经典案例
当前位置: 首页 经典案例 经典案例
菜鸟案例 | 摩托车跑车累计评价影响因素探究
来源: 浏览量:1912 更新时间:2017-06-08



Hello,大家好,本龟又回来了。今次,应一个朋友的请求,我们要分析一个很酷的东西,来研究研究——机车。

话说这位机车君前两天打电话给我,说打算做点摩托车销(dao)售(mai)的生意,让我帮帮忙照顾照顾他的生意。作为一个八百年不发朋友圈的人,突然让我为微商友情打广告?我的内心必然是大写的拒绝。于是机车君赶忙澄清,自己要做的是某电商平台的正经买卖,想让我给帮着分析分析该电商平台的摩托车销售行情,帮他的经营出谋划策。

再于是,他就甩给我一份爬下来的摩托车跑车数据,大家可以点击阅读原文下载。

数据情况

有了现成的数据,岂有不分析的道理,我们二话不说先观摩之。这里的4036条商品数据中包括了商品编号、标题、品牌等商品基本信息以及累计评价、总评分、各项评分等销售信息,然而,并没办法取得商品的累计销量。既然如此,我们只能将累计评价作为对商品销量的一个间接判断,看看又是什么样的因素会影响商品的累计评价。

那么问题又来了——这个累计评价并不是一个自然数序列,而是带有若干分组的一些区间列,如100+,400+等。所以我们最终只得把累计评价划分为几个水平,然后看看每个水平下的特征以及它们之间的区别。对数据进行删减、合并处理后,变量说明如下:

表1  摩托车跑车数据变量说明(删减后)

删减调整过后的数据为3550条,保留率为88.0%,调整依据将在后文中为各位细细道来。调整后的数据中累计评价为0的商品有1171条,而累计评价数最高为400+(并入100+组),有10条数据。



描述性分析


观察这些摩托车跑车的信息不难发现,这个数据集中,混入了一些奇怪的东西。比如,虽然商品名写着XXX摩托车,但是商品毛重居然赫然写着1kg,显然这是不可能的事情。不论出现这种情况的原因是什么,我们还是将这样的数据删去以保证分析的合理有效(竟然还有低于我体重的车子,统统不要)。类似删去的还有数据集中排量为“50cc以下”的车辆,在我国国家标准下,30cc以下为燃油助力车,30~50cc为轻便摩托车,而50cc以上方被认定为摩托车[1](国家都不承认的,也统统不要)。最后再删去存在缺失的数据。

上文说到,这个累计评价的变量啊,非常的不给力,该平台(也许)为了阻遏刷单现象对于评价数进行了一定的处理,导致我们的数据都是一个个区间段,无法作为数值型变量来看待。更不给力的是,这个区间段划分又不够粗糙,导致存在不少样本极少的段,故而我们秉持着分组不太多,数量差不多(纯属我瞎编)的原则对其进行合并。经过合并的累计评价情况如下表所示:

表2  摩托车跑车累计评价情况

blob.png

这样的分组较为均匀,也比较方便之后的分析。从表中可见绝大多数商品都徘徊在生死线边缘,累计评价不足两位数。而真正可算高销量的超过100+条评论数的商品条目不足1000,若要看超过200条评价的商品,则仅有351件,不到10%,看来机车市场的生存并不容易啊。 

对这个萎靡的市场有了一定了解后,我们可以正式对机车君的问题来做一些简单的回答了。我们首先从商品特征开始:

blob.png

图2 摩托车跑车累计评价与商品毛重的关系

四组中,累计评价数在1~10的商品明显重于其他几组,中位数将近150kg,11~100组的商品明显轻于其他几组,多为不足100kg的轻型车。至于大家最关心的爆款,总体上爆款车型还是不重的,毕竟现代造车工业都追求轻巧结实的材料以减轻车架的重量,但是受到青睐的较重型的车也有不少。

blob.png

摩托车的制动方式曾经是一个非常重要的指标,但是从上面大片的红色来看,这个问题已经渐渐成为了过去式。删减后的3550条数据中,非碟刹制动的车型仅116个(3.3%),而且分组来看,若是想要高销量呢,其他的制动方式还是放弃吧(后两组全为碟刹)。

接下来我们再来看看销售特征——评分。众所周知,网店的评分对于网店的“生死存亡”至关重要,顾客在购买商品时往往会将评分作为购买决策的重要考量因素,而有的店家为了高评分不惜利用刷单、骚扰电话等手段。那评分和销量(累计评价数)的关系到底如何呢?机车君给我的数据中共有四类评分:总评分、商品评价、服务态度和物流速度。

blob.png

出现了上图这样的结果其实一点也不意外,各项评分之间几乎是完全线性相关的,这也意味着我们只需要择其一来进行分析即可,重复几个几乎完全一样的过程是无甚意义的。我们选用总评分来观察(毕竟人家叫“总”评分嘛):

blob.png

图5  摩托车跑车累计评价与总评分的关系

前两组的箱子显然比后两组大上许多,更印证了前文所述“爆款总是相似的”。中位数上,1~10的组显著低于其他组,说明销量和评分确实是存在一定关系的。至于评价数为0的组为何还能有评分,可能是因为消费者未写评价也可能是因为历史数据的评分(而累计评价只有近期),具体是哪个,就不得而知了。



总结


中国虽然是摩托车大国,但是摩托车市场总体上并不太景气,大部分商品销量寥寥。但是若能在这个市场中占有一席之地,400+的销量也是相当可观的。摩托车本身的特征如重量和性能(此处观察了制动方式)对累计评价数确实存在一定影响。而买手们的评价,确实也对其有不小的影响,看来冲销量冲评分的做法确实有一定的道理嘛。

但是,机车君今后若是为了评分做出什么事儿来,那可绝不是我挑唆的。



长按二维码扫描

Scan QR code to Follow

1.除特别声明外,本网站资源来自网络上已发表内容,本网站不拥有其所有权。如引用,请注明原始出处;如有侵权,请来邮或来电告知,本网站将立即更正。

2.本网站属于非盈利的学术性网站,网上资源仅供对中国社会治理及相关内容感兴趣的用户学习讨论使用,所刊载文章不代表本站观点,亦不含任何商业目的。

3.本网站不保证为用户提供方便而添加的文章来源的准确性和完整性。

标签: