数据概览:本数据为2012年7月2日至2015年2月5日发生在淘宝天猫交易平台关于婴幼儿商品的交易数据,数据集包含两个表格:
缺失值处理:base表无缺失值,trade表property特征缺失144条数据,由于该特征主要用于机器学习预测分析,与本分析关联度不大,暂且取出。
异常值处理:base表birthday特征可视化,去除出生早于2000年的离散值;trade表buy_amount特征可视化,去除超过3个标准差的离散值。
一致化处理:base表birthday特征、trade表day特征,由整数类型转化为日期类型;user_id、auction_id、cat_id、cat1特征,由整数类型转化为字符串类型。
2012.07-2015.02期间总销量49586件(去除异常值后的数据),市场销量整体呈现上升趋势。
从季度销量情况看,第一季度普遍消费疲软,第四季度则大幅上升,且皆呈现同比增长状态。
问题1:第一季度普遍消费疲软,第四季度则大幅上升的原因?
问题2:2015年(1月1日-2月5日)销量同比大幅增长至126.37%的原因?
由1月-2月销售量情况图(按日划分)可知:
销售低谷时段与春节假期基本吻合,其原因可能是部分企业提早放假、快递停运等。此外,2015年春节假期为/2/19-2/25,相对较晚,因此1月销量受影响不大,同比增长较高。因此,可以认为每年第一季度的销量下降,与春节假期有较大关系。
由11月-12月销售量情况图(按日划分)可知:
订单数合计29940笔(去除异常值后),与销量分布大体一致呈现上升趋势,平均订单销量为1.66件。
问题一:第四季度平均订单销量、人均销量下降的原因?
问题二:在下单用户数呈现上升趋势的背景下,订单复购率持续走低的原因?
结合商品大类与年龄层销量数据,随着年龄增长50008168大类需求逐渐增长,50014815需求降低。
结合商品大类与性别销量数据,大类50014815和38,女童用户购买量居多,其他品类占比较为接近。
构建RFM评分系统如下:
因此建议,一方面注重新用户的引流,通过提高用户数及人均销量,提高整体消费情况;另一方注重平均订单销量、以及复购率的提升,从儿童年龄增长的角度、以及性别与商品类别关联度角度,提高商品推荐质量,培养用户忠诚度,通过合适的商品组合搭配,提高单均销量。
1、根据异常值剔除前后销量分布图可知,用户的购买量相差较大,少数用户购买量巨大,对销量分布有明显影响,建议做好大客户服务,保持长期合作关系。
3、所有品类产品复购率都处于较低水平,用户黏性不足,需从产品质量、购物体验、营销手段等分析各品类复购率低的原因,并对导致复购率低的因素进行改善,从而提高留存率与复购率。
4、从品类角度看,销量贡献主要集中在大类28、50008168、38,其中大类38潜在市场较大,用户复购率较高,但子品类较少,建议丰富子品类,刺激用户消费。
5、婴幼儿家长是购买主力,且女童家长消费比例普遍高于男童家长,同时随着年龄增长,购买需求也由大类50014815转向大类50008168,商品营销活动,与个性化推荐可侧重借鉴此类用户画像。