根据现有数据及分析目的,从四个维度进行分析:
第一个维度:用户购物情况整体分析
以PV、UV、平均访问量、跳失率等指标,分析用户最活跃的日期及活跃时段,了解用户行为习惯
第二个维度:商品购买情况分析
从成交量、人均购买次数、复购率等指标,探索用户对商品的购买偏好,了解商品的销售规律
第三个维度:用户行为转化漏斗分析
从收藏转化率、购物车转化率、成交转化率,对用户行为从浏览到购买进行漏斗分析
第四个维度:参照RFM模型,对用户进行分类,找出有价值的用户
分析步骤如下:
提出问题------理解数据------数据清洗------构建模型------数据可视化
(一)提出问题
(二)理解数据
用户行为类型又分为四种:
pv:商品详情页pv,等价于点击
buy:商品购买
cart:商品加入购物车
fav:收藏
(三)数据清洗
包含数据导入(采用Navicat)、缺失值处理、一致化处理、异常值处理(2017.11.25到2017.12.3日内的数据)
(四)构建模型
1.用户购物情况整体分析
1.1这9天里PV(浏览量),返回结果是:2027221
selectcount(behavior_type)as浏览量fromUser_Behaviorwherebehavior_type='pv';1.2这9天里UV(用户数),返回结果是:22099
selectcount(distinctuser_id)as用户数fromUser_Behavior;1.3平均访问量是:2027221/22099=91.7
即每个用户平均访问了91个页面。
1.4跳失率计算:
跳失率:只有点击行为的用户/总用户数
selectcount(distinctuser_id)fromUser_Behaviorwhereuser_idnotin(selectdistinctuser_idfromUser_Behaviorwherebehavior_type='fav')anduser_idnotin(selectdistinctuser_idfromUser_Behaviorwherebehavior_type='cart')anduser_idnotin(selectdistinctuser_idfromUser_Behaviorwherebehavior_type='buy');只有点击行为的用户数量为1253,故跳失率=1253/22099=0.0567,跳失率不高,说明店铺的商品详情页还是能吸引到用户的进行下一步行为。
1.5每天访问量/访客数情况
1.6每天的访客数情况:
1.7每个时段访问量/访客数
可以看出访客数与访问量趋势大致一致,17-22时达到访客高峰,猜测是下班后进行购物放松。1-7时大多数人处于睡眠休息阶段故访客与访问量较少。
1.8不同时段成交量
selecthours,count(behavior_type)as成交量fromUser_Behaviorwherebehavior_type='buy'groupbyhoursorderbyhours;
2.商品购买情况分析
2.1成交量
用户行为中,只要用户行为为“buy”,即是完成了一次购买,形成一个订单。下面对订单进行分析
2.2人均购买次数
2.3复购率
复购率=购买2次及以上用户数/总购买用户数
#总购买用户数selectcount(distinctuser_id)as用户数fromUser_Behaviorwherebehavior_type='buy';得到总购买人数15082
#购买次数>1次的用户数selectcount(*)from(selectcount(user_id)as重复购买用户数fromUser_Behaviorwherebehavior_type='buy'groupbyuser_id)awherea.重复购买用户数>1;购买两次及以上用户数9953
复购率=9953/15082=0.659=66%
用户107932购买次数达到72次,对于这类忠实的用户需要开发用户信息库,建立完善的用户资料库,记录客户购物情况。
3.用户行为转化漏斗分析
可见真正转化为购买的只有2%,用户在浏览商品详情页后出现了大量的流失。
那么,从浏览到购买,每一个环节的转化率是多少呢?因为加入购物车和收藏商品并没有行为的先后性,也就是说,购物路线可以有两条:
第一条线路:浏览—加入购物车—购买
又或者是
第二条线路:浏览—添加收藏—购买
按照线路一来购买的话,从浏览到加入购物车到购买之间的转化率是多少呢?
购物车转化率=加入购物车后购买的用户数/加入购物车的用户数
selectcount(distincta.user_id)as加入购物车用户数,count(distinctb.user_id)as加入后购买用户数from(selectdistinctuser_id,item_id,item_category,time_stampfromUser_Behaviorwherebehavior_type='cart')aleftjoin(selectdistinctuser_id,item_id,item_category,time_stampfromUser_Behaviorwherebehavior_type='buy')bona.user_id=b.user_idanda.item_id=b.item_idanda.item_category=b.item_categoryanda.time_stamp 加入购物车的用户数为:16638 加入购物车后购买的用户数:5023 所以,购物车转化率为:5023/16638=30.18%,约为30% 也就是说,加入购物车的用户中,有30%会进行购买。 #有多少用户进行了浏览selectcount(distinctuser_id)fromUser_Behaviorwherebehavior_type='pv';浏览的用户数是:22009 从图表中可以看出,从用户点击浏览到购买商品,用户浏览到加入购物车的转化率是很高的,达到了75.5%,说明大部分用户在浏览后有购买意向,加入了购物车;但是,在加入购物车到购买的环节里,只有30%左右的用户进行了真正的购买,而70%的用户是没有进一步购买的。为什么用户加入购物车后却并没有购买呢? 推测原因可能是: 1.加入购物车是为了与不同店铺的同种产品进行比价; 2.为了凑单,进行满减; 3.先放着,过几天再购买; 4.等活动优惠 考虑第二条线路,进行分析 收藏转化率=添加收藏后购买的用户数/添加收藏的用户数 浏览的用户数是:22009 加入收藏的用户数为:8900 加入收藏后购买的用户数:1910 所以,收藏转化率为:1910/8900=21.4%,约等于21% 与线路一的购买流程来看,用户在浏览后,相对于收藏行为,会更倾向于添加到购物车。而且购物车转化率为30%,收藏转化率为21%,购物车转化率比收藏转化率高,也就是说,用户更偏向于购物车购买。 这是为什么呢? 推测原因:加入购物车后可以直接下单购买,而加入收藏后并没有可以下单的页面,如果需要购买必须重新点击商品进入详情页才能下单,多了一个步骤,所以,在这个步骤里可能用户就流失了部分。 4.参照RFM模型,对用户进行分类找出有价值的用户 RFM模型是衡量客户价值和客户创利能力的重要工具。该模型通过客户的最近交易行为(Recency)、交易频率(Frequency)以及交易金额(Monetary)三项指标来描述该客户的价值状况。一般来说,会将这三项指标分成几个区间进行评分,通过计算评分找到有价值的用户,并对用户进行分类。 R(Recency)最近的购买行为: #按购买天数评分:createviewscore_01asselectuser_id,(casewhen购买天数between0and2then1when购买天数between3and4then2when购买天数between5and6then3when购买天数between7and8then4else0end)as购买得分from(selectuser_id,datediff(max(dates),'2017-11-25')as购买天数fromUser_Behaviorwherebehavior_type='buy'groupbyuser_id)asaorderby购买得分;F(Frequency)购买频率: 从上面对复购用户的分析中,我们也得知,有购买行为的用户,购买频率最高的能达到72次。所以,我们将1-72从低到高,划分为4个档次。1-18,19-36,37-54,55-72分别对应为1-4分。 下面对用户进行分类 求两项评分的均值: 将获得的两项评分分别和它们的均值进行比较,对客户进行分类: #对用户进行分类:createviewusers_classifyasselectuser_id,(casewhenR>3andF>1then'重要价值用户'whenR>3andF<=1then'重要保持用户'whenR<=3andF>1then'重要发展用户'whenR<=3andF<=1then'一般价值用户'else0end)as用户类型from(selecta.user_id,a.购买得分asR,b.购买频率得分asFfromscore_01asainnerjoinscore_02asbona.user_id=b.user_id)c;(暂时无法打开users_classify表格) 用户类型计数: 对于重要保持用户,他们最近有购买,但购买频率不高,可以通过活动等提高其购买频率; 对于重要发展用户,他们虽然最近没有购买,但以往购买频率高,可以做触达,以防止流失; 对于一般价值用户,他们最近没有购买,以往购买频率也不高,特别容易流失,所以应该赠送优惠券或推送活动信息,唤醒购买意愿。 1.12月2日与12月3日,相对于其他日期,流量增长明显,推测和搞活动有关; 2.大部分用户在18时到21时会比较活跃,其中21到22时,是一天当中最活跃的时段,成交量也是这一时段最高。建议可以在用户活跃的时段进行推广以使运营效果最大化。 6.用户行为转化率只有2%,有98%的用户行为是没有转化为成交的,用户在浏览商品详情页后出现了大量的流失。建议通过活动、优惠券、产品详情页的改进等提高转化。 7.从浏览到加入购物车的转化有75.5%,大部分用户在浏览后有购买意向;加入购物车到真正购买的,只有30%,有70%的用户加入购物车后却并没有进一步购买。 建议在用户加入购物车后能有促进用户下单的利益“诱导”,如赠送优惠券或采用倒计时购物车增加客户购买紧近感。 8.从收藏到购买的转化率为21%。相对于购物车30%的转化率,收藏转化率稍低。 同样建议在用户添加收藏后能提示优惠或促销等时限信息,促使用户尽早下单。 9.用RFM模型对用户进行分类后,可知重要价值用户比较少,用户类型主要还是集中于重要保持用户和一般价值用户。建议根据用户类型,进行有针对性的精准营销。