淘宝用户行为分析清洺

利用MySQL对淘宝用户行为进行数据分析,在Tableau中进行数据可视化。分析步骤:

分析维度——理解数据——数据清洗——构建模型——数据可视化

三、分析维度

基于淘宝用户行为数据,从以下四个维度进行分析和解释:

第一维度:用户消费行为习惯

统计数据集中的总用户数,商品数,商品类别数,用户行为数来评估用户整体购物情况。以PV、UV、平均访问量、跳失率等指标,通过对比分析方法,探索用户在不同时期下的活跃规律,了解用户消费行为习惯。

第二维度:商品购买情况分析

从成交量、人均购买次数、复购率等指标,探索用户对不同种类商品的偏好,了解商品的销售规律,找到针对不同商品的营销策略。

第三维度:用户行为转化分析

从商品和用户两个角度分析:

用户角度,运用AARRR漏斗模型拆解用户的行为路径,确定各个环节的流失率,找到需要改进的环节。

第四维度:用户分类

基于RFM模型,对用户进行分类,找出最具有价值的核心付费用户群,从而采取针对性的营销策略进行精细化运营。

由于不同的用户对公司带来的收益差别很大,因此需要对用户进行价值评价,找到最优价值的用户群,并针对该部分用户进行差异化营销。

F-Frequency(消费频率)

M-Monetary(消费金额)

这三个维度相互关联,反映了每个用户的现在价值和潜在价值,将每个维度分为若干区间进行评分,通过计算分数找到最有价值的用户,并对用户进行分类,可以针对性的对不同类型的用户采取不同的营销策略。

五、理解数据

数据集包含了2017年11月25日到2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。关于数据集中每一列的详细描述如下:

其中用户的行为类型共有四种,分别是:

六、数据清洗

1、导入数据

数据记录达一亿条,为了提高分析效率,数据是按照用户ID排序好的,将源csv文件进行切分,取前五百万行在MySQLWorkbench中导入数据。

2、一致化处理

UPDATEusersSETdatetimes=from_unixtime(time_stamp);UPDATEusersSETdates=from_unixtime(time_stamp,'%Y-%m-%d');UPDATEusersSETtimes=from_unixtime(time_stamp,'%H:%i:%S');UPDATEusersSEThours=from_unixtime(time_stamp,'%H');处理过的数据形式:

3、异常值处理

本次分析针对的是2017年11月25日至2017年12月3日的数据,将不在此日期范围内的数据删除,共删除2632行数据。

--异常值处理DELETEFROMusersWHEREdates<'2017-11-25'ORdates>'2017-12-03';七、构建模型和可视化分析

1、用户整体购物情况

1.1统计数据集中的用户行为数,总用户数,商品数和商品类别数

1.2PV(浏览量):具体指网站的页面浏览量或者点击量,页面被刷新一次就计算一次;UV(用户数):访问网站的一台客户端为一个用户;平均访问量:PV/UV

1.3跳失率:只有点击行为的用户/总用户数

只进行浏览的用户数量为2871,因此跳失率为2871/48984=5.86%,跳出率不高,说明店铺的商品详情页能吸引用户进行下一步的行为。

1.4留存率

使用群组分析方法,按每天新增的用户进行分组,通过每天新增用户的留存率来判断平台对用户的吸引力。

由于数据集的日期截止到2017年12月3日,因此五日留存率和七日留存率会出现为0的情况。从以上数据可以看出,每日的留存率都比较高。

2、用户消费行为习惯

2.1总的用户在四个行为下的记录情况

使用查询语句分别输出用户点击,收藏,加入购物车以及购买用户数量。

2.2单个用户行为情况

2.3每天的用户行为变化

2.4每小时的用户行为变化

3、商品购买情况

3.1人均购买次数

3.2复购率:购买2次及以上用户数/总购买用户数

3.3重复购买最多的用户

3.4重复购买最多的商品

4、用户行为转化

4.1推荐量和购买量都在前十的商品种类

可以看出,用户购买的和点击的商品种类相似性很大。

4.2推荐量和购买量都在前十的商品

虽然用户点击量最多的商品种类和购买的商品种类相似度很高,但购买量和点击量都在前十的商品为空,说明推荐系统不够好,导致给客户推荐的商品不是客户真正需要的,导致点击量很高但却没有促成交易。因此需要优化推荐系统,给用户推荐他们真正想要的商品。

4.3用户行为转化率

从行为数量的角度分析:

由于收藏和加入购物车都为浏览和购买阶段之间确定购买意向的用户行为,且不分先后顺序,因此将其算作一个阶段,可以看到从浏览到有购买意向只有9.5%的转化率,当然有一部分用户是直接购买而未通过收藏和加入购物车,但也说明大多数用户浏览页面次数较多,而使用购物车和收藏功能较少,而购买次数占使用购物车和收藏功能的23.6%,说明从浏览到进行收藏和加入购物车的阶段是指标提升的重点环节。

用户购买转化率:33286/48782=68.23%

点击支付转化率:100139/4472791=2.24%处于平均水平。

从用户数量的角度分析:

从以上结果可以看出:

(1)用户点击后的流失率仅为5.89%,说明平台对用户的吸引力还是较大的,用户点击后继续下一步行动的意愿较为强烈。

5、用户分类

创建最近一次消费间隔和频率的视图:

查看R和F的取值范围:

根据消费间隔R值的取值为0-8,将其分为3档,0-2,3-5,6-8分别对应的R评分1-3;

根据消费频率F值的取值,消费次数从低到高为1-84次,将其分为4档,1-21,22-42,43-63,64-84分别对应评分1-4;

计算R值和F值的平均值:

分级:

CREATEVIEWScoreASSELECTRF.*,(CASEWHENRBETWEEN0AND2THEN1WHENRBETWEEN3AND5THEN2WHENRBETWEEN6AND8THEN3END)ASR_score,(CASEWHENFBETWEEN1AND21THEN1WHENFBETWEEN22AND42THEN2WHENFBETWEEN43AND63THEN3WHENFBETWEEN64AND84THEN4END)ASF_scoreFROMRF;用户分类:

CREATEVIEWClassfyASSELECTuser_id,(CASEWHENR_score>2.4205ANDF_score>1.0030THEN'重要价值用户'WHENR_score>2.4205ANDF_score<1.0030THEN'重要发展用户'WHENR_score<2.4205ANDF_score>1.0030THEN'重要保持用户'WHENR_score<2.4205ANDF_score<1.0030THEN'一般价值用户'END)AS用户类型FROMScore;对各类用户进行统计:

对于重要价值用户,极有可能发展成忠实用户,需要加强交流与互动,提高满意度,提供针对性服务;

对于重要保持用户,虽然最近没有购买,但以往消费频率较高,可根据以往的消费记录,主动与其保持联系,为其个性化推荐,以提高复购率;

对于重要发展用户,他们最近有购买,但消费频率不高,可以通过活动等刺激消费;

对于一般价值用户,他们最近没有购买,以往购买频率也不高,特别容易流失,可以主动联系客户,赠送优惠券或推送活动信息,唤醒购买意愿。

八、结论

1.日点击量,访问量在2017年11月25日至2017年12月1日基本平稳,而12月2日与12月3日,相对于其他日期,流量增长明显,由于2017年11月25日,11与26日,12月2日与12月3日均为周末,考虑可能是与12月2日到3日搞活动有关;

3.人均购买次数为3,跳失率为5.86%,复购率65.77%,以上指标说明网页活跃度较好,商品对用户的吸引力较大,大多数用户浏览后会收藏,放进购物车或者直接购买;

6.利用RFM模型对用户进行分类后,可知重要价值用户比较少,用户类型主要还是集中于重要发展用户和一般价值用户,建议根据用户类型,进行有针对性的精准营销。

THE END
1.数据清洗涵盖了哪些方面?探索数据处理的全貌与重要步骤数据清洗是债券市场最近暴跌原因数据处理过程中不可或缺的重要步骤。随着数据量的增加和数据来源的多样化,原始数据往往包含大量的噪音、缺失值或异常数据,这些问题会严重影响数据分析的结果和结论的准确性。 通过数据清洗,可以有效地识别和处理数据中的各种问题,提高数据的质量和完整性。良好的数据清洗实践不仅能够确保数据https://www.zhaocaifu.cn/article/99497.html
2.跨境电商数据化选品方法包括数据分析法是通过对大量历史销售数据的挖掘和分析,找出潜在的热销产品和市场趋势。这种方法需要企业具备一定的数据收集和处理能力,以及专业的数据分析师团队。以下是数据分析法的一些具体步骤: 1.1 数据收集 企业可以通过各种渠道收集销售数据,如电商平台、社交媒体、搜索引擎等。这些数据可以包括商品名称、价格、销量、评价https://www.51969.com/post/19848837.html
3.数据清洗:让数据更干净更好用@慕课网原创慕课网数据清洗步骤 1. 看看数据。 我们需要检查数据集中的错误、缺失值、重复项或不一致之处。 2. 规划阶段: 制定一个解决已发现问题的策略。 3. 使用工具如下: 利用数据清洗工具或库,例如Python(Pandas, NumPy等)或R(tidyverse, dplyr等)。(Python的Pandas和NumPy库,R的tidyverse和dplyr库) https://m.imooc.com/mip/article/371415
4.电商精准营销—数据清洗电商精准营销—数据清洗 中级 文海洋 湖南工程学院 学习人次82 某商城作为中国最大的自营式电商,在保持高速发展的同时,沉淀了数亿的忠实用户,积累了海量的真实数据。如何从历史数据中找出规律,去预测用户未来的购买需求,让最合适的商品遇见最需要的人,是大数据应用在精准营销中的关键问题,也是所有电商平台在做智能化升https://www.educoder.net/shixuns/fqtjbfak/challenges
5.零基础小白如何入行电商数据分析?一文讲清!交易数据:通过电商平台(如淘宝、京东)的后台系统获取,包括订单量、销售额、转化率等。 客户数据:通过CRM系统收集,包括客户的基本信息、购买历史、偏好等。 3. 数据整理与清洗 收集到的原始数据往往包含大量无效、重复或错误的信息,需要进行整理与清洗。这一步骤包括数据筛选、去重、格式统一、缺失值处理等,以确保后续https://www.fanruan.com/bw/doc/178903
6.服装电商行业精准营销与个性化推荐系统建设.doc服装电商行业精准营销与个性化推荐系统建设.doc 16页VIP内容提供方:shily1 大小:111.95 KB 字数:约1.6万字 发布时间:2024-11-23发布于江苏 浏览人气:0 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)服装电商行业精准营销与个性化推荐系统建设.dochttps://max.book118.com/html/2024/1122/8014133065007001.shtm
7.最准一肖一码精准准——助力机遇无限为了更好地理解这些方法和工具的应用价值,我们可以看一个具体的案例,假设某电商平台希望预测用户的购买行为,以便进行个性化推荐和精准营销,具体步骤如下: 1、数据收集:平台收集了用户的浏览历史、点击记录、购买行为等数据。 2、数据预处理:对收集到的数据进行清洗和转化,处理缺失值和异常值,并进行必要的特征工程。 http://m.dade-light.com/guona/6854.html
8.跨境电商公司营业范围,数据支持方案解析入门版43.29.314、营销优化:根据数据分析结果,优化营销策略,提高营销效果,降低营销成本。 入门版数据支持方案实施步骤 针对入门版的数据支持方案,实施步骤如下: 1、确定数据收集渠道:包括电商平台、社交媒体、行业报告等。 2、数据清洗与整理:对收集到的数据进行清洗和整理,以便后续分析。 http://www.hnspacenet.com/post/5585.html
9.精准营销如何进行数据分析和挖掘?在精准营销中,数据分析和挖掘是关键步骤,包括数据收集、清洗、分析、建立客户画像、制定营销策略和监测效果等。https://www.mbalib.com/ask/question-0a9c031ac7fab1a8b53280df66bcf9bb.html
10.电商女装销量描述与分析案例零售行业——电商女装销量描述与分析 作者姓名(或单位、或来源): 朱江 案例所属行业: F523 纺织、服装及日用品专门零售 案例所用软件: Rstudio 案例包含知识点: 案例描述: 目前网络购物异常的火爆,发展迅猛,基于数据分析的精准营销需求也随之增加。目前网络购物的几个特点是:私人消费增长中网络消费占的比重越来越大https://www.cda.cn/anli/23888.html
11.分享一些成功的电商数据清洗案例二、清洗过程 数据收集与整理 首先,将分散在不同系统和数据库中的各类电商数据进行集中收集,包括订单系统数据、用户信息系统数据、商品管理系统数据等。 对收集到的数据进行初步分类整理,按照订单数据、用户数据、商品数据等进行分类存储,以便后续针对性处理。 https://www.jianshu.com/p/1ed5b1a7088c
12.1+x电子商务数据分析试题库附答案.docx[单选题]*A、1.数据处理2.数据清洗3.数据计算4.数据分析与展示B、1.数据清洗2.数据计算3.数据处理4.数据分析与展示C、1.数据计算2.数据清洗3.数据处理4.数据分析与展示D、1.数据清洗2.数据处理3.数据计算4.数据分析与展示(正确答案)31.以下属于电子商务数据分析在企业中常见应用的是()。*A、对企业网站https://www.renrendoc.com/paper/306190918.html
13.大数据营销过程大数据分析的基础:解锁数据背后的智慧2. 数据清洗 在大量的数据中,难免有一些无关紧要的信息,甚至是噪声。如何从中筛选出有用的、有价值的数据,是大数据分析中的一个关键步骤。比如在零售行业,企业可能需要排除掉那些无法为公司带来实际利益的用户群体数据,只保留对销售有直接关系的群体。 http://www.zhongxinlm.com/yinxiao/22167.html
14.用户画像标签体系RAD极客会用户画像数据来源广泛,这些数据是全方位了解用户的基础,这里以Qunar的画像为例,其画像数据主要维度如下所示,包括用户RFM信息、航线信息等。 Qunar的画像数据仓库构建都是基于Qunar基础数据仓库构建,然后按照维度进行划分。 07 用户画像的作用 在互联网、电商领域用户画像常用来作为精准营销、推荐系统的基础性工作,其作用总https://www.shangyexinzhi.com/article/5239597.html
15.揭秘提升2024一码一肖,100%精准,数据驱动执行方案数据收集与处理 在“一码一肖”策略中,数据收集是首要步骤。企业需要从多个渠道收集用户数据,包括但不限于网站访问记录、社交媒体互动、在线购物行为等。这些数据将被存储在企业的数据仓库中,并通过数据清洗和预处理步骤,确保数据的准确性和可用性。 用户画像构建 https://wap.planxx.com/post/18104.html
16.企讯达二肖一码100准选一,数据化决策分析EPW83.831随机版数据化决策正引领企业进入一个全新的发展阶段。通过先进的数据分析工具和科学的决策方法,企业可以更好地应对市场变化,实现精准营销和高效管理。“企讯达二肖一码100准选一”与“EPW83.831随机版”便是这一变革中不可或缺的元素,帮助企业在复杂的市场环境中进行快速而可靠的决策。http://www.cngxgy.net/post/36434.html