SQL数据分析淘宝用户分析实操MRO物料采购服务

常见的数据清洗,预处理,数据分类,数据筛选,分类汇总,以及数据透视等操作,用SQL一样可以实现(除了可视化,需要放到Excel里呈现)。SQL不仅可以从数据库中读取数据,还能通过不同的SQL函数语句直接返回所需要的结果,从而大大提高了自己在客户端应用程序中计算的效率。

但是,这个过程需要很熟练掌握SQL!

本文就利用提取MySQL的数据,通过写SQL的数据处理方式,来对一份淘宝数据进行用户分析。

本文从数据集中选取包含了2014年11月18日至2014年12月18日之间,8477名随机用户共1048575条行为数据,数据集的每一行表示一条用户行为,共6列。

列字段包含以下:

1.整体用户的购物情况

pv(总访问量)、日均访问量、uv(用户总数)、有购买行为的用户数量、用户的购物情况、复购率分别是多少?

2.用户行为转化漏斗

点击—加购物车—收藏—购买各环节转化率如何?购物车遗弃率是多少,如何提高?

3.购买率高和购买率为0的人群有什么特征

5.基于RFM模型的用户分析

03.数据清洗

1.导入数据

由于数据量有100多万,通过数据库管理工具Navicat将数据集导入MySQL数据库会表较慢,我这里使用ETL工具kettle进行导数,能够提高导数效率,也方便后续实现报表自动化处理,数据库的表名为user。

2.缺失值处理

item_category列表示地理位置信息,由于数据存在大量空值,且位置信息被加密处理,难以研究,因此后续不对item_category列进行分析。

3.数据一致化处理

{!--PGC_COLUMN--}

由于behavior_type列的四种行为类型分别用1,2,3,4表示点击、收藏、加购物车、购买四种行为,为了方便查看数据,将1,2,3,4替换为‘pv'、’fav‘,’cart',‘buy'。

通过查询表结构,可以看到date列日期列不是日期类型:

将date列改成date类型:

04.构建模型和分析问题

1.总体用户购物情况

在购物环节中收藏和加入购物车两个环节没有先后之分,所以将这两个环节可以放在一起作为购物环节的一步。最终得到用户购物行为各环节转化率,如下:

3.购买率高和购买率为低的人群有什么特征

购买率高用户特征:

由以上结果可以看出,购买率为低用户分为两类,

第一类是点击次数少的,一方面的原因是这类用户可能是不太会购物或者不喜欢上网的用户,可以加以引导,另一方面是从商品的角度考虑,是否商品定价过高或设计不合理;

第二类用户是点击率高、收藏或加购物车也多的用户,此类用户可能正为商家的促销活动做准备,下单欲望较少且自制力较强,思虑多或者不会支付,购物难度较大。

(1)一天中用户的活跃时段分布

可以看出,每日0点到5点用户活跃度快速降低,降到一天中的活跃量最低值,6点到10点用户活跃度快速上升,10点到18点用户活跃度较平稳,17点到23点用户活跃度快速上升,达到一天中的最高值。

(2)一周中用户活跃时段分布

由于第一周和第五周的数据不全,因此这两周的数据不考虑到此次数据分析中。

由以上结果可以看出,每周用户活跃度较稳定,每周五活跃度会有小幅降低,但是周末会慢慢回升。其中周五用户活跃度突增,这是由双十二电商大促销活动引起。

5.基于RFM模型找出有价值的用户

RFM模型是衡量客户价值和客户创利能力的重要工具和手段,其中由3个要素构成了数据分析最好的指标,分别是:

(1)计算R-Recency

(2)计算F-Frequency

(3)对用户进行评分

计算脚本如下:

(4)kettle制作报表自动化

为了实现监测每个月用户的评分变化,推测客户消费的异动状况,结合数据库使用ETL工具kettle实现定时输出评分结果:

这里kettle实现过程不做详细描述。

05.结论

1.总体转化率只有1%,用户点击后收藏和加购物车的转化率在5%,需要提高用户的购买意愿,可通过活动促销、精准营销等方式。

4.通过R和F的数据对用户行为进行打分,对每位用户进行精准化营销,还可以通过对R和F的数据监测,推测客户消费的异动状况,挽回流失客户。

THE END
1.浅谈电商数据采集重要的一环:数据清洗电商数据清洗在电子商务的浩瀚数据海洋中,数据采集是获取商业洞察力的第一步,而数据清洗则是这一过程中不可或缺且至关重要的环节。数据清洗不仅关乎数据的准确性与可靠性,更直接影响到后续数据分析的质量与深度。本文将从技术角度出发,深入探讨电商数据采集中的数据清洗过程,揭示其重要性及实施策略。 https://blog.csdn.net/Jernnifer_mao/article/details/140838875
2.电子商务数据运营与管理第二版第2章电子商务数据采集与预处理* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 2.3 电子商务数据采集实例 电子商务数据采集实训 1.实验目的 (1)了解数据采集相关知识 (2)实操通过八爪鱼工具进行数据采集 2.实验知识准备 (1)数据获取的基本流程 完整的数据获取流程主要包括采集、存储和清洗三个环节。https://max.book118.com/html/2022/0627/5033144114004300.shtm
3.基于小浣熊办公嘲的「大数据集分析」AI悟空聊架构3.4.2 实操内容 与办公小浣熊对话,输入上述提示词,它会帮我清洗数据。 小浣熊清理完数据后,还会温馨提示是如何清洗数据的:数据已根据“create_date”列进行了过滤,现在只包含在 2017-11-25 和 2017-12-04 之间的记录。 3.5 数据运算 第一个要分析的是每天的浏览次数以及每天的浏览人数。 https://xie.infoq.cn/article/49b0876e96a2a0d9df300e17e
4.武清开发区这些企业正在招聘!(第26期)3、具有较强的团队合作精神,对业务有较高的工作热情,较强的沟通和推动能力,妥善处理内外部关系的意识;具有采集数据和处理数据的能力,对数字敏感;高度的自我激励和结果驱动,思维敏捷,工作细心,处事灵活;具有较强的风险识别和管理能力。 待遇:缴纳六险一金、带薪年假、防暑降温、取暖补贴、交通补助、员工体检等,薪资面https://www.shkp.org.cn/content.html?type=lc&id=320689
5.武陟县人社局2023年7月31日收集企业招聘信息(第31期)河南阿洛克航空工业有限公司是一家专注于研发、生产和销售无人机的高科技科研生产型企业。产品应用于测绘、侦查、遥感数据采集与处理、电力巡查、农林植保等众多领域。产品销往国内外40多个国家和地区。旗下无人机驾驶员培训中心更是经民航局授权AOPA协会审定的合法培训单位。 https://wzjob.jzggjy.com/news/detail/304459.html
6.电商女装销量描述与分析案例知识点名称:数据筛选 知识点所属工作角色: 数据清洗 知识点背景: 1.对缺失值进行处理 2.从字符串中提取有用信息 3.根据之后描述性分析、探索性分析及建模需求,对数据进行合理的转化和处理,使得数据更具解释性 知识点描述 1.去除带缺失值的行 2.从字符串中提取有用信息 https://www.cda.cn/anli/23888.html
7.绩溪县2023年10月企业招聘信息要求:年龄20-45岁,大专以上学历,机电机械专业、掌握生产PQC\OQC发现过程/产品缺陷,监督指导分析和处理过程经验。 待遇:4000-10000元。 11.生产过程巡检:2名 要求:高中以上学历,有汽车零部件制造业检验工作经验优先;服从工作安排,巡检需能适应倒班。 待遇:4000-8000元。 https://www.cnjx.gov.cn/OpennessContent/show/2978202.html
8.Python电商数据分析实战教程课程内容涉及数据清洗、数据可视化、数据挖掘等方面的知识,通过实际案例的讲解和实操,帮助学员理解和掌握数据分析的基本原理和方法。 学习目标 本课程的学习目标包括:- 掌握Python的基础知识和数据分析工具的使用;- 理解电商运营和数据分析的深层关联;- 学会使用数据分析工具进行电商数据的清洗和处理;- 学习使用数据挖掘https://www.insideria.cn/web/special/details.html?id=110&from=more_list&type=0&recommend_id=2
9.学习前线周口Python人工智能培训班数据分析学习培训MySQL其他相关知识丨从Excel到Power BI丨Power BI中的数据清洗和分析模型丨Power BI中的数据可视化和报表制作丨Power BI项目实操丨认识和使用Tableau丨认识和使用fineBI丨数据思维和分析模型 Python数据分析 Python数据分析工具介绍丨使用NumPy实现批量数据处理丨线性代数和NumPy的linalg模块丨使用Pandas进行数据分析 http://www.haoxuanke.com/city/zk/news-id-109458.html
10.如何进行电商的运营工作数据清洗和预处理是数据分析的前置工作,需要对数据进行去重、缺失值处理、异常值处理等操作,以保证数据的准确性和可靠性。 3.数据挖掘和分析 数据挖掘和分析是电商运营数据分析的核心环节。需要通过数据挖掘、统计分析、机器学习等技术手段,挖掘数据背后的规律和趋势,为电商平台提供决策支持和优化建议。 https://www.linkflowtech.com/news/1767
11.20电商3B模块三数据清理* 6.数据分类与处理的方法不包括()。 A、数据采集 B、数据清洗 C、数据计算 D、数据排序 * 7.某店铺2019年度会员信息表中,某会员的出生年份是1990年,但年龄却记录为25岁,此类错误需要进行()。 A、缺失值清洗 B、重复值清洗 C、逻辑值清洗 D、无价值数据清洗 * 8.默认情况下,在Excel中输入数值“751667794https://www.wjx.cn/vj/rHykhIg.aspx
12.数据挖掘实战——电商产品评论数据情感分析:深度洞察用户心声数据清洗 :过滤掉数字、字母和特定品牌名称,减少噪声。 分词处理 :使用jieba进行分词,同时进行了词性标注和停用词的过滤,保证分析的准确性。 名词提取 :重点分析包含名词的评论,因为它们能更清晰地反映产品特性。 评论情感分析 情感词匹配 :结合自建情感词表,对每条评论进行情感倾向的初步评估。 https://cuicuo.com/index.php/2024/12/02/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E5%AE%9E%E6%88%98-%E7%94%B5%E5%95%86%E4%BA%A7%E5%93%81%E8%AF%84%E8%AE%BA%E6%95%B0%E6%8D%AE%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90%EF%BC%9A%E6%B7%B1/
13.大数据:分类算法深度解析数据清洗是特征提取的前提。它涉及到处理缺失值、异常值、重复值等问题,以确保数据的质量。清洗后的数据更有利于提取有效的特征。 在处理缺失值时,常见的方法包括删除包含缺失值的样本、用均值或中值填充缺失值,或者使用更复杂的插值方法。对于异常值,可以通过统计学方法或基于模型的方法进行识别和处理。而重复值的处理https://www.360doc.cn/article/78411425_1110858832.html
14.2022级电子商务专业群人才培养方案项目任务六:仓储数据处理 教学方式方法:主要采用任务驱动的教学方法,采用理论与实操相结合,线上线下结合的方式教学。 考核方式:课程考核采用多元评估体系,过程性评价和终结性评价相结合。 实训实践要求:教学场所为多媒体教室和物流综合实训室。 教师要求:任课教师应具有高尚的品德、扎实的仓储理论基础、丰富的仓储实践https://www.mxdx.net/jwc/info/1042/1241.htm