案例实操|手把手教你搭建RFM客户价值分析模型腾讯云开发者社区

根据已有数据对店铺整体运营情况进行分析,了解运营状况,对未来进行预测,已经成为电商运营必不可少的技能。

对一家全球超市4年(2011~2014年)的零售数据进行数据分析,分析目标如下:

①分析每年销售额增长率。

②各个地区分店的销售额。

③销售淡旺季。

④新老客户数。

⑤利用RFM模型标记用户价值。

初步判断是否有缺失值,如下所示。

同时发现数据缺失方面只有PostalCode(邮编)字段有缺失值,而该字段对分析并不会产生影响,可以不用处理。

数据清洗是数据分析的基础,也是最为重要的一步,因为数据清洗在提高了数据质量的同时也可以避免脏数据影响分析结果。

所谓数据清洗,实际上就是对缺失值、异常值的删除处理或填充处理,以及为了方便数据的获取和分析,对列名的重命名、列数据的类型转换或者是排序等操作。但是并不是所有的数据都需要将上述的所有操作都执行一遍,具体操作的选择可根据实际的数据和需求进行选定。

通过info函数了解到在数据集中的只有PostalCode字段含有缺失值。结果返回的是所有字段不为空的数据个数。

判断每个any()字段中的数据是否含有缺失值isna(),如以下所示。

使用isna().any()方法会返回一个仅含True和False这两种值的Series,这个方法主要是用来判断所有列中是否含有空值。通过两次方法验证空值,得出的结论一致,只有PostalCode字段含有缺失值。而该字段并不在分析范围内,可以不处理该字段的缺失值,同时也保留了该字段所在数据其他字段的数据,这样可以确保分析的准确度。

在查看数据的缺失值之后还需要检查一下数据中是否含有异常值,Pandas的describe()可以用来统计数据集的集中趋势,分析各行列的分布情况,因此在查看异常值时会经常用到,如以下代码所示。

describe()函数会对数值型数据进行统计,输出结果指标包括count、mean、std、min、max及下四分位数,中位数和上四分位数。通过观察该结果发现数据集并无异常值存在。

上面代码将OrderDate(订单日期)列的数据类型成功修改成了datetime类型,因为通过datetime可以快速增加数据的维度,如年、月和季度等,如以下代码所示。

销售增长率是企业本年销售收入增长额同上年销售收入总额之比。

本年销售增长额为本年销售收入减去上年销售收入的差额,它是衡量企业经营状况和市场占有能力、预测企业经营业务拓展趋势的重要指标,也是企业扩张增量资本和存量资本的重要前提,该指标越大,表明其增长速度越快,企业市场前景越好。同样,也可以根据销售额的平均增长率,对下一年的销售额进行预测。

计算公式如下。或者将计算公式改型为(本年销售额/上年销售额-1),计算与原表达式一致。

现在根据当前的数据对该超市进行2011~2014年的销售增长率的趋势分析,并给出下一年的销售建议。

将数据按照年份进行分组,并计算出每年的销售总额,如以下代码所示。

根据销售额增长率公式分别算出2012年、2013年和2014年的销售额增长率,如以下代码所示。

若想使用百分数的结果形式,可以用下面的方式将小数改成百分数,如以下代码所示。

用图表呈现每一年的销售额和对应的增长率。用表格展示销售额和对应的增长率,如以下代码所示。

为了能更加直观地展示数据,可以将数据进行图像展示,如以下代码所示。

将销售额和增长率绘制在一个图中,使用twinx()方法共享了x轴,并且建立了两个y轴,左侧的y轴代表的是销售额,右侧的y轴代表是对应的销售额增长率。

初步分析:结合销售额与增长率2011~2014年该超市的销售额在稳步上升,说明企业市场占有能力在不断提高,2012~2014年增长率在增长后趋于平稳,说明企业经营在逐步稳定。同样根据销售和增长率,可以初步制定下一年度的销售额指标是530万元左右,当然具体销售额指标的制定还要结合公司的整体战略规划。

了解了该超市的整体销售额情况之后,再对不同地区分店的销售额占比情况进行分析,以便对不同地区分配下一年度的销售额指标,和对不同地区分店采取不同的营销策略

首先按照Market字段进行数据分组,整体看一下不同地区分店2011~2014年的总销售额占比,如以下代码所示。

从占比图中可以看出APAC地区销售额占比最大,为28.4%,而Canada地区的销售额占比最少,只有0.5%,说明市场几乎没有打开,可以根据公司的总体战略部署进行取舍,从而根据销售额占比分配下一年的销售额指标。

接下来,为了能更清晰地了解各地区店铺的经营状况,可以再对各地区每一年的销售额进行分析,如以下代码所示。

下面是另一种操作:(两者效果一样)

从图可以看出,各个地区2011~2014年的销售总额均是增长的趋势,APAC地区和EU地区的增长速度比较快,可以看出市场占有能力也在不断增加,企业市场前景比较好,下一年可以适当加大运营成本,其他地区可以根据自身地区消费特点,参考上面两个地区的运营模式。

根据不同类型产品在不同地区的销售额占比,可以适当地改善经营策略,如以下代码所示。

所有产品按照三个大的类型进行了区分,分别是Furniture(家具)、Technology(电子产品)和OfficeSupplies(办公用品)。通过上图大致可以看出,在各大地区销售额都比较高的是电子产品,可以根据企业的整体战略部署适当加大对各地区该品类的投入,以便扩大优势。

根据超市的整体销售额情况和不同类型产品在不同地区的销售情况,再对每年每月的销售额进行分析,根据不同月份的销售情况,找出重点销售月份,从而制定经营策略与业绩月度及季度指标拆分。

为了方便观察数据,需要将数据根据年和月进行分组,并计算出每年每月的销售总额,再将其制作成年、月、销售额的数据透视表,最后通过折线图进行展示,如以下代码所示。

通过图基本可以看出,该超市2011~2014年每一年的销售额同比上一年都是上升趋势,而且很容易发现该超市的旺季是下半年,另外在上半年的销售额中发现6月份的销售额也是比较高的,所以可以在6月份开始加大一些运营成本,进而更大一步提高销售额,但是需要注意是下半年的7月份和10月份销售额会有明显的下降,可以针对这些下降的月份多举行一些营销活动。

企业的老客户一般都是企业的忠诚客户,有相对较高的黏度,也是为网站带来价值的主要客户群体;而新客户则意味着企业业务的发展,是企业价值不断提升的前提。可以说“老客户是企业生存的基础,新客户是企业发展的动力”,企业的发展战略往往是在基于保留老客户的基础上不断地提升新客户数。

分析新老客户的意义就在于:通过分析老客户,来确定企业的基础是否稳固,是否存在被淘汰的危机;通过分析新客户,来衡量企业的发展是否顺利,是否有更大的扩展空间。

根据该企业的新老客户分布,对超市客户维系健康状态进行了解。在分析之前需要定义一下新客户,将只要在该超市消费过的客户就定义为老客户,反之为新客户。由于2011年的数据为起始数据,根据定义大部分客户皆为新客户,其数据没有分析价值,如以下代码所示。

代码解析如下。

1)根据CustomerID列数据进行重复值的删除,保证数据集中所有的客户ID都是唯一的。

2)根据Order-year和Order-month两个字段进行分组,并使用size()函数对每个分组进行计数。

3)为了方便使用透视表对数据进行整理,需要先将索引转化成数据列。

4)使用数据透视表功能,将年份作为数据的列索引,月份作为数据的行索引。

根据图表可以看出,2011~2014年每一年的新增客户数是逐年减少的趋势,可以看出该网站对保持老客户是有效的,网站的运营状况较为稳定。但是,新客户获取率比较低,可以不定期地进行主动推广营销,从而增加新客户数。

或者这样操作:

目前几乎所有企业业务都是以客户的需求为主导,都希望服务好客户,促进销售转化,最好能让客户对产品和品牌产生黏性,长期购买。于是市场和运营人员都会绞尽脑汁的做活动、上新品、蹭热点、做营销,不断地拓展客户和回访以维系客户感情。但是,这些工作除了少数运气好的之外,大部分效果都不是很好,真正有价值的客户没有几个。不同阶段、不同类型的客户需求点不同,有的客户图便宜,有的客户看新品,有的客户重服务,粗狂式的营销运营方法最后的结果往往都是事与愿违,企业的资源利润无法发挥其最大效用去创造最大化的利润。

那么如何进行客户价值分析,甄选出有价值的客户,让企业精力集中在这些客户上,有效地提升企业竞争力使企业获得更大的发展呢?解决的方法很简单,就是客户精细化运营。通过各类运营手段提高不同类型的客户在产品中的活跃度、留存率和付费率。而如何将客户从一个整体拆分成特征明显的群体决定了运营的成败。在客户价值领域,最具有影响力并得到实证验证的理论与模型有:客户终生价值理论、客户价值金字塔模型、策论评估矩阵分析法和RFM客户价值分析模型等。这里介绍一个最经典的客户分群模型,即RFM模型。

RFM的含义如下。

根据R、F、M这3个维度,可以将客户分为以下8种类型,如图所示。

R、F、M每一个值是如何计算的。

例如,该超市某用户的2014年的消费记录见表。

1)R:5/1/2014-3/9/2014=53。2)F:消费次数=2。3)M:消费金额=128.736+795.408。

计算出结果之后还是无法直接通过R、F、M单独的数据衡量客户的价值。那么如何根据这3个数值,分别对不同维度进行高低等级的划分?

当R、F、M每个值计算出来之后,可以使用评分的方式对每一个维度的数据进行评分。然后再根据所有数据的平均评分,对每一个评分进行高低等级的标记。

1)R:R值越大,评分越小。2)F:F值越大,评分越大。3)M:M值越大,评分越大。

当R、F、M3个维度对应的评分值设置完成之后,再利用每个维度评分值的平均值,对数据的R、F、M进行高低维度的划分。即当评分值大于等于对应的平均值时表示高,同理当评分值小于对应的平均值时表示低。这样就可以将数据整理成上面8种类型的表的结构,进而得到该用户是什么类型的客户。

下面开始利用Python探索该超市2014年的客户群体。

第2步,对2014年数据按照CustomerID进行分组,然后再对每个分组的数据按照OrderDate进行排序并获取出日期最大的那个数据,如以下代码所示。

第3步,经过分组之后同样可以快速算出RFM模型中的F(购买次数)和M(销售额总数),如以下代码所示

第5步,经过上面四步分别计算出了RFM各个维度的数值,现在可以根据经验及业务场景设定分值的给予区间。本项目中给定F的区间为[0,5,10,15,20,50],然后采用5分制的评分规则与上面分值区间一一对应,例如,1~5对应的为1、5~10对应的为2,依此类推,如以下代码所示。

第6步,根据第5步的思路,首先确定M维度的区间为[0,500,1000,5000,10000,30000],然后采用5分制的评分规则与上面分值区间一一对应。同理,确定R维度的区间为[-1,32,93,186,277,365],但是R维度所对应的评分顺序应该与F和M的相反,如以下代码所示。

第7步,上面给每条数据的RFM都设置了对应的评分,现在需要根据每一个维度计算出对应的平均分,然后用对应的分数与平均分进行对比,大于平均分的值标记成1,同理小于平均分的值标记成0,如以下代码所示。

第8步,现在基本完成对每个数据RFM高低值的设置,接下来就可以根据RFM的高低值对每个客户进行类型标记了,如以下代码所示。

到此为止已经给所有的客户都设置好RFM的标签,现在来看一下2014年不同类型人群占比,如以下代码所示。

无论在什么环境中,总会有二八法则的存在。例如,20%的客户为公司提供了80%的利润。前面RMF模型分类出了8种不同性质的客户,下面根据客户对平台的贡献度做了排序。

一般挽留客户→一般发展客户→一般保持客户→一般价值客户→重要挽留客户→重要发展客户→重要保持客户→重要价值客户

一个客户流入电商平台,客户行为转化大致和上面的顺序一样,从一开始注册到频繁浏览,再到习惯性在平台购买小件低额商品,客户通过多次消费行为对平台累积了信任后会开始购置大件大额商品,最终成为平台的重要价值客户。相反,如果平台哪里做得让客户体验差,重要价值客户也有可能降低购买量甚至流失。所以,无论对客户做出什么样的营销策略,目的都是加大客户不断地从一般挽留客户向重要价值客户转化,减小重要价值客户向一般挽留客户转化。从而实现平台客户的积累。

那么处于不同阶段的客户,应该根据客户的阶段特性来制定不同的策略。下面分析一下每组客户的特性。

THE END
1.浅谈电商数据采集重要的一环:数据清洗电商数据清洗在电子商务的浩瀚数据海洋中,数据采集是获取商业洞察力的第一步,而数据清洗则是这一过程中不可或缺且至关重要的环节。数据清洗不仅关乎数据的准确性与可靠性,更直接影响到后续数据分析的质量与深度。本文将从技术角度出发,深入探讨电商数据采集中的数据清洗过程,揭示其重要性及实施策略。 https://blog.csdn.net/Jernnifer_mao/article/details/140838875
2.电子商务数据运营与管理第二版第2章电子商务数据采集与预处理* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 2.3 电子商务数据采集实例 电子商务数据采集实训 1.实验目的 (1)了解数据采集相关知识 (2)实操通过八爪鱼工具进行数据采集 2.实验知识准备 (1)数据获取的基本流程 完整的数据获取流程主要包括采集、存储和清洗三个环节。https://max.book118.com/html/2022/0627/5033144114004300.shtm
3.基于小浣熊办公嘲的「大数据集分析」AI悟空聊架构3.4.2 实操内容 与办公小浣熊对话,输入上述提示词,它会帮我清洗数据。 小浣熊清理完数据后,还会温馨提示是如何清洗数据的:数据已根据“create_date”列进行了过滤,现在只包含在 2017-11-25 和 2017-12-04 之间的记录。 3.5 数据运算 第一个要分析的是每天的浏览次数以及每天的浏览人数。 https://xie.infoq.cn/article/49b0876e96a2a0d9df300e17e
4.武清开发区这些企业正在招聘!(第26期)3、具有较强的团队合作精神,对业务有较高的工作热情,较强的沟通和推动能力,妥善处理内外部关系的意识;具有采集数据和处理数据的能力,对数字敏感;高度的自我激励和结果驱动,思维敏捷,工作细心,处事灵活;具有较强的风险识别和管理能力。 待遇:缴纳六险一金、带薪年假、防暑降温、取暖补贴、交通补助、员工体检等,薪资面https://www.shkp.org.cn/content.html?type=lc&id=320689
5.武陟县人社局2023年7月31日收集企业招聘信息(第31期)河南阿洛克航空工业有限公司是一家专注于研发、生产和销售无人机的高科技科研生产型企业。产品应用于测绘、侦查、遥感数据采集与处理、电力巡查、农林植保等众多领域。产品销往国内外40多个国家和地区。旗下无人机驾驶员培训中心更是经民航局授权AOPA协会审定的合法培训单位。 https://wzjob.jzggjy.com/news/detail/304459.html
6.电商女装销量描述与分析案例知识点名称:数据筛选 知识点所属工作角色: 数据清洗 知识点背景: 1.对缺失值进行处理 2.从字符串中提取有用信息 3.根据之后描述性分析、探索性分析及建模需求,对数据进行合理的转化和处理,使得数据更具解释性 知识点描述 1.去除带缺失值的行 2.从字符串中提取有用信息 https://www.cda.cn/anli/23888.html
7.绩溪县2023年10月企业招聘信息要求:年龄20-45岁,大专以上学历,机电机械专业、掌握生产PQC\OQC发现过程/产品缺陷,监督指导分析和处理过程经验。 待遇:4000-10000元。 11.生产过程巡检:2名 要求:高中以上学历,有汽车零部件制造业检验工作经验优先;服从工作安排,巡检需能适应倒班。 待遇:4000-8000元。 https://www.cnjx.gov.cn/OpennessContent/show/2978202.html
8.Python电商数据分析实战教程课程内容涉及数据清洗、数据可视化、数据挖掘等方面的知识,通过实际案例的讲解和实操,帮助学员理解和掌握数据分析的基本原理和方法。 学习目标 本课程的学习目标包括:- 掌握Python的基础知识和数据分析工具的使用;- 理解电商运营和数据分析的深层关联;- 学会使用数据分析工具进行电商数据的清洗和处理;- 学习使用数据挖掘https://www.insideria.cn/web/special/details.html?id=110&from=more_list&type=0&recommend_id=2
9.学习前线周口Python人工智能培训班数据分析学习培训MySQL其他相关知识丨从Excel到Power BI丨Power BI中的数据清洗和分析模型丨Power BI中的数据可视化和报表制作丨Power BI项目实操丨认识和使用Tableau丨认识和使用fineBI丨数据思维和分析模型 Python数据分析 Python数据分析工具介绍丨使用NumPy实现批量数据处理丨线性代数和NumPy的linalg模块丨使用Pandas进行数据分析 http://www.haoxuanke.com/city/zk/news-id-109458.html
10.如何进行电商的运营工作数据清洗和预处理是数据分析的前置工作,需要对数据进行去重、缺失值处理、异常值处理等操作,以保证数据的准确性和可靠性。 3.数据挖掘和分析 数据挖掘和分析是电商运营数据分析的核心环节。需要通过数据挖掘、统计分析、机器学习等技术手段,挖掘数据背后的规律和趋势,为电商平台提供决策支持和优化建议。 https://www.linkflowtech.com/news/1767
11.20电商3B模块三数据清理* 6.数据分类与处理的方法不包括()。 A、数据采集 B、数据清洗 C、数据计算 D、数据排序 * 7.某店铺2019年度会员信息表中,某会员的出生年份是1990年,但年龄却记录为25岁,此类错误需要进行()。 A、缺失值清洗 B、重复值清洗 C、逻辑值清洗 D、无价值数据清洗 * 8.默认情况下,在Excel中输入数值“751667794https://www.wjx.cn/vj/rHykhIg.aspx
12.数据挖掘实战——电商产品评论数据情感分析:深度洞察用户心声数据清洗 :过滤掉数字、字母和特定品牌名称,减少噪声。 分词处理 :使用jieba进行分词,同时进行了词性标注和停用词的过滤,保证分析的准确性。 名词提取 :重点分析包含名词的评论,因为它们能更清晰地反映产品特性。 评论情感分析 情感词匹配 :结合自建情感词表,对每条评论进行情感倾向的初步评估。 https://cuicuo.com/index.php/2024/12/02/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E5%AE%9E%E6%88%98-%E7%94%B5%E5%95%86%E4%BA%A7%E5%93%81%E8%AF%84%E8%AE%BA%E6%95%B0%E6%8D%AE%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90%EF%BC%9A%E6%B7%B1/
13.大数据:分类算法深度解析数据清洗是特征提取的前提。它涉及到处理缺失值、异常值、重复值等问题,以确保数据的质量。清洗后的数据更有利于提取有效的特征。 在处理缺失值时,常见的方法包括删除包含缺失值的样本、用均值或中值填充缺失值,或者使用更复杂的插值方法。对于异常值,可以通过统计学方法或基于模型的方法进行识别和处理。而重复值的处理https://www.360doc.cn/article/78411425_1110858832.html
14.2022级电子商务专业群人才培养方案项目任务六:仓储数据处理 教学方式方法:主要采用任务驱动的教学方法,采用理论与实操相结合,线上线下结合的方式教学。 考核方式:课程考核采用多元评估体系,过程性评价和终结性评价相结合。 实训实践要求:教学场所为多媒体教室和物流综合实训室。 教师要求:任课教师应具有高尚的品德、扎实的仓储理论基础、丰富的仓储实践https://www.mxdx.net/jwc/info/1042/1241.htm