Spark实现电商消费者画像案例腾讯云开发者社区

可怜的打工人准备下班时,突然收到领导发来的一份电商消费者样本数据,数据内容是这样的——

消费者姓名|年龄|性别|薪资|消费偏好|消费领域|常用购物平台|常用支付方式|单次购买商品数量|优惠券获取情况|购物动机

存好数据后,打工人去跟领导讨论一下需要分析哪些画像,领导给了一下几个思路——

年龄和性别画像:根据用户的年龄和性别信息,了解不同年龄段和性别分布情况。购物平台和支付方式画像:了解用户首选的电商平台和支付方式,有助于针对不同渠道进行个性化的营销活动。优惠偏好画像:通过用户在折扣优惠、免费赠品等方面的选择,可以了解其在购物时最看重哪些优惠方式。商品类别偏好画像:根据用户对汽车配件、珠宝首饰、图书音像等不同商品类别的选择,可以推测用户的兴趣爱好和消费倾向。购物目的画像:通过用户对商品的描述,如性价比、时尚潮流、环保可持续等,推断其购物的目的和价值观。接下来,就是基于这些数据和分析目标,开始基于Spark实现电商用户画像案例讲解。

在线上生产环境里,样本数据一般会放到HDFS或者HBase等地方,这些数据可能还会进一步清洗后同步到Hive里,方便直接HiveSQL或者Spark-SQL方式读取到做计算。本次代码案例里,暂时不需要涉及那么复杂的存储,只需了解真实生产线上数据是放HDFS、HBase等仓库存储即可。

把样本文件consumers.csv放到项目里路径为src/main/resources/consumers.csv,通过Spark读取到内存当中,顺便打印看下读取到的数据情况——

defmain(args:Array[String]):Unit={valconf=newSparkConf().setMaster("local").setAppName("consumer")valss=SparkSession.builder().config(conf).getOrCreate()valfilePath:String="src/main/resources/consumers.csv"valfileRDD=ss.sparkContext.textFile(filePath)}打印的结果如下所示——

只需要一行代码就可以实现将原始样本每一行字符数据转成数组结构——

valconsumerRDD=fileRDD.map(_.split(","))转换生成的consumerRDD里每一行数据,可以理解成是一个数组,数组索引0~10对应的字段类型如下——

原始样本处理成上图情况,后续的操作,其实就纯粹可以通过类似SQL形式来计算需要的结果了。

根据用户对汽车配件、珠宝首饰、图书音像等不同商品类别的选择,可以推测用户的兴趣爱好和消费倾向。

针对这个需求,可以通过以下代码实现——

defmain(args:Array[String]):Unit={valconf=newSparkConf().setMaster("local").setAppName("consumer")valss=SparkSession.builder().config(conf).getOrCreate()valfilePath:String="src/main/resources/consumers.csv"valfileRDD=ss.sparkContext.textFile(filePath)valconsumerRDD=fileRDD.map(_.split(","))consumerRDD.map(x=>(x.apply(5),1)).reduceByKey(_+_).sortBy(_._2,false).foreach(println)}打印结果如下,可见这批样本里,受消费者消费倾向最多的前TOP3,分别是服装、家居用品、图书音像——

(服装,553)(家居用品,542)(图书音像,539)(珠宝首饰,535)(母婴用品,530)(美妆护肤,526)(汽车配件,523)(电子产品,506)(食品饮料,500)(运动健身,492)实现的核心是通过这行代码consumerRDD.map(x=>(x.apply(5),1)).reduceByKey(_+).sortBy(._2,false)。

reduceByKey(_+_)表示将具有相同键的键值对进行合并,将键相同的值相加,生成一个新的RDD,其中每个键关联着其对应的累加值,例如服装这个key,最后累加得到553值。

sortBy(.2,false)表示是按照累加的值大小降序排序。

结合以上函数,就可以实现将consumerRDD中的数据按照【消费领域】字段,聚合出每个领域的消费者数量。

通过用户在折扣优惠、免费赠品、品牌忠诚等方面的选择,可以了解其在购物时最看重哪些消费习惯。

defmain(args:Array[String]):Unit={valconf=newSparkConf().setMaster("local").setAppName("consumer")valss=SparkSession.builder().config(conf).getOrCreate()valfilePath:String="src/main/resources/consumers.csv"valfileRDD=ss.sparkContext.textFile(filePath)valconsumerRDD=fileRDD.map(_.split(","))consumerRDD.map(x=>(x.apply(10),1)).reduceByKey(_+_).sortBy(_._2,false).foreach(println)}打印结果如下,可以看到,在这批消费者样本里,基于日常使用、礼物赠送、商品推荐等消费方式受众最多,那么可以基于商品消费做进一步优化——

(日常使用,777)(礼物赠送,773)(商品推荐,762)(兴趣爱好,750)(品牌忠诚,750)(跟风购买,724)(促销打折,710)2.3、优惠券获取情况和购物动机的关系观察优惠券获取情况和购物动机之间的联系,探索消费者是否更倾向于使用优惠券进行购物

+-----------------------+------------------+---------------+|couponAcquisitionStatus|shoppingMotivation|MotivationCount|+-----------------------+------------------+---------------+|折扣优惠|商品推荐|168||免费赠品|兴趣爱好|167||免费赠品|礼物赠送|166||满减优惠|日常使用|166||无优惠券|兴趣爱好|165||免费赠品|商品推荐|162||免费赠品|跟风购买|160||免费赠品|日常使用|159||折扣优惠|跟风购买|158||有优惠券|礼物赠送|157||免费赠品|促销打折|157||折扣优惠|品牌忠诚|157||无优惠券|日常使用|156||有优惠券|日常使用|156||满减优惠|礼物赠送|155||有优惠券|品牌忠诚|154||免费赠品|品牌忠诚|154||满减优惠|商品推荐|154||无优惠券|跟风购买|153||折扣优惠|礼物赠送|151|+-----------------------+------------------+---------------+以上是一些简单的实现,在真实环境里,并不会这么简单,可能还会涉及一系列数据的清洗和join处理,进而通过一些模型及算法,计算出更多有价值的画像数据。

样本处理完后,原以为这个故事结束了,打工人可以下班了,没想到——

THE END
1.客户行为模式识别应用聚类分析在电商行业的成功案例简介客户行为模式识别:应用聚类分析在电商行业的成功案例 数据收集与预处理 在进行聚类分析之前,首先需要从各种数据源如网站日志、用户反馈等处收集相关信息。这些数据通常包含用户的购买历史、浏览记录以及搜索关键词等。通过清洗和标准化这些数据,确保其质量和一致性,是保证聚类分析结果准确性的前提。 选择合适的聚类算法https://www.zuenx.cn/ji-gou-guan-dian/640942.html
2.精准营销及推广,商业智慧之舟引领时代浪潮精准营销与推广,作为现代市场营销领域的核心策略之一,早已成为企业竞相追逐的制高点,随着互联网技术的飞速发展,大数据、人工智能等先进技术的融合应用,营销领域正经历着一场革命性的变革,精准营销,正是在这样的时代背景下应运而生,它强调以精准的数据分析为基础,以细致入微的客户需求洞察为手段,实现营销信息的精准投放,https://www.hnmshk.com/post/134.html
3.数据清洗电商规模增速图表怎么做1、商品数据分析是电商平台运营的核心环节,电商平台需定期对商品销售数据进行深入分析,包括不同商品的销量、库存状况、商品评论等多个维度。2、制作图表数据分析图的步骤包括:明确分析目的,收集和整理数据,选择合适的图表类型,使用图表工具进行制作,并对图表进行解读与优化,在制作前,首先要确立分析http://m.9213.net/tags-15515.html
4.大数据精准化营销有效率高、成本低等特点,被广泛的应用于大数据时代的电商营销中。本课程主要通过电商精准营销案例,介绍数据分析的全过程,从开始的分析目标的确定、数据收集、数据挖掘(分析)以及到最后的应用,让您切实参与到数据挖掘(分析)中来,加深数对数据挖掘(分析)整个流程的理解,梳理数据挖掘(分析)的所必备的知识和https://www.educoder.net/paths/cfkjx3s9
5.分享一些成功的电商数据清洗案例一、案例背景 某中型电商企业在运营了一段时间后,积累了大量的用户交易数据、商品信息数据以及用户行为数据等。然而,这些数据存在着诸多问题,如重复的订单记录、部分商品信息缺失、用户地址信息格式不统一以及一些异常的交易数据(如价格极高或极低的疑似刷单数据)。这些问题严重影响了企业对业务的准确分析和决策,因此决定https://www.jianshu.com/p/1ed5b1a7088c
6.电商女装销量描述与分析案例案例编号: 102002 案例名称: 零售行业——电商女装销量描述与分析 作者姓名(或单位、或来源): 朱江 案例所属行业: F523 纺织、服装及日用品专门零售 案例所用软件: Rstudio 案例包含知识点: 案例描述: 目前网络购物异常的火爆,发展迅猛,基于数据分析的精准营销需求也随之增加。目前网络购物的几个特点是:私人消费增https://www.cda.cn/anli/23888.html
7.基于大数据的电商行业个性化推荐精准营销实践.pdf基于大数据的电商行业个性化推荐精准营销实践 .pdf 16页VIP内容提供方:135***3240 大小:756.3 KB 字数:约1.69万字 发布时间:2024-11-12发布于河南 浏览人气:0 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)基于https://max.book118.com/html/2024/1110/5002023342011343.shtm
8.澳门三中三码精准100%,数据指导策略规划,完整版313.2437通过以上步骤,该电商平台实现了精准营销,提升了用户购买率和满意度,同时也降低了运营成本。 三、数据指导策略规划的完整版313.2437 数据采集(Data Collection):确保数据来源的可靠性,收集全面、真实、准确的数据。 数据清洗(Data Cleaning):对采集到的数据进行清洗,去除错误、重复、异常数据。 https://www.lhsensor.cn/post/26168.html
9.数字经济核心要素:数据算法和算力——移动支付打通了线上线下场景,让资金流转更加高效便捷;智能供应链利用算法优化物流配送,让商品流通更加敏捷高效;数字营销利用大数据分析消费特征,实现千人千面的精准触达。电商平台、外卖平台、在线旅游平台、电商直播等新型商业形态大量涌现,数字化成为传统企业转型突围的重要路径。数据驱动、平台赋能的新型商业生态加速构建,https://www.chinacoop.gov.cn/news.html?aid=1823586
10.数据科学与大数据技术专题师资培训第二期为进一步推动大数据学科发展,帮助更多高校和企业培养大数据师资能力,北京大数据研究院、大数据教育联盟和博雅大数据学院特推出第二期“数据科学与大数据技术”专题培训。 本期培训共6门课程,涵盖了大数据的完整流程,包括:数据的获取、清洗、分析、建模和应用。采取案例式教学,将企业应用案例贯穿每门课程,学员将通过培训http://www.bibdr.org/nd.jsp?_ngc=-1&groupId=11&id=82
11.MarTech数字营销技术在中国值不值得发展?然后是FB、Twitter开放API,可以进行社交网络的精准营销。 二、2014年 2011年,Scott首次制作图谱,有1502、零售121家、电商平台217家、电商营销203家;渠道分销106家、分销营销65家。 五、数据:1076家。这2、AdTech市场83.2亿美金 3、数据、数据清洗整合、数据跟踪统计分析市场34亿美金https://www.iyiou.com/p/85008