阿里/网易/汽车之家画像标签体系数据源算法

编辑导语:上一篇《阿里/网易/美团/58用户画像中的ID体系建设》,笔者进行了画像体系中的地基建设,ID-Mapping体系的打通;接下来一起探究阿里、网易、汽车之家标签体系搭建方法,我们一起来看一下。

一、阿里

为打破数据孤岛,创造更大的数据价值,阿里设计了OneEntity来提供全域数据与服务;OneEntity体系主要包含统一实体、全域标签、全域关系、全域行为4大类。

1.标签分类

其中GProfile全域标签的分类,将“人”的立体刻画划分为“人的核心属性”和“人的向往与需求”2大部分,具体包含4大类:

人的核心属性,可分为自然属性、社会属性:

人的向往与需求,可分为兴趣偏好、行为消费偏好:

在以上四大类的基础上,我们又尝试根据不同的业务形态进一步细分二级、三级分类。

2.标签萃取

标签的萃取工作包含:数据采集、清洗,去噪声并统一、反复试用并确定最佳算法及模型、为模型选择计算因子并对模型中的每一个计算因子调配权重、产出标签质量评估报告以辅助验收。

我们随机抽查了若干个在用的标签,预估工作量和工作周期,一个有价值的标签的萃取,平均耗时2周。

慢的主要原因:

标签萃取过程复杂,那有什么可以参考的流程呢?

当一整套工具型产品上线之后,批量生产十几个同类型标签只需要2天左右,这是因为在补足数据源、确定业务规则、选择数据样本、选择算法与模型的过程中,减少了大量的代码开发与模型训练的工作。

在这个过程中,参与的角色也发生了变化,从原本的以数据产品经理、数仓工程师、数据科学家为主导;转变为对业务更为熟悉的业务人员、数据分析师为主导。

GRelation全域关系、GBehavior全域行为在此不再赘述。

二、网易

网易大数据融合用户娱乐、电商购物、教育、新闻资讯、通讯等多行业10+产品线,构建起全域用户画像数据,目前总标签1000+,ID量URS、phone、idfa、IMEI、oaid等均达到忆级。

1)基础标签

性别、年龄、教育背景、生活习惯(早起晚起)、地理位置(POI信息)、职业状况、经济情况(有车有房)、设备信息(手机、运营商等)、会员信息(会员等级)、衍生信息。

其中衍生标签,如评估是否已婚,在原由标签体系下没有此类标签;但可通过多个标签进行组合生成新的标签,包含是否有小孩、30岁等条件组合。

2)行为标签

3)偏好标签

包含出行购物、手机数码、家装家居、教育公益、文化娱乐、新闻资讯、金融理财、游戏竞技、动漫影视、明星艺人等维度

4)预测标签

包含利用算法进行预测生成的标签,包含是否出行、是否买车等标签。

注意:

2.标签计算

预测类标签案例:性别,主要包含三种方案:

基于上述三类算法特征结果集,对模型进行融合,然后对用户的性别进行预测,其准确率在0.6以上。

注意:需要突破的地方在于特征的稀疏性,因为ID-mapping打通后,数据覆盖率仅20%左右,严重影响了模型的整体效果。

三、汽车之家

用户画像的构建就是把用户标签分列到不同的类里面,这些类都是什么,彼此之间的联系,就构成了标签体系。

1.按用途分类

1)人口属性

用户自然属性、用户会员、用户所属年代、用户价值登记、是否增换购用户、用户分群、UVN-B用户分群、用户分层、用户流失预警。

2)网络属性

用户APP设备信息、用户PC设备信息、用户活跃时段、用户平台偏好、用户活跃类型。

3)内容兴趣偏好

4)车兴趣偏好

用户短期兴趣车偏好、用户兴趣车偏好、配置偏好、用户颜色偏好、用户购车目的、用户置换偏好、用户推荐有车、二手车用户偏好、用户购车意向、用户新旧偏好、用户购车阶段、用户有车标签、用户兴趣集中度、用户能源偏好、用户生产方式偏好。

5)金融画像

分期购车意向度、用户购买力、二手车用户购买力、用户汽车价格偏好、用户经济属性、增换购用户预测线索。

6)场景画像

用户地理位置。

2.按统计方式分类

1)统计类标签

2)兴趣类标签

3)模型类标签

基于机器学习方法进行数据建模预测用户的标签,这类标签在标签体系中占比较少,其实现难度高,开发成本高。

例如:

3.按时效分类

从数据时效上,可分为离线画像和实时画像。

离线与实时采用的构建思想相同,不同之处在于:

四、总结

各大公司的标签分类不同,现市面上有三种常用的标签分类方式:

篇幅有限,接下来继续开展标签体系建设实践篇。

数据产品索隆,坎坷的标签体系建设之路

数据产品索隆,标签体系建设流程

标签构建过程中,如何快速盘点业务及数据需求?

阿里/网易/美团/58用户画像中的ID体系建设

作者:草帽小子;公众号:一个数据人的自留地,wx:luckily304

本文由@草帽小子原创发布于人人都是产品经理。未经许可,禁止转载

THE END
1.图购探索06让利1万欢迎莅临赏鉴详询:4009314460商家名称:钦州市金鹏汽车销售有限公司 咨询电话: 4009314460 店面地址:钦州市北部湾北大道西面、民生街西北面污水处理厂西南侧免责声明汽车之家车商汇的信息内容系经销商自行发布,其真实性、准确性及合法性由经销商负责,汽车之家不提供任何保证,亦不承担任何法律责任。 询问底价 预约试驾 对以上车型感兴趣?预约试驾https://www.autohome.com.cn/dealer/202411/1286278029.html
2.汽车之家电话汽车之家电话 电话号码:8610-59857382号码删除和更正 地区:济宁市 地址:北京市海淀区北四环丹棱街3号中国电子大厦b座10层在地图上展示 资料来源:2023中国电信山东省黄页 下载查电话APP随时随地查电话号码 相关查询 汽车之家汽车维修装具电话 汽车之家湖南mc车友俱乐部电话https://m.chadianhua.net/%E6%B1%BD%E8%BD%A6%E4%B9%8B%E5%AE%B6%E7%94%B5%E8%AF%9D111
3.你留在汽车之家的电话号码,5年被“卖”了96亿打开汽车之家,选择一款喜欢的车型,点击获取底价,在弹出的页面输入“姓名”、“手机号”等信息,这样的“询价”操作,意味着你正在将自己的信息无偿交给平台,而平台会把这些信息有偿提供给第三方、每年获得数十亿的收入。 你的信息很值钱,甚至可以为上市公司汽车之家带来近百亿的收入。 https://www.iyiou.com/p/94819.html
4.汽车之家北京车之家信息技术有限公司汽车之家(NYSE:ATHM)成立于2005年,为消费者提供优质的汽车消费和汽车生活服务,助力中国汽车产业蓬勃发展。我们致力于通过产品服务、数据技术、生态规则和资源为用户和客户赋能,建设“车内容、车交易、车金融、车生活” 4个圈,建立以数据和技术为核心的智能汽车生态圈,正式迈向智能化的3。0时代。https://www.yfchuhai.com/enterprise/3225.html
5.汽车之家把我的个人信息卖给多个4s店年初使用过汽车之家搜索车子,没几天就卸载了,到现在半年了,突然有三家车子品牌打了我十几个电话推销车子,都说是汽车之家看到的我的手机号,今天下载app发现我昨天多了几个询价,我时隔几个月才重新下载,怎么可能操作询价。咨询汽车之家客服,他们表示即使我注销app,我的电话号码仍然会推给汽车销售,我只能每个月设置https://tousu.sina.cn/complaint/view/17367357038/
6.转型中的汽车之家,能否重演十年前的突围戏码车市环境疲软的当下,汽车之家能否重演十年前的黑马突围戏码,还有待市场检验。 01 强劲数据背后的代价 市场不景气,但汽车之家仍取得了营收利润的双双上涨。 对此,汽车营销的行业人士告诉「子弹财经」,在经费有限的情况下,汽车垂直媒体的头部效应更明显。 https://36kr.com/p/1724225339393
7.电动汽车之家,为新能源汽车而生第一电动网是新能源电动汽车网站,这里汇集了专业的新能源电动汽车视频图集和行业资讯,丰富的新能源电动汽车产业链企业库、产品库、车型库,更有新能源电动汽车行业数据报告、帮买团等内容,了解新能源汽车,就来第一电动网。https://www.d1ev.com/
8.中国十大汽车网汽车网站有哪些2024年汽车网十大品牌最新发布,汽车网排行榜前十名品牌有汽车之家、易车、懂车帝、太平洋汽车网、爱卡汽车、瓜子、有驾、卡车之家、网上车市、第一电动网。汽车网10大品牌排行榜由品牌研究部门收集整理大数据分析研究得出,帮助你了解汽车资讯网站有哪些。https://www.maigoo.com/maigoo/1349qcwz_index.html
9.聊聊产品中的心理学之“登门槛效应”当然汽车之家的内容不是让我免费看的(毕竟制作内容也是需要钱的),这个时候它的第三步就来了:让我填写自己的手机号码,可以免费试乘奔驰。——我这种傻白甜当然是毫不犹豫的就填写了! 第四步汽车之家的合作经销商就开始疯狂的给我打电话,各种邀约、礼品诱惑,邀请我到门店里看车;第五步就是我到店里享受导购小姐https://www.niaogebiji.com/article-24343-1.html
10.汽车之家招聘汽车之家(NYSE:ATHM)成立于2005年,是中国知名的汽车互联网平台——为汽车消费者提供选车、买车、用车、换车等所有环节的全面、准确、快捷的一站式服务。 我们致力于通过产品服务、数据技术、生态规则和资源为用户和客户赋能,建设“车媒体、车电商、车金融、车生活”4个圈、从“基于内容的垂直领域公司”转型升级为https://www.liepin.com/company/886182/