通过把人员信息标签化,来构建人员画像。在一系列真实数据的基础上为人员建立标签模型体系,将人员的具体行为属性进行归类,最终形成一个多元化的人员标签对象。
在注意力越来越宝贵的互联网时代,个性化推荐技术成为各类APP“粘”住用户的必杀技之一。拥有“推荐系统之王”美誉的亚马逊,曾表示平台有35%的成交额得益于个性化推荐。就11.11而言,淘宝等众多电商APP成交额逐年创新高,一定程度上也要归功于推荐算法逻辑的不断完善,在提高推荐精准度的同时,甚至能做到根据用户实时行为快速修正画像,从而推荐最新的清单。除了购物,资讯、视频、音乐、社交等等众多APP都非常重视个性化推荐技术的使用,做到千人千面。
产品在最初推出时,会拥有自身的定位。但随着市场环境的变化,APP在每一次迭代时,除了要考虑自身发展的规划,还会结合用户的特点,提供更契合受众的服务。比如,某图像处理APP最初期望面向广大用户提供简单易上手的修图功能,但在运营与发展过程中,APP发现自身的用户多为95后的年轻女性,因而在更新下一代产品时,提供可爱的贴纸与美轮美奂的滤镜成为了产品开发的重点。
无论是在产品早期深入了解、关怀种子用户,还是在产品成长期、成熟期阶段的精细化运营,用户画像都是重要的参考方向。比如,资讯类APP经常利用消息推送的手段将用户可能感兴趣的内容及时奉上,确保用户通知栏上展现的大多是他们感兴趣的内容,在提升APP活跃度的同时避免产生打扰。
所谓「标签化」,就是用户信息标签化。即收集这个用户的各种数据和行为,从而得出这个用户的一些基本信息和典型特征,最后形成一个人物原型。一般用户画像会分析三个信息维度,分别是基本属性、消费购物以及社交圈。其中基本属性就是指用户的一些基本信息,比如年纪、性别、生日、学校、所在地等等。消费购物这一维度就更加具体,比如这个用户消费偏好的领域,偏好的价格,消费记录等等。
标签化的目标其实是基于大数据的采集,用电子化的方式将人员属性抽象出来,以方便数据统计,构建大数据池,后续进行数据挖掘和聚合分析。人员标签一定要根据实际数据对人员进行分类整理。
人员画像的目的是,用透明直观的标签对目标用户进行数字化的聚合和描述。在进行聚合时,要注意「低交叉率」的原则。就是如果两组画像中的标签几乎一致,那么影响不大的标签因素是可以被弱化。
另一方面,人员画像也要尽量保证其完整性和独立性。完整性是为了尽可能大的包含人员群体,独立性又要求这些群体里没有重叠。
数据清洗:数据清洗是对原始数据源存在“脏数据”如数据空缺和噪声、不一致、重复、错误等问题进行特殊化处理加工的过程,为了保证后期数据分析与数据挖掘的准确性,避免对决策造成影响,对原始数据进行数据清洗预处理。
数据标准化:用户画像需要整合多源甚至跨系统的数据,如客户可能使用多个设备,拥有移动网络的多个账号,需要把同一个身份ID组合,建立统一的标准,才能完整标识实体的用户画像。
用户·建模:借助算法模型来定义客群的用户画像,如大数据NLP文本分析、特征识别、关键词提取等算法模型,实现数据的精准匹配和关联。
标签挖掘:利用云计算、大数据和人工智能技术,通过系统平台来进行标签的加工和计算,借助平台进行训练和学习,大规模的并行计算,挖掘用户标签。
标签验证:通过真实案例验证标签挖掘结果的正确性,保证标签对应的处理结果跟预期大体相符。即可以先用小样本数据验证模型的可靠性,再依照结果进行调整,再进行挖掘。
大数据可视化:借助大数据可视化技术,通过大屏实现视觉效果,呈现群体或个人的用户画像。
基本信息:用户的年龄、性别、职业、教育水平、收入等。
行为偏好:用户对于不同类别产品或服务的喜好程度,以及用户在购买产品或使用服务时的选择偏好。
场景偏好:用户在不同场景下使用产品或服务的偏好,比如工作、娱乐、出行等。
地理位置:用户所在的国家、城市、地区等。
利用大数据技术处理人员画像目前还处于初级阶段,虽然大数据技术日趋成熟,但是在人员画像这一应用领域应用得还是比较少,对于人员海量数据的获取、存储、处理以及分析还未形成一个统一的模式。
首先,从数据获取方面考虑,很多公司内部数据的保密程度相对较高,不同行业之间的信息流通相对困难,会形成信息孤岛的问题,对于人员的一些网络数据的真实性也需要考虑在内。