百分点数据科学实验室:烟草行业市场信息采集数据质量评估体系研究探索腾讯云开发者社区

未来,在卷烟市场全面进入数字化时代后,通过采集市场信息所形成的数据分析将在上述业务环节中起到关键性、决定性的作用,因此如何有效地针对市场信息的数据触点(云pos终端机)建立起数据质量评估体系,科学引导零售户正确使用终端机,从而提高整体数据质量,获取真正实用的基础数据,是当前烟草企业首要解决的核心问题。

终端机:指在门店部署云Pos终端机的零售户门店,由云pos终端机提供市场信息采集所需要的数据,所有配套了云pos终端机的零售户门店统称为云pos终端(以下统称终端机),而配套了终端机的零售户实现了卷烟或非烟商品在进、销、存方面的自动化数据管理,可为市场信息采集提供时效性较高的数据资源,未来终端机将逐步全面覆盖所有的零售户,为数字化卷烟销售提供硬件基础。

终端机数据质量:指对终端机提供的进销存数据在真实性、完整性、准确性的要求,数据被评估与判断为质量越好的终端,其所提供的市场消费数据可深入分析的价值越大,可在卷烟市场价格指数等主题分析的探索研究中起到重要作用。

市场分析样本:基于样本估计总体的分析思路,根据层级结构、数据质量、样本库数量要求抽取符合要求的市场信息样本点进行数据分析,样本点由信息采集点中择优选取,存在一定的比例要求。

在营销转型的新形势下,烟草行业对于社会消费、库存数据的分析与应用具有迫切性。从微观层面看,烟草行业迫切需要了解每一款投放产品真实的市场状态,准确识别产品所处的生命周期阶段,为卷烟产品在各区域的进退提供数据依据;从宏观层面看,迫切需要对卷烟市场的社会库存压力进行科学评估,准确把握卷烟发展拐点,在工商协议的签订、货源投放的精准、社会库存结构的优化方面向数据驱动模式转变。

同时,在卷烟专卖管理数据分析方面,市场信息采集对市场经营环境起到净化作用,如对社会库存的研究,可从源头上发现真烟异常流动(区域间窜货)的违规行为,提前响应市场管理机制,进一步加强对卷烟市场的管理水平。

综上所述,市场信息采集对于卷烟行业的重要性逐渐突显,当前市场信息采集的获取途径是零售户门店所部署的云pos终端机,它们构成了市场采集的数据触点网络,是实现自动化信息采集的硬件基础。

基于市场采集所反馈的数据,烟草企业能够掌握更多的市场真实消费信息,加深对消费者行为的研究,不断挖掘出市场的真实需求,在有效帮助零售户提高盈利水平的同时,还能不断增强烟草企业的渠道掌控力,实现由传统卷烟批发商向以数据驱动主动力的模式转变,加快企业由卷烟批发企业向新零售供应商的升级转变。

根据需求调研,从数据可应用的角度来讲,市场采集数据只有合格与不合格两种,主要体现在三个方面:

只有符合真实性、准确性、完整性三个特点的数据才是合格数据。当前,造成数据不合格的主观因素与客观因素如下:

主观因素

软件使用者在主观上不想把真实的销售情况通过扫码销售反映出来,因此存在集中扫码、数据修改频繁、库存准确率低等问题。

客观因素

即使软件使用者愿意将真实销售情况通过扫码销售上传到烟草公司,但由于使用者能力不足、指导人员没有进行有效指导、设备故障等,造成数据不准确、不完整,导致数据准确率低、非烟商品扫码数量与种类低、库存低于合理值等。

根据实际业务调研,目前市场采集尚处于终端机设备的初始推广阶段,零售户在主观与客观方面的因素造成了原始数据质量不高,因此需要在初始推广阶段,结合客户经理基层拜访的实际工作情况,形成适合当前阶段的零售户终端机使用行为评估与样本点筛选体系,基于体系化管理引导零售户群体规范化终端设备的使用行为,逐步将整体数据质量提升,为深层次的主题分析打下数据基础。

进销库存数据主要由4张基础表组成:

登陆日志表

销售单行表

入库单行表

客户商品库存表

基于终端机的数据源表结构,结合对实际业务的调研与总结,本文初步探索出以下的可量化分析维度:

终端扫码时段

终端扫码时段是指每日终端机存在有扫码动作记录的时段,一天共有24个时段,若零售户在1天的有效经营行为中,销售执行动作的扫码时段较少,则属于不正常扫码现象,需要及时介入引导。

系统在线时长

扫码金额、零售量

扫码金额,指单个商品或者单笔的销售总金额、总销售量,若出现较大的异常值,则可能存在集中刷、乱刷的使用行为,目前仅限于对卷烟商品的监控。

扫码笔数

扫码笔数,指销售的订单数量,一笔订单包含多个商品,一笔扫码代表一笔订单,若出现较大的异常笔数,则可能存在集中刷、乱刷的使用行为。

扫码品规

扫码品规,指每笔订单中包含卷烟品规的数量,若单笔订单中出现较多的品规,SKU宽度较大,则可能存在集中刷行为。

在线支付

在线支付,指的是消费者主动出示二维码支付的行为,若当日在线支付比例较低,则说明零售户存在不真实扫码的情况。

库存量

库存量,指的是商品发生销售行为后、商品消耗后存储量的变化情况,若商品出现负库存的情况,则可能存在超量销售的情况,目前仅限于对卷烟商品的监控。

集中度

集中度,指的是单日扫码笔数最高的两个时段扫码笔数之和/当日总扫码笔数,目前仅限于对卷烟商品的监控。

根据实际的业务要求,目前市场的数据采集范围仅限于样本点,总体思路为通过样本点数据估计总体趋势,原则上样本点的结构要求做到各行政区域内档位、业态、城乡的全覆盖,且要求符合各层级(档位+业态+城乡)实际分布,但不同的层级具有不同的经营能力,各层级所需抽样的数量还需要根据各层级的经营能力判断,层级结构如下:

区域

行政区划分,如芙蓉区、天心区等。

档位

共有30个等级,主要用于衡量零售户的经营水平,级别越高,经营水平越强。

业态

区分零售户的经营业态,主要由超市、烟酒店、便利店、食杂店等组成,相同档位内不同业态的经营能力也不一样,例如同档位内超市与烟酒店的经营能力有显著的差异。

城乡

区分零售户所处区域特征,共有2个属性维度,城市与乡村,城乡属性的零售户经营能力普遍高于乡村属性。

随着终端质量的不断提高,未来样本库的更新需要具备一套自动化的新老轮换机制,来实现对样本库的动态管理,对于无法达到样本点要求的老采集点,原则上要执行置换过程,置换的过程需要有量化支持,有理可依、有数可查。置换原则通过业务探索,总结如下:

针对终端机数据质量评估问题,在统计学方面本质上属于对离群值的判断。在终端机扫码销售的过程中,大部分出现异常的扫码行为均可量化与转化为统计学上对离群值的判断。总结为基于概率分布模型进行离群值的判断,其基本思想是根据数据集的特性,对给定的数据集假设一个概率分布模型,然后在某个显著水平上,确定数据集的拒绝域或者接受域,拒绝域是出现概率很小的区间,如果数据落在此区间,则可判定为异常数据。

本次研究中,在假设整体属于正态分布的情况下,对指标规则的制定主要应用3倍均值标准差(3σ)进行离群值的判断。根据大数定律和中心极限定理可知,当样本数据足够多时,其分布趋于正态分布。在正态分布的基础上,常用异常值被定义为一组结果值中与平均值的偏差超过三倍标准差的值,理论分布图如下图所示。

除了在统计学层面外,在设计终端数据质量评估体系的过程中,更应该注意专家业务决策的经验性指导,不可忽视其关键作用。

总结以上方法论,项目实施过程中我们提出了日常监控+月度评分与分类的终端数据质量评估体系,其中日常监控的作用在于:

在日常监控环节,项目主要形成的规则体系如下:

(注:同群体=同层级)

针对区域+档位+业态+城乡组成的样本点层级结构要求,经过项目组分析,其理论上属于分层抽样的范畴,分层抽样又称分类抽样或类型抽样,将总体划分为若干个同质层,再在各层内随机抽样或机械抽样。分层抽样的特点是将科学分组法与抽样法结合在一起,分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性,各层样本数的确定方法有3种:

因各个层级之间的差异性较大,主要体现在卷烟订单(进货)数量方面,若要较为真实地接近各层级的经营水平,需要引入订单(进货)因素,通过结合奈曼分配法,基于层级群体的订单(进货)量的标准差与客户数确定每层比例,最后根据所制定样本量合理分配各层级中抽样数量,项目实施过程中,还引入了终端数据质量评分体系,在奈曼分配法的基础上,按数据质量分数的高低择优抽样入库,样本点筛选逻辑如下:

针对样本库量化管理方面的需求,本文采用系统日常评价+月度质量评估的机制对所有在线正常运行的云pos终端机进行量化评分,评分的高低结合奈曼法进行样本点的动态管理。

在日常监控评估环节,本文采用满分扣分制度,每日初始满分为100分,若当日触发不同的监控规则扣除规则对应的分数,分数扣除越多,则当日的数据越低,分数越低则影响日均评分成绩。

实现对终端机“平时成绩”与“月度期末考试”的评价体系搭建后,系统将在每月初通过综合评定对终端机使用情况进行量化,其中,日常监控评分权重为0.6,月度评估评分权重为0.4,两者综合分数高者所划分的群体等级越高,等级越高代表终端使用质量越高,其数据利用价值越高,便越接近真实的市场销售行为。

在实际应用中,为了加强样本库的稳定性,对一类、二类样本点设置了容错保护机制,具体体现为基础加分与进退规则的差异化,避免大规模样本点置换现象出现。

月度量化评分规则体系如下:

等级划分规则与等级进退原则如下:

日常监控方面,规则部署完成系统化开发,实现了在PC端、移动端对零售户终端机的规则监控,T-1日推送异常信息,帮助客户经理及时介入。

PC端应用成果:

移动端应用成果:

形成了监控→预警→推送→核验→反馈的业务闭环,为客户经理提供了移动办公的条件。

数据质量提升效果:

系统于2021年3月在某市局上线,通过现行的规则监控与线下终端引导,零售户月度人均规则数逐月下降,特别是在5月推进“终端全优化”专项行动后,终端机配套数量不断提升的背景下,人均命中规则数降低至今年最低点,说明零售户整体的终端机扫码质量在显著提升。

样本点遴选结果:

根据样本点占总体1%的要求,实现了4个试点区域的样本点的筛选工作,并实现了系统化的开发。

PC端样本点管理界面:

未来随着市场信息采集数据质量评估体系的实施,烟草公司对于端数据的管理逐渐趋向规范化,整体终端的建设发展向高水准迈进,由此产生的数据将为卷烟市场研究甚至是非烟商品的研究提供可靠的数据支持,如何将高质量的市场信息采集数据利用起来,是未来烟草行业进行深度市场化改革的探索道路之一,本文就以下四大研究方向进行了探索:

数据采集系统

企业通过建立详尽的客户基础信息档案,包括内部订单与外部零售的数据资源,形成真正的卷烟大数据并进行数据储备。

数据分析系统

应用主体是卷烟企业,构建数据科学的分析模型,深入挖掘有价值的数据,提炼出对能够促进市场、品牌、终端建设有价值的信息知识。

数据应用系统

应用主体是企业营销决策者,在数据科学所获得的信息知识下进行营销决策,营销决策直达卷烟市场,营销决策所带来的市场效应将由采集系统供应数据、分析系统提供结果。

以上三者之间形成一种相互联系、相互贯通的数据闭环关系,真正实现数据驱动模式的市场化改革。

通过市场采集数据对市场状态进行科学判断,首先要搭建市场量化指标,如基于售价数据的指标:零售与市场价格指数、条包零售价吻合率等;基于库存数据的指标:社会库存、社会存销比等;基于销量数据的指标:零售量等。根据历史经验,价格指数与零售量提升、社会存销比趋势下降,就说明市场供需紧张、市场处于空缺状态;反之,则说明货源过剩、供需偏松、市场处于饱和状态。

在卷烟市场中,如何准确判断品牌的生命周期、把握品牌发展拐点、准确制定品牌经营策略,是烟草企业一直探索的行业难题。

烟草企业可根据终端数据建立起以市场依据为导向的品牌生命周期管理机制,如依据某一时期内品牌扫码销售数据,确定品牌的上柜率、销售增长率,以此将品牌发展阶段划分为导入、成长、稳定和衰退四个阶段,根据当前所处的阶段,具体分析该阶段品牌的动销率、重购率、断货率等二级指标,同时结合内部订单中重需率确定品牌的健康指数,全面量化品牌的市场健康状态,科学判断品牌生命周期,为品牌的培育、引入、退出提供依据。

对零售户开展个性化精准服务是卷烟行业加强终端建设的重点方向,加强终端建设能够有效提升渠道掌控力,对新时代烟草商业企业高质量发展具有重大意义。客户经理可以利用平板电脑、手机等移动终端设备,根据后台海量的终端数据随时了解市场整体趋势及终端零售客户的基本情况,为有针对性经营指导和拜访提供了可能性。

参考资料

[1]白明,推动卷烟零售终端转型升级的探索研究,现代营销(下旬刊),2019年4期.

[2]周亮,“大数据”技术在浙江烟草新时期的应用[J].硅谷,2013(19).

[3]刘洋,数据驱动创新大数据时代的卷烟营销思考[J].信息与电脑(理论版)2013,(7).

[4]邹亮,卷烟零售终端价值评价体系研究,《中国烟草学报》,2013年4期。

[5]许译文,卷烟零售终端建设理论模型初探[J].新西部.2015(12):69.

[6]郭飞,构建复合型卷烟零售终端的路径选择[J].重庆与世界,2016(11):81-83.

[7]刘金娣,李莉莉,高静,卢睿,异常值检验方法的比较分析[J].青岛大学学报(自然科学版)第30卷第2期2017年5月.

THE END
1.海晏县公安局查获一起非法运输经营烟草案公安机关县烟草专卖局近日,海北藏族自治州海晏县公安局经侦大队联合州烟草专卖局开展打击整治涉烟违法犯罪活动,查获一起非法运输、经营烟草案件,抓获涉案嫌疑人1人,查获非法运输、经营烟草406条,涉案金额4万余元。 海晏县公安局接到县烟草专卖局线索称有人非法运输销售烟草,经综合分析研判,快速锁定一名山西籍涉案嫌疑人,最终在西宁市湟源县https://www.163.com/dy/article/JJ1ORK1P05566SD1.html
2.烟草窜货50条以上烟草窜货50条以上 一纸离别书 2023-12-01 20:30:40 免费咨询 一、烟草窜货现象烟草窜货,指的是烟草产品在销售过程中,跨过正常销售渠道,流入非销售区域进行销售的现象。这种现象在近年来随着烟草市场的繁荣而逐渐凸显。一般来说,烟草产品由生产商通过一级经销商销售给二级经销商,再由二级经销商销售给终端零售商。然https://aiqicha.baidu.com/qifuknowledge/detail?id=10123252399
3.寄48条香烟被罚多少钱,十八条香烟可以快递吗5,窜货香烟48条可以定罪 25倍罚款 违法,属于无证批发行为。根据烟草专卖法实施条例第五章第二十六条 无烟草专卖批发企业许可证的单位或者个人,一次销售卷烟、雪茄烟50条以上的,视为无烟草专卖批发企业许可证从事烟草制品批发业务。显然,你么有烟草准运证和批发证。只有零售证。肯定是违法了。 http://www.wzchinwin.com/pp/wxjy/130602.html
4.青海省烟草专卖局根据《烟草专卖许可证管理办法》第四十四条第四款的规定,被烟草专卖局或者其他执法机关一次性查获假烟、走私烟50条以上的,发证机关可以责令持证人暂停烟草专卖业务、进行整顿,直至依法取消其从事烟草专卖业务的资格。根据《烟草专卖许可证管理办法实施细则(试行)》第五十三条的规定,烟草专卖局在作出撤销、撤回及责令暂停烟http://qh.tobacco.gov.cn/qh/lskhcjwt/202209/07b0b88c21a5464eb31cdb7888dd4cf1.shtml
5.中国烟草非洲市唱发商业计划书综上所述,通过五种竞争力量的分析发现中国烟草在塞舌尔竞争环境并不激烈,远没有到挥舞 成本控制大刀打价格战的地步,塞舌尔企业可以利用目前这种比较宽松的环境,致力推出自己品牌和特 别的品质服务。但是也要看到目前在销售存在联盟还要保障联盟,要探索一条新的、长期的和利益共有 的“商商关系”。 以上三种分析方法https://doc.mbalib.com/view/8954f5f17bc07ad269d1c98ed19f8682.html
6.物流案例分析报告(精选6篇)根据《规范》,统计物流园区周边5公里以内的高速公路、国道、省道总条数情况,从图10可知,70%的物流园区5公里以内有2~3条公路,临近四条及以上公路的物流园区特别是形成了几个大的批发市场,仅在××市区就有××光彩大市场、××汽车零件工业城、××国际汽车城、钢材大市场、烟草物流配送中心等。其中,××开发https://www.360wenmi.com/f/file11gr021s.html
7.恶性窜货(名词解释)B. \(50\)座 C. \(60\)座 查看完整题目与答案 工业上取得大量的乙烯、丙烯、1,3-丁二烯D. 以上三条都是 查看完整题目与答案 影响中心原子配位数的因素有 ( ) A. 中心原子能提供的https://www.shuashuati.com/ti/733c166c93644f4d8381c98ff1a26e32.html
8.烟草防伪企业稽查人员查询产品时,直接发现窜货,可进行窜货管理; 通过以上信息的统计、汇总和分析,形成决策分析图,帮助企业分析决策。 4、解决方案 利用数字加密二维条码技术,将自动销售机里的烟包进行防伪识别和管理,当卷烟流通到消费者手中后,消费者通过自动销售机扫描端口或手机二维码扫描,达到防伪造、防涂改和强化烟草专卖业https://www.315fangwei.com/315fangwei/302.html
9.烟草例如:2001年7月修改烟草企业消费税改革相关政策之后,相当多厂家开始调整产品结构,以保证原有的利税指标能够正常实现,使得出厂价高于50元/条的卷烟投放增加。调查数据很快显示出零售价在5-8元之间的香烟市场比例扩大,同时平均零售价却因供需短期失衡而有所下降,并有持续趋势,这充分验证了本调查对于整个市场动向的敏感性http://www.ark-mr.com/topic-6-135.html
10.无锡一女子购买了48条中华烟,准备邮寄给妹妹当喜烟,被烟草局《烟草专卖法》第二十一条规定,托运或者自运烟草专卖品必须持有烟草专卖行政主管部门或者烟草专卖行政主管https://www.zhihu.com/question/532567380/answer/2484162472
11.烟草串货怎么处罚烟草经营者串货的。经营数额达到5万元,或违法所得1万元以上的,处五年以下有期徒刑或者拘役,并处或者单处违法所得一倍以上五倍以下罚金;情节特别严重的,处五年以上有期徒刑,并处违法所得一倍以上五倍以下罚金或者没收财产。 法律依据 《中华人民共和国刑法》 第二百二十五条违反国家规定,有下列非法经营行为之一,扰乱https://www.lawtime.cn/tuwen/702764.html
12.物一码营销系统防伪防窜货系统香烟溯源系统是一种用于追踪和管理烟草制品生产、流通和销售的系统,旨在确保烟草制品的合法性、质量和安全性。以下是香烟溯源系统的功能介绍和优势介绍: 功能介绍: 产品追溯: 香烟溯源系统可以追溯每一包香烟的生产和流通信息,包括生产批次、生产地点、制造日期、https://www.mtytsoft.cn/zhuisu/755