徘徊的大数据门前:五个真实的数据挖掘故事

*利用大数据后,农夫山泉会发生管理变革吗?YES

*中国能制作出类《纸牌屋》的电视局吗?NO

*大数据可以给阿迪达斯带来利润吗?YES

*网易数据工程师可以当“媒婆”?YES

*中国政府未来会开放数据吗?YES

*正在到来的数据革命改变政府、商业和我们的生活......

文_本刊记者周恒星赵奕伏昕昝慧昉李春晖编辑_杨婧房煜王琦

就在制作这期“大数据专题”时,编辑部发生热烈讨论:什么是大数据?编辑记者们旁征博引,试图将数据堆砌的商业案例剔除,真正的、实用性强的数据挖掘故事留下。

我们报道的是伪大数据公司?我们是否成为《驾驭大数据》一书的作者BillFranks所称的“大数据骗局”中的一股力量?同样的质疑发生在阿里巴巴身上。有消息称,3月23日,阿里巴巴以7000万美元收购了一家移动开发者数据统计平台。这引发了专家们热烈讨论,它收购的真是一家大数据公司吗?

这些质疑并非没有道理。

中国确实没有大数据的土壤。“差不多先生”、“大概齐”的文化标签一直存在。很多时候,各级政府不太需要“大数据”,形成决策的关键性数据只有一个数字比率(GDP)而已;其二,对于行业主管机构来说,它们拥有大量原始数据,但它们还在试探、摸索数据开放的尺度,比如说,是开放原始数据,还是开放经过各种加工的数据?是转让给拥有更高级计算和储存能力的大型数据公司,还是将数据开源,与各种各样的企业共享?其三,数据挖掘的工具价值并没有完全被认同。在这个领域,硬件和软件的发展并不十分成熟。

即便如此,没有人否认数据革命的到来,尤其在互联网行业。阿里巴巴的马云将大数据作为战略方向,百度的李彦宏用“框计算”来谋划未来。即便是CBA(中国男子篮球职业联赛)也学起了NBA(美国男篮职业联赛)五花八门的数据统计、分析与挖掘。

但是,大数据还没法分析、挖掘出自己的直接变现能力。在截稿日时,我们再重新读维克托·迈尔-舍恩伯格(ViktorMayer-Sch鰊berger)的《大数据时代:生活、工作与思维的大变革》一书,作者相信,未来,数据会成为有价值的资产。假以时日,它会大摇大摆地进入资产负债表里。

案例1:农夫山泉用大数据卖矿泉水

文_本刊记者赵奕编辑_房煜

发挥你您的想象力,选择您认为可是的答案

这里是上海城乡结合部九亭镇新华都超市的一个角落,农夫山泉的矿泉水堆头静静地摆放在这里。来自农夫山泉的业务员每天例行公事地来到这个点,拍摄10张照片:水怎么摆放、位置有什么变化、高度如何……这样的点每个业务员一天要跑15个,按照规定,下班之前150张照片就被传回了杭州总部。每个业务员,每天会产生的数据量在10M,这似乎并不是个大数字。

但农夫山泉全国有10000个业务员,这样每天的数据就是100G,每月为3TB。当这些图片如雪片般进入农夫山泉在杭州的机房时,这家公司的CIO胡健就会有这么一种感觉:守着一座金山,却不知道从哪里挖下第一锹。

胡健想知道的问题包括:怎样摆放水堆更能促进销售?什么年龄的消费者在水堆前停留更久,他们一次购买的量多大气温的变化让购买行为发生了哪些改变竞争对手的新包装对销售产生了怎样的影响不少问题目前也可以回答,但它们更多是基于经验,而不是基于数据。

SAP全球执行副总裁、中国研究院院长孙小群接受《中国企业家》采访时表示,企业对于数据的挖掘使用分三个阶段,“一开始是把数据变得透明,让大家看到数据,能够看到数据越来越多;第二步是可以提问题,可以形成互动,很多支持的工具来帮我们做出实时分析;而3.0时代,信息流来指导物流和资金流,现在数据要告诉我们未来,告诉我们往什么地方走。”

SAP从2003年开始与农夫山泉在企业管理软件ERP方面进行合作。彼时,农夫山泉仅仅是一个软件采购和使用者,而SAP还是服务商的角色。

而等到2011年6月,SAP和农夫山泉开始共同开发基于“饮用水”这个产业形态中,运输环境的数据场景。

关于运输的数据场景到底有多重要呢?将自己定位成“大自然搬运工”的农夫山泉,在全国有十多个水源地。农夫山泉把水灌装、配送、上架,一瓶超市售价2元的550ml饮用水,其中3毛钱花在了运输上。在农夫山泉内部,有着“搬上搬下,银子哗哗”的说法。如何根据不同的变量因素来控制自己的物流成本,成为问题的核心。

基于上述场景,SAP团队和农夫山泉团队开始了场景开发,他们将很多数据纳入了进来:高速公路的收费、道路等级、天气、配送中心辐射半径、季节性变化、不同市场的售价、不同渠道的费用、各地的人力成本、甚至突发性的需求(比如某城市召开一次大型运动会)。

在没有数据实时支撑时,农夫山泉在物流领域花了很多冤枉钱。比如某个小品相的产品(350ml饮用水),在某个城市的销量预测不到位时,公司以往通常的做法是通过大区间的调运,来弥补终端货源的不足。“华北往华南运,运到半道的时候,发现华东实际有富余,从华东调运更便宜。但很快发现对华南的预测有偏差,华北短缺更为严重,华东开始往华北运。此时如果太湖突发一次污染事件,很可能华东又出现短缺。”

这种没头苍蝇的状况让农夫山泉头疼不已。在采购、仓储、配送这条线上,农夫山泉特别希望大数据获取解决三个顽症:首先是解决生产和销售的不平衡,准确获知该产多少,送多少;其次,让400家办事处、30个配送中心能够纳入到体系中来,形成一个动态网状结构,而非简单的树状结构;最后,让退货、残次等问题与生产基地能够实时连接起来。

也就是说,销售的最前端成为一个个神经末梢,它的任何一个痛点,在大脑这里都能快速感知到。

“日常运营中,我们会产生销售、市场费用、物流、生产、财务等数据,这些数据都是通过工具定时抽取到SAPBW或OracleDM,再通过BusinessObject展现。”胡健表示,这个“展现”的过程长达24小时,也就是说,在24小时后,物流、资金流和信息流才能汇聚到一起,彼此关联形成一份有价值的统计报告。当农夫山泉的每月数据积累达到3TB时,这样的速度导致农夫山泉每个月财务结算都要推迟一天。更重要的是,胡健等农夫山泉的决策者们只能依靠数据来验证以往的决策是否正确,或者对已出现的问题作出纠正,仍旧无法预测未来。

2011年,SAP推出了创新性的数据库平台SAPHana,农夫山泉则成为全球第三个、亚洲第一个上线该系统的企业,并在当年9月宣布系统对接成功。

胡健选择SAPHana的目的只有一个,快些,再快些。采用SAPHana后,同等数据量的计算速度从过去的24小时缩短到了0.67秒,几乎可以做到实时计算结果,这让很多不可能的事情变为了可能。

这些基于饮用水行业实际情况反映到孙小群这里时,这位SAP全球研发的主要负责人非常兴奋。基于饮用水的场景,SAP并非没有案例,雀巢就是SAP在全球范围长期的合作伙伴。但是,欧美发达市场的整个数据采集、梳理、报告已经相当成熟,上百年的运营经验让这些企业已经能从容面对任何突发状况,他们对新数据解决方案的渴求甚至还不如中国本土公司强烈。

这对农夫山泉董事长钟目炎目炎而言,精准的管控物流成本将不再局限于已有的项目,也可以针对未来的项目。这位董事长将手指放在一台平板电脑显示的中国地图上,随着手指的移动,建立一个物流配送中心的成本随之显示出来。数据在不断飞快地变化,好像手指移动产生的数字涟漪。

以往,钟目炎目炎的执行团队也许要经过长期的考察、论证,再形成一份报告提交给董事长,给他几个备选方案,到底设在哪座城市,还要凭借经验来再做判断。但现在,起码从成本方面已经一览无遗。剩下的可能是当地政府与农夫山泉的友好程度,这些无法测量的因素。

有了强大的数据分析能力做支持后,农夫山泉近年以30%-40%的年增长率,在饮用水方面快速超越了原先的三甲:娃哈哈、乐百氏和可口可乐。根据国家统计局公布的数据,饮用水领域的市场份额,农夫山泉、康师傅、娃哈哈、可口可乐的冰露,分别为34.8%、16.1%、14.3%、4.7%,农夫山泉几乎是另外三家之和。对于胡健来说,下一步他希望那些业务员搜集来的图像、视频资料可以被利用起来。

获益的不仅仅是农夫山泉,在农夫山泉场景中积累的经验,SAP迅速将其复制到神州租车身上。“我们客户的车辆使用率在达到一定百分比之后出现瓶颈,这意味着还有相当比率的车辆处于空置状态,资源尚有优化空间。通过合作创新,我们用SAPHana为他们特制了一个算法,优化租用流程,帮助他们打破瓶颈,将车辆使用率再次提高了15%。”

案例2:阿迪达斯的“黄金罗盘”

文_本刊记者昝慧昉编辑_房煜

他的厦门育泰贸易有限公司与阿迪达斯合作已有13年,旗下拥有100多家阿迪达斯门店。他说,“2008年之后,库存问题确实很严重,但我们合作解决问题,生意再次回到了正轨。”

在最初降价、打折等清库存的“应急措施”结束后,基于外部环境、消费者调研和门店销售数据的收集、分析,成为了将阿迪达斯和叶向阳们引向正轨的“黄金罗盘”。

现在,叶向阳每天都会收集门店的销售数据,并将它们上传至阿迪达斯。收到数据后,阿迪达斯对数据做整合、分析,再用于指导经销商卖货。研究这些数据,让阿迪达斯和经销商们可以更准确了解当地消费者对商品颜色、款式、功能的偏好,同时知道什么价位的产品更容易被接受。

推动这种订货方式,阿迪达斯得到了经销商们的认可。叶向阳说:“我们一起商定卖哪些产品、什么产品又会热卖。这样,我们将来就不会再遇到库存问题。”

挖掘大数据,让阿迪达斯有了许多有趣的发现。同在中国南部,那里部分城市受香港风尚影响非常大;而另一些地方,消费者更愿意追随韩国潮流。同为一线城市,北京和上海消费趋势不同,气候是主要的原因。还有,高线城市消费者的消费品位和习惯更为成熟,当地消费者需要不同的服装以应对不同场合的需要,上班、吃饭、喝咖啡、去夜店,需要不同风格的多套衣服,但在低线城市,一位女性往往只要有应对上班、休闲、宴请的三种不同风格的服饰就可以。两相对比,高线城市,显然为阿迪达斯提供了更多细分市场的选择。

实际上,对大数据的运用,也顺应了阿迪达斯大中华区战略转型的需要。

“我们与经销商伙伴展开了更加紧密的合作,以统计到更为确切可靠的终端消费数据,有效帮助我们重新定义了产品供给组合,从而使我们在适当的时机,将符合消费者口味的产品投放到相应的区域市场。一方面降低了他们的库存,另一方面增加了单店销售率。卖得更多,售罄率更高,也意味着更高的利润。”阿迪达斯大中华区董事总经理高嘉礼对大数据的应用成果颇为满意。

案例3:数据权之争

文_本刊记者周恒星编辑_杨婧

拥有了数据就等于夺取了行业制高点,飞友网络科技公司CEO郑洪峰深知个中道理。

最近几年,随着移动互联网的兴起,一类关于航班动态的应用程序开始出现。通过一套算法,数据工程师们将机场航班实时动态转换成直观的信息,再传递给用户,让后者能够及时了解到航班的起飞、到达、延误、取消、返航、备降等状态,从而帮助用户更高效地安排行程计划。

随着这个细分市场呈现三足鼎立的局面,一个问题浮出水面。郑洪峰向《中国企业家》直言,数据是这个行业最重要的资源。但是目前中航信垄断了大部分行业信息,使得飞常准必须通过购买和交换才能获得自己所需要的数据。

“我们的数据成本是非常高的。”郑洪峰告诉本刊,“气象、航班信息、空域流量等信息有些是公开发布的,有些则需要公司向空管局、机场和航空公司购买或交换。”

对于郑来说,获取数据的过程就是一部血汗创业史。据其回忆,早年的各大机场、航空公司之间的数据是割裂的,为了获得准确的航班起降信息,郑洪峰和他的团队就去为这些政府机构、大公司提供技术支持,以此来交换所需要的数据。“我们必须放下身段,他们需要什么我们就做什么。”郑说道。因为飞常准是家小公司,决策链条短,效率高,通过多年的积累,郑洪峰打通了部分数据通道。

2006年经济学家唐·泰普斯科特(DonTapscott)在《维基经济学》中指出,人类已经进入了共享时代:“失败者创建的是网页,而胜利者创建的是生机勃勃的社区;失败者创建的是有墙的花园,而胜利者创建的则是一个公共的场所;失败者精心守护他们的数据和软件界面,而胜利者则将资源与每个人共享。”这一理念后来被认为是网络2.0时代的核心理念。以用户为中心,注重用户交互,让用户参与共同建设的网络2.0同样适用于政府,最近几年各国政府的一系列举措标志着政府2.0时代的到来。

那么在大数据时代,中国政府做好准备了吗?

深藏的事实

面对竞争对手的步步紧逼,郑洪峰认为,正常的商业竞争并不是飞常准所焦虑的事。“开放与竞争对我们来说是好事。”

对于飞常准来说,央企中航信旗下的航旅纵横才是最大的威胁。“在一定程度上,它有垄断数据的嫌疑。”一位坚持匿名的专家说道。而面对记者的采访要求,航旅纵横以不便透露为由拒绝。目前,中航信拥有中国所有终端旅客详细的数据库,包括姓名、手机、消费习惯等,这是中航信最核心的资源。由于与航旅纵横母子公司的关系,非市场化的利益输送饱受诟病。

在中国,不到30%的空域对民航开放。和其它国家相比,中国是空域管制最为严格的国家之一。“民航系统也很头疼,七成多的空域属于国家机密,所以机场、空域关闭根本无法预知,何来公开的数据?”上述专家说道。

在石油、电信、铁路、民航等战略行业中,民航业的数据开放远远走在了其它行业的前头。上述电子商务公司的数据专家告诉本刊,设计物流工具时,他们更愿意与民航系统合作,不仅仅是快,还因为如果找相对封闭的铁路系统要一些关键性数据,“更难,更不靠谱。”数据专家说道。

中国传媒大学教授沈浩认为,现在的政府网站许多都是空架子,甚至大部分网站都很少更新,内容上也只是一些公告,而之前的决策过程并没有反映出来;与此同时,由于中国政府缺少推动力,尚无法建立像data.gov的数据平台。

另外,根据BNET商学院对中国政府部门的调查分析显示,政府部门以数据分析作为决策支撑并没有形成气候,将数据分析作为核心竞争力的只占5.6%,比起美国和英国等政府开源力度差距巨大。

此项调查的负责人,BNET商业英才网副总编周安利认为:政府部门依然缺乏对大数据的真正、全面的认识。在挖掘信息系统价值方面,数据分析也受制于管理体制和职能制约,及长期传统管理积累的习惯,业务驱动力不足,绩效考核不配套。所以中国政府部门对大数据可能产生的价值,以及如何利用数据分析实现政府的科学决策依然有相当长的距离要走。

数字生产力

以前,航班延误险存在一个问题,就是保险公司让用户去举证,用户必须有各种各样的纸质证明才能从保险公司拿到赔偿,而赔偿金额往往只有两三百块钱,因此用户都不愿意买这个险。“而现在,航班一落地,通过我们的数据和服务,保险公司就知道是否超过保险阀值,没超过的,用户可以直接从保险公司拿到钱,过程非常简单。”郑说道。与保险公司的合作,郑洪峰得到的回报是收取一小部分服务佣金。

数据开放不仅可以让小公司受益,而且可以让政府更加透明、负责任。美国政府前助理信息官、纽约大学法学院教授贝丝·诺维克(BethNoveck)在她的《维基政府——运用互联网技术提高政府管理能力》一书中阐述了如何在数字化背景下,运用网络和大数据建立民主和高效的政府。“数据开放可以让体制内外的人一起参与进来,解决政府无法完成以及棘手的问题。”诺维克告诉《中国企业家》。

诺维克以感染率数据为例说明开放数据的作用。美国的医疗部门搜集了全美几乎所有医院的感染率,但是政府并没有足够的能力把这些数据转化为有价值的信息。可是,当这些数据被放在data.gov网站上以后,微软和谷歌却能够运用自己强大的技术能力制作了一幅数据地图。不管是研究机构或者是普通患者都能运用搜索引擎查找任何一家医院的感染率来决定是否住院。

从2010年开始,百度联合卫生部、国家药监局等多个部委部门发起“阳光行动”,打击各类互联网不良及虚假信息,之后,百度与国家药监局正式达成战略合作,国家药监局的三大药品数据库,总计20余万个权威药品信息向百度开放,而且这些数据库将随着药监局的数据变化实时更新。用户可以通过通俗的商品名、专业的药品名、批准文号等多个途径,在百度搜索到药品的权威信息。

中国传媒大学教授沈浩认为,虽然中国政府在2007年就发布了《政府信息公开条例》,但目前政府公布的数据大部分还是报告和报表,没有标准的格式,不能以数据的形式查到,因此也无法进行深入的分析、加工和挖掘。

“如果政府需要社会共享和分析这些数据,必须提供最原始的数据,这样的数据学术和商业上才能去应用它。”沈浩说,“你看data.gov的网站,在上面的联邦政府的数据库,都是以电脑可读取的格式发布的。”

郑洪峰也相信,未来会更务实更市场化,歧视性的东西会越来越少。中国的数据会越来越开放,也会更加利用市场的机制去鼓励更多的商业用户用好航班的数据。

案例4:《纸牌屋》你学不会

凭借一部片子咸鱼翻身,这样的桥段在当下热播美剧《纸牌屋》身上重演,反转剧主角是美国一家视频公司Netflix,它的武器则是大数据。

事实是,美国“白宫甄嬛传”、导演大卫·芬奇(DavidFincher)和老戏骨凯文·史派西(KevinSpacey),这些噱头只是用以吸引眼球的皮毛。最抓人的是,Netflix根据数据技术推导出《纸牌屋》的关键要素,喜欢BBC剧、大卫·芬奇和凯文·史派西的用户存在交集,这是多么酷的一件事。

Netflix要将巨大的数据池变为生产力并非易事。长年以来,为了提高算法精准,它持续地举办大型比赛,来提高自己的数据挖掘能力。2005年底,Netflix曾开放一数据集,并设立百万美元的奖金(netflixprize),征集能够使其推荐系统性能上升10%的推荐算法和架构。这个数据集包含了超过48万个匿名用户对大约近2万部电影做的大约10亿次评分。

Netflix一直在寻找与自身匹配的数据挖掘工具。据一位前Netflix云数据库架构师的博客回忆,在2010年Netflix完成了两次迁移,其一是将Netflix的数据中心迁移到了AmazonAWS之中,其二是将Oracle数据库迁移至SimpleDB。而到了2011年又从SimpleDB迁移到Cassandra,利用Cassandra提供的路由配置,集群可以被部署在多个大洲。忘掉上述专业术语,一个小故事足以说明它们的意义。法国电影《不要告诉任何人》在美国的票房收入惨淡,只有600万美元。可Netflix的工程师并不相信这个数字,他们通过上述数据挖掘技术,找到了不易察觉的点击量,而这些才是被隐藏的事实。2011年时,Netflix决定播放《不要告诉任何人》。如Netflix预测的一样,这部电影在播放后立即在最受瞩目的节目中排到第四位。

早期,Netflix是北美家喻户晓的在线影片租赁提供商,它的主营业务是通过邮寄方式租赁DVD的模式赚取利润。然而,在互联网时代这个盈利模式逐渐式微。于是,Netflix将主营转向在线流媒体播放,其商业模式是付费用户通过PC、TV及iPad、iPhone收看电影、电视节目。但在逐步放弃高利润率的DVD业务,彻底转型低利润率的流媒体业务后,Netflix却遭遇营收增速放缓、成本费用激增的困境。2012年第三季度,尽管财报中营收和每股收益均超出分析师预期,股价却依然暴跌。美国知名专栏作家撰文称“Netflix被收购或许才是投资者最理想的选择”。

除此以外,一位视频行业的人士指出,在中国基于用户数据做出分析的同时,还要考虑广电审核的要素,一些领域与题材类型都要稍微收拢,“不是没法依赖数据,而是不能完全依赖数据,我们选择数据时也一定要结合中国国情。”

案例5:定制爱情

宅男们总幻想为自己定制一个女朋友,也许他们的愿望将不日达成。不是借助3D打印机,而是靠大数据时代的婚恋网站。

2012年底,网易旗下全新婚恋交友网站“花田”上线。花田以免费沟通为卖点,主打一二线城市中高端市场。摒弃了传统婚恋网站的“人工红娘”,花田不提供任何人工服务,从推荐到搜索全由系统自动完成。而业内的龙头老大世纪佳缘(Nasdaq:DATE),也在换帅之后摩拳擦掌,试图用大数据的精准化运营,为在海量异性资料中疲于搜索的用户“指一条明路”。

一年前婚恋网站最爱喊“实名制”。通过对用户身份证或手机号码进行验证,网站可获得用户真实姓名、年龄、性别、地区等身份证数据,对防止诈骗有一定作用。但如今各家都有,这种传统打法就过气了。毕竟有身份证的人,不一定是有身份的人。婚恋网站已将条条框框的硬指标罗列齐全,使人几乎怀疑进入的是淘宝人肉市场。当身高、体重、年龄、学历等等都一一框定,一看还有2000个姑娘(小伙)符合要求,是时候让理性回归感性了。而这感性,又是建立在理性的数据分析之上。

花田界面清新简洁,采用类似微博的信息流展示形式。首页是异性用户最近更新的图片、内心独白和文字传情,展示其生活方式、个人品味等软性资料。系统会自动推荐那些相对活跃、最近有信息流更新的人,这就促使用户拿出更新微博的劲头来更新花田,为花田积累了大量可供分析的软性数据。

“我们可以通过‘内心独白’来挖掘用户的性格特征。”网易花田负责人夏天宇说。夏天宇在网易已工作11年,此前他的团队负责网易微博的研发,而他最早的工作是Oracle数据库管理。

现在,他和他的团队正试图通过自然语言处理技术和语义分析方法来解码用户性格,实现“软硬兼施”的精准推荐。首先,他们运用切分词方法,从用户的“内心独白”中提取出现频率较高的关键词;再将这些关键词分类,如感性词汇或理性词汇;最后,通过文本分析、语义分析,从中挖掘出用户的性格是内向、外向、理想化还是现实派等等。这一技术目前还在测试中,2013年下半年会逐步投入使用。

花田团队只有30多个人,大多是85后。他们在对海量软硬数据进行分析的基础上,总结出一些人物特征,建立出一定数量的人物模型。再分析具体用户,将其分门别类套入各种模型。这样,用户心仪其中某一个人,便可向其推荐这一类人。

这种模型不仅是性格模型,还包括外貌模型。“我们马上要推出人脸识别。比如你想找个像范冰冰的女生,你输入范冰冰,就会推荐给你很多范冰冰脸型的女生。”夏天宇介绍,花田的后台已经提取出范冰冰脸型的数据,之后还会推出几十种流行的男女明星脸型供用户选择。

但跨平台数据提取在一定程度上又涉及用户隐私。大数据的底线在哪里?夏天宇认为,涉及到银行的数据绝对不可碰触。这个范围就很广泛。不过可以确定的是,网易不会在花田影响力和用户量都不足的时候开启跨平台数据分析。

“我希望花田能盖一个五层楼,每层装不同类别的人。一个收入五万块的人进来,也不感觉这里有很多屌丝。”夏天宇这样描述自己对花田的愿景。虽然少了王子配灰姑娘的浪漫童话,倒也实实在在为用户省去不少筛选麻烦。

数据分析不只可用于精准推荐,还能识别婚恋网站最为人诟病的造假和诈骗。2012年底,创始人龚海燕辞任世纪佳缘联席CEO后,另一联席CEO吴琳光担任CEO。吴琳光曾在空中网担任副总裁兼手机游戏事业部总经理。加入世纪佳缘后,他首先做的就是引入大数据来提高用户体验。世纪佳缘的数据分析团队开发出一套网警系统,由以往的被动等待用户举报骗子,改为主动出击。

“对我们来说,花篮托儿和酒吧托儿的危害最大。”世纪佳缘CEO吴琳光介绍,这两种人的特点是希望长期运营,不会像真正的诈骗犯,令受害者报案。钱虽不多,却最让人恶心。

通过对骗子这些行为模式的数据分析,世纪佳缘制作出一套骗子识别模型,已经投入使用。令人捧腹的是,吴琳光本人也曾因测试产品,被这套网警系统抓个正着,“我符合坏蛋的特征,上来就找女性直接要联系方式。”

“因为计划生育,这一段人口暴涨,她们对应的1973年-1978年的男性人口相对不够,和她们同龄的男性又被85后的年轻姑娘抢去了。”吴琳光说,2009年、2010年婚恋网站大爆发,正是因为这帮人到了必须结婚的岁数。

又如,世纪佳缘正在尝试联运页游,越是在世纪佳缘里收不到信的人,玩页游的越多。

数百年前的媒婆们绝想不到,若干年后,一群技术出身的工程师们用冷冰冰的数据为痴男怨女保媒拉纤。

然而技术男们纵然辨得出喜恶,抓得住流氓,却也有棘手的技术难题,比如人脸识别。对外貌的判断感性而且私人化,向来是婚恋网站的难点。世纪佳缘一直在努力寻找合适的面部识别软件,但难度很大。吴琳光表示,他们正引入一款能够识别相似脸的系统,从用户过往的选择数据中总结归纳用户喜欢何种脸型,给用户推荐类似脸型的人。

花田虽然背靠网易大树,即将推出人脸识别功能,但这一技术目前止步于脸型识别。花田试图将更高级的人脸识别,如五官识别、夫妻相匹配作为自己的增值服务收费点,尚有待进一步的技术突破。

对于人类这样复杂的动物,数据究竟能做到什么程度?吴琳光说自己的理想是让用户一注册世纪佳缘,看到的推荐异性就个个都喜欢。但从身边常听到的各种抱怨看,实现这个目标尚需时日。

THE END
1.婚恋网平台囍上媒捎真的可以找到对象吗欢迎咨询「合肥喜上媒捎久而久之,便失去了正确的判断。但是,我们的囍上媒捎婚恋平台将以用户安全和防骗为主,为你提供安心、可靠的交友平台。 你可能担心,如何保证交友对象不是骗子?囍上媒捎婚恋平台创造了多重防骗机制。我们不仅设立了严格的实名认证制度,还通过大数据技术进行身份验证、行为分析,真正保证每个用户都是真实可信的。 与此http://qiye.shuziyingxiao.net/item-10906740.html
2.娶一个巴基斯坦女人是种什么样的体验?征得姑娘的同意,王世成拍了照片给父母看,父母这次表示不干涉他的婚姻,只要他喜欢就好。离开的时候,王世成说给自己三天时间,考虑一下。 第二天,姑娘的父亲带着翻译来了。一脸的严肃,王世成心里直打鼓,他直觉这个父亲应该是不喜欢自己。他也忍不住正襟危坐,却不知道如何应对才好,只能客套的端茶送水。整整一个上午http://m.55xw.net/show-422841.html
3.记者亲身体验:号称免费的婚恋网站不付费寸步难行网友吐槽不靠谱 线下红娘也承认网上骗子多 百合网停牌至今 珍爱网无奈选择14亿“出嫁” 前段时间刷爆网络的一则新闻,父母提出“属羊的不要”等奇葩相亲理瞬间红遍朋友圈:户籍、收入、房产、学历等硬性条件是“交易筹码”,门当户对是“铁律”,为此这种传统的父母帮忙介绍的婚恋方式在网络上被年轻人大肆吐槽。而随着https://appm.hangzhou.com.cn/article.php?id=221654
4.杭州迈优品牌管理有限公司事发大概如下:marryu 于2021年4月25日线下邀约我去门店进行线下的资料登记和红娘沟通,到约定地点之后遭推销39***甚至更高价的消费套餐,当晚付了5000的预付款保留高级会员名额但并未决定是否接受套餐(所以也没有签署合同),红娘承诺最后不接受套餐可依照收据退款,但4月27号我决定不接受套餐后,在5月12日联系中却https://m.xfb315.com/complaints/details/94827900.html
5.暴躁老姐的心得分享视频「じゃあ何故そんなことするの」如今,这家市值千亿美元,拥有39477家门店的咖啡连锁巨头正面临史无前例的挑战:一面是竞争对手的步步进逼;一面是门店管理的问题频出。曾经被视为增长引擎的中国市场也动力不足,7月底发布的2024财年第三季度(截止2024年6月30日)显示,星巴克营收同比增长1%;而中国市场则同比下降11%。刚刚上任的这位80后新掌门,要如何http://www.wohui365.com/Iphone/51616159231436620721/index.phtml
6.怎么样加盟正规婚介(如何经营婚介所才能赚钱)怎么样加盟正规婚介(如何经营婚介所才能赚钱) 加盟之前对当地市场进行调查,是否适合在此处开设婚恋门店,通过对周围客流量情况调查,判断此处开店是否具有优势。加盟有爱有Ta婚介连锁加盟费用区间在9800-39800元不等,在三五线城市进行开店成本普遍在15万元左右,是每个小成本创业者的理想选择。http://meijia2008.com/index.php?id=1226
7.宁波我主良缘婚恋平台,电话把我骗去,给我洗脑3个多小时,诱骗我交我不会相信他们的话了,都是精神pua,和诱导消费,现在协商就说以我的性格不好找,诱导我买他们的婚恋技巧服务,我也不会再相信他们了,骗子公司,希望平台能看到同意我的诉求,积极反应,不想让其他更多的广大消费者受到欺骗了,希望能多多曝光。 诱导消费,霸王条款,虚假宣传 我于2024年7月28号在接到对方红娘有适合的https://tousu.sina.cn/complaint/view/17366499339/
8.我主良缘相亲靠谱吗?原来真相是这样!你们都“被骗了!”而我主良缘是采用实体婚恋模式的线上+线下的模式,单身在线上看上了心仪的对象后,可以联络网站客服或者去就近的实体门店考察,而门店的专业老师首先会审核单身的资料,通过审核后再根据单身的综合条件为其匹配合适的对象,网友普遍认为这样相亲较为靠谱。 “来这之前我在一些小网站相亲过,但是审核不完善,一个个美女看着https://www.7799520.com/news/53098.html
9.3·15晚会丨多家婚恋公司被点名!“把客户当成猎物”!红娘围追堵截记者在体验时,这几家婚恋平台的红娘,都承诺公司是严肃的婚恋平台。会过滤掉不诚信会员、有重大疾病的会员,保障客户的征婚安全。然而事实也并非如此严谨。 珍爱网呼叫中心 培训讲师:你为什么一定要去判断?他说他没结婚,他就没结婚。 百合网世纪佳缘线下门店 培训讲师:说实话一些隐疾我们核实不了。 世纪佳缘线下门店 https://www.cnr.cn/newscenter/native/gd/20240315/t20240315_526628597.shtml
10.中国男gary男爵个人资料「これで何曲になった」就在上个月,星巴克新任董事长兼首席执行官Brian Niccol曾表示,他正努力了解公司的中国业务,在市场竞争环境日趋激烈的背景下,星巴克需要弄清楚如何扩大市场,并探索出有利于公司长期发展的战略合作伙伴关系。星巴克中国门店达7596家近年来,国内咖啡市场竞争日趋激烈。窄门餐眼数据显示,截至11月12日,全国咖啡门店总数已突破http://www.cdkfq.gov.cn/gov/36vfH5D50Q0FFKypu6rufH/Default.html
11.已婚男同时交往5个女友,一人分饰多角“批量”诈骗现代快报讯(通讯员 狄公宣 记者 顾元森)“我希望和你一同去经历爱情的绚烂,一起去守住流年的平淡”“我会永远暖暖地陪在你身边”……31岁的崔女士期待这样的爱情,可是让她想不到的是,如此暖人心扉的话竟出自一个骗子团伙。8月18日,现代快报记者从南京地铁警方了https://www.xdkb.net/m1/nj/20200818/111169.html?_start_time=1653442191810&isPc=false&isMobile=true&res=%2Fr%2Fcms%2Fwww%2Fdefault&mobileRes=%2Fr%2Fcms%2Fwww%2Fmobile
12.当年轻人“不再恐婚”,互联网婚介却迎来大衰退还有个网友和赵晴说,自己也去了某个连锁婚恋品牌的线下门店,付了28800元套餐费,接着就被红娘密集定了好几次约会,“来的人都不怎么样,感觉红娘就是为了快点消耗约会次数”。 甚至还有个网友,在婚介所支付了5万元定金后,还没等服务期到期,婚介所就直接卷款跑路了。 https://36kr.com/p/2119822097664389
13.婚恋平台真爱难寻!“花钱买到的不是服务,是烦恼!”“注册后就频繁接到平台红娘打来电话推销服务,还邀请到门店详谈。”2019年8月18日上午,秦女士来到“我主良缘”婚恋平台位于新华国际的线下门店:“上午11点到下午18:30,持续不断围着推销,我一整天没吃饭,感觉当天不签合同他们都不会让我走。" 经过平台红娘长达6个小时的“疲劳轰炸”,秦女士现场购买了标价9999元的https://wap.cqcb.com/shangyou_news/NewsDetail?classId=2&newsId=2247825