争议:婚恋网站的推荐系统,怎么做才能让用户不用再回家相亲?腾讯云开发者社区

首先,我们先顺着作者的思路去看佳缘经历的推荐算法:

在2011年到2013年的算法年,佳缘尝试了两个算法方向,与我的想法非常背离,第一个不是最基本的Content-based,而是Item-based,相信Item-based算法大家都再了解不过,所以就不多做解释。我们只来分析算法的业务应用。Item-based是在构建一个User-Item矩阵,然后计算Item-Item之间的相似度。那么具体到婚恋网站的业务场景,其实也就是构建了一个Man-Woman的矩阵,将Woman当做Item,计算Woman之间的相似度,这个算法场景基于背后的假设是认为,如果一个男人喜欢一个女人,那么他必然喜欢和这个女人相似的女人,换句更直白的话说,每个男人都喜欢自己女朋友的闺蜜。相似,我们将User-Item矩阵做转置后,可以继续做Man的相似度,不再复述。

那么这个算法解决的出发点很好,但是实话实说,其实paper一共就那么多,我总结着看了下,并没有真正有用的东西,也没有创造性的模型产生,只是对于传统推荐算法的一个后过滤,整体思路就是把曾经的无向图变成了有向图,分别求出Man-->Women,Woman->Man的双向关系,然后或者相乘,或者搞一些奇怪的公式去做拟合。作者说不太靠谱,但是我认为这个算法从思路上来说是对路的,无论是不是用他们那些莫名其妙的模型,但是作为思想的参考还是值得借鉴的。

接下来佳缘推荐算法的阶段步入了2014的工程年,作者根据佳缘的团队及业务特点将佳缘推荐做了战略上的调整,从比拼算法模型改成了比拼特征工程。我不了解佳缘的实际情况,不敢多做评价,只是从个人感觉来说也许作者从一个极端走到了另一个极端。从外界来猜测一下佳缘的实现思路:抽出各种各样的特征,例如用户的基本人口学信息,加上用户的行为属性信息等等,然后针对每个用户训练一个分类器,来预测他是不是对对方感兴趣。

那我们来聊聊逻辑回归的根本问题吧:

我相信接下来我说的很多尝试和做法,佳缘都已经尝试过了,但是站在局外者的角度,我认为除了传统的特征工程以及算法模型的优化外,其实接下来的这些才是婚恋网站推荐算法成功的关键(结合佳缘的模式:收取用户的看信费用,其实我没用过):

说归说,我很佩服作者几年来一直坚持着做着同一个产品的推荐算法,也希望大家可以多多讨论。

在<商品推荐算法&推荐解释>一文中,@飞林沙表示,我们做推荐算法的时候要考虑:

但是从工程角度上,并不适合上来就搭建这么复杂的模型,所以我们可以适当做简化,例如:

@飞林沙认为,数据挖掘或推荐系统只要达到目的就足够了,用什么模型其实真的没有那么重要,优化了好久的模型还真的不如加两条规则,或者人工清洗一下数据好用。模型真正的价值是泛化,但是对于工业界来说,泛化能力不需要太强,只要限定在当前的产品线就够了,如果产品形态改变可以再来一个算法。

@breezedeus在原文中提出了自己的感想:

技术为产品服务,而不是直接面向用户数据质量是地基,保证好的质量很不容易如何制定正确的优化指标真的很难业务理解>工程实现数据>系统>算法快速试错

很多刚工作的同学,最喜欢干的事就是套算法,认为懂了算法就什么都会了。真实产品基本都是数据>特征>算法。算法真不是那么重要!

2011年8月我加入世纪佳缘,开始时主要负责佳缘的交友推荐系统优化,后来我这个团队也负责其他的机器学习事情,比如佳缘的网警系统(抓恶意用户)。刚来时团队加上我只有3个人,做的事基本集中在推荐系统,以及对业务部门新产品的接口支持。当时我自己并没有推荐系统应用于工业界的实际经验,所以很想当然地就从自己了解的推荐算法开始工作了。

Item-basedkNN算法的尝试最开始是基于最大化佳缘用户发信量的业务理解,但后来我们发现这个理解跟业务部门的需求偏差很大。比如给男性展示美女,男性的发信就会暴涨,但这样就会导致少量的女性收到大部分信,而大部分女性则没信可收。这是业务部门不愿意看到的。虽然我们尝试在item-basedkNN基础上做调整来平衡其他的业务指标(如收信人数,看信人数等),但效果不理想。

第二个尝试是学术界的可逆(Reciprocal)推荐算法1,即在考虑用户体验的同时也兼顾item(对佳缘来说也是人)的体验。这个尝试基本是失败的,学术界发明的那些算法基本都有各种前提假设,真用起来都不太靠谱。

虽然到2013年我们团队人数上升到了六七人,但基本在推荐算法上做事的人还是只有两个左右。

从2013年底开始我逐渐意识自己对算法的理解过于学术而无法满足业务部门的实际需求。所以从2013年底我开始从业务出发重新梳理推荐算法团队的工作方向。相对于给用户推荐物品的场景,佳缘的在线交友推荐有以下几个特点:

转化链很长,反馈延迟

佳缘业务的高复杂性,加上团队在使用算法上经验不够,让我决定把接下来的算法优化方向放在特征工程上,而算法就限制在最简单的逻辑回归(LogisticRegression)。团队在处理特征的过程中可以积累对数据的处理经验,以及对业务的理解。逻辑回归足够简单,解释性好,也有很好的开源实现。从它开始也可以让团队在算法使用上积累心得。这是“战术”上的第一个选择。我们把上图中每一步转化作为单独的问题分别进行优化,这样逻辑回归就适用于每一步。这是“战术”上的第二个选择。

上面说的“战术”,其实针对的只是推荐系统里的排序系统。当时我对推荐系统整体的想法是把运营需求和用户需求分开,然后分别对他们进行独立优化。具体说就是第一步以满足运营需求为目标获得候选集,而第二步是根据用户(双方)的喜好对候选集进行排序,系统流程图见下图。这样,在优化用户需求时就不需要考虑佳缘复杂的业务逻辑,可以极大地简化问题。同样,我们也可以比较独立地优化满足运营需求的候选系统。这可以认为是推荐系统的“战略”方向。

佳缘推荐系统流程图(2014)

2014年无疑是工程年。

2014年工程年的效果还是不错的,多个转化模型的分别构建和组合使用,使得业务上的各个指标都有所提升,很多指标的提升幅度都超过了50%。

例如,按照上面的流程图,第一步的候选系统通过考虑运营需求来产生候选集,然后候选集由考虑用户需求的排序系统进行排序。如果产生的候选集很小,那排序系统的优化空间就很小,作用自然也不会大;而如果候选集很大,那通过排序系统排序后获得最终推荐结果的做法就会降低运营需求的控制力度。

推荐系统通用流程图

再仔细说明下上面这个流程中的前两步:

相对于2014年运营需求与用户需求独立优化的“战略”,2015年的优化思路有所调整:

那么,为什么把2015年叫做推荐系统的产品年?因为今年推荐系统的目标是优化产品目标!

推荐系统是为产品服务的,而不是直接为用户服务。

上面这句话听起来很简单,但其实很多时候我们会在不知不觉中认为推荐系统是直接在为用户服务的。我们在最早的时候就是犯了这个错误。

本节的最后,汇总罗列下我这几年做推荐的感想:

这节我只是简单罗列下最近几年自己接触的比较有代表性的一些技术,跟工作关系不大。

了解DP主要是因为当时在看Mahout源代码的时候发现有个算法以前竟然没接触过,觉得挺有意思就仔细学了下。DP不太好理解,它被称为分布的分布。从DP抽取出的每个样本(一个函数)都可以被认为是一个离散随机变量的分布函数,这个随机变量以非零概率值在可数无穷个离散点上取值。DPM是非参数贝叶斯聚类模型,聚类时可以让模型自动学习类数。虽然听着好像很不错,其实有很多槽点,具体可见参考文献2(参阅参考文献请点击原文链接)。

LDA是文本处理里的利器,经常被用于对文本进行聚类,或者预处理。更详细的理论介绍可见参考文献3。当时我尝试把它用于佳缘的发信数据,看看能不能找出一些有明显特征的发信群体。聚类结果整体上基本不可解释,但有一个类别意义很明显,这类人主要给离婚异性发信。大家可以想想这类人是什么人。尝试感想是LDA直接用于聚类未必靠谱,但是可以把它用于数据的预处理,比如降维什么的。

ADMM是个优化算法框架,它把一个大问题分成可分布式同时求解的多个小问题。理论上,ADMM的框架可以解决大部分实际中的大尺度问题。槽点很多,谨慎使用!更详细的介绍可见参考文献4。

算法预测的效果还是不错的,准确度达到了87%。这还是在很小训练集上训练后获得的精度。DL麻烦是训练时需要调整的超参数实在是太多了,改一次超参数就要重跑一次,真的是很耗时。没有好的计算资源的话,建议别考虑DL。

实在想不出更多的有用特征?尝试下Facebook提出的利用GBDT来构造新特征的方法吧。我们的使用经验表明确实还是挺靠谱的,只要你效率能扛得住。具体介绍可见参考文献5。

很多个性化特征?特征数量太多?试试特征哈希的方法吧。此方法我们目前也没使用过,欢迎有经验的人发表意见。具体介绍可见参考文献5。

正负样本数量差异太大?训练样本太多机器跑不动?尝试下参考文献7中的抽样方法吧。我们之前的尝试表明还是有点作用的。不过如果你的数据不是大得跑不动,那尝试的必要性就不太大了。

THE END
1.如何开个婚介所(如何开一家婚介所)能够看中婚恋市场未来的发展前景,自然创业者在事物的远见性上是非常卓越的,除此之外还要热爱婚恋行业,遵守婚介品牌的运营制度等。“有爱有Ta”总部也会给予加盟商多个方面的扶持帮助,帮助加盟门店能够快速成型,全方位的扶植也能加盟商早日实现回本盈利。 0 条评论17944 http://www.meijia2008.com/index.php?id=474
2.婚恋服务平台(源码+文档+部署+讲解)源码管理婚恋婚恋服务平台是一个综合性的在线平台,旨在为用户提供婚恋服务,包括用户管理、活动管理、账户管理、审核中心、分销管理、账户中心、销售管理、服务管理等功能。平台通过管理端和H5端,为用户提供便捷的服务体验和高效的运营管理。 末尾获取系统源码 系统功能说明 http://k.sina.com.cn/article_7954797362_1da24933200101fc6y.html
3.婚恋交友网站运营模式随着互联网的普及,人们与世界的联系走向了更紧密的状态,各种新奇的网络服务应运而生。其中,婚恋交友网站成为了一个备受关注的话题。本文将从婚恋交友网站的运营模式方面进行探讨。 一、婚恋交友网站的定义和发展 婚恋交友网站是指一类旨在满足单身人士寻找爱情、建立家庭的社交网站。其核心业务是向用户提供注册、信息填写http://moliquan.com/zixun/959.html
4.打造专属婚恋平台,婚恋网站建设全攻略- 安全防护:加强网站安全防护,防止黑客攻击。 示例:安装安全插件,定期更新网站系统。 通过以上步骤,您可以从零开始打造自己的婚恋网站,在建设过程中,关注用户需求、优化网站功能、加强网站运营,是确保网站成功的关键,祝您在婚恋网站建设道路上取得丰硕成果!https://www.tacywl.net/post/7641.html
5.关于婚恋交友网站的运营思路启发篇(二)关于婚恋交友网站的运营思路启发篇(二) wapsky 官方认证帐号 2020-12-01 10:00 最近跟好几个运营婚恋交友网站的站长交流及网站运营的心得,据了解很多站长都觉得婚恋这个行业很难做,虽然市场需求很大,也很刚性,但仍会觉得线上赚钱太难了,不得不开发线下去或其他附加值来维持经营。实际上运营平台做得人多了,但是https://bbs.phpcoo.com/index.php/forum/list?tid=15621
6.婚介公司服务流程婚恋网站运营红娘话术行业设计素材婚介公司服务流程婚恋网站运营红娘话术行业设计素材 婚介公司服务流程婚恋网站运营红娘话术行业培训课件经营管理制度 风格: 婚介 公司 服务 流程 婚恋 网站 运营 红娘 话术 行业 图文详情https://www.zhe2.com/note/685150550614
7.婚恋平台“合伙人”“代理”方案说明(运营参考)2018版5. 商家需要放置展示网站的二维码海报在店面 本公司自成立以来凭借自身互联网专业技术支持优势,海量会员用户大数据,期待慧眼的你加入我们成为共赢合伙人。 此方案运营效果: 上线20天,平台收入破5万(不计线下),持续稳定增长中 备注:以上本地化婚恋社群营销运营方案由OElove婚恋系统产品开发商奥壹技术提供参考,若有https://www.oelove.com/yunying/654.html
8.婚介所怎么运营(解读婚介所婚恋平台不能不知赚钱运营模式)做为婚介所或者婚恋平台,盈利是很重要的一部分,没有人会做一件只有付出没有回报的事情,而且没有盈利后续的运营也是一个很大的问题,所以解决好盈利问题是重中之重的问题。 盈利所需要牵扯的东西就很多了,首先要先解决获客问题,利用各种渠道进行引流工作,比如:线上平台可以利用微信群、QQ群、朋友圈及各种社群的分享裂https://www.niaogebiji.com/article-168630-1.html
9.www.军之梦婚恋平台官网八一军婚专业军婚网站www.军之梦婚恋平台官网-八一军婚-专业军婚网站-正规公司运营-搭建军地鹊桥,促成军婚佳缘-为全军单身军人-官网首页 搜索 | 【逗号SSL(https)证书,25元/395天】【免费!!!十天首页一千词】【文本扩写,AI写作,通顺自然】【句子/段落/全文智能创作API】 监控排名https://seo.5118.com/m.81junhun.com
10.婚恋系统交友程序源码相亲系统婚介所软件爱牵线开发团队经19年运营和实践,自主研发了《婚介所管理软件》《微信公众号小程序系统》、《手机H5婚恋交友软件系统》、《红娘推广返利系统》、《商家、婚恋商城系统》等产品;全新上线V7,采用原生PHP和JS自主开发的相亲内核框架,性能高,负载强,深度二次开发更容易,https://www.a9a.cn/
11.2024年社交网络未来发展趋势预测图表54:Hers爱物网运营信息 图表55:蘑菇街基本信息 图表56:蘑菇街运营信息 图表57:美丽说基本信息 图表58:美丽说运营信息 图表59:LC风格网基本信息 图表60:LC风格网运营信息 图表61:2024年中国用户对社交化购物网站了解途径 图表62:2024年用户向朋友推荐社交化购物网站的原因 图表63:2024年用户选择社交化购物网站的https://www.cir.cn/R_JiXieDianZi/12/SheJiaoWangLuoWeiLaiFaZhanQuShiYuCe.html
12.八一军婚网全国首家专业军婚网站正规公司运营简介: 八一军婚网是现役军人和想选择军人做终生伴侣的爱军者的首选军婚婚恋网站。公司化运营服务全军部队和全国各地、专业军婚红娘为您提供正规军婚服务,成功率高、安全可靠 目录: 婚介、交友 @ 服务业 语言: GB2312 网址: www.81junhun.com 最后更新: 2012-06-07 14:28:01http://www.swkong.com/company/services/match_making,345235.html
13.婚恋交友系统OElovev5.4.zip资源婚恋交友系统OElove简介 OElove主要为满足企业及个人创业者对婚恋交友类网站的自定义快速搭建需求,OELove交友网站系统基于PHP Mysql开发的一套专业级本地化运营的婚恋、主题类交友系统,拥有交友、婚恋、微博、互动、心理测试等基础功能,运营者可直接运作也可以在此版本上进行二次开发模块及功能订制。 OElove 婚恋交友网https://download.csdn.net/download/weixin_39841848/11289625
14.地方网站微信公众平台该如何运营?(一)配置接本地网站微信公众平台应该如何运作? 最近开始接触微信公众平台,通过微信公众平台成功为我的网站带来了第一笔广告费。下面我将与大家分享一些我操作本地微信的经验。个人认为微信对于本地网站来说非常重要。大家可以关注一下。 相亲、交友平台网站定制开发、婚恋交友网站建设开发源码 http://www.bjhwtx.com/h-nd-22410.html
15.毕设精选基于SpringBoot和Vue的相关系统51CTO博客基于springboot的体育场运营系统+vue 基于springboot在线小说阅读平台+vue 基于springboot协同过滤算法商品推荐系统+vue 基于springboot学生选课系统教务系统+vue 基于ssm的网上书店销售管理系统+vue 基于ssm宠物寄养领养服务网站系统+vue 基于springboot的大学生心理健康评测系统+vue https://blog.51cto.com/u_14519396/8680059
16.婚恋交友APP运营需要哪些资质(ICP许可证和文网文证办理要求)4. 隐私保护:大多数婚恋交友APP都注重用户隐私的保护,通过严格的隐私政策和技术手段,保障用户的个人信息安全。 二、开发婚恋交友APP所需的资质和许可证 要合法开发和运营一款婚恋交友APP,企业需要具备多项资质和许可证。这些资质和许可证不仅是法律的要求,也是确保APP安全、合规运营的重要保障。 https://m.miibt.com/show-144-5328-1.html
17.网站图片怎么制作?网站图片制作教程步骤自己怎么制作网站图片?对于不会做设计的同学来说,制作图片可谓是非常困难,不仅要学会使用设计软件,还要懂美感,了解设计知识等等,而现在其实不用掌握专业的设计软件也可以轻松制作网站图片。 只需选择创客贴在线设计平台,寻找好用的模板,在原来的模板上进行文案信息、设计元素、图片素材等内容进行修改即可。 https://m.chuangkit.com/searcheo/course/3719.html