争议:婚恋网站的推荐系统,怎么做才能让用户不用再回家相亲?腾讯云开发者社区

首先,我们先顺着作者的思路去看佳缘经历的推荐算法:

在2011年到2013年的算法年,佳缘尝试了两个算法方向,与我的想法非常背离,第一个不是最基本的Content-based,而是Item-based,相信Item-based算法大家都再了解不过,所以就不多做解释。我们只来分析算法的业务应用。Item-based是在构建一个User-Item矩阵,然后计算Item-Item之间的相似度。那么具体到婚恋网站的业务场景,其实也就是构建了一个Man-Woman的矩阵,将Woman当做Item,计算Woman之间的相似度,这个算法场景基于背后的假设是认为,如果一个男人喜欢一个女人,那么他必然喜欢和这个女人相似的女人,换句更直白的话说,每个男人都喜欢自己女朋友的闺蜜。相似,我们将User-Item矩阵做转置后,可以继续做Man的相似度,不再复述。

那么这个算法解决的出发点很好,但是实话实说,其实paper一共就那么多,我总结着看了下,并没有真正有用的东西,也没有创造性的模型产生,只是对于传统推荐算法的一个后过滤,整体思路就是把曾经的无向图变成了有向图,分别求出Man-->Women,Woman->Man的双向关系,然后或者相乘,或者搞一些奇怪的公式去做拟合。作者说不太靠谱,但是我认为这个算法从思路上来说是对路的,无论是不是用他们那些莫名其妙的模型,但是作为思想的参考还是值得借鉴的。

接下来佳缘推荐算法的阶段步入了2014的工程年,作者根据佳缘的团队及业务特点将佳缘推荐做了战略上的调整,从比拼算法模型改成了比拼特征工程。我不了解佳缘的实际情况,不敢多做评价,只是从个人感觉来说也许作者从一个极端走到了另一个极端。从外界来猜测一下佳缘的实现思路:抽出各种各样的特征,例如用户的基本人口学信息,加上用户的行为属性信息等等,然后针对每个用户训练一个分类器,来预测他是不是对对方感兴趣。

那我们来聊聊逻辑回归的根本问题吧:

我相信接下来我说的很多尝试和做法,佳缘都已经尝试过了,但是站在局外者的角度,我认为除了传统的特征工程以及算法模型的优化外,其实接下来的这些才是婚恋网站推荐算法成功的关键(结合佳缘的模式:收取用户的看信费用,其实我没用过):

说归说,我很佩服作者几年来一直坚持着做着同一个产品的推荐算法,也希望大家可以多多讨论。

在<商品推荐算法&推荐解释>一文中,@飞林沙表示,我们做推荐算法的时候要考虑:

但是从工程角度上,并不适合上来就搭建这么复杂的模型,所以我们可以适当做简化,例如:

@飞林沙认为,数据挖掘或推荐系统只要达到目的就足够了,用什么模型其实真的没有那么重要,优化了好久的模型还真的不如加两条规则,或者人工清洗一下数据好用。模型真正的价值是泛化,但是对于工业界来说,泛化能力不需要太强,只要限定在当前的产品线就够了,如果产品形态改变可以再来一个算法。

@breezedeus在原文中提出了自己的感想:

技术为产品服务,而不是直接面向用户数据质量是地基,保证好的质量很不容易如何制定正确的优化指标真的很难业务理解>工程实现数据>系统>算法快速试错

很多刚工作的同学,最喜欢干的事就是套算法,认为懂了算法就什么都会了。真实产品基本都是数据>特征>算法。算法真不是那么重要!

2011年8月我加入世纪佳缘,开始时主要负责佳缘的交友推荐系统优化,后来我这个团队也负责其他的机器学习事情,比如佳缘的网警系统(抓恶意用户)。刚来时团队加上我只有3个人,做的事基本集中在推荐系统,以及对业务部门新产品的接口支持。当时我自己并没有推荐系统应用于工业界的实际经验,所以很想当然地就从自己了解的推荐算法开始工作了。

Item-basedkNN算法的尝试最开始是基于最大化佳缘用户发信量的业务理解,但后来我们发现这个理解跟业务部门的需求偏差很大。比如给男性展示美女,男性的发信就会暴涨,但这样就会导致少量的女性收到大部分信,而大部分女性则没信可收。这是业务部门不愿意看到的。虽然我们尝试在item-basedkNN基础上做调整来平衡其他的业务指标(如收信人数,看信人数等),但效果不理想。

第二个尝试是学术界的可逆(Reciprocal)推荐算法1,即在考虑用户体验的同时也兼顾item(对佳缘来说也是人)的体验。这个尝试基本是失败的,学术界发明的那些算法基本都有各种前提假设,真用起来都不太靠谱。

虽然到2013年我们团队人数上升到了六七人,但基本在推荐算法上做事的人还是只有两个左右。

从2013年底开始我逐渐意识自己对算法的理解过于学术而无法满足业务部门的实际需求。所以从2013年底我开始从业务出发重新梳理推荐算法团队的工作方向。相对于给用户推荐物品的场景,佳缘的在线交友推荐有以下几个特点:

转化链很长,反馈延迟

佳缘业务的高复杂性,加上团队在使用算法上经验不够,让我决定把接下来的算法优化方向放在特征工程上,而算法就限制在最简单的逻辑回归(LogisticRegression)。团队在处理特征的过程中可以积累对数据的处理经验,以及对业务的理解。逻辑回归足够简单,解释性好,也有很好的开源实现。从它开始也可以让团队在算法使用上积累心得。这是“战术”上的第一个选择。我们把上图中每一步转化作为单独的问题分别进行优化,这样逻辑回归就适用于每一步。这是“战术”上的第二个选择。

上面说的“战术”,其实针对的只是推荐系统里的排序系统。当时我对推荐系统整体的想法是把运营需求和用户需求分开,然后分别对他们进行独立优化。具体说就是第一步以满足运营需求为目标获得候选集,而第二步是根据用户(双方)的喜好对候选集进行排序,系统流程图见下图。这样,在优化用户需求时就不需要考虑佳缘复杂的业务逻辑,可以极大地简化问题。同样,我们也可以比较独立地优化满足运营需求的候选系统。这可以认为是推荐系统的“战略”方向。

佳缘推荐系统流程图(2014)

2014年无疑是工程年。

2014年工程年的效果还是不错的,多个转化模型的分别构建和组合使用,使得业务上的各个指标都有所提升,很多指标的提升幅度都超过了50%。

例如,按照上面的流程图,第一步的候选系统通过考虑运营需求来产生候选集,然后候选集由考虑用户需求的排序系统进行排序。如果产生的候选集很小,那排序系统的优化空间就很小,作用自然也不会大;而如果候选集很大,那通过排序系统排序后获得最终推荐结果的做法就会降低运营需求的控制力度。

推荐系统通用流程图

再仔细说明下上面这个流程中的前两步:

相对于2014年运营需求与用户需求独立优化的“战略”,2015年的优化思路有所调整:

那么,为什么把2015年叫做推荐系统的产品年?因为今年推荐系统的目标是优化产品目标!

推荐系统是为产品服务的,而不是直接为用户服务。

上面这句话听起来很简单,但其实很多时候我们会在不知不觉中认为推荐系统是直接在为用户服务的。我们在最早的时候就是犯了这个错误。

本节的最后,汇总罗列下我这几年做推荐的感想:

这节我只是简单罗列下最近几年自己接触的比较有代表性的一些技术,跟工作关系不大。

了解DP主要是因为当时在看Mahout源代码的时候发现有个算法以前竟然没接触过,觉得挺有意思就仔细学了下。DP不太好理解,它被称为分布的分布。从DP抽取出的每个样本(一个函数)都可以被认为是一个离散随机变量的分布函数,这个随机变量以非零概率值在可数无穷个离散点上取值。DPM是非参数贝叶斯聚类模型,聚类时可以让模型自动学习类数。虽然听着好像很不错,其实有很多槽点,具体可见参考文献2(参阅参考文献请点击原文链接)。

LDA是文本处理里的利器,经常被用于对文本进行聚类,或者预处理。更详细的理论介绍可见参考文献3。当时我尝试把它用于佳缘的发信数据,看看能不能找出一些有明显特征的发信群体。聚类结果整体上基本不可解释,但有一个类别意义很明显,这类人主要给离婚异性发信。大家可以想想这类人是什么人。尝试感想是LDA直接用于聚类未必靠谱,但是可以把它用于数据的预处理,比如降维什么的。

ADMM是个优化算法框架,它把一个大问题分成可分布式同时求解的多个小问题。理论上,ADMM的框架可以解决大部分实际中的大尺度问题。槽点很多,谨慎使用!更详细的介绍可见参考文献4。

算法预测的效果还是不错的,准确度达到了87%。这还是在很小训练集上训练后获得的精度。DL麻烦是训练时需要调整的超参数实在是太多了,改一次超参数就要重跑一次,真的是很耗时。没有好的计算资源的话,建议别考虑DL。

实在想不出更多的有用特征?尝试下Facebook提出的利用GBDT来构造新特征的方法吧。我们的使用经验表明确实还是挺靠谱的,只要你效率能扛得住。具体介绍可见参考文献5。

很多个性化特征?特征数量太多?试试特征哈希的方法吧。此方法我们目前也没使用过,欢迎有经验的人发表意见。具体介绍可见参考文献5。

正负样本数量差异太大?训练样本太多机器跑不动?尝试下参考文献7中的抽样方法吧。我们之前的尝试表明还是有点作用的。不过如果你的数据不是大得跑不动,那尝试的必要性就不太大了。

THE END
1.婚恋交友网站设计策划方案面对越来越多交友场所的涌现,管理、组织、宣传也趋向模式化,婚恋交友公司不在采用传统宣传方式宣传来自己,而是开始想要在网上实现这一目的。在众多婚恋网站中突出,网站设计水平及网站开发实力十分重要。 如火如荼的婚恋交友网站开始根据人们的需求开始竞争市场份额。婚恋网为人们的生活发挥着巨大的社会作用,很多人通过交友https://www.cncnzn.com/html/3078.html
2.开源基于JAVA+Vue+SpringBoot的婚恋交友网站本文介绍了基于JAVA、Vue、SpringBoot和MySQL的婚恋交友网站项目,包括会员管理、新闻管理、相亲大会管理和留言管理等功能模块,详细描述了系统设计、数据库设计和核心代码示例,强调了权限管理和安全控制。 摘要由CSDN通过智能技术生成 目录 一、摘要 1.1 项目介绍 https://blog.csdn.net/javamyfriend/article/details/135837755
3.同城婚恋相亲社交软件部署开发同城婚恋相亲社交软件的开发需要设计一系列功能模块,以满足用户在寻找伴侣、交流互动、了解对方信息等方面的需求。以下是一些关键的功能模块: 一、用户注册与认证 基本信息注册:用户可以通过软件注册个人信息来创建自己的个人账户,这些信息通常包括姓名、年龄、性别、电子邮箱地址、密码等。 http://144251355.b2b.11467.com/news/9370038.asp
4.装饰网站建设规划论文,构建精美装饰网站的关键要素与策略探讨一个成功的装饰网站,首先要明确其目标与定位,网站应旨在成为装饰行业的信息交流平台,提供全面的行业资讯、设计灵感、材料选购等服务,网站还应成为客户与装饰公司之间的桥梁,为客户提供在线咨询、预约服务等功能,建设规划的核心应围绕用户需求展开,确保网站内容的专业性、实用性和互动性。 https://3g.tacywl.net/post/3821.html
5.搭建婚恋服务平台事宜怎么写搭建婚恋服务平台事宜你可能会好奇,建婚恋网站需要多少钱能引领这个行业走向创新的前沿?答案并不是一个固定的数字,而是如何通过创新与科技,把用户的需求与网站的盈利模式完美契合。 结语建婚恋网站的费用并没有固定答案,它随需求、技术、设计、推广等因素的不同而有所变化。从几万元到上百万元不等,如何合理规划预算,选择合适的技术与团http://www.wedating.cn/hunl/47405.html
6.婚恋网站设计图,婚恋网站设计图片网站设计大家好,今天小编关注到一个比较有意思的话题,就是关于婚恋网站设计图的问题,于是小编就整理了4个相关介绍婚恋网站设计图的解答,让我们一起看看吧。 做一个像珍爱网那样的婚恋网站需要投资多少? 这可是一个大工程。 做这种平台呢,建议是分步骤实施,不好一次性去估算完整的投入情况。 http://www.dah.cc/sj/2f7333f6ebf99a72.html
7.婚恋logo婚恋网站标志设计模板下载婚恋logo婚恋网站标志 独家销售 上传者:hengque+ 关注 编号:20200114212409277020 格式: AI(CC)ai大小:75.40Kb颜色模式:CMYK 版权买断 ?授权 | 合同 立即购买收藏 购买有疑问?请 联系客服 关键词 婚恋标志恋爱logo情趣用品logo婚恋logo婚恋爱情 相似图片 查看更多>> 浪漫爱情天鹅logo商标志设计 男人女人logo商标标志设https://www.huitu.com/design/show/20200114/212409277020.html
8.交友网站制作北京婚恋网站设计免费婚庆网站制作大全雕龙网(www.diaolong.com)交友网站制作栏目为您提供北京婚恋网站设计,免费婚庆网站制作大全.找更多北京婚恋网站设计,免费婚庆网站制作大全就到雕龙网.http://www.diaolong.com/jianzhan/hunlian/
9.世界环境设计网站排名大连婚恋网站排名世界环境设计网站排名www.pncqg.cn大连婚恋网站排名USER:mysql默认root账号它有大量的自定义选项,并带有一个移动应用程序,因此您可以提供实时支持。1.阿里巴巴的盈利项目主要是哪些( ) A.委托设计公司网站 B.诚信通 C.以上都正确 D.中国供应商 E.网上推广项目 错误 正http://www.pncqg.cn/pncqg/845147.html
10.相亲平台网站定制开发,婚恋相亲网站建设开发源码将想法与焦点和您一起共享 相亲平台网站定制开发,婚恋相亲网站建设开发源码 专业定制交友网站开发,交友平台网站建设,婚恋网站平台开发建设,可仿百合网,世纪佳缘网,支持电脑版+手机版+微信版+小程序版+APP版,由10年的技术团队专业定制,需要的朋友可以联系我们。http://chengdu.cdxwcx.cn/article/chsdej.html
11.婚恋网站建设方案婚恋网站设计何搭建和部署的吗? 华为云微认证《搭建麦进斗电子商务网站》 麦进斗是一套专业开源的电子商务系统,具有模块化架构体系,功能丰富,设计灵活,常被用于建设多用途和适用面的电子商务网站。本认证通过弹性云服务器快速实现麦进斗电子商务网站的搭建,带你体验华为云为电子商务领域带来的极大便利。 查看详情 https://www.huaweicloud.com/theme/682812-5-H-undefined
12.约会聊天类网站建设约会平台网页设计婚恋交友网站搭建随着互联网的快速发展,交友聊天类程序逐渐走进人们的生活,成为人们重要的社交方式之一。这些程序通过创造一个虚拟的社交环境,使人们能够轻松地与其他人交流和结识新朋友。同时,随着社交网络的兴起,各种社交系统网站也开始快速发展。本文将探讨交友聊天类程序与网络发展的关系,并介绍社交系统网站建设及详细的栏目分类。 https://www.wxavatar.com/yhltlw.html
13.婚恋网站数据库设计51CTO博客已为您找到关于婚恋网站数据库设计的相关内容,包含IT学习相关文档代码介绍、相关教程视频课程,以及婚恋网站数据库设计问答内容。更多婚恋网站数据库设计相关解答可以来51CTO博客参与分享和学习,帮助广大IT技术人实现成长和进步。https://blog.51cto.com/topic/hunlianwangzhanshujukusheji.html
14.婚恋网站制作婚恋网站制作既需要精美的界面设计,又需要稳定的技术支持和丰富的功能。作为有着17年网站建设经验的企业网站设计规划人员,我们深知如何为婚恋网站打造出色的用户体验。我们拥有一支经验丰富的设计团队,能够根据客户需求定制个性化的界面设计,为婚恋http://www.789.net.cn/list_16/9612.html
15.“世纪佳缘”婚恋交友网站调查问卷您曾经注册过世纪佳缘这种婚恋交友网站 能很容易在网上找到“世纪佳缘”该网站 浏览网页后,对于世纪佳缘网页的设计排版很满意 *9. 世纪佳缘客户信任度调查 非常不赞同 不赞同 中立 赞同 非常赞同 您会在注册的时候填写真实的个人资料 您相信世纪佳缘对于您个人资料的保密措施 您相信世纪佳缘对其他用户的真实https://www.wjx.cn/jq/2127395.aspx
16.日韩网站精粹粉色系婚恋网站首页日韩网站精粹-粉色系婚恋网站首页 互联网,企业网站,婚恋 网页素材共享与免费下载网站-素材公社(www.tooopen.com)https://www.tooopen.com/view/155870.html
17.网站投资项目计划书11篇(全文)以精心呵护爱情,成就美满婚姻为已任,打造一个纯净、专业、人性化的婚恋择偶机构和服务平台。 优势及劣势 优势: 产品优势 缘圈交网站不同于目前中国的几大交友网站(世纪佳缘、百合、嫁我),其站点整体设计风格、模块、功能都不是类似站点间的相互模仿和借用,而是围绕用户的交友互动体验进行全新的设计及打造。站点模块紧https://www.99xueshu.com/w/filezcejkc4g.html
18.高端网站设计定制素材网站图片免费下载【上海雍熙YONGSY】高端网站设计:三棵树官网建设 7 上海雍熙 【上海雍熙YONGSY】高端网站设计:ABB官网建设 1 上海雍熙 新安电器官网建设定制 1 懒小虫大战苹果果 蓝蓝设计兰亭妙微 赛门仕博 —— 高端定制响应式网站设计作品集 12 赛门仕博 上海雍熙 https://www.zcool.com.cn/tag/ZNDM2OTgyNA==.html
19.男女婚恋交友平台网站模板一款Bootstrap 4构建的,现代化响应式的婚姻介绍,婚恋交友,男女社交网站html模板。包括24页的Html文件是很好的组织和命名,因此它很容易改变任何和所有的设计。你可以很容易地定制它来满足你的约会计划需要。https://www.17sucai.com/pins/36238.html
20.网站建设设计网站主要是针对于海外华人的婚恋网站,旨在打造一个国际华人的婚恋网站平台。 网站有PC电脑端和手机移动端。网站具有会员注册、会员登陆等功能 网站首页设计图如下 查看详细 232017.06 【中标】优必选机器人网站建设设计 公司简介 深圳市优必选科技有限公司(UBTECH)–成立于2012年,是一家集人工智能和人形机器人研发、平台软https://www.szfangwei.cn/tag/6403.html
21.真情在线婚恋网征婚交友相亲无不良嗜好,自小接受专业的美术教育,本科毕业于北京某大学艺术与设计专业,随后在意大利于米兰研读硕士研究生教育,回国后2009年成立自己的设计工作室现保有创意顾问的身份,个人喜爱各类设计与艺术作品,去过十几个国家小住,现在更偏好居家生活,在关系中懂得尊重对方的重要性。行为独立,情感依赖。\r\n\r\n 如果有机会http://lol99.com/
22.网站建设网站制作网页设计小程序开发和暖科技是专业的网络公司,主要服务项目:网站建设、网页设计、网站制作、网站优化、网站推广、软件开发、网站优化。为企业提供一站式网站建设,网络推广,软件开发等服务http://www.jzsex.cn/
23.知名婚恋交友网站世纪佳缘启用新LOGO和吉祥物知名婚恋交友网站世纪佳缘启用新LOGO和吉祥物 @世纪佳缘官方:【世纪佳缘新LOGO正式亮相!】5月20日世纪佳缘于诞辰10周年之际启用新版Logo。同时两只爱情鸟作为网站吉祥物与大家相见。孤单的日子,世纪佳缘陪你。 世纪佳缘“新Logo采用现代弧形线条设计,粉色代表感性和爱情,蓝色代表理性和永久,新Logo保留了经典的男女性别https://www.rologo.com/shijijiayuan-new-logo.html
24.基于Java+Springboot+Vue开发的婚恋交友网站管理系统该项目是基于Java+Springboot+Vue开发的婚恋交友网站管理系统(前后端分离),这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Java编程技能,同时锻炼他们的项目设计与开发能力。通过学习基于Java的婚恋交友管理系统项目,大学生可以在实践中学习和提升自己的能力,为以后的职业发展打下坚实基础。 https://www.imooc.com/article/355426
25.正规婚介一般收多少钱婚介所男女都要交费吗接亲网6、绝对100(中国最专业的婚恋网站之一,由心理学专家团队创建并运营的婚恋网站) 7、爱情公寓(国内唯一一个以白领女性及大学女生为主轴设计的交友社区网站) 以上就是小编为大家介绍的,关于婚介所收费价目表的具体情况和注意事项了。其实现在的婚姻介绍所都是以盈利目的为准的,在加入婚姻介绍所的时候,都会缴纳一定的会员https://www.jieqinwang.com/baike/137504.html
26.北京网站设计开发,小程序开发,公众号,微信开发云智互联网站开发公司提供北京网站设计,网站开发,网站定制等建站服务和微信开发,小程序设计,小程序开发,公众号开发等移动端开发设计服务?:010-64758810https://www.yzlink.cn/