数学家用算法在相亲网站上找到真爱相亲相亲网站真爱

像麦克金雷这样的数学家,他们能够在不同情况下使用数学方法,哪怕是看见不认识的扑克游戏,比如牌九,他们也能回家写代码,然后得出一个最优策略。在寻找真爱的道路上,也应该有一个最优策略。麦克金雷就用一个基于算法、大数据和机器学习的方法,在一个相亲网站上找到了真爱。

编译_七猫

UCLA(美国加州大学)的数学实验室里,克里斯·麦克金雷缩在他的办公间,一颗小小的灯泡和屏幕映射的微光就是凌晨三点唯一的光源。他在这里赶他的博士论文(题目:《大数据处理和并行计算方法》)。当电脑忙着编译代码的时候,他点开另外一个窗口,查看他的OkCupid收件箱。

对了,OkCupid是一个相亲网站。

现在来介绍一下我们的男主角:麦克金雷,35岁,未婚,身材干瘪,头发稀少,在外表上几乎没有什么竞争力。他是美国4000万网络相亲大军中的一员,从Match.com到J-Date再到e-Harmony,但凡是有点名气的相亲网站上,都有他的资料。自从9个月前跟前女友分手之后,麦克金雷就一直在寻找新的缘分,但始终没有结果。其中有一个网站,OkCupid,曾经依照它的算法给麦克金雷推荐了几十个与他“很般配”的姑娘,而麦克金雷给她们之中的大多数都发了自我介绍的信息。大多数人都无视了他的信息;只有六个跟他进行了初次约会,但没有一个能更进一步。

2012年6月的这个凌晨,麦克金雷的电脑编译着代码,另外一个窗口上则是他那冷清孤单的相亲网站资料页。这时候他突然醒悟过来,原来他犯了一个致命的错误:他一直像其他用户一样使用这个在线相亲网站,他现在意识到,他应该要像一个数学家那样相亲。

用算法找到你的灵魂伴侣

2004年,四个哈佛数学专业的学生创办了OkCupid,其卖点就是“用算法来找到你的灵魂伴侣”。这个网站精心设计了若干生活态度和心理测试题(他们甚至还开发了一个平台以供会员自行创建心理测试),会员们需要回答十个必答问题和若干个其他附加题目。这些题目都是选择题,覆盖面囊括政治、宗教、家庭、爱情、性甚至是智能手机品牌。比如,“下面哪种情况最可能吸引你去看电影?”或者“宗教和上帝在你的生活中到底有多重要?”

会员们不仅需要记录自己的答案(单选),还需要选择可接受的伴侣回答(可多选),以及认为这个问题有多重要(从“没有关系”到“至关紧要”)。据统计,该网站会员平均每人会回答350个问题。

回答的问题越多,匹配的精准度就越高—根据这些问题的答案数据,OkCupid的算法引擎会自动测算两个会员之间的匹配度,100%就是数学上的灵魂伴侣,于是,当然越接近100%的越好。

但就算是数学上,麦克金雷与洛杉矶女人的匹配度也很可悲。主要是因为,OkCupid在选择潜在匹配对象时,首先会锁定回答了同一个问题的人群,然后再根据性别性向进一步筛选,最后再根据答案计算两两之间在这个问题上的分值。问题是,麦克金雷都是随机选择问题的,而他回答的问题,最终看起来都是“不受欢迎”的问题,也就是说,回答这些问题的人很少。所以,在一个拥有200万女性的大都市里,起码有8万女性在使用OkCupid,可是麦克金雷的90分以上匹配者只有不到100个。在一个匹配度等同于存在感的网站上,他实际上就是一个透明人。

他意识到,他必须提升这些数字。麦克金雷认为,他可以通过统计分析来获知哪些问题对他喜欢的女人来说是最重要的,然后他就可以建立一个新的交友档案,诚实地回答这些“正确”的问题,然后其他的问题都不用管了。理论上来说,这样他就能够匹配到洛杉矶里任何一个适合他的女人,而不会遇上任何一个不适合的。

爱情有一个最优策略

即使对于一个数学家来说,麦克金雷也是个极不寻常的人。

他在波士顿郊区长大,2001年在米德布里学院的中文系毕业,同年8月在纽约找了一份兼职工作,在世贸大楼的北塔91层的一家公司当翻译,将中文翻译成英文。在他走进社会的第五个星期,双子楼遭遇惨剧—在9·11那天,麦克金雷要到下午2点才需要上班,所以当第一架飞机在早上8点46分撞上北塔时,他还在睡梦之中。

“那天之后,我就一再问我自己,我到底想要干什么,”麦克金雷说。

刚好,他有个哥伦比亚的朋友看中了他的反应能力和数学能力,将他招募进麻省理工那著名的黑杰克队伍(MITBlackjackTeam)—他们依靠快速算牌技巧和团队配合用扑克牌玩21点,在赌场赢取大笔奖金。之后几年,他往返于纽约和拉斯维加斯,最多每年可以赚到6万美元。

这种经历加深了他对应用数学的兴趣,并最终鼓励他积极进取,在此领域更加钻研,得到了硕士甚至是博士学位。“他们能够在不同情况下使用数学方法,”麦克金雷在提起自己的算牌伙伴时说,“哪怕是看见不认识的扑克游戏,比如牌九,他们也能回家写代码,然后得出一个最优策略。”

他认为,在寻找真爱的道路上,也有一个最优策略。

科学地寻找真爱

首先,他需要数据。他建立了12个虚拟的OkCupid账号,并通过一个Python脚本来控制它们。这个脚本会寻找他的目标(25岁到45岁之间的异性恋及双性恋女性),浏览他们的网页,抓取所有公开的信息:种族、身高、是否吸烟、星座,等等。

要找到她们的问题和答案,他必须再多做一点事情。OkCupid让用户看见别人的回答,不过只能是他们自己回答过的问题。于是麦克金雷让他的代码操纵着各个账号回答随机的问题—反正他不用这些账号来吸引任何人的注意,所以答案并不重要—然后,将姑娘们的答案存入自己的数据库里。

麦克金雷满意地看着他的程序满载而归。不过,他只收集了1000个账号的资料,就遇上了新的屏障:OkCupid有一个防滥用系统,专门用来防止此类数据收割,于是没过多久,他的虚拟账号就一个个地被封了。

他必须将他们训练得像人类。

他找到了他的朋友萨姆·托里西。托里西也是个妙人,他是一个神经学家,不过最近他在教麦克金雷音乐理论知识,作为交换,麦克金雷得给他上几堂高数课。托里西自己也在OkCupid上征友,他觉得麦克金雷做的这件事很有意义,就同意在自己的电脑安一个监控软件,记录他的使用情况。有了这个数据,麦克金雷就能编写一个程序,模拟托雷西的鼠标点击速度和打字速度,简而言之,“看起来像人”。他从家里再带了一台电脑插在数学系的网口上,这样就能够24小时无间断地运行了。

三星期后,他喜获丰收,现在他有全国各地20000个姑娘的600万个问题和答案了。那个凌晨三点突如其来的念头变成了麦克金雷的另外一个重要项目。他本来已经经常在办公间里过夜了,这下,他干脆直接不再续租公寓,完全搬到办公间里来。他带了一张薄薄的小毛毯,等要睡觉的时候,就躺在桌子上睡。

大数据处理与真爱的类别

要想让麦克金雷的计划奏效,他需要在这600万个问题和答案中寻找某个模式,好将这20000个姑娘分成不同的类别。他开始试用不同的算法,最终,当他找到一个改进版本的贝尔实验室K-Modes算法时,突破点到来了。这个算法最早在1998年投入使用,是用来分析各地黄豆灾害的具体原因,它能够根据大量的数据特征,慢慢地将所有对象细分再细分成不同的类型。有了这个算法,麦克金雷就能够轻松地将他收割来的数据投入不同的类别里,在20000人中找到最适合他的女人。

他开始实践。根据她们的问题和答案,20000人被逐步分成了7组。麦克金雷认为这样就够了,他已经对这个进展感到欣喜若狂,“那是六月的最高点”。

在不同类别中,他都选择了一些档案来研究,发现其中一个太年轻了,有两个则太老,还有一个对于宗教过于虔诚。不过有一个类别看起来很不错:里面都是25岁左右的女性,看起来很有个性,音乐家或者艺术家。她们是黄金类别,就是他所想要的那种。他觉得,在这里,他能找到真爱。

事实上,还有另外一个类别看起来也挺酷—这里面的女性年纪稍微大一点,都从事创造性的职业,比如说编辑或者设计师。他决定两者都试试看,于是他创建了两个账号,分别针对A类优化和B类优化。

他翻阅这两个类别的女性档案,寻找她们感兴趣的东西。结果,原来教师还是很受欢迎的,所以他在介绍里强调自己是一名数学教授。当然,最重要的部分还是那些问题。他选出在这两个类别里最受欢迎的500个问题,然后如实作答—他不希望未来的恋爱和婚姻建立在虚假之上。但他决定让计算机决定每个问题到底有多重要,他用了一种机器学习的算法,叫“自适应增强”(adaptiveboosting),以获得最理想的分值。

这样,他就创建了两个账号,其中一个的资料照片是他攀岩的样子,而另外一个则是他在弹吉他。“不管未来的计划如何,你现在更感兴趣的是什么?性,还是爱?”他的答案是爱。但对于比较年轻的A类别,他按照机器的建议为这个问题评分为“非常重要”,对于B类别,则是“至关紧要”。

当他答完最后一个问题,他在OkCupid上进行了一项搜索,按匹配度来排序。最上面的:一整页的99%匹配度。他翻页,再翻页,1万人过去了,跟他的匹配度还在90%以上。

“我从来没见过跟我匹配度这么高的人,而且我觉得你的资料还挺吸引人的,”有个女人写道,“而且一个擅长数学的糙汉子感觉总会有些故事……我觉得自己得来跟你打声招呼。”

“嗨—你的资料看起来真的很吸引我,所以我过来打声招呼。”另一个这样写,“我想我们之间有很多共同点,虽然数学方面不是,但其他方面像得惊人!”

“你真的可以翻译中文?”还有一个问。“我曾经上过一堂课,但实在太难了。”

真爱在相遇之后开始

数学和算法的部分到此结束。在麦克金雷寻找真爱的道路上,他还需要做一件事:离开他的四方格工作间—约会。

但当他跟Sheila告别时,很显然,他们彼此都没有动心。于是他第二天又进行了他的第二次约会,是一个来自B类别的博客写手。他本打算带着女伴在回音公园的湖畔浪漫散步交谈,但到了那里才发现,正有一群人在湖里挖淤泥。更糟糕的是,她热爱法国作家马塞尔·普鲁斯特,对生活的态度很不积极。麦克金雷表示,这次约会甚至感觉有些抑郁。

到第20次约会的时候,他发现A类别的人里面,有很多都有文身,或者养了中大型犬,而他对这些事都不是很能接受。一个月后,他认为这些不合适的人妨碍了他的效率,于是他删掉了自己的A类别账号,专心约会B类别的人。他的效率提高了,但结果依然同样。他已经约会了55个人,但只跟三个人见了第二面,只有一个人约了第三次会。

大多数失败的约会让人怀疑人生,但对于麦克金雷来说,这更糟糕,他开始怀疑自己的算法。

直到他收到王恬(音译)的信息。她是个28岁的艺术家,还是监狱废止运动的积极分子。她正在UCLA读艺术硕士,希望在UCLA附近寻找到身高180cm左右蓝眼睛的家伙,然后,她就找到了麦克金雷。他们的匹配度是91。

他们约在校园的雕塑公园相见。从那里,他们一起走到了一家校园寿司连锁店。他立刻就感受到了真爱的电力。他们从书籍讨论到艺术和音乐,聊着聊着,她承认,在给他发信息之前,她特地在自己的资料上做了小小的改动;然后他给她讲了他的爱情算法,从头到尾,这一整个故事。

“这事儿可实在有点神经质,”她说,“不过我喜欢。”

她是麦克金雷约会的第88个人。但跟以前的87个人都不同,他们进行了第二次约会,第三次,两个星期后,他们都冻结了自己的OkCupid账号。

“我想我做的与其他人没有太大不同,只是一个基于算法、大数据和机器学习的版本,”麦克金雷表示。所有人都希望在相亲网站上建立一个更优化的账号资料,他只是用数据和程序创建了一个。

对于王恬来说,麦克金雷的壮举只是一个有趣的故事。她知道,这些数学和编程都只是让他们相遇的故事前言,真正的挑战是他们相遇之后的生活。“人类比账号上的那些资料要复杂多了,”她说,“所以,我们相遇的方式可能有某种不真实的成分,但那之后的每一刻都很真实。”

麦克金雷也同意她的看法:“并不是因为我们匹配才有一个很好的关系,而是,这个算法能够让我们站在了彼此可以触及的地方。我用OkCupid找到了对的人。”

她不以为然地敲了敲他的手肘:“你没有找到我,因为是我找到了你。”麦克金雷思考了一下,承认她说的是对的。

现在麦克金雷已经获得了他的博士学位,继续教授数学;而王恬正在卡塔尔进行一项为期一年的伙伴活动。在与记者见面后的一周,王恬回到了卡塔尔,而在他们每天的Skype对话里,麦克金雷突然掏出一枚钻戒,放在摄像头面前。

她说她愿意。

他们还没决定具体的婚礼日期;也许他们还需要一个算法来进行优化。

THE END
1.Springboot计算机毕业设计线上相亲系统p1r58本项目的主要目标是开发一个功能丰富、用户体验良好的线上相亲系统。该系统将涵盖男生、女生用户信息管理,相识广场,用户信息展示(包括女生信息和男生信息),约见功能(包括约女生和约男生),成功案例展示,充值功能(包括男生充值和女生充值),红娘服务以及广告信息发布等功能模块。通过这些功能模块,系统旨在为用户提供一个安全https://blog.csdn.net/cccc_cz/article/details/144323035
2.婚恋服务平台(源码+文档+部署+讲解)命令提示符婚恋服务平台前端 VUE:2.6.14 element-ui: 2.15.6 NODE:14.21.3 (>=8.9) NPM: >=3.0.0 获取完整源码 想要深入了解本项目的代码实现,并进行二次开发或学习参考,可以私信我获取完整源码。点击查看全文特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布平台。付费内容精选 更多 入殓https://m.163.com/dy/article/JIO59D7K0556A0H0.html
3.婚恋交友圈子论坛系统的源码mb674ed4a7d0b18的技术博客模块化设计:将系统划分为不同的功能模块,如用户模块、圈子模块、帖子模块、聊天模块等。每个模块都有自己的代码文件和目录结构。 分层设计:将系统划分为不同的层次,如表示层(前端页面)、业务逻辑层(后端处理)、数据访问层(数据库操作)等。每个层次都有自己的职责和接口定义。 https://blog.51cto.com/u_17171978/12756644
4.相亲交友婚恋社交app系统源码搭建加强用户教育和宣传,提高用户防范意识。 相亲交友婚恋社交app系统的开发需要从市场调研、技术选型、功能开发、界面设计、测试优化、运营推广以及合规与安全等多个方面综合考虑。通过精心策划和不断优化,可以打造出一个既受用户欢迎又能实现商业变现的成功产品。https://guangzhou0719902.11467.com/news/9343501.asp
5.相亲代码琢磨先生相亲代码 var a=prompt("女:你有房吗?") if(a=="有房") { alert("那结婚吧") } else { if(a=="没房") { var b=prompt("女:有钱吗?") if(b=="有钱") { alert("先买房子在结婚吧!") } else { if(b=="没钱") { var https://www.cnblogs.com/liuyanzeng/p/5802470.html
6.把女朋友当代码,程序员相亲这样介绍自己,网友:情商高又幽默程序员特殊的工作性质就在于经常晚上加班,尤其是一些重大的更新和测试,都会选择夜深人静用户比较少的时间段,这也造成了许多程序员找不到女朋友的现象,相亲成了许多程序员脱单的一条路径。 程序员相亲当然与其它职业有所不同,毕竟外行人都带着有色眼镜看你了,要提高成功率,不妨把女生当做代码看待。 https://www.jianshu.com/p/77896fcd8c57
7.交友系统交友程序源代码婚恋相亲软件扬州择爱网络文化传媒有限公司开发团队经19年运营和实践,自主开发了《婚介所管理软件CRM管理系统》、《PC婚恋交友系统》、《微信公众号交友软件系统》、《手机H5婚恋交友软件系统》、《媒婆推广返利系统》、《婚恋商城系统》等产品;全新上线V10,采用原生PHP和JS自主开发http://www.zeai.cn/
8.记住几个代码,让你在飞机上跟空姐“相亲”所谓的相亲位,实则是指空姐对面的座位哟。倘若您搭乘的是南航的波音 738,千万要记住选 39L 这个座位;要是乘坐的是夏航波音 787 ,那 46 排便是您的不二之选;要是乘坐南航空客 320 ,47 排就是您的目标座位;而要是乘坐春秋航空的空客 A321 ,29 排就是那个令人称奇的相亲位啦。 ?然而,虽说大家都将https://m.dianping.com/ugcdetail/258745434?sceneType=0&bizType=29&msource=baiduappugc
9.TDK查询结果Title:交友系统交友程序源代码扬州择爱网络文化传媒有限公司开发团队经19年运营和实践,自主开发了《婚介所管理软件CRM管理系统》、《PC婚恋交友系统》、《微信公众号交友软件系统》、《手机H5婚恋交友软件系统》、《媒婆推广返利系统》、《婚恋商城系统》等产品;全新上线V10,采用原生PHP和JS自主开发的交友内核框架大型交友系统,性能高,负载强,可深度http://xcczykqrj.com/tools/seo/www.zeai.cn
10.父母牵线子女相亲小程序制作父母牵线子女相亲小程序怎么做平台提供免费父母牵线子女相亲小程序模板 解决你制作父母牵线子女相亲小程序路上的各种困扰 父母牵线子女相亲小程序制作平台网站具有哪些优势 定制自制2种服务,还有多功能服务助你减少烦恼 ▽不需要自己写代码 ▽小程序制作全程简易拖动操作 ▽一句代码不写也可完成父母牵线子女相亲小程序开发 https://qz.fkw.com/news/1211504.html
11.南都晨报20:21 终极代码 ●中央台八套 12:47 谢谢你医生 (18~21) 16:31 我的仨妈俩爸(46);夺金(1、2) 19:30 情满九道弯 (6~8) ●中央台十一套 15:52 青春戏苑 19:30 宝贝亮相吧 卫视节目导视 星期一 星期二 星期三 星期四 星期五 星期六 http://ep.nybyjt.com/h5/ndcb/html5/2023-02/10/content_13720_873614.htm
12.婚恋系统交友程序源码相亲系统婚介所软件爱牵线开发团队经19年运营和实践,自主研发了《婚介所管理软件》《微信公众号小程序系统》、《手机H5婚恋交友软件系统》、《红娘推广返利系统》、《商家、婚恋商城系统》等产品;全新上线V7,采用原生PHP和JS自主开发的相亲内核框架,性能高,负载强,深度二次开发更容易,https://www.a9a.cn/
13.对缘品牌介绍对缘相亲网对缘,专业、高效的视频相亲交友平台!茫茫人海,众里寻TA,慕然回首,对缘就在眼前。这里有专业的红娘为你牵线搭桥,理解你的喜怒哀乐,助有缘人终成眷属。 【专业红娘】多年线下经验的专业红娘为你在线服务! 【视频相亲】红娘与男女嘉宾三人视频相亲,杜绝照骗,助你表白! 【专属相亲】只有红娘和男女嘉宾三个人的专属相亲https://m.maigoo.com/brand/1629733.html
14.相亲网站建设方案创建设备华为云帮助中心为你分享云计算行业信息,包含产品介绍、用户指南、开发指南、最佳实践和常见问题等文档,方便快速查找定位问题与能力成长,并提供相关资料和解决方案。本页面关键词:相亲网站建设方案。https://support.huaweicloud.com/topic/692073-1-X
15.相亲交友模块源码V5.1.3.zip码农集市专业分享IT编程学习资源1:增加活动功能。包括发布活动,活动在线报名,支付定金,活动发起类型等2:增加聊天功能,以及VIP会员才能聊天3:增加聊天模板消息提示功能4:增加了很多其他功能5:增加微信客服与关注我们6:增加会员搜索筛选功能7:增加短信验证功能8:增加发布说说图片审核9:优化页面https://www.coder100.com/index/index/content/id/1073356
16.孝感心动相亲传媒科技有限公司怎么样信用代码:91420902MA4F1FF77T 注册地址:湖北省孝感市槐荫大道3号佳磐瑞府5幢107商铺* 信息举报 举报类型: 问题描述: (选填) 邮箱地址: (选填) 举报 *违反原因: 激进时政或意识形态话题 广告或垃圾信息 色情、淫秽或低俗内容 不雅词句、人身攻击 其他 https://www.jobui.com/company/20832567/
17.青春不常在,抓紧谈恋爱——html代码一个简单的相亲html代码 效果如下: 代码如下: <!DOCTYPEhtml>class03青春不常在,抓紧谈恋爱昵称:性别:男女所在城市:上海广州深圳南京婚姻状况:未婚https://developer.aliyun.com/article/1168033
18.简单通用相亲婚恋平台,一键打造专属婚恋网站欢迎来到我们的相亲婚恋平台!我们提供简单通用的网站模板,专注于为您打造专业、高效的婚恋交友体验。在这里,您可以轻松结识志同道合的伴侣,开启美好婚恋之旅。快来加入我们吧!https://www.moyublog.com/codes/22621.html
19.交友程序全开源版源码相亲婚恋交友系统Thinkphp婚恋交友平台源码安全性:在下载和使用源码之前,请务必进行安全检查,确保源码没有恶意代码或漏洞。 二次开发:根据您的实际需求,对源码进行二次开发和定制,以满足您的特定需求。 综上所述,您可以从多个渠道获取所需的交友程序、相亲婚恋交友系统、Thinkphp 婚恋交友平台、一对一交友源码、聊天软件源码以及同城搭子小程序源码。在使用这https://my.oschina.net/u/7334581/blog/16578282
20.相亲指南:怎么带妹子来一场硬核黑客的约会雷峰网作为一名相亲超过 50 次依然没有成功的 88 年中年男子,这次约会他又悲剧了。 相比之下,同事王小贱就显得滋润多了,号称“撩妹高手”的他对李帅气提出了一些建议,当然不是不穿格子衫、约会不要在快餐厅这种肤浅的招数了。 他认真地盯住了李帅气三秒:我觉得你可以带妹子去参加一场黑客大会,比如,百度安全在 5 月https://www.leiphone.com/category/gbsecurity/Dy1SptFIUEa6N65e.html
21.00后程序员要请假相亲,上司收到代码了请假来自趣玩攻略部00后程序员要请假相亲,上司收到代码了请假条,多少有些复杂粗暴了~[笑cry] #迷惑行为大赏##亿点曝光计划# http://t.cn/A6KxrTZ0 https://weibo.com/1921074143/Mie6QscyU