他山之石美团基于知识图谱的个性化新闻推荐系统腾讯云开发者社区

个性化新闻推荐系统的构建有两种方法:

知识图谱能给个性化推荐系统带来哪些好处?

首先,知识图谱为物品引入了更多的语义关系,可以更深层次地发现用户的兴趣。比如用户看一个电影,通过知识图谱就可以知道电影的各种各样的信息,因此通过知识图谱就可以引入高质量的信息,包括用户的表示。同时,因为知识图谱是构建非常优良的图结构,通过连接用户和商品、商品和商品,就可以找到非常有意义的路径,并通过这些路径来构建可解释理由。因此,通过知识图谱就可以在给出推荐的同时,也给出推荐的理由,增强用户对推荐系统的满意度和接受度。

02

新闻知识图谱

1.新闻知识图谱的研究动机

2.新闻知识图谱的研究方法

首先,做新闻推荐一般都是用类似于百科的知识图谱,百科式的知识图谱构造非常精良,格式统一,知识全面。但是这也就存在了一个问题:包含了大量的与新闻推荐无关的信息,即它里面会包含大量的冗余信息。比如特朗普眼睛的颜色,这样的信息对于新闻推荐是没有太大的作用的。

3.实验过程

①图谱数据统计

下图是通用知识图谱和我们修改得到的新闻知识图谱的数据对比情况,KG是原始的新闻知识图谱,News-RelevantKG是去掉无关关系后的知识图谱,CollaborativeRelationsinNG是增加了协同关系的知识图谱,TopicEntitiesinNG是主题节点的知识图谱。

②实验数据介绍

我们选取了MSN新闻四周的语料用来测试我们通用知识图谱和新闻知识图谱,进行对比。同时我们在多种推荐任务上都进行了测试,比如我们最擅长的个性化新闻推荐任务还有新闻分类任务。

③实验模型介绍

为了更直观地验证效果,我们选择了非常简单的模型,仅仅用到了新闻向量和用户向量,再加上通过知识图谱预训练得到的实体向量。其中,我们对比了两种实体向量,分别是通用知识图谱训练出来的实体向量以及新闻知识图谱训练出来的实体向量。如下图所示,在不同的任务上,我们使用了不同的架构。

④实验结果

下图是实验结果,对比的是不使用知识图谱的结果、使用通用知识图谱以及新闻知识图谱的结果,上面的表格各模型在个性化推荐任务上的表现,下面的表格是模型在不同的新闻分类任务上的表现。可以看到,新闻知识图谱相对于通用知识图谱是有提升的,说明了新闻知识图谱构建的有效性。而我们也会将新闻知识图谱作为一个基础,应用到后面的工作中。

03

知识图谱与新闻推荐的准确性

1.新闻推荐特点

新闻推荐系统与其他推荐系统相比,还是存在非常鲜明的不同点的。

因此,对于新闻推荐来说,最主要的几个模块是:如何建模新闻、如何根据用户新闻阅读历史建模用户、如何将新闻建模与用户建模进行个性化的匹配。

2.知识图谱与新闻推荐结合的研究动机

接下来的工作是我们发表在Recsys2020会议中的一个工作,该工作介绍了如何更好地利用新闻中的知识实体来提升新闻的表示。

3.知识图谱与新闻推荐结合的研究方法

①模型结构

为此,我们设计了一个模型,该模型主要核心有三层:实体表示层、语境嵌入层、信息蒸馏层。通过这三层,给根据NLP模型得到的新闻表示DV注入一个知识实体的信息,得到一个知识增强的新闻表示。

第一层是实体表示层。首先,把出现在这篇新闻中的实体通过预训练的方式取出,但是不同的实体在知识图谱中有各种各样的邻居,这些邻居也能够丰富它的表示,因此我们采取一种KGAT的方式,通过考虑它不同的关系,来聚合它的邻居信息,从而得到更全面的出现在新闻中的实体表示。

第三层是信息蒸馏层,其目的是判断不同的实体在不同的新闻中的重要性。比如体育新闻中,体育明星的重要性会更高,湖人队的新闻中,可能詹姆斯的重要性会更高一些。所以我们将新闻的文本表示作为监测信号,去监督不同实体的重要性并进行重要性的加权,最后拼接到本身的初始新闻表示上,得到知识增强的新闻表示。

②训练框架

③实验结果

下图是个性化推荐任务上的结果,我们采用了两种基础的新闻向量表示方法,一种是实际业务中使用的LDA+DSSM,另一种是学术界使用非常多的BERT模型。根据这两种模型得到新闻的预训练表示之后,再结合知识实体,并通过我们设计的模型去增强这两种表示。结果显示,无论是在LDA+DSSM模型还是BERT模型上,我们对于这两种基础向量都取得了效果上的提升。因为BERT模型具有强大的表示能力,并且有非常强大的预训练的库,所以会比业务中使用的LDA+DSSM模型效果表示得好一些。

下图是在不同新闻分类任务上的结果:

在item2item的推荐实验上,我们的模型也是取得了比之前baseline更好的效果。

我们也进行了消融实验,将我们模型核心的三层模块进行比较,通过消融实验证明我们每个模块都起到了非常好的作用。由于我们的模型是在预训练表示的基础上再注入知识,所以效率其实是非常高的。相对于以前的一些模型,无论是在训练还是测试任务上,我们的模型在效率上还是非常占优势的。

④可视化分析

同时我们也做了可视化的分析,下图展示了模型在一篇新闻中最终学到的weight在不同知识实体上的表现。可以看到,对于这篇新闻来说,重要的实体会学习到更高的权重。

下图是我们对于最终生成的向量表示做的一个可视化,以此来证明向量在不同的类别上有更加明显的区分,也说明我们得到的知识增强的向量所学习到的信息是更好的。

4.我所做的工作

①研究动机

接下来介绍我在美团做的工作,我的工作主要动机有三个:

首先,上文讲述了如何通过知识图谱增强新闻的表示,但对于新闻推荐来说,准确地表示用户兴趣也非常关键,所以我们更深层次地研究如何利用知识图谱来更加全面地建模用户在新闻阅读过程中的兴趣的表示。

其次,新闻中其实包含了大量的新闻实体,这些实体能反映一篇新闻复杂多样的兴趣。新闻不同于商品,内容更加复杂,一篇新闻中往往会包含各种各样的兴趣,所以引入知识可以更加全面地了解一篇新闻的兴趣。在此基础上,我们就可以进一步了解用户的多样的、动态的兴趣。

②研究方法

下面介绍一下具体的工作。

首先是异构图表示学习的方法。新闻本身包含了丰富的文本信息,同时我们通过把它和知识图谱进行连接,得到一个空间的结构化信息。所以我们一方面可以通过一些预训练的模型,得到文本信息的表示,同时也可以通过图学习的结构信息,得到空间结构的表示,最后通过异构图学习的方式,将这两种不同的信息表示融合到一个向量空间里。

接下来,我又设计了双记忆网络模型来建模用户的多种多样的信息表示。使用记忆网络是因为它有两个非常显著的优势。

因此我这里采用了一个双记忆网络,用兴趣记忆网络学习兴趣的表示,同时用户记忆网络去建模序列化信息。其中,对于兴趣,我们也从两个方面进行建模:

下图是我们的数据集,同时应用了MicrosoftNews还有美团的点评数据集。

从下表可见,模型在两种不同的数据集上都取得了比baseline更好的效果。

同时,我们对于不同的数据集实验了不同的兴趣数量,可以看到,在Microsoftnews上,兴趣数量要比点评数据集上稍微多一点,主要是因为Microsoftnews的新闻更加多样性,可以反映用户更多的兴趣。

下图是我们做的可解释性的简略分析。引入知识图谱的一个好处是在分析用户兴趣的时候,不光可以在新闻的层次上进行分析,还可以在更加基本更加底层的实体表示层次进行兴趣分析,这样它的兴趣会更加直观。

04

知识图谱与新闻推荐的可解释性

1.研究动机

商品推荐可能已经有可解释性工作了,那新闻推荐和商品推荐的可解释性工作有什么不同的地方?

首先,新闻中包含了大量的实体,并且新闻知识图谱也比商品知识图谱要复杂得多,比如新闻知识图谱关系可能有上千种,但亚马逊的商品知识图谱可能只有十几种关系。因此,对于如此复杂的数据和图,如何生成可解释路径是非常有挑战性的工作。

2.研究方法

针对这个问题,我们另辟蹊径地设计了一个比较新颖的可解释的范式——锚点知识图。具体原理是:

3.实验结果

我们这里采取的是微软的新闻推荐数据集还有一个工业数据集:

下表是消融实验的结果。可以看到,去除一些模块,效果会有明显下降。

4.可解释性分析

同时我们对可解释性也做了一个量化分析。模型中本就包含RNN模块,所以我们用RNN模块的分数来粗略评估可解释路径的质量,可以看到我们在数量还有质量上都比baseline模型要高。

05

问答环节

Q1:做推荐的时候,是否可以通过构造事件图谱来进行推荐,比如买了房子接下来要装修,装修就会涉及到买窗帘、硬装、软装之类的?

A1:做新闻的时候确实会包含事件,很多时候不能把新闻的人物、地点单独考虑,通过事件会更加全面一些。但是事件构建难度较大,因为我并不是知识图谱构建的专家,所以我在尝试后,并没有找到很好的方法。但是这个在制作方面确实是非常有意义的,如果能在图谱中加入事件的节点,对新闻推荐肯定会有非常好的帮助。不过,对于新闻来说,很多事件是突然发生的,可能之前知识中并没有该事件,这个就属于动态图的研究范畴了,即增加新知识,这是非常有挑战的。

Q2:商品的库存与销售可以做知识图谱吗?

A2:我认为是可以的。知识图谱是非常广泛的概念,新闻知识图谱更类似于百科式的,实际上我们在美团业务中,用的知识图谱更多的是把用户和商户、用户和商品做一个连接。其实只要通过构图能够提升它的表示或增强了解,我们认为图谱都是有用的,都可以通过构图来学习。所以商品的库存与销售可以通过合理的方式来构建图谱,比如库存,可能具体的数字会带来噪音,但你可以把大于1000的、500-1000的等等,对应到节点上,然后加入到图中,这个估计对知识图谱会有很好的补充作用。

Q3:在建模过程中,会用到如随机游走或者负采样等策略,在知识图谱中会不会去专门挖掘一些比如pattern的整一块的知识吗?

A3:你所提到的图的pattern类似于metagraph,这个别的工作里确实也有,通过关系来构建Metapath或者Metagraph,这个也是非常有效的,尤其是在一些简单的商品知识图谱中。但对于新闻来说,就比较复杂,因为它可能存在上千种关系,Metagraph下来就非常复杂了,所以暂时就没有考虑。但是我相信,如果设计好的话,是非常有用的。

Q4:请问老师,现在有开源的知识图谱吗?

Q5:能否在开源图谱上进行预训练,使得在构建自己业务的知识图谱的时候,能够效率更高一点。

Q6:在现在推荐领域的研究,更多的是在开源知识图谱上做还是要自己收集数据、自己构建,再进行研究

A6:从科研角度上看,利用开源图谱会更加方便,比如我这几个工作里的新闻推荐就是基于wikidata的。但是如果涉及到具体业务的话,那还是要根据自己的业务进行改造,效果会更好一些。

THE END
1.网络销售好做吗?网友(赶紧十八)职场问答我觉得网络销售只要是掌握一定的技巧,总体来说还算是比较好做的,一般情况下他的这一个业绩做的比较好https://zq.zhaopin.com/question/7342745/
2.网络销售很难吗要怎样做摘要:我们都知道,现在网上有很多网络销售,其实不算很难,就是每天都需要在电脑面前,每时每刻都要发布产品信息,因为信息是有时效性 众所周知,如今在网上有许多 网络销售,实际上不算很难,就是说每日都必须在电脑上眼前,时时刻刻必须发布产品信息,由于信息内容是有及时性的,假如拥有最新资讯要立刻拆换。讲难得话也https://www.xazcit.com/22200.html
3.做网络推广销售好做吗有前途吗海欣食品:将优化线上推广策略提高品牌曝光度,全渠道销售网络实现海欣食品十分关注线上渠道的发展趋势,未来将优化线上推广策略,提高品牌曝光度。公司已与锅圈开展合作,产品已覆盖各大连锁商超,包括沃尔玛、永辉、大润发、家乐福、华润万家等,线上渠道已覆盖天猫、京东等电商平台,通过全渠道销售网络实现消费者体验多元化http://dmapo.cn/44c3i5ai.html
4.网络推广销售好做吗(网络推广好做嘛)在当今数字化时代,网络推广销售已成为一种热门的商业模式,吸引了众多创业者和企业的关注,对于许多人来说,他们可能对网络推广销售的实际情况并不了解,不清楚它到底好不好做,本文将深入探讨网络推广销售的各个方面,包括其优势、挑战以及成功的关键因素,帮助读者更好地理解这一领域。 http://m.jlgou.com/zx/%E7%BD%91%E7%BB%9C%E6%8E%A8%E5%B9%BF%E9%94%80%E5%94%AE%E5%A5%BD%E5%81%9A%E5%90%97.html
5.在58同城做网络销售好做吗?爱问知识人58同城好做。 这个得具体分析行业信息!虽然我没有做过58同城的网络销售,但是我做装修公司的网络销售!https://iask.sina.com.cn/b/6ho4TzCOsp7.html
6.如何做好网上生意的销售工作?职场攻略职场双响炮如何做好网上生意的销售工作? 大家都很关注怎么来做好销售工作,现在网络的发达,制造了一个新的销售环境,那么,怎么样才能做好这个销售呢?虽说网络是虚拟的,但做好了网络销售比传统营业在销售手法上要更讲究实际,具体我们要做得哪几点呢才能把这个网络销售做好呢?个人建议如下,希望能给大家带来帮助!1、第一时间发现https://www.19lou.com/mip/forum-197-thread-33656082-1-1.html
7.网络营销是什么网络销售怎么做,如何做好呢网友“心尖爱人”评论: 微商现在竞争已经白热化了,想要靠自己单打独斗把产品推广出去很难,有条件可以找个比较好的微商推广平台,像我们公司就长期与易促宝合作,做到强强联合,易促宝可以帮我们把产品和资料都推广到搜索主页上,让搜索的人可以在首页看到我们的产品和资料,有购买意愿的都会联系我们,一下子粉丝和销https://weibo.com/ttarticle/p/show?id=2313501000014220490351833680
8.最新电话销售的工作总结和不足实用(11篇)今年我合作成功的客户主要是通过电话销售和网络客服等渠道找到客户,而自己真正找的客户很少,这点值得自己好好的深思一下,有一些大部分原因是为了不错过任何一个主动联系我司的意向强烈客户,因此大部分的时间花在了联系电话销售客户上,而忽略了自己联系上的意向客户。而自己今年开拓的新客户量不多,这点在明年要很好的http://cooco.net.cn/zuowen/2759799.html
9.网络营销主要做些什么(分享线上推广网络营销)西安创享时代网络科技就是一家致力于中小型企业提供一站式网络营销推广的公司,从网站建设、网站优化,百度竞价,各类自媒体的代运营和自媒体的广告投放全权托管,有专业的优化推广人员一对一负责,帮企业减少成本,提高效率,打造产品品牌化。 网络营销可以在八个方面发挥作用:网络品牌、网站推广、信息发布、销 售促进、销售渠https://www.niaogebiji.com/article-134050-1.html
10.网课电话销售好做吗?如何做好电话销售?对于线上教育机构来说,除了在网上的各大平台上推广,有的时候想要扩大生源,也必须进行电话销售,就是主要通过打电话的方式来招生。所以,网课电话销售是很多在线教育平台和线上教育机构都会招聘的人才。 至于网课电话销售好不好做,主要还是因人而异,喜欢做电话销售的,这种工作很容易,而对于电话销售这种工作感觉吃力的,自https://www.grazy.cn/article/16599.htm
11.电话销售简短个人工作总结(精选11篇)总结就是把一个时间段取得的成绩、存在的问题及得到的经验和教训进行一次全面系统的总结的书面材料,它可以帮助我们有寻找学习和工作中的规律,为此我们要做好回顾,写好总结。总结怎么写才是正确的呢?以下是小编为大家整理的电话销售简短个人工作总结,希望能够帮助到大家。 https://www.ruiwen.com/gongwen/gongzuozongjie/687032.html
12.中国人寿银保部好做吗,职业发展前景如何基础知识前言:中国人寿银保部是中国人寿保险公司的一部分,主要负责销售银行保险产品。银保部的工作难度与一般的销售岗位相当,但职业发展前景广阔,晋升空间较大。 中国人寿银保部是中国人寿保险公司的一部分,主要负责销售银行保险产品。随着中国银行业的不断发展,银保业务也越来越受到人们的关注。那么,中国人寿银保部好做吗?它https://www.shenlanbao.com/zhishi/5-584348
13.选择做销售的十大理由!做服务行业,报酬和收入不成正比,拿餐饮行业来说,每天工作14小时吧,但是收入就那么高。 做销售呢?收入无上限,因为销售的收入跟你的业绩有关系,你有多大能耐,就能拿多少钱。 按照投入产出比率来说,做销售投产比是最高的。 注:美篇内容、图片来源于网络《销售一分钟 》https://www.meipian.cn/50h217im
14.我,23岁大专毕业,出来找工作找不到,做起了销售一个月赚了12万所以我就会通过他们的这种方式去和他们交流。 还有一种方法就是通过我的同事,因为在做销售的过程中,我们总会遇到一些客户不太好说话的人。但是通过我们同事之间相互交流沟通之后,对方也会对我们有好感,这样我们就能够很容易地完成一个销售。 图片素材来自网络 真实内容编写https://www.jianshu.com/p/9ced8ebedb3f
15.酒水销售人员的工作计划和目标(14篇)了解和掌握公司产品和其他白酒品牌产品的销售情况以及整个白酒市场的走向,以便应对各种市场情况,并及时调整营销策略。 2、与经销商密切配合,做好销售工作 协助经销商在稳住现有网络和消费者群体的同时,充分拓展销售网络和挖掘潜在的消费者群体。凡是遇到经销商发火的时候一定要皮厚,听他抱怨,先不能解释原因,他在气头上https://www.chazidian.com/fanwen/284479/