KDD2020知识图谱相关论文分享

论文解读者:北邮GAMMALab博士生闫博

题目:鲁棒的跨语言知识图谱实体对齐

会议:KDD2020

1引言

现有方法在进行跨语言实体对齐时没有考虑噪音问题,而这些噪音可能会损害模型的效果。如图1所示,(a)中的两个不同语言的知识图谱存在实体对噪音(虚线表示的实体对1-4),(b)是理想状况下节点在特征空间中的表示,可以看出不同语言知识图谱中具有相似语义的实体在特征空间中也相近。(c)是利用含有噪音的训练数据得到的节点特征表示,由于噪音的存在,节点的表示存在了一定的偏差。我们希望跨语言实体对齐是鲁棒性的,即使训练数据中存在噪音,模型也能尽量减少噪音的消极影响,得到如图(b)中的表示。为了克服现有的跨语言实体对齐方法在处理带噪标签实体对时存在的局限性,本文探讨了如何将噪声检测与实体对齐模型结合起来,以及如何共同训练它们以对齐不同语言知识图谱中的实体。

图1噪音对跨语言实体对齐模型效果的影响示意图

问题定义

噪音检测和鲁棒性图表示学习:在一个存在噪音的场景下,代表所有的用于训练的实体对(可能包含噪音),代表中确定的干净的实体对,代表不确定是否含有噪音的实体对。鲁棒性的跨语言实体对齐模型利用给定的和,去对齐知识图谱中的剩余实体,并且能自动发现中的噪音实体对。

这个问题是不平凡的,主要存在两方面的挑战:(1)没有明显的噪音知识加以利用,即我们不知道训练数据中哪些是噪音数据,所以传统的监督学习方法无法使用,提出的模型需要以一种无监督的方式自动检测出训练数据中的噪音实体对。(2)提出一个统一的模型。此模型要既能检测出训练数据中的噪音,还能进行有效的跨语言实体对齐。

2方法

图2REA模型示意图

2.1基于噪音感知的实体对齐模型

这里代表信任分数,又噪音检测模块输出,即当实体对的信任分数超过阈值时,此实体对才被认为是正确的,才会被加入训练集。代表marginloss,是一个超参数。是一个衡量实体对相似性的函数,由能量函数定义:

负样本对由随机替换头或尾实体得到。

2.2噪音检测模块

对所有负样本的梯度求解近似为对k个采样的负样本的梯度求解,可以看作当前的状态,可以看作策略,看作是动作,代表奖励。

越大,实体对越有可能为真实实体对,定义实体对的信任得分为:

信任得分为1的实体对将返回给实体对齐模型,继续训练。

2.3算法流程

REA模型采用的是一个迭代的算法,在每次迭代中,算法依次进行三部分的参数训练。首先是利用干净的实体对进行节点的表示学习(4-7);然后对噪音实体对判别器进行训练(8-12);最后对噪音实体对生成器进行训练(13-17)。一次迭代完成后,更新中实体对的信任得分,将信任得分等于1的实体对加入。具体算法如下所示。

3实验

作者在两个数据集DBP15K和DWY100K包含的5个跨语言知识图谱上进行了实验。采用Hits@1,Hits@5,MRR做为评价指标。实验结果如下图所示,其中REA-KE是去掉噪音检测模块得到的结果。

本模型中,噪音实体对判别器的检测能力至关重要,所以作者也测试了噪音判别器对噪音数据的检测能力。如下所示,噪音数据的比例为20%和40%时,判别器都有一个较好的检测噪音的效果。但是由于知识图谱的不完整性,仍有大量真实实体对被检测为噪音。

当干净的实体对数据()增加的时候,模型效果也会变好;而当噪音数据增加的时候,模型效果就会降低。而REA在有噪音的情况下表现是最好的。这也说明了噪音对跨语言实体对齐有很大的影响,REA能有效地处理噪音问题。如图3和图4所示。

图3干净实体对的数量对实验结果的影响

图4噪音实体对的数量对实验结果的影响

最后,作者还测试了不同类型的噪音对实验结果的影响。噪音的不同类型由它们采样时离真实实体的距离所定。图5分别测试了噪音实体离真实实体距离为10,50,100和全局的情形下模型的效果。

图5噪音类型对实验结果的影响

从图5可以看出,噪音离真实实体越远,即与真实实体的语义差别越大时,模型效果降低越多。当距离大于50后,模型效果几乎不再变化,这也说明了离真实实体大于一定距离时,噪音对模型的负面效果趋于稳定。而当噪音实体离真实数据越近,模型效果越好,这是显而易见的,因为这样越接近干净的标注数据。在所有的4种情况下,REA均取得了最好的效果。

4总结

在标注跨语言实体对齐语料过程中不可避免地会引入噪音。现有方法没有考虑噪音问题,损害了实体对齐的效果。针对这一问题,本文提出了鲁棒性的跨语言实体对齐模型REA。REA通过一种迭代训练的方式,在每一轮训练过程中,通过图神经网络建模知识图谱中的实体对,得到噪声感知的实体对齐模块,然乎利用生成对抗网络来生成噪音实体对并训练一个噪音判别器,噪音判别器识别出干净的实体对加入训练集继续训练。大量的实验证明了REA在鲁棒性跨语言实体对齐任务上的有效性。

责任编辑:xj

原文标题:【KDD20】鲁棒的跨语言知识图谱实体对齐

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)

THE END
1.家电类目商品知识图谱的语义搜索与问答技术家电检索法作为一位世界级人工智能专家,我很荣幸能够为您撰写这篇技术博客文章。作为一名资深的计算机科学家和软件架构师,我将以专业、深入、实用的角度,为您阐述"家电类目商品知识图谱的语义搜索与问答技术"的核心概念、算法原理和最佳实践。 1. 背景介绍 随着电子商务的快速发展,家电类商品已经成为网上购物的重要品类之一。为了https://blog.csdn.net/universsky2015/article/details/137145978
2.T/CAS577T/CAS 577-2022由中国团体标准 CN-TUANTI 发布于 2022-03-07,并于 2022-10-21 实施。 T/CAS 577-2022在国际标准分类中归属于: 97.120 家用自动控制装置。 T/CAS 577-2022 智能家电知识图谱应用指南的最新版本是哪一版? 最新版本是 T/CAS 577-2022 。 T/CAS 577-2022的历代版本如下: 2022年 T/CAS https://www.antpedia.com/standard/1060273108-9.html
3.一种基于知识图谱的家电故障预测方法和系统专利摘要:本发明适用于计算机技术领域,尤其涉及一种基于知识图谱的家电故障预测方法和系统,所述方法包括:获取历史运行数据和实时运行数据;对历史运行数据进行解析,生成正常运行参数范围,构建故障预警特征知识图谱;对实时运行数据进行数据提取,进行故障预测检测;截取实时运行数据,并提取得到实时运行特征,判定是否存在故障风险,若存https://d.wanfangdata.com.cn/patent/CN202210952190.1
4.建议大家:买家电牢记这5点,避免上交“智商税”,收藏起来!家电是我们日常生活中必不可少的用品,但是在选购家电时,我们往往会遇到各种各样的问题,比如品牌、价格、功能、质量、售后等等。有些家电销冠为了推销自己的产品,可能会用一些夸大或者误导的手段来忽悠我们,让我们买到不合适或者不满意的家电。那么,我们该如何避免被忽悠呢?今天,我就来给大家分享一些买家电的注意https://baijiahao.baidu.com/s?id=1784244632709860649&wfr=spider&for=pc
5.知识图谱在电器故障诊断中的应用.docx5.知识推理:应用推理规则来推导出新的知识,扩展知识图谱的覆盖范围和深度。 评估 知识图谱的评估对于确保其质量和可用性至关重要。评估指标包括: *覆盖率:知识图谱中包含实体和关系的范围。 *准确性:知识图谱中信息的正确性。 *完整性:知识图谱中知识的完整性和深度。 https://max.book118.com/html/2024/0620/5343004104011231.shtm
6.清华高通寒武纪通通在列,首批嘉宾阵容曝光!中国最火AI芯片峰会将2017年以来,赵峰博士牵头构建全球首个智能家电知识图谱,用大数据和人工智能让家电真正具有思考能力,使海尔的智慧家庭解决方案能够主动地为用户提供服务,开发和发布了行业首套全场景体验智慧家电。 在去年的GTIC 2018 AI芯片峰会上,赵峰博士就《AI赋能智慧家庭》这一主题进行了演讲。目前,赵峰已经确定参加GTIC 2019 AI芯片https://zhidx.com/p/140841.html
7.大数据看懂“世界大牌背后的中国力量”数据显示,新消费热潮催生的“新四大金刚”——玩具、宠物、运动户外、珠宝四个行业正强势崛起。而被称为“老四大金刚”的美妆、食品饮料、小家电、服饰行业,依然强势增长。 看布局: 从站在幕后到“品牌崛起”,一张“知识图谱”读懂中国制造的份量 当前,中国企业在消费市场扮演的角色有两种:一种是与占据主导的国际https://m.tianyancha.com/hotnews/11888
8.知识图谱平台智能知识管理知识图谱工具沃丰科技GaussMind知识图谱平台连接企业异构数据源,全方位洞察数据的业务价值,辅佐企业智能决策。智能知识管理基于深度学习的NLP算法,能帮助客户完成上传、标注数据,自定义构建模型训练,构建可视化知识图谱。https://www.udesk.cn/gaussmind/knowledge_map.html
9.知识图谱,“暴富”新选择o.O!那么这里,本文先介绍知识图谱的概念,然后根据知识图谱的工作原理教大家构建“暴富”知识图谱。最后大家就可以根据“暴富”知识图谱践行“暴富”方法,实现“暴富”! 01 什么是知识图谱? 知识图谱可以理解为语义网络,即知识图谱是表示现实世界中的实体(即对象、事件、状况或概念,这里可以是“暴富”事件和“暴富”方法),https://www.eet-china.com/mp/a250474.html
10.知识图谱:知识图谱赋能企业数字化转型AI研习社职播间第3期今天我们分享内容包括:公司介绍&招聘,知识图谱概述 &企业机遇挑战,知识图谱赋能企业数字化转型,知识图谱落地挑战与趋势四个方面。 公司介绍&招聘 其实我们首席科学家在 2015 年就开始做知识图谱的相关业务了,在 2017 年成立了北京知识图谱科技有限公司。公司的研发中心在江苏省南京市江宁区秣周东路(地铁三号线旁边),https://maimai.cn/article/detail?fid=943630042&efid=2uDqLtvTGub_6lb22XiOKQ
11.知识图谱工程师招聘网2024年知识图谱工程师招聘信息猎聘2024年知识图谱工程师招聘信息,海量高薪猎头职位等你来选,了解知识图谱工程师岗位要求、薪资待遇等真实招聘信息,找高薪职位,上猎聘!https://www.liepin.com/zpzstpgcs/
12.招聘进阶知识图谱招聘知识 图谱招聘进阶知识图谱目录01招聘全景图招聘全景图招聘全流程图02招聘前导分析招聘前所需要 思考的事情影响组织的四 种外部力量组织分 析工作分析胜任力分析03职责描述职责描述的关 键点职责描述必备4 要素职位资格的两 个关键案例:各大厂 岗位职责描述04招聘渠道的 http://www.360doc.com/content/24/0626/15/60310931_1127196017.shtml
13.以下属于知识图谱广泛应用的领域的是()。以下属于知识图谱广泛应用的领域的是( )。 A. 个性化推荐 B. 智能搜索 C. 智能问答 D. 家电维护 题目标签:应用图谱属于如何将EXCEL生成题库手机刷题 如何制作自己的在线小题库 > 手机使用 分享 反馈 收藏 举报 参考答案: A B C 复制 纠错https://www.shuashuati.com/ti/948ab1eaa053473d8fb3b474ca1f92a3.html
14.客户服务运营管理知识图谱思维导图模板涵盖客户服务人员管理、流程机制、客户沟通等多方位全流程知识图谱 客户服务运营 电商客服流程 外呼流程 客服中心组织架构及工作流程 运营 客服 工作总结 作者其他创作 大纲/内容 沟通管理 五类员工必须沟通 新员工入职一周内必须沟通 业绩在团队中排名前20%的员工一季度沟通一次 班组长汇报某员工近期https://www.processon.com/view/5df71775e4b004cc9a31c334
15.metamind,生成你的知识图谱,构建你的数字心识合作伙伴招募 企业营销服务新范式 ,共享百亿市场 了解更多 SaaS平台开放测试 帮助企业用户快速打造适合的数字人 了解更多 > 合作伙伴招募 留下联系方式,我们将为您提供一对一的咨询服务 试用申请 > metamind 最新资讯 深兰“AI数字伙伴”亮相“全国社会心理服务体系建设经验交流大会”深兰“AI数字伙伴”亮相“全国社会https://www.metamind.cn/
16.一号互联智能客服官网小A智能客服是一号互联自主研发的知识图谱+智能电话客服机器人+智能语音质检+智能导航IVR+智能坐席辅助+CRM管理系统+文本机器人+知识图谱为一体的AI+SaaS智能客服平台,为企业提供全渠道多场景智能客服解决方案http://ehao99.com/
17.鲸鸿动能平台知识图谱鲸鸿动能广告(中国大陆地区)鲸鸿动能广告(中国大陆地区) 鲸鸿动能平台知识图谱 新功能速递 平台与资源介绍 平台介绍 资源介绍 鲸鸿动能竞价资源介绍 术语表 关于鲸鸿动能广告与隐私的声明 鲸鸿动能平台协议 账户与素材审核规范 概述 禁投内容 法律法规禁投内容 鲸鸿动能平台禁投内容 开户审核 主体资质审核 行业资质审核 https://developer.huawei.com/consumer/cn/doc/promotion/ads-jinghonpintaizhishitupu-0000001782957109
18.基于知识图谱的洪泽湖研究状况分析因此,通过运用CiteSpace软件,以CNKI数据库中1992~2020年间洪泽湖主题研究的296篇北大核心文献作为样本,进行研究绘制知识图谱,分析洪泽湖主题研究的总体概况和研究热点,为今后对洪泽湖的研究指明方向。[主 题词]:洪泽湖; 知识图谱; CiteSpace; 研究热点 [作 者]:徐君http://www.yidu.edu.cn/detail/article/63d9283c617c576e7b3b5d2e.html?q=C/N&uorg=999999