全网最全知识图谱讲解!

知识图谱标准化白皮书定义:知识图谱(KnowledgeGraph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

简单讲,知识图谱由节点(point)和边(edge)组成,每个节点表示一个实体,实体可以指客观世界中的人、事、物,每条边表示一种关系,关系可以表达不同实体间的联系。本质上,知识图谱可以理解为以图结构存储的语义网络。

知识图谱源于20世纪50年代,发展至今可大致分为三个阶段。第一阶段(1950年-1977年)是知识图谱的启蒙期,这一时期文献索引的符号逻辑被提出,并逐渐成为研究当代科学发展脉络的常用方法。第二阶段(1977年-2012年)是知识图谱的成长期,这一阶段语义网络得到快速发展,知识本体的研究成为计算机科学的重要领域,在其期间出现了例如WordNet、Cyc、Hownet等大规模的人工知识库,使得知识更易于在计算机之间和计算机与人之间进行交换流通。第三阶段(2012年-至今)是知识图谱的繁荣期,2012年Google公司率先提出知识图谱(KnowledgeGraph,KG)概念,谷歌公司通过知识图谱技术,改善了搜索引擎性能,增强了用户搜索体验,同时也拉开了现代知识图谱的篇章。

当前,随着大数据时代的到来,数据量呈现井喷式增长,知识图谱也从学术圈朝着适合现代化企业的广义大规模知识图谱转变。在人工智能技术的蓬勃发展下,底层图数据库存储、算力规模化部署等知识图谱关键技术难点得到一定程度解决。在搜索引擎领域之外,知识图谱技术已成为电商、医疗、金融、能源等领域的热点技术,解决行业生产环节中的核心痛点。

上文有说,知识图谱本质是是一种语义网络,其节点代表实体,边代表实体间的语义关系,基本的逻辑结构分为模式层和数据层。模式层在数据层之上,为知识图谱的核心,存储的是经过提炼的知识类数据模型,包括实体、关系、属性等层次结构。数据层主要由事实数据信息组成,即现实世界的真实信息,通常以“实体-关系-实体”或“实体-属性-属性值”三元组作为基本表达方式。

目前表示知识图谱的两种主要图数据模型是RDF图和属性图,下文将讲解两种模型的表达方式、区别和局限性。

在学术领域,存储的往往是结构固定的静态化数据,并提供标准化的接口,RDFSchema可以复用,实现数据的开放共享,避免人员重复劳动。但在其它行业领域,RDF图具有局限性,由于没有可复用的数据字典,开发一个全新的RDF数据集代价非常高,并且RDF的顶点上不存在标签或类型的概念,属性是通过另一个主谓宾来完成的,当业务需要增加属性时,RDF图需要修改点边结构来增加属性,图模型会发生改变,容易导致以前的查询语句不可用,对业务入侵性强,而在属性图上,可以直接在图模型上进行修改,不影响业务正常使用。举例说明,需要在出演电影的边上增加“角色”属性,在属性图上,直接在边上添加属性即可,如下图所示。

而RDF图由于边上不支持设置属性,相同类型的边都是相同的,边会被重复的使用。如果简单的在“出演电影”边上增加“吴京”和“长津湖”之间的角色关系,会在所有“出演电影”这一谓词上添加相同的属性。在RDF中,常规的方法是通过新建一个顶点”ex:xxx”来表示语句,如下图所示。

可以看到,RDF图在新增属性时,会改变原有图模型结构,原本一跳就能完成的查询,需要2跳以上才能完成。考虑到现阶段行业知识图谱朝着数据规模大、实时变动多、业务模型复杂的方向发展,以RDF图模型架构的知识图谱面临发展瓶颈,且部署完成后的运维成本高昂,而以属性图模型表达的知识图谱逐渐获得客户认可。

上文提到,Google公司利用知识图谱技术,优化了搜索引擎性能,大幅度提高用户搜索准确度。此外,大规模知识图谱技术早已在各行业实现广泛应用。

金融领域,知识图谱提供金融知识的提取、融合、分析、推断、决策等功能,打通金融领域内孤立的多源数据,通过数据抽取、信息提取、语义消歧、知识融合、知识加工等技术,构建金融知识图谱,实现智慧金融中的信用卡反欺诈、风险预测、智能营销等应用。例如,知识图谱根据手机号码、联系号码、IP地址、设备、申请件等主要欺诈要素构建信用卡反欺诈关系图谱,欺诈团伙考虑到犯罪成本,可能会共用IP、手机号码、设备等信息,根据这些既定规则对欺诈行为进行判定,挖掘出潜在欺诈用户,从而做到提前预警。

能源领域,现代电网是以物理电网为基础,结合先进的传感器技术、信息技术、数据分析技术、计算机控制技术等形成的智慧电网。它应当以满足区域性用电需求、优化电力配置、保证电力供应灵活稳定性为目的,确保用户用电安全、可靠、经济。知识图谱应用其中,通过整合调度范围内变电站间输送电关系、变电站内设备接线关系、发电厂内设备接线关系等信息,结合电网实时运行状态构建电网数字孪生图谱,在全局视角下实现最优应急复电策略、跨业务数据贯通、设备缺陷预警、影响范围分析等功能。

零售领域,不同于以往的卖家市场,如今的电商模式是买家市场,电商平台如何从海量的商品中挑选出用户感兴趣的几十件商品,满足用户个性化的购物需求,成为零售领域商品推荐的难题。电商知识图谱从用户需求出发,整合用户的浏览习惯、购买历史、社交行为等数据,分析出各品类商品的潜在用户群体,实现智能推荐和精准营销,为买家提供良好购物体验的同时,也使商家利益最大化。

结合当前研报内容,知识图谱建设主要的难点在于数据治理、行业专家储备、底层图数据库存储、算法生产流程和性能待提升、客户认知待培养以及产品封装待优化。攻克上述知识图谱建设难点,有利于从源头保证数据的真实可靠性,同时也能为行业培养复合型人才,底层图数据库存储方式的升级、算法性能的提升、产品易用性的优化也有助于知识图谱行业的壮大。

未来是认知智能到来的时代,感知智能犹如四肢,认知智能犹如大脑,大脑能够对信息进行知识抽取和业务场景推理分析,提高AI的理解分析能力。知识图谱在其中,将起到关键的破局作用,为认知智能洞察隐性关系与逻辑,赋能业务决策。同时,知识图谱作为认知智能时代的底层技术,也将迎来高速发展。

我们相信,随着数据量的指数级增长,变化稍纵即逝,未来的知识图谱不仅要大,还要快,为企业抓住机遇,创造价值。图数据库作为知识图谱的底层支柱,应持续优化存储与运算性能,为即将到来的需求做好准备。

当然,没有一项技术是完美的,技术融合也是未来行业发展的趋势。各项技术的取长补短,也将更好的服务于知识图谱应用,让其在打磨中不断进步,复制成功经验从而诞生更多解决方案。

THE END
1.知识谱系是什么意思?知识的发展史,像一般的家族族谱一样成树状分布.现在比较完善的谱系是西方的,我们中国自己的知识谱系并不健全,所以要举例很难.以数学为例:1(前3500-前500)数学起源与早期发展:古埃及数学、美索不达米亚(古巴比伦)数学2(前600-5世纪)古代希腊数学:论证数学的发端、欧式几何3(3世纪-14世纪)中世纪的中国数学、印度数https://qb.zuoyebang.com/xfe-question/question/780c4d662dd64e71ab4f2620a34effd6.html
2.谱系是什么意思怎么理解谱系的意思谱系是什么意思 怎么理解谱系的意思烟的寂寞 小学教育 精选回答 1、谱系又称系谱或系谱图。指从先证者入手,追溯调查其所有家族成员(直系亲属和旁系亲属)的数目、亲属关系及某种遗传病(或性状)的表现等资料,并按一定格式将这些资料绘制而成的图谱。 2、系谱中不仅有某种性状或患有某种疾病的个体,也应包括家族的https://edu.iask.sina.com.cn/jy/hPX2ixW2HF.html
3.科学网—四研究知识谱系的意义——以中医为例以知识谱系观之,中医究竟是什么知识? 在本体论知识谱系中,阶梯上的高层得到格外强调。之一,强调人的整体而不是局部;之二,扩展到天地人和而不只是人;之三,不仅在生理,而且达到精气神。此三者均缺乏低层知识的支撑。确切地说,在本体论视角,中医的知识不是阶梯型的谱系,不存在高低层次之分。 https://blog.sciencenet.cn/home.php?mod=space&uid=210844&do=blog&id=1345752
4.知识谱系建筑学是一门古老的学科,找到自己的定位要先了解历史。这个历史不一定是权威或正统的历史教材,但凡有见地的建筑师都有自己认识历史的“谱系”。如果脑子里的这张谱系的大表没有建立起来,那学再多、看再多也只能是东一榔头西一棒槌的零敲碎打。 这个知识谱系因人而异,但无外乎两种路径:人和作品。首先是基于重要建https://www.douban.com/note/734695801/
5.知识谱系的若干维度《科学技术哲学研究》2021年05期文章讨论知识谱系,着重于对知识本身的研究,以区分服务于个人和机构并相对熟知的知识地图和知识图谱。知识的谱系大体上可以区分为以下维度:本体论意义上的"阶梯"型谱系;认识论意义上的"山"型谱系;普适性知识与地方性知识,特别是与"归属"地方性知识的谱系;还有由知到行的谱系;以及编码知识与隐性知识的谱系。上述https://mall.cnki.net/magazine/article/KXBZ202105001.htm
6.法学的知识谱系.docx2、知识谱系的含义和重要性 知识谱系是一个学科领域中知识单元之间的关系,这些知识单元可以是概念、理论、方法、技术等。在法学领域中,知识谱系是指法律概念、法律原则、法律规则、法律理论等之间的联系和关系,它们共同构成了一个法律体系的理论基础和实践操作。 知识谱系对于法学的学科建设和人才培养具有非常重要的意义https://max.book118.com/html/2023/0916/5024310242010330.shtm
7.知识图谱01:知识图谱的定义在客观世界里,知识图谱是什么[7]. 知识并非存储在知识地图中, 而是存储在知识地图所指向的知识源中. 知识地图指向的知识源包含数据库、文件以及拥有丰富隐性知识的专家或员工. 1.3 科学知识图谱 科学知识图谱(mapping knowledge domain)是用来显示知识演化进程和知识结构的图形化与序列化的知识谱系[8]. https://blog.csdn.net/u013230189/article/details/108933491
8.精神资源与知识谱系精神资源与知识谱系 文明社会中文化已经是第二叙事,文化习得已经成为重要的工具拐杖,原初的知识广度远比深度重要,最初习得的知识谱系决定了行为方向并强化深度,而让这种行为沟壑无法https://www.jianshu.com/p/768410be273e