数据,模型,决策分享 http://blog.sciencenet.cn/u/郭崇慧 自强不息,厚德载物

博文

知识图谱与关系预测——“大数据与智能决策”讨论班

已有 7447 次阅读 2019-11-18 10:49 |个人分类:科研笔记|系统分类:科研笔记| 知识图谱, 关系预测, 注意力模型

知识图谱

知识图谱(Knowledge Graph,KG)是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。知识图谱是结构化的语义知识库,用于以符号形式描述现实世界中的概念及其相互关系。知识图谱的基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性值对,实体间通过关系相互联结,构成网状的知识结构。

image.png

图1 知识图谱示例

图1中的“C罗”是一个实体,“金球奖”也是一个实体,他们俩之间有一个语义关系就是“获得奖项”。“运动员”、“足球运动员”都是概念,后者是前者的子类(对应于图中的sub-class-Of关系)。

20世纪60年代,普莱斯等人提出使用引文网络来研究当代科学发展的脉络的方法,首次提出了知识图谱(Mapping Knowledge Domain)的概念。1977年,在麻省理工学院召开的第五届国际人工智能会议上,斯坦福大学费根鲍姆教授提出知识工程(Knowledge Engineering)以来,以专家系统为代表的知识库系统开始被广泛研究和应用。到20世纪90年代,机构知识库的概念被提出,自此关于知识表示、知识组织的研究工作开始深入开展起来。机构知识库系统被广泛应用于各科研机构和单位内部的资料整合以及对外宣传工作。

2012年11月Google公司率先提出知识图谱(Knowledge Graph,KG)概念,表示将在其搜索结果中加入知识图谱的功能。知识图谱是Google用于增强其搜索引擎功能的知识库。据2015年1月统计的数据,Google 构建的KG已经拥有5亿个实体,约35亿条实体关系信息,已经被广泛应用于提高搜索引擎的搜索质量。知识图谱为互联网上海量、异构、动态的大数据表达、组织、管理以及利用提供了一种更为有效的方式,使得网络的智能化水平更高,更加接近于人类的认知思维。

知识图谱中的关系预测

文献:Nathani D, Chauhan J, Sharma C, et al. Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs[C]. Association of Computational Linguistics,2019.

知识图谱将知识表示为一个有向图的形式,其中节点和边分别表示实体和关系。近年来,随着知识图谱的大量出现,实体间连接的关系出现缺失或不完全的现象,这就引发了学者对知识补全(或关系预测)的研究。本文作者研究知识图谱中的关系预测问题,预测给定的三元组是否存在。文章将注意力机制引入到知识图谱三元组的邻居中,每个实体的表示都与其相邻节点息息相关,为知识图谱添加了注意力机制。

作者回顾了利用知识图谱嵌入进行关系预测的相关工作,总结为四种:基于成分的模型、翻译模型、基于卷积神经网络的模型、基于图的模型。作者指出这些相关工作存在两方面的不足,一是独立的处理三元组的信息,二是忽略了给定实体周围丰富和潜在的语义关系,即没有充分利用关系。在知识图谱中,实体根据其关联的关系扮演不同的角色。因此,作者提出了一种广义的基于注意力的图嵌入方法进行关系预测,该方法可以同时捕获任意给定实体邻域中的实体和关系特征。

作者提出的方法借鉴了图注意网络(Graph ATtention Networks,GATs))的思想,本文作者提出的方法和图注意网络都是给邻居节点分配不同的权重(注意力),不同的是GATs只输入节点嵌入信息,而作者提出的广义的基于注意力的图嵌入方法将节点嵌入和关系嵌入都作为输入,用分层迭代的方式传播注意力。学习实体、关系和得分函数f的有效表示,对于一个给定的三元组,通过评分函数来判断这个三元组有效的可能性。论文的构架是编码器-解码器模型,广义图注意力模型和ConvKB分别扮演编码器和解码器的角色。文章的重点和主要贡献是作者提出的广义图注意力模型。

image.png

图2  广义图注意力模型

最后,作者将提出的方法应用到五个数据集上,实验表明,该方法与其他先进的方法相比,具有显著的作用,效果较优。

备注:2019年10月29日晚上,“糖果之家”相约星期二,“大数据与智能决策”讨论班(Seminar)继续开讲,本次讨论班以知识图谱为题,共讨论了一篇文献,由硕士生进行讲解,共有青年教师、博士后、博士生和硕士生20人参加。




https://blog.sciencenet.cn/blog-34250-1206568.html

上一篇:电子病历挖掘——“大数据与智能决策”讨论班
下一篇:基于深度学习的推荐系统——“大数据与智能决策”讨论班
收藏 IP: 202.118.103.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 11:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部