知识图谱中的关系推理,究竟是个什么玩意儿?

in 知识图谱 Views: 6,860 s with 5 comments

关系推理是我全新接触的东西,虽然大一暑假的时候,留校做比赛有了解过神经网络的相关算法, 看过十多篇国内的论文,但这一次跟着刘老师的团队进行的这份工作,才让我真正的感受到了科研的魅力。

说起来,机器学习里那么多的方法,我对神经网络真的是真爱,这份喜爱大概来源自高中时看的某篇科幻小说吧~(不要打我……逃)

这一篇是刘老师交给我看的第一篇论文,从初期的配置环境,到后面直接一口气上全英文的论文,再到接触全新的一门Lua语言(因为论文的实现是用的Lua,我们项目组也在考虑要不要用Python来重写。)

总之,也不确定国内有多少人在看这篇论文,也不确定我自己的这一系列文章能对多少人有所帮助,只当是留下自己的一个学习过程吧。也希望能帮到项目组后面接触这篇论文的人。

那么下面切入正题。

首先是知识图谱这个东西。

知识图谱本质上是语义网络,是一种基于的数据结构,由节点(Point)(“实体”)和边(Edge)(“关系”)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。
如果你已经对机器学习、数据挖掘这类的一系列新兴玩意儿搞傻眼了的话,可以先看看这篇介绍:
数据挖掘、机器学习、深度学习,脸盲症入坑指南

一图胜千言!上图!
知识图谱.png

如果还是不太懂的可以去看相关链接【1】【2】,这里我不赘述了。

再来说关系推理

就我的理解而言,虽然目前的知识图谱上已经有了非常多的实体对和关系事实,但是由于数据的更新迭代以及不完整性,注定了这个知识图谱的不完整,同样,他里面也隐藏着我们难以轻易发现的信息。在论文中,给出了一个非常经典的介绍:

For example, we may have no evidence directly linking Melinda Gates and Seattle, however, we may infer with some likelihood that Melinda–lives-in– Seattle, by observing that the KB contains the path Melinda–spouse–Bill–chairman–Microsoft–HQ-in–Seattle.
比如说,我们没有证据直接指明梅琳达·盖茨和西雅图的关系。然而,我们可以通过观察到知识图谱中包含这样的一条路径“梅琳达·盖茨 - 配偶 - 比尔·盖茨 -主席 - 微软 - 总部在 - 西雅图 ”,推测出梅林达可能居住在西雅图。
这就是一个完整的、从关系推导出结果的例子。

或许你会说,这条路径多简单,是个人都能猜到。那么从100条这样的路径中呢?你会得出怎样的信息,会如何对信息的选择进行预判,你得出的信息又到底是对是错?这就是关系推理需要进行的工作了。

目前国内外的关系推理模型主要基于三类:
关系推理3.jpg

接下来分开来讲

先放两张便于大家理解的图——(基于逻辑规则的关系推理里也包含了基于概率图,基于知识表达的我暂时没找到,这个文件讲的还不错,大家可以先看看这个QAQ)

基于逻辑规则的关系推理

  1. 建模依据:采用抽象或具象的Horn子句
  2. 本质:基于逻辑规则进行推理
  3. 代表性工作:

    • 马尔科夫逻辑网络(Markov Logic Network)模型
    • 基于贝叶斯网络的概率关系模型(Probabilistic Relational Models)
    • 基于统计机器学习的FOIL(First Order Inductive Learner)算法
    • PRA算法(Path Ranking Alogorithm)
    • SFE(Subgraph Feature Extraction)算法
    • HiRi(Hierarchical Random-walk inference)算法
  4. 优势:能够模拟人类的逻辑推理能力,有可能引入人类的先验知识辅助推理
  5. 缺点:尚未有效解决优势所带来的的一系列问题,包括专家依赖、复杂度过高等问题
  6. 发展趋势

    1. 逐渐摒弃对人工规则的依赖
    2. 转而借助模式识别的方式进行规则(模式特征)发现
    3. 采用机器学习方法进行特征建模

基于知识表达的关系推理

  1. 建模依据:将实体和关系映射到一个低维的embedding空间中,基于知识的语义表达进行推理建模
  2. 代表性工作:

    • RESCAL张量分解模型(Tensor Factorization Model)
    • SE(Structured Embedding)关系推理算法
    • TransE(Translating Embedding)算法
    • TransH算法
    • TransM算法
    • TransG模型
  3. 优势:生成知识表达时能够充分利用知识图谱已有的结构化信息
  4. 缺点:建模方法着眼于实体间的直接关联关系,难以引入并利用人类的先验知识实现逻辑推理

基于深度学习的关系推理

  1. 代表性工作:

    • 单层感知机模型SLM(Single Layer Model)
    • NTN神经张量模型(Neural Tensor Networks)
    • DKRL(Description-Embodied Knowledge Representation Learning)模型
    • Path-RNN模型
      然后这是以上概括的整体思维导图——

而在关系推理日益发展壮大的基础上,在为知识图谱扩容的时候,又可以倒过来为自动化知识质量评估技术做出贡献。也就是前面所说的怎么判断抽取到的资料,好不好、正不正确等。

关系推理的介绍就先这样了~

后续我会继续补充整理资料上来~大家晚安~

相关链接:

【1】知识图谱技术原理介绍

【2】知识图谱的应用——知乎专栏

「一键投喂 软糖/蛋糕/布丁/牛奶/冰阔乐!」

薇拉航线

(๑>ڡ<)☆谢谢老板~

使用微信扫描二维码完成支付

Comments are closed.
  1. sanpang

    写的很好 解决了我这个小白的很多困惑
    超级感谢

    回复
  2. sanpang

    感觉真的好像认识唉~

    回复
    1. @sanpang

      这么厉害……居然撞见熟人了吗(惊

      回复
  3. zhou1xiang2

    “马尔代夫逻辑网络”,我读书少你不要骗我

    回复
    1. @zhou1xiang2

      马尔科夫逻辑网络(Markov Logic Networks)是基于马尔科夫网络的一个模型,详情可以看作者的介绍文献http://www.cs.washington.edu/homes/pedrod/papers/mlj05.pdf,发表于2006年的Machine Learning上。

      回复