上一篇文章中我们介绍了什么是知识图谱,而这一篇讲述了知识图谱的表示和建模方法。和编程之前需要选择平台一样,知识图谱的建模也需要我们来选择一种方法。本章主要讲述了如何使用这些方法对知识进行建模。
1.什么是知识表示
知识表示的五大用途和特点客观事物的机器标示(A KR is a Surrogate),即知识表示首先需要定义客观实体的机器指代或指称。 一组本体约定和概念模型(A KR is a Set of Ontological Commitments),即知识表示还需要定义用于描述客观事物的概念和类别体系。 支持推理的表示基础(A KR is a Theory of Intelligent Reasoning),即知识表示还需要提供机器推理的模型与方法。 用于高效计算的数据结构(A KR is a medium for Efficient Computation),即知识表示也是一种用于高效计算的数据结构。 人可理解的机器语言(A KR is a Medium of Human Expression),即知识表示还必须接近于人的认知,是人可理解的机器语言。再来梳理一下知识表示发展的脉络
知识表示发展脉络
Q:为什么要引入向量的概念?A: 简单来讲,向量能够表示更多字符无法表示的隐藏的知识,且更易于推理。
2.早期的一些表示方法
- 一阶谓词逻辑
第一步:列出一些基本逻辑
COMPUTER(x):x是计算机系的学生。LIKE(x,y):x喜欢y。HIGHER(x,y):x比y长得高。
第二步:将个体代入谓词中
这里涉及的个体有:张晓辉(zhangxh),编程序(programming),李晓鹏(lixp),以函数father(lixp)表示李晓鹏的父亲。
COMPUTER(zhangxh) ,~LIKE(zhangxh, programming) ,HIGHER(lip, father(lixp))
第三步:根据语义,用逻辑联接词将它们联接起来,就得到了表示上述知识的谓词公式
COMPUTER(zhangxh) ∧LIKE(zhangxh, programming)
张晓辉是一个计算机系的学生,他喜欢编程
HIGHER(lixp, father( lixp))
李晓鹏比他父亲长得高
- 霍恩子句和霍恩逻辑
霍恩子句(Horn Clause)得名于逻辑学家Alfred Horn[6]。一个子句是文字的析取。霍恩子句是带有最多一个肯定(positive)文字的子句,肯定文字指的是没有否定符号的文字。例如,Øp1∨…∨Øpn∨ q是一个霍恩子句,它可以被等价地写为(p1∧…∧pn)→ q。Alfred Horn于1951年撰文指出这种子句的重要性。这一段书里讲的内容属实没看明白,但是也不是特别重要,因为在知识表示方面他已经是过去式了!
- 语义网络
语义网络在形式上式一个带有标识的有向图,由节点和连接弧组成。如图
语义网络的构成
语义网络的缺点是
- 同一段知识可能有多种多样的表示形式。不同的表示形式会提高处理不同语义网络的复杂性。
- 如果你想要理解一个语义网络的含义,那你只能依靠其处理程序。即语义网络缺少一套公认的形式表示体系。这会产生什么样的影响呢?举个栗子,假如全世界各个国家的人只说自己本国的语言,那跨国交流就只能依靠打手势了,使得知识表示非常容易产生偏差。
“我对着她竖起了中指,她却以为我爱上了她”
- 框架
其理论的基本思想是:认为人们对现实世界中各种事物的认识都以一种类似于框架的结构存储在记忆中。
一个框架的实例
我们可以看到框架中有很多默认值,这种默认值会大大增加推理的难度。
- 描述逻辑
描述逻辑可以被看成是利用一阶逻辑对语义网络和框架进行形式化后的产物。描述逻辑一般支持一元谓词和二元谓词。一元谓词称为类,二元谓词称为关系。描述逻辑的重要特征是同时具有很强的表达能力和可判定性。描述逻辑是OWL的理论基础,下一篇文章再详细讨论
To Be Continued ….