知识是智能的基础:获得知识、运用知识
符合计算机要求的知识模式:计算机能存储、处理的知识表示模式;数据结构(List,Table,Tree,Graph,etc.)2.1基本概念
2.1.1数据、信息与知识
数据(Data)
信息的载体和表示
用一组符号及其组合表示信息
信息(Information)
数据的语义
数据在特定场合下的具体含义
知识(Knowledge)
信息关联后所形成的信息结构:事实&规则
经加工、整理、解释、挑选、改造后的信息
2.1.2知识的特性
相对正确性
一定条件下
某种环境中
......
不确定性
存在“中间状态”
“真”(“假”)程度
随机性
模糊性
经验性
不完全性
......可表示性&可利用性
语言
文字
图形
图像
视频
音频
神经网络
概率图模型
2.1.3知识的分类
常识性知识、领域性知识(作用范围)
事实性知识、过程性知识、控制知识(作用及表示)
确定性知识、不确定性知识(确定性)
逻辑性知识、形象性知识(结构及表现形式)
零级知识、一级知识、二级知识(抽象程度)
2.1.4常用的知识表示方法
一阶谓词(FirstOrderPredicate)产生式(Production)
框架(Framework)
语义网络(SemanticNetwork)剧本(Script)过程(Procedure)
面向对象(Object-Oriented)Petri网(PetriNetwork)
信念网(BeliefNetwork)
本体论(Ontology)……
2.1.5如何选择合适的表示方法?
充分表示领域知识
有利于对知识的利用
便于理解和实现
便于对知识的组织、管理与维护
2.2一阶谓词表示法
1.优点
自然性
接近自然语言,容易接受
精确性
用于表示精确知识
严密性
有严格的形式定义和推理规则
易实现性
易于转换为计算机内部形式2.缺点
无法表示不确定性知识
所能表示的知识范围太狭窄
难以表示启发性知识及元知识
未能充分利用与问题本身特性有关的知
识
组合爆炸
经常出现事实、规则等的组合爆炸
效率低
推理与知识的语义完全割裂
2.3产生式表示法
1943年E.Post第一次提出
称为“Post机”的计算模型(《计算理论》)
一种描述形式语言的语法
AI中应用最多的知识方法之一
Feigenbaum研制的化学分子结构专家系统DENDRAL
Shortliffe研制的的诊断感染性疾病的专家系统MYCIN
……
2.3.1产生式的基本形式
P→Q或
IFPTHENQCF=[0,1]
其中,P是产生式的前提,Q是一组结论或操作,CF(CertaintyFactor)为确定性因子,也称置信度。
【注意】:谓词逻辑中的蕴涵式与产生式的基本形式相似,事实上,蕴涵式只是产生式的一种特殊情况。理由如下:
(1)蕴涵式只能表示精确知识,其值非“真”即“假”,而产生式不仅可以表示精确知识,而且还可以表示不精确知识。
例如,MYCIN中有如下产生式:
IF本微生物的染色斑是革兰氏阴性
本微生物的形状呈杆状
病人是中间宿主
THEN该微生物是绿脓杆菌,置信度为CF=0.6
CF表示知识的强度,谓词逻辑中的蕴涵式不可以这样做。
(2)用产生式表示知识的系统中,“事实”与产生式的“前提”中所规定的条件进行匹配时,可以是“精确匹配”,也可以是基于相似度的“不精确匹配”,只要相似度落入某个预先设定的范围内,即可认为匹配。但对谓词逻辑的蕴涵式而言,其匹配必须是精确的。
用BNF(BackusNormalForm)表示的产生式形式描述及语义:
<产生式>::=<前提>→<结论>
<前提>::=<简单条件>|<复合条件>
<结论>::=<事实>|<操作>
<复合条件>::=<简单条件>AND<简单条件>[(AND<简单条件>)...]|<简单条件>OR<简单条件>[(OR<简单条件>)...]
<操作>::=<操作名>[(<变元>,...)]
【说明】:产生式又称规则或产生式规则;
产生式的“前提”:又称条件、前提条件、前件、左部等;
产生式的“结论”:又称后件、右部等。
2.3.2产生式系统的组成
产生式系统的三个组成部分:规则库、综合数据库、控制系统。
1、规则库
用于描述相应领域内知识的产生式集合。
在建立规则库时,应注意如下问题:
(1)有效地表达领域内的过程性知识:包括规则的建立、不确定性知识的表示、推理链的形成、知识的完整性等。
(2)对知识进行合理的组织与管理:目的是使得推理避免访问与所求解的问题无关的知识,以提高问题求解效率。
2、综合数据库
综合数据库又称为事实库、上下文、黑板等。它是一个用于存放问题求解过程中各种当前信息的数据结构,例如:问题的初始状态、原始证据、推理中得到的中间结论、最终结论等。
当规则库中某条产生式的前提可与综合数据库中的某些已知事实匹配时,该产生式就被激活,并把用它推出的结论放入综合数据库中,作为后面推理的已知事实。显然,综合数据库的内容是在不断变化的,是动态的。
综合数据库中的已知事实通常用字符串、向量、集合、矩阵、表等数据结构表示。
3、控制系统
控制系统又称推理机构,由一组程序组成,负责整个产生式系统的运行,实现对问题的求解。
控制系统的主要工作:
(1)按一定的策略从规则库中选择规则,并与综合数据库中的已知事实进行匹配。
(2)当发生冲突(即匹配成功的规则不止一条)时,调用相应的冲突解决策略予以消解。
(3)在执行某条规则时,若该规则的右部是一个或多个结论,则把这些结论加到综合数据库中;若规则的右部是一个或多个操作,则执行这些操作。
(4)对于不确定性知识,在执行每一条规则时,还要按一定的算法计算结论的不确定性。
(5)随时掌握结束产生式系统运行的时机,以便在适当的时候停止系统的运行。
产生式系统的三大组成部分的相互关系图
4、产生式系统求解问题的一般步骤
(1)初始化综合数据库,把问题的初始已知事实送入综合数据库中。
(2)若规则库中存在尚未使用过的规则,而且它的前提可与综合数据库中的已知事实匹配,则继续;若不存在这样的事实,则转第(5)步。
(3)执行当前选中的规则,并对该规则做上标记,把该规则执行后得到的结论送入综合数据库中。若该规则的结论部分指出的是某些操作,则执行这些操作。
(4)检查综合数据库中是否已包含了问题的解,若已包含,则终止问题的求解过程;否则,转第(2)步。
(5)要求用户提供进一步的关于问题的已知事实,若能提供,则转第(2)步;否则,终止问题求解过程。
(6)若规则中不再有未使用过的规则,则终止问题的求解过程。