7.1 不确定性及其类型 7.2 不确定性知识的表示 7.3 不确定性推理的一般模式 7.4 确定性理论 7.5 证据理论 7.6 模糊推理

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
复习: :对任意的x∈A,都有x∈B。 集合A与集合B间的关系 A(B) A B :存在x0∈A,但x0∈B。 A B A B.
教材: 王万良《人工智能及其应用》(第2版) 高等教育出版社,
第 8 章 不确定性知识的表示与推理 8.1 不确定性处理概述 8.2 几种经典的不确定性推理模型 8.3 基于贝叶斯网络的概率推理
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
10.2 立方根.
《高等数学》(理学) 常数项级数的概念 袁安锋
四种命题 2 垂直.
常用逻辑用语复习 知识网络 常用逻辑用语 命题及其关系 简单的逻辑联结词 全称量词与存在量词 四种命题 充分条件与必要条件 量词 全称量词 存在量词 含有一个量词的否定 或 且 非或 并集 交集 补集 运算.
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
常用逻辑用语复习课 李娟.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 函数的求导法则 一 函数的四则运算的微分法则 二 反函数的微分法则 三 复合函数的微分法则及微分 形式不变性 四 微分法小结.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第二章 矩阵(matrix) 第8次课.
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
数列.
人工智能 Artificial Intelligence 第四章
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
第四章 一次函数 4. 一次函数的应用(第1课时).
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
第九节 赋值运算符和赋值表达式.
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.2 子集、补集、全集习题课.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
4) 若A可逆,则 也可逆, 证明: 所以.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
2.2矩阵的代数运算.
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
主讲教师 欧阳丹彤 吉林大学计算机科学与技术学院
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
第六章 不确定性推理 6-1 不确定性推理的基本概念.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
1.2.2 充要条件 高二数学 选修 1-1 第一章 常用逻辑用语.
Presentation transcript:

7.1 不确定性及其类型 7.2 不确定性知识的表示 7.3 不确定性推理的一般模式 7.4 确定性理论 7.5 证据理论 7.6 模糊推理 第7章 不确定性处理 7.1 不确定性及其类型 7.2 不确定性知识的表示 7.3 不确定性推理的一般模式 7.4 确定性理论 7.5 证据理论 7.6 模糊推理

7.1 不确定性及其类型 由于客观世界的复杂、多变性和人类自身认识的局限、主观性,致使我们所获得、所处理的信息和知识中,往往含有不肯定、不准确、不完全甚至不一致的成分。这就是所谓的不确定性。 事实上,不确定性大量存在于我们所处的信息环境中,例如人的日常语言中就几乎处处含有不确定性(瞧!这句话本身就含有不确定性:什么叫“几乎”?)。不确定性也大量存在于我们的知识特别是经验性知识之中。

所以,要实现人工智能,不确定性是无法回避的。人工智能必须研究不确定性,研究它们的表示和处理技术。事实上,关于不确定性的处理技术,对于人工智能的诸多领域,如专家系统、自然语言理解、控制和决策、智能机器人等,都尤为重要。按性质划分,不确定性大致可分为随机性、模糊性、不完全性、不一致性和时变性等几种类型。

1. 随机性 随机性就是一个命题(亦即所表示的事件)的真实性不能完全肯定,而只能对其为真的可能性给出某种估计。例如, 如果乌云密布并且电闪雷鸣,则很可能要下暴雨。 如果头痛发烧,则大概是患了感冒。 就是两个含有随机不确定性的命题。当然,它们描述的是人们的经验性知识。

2.模糊性 模糊性就是一个命题中所出现的某些言词,从概念上讲,无明确的内涵和外延,即是模糊不清的。例如, 小王是个高个子。 张三和李四是好朋友。 如果向左转,则身体就向左稍倾。 这几个命题中就含有模糊不确定性,因为其中的“高”、“好朋友”、“稍倾”等都是模糊概念。

3.不完全性 不完全性就是对某事物来说,关于它的信息或知识还不全面、不完整、不充分。例如,在破案的过程中,警方所掌握的关于罪犯的有关信息,往往就是不完全的。但就是在这种情况下,办案人员仍能通过分析、推理等手段而最终破案。

4.不一致性 不一致性就是在推理过程中发生了前后不相容的结论;或者随着时间的推移或者范围的扩大,原来一些成立的命题变得不成立、不适合了。例如,牛顿定律对于宏观世界是正确的,但对于微观世界和宇观世界却是不适合的。

7.2 不确定性知识的表示 7.2.1 随机性知识的表示 我们只讨论随机性产生式规则的表示。对于随机不确定性,一般采用信度(或称可信度)来刻划。一个命题的信度是指该命题为真的可信程度。例如, (这场球赛甲队取胜,0.9) 这里的0.9就是命题“这场球赛甲队取胜”的可信度。它表示“这场球赛甲队取胜”这个命题为真(即这个事件发生)的可能性程度是0.9。

随机性产生式的一般表示形式为 A→B(C(A→B)) (7―1) 或者 A→(B,C(B|A)) (7--2) 其中C(A→B)表示规则A→B为真的信度;而C(B|A)表示规则的结论B在前提A为真的情况下为真的信度。例如,对上节中给出的两个随机性命题,其随机性可以用信度来表示。  

信度也可以是基于概率的某种度量。例如,在著名的专家系统MYCIN中,其规则E→H中,结论H的信度就被定义为 当P(H|E)>P(H) 当P(H|E)=P(H) 当P(H|E)<P(H)

其中,E表示规则的前提,H表示规则的结论,P(H)是H的先验概率,P(H|E)是E为真时H为真的条件概率,CF(Certainty Factor)称为确定性因子,即可信度。 由此定义,可以求得CF的取值范围为[-1,1]。当CF=1时,表示H肯定真;CF=-1表示H肯定假;CF=0表示E与H无关。 这个可信度的表达式是什么意思呢?原来,CF是由称为信任增长度MB和不信任增长度MD相减而来的。即 CF(H,E)=MB(H,E)-MD(H,E)

当P(H)=1 否则 当P(H)=0 否则

当MB(H,E)>0,表示由于证据E的出现增加了对H的信任程度。当MD(H,E)>0,表示由于证据E的出现增加了对H的不信任程度。由于对同一个证据E,它不可能既增加对H的信任程度又增加对H的不信任程度,因此,MB(H,E)与MD(H,E)是互斥的,即 当MB(H,E)>0时,MD(H,E)=0; 当MD(H,E)>0时,MB(H,E)=0。

7.2.2 模糊性知识的表示 对于模糊不确定性,一般采用程度或集合来刻划。所谓程度就是一个命题中所描述的事物的属性、状态和关系等的强度。例如,我们用三元组(张三,体型,(胖,0.9))表示命题“张三比较胖”,其中的0.9就代替“比较”而刻划了张三“胖”的程度。 这种程度表示法,一般是一种针对对象的表示法。其一般形式为 (<对象>,<属性>,(<属性值>,<程度>))

可以看出,它实际是通常三元组(<对象>,<属性>,<属性值>)的细化,其中的<程度>一项是对前面属性值的精确刻划。事实上,这种思想和方法还可广泛用于产生式规则、谓词逻辑、框架、语义网络等多种知识表示方法中,从而扩充它们的表示范围和能力。下面我们举例。

例7.1 模糊规则 (患者,症状,(头疼,0.95))∧(患者,症状,(发烧,1.1))→(患者,疾病,(感冒,1.2))可解释为:如果患者有些头疼并且发高烧,则他患了重感冒。

例7.2 模糊谓词 (1)1.0白(雪)或白1.0(雪) 表示:雪是白的。 (2)朋友1.15(张三,李四)或1.15朋友(张三,李四) 表示:张三和李四是好朋友。 (3)x(计算机系学生(x) 1.0 努力1.2(x)) 表示:计算机系的同学学习都很努力。

例7.3 模糊框架 框架名:<大枣> 属:(<干果>,0.8) 形:(圆,0.7) 色:(红,1.0) 味:(甘,1.1) 用途:食用 药用: 用量:约五枚 用法:水煎服 注意:室温下半天内服完

例7.4 模糊语义网 理解人意 狗 食肉动物 (灵敏,1.5) (can,0.3) (AKO,0.7) 嗅觉

7.2.3 模糊集合与模糊逻辑 上面我们是从对象着眼,来讨论模糊性知识的表示方法的。若从概念着眼,模糊性知识中的模糊概念则可用所谓的模糊集合来表示。 1.模糊集合 定义1 设U是一个论域,U到区间[0,1]的一个映射 μ:U [0,1]

论域U上的模糊集合A,一般可记为

例7.5 设U={0,1,2,3,4,5,6,7,8,9,10},则U中“大数的集合”和“小数的集合”可分别定义如下: 大数的集合=0/0+0/1+0/2+0.1/3+0.2/4+0.3/5+0.5/6+0.7/7+0.9/8+1/9+1/10 小数的集合=1/0+1/1+1/2+0.8/3+0.7/4+0.5/5+0.4/6+0.2/7+0/8+0/9+0/10

例7.6 设论域U=[1,200],表示人的年龄区间,则模糊概念“年轻”和“年老”可分别定义如下: 当1≤u≤25 当1≤u≤50 当1≤u≤25 当1≤u≤50

2. 模糊关系 除了有些性质概念是模糊概念外,还存在不少模糊的关系概念。如“远大于”、“基本相同”、“好朋友”等就是一些模糊关系。模糊关系也可以用模糊集合表示。下面我们就用模糊子集定义模糊关系。 定义2 集合U1,U2,…,Un的笛卡尔积集U1×U2×…×Un的一个模糊子集 ,称为U1,U2,…,Un间的一个n元模糊关系。特别地,Un的一个模糊子集称为U上的一个n元模糊关系。

例7.7 设U={1,2,3,4,5},U上的“远大于”这个模糊关系可用模糊子集表示如下: “远大于”= 0.1/(1,2)+0.4/(1,3)+0.7/(1,4)+1/(1,5)+0.2/(2,3)+0.4/(2,4)+0.7/(2,5)+0.1/(3,4)+0.4/(3,5)+0.1/(4,5) 就像通常的关系可用矩阵表示一样,模糊关系也可以用矩阵来表示。例如上面的“远大于”用矩阵可表示如下:

1 2 3 4 5 0 0.1 0.4 0.7 1 0 0 0.2 0.4 0.7 0 0 0 0.1 0.4 0 0 0 0 0.1 0 0 0 0 0 1 2 3 4 5 表示模糊关系的矩阵一般称为模糊矩阵。

3.模糊集合的运算 与普通集合一样,也可定义模糊集合的交、并、补运算。 定义3 设 是X的模糊子集, 的交集 、并集 和补集 ,分别由下面的隶属函数确定:

4.模糊逻辑 模糊逻辑是研究模糊命题的逻辑。设n元谓词 可以看出,上述定义的模糊命题的真值,实际是把一个命题内部的隶属度,转化为整个命题的真实度。

7.2.4 多值逻辑 我们知道,人们通常所使用的逻辑是二值逻辑。即对一个命题来说,它必须是非真即假,反之亦然。但现实中一句话的真假却并非一定如此,而可能是半真半假,或不真不假,或者真假一时还不能确定等等。这样,仅靠二值逻辑有些事情就无法处理,有些推理就无法进行。于是,人们就提出了三值逻辑、四值逻辑、多值逻辑乃至无穷值逻辑。

我们介绍一种三值逻辑,称为Kleene三值逻辑。在这种三值逻辑中,命题的真值,除了“真”、“假”外,还可以是“不能判定”。其逻辑运算定义如下: ∧ T F U T F U T F U F F F U F U ∨ T F U T F U T T T T F U T T U P T F U

7.2.5 非单调逻辑 所谓“单调”,是指一个逻辑系统中的定理随着推理的进行而总是递增的。那么,非单调就是逻辑系统中的定理随着推理的进行而并非总是递增的,就是说也可能有时要减少。传统的逻辑系统都是单调逻辑。但事实上,现实世界却是非单调的。例如,人们在对某事物的信息和知识不足的情况下,往往是先按假设或默认的情况进行处理,但后来发现得到了错误的或者矛盾的结果,则就又要撤消原来的假设以及由此得到的一切结论。

在非单调逻辑中,若由某假设出发进行的推理中一旦出现不一致,即出现与假设矛盾的命题,那么允许撤消原来的假设及由它推出的全部结论。基于非单调逻辑的推理称为非单调逻辑推理,或非单调推理。 (1)在问题求解之前,因信息缺乏先作一些临时假设,而在问题求解过程中根据实际情况再对假设进行修正。 (2)非完全知识库。随着知识的不断获取,知识数目渐增,则可能出现非单调现象。

(3)动态变化的知识库。 常见的非单调推理有缺省推理(reasoningbydefault)和界限推理。由于篇幅所限,这两种推理不再详细介绍,有兴趣的读者可参阅有关专著。

7.2.6 时序逻辑 对于时变性,人们提出了时序逻辑。时序逻辑也称时态逻辑,它将时间词(称为时态算子,如“过去”,“将来”,“有时”,“一直”等)或时间参数引入逻辑表达式,使其在不同的时间有不同的真值。从而可描述和解决时变性问题。时序逻辑在程序规范(specifications)#,程序验证以及程序语义形式化方面有重要应用,因而它现已成为计算机和人工智能科学理论的一个重要研究课题。

7.3 不确定性推理的一般模式 基于不确定性知识的推理称为不确定性推理,亦称为不精确推理。 7.3 不确定性推理的一般模式 基于不确定性知识的推理称为不确定性推理,亦称为不精确推理。 由于不确定性推理是基于不确定性知识的推理,所以,其结果仍然是不确定性的。但对不确定性知识,我们是用量化不确定性的方法表示的(实际是把它变成了确定性的了),所以,不确定性推理的结果仍然应含有某种不确定性度量。

所以,不确定性推理的一般模式就可简单地表示为 不确定性推理=符号模式匹配+不确定性计算 这里的不确定性计算是基于各种不确定性度量,如信度、真度、各种特征(值)强度、隶属度等的计算。

可以看出,不确定性推理与通常的确定性推理相比,区别在于多了个数值计算过程。   但正由于需要计算,所以,不确定性推理就与通常的确定性推理有了质的差别。主要表现在以下几个方面: (1)不确定性推理中符号模式匹配能否成功,不但要求两个符号模式本身要能够匹配(合一),而且要求证据事实所含的不确定性程度必须达“标”,即必须达到一定的限度。这个限度一般称为“阈值”。

(2)不确定性推理中一个规则的触发,不仅要求其前提能匹配成功,而且前提条件的不确定性总程度还必须至少达到阈值。 (3)不确定性推理中推得的结论是否有效,也取决于其不确定性程度是否达到阈值。 总之,不确定性推理要涉及:不确定性度量、阈值、上述各种度量计算方法等的定义和选取。所有这些就构成了所谓的不确定性推理模型,或不精确推理模型。  

7.4 确定性理论 确定性理论是肖特里菲(E.H.Shortliffe)等于1975年提出的一种不精确推理模型,它在专家系统MYCIN中得到了应用。确定性理论是用于随机不确定性的一种推理模型。   1.不确定性度量 采用CF,即确定性因子(一般称为可信度),其定义如上节所述,取值范围为[-1,1]。

2. 前提证据事实总CF值计算 CF(E1∧E2∧…∧En)=min{CF(E1),CF(E2),…,CF(En)} CF(E1∨E2∨…∨En)=max{CF(E1),CF(E2),…,CF(En)} 其中E1,E2,…,En是与规则前提各条件匹配的事实。 3.推理结论CF值计算 CF(H)=CF(H,E)·max{0,CF(E)} 其中E是与规则前提对应的各事实,CF(H,E)是规则中结论的可信度,即规则强度。

4.重复结论的CF值计算 若同一结论H分别被不同的两条规则推出,而得到两个可信度CF(H)1和CF(H)2,则最终的CF(H)为 CF(H)1+CF(H)2-CF(H)1·CF(H)2 当CF(H)1≥0,且CF(H)2≥0 CF(H)= CF(H)1+CF(H)2+CF(H)1·CF(H)2 当CF(H)1<0,且CF(H)2<0 CF(H)1+CF(H)2 否则

例7.8 设有如下一组产生式规则和证据事实,试用确定性理论求出由每一个规则推出的结论及其可信度。 规则: ①if At hen B(0.9) ②if B and C then D(0.8) ③if A and C then D(0.7) ④if B or D then E(0.6) 事实: A,CF(A)=0.8;C,CF(C)=0.9

解 规则①得:CF(B)=0.9×0.8=0.72 由规则②得:CF(D)1=0.8×min{0.72,0.9)=0.8×0.72=0.576 由规则③得:CF(D)2=0.7×min{0.8,0.9)=0.7×0.8=0.56 从而 CF(D) =CF(D)1+CF(D)2-CF(D)1×CF(D)2 =0.576+0.56-0.576×0.56=0.32256 由规则④得:CF(E)=0.6×max{0.72,0.32256}=0.6×0.72=0.432

7.5 证据理论 7.5.1基本概念 1.识别框架 识别框架就是所考察判断的事物或对象的集合,记为Ω。例如下面的集合都是识别框架: 7.5 证据理论 7.5.1基本概念 1.识别框架 识别框架就是所考察判断的事物或对象的集合,记为Ω。例如下面的集合都是识别框架: Ω1={晴天,多云,刮风,下雨} Ω2={感冒,支气管炎,鼻炎} Ω3={红,黄,蓝} Ω4={80,90,100}

识别框架的子集就构成求解问题的各种解答。这些子集也都可以表示为命题。证据理论就是通过定义在这些子集上的几种信度函数,来计算识别框架中诸子集为真的可信度。例如,在医疗诊断中,病人的所有可能的疾病集合构成识别框架,证据理论就从该病人的种种症状出发,计算病人患某类疾病(含多种病症并发)的可信程度。

2. 基本概率分配函数 定义4给定识别框架Ω,A∈2Ω,称m(A):2Ω→[0,1]是2Ω上的一个基本概率分配函数(Function of Basic Probability Assignment),若它满足 (1) m(Φ)=0;

例7.9 设Ω={a,b,c},其基本概率分配函数为 m({a})=0.4 m({a,b})=0 m({a,c})=0.4 m({a,b,c})=0.2 m({b})=0 m({b,c})=0 m({c})=0 可以看出,基本概率分配函数之值并非概率。如 m({a})+m({b})+m({c})=0.4≠1

3.信任函数 定义5 给定识别框架Ω,   称为2Ω上的信任函数(Function of Belief)。 信任函数表示对A为真的信任程度。所以,它就是证据理论的信度函数。信任函数也称为下限函数。

可以证明,信任函数有如下性质: (1)Bel(Φ)=0,Bel(Ω)=1,且对于2Ω中的任意元素A,有0≤Bel(A)≤1。 (2)信任函数为递增函数。即若 ,则Bel(A1)≤Bel(A2)。   (3)Bel(A)+Bel(A′)≤1 (A′为A的补集)

例7.10 由例7.9可知 Bel({a,b})=m({a})+m({b})+m({a,b})=0.4+0+0=0.4 4.似真函数 定义6 Pl(A)=1-Bel(A′)(A∈2Ω,A′为A的补集)称为A的似真函数(Plausible function),函数值称为似真度。 似真函数又称为上限函数,它表示对A非假的信任程度。

例7.11 由例7.9、例7.10可知 Pl({a,b})=1-Bel({a,b}′)=1-({c})=1-0=1 5.信任区间 定义7 设Bel (A)和Pl(A)分别表示A的信任度和似真度,称二元组 [Bel(A),Pl(A)] 为A的一个信任区间。

6. Dempster 组合规则 1) 基本的组合规则 设m1(A)和m2(A)(A∈2Ω)是识别框架Ω基于不同证据的两个基本概率分配函数,则将二者可按下面的 Dempster组合规则合并: 该表达式一般称为m1与m2的正交和,并记为 m=m1+m2。不难证明,组合后的m(A)满足

例7.12 设识别框架Ω={a,b,c},若基于 两组不同证据而导出的基本概率分配函数分别为: m1({a})=0.4 m1({a,c})=0.4 m1({a,b,c})=0.2 m2({a})=0.6 m2({a,b,c})=0.4

将m1和m2合并 m({a})= =m1({a})m2({a})+m1({a})m2({a,b,c})+m1({a,c})m2({a}) +m1({a,b,c})m2({a})=0.76 m({a,c})=m1({a,c})m2({a,b,c})=0.16 m({a,b,c})=m1({a,b,c})m2({a,b,c})=0.08

2) 含冲突修正的组合规则 上述组合规则在某些情况下会有问题。考察两个不同的基本概率分配函数m1和m2,若存在集合B、C,B∩C=Φ,且m1(A)>0,m2(B)>0,这时使用 Dempster组合规则将导出 这与概率分配函数的定义冲突。这时,需将Dempster 组合规则进行如下修正:

其中K为规范数,且 规范数K的引入,实际上是把空集所丢弃的正交和按比例地补到非空集上,使m(A)仍然满足 如果所有交集均为空集,则出现K=∞,显然,Dempster组合规则在这种情况下将失去意义。

7.5.2基于证据理论的不确定性推理 基于证据理论的不确定性推理,大体可分为以下步骤: (1)建立问题的识别框架Ω; (2)给幂集2Ω定义基本概率分配函数; (3)计算所关心的子集A∈2Ω(即Ω的子集)的信任函数值Bel(A)、似真函数值Pl(A); (4)由Bel(A)、Pl(A)得出结论。

例7.13 设有规则: (1)如果流鼻涕则感冒但非过敏性鼻炎(0.9)或过敏性鼻炎但非感冒(0.1) (2)如果眼发炎则感冒但非过敏性鼻炎(0.8)或过敏性鼻炎但非感冒(0.05)括号中的数字表示规则前提对结论的支持程度。又有事实: (1)小王流鼻涕(0.9) (2)小王眼发炎(0.4) 括号中的数字表示事实的可信程度。

问:小王患什么病? 我们用证据理论求解这一医疗诊断问题。 首先,取识别框架 Ω={h1,h2,h3} 其中,h1表示“感冒但非过敏性鼻炎”,h2表示“过敏性鼻炎但非感冒”,h3表示“同时得了两种病”。

再取下面的基本概率分配函数: m1({h1})=规则前提事实可信度×规则结论可信度 =0.9×0.9=0.81 m1({h2})=0.9×0.1=0.09 m1({h1,h2,h3})=1- m1({h1})- m1({h2})=1-0.81-0.09=0.1 m1(A)=0 (A为Ω的其他子集) m2({h1})=0.4×0.8=0.32m2({h2})=0.4×0.05=0.02m2({h1,h2,h3})=1-m2({h1})-m2({h2})=1-0.32-0.02=0.66 m2(A)=0 (A为Ω的其他子集)

将两个概率分配函数合并 K=1/{1-[m1({h1})m2({h2})+m1({h2})m2({h1})]} =1/{1-[0.81×0.02+0.09×0.32]} =1/{1-0.045} =1/0.955 =1.05 m({h1})=K·[m1({h1})m2({h1})+m1({h1})m2({h1,h2,h3}+m1({h1,h2,h3})m2({h1})] =1.05×0.8258=0.87

m({h2})=K·[m1({h2})m2({h2})+m1({h2})m2({h1,h2,h3}+m1({h1,h2,h3})m2({h2})] =1.05×0.0632 =0.066 m({h1,h2,h3})=1-m({h1})-m({h2}) =1-0.87-0.066=0.064 由信任函数求信任度 Bel({h1})=m({h1})=0.87 Bel({h2})=m({h2})=0.066

由似真函数求似真度 Pl({h1})=1-Bel({h1}′)=1-Bel({h2,h3}) =1-[m({h2}+m({h3}) =1-[0.066+0]=0.934 Pl({h2})=1-Bel({h2}′)=1-Bel({h1,h3}) =1-[m({h1})+m({h3})] =1-[0.87+0]=0.13

于是,最后得到: “感冒但非过敏性鼻炎”为真的信任度为0.87,非假的信任度为0.934; “过敏性鼻炎但非感冒”为真的信任度为0.066,非假的信任度为0.13。 所以,看来该患者是感冒了。 证据理论是被推崇的处理随机性不确定性的好方法,受到人工智能特别是专家系统领域的广泛重视,并且已为许多专家系统所采用。

7.6 模糊推理 7.6.1 语言变量,语言值 简单来讲,语言变量就是我们通常所说的属性名,如“年纪”就是一个语言变量。语言值是指语言变量所取的值,如“老”、“中”、“青”就是语言变量年纪的三个语言值。

7.6.2 用模糊(关系)集合表示模糊规则 可以看出,模糊命题中描述事物属性、状态和关系的语词,就是这里的语言值。这些语言值许多都是模糊概念,因而可用模糊集合表示。 我们知道,一条规则实际是表达了其前提与结论的对应关系。再具体一点讲,是表达了前提中的语言值与结论中的语言值之间的对应关系(如上例中的规则就表示了语言值“小”与“大”的对应关系)。

现在语言值又可用集合表示,所以,一条模糊规则实际就刻划了其前提中的模糊集与结论中的模糊集之间的一种对应关系。Zadeh认为,这种对应关系是两个集合间的一种模糊关系,因而它也可以表示为模糊集合。于是,一条模糊规则就转换成了一个模糊集合。特别地,对于有限集,则就是一个模糊矩阵。

7.6.3 模糊关系合成 什么是模糊关系合成呢?模糊关系合成也就是两个模糊关系复合为一个模糊关系。用集合的话来讲,就是两个集合合成为一个集合。如果是两个有限模糊集,则其合成可以用矩阵运算来表示。下面就以有限模糊集为例,给出 Zadeh 的模糊关系合成法则。  

其中

同规则一样,证据事实也可表示成模糊矩阵(实际是向量)。如,对于事实 x比较小把“比较小”表示为 7.6.4 基于关系合成的模糊推理 同规则一样,证据事实也可表示成模糊矩阵(实际是向量)。如,对于事实 x比较小把“比较小”表示为 现在,就可通过模糊关系的合成运算进行模糊推理了。其模式是 (7―3)

用隶属函数表示,7―3式就是,对于y∈V 例7.14 现在我们举例。就解决本节开始提出的问题。即已知 (1)如果x小,那么y大。 (2)x比较小。 问:y怎么样?

解 如前所述,由(1)得 由(2)得 A′=(1,1,0.5,0.2,0) 从而 0 0 0.4 0.6 1 0 0 0.4 0.6 1 0.5 0.5 0.5 0.5 0.5 1 1 1 1 1 由(2)得 A′=(1,1,0.5,0.2,0) 从而

推理模式(7―3)是肯定前件的模糊推理。同理,可得否定后件的模糊推理:   (7―4) 可以看出,这一模式可解决下面的问题: 设已知 (1)如果x小,那么y大。 (2)y比较大。 问:x怎么样?

需说明的是,上面我们是把一条模糊规则表示为一个模糊关系(矩阵),但实际问题中往往并非仅有一条规则,而是多条规则,那该怎么办呢?所幸的是对于多条规则用模糊关系的合成法则仍然可化为一个模糊关系(矩阵)。由于篇幅所限这里不作介绍,有兴趣的读者可进一步参考有关模糊推理的文献。

7.6.5 模糊推理的应用与发展 由上所述,我们看到这种模糊推理实际把推理变成了计算,从而为不确定性推理开辟了一条新途径。特别是这种模糊推理很适合于控制。用模糊推理原理构造的控制器称为模糊控制器。模糊控制器结构简单,可用硬件芯片实现,造价低、体积小,现已广泛应用于控制领域。