欢迎使用本课件 教材简介: 名 称:人工智能原理与应用 作 者:张仰森 出版社:高等教育出版社 章 节:共十章 主讲教师: 宗春梅.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
第二节 换元积分法 一、第一类换元积分 法(凑微分法) 二、第二类换元积分法. 问题 解决方法 利用复合函数,设置中间变量. 过程令 一、第一类换元积分法(凑微分法)
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
复习: :对任意的x∈A,都有x∈B。 集合A与集合B间的关系 A(B) A B :存在x0∈A,但x0∈B。 A B A B.
教材: 王万良《人工智能及其应用》(第2版) 高等教育出版社,
第 8 章 不确定性知识的表示与推理 8.1 不确定性处理概述 8.2 几种经典的不确定性推理模型 8.3 基于贝叶斯网络的概率推理
10.2 立方根.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
《高等数学》(理学) 常数项级数的概念 袁安锋
§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间 线性空间是线性代数的高等部分,是代数学
四种命题 2 垂直.
1.1.2四种命题 1.1.3四种命题间的相互关系.
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
常用逻辑用语复习课 李娟.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
1.2 事件的频率与概率 一、事件的频率 二、概率的公理化体系 1.2 事件的频率与概率.
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
元素替换法 ——行列式按行(列)展开(推论)
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第五章 不确定性推理 概述 概率论基础 Bayes网络 主观Bayes方法 确定性方法 证据理论.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
6.4不等式的解法举例(1) 2019年4月17日星期三.
实数与向量的积.
顺序表的删除.
人工智能 Artificial Intelligence 第四章
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
1.2 子集、补集、全集习题课.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
2.2矩阵的代数运算.
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
主讲教师 欧阳丹彤 吉林大学计算机科学与技术学院
锐角三角函数(1) ——正 弦.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第十七讲 密码执行(1).
第十二讲 密码执行(上).
第六章 不确定性推理 6-1 不确定性推理的基本概念.
位似.
5.1 相交线 (5.1.2 垂线).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
§3.1.2 两条直线平行与垂直的判定 l1 // l2 l1 ⊥ l2 k1与k2 满足什么关系?
1.2.2 充要条件 高二数学 选修 1-1 第一章 常用逻辑用语.
Presentation transcript:

欢迎使用本课件 教材简介: 名 称:人工智能原理与应用 作 者:张仰森 出版社:高等教育出版社 章 节:共十章 主讲教师: 宗春梅

一个人工智能系统,由于知识本身的不精确和不完全,常采用非标准逻辑意义下的不确定性推理方法和非单调推理方法。对于不确定推理来说,不精确性如何描述以及如何传播是主要问题 。

4.1不确定性推理概述 知识库是人工智能系统的核心,而知识库中的知识既有规律性的一般原理,又有大量的不完全的专家经验知识,这样的知识不可避免的带有模糊性、随机性、不可靠或不知道等不确定因素。一般地说,不确定性是来自知识的客观现实和知识的主观认识水平。不确定性是人们思维过程中经常出现的一种心理状态,人们在日常生活中要处理大量的不确定性问题。现实世界上几乎没有什么事情是完全确定的,处理不确定性的目的是希望得到对某一命题的精确判断。

4.1不确定性推理概述 4.1.2不确定性推理方法的分类 可信度方法 基于概率的方法方法 主观Bayse方法 数值方法 证据理论方法 模型方法 控制方法 数值方法 非数值方法 启发式搜索 相关性制导回溯 基于概率的方法方法 模糊推理方法 可信度方法 主观Bayse方法 证据理论方法

4.1不确定性推理概述 4.1.3不确定性推理中的基本问题 1、不确定性的表示 2、推理计算 3、不确定性的度量

以产生式作为知识表示的MYCIN中,第一次使用了不确定性推理方法,给出了以确定性因子或称可信度作为不确定性的度量。 4.2可信度方法 4.2.1可信度的概念 以产生式作为知识表示的MYCIN中,第一次使用了不确定性推理方法,给出了以确定性因子或称可信度作为不确定性的度量。

4.2可信度方法 (以下将综合对以上四小节进行讨论) 4.2.2知识不确定性的表示 4.2.3证据不确定性的表示 4.2.4不确定性的推理计算 4.2.5可信度方法应用举例 (以下将综合对以上四小节进行讨论)

4.2.1-4.2.5 1.规则的不确定性度量   规则以A→B表示,其中前提A可以是一些命题的合取或析取。MYCIN系统引入可信度CF作为规则不确定性度量。CF表示了增量      P(B│A)-P(B)   相对于P(B)或P(~B)的比值。其中P表概率。规定 规定

4.2.1-4.2.5 CF(B,A)表示了证据A为真时,相对于P(~B)=1-P(B)来说A对B为真的支持程度(当CF(B,A)≥ 0)。或相对于P(B)来说A对B为真的不支持程度(当CF(B,A)<0)。这种定义形式保证了-1≤CF(B,A)≤ 1。当P(B│A)-P(B)相同时,P(B)小的CF小,P(B)大的CF大。   容易看出CF(B,A)的几个特殊值:   (1) 前提A真,结论B必真的情形。由P(B│A)=1来体现,这时CF(B,A)=1。   (2) 前提A与结论B无关的情形。由P(B│A)=P(B)来体现,这时CF(B,A)=0。   (3) 前提A与结论B无关的情形,由P(B│A)=0来体现,这时CF(B,A)=-1。

4.2.1-4.2.5 显然CF(B,A)≥ 0表示前提A真支持B真。CF(B,A)<0表示前提A真不支持B真。   不难看出,CF(B,A)的定义借用了概率,但它本身并不是概率。因为CF(B,A)可取负值,CF(B,A)+CF(B,~A)不必为1甚至可能为0。   实际应用中,A→B的CF(B,A)值是由专家主观确定的,并不是由P(B│A),P(B)来计算的。需注意的是CF(B,A)表示的是增量P(B|A)-P(B)对1-P(B)或P(B)的比值,而不是绝对量的比值。

4.2.1-4.2.5 2.证据的不确定性度量   证据A的不确定性也可以CF(A)表示,同样规定-1≤CF(A)≤ 1。   几个特殊值规定为   (1) A肯定为真时CF(A)=1。   (2) A肯定为假时,CF(A)=-1。   (3) 对A一无所知时,CF(A)=0。   CF(A)>0 表示A以CF(A)程度为真。   CF(A)<0 表示A以CF(A)程度为假。   实际使用时,初始证据的CF值由专家提供,其它证据的CF值是需使用规则经推理求得。

4.2.1-4.2.5 3.推理计算 (1)已知 CF(A),A→B CF(B,A)求CF(B)      规定 CF(B)=CF(B,A)·max{0,CF(A)} (2)规定 CF(~A)=-CF(A)         CF(A1∧ A2)=min{CF(A1),CF(A2)}         CF(A1∧ A2)=max{CF(A1),CF(A2)} (3)由规定 →B求得CF(B),又使用规则 →B时,如何更新CF(B)。或说    已知 CF(A1),CF(A2)以及CF(B, A1),CF(B, A2 )来寻求合成的CF(B)。   依(1)先计算出      CF1(B)=CF(B,A1)·max{0,CF(A1 )}      CF2(B)=CF(B, A2)·max{0,CF(A2 )}

4.2.1-4.2.5 进而规定                                                   CF(B)的更新计算,也可这样来理解。已知CF(A),A→B CF(B,A)而B原来的可信度为CF(B),来求B的可信度更新值CF(B|A)。

4.2.1-4.2.5 当CF(A)=1时,有                                                  当CF(A)<1(证据A也是不确定的),这时CF(B|A)必然比CF(A)=1时的CF(B|A)来得小。若CF(A)>0,可以CF(A)·CF(B,A)作为对规则A→B的可信度,而CF(B|A)的计算仍可使用CF(A)=1时的公式。但CF(A)<0时,规则A→B可不使用,像MYCIN系统规定CF(A)≤0.2就认为是不可使用的前提。

4.2.1-4.2.5 关于CF(B|A)的计算,对除CF(A),CF(B,A)均非负,以及CF(B),CF(B,A)均为负之外的其它情形,EMYCIN系统使用的是                                应指出,若通过引入信任增长度MB和不信任增长度MD来定义CF=MB-MD,并用MB、MD来计算合成的CF值,半群代数结构方可得到保证。而在MYCIN中上述计算CF(B|A)的方法过于简单了,并不能保证CF合成计算的结合律了。

4.3主观Bayes方法 以语义网络表示的 PROSPECTOR 系统,采用了主观 Bayes 方法来度量不确定性。引入两个数值(LS,LN)来作度量,LS 表现规则成立的充分性,LN 表现规则成立的必要性,这种表示既考虑了 A 的出现对 B 的支持,又考虑了 A 的不出现对 B 的影响。 4.3.1基本Bayes公式

4.3主观Bayes方法 4.3.2主观Bayes方法及其推理网络

4.3主观Bayes方法 4.3.3知识不确定性的表示 1. 对规则的不确定性度量   直接使用Bayes 公式来做度量时,在计算P(B|A)时需要已知P(A|B),为避开这个困难,提出了主观Bayes 方法。   对规则A→B的不确定性f(B,A)以(LS,LN)来描述。其中                           下面分析一下LS,LN 的意义。   先建立几率函数                  

4.3主观Bayes方法 4.3.3知识不确定性的表示 表示的是证据X的出现概率与不出现概率之比,显然随P(X)的加大O(X)也加大,而且      P(X)=0 时 O(X)=0      P(X)=1 时 O(X)=∞   这样,取值[0,1]的P(X)放大为取值[0,∞]便得O(X)。   不难验证      O(B|A)=LS·O(B)      O(B|~A)=LN·O(B)   由于  

4.3主观Bayes方法 4.3.3知识不确定性的表示 两者相比得 这就是 O(B|A)=LS·O(B)   相仿地也可得      O(B|~A)=LN·O(B) 由这两个公式可看出,LS表示A真时,对B为真的影响程度,表示规则A→B成立充分性。LN表示A假时,对B为真的影响程度,表示规则A→B成立的必要性。   

4.3主观Bayes方法 4.3.3知识不确定性的表示 几个特殊值     由LS,LN 的定义知,LS,LN均≥ 0,而且LS,LN不是独立取值的,只能出现LS>1,LN<1或LS<1,LN>1 或LS=LN=1。但不能出现两者同时>1或同时<1。   在实际系统中,LS,LN的值是由专家凭经验给出的,而不是依LS,LN的定义来计算的。

4.3主观Bayes方法 4.3.3知识不确定性的表示     由LS,LN 的定义知,LS,LN均≥ 0,而且LS,LN不是独立取值的,只能出现LS>1,LN<1或LS<1,LN>1 或LS=LN=1。但不能出现两者同时>1或同时<1。   在实际系统中,LS,LN的值是由专家凭经验给出的,而不是依LS,LN的定义来计算的。

4.3主观Bayes方法 4.3.4证据不确定性的表示 就以O(A)或P(A)表示证据A的不确定性,转换公式是

4.3主观Bayes方法 4.3.5不确定性的推理计算 (1)当A确定必出现时,可直接使用      O(B|A)=LS·O(B)      O(B|~A)=LN·O(B)   以求得使用规则A→B后,O(B)的更新值O(B/A),O(B/~A)。若需要以概率表示,再由                                    计算出P(B|A),P(B|~A)。   

4.3主观Bayes方法 4.3.5不确定性的推理计算 (2)当A是不确定的,即P(A)≠1时,需作如下考虑。   设A‘代表与A有关的所有观察,对规则A→B来说 Duda 1976年给出公式   P(B|A’)=P(B|A)·P(A|A)‘+P(B|~A)·P(~A|A’)   问题是当P(B|A‘),A→B (LS,LN)以及P(B)已知时,如何更新P(B)或说寻求P(B|A’) 。   当P(A|A‘)=1时,证据A必然出现有                                                                    不难验证这公式是成立的。

4.3主观Bayes方法 4.3.5不确定性的推理计算 (3) P( ∧ |A')=min{P( |A'),P( |A')} P(  ∧   |A')=max{P(  |A'),P(   |A')} (4) 若  →B,   →B而  ,   相互独立,对  ,   的有关观察分别为  ',   '便有                                 

4.3主观Bayes方法 4.3.6结论不确定性的合成与更新算法 结论不确定性的合成如下:

4.3主观Bayes方法 4.3.6结论不确定性的合成与更新算法 结论不确定性的更新算法如下:

4.4证据理论 Dempster 和 Shafer 提出的证据理论,可用来处理不知道所引起的不确定性。采用信任函数而不是概率作为不确定性度量,通过对一些事件的概率加以约束来建立信任函数而不必说明精确的难于获得的概率,当这种约束限制为严格的概率时,证据理论就退化为概率论了。   

4.4证据理论 1.证据的不确定性度量   若用U表示所有可能的假设集合,而U的元素间是互斥的。对任一A U,命题A表示了某些假设的集合(这样的命题间不再有互斥性)。针对医疗诊断问题, U就是所有可能疾病(假设)的集合,诊断的结果必是U中确定的元素构成的。A表示某一种(单元素)或某些种疾病。医生为了诊断所进行的各种检查就称作证据,有的证据所支持的常不只是一种疾病而是多种疾病,即U的一子集A。

4.4证据理论 2、基本概率分配函数 m:2U→[0,1]   满足 m(φ)=0       m(A)=1   m(A)表示了证据对U的子集成立的一种信任的度量,取值于[0,1],而且2U中各元素信任的总和为1,不同于Bayes 方法,因为Bayes 方法仅对U中单个元素赋予一种信任――概率。

4.4证据理论 3、信任函数      Bel:2U→[0,1]      Bel(A)= m(B)   即命题A的信任函数的值,是A的所有子集的基本概率分配函数会值的和,用来表示对A的总信任。知Bel(φ)=0,Bel(U)=1 ,单元素集上m与Bel是相等的。

4.4证据理论 4、似然函数   PI:2U→[0,1]   Pl(A)=1-Bel(~A)= m(B)   表示不否定A的信任度,是所有与A相交的子集的基本概率分配函数值的和。   显然有,0 ≤ Bel(A)≤ Pl(A)≤ 1   而Pl(A)-Bel(A)表示了既不信任A也不信任~A的一种度量,可表示对不知道的度量,用区间(Bel (A),Pl(A))来描述A的不确定性。Bel(A)表度量的下限,Pl(A)表度量的上限。实际上m,Bel,Pl只要知其一,必可求得另两个,但三个函数有不同含义。 返回目录