第7章 模糊模式识别法
第7章 模糊模式识别法 7.1 模糊数学概述 7.2 模糊集合 7.3 模糊关系与模糊矩阵 7.4 模糊模式分类的直接方法 和间接方法 第7章 模糊模式识别法 7.1 模糊数学概述 7.2 模糊集合 7.3 模糊关系与模糊矩阵 7.4 模糊模式分类的直接方法 和间接方法 7.5 模糊聚类分析法
7.1 模糊数学概述 7.1.1 模糊数学的产生背景 模糊数学诞生的标志:1965年美国加利福尼亚大学控制 7.1 模糊数学概述 7.1.1 模糊数学的产生背景 模糊数学诞生的标志:1965年美国加利福尼亚大学控制 论专家L.A.Zadeh(查德)发表的文章“Fuzzy sets” 。 模糊数学(Fuzzy sets)又称模糊集合论。 1.精确数学方法及其局限性 1) 精确数学方法 忽略对象的一般特性,着重注意对象的数量、空间形式 和几何形状的数学方法。 如:牛顿力学、牛顿和莱布尼茨创立的微积分学等。
2) 近代科学的特点 (1) 理论研究方面:用精确定义的概念和严格证明的定理, 描述现实事物的数量关系和空间形式。 (2) 工程技术方面:用精确的实验方法和精确的测量计算, 探索客观世界的规律,建立严密的理论体系。 3) 精确数学方法的局限性 现实世界中的许多现象,用精确数学方法难以解决。 例如:著名的问题之一——秃头悖论 用精确数学方法判断“秃头”: 方法:首先给出一个精确的定义,然后推理,最后结论。 定义:头发根数≤n时,判决为秃头;否则判决为不秃。 即头发根数n为判断秃与不秃的界限标准。 问题:当头发根数恰好为n+1,应判决为秃还是不秃?
结论:有n根头发的是秃头,有n+1根头发的不是秃头。 均表现出精确方法在这个 问题上与常理对立的情况 推理:两种选择 (1) 承认精确方法:判定为不秃。 结论:有n根头发的是秃头,有n+1根头发的不是秃头。 ——显然不合理 (2) 承认生活常识:认为仅一根头发之差不会改变秃与不秃的 结果,即有n+1根头发者也应是秃头。 那么采用传统的逻辑推理,会得到下面的一些命题: 头发为n根者为秃头, 头发为n+1根者为秃头, 头发为n+2根者为秃头, …… 头发为n+k根者为秃头。 其中,k是一个有限整数,显然k完全可以取得很大。 结论:头发很多者为秃头。 类似地:没有头发者不是秃头
2.模糊数学的诞生 模糊数学:有关描述和处理模糊性问题的理论和方法的学科。 模糊数学的基本概念:模糊性。 1965年查德(zadeh)发表了“模糊集合”论文后,在科学界引 起了爆炸性的反映,他准确地阐述了模糊性的含义,制定了刻画 模糊性的数学方法(隶属度、隶属函数、模糊集合等),为模糊 数学作为一门独立的学科建立了必要的基础。 7.1.2 模糊性 1.模糊性的基本概念 人们在认识事物时,总是根据一定的标准对事物进行分类, 有些事物可以依据某种精确的标准对它们进行界线明确的认识, 有些事物根本无法找出精确的分类标准,例如 “秃头悖论”中的 头发根数的界线n,实际是不存在的。
1) 清晰性:事物具有的明确的类属特性(或是或非)。 2) 模糊性:事物具有的不明确类属特性(只能区别程度、等级)。 3) 模糊性的本质:是事物类属的不确定性和对象资格程度的渐 变性。 例: 类 属 实 例 界限分明 行星、整数、鸡蛋 模 糊 高山、优秀、胖子 2.与模糊性容易混淆的几个概念 1) 模糊性与近似性 ① 共同点:描述上的不精确性。 ② 区别:不精确性的根源和表现形式不同。
a) 近似性:问题本身有精确解,描述它时的不精确性源于认 识条件的局限性和认识过程发展的不充分性。 例:薄雾中观远山。 b) 模糊性:问题本身无精确解,描述的不精确性来源于对象 自身固有的性态上的不确定性。 例:观察一片秋叶。 2) 模糊性与随机性 ① 共同点:不确定性。 ② 区别:不确定性的性质不同。 a) 模糊性:表现在质的不确定性。是由于概念外延的模糊性 而呈现出的不确定性。
b) 随机性:是外在的不确定性。是由于条件不充分,导致 条件与事件之间不能出现确定的因果关系,而事物本身 的性态和类属是确定的。 例:降雨量:大雨、中雨或小雨,典型的模糊性。 投掷硬币:随机性。 c) 排中律:即事件的发生和不发生必居且仅居其一,不存在 第三种现象。随机性遵守排中律,模糊性不遵守,它存在 着多种,甚至无数种中间现象。 3、模糊性与含混性 ① 共同点:不确定性。 ② 区别:
a) 含混性:由信息不充分(二义性)引起,一个含混的命题 即是模糊的,又是二义的。一个命题是否带有含混性与其应 用对象或上下文有关。 b) 模糊性:是质的不确定性。 例:命题“张三很高” :对给张三购买什么型号的衣服这个应用对象是含混的。 也是一个模糊性命题。 总之,模糊性:由本质决定。 其 它:由外界条件带来的不确定性引起。
7.1.3 模糊数学在模式识别领域的应用 模式识别从模糊数学诞生开始就是模糊技术应用研究 的一个活跃领域,研究内容涉及:计算机图像识别、手书 文字自动识别、癌细胞识别、白血球的识别与分类、疾病 预报、各类信息的分类等。 研究方法: * 针对一些模糊识别问题设计相应的模糊模式识别系统。 *用模糊数学对传统模式识别中的一些方法进行改进。
7.2 模糊集合 7.2.1 模糊集合定义 1. 经典集合论中几个概念 传统经典集合论中的集合称为: 经典集合、普通集合、确定集合、脆集合。 7.2 模糊集合 7.2.1 模糊集合定义 1. 经典集合论中几个概念 传统经典集合论中的集合称为: 经典集合、普通集合、确定集合、脆集合。 1)论域 讨论集合前给出的所研究对象的范围。选取一般不唯一, 根据具体研究的需要而定。 2)子集 对于任意两个集合A、B,若A的每一个元素都是B的元素, 则称A是B的“子集”,记为 ;若B中存在不属于 A的元素,则称A是B的“真子集”,记为 。
3)幂集 对于一个集合A,由其所有子集作为元素构成的集合称 为A的“幂集”。 例:论域X={ 1, 2 },其幂集为 2.模糊集合的定义 给定论域X上的一个模糊子集 ,是指:对于任意 x∈X , 都确定了一个数 ,称 为 x 对 的隶属度,且 。 映射 : 叫做 的隶属函数,或从属函数。模糊子集常称为模糊集合 或模糊集。
说明:
3.相关的几个概念 即:是隶属度为1的元素组成的经典集合。 正规模糊集:模糊集合的核是非空的; 非正规模糊集:模糊集合的核是空的。
4.模糊集合的表示 有多种表示方法:要求表现出论域中所有元素与其对应的隶属 度之间的关系。 查德的求和表示法和积分表示法: 1)求和表示法: —— 适用于离散域论域。 2)积分表示法: ——适合于任何种类的论域, 特别是连续论域。
常用的模糊集合表示方法: 注:当某一元素的隶属函数为0时,这一项可以不计入。
② X是一个连续的实数区间,模糊集合表示为
7.2.2 隶属函数的确定 隶属函数是模糊集合赖以存在的基石。正确地确定隶属函 数是利用模糊集合恰当地定量表示模糊概念的基础。 常用的形式: S型函数:从0到1单调增长。 型函数:中间高两边低的函数。 隶属函数的确定: 目前很难找到统一的途径。 构造一个概念的隶属函数时,结果不唯一 。 几种隶属函数的构造与确定方法: 1.简单正规模糊集合隶属函数的构成
隶属函数的构成: 方法: 1)假定: 并确定 , ,有
2. 模糊统计法:利用模糊统计的方法确定隶属函数。 模糊统计试验四要素: 1)论域X,例如人的集合; 2)X中的一个元素x0,例如王平; 3)X中的一个边界可变的普通集合A,例如“高个子”; 4)条件s,制约着A边界的改变。 方法: 每次试验下,对x0是否属于A做出一个确定的判断, 有 随着n的增大,隶属频率呈现稳定性,所在的稳定值叫隶属度。
3. 二元对比排序法 从两种事物的对比中,做出对某一概念符合程度的判断。 是区别事物的一种重要方法。 缺点: 往往不满足数学上对“序”的要求,不具有传递性,出现循环现象。 1)择优比较法 例7.4 求茶花、月季、牡丹、梅花、荷花对“好看的花”的隶 属度。 方法: 10名试验者逐次对两种花作对比,优胜花得1分,失败 者0分。
表7.1 一位测试者的二元对比结果 失败 优胜 茶花 月季 牡丹 梅花 荷花 得分 1 2 3 4 表7.2 五种花对“好看的花”的隶属度 名 称 总 得 分 隶 属 度 茶 花 23 0.23 月 季 18 0.18 牡 丹 20 0.20 梅 花 15 0.15 荷 花 24 0.24
2)优先关系定序法
x3为第一优越元素。除去x3得新的优先关系矩阵。 按x3,x1,x2顺序赋予相应的隶属度。 3)相对比较法 4)对比平均法
4. 推理法 根据不同的数学物理知识,设计隶属度函数,然后在实践 中检验调整。 一般以成功的实例进行借鉴。 例7.6 笔划类型的隶属函数的确定 根据笔划与水平线的交角确定隶属函数。
例7.7 手写体字符U和V的区别。 解:用包含的面积与三角形面积作比较。
例7.8 封闭曲线的圆度。 表征圆度的隶属函数: 5. 专家评分法 难免引入个人的主观成份,但对某些难以用上述几种方法 实现的应用来说,仍不失为一种办法。
7.2.3 模糊集合的运算 1. 基本运算 两个模糊子集间的运算: 逐点对隶属函数作相应的运算,得到新的隶属函数。 在此过程中,论域保持不变。
2. 运算的基本性质
7.2.4 模糊集合与普通集合的相互转化 截集是联系普通集合与模糊集合的桥梁,它们使模糊集合 论中的问题转化为普通集合论的问题来解。 截 集 模糊集合 普通集合
根据医生的经验,可将各温度段用“发烧”的隶属度表示如下: T>39.0℃——隶属度=1.0 38.5℃≤ T<39.0℃——隶属度=0.9 38.0℃≤ T<38.5℃——隶属度=0.7 37.0℃≤ T<38.0℃——隶属度=0.4 T<37.0℃——隶属度=0.0
2. 截集的三个性质
7.3 模糊关系与模糊矩阵 普通关系:二值的,存在或者不存在关系, 两者必居且仅居其一。 模糊关系:需要用描述关系程度的量补充描述, 7.3 模糊关系与模糊矩阵 普通关系:二值的,存在或者不存在关系, 两者必居且仅居其一。 模糊关系:需要用描述关系程度的量补充描述, 关系程度通过隶属度表示。 7.3.1 模糊关系定义 1.基本概念 设X、Y是两个论域, 笛卡尔积: 又称直积。 —— 由两个集合间元素无约束地搭配成的序偶(x,y)的全体构成的集合。
如果: 给无约束搭配施以某种约束 体现了一种特殊关系 接受约束的元素对便构成笛卡尔集中的一个子集 子集表现了一种关系 序偶中两个元素的排列是有序的: 普通集合论: X到Y的一个关系,定义为X×Y的一个子集R,记作 模糊关系的定义类似。
2.模糊关系定义
7.3.2 模糊关系的表示 1.用模糊矩阵表示 如:例7.11中的模糊 关系对应的模糊矩阵
2.用有向图表示 有向图表示:
7.3.3 模糊关系的建立 计算 第一步:正规化。 极值标准化公式:
计算rij的常用方法: 1)欧式距离法 2)数量积法 M:正数,满足
3)相关系数法 其中, 4)最大最小法 5)主观评定法 以百分制打分,然后除以100,得[0,1]区间的一个数。
7.3.4 模糊关系和模糊矩阵的运算 1.并、交、补运算 1)模糊关系的并、交、补运算
模糊关系并、交、补运算分别与模糊矩阵并、交、补运算对应。 模糊关系和模糊矩阵的运算实际上就是隶属度的运算。 2)模糊矩阵的并、交、补运算 模糊关系并、交、补运算分别与模糊矩阵并、交、补运算对应。 模糊关系和模糊矩阵的运算实际上就是隶属度的运算。
求:a) 关系“x比y高或比y胖”; b) 关系“与y相比,x又高又胖”; c) 关系“x没y高”。
解:
2.模糊关系的倒置与模糊矩阵的转置
例7.15 模糊关系 = “x比y高” 对应的模糊矩阵 = “y比x低” 对应的模糊矩阵
3.截矩阵与截关系
4. 模糊关系合成与模糊矩阵合成 1)模糊关系合成 幂运算:模糊关系与自身的运算,即:
2)模糊矩阵合成 类似 对比 对有限论域: 普通矩阵乘法运算 模糊矩阵乘积运算 加法 求大 乘法 求小
,求Q对R的合成矩阵。
7.3.5 模糊关系的三大性质 1.自反性 例:关系“等于”—— 关系“了解”—— 具有自反性, 不具有自反性。 2. 对称性
b) S只有对称性,无自反性。 3. 传递性
说明:
例:“个子高”—— “认 识”—— 具有传递性, 不具有传递性。 例7.19 判断 是否是传递模糊矩阵。 解: ? ∴ R是一个传递模糊矩阵。
4. 模糊等价关系和模糊相似关系 定义:
7.4 模糊模式分类的直接方法和间接方法 7.4.1 直接方法——隶属原则 直接计算样品的隶属度,根据隶属度最大原则进行分类。 7.4 模糊模式分类的直接方法和间接方法 7.4.1 直接方法——隶属原则 直接计算样品的隶属度,根据隶属度最大原则进行分类。 —— 用于单个模式的识别 隶属原则:
隶属原则是显然的,易于公认的,但其分类效果如果, 十分依赖于建立已知模式类隶属函数的技巧。
中: 青: 现有45岁、30岁、65岁、21岁各一人,问应分别属于哪一类?
∴ 属于老年人。 中年 老年 青年 年龄(岁) 1 0.5 45 100 20 70
例7.21 染色体识别或白血球分类问题。这类问题最终归结为识别三角形。即判断一个三角形属于“等腰三角形(I)、直角三角形(R)、等腰直角三角形(IR)、正三角形(E)、其他三角形(T)”中的哪一种。
7.4.2 间接方法——择近原则 求模糊集合之间接近程度的问题。 —— 适合于模糊集
1.模糊集合间的距离 聚类分析中 两向量间的明氏距离
两种常用的绝对距离公式: 街坊距离 欧氏距离 其他:相对距离、加权距离
描述了两个较“接近”的模糊集合的贴近度也较大 2. 贴近度 说明两个相同的模糊集的贴近度最大 要求贴近度映射具有对称性 描述了两个较“接近”的模糊集合的贴近度也较大 模糊集合贴近度的具体形式不唯一。
两种常用贴近度 :
2)格贴近度 内积、外积分别定义为
3. 择近原则
7.5 模糊聚类分析法 7.5.1 基于模式糊等价关系的聚类分析法 称为:截矩阵分类法 只有模糊等价关系才能用模糊等价矩阵进行截矩阵分类。 7.5 模糊聚类分析法 7.5.1 基于模式糊等价关系的聚类分析法 称为:截矩阵分类法 只有模糊等价关系才能用模糊等价矩阵进行截矩阵分类。 包括: * 对于模糊等价关系: 可以用模糊等价矩阵的截矩阵直接进行模式分类。 * 对模糊相似关系: 必须由相应的模糊相似矩阵生成模糊等价矩阵,然后对 生成的等价矩阵利用截矩阵的办法分类。 1.模糊等价关系的截矩阵分类法
要求按不同λ水平分类。
动态聚类图:
2.模糊相似关系的截矩阵分类法 必须用模糊相似矩阵生成一个模糊等价矩阵。 直接用模糊相似关系进行分类出现的问题: 例:设有五种矿石,按其颜色、比重等性质得出描述其“相似 程度”的模糊关系矩阵如下:
(1)判断是什么矩阵: 矩阵R的自反性、对称性是明显的,计算传递性: 产生矛盾。
给定一个模糊相似矩阵就可以得到一个模糊等价矩阵。
7.5.2 模糊相似关系直接用于分类 对于模糊相似关系,需要改造成为模糊等价关系,才能 利用截矩阵的方法进行正确分类。但多次矩阵相乘,计算麻 烦。为此寻找由模糊相似矩阵直接进行聚类的方法,如最大树法。 最大树法:
例7.25 设二个家庭,每家3-5人,选每个人的一张照片,共8张,混放在一起,将照片两两对照,得出描述其“相似程度” 的模糊关系矩阵。要求按相似程度聚类,希望把二个家庭分开。
解:(1) 按模糊相似矩阵,画出被分类的元素集,构造“最大树”。 当全部连通时,检查一下全部元素是否都已出现,即保证所有元素都 是连通的。最大树即构造好。 4 0.2 7 0.8 0.8 0.4 2 5 0.4 0.8 0.2 6 0.5 0.5 回路不画 3 1 0.8 8 0.2
0.2 0.4 0.5 0.8 4 6 2 8 7 5 3 1 回路不画 0.2 0.5 0.8 4 6 2 8 7 5 3 1
0.2 0.5 0.8 4 6 2 8 7 5 3 1
0.2 0.5 0.8 4 6 2 8 7 5 3 1 注意:最大树不唯一,但取截集后,所得子树相同。
7.5.3 模糊K-均值算法 由聚类分析中动态聚类法中的K-均值算法派生出来。 K-均值算法回顾: ①任选K个聚类中心; ②按最近邻规则聚类; ③根据聚类结果计算新的聚类中心, 比较新旧聚类中心是否相等; ④新旧中心相等,结束;否则回到②。 模糊K-均值算法基本思想: 首先设定一些类及每个样本对各类的隶属度; 然后通过迭代,不断调整隶属度至收敛。
步骤: (1) 确定模式类数K,1<K<N,N为样本个数。
加权平均 例如,3个样本时: !
例当有两个聚类中心时,样本j对两个类别隶属度的计算: 类似于相对距离 例当有两个聚类中心时,样本j对两个类别隶属度的计算:
例:
由U(0)可知,倾向于X1、X2、X3为一类,X4为一类。
如对X3有: 得
类似地,可得到U(1)中其它元素,有
7.5.4 模糊ISODATA算法 ISODATA算法:源于K-均值算法。 ISODATA算法特点:具有类别调整功能。 合并、分解等操作使聚类过程中类别数可变。 ISODATA算法的核心:类别调整。 模糊ISODATA算法:将模糊方法引入ISODATA算法。 算法步骤: (1) 选择初始聚类中心。 例如:将全体样本均值作为第一个聚类中心,在所有n个特征 方向上加、减一个均方差。 —— 共(2n+1)个聚类中心
(2) 若已选择了K个初始聚类中心,用模糊K-均值算法进行聚类。 由于现在得到的是各聚类中心,所以直接计算下一步的隶 属度矩阵U(1) ,……继续K-均值算法直到收敛,最终得到隶属度矩阵U和K个聚类中心。 (3) 类别调整:合并 、分解 、删除。 (4) 最佳类数或最佳结果的讨论。 判定结果好坏的直接依据:隶属度矩阵U。 由于计算机存储量的限制,选取了三个评价分类优劣的判据: ① 最大稳定度 ② 最小相关度 ③ 最大聚类度