第7章 模糊模式识别法.

Slides:



Advertisements
Similar presentations
校园及周边治安防范 暨应急预案桌面演练 实 训 乐山应急管理学会 贾 伟. 目 录 校园治安问题包含的内容 校园治安问题的特点 避免引发校园治安问题的对策 校园应急预案桌面演练实训 校园治安问题的成因.
Advertisements

“ 上海市科研计划课题预算编制 ” 网上教程 上海市科委条财处. 经费预算表 表 1 劳务费预算明细表 表 2 购置设备预算明细表 表 3 试制设备预算明细表 表 4 材料费预算明细表 表 5 测试化验与加工费预算明细表 表 6 现有仪器设备使用费预算明细表 小于等于 20 万的项目,表 2 ~表.
“ 我不能 上学了,我 每天还要帮 家里拾柴火 呢。 ” 给远方的小学生写一封信 书信的基本格式: 开头顶格写称呼,打上冒号; 换行空两格写问候语; 接下来换行空两格写正文部分; 正文结束后,换行写祝颂语; 最后在右下方写上寄信人姓名和 写信日期。
平台的优点: ( 1 )永久免费: 学校和老师使用校讯通平台发送短信 是免费的,并且通过使用平台,可获得部分购物卡补贴。 ( 2 )移动办公: 校讯通不受时间和空间的限制,只要 有一台可以上网的电脑,老师便可以通过互联网发送短信 给家长,能够实现移动办公,节省老师的工作时间。 ( 3 )简单易用:
中醫藥就醫用藥 - 婦女篇 中醫藥安全衛生教育資源中心 中醫藥就醫用藥百分百、就是藥做到: 停、看、聽、選、用專業.
下背痛 林口長庚醫院內科 住院醫師 毛畯台. 下背痛常見原因 軟組織受傷/背部筋膜發炎 椎間盤突出症 脊椎退化性關節炎 壓迫性骨折 椎間盤滑脫 惡性腫瘤 泌尿道疾患 姿勢不良.
華德學校上午校 「協助小學中國語文科教師建立專業學習型社群」計劃 (2008) 總結分享會 二零零九年一月十日.
人的性别遗传 合肥市第四十九中学 丁 艳. 男女成对染色体排序图 1 、男性和女性各 23 对染色体有何异同 ? 哪 一对被称为性染色体 ? 2 、这两幅图中,哪幅 图显示的是男性的染色 体?哪幅图显示的是女 性染色体? 3 、图中哪条染色体是 Y 染色体?它与 X 染色体 在形态上的主要区别是.
園藝二乙 1 號 丁楷儒 32 號 孫子恩. 1. 福山萵苣 ( 大陸妹 ) : 福山萵苣,萵苣家族成員之一,鮮甜脆綠又帶有萵苣類的 特殊苦味,用來代替生菜搭配烤肉也別具風味。極少病蟲 害,只需定時澆水施肥就能健康長大,是相當容易種植又 能有大收穫的蔬菜 。 感想: 雖然大陸妹好吃又好種,但種了太多而吃不完.
开远市第一中学 2014年高考志愿填报指导会 2014年6月26日.
XX啤酒营销及广告策略.
大学生创业实践.
社交礼仪.
第四章:长期股权投资 长期股权投资效果 1、控制:50%以上 有权决定对方财务和经营.
第五单元 口语交际和作文.
損益表 原則: 收益與費用的計算,實際上是在實現或發生時所產生,與現金收付當時無關。
第八章 負債 8-1 負債之意義及內容 8-2 流動負債 8-3 長期負債 8-4 其他負債.
工业财务状况表 财务部分培训 (2010年年报).
1、一般地说,在生物的体细胞中, 和 都是成对存在的。
辨性别 A B. 辨性别 A B 第三节人类染色体与性别决定 昌邑市龙池初中 杨伟红 学习目标 1.理解人的染色体组成和传递规律。 2.解释人类性别决定的原理。 3.通过探究活动,解读数据了解生男生女的比例。
无锡商业职业技术学院 机电工程学院党总支孙蓓雄
这是一个数字的 乐园 这里埋藏着丰富的 宝藏 请跟我一起走进数学的 殿堂.
定海区渔农村集体资产 股份合作制改革工作 档案管理培训班
《中国共产党发展党员工作细则》 学习提纲 中共进贤县委组织部 宋 剑
严格发展程序,提高工作能力 黄 玉 2010年9月.
发展党员的流程和要求 党委组织部 萧炽成.
全面了解入党程序 认真履行入党手续 第一讲 主讲人:陈亭而.
中共湖北大学知行学院委员会党校 入党材料规范填写指导 学工处 李华琼 二〇一三年十二月.
云南财经大学2010年党员发展培训—— 党员发展工作培训 校党委组织部 2010年9月17日.
教育年鉴条目的撰写.
主講者 柯貞妃、張君妃、洪嫦妙、 蘇暎雅、劉妍君
莫让情感之船过早靠岸 兴庆回中 赵莉.
《老年人权益保障》 --以婚姻法.继承法为视角
行政公文写作 第七章 2004年8月 行政公文写作.
论文撰写的一般格式和要求 孟爱梅.
一元一次方程的应用 行程问题.
欢迎大家来到生命科学课堂.
初中语文总复习 说明文 阅读专题 西安市第六十七中学 潘敏.
负 债 第九章 主讲老师:潘煜双 方正为人,勤慎治学.
第三章 幼儿园课程内容的编制与选择.
清仓处理 跳楼价 满200返160 5折酬宾.
第八章 诉讼法 第一节 诉讼法概述 第二节 民事诉讼法 第三节 行政诉讼法 第四节 刑事诉讼法.
第三章  电话、电子通讯   本章重难点:     打电话的方法、         接听电话的方法。
初中《思想品德》课程改革 回顾·现状·展望
1.1.2 四 种 命 题.
高一数学 充分条件与必要条件 教育科学学院03级教育技术2班 刘文平.
色 弱 與 色 盲.
《社交礼仪分享》 阳晨牧业科技有限公司 市场中心 二O一二年四月十八日.
会议文书.
高考哲学十种主观题常见题型及分析.
宠物之家 我的宠物性别? 雌(♀) or 雄(♂) 第一阶段:我的宠物我做主 第二阶段:宠物“相亲记” 第三阶段:家族诞生
如何写入团申请书.
课标教材下教研工作的 实践与思考 山东临沂市教育科学研究中心 郭允远.
北师大版七年级数学 5.5 应用一元一次方程 ——“希望工程”义演 枣庄市第三十四中学 曹馨.
第八章二元一次方程组 8.3实际问题与二元一次方程组.
第八章二元一次方程组 8.3实际问题与二元一次方程组 (第3课时).
通 知 通知是批转下级机关的公文,转发上级机关和不相隶属机关的公文,传达要求下级机关办理和需要有关单位周知或执行的事项,任免人员时使用的公文。
海洋存亡 匹夫有责 ——让我们都来做环保小卫士 XX小学三(3)班.
第11周 工作计划.
中華民國九十七年三月二十七日 分享人:蔡新淵 (教育局工程科支援教師)
第二部分 免疫系统与免疫活性分子 第二章 免疫系统 第三章 免疫球蛋白 第二 部分 第五章 细胞因子 第四章 补体系统.
一元一次方程式的意義 一元一次方程式的解 等量公理與移項法則 自我評量.
第九章 結 帳 9-1 了解結帳的意義及功能 9-2 了解虛帳戶結清之會計處理 9-3 了解實帳戶結轉的會計處理
二元一次聯立方程式 代入消去法 加減消去法 自我評量.
認識多項式 1 多項式的加法 2 多項式的減法
第七章  事业单位支出的核算      §第一节  支出概述     §第二节  拨出款项     §第三节  各项支出     §第四节  成本费用.
中国大连高级经理学院博士后入站申请汇报 汇报人:XXX.
內部控制作業之訂定與執行 報告人:許嘉琳 日 期:
(5) (-5x)(-7x+2) =__________ (6) 7x(5x2+6x-3) = _______________ -27x2
8的乘法口诀 导入 新授 练习.
Presentation transcript:

第7章 模糊模式识别法

第7章 模糊模式识别法 7.1 模糊数学概述 7.2 模糊集合 7.3 模糊关系与模糊矩阵 7.4 模糊模式分类的直接方法 和间接方法 第7章 模糊模式识别法 7.1 模糊数学概述 7.2 模糊集合 7.3 模糊关系与模糊矩阵 7.4 模糊模式分类的直接方法 和间接方法 7.5 模糊聚类分析法

7.1 模糊数学概述 7.1.1 模糊数学的产生背景 模糊数学诞生的标志:1965年美国加利福尼亚大学控制 7.1 模糊数学概述 7.1.1 模糊数学的产生背景 模糊数学诞生的标志:1965年美国加利福尼亚大学控制 论专家L.A.Zadeh(查德)发表的文章“Fuzzy sets” 。 模糊数学(Fuzzy sets)又称模糊集合论。 1.精确数学方法及其局限性 1) 精确数学方法 忽略对象的一般特性,着重注意对象的数量、空间形式 和几何形状的数学方法。 如:牛顿力学、牛顿和莱布尼茨创立的微积分学等。

2) 近代科学的特点 (1) 理论研究方面:用精确定义的概念和严格证明的定理, 描述现实事物的数量关系和空间形式。 (2) 工程技术方面:用精确的实验方法和精确的测量计算, 探索客观世界的规律,建立严密的理论体系。 3) 精确数学方法的局限性 现实世界中的许多现象,用精确数学方法难以解决。 例如:著名的问题之一——秃头悖论 用精确数学方法判断“秃头”: 方法:首先给出一个精确的定义,然后推理,最后结论。 定义:头发根数≤n时,判决为秃头;否则判决为不秃。 即头发根数n为判断秃与不秃的界限标准。 问题:当头发根数恰好为n+1,应判决为秃还是不秃?

结论:有n根头发的是秃头,有n+1根头发的不是秃头。 均表现出精确方法在这个 问题上与常理对立的情况 推理:两种选择 (1) 承认精确方法:判定为不秃。 结论:有n根头发的是秃头,有n+1根头发的不是秃头。 ——显然不合理 (2) 承认生活常识:认为仅一根头发之差不会改变秃与不秃的 结果,即有n+1根头发者也应是秃头。 那么采用传统的逻辑推理,会得到下面的一些命题: 头发为n根者为秃头, 头发为n+1根者为秃头, 头发为n+2根者为秃头, …… 头发为n+k根者为秃头。 其中,k是一个有限整数,显然k完全可以取得很大。 结论:头发很多者为秃头。 类似地:没有头发者不是秃头

2.模糊数学的诞生 模糊数学:有关描述和处理模糊性问题的理论和方法的学科。 模糊数学的基本概念:模糊性。 1965年查德(zadeh)发表了“模糊集合”论文后,在科学界引 起了爆炸性的反映,他准确地阐述了模糊性的含义,制定了刻画 模糊性的数学方法(隶属度、隶属函数、模糊集合等),为模糊 数学作为一门独立的学科建立了必要的基础。 7.1.2 模糊性 1.模糊性的基本概念 人们在认识事物时,总是根据一定的标准对事物进行分类, 有些事物可以依据某种精确的标准对它们进行界线明确的认识, 有些事物根本无法找出精确的分类标准,例如 “秃头悖论”中的 头发根数的界线n,实际是不存在的。

1) 清晰性:事物具有的明确的类属特性(或是或非)。 2) 模糊性:事物具有的不明确类属特性(只能区别程度、等级)。 3) 模糊性的本质:是事物类属的不确定性和对象资格程度的渐 变性。 例: 类 属 实   例 界限分明 行星、整数、鸡蛋 模 糊 高山、优秀、胖子 2.与模糊性容易混淆的几个概念 1) 模糊性与近似性 ① 共同点:描述上的不精确性。 ② 区别:不精确性的根源和表现形式不同。

a) 近似性:问题本身有精确解,描述它时的不精确性源于认 识条件的局限性和认识过程发展的不充分性。 例:薄雾中观远山。 b) 模糊性:问题本身无精确解,描述的不精确性来源于对象 自身固有的性态上的不确定性。 例:观察一片秋叶。 2) 模糊性与随机性 ① 共同点:不确定性。 ② 区别:不确定性的性质不同。 a) 模糊性:表现在质的不确定性。是由于概念外延的模糊性 而呈现出的不确定性。

b) 随机性:是外在的不确定性。是由于条件不充分,导致 条件与事件之间不能出现确定的因果关系,而事物本身 的性态和类属是确定的。 例:降雨量:大雨、中雨或小雨,典型的模糊性。    投掷硬币:随机性。 c) 排中律:即事件的发生和不发生必居且仅居其一,不存在 第三种现象。随机性遵守排中律,模糊性不遵守,它存在 着多种,甚至无数种中间现象。 3、模糊性与含混性 ① 共同点:不确定性。 ② 区别:

a) 含混性:由信息不充分(二义性)引起,一个含混的命题 即是模糊的,又是二义的。一个命题是否带有含混性与其应 用对象或上下文有关。 b) 模糊性:是质的不确定性。 例:命题“张三很高” :对给张三购买什么型号的衣服这个应用对象是含混的。 也是一个模糊性命题。 总之,模糊性:由本质决定。 其 它:由外界条件带来的不确定性引起。

7.1.3 模糊数学在模式识别领域的应用   模式识别从模糊数学诞生开始就是模糊技术应用研究 的一个活跃领域,研究内容涉及:计算机图像识别、手书 文字自动识别、癌细胞识别、白血球的识别与分类、疾病 预报、各类信息的分类等。 研究方法: * 针对一些模糊识别问题设计相应的模糊模式识别系统。 *用模糊数学对传统模式识别中的一些方法进行改进。

7.2 模糊集合 7.2.1 模糊集合定义 1. 经典集合论中几个概念 传统经典集合论中的集合称为: 经典集合、普通集合、确定集合、脆集合。 7.2  模糊集合 7.2.1 模糊集合定义 1. 经典集合论中几个概念 传统经典集合论中的集合称为: 经典集合、普通集合、确定集合、脆集合。 1)论域   讨论集合前给出的所研究对象的范围。选取一般不唯一, 根据具体研究的需要而定。 2)子集 对于任意两个集合A、B,若A的每一个元素都是B的元素, 则称A是B的“子集”,记为       ;若B中存在不属于 A的元素,则称A是B的“真子集”,记为      。

3)幂集 对于一个集合A,由其所有子集作为元素构成的集合称 为A的“幂集”。 例:论域X={ 1, 2 },其幂集为 2.模糊集合的定义 给定论域X上的一个模糊子集 ,是指:对于任意 x∈X , 都确定了一个数 ,称 为 x 对 的隶属度,且 。 映射 : 叫做 的隶属函数,或从属函数。模糊子集常称为模糊集合 或模糊集。

说明:

3.相关的几个概念 即:是隶属度为1的元素组成的经典集合。 正规模糊集:模糊集合的核是非空的; 非正规模糊集:模糊集合的核是空的。

4.模糊集合的表示 有多种表示方法:要求表现出论域中所有元素与其对应的隶属 度之间的关系。 查德的求和表示法和积分表示法: 1)求和表示法: —— 适用于离散域论域。 2)积分表示法: ——适合于任何种类的论域, 特别是连续论域。

常用的模糊集合表示方法: 注:当某一元素的隶属函数为0时,这一项可以不计入。

② X是一个连续的实数区间,模糊集合表示为

7.2.2 隶属函数的确定 隶属函数是模糊集合赖以存在的基石。正确地确定隶属函 数是利用模糊集合恰当地定量表示模糊概念的基础。 常用的形式: S型函数:从0到1单调增长。 型函数:中间高两边低的函数。 隶属函数的确定: 目前很难找到统一的途径。 构造一个概念的隶属函数时,结果不唯一 。 几种隶属函数的构造与确定方法: 1.简单正规模糊集合隶属函数的构成

隶属函数的构成: 方法: 1)假定: 并确定 , ,有

2. 模糊统计法:利用模糊统计的方法确定隶属函数。 模糊统计试验四要素: 1)论域X,例如人的集合; 2)X中的一个元素x0,例如王平; 3)X中的一个边界可变的普通集合A,例如“高个子”; 4)条件s,制约着A边界的改变。 方法: 每次试验下,对x0是否属于A做出一个确定的判断, 有 随着n的增大,隶属频率呈现稳定性,所在的稳定值叫隶属度。

3. 二元对比排序法 从两种事物的对比中,做出对某一概念符合程度的判断。 是区别事物的一种重要方法。 缺点: 往往不满足数学上对“序”的要求,不具有传递性,出现循环现象。 1)择优比较法 例7.4 求茶花、月季、牡丹、梅花、荷花对“好看的花”的隶 属度。 方法: 10名试验者逐次对两种花作对比,优胜花得1分,失败 者0分。

表7.1 一位测试者的二元对比结果 失败 优胜 茶花 月季 牡丹 梅花 荷花 得分 1 2 3 4 表7.2 五种花对“好看的花”的隶属度 名 称 总 得 分 隶 属 度 茶 花 23 0.23 月 季 18 0.18 牡 丹 20 0.20 梅 花 15 0.15 荷 花 24 0.24

2)优先关系定序法

x3为第一优越元素。除去x3得新的优先关系矩阵。 按x3,x1,x2顺序赋予相应的隶属度。 3)相对比较法 4)对比平均法

4. 推理法 根据不同的数学物理知识,设计隶属度函数,然后在实践 中检验调整。 一般以成功的实例进行借鉴。 例7.6 笔划类型的隶属函数的确定 根据笔划与水平线的交角确定隶属函数。

例7.7 手写体字符U和V的区别。 解:用包含的面积与三角形面积作比较。

例7.8 封闭曲线的圆度。 表征圆度的隶属函数: 5. 专家评分法 难免引入个人的主观成份,但对某些难以用上述几种方法 实现的应用来说,仍不失为一种办法。

7.2.3 模糊集合的运算 1. 基本运算 两个模糊子集间的运算: 逐点对隶属函数作相应的运算,得到新的隶属函数。 在此过程中,论域保持不变。

2. 运算的基本性质

7.2.4 模糊集合与普通集合的相互转化 截集是联系普通集合与模糊集合的桥梁,它们使模糊集合 论中的问题转化为普通集合论的问题来解。 截 集 模糊集合 普通集合

根据医生的经验,可将各温度段用“发烧”的隶属度表示如下: T>39.0℃——隶属度=1.0 38.5℃≤ T<39.0℃——隶属度=0.9 38.0℃≤ T<38.5℃——隶属度=0.7 37.0℃≤ T<38.0℃——隶属度=0.4 T<37.0℃——隶属度=0.0

2. 截集的三个性质

7.3 模糊关系与模糊矩阵 普通关系:二值的,存在或者不存在关系, 两者必居且仅居其一。 模糊关系:需要用描述关系程度的量补充描述, 7.3 模糊关系与模糊矩阵 普通关系:二值的,存在或者不存在关系, 两者必居且仅居其一。 模糊关系:需要用描述关系程度的量补充描述, 关系程度通过隶属度表示。 7.3.1 模糊关系定义 1.基本概念 设X、Y是两个论域, 笛卡尔积: 又称直积。 —— 由两个集合间元素无约束地搭配成的序偶(x,y)的全体构成的集合。

如果: 给无约束搭配施以某种约束 体现了一种特殊关系 接受约束的元素对便构成笛卡尔集中的一个子集 子集表现了一种关系 序偶中两个元素的排列是有序的: 普通集合论: X到Y的一个关系,定义为X×Y的一个子集R,记作 模糊关系的定义类似。

2.模糊关系定义

7.3.2 模糊关系的表示 1.用模糊矩阵表示 如:例7.11中的模糊 关系对应的模糊矩阵

2.用有向图表示 有向图表示:

7.3.3 模糊关系的建立 计算 第一步:正规化。 极值标准化公式:

计算rij的常用方法: 1)欧式距离法 2)数量积法 M:正数,满足

3)相关系数法 其中, 4)最大最小法 5)主观评定法 以百分制打分,然后除以100,得[0,1]区间的一个数。

7.3.4 模糊关系和模糊矩阵的运算 1.并、交、补运算 1)模糊关系的并、交、补运算

模糊关系并、交、补运算分别与模糊矩阵并、交、补运算对应。 模糊关系和模糊矩阵的运算实际上就是隶属度的运算。 2)模糊矩阵的并、交、补运算 模糊关系并、交、补运算分别与模糊矩阵并、交、补运算对应。 模糊关系和模糊矩阵的运算实际上就是隶属度的运算。

求:a) 关系“x比y高或比y胖”; b) 关系“与y相比,x又高又胖”; c) 关系“x没y高”。

解:

2.模糊关系的倒置与模糊矩阵的转置

例7.15 模糊关系 = “x比y高” 对应的模糊矩阵 = “y比x低” 对应的模糊矩阵

3.截矩阵与截关系

4. 模糊关系合成与模糊矩阵合成 1)模糊关系合成 幂运算:模糊关系与自身的运算,即:

2)模糊矩阵合成 类似 对比 对有限论域: 普通矩阵乘法运算 模糊矩阵乘积运算 加法 求大 乘法 求小

,求Q对R的合成矩阵。

7.3.5 模糊关系的三大性质 1.自反性 例:关系“等于”—— 关系“了解”—— 具有自反性, 不具有自反性。 2. 对称性

b) S只有对称性,无自反性。 3. 传递性

说明:

例:“个子高”—— “认 识”—— 具有传递性, 不具有传递性。 例7.19 判断 是否是传递模糊矩阵。 解: ? ∴ R是一个传递模糊矩阵。

4. 模糊等价关系和模糊相似关系 定义:

7.4 模糊模式分类的直接方法和间接方法 7.4.1 直接方法——隶属原则 直接计算样品的隶属度,根据隶属度最大原则进行分类。 7.4 模糊模式分类的直接方法和间接方法 7.4.1 直接方法——隶属原则 直接计算样品的隶属度,根据隶属度最大原则进行分类。 —— 用于单个模式的识别 隶属原则:

隶属原则是显然的,易于公认的,但其分类效果如果, 十分依赖于建立已知模式类隶属函数的技巧。

中: 青: 现有45岁、30岁、65岁、21岁各一人,问应分别属于哪一类?

∴ 属于老年人。 中年 老年 青年 年龄(岁) 1 0.5 45 100 20 70

例7.21 染色体识别或白血球分类问题。这类问题最终归结为识别三角形。即判断一个三角形属于“等腰三角形(I)、直角三角形(R)、等腰直角三角形(IR)、正三角形(E)、其他三角形(T)”中的哪一种。

7.4.2 间接方法——择近原则 求模糊集合之间接近程度的问题。 —— 适合于模糊集

1.模糊集合间的距离 聚类分析中 两向量间的明氏距离

两种常用的绝对距离公式: 街坊距离 欧氏距离 其他:相对距离、加权距离

描述了两个较“接近”的模糊集合的贴近度也较大 2. 贴近度 说明两个相同的模糊集的贴近度最大 要求贴近度映射具有对称性 描述了两个较“接近”的模糊集合的贴近度也较大 模糊集合贴近度的具体形式不唯一。

两种常用贴近度 :

2)格贴近度 内积、外积分别定义为

3. 择近原则

7.5 模糊聚类分析法 7.5.1 基于模式糊等价关系的聚类分析法 称为:截矩阵分类法 只有模糊等价关系才能用模糊等价矩阵进行截矩阵分类。 7.5 模糊聚类分析法 7.5.1 基于模式糊等价关系的聚类分析法 称为:截矩阵分类法 只有模糊等价关系才能用模糊等价矩阵进行截矩阵分类。 包括: * 对于模糊等价关系: 可以用模糊等价矩阵的截矩阵直接进行模式分类。 * 对模糊相似关系: 必须由相应的模糊相似矩阵生成模糊等价矩阵,然后对 生成的等价矩阵利用截矩阵的办法分类。 1.模糊等价关系的截矩阵分类法

要求按不同λ水平分类。

动态聚类图:

2.模糊相似关系的截矩阵分类法 必须用模糊相似矩阵生成一个模糊等价矩阵。 直接用模糊相似关系进行分类出现的问题: 例:设有五种矿石,按其颜色、比重等性质得出描述其“相似 程度”的模糊关系矩阵如下:

(1)判断是什么矩阵: 矩阵R的自反性、对称性是明显的,计算传递性: 产生矛盾。

给定一个模糊相似矩阵就可以得到一个模糊等价矩阵。

7.5.2 模糊相似关系直接用于分类 对于模糊相似关系,需要改造成为模糊等价关系,才能 利用截矩阵的方法进行正确分类。但多次矩阵相乘,计算麻 烦。为此寻找由模糊相似矩阵直接进行聚类的方法,如最大树法。 最大树法:

例7.25 设二个家庭,每家3-5人,选每个人的一张照片,共8张,混放在一起,将照片两两对照,得出描述其“相似程度” 的模糊关系矩阵。要求按相似程度聚类,希望把二个家庭分开。

解:(1) 按模糊相似矩阵,画出被分类的元素集,构造“最大树”。 当全部连通时,检查一下全部元素是否都已出现,即保证所有元素都 是连通的。最大树即构造好。 4 0.2 7 0.8 0.8 0.4 2 5 0.4 0.8 0.2 6 0.5 0.5 回路不画 3 1 0.8 8 0.2

0.2 0.4 0.5 0.8 4 6 2 8 7 5 3 1 回路不画 0.2 0.5 0.8 4 6 2 8 7 5 3 1

0.2 0.5 0.8 4 6 2 8 7 5 3 1

0.2 0.5 0.8 4 6 2 8 7 5 3 1 注意:最大树不唯一,但取截集后,所得子树相同。

7.5.3 模糊K-均值算法 由聚类分析中动态聚类法中的K-均值算法派生出来。 K-均值算法回顾: ①任选K个聚类中心; ②按最近邻规则聚类; ③根据聚类结果计算新的聚类中心, 比较新旧聚类中心是否相等; ④新旧中心相等,结束;否则回到②。 模糊K-均值算法基本思想: 首先设定一些类及每个样本对各类的隶属度; 然后通过迭代,不断调整隶属度至收敛。

步骤: (1) 确定模式类数K,1<K<N,N为样本个数。

加权平均 例如,3个样本时: !

例当有两个聚类中心时,样本j对两个类别隶属度的计算: 类似于相对距离 例当有两个聚类中心时,样本j对两个类别隶属度的计算:

例:

由U(0)可知,倾向于X1、X2、X3为一类,X4为一类。

如对X3有: 得

类似地,可得到U(1)中其它元素,有

7.5.4 模糊ISODATA算法 ISODATA算法:源于K-均值算法。 ISODATA算法特点:具有类别调整功能。 合并、分解等操作使聚类过程中类别数可变。 ISODATA算法的核心:类别调整。 模糊ISODATA算法:将模糊方法引入ISODATA算法。 算法步骤: (1) 选择初始聚类中心。 例如:将全体样本均值作为第一个聚类中心,在所有n个特征 方向上加、减一个均方差。 —— 共(2n+1)个聚类中心

(2) 若已选择了K个初始聚类中心,用模糊K-均值算法进行聚类。 由于现在得到的是各聚类中心,所以直接计算下一步的隶 属度矩阵U(1) ,……继续K-均值算法直到收敛,最终得到隶属度矩阵U和K个聚类中心。 (3) 类别调整:合并 、分解 、删除。 (4) 最佳类数或最佳结果的讨论。 判定结果好坏的直接依据:隶属度矩阵U。 由于计算机存储量的限制,选取了三个评价分类优劣的判据: ① 最大稳定度 ② 最小相关度 ③ 最大聚类度