神经信息学 自组织网络 ——自组织映射 史忠植 shizz@ics.ict.ac.cn 中科院计算所 2019/2/2.

Slides:



Advertisements
Similar presentations
Chapter 2 Combinatorial Analysis 主講人 : 虞台文. Content Basic Procedure for Probability Calculation Counting – Ordered Samples with Replacement – Ordered.
Advertisements

办公室保健指南. 减少辐射篇 ❤显示器散发出的辐射多数不是来自它的正面,而是侧面和后面。因此,不要 把自己显示器的后面对着同事的后脑或者身体的侧面。 ❤常喝绿茶。茶叶中含有的茶多酚等活性物质,有助吸收放射性物质。 ❤尽量使用液晶显示器。
湘雅路街道 刘韬 2014 年 4 月 微时代 · 新挑战. 什么是微时代 : 微时代即以微博、微信 等作为传播媒介代表,以短 小精炼作为文化传播特征的 时代。 开福区湘雅路街道工委 微博:微型博客的简称,即一句话 博客,是一种通过关注机制分享简 短实时信息的广播式的社交网络平 台。 微信:是腾讯公司于.
1 門市服務丙級技術士 技能檢定介紹 門市服務丙級技術士報告注意事項 證照名稱:門市服務丙級技術士 發照單位:行政院勞工委員會 有效期限:終生有效 考照時間:每年一次,皆為第一梯次 1. 簡章與報名書表發售時間:每年 1 月 2. 報名時間:每年 1 月。 3. 學科考試時間:每年 3.
魏 饴. 处级干部培训班讲座 一、卓越干部的德行素质  常修为政之德、常思贪欲之害、常怀律己之心!  孔老夫子有个观点 “ 为政以德,譬如北辰居其所而众星拱之。 ”  司马光《资治通鉴》 “ 才者,德之资也;德者,才之帅也。 ” “ 德 ” 胜 “ 才 ” 谓之 “ 君子 ” , “ 才 ”
一、真愛密碼 二、尋求真愛 三、有自尊的愛. 。如果雙方對愛情產生 質疑、困惑時,則表示 彼此之間的愛情關係仍 有 待加強或釐清,千萬別 急著為自己的人生大事 下決定。 我是一個 16 歲的未婚媽媽,發現自 己懷孕時,已經五個月大了,我知 道自己沒能力照顧孩子,在驚訝之 於,大人們只好坦然接受,幫我找.
大地遊戲王 課程實錄.
生源地助学贷款系统还款功能优化说明 评审三局 2015年5月.
回归教材、梳理知识、突出能力 ——2015年历史二轮复习思考 李树全 西安市第八十九中学.
加強水銀體溫計稽查管制及回收 回收作業須知及緊急應變措施
二、信用工具和外汇.
第4章 分錄及日記簿 4-1 借貸法則 4-2 日記簿的格式及記錄方法 4-3 分錄的意義及記錄方法 4-4 常見分錄題型分析
为您扬帆,助您远航! 徽商银行特色新产品介绍. 为您扬帆,助您远航! 徽商银行特色新产品介绍.
最新消息插播! 意見反應: 我是貴校學生的家長,請問貴校該給工讀生的薪水何時才肯發呢?現在已經是十一月中了,九月十月的薪水還沒入帳我們不知道是卡在哪個環節,但貴校是否知道有多少同學需要這筆錢去過生活、繳納房租? …………………………………………………….? 請各位報帳同仁、專兼任助理們務必養成平時定期清帳的習慣,不要等到年終或結案前才開始緊張。
国学传统与企业文化建设 刘大洋 博士.
公务卡使用说明.
第十三屆 Step.1 我們的目標 Step.2 我們的角色 Step.4 權利與義務 義務 權利 年繳會費五百元整
财务知识培训 杨 秀 玲 2014年10月.
湖南师大附中高三政治第二次月考 试题讲评 试题讲评.
财务管理.
大學甄選入學 選填志願輔導說明會 曾文農工輔導室.
第一章会计技能的内容 1.1会计技能的重要性.
语文版九年级(下) 多媒体课件.
第4章 聚类分析 4.1 概述 4.2 基于划分的聚类算法 4.3 层次聚类算法 4.4 基于密度的聚类算法 4.5 基于图的聚类算法
植物保护 课程整体设计 汇报 申报省级精品资源共享课建设 植物保护课程组.
為孩子編織一個支持網  台北市家庭暴力暨性侵害防治中心.
第四章 概率密度函数的非参数估计 2学时.
政府扶持资金通览 技术改造篇.
-Artificial Neural Network- Hopfield Neural Network(HNN) 朝陽科技大學 資訊管理系 李麗華 教授.
-Artificial Neural Network- Adaline & Madaline
資訊管理 第九章 資料採礦.
本科生医保资料的提交.
第三章 生物神經網路 與類神經網路 類神經網路 台大生工系水資源資訊系統研究室.
On Some Fuzzy Optimization Problems
K-modes(补充) K-模,对k-平均方法的改进,k-原型的简化 处理分类属性
統計圖表的製作.
Digital Terrain Modeling
第4章 网络互联与广域网 4.1 网络互联概述 4.2 网络互联设备 4.3 广域网 4.4 ISDN 4.5 DDN
第11章 抽樣設計 本章的學習主題 1.抽樣的基本概念 2.抽樣的程序 3.機率抽樣 4.非機率抽樣 5.電話抽樣
传感器网络数据融合技术研究 张小波 广东工业大学自动化学院网络工程系
第五章 聚类方法 内容提要 聚类方法概述 划分聚类方法 层次聚类方法 密度聚类方法 其它聚类方法 2019年2月17日星期日
類神經網路簡介 B 朱峰森 B 梁家愷.
谈模式识别方法在林业管理问题中的应用 报告人:管理工程系 马宁 报告地点:学研B107
导数的应用 ——函数的单调性与极值.
-Artificial Neural Network(ANN)- Self Organization Map(SOM)
《结构力学认知实验》(授课形式)的上课时间改为: 5月5日(周二)晚上18:00~19:30和19:30~21:00,
《结构力学认知实验》(授课形式)的上课时间改为: 5月7日(周四)晚上18:30~20:00和20:00~21:30,
健康體育網路護照操作 STEP1 於教育部體適能網站進入「健康體育網路護照」.
第七章 网络营销.
Vector Quantization(VQ)
主講人:陳鴻文 副教授 銘傳大學資訊傳播工程系所 日期:3/13/2010
聚类分析法预测(Cluster Analysis)
Applied Human Computer Interaction Lecture 10 Yan Ke
A Data Mining Algorithm for Generalized Web Prefetching
畢業資格審查系統 操作步驟說明.
新制退休實務計算說明- 現職人員退休範例說明
第三章 世界文明的蛻變與互動 第一節 歐洲社會的蛻變 第二節 世界文明的交匯 第三節 亞洲大帝國的發展 1.
More About Auto-encoder
第六章 自組性類神經網路 類神經網路.
106 學年度新生入學說明會 國立臺灣海洋大學 教務處簡介
學士學位畢業論文說明 逢 學 大 甲 土 理 管 地 2009/10/05.
高雄市97年度國民小學閱讀計畫創新教學-教案達人創新教學方案
2 Number Systems, Operations, and Codes
一只猪和一只企鹅被关在-20℃的冷库里,第二天企鹅死了,猪没事,为什么?你知道为什么吗?
群聚分析操作介紹 -以SOM和K-means為例
Experimental Analysis of Distributed Graph Systems
臺灣北區102學年度高級中等學校 舞蹈班暨聯合甄選入學術科測驗 暨甄選入學說明會
歡迎光臨! 講師:台灣科技大學企管系林孟彥,
Presentation transcript:

神经信息学 自组织网络 ——自组织映射 史忠植 shizz@ics.ict.ac.cn 中科院计算所 2019/2/2

概 述 自组织神经网络,又称为自组织竞争神经网络,特别适合于解决模式分类和识别方面的应用问题。 概 述 自组织神经网络,又称为自组织竞争神经网络,特别适合于解决模式分类和识别方面的应用问题。 自组织神经网络属于前向神经网络类型,采用无导师学习算法, 自组织特征映射神经网络不仅能够像自组织竞争神经网络一样学习输入的分布情况,而且可以学习神经网络的拓扑结构。 2019/2/2

概 述 自组织竞争神经网络类型 自组织特征映射(self-Organizing Map,SOM)网络 概 述 自组织竞争神经网络类型 自组织特征映射(self-Organizing Map,SOM)网络 自适应共振理论(Adaptive Resonance Theory,ART)网络 对传(Counter Propagation,CP)网络 协同神经网络(Synergetic Neural Network.SNN) 2019/2/2

自组织特征映射神经网络结构 由芬兰学者Teuvo Kohonen于1981年提出 I’m Teuvo Kohonen 基本上为输入层和映射层的双层结构,映射层的神经元互相连接,每个输出神经元连接至所有输入神经元 Kohonen的思想在本质上是希望解决有关外界信息在人脑中自组织地形成概念的问题。 I’m Teuvo Kohonen 2019/2/2

SOM网的生物学基础 Kohonen认为人的大脑有如下特点: 1.大脑的神经元虽然在结构上相同,但是它们的排序不同。排序不是指神经元位置的移动,而是指神经元的有关参数在神经网络受外部输入刺激而识别事物的过程中产生变动。 2.大脑中神经元参数在变动之后形成特定的参数组织;具有这种特定参数组织的神经网络对外界的特定事物特别敏感。 3.根据生物学和神经生理学,大脑皮层分成多种不同的局部区域,各个区域分别管理某种专门的功能,比如听觉、视觉、思维等。 4.大脑中神经元的排序受遗传决定,但会在外界信息的刺激下,不断接受传感信号,不断执行聚类过程,形成经验信息,对大脑皮层的功能产生自组织作用,形成新功能。 2019/2/2

SOM网的生物学基础 生物学研究的事实表明,在人脑的感觉通道上,神经元的组织原理是有序排列。因此当人脑通过感官接受外界的特定时空信息时,大脑皮层的特定区域兴奋,而且类似的外界信息在对应区域是连续映象的。 对于某一图形或某一频率的特定兴奋过程,神经元的有序排列以及对外界信息的连续映象是自组织特征映射网中竞争机制的生物学基础。 2019/2/2

自组织特征映射神经网络结构 竞争层 输入层 SOM神经网络结构 2019/2/2

SOM网的拓扑结构 SOM网共有两层,输入层模拟感知外界输入信息的视网膜,输出层模拟做出响应的大脑皮层。 2019/2/2

SOM网的权值调整域 SOM网的获胜神经元对其邻近神经元的影响是由近及远,由兴奋逐渐转变为抑制,因此其学习算法中不仅获胜神经元本身要调整权向量,它周围的神经元在其影响下也要程度不同地调整权向量。这种调整可用三种函数表示: 2019/2/2

SOM网的权值调整域 以获胜神经元为中心设定一个邻域半径,该半径圈定的范围称为优胜邻域。在SOM网学习算法中,优胜邻域内的所有神经元均按其离开获胜神经元的距离远近不同程度地调整权值。 优胜邻域开始定得很大,但其大小随着训练次数的增加不断收缩,最终收缩到半径为零。 2019/2/2

自组织特征映射网络的学习算法 自组织特征映射学习算法原理 类似度准则 Kohonen自组织特征映射算法,能够自动找出输入数据之间的类似度,将相似的输入在网络上就近配置。因此是一种可以构成对输入数据有选择地给予响应的网络。 类似度准则 欧氏距离 2019/2/2

自组织特征映射网络的学习算法 自组织特征映射学习算法步骤 (1)网络初始化 (2)输入向量 (3) 计算映射层的权值向量和输入向量的距离 用随机数设定输入层和映射层之间权值的初始值 (2)输入向量 把输入向量输入给输入层 (3) 计算映射层的权值向量和输入向量的距离 映射层的神经元和输入向量的距离,按下式给出 2019/2/2

自组织特征映射网络的学习算法 自组织特征映射学习算法步骤 (4) 选择与权值向量的距离最小的神经元 计算并选择使输入向量和权值向量的距离最小的神经元,把其称为胜出神经元并记为 ,并给出其邻接神经元集合。 (5)调整权值 胜出神经元和位于其邻接神经元的权值,按下式更新: (6)是否达到预先设定的要求如达到要求则算法结束,否则返回(2),进入下一轮学习 2019/2/2

自组织特征映射网络的学习算法 邻域函数 由邻域函数可以看到,以获胜神经元为中心设定了一个邻域半径,称为胜出邻域。学习初期,胜出神经元和其附近的神经元全部接近当时的输入向量,形成粗略的映射。 随着学习的进行而减小,胜出邻域变窄,胜出神经元附近的神经元数变少。因此,学习方法是一种从粗调整向微调整变化,最终达到预定目标的过程。 2019/2/2

Kohonen学习算法程序流程 2019/2/2

Hierarchical and Partitive Approaches Partitive algorithm Determine the number of clusters. Initialize the cluster centers. Compute partitioning for data. Compute (update) cluster centers. If the partitioning is unchanged (or the algorithm has converged), stop; otherwise, return to step 3 k-means error function To minimize error function 2019/2/2

Hierarchical and Partitive Approaches Hierarchical clustering algorithm (Dendrogram) Initialize: Assign each vector to its own cluster Compute distances between all clusters. Merge the two clusters that are closest to each other. Return to step 2 until there is only one cluster left. Partition strategy Cut at different level 2019/2/2

Hierarchical SOM GHSOM – Growing Hierarchical Self-Organizing Map grow in size in order to represent a collection of data at a particular level of detail 2019/2/2

自组织网络学习算法的MATLAB实现 MATLAB中自组织神经网络的重要函数和基本功能 函 数 名 功 能 newsom() 功 能 newsom() 创建一个自组织特征映射神经网络 plotsom() 绘制自组织特征映射网络的权值矢量 vec2ind() 将单值矢量组变换成下标矢量 compet() 竞争传输函数 midpoint() 中点权值初始化函数 learnsom() 自组织特征映射权值学习规则函数 2019/2/2

自组织网络学习算法的MATLAB实现 MATLAB中自组织神经网络的重要函数和基本功能 newsom() 功能 创建一个自组织特征映射网络函数 格式 net = newsom(PR,[D1,D2,...],TFCN,DFCN,OLR,OSTEPS,TLR,TND) 说明 net为生成的新BP神经网络;PR为网络输入矢量取值范围的矩阵[Pmin Pmax];[D1,D2,...]为神经元在多维空间中排列时各维的个数;TFCN为拓扑函数,缺省值为hextop;DFCN为距离函数,缺省值为linkdist;OLR为排列阶段学习速率,缺省值为0.9;OSTEPS为排列阶段学习次数,缺省值为1000;TLR为调整阶段学习速率,缺省值为0.02,TND为调整阶段领域半径,缺省值为1。 2019/2/2

自组织网络学习算法的MATLAB实现 plotsom() 功能 绘制自组织特征映射网络图的权值向量 函数 格式 功能 绘制自组织特征映射网络图的权值向量 函数 格式 (1) plotsom(pos) (2) plotsom(W,D,ND) 说明 式中pos是网络中各神经元在物理空间分布的位置坐标矩阵;函数返回神经元物理分布的拓扑图,图中每两个间距小于1的神经元以直线连接;W为神经元权值矩阵;D为根据神经元位置计算出的间接矩阵;ND为领域半径,缺省值为1;函数返回神经元权值的分布图,图中每两个间距小于ND的神经元以直线连接。 2019/2/2

自组织网络学习算法的MATLAB实现 yec2ind() 功能 将单值向量组变换成下标向量 格式 ind = vec2ind(vec) 功能 将单值向量组变换成下标向量 格式 ind = vec2ind(vec) 说明 式中,vec为m行n列的向量矩阵x,x中的每个列向量i,除包含一个1外,其余元素均为0, ind为n个元素值为1所在的行下标值构成的一个行向量。 2019/2/2

自组织网络学习算法的MATLAB实现 例1 人口分类是人口统计中的一个重要指标,现有1999共10个地区的人口出生比例情况如下: 出生男性百分比分别为:0.5512 0.5123 0.5087 0.5001 0.6012 0.5298 0.5000 0.4965 0.5103 0.5003; 出生女性百分比分别为:0.4488 0.4877 0.4913 0.4999 0.3988 0.4702 0.5000 0.5035 0.4897 0.4997 2019/2/2

自组织网络学习算法的MATLAB实现 例1 源程序 2019/2/2

例1 SOM网络权值分布图 2019/2/2

例1 SOM网络数据分类图 测试数据属于类别5 类别5 类别4 类别3 类别2 类别1 2019/2/2

自组织语义图 利用词与词在文档中的上下文关系,将词表示成一个向量,然后用表示词的向量作为SOM网络的输入,聚类,输出形成一个词汇类别图(Word category map) 在这个图中,意义相近的词聚在一起,组成一个词类,词在词汇类别图中的位置可以通过快速Hash的方法查到。 2019/2/2

自组织语义图:一种将词向量化的方法 在一个文档集中考虑词与词之间的上下文关系。设Ii(d)表示相对于第i个词位移为d的位置上出现的词集合(有可能出现多次),例如,Ii(1)表示第i个词的所有前趋邻接词 用向量xi表示第i个词,对位移集{d1,…,dN}: , 其中, 表示 中词的数量 一般地,为计算简单,只取d=1和d=-1 2019/2/2

自组织语义图:另一种对中文词汇向量化的方法 对每一个词,在文档集合中出现该词的时候会伴随一些修饰词。因此可以用修饰词来表示该词,提供该词的一些语义信息 例如对名词“大学”,会出现一些修饰词如“本科”、“重点”、“合格”等,则定义,大学={本科,重点,合格,…} 2019/2/2

自组织语义图:另一种对中文词汇向量化的方法 一般地,词wi(i=1,2,…,N)为: 其中ni表示修饰词个数 定义词wi的向量表示为: 其中, , ; , cij表示词wi和词wj的修饰词集合中都出现的修饰词个数 将词用这种向量表示后,作为一个SOM网络的输入,可以聚类形成中文语义图。 2019/2/2

自组织语义图:示例 2019/2/2

利用SOM进行文本聚类:预处理 去掉非文本信息 去掉在整个文档集合中出现次数小于50次的词 去停用词 经过上述处理后,词的个数由 1 127 184 减少为 63 773 2019/2/2

利用SOM进行文本聚类:Word category map 最终产生 13 432 个词类单元 ( 63 773  13 432) 2019/2/2

利用SOM进行文本聚类:Document map 利用上面产生的词类将文档向量化后,每篇文档表示为一个 13 432 维的向量,再利用随机映射(Random mapping method)的降维方法,向量维数减少到 315 维 将这 315 维的向量作为一个 SOM 的输入 相关的结果可以参见http://websom.hut.fi/websom/ 2019/2/2

利用SOM进行文本聚类 2019/2/2

SOM的特点 自组织映射(Self-organizing Maps,SOM)算法是一种无导师学习方法 具有良好的自组织 可视化 得到了广泛的应用和研究。 2019/2/2