第04讲反向传播网络.

Slides:

Advertisements

Similar presentations

北京科技大学科研工作基本情况 2012 年 4 月. 2北京钢铁学院 1960 年，更名为北京钢铁学院同年被批准为全国重点院校 1960 年，更名为北京钢铁学院同年被批准为全国重点院校 1984 年，首批试办研究生院北京科技大学 1988 年，更名为北京科技大学 1988 年，更名为北京科技大学.

Advertisements

病历书写中山医院呼吸科张新. 定义病历是临床医生根据问诊、体格检查、实验室和其他检查获得的资料经过归纳、分析、整理，按照规定的格式而写成的；是关于病人发病情况，病情发展变化，转归和诊疗情况的系统记录。病历是临床医生根据问诊、体格检查、实验室和其他检查获得的资料经过归纳、分析、整理，

第十二章病历书写与要求病历病历医务人员在医疗中形成的文字、符号、图表、影像、切片等资料的总和。病历书写通过诊法、诊断、治疗、护理等医疗活动获得有关资料，进行归纳、分析、整理形成医疗活动记录行为。病历意义 A 诊疗等的源文件； B 复 / 转 / 会诊，解决医疗纠纷、判定法律责任、医疗保险等的资料和依据；

因果图. 因果图因果图的适用范围如果在测试时必须考虑输入条件的各种组合，可使用一种适合于描述对于多种条件的组合，相应产生多个动作的形式来设计测试用例，这就需要利用因果图。因果图方法最终生成的就是判定表。它适合于检查程序输入条件的各种组合情况。因果图的适用范围如果在测试时必须考虑输入条件的各种.

第七章求职方法和技巧（二）主讲人：谭琳. 第一节自荐一、目前常见的自荐种类 1 ．口头自荐 1 ．口头自荐 2 ．书面自荐 2 ．书面自荐 3 ．广告自荐 3 ．广告自荐 4 ．学校推荐 4 ．学校推荐 5 ．他人推荐 5 ．他人推荐.

第二章信息资源的概念、特性及类型吉林建筑大学城建学院.

受限空间作业安全技术王锡涛江苏安泰安全技术有限公司董事长省化工安全技术专家联系电话：

教育部「生技產業創新創業人才培育計畫」推動中心計畫簡報

全民總動員─國防教育從小開始主講人：桃園縣楊梅國小林俊榮老師桃園縣楊梅國小李華玲老師 2017/2/27 桃園縣楊梅國小.

一百年後的世界裡，人類掌握長生不死的秘密，但伴隨而來的是……

王同学的苦恼﹗ MC 4.1 诚可贵﹗.

团结奋进，一马当先 ——化工研13-1班亮剑党支部汇报人：罗云 2017年2月28日.

第五章不同人群的体育卫生第一节儿童少年的体育卫生第二节女子的体育卫生第三节中年人的体育卫生第四节老年人的体育卫生.

国际时政 2009年2月.

第四章招聘录用.

重庆市自然科学基金申报.

3/5/2017 十二经脉八、足少阴肾经.

2015年度工作情况汇报 ——力学 2015年12月.

综合实验 ----实验选作（1/3）智能五子棋游戏 1. 实验目的

有“礼”走遍天下 ——现代商务礼仪指引与训练

2011年上半年学位论文答辩及学位申请工作.

中国矿业大学力学与建筑工程学院岩石力学与工程研究所 2015年工作汇报 2016年1月6日 1 1.

第一节二次型的矩阵表示一、二次型的定义二、二次型的矩阵表示三、非退化线性替换四、矩阵的合同.

2015年工作总结建筑工程系.

從「新創事業的挑戰與因應之道」來談如何規劃準備創業

专题三胚胎工程胚胎工程的应用及前景.

职称：***（博导、教授、副教授、讲师）团队：***教授的知识创新（服务、传授）团队

基于新理念、新技术的“翻转课堂” 孟世敏武夷学院数字学习协同创新中心东方潜能脑认知结构成像实验室武夷学院“数字学习协同创新中心”

新疆瓜果大全新疆是久负盛名的“瓜果之乡”，瓜田果树无处不有。这里阳光充足，气候适宜，为瓜果生产提供了良好的自然条件。瓜果品种繁多，质地优良，营养丰富，一年四季干鲜瓜果不绝于市，处处瓜果飘香，各种瓜果随季节在排队上市，这里不妨顺着瓜果上市的次序来个大点兵：1桑椹、2草莓、3杏子、4李子、5蜜桃、6樱桃、7无花果、8西瓜、9哈密瓜、10葡萄、11蟠桃、12海棠果、13香瓜、14梨瓜、15沙枣、16苹果、17香梨、18核桃、19大枣、20石榴、21巴旦木、22乌梅……

繪本教學心得分享分享者：張玲華.

　坚持以人为本　一切依靠人民胡锦涛总书记“七一”重要讲话全文1．4万多字，其中“人民”一词用了136次，平均每104个字里就有一个，可见“人民”在党心中的分量。讲话阐述的保持和发展马克思主义政党先进性的根本点第二条就是，坚持为了人民、依靠人民，诚心诚意为人民谋利益，从人民群众中汲取智慧和力量，始终保持党同人民群众的血肉联系；提高党的建设科学化水平目标任务第三条也强调，必须坚持以人为本、执政为民理念，牢固树立马克思主义群众观点、自觉贯彻党的群众路线，始终保持党同人民群众的血肉联系。这充分体现了我党把人民放

社評分享簡報者:洪健耀.

台灣的名勝古蹟.

深圳人口与医疗需求预测深圳大学吴心弘杨杰蔡炜城 1.

染整082 11号古仲棋 12号关德辉 41号谢长威 52号陈晓亮 33号唐祝玉杨剑耀

CHAPTER　6 寫的溝通. CHAPTER　6 寫的溝通第六章　寫的溝通125 第一節　寫的溝通之特性127 壹、蒐集資料為起點128 貳、清楚表達訊息128 一、大綱模式129 二、自問自答模式 130 三、腦力激盪式 130 參、善用資料130 肆、簡潔有力131 一、簡潔扼要，話說完就停筆131.

第七章项目融资评估.

名以清修利以义制绩以勤勉汇通天下新晋商理念李安平

第六章动作分析第一节动作分析概述第二节动作要素分析第三节影像分析第四节动作经济原则第五节作业改善--动作经济原则的应用.

儿科病史与体格检查.

台灣史總複習.

新能源是指可再生能源，例如：太阳能、风能、海洋能、生物质能、氢能、核能等。

改革开放以来小金华的变化浙江中西部中心城市——金华市区全景.

第四章：養分的攝取動物體養分的消化與吸收.

粥点击翻页.

國文報告儒家生死文化討論不死鳥組員 972BP001 彭科強 972BP008 王薪榕 972BP025 彭裕宗

語言治療師：韓慧雯咿咿呀呀 ~嬰幼兒語言發展輔導策略語言治療師：韓慧雯韓老師語言治療所.

前瞻而行突破制胜 ——顺欣广场地块提案提案机构:广州市地博置业顾问有限公司提案时间:2007年12月26日.

“体育与健康”课程介绍尹林教授.

调整职业生涯规划的必要性及其时机来安职高《职业生涯规划》课程组.

第二章中枢神经系统第一节脊髓一、脊髓的位置和外形颈膨大支配上肢腰骶膨大与上、下肢发育有关— 支配下肢，脊髓圆锥—终于L1下缘 ——终丝（无NT）前正中裂、后正中沟.

公文書寫注意事項報告人許崑燈.

学院“十二五”发展规划修改意见发展规划处二0一一年二月.

主要内容常用调节规律可编程逻辑控制器（PLC）简介比例积分微分（PID）控制改进的PID控制算法调节器控制规律的选择

港口股份有限公司东源分公司降本增效部门：机械队流机二班发言人：程广州.

第八章完全獨占市場產量與價格的決定.

類神經網路簡介 B 朱峰森 B 梁家愷.

领导艺术与方法适合对象：课长级以上人员人力资源部李晓红 2006/6/12

单片机应用技术项目二电子打铃装置第3讲单片机功率接口《单片机应用技术》精品课程组湖北职业技术学院机电工程系.

联系观总特征/基本观点发展观对立统一——实质和核心唯物辩证法矛盾观矛盾分析法——根本方法辨证否定观 —基本要求辩证唯物主义

統計學期末報告班級：休管系二年甲班組員：吳佳霖指導老師：蘇明俊老師林禮慧

网络模型 Network Modeling Operations Research 运筹学

解難指導（第２章）熱學實驗（推斷不同因素造成的影響）.

解難指導（第２章）從結果倒推成因（熱學實驗）.

青少年父母的迷惘：除了say no我們還可以教孩子什麼？

第8章信息系统的评价与维护新系统投入正常运行，并有效运行一段时间之后，必须对新系统作全面的系统评价和维护。系统评价的目的是为了估计系统的技术能力、工作性能和系统的利用率等。系统评价度量了系统当前的性能并为系统未来改善提供依据，而系统的维护是为了保证信息系统能持续地与用户环境、数据处理操作、政府或其他有关部门的请求取得协调而从事的各项活动。本章主要介绍系统的评价和维护两个方面。

Presentation transcript:

第04讲反向传播网络

反向传播网络(Back—Propagation Network，简称BP网络)是将W—H学习规则一般化，对非线性可微分函数进行权值训练的多层网络。 BP网络是一种多层前向反馈神经网络，其神经元的变换函数是S型函数，因此输出量为0到1之间的连续量，它可以实现从输入到输出的任意的非线性映射。由于其权值的调整采用反向传播（Backpropagation）的学习算法，因此被称为BP网络。

BP网络主要用于： 1)函数逼近：用输入矢量和相应的输出矢量训练一个网络逼近—个函数； 2)模式识别：用一个特定的输出矢量将它与输入矢量联系起来； 3)分类：把输入矢量以所定义的合适方式进行分类； 4)数据压缩：减少输出矢量维数以便于传输或存储。

4．1 BP网络模型与结构一个具有r个输入和一个隐含层的神经网络模型结构

感知器和自适应线性元件的主要差别在激活函数上：前者是二值型的，后者是线性的。 BP网络具有一层或多层隐含层，除了在多层网络上与前面已介绍过的模型有不同外，其主要差别也表现在激活函数上。 BP网络的激活函数必须是处处可微的，所以它就不能采用二值型的阀值函数{0，1}或符号函数{—1，1}，BP网络经常使用的是S型的对数或正切激活函数和线性函数。

图6. 2 BP网络S型激活函数因为S型函数具有非线性放大系数功能，它可以把输入从负无穷大到正无穷大的信号，变换成-1到l之间输出，对较大的输入信号，放大系数较小；而对较小的输入信号，放大系数则较大，所以采用S型激活函数可以去处理和逼近非线性的输入/输出关系。

只有当希望对网络的输出进行限制，如限制在0和1之间，那么在输出层应当包含S型激活函数，在一般情况下，均是在隐含层采用S型激活函数，而输出层采用线性激活函数。 BP网络的特点： 1、输入和输出是并行的模拟量； 2、网络的输入输出关系是各层连接的权因子决定，没有固定的算法； 3、权因子是通过学习信号调节的，这样学习越多，网络越聪明； 4、隐含层越多，网络输出精度越高，且个别权因子的损坏不会对网络输出产生大的影响

4.2 BP学习规则 BP算法属于δ算法，是一种监督式的学习算法。其主要思想为：对于q个输入学习样本：P1，P2，……Pq，已知与其对应的输出样本为：T1，T2，……Tq。学习的目的是用网络的实际输出A1，A2，……Aq，与目标矢量T1，T2，……Tq，之间的误差来修改其权值，使Al，(l＝l，2…，q)与期望的Tl尽可能地接近；即：使网络输出层的误差平方和达到最小。

BP算法是由两部分组成：信息的正向传递与误差的反向传播。在正向传播过程中，输入信息从输入经隐含层逐层计算传向输出层，每一层神经元的状态只影响下一层神经元的状态。如果在输出层没有得到期望的输出，则计算输出层的误差变化值，然后转向反向传播，通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标。

图6．3 具有一个隐含层的简化网络图设输入为P，输入神经元有r个，隐含层内有s1个神经元，激活函数为F1，输出层内有s2个神经元，对应的激活函数为F2，输出为A，目标矢量为T。

4．2．1信息的正向传递 1)隐含层中第i个神经元的输出为： (6.1) 2)输出层第k个神经元的输出为：（6.2） 3)定义误差函数为：（6.3）

4．2．2利用梯度下降法求权值变化及误差的反向传播 (1)输出层的权值变化对从第i个输入到第k个输出的权值有：（6.4）其中：（6.5）（6.6）同理可得：（6.7）

(2)隐含层权值变化对从第j个输入到第i个输出的权值，有：（6.8）其中：（6.9）同理可得：（6.10）

4．2．3 误差反向传播的流程图与图形解释误差反向传播过程实际上是通过计算输出层的误差ek，然后将其与输出层激活函数的一阶导数f2’相乘来求得δki。由于隐含层中没有直接给出目标矢量，所以利用输出层的δki反向传递来求出隐含层权值的变化量Δw2ki。然后计算并同样通过将ei与该层激活函数的一阶导数f1’相乘，而求得δij，以此求出前层权值的变化量Δw1ij。如果前面还有隐含层，沿用上述同样方法依此类推，一直将输出误差ek一层一层的反推算到第一层为止。

图6．4 误差反向传播法的图形解释

4.3 BP网络的训练过程为了训练一个BP网络，需要计算网络加权输入矢量以及网络输出和误差矢量，然后求得误差平方和。当所训练矢量的误差平方和小于误差目标，训练则停止，否则在输出层计算误差变化，且采用反向传播学习规则来调整权值，并重复此过程。当网络完成训练后，对网络输入一个不是训练集合中的矢量，网络将以泛化方式给出输出结果。

[例6．1]用于函数逼近的BP网络的设计。 P=-1:0.1:1； T=[-0.96 0.577 -0.0729 0.377 0.641 0.66 0.461 0.1336 -0.201 -0.434 -0.5 -0.393 -0.1647 0.0988 0.3072 0.396 0.3449 0.1816 -0.0312 -0.2183 -0.3201];

泛化性能：使网络平滑地学习函数，使网络能够合理地响应被训练以外的输入。要注意的是，泛化性能只对被训练的输入／输出对最大值范围内的数据有效，即网络具有内插值特性，不具有外插值性。超出最大训练值的输入必将产生大的输出误差。

4.4 BP网络的设计 4．4．1网络的层数理论上已经证明：具有偏差和至少一个S型隐含层加上一个线性输出层的网络，能够逼近任何有理函数。增加层数主要可以更进一步的降低误差，提高精度，但同时也使网络复杂化，从而增加了网络权值的训练时间。一般情况下，应优先考虑增加隐含层中的神经元数。能不能仅用具有非线性激活函数的单层网络来解决问题呢？结论是：没有必要或效果不好。

4．4．2 隐含层的神经元数网络训练精度的提高，可以通过采用一个隐含层，而增加其神经元数的方法来获得。这在结构实现上，要比增加更多的隐含层要简单得多。在具体设计时，比较实际的做法是通过对不同神经元数进行训练对比，然后适当地加上一点余量。

4．4．3初始权值的选取一般取初始权值在(—1，1)之间的随机数。威得罗等人在分析了两层网络是如何对一个函数进行训练后，提出一种选定初始权值的策略。其方法仅需要使用在第一隐含层的初始值的选取上，后面层的初始值仍然采用随机取数。

4．4．4 学习速率学习速率决定每一次循环训练中所产生的权值变化量。大的学习速率可能导致系统的不稳定。小的学习速率导致较长的训练时间，可能收敛很慢，不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况下，倾向于选取较小的学习速率以保证系统的稳定性。学习速率的选取范围在0．01—0．8之间。

4．4．5 期望误差的选取在设计网络的训练过程中，期望误差值也应当通过对比训练后确定一个合适的值。这个所谓的“合适”，是相对于所需要的隐含层的节点数来确定，因为较小的期望误差值是要靠增加隐含层的节点，以及训练时间来获得的。一般情况下，作为对比，可以同时对两个不同期望误差值的网络进行训练，最后通过综合因素的考虑来确定采用其中一个网络。

4．5 限制与不足 (1)需要较长的训练时间 (2)完全不能训练 4．5 限制与不足 (1)需要较长的训练时间 (2)完全不能训练通常为了避免这种现象的发生，一是选取较小的初始权值，二是采用较小的学习速率，但这又增加了训练时间。 (3)局部极小值 BP算法可以使网络权值收敛到一个解，但它并不能保证所求为误差超平面的全局最小解，很可能是一个局部极小解。

4．6 反向传播法的改进方法主要目标是为了加快训练速度，避免陷入局部极小值。 4．6．1 附加动量法 4．6 反向传播法的改进方法主要目标是为了加快训练速度，避免陷入局部极小值。 4．6．1 附加动量法附加动量法使网络在修正其权值时，不仅考虑误差在梯度上的作用，而且考虑在误差曲面上变化趋势的影响，其作用如同一个低通滤波器，它允许网络忽略网络上的微小变化特性。利用附加动量的作用则有可能滑过局部极小值。

该方法是在反向传播法的基础上在每一个权值的变化上加上一项正比于前次权值变化量的值，并根据反向传播法来产生新的权值变化。带有附加动量因子的权值调节公式为：其中k为训练次数，mc为动量因子，一般取0．95左右。附加动量法的实质是将最后一次权值变化的影响，通过一个动量因子来传递。当动量因子取值为零时，权值的变化仅是根据梯度下降法产生；当动量因子取值为1时，新的权值变化则是设置为最后一次权值的变化，而依梯度法产生的变化部分则被忽略掉了。

4．6．2 误差函数的改进包穆(Baum)等人于1988年提出一种误差函数为：不会产生不能完全训练的麻痹现象。

4．6．3 自适应学习速率通常调节学习速率的准则是：检查权值的修正值是否真正降低了误差函数，如果确实如此，则说明所选取的学习速率值小了，可以对其增加一个量；若不是这样，而产生了过调，那么就应该减小学习速率的值。下式给出了一种自适应学习速率的调整公式：

4．7 本章小结 1)反向传播法可以用来训练具有可微激活函数的多层前向网络以进行函数逼近，模式分类等工作； 4．7 本章小结 1)反向传播法可以用来训练具有可微激活函数的多层前向网络以进行函数逼近，模式分类等工作； 2)反向传播网络的结构不完全受所要解决的问题所限制。网络的输入神经元数目及输出层神经元的数目是由问题的要求所决定的，而输入和输出层之间的隐含层数以及每层的神经元数是由设计者来决定的； 3)已证明，两层S型线性网络，如果S型层有足够的神经元，则能够训练出任意输入和输出之间的有理函数关系；

4)反向传播法沿着误差表面的梯度下降，使网络误差最小，网络有可能陷入局部极小值； 5)附加动量法使反向传播减少了网络在误差表面陷入低谷的可能性并有助于减少训练时间； 6)太大的学习速率导致学习的不稳定，太小值又导致极长的训练时间。自适应学习速率通过在保证稳定训练的前提下，达到了合理的高速率，可以减少训练时间； 7)80％—90％的实际应用都是采用反向传播网络的。改进技术可以用来使反向传播法更加容易实现并需要更少的训练时间。

4．8作业用BP神经网络对一个简单的非线性神经元进行训练。输入矢量 p=[-3 2] 目标矢量 t=[0.4 0.8]