局部优化算法之一: 梯度下降法 李金屏 济南大学信息科学与工程学院 2006年9月.

Slides:



Advertisements
Similar presentations
简单迭代法的概念与结论 简单迭代法又称逐次迭代法,基本思想是构造不动点 方程,以求得近似根。即由方程 f(x)=0 变换为 x=  (x), 然后建立迭代格式, 返回下一页 则称迭代格式 收敛, 否则称为发散 上一页.
Advertisements

“ 上海市科研计划课题预算编制 ” 网上教程 上海市科委条财处. 经费预算表 表 1 劳务费预算明细表 表 2 购置设备预算明细表 表 3 试制设备预算明细表 表 4 材料费预算明细表 表 5 测试化验与加工费预算明细表 表 6 现有仪器设备使用费预算明细表 小于等于 20 万的项目,表 2 ~表.
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 微分及其应用. 三、可微的条件 一、问题的提出 二、微分的定义 六、微分的形式不变性 四、微分的几何意义 五、微分的求法 八、小结 七、微分在近似计算中的应用.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
平台的优点: ( 1 )永久免费: 学校和老师使用校讯通平台发送短信 是免费的,并且通过使用平台,可获得部分购物卡补贴。 ( 2 )移动办公: 校讯通不受时间和空间的限制,只要 有一台可以上网的电脑,老师便可以通过互联网发送短信 给家长,能够实现移动办公,节省老师的工作时间。 ( 3 )简单易用:
开远市第一中学 2014年高考志愿填报指导会 2014年6月26日.
大学生创业实践.
社交礼仪.
損益表 原則: 收益與費用的計算,實際上是在實現或發生時所產生,與現金收付當時無關。
专利技术交底书的撰写方法 ——公司知识产权讲座
无锡商业职业技术学院 机电工程学院党总支孙蓓雄
高等数学教学课件 教材版本:同济七版 课件研制:军械工程学院 张士军 高等教育出版社 高等教育电子音像出版社.
《中国共产党发展党员工作细则》 学习提纲 中共进贤县委组织部 宋 剑
严格发展程序,提高工作能力 黄 玉 2010年9月.
发展党员的流程和要求 党委组织部 萧炽成.
全面了解入党程序 认真履行入党手续 第一讲 主讲人:陈亭而.
中共湖北大学知行学院委员会党校 入党材料规范填写指导 学工处 李华琼 二〇一三年十二月.
云南财经大学2010年党员发展培训—— 党员发展工作培训 校党委组织部 2010年9月17日.
教育年鉴条目的撰写.
莫让情感之船过早靠岸 兴庆回中 赵莉.
《老年人权益保障》 --以婚姻法.继承法为视角
行政公文写作 第七章 2004年8月 行政公文写作.
论文撰写的一般格式和要求 孟爱梅.
认识结果语境论.
负 债 第九章 主讲老师:潘煜双 方正为人,勤慎治学.
第三章 幼儿园课程内容的编制与选择.
第八章 诉讼法 第一节 诉讼法概述 第二节 民事诉讼法 第三节 行政诉讼法 第四节 刑事诉讼法.
第三章  电话、电子通讯   本章重难点:     打电话的方法、         接听电话的方法。
《高等数学》(理学) 常数项级数的概念 袁安锋
四种命题 班级:C274 指导教师:钟志勤 任课教师:颜小娟.
《社交礼仪分享》 阳晨牧业科技有限公司 市场中心 二O一二年四月十八日.
会议文书.
第五章 定积分及其应用.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
高考哲学十种主观题常见题型及分析.
如何写入团申请书.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
第7章 相关分析 7.1 相关分析 7.2 相关系数 7.3 线性相关分析.
通 知 通知是批转下级机关的公文,转发上级机关和不相隶属机关的公文,传达要求下级机关办理和需要有关单位周知或执行的事项,任免人员时使用的公文。
第11周 工作计划.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
导数的应用 ——函数的单调性与极值.
第一章 函数与极限.
第九章 結 帳 9-1 了解結帳的意義及功能 9-2 了解虛帳戶結清之會計處理 9-3 了解實帳戶結轉的會計處理
第七章 组合数学 7.7生成函数 7.7.1幂级数型生成函数 定义1 生成函数 实数序列{an}的生成函数:
認識多項式 1 多項式的加法 2 多項式的減法
第4章 Excel电子表格制作软件 4.4 函数(一).
中国大连高级经理学院博士后入站申请汇报 汇报人:XXX.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
第四章 第四节 函数图形的描绘 一、渐近线 二、图形描绘的步骤 三 、作图举例.
山东省临沂第一中学 计 算 机 教 学 课 件 指数函数及其性质 (二) 山东省临沂第一中学 Wednesday, May 08, 2019.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
內部控制作業之訂定與執行 報告人:許嘉琳 日 期:
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
建模常见问题MATLAB求解  .
高中数学选修 导数的计算.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
选修1—1 导数的运算与几何意义 高碑店三中 张志华.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
三角 三角 三角 函数 余弦函数的图象和性质.
8的乘法口诀 导入 新授 练习.
Presentation transcript:

局部优化算法之一: 梯度下降法 李金屏 济南大学信息科学与工程学院 2006年9月

优化算法和运筹学 优化算法 许多实际问题利用数学建模的方法得到下面常规的优化形式: min f(x),s.t. g(x) ≥0, x∈D. 其中,x是一个n维矢量,D是问题的定义域,F可行域。 关于f(x): 当x=(x)时,f(x)是一条曲线; 当x=(x1, x2)时,f(x1, x2)是一个曲面; 当x=(x1, x2, x3)时,f(x1, x2, x3)是一个体密度(或类位势函数); 当x=(x1, x2, …, xn)时,f(x1, x2, …, xn)是一个超曲面。 12

优化算法和运筹学 曲面,自然有许多极大值和极小值,必然各有一个全局最大值和全局最小值。 超曲面,与上相同。 有些算法,只能在自己的小范围内搜索极大值或极小值。这些算法称为局部优化算法,常称为经典优化算法。 另有些算法,可以在整个超曲面取值范围内搜索最大值或最小值。这些算法称为全局性优化算法,又称为现代优化算法。 12

优化算法和运筹学 通常的运筹学,就是经典的局部优化算法。全局性优化算法通常是随机性搜索。 一个简单二维曲面 12

局部优化算法之一:梯度下降法 见右图。局部极小值是C点(x0)。 梯度,即导数,但是有方向,是一个矢量。曲线情况下,表达式为 如果,f’(x)>0,则x增加,y也增加,相当于B点;如果f’(x)<0,则x增加,y减小,相当于A点。 要搜索极小值C点,在A点必须向x增加方向搜索,此时与A点梯度方向相反;在B点必须向x减小方向搜索,此时与B点梯度方向相反。总之,搜索极小值,必须向负梯度方向搜索。 12

局部优化算法之一:梯度下降法 一般情况下分析: y=f (x1, x2, …, xn) 假设只有一个极小点。初始给定参数为 从这个点如何搜索才能找到原函数的极小值点? 方法: 1、首先设定一个较小的正数,; 2、求当前位置处的各个偏导数:dy/dx1, dy/dx2, …, dy/dxn; 3、按照下述方式修改当前函数的参数值: x10x10   dy/dx1, x20x20   dy/dx2, …, xn0xn0   dy/dxn; 4、如果超曲面参数变化量小于,退出;否则返回2。 12

局部优化算法之一:梯度下降法 举例:y=x2/2-2x 计算过程: 任给一个初始出发点,设为x0=-4。 (1) 首先给定两个参数:=1.5,=0.01; (2) 计算导数:dy/dx = x-2 (3) 计算当前导数值:y’=-6 (4) 修改当前参数: x0=-4  x1= x0 - *y’ =-4-1.5*(-6)=5.0; (5) 计算当前导数值:y’=3.0 (6) 修改当前参数: x1=5.0  x2=5.0 – 1.5*(3.0) =0.5; 12

局部优化算法之一:梯度下降法 (7) 计算当前导数值: y’=-1.5 (8) 修改当前参数: x2=0.5x3=0.5-1.5*(-1.5) =2.75; (9) 计算当前导数值:y’=0.75 (10) 修改当前参数: x3=2.75 x4 = 2.75-1.5*(0.75) =1.625; (11) 计算当前导数值: y’=-0.375 (12) 修改当前参数:x4=1.625 x5 = 1.625-1.5*(-0.375)=2.1875; … 12

局部优化算法之一:梯度下降法 可见,当=1.5时,搜索呈现振荡形式,在极值点附近反复搜索。可以证明,当<1.0时,搜索将单调地趋向极值点,不会振荡;当>2.0时,搜索将围绕极值点逐渐发散,不会收敛到极值点。 为了保证收敛,不应当太大。但如果过小,收敛速度将十分缓慢。可以采用自适应调节的方法加快收敛而又不至于发散。 问题:为何当很小时搜索总会成功? 证明:(下页) 12

局部优化算法之一:梯度下降法 y=f (x1, x2, …, xn)。假设只有一个极小点。 x1x1+x1, x2x2+x2, …, xnxn+xn. 显然问题在于xi (i=1,2,…, n)的确定。 于是,当前函数值为y=f (x1+x1, x2+x2, …, xn+xn). 可以按照泰勒级数展开为: y=f (x1, x2, …, xn) + f 其中f=x1*(dy/dx1)+ x2*(dy/dx2)+ … + xn*(dy/dxn) 如何保证f<0? (搜索极小值) 12

局部优化算法之一:梯度下降法 可以按照下述方式: x1= - *(dy/dx1), x2= - *(dy/dx2), …, xn= - *(dy/dxn). 其中>0是个小的正数。代入前式,有 f = - *(dy/dx1)*(dy/dx1) - *(dy/dx2)*(dy/dx2) - … - *(dy/dxn)*(dy/dxn) = - *[(dy/dx1)2 + (dy/dx2)2 + (dy/dxn)2] <0 即f<0。这样就可以保证搜索到极小值。 于是获得梯度下降法的搜索策略: 12

总结和作业 局部优化算法之一:梯度下降法 用于BP神经网络,Hopfield神经网络,模式分类,求函数极值等。 相关内容:共轭梯度法 12