常用的无约束搜索方法 王琥 wanghu@hnu.edu.cn 湖南大学 机械与运载工程学院 汽车车身先进设计制造国家重点实验室.

Slides:



Advertisements
Similar presentations
数值分析 第五节 数值微分 在实际问题中,往往会遇到某函数 f(x) 是用表格 表示的, 用通常的导数定义无法求导, 因此要寻求其他 方法近似求导。常用的数值微分方法有 : 一. 运用差商求数值微分 二.运用插值函数求数值微分 三. 运用样条插值函数求数值微分 四. 运用数值积分求数值微分.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
目录 上页 下页 返回 结束 习题课 一、导数和微分的概念及应用 二、导数和微分的求法 导数与微分 第二章.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
第七节 函数的微分 一 、微分 概念 二、微分的几何意义 三、 基本初等函数的微分公 式与 微分运算法则 四 、小结.
第 4 章 不定积分 4.1 不定积分的概念与基本积分公式 4.2 换元积分法 4.3 分部积分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
5.4 微 分 一、微分概念 二、微分的运算法则与公式 三、微分在近似计算上的应用. 引例 一块正方形金属片受热后其边长 x 由 x 0 变到 x 0  x  考查此薄片的面积 A 的改变情况  因为 A  x 2  所以金属片面 积的改变量为  A  (x 0 
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
2.3 函数的微分. 四川财经职业学院 课前复习 高阶导数的定义和计算方法。 作业解析:
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第四章无约束优化方法 第一节 概述 从第一章列举的机械设计问题,大多数实际问题是约束优化问题。
第三章 函数逼近 — 最佳平方逼近.
第四节 对数留数与辐角原理 一、对数留数 二、辐角原理 三、路西定理 四、小结与思考.
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 定积分及其应用 4.3 定积分的概念与性质 微积分基本公式 定积分的换元积分法与分部积分法 4.5 广义积分
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
微积分基本定理 2017/9/9.
9.1 数值积分基本方法 9.2 梯形积分 9.3 Simpson积分 9.4 Newton-Cotes积分 9.5 Romberg积分
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第四章 一元函数的积分 §4.1 不定积分的概念与性质 §4.2 换元积分法 §4.3 分部积分法 §4.4 有理函数的积分
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
全 微 分 欧阳顺湘 北京师范大学珠海分校
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
第4章 非线性规划 一维搜索方法 2011年11月.
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第二章 非线性方程的数值解法 非线性方程 n次代数方程 : 超越方程: n=1,2 n=3,4 n≥5 求根公式 查数学手册 ? 如
第 五 章 无约束最优化方法.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第四章 无约束非线性问题的解法 本章要点: 最速下降法的基本思想及特点 牛顿方向 Newton法基本思想及特点
第二章 函数 插值 — 分段低次插值.
线性规 Linear Programming
概 率 统 计 主讲教师 叶宏 山东大学数学院.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
函 数 连 续 的 概 念 淮南职业技术学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
4) 若A可逆,则 也可逆, 证明: 所以.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第 六 章 约束最优化方法.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
高中数学选修 导数的计算.
2019/5/20 第三节 高阶导数 1.
§2 方阵的特征值与特征向量.
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
教学大纲(甲型,54学时 ) 教学大纲(乙型, 36学时 )
线性规划 Linear Programming
三角 三角 三角 函数 余弦函数的图象和性质.
Presentation transcript:

常用的无约束搜索方法 王琥 wanghu@hnu.edu.cn 湖南大学 机械与运载工程学院 汽车车身先进设计制造国家重点实验室

搜索算法的结构 一、下降算法模型 考虑(fs) 常用一种线性搜索的方式来求解:迭代中从一点出发沿下降可行方向找一个新的、性质有改善的点。迭代计算: 其中dk为第 k+1 次迭代的搜索方向,λk为沿dk搜索的最佳步长因子(通常也称作最佳步长)。 min f(x) s.t. x∈S

搜索算法的结构 下降方向: 设 ∈S, d ∈Rn,d≠0,若存在 使 , 称d 为 在 点的下降方向。 可行方向: 同时满足上述两个性质的方向称下降可行方向

算法流程 初始x(1) ∈S, k =1 对x(k)点选择下降 3 可行方向d(k) 1 k=k+1 5 线性搜索求 新点 使x(k+1)∈S no 是否满足收敛条件? yes 停

收敛性 考虑(fs) min f(x) 设迭代算法产生点列{x(k)} S. s.t. x∈S 概念: 考虑(fs) 设迭代算法产生点列{x(k)} S. 理想的收敛性:设x*∈S是 g.opt(全局最优解).当x*∈ {x(k)} 或 x(k) ≠ x*, 满足 时,称算法收敛到最优解 x*。 min f(x) s.t. x∈S

收敛性 对于实际的工程而言,全局收敛的条件较为苛刻。因此,定义了较为实用的收敛条件 S* = { x | x 具有某种性质 } 例:S*={x|x---g.opt} S*={x|x---l.opt} S*={x| f(x)=0} S*={x|f(x)≤β } (β为给定的实数,称为阈值)

收敛速度 设算法产生点列{x(k)},收敛到解x*,且x(k)≠x*, k,关于算法的收敛速度,有 线性收敛: 当k充分大时成立。 超线性收敛: 二阶收敛:   ﹥0,是 使当k充分大时有

收敛速度 定理:设算法点列{x(k)}超线性收敛于x*,且x(k)≠x*, k,那么 证明:只需注意 | ||x(k+1) –x* || -|| x(k) –x* || |≤ ||x(k+1) –x(k) || ≤ ||x(k+1) –x* || +|| x(k) –x* || ,除以|| x(k) –x* || 并令k→∞,利用超线性收敛定义可得结果。 该结论导出算法的停止条件可用:

常用的一维搜索算法 已知 并且求出了 处的可行下降方向 从 出发, 沿方向 求如下目标函数的最优解, 或者选取 使得:

常用的一维搜索算法 设其最优解为 (叫精确步长因子), 于是得到一个新点: 所以线性搜索是求解一元函数 的最优化问 题(也叫一维最优化问题或 一维搜索)。 一般地,一维优化问题可描述为: 或解

主要介绍的搜索方法 搜索区间的确定 黄金分割法(0.618法) 二次插值法 Newton法 1、直接法:迭代过程中只需要计算函数值; 2、微分法:迭代过程中还需要计算目标函数的导数;

搜索区间的确定 常用的一维直接法有消去法和近似法两类。它们都是从某个初始搜索区间出发,利用单峰函数的消去性质,逐步缩小搜索区间,直到满足精度要求为止。 单峰函数 定义:如果函数f(x)在区间[a,b]上只有一个极值点, 则称f(x)为[a, b]上的单峰函数。 f(x) x a b 连续单峰函数

搜索区间的确定 单峰函数具有一个重要的消去性质 定理:设f(x)是区间[a,b]上的一个单峰函数, x*∈[a,b]是其极小点, x1 和x2是[a, b]上的任意两点, 且a<x1 <x2<b,那么比较f(x1)与f(x2)的值后, 可得出如下结论: f(x) x a b (I) 消去[a, x1 ] x* x1 x2 (II) 消去[x2, b] (II) 若f(x1) < f(x2), x*∈[a,x2] (I) 若f(x1)≥f(x2),x*∈[x1,b] 在单峰函数的区间内,计算两个点的函数值,比较大小后,就能把搜索区间缩小。在已缩小的区间内,仍含有一个函数值,若再计算另一点的函数值,比较后就可进一步缩小搜索区间 .

进退方法 由单峰函数的性质可知, 函数值在极小点左边严格下降, 在右边严格上升。 从某个初始点出发, 沿函数值下降的方向前进, 直至发现函数值上升为止。由两边高,中间低的三点,可确定极小点所在的初始区间。 f(x) x a b x* x0 x1 x2

基本算法 1、选定初始点a 和步长h; 2、计算并比较f(a)和f(a+h);有前进(1)和后退(2)两种情况: 则步长加倍,计算f(a+3h)。若f(a+h) ≤f(a+3h), 令 a1=a, a2=a+3h, 停止运算;否则将步长加倍,并重复上述运算。 (1) 前进运算:若f(a) ≥f(a+h), (2) 后退运算:若f(a) < f(a+h), 则将步长改为-h。计算f(a-h), 若f(a-h) ≥ f(a), 令 a1=a-h, a2=a+h, 停止运算;否则将步长加倍,继续后退。 f(x) x f(x) x a+h a a a+7h a+h a-h a-7h a1 b1 a1 b1 a-3h a+3h

主要缺陷 效率低 步长选择问题 问题的局限性

区间消去法-黄金分割法 消去法的思想:反复使用单峰函数的消去性质,不断缩小包含极小点的搜索区间,直到满足精度为止。 消去法的优点:只需计算函数值,通用性强。 消去法的设计原则:(1)迭代公式简单;(2)消去效率高; (3)对称: x1-a = b-x2 ;(4)保持缩减比:λ=(保留的区间长度/原区间长度) 不变。(使每次保留下来的节点, x1或 x2 ,在下一次的比较中成为一个相应比例位置的节点 )。 黄金分割 x a b L λL (1-λ)L 取 “ +”,λ=0.61803398874189

区间消去法-黄金分割法 黄金分割法的基本思想 黄金分割重要的消去性质: 设x1,x2 为[a, b] 中对称的两个黄金分割点, x1为[a,x2]的黄金分割点 设x1,x2 为[a, b] 中对称的两个黄金分割点, a b L x1 x2 λL (1-λ)L λL (1-λ)L x2为[x1,b]的黄金分割点 黄金分割比λ  0.618,所以此法也称为0.618法。 在进行区间消去时,不管是消去[a, x1],还是消去[x2,b],留下来的区间中还含一个黄金分割点,只要在对称位置找另一个黄金分割点,又可以进行下一次区间消去。

!!! 在迭代过程中,四个点的顺序始终应该是 a<x1 < x2 <b 开始 a b x2 x1 x1 +x2 = a+b 给定a0 , b0 , a=a0 ,b= b0 , =0.618034 x2 =a+(b-a), x1 =a+b-x2 f2 =f(x2), f1 =f(x1) x*∈[x1, b] x*∈[a, x2] f1 f2 !!! 在迭代过程中,四个点的顺序始终应该是 a<x1 < x2 <b x*=x2, f*=f2 是 b-x1 <  否 x*=x1, f*=f1 结束 是 是 x2 –a<  a=x1, x1= x2, f1 =f2 x2 =a+b- x1, f2 =f(x2) 否 b=x2, x2= x1, f2 =f1 x1 =a+b- x2, f1 =f(x1) 否

需要注意的几点… 终止限不要取得太小; 使用双精度运算; 经过若干次运算后,转到算法中的第3步,重新开始。 1、优点:算法简单,效率高,只计算函数值,对函数要求低,稳定性好, 对多峰函数或强扭曲的,甚至不连续的,都有效; 2、缺点:对解析性能好的单峰函数,与后面要介绍的二次插值法、三次 插值法及牛顿-拉夫森法等比较,计算量较大,收敛要慢。

算例 f(x)=x2, a=-1.5, b=1;精度10-5 a x1 x2 b -3.6034e-005 2.9804e-006 2.7093e-005 6.6107e-005 22 0.618034 0.618034 (x1-a)/(x2-a) (b-x2)/(b-x1) -3.6034e-005 -1.1922e-005 2.9804e-006 2.7093e-005 23 0.618034 0.618034 -1.1922e-005 2.9804e-006 1.219e-005 2.7093e-005 24 0.618035 0.618035 -1.1922e-005 -2.7117e-006 2.9804e-006 1.219e-005 25 0.618032 0.618032 -1.1922e-005 -6.2296e-006 -2.7117e-006 2.9804e-006 26 0.618038 0.618038 x*= -2.7117e-006 若用0.618效果较差

二分法 设 f (x)在 [a ,b]上可微,且当导数为零时是解。 tg α<0 tg α>0 α α a x b a x b f '(x) = 0 时, x 为最小点, x= x* ; f '(x) > 0 时, x 在上升段, x* < x,去掉[x ,b] ; f' (x) < 0 时, x 在下降段, x* > x,去掉[a, x] . α a x b tg α<0 f′ ( x ) a x b α tg α>0 f′ ( x )

二分法 我们知道, 在极小点 , 且 时, 递减, 即 , 而当 ,函数递增, 即 。 若找到一个区间[a, b], 满足性质 ,则 的极小点 , 且 , 为找此 , 取 , 若 , 则在 中有极小点,这时 用 作为新的区间[a, b], 继续这个过程,逐步将区间 [a, b]缩小, 当区间[a, b]的长度充分小时, 或者当 充分小时, 即可将[a, b]的中点取做极小点的近似点, 这时有估计:

二分法 其中区间[a, b]的确定,一般可采用“进退法”。 假设 f(x) 是具有极小点的单峰函数, 则必存在区间[a, b],使f '(a)<0, f '(b)>0。 由f '(x)的连续性可知,必有x*(a, b),使f '(x)=0 f '(x) x a b a1 b1 a2 b2 优点:计算量较少,总能找到最优点 缺点:要计算导数值,收敛速度较慢,收敛速度为一阶

梯度法 迭代的基本公式 如何选择下降最快的方向?

梯度法 梯度法的基本思路 梯度法的基本步骤

梯度法 解:

梯度法 收敛性

梯度法的锯齿现象 最速下降法仅是算法的局部性质。对于许多问题,全局看最速下降法并非“最速下降”,而是下降的较缓慢。数值试验表明,当目标函数的等值线接近于一个圆(球)时,最速下降法下降较快,而当目标函数的等值线是一个扁长的椭球时,最速下降法开始几步下降较快,后来由于出现“锯齿”现象,下降就比较缓慢。

梯度法的锯齿现象 其原因就是精确一维搜索(最优步长)满足 f(x(k+1)) T dk =0, 即 f(x(k+1)) T f(x(k)) =dk+1Tdk =0, 这表明在相邻的两个迭代点上函数f(x)的两个梯度方向是互相直交的,即,两个搜索方向互相直交,这就产生了锯齿形状。当接近极小点时,步长愈小,前进愈慢。 这就造成了最优步长的最速下降法逼近极小点过程是“之”字形,并且越靠近极小点步长越小,移动越慢,以至在实际运用中在可行的计算时间内得不到需要的结果。 这似乎与“最速下降”的名称矛盾。其实不然,因为梯度是函数局部性质,从局部看,函数在这一点附近下降的很快,然而从整体看,则走过了许多弯路,因此反而是不好的。

梯度法 例:问题: 为了清除最优步长最速下降法中两个搜索方向正交的不良后果,人们发现了不少方法,如: (1) 选择不同初始点 取初点 为求 , 沿 方向从 出发求 的极小点 即进行线搜索 则 解得

梯度法 然后再从 开始新的迭代,经过10次迭代,得最优解 计算中可以发现,开始几次迭代,步长比较大,函数值下将降较快但当接进最优点时,步长很小,目标函数值下降很慢。如果不取初点为 而取 虽然后一初点较前一初点离最优点 远,但迭代中不会出现上面的锯齿现象。这时: 可见:造成距齿现象与初始点的选择有关,但怎样选一个初始点也是一件困难的事。 一步就得到了极小点。

梯度法 (2)采用不精确的一维搜索:用一维搜索求出的步长为 时,我们不取 ,而用 的一个近似值作为 , 这样可使相邻两个迭代点处的梯度不正交,从而改变收敛性。 对于最速下降法,有时为了减少计算工作量,不采用直线搜索确定步长,而采用固定步长λ的方法,称为固定步长最速下降法。只要λ充分小,总有: 但λ到底取多大,没有统一的标准, λ取小了,收敛太慢,而λ取大了,又会漏掉极小点。——不精确线搜索解决这个问题

几何意义 下面说明最速下降法收敛 性的几何意义。考虑具有对称正定矩阵的函数 其中 这个函数的等值线为 (c>0) ,改写为:

几何意义 这是以 和 为半轴的橢圆,从下面的分析可见 两个特征值的相对大小决定最速下降法的收敛性。 这是以 和 为半轴的橢圆,从下面的分析可见 两个特征值的相对大小决定最速下降法的收敛性。 (1)当 时,等值线变为圆 此时 因而由上述定理知: 即只需迭代一步就到了极小点,这表明最速下降法用于等值线为圆的目标函数时,从任意初始点出发,只需迭代一步就到了极小点。 (2)当 时, 等值线为椭圆。此时对于一般的初始点将产生锯齿现象。

几何意义 (3)当 , 等值线是很扁的椭圆,此时 对于一般的初始点收敛速度可能十分缓慢,锯齿现象严重。

Newton法 (一)基本Newton法 设函数f(x)是二次可微函数, 又设函数x(k)是f(x)的极小点的一个 由最速下降法可知,从全局角度来看,负梯度方向一般不是一个特别好的方向,有没有更好的方向 (一)基本Newton法 设函数f(x)是二次可微函数, 又设函数x(k)是f(x)的极小点的一个 估计,我们把设函数f(x)在x(k)展成Taylor级数,并取二阶近似: 取 f(∆x; x(k))的平稳点作为f(x) 最优点的一个近似点 f(x)在x(k)处的 二次近似函数 令f (∆x; x(k)) = f (x(k))+ 2f (x(k))x = 0 设函数f(x)的Hesse矩阵可逆,由上式可得:

Newton法 x- x(k) = x = -2f (x(k))-1f (x(k)) Newton法迭代公式: x(k+1) = x(k)-2f (x(k))-1f (x(k)) 或 x(k+1) = x(k)-H(x(k))-1g(x(k)) f(x; x(k)) 这样,知道x(k)后,算出在这一点处目标函数的梯度和Hesse矩阵的逆,代入便得到后继点x(k+1) 。 -H(x(k))-1g(x(k)) x(k+1) x(k) ! 当f(x)是单变量函数时,本方法即为一维搜索的Newton法! ! 当f(x)是二次函数时,一次迭代就可达到平稳点 !

Newton法 开始 给定x(0) ,  , 令 k=0 计算g(k) =f( x(k ) ) 是 ||g(k )|| <  x*=x(k) 是 结束 否 计算 H(x(k)) p(k) =-H(x(k))-1g(k) x(k+1) = x(k) +p(k) k=k+1

Newton法 例子 例 用基本Newton法求函数 f (x1, x2)=8x12+4x1x2+5x22 的极小点。 初始点取为x(0)=[10, 10]T 。 解: f (x)=[16x1+4x2, 4x1+10x2 ]T 2f (x)=H(x)= 16 4 4 10 H(x)-1 = 10 - 4 -4 16 1 144 x(1) = x(0)-H(x(0))-1f (x(0)) 10 = - = 10 - 4 -4 16 1 144 200 140 因为f(x)是二次函数,所以一步迭代就达到平稳点,又因为H(x(1))是正定矩阵,所以x(1)是极小点。

Newton法 例子 例:用Newton法求 的极小点。 解:取初点 则: 代入Newton迭代公式得: 此即为问题的最优点

Newton法的几点说明 1、基本Newton法要求Hesse矩阵具有逆矩阵。 如果H(x(k))是正定的,则H(x(k))-1必存在,从而算法是可行的,并且保证求得 的平稳点是极小点。 然而在迭代过程中要求H(x(k))是正定的这一条件不一定能保证,只有当初始 点合适时才能满足。一般在极小点附近的Hesse矩阵容易为正定的。 所以基本Newton法在极小点附近才比较有效。 2、 Newton法的搜索方向-H (x)-1f (x)不一定是下降方向。 因为若是下降方向,则应有f (x)T[-H (x)-1f (x)]<0,即 f (x)TH (x)-1f (x)>0,但由于H (x)-1不一定是正定的,所以上式不一定成立。

Newton法的几点说明 3、Newton法的最大优点是:当初始点选得合适时收敛很快,具有二阶收敛速度,是目前讲过的算法中最快的一种,且不需一维搜索。 对初始点要求高,一般要求初始点离极小点较近,否则不收敛。有时即使是收敛的,但因初始点离极大点或鞍点较近,会收敛于极大点或鞍点。 4、方向-H (x)-1f (x)称为Newton方向,是一个好方向,对二次函数此方向直指平稳点。 对于目标函数是二次函数的无约束优化问题,从任意初始点出发,利用Newton法一步迭代即可得到最优解,也就是Newton法具有二次终止性。

沿Newton方向一维搜索得到的最优步长 固定的步长因子不能保证目标函数有合理的改善,甚至不能保证算法下降,因此有必要对牛顿算法作一些改进,一个最直接的改进是:在牛顿算法中加入一维搜索。 修正(阻尼)Newton法 修正Newton迭代公式: x(k+1) = x(k)- tk H(x(k))-1f (x(k)) 沿Newton方向一维搜索得到的最优步长 保证了 f(x(k+1)) ≤f(x(k)) , 且不必要求H(x)为正定矩阵。 ? 出现 (1) H(x(k)) -1不存在;或(2) tk =0 时怎么办 ? 改用最速下降法 ,即 p(k) =- f (x(k)) 修正Newton法与基本Newton法的优点是: 收敛快,程序简单。前者更实用可靠。 缺点:要求计算Hesse矩阵及其逆矩阵,计算量大,尤其当维数n较大时。

要求计算导数的插值法 优缺点 1、优点:收敛速度快;在f'(x)=0的单根处,是2阶收敛;在f'(x)=0的重根处,是线性收敛。 2、缺点:需要求二阶导数,若用数值导数代替,由于舍入误差将影响收敛 速度; 收敛性还依赖于初始点及函数性质。 f ’(x) x !!! 通常在计算程序中规定最大迭代次数,当次数达到K还不能满足精度时, 则认为不收敛,要换一个初始点。

要求计算导数的插值法 二点二次插值 三次插值 割线法——基本思想:用割线代替Newton法中的切线,并与区间消去法相结合。 a f ’(x) x b 割线法——基本思想:用割线代替Newton法中的切线,并与区间消去法相结合。 c x* 三次插值 基本思想与二次插值法类似:用四个已知值(如两个点函数值及其导数值) 构造一个三次多项式P3(x),用P3(x)的极小点近似目标函数的极小点x*