第8章矩阵特征值计算 8.1 特征值性质和估计 8.2 幂法及反幂法 8.3 正交变换与矩阵分解 8.4 QR方法.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

第八章第四节机动目录上页下页返回结束一个方程所确定的隐函数及其导数隐函数的微分法.

常系数线性微分方程组 §5.3 常系数线性方程组. 常系数线性微分方程组一阶常系数线性微分方程组 : 本节主要讨论 (5.33) 的基解矩阵的求法.

2.6 隐函数微分法第二章第二章二、高阶导数一、隐式定义的函数三、可微函数的有理幂. 一、隐函数的导数若由方程可确定 y 是 x 的函数, 由表示的函数, 称为显函数. 例如, 可确定显函数可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此隐函数求导方法.

5.4 微分一、微分概念二、微分的运算法则与公式三、微分在近似计算上的应用. 引例一块正方形金属片受热后其边长 x 由 x 0 变到 x 0  x  考查此薄片的面积 A 的改变情况  因为 A  x 2  所以金属片面积的改变量为  A  (x 0 

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

第二章导数与微分. 二、微分的几何意义三、微分在近似计算中的应用一、微分的定义 2.3 微分.

第三节微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出实例 : 正方形金属薄片受热后面积的改变量.

§3.4 空间直线的方程.

3.4 空间直线的方程.

圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.

第五章二次型. 第五章二次型知识点1---二次型及其矩阵表示二次型的基本概念 1. 线性变换与合同矩阵 2.

第3节二次型与二次型的化简一、二次型的定义二、二次型的化简（矩阵的合同）下页.

§1 二阶与三阶行列式 ★二元线性方程组与二阶行列式 ★三阶行列式

一、二阶行列式的引入用消元法解二元线性方程组. 一、二阶行列式的引入用消元法解二元线性方程组.

第三章函数逼近 — 最佳平方逼近.

§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间线性空间是线性代数的高等部分，是代数学

第一章行列式第五节 Cramer定理设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式

第四章　函数的积分学第六节　微积分的基本公式一、变上限定积分二、微积分的基本公式.

第5章定积分及其应用基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法

第三节格林公式及其应用（2）一、曲线积分与路径无关的定义二、曲线积分与路径无关的条件三、二元函数的全微分的求积四、小结.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第二章　导数与微分第二节　函数的微分法一、导数的四则运算二、复合函数的微分法.

§4.3 常系数线性方程组.

第三章导数与微分习题课主要内容典型例题.

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第三讲矩阵特征值计算及其应用 — 正交变换与QR方法.

第5章 §5.3 定积分的积分法换元积分法不定积分分部积分法换元积分法定积分分部积分法.

第2章 Z变换 Z变换的定义与收敛域 Z反变换系统的稳定性和H(z) 系统函数.

第二章矩阵(matrix) 第8次课.

元素替换法 ——行列式按行(列)展开（推论）

!!! 请记住：矩阵是否等价只须看矩阵的秩是否相同。

§2 求导法则 2.1 求导数的四则运算法则下面分三部分加以证明, 并同时给出相应的推论和例题 .

I. 线性代数的来龙去脉 -----了解内容简介

第四章矩阵 §1 矩阵概念的一些背景 §6 初等矩阵 §4 矩阵的逆 §5 矩阵的分块 §2 矩阵的运算 §3 矩阵乘积的行列式与秩

第一章函数与极限.

第八章线性方程组的迭代解法.

实数与向量的积.

线性代数第二章矩阵 §1 矩阵的定义定义：m×n个数排成的数表 3) 零矩阵： 4) n阶方阵：An=[aij]n×n

线性代数厦门大学线性代数教学组 2019年4月24日6时8分 / 45.

特征值与特征向量一、特征值与特征向量的概念二、特征值和特征向量的性质.

复习：若A(x1,y1,z1) , B(x2,y2,z2), 则 AB = OB - OA=(x2-x1 , y2-y1 , z2-z1)

定理21.9(可满足性定理)设A是P(Y)的协调子集，则存在P(Y)的解释域U和项解释，使得赋值函数v(A){1}。

第16讲相似矩阵与方阵的对角化主要内容： 1.相似矩阵 2. 方阵的对角化.

§8.3 不变因子一、行列式因子二、不变因子.

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

1.设A和B是集合，证明：A=B当且仅当A∩B=A∪B

第三章　函数的微分学第二节　导数的四则运算法则一、导数的四则运算二、偏导数的求法.

4) 若A可逆，则也可逆，证明：所以.

第五章相似矩阵及二次型.

线性代数第十一讲分块矩阵.

2.2矩阵的代数运算.

第15讲特征值与特征向量的性质主要内容：特征值与特征向量的性质.

线性代数厦门大学线性代数教学组 2019年5月12日4时19分 / 45.

A经有限次初等变换化为B,称A与B等价,记作A→B.

高中数学必修平面向量的基本定理.

§2 方阵的特征值与特征向量.

第三节函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.

定义5 把矩阵 A 的行换成同序数的列得到的矩阵,

第四节向量的乘积一、两向量的数量积二、两向量的向量积.

第四章　函数的积分学第七节　定积分的换元积分法　　　与分部积分法一、定积分的换元积分法二、定积分的分部积分法.

教学大纲（甲型，54学时）教学大纲（乙型， 36学时）

第六章线性方程组的迭代法 — Jacobi, G-S and SOR.

第三节数量积向量积混合积一、向量的数量积二、向量的向量积三、向量的混合积四、小结思考题.

§4.5 最大公因式的矩阵求法（ Ⅱ ）.

§1 向量的内积、长度及正交性 1. 内积的定义及性质 2. 向量的长度及性质 3. 正交向量组的定义及求解 4. 正交矩阵与正交变换.

第三章线性方程组 §4 n维向量及其线性相关性（续7）

Presentation transcript:

第8章矩阵特征值计算 8.1 特征值性质和估计 8.2 幂法及反幂法 8.3 正交变换与矩阵分解 8.4 QR方法

8.1 特征值性质和估计 8.1.1 特征值问题及其性质设矩阵，特征值问题是求和非零向量使（1.1） 8.1 特征值性质和估计 8.1.1 特征值问题及其性质设矩阵，特征值问题是求和非零向量使（1.1）其中是矩阵属于特征值的特征向量. 求的特征值问题（1.1）等价于求的特征方程（1.2）的根.

定理1 设为的特征值, ，则（1）为的特征值（为常数 ); （2）为的特征值，即（3）为的特征值；

定理2 （1）设可对角化，即存在非奇异矩阵使的充要条件是具有个线性无关的特征向量. （2）如果有个不同的特征值则对应的特征向量线性无关.

定理3 设为对称矩阵，则：（1）的特征值均为实数；（2）有个线性无关的特征向量；（3）存在一个正交矩阵使且为特征值，而的列向量为的对应于的特征向量.

定理4 设为对称矩阵（其特征值次序记为则（1.3）记称为矩阵的瑞利（Rayleigh）商. 证明只证 1. 由于为实对称矩阵，可将对应的特征向量正交规范化，则有

设为中任一向量，则有展开式于是从而1成立. 结论1说明瑞利商必位于和之间.

8.1.2 特征值估计与扰动定义1 设 .令 (1) (2) 集合 . 称复平面上以为圆心，以为半径的所有圆盘为的格什戈林（Gerschgorin）圆盘.

定理5 （格什戈林圆盘定理）（1）设，则的每一个特征值必属于下述某个圆盘之中（1.4）或者说，的特征值都在复平面上个圆盘的并集中. （2）如果有个圆盘组成一个连通的并集，且与余下个圆盘是分离的，则内恰包含的个特征值. 特别地，如果的一个圆盘是与其他圆盘分离的 (即孤立圆盘)，则中精确地包含的一个特征值.

证明只就(1)给出证明. 设为的特征值，即记考虑的第个方程，即或于是

即这说明，的每一个特征值必位于的一个圆盘中，并且相应的特征值一定位于第个圆盘中. 其中是对应特征向量绝对值最大的分量的下标.

利用相似矩阵性质，有时可以获得的特征值进一步的估计，即适当选取非奇异对角阵并做相似变换 . 适当选取可使某些圆盘半径及连通性发生变化.

例1 估计矩阵特征值的范围. 解的3个圆盘为由定理5，可知的3个特征值位于3个圆盘的并集中，由于是孤立圆盘，所以内恰好包含的一个特征值（为实特征值），即

的其他两个特征值包含在的并集中. 现选取对角阵做相似变换的3个圆盘为

这样，3个圆盘都成为了孤立圆盘，每一个圆盘都包含的一个特征值（为实特征值）且有估计

下面讨论当有扰动时产生的特征值扰动，即有微小变化时特征值的敏感性. 定理6 （Bauer-Fike定理）设是的一个特征值，且则有（1.5）其中为矩阵的范数，证明只要考虑 .这时非奇异，设是对应于的特征向量，由左乘可得

是非零向量.上式两边取范数有而对角矩阵的范数为所以有这就得到（1.5）式.这时总有中的一个取到值.

由定理6可知是特征值扰动的放大系数，但将对角化的相似变换矩阵不是唯一的，所以取的下确界（1.6）称为特征值问题的条件数. 只要不很大，矩阵微小扰动只带来特征值的微小扰动.但是难以计算，有时只对一个，用代替 .

特征值问题的条件数和解线性方程组的条件数是两个不同的概念，对于一个矩阵，两者可能一大一小. 关于计算矩阵的特征值问题，当时，还可以按行列式展开的方法求特征方程的根.但当较大时，如果按展开行列式的方法，首先求出的系数，再求的根，工作量就很大，用这种方法求特征值是不切实际的, 需要研究求的特征值及特征向量的数值方法.

8 . 2 幂法及反幂法 8.2.1 幂法幂法是一种计算矩阵主特征值（矩阵按模最大的特征 8 . 2 幂法及反幂法 8.2.1 幂法幂法是一种计算矩阵主特征值（矩阵按模最大的特征值）及对应特征向量的迭代方法，特别适用于大型稀疏矩阵. 反幂法是计算海森伯格阵或三对角阵的对应一个给定近似特征值的特征向量的有效方法之一. 设实矩阵有一个完全的特征向量组，其特征值为，相应的特征向量为 .

已知的主特征值是实根，且满足条件（2.1）现讨论求及的方法. 幂法的基本思想是任取一个非零的初始向量，由矩阵构造一向量序列（2.2）

称为迭代向量. 由假设，可表示为（2.3）于是其中

由假设故从而（2.4）这说明序列越来越接近的对应于的特征向量，或者说当充分大时

（2.5）即迭代向量为的特征向量的近似向量（除一个因子外）. 再考虑主特征值的计算，用表示的第个分量，则（2.6）故（2.7）也就是说两相邻迭代向量分量的比值收敛到主特征值.

这种由已知非零向量及矩阵的乘幂构造向量序列以计算的主特征值及相应特征向量的方法称为幂法. 由（2.6）式知，的收敛速度由比值来确定，越小收敛越快，但当时收敛可能就很慢. （2.6）

定理7 设有个线性无关的特征向量，主特征值满足则对任何非零初始向量 ,(2.4),(2.7)式成立. 即（2.4）（2.7）

如果的主特征值为实的重根，即，且又设有个线性无关的特征向量，对应的个线性无关特征向量为，则由（2.2）式（2.2）这说明当的主特征值是实的重根时，定理7的结论还是正确的.

应用幂法计算的主特征值及对应的特征向量时，迭代向量的各个不等于零的分量将随而趋向于无穷（或趋于零）. 如果（或），这样在计算机实现时就可能“溢出”. 为了克服这个缺点，就需要将迭代向量加以规范化. 设有一向量，将其规范化得到向量其中表示向量的绝对值最大的分量，即如果有

则，且为所有绝对值最大的分量中的最小下标. 主特征值为单特征值的条件下幂法可这样进行：任取一初始向量，构造向量序列

由（2.3）式（2.8）（2.3）

这说明规范化向量序列收敛到主特征值对应的特征向量. 同理，可得到

收敛速度由比值确定.

定理8 设有个线性无关的特征向量，主特征值满足 ,则对任意非零初始向量，按下述方法构造的向量序列（2.9）则有

例2 用幂法计算的主特征值和相应的特征向量. 计算过程为结果如表8-1.

表8-1的结果是用8位浮点数字进行运算得到的，的分量值是舍入值. 于是得到及相应的特征向量和相应的特征向量的真值（8位数字）为

8.2.2 加速方法原点平移法由前面讨论，应用幂法计算的主特征值的收敛速度主要由比值来决定，但当接近于1时，收敛可能很慢. 8.2.2 加速方法原点平移法由前面讨论，应用幂法计算的主特征值的收敛速度主要由比值来决定，但当接近于1时，收敛可能很慢. 一个补救的办法是采用加速收敛的方法. 引进矩阵其中为选择参数.

设的特征值为，则的相应特征值为而且的特征向量相同. 如果要计算的主特征值，就要适当选择使仍然是的主特征值，且使对应用幂法，使得在计算的主特征值的过程中得到加速. 这种方法通常称为原点平移法.

例3 设有特征值比值 . 作变换则的特征值为应用幂法计算的主特征值的收敛速度的比值为

选择有利的值，虽然能够使幂法得到加速，但问题在于如何选择适当的参数 . 设的特征值满足（2.10）则不管如何，的主特征值为或 . 当希望计算及时，首先应选择使且使收敛速度的比值

显然，当 , 即时为最小，这时收敛速度的比值为当的特征值满足（2.10）且能初步估计时，就能确定的近似值. 当希望计算时，应选择（2.10）使得应用幂法计算得到加速.

例4 计算矩阵的主特征值. 作变换取，则对应用幂法，计算结果如表8-2.

由此得的主特征值为 , 的主特征值为

与例2结果比较，上述结果比例3迭代15次还好. 若迭代15次，（相应的 ). 原点位移的加速方法，是一个矩阵变换方法. 这种变换容易计算，又不破坏矩阵的稀疏性，但的选择依赖于对的特征值分布的大致了解.

瑞利商加速定理9 设为对称矩阵，特征值满足对应的特征向量满足，应用幂法计算的主特征值，（2.8）则规范化向量的瑞利商给出的较好的近似证明由（2.8）式及

得（2.11）

8.2.3 反幂法反幂法用来计算矩阵按模最小的特征值及其特征向量，也可用来计算对应于一个给定近似特征值的特征向量. 8.2.3 反幂法反幂法用来计算矩阵按模最小的特征值及其特征向量，也可用来计算对应于一个给定近似特征值的特征向量. 设为非奇异矩阵，的特征值次序记为相应的特征向量为，则的特征值为对应的特征向量为 .

因此计算的按模最小的特征值的问题就是计算的按模最大的特征值的问题. 对于应用幂法迭代（称为反幂法），可求得矩阵的主特征值，从而求得的按模最小的特征值 . 反幂法迭代公式为：任取初始向量 , 构造向量序列迭代向量可以通过解方程组求得.

定理10 设为非奇异矩阵且有个线性无关的特征向量，其对应的特征值满足则对任何初始非零向量，由反幂法构造的向量序列满足收敛速度的比值为 .

反幂法中也可以用原点平移法来加速迭代过程或求其他特征值及特征向量. 如果矩阵存在，其特征值为对应的特征向量仍然是 . 对矩阵应用幂法，得到反幂法的迭代公式（2.12）

如果是的特征值的一个近似值，且设与其他特征值是分离的，即就是说是的主特征值，这时也可用反幂法计算特征值及特征向量.

设有个线性无关的特征向量，则其中

同理可得：定理11 设有个线性无关的特征向量，的特征值及对应的特征向量分别记为及 , 而为的近似值，存在，且则对任意的非零初始向量，由反幂法迭代公式（2.12）构造的向量序列满足（2.12）

即且收敛速度由比值确定. 由该定理知，对 (其中 ) 应用反幂法，可用来计算特征向量 . 只要选择的是的一个较好的近似且特征值分离情况较好，一般很小，常常只要迭代一二次就可完成特征向量的计算.

反幂法迭代公式中的是通过解方程组求得的. 为了节省工作量，可以先将进行三角分解其中为某个排列阵. 于是求相当于解两个三角形方程组

可以按下述方法选择：选使（2.13）用回代求解（2.13）即得，然后再按公式（2.12）进行迭代. 反幂法计算公式（2.12） 1. 分解计算 2. 反幂法迭代

例5 用反幂法求的对应于计算特征值（精确特征值为 ) 的特征向量（用5位浮点数进行运算）. 解用部分选主元的三角分解将分解为其中

由，得由，得

对应的特征向量是由此看出是的相当好的近似. 特征值，的真值为

8.3 正交变换与矩阵分解

8.3.1 豪斯霍尔德变换定义2 设向量且，为初等反射阵(或称为豪斯霍尔德变换). 如果记 , 则（3.1）

定理12 设有初等反射阵 ,其中则 (1) 是对称矩阵，即 (2) 是正交矩阵，即 (3) 设为对称矩阵，那么亦是对称矩阵.  证明只证的正交性，其他都可通过验证得到.

设向量 , 则显然 是一个初等反射阵. 初等反射阵的几何意义. 考虑以为法向量且过原点的超平面 . 设任意向量，则 , 其中 . 于是

对于，从而对任意向量，总有其中为关于平面S的镜面反射(见图8-1). 图8-1

定理13 设为两个不相等的维向量，则存在一个初等反射阵，使证明令，则得到一个初等反射阵而且

因为所以是使成立的唯一长度等于1的向量(不计符号).

定理14 (约化定理) 设，则存在初等反射阵 ,使，其中（3.2）证明记 ,设 ,取，则有于是由定理13存在变换其中 , 使

记  于是其中显然如果和异号，那么计算时有可能出现两相近数相减的情况，有效数字可能损失.

取和有相同的符号，即取在计算时，为了避免上溢或下溢，将规范化 则有使 , 其中

例6 设，则 .取可以验证

8.3.2 吉文斯变换设 , 则变换是平面上向量的一个旋转变换，其中为正交矩阵.

中变换：其中而（3.3）

称为中平面的旋转变换，也称吉文斯变换. 称为平面旋转矩阵. 显然，具有性质： (1) 与单位阵只是在位置元素不一样，其他相同. (2) 为正交矩阵 (3) (左乘)只需计算第行与第行元素，即对  有

其中 (4) (右乘)只需计算第列与第列元素利用平面旋转变换，可使向量中的指定元素变为零.

定理15 (约化定理) 设 ,其中不全为零，则可选择平面旋转阵 ,使证明取 . 由  , 利用矩阵乘法，显然有

由的取法得

8.3.3 矩阵的QR分解与舒尔分解定理16 设非奇异，则存在正交矩阵使其中为上三角阵. 证明先用吉文斯变换给出构造的方法. 定理16 设非奇异，则存在正交矩阵使其中为上三角阵. 证明先用吉文斯变换给出构造的方法. （1）第1步约化，由设有使，则可选择吉文斯变换，将处的元素化为零.若，则存在使得

可简记为 , 其中 (2) 第步约化：设上述过程已完成第1步至第步，于是有由设有使，若，则可选择吉文斯变换，使

其中 (3) 继续上述约化过程，最后则有令，它是一个正交阵，有也可以用豪斯霍尔德变换构造正交阵，记，它的第一列记为 .不妨设，可按公式（3.2）找到矩阵，使

于是其中一般地，设

其中为阶方阵，其对角线以下元素均为0，为阶方阵，设其第一列为，可选择的豪斯霍尔德变换，使根据构造阶的变换矩阵为于是有

和有类似的形式，只是为阶方阵，其对角线以下元素是0，这样经过步运算得到其中为上三角阵，为正交矩阵. 从而有

定理17 (QR分解定理) 设为非奇异矩阵，则存在正交矩阵与上三角阵，使有分解且当的对角元为正时，分解是唯一的. 证明从定理16知，只要令就有，下面证分解的唯一性，设有两种分解其中为正交阵，为对角元均为正的上三角阵，则

由假设及对称正定矩阵的楚列斯基分解的唯一性，则得 .从而可得定理16保证了可分解为 .若非奇异，则也非奇异.如果不规定的对角元为正，则分解不是唯一的. 一般按吉文斯变换或豪斯霍尔德变换方法作出的分解，的对角元不一定是正的，设上三角矩阵，只要令

则为正交矩阵，为对角元是的上三角阵，这样便是符合定理17的唯一QR分解.

例7 设用豪斯霍尔德变换作矩阵的QR分解解按（3.2）式找豪斯霍尔德矩阵 .使则有

再找，使，得

这时一个上三角阵，但对角元皆为负数，只要令，则有是对角元为正的上三角阵.取则得

除了QR分解，矩阵的舒尔（Schur）分解也是重要的工具，它解决矩阵可约化到什么程度的问题，对复矩阵 ,则存在酉矩阵，使为一个上三角矩阵，其对角元素就是的特征值，称的舒尔分解，对于实矩阵，其特征值可能有复数，不能用正交相似变换约化为上三角阵，但它可以约化为以下形式.

定理18 (实舒尔分解）设，则存在正交矩阵，使（3.4）其中对角块为一阶或二阶方阵. 且每个一阶是的实特征值，每个二阶对角块的两个特征值是的两个共轭复特征值.

8.3.4 用正交相似变换约化一般矩阵为上海森柏格阵 8.3.4 用正交相似变换约化一般矩阵为上海森柏格阵设 . 我们的目标是选择初等反射阵，使经正交相似变换约化为一个上海森伯格阵.

（1）设其中，不妨设 , 否则这一步不需要约化. 选择初等反射阵使

其中（3.5）令则

其中

(2) 第步约化：重复上述过程，设对已完成第1步，…，第步正交相似变换，即有或且

其中为阶上海森伯格阵，设，于是可选择初等反射阵使，其中, 计算公式为

（3.6）令则

（3.7）其中为阶上海森伯格阵. 第步约化只需计算及 . 当为对称阵时，只需计算 .

（3）重复上述过程，则有总结上述讨论，有

定理19 （豪斯霍尔德约化矩阵为上海森伯格阵）设则存在初等反射阵使本算法约需要次乘法运算，要明显形成还需要附加次乘法.

例8 用豪斯霍尔德方法将矩阵约化为上海森伯格阵. 解选取初等反射阵使，其中 (1) 计算

则有 (2) 约化计算：令

则如果是对称的，则也对称，这时是一个对称三对角阵.

定理20（豪斯霍尔德约化对称阵为对称三对角阵）设为对称矩阵，则存在初等反射阵使

证明由定理17，存在初等反射阵使为上海森伯格阵,且亦是对称阵，因此，为对称三对角阵. 由上面讨论可知，当为对称阵时,由的一步约化计算中只需计算及 . 又由于的对称性，故只需计算的对角线以下元素. 注意到

引进记号则对对称阵用初等反射阵正交相似约化为对称三对角阵大约需要次乘法.

8.4 QR 方法 8.4.1 QR算法 QR方法是一种变换方法，是计算一般矩阵（中小型矩阵）全部特征值问题的最有效方法之一. （1）上海森伯格阵的全部特征值问题，（2）计算对称三对角矩阵的全部特征值问题，且QR方法具有收敛快，算法稳定等特点.

对于一般矩阵（或对称矩阵），则首先用豪斯霍尔德方法将化为上海森伯格阵（或对称三对角阵），然后再用QR方法计算的全部特征值. 设，且对进行QR分解，即其中为上三角阵，为正交阵. 于是可得到一新矩阵显然，是由经过正交相似变换得到，因此与特征值相同.

再对进行QR分解，又可得一新的矩阵，重复这一过程可得到矩阵序列：设将进行QR分解作矩阵求得后将进行分解形成矩阵 QR算法，就是利用矩阵的QR分解，按上述递推法则构造矩阵序列的过程.

只要为非奇异矩阵，则由QR算法就完全确定 . 定理21 （基本QR方法）设 . 构造QR算法：（4.1）记，则有（1）相似于，即（2）（3）的QR分解式为

证明（1）,（2）显然，现证（3）. 用归纳法，显然，当时有，设有分解式于是其中利用了

由定理17知，将进行QR分解，即将用正交变换（左变换）化为上三角矩阵其中 , 故这就是说可由按下述方法求得：（1）左变换 (上三角阵）；（2）右变换

定理22 （QR方法的收敛性）设 , (1) 如果的特征值满足：； (2) 有标准型其中，且设有三角分解 ( 为单位下三角阵，为上三角阵），则由QR算法产生的本质上收敛于上三角矩阵，即

若记，则（4.2）（4.3）当时极限不一定存在.

定理23 如果对称矩阵满足定理20的条件，则由QR 算法产生的收敛于对角阵 . 关于QR算法收敛性的进一步结果为：设，且有完备的特征向量集合，如果的等模特征值中只有实重特征值或多重复的共轭特征值，则由QR算法产生的本质收敛于分块上三角矩阵（对角块为一阶和二阶子块）且对角块中每一个2×2子块给出的一对共轭复特征值，每一个一阶对角子块给出的实特征值，即

其中为2×2子块，它给出一对共轭特征值.

8.4.2 带原点位移的QR方法定理22中的速度依赖于比值，当很小时，收敛较快，如果为的一个估计，且对运用QR算法，定理22中的速度依赖于比值，当很小时，收敛较快，如果为的一个估计，且对运用QR算法，则元素将以收敛因子线性收敛于零，元素将比在基本算法中收敛更快. 为了加速收敛，选择数列，按下述方法构造矩阵序列，称为带原点位移的QR算法.

设对进行QR分解形成矩阵求得后，将进行QR分解（4.4）形成矩阵（4.5）

如果令，则有，并且矩阵有QR分解式在带位移QR方法中，每步并不需要形成和，可按下面的方法计算：首先用正交变换（左变换）将化为上三角阵，即当为上海森伯格阵或对称三对角阵时，可为平面旋转阵，

则下面考虑用QR方法计算上海森伯格阵的特征值. 设为上海森伯格阵，即如果，则称为不可约上海森伯格阵.

设，由定理17可选正交阵使为上海森伯格阵，对应用QR算法. QR算法：对于（4.6）假设由（4.6）迭代产生的每一个上海森伯格阵都是不可约的，否则，若在某步有

于是，这个问题就分离为与两个较小的问题. 当或时，有或由此可得到的特征值，或由右下角二阶阵的特征值求出 .

对降阶的，用类似的方法可求出的其余特征值. 实际上，每当的次对角元适当小时，就可进行分离. 例如，如果就把视为零. 一般取，其中是计算中有效数字的位数.

8.4.3 用单步QR方法计算上海森伯格阵特征值上海森伯格阵的单步QR方法：选取并设对于（用位移来加速收敛）由实际计算为

（1）左变换：（2）右变换：其中为平面旋转阵. （1）左变换计算确定平面旋转阵使

设已完成第1次，第次左变换，即有（4.7）第次变换的工作就是要确定平面旋转阵，使变为0，且完成第次左变换

这时只需计算（4.7）阵第行及第行元素. 这是因为平面旋转阵只改变矩阵的行和行. 继续这一过程，最后有（2）右变换计算在第次右变换中，只需计算第列及第列元素.

最后由上述讨论指出，如果为上海森伯格阵，则用QR算法产生的亦是上海森伯格阵. 即上海森伯格阵在QR变换下形式不变.

讨论一个极端的情况定理24 设：（1）为不可约上海森伯格阵；（2）为一个特征值. 则QR方法中证明记

由设为不可约阵，则上海森伯格阵亦为不可约. 由将上海森伯格阵约化为上三角阵的平面旋转变换的取法可知又因为为奇异矩阵，从而得到 . 因此，的最后一行为，即这样在QR方法迭代中，参数可选为，即的元素. 通常可以作为特征值的最好近似.

算法1 （上海森伯格矩阵的QR算法）给定为上海森伯格阵，本算法计算且覆盖

如果用不同的位移，反复应用算法3就产生正交相似的上海森伯格阵序列 . 当充分小时，可将它置为零就得到的近似特征值 . 再将矩阵降阶，对较小矩阵连续应用算法.

例9 用QR方法计算对称三对角矩阵的全部特征值. 解选取，则

现在收缩，继续对的子矩阵进行变换，得到

故求得近似特征值为而的特征值是算法1是在实数中进行选择位移 , 不能逼近一个复特征值，所以算法3不能用来计算的复特征值.

8.4.4* 双步QR方法（隐式QR方法）第3节中将经过正交相似变换化为上海森伯格矩阵，即，其中不是唯一的. 第3节中将经过正交相似变换化为上海森伯格矩阵，即，其中不是唯一的. 但是，如果规定了正交矩阵的第一列，则和除差±1因子外唯一. 定理25 （隐式Q定理）设 , 且：（1）及都是正交阵，且有都是上海森伯格阵. （2）为不可约上海森伯格阵，且（即与第1列相同）.

则：（1） ,且 ; （2） ,其中，即和在意义上“本质上相等”. 算法1不能用来求的一个复特征值. 当的按模最小特征值是复数时，位移参数可取为某步右下角的二阶矩阵（4.8）的特征值.

当的特征值与为复数时，如果应用算法1就要引进复数运算，这对于实矩阵是不必要的. 在某些条件下，可以用正交相似变换将约化为实舒尔型. 隐式位移的QR方法，即用与作位移连续进行二次单步的QR迭代，使用复位移，又避免复数运算. （1）设为上海森伯格阵，取共轭复数作两步位移的QR方法，即

（4.9）显然有QR分解（4.10）事实上，由(4.9)式并利用有

且阵为实矩阵，这是因为（即使特征值为复数）（4.11）其中为实数. 于是，（4.10）式为实矩阵的QR分解，并且可以选取和使为实的正交阵. 由此得出（4.10）

是实矩阵. 如果用下述算法就能保证是实矩阵 (a) 直接形成实矩阵 (b) 计算阵的实QR分解 (c) 令但是(a)需要次乘法运算，不实用. （2）根据隐式Q定理，如果按下述算法进行，就有可能用次运算来实现从到的转换. (a′) 求与有相同第一列的正交阵

(b′) 应用豪斯霍尔德方法将化为一个上海森伯格阵，即记 , 上式为显然，的第一列与的第一列相同，即与第一列相同（）. 若与两者都是不可约上海森伯格阵，则由隐式Q定理与本质上相等. （3）如何寻求正交阵 .

由于 (为的QR分解），则说明第一列即是第一列的一个倍数. 于是，对阵的第一列（非零）寻求初等反射阵 , 使即这说明与具有相同的第一列. 由于 , 则

其中（4.12）双步QR方法：设为不可约上海森伯格阵. (a) 计算阵的第一列. 即按（4.12）式计算 (b) 确定初等反射阵使

即确定初等反射阵 , 使 (c) 计算初等反射阵 , 使为上海森伯格阵. 则与第一列相同, 且 .

这样上面的算法就完成了从到的变换，但没有明显的应用到位移和 .