第8章 矩阵特征值计算 8.1 特征值性质和估计 8.2 幂法及反幂法 8.3 正交变换与矩阵分解 8.4 QR方法.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
常系数线性微分方程组 §5.3 常系数线性方程组. 常系数线性微分方程组 一阶常系数线性微分方程组 : 本节主要讨论 (5.33) 的基解矩阵的求法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
5.4 微 分 一、微分概念 二、微分的运算法则与公式 三、微分在近似计算上的应用. 引例 一块正方形金属片受热后其边长 x 由 x 0 变到 x 0  x  考查此薄片的面积 A 的改变情况  因为 A  x 2  所以金属片面 积的改变量为  A  (x 0 
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第二章 导数与微分. 二、 微分的几何意义 三、微分在近似计算中的应用 一、 微分的定义 2.3 微 分.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
§3.4 空间直线的方程.
3.4 空间直线的方程.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第3节 二次型与二次型的化简 一、二次型的定义 二、二次型的化简(矩阵的合同) 下页.
§1 二阶与三阶行列式 ★二元线性方程组与二阶行列式 ★三阶行列式
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
第三章 函数逼近 — 最佳平方逼近.
§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间 线性空间是线性代数的高等部分,是代数学
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第二章 导数与微分 第二节 函数的微分法 一、导数的四则运算 二、复合函数的微分法.
§4.3 常系数线性方程组.
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三讲 矩阵特征值计算及其应用 — 正交变换与QR方法.
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第二章 矩阵(matrix) 第8次课.
元素替换法 ——行列式按行(列)展开(推论)
!!! 请记住:矩阵是否等价只须看矩阵的秩是否相同。
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
I. 线性代数的来龙去脉 -----了解内容简介
第四章 矩阵 §1 矩阵概念的一些 背景 §6 初等矩阵 §4 矩阵的逆 §5 矩阵的分块 §2 矩阵的运算 §3 矩阵乘积的行列 式与秩
第一章 函数与极限.
第八章 线性方程组 的迭代解法.
实数与向量的积.
线性代数 第二章 矩阵 §1 矩阵的定义 定义:m×n个数排成的数表 3) 零矩阵: 4) n阶方阵:An=[aij]n×n
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
特 征 值 与 特 征 向 量 一、特征值与特征向量的概念 二、特征值和特征向量的性质.
复习.
复习: 若A(x1,y1,z1) , B(x2,y2,z2), 则 AB = OB - OA=(x2-x1 , y2-y1 , z2-z1)
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§8.3 不变因子 一、行列式因子 二、不变因子.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
4) 若A可逆,则 也可逆, 证明: 所以.
第五章 相似矩阵及二次型.
线性代数 第十一讲 分块矩阵.
2.2矩阵的代数运算.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
A经有限次初等变换化为B,称A与B等价,记作A→B.
高中数学必修 平面向量的基本定理.
§2 方阵的特征值与特征向量.
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
教学大纲(甲型,54学时 ) 教学大纲(乙型, 36学时 )
第六章 线性方程组的迭代法 — Jacobi, G-S and SOR.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
§4.5 最大公因式的矩阵求法( Ⅱ ).
§1 向量的内积、长度及正交性 1. 内积的定义及性质 2. 向量的长度及性质 3. 正交向量组的定义及求解 4. 正交矩阵与正交变换.
第三章 线性方程组 §4 n维向量及其线性相关性(续7)
Presentation transcript:

第8章 矩阵特征值计算 8.1 特征值性质和估计 8.2 幂法及反幂法 8.3 正交变换与矩阵分解 8.4 QR方法

8.1 特征值性质和估计 8.1.1 特征值问题及其性质 设矩阵 ,特征值问题是求 和非零向量 使 (1.1) 8.1 特征值性质和估计 8.1.1 特征值问题及其性质 设矩阵 ,特征值问题是求 和非零向量 使 (1.1) 其中 是矩阵 属于特征值 的特征向量. 求 的特征值问题(1.1)等价于求 的特征方程 (1.2) 的根.

定理1 设 为 的特征值, , 则 (1) 为 的特征值( 为常数 ); (2) 为 的特征值,即 (3) 为 的特征值;

定理2 (1)设 可对角化,即存在非奇异矩阵 使 的充要条件是 具有 个线性无关的特征向量. (2) 如果 有 个 不同的特征值 则对应的特征向量 线性无关.

定理3 设 为对称矩阵,则: (1) 的特征值均为实数; (2) 有 个线性无关的特征向量; (3)存在一个正交矩阵 使 且 为 特征值, 而 的列 向量 为 的对应于 的特征向量.

定理4 设 为对称矩阵(其特征值次序记为 则 (1.3) 记 称为矩阵 的瑞利(Rayleigh)商. 证明 只证 1. 由于 为实对称矩阵,可将 对应的特征 向量 正交规范化,则有

设 为 中任一向量,则有展开式 于是 从而1成立. 结论1说明瑞利商必位于 和 之间.

8.1.2 特征值估计与扰动 定义1 设 .令 (1) (2) 集合 . 称复平面上以 为圆心,以 为半径的所有圆盘为 的格什戈林(Gerschgorin)圆盘.

定理5 (格什戈林圆盘定理) (1) 设 , 则 的每一个特征值必属于下述某个圆盘之中 (1.4) 或者说, 的特征值都在复平面上 个圆盘的并集中. (2) 如果 有 个圆盘组成一个连通的并集 , 且 与余下 个圆盘是分离的,则 内恰包含 的 个 特征值. 特别地,如果 的一个圆盘 是与其他圆盘分离的 (即孤立圆盘),则 中精确地包含 的一个特征值.

证明 只就(1)给出证明. 设 为 的特征值,即 记 考虑 的第 个方程, 即 或 于是

即 这说明, 的每一个特征值必位于 的一个圆盘中, 并且相应的特征值 一定位于第 个圆盘中. 其中 是对应特征向量 绝对值最大的分量的下标.

利用相似矩阵性质,有时可以获得 的特征值进一步 的估计,即适当选取非奇异对角阵 并做相似变换 . 适当选取 可使某些圆盘半径及连通性发生变化.

例1 估计矩阵 特征值的范围. 解 的3个圆盘为 由定理5,可知 的3个特征值位于3个圆盘的并集中, 由于 是孤立圆盘,所以 内恰好包含 的一个特征值 ( 为实特征值),即

的其他两个特征值 包含在 的并集中. 现选取对角阵 做相似变换 的3个圆盘为

这样,3个圆盘都成为了孤立圆盘,每一个圆盘都包 含 的一个特征值(为实特征值)且有估计

下面讨论当 有扰动时产生的特征值扰动,即 有微 小变化时特征值的敏感性. 定理6 (Bauer-Fike定理) 设 是 的一 个特征值,且 则有 (1.5) 其中 为矩阵 的范数, 证明 只要考虑 .这时 非奇异,设 是 对应于 的特征向量,由 左乘 可得

是非零向量.上式两边取范数有 而对角矩阵 的范数为 所以有 这就得到(1.5)式.这时总有 中的一个 取到 值.

由定理6可知 是特征值扰动的放大系 数,但将 对角化的相似变换矩阵 不是唯一的,所以取 的下确界 (1.6) 称为特征值问题的条件数. 只要 不很大,矩阵微小扰动只带来特征值的微小 扰动.但是 难以计算,有时只对一个 ,用 代替 .

特征值问题的条件数和解线性方程组的条件数是两个 不同的概念,对于一个矩阵 ,两者可能一大一小. 关于计算矩阵 的特征值问题,当 时,还可以 按行列式展开的方法求特征方程的根.但当 较大时,如果 按展开行列式的方法,首先求出 的系数,再求 的根,工作量就很大,用这种方法求特征值是不切实际的, 需要研究求 的特征值及特征向量的数值方法.

8 . 2 幂法及反幂法 8.2.1 幂法 幂法是一种计算矩阵主特征值(矩阵按模最大的特征 8 . 2 幂法及反幂法 8.2.1 幂法 幂法是一种计算矩阵主特征值(矩阵按模最大的特征 值)及对应特征向量的迭代方法,特别适用于大型稀疏矩 阵. 反幂法是计算海森伯格阵或三对角阵的对应一个给定 近似特征值的特征向量的有效方法之一. 设实矩阵 有一个完全的特征向量组,其特 征值为 ,相应的特征向量为 .

已知 的主特征值是实根,且满足条件 (2.1) 现讨论求 及 的方法. 幂法的基本思想是任取一个非零的初始向量 ,由矩 阵 构造一向量序列 (2.2)

称为迭代向量. 由假设, 可表示为 (2.3) 于是 其中

由假设 故 从而 (2.4) 这说明序列 越来越接近 的对应于 的特征向量, 或者说当 充分大时

(2.5) 即迭代向量 为 的特征向量的近似向量(除一个因子外). 再考虑主特征值 的计算,用 表示 的第 个 分量,则 (2.6) 故 (2.7) 也就是说两相邻迭代向量分量的比值收敛到主特征值.

这种由已知非零向量 及矩阵 的乘幂 构造向量 序列 以计算 的主特征值 及相应特征向量的方法 称为幂法. 由(2.6)式知, 的收敛速度由比值 来确定, 越小收敛越快,但当 时 收敛可能就很慢. (2.6)

定理7 设 有 个线性无关的特征向量,主特征值 满足 则对任何非零初始向量 ,(2.4),(2.7)式成立. 即 (2.4) (2.7)

如果 的主特征值为实的重根,即 , 且 又设 有 个线性无关的特征向量, 对应的 个线性无 关特征向量为 , 则由(2.2)式 (2.2) 这说明当 的主特征值是实的重根时,定理7的结论还 是正确的.

应用幂法计算 的主特征值 及对应的特征向量时, 迭代向量 的各个不等于零 的分量将随 而趋向于无穷(或趋于零). 如果 (或 ), 这样在计算机实现时就可能“溢出”. 为了克服这个缺点,就需要将迭代向量加以规范化. 设有一向量 ,将其规范化得到向量 其中 表示向量 的绝对值最大的分量, 即如果有

则 ,且 为所有绝对值最大的分量中的最小 下标. 主特征值为单特征值的条件下幂法可这样进行: 任取一初始向量 , 构造向量序列

由(2.3)式 (2.8) (2.3)

这说明规范化向量序列收敛到主特征值对应的特征向量. 同理,可得到

收敛速度由比值 确定.

定理8 设 有 个线性无关的特征向量,主特征值 满足 ,则对任意非零初始向量 ,按下述方法构造的向量序列 (2.9) 则有

例2 用幂法计算 的主特征值和相应的特征向量. 计算过程为 结果如表8-1.

表8-1的结果是用8位浮点数字进行运算得到的, 的 分量值是舍入值. 于是得到 及相应的特征向量 和相应的特征向量的真值(8位数字)为

8.2.2 加速方法 原点平移法 由前面讨论,应用幂法计算 的主特征值的收敛速度 主要由比值 来决定,但当 接近于1时,收敛可能 很慢. 8.2.2 加速方法 原点平移法 由前面讨论,应用幂法计算 的主特征值的收敛速度 主要由比值 来决定,但当 接近于1时,收敛可能 很慢. 一个补救的办法是采用加速收敛的方法. 引进矩阵 其中 为选择参数.

设 的特征值为 , 则 的相应特征值为 而且 的特征向量相同. 如果要计算 的主特征值 ,就要适当选择 使 仍然是 的主特征值,且使 对 应用幂法,使得在计算 的主特征值 的过程中 得到加速. 这种方法通常称为原点平移法.

例3 设 有特征值 比值 . 作变换 则 的特征值为 应用幂法计算 的主特征值 的收敛速度的比值为

选择有利的 值,虽然能够使幂法得到加速,但问题 在于如何选择适当的参数 . 设 的特征值满足 (2.10) 则不管 如何, 的主特征值为 或 . 当希望计算 及 时,首先应选择 使 且使收敛速度的比值

显然,当 , 即 时 为最小, 这时收敛速度的比值为 当 的特征值满足(2.10)且 能初步估计时, 就能确定 的近似值. 当希望计算 时,应选择 (2.10) 使得应用幂法计算 得到加速.

例4 计算矩阵 的主特征值. 作变换 取 , 则 对 应用幂法,计算结果如表8-2.

由此得 的主特征值为 , 的主特征值 为

与例2结果比较,上述结果比例3迭代15次还好. 若迭代15次, (相应的 ). 原点位移的加速方法,是一个矩阵变换方法. 这种变换容易计算,又不破坏矩阵 的稀疏性,但 的选择依赖于对 的特征值分布的大致了解.

瑞利商加速 定理9 设 为对称矩阵,特征值满足 对应的特征向量满足 ,应用幂法计算 的主 特征值 , (2.8) 则规范化向量 的瑞利商给出 的较好的近似 证明 由(2.8)式及

得 (2.11)

8.2.3 反幂法 反幂法用来计算矩阵按模最小的特征值及其特征向量, 也可用来计算对应于一个给定近似特征值的特征向量. 8.2.3 反幂法 反幂法用来计算矩阵按模最小的特征值及其特征向量, 也可用来计算对应于一个给定近似特征值的特征向量. 设 为非奇异矩阵, 的特征值次序记为 相应的特征向量为 , 则 的特征值为 对应的特征向量为 .

因此计算 的按模最小的特征值 的问题就是计算 的按模最大的特征值的问题. 对于 应用幂法迭代(称为反幂法),可求得矩阵 的主特征值 ,从而求得 的按模最小的特征值 . 反幂法迭代公式为: 任取初始向量 , 构造向量序列 迭代向量 可以通过解方程组 求得.

定理10 设 为非奇异矩阵且有 个线性无关的特征 向量,其对应的特征值满足 则对任何初始非零向量 ,由反幂法构造的向量 序列 满足 收敛速度的比值为 .

反幂法中也可以用原点平移法来加速迭代过程或求其他特征值及特征向量. 如果矩阵 存在,其特征值为 对应的特征向量仍然是 . 对矩阵 应用幂法,得到反幂法的迭代公式 (2.12)

如果 是 的特征值 的一个近似值,且设 与其 他特征值是分离的,即 就是说 是 的主特征值, 这时也可用反幂法计算特征值及特征向量.

设 有 个线性无关的特征向量 , 则 其中

同理可得: 定理11 设 有 个线性无关的特征向量, 的特征值及对应的特征向量分别记为 及 , 而 为 的近似值, 存在,且 则对任意的非零初始向量 ,由反幂法迭代公式 (2.12)构造的向量序列 满足 (2.12)

即 且收敛速度由比值 确定. 由该定理知,对 (其中 ) 应用反幂法, 可用来计算特征向量 . 只要选择的 是 的一个较好的近似且特征值分离情 况较好,一般 很小,常常只要迭代一二次就可完成特征 向量的计算.

反幂法迭代公式中的 是通过解方程组 求得的. 为了节省工作量,可以先将 进行三角分解 其中 为某个排列阵. 于是求 相当于解两个三角形方程组

可以按下述方法选择 : 选 使 (2.13) 用回代求解(2.13)即得 ,然后再按公式(2.12)进行迭 代. 反幂法计算公式 (2.12) 1. 分解计算 2. 反幂法迭代

例5 用反幂法求 的对应于计算特征值 (精确特征值为 ) 的特征向量(用5位浮点数进行运算). 解 用部分选主元的三角分解将 分解为 其中

由 ,得 由 ,得

对应的特征向量是 由此看出 是 的相当好的近似. 特征值 , 的真值为

8.3 正交变换与矩阵分解

8.3.1 豪斯霍尔德变换 定义2 设向量 且 , 为初等反射阵(或称为豪斯霍尔德变换). 如果记 , 则 (3.1)

定理12 设有初等反射阵 ,其中 则 (1) 是对称矩阵,即 (2) 是正交矩阵,即 (3) 设 为对称矩阵,那么 亦是对 称矩阵.  证明 只证 的正交性,其他都可通过验证得到.

设向量 , 则显然 是一个初等反射阵. 初等反射阵的几何意义. 考虑以 为法向量且过原点 的超平面 . 设任意向量 , 则 , 其中 . 于是

对于 , 从而对任意向量 , 总有 其中 为 关于平面S的镜面反射(见图8-1). 图8-1

定理13 设 为两个不相等的 维向量, 则存在一个初等反射阵 ,使 证明 令 ,则得到一个初等反射阵 而且

因为 所以 是使 成立的唯一长度等于1的向量(不计符号).

定理14 (约化定理) 设 ,则存在初等反射阵 ,使 ,其中 (3.2) 证明 记 ,设 ,取 ,则有 于是由定理13存在 变换 其中 , 使

记  于是 其中 显然 如果 和 异号,那么计算 时有可能出现两相 近数相减的情况,有效数字可能损失.

取 和 有相同的符号,即取 在计算 时,为了避免上溢或下溢,将 规范化 则有 使 , 其中

例6 设 ,则 .取 可以验证

8.3.2 吉文斯变换 设 , 则变换 是平面上向量的一个旋转变换,其中 为正交矩阵.

中变换: 其中 而 (3.3)

称为 中平面 的旋转变换,也称吉文斯变换. 称为平面旋转矩阵. 显然, 具有性质: (1) 与单位阵 只是在 位置 元素不一样,其他相同. (2) 为正交矩阵 (3) (左乘)只需计算第 行与第 行元素, 即对  有

其中 (4) (右乘)只需计算第 列与第 列元素 利用平面旋转变换,可使向量 中的指定元素变为零.

定理15 (约化定理) 设 ,其中 不全为零,则可选择平面旋转阵 ,使 证明 取 . 由  , 利用矩阵乘法,显然有

由 的取法得

8.3.3 矩阵的QR分解与舒尔分解 定理16 设 非奇异,则存在正交矩阵 使 其中 为上三角阵. 证明 先用吉文斯变换给出构造 的方法. 定理16 设 非奇异,则存在正交矩阵 使 其中 为上三角阵. 证明 先用吉文斯变换给出构造 的方法. (1)第1步约化,由设有 使 ,则可 选择吉文斯变换 ,将 处的元素化为零.若 ,则存在 使得

可简记为 , 其中 (2) 第 步约化: 设上述过程已完成第1步至第 步, 于是有 由设有 使 , 若 , 则可选择吉文斯变换 , 使

其中 (3) 继续上述约化过程,最后则有 令 ,它是一个正交阵,有 也可以用豪斯霍尔德变换构造正交阵 ,记 , 它的第一列记为 .不妨设 ,可按公式(3.2)找 到矩阵 ,使

于是 其中 一般地,设

其中 为 阶方阵,其对角线以下元素均为0, 为 阶方阵,设其第一列为 ,可选择 的豪斯霍尔德变换 ,使 根据 构造 阶的变换矩阵 为 于是有

和 有类似的形式,只是 为 阶方阵,其对角 线以下元素是0,这样经过 步运算得到 其中 为上三角阵, 为正交矩阵. 从而有

定理17 (QR分解定理) 设 为非奇异矩阵, 则存在正交矩阵 与上三角阵 ,使 有分解 且当 的对角元为正时,分解是唯一的. 证明 从定理16知,只要令 就有 , 下面证分解的唯一性,设有两种分解 其中 为正交阵, 为对角元均为正的上三角阵,则

由假设及对称正定矩阵 的楚列斯基分解的唯一性, 则得 .从而可得 定理16保证了 可分解为 .若 非奇异,则 也 非奇异.如果不规定 的对角元为正,则分解不是唯一的. 一般按吉文斯变换或豪斯霍尔德变换方法作出的分解 , 的对角元不一定是正的,设上三角矩阵 , 只要令

则 为正交矩阵, 为对角元是 的上三角阵,这样 便是符合定理17的唯一QR分解.

例7 设用豪斯霍尔德变换作矩阵 的QR分解 解 按(3.2)式找豪斯霍尔德矩阵 .使 则有

再找 ,使 , 得

这时一个上三角阵,但对角元皆为负数,只要令 , 则有 是对角元为正的上三角阵.取 则得

除了QR分解,矩阵的舒尔(Schur)分解也是重要的工 具,它解决矩阵 可约化到什么程度的问题,对复 矩阵 ,则存在酉矩阵 ,使 为一个上三角 矩阵 ,其对角元素就是 的特征值, 称 的 舒尔分解,对于实矩阵 ,其特征值可能有复数,不能用 正交相似变换约化为上三角阵,但它可以约化为以下形式.

定理18 (实舒尔分解)设 ,则存在正交矩阵 ,使 (3.4) 其中对角块 为一阶或二阶方阵. 且每个一阶 是 的实特征值,每个二阶对角块 的两个特征值是 的两个共轭复特征值.

8.3.4 用正交相似变换约化一般矩阵为 上海森柏格阵 8.3.4 用正交相似变换约化一般矩阵为 上海森柏格阵 设 . 我们的目标是选择初等反射阵 , 使 经正交相似变换约化为一个上海森伯格阵.

(1) 设 其中 ,不妨设 , 否则这一 步不需要约化. 选择初等反射阵 使

其中 (3.5) 令 则

其中

(2) 第 步约化: 重复上述过程,设对 已完成第1步,…,第 步正交相似变换, 即有 或 且

其中 为 阶上海森伯格阵, 设 ,于是可选择初等反射阵 使 , 其中, 计算公式为

(3.6) 令 则

(3.7) 其中 为 阶上海森伯格阵. 第 步约化只需计算 及 . 当 为对称阵时,只需计算 .

(3) 重复上述过程,则有 总结上述讨论,有

定理19 (豪斯霍尔德约化矩阵为上海森伯格阵)设 则存在初等反射阵 使 本算法约需要 次乘法运算,要明显形成 还需 要附加 次乘法.

例8 用豪斯霍尔德方法将 矩阵约化为上海森伯格阵. 解 选取初等反射阵 使 , 其中 (1) 计算

则有 (2) 约化计算: 令

则 如果 是对称的,则 也对称,这时 是 一个对称三对角阵.

定理20(豪斯霍尔德约化对称阵为对称三对角阵)设 为对称矩阵,则存在初等反射阵 使

证明 由定理17,存在初等反射阵 使 为上海森伯格阵,且 亦是对称阵,因此, 为对称三对角阵. 由上面讨论可知, 当 为对称阵时,由 的一步约化计算中只需计算 及 . 又由于 的对称性,故只需计算 的对角线以下 元素. 注意到

引进记号 则 对对称阵 用初等反射阵正交相似约化为对称三对角 阵大约需要 次乘法.

8.4 QR 方 法 8.4.1 QR算法 QR方法是一种变换方法,是计算一般矩阵(中小型矩 阵)全部特征值问题的最有效方法之一. (1)上海森伯格阵的全部特征值问题, (2)计算对称三对角矩阵的全部特征值问题,且QR方法具有收敛快,算法稳定等特点.

对于一般矩阵 (或对称矩阵),则首先用豪斯 霍尔德方法将 化为上海森伯格阵 (或对称三对角阵), 然后再用QR方法计算 的全部特征值. 设 ,且对 进行QR分解,即 其中 为上三角阵, 为正交阵. 于是可得到一新矩阵 显然, 是由 经过正交相似变换得到,因此 与 特征 值相同.

再对 进行QR分解,又可得一新的矩阵,重复这一过 程可得到矩阵序列: 设 将 进行QR分解 作矩阵 求得 后将 进行分解 形成矩阵 QR算法,就是利用矩阵的QR分解,按上述递推法则 构造矩阵序列 的过程.

只要 为非奇异矩阵,则由QR算法就完全确定 . 定理21 (基本QR方法)设 . 构造QR算法: (4.1) 记 ,则有 (1) 相似于 ,即 (2) (3) 的QR分解式为

证明 (1),(2)显然,现证(3). 用归纳法, 显然,当 时有 , 设 有分解式 于是 其中利用了

由定理17知,将 进行QR分解,即将 用正交变换(左变换)化为上三角矩阵 其中 , 故 这就是说 可由 按下述方法求得: (1) 左变换 (上三角阵); (2) 右变换

定理22 (QR方法的收敛性)设 , (1) 如果 的特征值满足: ; (2) 有标准型 其中 , 且设 有三角分解 ( 为单位下三角阵, 为上三角阵),则由QR算法产生的 本质上收敛于上三 角矩阵,即

若记 ,则 (4.2) (4.3) 当 时 极限不一定存在.

定理23 如果对称矩阵 满足定理20的条件,则由QR 算法产生的 收敛于对角阵 . 关于QR算法收敛性的进一步结果为: 设 ,且 有完备的特征向量集合,如果 的 等模特征值中只有实重特征值或多重复的共轭特征值,则 由QR算法产生的 本质收敛于分块上三角矩阵(对角 块为一阶和二阶子块)且对角块中每一个2×2子块给出 的 一对共轭复特征值,每一个一阶对角子块给出 的实特征值, 即

其中 为2×2子块,它给出 一对共轭特征值.

8.4.2 带原点位移的QR方法 定理22中 的速度依赖于比值 , 当 很小时,收敛较快, 如果 为 的一个估计,且对 运用QR算法, 定理22中 的速度依赖于比值 , 当 很小时,收敛较快, 如果 为 的一个估计,且对 运用QR算法, 则 元素将以收敛因子 线性收敛于零, 元素将比在基本算法中收敛更快. 为了加速收敛,选择数列 ,按下述方法构造矩阵 序列 ,称为带原点位移的QR算法.

设 对 进行QR分解 形成矩阵 求得 后,将 进行QR分解 (4.4) 形成矩阵 (4.5)

如果令 ,则有 , 并且矩阵 有QR分解式 在带位移QR方法中,每步并不需要形成 和 ,可按 下面的方法计算: 首先用正交变换(左变换)将 化为上三角阵, 即 当 为上海森伯格阵或对称三对角阵时, 可为平面旋转阵,

则 下面考虑用QR方法计算上海森伯格阵的特征值. 设 为上海森伯格阵,即 如果 ,则称 为不可约上海森伯格阵.

设 ,由定理17可选正交阵 使 为上海森伯格阵, 对 应用QR算法. QR算法: 对于 (4.6) 假设由(4.6)迭代产生的每一个上海森伯格阵 都是不可 约的, 否则,若在某步有

于是,这个问题就分离为 与 两个较小的问题. 当 或 时,有 或 由此可得到 的特征值 ,或由 右下角二阶 阵的特征值求出 .

对降阶的 ,用类似的方法可求出 的其余特征值. 实际上,每当 的次对角元适当小时,就可进行分离. 例如,如果 就把 视为零. 一般取 ,其中 是计算中有效数字的位数.

8.4.3 用单步QR方法计算上海森伯格阵特征值 上海森伯格阵的单步QR方法: 选取 并设 对于 (用位移来加速收敛) 由 实际计算为

(1)左变换: (2)右变换: 其中 为平面旋转阵. (1) 左变换计算 确定平面旋转阵 使

设已完成第1次, 第 次左变换,即有 (4.7) 第 次变换的工作就是要确定平面旋转阵 , 使 变为0,且完成第 次左变换

这时只需计算(4.7)阵第 行及第 行元素. 这是因为平面旋转阵 只改变矩阵的 行和 行. 继续这一过程,最后有 (2) 右变换计算 在第 次右变换 中,只需计算 第 列及第 列元素.

最后 由上述讨论指出,如果 为上海森伯格阵, 则用QR算法产生的 亦是上海森伯格阵. 即上海森伯格阵在QR变换下形式不变.

讨论一个极端的情况 定理24 设:(1) 为不可约上海森伯格阵; (2) 为 一个特征值. 则QR方法 中 证明 记

由设 为不可约阵,则上海森伯格阵 亦为不可约. 由将上海森伯格阵 约化为上三角阵 的平面旋转 变换的取法可知 又因为 为奇异矩阵, 从而得到 . 因此, 的最后一行为 , 即 这样在QR方法迭代中,参数 可选为 ,即 的 元素. 通常可以作为特征值的最好近似.

算法1 (上海森伯格矩阵的QR算法) 给定 为上海森伯格阵,本算法计算 且 覆盖

如果用不同的位移 ,反复应用算法3就产生正 交相似的上海森伯格阵序列 . 当 充分小时,可将它置为零就得到 的近似特征值 . 再将矩阵降阶,对较小矩阵连续应用算法.

例9 用QR方法计算对称三对角矩阵 的全部特征值. 解 选取 ,则

现在收缩,继续对 的子矩阵 进行变换,得到

故求得 近似特征值为 而 的特征值是 算法1是在实数中进行选择位移 , 不能逼近一 个复特征值,所以算法3不能用来计算 的复特征值.

8.4.4* 双步QR方法(隐式QR方法) 第3节中将 经过正交相似变换化为上海森伯格矩阵 ,即 ,其中 不是唯一的. 第3节中将 经过正交相似变换化为上海森伯格矩阵 ,即 ,其中 不是唯一的. 但是,如果规定了正交矩阵 的第一列,则 和 除 差±1因子外唯一. 定理25 (隐式Q定理)设 , 且: (1) 及 都是 正交阵,且有 都是上海森伯格阵. (2) 为不可约上海森伯格阵,且 (即 与 第1列相同).

则: (1) ,且 ; (2) ,其中 , 即 和 在 意义上“本质上相等”. 算法1不能用来求 的一个复特征值. 当 的按模最小特征值是复数时,位移参数 可取为某步 右下角的二阶矩阵 (4.8) 的特征值.

当 的特征值 与 为复数时,如果应用算法1就要 引进复数运算,这对于实矩阵 是不必要的. 在某些条件下,可以用正交相似变换将 约化为实舒尔型. 隐式位移的QR方法,即用 与 作位移连续进行二次 单步的QR迭代,使用复位移,又避免复数运算. (1) 设 为上海森伯格阵,取共轭复 数 作两步位移的QR方法,即

(4.9) 显然 有QR分解 (4.10) 事实上,由(4.9)式并利用 有

且 阵为实矩阵, 这是因为(即使 特征值为复数) (4.11) 其中 为实数. 于是,(4.10)式为实矩阵 的QR分解,并且可以 选取 和 使 为实的正交阵. 由此得出 (4.10)

是实矩阵. 如果用下述算法就能保证 是实矩阵 (a) 直接形成实矩阵 (b) 计算 阵的实QR分解 (c) 令 但是(a)需要 次乘法运算,不实用. (2) 根据隐式Q定理,如果按下述算法进行,就有可 能用 次运算来实现从 到 的转换. (a′) 求与 有相同第一列的正交阵

(b′) 应用豪斯霍尔德方法将 化为一个上海森 伯格阵,即 记 , 上式为 显然, 的第一列与 的第一列相同,即 与 第一 列相同( ). 若 与 两者都是不可约上海森伯格阵, 则由隐式Q定理 与 本质上相等. (3) 如何寻求正交阵 .

由于 (为 的QR分解),则 说明 第一列即是 第一列的一个倍数. 于是,对 阵的第一列(非零)寻求初等反射阵 , 使 即 这说明 与 具有相同的第一列. 由于 , 则

其中 (4.12) 双步QR方法: 设 为不可约上海森伯格阵. (a) 计算 阵的第一列. 即按(4.12)式计算 (b) 确定初等反射阵 使

即确定初等反射阵 , 使 (c) 计算初等反射阵 , 使 为上海森伯格阵. 则 与 第一列相同, 且 .

这样上面的算法就完成了从 到 的变换,但没有 明显的应用到位移 和 .