矩阵分析：chapt4

分类：数学格式：doc 日期：2005年12月22日

第4章矩阵分解
(I)高斯消去法
假设矩阵A 的顺序主子式(0 (i=1,…,n),
则我们可以进行以下的顺序消元过程
1．消元过程

等价于用初等矩阵分别左乘和，即
(1)
其中，,

我们称为消元因子，为主元素；
消元过程的一个重要性质是：消元过程不改变矩阵的主子矩阵的行列式(主子式)的值。
例
,顺序主子式为，1，5，(10
,顺序主子式为，1，5，(10
，顺序主子式为，1，5，(10
引理：约化的主元素(0的充要条件是矩阵A 的顺序主子式(0 (i=1,…,k);
推论：若矩阵A 的顺序主子式(0
(i=1,…,k)，则
，；
由此有若A对称正定或严格对角占优，而它们的顺序主子矩阵也是对称正定或严格对角占优，从而顺序主子式不为0，顺序高斯消去过程可进行；
2.回代过程：

设，,
用高斯消去法解线性方程Ax=b.
增广矩阵为

，
因此，问题的解为

3,数值稳定性
1)选列主元；
2)选全主元；
3)高斯若当(Gauss-Jordan)消去法，求矩阵的逆;
,求A(1.
增广矩阵为

从而

4．高斯顺序消元法解方程的计算量
1)乘除次数：
2)加减次数：
3)求矩阵的逆的计算量为o()
(II) 顺序消元过程与矩阵的三角分解
(1)
(2) 若则有,从而
，

(3) 由
有
故有 A=LU，其中.
这时L为单位下三角矩阵。
矩阵的三角分解
A=(a1,a2,…,an)=PR=(p1,p2,…,pn)R
(a) LU分解(Doolittle分解)
(1) 存在唯一的条件;(顺序主子式不为0)
(2) 公式推导;(矩阵乘法)
定义4.1 如果方阵A可分解成一个下三角矩阵L和一个上三角矩阵U的乘积，则称
A可作三角分解,如果方阵A可分解成
A=LDU,其中L为一个单位下三角矩阵，
D为对角矩阵，U是一个单位上三角矩阵。
推论：若矩阵A 的顺序主子式(k(0
(k=1,…,n-1)，则A可唯一分解为
A=LDU,其中L为一个单位下三角矩阵，
D为对角矩阵，U是一个单位上三角矩阵。
dk=(k/(k(1 ((0=1)。
定理4.2 设A是n阶非奇异矩阵，则存在置换矩阵P使得PA=LDU,其中L为一个单位下三角矩阵，D为对角矩阵，U是一个单位上三角矩阵。
定义4.2 设A存在唯一的LDU分解.若把
A=LDU中的D和U结合起来，并且用
U’表示，则得到唯一的LU分解
A=LU’
称为Doolittle分解；若把A=LDU中的L和D
结合成L’，就得到A=L’U
称为Crout分解。
LU分解的公式：
lik=aik-(li1u1k+…+li,k-1uk-1,k)
ukj= [akj-(lk1u1j+…+lk,k-1uk-1,j)]/lkk
Crout分解类似。
(b)平方根法
(1)对称矩阵的三角分解定理；

(2)对称正定矩阵的三角分解(Cholesky分解)

递推公式
gii=(aii-)1/2
gij=[aij-(gi1gj1+gi2gj2+…+gi,j-1gj,j-1)]/gii,i>j
gij=0 i<j
四、分块矩阵的拟LU分解和拟LDU分解

若A11可逆，作
则
从而det(A)=det(A11)(det()
同样若A22可逆，可得类似结果。
矩阵求逆引理
(A+BC)(1=A(1( A(1B(I+CA(1B)(1CA(1
证明：求方程(A+BC)x = b,
令y=Cx,则有 Ax+By=b
(Cx+y=0
写成矩阵为
，
利用高斯消去法有

因此可得
x = (A(1( A(1B(I+CA(1B)(1CA(1)b,
而由(A+BC)x = b可得x = (A+BC)(1b
由于b的任意性可得
(A+BC)(1=A(1( A(1B(I+CA(1B)(1CA(1
从而命题得证。
推论：(A+BD(1C)(1=A(1( A(1B(D+CA(1B)(1CA(1
例=
=
由于

利用矩阵求逆引理有

矩阵的QR分解
Givens变换与Householder变换
Givens变换定义：设实数c与s满足 c2+s2=1,称

为Givens 矩阵，也可记作Tij=Tij(c,s),由Givens矩阵确定线性变换称为Givens 变换。
性质1,Givens矩阵是正交矩阵，且有
[Tij(c,s)](1=[Tij(c,s)]T=Tij(c,(s)
det[Tij(c,s)]=1
性质2 设x=((1,(2,(,(n)T,y=Tijx=((1,(2,(,(n)T,则有
(i= c(i +s(j
(j= (s(i+ c(j
(k=( k ( k(i,j )
定理4.3 设x=((1,(2,(,(n)T(0,则存在有限个Givens矩阵的乘积，记作T，使得Tx=|x|e1.
推论,设非零列向量x(Rn及单位列向量z(Rn,则存在有限个Givens变换矩阵的乘积，记作T，使得Tx=|x|z.
Householder 矩阵和Householder 变换定义4.5 设单位列向量u(Rn,称
H=I(2uuT
为Householder 矩阵(初等反射矩阵)，由Householder矩阵确定的线性变换为Householder变换(初等反射变换).
(1),HT=H (对称矩阵)
(2),HTH=I (正交矩阵)
(3),H2=I (对合矩阵)
(4) H(1=H (自逆矩阵)
(5) det(H)= (1
定理4.4 任意给定非零列向量x(Rn(n>1)及单位列向量
z(Rn,则存在Householder矩阵H，使得Hx=||x|| z.
定理4.5 初等旋转矩阵(Givens变换)是两个初等反射矩阵
(Householder变换)的乘积。
证明：对初等旋转矩阵Tij,取
u=(0,…,0,sin((/4),0,…,0,cos((/4),0,…,0)T
v=(0,…,0,sin(3(/4),0,…,0,cos(3(/4),0,…,0)T
直接计算可得
Tij=HvHu
从平面上看，我们可以得出
x
H((()= (+2((( u
其中H=I (2uuT y (
x为变换前的任意向量，用它与正半实轴的夹角(表示。
y为变换后的向量,用它与正半实轴的夹角表示为(+2(((。
y x
( (
G((()=(+(
其中，(为旋转角度；
x为变换前的任意向量，用它与正半实轴的夹角(表示；
y为变换后的向量,用它与正半实轴的夹角表示为 (+(。
我们需要证明的目标就是找到两个向量u1和u2使得它们对应的Householder变换的乘积等于给定的一个旋转变换G((()。根据前面的讨论我们对于H变换和G变换都可以用向量的角度表示。因此有
H(2H(1(()=(+2(2(((+2(1(()=2((2((1)+( =(+(= G((() l1
可见( =2((2((1)成立即可。 x
这个等式在几何成立的意思,H(u1)x u2
x和H(u2)H(u1)x之间的夹角等于二倍的 l2 u1
u1和u2之间的夹角。
这在几何上是显然的。因为u1对应的垂线l1平分
x和H(u1)x的夹角； H(u2)H(u1)x
同样，因为u2对应的垂线l2平分
H(u1)x和H(u2)H(u1)x的夹角。
注意到l1和l2的夹角和向量u1和u2的夹角相等。
因此结论是显然的。
换句话说，对于给定的旋转变换，仅需找到夹角为旋转角度的二分之一的两个向量，用它们作反射变换，就可以得到旋转变换。
矩阵QR(正交三角)分解
定义4.6 如果实(复)矩阵A能够化成正交矩阵Q与实
(复)非奇异上三角矩阵R的乘积，即 A=QR
则称为A的QR分解。
定理4.6 设A是n 阶实(复)非奇异矩阵，则存在正交(酉)
矩阵Q与实(复)非奇异上三角矩阵R使得 A=QR
且除去相差一个对角元素的绝对值(模)全等于1的对角矩阵外，分解唯一。即QR分解存在唯一。
证明：存在性：使用Gram-schmidt正交化过程。
唯一性：A=QR=Q1R1从而P=(Q1)TQ=R(1R1
注意到I=PTP所以P(1=PT,而P为上三角矩阵，其逆也为上三角矩阵，而PT为下三角矩阵,从而P为对角矩阵.
又P2=I，所以P的对角元只能为正负1。
Q= Q1P,R= P R1.
定理4.7 设A是m(n实(复)矩阵，且其n个列线性无关，
则A有分解 A=QR
其中Q是m(n实(复)矩阵，且满足QTQ=I,R是实(复)非奇异上三角矩阵R且除去相差一个对角元素的绝对值(模)
全等于1的对角矩阵外，分解唯一。
定理任何n阶实非奇异矩阵A可通过左连乘初等Givens
旋转矩阵化为上三角矩阵。
定理4.10 任何n阶实非奇异矩阵A可通过左连乘
Householder矩阵化为上三角矩阵。
定义4.7　如果矩阵A的次对角线以下元素全为零，则称
A为上Hessenberg矩阵；
定理4.11,任何实方正A都可以通过初等旋转变换正交相似与上Hessenberg矩阵。
定理4.12任何实方正A都可以通过初等反射变换正交相似与上Hessenberg矩阵。
推论：任何实对称矩阵A都可以通过初等旋转变换(或初等反射变换)正交相似于实对称三对角矩阵。
思考题：任何正交矩阵Q是否存在特征值互不相同的对称
(角)矩阵A(D)和三对角矩阵T使得AQ=QT 或 DQ=QT?
其中要求T的次对角线的所有元素都不为零。
这就是特征值的反问题：已知Q求D和T使得DQ=QT.
例如单位矩阵Q=I就不存在，那么存在的条件是什么？
在信号处理中，我们一般使用的都是哪些存在T的正交矩阵
Q对应的正交变换，为什么？
Fourier 变换，小波变换都存在。这和所谓信号的频率有关。
一般说来，Q的列按频率由低到高排列。
4.3 矩阵的满秩分解
复习矩阵的秩的概念和性质定义:矩阵行或列向量的最大线性无关组的个数。
思考题：证明矩阵的行秩和列秩相等。
性质：rank(AB) (min (rank(A),rank(B))
定义4.8 设A((r>0),如果存在矩阵F(和
G(使得 A=FG
则称为A的满秩分解。
当A为行满秩或列满秩矩阵时，A可分解为一个因子为单位矩阵，另一个为A本身，称为平凡分解。
定理：设A(则A的满秩分解存在。
证明过程即为构造过程。
证明：设A=(a1,a2,…,an),取A的列向量组的一个极大线性无关组，不妨设为ai1,ai2,…,air,则对于A的任意i列ai可以表示为ai1,ai2,…,air的线性组合。即
ai=g1i(ai1+ g2i(ai2+…+ gri(air,i=1,2,…,n
写成矩阵形式有
A=FG
其中F=( ai1,ai2,…,air),G=(g1,g2,…,gn),gi=(g1i,g2i…,gri)T,
显然F为列满秩的矩阵，G为行满秩的矩阵(为什么？)。
注:满秩分解不唯一。
定义4.9 Hermite标准形,B(满足
1)B的前r行中每一行至少含一个非零元素，且第一个非零元素是1，而后m-r个元素为0；
2)若B中第i行的第一个非零元素1在第ji列(i=1,2,…,r),
则 j1<j2<…<jr;
3)中的j1,j2,…,jr列为单位矩阵Im的前r列。
例如：

这样B(为Hermite 标准形。
定理,任意非零矩阵A(可通过初等行变换化为Hermite 标准形B,且B的前r行线性无关。
定义：置换矩阵是以n阶单位矩阵的n个列向量为列按照任意顺序构成的矩阵。
定理设矩阵A(的Hermite 标准形为B,
那么,取F为A的j1,j2,…,jr列构成m(r矩阵，
G为B的前r行构成的m(r矩阵,A=FG.
证明：A(B,知存在可逆矩阵P使得PA=B
从而A=P(1B
将P(1分块为P(1=[F,S] 可得 A=FG,其中G为B的前r行构成的m(r矩阵。（为什么？）
注意到B为Hermite 标准形，从而它的后n(r行为0向量.
作置换矩阵P1使得BP1=
从而AP1= P(1BP1=[F,S] =[F,FB12]
从而F为A对应的列。
例：rank(A+B)(rank(A)+rank(B)
例：设矩阵A((r>0),则必有分解
A=QR.
其中,Q为m( r矩阵,QHQ=I,而R为r( n矩阵，它的行线性无关。
证明：作A的满秩分解
A=FG
其中F(，G(.由矩阵的QR分解定理有
F=QR1
其中Q为m( r矩阵,QHQ=I,而R1为r阶非奇异矩阵。
于是 A= FG = QR1G =QR.
这里R=R1G,它的r个行线性无关。
定理(习题4.3,第4题),设F(，G(,则
rank(FG)= r
证明：显然 rank(FG)( r (a)
如果rank(FHF)= rank(GGH) =r.
则 rank(FHFGGH) =r.，从而
rank(FG)( r (b)
这样rank(FG)= r,
下面我们证明rank(FHF) =r (实际为习题4.3 第2题)
这需要证明FHF为满秩矩阵。仅需证明对任意x(Cr,若 FHFx =0
则 x =0 即可。
事实上,由FHFx =0可得xHFHFx=0,
从而||Fx||=0,根据范数定义,Fx=0；
再由F为列满秩矩阵，可得x=0。
这样证明了。
思考题,设F(，G(,则rank(GF)= r成立吗？
若是，证明之；若否，研究成立的条件是什么？
下面利用满秩分解讨论线性方程组求解。
Ax= b,
设A的满秩分解为A=FG,方程变为FGx=b.
则若b(R(F),则存在相容解。
若b(R(F),则不存在相容解，这时我们可以将b投影到R(F)得到b(=F(FHF)(1FHb
b
R(F)
b(
这时方程求解的实际就是所谓最小二乘解。
如果这样方程组变为Gx=(FHF)(1FHb.
由于G的秩为r 因此方程组Gx=(FHF)(1FHb
肯定有解。如果G不为方阵，
则解不惟一。这时需要求解所谓最小范数解。
即 x= GH(GGH)(1(FHF)(1FHb
这就是所谓最小范数最小二乘解。

10个随机逼近点，y= x2+r,其中r为[(0.1,0.1]之间均匀分布的随机数。根据模型y=ax2+bx+c,利用最小二乘解得到的逼近结果。红线所在点为逼近点蓝线为y= x2，绿线为求得的逼近解。

20个随机逼近点，y= x2+r,其中r为[(0.1,0.1]之间均匀分布的随机数。根据模型y=ax2+bx+c,利用最小二乘解得到的逼近结果。红线所在点为逼近点蓝线为y= x2，绿线为求得的逼近解。
4.4 矩阵的奇异值分解
1.矩阵的正交对角分解我们知道实对称矩阵A或Hermite矩阵A都可正交相似于对角矩阵,即
A=QHDQ
由定理4.12 任何实方阵A都可以正交相似于上Hessenberg
矩阵。
即 A=QTHQ
定理：对于任何非奇异的实方阵，存在正交矩阵P和Q
使得PTAQ为正对角矩阵D。即A=PDQT
证明,由于A非奇异，因此ATA为实对称矩阵。于是存在正交矩阵Q使得 QT(ATA)Q=D,D为对角矩阵,其对角元为
ATA的特征值,它们大于0.
因此记 P=AQD1/2,易验证PTP=I
且A= PD1/2Q.
2矩阵的奇异值分解基本事实：
1.设A((r>0),则AHA是Hermite 矩阵，且其特征值非负。
2,rank(A)=rank(AHA)
设A(，则A=0的充要条件为AHA=0.
定义,设A(，A的奇异值为AHA的特征值的非负平方根。
定理4.16 设A(，则存在m阶酉矩阵U和n阶酉矩阵V使得UHAV=,其中(=diag((1,(2,…,(r),
而(i为矩阵A的全部非零奇异值。
或者写为 A=UVH称为A的奇异值分解。
证明过程略。
显然由证明过程可见，若A为实矩阵，则定理4.16中
U和V都可以为正交矩阵。
例4.15 设矩阵A=UVH，则U的列是AAH的特征向量,V的列为AHA的特征向量。
反之不一定对，即设U的列是AAH的特征向量，V的列为AHA的特征向量。那么UVH =A不一定成立。
定理4.17 在奇异值分解A=UVH,设U和V的列向量分别为u1,u2,…,um和v1,v2,…,vn,则
N(A)=L(vr+1,vr+2,…,vn)
R(A)=L(u1,u2,…,ur)
A=(1u1+(2u2+…+(rur (广义谱分解)。
奇异值分解的统计意义：
若x一个均值为0的n维随机向量，A的每一行表示它的一次抽样，则AHA的i行j 列表示随机向量x的在m次独立抽样基础上对相关矩阵的一个无偏估计。如果对随机向量x
进行线性变换
y=Vx
则随机向量y在m次独立抽样基础上对相关矩阵的一个无偏估计为对角矩阵，因此我们有理由认为y为线性独立的。
并且，更为重要的是，我们可以仅取y的前几位分量，就可以得到对x的一个较好的近似表示。这几个分量我们成为主分量。
求取y的过程称为主分量分析。
它们是特征提取和数据压缩的依据所在。
奇异值分解在图像压缩中的应用。
3 矩阵正交相抵定义：设A,B(Rm(n,如果存在m阶正交矩阵U和V使得
B=UTAV,则称A和B正交相抵。
性质：矩阵的正交相抵为等价关系。
定理4.18 正交相抵的矩阵有相同的奇异值。
反之，若实矩阵有相同的奇异值，则它们为正交相抵的。
由奇异值分解定理,任意矩阵都和一个对角矩阵正交相抵。