广义逆矩阵
6.1 投影矩阵设 Cn=L(M,即 Cn为L和M的直和。
定义6.1 将任意x(Cn变为沿着M到L的投影的变换称为沿着M到L的投影算子,记为PL,M即
PL,M x=y
性质:R(PL,M)=L,N(PL,M)=M
M x
y L
如图,PL,M x=y,注意 x(y (M,
定义6.2 投影算子PL,M 在Cn的基e1,e2,…,en
下的矩阵称为投影矩阵。
引理1 设A(Cn×n 是幂等矩阵,A2=A,则
N(A)=R(I(A)
证明:任给x( N(A),则Ax=0,从而
x=Ax+(I(A)x=(I(A)x( R(I(A)
因此N(A)( R(I(A),
反之,任给x( R(I(A),则存在y( Cn使得
x=(I(A)y,从而 Ax=A(I(A)y= (A(A2)y=0
这样R(I(A) ( N(A)。
从而 N(A)=R(I(A).
定理6.1 矩阵P为投影矩阵的充要条件是P为幂等矩阵。
证明:由引理1,取M=R(I(P),L= R(P)
则R(PL,M)=L,N(PL,M)=M。
投影矩阵计算:取L的一组基q1,q2,…,qr和M的一组基
qr+1,qr+2,…,qn。这样任给向量x(Cn,则x可以表示为
x=(q1,q2,…,qr,qr+1,qr+2,…,qn)y=Qy.
PL,Mx=QIry=QIrQ(1x
从而PL,M=QIrQ(1.其中Ir表示对角线前r个元素为1,其余矩阵的所有元素为0.
思考:PL,M和线性空间L,M的基的选择无关。即如果我们分别选择L,M的另外一组基q1,q2,…,qr和qr+1,qr+2,…,qn;
不妨设(q1,q2,…,qr)= (q1,q2,…,qr)R1,R1为r(r的可逆矩阵。
( qr+1,qr+2,…,qn)= (qr+1,qr+2,…,qn)R2,R2为(n(r)((n(r)的可逆矩阵。因此Q=(q1,q2,…,qr,qr+1,qr+2,…,qn)
=Qdiag(R1,R2),
这样投影变换利用这组基的矩阵表示为
PL,M= QIrQ(1= Qdiag(R1,R2) Ir diag(R1,R2)(1 Q(1
= Qdiag(R1,R2) Ir diag((R1) (1,(R2) (1)Q(1
= Q Ir Q(1
= PL,M
可见矩阵与表示L,M的基的选择无关。
定义6.3 设L是Cn的子空间,则称沿着L(到L
的投影算子为正交投影算子,简记为PL。
L( x
PLx L
正交投影算子在Cn的基e1,e2,…,en下的矩阵称为正交投影矩阵,记为PL。
定理6.2 矩阵P为正交投影矩阵的充要条件是
P为幂等Hermite矩阵。
证明:若矩阵P=PL,则P为幂等矩阵。
即R(P)和R(I(P)正交,从而对任意x(Cn
xHPH(I(P)x=0,即PH(I(P)=0,
从而PH= PHP,这样P= PHP=PH。
反之,若P=PH,且P2=P。
由P2=P根据定理6.1有
P=PR(P),N(P)= PR(P) == 
成立。
正交投影矩阵计算:取L的一组标准正交基q1,q2,…,qr和
M的一组标准正交基qr+1,qr+2,…,qn。由于L(M,因此
Q=(q1,q2,…,qr,qr+1,qr+2,…,qn)为正交矩阵。
这样任给向量x(Cn,则x可以表示为
x=(q1,q2,…,qr,qr+1,qr+2,…,qn)y=Qy.
y=QHx
PL,Mx=QIry=QIrQ(1x
从而PL,M=QIrQH
类似于投影矩阵的讨论,正交投影算子的矩阵表示和L,M的正交基选择无关。
6.2 广义逆矩阵的定义和性质
定义6.4 设矩阵A(Cm×n,若矩阵x(Cn×m满足如下四个Penrose方程

则称X为A的Moore-Penrose逆,记为A+。
Cn X Cm
A
b Xb XAXb=Xb
AXb c
Ac XAc AXAc=Ac
图中说明广义逆的线性映射表示。也就是说
AXb和b可以不重合,但是XAXb和Xb要求重合,这样得到2逆。同样XAc和c不一定重合,但AXAc和Ac一定重合。这样得到
1逆。
Cn Cm
R(X) R(A)(N(X)=0
x Ax
XAx
N(A) N(X)
线性映射A的1-逆的说明图。
Cm=R(A)( N(X)(V1,
定理6.3 对任意A(Cm×n,A+存在并且惟一。
证明:存在性由奇异值分解可得。
A=Udiag((1,(2,...,(r,0,...,0)VH
定义A+=Udiag(1/(1,1/(2,...,1/(r,0,...,0)VH
显然易验证A+满足定义的4个条件。
唯一性:设有两个不同的A+伪逆X和Y,则
Y=YAY=Y(AY)H= YYHAH=YYH(AXA)H
= YYHAH(AX)H=Y(AY)HAX=Y(AYA)X
=YAX=(YA)HX=AHYHX
=AHYHXAX= AHYH(XA)HX= AHYHAHXHX
=(AYA)HXHX=AHXHX=(XA)HX=XAX=X.
定义6.5 对任意A(Cm×n,若X(Cn×m满足Penrose
方程中的(i),(j),…,(l)等到方程,则称X为A
的{i,j,…,l}-逆,记为A(i,j,…,l),其全体记为A{i,j,…,l}.
定理6.4 矩阵A(Cm×n,有惟一{1}-逆的充要条件是A非奇异矩阵,且这个{1}-逆与A(1一致。
(复习定理1.35).
定理,V1(=Vn
定理1.35,对任意矩阵A(Rm(n,有
R((A)=N(AT),R(A)(N(AT)=Rm
R((AT)=N(A),R(AT)(N(A)=Rn
引理:N(A)(N(B) (存在X,使得A=XB.
R(A)(R(B)( 存在X,使得A=BX.
证明:由N(A),R(A)的定义,显然成立。
推论:rank(AB)=rank(A)(A=ABX
rank(BA)=rank(A) (A=XBA
定理6.5 设A(Cm×n,B(Cn×p,((C,则
(1)(A(1))H(AH{1};
(2)(+A(1)(((A){1};
(3)若S和T非奇异,则T-1A(1)S-1((SAT){1};
(4) rank(A(1)) ( rank(A);
AA(1)和A(1)A均为幂等矩阵且与A同秩;
R(AA(1))=R(A),N(A(1)A)=N(A),R((A(1)A)H)=R(AH);
A(1)A=In的充要条件是rankA=n,AA(1)=Im的充要条件是rankA=m;
AB(AB)(1)A=A的充要条件是
rank(AB)=rankA,
B(AB)(1)AB=B的充要条件是
rank(AB)=rankB.
证明(1)至(5)由定义可得,
证明(6),R(AA(1))(R(A)=R (AA(1)A) ( R(AA(1))
所以 R(AA(1))=R(A)
由引理N(A) (N(A(1)A) ( N(AA(1)A)= N(A)
所以N(A) =N(A(1)A).
(7)利用(5)式显然可证。
(8) 充分性:由于R(AB)(R(A)和rank(A)=rank(AB)
得到 R(AB)= R(A)
即R(A)(R(AB),得到存在X使得
A=ABX=(AB(AB)(1)AB)X
=AB(AB)(1)[ABX]= AB(AB)(1)A
必要性:rank(A)(rank(AB)( rank(AB(AB)(1)A)
=rank(A).
第2个等式同样证明。
说明:在这章的许多证明中反复应用(8)这种证明方法,即利用引理和矩阵广义逆的定义证明结论。
定理6.6设矩阵Y,Z(A{1},又设X=YAZ,则
X(A{1,2}
证明:XAX=YAZAYAZ=YAZ(AYA)YAZ
=Y(AZA)Y(AYA)Z=Y(AYA)Z
=YAZ=X.
定理6.7给定矩阵A和X(A{1},则X(A{1,2}的充要条件是rank(X)=rank(A).
证明:充分性:因X(A{1},所以A=AXA
所以rank(X)( rank(XA) ( rank(AXA)=rank(A)
这样rank(X)= rank(XA),
又因为R(XA)(R(X),这样R(X)=R(XA)
这就得到存在Y使得X=XAY
即X=XAY=X(AXA)Y
= XA(XAY)=XAX
从而X(A(2)
必要性。由定理6.5 我们知道因X(A{1}可得
rank(A)=rank(AX)(rank(XAX)=rank(X)
rank(X) ( rank(AX)
因此rank(A)=rank(X).
引理2 对任意矩阵A均有
rank(AHA)=rankA=rank(AAH)
证明:由AHAx=0 (Ax=0,即N(AHA)(N(A)
由引理存在X使得A=XAHA.
这就可得rank(A)(rank(AHA) (rank(A)
即rank(AHA)=rankA。
余下的类推。
定理6.8 设矩阵A给定,则
Y=(AHA)(1)AH(A{1,2,3}
Z= AH(AAH)(1)(A{1,2,4}
证明:rank(AHA)=rank(A)=rank(AH),由定理6.5的(8)可得
A= A(AHA)(1)AHA
AH= AHA(AHA)(1)AH
从而AYA=A(AHA)(1)AHA=A
YAY=(AHA)(1) AHA(AHA)(1)AH=(AHA)(1)AH
=Y.
由于存在X使得A=XAHA,所以
AY=A(AHA)(1)AH=XAHA(AHA)(1)(XAHA)H
=X[AHA(AHA)(1)AHAH]XH=XAHAXH
为Hermite矩阵。
定理6.9 设矩阵A给定,则
A+=A(1,4)AA(1,3)
证明:记X= A(1,4)AA(1,3),由定理6.6知X(A(1,2).
另外,AX=AA(1,4)AA(1,3)= AA(1,3) 为Hermite矩阵
XA= A(1,4)AA(1,3)A= A(1,4)A 为Hermite矩阵。
从而由A+得到结论。
定理6.10 设矩阵A给定,则
rankA+= rankA;
(A+)+=A;
(AH)+=( A+)H,( AT)+=( A+)T;
(AHA)+= A+(AH)+,(AAH)+= (AH)+ A+;
A+=(AHA)+ AH= AH(AAH)+;
R(A+)= R(AH),N(A+)= N(AH).
证明:(1)-(4)可应用前面的定义得到。
下面证明(5)和(6).
(5),设X=(AHA)+ AH,由定理6.8可得 X(A{1,2,3}
由于XA=(AHA)+ AHA为Hermite 矩阵。
(利用(AHA)+ (AHA{1,2,3,4})
(6).由于A+AA+=A+,可得rank(AH)=rank(A)=rank(A+)
由于(5),A+= AH(AAH)+得到R(A+)(R(AH)
这样 R(A+)= R(AH).
同样由A+=(AHA)+ AH,得到N(AH) ( N(A+)
因此N(A+)= N(AH)。
推论1 若A(Cnm×n,则
A+=(AHA)(1 AH
若A(Cmm×n则
A+=AH(AAH) (1
推论2 设(为n维列向量,且((0,则
(+=((H()(1(H

((H)+= ((+)H=(((H()(1
对于同阶可逆矩阵A,B有(AB)(1=B(1A(1;
定理6.10之(4)表明对于特殊的矩阵A和AH,
Moore-Penrose逆有类似的性质。
定义6.6 设矩阵A(Cm×n。若矩阵x(Cn×m满足
AX=PR(A)A,XA=PR(X)A其中PL是空间L上的正交投影矩阵,则称X为A的Moore广义逆矩阵。
定理6.11 Moore的广义逆矩阵和Penrose的广义逆矩阵
(定义6.4)是等价的。
定理6.12 设A(Cm×n,若存在x(Cn×m和C(Cm×m,
V(Cn×n满足AXA=A,X=AHU,X=VAH,
则X惟一确定,且X=A+。
定理6.13 设A(Cm×n,若存在x(Cn×m和Z(Cm×n,
满足AXA=A,X=AHZAH,则X=A+。
6.3 广义逆的计算方法
(本节主要掌握计算矩阵1-逆和A+逆的一种计算方法)
定理6.14设A(Crm×n,又设Q( Cmm× n和P( Cnn× n使得

成立,则对任意L( C(n-r)×(m-r),n×m矩阵

是A的{1}-逆。
定理6.15 设A(Crm×n(r>0)的满秩分解为式A=FG,则
G(i)F(1)(A{i},i=1,2,4;
G(1)F(i)(A{i},i=1,2,3;
G(1)F+(A{1,2,3},G+F(1)(A{1,2,4};
A+= G+F(1,3)= G(1,4)F+;
A+= G+F+= GH(GGH)-1(FHF)-1FH= GH(FHA GH)-1FH.
证明:由于G和F为满秩矩阵,因此
F(1)F=GG(1)=Ir
由定义可直接验证(1)和(2).
验证(1).A G(1)F(1)A=FG G(i)F(1)FG=FG=A.
G(2)F(1)A G(2)F(1)= G(2)F(1)FGG(2)F(1)= G(2)G G(2)F(1)
= G(2)F(1)
G(4)F(1)A=G(4)F(1)FG=G(4)G=(G(4)G)H= (G(4)F(1)A)H
(2)类似可证。
(3),由(1)(2)可得。其中G+和F+换成G(1,2,4)和F(1,2,3)
结论也成立。
(4),由(3)知道G+F(1,3) (A{1,2,4},证明G+F(1,3) (A{3}
A G+F(1,3)=FG G+F(1,3)=FF(1,3)= (FF(1,3))H=(A G+F(1,3))H
从而G+F(1,3) (A{3}成立。
(5)利用公式 F+=(FHF)(1FH,
G+=GH(GGH) (1
可得结论。
由此我们得到了计算A+的方法。

A==FG
(FHF)(1FH=
G(1=G
则A+=G(FHF)(1FH=.
引理3 设A(Crm×n,U(Cn×p,V( Cq×m,又设
X=U(VAU)(1)V (6.3.5)
其中(VAU)(1) ((VAU){1}.则
X(A{1}的充要条件是rank(VAU)=r;
X(A{2}且R(X)=R(U)的充要条件是
rank(VAU)= rankU
X(A{2}且N(X)=N(V)的充要条件是
rank(VAU)= rankV
X(A{1,2}且R(X)=R(U),N(X)=N(V)的充要条件是
rank(VAU)= rankU= rankV=r
引理4 对任意给定的矩阵为A满足X(A{1,2}和
R(X)=R(AH),N(X)=N(AH)的惟一矩阵为A+。
定理6.16 给定矩阵A,则
A+= AH(AH A AH)(1) AH (6.3.6)
其中(AH A AH)(1) ((AH A AH){1}
定理6.17 (Greville)设A(Cm×n,记ak(k=1,…,n)为A的第k列,Ak(k=1,…,n)为A的前k列构成的子矩阵;又记
dk=A+k+1ak (6.3.7)
ck= ak- Ak-1 dk= ak- Ak-1 A+k+1ak
= ak- (6.3.8)

 (6.3.9)
其中

(k=2,…,n)
6.4 广义逆与线性方程组求解
(本节主要讨论利用广义逆表示一般线性方程组的解.
对于线性方程组Ax=b,如果A非奇异,则x=A(1b.
对于一般的线性方程组,我们希望得到类似的结果。
这就是本节讨论的主要问题.)
定理6.26设A(Cm×n,B(Cp×q,D( Cm×p,则矩阵方程
AXB=D (6.4.5)
相容的充要条件是
AA(1)DB(1)B=D (6.4.6)
其中A(1) (A{1},B(1) (B{1},当方程(6.4.5)相容时,
其通解为
X= A(1)D B(1)+Y(A(1)AYB B(1) (6.4.7)
这里Y( Cn×p任意。
证明:充分性,若AA(1)DB(1)B=D成立,取X= A(1)DB(1)结论显然成立。反之,若AXB=D有解,则
D=AXB=AA(1)AXBB(1)B=AA(1)DB(1)B成立。
显然A(1)D B(1)+Y- A(1)AYB B(1)为AXB=D的解。若
X为其任意一个解,则
X= A(1)D B(1) +X(A(1)AXB B(1),
成立。
推论 设A(Cm×n,A(1) (A{1}则
A{1}={ A(1)+Z( A(1)AZA A(1)|Z( Cm×n} (6.4.8)
定理6.27 线性方程组Ax=b相容的充要条件是
A A(1)b=b (6.4.9)
且其通解为
x= A(1)b+(I- A(1)A)y (6.4.10)
其中y( Cn任意。
证明:充分性显然。
必要性:b=Ax=AA(1)Ax= AA(1)b.
显然A(1)b+(I- A(1)A)y为它的解,反之若Ax=b
则x=A(1)b+x(A(1)b= A(1)b+x(A(1)Ax
= A(1)b+(I(A(1)A)x
定理6.28 设A(Cm×n,b(Cm,X( Cn×m.若对于使得方程组(6.5.1)相容的所有b,x=Xb都是解,
则X( A{1}。
证明:由于对于A的每一列ai,则Ax=ai都是相容的。
因此AXai=ai,取i=1,2,...,n,则得到AXA=A成立。
2,相容线性方程组的最小范数解
引理6 相容方程组Ax=b的极小范数解惟一,
且这个惟一解在R(AH)中。
证明,利用R(AH)=N(A)(.
引理7 集合A{1,4}由矩阵方程
XA=A(1,4)A (6.4.11)
的所有解X组成,其中A(1,4)(A{1,4}。
证明:显然。
这个定理说明对于任给的X(A{1,4}
XA为常数矩阵。
定理6.29 设A(Cm×n,A(1,4) (A{1,4},则
A{1,4}={ A(1,4)+Z(I-A A(1,4))|Z(Cn×m } (6.4.12)
定理6.30 设方程组Ax=b相容,则
x=A(1,4)b
为最小范数解;反之,若对任何的b(R(A),Xb都是最小范数解,则X(A{1,4}.
3,矛盾方程组的最小二乘解与{1,3}-逆
引理8 设A(Cm×n,集合A{1,3}由矩阵方程
AX=AA(1,3) (6.4.13)
的所有解X组成,其中A(1,3) (A{1,3}。
证明,若X(A{1,3},则
AX=AA(1,3)AX=(AX)H(AA(1,3))H
=AXAA(1,3)=AA(1,3)
反之,若AX=AA(1,3),则首先由于AA(1,3)为
Hermite矩阵,从而AX为Hermite矩阵,即X(A{3};
另外,AXA=AA(1,3)A=A,从而X(A{1}.这样X(A{1,3}。
证毕。
定理6.31 设A(Cm×n,A(1,3) (A{1,3}则
A{1,3}={ A(1,3) +(I( A(1,3) A)Z|Z ( Cn×m } (6.4.14)
证明:由引理8和定理6.26 可得
AX=AA(1,3)通解为
X=A(1,3)AA(1,3)+Y(A(1,3)AY
令Y=A(1,3)+Z,代入可得
X=A(1,3)AA(1,3)+ A(1,3)+Z (A(1,3)A(A(1,3)+Z)
= A(1,3)AA(1,3)+ A(1,3)+Z (A(1,3)AA(1,3) (A(1,3)A Z
=A(1,3)+(I(A(1,3)A)Z
证毕。
定理6.32 设A(Cm×n,b( Cm,A(1,3) (A{1,3}.则
x= A(1,3) b (6.4.15)
是方程组Ax=b的最小二乘解,反之,设X(Cm×n,
若对所有b( Cm,x=Xb都是方程组Ax=b的最小二乘解,
则X( A{1,3}
证明:显然Ax(b=Ax(PR(A)b+( PR(A)b(b)
由于Ax(PR(A)b(R(A),( PR(A)b(b)(R((A)=N(AH)
所以 ||Ax(b||2=||Ax(PR(A)b||2+||PR(A)b(b||2
显然||Ax(b||2取得极小值的充要条件为Ax(PR(A)b=0.
任取A(1,3)(A{1,3},欲证AA(1,3)= PR(A)
需证明R(AA(1,3))=R(A),且AA(1,3)为投影矩阵。
R( (AA(1,3))= R((A).
显然R(AA(1,3))( R(A)= R(AA(1,3)A) ( R(AA(1,3))
从而R(AA(1,3))=R(A)
且 AA(1,3)= AA(1,3) (AA(1,3)).
R( (AA(1,3))=N((AA(1,3))H)(N(AH)= R((A).
反之,若y(N(AA(1,3)),则
AA(1,3)x=0,则AHy=(AA(1,3)A)Hx=AH[AA(1,3)]Hx
=AH[AA(1,3)y]=0.
因此,AA(1,3)=PR(A)
令x= A(1,3)b,则Ax=A A(1,3)b = PR(A)b是方程Ax=b
的最小二乘解。反之,若对任意b,有x=Xb为
Ax=b的最小二乘解,即
AXb=PR(A)b
则有AX=PR(A)=AA(1,3),即X为方程AX=AA(1,3)的解,
由引理8,我们推得X(A{1,3}。
推论,x是方程组Ax=b的最小二乘解的充要条件是,x为
AHAx=AHb (6.4.18)
的解。
证明:由定理6.32可得,x是方程组Ax=b的最小二乘解的是x=A(1,3)b.
必要性:AHAx=AHAA(1,3)b=AH(AA(1,3))Hb
=(AA(1,3)A)Hb=AHb.
充分性,若AHAx=AHb,则
x= (AHA)(1)AHb+(I((AHA)(1)AHA)y
由定理6.8 的结果,我们知道(AHA)(1)AH(A{1,2,3}
因此,x=A(1,3)b+(I(A(1,3)A)y
从而 Ax=AA(1,3)b=PR(A)b,即x为Ax=b的最小二乘解。
证毕。
4,矛盾方程组的极小范数最小二乘解与A+
定理6.33 设A(Cm×n,b( Cm,则x=A+b是方程组Ax=b
的惟一极小范数最小二乘解。反之,设X(Cn×m,若对所有b( Cm,x=Xb是方程组Ax=b的极小范数最小二乘解,则X=A+。
证明:取A(1,3)(A{1,3},则Ax=b最小二乘解满足
Ax=AA(1,3)b,
这个方程的最小范数解为x=A(1,4)AA(1,3)b=A+b.
(此处利用 A(1,4)AA(1,3)=A+).
反之,若对任何b,Xb为Ax=b的极小范数最小二乘解,
则Xb=A+b,从而X=A+.
由于极小范数解唯一,因此极小范数最小二乘解唯一。
定理6.34 若矩阵方程(6.4.5)不相容,则它的极小范数最小二乘解,即满足

的惟一解为
X=A+DB+