矩阵是什么?
矩阵是线性映射的表示:
线性映射的相加表示为矩阵的相加线性映射的复合表示为矩阵的相乘
矩阵是一种语言,它是表示复杂系统的有力工具。学习矩阵理论的重要用途之一就是学会用矩阵表示复杂系统的关系,培养根据矩阵推演公式的能力是学习矩阵论的目的之一。
定义一个矩阵有几种方式:可以通过定义矩阵的每一个元素来定义一个矩阵,也可以通过矩阵具有的性质来定义一个矩阵。如:对称矩阵可以定义为:aij=aji
也可以定义为,(x,Ay)=(Ax,y),
还可以定义为,Ax=(f(x),其中f(x)=xTBx/2,即它对向量x的作用相当于函数f(x)在x处的梯度。
第一章:线性空间和线性变换
线性空间集合与映射集合是现代数学的最重要的概念,但没有严格的定义。
集合的运算及规则,两个集合的并、交运算以及一个集合的补;集合中元素没有重合,子集,元素
映射:为一个规则(:S ( S',使得S中元素a和S'中元素对应,记为 a'=((a),或(:a(a'.
映射最本质的特征在于对于S中的任意一个元素在S'中仅有唯一的一个元素和它对应。
映射的原象,象;映射的复合。满射,单射,一一映射。
若S'和S相同,则称(为变换。
若S'为数域,则称(为函数。
线性空间的定义和性质定义1.1设V是一个非空集合,它的元素用x,y,z等表示,并称之为向量;K是一个数域,它的元素用k,l,m等表示,如果V满足下列条件在V中定义一个加法运算,即当时,有惟一的,且加法运算满足下列性质结合律
交换律
存在零元素0,使x+0=x;
存在负元素,即对任何一向量x(V,存在向量y,使x+y=0,则称y为x的负元素,记为-x,于是有
x+(-x) = 0
在V中定义数乘运算,即当x(V,k(K,有唯一的kx(V,且数乘运算满足下列性质
(5)数因子分配律 k(x+y)=kx+ky ;
(6) 分配律 (k+l)x = k x+l x ;
(7) 结合律 k(l x)=(k l ) x ;
1 x = x
则称V为数域K上的线性空间或向量空间。
特别地,当K为实数域R时,则称V为实线性空间;
当K为复数域C时,则称V为复线性(酉)空间。
例:次数不超过n(1的多项式Pn全体按照通常的多项式加法和数乘构成一个线性的多项式函数空间;
即:f(x)=a0xn(1+a1xn(2+…+an(2x+an(1
g(x)=b0xn(1+b1xn(2+…+bn(2x+bn(1
定义 f(x)(g(x)=f(x)+g(x),
k(f(x)=(k(a0)xn(1+(k(a1)xn(2+…+(k(an(2)x+k(an(1
n维实向量的全体按照通常的向量加法和数乘构成一个实线性空间,我们把这个空间称为实向量空间;
即:x,y(Rn,定义:(x(y)i=xi+yi,(k(x)i=k(xi
所有m(n实矩阵的全体按照通常的矩阵加法和数乘构成一个实线性空间,称之为矩阵空间;
由例如,取V=R,x,y(V,定义 x(y=(x3+y3)1/3,k(x=k1/3x,k(R.
易验证这样定义的加法和数乘仍然构成一个线性空间。
线性函数(泛函)空间;
线性函数(泛函)的对偶空间。
这两个空间是泛函分析研究的内容,我们不进行过多讨论。
线性空间中,向量的关系:
线性相关:若存在一组不全为零的数c1,c2,…,cm,使得
c1x1+c2x2+…+cmxm=0
则称向量组x1,x2,…,xm线性相关,否则为线性无关。
极大线性无关组:一个不可能再往里添加向量而保持它们的线性无关性引理1.1:线性无关组总是可以扩充为极大线性无关组。
引理1.2:在一个线性空间中任两个极大线性无关组若它们的所含向量个数都有限,则所含向量个数一定相同.(作为作业证明)
(定义)线性空间V的维数:V中极大线性无关组的所含向量的个数,定义为线性空间的维数。
维数有限的称为有限维空间,否则称为无穷维空间。
本书仅仅研究有限维空间,这里得到的结论有些可以直接推广到无穷维空间,但有些却不可能。必须小心!
在后面的讨论中我们仅仅讨论有限维空间,而不一一说明。
线性空间中向量的表示
线性空间的基:若线性空间V的向量x1,x2,…,xr满足
x1,x2,…,xr线性无关;
V中的任意向量x都是x1,x2,…,xr的线性组合;
则称x1,x2,…,xr为V的一个基或基底,相应地称xi为基向量。
推论1.1,线性空间中任意一组极大无关组构成它的一组基。
定义1.2:称线性空间Vn的一组基x1,x2,…,xn为Vn的一个坐标系。设向量x(Vn,它在该组基下的线性表示为
x = c1 x1+c2x2+…+cnxn
则称 c1,c2,…,cn为x在该坐标系下的坐标或分量,有时我们称
n维向量(c1,c2,…,cn)T为向量x在该组基下的表示。
数域相同的线性空间和欧氏空间的关系:
定理1.2 在一组基下我们看到任意n维线性空间V和n维欧氏空间Rn(或Cn)代数同构,即存在V和Rn或(Cn)的一一映射(:V(X使得
((x+y)= ((x)+ ((y),x,y(V
((kx) =k ((x),x(V,k(K.
(按后面的定义,(实际为可逆的线性映射)。
这个定理说明虽然n维线性空间有无穷多,但是从代数的角度我们仅仅研究n维实(或复)欧氏空间就足够了。
基变换与坐标变换在线性空间Vn中,同一向量对不同的基,它的坐标表示是不一样的。当由一个基x1,x2,…,xn变换为另一个基y1,y2,…,yn时,则由基的定义可得
y1=c11x1+c21x2+…+cn1xn
y2= c12x1+c22x2+…+cn2xn
(
yn= c1nx1+c2nx2+…+cnnxn
或用矩阵形式写为
Y = XC 称为基变换公式 (1.1)
其中矩阵C为
c11 c12 … c1n
c21 c22… cn2 称为由旧基到新基的过渡矩阵。
(
cn1 cn2…cnn
Y=(y1,y2,…,yn),X= (x1,x2,…,xn)
矩阵A为奇异矩阵定义为:存在非零n维向量x使得Ax = 0.
推论1.2 过渡矩阵非奇异,(自行证明)
从推论1.2我们可以发现,任何一个非奇异矩阵都可以看成是线性空间的两组基之间的过渡矩阵,换句话说,是一组基在另一组基下的坐标表示。
向量在不同基下的表示坐标的关系:
设由一个基x1,x2,…,xn变换为另一个基y1,y2,…,yn时过渡矩阵为C,向量x在基x1,x2,…,xn和基y1,y2,…,yn的坐标表示分别为
( =[(1,(2,…,(n]T,( =[(1,(2,…,(n]T则有
x=X((=Y((=X(C((,从而有(=C((或者(=C-1((
或用分量形式推导得

即为 (=C((
线性子空间定义:设V1是数域K上线性空间V的非空子集合,且对V已有的线性运算满足以下条件
(1)对加法封闭,若x,y(V1,则x+y(V1
(2)对数乘封闭:若x(V1,k(K,则k(x(V1.
则称V1为V的线性子空间或子空间。
仅由0元素构成的子空间为零子空间。
注意:零子空间的维数为0而不是1。
子空间的运算:交,和,直和两个子空间V1,V2的交V1(V2仍为子空间。
定义1.8 设V1,V2为数域K上的线性空间V的子空间,且x(V1,
y(V2,则由x+y 的全体构成的集合称为V1和V2的和,记为
V1+V2.记V1+V2={z | z=x+y,x(V1,y(V2}。
显然,两个子空间V1,V2的和V1+V2仍为子空间,并且交与和分别满足结合律,即(V1(V2) (V3=V1((V2 (V3),
(V1+V2)+ V3=V1+(V2 +V3),
从而它们都可以推广到几个子空间的情形,并且
V1(V2 (… (Vn 或V1+V2 +… +Vn有意义。
子空间的维数公式:dim V1+dim V2=dim (V1+V2)+dim(V1(V2)
直和的定义,若V1(V2=0,则V1+V2为V1,V2的直和,记为
V1⊕V2。
性质:对于V1⊕V2中的元素z,在V1和V2分别存在唯一x和y使得z=x+y.即z的分解唯一。
显然有V1⊕V2( dim(V1(V2)=0( dim V1+dim V2=dim (V1+V2)
子空间的构成:1)由几个子空间的交或和构成。
2)向量x1,x2,…,xm组扩张而成。
由单个非零向量x对数乘运算封闭构成的一维子空间维
L(x)={z | z=k(x,k(K}.
同理记L(x1,x2,…,xm)=L(x1)+L(x2)+…+L(xm)
显然dim(L(x1,x2,…,xm)) ( m
思考题1:一个n维线性空间的真子空间有多少?
思考题2:若V1,V2,…,Vm为线性空间V的真子空间,证明存在一个向量x(V,但x(V1(V2( …(Vm成立。
特别讨论在实线性空间Rm中矩阵A=(aij)(Rm(n的列向量构成的子空间L(a1,a2,…,an)称为矩阵A的值域(列空间),记为
R(A)=L(a1,a2,…,an)(Rm
矩阵的秩矩阵的列秩:由矩阵的列向量构成的最大无关组的个数。
矩阵的行秩:由矩阵的行向量构成的最大无关组的个数。
定理,矩阵的行秩和列秩相同。
从而它们称为矩阵的秩,极为rank(A).
定理 dim(R(A))=rank(A).
定义1.7 设在实线性空间Rn中矩阵A=(aij)(Rm(n,称集合{x|Ax=0}为矩阵A的核空间,记为N(A),即N(A)={x|Ax=0}(Rn.
称N(A)的维数为A的零度,记为n(A),即n(A)=dim(N(A)).
定理,dim(R(A))+dim(N(A))=n,
思考:若A(Rn(n,R(A) ⊕ N(A)成立吗?举例说明?
成立的条件是什么?
2 线性映射,线性函数,线性变换及它们的矩阵表示表示是什么?表示究是本质来说是一种映射,它把我们不熟悉或抽象的事物映射为我们熟知或具体的事物。
例如:抽象的线性空间在一组基下可表示为实或复的向量空间。
同样地,线性空间之间的线性映射都可以表示为矩阵。这正是矩阵的代数本质所在。(向量为特殊的矩阵)
这就是本节所研究的内容。
定义:数域相同的线性空间X到线性空间Y的映射T称为线性映射,若T满足下列条件,1) T(x+y)=T(x)+T(y)
2) T(kx)=kT(x)
若线性空间W和线性空间V的维数分别为:m=dim(W),n=dim(V)
x1,x2,…,xm以及y1,y2,…,yn分别为W和V的一组基,
则线性映射可以表示为一个Rn(m的矩阵。
设向量Txi在基y1,y2,…,yn的坐标表示为
Txi=(y1,y2,…,yn) (a1i,a2i,…,ani)T=(y1,y2,…,yn)ai,i=1,2,…,m
记矩阵A=(a1,a2,…,am),Y=(y1,y2,…,yn),X= (x1,x2,…,xm)。
则有 TX=(Tx1,Tx2,…,Txm)=Y (A (2.1)
对任意向量x在基x1,x2,…,xm的坐标表示为( =[(1,(2,…,(m]T,向量Tx在基y1,y2,…,yn的坐标表示为( =[(1,(2,…,(n]T,那么我们有 Tx=Y((=T(X(()=(TX) ((=(Tx1,Tx2,…,Txm) ((
=Y((A( )( (=A( (2.2)
从而对于线性映射T,在基X和Y的下的表示为矩阵A.
T, x ( y=Tx 其中x=X(,y=Y(
A,( ( (=A(
注意对于同一映射,若基X和Y选择不同,则T的表示A一般不相同。
一个很自然的问题就是各种表示之间的关系如何?
若用映射的形式我们可以表示为:
A=((T; X,Y) (2.3)
设线性空间W的另一组为X',且X'=XC,
线性空间V的另一组为Y',且Y'=YD,或Y=Y' D(1
(注意,因为C和D分别为过渡矩阵,从而可逆)
设线性映射T在基X'和Y'下的矩阵为A',即 TX'=Y' A'
则 TX'=T(XC)=(TX)C(由(2.1))=Y(AC)=Y'D(1AC=Y'A'
从而我们有 A'= D(1AC (2.4)
这就是线性映射在不同基下的矩阵表示的关系式。
注意,D(Rn(n,A(Rn(m,C(Rm(m.
线性映射的复合,S,W(V; T,V(Z
定义 (T(S)(x)=T(S(x)),
其中W,V和Z为线性空间,S和T都为线性映射。
很明显,线性映射的复合仍为线性映射。
设x1,x2,…,xm为W的一组基,
y1,y2,…,yn为V的一组基
z1,z2,…,zr为Z的一组基,
S在W和V的当前基下的表示为A,
而T在V和Z的当前基下的表示为B,
则它们的复合T(S在当前基下的矩阵表示为BA.
由于映射的复合一般不可交换,从而对应的矩阵的乘法也不可交换,即 BA=AB一般不成立。
定理:W内的线性子空间在V中的象为V的线性子空间。
反之,V中的线性子空间V1的逆象
T-1(V1)={ x | ( y s.t,y=Tx }
也为X中的线性子空间。
记R(T)为W在V中的象,称之为值域,即
R(T)={ y(V | y=Tx,( x(W }
记N(T)为V中零向量空间的逆象T-1(0),称之为T的核,即
N(T)={ x| Tx=0,x(W }
T的值域R(T)的维数dim(R(T))称为T的秩,其核子空间的维数dim(N(T))称为T的亏度。
对于W到V的两个的线性映射T1和T2分别定义它们的加法和数乘如下:
(T1+T2)(x)=T1x+T2x (2.4)
(kT1)(x) = k (T1x) (2.5)
那么有以下定理:
定理2.4:所有W到V的线性映射的全体按(2.4)和(2.5)定义的加法和数乘构成一个线性空间。这个空间的维数为mn.
几个特殊的线性映射:
1)线性函数,即取 Y=R1,或C1称之为实或复线性函数。在泛函分析中称之为线性泛函。
根据定理2.4我们有n维线性空间V上的线性函数的全体构成一个n维的线性空间L(V),从而 L(V)和V代数同构。在泛函分析中称之为V的对偶空间。 设若x1,x2,…,xn为V的一组基,而T1,T2,…,Tn为L(V)的一组基,若它们之间满足
Ti(xj)=0,i(j
Ti(xi)= 1,i=1,2,…,n
则称基x1,x2,…,xn和T1,T2,…,Tn的对偶基。
在对偶基下,线性函数可表示为向量内积。
设线性函数T可表示为T=(1T1+(2T2+…+ (n Tn,同样V中的向量x可表示为 x=(1x1+(2x2+…+ (nxn,若基x1,x2,…,xn和T1,T2,…,Tn为对偶基,那么线性函数T(x)可表示为
T(x)=(1(1+(2(2+…+ (n (n
其中ti,(i都为实数或复数。
很明显,线性空间V的任意一组基x1,x2,…,xn,在L(V)中一定存在它的对偶基T1,T2,…,Tn,求线性函数空间的对偶基在许多应用中都是非常关键的,此处仅介绍概念而已。
对于我们熟知的欧氏空间Rn,设矩阵A的列向量构成它的一组基(此时A一定可逆),则A-1的行向量构成Rn的线性函数空间一组对偶基。求取对偶基在数值分析的n次多项式的Lagrange插值方法中表现为求取插值基函数。
2)线性变换:若线性映射T为:W(W,则称T为线性变换。
线性映射和线性映射的区别:
线性映射T:W (V,
线性变换T,W(W.
线性映射的矩阵表示A与X和Y的选择基有关。
线性变换的矩阵表示A仅需选择X的一组基而不是两组基。
区别2的意思是,线性空间W上的线性变换T的矩阵表示A仅需选择一组基x1,x2,…,xn,那么
Txi=(x1,x2,…,xn) (a1i,a2i,…,ani)T=(x1,x2,…,xn)ai,i=1,2,…,n
这时有TX=AX.
( 我们称A为线性变换T在线性空间W的基x1,x2,…,xn
的矩阵表示。)
这时如果将T看作W(W的线性映射,我们分别选择W的两组基X= (x1,x2,…,xm)和Y=(y1,y2,…,yn),这时T的矩阵A表示为
Txi=(y1,y2,…,yn) (a1i,a2i,…,ani)T=(y1,y2,…,yn)ai,i=1,2,…,m
这时有TX=Y A.
在以后,我们所线性变换时,仅需选择一组基。
由于线性变换仅为线性映射的特殊情形,因此前面讨论的关于线性映射的所有定义和性质对线性变换都适应,我们不必重复。
下面我们仅讨论线性变换的特殊之处。
线性变换的矩阵表示在不同基下的关系:
设线性空间W的两组不同基X和X'之间满足关系
X'=XC
那么线性变换T在基X和X'下的矩阵表示分别为A和A',
则 A'= C(1AC
定义,线性变换在不同基下的表示矩阵称为相似矩阵。
定理,矩阵A和A'相似的充要条件为存在可逆矩阵C
使得 A' = C(1AC
容易验证矩阵相似关系为等价关系。
即,自反性:A和A相似;
对称性:若A和B相似,则B和A相似;
传递性:若A和B相似,B和C相似,则A和相似。
从这儿我们可以看出,在相似等价意义下具有的性质有时也称线性变换的性质。例如,相似的矩阵具有相同的行列式,所以我们可以认为线性变换的对应矩阵的行列式为线性变换对原空间的单位超立方体经变换后的多面体的体积。这正是多元积分的变量替换的Jacobi行列式。
又如 我们知道,相似的矩阵具有相同的的特征多项式,所以我么可以定义线性变换的特征多项式。同样可以导出线性变换的特征值,线性变换的迹(定义为线性变换的所有特征值的和)。
几个特殊的变换:
零变换T0,T0(x)=0.
恒等变换I,I(x) = x.
数乘变换Tk,Tk(x)= k (x.
正交变换T,||Tx||2=||x||2,其中||.||2为欧氏范数(第2章介绍)
对于复合变换T(T记为T2,类似地,记Tk+1=Tk(T,
显然若线性变换T的矩阵表示为A,则Tk的矩阵表示为Ak,
从而线性变换f (T)=a0Tm+a1Tm(1+…+am-1T+am I
(此处I表示恒等变换)
的矩阵表示为矩阵多项式:
f (A)= a0Am+a1Am(1+…+am-1A+amI
其中I表示单位矩阵。
线性变换的特征值和特征向量由于线性变换在不同基下的矩阵表示不相同,那么一个很自然的问题就是,怎样选择特殊的基使得给定线性变换在该组基下的表示矩阵最简单。
为此引入下列概念.
定义,若存在非零向量x和数(满足
Tx=( x
则称(为T的特征值,x为相应的特征向量。
注意,由定义,特征向量非零。
定义:矩阵A的特征矩阵(I(A的行列式det((I(A)=| (I(A|,称为矩阵A的特征多项式,记为((()。((()的根(0为A的特征根或特征值;相应方程((0I(A)x=0的非零解x称为A的属于(0的特征向量。
若线性变换T在线性空间的一组基X下的矩阵表示为A,即
T X=(Tx1,Tx2,…,Txn)=XA
设T的特征向量x在基X的坐标表示为(,即
x=(1x1+(2x2+…+ (nxn =X((1,(2,…,(n)T=X(
那么有 X((0(()=(0x=Tx=T X(=XA(
从而 (0((= A(,
由于上述推导可以倒推,因此求线性变换T的特征值(0和特征向量x等价于在一组基X下求T的表示矩阵A的特征值(0和特征向量(。这时(为x在基X下的坐标,即 x=X(。
定义(特征子空间):设(0为线性变换T的一个特征值,称线性变换(0I(T 的核空间V(0={x | ((0I(T)x=0 } 为T的属于(0的特征子空间,其中I表示恒等变换。
定义:变换矩阵A的迹 Trace(A)=Tr(A)=
性质1:Tr(A)等于A的所有特征值的和.
由根与系数的关系可得。
性质2,Tr(AB)=Tr(BA).
性质3,对任意可逆矩阵P,Tr(A)=Tr(P(1AP),这说明矩阵A的迹由线性变换T(在某种基下对应于矩阵A)决定,与基(坐标)的选择无关。
矩阵的性质定理1.16(Sylvester) 设A(Rm(n,B(Rn(m, AB的特征多项式为(AB((),BA的特征多项式为(BA((),则(n(AB(()=(m (BA(()
证明:根据矩阵等式有:
Im 0 Im A (Im-AB 0
-B In 0 (In B In
Im 0 (Im A (Im A
-B In (B (In 0 (In-BA
对矩阵等式取行列式可得结论。
特殊矩阵:三角矩阵L,对角矩阵D
下三角矩阵D+L,单位下三角矩阵I+L,严格下三角矩阵L,
上三角矩阵D+LT,单位上三角矩阵I+LT,严格上三角矩阵LT,
块对角矩阵,块三角矩阵;
初等矩阵(定义),E(u,v;()=I((uvH
性质1,E(u,v;()E(u,v;()= E(u,v;(+((((vHu);
性质2,det(E(u,v; ())=1- ((vHu
性质3,Ln =0
性质4,若对角矩阵D的元素各不相同,对于变换矩阵A有DA=AD,则 A为对角矩阵。
定理1.17 任意n阶矩阵与三角矩阵相似.
定理1.18 (Hamilton-Cayley) n阶矩阵A是其特征多项式的根,
即设((()=det((I(A)=(n +a1(n(1+…+an-1(+an
则 ((A) =An +a1An(1+…+an-1A+anI=0.
定义19,在所有首项系数为1的多项式中使得A成为它的根的最小次数多项式m(()称为A的最小多项式。
定理1.19 矩阵A的最小多项式m(()可整除以A为根的任意首意多项式( ((),且m(()是唯一的。
定理1.20矩阵A的最小多项式m(()和特征多项式( (()的零点相同。
定理1.21 设n阶矩阵A特征多项式( ((),特征矩阵(I(A的全体n(1阶子式的最大公因式为d((),则A的最小多项式为
m(()=( (()/d(()
定义20,对于给定变换矩阵A,向量u关于A的指标r定义为使得u,Au,A2u,…,Ar(1u线性无关的最大整数。
定理1.22 如果(1,(2,…,(s是矩阵A的互不相同的特征值,x1,x2,…,xs是分别属于它们的特征向量,那么x1,x2,…,xs线性无关。
定理1.23如果(1,(2,…,(k是矩阵A的互不相同的特征值,xi1,xi2,…,xi ri是属于(i的线性无关的特征向量,那么x11,x12,…,x1r1,…,xk1,xk2,…,xkrk线性无关。
不变子空间定义1.20 如果线性空间V的线性子空间V1对线性变换T保持不变,即,任给x(V1,有Tx(V1,则称V1为T不变子空间.
定义1.21 设T为线性空间V的线性变换,若V1为T不变子空间,这时T可以看作V1的线性变换,记T在V1上的限制为T|V1。
不变子空间的性质:
性质1,不变子空间的和与交仍为不变子空间。
性质2,线性变换T的值域R(T),核N(T)仍为不变子空间。
性质3,设f(t)为多项式,则T的不变子空间为f(T)的不变子空间,
N(f(T))为T的不变子空间,从而特征子空间
V(={x| Tx=(x}为T的不变子空间。
利用不变子空间简化线性变换的矩阵定理1.27 设T是线性空间Vn的线性变换,且Vn可分解为s个T的不变子空间的直和
Vn=V1(V2(…(Vs
在每个不变子空间Vi中选取一组基
xi1,xi2,…,xini i =1,2,3,…,s
它们的合并构成Vn的一组基,则T在该组基下的矩阵为块对角矩阵 A=diag(A1,A2,…,As)
推论1,线性变换可对角化的充要条件为存在一组特征向量构成的基。
推论2 设(1,(2,…,(k是线性变换T的全部的k互不相同的特征值,
则T可对角化的充要条件为
dim(N((1I(T))+ dim(N((2I(T))+…+ dim(N((kI(T))= n
推论3 若线性变换T有n个互不相同的特征值,则T可对角化。
Jordan 标准形定理1.28 设T是复数域C上的线性空间Vn的线性变换,任取Vn的一组基,T在该基下的矩阵为A,T的特征多项式
((()=det((I(A)=
(m1+m2+…+ms=n)
则Vn可分解为不变子空间的直和
Vn=N1(N2(…(Ns
其中Ni={x| x=0,x(Vn}是线性变换的核空间。
若给每个子空间Ni选一组基,它们的并构成Vn 的基,且T在该组基下的矩阵为如下形式的对角块矩阵

其中

定义1.21 在上面的定义中 J称为矩阵A的Jordan 标准形,
Ji((i)为对应的Jordan 块。
定理,设矩阵A为复数域C的矩阵,特征多项式的分解((()=det((I(A)=
存在,则存在非奇异矩阵P使得 P(1AP= J.
定理1.30 每个n阶复矩阵A都与一个Jordan 标准形相似,这个Jordan 标准形除去其中Jordan块的排列次序外,是由A唯一确定的。
欧氏(Euclid)空间
定义,设V是实数域R上的线性空间,对V中任意两个x和y,按某种规则定义一个实数,用(x,y)表示,且满足下列四个条件:
1),交换律:(x,y)=(y,x);
2),分配律:(x,y+z)=(x,y)+(x,z)
3),齐次性,(kx,y)=k (x,y),( k(R
4),非负性:(x,x)(0,当且仅当 x=0时,(x,x)=0.
则称V为Euclid空间,简称欧氏空间或实内积空间.
思考:任意线性空间在它的两个向量能否定义内积,
若否,举例说明;若能,证明这一点。
例1.对于我们以前定义的线性空间V=R,
x?y =(x3+y3)1/3,
k☉x=k1/3(x
我们已经证明了这样定义的加法和数乘确实为线性空间。那么对于它的内积,我们可以定义为:(x,y)=(x(y)3
例2,对于V=R+,x?y =x(y,k☉x=xk,我们已经证明了这样定义的加法和数乘确实为线性空间。那么对于它的内积,我们可以定义为,(x,y)=logx(logy
例3,对于例2的一维空间,我们可以使用笛卡尔乘积扩充为多维空间 V=R+(R+(…(R+,对于任意x,y(V,x=(x1,x2,…,xn)T,y=(y1,y2,…,yn)T 定义
x?y =x1(y1+x2(y2+…+xn(yn,
k☉x=((x1)k,(x2)k,…,(xn)k)T,显然可以验证这样的加法和数乘确实构成一个线性空间。对于对于任意x,y(V,x=(x1,x2,…,xn)T,y=(y1,y2,…,yn)T 定义它们的内积为
(x,y)=log x1(log y1+log x2(log y2+…+log xn(logyn
这样我们对于这个n维线性空间,定义了一种内积。
例4,对于一般线性空间V,我们可以在其上选择一组基X=(x1,x2,…,xn),那么对于任意两个向量x,y(V,设它们的坐标分别为x((x1,x2,…,xn)T,y((y1,y2,…,yn)T,这时我们可以定义内积为
(x,y)=x1(y1+x2(y2+…+xn(yn
容易验证这样的定义仍然满足内积的条件。显然这样定义的内积与基函数的选择有关。我们可以讨论这样定义的两个不同基之间的内积的关系。(留作思考题)
作业题:针对例3中定义的线性空间,求出它的一组基,对这组基给出由例4中定义的内积,然后比较这样定义的内积和例3中定义的内积的关系。
定义,在Euclid空间中,非负实数称为向量x的长度(或模,范数),记为||x||或|x|.
定义,非零向量x和y的夹角<x,y>定义为
<x,y>=arccos
性质1 (x,k(y)=k (x,y)
性质2 (x,0)=(0,x)=0
性质3.
定义Gram矩阵A=(aij)=( (xi,xj) ),其中X=(x1,x2,…,xn)为一组基。
性质4,Schwarz不等式 |(x,y)|( ||x||(||y||
推论:设x,y(Rn,A为对称正定矩阵,则 |xTy| ( xTAx(yTA(1y
(证明留作思考题)
性质5,三角不等式 ||x+y||(||x||+||y||
性质6,(Reize表示定理) Euclid空间Vn中所有的线性函数都可表示为内积形式,即设l(x)为Vn为的一个线性函数,则一定存在一个向量 ul (Vn使得对任一x(Vn有l(x)=(ul,x).
正交性
Euclid空间的向量正交性,x和y正交的定义为(x,y)=0,
记为x (y.
定理,Euclid 空间的向量x和y正交的充要条件为||x+y||2=||x||2+||y||2
定义:如果Euclid空间中的一组非零向量两两正交则称之为正交向量组。
定理,正交向量组一定线性无关。
定义:在Euclid空间Vn中,n个正交向量组成的极大线性无关组构成Vn的正交基。由单位向量组成的正交基为标准正交基。
定理:任意Euclid空间Vn中存在一组正交基。对任意一组Vn的一组基x1,x2,…,xn,存在一组正交基y1,y2,…,yn满足L(x1,x2,…,xi)=L(y1,y2,…,yi),i=1,2,…,n成立。
证明过程就是 Gram-Schmidt正交化过程。
子空间的正交性,设Euclid空间Vn的两个子空间V1和V2满足任给x(V1,y(V2满足(x,y)=0,则称V1和V2正交。
子空间的正交补:设Euclid空间Vn的子空间V1,它的正交补定义为={x| (x,y)=0,(y(V1,x (Vn}.
定理,V1(=Vn
定理,对任意矩阵A(Rm(n,有
R((A)=N(AT),R(A)(N(AT)=Rm
R((AT)=N(A),R(AT)(N(A)=Rn
正交变换及其正交矩阵表示定义:设V为Euclid空间,T为其线性变换,如果T保持V中任意向量x的长度不变,即||x||=||Tx||,则称T为正交变换。
定理 T为正交变换的充要条件为保持内积不变,即
(x,y)=(Tx,Ty).
定义:若方阵Q满足 QTQ=I或Q(1=QT,
则称Q为正交矩阵。
定理(正交变换的矩阵表示),Euclid空间的线性变换为正交变换的充要条件为它对于标准正交基的矩阵是正交矩阵。
正交矩阵的性质:
性质1,正交矩阵非奇异.
性质2,正交矩阵的逆矩阵仍是正交矩阵.
性质3,正交矩阵的乘积仍是正交矩阵。
性质4,正交基变换矩阵为正交矩阵。
性质5,正交矩阵的特征值位于单位元。
对称变换和对称矩阵定义1.30 设T是欧氏空间V的一个线性变换,且对V中任意两个向量x,y都有
(Tx,y)=(x,Ty)
成立,则称T为V中一个对称变换。
定理,在Euclid 空间中线性变换是实对称变换的充要条件为它在标准正交基下的矩阵为对称矩阵。
定理:实对称矩阵的特征值都为实数,属于不同特征值的特征向量互相正交。
酉空间介绍:
定义,设V是复数域C上的线性空间,对V中任意两个x和y,按某种规则定义一个复数,用(x,y)表示,且满足下列四个条件:
1),交换律:(x,y)= (y,x),此处 (y,x)为(y,x)的复共轭;
2),分配律:(x,y+z)=(x,y)+(x,z)
3),齐次性,(kx,y)=k (x,y),( k(R
4),非负性:(x,x)(0,当且仅当 x=0时,(x,x)=0.
则称V为酉空间,简称复欧氏空间或复内积空间.
Euclid 空间的所有性质均可平行推广到复内积空间中,在此不一一罗列。可参看教材。
在此特别指出几个特别重要的地方:
1.酉变换T在标准正交基下的矩阵为酉矩阵A满足AHA=AAH=I.
2.Heirmite变换T在标准正交基下的矩阵A为Hermite矩阵,即满足 (Tx,y)=(x,Ty) 即 A=AH,
3,Heirmite矩阵的谱分解:设A为Heirmite矩阵,则
A=(1 p1((p1)H+(2 p2((p2)H+…+(n pn((pn)H
其中(i 和pi分别为A的特征值和特征向量。
应用谱分解证明:若A和B都为正定Heimite矩阵,则C=A(B仍为正定Heirmite矩阵,其中,cij = aij (bij,即C的每个元素为A和B元素的乘积。
需要特别讨论和注意的几个相似性定理:
定理1.41,1).设A(Cn(n,则存在酉矩阵P使得 PTAP=U,其中U为上三角矩阵。
2) 设A(Rn(n且它的所有特征值为实数,则存在正交矩阵Q使得 QTAQ=U,其中U为上三角矩阵。
定义:设A(Cn(n且AHA=AAH,则称A为正规矩阵.
定理1.42:1).设A(Cn(n,则A酉相似于对角矩阵的充要条件为A为正规矩阵,即存在酉矩阵P使得 PTAP=D,其中D为对角矩阵.
2)设A(Rn(n且它的所有特征值为实数,则A正交相似于对角矩阵的充要条件为A为正规矩阵,即存在正交矩阵Q使得存在正交矩阵Q使得 QTAQ=D,其中D为上三角矩阵。
定理1.17 任意n阶矩阵与三角矩阵相似.
定理1.30 每个n阶复矩阵A都与一个Jordan 标准形相似,这个Jordan 标准形除去其中Jordan块的排列次序外,是由A唯一确定的。