第五章 矩阵的相似对角化
第一节 矩阵的特征值和特征向量
相似矩阵
? 本节进一步讨论方阵的内在性质,加深对矩阵的
认识和理解,以便更好地使用矩阵解决线性代数中
的问题。
一,矩阵的特征值和特征向量
定义 1 设 A是 n阶矩阵,如果数 ?和 n维非零列向量
x,使关系式
Ax =?x (1)
成立,则称数 ?为矩阵 A的特征值 (eigenvalue),非
零向量 x称为 A的对应于特征值 ?的特征向量
(eigenvector)。
例 1 试验证
是矩阵
分别是属于特征值 ?1 = 1和 ?2= ?5的特征向量
?
?
?
?
?
?
?
???
?
?
?
?
?
??
1
2
,
1
1
?
?
?
?
?
?
?
?
?
12
43
A
证 只需验证 A? = 1??,A? = ?5??:
(1)
式也可以写成,
(A??E)x = 0 (2)
这是 n个未知数 n个方程的齐次线性方程组,我们知
道,它有非零解的充分必要条件是系数行列式
|A ? ?E| = 0 (3)
?????
?
?
?
?
?
?
???
?
?
?
?
? ?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
????
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
??
5
1
2
5
5
10
1
2
12
43
A
1
1
1
1
1
12
43
A

上式是以 ?为未知数的一元 n次方程,称为方阵 A的
特征方程。其左边是 ?的 n次多项式,记作 f (?),
称为 A的特征多项式。显然,A的特征值就是特征
方程的根或特征多项式的零点。这个 n次的特征方
程在计算根的重数时应共有 n个实根或复根。因
此,n阶矩阵有 n个特征值。
0
aaa
aaa
aaa
nn2n1n
n22221
n11211
?
??
??
??
?
????
?
?
读者注意:( 1)式也可改写成( ?E- A) x= 0,从
而( 3)式变成 | ?E ?A | = 0,
即有些教材把上式定义为方阵 A的特征方程,其左边
是 ?的 n次首一多项式,亦记作 f (?),并称为 A的特
征多项式。事实上,为叙述的方便,在本章的最后
一节中,作者采用的就是这种定义。
0
aaa
aaa
aaa
nn2n1n
n22221
n11211
?
????
????
????
?
????
?
?
设 n阶矩阵 A=(aij)的特征值为 ?1,?2,…,?n,由多项式
根与系数之间的关系可得:
1,?1 + ?2 + … + ?n = a11 + a22 + … + ann
2,?1?2… ?n = |A|
由 (2)知,方阵 A可逆的充要条件是 A有 n个非零的特征
值。
设 ?=?i是方阵 A的一个特征值,则由方程
( A ? ?iE ) x = 0
可求得非零解 x = Pi,那么 Pi就是 A的对应于特征值 ?I
的特征向量。
(注意:若为 ?i是实数,则 Pi可取实向量;若 ?i为复
数,则 Pi为复向量。)
例 2 求
的特征值和特征向量。
解 A的特征多项式为
所以 A的特征值为 ?1=4,?2=2。
当 ?1=2时,由 ( A ? ?1E ) x = 0,即
??
?
??
?
?
?
?
31
13
A
)2)(4(1)3(
31
13
EA 2 ?????????
???
???
???
??
?
??
??
??
?
??
?
?
?
?
?
?
?
??
??
0
0
x
x
231
123
2
1

解得 x1 = x2,所以对应的特征向量可取为
当 ?2 = 4时,由 ( A ? ?2E ) x = 0,即
解得 x1 = ? x2,所以对应的特征向量可取为
?
?
?
???
??
0xx
0xx
21
21
?
?
?
?
?
??
1
1
1p
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
??
??
0
0
x
x
431
143
2
1
显然,若 Pi为 A的对应于特征值 ?i的特征向量,则
kPi( k?0)也是对应于 ?i的特征向量
例 3 求矩阵
的特征值和特征向量。
解 A的特征多项式为
?
?
?
?
?
?
?
?
1
1
2
p
?
?
?
?
?
?
?
?
?
?
?
?
?
201
034
011
A
2)1)(2(
201
034
011
|EA | ?????
?
?
?
?
?
?
?
?
?
?
??
???
???
???
所以 A的特征值为 ?1 = 2,?2 = ?3 = 1。
当 ?1 = 2时,解方程 (A ? 2E) x = 0。由
得基础解系
所以 k1P1(k1 ? 0)是对应于 ?1 = 2的全部特征值。
当 ?2 = ?3 = 1时,解方程 (A ? E) x = 0。由
,
000
001
010
001
014
013
E2A
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
1
0
0
1
p
得基础解系
所以 k2P2 (k2 ? 0)是对应于 ?2 = ?3 = 1的全部特征
向量。
,
000
101
012
101
024
012
EA
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
1
2
1
2
p
例 4 求矩阵
的特征值和特征向量

?
?
?
?
?
?
?
?
?
?
?
?
?
314
020
112
A
???
??
???
???
314
020
112
EA
?
?
?
?
?
?
???
???
???
34
12
)2(
= (2 ? ?)( ?2 ??? 2 )
= ? (? + 1 )( ?? 2 )2,
所以 A的特征值为 ?1 = ?1,?2 = ?3 = 2。
当 ?1 = ? 1时,解方程 (A + E) x = 0。由
得基础解系
,
000
010
101
414
030
111
EA
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
1
0
1
1
p
所以对应于 ?1 = ?1的全部特征向量为 k1P1
( k1 ? 0 )。
当 ?2 = ?3 = 2时,解方程 (A ? 2E) x = 0。由
得基础解系
所以对应于 ?2 = ?3 = 2的全部特征向量为 k2 P2 +
k3 P3 (k2,k3不同时为零 )
,
000
000
114
114
000
114
E2A
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
,
4
0
1
,
1
1
0
32
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? pp
例 5 设 ?为方阵 A的特征值,证明 ?2是 A2的特征值。
证 因 ?为 A的特征值,故有 P ? 0使 AP=?P。于是
A2 P = A (A P ) = A (?P ) = ? ( A P ) = ?2 P,
所以,?2是 A2的特征值 。
由此例类推,不难证明:若 ?为方阵 A的特征值,则 ?k
是 Ak的特征值;
? (?)是 ? (A)的特征值(其中,?(?)为 ?的 m次多项
式)。若 A为可逆矩阵,则还有 ??1是 A?1的特征值。
定理 1 设 ?1,?2,…, ?m是方阵 A的 m个特征值,
p1,p2,…, pm依次是与之对应的特征向量。如果
?1,?2,…, ?m各不相等,则 p1,p2,…, pm线
性无关。
证 设有常数 x1,x2,…, xm使
x1p1 + x2p2 + … + xmpm= 0
则 A(x1p1 + x2p2 + … + xmpm)= 0,即
?1x1p1 +?2 x2p2 + … + ?mxmpm= 0
又 A ( ?1x1p1 +?2 x2p2 + … + ?mxmpm ) = 0,即
类推之,有
把上述各式合写成矩阵形式,得
)1m,,2,1k(xxx mmk m22k 211k1 ????????? ?? 0ppp
).(
1
1
1
)x,,x,x(
1m
mm
1m
22
1m
11
mm2211,00,0,ppp ?
?
????
?
?
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
?
?
?
上式等号左边第二个矩阵的行列式为范德蒙行列
式,当 ?I各不相同时该行列式不等于零,从而该矩
阵可逆,于是有
( x1p1, x2p2, …, xmpm) =( 0,0,…, 0)
即 xi pi = 0,( i = 1,2,…, m)。但 pi ? 0,故 xi
= 0( i = 1,2,…, m)。
所以,向量组 p1,p2,…, pm线性无关。
二,相似矩阵及其性质
定义 2 设 A,B都是 n阶方阵,若有可逆方阵 P,使
P?1AP = B则称 B是 A的相似矩阵,或说 A与 B相似 。
对 A进行运算 P?1AP称为 对 A进行相似变换,可逆矩
阵 P称为 把 A变成 B的相似变换矩阵 。
容易证明,方阵之间的相似关系是 等价关系 。
定理 2 若 n阶方阵 A,B相似,则 A,B的特征多项式
相同,从而 A与 B的特征值相同 。
证 因为 A,B相似,所以存在可逆矩阵 P,使
P?1AP = B。故
|B ??E|=| P?1AP ? ?E|
=| P?1AP ? P?1(?E)P |
=|P?1(A ??E)P|
=|P?1|·|A ? ?E|·|P|
=| A ? ?E|
推论 若 n阶方阵 A与对角阵。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
n
2
1
00
00
00
?
????
?
?
相似,则 ?1,?2,…,?n就是 A的 n个特征值。
定理 3 若 n阶方阵 A,B相似,相似变换矩
阵为 P,则
1,Ak与 Bk相似,且相似变换矩阵为 P,即 Ak =
P?1Bk P (k为正整数 );
2,? (A)与 ? (B)相似,且相似变换矩阵为 P,即
? (A) = P?1? (B)P 。
其中 ? (A)为 A的 m次多项式。
证 (1) 因为 A = P?1BP,所以
A2 = (P?1BP)( P?1BP) = P?1B2P,
A3 = (P?1B2P)( P?1BP) = P?1B3P,

Ak = (P?1Bk?1P)( P?1BP) = P?1BkP,
(2) 设
? (A) = a0Am + a1Am?1 + … + am ?1A + amE,
由( 1)知,
? (A) = a0Am + a1Am?1 + … + am ?1A + amE
= a0P?1BmP + a1P?1Bm?1P + … +
am?1P?1BP + amP?1EP
= P?1(a0Bm + a1Bm?1 + … + am ?1B +
amE)P
= P?1? (B)P
三 一般矩阵的对角化
? 这一段我们要讨论的主要问题是:对 n阶方阵 A,
寻求相似变换矩阵 P,使 P?1AP=?为对角阵,该
手续称为把方阵 A对角化,并称可与对角阵相似
的矩阵为可对角化矩阵。
定理 4 n阶方阵 A可对角化的充要条件是 A具有 n
个线性无关的特征向量。
证 必要性 设 A与对角阵 D=diag(d1,d2,…,dn) 相
似,故有满秩矩阵 P,成立
A = PDP?1

AP = PD
对 P按列分块,
P = [p1,p2,…, pn]
则可将( 4)式写成 n个向量等式
Api = dipi ( i=1,2,…, n)
显然 Pi是 A的对应于特征值 di的特征向量。又因 P可
逆,故 p1,p2,…, pn线性无关。
充分性
若 A有 n个线性无关的特征向量 p1,p2,…, pn,
它们所对应的特征值分别为 ?1,?2,…, ?n 。 则

Api = ?ipi ( i=1,2,…, n)
将这 n个向量等式合并成矩阵等式,得
A[p1,p2,…, pn] = [?1p1,?2p2,…, ?npn]
联系定理 1,可得如下推论:
推论 如果 n阶方阵 A的 n个特征值互不相等,则 A与
对角阵相似。
当 A的特征方程有重根时,就不一定有 n个线性无
关的特征向量,从而就不一定可对角化。例如在 例
3中 A的特征方程有重根,确实找不到 3个线性无关
的特征向量,因此,例 3中的 A不能对角化;而在例
4中虽然 A的特征方程也有重根,但却能找到 3个线
性无关的特征向量,因此 例 4中的 A可对角化。
一个方阵具备什么条件才能对角化是一个较复杂
的问题。我们对此不作一般性的讨论,而仅讨论当
A为实对称阵的情形。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
100
100
154
B,
100
120
111
A