第六章 线性变换和特征值
6.1 n维空间的线性变换
6.2 方阵的特征值和特征向量
6.3 相似矩阵与矩阵的对角化
6.4 实对称矩阵的对角化
6.5 二次型及其标准形
6.6 奇异值分解简介
6.7 应用实例
6.8 习题
6.1 n维空间的线性变换定义 6.1 设 X,Y 是两个非空集合 。 若对于 X
中的任一元素 x,按照一定的对应法则 T,总有
Y中一个确定的元素 y与之对应,则称 T
为从集合 X到集合 Y的 映射,记为或,称 y是 X在映射 T下的 像,x是 y
在 映射 T下的 源,X称为映射 T的 源集,像的全体所构成的集合称为 像集,记作 。
y = T (x)
y = Tx?xX
TX
定义 6.2 设 是实数域上的向量空间,
T是一个从 到 的映射,若映射 T满足
1)
2)
则称 T为从 到 的线性映射,或称线性变换。线性映射就是保持线性组合的映射。
nmV,U
nV mU
, 1 2 n 1 2 1 2x,x V T ( x + x ) = T ( x + T ( x )有 )
,knx V R,T x T( x有 ( k ) = k )
nV mU
例 6.1 试证所有矩阵相乘的关系式即都是 的线性映射。
证,利用矩阵的数乘及乘法运算,
是 的映射。 显然有及即 T是 的线性映射。
y = T (x ) A x
111 1 1 2 1
2 2 1 2 2 2 2
12
n
n
m m m nmn
yxa a a
y a a a x
a a ayx






nmRR到
y = T (x ) A x
nmRR到
1 1 2 2,,y = A x y = A x若
1 2 1 2 1 2y y = A x A x A x x+ + = +11kky A x=
nmRR到例 6.2 向量空间 V中的恒等变换是线性变换。
证明,设,则有所以恒等变换 E是线性变换。
E,E (α )= α,α V
,kα,β VR
k k k
E( α + β )= α + β = E ( α ) + E ( β ),
E( α )= α = E ( α )
6.2 方阵的特征值和特征向量
6.2.1 特征值和特征向量的定义和计算定义 6.3 设 是 阶方阵,若存在数 和维非零列向量,使得
( 6-1)
成立,则称数 为方阵 A的特征值,称非零向量 为方阵 A对应于特征值 的特征向量。将
( 6-1)式变形为
(或 ) ( 6-2)
()ija?A n n?
x
A x = x
x?
( I - A )x 0 0)( xIA?
满足这个方程的 和 就是我们要求的特征值和特征向量。
( 6-2)式是含个 方程的 元齐次线性方程组,它有非零解的充要条件是
( 6-3)
记作 ( 6-4)
称 为方阵 A的特征多项式,方程 称为方阵 A的特征方程,特征值即为特征方程的根。由于 是 的 次多项式,所以方程 在复数域内有 个根(重根按重数计算)。
x
n n
I - A 0
1 1 1 2 1
2 1 2 2 2
12
( ) 0
n
n
n n n n
a a a
a a a
f
a a a




()f? ( ) 0f
()f n
( ) 0f n
矩阵 A的特征值和特征向量的计算步骤:
第一步,求特征值。先通过行列式( 6-4)
的计算,写出其特征多项式,这一步的难度是计算一个高阶的矩阵的行列式,需要很大的计算工作量;
第二步,并进行因式分解然后求出特征方程 的全部根这就是 A的所有特征值;
第三步,把每个特征值 分别代入方程,求齐次线性方程组 的非零解,它就是 A对应于特征值 的一个特征向量(不是惟一的)。
)(?f
)())(()( 21 nf
0)(f n,,,21?
i?
()iI - A x 0 ip
i?
例 6.4 求矩阵 的特征值和特征向量。
解,A的特征多项式所以 A的全部特征值为对于特征值 解齐次线性方程组
,即可得它的一个基础解系
324
2 0 2
423




A
2
3 2 4
2 2 ( 1 ) ( 8 )
4 2 3




IA
1 2 31,8
12 1,
0?(-I - A )x
1
2
3
4 2 4 0
2 1 1 0
4 2 4 0
x
x
x




所以 都不为零)是 A对应于特征值 的全部特征向量。
对于特征值,解齐次线性方程组
,得它的一个基础解系
,所以 是 A对应于特征值 8的全部特征向量。
11
2,0,
01




12ξ ξ 1 2 1 2(,k k k k?12ξ ξ
1 1
3 8
8?( I - A )x 0
2
1
2





3ξ 33,( 0 )kk?3ξ
6.2.2 方阵的特征值和特征向量的性质性质 1 阶矩阵 A与其转置矩阵有相同的特征值。
性质 2 设 是矩阵 A的 个特征值,

1)
2)
称 为矩阵 A的迹,记为
n
12,,,n n
1 2 1 1 2 2n n na a a
12 n A
1 1 2 2 nna a a ()tr A
性质 3 设 为方阵 A的特征值,则
1)当 A可逆时,是 的特征值
2) 是 A的伴随矩阵 的特征值
3) 是 的特征值;进而有矩阵 A的次多项式的特征值为
1
1?A
A ()adj A
()m mN mA m
10 1 1() mm mmf a a a aA A A A I
10 1 1() mm mmf a a a a
例 6.5 设矩阵
1)求及的特征值;
2)进一步求矩阵的特征值。
解,1)由 A的特征方程可得 A的全部特征值为 1,2,-1。
的特征值为
,即 -2,13,-8。
1 1 2
0 2 1
0 0 1
A



1 1 2
0 2 1 ( 1 ) ( 2 ) ( 1 ) 0
0 0 1




I - A =
f 3( A ) = 2A + A - 5I 3( ) 2 5i i if
2)
解法 1,先计算,令,求出特征方程 的根即可。
解法 2,因为 所以 A可逆,
为对应于 A的特征值 的特征向量,则又所以从而矩阵 的特征值为,即
1?A -1B = I + A
0I - B
1 2 3 2 0,A
ip
i?
1
i
pp-1 iiA ppiiI=
1( 1 ),1,2,3
i
p p i-1 ii( I + A )
1IA 11
i?
32,,0
2
定理 6.1 设 为方阵 A的互不相同的特征值,分别为对应于特征值的特征向量,则 线性无关。
推论 矩阵 A的 个互不相同特征值所对应的 组各自线性无关的特征向量并在一起仍是线性无关的。
12,,,m
,1 2 mξ,ξ,ξ 12,,,m
,1 2 mξ,ξ,ξ
m
m
6.2.3 特征值和特征向量的 MATLAB求法
MATLAB提供了计算方阵的特征值和特征向量各步骤的函数。这三个步骤是:
( 1)用 f=poly(A)可以计算方阵 A的特征多项式系数向量 f;
( 2)用 lamda=roots(f)可以求特征多项式 f的全部根 lamda(表示为列向量);
( 3)用函数 p=null([lamda*I-A])直接给出基础解 p,将 n个特征列向量 p排在一起,就是的特征向量矩阵。
取例 6.4为典型,解题的程序 ea604为
A=[3,2,4;2,0,2;4,2,3];
f=poly(A),
r=roots(f),r=real(r) B1= r(1)*eye(3)-A;
B1=rref(B1,1e-12),
p1=null(B1,‘r’)
B2=r(2)*eye(3)-A; p2=null(B2,‘r’)
B3=r(3)*eye(3)-A; p3=null(B3,‘r’)
程序运行的结果为:
f = 1.0000 -6.0000 -15.0000 -8.0000 (特征多项式系数向量 )
r = 8.0000(三个特征根即特征值,后两个是重根 )
-1.0000 + 0.0000i (微小虚数可用 r=real(r)
去除 )
-1.0000 - 0.0000i
实际上 MATLAB已经把求特征根和特征向量的步骤集成化,其中也包括了处理计算误差的功能,所以一条命令就解决问题了。这个功能强大的子程序名为 eig(特征值英文是 eigenvalue,特征向量英文是
eigenvector),调用的形式是:
[p,lamda]=eig(A)
输出变元中的 lamda是特征值,p是特征向量。把例 6.4的系数矩阵 A代入,即可得到:
- 0,4 9 4 1 - 0,5 5 8 0 0,6 6 6 7 - 1,0 0 0 0 0 0
- 0,4 7 2 0 0,8 1 6 1 0,3 3 3 3,0 - 1,0 0 0 0 0
0,7 3 0 1 0,1 5 0 0 0,6 6 6 7 0 0 8,00 00




p la m da

6.3 相似矩阵与矩阵的对角化定义 6.4 设 A和 B是 阶方阵,若存在可逆矩阵 P,使得,则称矩阵 A与 B相似,把
A变成 的变换称为 相似变换,可逆矩阵 P
被称为把 A变成 B的 相似变换矩阵 。
相似矩阵具有以下性质。设矩阵 A与 B相似
1)
2)
n
-1P A P = B
-1P AP
( ) ( )RR?AB
A = B
3)A与 B的迹相同
4)若 A可逆,则 B必可逆,且 也相似定理 6.2 设矩阵 A与 B相似,则它们的特征多项式相同,从而有相同的特征值,
推论 若 阶方阵 A与对角矩阵相似,则是矩阵 A的全部特征值。此时,必存在可逆矩阵 P,使得,称为把 矩阵 A对角化,也称矩阵 A可对角化。
11AB与
n
1
2
n




O
Λ
O 12,,,n
-1P A P = Λ
定理 6.3 阶方阵 A可对角化的充分必要条件 A是有 个线性无关的特征向量。
证明:
必要性 设 阶方阵 A可对角化,则存在可逆矩阵 使,从而即于是有,所以 是方阵 A
的特征值,是对应于特征值 的特征向量。
由于矩阵 P可逆,det(P)?0,必线性无关。
n
n
n
1 2 nP = p,p,,p -1P A P = Λ AP = PΛ

1
2
12,,,n
n





1 2 n 1 2 n 1 2 n
O
A p,p,,p = p,p,,p p p p
O
1,2,,i iniiA p = p i?
ip
i?
,1 2 np,p,p
充分性 设 是 A的 个特征值,
是与之对应的 个线性无关的特征向量,
令,则有即所以方阵 A可对角化。
推论 若 阶方阵 A的特征值互不相同,则方阵 A一定可对角化。
12,,,n n 1 2 n
p,p,,p
n
1 2 nP = p,p,,p AP = PΛ
1
2
n




-1
O
P A P = Λ
O
n
例 6.7 判断矩阵 能否对角化?
解,由 得 A的特征值为求得 对应的特征向量,再求对应的特征向量。
把 作行阶梯变换,得到相当于方程组 它只有一个线性无关的特征向量,即 A总共只有两个线性无关的特征向量,所以 A不能对角化。
1 1 0
4 3 0
1 0 2



A
2
1 1 0
| | 4 3 0 ( 2 ) ( 1 ),
1 0 2




I - A
1 2 32,1
1 20 1 0? T1p
23 1
2 1 0
4 2 0
1 0 1



I - A
1 0 1
0 1 2
0 0 0



13
232
xx
xx


1 2 1 T2p
用 MATLAB解此题时,要检验特征向量组的秩,判断独立的特征向量数。故程序如下:
A=[-1,1,0;- 4,3,0;1,0,2],
[p,lamda]=eig(A),
rp=rank(p)
运行的结果是:
由于 特征向量组的秩为 2,说明只有两个线性无关的特征向量,因此不能对角化。
0 0,4 0 8 2 0,4 0 8 2 2 0 0
0 0,8 1 6 5 0,8 1 6 5,0 1 0,2
1 - 0,4 0 8 2 - 0,4 0 8 2 0 0 1
rp




p lam da
6.4 实对称矩阵的对角化定理 6.4 实对称矩阵的特征值必为实数。
定理 6.5 实对称矩阵的不同特征值对应的特征向量必正交。
证明,设 A为 n阶实对称矩阵,是矩阵 A
的两个不同的特征值,是矩阵 A对应的特征向量,即因为于是由于,所以,即 正交。
12,
12p,p
1 2 1 21 1 2 2A p p,A p p,
1 1 2 2T T T T T T1 2 1 2 1 2 1 2 1 2 1 2p p ( p ) p ( A p ) p = p A p = p p p p
12( ) 0T12pp
12
T12p p = 0 12p,p
定理 6.6 设 A为 n阶对称矩阵,则存在正交矩阵 P,使得这里 是以 A的 n个特征值为对角元素的对角矩阵。
推论 1 设 A为 n阶实对称矩阵,是 A的 重特征值,则 A必有 个对应于特征值 的线性无关的特征向量,
推论 2 实对称矩阵一定可对角化,
推论 3 n阶实对称矩阵 A,存在 n个正交单位特征向量。
-1 TP A P = P A P = Λ
Λ
r
r?
n阶实对称矩阵对角化的步骤第一步:解特征方程,求出 A的全部互不相等的特征值 它们的重数依次为第二步:求出矩阵 A的特征值 对应的特征向量,
得到 个线性无关的特征向量;
第三步:将每个特征值 对应的 个线性无关的特征向量正交化、单位化,这样得到 n个两两正交的单位特征向量 ;
第四步:令,P是正交矩阵,使得 。
必须注意,中对角元素的排列次序与 P中列向量的排列次序要一致。
0I - A
12,,,,r
22,,,( )rrt t t t n11tt
i?
it
i? it
,,ip (i = 1,2 n )
],,[ n1 ppP
-1P A P = Λ
Λ
例 6.10 设解:
当 时,,即解得单位特征向量可取为
400
0 3 1
0 1 3



A
,-1P P A P = Λ求 一 个 正 交 矩 阵 使 为 对 角 矩 阵
22
4 0 0
| | 0 3 1 ( 4 ) ( 6 8 ) ( 2 ) ( 4 ),
0 1 3


AI
1 2 32,4故 得 特 征 值
1 2(A - 2 I)x 0
1
2
3
2 0 0 0
0 1 1 0,
0 1 1 0
x
x
x




1
21
3
0
1,
1
x
xk
x




0
1 2,
12





1p
解得 为任意常数。
基础解系中的两个向量恰好正交,只需单位化,可得两个单位正交的特征向量
23 4,( 4 ) 0,A I x当 时 由 即,
1
1
2
23
3
0 0 0 0
0 1 1 0
0 1 1 0
x
x
x
xx
x





任 取
1
2 2 3
3
10
0 1,
01
x
x k k
x




23,kk
01
0,1 2
0 12





23pp
从而得到正交矩阵有本例用 MATLAB解时的程序为:
A=[4,0,0;0,3,1;0,1,3]; [p,lamda]=eig(A)
程序运行的结果与笔算的相同,为,

0 1 0
1 / 2 0 1 / 2
1 / 2 0 1 / 2



1 2 3P = p,p,p
2
4
4




- 1 TP A P = P A P
0 0 1.0 00 0 2 0 0
- 0.7 07 1 0,70 71 0,0 4 0
0.7 07 1 0,70 71 0 0 0 4




P lam d a
6.5 二次型及其标准形
6.5.1 二次型的概念定义 6.5 含有 n个变量 的二次齐次函数:
(6-10)
称为 n元二次型,简称二次型。 为实数时,
称 为实二次型; 为复数时,称 为复二次型。本章书仅讨论实二次型。
1,2,,nx x x
2
1,2,1 1 1 1 2 1 2 1 3 1 3 1 1
22
2 2 2 2 3 2 3 2 2
(,) 2 2 2
22
n n n
n n n n n
f x x x a x a x x a x x a x x
a x a x x a x x a x


ija
f ija f
令,则二次型( 6.10)可写成用矩阵形式表示为 ( 6-11)
其中
ij jiaa?
2
1,2,1 1 1 1 2 1 2 1 3 1 3 1 1
2
2 1 2 1 2 2 2 2 3 2 3 2 2
2
1 1 2 2
(,)n n n
nn
n n n n n n n
f x x x a x a x x a x x a x x
a x x a x a x x a x x
a x x a x x a x



11 1 1 2 1
2 1 2 2 2 2
1,2,
12
,
n
n
n
n n n n n
xa a a
a a a x
x x x
a a a x






f? Tx A x
1 1 1 2 1 1
2 1 2 1 2 2
12
,
n
n
n n n n n
a a a x
a a a x
a a a x






Ax
例 6.13 写出下列二次型的矩阵解,由已知的二次型系数,得矩阵元素为:
故得的 矩阵为
323121242322214321 3223),,,( xxxxxxxxxxxxxxf
1,1,3,1 44332211 aaaa
1 2 2 1 1 3 3 1 1 4 4 11,1,0a a a a a a
2 3 3 2 2 4 4 2 3 4 4 3
3,0,0
2a a a a a a
1000
01
2
31
0
2
331
0111
A
f
6.5.2 二次型的标准形及惯性定理定义 6.6 若秩为 r 的二次型 通过可逆线性变换 x=Cy 可化为只含平方项的二次型,

(6-12)
那么,此二次型称为 的 标准形,标准形中所含平方项的个数等于二次型 的秩,
例 6.15 设二次型分别作下列二个可逆线性变换,求新二次型,
f? Tx A x
fT T Tx A x y ( C A C ) y2 2 21 1 2 2 rrd y d y d y
f
f
221 2 1 2 2 32 4 4f x x x x x x
1) =
2)
解:
1)将线性关系直接代入并化简、整理
11
22
33
1 1 2
0 1 2
0 0 1
xy
xy




BY
11
22
33
1 2 1 1
0 1 1
0 0 1 / 2
xy
x y C Y
xy





221 2 3 2 32( 2 ) ( 2 )f y y y y y
1 2 3 2 3 3 2 34 ( 2 ) ( 2 ) 4 ( )y y y y y y y y
2 2 21 2 324y y y
2)
由于因此,
此例表明:二次型 的标准形不是唯一的。
1 2 3
1 2 0 0 2 2 0 1 2 1 1
(,,) 1 1 0 2 1 2 0 1 1
1 1 1 / 2 0 2 0 0 0 1
y y y





TC A C
2 2 2 2 0 1 2 1 1
0 1 2 0 1 1
0 0 2 0 0 1 / 2





1
1
1



1
1 2 3 2
3
1
(,,) 1
1
y
f y y y y
y




2 2 21 2 3y y y
f
*实二次型的规范形的定义,对秩为 r的实系数二次型,设它通过可逆线性变换
x=Cy化为下面的标准形:
其中 ( )>0,若再作如下的可逆变换:
则上面的标准形可进一步化为如下的形式:
这个二次型称为实二次型的 规范形,显然它是唯一的,
f? Tx Ax
2 2 2 21 1 1 1p p p p r rf k y k y k y k y
ik 1,2,,ir?
riz
k
y i
i
i,,2,1,
1
2 2 2 211 p p rf z z z z
定理 6,7(惯性定理) 设秩为 r的实二次型
,通过可逆线性变换,可化为如下的标准形:
其中 >0( ),则数 p称为实二次型的正惯性指数,q=r-p称为负惯性指数,
惯性定理是指:实二次型的标准形中正系数的平方项的个数是唯一确定的,它等于正惯性指数,而系数为负的平方项的个数也是唯一确定的,它就等于负惯性指数。
f? Tx A x
2 2 2 21 1 1 1p p p p r rf k y k y k y k y
ik 1,2,,ir? f
6.5.3 化实二次型为标准形的方法
1)正交变换法正交变换法的具体步骤与求特征值和特征向量相仿第一步:写出二次型 的矩阵 A,并由特征方程 求出全部互不相同特征值第二步:求出 A的对应于 的特征向量,即求齐次线性方程组 的基础解系。如果某些 是重根,则将其对应的特征向量正交化、单位化。这样便可得到 n
个两两正交的单位特征向量
f
0AI ( 1,2,,)i it
i? ( 1,2,,)it?
0iA I x
i?
,1,2,nη η η
第三步:令,则 P是正交矩阵,
二次型 通过正交变换 x=Py化为标准形上述步骤也可用 eig函数来完成。其调用格式为:
[P,lamda]=eig(A)
P和 lamda将分别给出特征向量组(即正交矩阵)和特征向量。此外 MATLAB中还提供了一个用以计算正交变换矩阵的函数
R?orth(A)。它的结果和 eig函数算出的特征向量矩阵是一样的,只是排列的顺序不同,
,1,2,nP = (η η η )
f? Tx Ax
2 2 21 1 2 2 nnf y y y
2)配方法如果二次型中含有变量 的平方项,则先把含有 的各项集中,按 配方,然后按此法对其它变量配方,直至都配成平方项,
如果二次型中不含平方项,但某个则先作一个可逆线性变换:
使二次型 出现平方项,再按上面方法配方。
ixix
ix
0 ( )ija i j
,,
i i j
j i j
kk
x y y
x y y
x y k i j



f
例 6.16 设 令 A的二次型 等于常数,
这是一个椭圆的方程,其图形如图 6.1(a)
所示。现要求将它变为标准形并画出图形。
52
25

A
Tx Ax
1 221 2 1 1 2 2
2
52 5 4 5 4 8
25
xf x x x x x x
x

Tx A x
图 6.1 两种二次型经坐标变换到主轴方向
( 1)正交变换法如果做一个基坐标的旋转变换,让坐标轴转过 45度,这个椭圆的主轴就与新的坐标方向,相同,如图 6.1( b)所示,其方程将变为标准形椭圆方程。从解析几何知此变换关系为:
cosθ? sinθ
sinθ? cosθ
写成矩阵形式 y?Px
其中 c os si n
si n c os



P
1y 2y
1y
2y 1x
1x
2x
2x
或取其逆变换,写成 x?Ry?
其中用此变换式代入二次型的表达式,有本题的数据是45度,得到
1y?P
1 c o s sin
sin c o s




R = P
112
2
52 48
25
T yx y y
y

T T T TA x = y R A R y = R R y D y
0,7 0 7 1 0,7 0 7 1 0,7 0 7 1 0,7 0 7 1
0,7 0 7 1 0,7 0 7 1 0,7 0 7 1 0,7 0 7 1

1R R = P- 及便有及所以从几何图形上寻找二次型主轴的问题,
在线性代数中就等价于:使矩阵 A经过正交变换 R实现对角化。
( 2)用配方法
30
07

TR A R Λ
1 22
1 2 1 2
2
30[ ] 3 7 48
07
y
y y y y
y



Tx A x

22
22
1 2 1 1 2 2 1 2 2
2 2 1,5 4 5 5
55f x x x x x x x x x



令得到它所对应的变换图 6.1中的( c)和( d)表示了对另一种双曲线二次型的坐标变换,它的方程为:
1 1 2 2 2
2,
5y x x y x
1 221 2 1 2 1 2
2
50,[ ] 5 4,2 4 8
0 4,2
yf x x y y y y
y


Tx A x
11
22
1 2 5 1 2 5,
0 21 5 0 21 5
yx


1R即
221 1 2 28 5 16x x x x
图 6.2 两种对角化方法的不同变换:正交变换法,图形相似(左),配方法,图形崎变(右)
6.5.4 二次型的正定和负定图 6.3 二次型曲面的几种类型一般的,二元变量的二次圆锥曲线在非退化(指它的二次项系数不全为零)
情况下,它的类型决定于其二次项的对称矩阵 A的特征值。具体如下:
2211 1 12 1 2 22 2 1 1 2 220a x a x x a x b x b x c
A的特征值 对应圆锥曲线的类型 驻点是否极值点
(正定或负定 ) 椭圆 极值点
(不定 ) 双曲线 鞍点(费极值点)
或 (半正定 ) 抛物线 极值线
1? 2?
12 0
12 0
1 0 2 0
定义 6.8 若对任给定的
1)恒有,则称 为正定
(负定)二次型,此时对称矩阵 A称为正定
(负定)矩阵;
2)恒有,则称 为半正定(半负定)二次型,此时对称矩阵 A称为半正定
(半负定)矩阵。
3)其它的二次型称为不定二次型。
定理 6.8 n元实二次型 正定的充要条件是它的标准形中的 n个系数全为正,或的正惯性指数为 n。
0?x
0( 0)fTx A x f? Tx A x
0( 0)fTx A x f
f? Tx A x
f
证明,设 经过可逆线性变换化为标准形,
充分性 若,对任意 有
,所以必要性 设 为正定二次型。假设有,取时,从而,这与 是正定的相矛盾。所以推论 实对称矩阵 A正定的充分必要条件是 A的特征值全大于零。
f? Tx A x
22
22
2
11 nn ydydydf
nid i,,2,1,0,0x?
0xCy 1 2222211 nn ydydydf0?
0?kd
key? 0eCx 1 k 0 kdf
nid i,,2,1,0
f
f
定义 6.9 设 为 n阶方阵,依次取 A的前
k行与前 k列所构成的行列式称为 A的 k阶顺序主子式 。
定理 6.9 设 n元实二次型 为正定,则下列结论等价:
1)对任意 n维非零向量
2) 的标准形中的 n个系数全为正;
3) 实对称矩阵 A的特征值全大于 0;
4) 正惯性指数 p=n;
)( ija?A
1 1 1 2 1
2 1 2 2
12
k
kk
k
k k k k
a a a
a a a
a a a

f? Tx A x
0fTx,x A x有
f
5) 实对称矩阵 A的各阶顺序主子式全大于
0,即结论 5)称为霍尔维茨定理。
类似地,n元实二次型 为负定,
则下列结论等价
1) 的标准形中的 n个系数全为负
2)实对称矩阵 A的特征值全小于 0
3)负惯性指数 q=n
4)实对称矩阵 A的各阶顺序主子式中,奇数阶的全小于 0,偶数阶的全大于 0
1 1 1 2
11
2 1 2 2
0,0,,0
aa
a
aa
A
f? Tx Ax
f
例 6.19 判断二次型的负定性,
解,二次型 的矩阵为由可知 为负定二次型注,本题也可通过判断 -A为正定矩阵来解决
2 2 25 6 6 4 4f x y z x y x z
f
5 2 2
2 6 0
2 0 6



A
1 1 1 2
11
2 1 2 2
525 0,2 6 0,8 0 0
26
aaa
aa

A
f
例 6.20 求 的取值,使得二次型为正定二次型,
解,二次型 的矩阵为由于 为正定二次型,故所有顺序主子式全大于零,即解出,即为所求,
323121232221321 22232),,( xxxxxxxxxxxxf
1 1 1
12
13



A
2111 0,0,2 1 1 2 1 2 012A
( 1 2 ) 2 1
f
6.6 奇异值分解的简介定义 6.10 设矩阵,若存在非负实数 和 n
维非零向量 m维非零向量 v使得
(6-13 )
则称 为 A的 奇异值,u和 v分别称为 A对应于奇异值 的 右奇异向量和左奇异向量。
由式( 6-13)可得
(6-14)
(6-15)
mn?A?
,u
,A u v A v u
2==TTA A u A v u
2==TA A v A u v
定理 6.10(矩阵的奇异值分解)
设 A是 m× n矩阵,设 是 A的奇异值,则,其中 U是 m阶正交矩阵,V是 n阶正交矩阵,
,而此式也可以表示为:
(6-16)
其中,是矩阵 U的第 i列 是矩阵 V的第 j列,
1 2,,n
1 2 1 0,rnTA U S V?

r
Σ 0S
00 12(,,,)rd ia grΣ
12 nT T T T1 1 2 2 n nA = U S V u v + u v + u v
( i 1,2,,m )?
( j 1,2,,n )?
iu jv
MATLAB中设有奇异值分解函数,其调用格式为 [U,S,V] = svd(A),其中 U是 m× m
归一化正交矩阵,S是 m× n对角矩阵,它的左上方是 r× r r?min(m,n) 对角矩阵,其 r
个特征值已按递减规则,其余各块元素都是全零。排列的 V是 n× n归一化正交矩阵。
根据 S中大于门限值的特征值数目,就可以求出矩阵的数字秩,rank(A)就是按这个思路编写的。在大于门限值的特征值中,最大和最小的两个元素之比,就是矩阵的条件数,可以调用 r=cond(A)算出。
例 6.21 设求它的各奇异值,及条件数。
解,这样阶次的问题,只能用计算机来解了。
程序为
A=[2,7,9,-5,4;-9,-9,5,3,-2;-2,5,-1,-3,5;-
4,9,0,9,-4]
[U,S,V]=svd(A),condA= S(1,1)/S(4,4)
运行结果为:
2 7 9 - 5 4
- 9 - 9 5 3 - 2
- 2 5 - 1 - 3 5
- 4 9 0 9 - 4




A
0,6 08 4 - 0,16 47 0,7 12 6 - 0,30 81
- 0,71 46 - 0,04 99 0,6 75 0 0,17 67
0,3 38 5 - 0,00 71 0,1 13 2 0,93 41
0,0 67 9 0,98 51 0,1 54 1 - 0,03 58



U
不难验证,U,V都是规范正交矩阵,都有
A的四个奇异值为,[16.5933 13.9809
11.2638 5.9432],
A的条件数为,condA = 16.5933/5.9432 =
2.7920
16.5933 0 0 0 0
0 13.9 809 0 0 0
0 0 11.2 638 0 0
0 0 0 5.94 32 0



S
0,4 0 3 7 - 0,2 7 2 3 - 0,4 8 7 6 - 0,6 6 1 5 0,2 9 5 7
0,7 8 3 1 0,5 8 1 3 0,0 7 6 9 0,1 0 1 1 - 0,1 8 1 0
0,0 9 4 3 - 0,1 2 3 3 0,8 5 9 0 - 0,4 7 5 0 0,1 1 1 5
- 0,3 3 6 9 0,6 8 3 8 - 0,0 4 3 6 - 0,1 7 7 4 0,6 2 0 9
0,3 1
V
8 4 - 0,3 2 4 3 0,1 2 8 7 0,5 4 3 2 0,6 9 41




TTU U = I,V V = I,
6.7 应用实例
6.7.1 人口迁徙模型假设在一个大城市中的总人口是固定的,人口的分布则因居民在市区和郊区之间迁徙而变化。每年有 6%的市区居民搬到郊区去住,而有 2%的郊区居民搬到市区。假如开始时有 30%的居民住在市区,
70%的居民住在郊区,问十年后市区和郊区的居民人口比例是多少? 30年,50年后又如何?
解,这个问题可以用矩阵乘法来描述。令人口变量其中 为市区人口所占比例,为郊区人口所占比例,k表示年份的次序。在 k?0的初始状态为:
一年以后,市区人口为郊区人口 用矩阵乘法可写成:
,ck
sk
x
x



kx
cx sx
0
0
0,3
0,7
c
s
x
x

0x
1 0 0( 1 0,0 6 ) 0,0 2c c sx x x
1 0 00,0 6 ( 1 0,0 2 )s c sx x x
1
1
0,9 4 0,0 2 0,3 0,2 9 6 0
0,0 6 0,9 8 0,7 0,7 0 4 0
c
s
x
x

10x A x
从初始时间到 k年,A不变,因此用下列 MATLAB程序 ea661进行计算:
A?[0.94,0.02;0.06,0.98]
x0?[0.3;0.7],x1?A*x0,
x10?A^10*x0,x30?A^30*x0,x50?A^50*x0
程序运行的结果为:
2k k - 1 k - 2x = A x = A x =? k 0Ax
0,2 9 6 0 0,2 7 1 7 0,2 5 4 1 0,2 5 0 8,,,,
0,7 0 4 0 0,7 2 8 3 0,7 4 5 9 0,7 4 9 2

1 1 0 3 0 5 0
x x x x
无限增加时间 k,市区和郊区人口之比将趋向一组常数 0.25/0.75。为了弄清为什么这个过程趋向于一个稳态值,可以改变一下坐标系统,在这个坐标系统中可以更清楚地看到矩阵乘幂的效果,为此将 A对角化。令,其中 Λ为对角矩阵,则有于是对角矩阵的幂次可以化为元素的幂次所以,它就很容易计算。键入
[p,lamda]=eig(A),得到
-1A = pΛ p
kk
k
- 1 - 1 - 1 - 1A = p Λ pp Λ pp Λ pp Λ p
00k k - 1kx = A x = p Λ px
11
2 2
k k
k






令于是整理后得到
0,7 0 7 1 0,3 1 6 2 0,9 2 0 0 0,
0,7 0 7 1 0,9 4 8 7 0 1,0 0 0 0

p la md a
110,7 0 7 1,0,3 1 6 213
12
p = p,p


k 1
0 k
0,9 2 0 0 0 0,7 0 7 1 0,3 1 6 2 0,3
0,7 0 7 1 0,9 4 8 7 0,7 0 1.0 00 0



k - 1
k 1 2x = p Λ p x p,p
kk12 11- 0,07 07 0,92 - 0,79 06 1,0,25 ( 1 ) 0,05 ( 0,92 )31kk

kx p p
式中的第二项会随着 k的增大趋向于零。如果只取小数点后两位,则只要 k?27,这第二项就可以忽略不计,从而得到可见,适当选择基向量可以使矩阵乘法结果等价于一个简单的实数乘子,使得问题简单化。系统进入稳态的时间取决于特征值 而达到 的稳态值取决于特征向量 这也是方阵求特征值的基本思想之一。
27
1 0,2 5
0,2 5
3 0,7 5k?



k
k0x A x
1? 2p