第三节 协方差和相关系数一、协方差如果 X与 Y相互独立,则
E{[X-E(X)][Y-E(Y)]}=E[X-E(X)]E[Y-E(Y)]=0
因此,对于任意两个随机变量 X与 Y,若
E{[X-E(X)][Y-E(Y)]}≠0,
则随机变量 X与 Y不相互独立,从而说明 X与 Y之间有一定联系,因而给出如下定义。
定义 4.4 设 (X,Y)为二维随机变量,若
E{[X-E(X)][Y-E(Y)]}存在,则称它是随机变量 X与 Y的协方差,记为 Cov(X,Y),即
Cov(X,Y)=E{[X-E(X)][Y-E(Y)]} (4.15)
显然有 Cov(X,X)=D(X).
协方差 Cov(X,Y),实际上就是计算二维随机变量
(X,Y)的函数 g(X,Y)=[X-E(X)][Y-E(Y)]的数学期望。
)16.4(.)]() ] [([),(C o v
1 1


i j
ijji pYEyXExYX
则由若 (X,Y)为二维离散型随机变量,联合分布律为
P{X=xi,Y=yj}=pij,i=1,2,…,j=1,2,…,
若 (X,Y)为二维连续型随机变量,联合概率密度为
f(x,y),
)17.4(.dd),()]() ] [([),(C o v



yxyxfYEyXExYX
为便于计算协方差 Cov(X,Y),常采用以下公式
Cov(X,Y)=E(XY)-E(X)E(Y).
证 Cov(X,Y)=E{X-E(X)][Y-E(Y)]}
=E[XY-XE(Y)-YE(X)+E(X)E(Y)]
=E(XY)-E(Y)E(X)-E(X)E(Y)+E(X)E(Y)
=E(XY)-E(X)E(Y).
协方差具有下列性质。
性质 1 Cov(X,Y)=Cov(Y,X).
性质 2 Cov(aX+c,bY+d)=abCov(X,Y),这里 a,b,c,d
均为常数。
推论 Cov(aX,bY)=abCov(X,Y),a,b为常数。
性质 3 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).
性质 4 若 X与 Y相互独立,则 Cov(X,Y)=0.
推论 2 D(X-Y)=D(X)+D(Y)-2Cov(X,Y).
推论 Cov(X1+X2,Y1+Y2)=Cov(X1,Y1)+Cov(X1,Y2)
+Cov(X2,Y1)+Cov(X2,Y2).
性质 5 D(X+Y)=D(X)+D(Y)+2Cov(X,Y).
推论 1 若 X与 Y相互独立,则 D(X± Y)=D(X)+D(Y).
二、相关系数即关系数,记为相的线性相关系数,简称与为随机变量则称数值若定义
,
)()(
),C o v (
,0)(,0)(4,5
XY
YX
YDxD
YX
YDXD

.
)()(
),C o v (
YDXD
YX
XY
X与 Y的相关系数?XY实际上为 X,Y的标准化随机变量的协方差。
的协方差与准化,则的标与分别为若
**
**,
)(
)(
,
)(
)(
YX
YX
YD
YEY
Y
XD
XEX
X
.
)()(
),C o v (
)()(
))(),((C o v
),C o v (
**
XY
YDXD
YX
YDXD
YEYXEX
YX


例 1 设 X~ N(?,?2),Y~ N(?,?2),且 X与 Y相互独立,
求 U=?X+?Y,V=?X-?Y的相关系数 (其中?,?是不为零的常数。 )
解 由已知有 D(X)=D(Y)=?2,由于 X与 Y相互独立,
从而有
D(U)=D(?X+?Y)=?2D(X)+? 2D(Y)=(?2+? 2)?2,
D(V )=D(?X-?Y)=?2D(X)+? 2D(Y)=(?2+? 2)?2.
根据协方差性质,
Cov(U,V )=Cov(?X+?Y,?X-?Y)
.
)(
)(
)()(
),(
22
22
222
222




VDUD
VUC o v
UV
=?2D(X)-? 2D(Y)
=(?2-? 2)?2.
=?2Cov(X,X)-Cov(X,Y)
+Cov(Y,X)-? 2Cov(Y,Y)
从而有例 2 设 (X,Y)的联合分布律为定义 4.6 若?XY=0,称 X与 Y不相关。否则,称为相关,其中,若?XY>0,称 X与 Y正相关;若?XY<0,称 X与 Y
负相关。
002
01
2
0
10YX
9
1
9
1
9
1
9
2
9
2
9
2
求?XY,
,98)()(,32)()( 22 YEXEYEXE
解 X,Y的边缘分布律分别为
2
pk
10X
9
4
9
1
9
4
,
2
pk
10Y
9
4
9
1
9
4
即 X与 Y同分布,从而
,
9
4
3
2
9
8)()( 2?


YDXD
,92)(?XYE
,
9
2
3
2
9
2)()()(),C o v ( 2


YEXEXYEYX
.
2
1
9
4
9
2
)()(
),C o v (


YDXD
YX
XY?
负相关。与,所以因为 YXXY 021
定理 4.3 X与 Y的相关系数?XY具有下列性质:
则令证,
)(
)(,
)(
)()1( **
YD
YEYY
XD
XEXX
(1) |?XY|≤1.
(2) |?XY|=1的充分必要条件是存在常数 a,b,使
P{Y=aX+b}=1,即?XY=1或?XY =-1的充分必要条件是随机变量 Y和 X以概率 1有线性关系,也称满足
P{Y=aX+b}=1的 X与 Y之间几乎处处有线性关系。
,0)()( ** YEXE
,1)()( ** YDXD
.),C o v ( ** XYYX
由协方差性质 5,
.1||,11 XYXY 也即即
,0)1(2
),C o v (2)()()( ****


XY
YXYDXDYXD
(2) 首先证明 |?XY|=1的充分必要条件是存在常数 a,b,
使 E[(Y-aX-b)2]=0.
由于 E[(Y-aX-b)2]=E(Y2+a2X2+b2-2aXY-2bY-2abX)
=E(Y2)+a2E(X2)+b2-2aE(XY)
-2bE(XY)-2abE(X),
利用公式 E(X)2=D(X)+[E(X)]2,
E(XY)=Cov(X,Y)+E(X)E(Y),
则 E[(Y-aX-b)2]=D(Y)+E(Y)]2+a2D(X)+a2[E(X)]2+b2
-2aCov(X,Y)-2aE(X)E(Y)-2bE(Y)-2abE(X)
2
2
2
])()([
)(
),C o v (
)(
)()(
),(C o v
1)(
bXaEYE
XD
YX
aXD
YDXD
YX
YD



=D(Y)+a2D(X)+[E(Y)-aE(X)-b]2-2aCov(X,Y)
2
2
2
])()([
)(
),C o v (
)()1)((
bXaEYE
XD
YX
aXDYD XY


.0])[(),()(
,
)(
),C o v (
)21.4(,1||
2

baXYEXaEYEb
XD
YX
aXY
使式,必存在常数则由若?
其次由方差性质 3及
D(Y-aX-b)=E[(Y-aX-b)2]-[E(Y-aX-b)]2≥0,
.1||,01
)21.4(,1||
),1(,0])[(,,
2
2


XYXY
XY
baXYEba


,从而必有式右端三项均是非负的因此由使反之,若存在常数则
P{Y=aX+b}=P{Y-aX-b=0}=1
成立的充分必要条件为 E[(Y-aX-b)2]=0,从而证得结论 (2).
相关系数?XY是刻画随机变量 X与 Y之间线性关系程度的数字特征,|?XY|越大,随机变量 X与 Y之间的线性关系越明显,当?XY>0时,Y将随着 X的增加而增大;当
XY<0时,Y将随着 X的增加而减少。
定理 4.4 若随机变量 X与 Y相互独立,则 X与 Y不相关。
证 由于 X与 Y相互独立,由协方差性质 4知
Cov(X,Y)=0,从而有?XY=0,即 X与 Y不相关。
定理 4.4的逆定理不成立,即若 X与 Y不相关,但不一定有 X与 Y相互独立。为了说明这一点,只要举出一个反例即可。请看下例。
例 3 设随机变量 X~ N(0,1),Y=X 2,证明 X与 Y不相关但 X与 Y也不相互独立。
.0de
2
1
)()( 2
2
33


xxXEXYE
x
证 E(X)=0,E(Y)=E(X2)=D(X)+[E(X)]2=1,
因此
Cov(X,Y)=E(XY)-E(X)E(Y)=0,
从而?XY =0,于是 X与 Y不相关。但 X与 Y之间确有函数关系:
Y=X2,这说明 X与 Y不相互独立。
注意:两个随机变量相互独立与不相关是两个不同的概念。“随机变量不相关”只说明两个随机变量之间没有线性关系,但这时的 X与 Y之间可能有某种别的函数关系;而“随机变量相互独立”说明两个随机变量之间没有任何关系,既无线性关系,也无非线性关系,所以我们就能很好地理解“相互独立”必导致“不相关”,
反之却不一定成立。但有一个例外。对于二维正态分布来说,不相关与相互独立是等价的。这也是二维正态分布分布随机变量的独特性质。
.求ρ
),,σ,σ,μN( μ正 态设( X,Y ) 服从二维4例
XY
2
2
2
121?分布而则有~~知由例解
.)(,)(,)(,)(
),,(),,(8.3
2
22
2
11
2
22
2
11


YDYEXDXE
NYNX
)])([() ] }() ] [({[),C o v ( 21 YXEYEYXEXEYX
yx
yyxx
p
yx
dd
))((
2
)1(2
1
e x p))((
12
1
2
2
2
21
21
2
1
1
221
2
21













y
xy
y
xx
x
d
)1(2
1
e x p)(
de)(
12
1
2
1
1
2
2
22
2
1
2
2
)1(
1
2
21







,d1d,
1
1 2
2
1
1
2
2
2
tyt
xy




则令
txt
xxYX
t
x
de)(1
de)(
2
1
),C o v (
2
2
1
1
22
2
2
1
2
2
)1(
1
1








xx
x
de)(
2
2
12
2)
1(
2
1
2
1
2?





,)( 21
1
2
XD
.
)()(
),C o v (
21
21?



YDXD
YX
XY
于是确定。相关系数及方差量的数学期望布完全可由每个随机变正态分布随机变量的分的相关系数,因此二维与就是数的联合概率密度中的参量即二维正态分布随机变

2
2
2
121
,,,
),(
YX
YX
对于二维随机变量 (X,Y),一般有下列关系式:
).()()(
)()()(
0),C o v (
0
YDXDYXD
YEXEXYE
YX
YXYX
XY



不相关与相互独立与例 5 设 (X,Y)的联合分布律为
0
3
003
2
01
10XY
8
3
8
3
8
1
8
1
(1)X与 Y是否不相关? (2)X与 Y是否相互独立?
,23813832831810)(XE
解 (1) X,Y的边缘分布律分别为
32
pk
10X
8
3
8
3
8
1
8
1
,
pk
31Y
4
1
4
3
,23413431)(YE
,
4
9
8
1
33013032
8
3
12
031
8
3
11
8
1
30010)(

XYE
,0
2
3
2
3
4
9
)()()(),(C

YEXEXYEYXov
从而 X与 Y不相关。
于是由于
,
4
3
}1{
,
8
1
}0{,0}1,0{)2(


YP
XPYXP
},1{}0{}1,0{ YPXPYXP
因此 X与 Y不相互独立。
一、矩定义 4.7 对随机变量 X,若 E(Xk)存在,则称 E(Xk)
为 X的 k阶原点矩,简称 k阶矩。若 E{[X-E(X)]k}存在,
则称 E{[X-E(X)]k}为 X的 k阶中心矩。
易知 X的一阶原点矩为 X的数学期望。 X的 1阶中心矩为零,X的 2阶中心矩为 X的方差。
定义 4.8 对于随机变量 X,Y,若 E(XkYl)存在,则称
E(XkYl)为 X与 Y的 k+l阶混合矩;若 E{[X-E(X)]k[Y-E(Y)]l}
存在,则称它为 X与 Y的 k+l阶混合中心矩,k,l=1,2,…,
由定义 4.8知,协方差 Cov(X,Y)为 X与 Y的 1+1阶混合中心矩。