概率论第三节 协方差及相关系数协方差相关系数课堂练习小结 布置作业概率论前面我们介绍了随机变量的数学期望和方差,
对于二维随机变量( X,Y),我们除了讨论 X与 Y
的数学期望和方差以外,还要讨论描述 X和 Y之间关系的数字特征,这就是本讲要讨论的协方差和相关系数概率论量 E{[ X-E(X)][Y-E(Y) ]}称为随机变量 X和
Y的协方差,记为 Cov(X,Y),即
⑶ Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y)
⑴ Cov(X,Y)= Cov(Y,X)
一、协方差
2.简单性质
⑵ Cov(aX,bY) = ab Cov(X,Y) a,b 是常数
Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]}
1.定义概率论
Cov(X,Y)=E(XY) -E(X)E(Y)
可见,若 X 与 Y 独立,Cov(X,Y)= 0,
3,计算协方差的一个简单公式由协方差的定义及期望的性质,可得
Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]}
=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)
=E(XY)-E(X)E(Y)
即概率论
D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y)
4,随机变量 和的方差与协方差的关系特别地
)()()(),( 22 XDXEXEXXC o v
概率论协方差的大小在一定程度上反映了 X和 Y相互间的关系,但它还受 X与 Y本身度量单位的影响,例如:
Cov(kX,kY)=k2Cov(X,Y)
为了克服这一缺点,对协方差进行标准化,这就引入了 相关系数,
概率论二,相关系数为随机变量 X 和 Y 的相关系数,
定义,设 D(X)>0,D(Y)>0,
)()(
),(
YDXD
YXC o v
XY
称在不致引起混淆时,记 为,XY
概率论相关系数的性质:
11?||,?
证,由方差的性质和协方差的定义知,
对任意实数 b,有
0≤D(Y-bX)= b2D(X)+D(Y)-2b Cov(X,Y )
)(
),(
XD
YXC o vb?令,则上式为
D(Y- bX)=
)(
)],([)( 2
XD
YXC o vYD?
])()( )],([1)[(
2
YDXD
YXC o vYD ]1)[( 2 YD
由于方差 D(Y)是正的,故必有
1- ≥ 0,所以 | |≤1。2
概率论
2,X和 Y独立时,=0,但其逆不真,?
由于当 X和 Y独立时,Cov(X,Y)= 0.
故
)()(
),(
YDXD
YXC o v = 0
0但由 并不一定能推出 X和 Y 独立,
请看下例,
概率论
,
Cov(X,Y)=0,
事实上,X的密度函数
其它0
2
1
2
1
1
)(
x
xf
0)(?XE可得
0)(c o s)c o s()( 2
1
2
1
dxxxfxXXEXYE
0)()()(),( YEXEXYEYXC ov
例 1 设 X服从 (-1/2,1/2)内的均匀分布,而 Y=cos X,
不难求得概率论
1.3
存在常数 a,b(b≠0),使 P{Y= a + b X}=1,
即 X 和 Y 以概率 1 线性相关,
因而 =0,? 即 X和 Y不相关,
但 Y与 X有严格的函数关系,即 X和 Y不独立,
概率论考虑以 X的线性函数 a+bX来近似表示 Y,
以均方误差
e =E{[Y-(a+bX)]2}
来衡量以 a +b X 近似表示 Y 的好坏程度,
e 值越小表示 a +b X 与 Y 的近似程度越好,
用微积分中求极值的方法,求出使 e达到最小时的 a,b
相关系数刻划了 X和 Y间“线性相关”的程度,
概率论
=E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X)
- 2aE(Y)
e =E{[Y-(a+bX)]2 }
0)(2)(2)(2
0)(2)(22
2
XaEXYEXbE
b
e
YEXbEa
a
e
)(
),(
0 XD
YXC o vb?解得
)()( 00 XEbYEa
这样求出的最佳逼近为
L(X)=a0+b0X
概率论这样求出的最佳逼近为 L(X)=a0+b0X
这一逼近的剩余是若 =0,Y 与 X 无线性关系 ;?
Y与 X有严格线性关系 ;,1若可见,
若 0<| |<1,?
| | 的值越接近于 1,Y 与 X 的线性相关程度越高 ;?
| | 的值越接近于 0,Y与 X的线性相关程度越弱,?
E[(Y-L(X))2]= D(Y)(1- )2?
概率论但对下述情形,独立与不相关等价若 (X,Y)服从二维正态分布,则
X与 Y独立 X与 Y不相关?
前面,我们已经看到:
若 X 与 Y 独立,则 X与 Y不相关,
但由 X与 Y不相关,不一定能推出 X与 Y独立,
概率论三、课堂练习
1,)具有概率密度,设随机变量( YX
其它0
20,20)(
8
1
),(
yxyx
yxf
。求 )(),,(),(),( YXDYXC ovYEXE?
2,相互独立,,且设设 YXNYNX ),(~),,(~ 22
是不全为零的常数)。
,其中的相关系数和试求 (21 YXZYXZ
概率论
1、解 95)(,361),(,67)()( YXDYXC ovYEXE
2、解 2)()( YDXD
222221 )()()()()( YDXDYXDZD
222222 )()()()()( YDXDYXDZD
22
22
21
21
)()(
),(
21
ZDZD
ZZCov
ZZ
),(),( 21 YXYXC ovZZC ov
),(),( 22 YYC o vXXC o v 22( ) ( )D X D Y
2 2 2()
概率论四、小结这一节我们介绍了协方差、相关系数、
相关系数是刻划两个变量间 线性相关程度 的一个重要的数字特征,
注意独立与不相关并不是等价的,
当 (X,Y) 服从二维正态分布时,有
X 与 Y 独立 X 与 Y 不相关?
概率论五,布置作业
,概率论与数理统计,作业(四)
三、解答题 第 6小题
对于二维随机变量( X,Y),我们除了讨论 X与 Y
的数学期望和方差以外,还要讨论描述 X和 Y之间关系的数字特征,这就是本讲要讨论的协方差和相关系数概率论量 E{[ X-E(X)][Y-E(Y) ]}称为随机变量 X和
Y的协方差,记为 Cov(X,Y),即
⑶ Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y)
⑴ Cov(X,Y)= Cov(Y,X)
一、协方差
2.简单性质
⑵ Cov(aX,bY) = ab Cov(X,Y) a,b 是常数
Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]}
1.定义概率论
Cov(X,Y)=E(XY) -E(X)E(Y)
可见,若 X 与 Y 独立,Cov(X,Y)= 0,
3,计算协方差的一个简单公式由协方差的定义及期望的性质,可得
Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]}
=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)
=E(XY)-E(X)E(Y)
即概率论
D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y)
4,随机变量 和的方差与协方差的关系特别地
)()()(),( 22 XDXEXEXXC o v
概率论协方差的大小在一定程度上反映了 X和 Y相互间的关系,但它还受 X与 Y本身度量单位的影响,例如:
Cov(kX,kY)=k2Cov(X,Y)
为了克服这一缺点,对协方差进行标准化,这就引入了 相关系数,
概率论二,相关系数为随机变量 X 和 Y 的相关系数,
定义,设 D(X)>0,D(Y)>0,
)()(
),(
YDXD
YXC o v
XY
称在不致引起混淆时,记 为,XY
概率论相关系数的性质:
11?||,?
证,由方差的性质和协方差的定义知,
对任意实数 b,有
0≤D(Y-bX)= b2D(X)+D(Y)-2b Cov(X,Y )
)(
),(
XD
YXC o vb?令,则上式为
D(Y- bX)=
)(
)],([)( 2
XD
YXC o vYD?
])()( )],([1)[(
2
YDXD
YXC o vYD ]1)[( 2 YD
由于方差 D(Y)是正的,故必有
1- ≥ 0,所以 | |≤1。2
概率论
2,X和 Y独立时,=0,但其逆不真,?
由于当 X和 Y独立时,Cov(X,Y)= 0.
故
)()(
),(
YDXD
YXC o v = 0
0但由 并不一定能推出 X和 Y 独立,
请看下例,
概率论
,
Cov(X,Y)=0,
事实上,X的密度函数
其它0
2
1
2
1
1
)(
x
xf
0)(?XE可得
0)(c o s)c o s()( 2
1
2
1
dxxxfxXXEXYE
0)()()(),( YEXEXYEYXC ov
例 1 设 X服从 (-1/2,1/2)内的均匀分布,而 Y=cos X,
不难求得概率论
1.3
存在常数 a,b(b≠0),使 P{Y= a + b X}=1,
即 X 和 Y 以概率 1 线性相关,
因而 =0,? 即 X和 Y不相关,
但 Y与 X有严格的函数关系,即 X和 Y不独立,
概率论考虑以 X的线性函数 a+bX来近似表示 Y,
以均方误差
e =E{[Y-(a+bX)]2}
来衡量以 a +b X 近似表示 Y 的好坏程度,
e 值越小表示 a +b X 与 Y 的近似程度越好,
用微积分中求极值的方法,求出使 e达到最小时的 a,b
相关系数刻划了 X和 Y间“线性相关”的程度,
概率论
=E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X)
- 2aE(Y)
e =E{[Y-(a+bX)]2 }
0)(2)(2)(2
0)(2)(22
2
XaEXYEXbE
b
e
YEXbEa
a
e
)(
),(
0 XD
YXC o vb?解得
)()( 00 XEbYEa
这样求出的最佳逼近为
L(X)=a0+b0X
概率论这样求出的最佳逼近为 L(X)=a0+b0X
这一逼近的剩余是若 =0,Y 与 X 无线性关系 ;?
Y与 X有严格线性关系 ;,1若可见,
若 0<| |<1,?
| | 的值越接近于 1,Y 与 X 的线性相关程度越高 ;?
| | 的值越接近于 0,Y与 X的线性相关程度越弱,?
E[(Y-L(X))2]= D(Y)(1- )2?
概率论但对下述情形,独立与不相关等价若 (X,Y)服从二维正态分布,则
X与 Y独立 X与 Y不相关?
前面,我们已经看到:
若 X 与 Y 独立,则 X与 Y不相关,
但由 X与 Y不相关,不一定能推出 X与 Y独立,
概率论三、课堂练习
1,)具有概率密度,设随机变量( YX
其它0
20,20)(
8
1
),(
yxyx
yxf
。求 )(),,(),(),( YXDYXC ovYEXE?
2,相互独立,,且设设 YXNYNX ),(~),,(~ 22
是不全为零的常数)。
,其中的相关系数和试求 (21 YXZYXZ
概率论
1、解 95)(,361),(,67)()( YXDYXC ovYEXE
2、解 2)()( YDXD
222221 )()()()()( YDXDYXDZD
222222 )()()()()( YDXDYXDZD
22
22
21
21
)()(
),(
21
ZDZD
ZZCov
ZZ
),(),( 21 YXYXC ovZZC ov
),(),( 22 YYC o vXXC o v 22( ) ( )D X D Y
2 2 2()
概率论四、小结这一节我们介绍了协方差、相关系数、
相关系数是刻划两个变量间 线性相关程度 的一个重要的数字特征,
注意独立与不相关并不是等价的,
当 (X,Y) 服从二维正态分布时,有
X 与 Y 独立 X 与 Y 不相关?
概率论五,布置作业
,概率论与数理统计,作业(四)
三、解答题 第 6小题