第四章随机变量的数字特征
§ 1 随机变量的期望随机变量的分布能全面反映随机变量取值的概率分布情况,但实际问题中概率分布较难确定,有时也无必要,不少问题只需知道它的某些数字特征就够了。
在这些数字特征中,期望 和 方差 是最基本又是最重要的两个。
一。期望的概念设随机变量 X的分布列为:
,...2,1,)( kpxXP kk
希望找到一个数值来体现 X取值的平均大小。
这个值就叫做期望(均值或数学期望)。
期望严格的定义如下:
定义 1 设离散型随机变量 X的分布列为:
,...2,1,)( kpxXP kk
则称无穷级数
k
kk px
( 1。 1)
为 随机变量 X的期望。 记作 )(XE
这里还要求无穷级数绝对收敛,即

k
kk px ||
以保证该级数的和在求和过程中不受各项次序的影响。
如果离散型随机变量 的频数为
kxX?
,kn
则 X的期望



m
k
kk
m
k
kk nxnpxXE
11
1)( ( 1。 2)
其中
m
k
k nn
1
定义 2 设连续型随机变量 X的概率密度为 ),(xp
如果
,)( dxxpx
则定义
dxxxpXE )()( ( 1。 3)
随机变量 X的期望的定义的一般形式可写成:
)()( xxd FXE
( 1。 4)
二。几个常用分布的期望
(一)两点分布
),1(~ pBX
1,0,)1()( 1 kppkXP kk
设 其分布列为:

pppXE 1)1(0)(
(二)泊松分布
)(~?PX设
,.,,2,.1,0,!}{
kkekXP
k
0
其分布列为:


0 !
)(
k
k
k
ekXE
1
1
)!1(k
k
k
e

0 !t
t
t
e ee
(三)几何分布
)(~ pGX
,.,,2,1,)1(}{ 1 kppkXP k
,其分布列为:设则

k
k
pppkXE
1)1()( 1
(级数逐项积分)
(四)正态分布
),(~ 2NX


xexp
x
,
2
1)( 2
2
2
)(

,其概率密度为:设则
dxexXE x 22 2/)(
2
1)(







dtet t
xt
2/
/)( 2
)(
2
1



dte t 2/2
2
1
第四章随机变量的数字特征
§ 2 随机变量函数的期望公式与期望的性质设随机变量 X的分布函数为 F(x),(连续型随机变量的概率密度为 p(x)或离散型随机变量的分布列为 ),Y=f(X)是随机变量的函数,则 Y的期望为:
)()()]([)( xdFxfxfEYE
kk pxXp )(
一。 随机变量函数的期望公式


k
kk pxf
dxxpxf
)(
)()(
连续型离散型由上述定义可知,计算随机变量函数的期望不必先求出随机变量函数的分布。
( 2。 1)
随机变量函数的期望的定义,可推广到 n维随机向量函数的期望:
),...,,( 21 nxxxp
如果随机向量为连续型,其概率密度是:
,则
nnn dxdxxxxpxxxfYE,..)...,,(),.,,,,(...)( 12121
( 2。 2)
设 n维随机向量 X的分布函数为
Y=f(X)是随机向量 X的函数,则 Y的期望为:
)]([)( XfEYE?
),,...,,( 21 nxxxF
),...,,(),...,(..,2121 nn xxxdFxxxf
特别,当( X,Y)为二维连续型随机向量,
),( yxfZ? 是( X,Y)的二元函数时,
),( yxp
是其概率密度,
则有:
d x d yyxxpXE ),()( dxxxp X )(
d xd yyxypYE ),()( dyyp Y )(
d xd yyxxypXYE ),()(
( 2。 3)
( 2。 4)
( 2。 5)
类似地可定义 n维离散型随机向量函数的期望。
d x d yyxpyxfZE ),(),()(从而有:
当 X,Y相互独立时,
d xd yyxxypXYE ),()(
dyyypdxxxp YX )()( )()( YEXE?
结论可推广到 n个相互独立的随机变量。
例 2。 1 设 X,Y独立同分布 N(0,1),求 )( 22 YXE?
解:
)( 22 YXE? d x d yeyx yx 2/)(22 22
2
1




20 0 0 2/12/ 22 1 2 dtetdrred tr
2/)2/1()2/2()2/3(2
二。期望的性质
iX
( 1)当各 相互独立时,


n
i
n
i
ii XEXE
1 1
)()(
( 2。 6)
( 2)


n
i
ii
n
i
ii XECXCE
11
)()(
( 2。 7)
特别有:


n
i
i
n
i
i XEXE
11
)()(
( 2。 8)
( 3) CCE?)(
这是因为 CCCE 1)(
( 2。 9)
三。性质


n
i
i
n
i
i XEXE
11
)()(
的应用
(必须指出,上式成立并不要求各随机变量相互独立)。
例 2。 2 设
),(~ pnBX
,求
)(XE
解:
由二项分布关于参数 n的再生性可知:
n
i
iXX
1



n
i
i
n
i
i XEXE
11
)()( npXnE i )(

,0
,1
iX
第 次试验 A发生第 次试验 A不发生令则各
pAPXEpBX ii )()(),,1(~
ni,...,2,1?
i
i
iX
相互独立且例 2。 3 设
),,,(~ NMnHX

)(XE


,0
,1
iX
第 i次抽到次品令
ni,...,2,1?第 i次抽到正品解:
.)0(,)1( N MNXPNMXP ii

n
i
ii XXN
MXE
1
,)(



n
i
i
n
i
i XEXE
11
)()(
N
Mn?
应该指出,例 2。 2和例 2。 3也能直接由定义计算 X的期望,但是要复杂得多。
例 2。 4 一辆机场交通车送 25名乘客到 7个站,假设每一车上乘客都和其他人一样等可能地在任一站下车,并且他们的行动独立,交通车只有在有人下车时才停车。问:它停车的期望次数是多少?
解:

,0
,1
iX
第 i站停车令
ni,...,2,1?第 i站不停车则
2525 )
7
6(1)1(,)
7
6()0(
ii XPXP

7
1
25,)
7
6(1)(
i
ii XXXE



7
1
7
1
)()()(
i
i
i
i XEXEXE
])76(1[7 25
例 2。 5(邮票收集问题)一盒子中装有标上 1至 N
的 N张不同的邮票,以有放回的方式一张一张地抽取。如果我们想收集 r张不同的邮票,问:要期望抽取多少次才能得到?
解,设
iX
{第 i张邮票首次出现的抽取次数 };,...,2,1 ri?
r
i
iXX
1
由于
riN iNp i,.,,,2,1,)1(

ripXEpGX
i
iii,...,2,1,
1)(),(


r
i
i iNNXEiN
NXE
1 1
1)(,
1)(
第四章随机变量的数字特征
§ 3 方差一。定义与计算公式由定义可见,随机变量 X的方差是函数
2)]([ XEX?
的期望,它反映了随机变量 X偏离其中心 )(XE 的程度。
由随机变量函数的期望公式,可得:
)()]([)( 2 xdFXExXD


k
kk pXEx
dxxpXEx
2
2
)]([
)()]([
连续型离散型
( 3。 1)
由定义可知,
0)(?XD
定义,对随机变量 X,称
})]({[ 2XEXE?
为 X的 方差,记作 )(XD 或
).( XV ar

})]({[ 2XEXE? )]()(2[ 22 XEXXEXE
)()(2)( 222 XEXEXE )()( 22 XEXE
可得计算方差的常用公式:
二。常用分布的方差
(一)两点分布
),1(~ pBX
1,0,)1()( 1 kppkXP kk
设 其分布列为:

pppXE 222 1)1(0)(,)( pXE?
)1()( 2 ppppXD
)(XD )()( 22 XEXE ( 3。 2)
(二)泊松分布
)(~?PX设
,.,,2,.1,0,!}{
kkekXP
k
0
其分布列为:
则,)(XE

0
22
!
)(
k
k
k
ekXE


ekk
k
k )!1(
]1)1[(
1



2
2 1
12
2
)!1()!2(k k
kk
kk
22 )()( XD
(四)正态分布
2)()( XEXD
dxex x 22 2/)(2
2
1)(








dtet t
xt
2/2
2/)(
2
2?
2
(分部积分)
),(~ 2NX


xexp
x
,
2
1)( 2
2
2
)(

,其概率密度为:设则
,)(XE
三。方差的性质
( 1) 设 a,b为任意常数,则由方差的定义可得:
0)(?aD
),()( 2 XDbbXD?
)0})]({[)(( 2 aEaEaD?
)()( 2 XDbbXaD ( 3。 3)
( 2)
)( YXD?
)]}()][({[2)()( YEYXEXEYDXD
( 3。 4)
)]()()([2)()( YEXEXYEYDXD
( 3。 5)
一般地,有
n
i
iXD
1
)(



n
i
n
j
jjii XEXXEXE
1 1
) ] }() ] [({[



n
i ji
jjiii XEXXEXEXD
1
) ] }() ] [({[2)(
还可推广到:
n
i
ii XCD
1
)(



n
i
n
j
jjiiji XEXXEXECC
1 1
) ] }() ] [({[
( 3。 6)
结论可推广到 n个相互独立的随机变量,即有:


n
i
i
n
i
i XDXD
11
)()(
( 3。 8)
( 3)当 X,Y独立时,
)()()( YDXDYXD
( 3。 7)
),()()( YEXEXYE
故有例 3。 1 设随机变量
4321,,,XXXX
相互独立,
且有
.4,3,2,1,5)(,)( iiXDiXE ii
.2/32 4321 XXXXY

)(),( YDYE
解:
74)2/1(33212)(YE
25.374/129344)(YD
例 3。 2 设随机变量 X,Y独立,且 ),30,720(~ 2NX

YXZYXZ 21,2
的分布,并求概率
)( YXP?
)25,6 4 0(~ 2NY
解:
2 0 8 06407202)()(2)( 1 YEXEZE
806 4 07 2 0)()()( 2 YEXEZE
42256259004)()(4)( 1 YDXDZD
1 5 2 5625900)()()( 2 YDXDZD
))1525(,80(~),65,2080(~ 2221 NZNZ?
)1 2 2 5801 2 2 5 80)(()0()( YXPYXPYXP
9 7 9 8.0)05.2()1 2 2 580(1
例 3。 3 设
),(~ pnBX
,求
)(XD

,0
,1
iX
第 次试验 A发生第 次试验 A不发生令则
,)(),,1(~ pXEpBX ii?
ni,...,2,1?
i
i
)1()( ppXD i
解:
n
i
iXX
1
且,各
iX
相互独立,



n
i
i
n
i
i XDXD
11
)()( )1()( pnpXnD i
例 3。 4 设
),,,(~ NMnHX

)(XD
解:

,0
,1
iX
第 i次抽到次品令
ni,...,2,1?第 i次抽到正品则
n
i
iXX
1
且各
iX
服从两点分布,但不相互独立。

n
i
iXD
1
)()(XD



n
i ji
jijii XEXEXXEXD
1
)]()()([2)(

njiNMXEXE ji,.,,,2,1,,)()(

,0
,1
ji XX

i
次和第 j 次都取到次品。
否则
niNMNMXD i,.,,2,1),1()(
njiXXPXXE jiji,...,2,1,),1()(
1
1)1(
21?

N
M
N
MXXP
)1( NMNMn ])(
)1(
)1()[1( 2
N
M
NN
MMnn?

1)1(?

N
nN
N
M
N
Mn



n
i ji
jijii XEXEXXEXDXD
1
)]()()([2)()(
(统分,提出公因子)
四。标准化随机变量定义
)(
)(*
XD
XEXX
为对应于 的 标准化随机变量 。X
容易证明:
1)(,0)( ** XDXE
例如:
),,(~ 2NX 则
XX *
是对应于 的标准化随机变量。X
又如
),(~?PX

XX *
是对应于 X的标准化随机变量。
五。切比雪夫不等式定理 设 X的期望和方差都存在,则对任一,0

,/)(})({ 2 XDXEXP

2/)(1})({ XDXEXP
( 3。 9)
(证略)
从切比雪夫不等式能进一步看出方差是衡量随机变量分散程度的一个指标。
切比雪夫不等式在理论上很有用(见第 5章),
计算上能对随机变量的取值范围作粗略的估计。
例 3。 5 已知正常男性成人血液中,每一毫升白细胞数平均是 7300,均方差是 800。利用切比雪夫不等式估计每毫升含白细胞数在 5200~9400之间的概率。
解:
)9 40 05 20 0( XP
)73009400730073005200( XP
9
8)
2 10 0
3 00(1)2 10 0|)((| 2 XEXP
定理 方差为零的充要条件是随机变量取某一常
1)(0)( CXPXD
其中 C为某一常数。 (证略)
数的概率等于 1。即第四章随机变量的数字特征
§ 4 协方差与相关糸数设有 n维随机向量
),...,,( 21 nXXXX
维随机矩阵nm?
nmijYY
X和 Y的期望分别定义为:
})(),.,,,(),({)( 21 nXEXEXEXE
nmijYEYE )()(
方差是随机变量函数的期望,因此类似地有定义:
})(),.,,,(),({)( 21 nXDXDXDXD
nmijYDYD )()(
一。多维随机向量和多维随机矩阵的期望和方差
( 4。 1)
( 4。 2)
( 4。 3)
( 4。 4)
及二。协方差和协方差阵在研究多维随机向量的数字特征时,除了各分量自身的特征,如期望、方差以外,还必须找出能体现各分量之间取值关系的数字特征,主要有协方差(协方差阵)和相关糸数。
(一)定义 设 X,Y是定义在同一概率空间上的两个随机变量,称(如果存在的话)
) ] }() ] [({[ YEYXEXE
为 X,Y的 协方差,记作
),( YXC ov

XY?
按此定义,方差
XXXD)(
( 4。 5)
计算协方差的常用公式是:
)()()( YEXEXYEXY
( 4。 6)
有了协方差的概念可将前面的公式( 3。 5)改
),(2)()()( YXC o vYDXDYXD
写成,( 4。 7)
对于随机向量
),...,,( 21 nXXXX
,记
) ] },() ] [({[ jjiiXXij XEXXEXEji
nji,...,2,1,?

nij
为随机向量的协方差矩阵。
其向量形式为:
}])()][({[ XEXXEXE
( 4。 8)
(二)性质由定义易得协方差和协方差阵的如下性质:
( 1) );,(),( XYC o vYXC o v?
( 2)
);,(),( YXa b C o vbYaXC o v?
( 3) );,(),(),( ZYC o vZXC o vZYXC o v
( 4)协方差矩阵是非负定的,即是对称阵,且对于任一实 n维向量,),...,,(
21 ntttt
恒有 。0 tt
证:
tXEXXEXEttt }])() ] [({[
}])() ] [([{ tXEXXEXtE
}])()][({[ XtEXtXtEXtE 0)( XtD
解:
d xd yyxpxXE ),()(
1020 1c o s r d rrd 0?
同理
.0)(?YE
,0)(?XYE
类似地可得:
4
1)(,
4
1)( 22 YEXE






4/10
04/1
YYYX
XYXX


例 4。 1 设 X,Y的联合概率密度是

其他,0
1,
1
),(
22 yx
yxp?
求协方差矩阵?
三。相关糸数协方差的量纲是 X量纲和 Y量纲的乘积,为为 X,Y的 相关糸数 。
了使刻划两随机变量间的取值关系有统一的尺度,将引入相关糸数这一重要概念。
(一)定义 设 X,Y是两个随机变量,
,0)(,0)( YDXD
则称
YYXX
XY
YDXD
YXC ov


)()(
),(
( 4。 9)
如果由公式( 4。 9)可知,相关糸数是无量纲的。
( 2)如果 X,Y相互独立,则 ;0
( 3)
1? 存在常数 a,b,使,1)( bXaYP
即:相关糸数的绝对值等于 1的充要条件是 X,Y
如果,0?
XY?
则称 X,Y不相关。
以概率 1存在线性关系。
必须指出:不相关只是相互独立的必要条件。
例如在例 4。 1中,
.0,0 XYXY

)()(),( ypxpyxp?,故 X,Y不相互独立。
(二)性质 设
是 X,Y的相关糸数,则有
( 1);1
例 4。 2 设随机变量( X,Y)的分布列是
Y/X -1 0 1
-1 1/8 1/8 1/8
0 1/8 0 1/8
1 1/8 1/8 1/8
验证,X和 Y不相关,但不相互独立。
证:
0)(,0)(,0)( XYEyExE
)()()( YEXEXYE
,即 X,Y不相关。
,例如
,0)0,0(?p,4/1)0(,4/1)0( YX pp
但 )()(),( ypxpyxp
YX?
( X,Y) ~ N( ),,,,
2121
例 4。 3 设求 X,Y的协方差和相关糸数。
解,如前所述,
),,(~ 211NX ),,(~ 222NY
因此,
,21 )(,)( YEXE
2221 )(,)( YDXD



d x d yyxpyxXY ),())(( 21
,21r? rXY
由此可知:( 1)二维正态分布中的第五个参数的概率含意是表示两个随机变量的相关糸数。
( 2)对于二维正态分布,X,Y相互独立的充要条件是 X,Y不相关。
设有两个随机变量 X和 Y,已知,0)(,0)( YDXD
希望用 X的线性函数 a+bX来近似代替 Y,问:应如何选择 a,b使 a+bX最接近 Y,接近程度如何?
四。线性预测与相关糸数的概率意义用均方偏差
})]({[),( 2bXaYEbaQ
最小,作为衡量的指标。 可以证明:当
XXXYbb /*

)()(* XEYEaa
XX
XY
时,
XX
XY
YYbaQ?
2),( ( 4。 10)
达到最小,即 )1(),(m in
2** XYYYbaQ ( 4。 11)
进一步可见:相关糸数刻划了两个随机变量线性相关的程度。
五。关于多维正态分布
),(~NX
由第三章结论可知:
.)(XE
此外,用高等代数知识不难证明:
.}])()][({[ XEXXEXE
这表明多维正态分布中的参数阵
,?
正是随机向量 X的协差阵。
特别,在二维正态分布
),(~
2
1
2
1?




N
X
X
X



2221
2111
XXXX
XXXX


中,
参数第四章随机变量的数字特征
§ 5 条件期望一。条件期望的概念二。最佳预测如果我们不限制在 X的线性函数中寻找最接近 Y的
})]({[ 2XgYE? 达到最小,结果又如何呢?
)(Xm
这表明,在最小均方偏差准则下,条件期望是对 Y的最佳预测。
定理 对于任意 )(?g,有
})]({[})]({[ 22 XgYEXmYE ( 5。 1)
,使作业,见习题集第四章。
)(Xg
由定义可见,条件期望是随机变量 X的函数,它也是随机变量。
设在条件 xX? 下 Y 的条件期望为
),(xm即
),()|( xmxXYE 则称 )(Xm 为
Y关于 X的 条件期望,记作 )|( XYE
(证略)