第四章 随机变量的数字特征
第一节 数学期望
湖南商学院信息系
数学教研室
在前面的课程中,我们讨论了随机变量及
其分布,如果知道了随机变量 X的概率分布,
那么 X的全部概率特征也就知道了,
然而,在实际问题中,概率分布一般是较
难确定的, 而在一些实际应用中,人们并不需
要知道随机变量的一切概率性质,只要知道它
的某些数字特征就够了,
因此,在对随机变量的研究中,确定某些
数字特征是重要的, 其中最常用的是
期望 和 方差
一、离散型随机变量的数学期望
概念的引入:
某车间对工人的生产情况
进行考察, 车工小张每天生产
的废品数 X是一个随机变量, 如
何定义 X的平均值呢?
我们来看这个问题,
若统计 100天,
例 1 某车间对工人的生产情况进行考察, 车工
小张每天生产的废品数 X是一个随机变量, 如
何定义 X的平均值呢?
32天没有出废品 ;
30天每天出一件废品 ;
17天每天出两件废品 ;
21天每天出三件废品 ;
27.11 0 02131 0 01721 0 03011 0 0320 ????????
可以得到这 100天中
每天的平均废品数为
这个数能否作为
X的平均值呢?
可以想象,若另外统计 100天,车工小张不
出废品,出一件、二件、三件废品的天数与
前面的 100天一般不会完全相同,这另外 100
天每天的平均废品数也不一定是 1.27.
n0天没有出废品 ;
n1天每天出一件废品 ;
n2天每天出两件废品 ;
n3天每天出三件废品,
n
n
n
n
n
n
n
n 3210 3210 ???????
可以得到 n天中每天的平均废品数为
(假定小张每天至多出
三件废品 )
一般来说,若统计 n天,
这是
以频率为权的加权平均 n
n
n
n
n
n
n
n 3210 3210 ???????
由频率和概率的关系
不难想到,在求废品数 X
的平均值时,用 概率代替
频率,得平均值为
3210 3210 pppp ???????
这是
以概率为权的加权平均
这样得到一个确定的数, 我们就用这个数作为
随机变量 X的平均值,
定义 1 设 X是离散型随机变量,它的概率分布
是, P{X=Xk}=pk,k=1,2,…
也就是说,离散型随机变量的数学期望是一个绝
对收敛的级数的和,
?
?
?
?
1
)(
k
kk pxXE
?
?
? 1
||
k
kk px
如果 有限,定义 X的数学期望
数学期望的统计意义
请看演示
要了解数学期望的统计意义,
两点分布 X ~ B(1,p),0<p<1
P{X=1}=p,P{X=0}=1-p
? E(X)=1?p+0?(1-p)=p
常见 离散型随机变量的数学期望
二项分布 X ~ B(n,p),其中 0<p<1
npE ( X ) ?
推导见(板)书,另一简单证明见期望的
性质后面例题
泊松分布 X ~ P(?) 其中 ?>0,则 E(X)= ?
??
?
?
??
?
?
??
??
?
??
?
???
?
?
??
1k
k
0k
k
k
e
!k
ke
!k
k)X(E
,2,1,0ke
!k
}kX{P ??
?????
?
??
??
?
?
???
?
???
?
?
??
?
?
??
?
?
??
??
?
??
?
1e
!l
1kl
e
)!1k(
e
)!1k(
0l
l
1k
1k
1k
1k
二、连续型随机变量的数学期望
设 X是连续型随机变量,其密度函数为 f (x),
在数轴上取很密的分点 x0 <x1<x2< …,则 X落
在小区间 [xi,xi+1)的概率是
? ? 1 )(iixx dxxf
ii xxf ?? )(
小区间 [xi,xi+1)
阴影面积
近似为
ii xxf ?)(
))(( 1 iii xxxf ?? ?
小区间 [Xi,Xi+1)
由于 xi与 xi+1很接近,所以区间 [xi,xi+1)中
的值可以用 xi来近似代替,
? ?
i
iii xxfx )(
这正是 ??
??
dxxfx )(
的渐近和式,
阴影面积
近似为
ii xxf ?)(
近似,
ii xxf ?)(因此 X与以概率
取值 xi的离散型 r.v
该离散型 r.v的数
学期望 是
由此启发我们引进如下定义,
定义 2 设 X是连续型随机变量,其密度函数
为 f (x),如果
? ??? dxxfx )(||
有限,定义 X的数学期望为
? ???? dxxfxXE )()(
也就是说,连续型随机变量的数学期望是一个绝
对收敛的积分,
2)(
baXE ??
若 X~U[a,b],即 X服从 [a,b]上的均匀分布,则
??)( XE
若 X服从 则),,( 2??N
?/1)( ?XE
若 X服从参数为 的指数分布,则?
由随机变量数学期望的定义,不难计算得:
这意味着,若从该地区抽查很多个成
年男子,分别测量他们的身高,那么,这
些身高的平均值近似是 1.68.
68.1)( ?? ?XE
已知某地区成年男子身高 X~ ),,.( 2681 ?N
三、随机变量函数的数学期望
1,问题的提出:
设已知随机变量 X的分布,我们需要计
算的不是 X的期望,而是 X的某个函数的期
望,比如说 g(X)的期望, 那么应该如何计算
呢?
如何计算随机变量函数的数学期望?
一种方法是,因为 g(X)也是随机变量,
故应有概率分布,它的分布可以由已知的 X
的分布求出来, 一旦我们知道了 g(X)的分布,
就可以按照期望的定义把 E[g(X)]计算出来,
使用这种方法必须先求出随机变量函数
g(X)的分布,一般是比较复杂的,
那么是否可以不先求 g(X)的分布而只
根据 X的分布求得 E[g(X)]呢?
下面的基本公式指出,答案是肯定的,
类似引入上述 E(X)的推理,可得如下的
基本公式,
设 X是一个随机变量,Y=g(X),则
?
?
?
?
?
??
?
?
?
??
?
?
连续型
离散型
Xdxxfxg
Xpxg
XgEYE k
kk
,)()(
,)(
)]([)( 1
当 X为离散型时,P(X= xk)=pk ;
当 X为连续型时,X的密度函数为 f(x).
?
?
?
?
?
??
?
?
?
??
?
?
连续型
离散型
Xdxxfxg
Xpxg
XgEYE k
kk
,)()(
,)(
)]([)( 1
该公式的重要性在于, 当我们求 E[g(X)]
时,不必知道 g(X)的分布,而只需知道 X的
分布就可以了, 这给求随机变量函数的期
望带来很大方便,
X~N(0,1) 求, E(X2)
解,
例 3
?
?
?
??
?
?
??
?
?
??
?
?
2
x
2
x
22
2
2
x d e
2
1
dxe
2
1
x)X(E
110
dxe
2
1
xe
2
1
2
x
2
x
22
???
?
?
?
?? ?
?
??
?
?
??
?
设,国际市场上对我国某种出口商品的
每年需求量是随机变量 X(单位, 吨 ).X服从区
间 [2000,4000]上的均匀分布,每销售出一吨商
品,可为国家赚取外汇 3万元 ; 若销售不出,则
每吨商品需贮存费 1万元,求,应组织多少货源,
才能使国家收益最大?
例 4.
设组织货源 t吨,显然应要求
2000 ≤ t ≤ 4000,国家收益 Y(单位,万元 )
是 X的函数 Y=g(X),表达式为,
解
?
?
?
???
?
?
tX)Xt(X3
tXt3
)X(g
由已知条件,X的概率密度函为
?
?
?
?
?
?
?
?
]4000,2000[x0
]4000,2000[x
2000
1
)x(f
?? ??
?
??
4000
2000
dx)x(g
2 0 0 0
1dx)x(f)x(g)]X(g[E
)108t140 00t2(
200 0
1
t dx3dx)tx4(
200 0
1
62
4 0 0 0
t
t
2 0 0 0
?????
??
?
??
? ???
??
可算得 当 t=3500时,
E(Y)=-2t2 + 14000t-8000000
达到 最大,因此,应组织 3500吨货源,
?说明
前面我们给出了求 g(X)的期望的方法,
实际上定理的结论可以原封不动地
推广到两个随机变量函数 Z=g(X,Y)的情
形,
稍事休息
设二维离散型随机向量 (X,Y)的分布律为
pij i=1,2,? ; j=1,2,?,则,
? ?
?
?
?
?
?
1i 1j
ijji p)y,x(g)]Y,X(g[E
设二维连续型随机向量 (X,Y)的密度函数为
f(x,y),则,
d x d y)y,x(f)y,x(g)]Y,X(g[E ? ??
??
?
??
?
设二维离散型随机向量 (X,Y)的
概率分布如下表所示,求,Z=X2+Y的期望,
E(Z)=g(1,1)?0.125+g(1,2)?0.25
+g(2,1)?0.5+g(2,2)?0.125
解,
Y
X
1 2
1
1 /8 1 /4
2
1 /2 1 /8
例 5
=4.25
设随机变量 X和 Y相互独立,概率密度函
数分别为
求,E(XY)
解,
?
?
? ?
?
?
其它0
0xe4
)x(f
x4
X
?
?
? ?
?
?
其它0
0ye2
)y(f
y2
Y
d x d y)y(f)x(xyf)]Y,X(g[E YX? ??
??
?
??
??
∵ G(X,Y)=XY,X和 Y相互独立,
例 6
8
1
2
1
4
1
dyye2dxxe4
dx dye2e4xy
0 0
y2x4
y2
0 0
x4
?????
???
? ?
? ?
? ?
??
?
? ?
?
四、数学期望的性质
1,设 C是常数,则 E(C)=C;
4,设 X,Y独立,则 E(XY)=E(X)E(Y);
2,若 k是常数,则 E(kX)=kE(X);
3,E(X1+X2) = E(X1)+E(X2);
??
??
?
n
i
i
n
i
i XEXE
11
)(][:推广
??
??
?
n
i
i
n
i
i XEXE
11
)(][:推广 (诸 Xi独立时)
注意,由 E(XY)=E(X)E(Y)
不一定能推出 X,Y独立
五、数学期望性质的应用
例 7 求二项分布的数学期望
若 X~B(n,p),
则 X表示 n重贝努里试验中的“成功” 次数,
现在我们来求 X的数学期望,
可见,服从参数为 n和 p的二项分布的
随机变量 X的数学期望是 np.
X~B(n,p),
若设
则 X= X1+X2+…+ Xn
= np
?
?
??
次试验失败如第
次试验成功如第
i
iX
i 0
1 i=1,2,…, n
因为 P{Xi =1}= p,P{Xi =0}= 1-p
?
?
n
i
iXE
1
)(所以 E(X)=
则 X表示 n重贝努里试验中的“成功” 次数,
E(Xi)= )1(01 pp ???? = p
例 8 将 n个球放入 M个盒子中,设每个球落入各
个盒子是等可能的,求有球的盒子数 X的期望,
解, 引入随机变量,
M,,2,1i
i0
i1
X
i
??
?
?
?
?
个盒子中无球若第
个盒子中有球若第
则 X=X1+X2+… +XM,于是
E(X)=E(X1)+E(X2)+ … +E(XM).
每个随机变量 Xi都服从两点分布,i=1,2,…,M.
∵ 每个球落入每个盒子是等可能的均为 1/M,
∴ 对第 i个盒子,一个球不落入这个盒子内的概
率为 (1-1/M).故 N个球都不落入这个盒子内的
概率为 (1-1/M)n,即,
?
?
?
?
?
?
???
????
?????
?????
????????
n
M21
M21
n
i
n
i
n
i
)
M
1
1(1M
)X(E)X(E)X(E
)XXX(E)X(E
M,,2,1i)
M
1
1(1)X(E
)
M
1
1(1}1X{P,)
M
1
1(}0X{P
?
?
?
小结,这一讲,我们介绍了随机变量的数
学期望,它反映了随机变量取值的平均水
平,是随机变量的一个重要的数字特征,
接下来的一讲中,我们将向大家介绍
随机变量另一个重要的数字特征:
方差
第一节 数学期望
湖南商学院信息系
数学教研室
在前面的课程中,我们讨论了随机变量及
其分布,如果知道了随机变量 X的概率分布,
那么 X的全部概率特征也就知道了,
然而,在实际问题中,概率分布一般是较
难确定的, 而在一些实际应用中,人们并不需
要知道随机变量的一切概率性质,只要知道它
的某些数字特征就够了,
因此,在对随机变量的研究中,确定某些
数字特征是重要的, 其中最常用的是
期望 和 方差
一、离散型随机变量的数学期望
概念的引入:
某车间对工人的生产情况
进行考察, 车工小张每天生产
的废品数 X是一个随机变量, 如
何定义 X的平均值呢?
我们来看这个问题,
若统计 100天,
例 1 某车间对工人的生产情况进行考察, 车工
小张每天生产的废品数 X是一个随机变量, 如
何定义 X的平均值呢?
32天没有出废品 ;
30天每天出一件废品 ;
17天每天出两件废品 ;
21天每天出三件废品 ;
27.11 0 02131 0 01721 0 03011 0 0320 ????????
可以得到这 100天中
每天的平均废品数为
这个数能否作为
X的平均值呢?
可以想象,若另外统计 100天,车工小张不
出废品,出一件、二件、三件废品的天数与
前面的 100天一般不会完全相同,这另外 100
天每天的平均废品数也不一定是 1.27.
n0天没有出废品 ;
n1天每天出一件废品 ;
n2天每天出两件废品 ;
n3天每天出三件废品,
n
n
n
n
n
n
n
n 3210 3210 ???????
可以得到 n天中每天的平均废品数为
(假定小张每天至多出
三件废品 )
一般来说,若统计 n天,
这是
以频率为权的加权平均 n
n
n
n
n
n
n
n 3210 3210 ???????
由频率和概率的关系
不难想到,在求废品数 X
的平均值时,用 概率代替
频率,得平均值为
3210 3210 pppp ???????
这是
以概率为权的加权平均
这样得到一个确定的数, 我们就用这个数作为
随机变量 X的平均值,
定义 1 设 X是离散型随机变量,它的概率分布
是, P{X=Xk}=pk,k=1,2,…
也就是说,离散型随机变量的数学期望是一个绝
对收敛的级数的和,
?
?
?
?
1
)(
k
kk pxXE
?
?
? 1
||
k
kk px
如果 有限,定义 X的数学期望
数学期望的统计意义
请看演示
要了解数学期望的统计意义,
两点分布 X ~ B(1,p),0<p<1
P{X=1}=p,P{X=0}=1-p
? E(X)=1?p+0?(1-p)=p
常见 离散型随机变量的数学期望
二项分布 X ~ B(n,p),其中 0<p<1
npE ( X ) ?
推导见(板)书,另一简单证明见期望的
性质后面例题
泊松分布 X ~ P(?) 其中 ?>0,则 E(X)= ?
??
?
?
??
?
?
??
??
?
??
?
???
?
?
??
1k
k
0k
k
k
e
!k
ke
!k
k)X(E
,2,1,0ke
!k
}kX{P ??
?????
?
??
??
?
?
???
?
???
?
?
??
?
?
??
?
?
??
??
?
??
?
1e
!l
1kl
e
)!1k(
e
)!1k(
0l
l
1k
1k
1k
1k
二、连续型随机变量的数学期望
设 X是连续型随机变量,其密度函数为 f (x),
在数轴上取很密的分点 x0 <x1<x2< …,则 X落
在小区间 [xi,xi+1)的概率是
? ? 1 )(iixx dxxf
ii xxf ?? )(
小区间 [xi,xi+1)
阴影面积
近似为
ii xxf ?)(
))(( 1 iii xxxf ?? ?
小区间 [Xi,Xi+1)
由于 xi与 xi+1很接近,所以区间 [xi,xi+1)中
的值可以用 xi来近似代替,
? ?
i
iii xxfx )(
这正是 ??
??
dxxfx )(
的渐近和式,
阴影面积
近似为
ii xxf ?)(
近似,
ii xxf ?)(因此 X与以概率
取值 xi的离散型 r.v
该离散型 r.v的数
学期望 是
由此启发我们引进如下定义,
定义 2 设 X是连续型随机变量,其密度函数
为 f (x),如果
? ??? dxxfx )(||
有限,定义 X的数学期望为
? ???? dxxfxXE )()(
也就是说,连续型随机变量的数学期望是一个绝
对收敛的积分,
2)(
baXE ??
若 X~U[a,b],即 X服从 [a,b]上的均匀分布,则
??)( XE
若 X服从 则),,( 2??N
?/1)( ?XE
若 X服从参数为 的指数分布,则?
由随机变量数学期望的定义,不难计算得:
这意味着,若从该地区抽查很多个成
年男子,分别测量他们的身高,那么,这
些身高的平均值近似是 1.68.
68.1)( ?? ?XE
已知某地区成年男子身高 X~ ),,.( 2681 ?N
三、随机变量函数的数学期望
1,问题的提出:
设已知随机变量 X的分布,我们需要计
算的不是 X的期望,而是 X的某个函数的期
望,比如说 g(X)的期望, 那么应该如何计算
呢?
如何计算随机变量函数的数学期望?
一种方法是,因为 g(X)也是随机变量,
故应有概率分布,它的分布可以由已知的 X
的分布求出来, 一旦我们知道了 g(X)的分布,
就可以按照期望的定义把 E[g(X)]计算出来,
使用这种方法必须先求出随机变量函数
g(X)的分布,一般是比较复杂的,
那么是否可以不先求 g(X)的分布而只
根据 X的分布求得 E[g(X)]呢?
下面的基本公式指出,答案是肯定的,
类似引入上述 E(X)的推理,可得如下的
基本公式,
设 X是一个随机变量,Y=g(X),则
?
?
?
?
?
??
?
?
?
??
?
?
连续型
离散型
Xdxxfxg
Xpxg
XgEYE k
kk
,)()(
,)(
)]([)( 1
当 X为离散型时,P(X= xk)=pk ;
当 X为连续型时,X的密度函数为 f(x).
?
?
?
?
?
??
?
?
?
??
?
?
连续型
离散型
Xdxxfxg
Xpxg
XgEYE k
kk
,)()(
,)(
)]([)( 1
该公式的重要性在于, 当我们求 E[g(X)]
时,不必知道 g(X)的分布,而只需知道 X的
分布就可以了, 这给求随机变量函数的期
望带来很大方便,
X~N(0,1) 求, E(X2)
解,
例 3
?
?
?
??
?
?
??
?
?
??
?
?
2
x
2
x
22
2
2
x d e
2
1
dxe
2
1
x)X(E
110
dxe
2
1
xe
2
1
2
x
2
x
22
???
?
?
?
?? ?
?
??
?
?
??
?
设,国际市场上对我国某种出口商品的
每年需求量是随机变量 X(单位, 吨 ).X服从区
间 [2000,4000]上的均匀分布,每销售出一吨商
品,可为国家赚取外汇 3万元 ; 若销售不出,则
每吨商品需贮存费 1万元,求,应组织多少货源,
才能使国家收益最大?
例 4.
设组织货源 t吨,显然应要求
2000 ≤ t ≤ 4000,国家收益 Y(单位,万元 )
是 X的函数 Y=g(X),表达式为,
解
?
?
?
???
?
?
tX)Xt(X3
tXt3
)X(g
由已知条件,X的概率密度函为
?
?
?
?
?
?
?
?
]4000,2000[x0
]4000,2000[x
2000
1
)x(f
?? ??
?
??
4000
2000
dx)x(g
2 0 0 0
1dx)x(f)x(g)]X(g[E
)108t140 00t2(
200 0
1
t dx3dx)tx4(
200 0
1
62
4 0 0 0
t
t
2 0 0 0
?????
??
?
??
? ???
??
可算得 当 t=3500时,
E(Y)=-2t2 + 14000t-8000000
达到 最大,因此,应组织 3500吨货源,
?说明
前面我们给出了求 g(X)的期望的方法,
实际上定理的结论可以原封不动地
推广到两个随机变量函数 Z=g(X,Y)的情
形,
稍事休息
设二维离散型随机向量 (X,Y)的分布律为
pij i=1,2,? ; j=1,2,?,则,
? ?
?
?
?
?
?
1i 1j
ijji p)y,x(g)]Y,X(g[E
设二维连续型随机向量 (X,Y)的密度函数为
f(x,y),则,
d x d y)y,x(f)y,x(g)]Y,X(g[E ? ??
??
?
??
?
设二维离散型随机向量 (X,Y)的
概率分布如下表所示,求,Z=X2+Y的期望,
E(Z)=g(1,1)?0.125+g(1,2)?0.25
+g(2,1)?0.5+g(2,2)?0.125
解,
Y
X
1 2
1
1 /8 1 /4
2
1 /2 1 /8
例 5
=4.25
设随机变量 X和 Y相互独立,概率密度函
数分别为
求,E(XY)
解,
?
?
? ?
?
?
其它0
0xe4
)x(f
x4
X
?
?
? ?
?
?
其它0
0ye2
)y(f
y2
Y
d x d y)y(f)x(xyf)]Y,X(g[E YX? ??
??
?
??
??
∵ G(X,Y)=XY,X和 Y相互独立,
例 6
8
1
2
1
4
1
dyye2dxxe4
dx dye2e4xy
0 0
y2x4
y2
0 0
x4
?????
???
? ?
? ?
? ?
??
?
? ?
?
四、数学期望的性质
1,设 C是常数,则 E(C)=C;
4,设 X,Y独立,则 E(XY)=E(X)E(Y);
2,若 k是常数,则 E(kX)=kE(X);
3,E(X1+X2) = E(X1)+E(X2);
??
??
?
n
i
i
n
i
i XEXE
11
)(][:推广
??
??
?
n
i
i
n
i
i XEXE
11
)(][:推广 (诸 Xi独立时)
注意,由 E(XY)=E(X)E(Y)
不一定能推出 X,Y独立
五、数学期望性质的应用
例 7 求二项分布的数学期望
若 X~B(n,p),
则 X表示 n重贝努里试验中的“成功” 次数,
现在我们来求 X的数学期望,
可见,服从参数为 n和 p的二项分布的
随机变量 X的数学期望是 np.
X~B(n,p),
若设
则 X= X1+X2+…+ Xn
= np
?
?
??
次试验失败如第
次试验成功如第
i
iX
i 0
1 i=1,2,…, n
因为 P{Xi =1}= p,P{Xi =0}= 1-p
?
?
n
i
iXE
1
)(所以 E(X)=
则 X表示 n重贝努里试验中的“成功” 次数,
E(Xi)= )1(01 pp ???? = p
例 8 将 n个球放入 M个盒子中,设每个球落入各
个盒子是等可能的,求有球的盒子数 X的期望,
解, 引入随机变量,
M,,2,1i
i0
i1
X
i
??
?
?
?
?
个盒子中无球若第
个盒子中有球若第
则 X=X1+X2+… +XM,于是
E(X)=E(X1)+E(X2)+ … +E(XM).
每个随机变量 Xi都服从两点分布,i=1,2,…,M.
∵ 每个球落入每个盒子是等可能的均为 1/M,
∴ 对第 i个盒子,一个球不落入这个盒子内的概
率为 (1-1/M).故 N个球都不落入这个盒子内的
概率为 (1-1/M)n,即,
?
?
?
?
?
?
???
????
?????
?????
????????
n
M21
M21
n
i
n
i
n
i
)
M
1
1(1M
)X(E)X(E)X(E
)XXX(E)X(E
M,,2,1i)
M
1
1(1)X(E
)
M
1
1(1}1X{P,)
M
1
1(}0X{P
?
?
?
小结,这一讲,我们介绍了随机变量的数
学期望,它反映了随机变量取值的平均水
平,是随机变量的一个重要的数字特征,
接下来的一讲中,我们将向大家介绍
随机变量另一个重要的数字特征:
方差