§ 5.2 中心极限定理
人们已经知道,在自然界和生产实践中遇到的大量随机
变量都服从或近似服从正态分布,正因如此,正态分布占有
特别重要的地位。那么,如何判断一个随机变量服从正态分
布显得尤为重要。如经过长期的观测,人们已经知道,很多
工程测量中产生的误差 X都是服从正态分布的随机变量。分
析起来,造成误差的原因有仪器偏差 X1、大气折射偏差 X2,
温度变化偏差 X3、估读误差造成的偏差 X4等等,这些偏差 Xi
对总误差 的影响都很微小,没有一个起到特别突出
的影响,虽然每个 Xi的分布并不知道,但 却服从正态
分布。类似的例子不胜枚举。
设 为一随机变量序列,其标准化随机变量
?? iXX
?? iXX
}{ nX
,( 5-6)
在什么条件下,,这是十八世纪以来概率论研究
的中心课题,因而,从二十世纪二十年代开始,习惯上把研究
随机变量和的分布收敛到正态分布的这类定理称为 中心极限定
理 ( Central Limit Theorems)。这里仅介绍独立同分布场合
下的中心极限定理。
定理 5.2 (林德伯格 — 莱维( Lindeberg-Lévy)中心极限定
理 ) 设 是一相互独立同分布随机变量序列,
则对任意的实数,总有
)(
)(
1
1 1
?
? ?
?
? ?
?
?
n
i
i
n
i
n
i
ii
n
XD
XEX
Y
? ? )(lim xxYP nn ?????
}{ nX
?,2,1,0,,22 ??????? iDXEX ii ???
,(5-7)
本定理的证明在 20世纪 20年代由林德伯格和莱维给出,因
证明较复杂,在此从略。
由定理 5.2可知,当 n充分大时,
,(5-8)
从而,
2
1 1 1 2
1
1
l i m l i m d ( )
2
n n n
x ti i i
i i i
nnn
i
i
X E X X n
P x P x e t x
n
DX
?
??
?
? ? ?
? ? ? ?
??
?
?? ??
???? ??
? ? ? ?
? ? ? ? ? ?? ? ? ?
? ? ? ?
? ? ? ???
??
? ? ?
?
?
)1,0( ~ 1 N
n
nX
n
i
i 近似
?
??
?
?
),( ~ 2
1
?? nnNX
n
i
i
近似?
?
或
另外,对于任意的实数 和较大的 n,由( 5-8)可知
,(5-10)
定理 5.2在概率论中占有特别重要的地位,由于它对 的
分布形式没有要求,因而得到广泛使用。对于应用者来讲,只
要能把问题抽象为独立同分布的随机变量之和,且这些随机变
量的均值和方差均存在,便可用( 5-9)式近似计算概率。
),( ~ 1
2
1 n
NX
n
n
i
i
??近似?
?
)ba(b,a ?
)()(1 abb
n
nX
aP
n
i
i
????
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
}{ nX
推论 1 (棣莫佛 — 拉普拉斯( De Moivre - Laplace)定理 )
设 为相互独立的随机变量序列,且, 0< p< 1,
,则对任意实数,有
,( 5-11)
证明 只需将,,,代入 ( 5-7 )
式便得( 5-11)式, ?
这是历史上最早的中心极限定理,棣莫佛在 1716年证明了
的情形,后来拉普拉斯将结果推广到一般情形。对较大
的 n,由( 5-11)或( 5-8)可知
}{ nX ),1(~ pBX i
??,,,2,1 ni ? x
)(d
2
1
)1(
lim
21
2
xtex
pnp
npX
P
x
t
n
i
i
n
???
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
?
?
??
?
?
?? ?
pEX i ? )1( ppDX i ?? ??,,,2,1 ni ?
2
1?p
,( 5-12)
令,则, 于是,对于任意的实数 和较
大的 n,有
,( 5-13)
其中
.
因为对较大的 n,和 的值很小,可忽略不计,所以
我们还有
)1(
1
pnp
npX
n
i
i
?
??
? )1,0( ~ N近似
?
?
? n
i
in XZ
1
),(~ pnBZ n )(,,baba ?
? ? ?
?
???
??
???
?
??
?
??
?
????
)1()1()1( pnp
npb
pnp
npZ
pnp
npaPbZaP n
n
)()( 11 ab ????
)1(
,
)1( 11 pnp
npbb
pnp
npaa
?
??
?
??
}{ aZP n ? }{ bZP n ?
,
,
,
关于这些近似公式的使用,现作如下说明:
( 1)注意到,则( 5-13)表明,对固定的 p和较
大的 n,二项分布可用正态分布逼近;
( 2)“较大的 n”是一个较为模糊的概念,究竟多大才是较
“大”要依据实际问题来定。一般地,如果 n≥50(有时亦可放
宽到 n≥30),就可认为是较大的 n;
( 3)第二章泊松定理表明,当 p很小(可设想成 p随 n的变
化趋于 0),n较大且 np不太大时,二项分布可用泊松分布逼
近。在实际中,当 p≤0.1,n较大且 np≤5时,常用泊松分布
(见附表 1)逼近二项分布;当 n较大且 np>5时,常用正态分布
做二项分布的近似计算。
? ?bZaP n ?? )()( 11 ab ????
? ?bZaP n ?? )()( 11 ab ????
? ?bZaP n ?? )()( 11 ab ????
),(~ pnBZ n
最后,我们指出大数定律与中心极限定理的区别:
设 为独立同分布随机变量序列,且,,
则由定理 5.1的推论 1,对于任意的 ε> 0有
.
大数定律并未给出 的表达式,但保证了其极限是 1.
而在以上条件下,中心极限定理 5.2(林德伯格 — 莱维)亦
成立,这时,对于任意的 ε> 0及某固定的 n,有
.
由于,因此,在所给条件下,中心极限定理不
仅给出了概率的近似表达式,而且也能保证了其极限是 1,可
见中心极限定理的结论更为深入。
}{ nX ??iEX 02 ?? ?iDX
11lim
1
?
?
?
?
?
?
? ???
???
??
n
i
in XnP
??
?
??
? ?????
?
n
i
iXnP
1
1
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
?
?
?
??
?
?
?
??
?
? ? ?
?
?
?
??
n
n
nX
PX
n
P
n
i
i
i
11
112 ?? ?????
?
?
???
??
??n
n
?
?