1
概率论与数理统计第 9讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '工程数学 '子目录 )
2
第五章 大数定律及中心极限定理
3
§ 1 大数定律
4
在第一章提到过事件发生的频率具有稳定性,
即随着试验次数的增加,事件发生的频率逐渐稳定于某个常数,在实践中人们还认识到大量测量值的算术平均值也具有稳定性,这种稳定性就是本节要讨论的大数定律的客观背景,
5
定理一 (契比雪夫定理的特殊情况 ) 设随机变量 X1,X2,...,Xn,...相互独立,且具有相同的数学期望和方差,E(Xk)=m,D(Xk)=s2(k=1,2,...),作前 n个随机变量的算术平均
,
1
1
n
k
kXnX
)1.1(.1
1
lim
}|{|lim
1




em
em
n
k
k
n
n
X
n
P
XP则对于任意正数 e,有
6
证 由于
,
1
)(
11
,
1
)(
11
2
2
2
1
2
1
11
n
n
n
XD
n
X
n
D
n
n
XE
n
X
n
E
n
k
k
n
k
k
n
k
k
n
k
k
s
s
mm






2
2
1
/
1
1
e
s
em
n
X
n
P
n
k
k

由契比雪夫不等式可得
7
在上式中令 n,并注意到概率不能大于 1,
即得
.1
1
lim
1


em
n
k
k
n
X
n
P
2
2
1
/
1
1
e
s
em
n
X
n
P
n
k
k

8
E(X1)=E(X2)=...=E(Xn)=m,这种接近是概率意义下的接近,通俗地说,在定理的条件下,n个随机变量的算术平均,当 n无限增加时将几乎变成一个常数,
接近于数学期望的算术平均值随机变量很大时当定理一表明


n
k
k
n
n
k
k
n
X
n
X
XXXn
X
n
P
1
21
1
1
,,,,,
.1
1
lim
em
9
设 Y1,Y2,...,Yn,...是一个随机变量序列,a是一个常数,若对于任意正数 e,有
,1}|{|lim

eaYP n
n
.aY Pn
则称序列 Y1,Y2,...,Yn,...依概率收敛于 a,记为
10
依概率收敛的序列还有以下性质,
).,(),(
,),(
),(,,
bagYXg
ba
yxgbYaX
P
nn
P
n
P
n


则连续在点又设函数设证,由 g(x,y)在 (a,b)的连续性可知,任给 e>0,必存在 d>0,使当 |x?a|+|y?b|<d时 |g(x,y)?g(a,b)|<e,
于是
{|g(Xn,Yn)?g(a,b)|?e}?{|Xn?a|+|Yn?b|?d}
{|Xn?a|?d/2}?{|Yn?b|?d/2},
11
.1}|),(),({|lim

ebagYXgP nn
n
{|g(Xn,Yn)?g(a,b)|?e}?{|Xn?a|+|Yn?b|?d}
{|Xn?a|?d/2}?{|Yn?b|?d/2},
因此
P{|g(Xn,Yn)?g(a,b)|?e}?
P{|Xn?a|?d/2}+P{|Yn?b|?d/2}
0,当 n
亦即
12
这样,上述定理一又可叙述为,
定理一 设随机变量 X1,X2,...,Xn,...相互独立,且具有相同的数学期望和方差,E(Xk)=m,
D(Xk)=s2(k=1,2,...),则序列
.,
1
1
mm
P
n
k
k XXnX 即依概率收敛于
13
定理二 (伯努利大数定理 ) 设 nA是 n次独立重复试验中事件 A发生的次数,p是事件 A在每次试验中发生的概率,则对于任意正数 e>0,有
)2.1(1lim?


ep
n
n
P A
n

)3.1(0lim?


ep
n
n
P A
n
14
证 因为 nA~b(n,p),由第四章 § 2例 6,有
nA=X1+X2+...+Xn,
其中,X1,X2,...,Xn相互独立,且都服从以 p为参数的 (0-1)分布,因而 E(Xk)=p,D(Xk)=p(1?p)
(k=1,2,...,n),由 (1.1)式即得
.1lim
,1)(
1
lim
21




e
e
p
n
n
P
pXXX
n
P
A
n
n
n

15
率收敛于事件的概率 p,这个定理以严格的数学形式表达了频率的稳定性,就是说 n很大时,
事件发生的频率与概率有较大偏差的可能性很小,由实际推断原理,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率,
依概件发生的频率伯努利大数定理表明事 nn A
16
定理一中要求随机变量 X1,X2,...的方差存在,
但这些随机变量服从相同分布的场合,并不需要这一要求,我们有以下的定理,
定理三 (辛钦定理 ) 设随机变量 X1,X2,...,Xn,...
相互独立,服从同一分布,且具有数学期望
E(Xk)=m(k=1,2,...),则对于任意正数 e,有
)3.1(.1
1
lim
1


em
n
k
k
n
X
n
P
17
§ 2 中心极限定理
18
在客观实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的,
而其中每一个别因素在总的影响中所起的作用都是微小的,这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景,
19
二项分布的随机变量可看作许多相互独立的
0-1分布的随机变量之和,下面是当 x~B(20,0.5)
时,x的概率分布图
0
0.05
0.1
0.15
0.2
P
20
普阿松分布相当于二项分布中 p很小 n很大的分布,因此,参数 l=np当很大时也相当于 n特别大,这个时候普阿松分布也近似服从正态分布,下面是 l=30时的普阿松概率分布图,
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48
P
21
在 c2(n)分布中,如果自由度 n很大,也可以认为是多个自由度为 1的相互独立的 c2(1)分布的随机变量的和,因此也近似服从正态分布,
下面是 c2(60)的概率密度曲线,
x0 60 120
22
定理四 (独立同分布的中心极限定理 ) 设随机变量 X1,X2,...,Xn,...相互独立,服从同一分布,且具有数学期望和方差 E(Xk)=m,D(Xk)=s2,
(k=1,2,...),则随机变量之和 X1+X2+...+Xn的标准化变量设为 Yn:(近似服从标准正态分布 )
.
1
1
11
s
m
n
nX
XD
XEX
Y
n
k
k
n
k
k
n
k
k
n
k
k
n


23
Yn的分布函数 Fn(x)对于任意 x满足
)1.2().(
2
1
lim)(lim
2/
1
2
xdte
x
n
nX
PxF
x
t
n
k
k
n
n
n
m
m



证明略,
.1
s
m
n
nX
Y
n
k
k
n
24
此定理说明,均值为 m,方差为 s2的独立同分布的 n个随机变量 (n超过 10或者 20以上 )
X1,X2,...,Xn之和 X1+X2+...+Xn近似服从正态分布 N(nm,ns2),
或者将其标准化有
)2.2().1,0(~
1
N
n
nX
n
k
k 近似地
s
m
这样就可以用正态分布对 X1+X2+...+Xn作理论分析或作概率计算,好处是明显的,
25
将 (2.2)式左端改写成
)3.2()./,(~)1,0(~
/
,
:,,
//
1
2
1
nNXN
n
X
n
n
X
n
X
n
n
k
k
sm
s
m
s
m
s
m
近似地近似地或充分大时当上述结果可写成这样

这是独立同分布中心极限定理结果的另一个形式,
26
这就是说,均值为 m,方差为 s2>0的独立同分布的随机变量 X1,X2,...,Xn的算术平均值为充分大时近似地服从均当 nX
n
X
n
k
k,
1
1
m,方差为 s2/n的正态分布,这一结果是数理统计中大样本统计推断的基础,
27
定理五 (李雅普诺夫定理 ) 设随机变量
X1,X2,...,Xn,...,相互独立,它们具有数学期望和方差,

n
k
kn
kkkk
B
kXDXE
1
22
2
,,2,1,0)(,)(
s
sm

0}|{|
1
1
2
2

n
k
kk
n
XE
B
d
d
m
若存在正数 d,使得当 n时,
28
则随机变量之和 X1+X2+...+Xn的标准化变量,
n
k
k
k
k
n
k
k
n
k
k
n
k
k
n
B
X
XD
XEX
Z







11
1
11
m
)4.2().(de
2
1
lim)(lim
2/
11
2
xt
x
B
X
PxF
x
t
n
n
k
k
n
k
k
n
n
n
m




的分布函数 Fn(x)对于任意的 x,满足
29
定理五表明,在定理的条件下,随机变量
.,
,
,).1,0(,
2
1
11
11




n
n
k
k
n
k
knn
n
k
k
n
k
k
k
k
n
BN
ZBXn
Nn
B
X
Z
m
m
m
态分布近似地服从正很大时当由此近似地服从正态分布很大时当
30
这就是说,无论各个随机变量 Xk(k=1,2,...)服从什么分布,只要满足定理的条件,则它们的和
X1+X2+...+Xn当 n很大时,就近似地服从正态分布,这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因,在很多问题中,
所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户的耗电量的总和 ; 一个物理实验的测量误差是由许多观察不到的,
可加的微小误差合成的,它们往往近似服从正态分布,
31
定理六 (棣莫弗 -拉普拉斯定理 ) 设随机变量
hn(n=1,2,...)服从参数为 n,p(0<p<1)的二项分布,则对于任意 x,有
)5.2(
).(de
2
1
)1(
lim
2/
2
xtx
pnp
np
P
x
tn
n
h





32
证 hn可看作由 n个服从同一 (0-1)分布的随机变量 X1,X2,...,Xn的和 hn=X1+X2+...+Xn,其中
E(Xk)=p,D(Xk)=p(1?p)(k=1,2,...,n),由定理四得


x
t
n
k
k
n
n
n
t
x
pnp
npX
Px
pnp
np
P
de
2
1
)1(
lim
)1(
lim
2/
1
2
h
33
例 1 一加法器同时收到 20个噪声电压
Vk(k=1,2,...,20),设它们是相互独立的随机变量,且都在区间 (0,10)上服从均匀分布,记
V=V1+V2+...+V20,求 P(V>105)的近似值,
解 易知 E(Vk)=5,D(Vk)=100/12(k=1,2,...,20),
则 E(V)=E(V1+...+V20)=E(V1)+...+E(V20)=100,
D(V)=D(V1+...+V20)=D(V1)+...+D(V20)=1000/6,
根据中心极限定理,近似有
V~N(100,1000/6).
34
V~N(100,1000/6),于是
348.0)387.0(1
387.0
6/1000
100
1
387.0
6/1000
100
6/1000
100105
6/1000
100
}105{




V
P
V
P
V
PVP
即有 P{V>105}?0.348.
35
例 2 一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 3o的概率为 p=1/3,若船舶遭受了 90000次波浪冲击,问其中有
29500~30500次纵摇角大于 3o的概率是多少?
解 将船舶每遭受一次波浪冲击看作是一次试验,并假定各次试验是独立的,在 90000次波浪冲击中纵摇角度大于 3o的次数记为 X,则 X是一个随机变量,且有 X~b(90000,1/3),则
E(X)=np=90000?(1/3)=30000,
D(X)=np(1?p)=90000?(1/3)?(2/3)=20000.
36
E(X)=30000,D(X)=20000,
因此,根据中心极限定理,近似有
X~N(30000,20000),则
9 99 5.0)2/25()2/25(
2 00 0 0
3 00 0 03 05 0 0
2 00 0 0
3 00 0 0
2 00 0 0
3 00 0 02 95 0 0
}3 05 0 02 95 0 0{





X
P
XP
37
例 3 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长,1名家长,2名家长来参加会议的概率分别为 0.05,
0.8,0.15,若学校共有 400名学生,设各学生参加会议的家长数相互独立,且服从同一分布,
(1)求参加会议的家长数 X超过 450的概率 ; (2)
求有一名家长来参加会议的学生数不多于 340
的概率,
38
解 (1)以 Xk(k=1,2,...,400)记第 k个学生来参加会议的家长数,则 Xk的分布律为
15.08.005.0
210
k
k
p
X
1357.0)147.1(1
76
440450
76
440
}450{



X
PXP
则 E(Xk)=1.1,D(Xk)=0.19 k=1,2,...,400,而
X=X1+X2+...+X400,E(X)=440,D(X)=76,X近似服从 N(440,76),因此
39
(2) 以 Y记有一名家长来参加会议的学生数,则
Y~b(400,0.8),由定理六得
.9 9 3 8.0)5.2(
2.08.0400
8.0400340
2.08.0400
8.0400
}340{





Y
P
YP
40
作业 第五章 习题第 154页 开始第 1,2,7题
41
请提问