1
概率论与数理统计第 19讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
第五章 大数定律与中心极限定理
3
切贝谢夫不等式设随机变量 x有期望值 Ex及方差 Dx,则任给
e>0,有
2
2
1)|(|
)|(|
e
x
exx
e
x
exx
D
EP
D
EP
4
示意图
Ex Ex+eEx?e
j(x)
x
Dx/e2
5
证 如 x是离散型随机变量,那么
22
2
||
2
2
||||
)(
)(
)()|(|
e
x
e
x
e
x
xexx
ex
exex
D
p
Ex
p
Ex
pxPEP
k
k
k
Ex
k
k
Ex
k
Ex
k
k
kk
6
如果 x是连续型随机变量,x~j(x),则
22
2
||
2
2
||
)(
)(
)(
)(
)()|(|
e
x
j
e
x
j
e
x
jexx
ex
ex
D
dxx
Ex
dxx
Ex
dxxEP
Ex
Ex
+
7
例 1 设 x是掷一颗骰子所出现的点数,若给定
e=1,2,实际计算 P(|x?Ex|?e),并验证切贝谢夫不等式成立,
解 因 P(x=k)=1/6,(k=1,2,3,4,5,6)
)2|
2
7
(|
3
1
48
35
124
35
:2
)1|
2
7
(|
3
2
12
35
:1
12
35
12
147182
4
49
6
91
)(
6
91
6
362516941
,
2
7
6
654321
2
2
22
2
+++++
+++++
x
e
x
e
x
e
x
e
xxx
xx
P
D
P
D
EED
EE
8
例 2 设电站供电所有 10000盏电灯,夜晚每一盏灯开灯的概率都是 0.7,而假定开关时间彼此独立,估计夜晚同时开着的灯数在 6800与
7200之间的概率,
9
解 令 x为同时开灯的数目,则 x~B(10000,0.7)
95.0
200
21 00
1
)200|70 00(|}72 0068 00{
21 003.07.010 000
70 007.010 000
:
3.07.0)72 0068 00(
2
7199
6801
1 0 0 0 0
1 0 0 0 0
xx
x
x
x
PP
npqD
npE
CP
k
kkk
估计如果用切贝谢夫不等式可见只要有供应 7200盏灯的电力就够用,
10
大数定律的概念例 1 掷一颗骰子,出现 1点的概率是 1/6,在掷的次数比较少时,出现 1点的频率可能与 1/6相差很大,但是在掷的次数很多时,出现 1点的频率接近 1/6是必然的,
例 2 测量一个长度 a,一次测量的结果不见得就等于 a,量了若干次,其算术平均值仍不见得等于 a,但当测量次数很多时,算术平均值接近于 a几乎是必然的,
11
算术平均值在相同条件下对某一个随机变量进行反复地试验,计划试验 n次,就试验方案而言,这样的试验将产生出相互独立且同样分布的 n个随机变量 x1,x2,...,xn,将这 n个随机变量加起来除以 n
称做这 n个随机变量的算术平均值,
.,
,,
5
,
2
1
54321
5
21
2
1
21
变量算术平均值仍然是随机当然等等例如记作
xxxxx
xx
x
xxx
++++
+
+++
n
i
i
n
n
nn
12
虽然 n个随机变量的算术平均值仍然是随机变量,人们相信当试验次数 n无限增大的时候,此随机变量将趋向于常数,即数学期望,这就是大数定律,
这就让人想到极限的概念,但是,传统的极限定义在这里遇到了麻烦,
传统的一个数列 {an}的极限是定义为,任给一个非常小的实数 e,存在着一个正数 N,当 n>N时,|an?
a|<e,
但概率不行,比如说虽然掷硬币试验次数增加时频率将趋于 0.5,但无论试验多少回,次次正面向上的机会都是存在的,
13
因此,人们就尝试其它的定义有关随机变量的极限的办法,比如说均方收敛,大家知道当一个随机变量的方差为 0时,这个随机变量实际上就是一个常数,那么,可以知道,一组相互独立同分布的期望为 m方差为 s2随机变量,它们的 n个变量的算术平均值的期望和方差为
nn
n
D
nn
D
n
n
E
nn
E
n
i
i
n
i
i
n
i
i
n
i
i
2
2
2
1
2
1
11
11
11
ss
xx
m
m
xx
14
可见当随着试验次数增加,n次试验的算术平均值的数学期望将保持不变,而其方差则随着
n的增加而减少,趋向于 0,因此可以认为算术平均值将趋向于一个常数,即随机变量的期望,
由此定义出,当一列随机变量的方差趋向于 0
的时候,如果它们的数学期望不变为 m,则称为这组随机变量均方收敛于数学期望 m,记作
mx
m?m?
n
n
i
i
n
nn
n
n
2
1
2
1
mil,
因此我们知道或
15
而切贝谢夫不等式又建立了方差与概率的关系,将不等式中的 x替换为?n得
2
2
1)|(|
)|(|
e
em?
e
em?
n
n
n
n
D
P
D
P
由此可见,如果 D?n趋向于 0,则?n落在其期望
m周围的任意一个小区间 (m?e,m+e)内的概率就趋向于 1,因此人们就将这样的情况称做依概率收敛,
16
定义 5.1 若存在常数 a,使对于任何 e>0,有
a
a
aP
n
P
n
n
n
n
x
x
ex
记作依概率收敛于则称随机变量序列
.}{
,1}|{|lim
17
定理 5.3 (辛钦大数定律 ) 如果 x1,x2,...是相互独立并且具有相同分布的随机变量,有 Exi=a
(i=1,2,...),则有
a
n n
P
n
i
i
1
1
x
这个定理说明我们应当相信只要反复试验,则一个随机变量的算术平均值将趋向于常数,通常就是数学期望,
18
定理 5.2 (贝努里大数定律 ) 在独立试验序列中,当试验次数 n无限增加时,事件 A发生的频率 x/n(x是 n次试验中事件 A发生的次数 )满足,
.10,
,)(
...
21
分布的满足参数为的次数发生次试验是指的第其中
+++
p
AipAP
p
nn
i
n
Pn
x
xxxx
这个定理说明在试验条件不变的情况下,重复进行多次试验时,任何事件 A发生的频率将趋向于概率,
19
中心极限定理中心极限定理是概率论的一个非常重要的定理,它原来叫中心极限定律,
对中心极限定理,只需要记住这样一个描述就行,
如果多个相互独立的随机变量相加,不管它们是离散的还是连续的或者是任何类型的,只要它们大小相差并不悬殊,则加起来以后得到的随机变量,就近似服从正态分布,
20
正态分布的概率密度的图形
xm m+sm?s
21
二项分布的随机变量可看作许多相互独立的
0-1分布的随机变量之和,下面是当 x~B(20,0.5)
时,x的概率分布图
0
0.05
0.1
0.15
0.2
0 5 10 15 20
P
22
普阿松分布相当于二项分布中 p很小 n很大的分布,因此,参数 l=np当很大时也相当于 n特别大,这个时候普阿松分布也近似服从正态分布,下面是 l=30时的普阿松概率分布图,
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48
P
23
在 c2(n)分布中,如果自由度 n很大,也可以认为是多个自由度为 1的相互独立的 c2(1)分布的随机变量的和,因此也近似服从正态分布,下面是 c2(60)的概率密度曲线,
x0 60 120
24
例 1 一个螺丝钉的重量是一个随机变量,期望值是一两,标准差是 0.1两,求一盒 (100个 )螺丝钉的重量超过 10.2斤的概率,
解 设一盒重量为 x,盒中第 i个螺丝钉的重量为
xi,(i=1,2,...,100),x1,...,x100相互独立,
022750.0)2(12
1
100
)102(
)1,100(~),(11001.0
),(100,,1.0,1
0
2
100
1
x
x
xx
xxxxx
PP
ND
EDE
i
iii
则近似两两则
25
例 2 对敌人的防御地段进行 100次轰炸,每次轰炸命中目标的炸弹数目是一个随机变量,其期望值为 2,方差为 1.69,求在 100次轰炸中有
180颗到 220炸弹命中目标的概率,
解 令第 i次轰炸命中目标的次数为 x,100次轰炸命中目标次数 x=x1+x2+...+x100,Ex=200,
Dx=169,近似有 x~N(200,132)
8 7 6 4 4.01)54.1(2
13
20
13
200
)20|200(|)220180(
0
x
xx
P
PP
26
定理 5.5 拉普拉斯定理,设 x~B(n,p)
npq
npa
npq
npb
abbaP
n
npq
npk
npq
e
npq
kP
n
npq
npk
00
0
2
)(
)()()(
:)2(
1
2
1
)(
:)1(
2
x
j
x
时当积分极限定理时当局部极限定理
27
例 3 10部机器独立工作,每部停机的概率为 0.2,
求 3部机器同时停机的概率,
解 10部机器中同时停机的数目 x~B(10,0.2)
2308.0)79.0(
265.1
1
265.1
23
265.1
11
)3(
:)2(
2013.08.02.0)3(:)1(
.265.1,2,2.0,10
0
00
733
10
j
jjx
x
npq
npk
npq
P
CP
npqnppn
算用局部极限定理近似计直接计算
28
例 4 设电站供电所有 10000盏电灯,夜晚每一盏灯开灯的概率都是 0.7,而假定开关时间彼此独立,估计夜晚同时开着的灯数在 6800与
7200之间的概率,
解 开着的灯数 x~B(10000,0.7)
99999.01)36.4(2
36.4
83.45
7000
)200|7000(|)72006800(
83.45,7000
0
x
xx
P
PP
npqnp
29
例 5 产品为废品的概率为 p=0.005,求 10000件产品中废品数不大于 70的概率,
解 10000件产品中的废品数 x~B(10000,0.005),
9977.0)84.2(
053.7
5070
)70(
053.7,50
0
0
xP
npqnp
30
例 6 每颗炮弹命中飞机的概率为 0.01,求 500发炮弹中命中 5发的概率,
解 命中飞机的炮弹数目 x~B(500,0.01)
1793.0
51
)5(
)3(
175467.0)5(
1,)2(
17635.099.001.0)5(
:)1(
225.2,5
0
5
49555
500
npq
np
npq
P
P
CP
npqnp
jx
x
理计算用拉普拉斯局部极限定可得查附表用普哇松公式计算用二项分布公式计算
31
请提问
32
作业 习题五第 112页第 1,2,4,6,9题
概率论与数理统计第 19讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
第五章 大数定律与中心极限定理
3
切贝谢夫不等式设随机变量 x有期望值 Ex及方差 Dx,则任给
e>0,有
2
2
1)|(|
)|(|
e
x
exx
e
x
exx
D
EP
D
EP
4
示意图
Ex Ex+eEx?e
j(x)
x
Dx/e2
5
证 如 x是离散型随机变量,那么
22
2
||
2
2
||||
)(
)(
)()|(|
e
x
e
x
e
x
xexx
ex
exex
D
p
Ex
p
Ex
pxPEP
k
k
k
Ex
k
k
Ex
k
Ex
k
k
kk
6
如果 x是连续型随机变量,x~j(x),则
22
2
||
2
2
||
)(
)(
)(
)(
)()|(|
e
x
j
e
x
j
e
x
jexx
ex
ex
D
dxx
Ex
dxx
Ex
dxxEP
Ex
Ex
+
7
例 1 设 x是掷一颗骰子所出现的点数,若给定
e=1,2,实际计算 P(|x?Ex|?e),并验证切贝谢夫不等式成立,
解 因 P(x=k)=1/6,(k=1,2,3,4,5,6)
)2|
2
7
(|
3
1
48
35
124
35
:2
)1|
2
7
(|
3
2
12
35
:1
12
35
12
147182
4
49
6
91
)(
6
91
6
362516941
,
2
7
6
654321
2
2
22
2
+++++
+++++
x
e
x
e
x
e
x
e
xxx
xx
P
D
P
D
EED
EE
8
例 2 设电站供电所有 10000盏电灯,夜晚每一盏灯开灯的概率都是 0.7,而假定开关时间彼此独立,估计夜晚同时开着的灯数在 6800与
7200之间的概率,
9
解 令 x为同时开灯的数目,则 x~B(10000,0.7)
95.0
200
21 00
1
)200|70 00(|}72 0068 00{
21 003.07.010 000
70 007.010 000
:
3.07.0)72 0068 00(
2
7199
6801
1 0 0 0 0
1 0 0 0 0
xx
x
x
x
PP
npqD
npE
CP
k
kkk
估计如果用切贝谢夫不等式可见只要有供应 7200盏灯的电力就够用,
10
大数定律的概念例 1 掷一颗骰子,出现 1点的概率是 1/6,在掷的次数比较少时,出现 1点的频率可能与 1/6相差很大,但是在掷的次数很多时,出现 1点的频率接近 1/6是必然的,
例 2 测量一个长度 a,一次测量的结果不见得就等于 a,量了若干次,其算术平均值仍不见得等于 a,但当测量次数很多时,算术平均值接近于 a几乎是必然的,
11
算术平均值在相同条件下对某一个随机变量进行反复地试验,计划试验 n次,就试验方案而言,这样的试验将产生出相互独立且同样分布的 n个随机变量 x1,x2,...,xn,将这 n个随机变量加起来除以 n
称做这 n个随机变量的算术平均值,
.,
,,
5
,
2
1
54321
5
21
2
1
21
变量算术平均值仍然是随机当然等等例如记作
xxxxx
xx
x
xxx
++++
+
+++
n
i
i
n
n
nn
12
虽然 n个随机变量的算术平均值仍然是随机变量,人们相信当试验次数 n无限增大的时候,此随机变量将趋向于常数,即数学期望,这就是大数定律,
这就让人想到极限的概念,但是,传统的极限定义在这里遇到了麻烦,
传统的一个数列 {an}的极限是定义为,任给一个非常小的实数 e,存在着一个正数 N,当 n>N时,|an?
a|<e,
但概率不行,比如说虽然掷硬币试验次数增加时频率将趋于 0.5,但无论试验多少回,次次正面向上的机会都是存在的,
13
因此,人们就尝试其它的定义有关随机变量的极限的办法,比如说均方收敛,大家知道当一个随机变量的方差为 0时,这个随机变量实际上就是一个常数,那么,可以知道,一组相互独立同分布的期望为 m方差为 s2随机变量,它们的 n个变量的算术平均值的期望和方差为
nn
n
D
nn
D
n
n
E
nn
E
n
i
i
n
i
i
n
i
i
n
i
i
2
2
2
1
2
1
11
11
11
ss
xx
m
m
xx
14
可见当随着试验次数增加,n次试验的算术平均值的数学期望将保持不变,而其方差则随着
n的增加而减少,趋向于 0,因此可以认为算术平均值将趋向于一个常数,即随机变量的期望,
由此定义出,当一列随机变量的方差趋向于 0
的时候,如果它们的数学期望不变为 m,则称为这组随机变量均方收敛于数学期望 m,记作
mx
m?m?
n
n
i
i
n
nn
n
n
2
1
2
1
mil,
因此我们知道或
15
而切贝谢夫不等式又建立了方差与概率的关系,将不等式中的 x替换为?n得
2
2
1)|(|
)|(|
e
em?
e
em?
n
n
n
n
D
P
D
P
由此可见,如果 D?n趋向于 0,则?n落在其期望
m周围的任意一个小区间 (m?e,m+e)内的概率就趋向于 1,因此人们就将这样的情况称做依概率收敛,
16
定义 5.1 若存在常数 a,使对于任何 e>0,有
a
a
aP
n
P
n
n
n
n
x
x
ex
记作依概率收敛于则称随机变量序列
.}{
,1}|{|lim
17
定理 5.3 (辛钦大数定律 ) 如果 x1,x2,...是相互独立并且具有相同分布的随机变量,有 Exi=a
(i=1,2,...),则有
a
n n
P
n
i
i
1
1
x
这个定理说明我们应当相信只要反复试验,则一个随机变量的算术平均值将趋向于常数,通常就是数学期望,
18
定理 5.2 (贝努里大数定律 ) 在独立试验序列中,当试验次数 n无限增加时,事件 A发生的频率 x/n(x是 n次试验中事件 A发生的次数 )满足,
.10,
,)(
...
21
分布的满足参数为的次数发生次试验是指的第其中
+++
p
AipAP
p
nn
i
n
Pn
x
xxxx
这个定理说明在试验条件不变的情况下,重复进行多次试验时,任何事件 A发生的频率将趋向于概率,
19
中心极限定理中心极限定理是概率论的一个非常重要的定理,它原来叫中心极限定律,
对中心极限定理,只需要记住这样一个描述就行,
如果多个相互独立的随机变量相加,不管它们是离散的还是连续的或者是任何类型的,只要它们大小相差并不悬殊,则加起来以后得到的随机变量,就近似服从正态分布,
20
正态分布的概率密度的图形
xm m+sm?s
21
二项分布的随机变量可看作许多相互独立的
0-1分布的随机变量之和,下面是当 x~B(20,0.5)
时,x的概率分布图
0
0.05
0.1
0.15
0.2
0 5 10 15 20
P
22
普阿松分布相当于二项分布中 p很小 n很大的分布,因此,参数 l=np当很大时也相当于 n特别大,这个时候普阿松分布也近似服从正态分布,下面是 l=30时的普阿松概率分布图,
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48
P
23
在 c2(n)分布中,如果自由度 n很大,也可以认为是多个自由度为 1的相互独立的 c2(1)分布的随机变量的和,因此也近似服从正态分布,下面是 c2(60)的概率密度曲线,
x0 60 120
24
例 1 一个螺丝钉的重量是一个随机变量,期望值是一两,标准差是 0.1两,求一盒 (100个 )螺丝钉的重量超过 10.2斤的概率,
解 设一盒重量为 x,盒中第 i个螺丝钉的重量为
xi,(i=1,2,...,100),x1,...,x100相互独立,
022750.0)2(12
1
100
)102(
)1,100(~),(11001.0
),(100,,1.0,1
0
2
100
1
x
x
xx
xxxxx
PP
ND
EDE
i
iii
则近似两两则
25
例 2 对敌人的防御地段进行 100次轰炸,每次轰炸命中目标的炸弹数目是一个随机变量,其期望值为 2,方差为 1.69,求在 100次轰炸中有
180颗到 220炸弹命中目标的概率,
解 令第 i次轰炸命中目标的次数为 x,100次轰炸命中目标次数 x=x1+x2+...+x100,Ex=200,
Dx=169,近似有 x~N(200,132)
8 7 6 4 4.01)54.1(2
13
20
13
200
)20|200(|)220180(
0
x
xx
P
PP
26
定理 5.5 拉普拉斯定理,设 x~B(n,p)
npq
npa
npq
npb
abbaP
n
npq
npk
npq
e
npq
kP
n
npq
npk
00
0
2
)(
)()()(
:)2(
1
2
1
)(
:)1(
2
x
j
x
时当积分极限定理时当局部极限定理
27
例 3 10部机器独立工作,每部停机的概率为 0.2,
求 3部机器同时停机的概率,
解 10部机器中同时停机的数目 x~B(10,0.2)
2308.0)79.0(
265.1
1
265.1
23
265.1
11
)3(
:)2(
2013.08.02.0)3(:)1(
.265.1,2,2.0,10
0
00
733
10
j
jjx
x
npq
npk
npq
P
CP
npqnppn
算用局部极限定理近似计直接计算
28
例 4 设电站供电所有 10000盏电灯,夜晚每一盏灯开灯的概率都是 0.7,而假定开关时间彼此独立,估计夜晚同时开着的灯数在 6800与
7200之间的概率,
解 开着的灯数 x~B(10000,0.7)
99999.01)36.4(2
36.4
83.45
7000
)200|7000(|)72006800(
83.45,7000
0
x
xx
P
PP
npqnp
29
例 5 产品为废品的概率为 p=0.005,求 10000件产品中废品数不大于 70的概率,
解 10000件产品中的废品数 x~B(10000,0.005),
9977.0)84.2(
053.7
5070
)70(
053.7,50
0
0
xP
npqnp
30
例 6 每颗炮弹命中飞机的概率为 0.01,求 500发炮弹中命中 5发的概率,
解 命中飞机的炮弹数目 x~B(500,0.01)
1793.0
51
)5(
)3(
175467.0)5(
1,)2(
17635.099.001.0)5(
:)1(
225.2,5
0
5
49555
500
npq
np
npq
P
P
CP
npqnp
jx
x
理计算用拉普拉斯局部极限定可得查附表用普哇松公式计算用二项分布公式计算
31
请提问
32
作业 习题五第 112页第 1,2,4,6,9题