第五章第二节
中心极限定理
中心极限定理的客观背景
在实际问题中,常常需要考虑许多随机
因素所产生总影响,
例如:炮弹射击的落点与目标的偏差,就受
着许多随机因素的影响,
空气阻力所产生的误差,
对我们来说重要的是这些随机因素的总影响,
如瞄准时的误差,
炮弹或炮身结构所引起的误差等等,
观察表明,如果一个量是由大量相互独
立的随机因素的影响所造成,而每一个别因
素在总影响中所起的作用不大, 则这种量一
般都服从或近似服从正态分布,
自从高斯指出测量误差服从正
态分布之后,人们发现,正态分布
在自然界中极为常见,
现在我们就来研究独立随机变量之和所
特有的规律性问题,
当 n无限增大时,这个和的极限分布是
什么呢?
在什么条件下极限分布会是正态的呢?
由于无穷个随机变量之和可能趋于 ∞,
故我们不研究 n个随机变量之和本身而考虑
它的标准化的随机变量
?
? ?
?
? ?
?
?
n
k
k
n
k
n
k
kk
n
XV ar
XEX
Z
1
1 1
)(
)(
的分布函数的极限,
?
? ?
?
? ?
?
?
n
k
k
n
k
n
k
kk
n
XV ar
XEX
Z
1
1 1
)(
)(
的分布函数的极限,
可以证明,满足一定的条件,上述极
限分布是标准正态分布,
考虑
中心极限定理
这就是下面要介
绍的
在概率论中,习惯于把和的分布
收敛于正态分布这一类定理都叫做中心
极限定理,
我们只讨论几种简单情形,
下面给出的独立同分布随机变量序列
的中心极限定理,也称 列维一林德伯格
( Levy- Lindberg)定理,
}{lim 1 x
n
nX
P
n
i
i
n
?
??
?
?? ?
?
定理 1(独立同分布下的中心极限定理)
? ??
x
-
2t- dte
2
1 2
?
它表明,当 n充分大时,n个具有期望和方差
的独立同分布的 r.v之和近似服从正态分布,
设 X1,X2,… 是独立同分布的随机
变量序列,且 E(Xi)= Var(Xi)=,
i=1,2,…,则
2??
定理 (棣莫佛-拉普拉斯定理)
}
)1(
{lim x
pnp
npYP n
n
?
?
?
??
设随机变量 服从参数 n,p(0<p<1)的
二项分布,则对任意 x,有
nY
dte
x
t
? ??
?
? 2
2
2
1
?
定理表明,当 n很大,0<p<1是一个定值
时(或者说,np(1-p)也不太小时),二项 变
量 的 分布近似正态分布 N(np,np(1-p)).
nY
请看演示
中心极限定理的直观演示
下面我们举例说明中心极限定理的应用
从演示不难看到中心极限定理的客观背景
例,20个 0-1分布的和的分布
X1 ~f(x) X1 +X2~g(x)
X1 +X2+X3~ h(x)
几个 (0,1)上均匀分布的和的分布
0 1 2 3 x
f
g h
设一批产品的强度服从期望为 14,方差
为 4的分布,每箱中装有这种产品 100件,
求,(1).每箱产品的平均强度超过 14.5的
概率是多少,
(2).每箱产品的平均强度超过期望 14
的概率是多少,
n=100,设 Xi是第 i件产品的强度,
E(Xi)=14,Var(Xi)=4 i=1,2,?,100.
每箱产品的平均强度为
解,
例 1
.XXn1
n
1i
i 记做?
?
根据定理 5.2.1
2.0
14X
1 0 0
2
14X
n
X ??
?
?? 即即 近似 ~N(0,1)
于是
0062.09930.01)5.2(1
}5.2
2.0
14X
{P1}5.2
2.0
14X
{P
}
2.0
145.14
2.0
14X
{P}5.14X{P).1(
??????
?
?
???
?
?
?
?
?
??
5.05.01)0(1}0
2.0
14X
{P1
}
2.0
1414
2.0
14X
{P}14X{P).2(
???????
?
??
?
?
?
??
计算机在进行数字计算时遵从四舍五入
原则,
为使我们此题简单考虑,我们假定对小数
点后面的第一位进行四舍五入运算,
则误差 X这个随机变量可以认为服从
[-0.5,0.5]上的均匀分布,
现若在一项计算中一共进行了 100次数字
计算,
例 2
]203,203[ ?
≈0.0866
求,平均误差落在区间
上的概率
解, n=100,设 Xi是第 i次运算的误差,
∵ 误差服从 [-0.5,0.5]上的均匀分布
∴ E(Xi)=(-0.5+0.5)/2=0
Var(Xi)=[0.5-(-0.5)]2/12=1/12
i=1,2,?,100.
∴ 平均误差为
.XXn1
n
1i
i 记做?
?
根据中心极限定理
X320
10 0
12
1
X
n
X 即即
?
??
近似 ~N(0,1)
于是
9973.0)3()3(
}320
20
3
X320320
20
3
{P
}
20
3
X
20
3
{P
??????
??????
???
某单位有 200部电话分机,每部电话约有
5%的时间要使用外线通话,设每部电话是否使
用外线通话是相互独立的,
求,该单位总机至少需要安装多少条外线
才能以 90%以上的概率保证每部电话需要使用
外线时可以打通?
解,
例 3
∴ Xi ~ b(1,p).X1,X2,?,X200相互独立,
设该单位总机安装 k条外线,则,
?
?
?
?
.i0
.i1
X i
部电话未使用外线通话第
部电话使用外线通话第
令
P{每部电话需要使用外线时可以打通 }
=P{使用外线的电话数目 ≤ k}
=P{X1+X2+?+X200 ≤k }
)
5.9
10
()
5.9
10k
(
}
5.9
10k
5.9
10X
5.9
10
{P
}
)p1(np
npk
)p1(np
npX
)p1(np
np0
{P
}kX0{P
n
1i
i
n
1i
i
200
1i
i
?
??
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
求最小的 k,使
P{每部电话需要使用外线时可以打通 }≥90%
?求最小的 k,使 P{X1+X2+?+X200 ≤k }≥90%
?求最小的 k,使
9.0)
5.9
10()
5.9
10k( ??????
95.13k282.1
5.9
10k
9.0)
5.9
10k
(0)
5.9
10
(
???
?
?
?
???
?
?
查附表二
求解?
∴ 该单位总机至少需要安装 14条外线,
某市保险公司开办一年人身保险业务,
被保险人每年需交付保险费 160元, 若一年内
发生重大人身事故,其本人或家属可获 2万元赔
金, 己知该市人员一年内发生重大人身事故的
概率为 0.005.现有 5000人参加此项保险,
求,保险公司一年内从此项业务所得到的
总收益在 20万元到 40万元之间的概率,
解,
例 4
5 0 0 0,,2,1i
.i0
.i1
X
i
??
?
?
?
?
事故个被保险人未发生重大第
故个被保险人发生重大事第
令
∴ Xi ~ b(1,p),P=0.005
X1,X2,?,X200相互独立,则,
P{20万元 ≤ 总收益 ≤ 40万元 }
=P{20万元 ≤ 0.016万元保险费 ?参保人数 -2万
元赔金 ?一年内发生重大人身事故的人数 ≤ 40
万元 }
=P{20≤ 0.016?5000-
2?(X1+X2+?+X5000)≤ 40}
}30X20{P
}40X260{P}40X28020{P
5000
1i
i
5000
1i
i
5000
1i
i
???
??????????
?
??
?
??
∵ np=25 np(1-p)=25?0.995
6826.01)1(2)1()1(
}
995.025
5
995.025
25X
995.025
5
{P
}
)p1(np
np3
)p1(np
npX
)p1(np
np20
{P
}30X20{P
n
1i
i
n
1i
i
5000
1i
i
?????????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
∴ 总收益在 20万元到 40万元之间的概率为
0.6826.
不知大家是否还记得街头赌博的演示?
现在我们用 中心极限定理 来揭穿这个
赌博中的奥秘,
请看演示:
高尔顿钉板试验的理论解释
街头赌博 再看演示请点击
如图,钉板有 n=16层,可以
求出标准差,416 ???
n次碰钉后小球的位置
Yn近似服从正态分布 N(0,n),
E(Yn)=0,Var(Yn)=n,
?
左右 8颗钉子以内的概率近似为 95.6%,
根据正态分布的查表计算
知道,落在 2 以内即中线
说,落在这以外的概率只有 4%左右,
即是
如图钉板有 n=16层,可以
求出标准差,416 ???
?
根据正态分布的查表计算
知道,落在 2 以内即中线
左右 8颗钉子以内的概率
近似为 95.6%,即是说,落
在这以外的概率只有 4%左
右,
现在你知道为什么摆摊的人敢于
在上面放那么值钱的东西了吧 !
这一讲我们介绍了中心极限定理
在后面的课程中,我们还将经常用到中心
极限定理,
中心极限定理是概率论中最著名的结果
之一,它不仅提供了计算独立随机变量之和
的近似概率的简单方法,而且有助于解释为
什么很多自然群体的经验频率呈现出钟形曲
线这一值得注意的事实,
中心极限定理
中心极限定理的客观背景
在实际问题中,常常需要考虑许多随机
因素所产生总影响,
例如:炮弹射击的落点与目标的偏差,就受
着许多随机因素的影响,
空气阻力所产生的误差,
对我们来说重要的是这些随机因素的总影响,
如瞄准时的误差,
炮弹或炮身结构所引起的误差等等,
观察表明,如果一个量是由大量相互独
立的随机因素的影响所造成,而每一个别因
素在总影响中所起的作用不大, 则这种量一
般都服从或近似服从正态分布,
自从高斯指出测量误差服从正
态分布之后,人们发现,正态分布
在自然界中极为常见,
现在我们就来研究独立随机变量之和所
特有的规律性问题,
当 n无限增大时,这个和的极限分布是
什么呢?
在什么条件下极限分布会是正态的呢?
由于无穷个随机变量之和可能趋于 ∞,
故我们不研究 n个随机变量之和本身而考虑
它的标准化的随机变量
?
? ?
?
? ?
?
?
n
k
k
n
k
n
k
kk
n
XV ar
XEX
Z
1
1 1
)(
)(
的分布函数的极限,
?
? ?
?
? ?
?
?
n
k
k
n
k
n
k
kk
n
XV ar
XEX
Z
1
1 1
)(
)(
的分布函数的极限,
可以证明,满足一定的条件,上述极
限分布是标准正态分布,
考虑
中心极限定理
这就是下面要介
绍的
在概率论中,习惯于把和的分布
收敛于正态分布这一类定理都叫做中心
极限定理,
我们只讨论几种简单情形,
下面给出的独立同分布随机变量序列
的中心极限定理,也称 列维一林德伯格
( Levy- Lindberg)定理,
}{lim 1 x
n
nX
P
n
i
i
n
?
??
?
?? ?
?
定理 1(独立同分布下的中心极限定理)
? ??
x
-
2t- dte
2
1 2
?
它表明,当 n充分大时,n个具有期望和方差
的独立同分布的 r.v之和近似服从正态分布,
设 X1,X2,… 是独立同分布的随机
变量序列,且 E(Xi)= Var(Xi)=,
i=1,2,…,则
2??
定理 (棣莫佛-拉普拉斯定理)
}
)1(
{lim x
pnp
npYP n
n
?
?
?
??
设随机变量 服从参数 n,p(0<p<1)的
二项分布,则对任意 x,有
nY
dte
x
t
? ??
?
? 2
2
2
1
?
定理表明,当 n很大,0<p<1是一个定值
时(或者说,np(1-p)也不太小时),二项 变
量 的 分布近似正态分布 N(np,np(1-p)).
nY
请看演示
中心极限定理的直观演示
下面我们举例说明中心极限定理的应用
从演示不难看到中心极限定理的客观背景
例,20个 0-1分布的和的分布
X1 ~f(x) X1 +X2~g(x)
X1 +X2+X3~ h(x)
几个 (0,1)上均匀分布的和的分布
0 1 2 3 x
f
g h
设一批产品的强度服从期望为 14,方差
为 4的分布,每箱中装有这种产品 100件,
求,(1).每箱产品的平均强度超过 14.5的
概率是多少,
(2).每箱产品的平均强度超过期望 14
的概率是多少,
n=100,设 Xi是第 i件产品的强度,
E(Xi)=14,Var(Xi)=4 i=1,2,?,100.
每箱产品的平均强度为
解,
例 1
.XXn1
n
1i
i 记做?
?
根据定理 5.2.1
2.0
14X
1 0 0
2
14X
n
X ??
?
?? 即即 近似 ~N(0,1)
于是
0062.09930.01)5.2(1
}5.2
2.0
14X
{P1}5.2
2.0
14X
{P
}
2.0
145.14
2.0
14X
{P}5.14X{P).1(
??????
?
?
???
?
?
?
?
?
??
5.05.01)0(1}0
2.0
14X
{P1
}
2.0
1414
2.0
14X
{P}14X{P).2(
???????
?
??
?
?
?
??
计算机在进行数字计算时遵从四舍五入
原则,
为使我们此题简单考虑,我们假定对小数
点后面的第一位进行四舍五入运算,
则误差 X这个随机变量可以认为服从
[-0.5,0.5]上的均匀分布,
现若在一项计算中一共进行了 100次数字
计算,
例 2
]203,203[ ?
≈0.0866
求,平均误差落在区间
上的概率
解, n=100,设 Xi是第 i次运算的误差,
∵ 误差服从 [-0.5,0.5]上的均匀分布
∴ E(Xi)=(-0.5+0.5)/2=0
Var(Xi)=[0.5-(-0.5)]2/12=1/12
i=1,2,?,100.
∴ 平均误差为
.XXn1
n
1i
i 记做?
?
根据中心极限定理
X320
10 0
12
1
X
n
X 即即
?
??
近似 ~N(0,1)
于是
9973.0)3()3(
}320
20
3
X320320
20
3
{P
}
20
3
X
20
3
{P
??????
??????
???
某单位有 200部电话分机,每部电话约有
5%的时间要使用外线通话,设每部电话是否使
用外线通话是相互独立的,
求,该单位总机至少需要安装多少条外线
才能以 90%以上的概率保证每部电话需要使用
外线时可以打通?
解,
例 3
∴ Xi ~ b(1,p).X1,X2,?,X200相互独立,
设该单位总机安装 k条外线,则,
?
?
?
?
.i0
.i1
X i
部电话未使用外线通话第
部电话使用外线通话第
令
P{每部电话需要使用外线时可以打通 }
=P{使用外线的电话数目 ≤ k}
=P{X1+X2+?+X200 ≤k }
)
5.9
10
()
5.9
10k
(
}
5.9
10k
5.9
10X
5.9
10
{P
}
)p1(np
npk
)p1(np
npX
)p1(np
np0
{P
}kX0{P
n
1i
i
n
1i
i
200
1i
i
?
??
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
求最小的 k,使
P{每部电话需要使用外线时可以打通 }≥90%
?求最小的 k,使 P{X1+X2+?+X200 ≤k }≥90%
?求最小的 k,使
9.0)
5.9
10()
5.9
10k( ??????
95.13k282.1
5.9
10k
9.0)
5.9
10k
(0)
5.9
10
(
???
?
?
?
???
?
?
查附表二
求解?
∴ 该单位总机至少需要安装 14条外线,
某市保险公司开办一年人身保险业务,
被保险人每年需交付保险费 160元, 若一年内
发生重大人身事故,其本人或家属可获 2万元赔
金, 己知该市人员一年内发生重大人身事故的
概率为 0.005.现有 5000人参加此项保险,
求,保险公司一年内从此项业务所得到的
总收益在 20万元到 40万元之间的概率,
解,
例 4
5 0 0 0,,2,1i
.i0
.i1
X
i
??
?
?
?
?
事故个被保险人未发生重大第
故个被保险人发生重大事第
令
∴ Xi ~ b(1,p),P=0.005
X1,X2,?,X200相互独立,则,
P{20万元 ≤ 总收益 ≤ 40万元 }
=P{20万元 ≤ 0.016万元保险费 ?参保人数 -2万
元赔金 ?一年内发生重大人身事故的人数 ≤ 40
万元 }
=P{20≤ 0.016?5000-
2?(X1+X2+?+X5000)≤ 40}
}30X20{P
}40X260{P}40X28020{P
5000
1i
i
5000
1i
i
5000
1i
i
???
??????????
?
??
?
??
∵ np=25 np(1-p)=25?0.995
6826.01)1(2)1()1(
}
995.025
5
995.025
25X
995.025
5
{P
}
)p1(np
np3
)p1(np
npX
)p1(np
np20
{P
}30X20{P
n
1i
i
n
1i
i
5000
1i
i
?????????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
∴ 总收益在 20万元到 40万元之间的概率为
0.6826.
不知大家是否还记得街头赌博的演示?
现在我们用 中心极限定理 来揭穿这个
赌博中的奥秘,
请看演示:
高尔顿钉板试验的理论解释
街头赌博 再看演示请点击
如图,钉板有 n=16层,可以
求出标准差,416 ???
n次碰钉后小球的位置
Yn近似服从正态分布 N(0,n),
E(Yn)=0,Var(Yn)=n,
?
左右 8颗钉子以内的概率近似为 95.6%,
根据正态分布的查表计算
知道,落在 2 以内即中线
说,落在这以外的概率只有 4%左右,
即是
如图钉板有 n=16层,可以
求出标准差,416 ???
?
根据正态分布的查表计算
知道,落在 2 以内即中线
左右 8颗钉子以内的概率
近似为 95.6%,即是说,落
在这以外的概率只有 4%左
右,
现在你知道为什么摆摊的人敢于
在上面放那么值钱的东西了吧 !
这一讲我们介绍了中心极限定理
在后面的课程中,我们还将经常用到中心
极限定理,
中心极限定理是概率论中最著名的结果
之一,它不仅提供了计算独立随机变量之和
的近似概率的简单方法,而且有助于解释为
什么很多自然群体的经验频率呈现出钟形曲
线这一值得注意的事实,