第五章 大数定律与中心极限定理
本章要解决的问题
1,为何能以某事件发生的频率
作为该事件的 概率的估计?
2,为何能以样本均值作为总体
期望的估计?
3,为何正态分布在概率论中占
有极其重要的地位?4,大样本统计推断的理论基础
是什么?
答复
大数
定律
中心极
限定理
设非负 r.v,X 的期望 E( X )存在,
则对于任意实数 ? > 0,
??
)()( XEXP ??
证 仅证连续型 r.v.的情形 ? ??
?? ?? dxxfXP )()( ? ??? ? ? dxxfx )(
? ??? 0 )(1 dxxxf? ? )( XE?
重要不等式
§ 5.1 大数定律
设随机变量 X 的 k阶绝对原点矩 E( |X |k)
存在,则对于任意实数 ? > 0,
k
kXE
XP ?? )|(|)|(| ??
推论 1
设随机变量 X 的方差 D ( X )存在,
则对于任意实数 ? > 0,
2
)()|)((|
??
XDXEXP ???
推论 2 —— 切贝雪夫 ( chebyshev)不等式
或 2
)(1)|)((|
??
XDXEXP ????
当 ? 2? D(X)
无实际意义,
—— 马尔可夫 ( Markov ) 不等式
例 1 设有一大批种子,其中良种占 1/6,试
估计在任选的 6000 粒种子中,良种所占比
例与 1/6 比较上下小于 1%的概率,
解 设 X 表示 6000 粒种子中的良种数,
X ~ B (6000,1/6 )
?????? ?? 01.0616000XP 6
5000)(,1000)( ?? XDXE
)60|1000(| ??? XP 260
6
5000
1 ?? 7685.0
108
83 ??
实际精确计算
? ?1 0 6 09 4 0 ??? XP ?????? ?? 01.06
1
6000
XP
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?? 1059
941
6000
6000 6
5
6
1
k
kk
kC
959036.0?
用 Poisson 分布近似计算
? ?1 0 6 09 4 0 ??? XP ??
??
?
? ?? 01.0
6
1
6000
XP
937934.0??
?
?
?
10 59
94 1
10 00
!
1 0 0 0
k
k
k
e
取 ? = 1000
例 2设每次试验中,事件 A 发生的概率为
0.75,试用 Chebyshev 不等式估计,n 多大
时,才能在 n 次独立重复试验中,事件 A 出
现的频率在 0.74 ~ 0.76 之间的概率大于 0.90?
解 设 X 表示 n 次独立重复试验中事件 A
发生的次数,则
X ~ B(n,0.75)
nXDnXE 1 8 7 5.0)(,75.0)( ?? 90.076.074.0 ?
?????? ?? nXP要使,求 n
即 ? ? 90.076.074.0 ??? nXnP
即 ? ? 90.001.0|75.0| ??? nnXP
由 Chebyshev 不等式, ? = 0.01n,故
? ? 2
)01.0(
1 8 7 5.0101.0|75.0|
n
nnnXP ????
令 90.0
)01.0(
1 8 7 5.01
2 ?? n
n
解得 18750?n
大数定律
贝努里 ( Bernoulli) 大数定律
设 nA 是 n 次独立重复试验中事件 A 发生
的次数,p 是每次试验中 A 发生的概率,则
0??? 有 0li m ?
?????? ???? ?pnnP An
或 1li m ??
?
??
?
? ??
??
?pnnP A
n
证 引入 r.v,序列 {Xk}
?
?
?
?
发生次试验第
发生次试验第
Ak
Ak
X k
,0
,1
设,)1( pXP k ??则 pqXDpXE kk ?? )(,)(
nXXX,,,21 ?相互独立,
?
?
?
n
k
kA Xn
1
记,
1
1
?
?
?
n
k
kn XnY n
pqYDpYE
nn ?? )(,)(
由 Chebyshev 不等式
?
?
?
?
?
? ??? ?p
n
nP A0
故 0li m ???
?
?
?
? ??
??
?p
n
nP A
n
? ????? )( nn YEYP n
pq??
2
1
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
? ?)(1
k
n
k
k
XE
n
X
P
在概率的统计定义中,事件 A 发生的频率
,稳定于”事件 A 在一次试验中发生
的概率是指:
n
nA
频率 与 p 有较大偏差 ??
??
?
? ?? ?p
n
n A
是
小概率事件,因而在 n 足够大时,可以用频
率近似代替 p, 这种稳定称为依概率稳定,
贝努里 (Bernoulli)大数定律的意义
nnA
定义
a 是一常数,
? ? 0lim ???
??
?aYP n
n
(或 ? ? )1lim ????? ?aYP nn
则称 r.v,序列 ??,,,,21 nYYY 依概率
收敛于常数 a,记作
aY n Pn ???? ??
故 pn
n
n
PA
??
?? ??
??,,,,21 nYYY 是一系列 r.v.设
0??? 有若
在 Bernoulli 定理的证明过程中,Y n
是相互独立的服从 (0,1) 分布的 r.v,序列
{Xk} 的算术平均值,Y n 依概率收敛于
其数学期望 p,
结果同样适用于服从其它分布的独立
r.v,序列
Chebyshev 大数定律
??,,,,21 nXXX 相互独立,设 r.v,序列
(指任意给定 n > 1,相互独立 )
且具有相同的数学期望和方差
nXXX,,,21 ?
?,2,1,)(,)( 2 ??? kXDXE kk ??
则 0??? 有 01lim
1
??
?
??
?
? ???
???
??
n
k
kn XnP
或 1
1lim
1
??
?
??
?
? ???
???
??
n
k
kn XnP
定理的意义
当 n 足够大时,算术平均值几乎是一常数,
具有相同数学期望和方差的独立 r.v.序列的
算术平均值依概率收敛于数学期望,
算术
均值
数学
期望 近似代替可被
注 2 ??,,,,21 nXXX 相互独立的条件可以
去掉,代之以
? 01
1
2
??
?
?????? ? n
n
k
kXDn
注 1 ??,,,,21 nXXX 不一定有相同的数学
期望与方差,可设
?,2,1,)(,)( 22 ???? kXDXE kkkk ???
有 0
11lim
11
??
?
??
?
? ?? ??
????
??
n
k
k
n
k
kn nXnP
??,,,,21 nXXX 相设 r.v.序列
?,2,1,)( ?? iXE kki ?
则 0??? 有
0
1
lim
1
??
?
?
?
?
? ???
???
?? k
n
i
k
in XnP
互独立具有相同的分布,且
记
k
n
i
k
i MXn ??
? 1
1
注 3
11 ????? ?? n
PM
???????
),,,( 21 kMMMg ????? ?? n P ),,,( 21 kg ??? ?
则
则
22 ????? ?? n
PM
kn
P
kM ????? ??
),,,( 21 kxxxg ?连续,若
作业 P185 习题五
3 4
电视台需作节目 A 收视率的调查,
每天在播电视的同时,随机地向当地居
民打电话询问是否在看电视, 若在看电
视,再问是否在看节目 A,设回答看电视
的居民户数为 n,若要保证以 95%的概
率使调查误差在 10%之内,n 应取多大?
第十一周 问 题
若使调查误差在 1%之内,n 又取多大?
每晚节目 A 播出一小时,调
查需同时进行,设每小时每人能
调查 20户,每户居民每晚看电视
的概率为 70%,电视台需安排多
少人作调查,
本章要解决的问题
1,为何能以某事件发生的频率
作为该事件的 概率的估计?
2,为何能以样本均值作为总体
期望的估计?
3,为何正态分布在概率论中占
有极其重要的地位?4,大样本统计推断的理论基础
是什么?
答复
大数
定律
中心极
限定理
设非负 r.v,X 的期望 E( X )存在,
则对于任意实数 ? > 0,
??
)()( XEXP ??
证 仅证连续型 r.v.的情形 ? ??
?? ?? dxxfXP )()( ? ??? ? ? dxxfx )(
? ??? 0 )(1 dxxxf? ? )( XE?
重要不等式
§ 5.1 大数定律
设随机变量 X 的 k阶绝对原点矩 E( |X |k)
存在,则对于任意实数 ? > 0,
k
kXE
XP ?? )|(|)|(| ??
推论 1
设随机变量 X 的方差 D ( X )存在,
则对于任意实数 ? > 0,
2
)()|)((|
??
XDXEXP ???
推论 2 —— 切贝雪夫 ( chebyshev)不等式
或 2
)(1)|)((|
??
XDXEXP ????
当 ? 2? D(X)
无实际意义,
—— 马尔可夫 ( Markov ) 不等式
例 1 设有一大批种子,其中良种占 1/6,试
估计在任选的 6000 粒种子中,良种所占比
例与 1/6 比较上下小于 1%的概率,
解 设 X 表示 6000 粒种子中的良种数,
X ~ B (6000,1/6 )
?????? ?? 01.0616000XP 6
5000)(,1000)( ?? XDXE
)60|1000(| ??? XP 260
6
5000
1 ?? 7685.0
108
83 ??
实际精确计算
? ?1 0 6 09 4 0 ??? XP ?????? ?? 01.06
1
6000
XP
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?? 1059
941
6000
6000 6
5
6
1
k
kk
kC
959036.0?
用 Poisson 分布近似计算
? ?1 0 6 09 4 0 ??? XP ??
??
?
? ?? 01.0
6
1
6000
XP
937934.0??
?
?
?
10 59
94 1
10 00
!
1 0 0 0
k
k
k
e
取 ? = 1000
例 2设每次试验中,事件 A 发生的概率为
0.75,试用 Chebyshev 不等式估计,n 多大
时,才能在 n 次独立重复试验中,事件 A 出
现的频率在 0.74 ~ 0.76 之间的概率大于 0.90?
解 设 X 表示 n 次独立重复试验中事件 A
发生的次数,则
X ~ B(n,0.75)
nXDnXE 1 8 7 5.0)(,75.0)( ?? 90.076.074.0 ?
?????? ?? nXP要使,求 n
即 ? ? 90.076.074.0 ??? nXnP
即 ? ? 90.001.0|75.0| ??? nnXP
由 Chebyshev 不等式, ? = 0.01n,故
? ? 2
)01.0(
1 8 7 5.0101.0|75.0|
n
nnnXP ????
令 90.0
)01.0(
1 8 7 5.01
2 ?? n
n
解得 18750?n
大数定律
贝努里 ( Bernoulli) 大数定律
设 nA 是 n 次独立重复试验中事件 A 发生
的次数,p 是每次试验中 A 发生的概率,则
0??? 有 0li m ?
?????? ???? ?pnnP An
或 1li m ??
?
??
?
? ??
??
?pnnP A
n
证 引入 r.v,序列 {Xk}
?
?
?
?
发生次试验第
发生次试验第
Ak
Ak
X k
,0
,1
设,)1( pXP k ??则 pqXDpXE kk ?? )(,)(
nXXX,,,21 ?相互独立,
?
?
?
n
k
kA Xn
1
记,
1
1
?
?
?
n
k
kn XnY n
pqYDpYE
nn ?? )(,)(
由 Chebyshev 不等式
?
?
?
?
?
? ??? ?p
n
nP A0
故 0li m ???
?
?
?
? ??
??
?p
n
nP A
n
? ????? )( nn YEYP n
pq??
2
1
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
? ?)(1
k
n
k
k
XE
n
X
P
在概率的统计定义中,事件 A 发生的频率
,稳定于”事件 A 在一次试验中发生
的概率是指:
n
nA
频率 与 p 有较大偏差 ??
??
?
? ?? ?p
n
n A
是
小概率事件,因而在 n 足够大时,可以用频
率近似代替 p, 这种稳定称为依概率稳定,
贝努里 (Bernoulli)大数定律的意义
nnA
定义
a 是一常数,
? ? 0lim ???
??
?aYP n
n
(或 ? ? )1lim ????? ?aYP nn
则称 r.v,序列 ??,,,,21 nYYY 依概率
收敛于常数 a,记作
aY n Pn ???? ??
故 pn
n
n
PA
??
?? ??
??,,,,21 nYYY 是一系列 r.v.设
0??? 有若
在 Bernoulli 定理的证明过程中,Y n
是相互独立的服从 (0,1) 分布的 r.v,序列
{Xk} 的算术平均值,Y n 依概率收敛于
其数学期望 p,
结果同样适用于服从其它分布的独立
r.v,序列
Chebyshev 大数定律
??,,,,21 nXXX 相互独立,设 r.v,序列
(指任意给定 n > 1,相互独立 )
且具有相同的数学期望和方差
nXXX,,,21 ?
?,2,1,)(,)( 2 ??? kXDXE kk ??
则 0??? 有 01lim
1
??
?
??
?
? ???
???
??
n
k
kn XnP
或 1
1lim
1
??
?
??
?
? ???
???
??
n
k
kn XnP
定理的意义
当 n 足够大时,算术平均值几乎是一常数,
具有相同数学期望和方差的独立 r.v.序列的
算术平均值依概率收敛于数学期望,
算术
均值
数学
期望 近似代替可被
注 2 ??,,,,21 nXXX 相互独立的条件可以
去掉,代之以
? 01
1
2
??
?
?????? ? n
n
k
kXDn
注 1 ??,,,,21 nXXX 不一定有相同的数学
期望与方差,可设
?,2,1,)(,)( 22 ???? kXDXE kkkk ???
有 0
11lim
11
??
?
??
?
? ?? ??
????
??
n
k
k
n
k
kn nXnP
??,,,,21 nXXX 相设 r.v.序列
?,2,1,)( ?? iXE kki ?
则 0??? 有
0
1
lim
1
??
?
?
?
?
? ???
???
?? k
n
i
k
in XnP
互独立具有相同的分布,且
记
k
n
i
k
i MXn ??
? 1
1
注 3
11 ????? ?? n
PM
???????
),,,( 21 kMMMg ????? ?? n P ),,,( 21 kg ??? ?
则
则
22 ????? ?? n
PM
kn
P
kM ????? ??
),,,( 21 kxxxg ?连续,若
作业 P185 习题五
3 4
电视台需作节目 A 收视率的调查,
每天在播电视的同时,随机地向当地居
民打电话询问是否在看电视, 若在看电
视,再问是否在看节目 A,设回答看电视
的居民户数为 n,若要保证以 95%的概
率使调查误差在 10%之内,n 应取多大?
第十一周 问 题
若使调查误差在 1%之内,n 又取多大?
每晚节目 A 播出一小时,调
查需同时进行,设每小时每人能
调查 20户,每户居民每晚看电视
的概率为 70%,电视台需安排多
少人作调查,