第五章 大数定律与中心极限定理本章要解决的问题
1,为何能以某事件发生的频率作为该事件的 概率的估计?
2,为何能以样本均值作为总体期望的估计?
3,为何正态分布在概率论中占有极其重要的地位?4,大样本统计推断的理论基础是什么?
答复大数定律中心极限定理设非负 r.v,X 的期望 E( X )存在,
则对于任意实数? > 0,

)()( XEXP
证 仅证连续型 r.v.的情形
dxxfXP )()( dxxfx )(
0 )(1 dxxxf )( XE?
重要不等式
§ 5.1 大数定律设随机变量 X 的 k阶绝对原点矩 E( |X |k)
存在,则对于任意实数? > 0,
k
kXE
XP )|(|)|(|
推论 1
设随机变量 X 的方差 D ( X )存在,
则对于任意实数? > 0,
2
)()|)((|

XDXEXP
推论 2 —— 切贝雪夫 ( chebyshev)不等式或 2
)(1)|)((|

XDXEXP
当? 2? D(X)
无实际意义,
—— 马尔可夫 ( Markov ) 不等式例 1 设有一大批种子,其中良种占 1/6,试估计在任选的 6000 粒种子中,良种所占比例与 1/6 比较上下小于 1%的概率,
解 设 X 表示 6000 粒种子中的良种数,
X ~ B (6000,1/6 )
01.0616000XP 6
5000)(,1000)( XDXE
)60|1000(| XP 260
6
5000
1 7685.0
108
83
实际精确计算
1 0 6 09 4 0 XP 01.06
1
6000
XP
1059
941
6000
6000 6
5
6
1
k
kk
kC
959036.0?
用 Poisson 分布近似计算
1 0 6 09 4 0 XP

01.0
6
1
6000
XP
937934.0
10 59
94 1
10 00
!
1 0 0 0
k
k
k
e
取? = 1000
例 2设每次试验中,事件 A 发生的概率为
0.75,试用 Chebyshev 不等式估计,n 多大时,才能在 n 次独立重复试验中,事件 A 出现的频率在 0.74 ~ 0.76 之间的概率大于 0.90?
解 设 X 表示 n 次独立重复试验中事件 A
发生的次数,则
X ~ B(n,0.75)
nXDnXE 1 8 7 5.0)(,75.0)( 90.076.074.0?
nXP要使,求 n
即 90.076.074.0 nXnP
即 90.001.0|75.0| nnXP
由 Chebyshev 不等式,? = 0.01n,故
2
)01.0(
1 8 7 5.0101.0|75.0|
n
nnnXP
令 90.0
)01.0(
1 8 7 5.01
2 n
n
解得 18750?n
大数定律贝努里 ( Bernoulli) 大数定律设 nA 是 n 次独立重复试验中事件 A 发生的次数,p 是每次试验中 A 发生的概率,则
0 有 0li m?
pnnP An
或 1li m



pnnP A
n
证 引入 r.v,序列 {Xk}
发生次试验第发生次试验第
Ak
Ak
X k
,0
,1
设,)1( pXP k则 pqXDpXE kk )(,)(
nXXX,,,21?相互独立,
n
k
kA Xn
1
记,
1
1
n
k
kn XnY n
pqYDpYE
nn )(,)(
由 Chebyshev 不等式
p
n
nP A0
故 0li m


p
n
nP A
n
)( nn YEYP n
pq
2
1

)(1
k
n
k
k
XE
n
X
P
在概率的统计定义中,事件 A 发生的频率
,稳定于”事件 A 在一次试验中发生的概率是指:
n
nA
频率 与 p 有较大偏差

p
n
n A
是小概率事件,因而在 n 足够大时,可以用频率近似代替 p,这种稳定称为依概率稳定,
贝努里 (Bernoulli)大数定律的意义
nnA
定义
a 是一常数,
0lim

aYP n
n
(或 )1limaYP nn
则称 r.v,序列,,,,21 nYYY 依概率收敛于常数 a,记作
aY n Pn
故 pn
n
n
PA


,,,,21 nYYY 是一系列 r.v.设
0 有若在 Bernoulli 定理的证明过程中,Y n
是相互独立的服从 (0,1) 分布的 r.v,序列
{Xk} 的算术平均值,Y n 依概率收敛于其数学期望 p,
结果同样适用于服从其它分布的独立
r.v,序列
Chebyshev 大数定律
,,,,21 nXXX 相互独立,设 r.v,序列
(指任意给定 n > 1,相互独立 )
且具有相同的数学期望和方差
nXXX,,,21?
,2,1,)(,)( 2 kXDXE kk
则 0 有 01lim
1





n
k
kn XnP
或 1
1lim
1





n
k
kn XnP
定理的意义当 n 足够大时,算术平均值几乎是一常数,
具有相同数学期望和方差的独立 r.v.序列的算术平均值依概率收敛于数学期望,
算术均值数学期望 近似代替可被注 2,,,,21 nXXX 相互独立的条件可以去掉,代之以
01
1
2

n
n
k
kXDn
注 1,,,,21 nXXX 不一定有相同的数学期望与方差,可设
,2,1,)(,)( 22 kXDXE kkkk
有 0
11lim
11





n
k
k
n
k
kn nXnP
,,,,21 nXXX 相设 r.v.序列
,2,1,)( iXE kki?
则 0 有
0
1
lim
1



k
n
i
k
in XnP
互独立具有相同的分布,且记
k
n
i
k
i MXn
1
1
注 3
11 n
PM

),,,( 21 kMMMg n P ),,,( 21 kg
则则
22 n
PM
kn
P
kM
),,,( 21 kxxxg?连续,若作业 P185 习题五
3 4
电视台需作节目 A 收视率的调查,每天在播电视的同时,随机地向当地居民打电话询问是否在看电视,若在看电视,再问是否在看节目 A,设回答第 12周 问 题看电视的居民户数为 n,若要保证以 95%的概率使调查误差在 10%之内,n 应取多大?
每晚节目 A 播出一小时,调查需同时进行,设每小时每人能调查 20户,每户居民每晚看电视的概率为 70%,电视台需安排多少人作调查,
又,若使调查误差在 1 %
之内,n 应取多大?