1
概率论与数理统计第 16讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
超几何分布
3
例 1 某班有学生 23名,其中有 5名女同学,今从班上任选 4名学生去参观展览,被选到的女同学数 x是一个随机变量,求 x的分布,
解 x可取 0,1,2,3,4,这 5个值,相应概率为
)4,3,2,1,0()(
4
20
4
155
k
C
CC
kP
kk
x
4
概率分布表为
x 0 1 2 3 4
P 0.2817 0.4696 0.2167 0.0310 0.0310
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0 1 2 3 4
P
概率分布图为,
5
定义 设 N个元素分为两类,有 N1个元素属于第一类,N2个元素属于第二类 (N1+N2=N),从中按不重复抽样取 n个,令 x表示这 n个中第一 (或二 )
类元素的个数,则 x的分布称为超几何分布,其概率函数为,
0,,
),,1,0()(
21


r
n
n
N
mn
N
m
N
Crn
nm
C
CC
mP
则如果规定
x
6
根据概率分布的性质,必有
n
NN
n
m
mn
N
m
N
n
m
n
N
mn
N
m
N
n
m
CCC
C
CC
mP
2121
21
0
0
0
,1
,1)(


x
7
和二项分布相比,
二项分布是放回抽样,而超几何分布是不放回抽样,
当在不放回抽样时,超几何分布中的 N1/N相当于二项分布中的参数 p,N2/N相当于二项分布中的 q=1?p.
超几何分布也可以和二项分布一样看作是 n个
0-1分布的随机变量 xi的和,i=1,2,...,n,xi表示第
i次抽样抽到第一类元素的事件的次数,根据抽签原理 P(xi=1)=N1/N,但如果 i?j,xi与 xj相互之间是不独立的,
8
计算超几何分布的数学期望因为 x可看作 n个相互并不独立但仍然服从同样的 0-1分布的随机变量 x1,x2,...,xn的和,
x=x1+x2+...+xn,其中
N
N
nnpEEE
ni
N
N
pE
n
i
i
n
i
i
i
1
11
1
,,2,1,




xxx
x
因此
可以认为超几何分布的数学期望与二项分布的一样
9
计算 x的方差因 xi服从 0-1分布,则 xi2也服从同样的 0-1分布,
则 Exi2=N1/N=Exi,当 i?j时,xixj也服从 0-1分布,
)
(
)(
)1(
)1(
)1(
21
22212
12111
2
1
2
11
nnnn
n
n
n
ji
E
EE
NN
NN
P
xxxxxx
xxxxxx
xxxxxx
xxx
xx






iEx?
10
因此
11
)1(
)1(
)(
)(
)1(
)1(
)(
21
2
2
121121
222
11212




N
nN
np q
N
nN
N
N
N
N
n
N
N
n
NN
NN
nn
N
N
n
EED
NN
NN
nn
N
N
nE
xxx
x
11
也可以直接用定义来计算 Ex和 Dx
N
N
nC
C
N
CC
C
N
E
mk
C
mNm
N
C
N
C
mNm
N
m
C
C
CC
mmmPE
n
N
n
N
kn
N
n
k
k
N
n
N
n
m
mn
N
n
N
n
m
mn
N
n
N
n
m
n
N
mn
N
m
N
n
m
11
1
11
1
0
1
1
1 1
11
1 1
1
00
21
2
2
21
1
)!()!1(
)!1(
)!(!
!1
)(







x
xx
则令
12
计算 Dx必须要先计算 E{x(x?1)}
)1(
)1()1()1(
)1(
)!()!2(
)!2()1(
)!()!2(
!1
)1()()1()]1([
112
2
11
2
0
)2(
2
11
2
2 1
111
2 1
1
20
21
2
2
21








NN
nnNN
C
C
NN
CC
C
NN
C
mNm
N
C
NN
C
mNm
N
C
C
CC
mmmPmmE
n
N
n
N
n
k
kn
N
k
N
n
N
mk
n
m
mn
N
n
N
n
m
mn
N
n
N
n
m
n
N
mn
N
m
N
n
m
xxx
13
因此
N
nN
NN
nnNN
EEE
111
2
)1(
)1()1(
)]1([

xxxx
11
)1(
)1()1(
)(
21
2
2
1
2
111
22




N
nN
npq
N
nN
N
N
N
N
n
N
Nn
N
nN
NN
nnNN
EED xxx
14
在实际应用中元素的个数 N是相当大的,例如,从中国人民中任抽几千个人观察,从一个工厂的几十万件产品中任抽几千件观察,等等,
而在 N非常大的情况下,放回抽样和不放回抽样的结果几乎是相同的,
因此有,当 N很大的时候,超几何分布可用二项分布来近似,
或者换句话说,当 N趋于无穷时,超几何分布的极限是二项分布,
15
为证明这一点,首先给出一个近似公式
!
)
1
1()
2
1)(
1
1(
!
!
)1()2)(1(
!
m
n
n
m
nnm
n
m
mnnnn
C
m
n
C
mn
m
n
m
m
n
m
m
n




这是因为保持不变的时候很大而当
16
因此,如果 x服从超几何分布,则当抽样数 n保持不变且远小于样本数 N即也小于 N1和 N2时
mnmm
n
mnm
n
mnm
n
N
mn
N
m
N
qpC
N
N
N
N
mnm
n
n
N
mn
N
m
N
C
CC
mP

21
21
)!(!
!
!
)!(!
)(
21
x
这正是二项分布的概率函数表达式当 N趋于无穷时,上面的约等于就成为等于
17
例 3 一大批种子的发芽率为 90%,今从中任取
10粒,求播种后,(1) 恰有 8粒发芽的概率 ; (2)
不少于 8粒发芽的概率,
解 设 10粒种子中发芽的数目为 x,因 10粒种子是由一大批种子中抽取的,这是一个 N很大,n
相对于 N很小的情况下的超几何分布问题,可用二项分布近似计算,其中 n=10,p=90%,
q=10%,k=8
9 2 9 8.09.01.09.091 9 3 7.0}8{)2(
1 9 3 7.01.09.0}8{)1(
109
288
10


x
x
P
CP
18
普哇松 (Poisson)分布在编写电子游戏程序时,有时需要某个目标随机出现,比如说,在驾驶游戏中希望平均十秒钟对面出现一辆迎面开来的车,
因此而每秒种做一次发生概率为 p=1/10的贝努利试验概型的试验,则十秒钟就做了 n=10次,
平均发生次数为 np=1.
而更精确的做法是每十分之一秒做一次
p=1/100的试验,则十秒钟 n=100,平均发生次数也是 np=1.
还可以将 n增加 p再减少来保持均值 np不变,
19
图示时间 t1 10
1 10 时间 t
每秒做一次发生概率为 1/10
的试验每 1/10秒做一次发生概率为
1/100的试验
20
因此就想到,固定二项分布的均值 np不变,即令 l=np的条件下,让 n很大,p很小,甚至让 n趋于穷大,p趋于无穷小,会变成什么分布
l
l
l
l
l
x
l
l
x




e
n
kP
pe
n
p
np
k
n
Cpn
ppCkP
k
k
n
n
k
k
n
knkk
n
!
)(
1)1(,)1()1(
,,
!
,
)1()(
因此最后得而因很小时很大当
21
定义 4.3 如果随机变量 x的概率函数是
1
!
)(
,
!
.)(,0
),1,0(
!
)()(
00
0



lll
l
l
l
l
xl
l
x
ee
m
emP
k
x
e
P oi s s on
me
m
mPmP
m
m
m
k
k
x
m
易知利用级数分布服从普哇松则称其中
22
普哇松分布常见于所谓稠密性的问题中,如一段时间内,电话用户对电话台的呼唤次数,候车的旅客数,原子放射粒子数,
织机上断头的次数,以及零件铸造表面上一定大小的面积内砂眼的个数等等,
23
普哇松分布的数学期望
ll
l
lx
l
l
l
x
lll
ll




ee
k
eE
mk
m
ee
m
mE
k
k
m
m
m
m
0
1
1
0
!
,1
)!1(!
则令
24
普哇松分布的方差
lx?lxx
llllxxx
llxlx
l
l
l
l
xx
x
l
l




DDE
EED
EE
m
e
e
m
mmE
m
m
m
m
,
)(
)!2(
!
)1()}1({
2222
222
2
2
2
2
0

25
通常在 n比较大,p很小时,
用普哇松分布近似代替二项分布的公式,其中 l=np,
普哇松分布的方便之处在于有现成的分布表可查
(见附表 1)
26
例 1 x服从普哇松分布,Ex=5,查表求 P(x=2),
P(x=5),P(x=20)
解 因普哇松分布的参数 l就是它的期望值,故
l=5,查书后附表一,有
P5(2)=0.084224,
P5(5)=0.175467,
P5(20)=0
27
例 2 一大批产品的废品率为 p=0.015,求任取一箱 (有 100个产品 ),箱中恰有一个废品的概率,
解 所取一箱中的废品个数 x服从超几何分布,
由于产品数量 N很大,可按二项分布公式计算,
其中 n=100,p=0.015.
3 3 5 9 5 3.0985.0015.0)1( 991100 CP x
但由于 n较大而 p很小,可用普哇松分布公式近似代替二项分布公式计算,其中 l=np=1.5,查表得,
P1.5(1)=0.334695
误差不超过 1%.
28
例 3 检查了 100个零件上的疵点数,结果如下表,
疵点数 0 1 2 3 4 5 6
频数 14 27 26 20 7 3 3
试用普哇松分布公式计算疵点数的分布,
并与实际检查结果比较,

2)63127014(
100
1l
29
计算出来的图表如下所示,
疵点数 0 1 2 3 4 5 6
频数 14 27 26 20 7 3 3
频率 0.14 0.27 0.26 0.20 0.07 0.03 0.03
概率 0.135 0.271 0.271 0.18 0.09 0.036 0.01
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6
μ?ê
ê
30
指数分布定义 如随机变量 x的概率密度为
x
j(x)
的指数分布服从参数为则称其中其它当
lxl
l
j
l
,0
0
0
)(

xe
x
x
31
指数分布的分布函数





时当时当因此时当时当
01
00
)(
1)(
,0
0)(,0,)()(
|
00
xe
x
xF
eedtexF
x
xFxdttxF
x
x
x
t
x
t
x
l
lll
l
j
32
对任何实数 a,b(0?a<b),有
ba
b
a
x
eedxebaP
lll
lx

)(
在习题三第 12题中已经算出它的期望和方差:
Ex=l?1
Dx=l?2
33
指数分布经常用来作各种“寿命”分布的近似,如随机服务系统中的服务时间,某些消耗性产品 (电子元件等 )的寿命等等,都常被假定服从指数分布,假若产品的失效率为 l,则产品在
t(t>0)时间失效的分布函数为
F(t)=1?e?lt
而产品的可靠度为
R(t)=1?F(t)=e?lt
34
例 1 某元件寿命 x服从参数为 l(l?1=1000小时 )
的指数分布,3个这样的元件使用 1000小时后,
都没有损坏的概率是多少?
解 参数为 l的指数分布的分布函数为
)0(1)( 1000
xexF
x
P(x>1000)=1?P(x?1000)=1?F(1000)=e?1
各元件寿命相互独立,因此 3个这样的元件使用 1000小时都未损坏的概率为 e?3(约为 0.05).
35
请提问
36
作业 习题四第 100页第 13,16,17,19题
B组交作业