实验数据处理方法
第一部分:概率论基础
第四章
特殊的概率密度函数
? 概率分布函数反映了随机变量的概率分布规律;
? 在概率论中处理概率分布时一般不涉及分布的物理来源,为
在实验数据分析中正确地掌握和运用这些分布函数,需要,
– 熟悉公式及运算规则;
– 分布的物理意义;
? 实验数据处理中所用到的概率分布的来源,
1,实验所涉及到的物理问题本身的统计性质带来的,这类
分布比较多样化,是和所处理的物理问题有直接的联系;
2,对实验测量结果作数据处理时所引进的。这一类分布比
较标准化,且处理的方法也比较明确;
? 本章内容,
– 数据处理过程中常用的概率分布函数,给出它们的定义、
性质和实际应用
第四章
特殊的概率密度函数
4.1 二项式分布
( Binomial Distribution)
??
?
?
??
?
?
?
?
?
???
?
?
??
?
?
????
?
?
??
?
?
? ?
rn
n
rnr
n
r
n
nrpp
r
n
pnrB rnr
)!(!
!
,2,1,0,)1(),;( ?
1)()1(),;(
1),;(
00 0
0
?????
?
?
??
?
?
????
?
?
??
?
?
?
?
?? ?
?
?
?
? ?
?
?
n
n
r
rnr
n
r
n
r
rnr
n
r
qpqp
r
n
pp
r
n
pnrB
pnrB
4.1 二项式分布
( Binomial distribution)
一、定义(亦称伯努利分布),
考虑一个随机实验的两个互斥的结果:成功和失败,设成功的概率为 p,
则不成功的概率为 1-p=q。在 n次独立的实验中,有 r次成功的概率为,
二、性质,
1,满足归一化条件
证,
npqpnprErErV
nprE
?????
?
)1()]([)(
)(
2
4.1 二项式分布
( Binomial distribution)
2,在变换 (r,p)??(n-r,1-p)下保持不变,B(r;n,p)=B(n-r;n,1-p)
3,当 p=q=0.5时,是对称的 ;
对于任意的 p值,是非对称的 ;
当 n增大时,分布趋于对称 ;
当 n很大时,近似为正态分布
4,服从二项式分布的随机变量 r 的平均值和
方差,
三、应用,
给出进行 N次实验有 r次成功的概率。
4.1 二项式分布
( Binomial distribution)
例 1:直方图( Histogram)
考虑一直方图,设 A表示一事例落入 Bin i,A表示某事例落入直方图
中其它的 Bin,如果共有 n个独立的事例,其中有 r个事例落入 Bin i,
n -r个事例分布于其它的 Bin ?r服从二项式分布
Bin i中事例数 r的期望值和方差,
μ≡ E(r) = n p
V(r) = n p (1 - p)
r的标准偏差,
???
???
nr
n
rrrV
,
)1()(
?
?
概率 p是未知的,可由实验结果估计,
n
rpp ?? ?
一维散点图
一维直方图
x
r
x i
4.1 二项式分布
( Binomial distribution)
例 2.设在某实验中,所期望的事例出现的概率为 p。问,需要作多少次实
验才能使至少有一个这样的事例出现的概率为 α?
设在 N次实验中共出现了 X这样的事例。 X服从二项式分布
XnX pp
X
NpNXB ??
???
?
???
?? )1(),;(
1
( 1 ) ( ;,) 1 (0 ;,)
N
X
p X B X N p B N p ?
?
? ? ? ? ??
至少有一个这样的事例出现的概率,
)1lo g ()1lo g (
1)1(
)1(),;0(
),;0(1)0(1
pN
p
ppNB
pNBXp
N
N
???
????
??
?????
?
?
?
0
2
1
3
2
3
1
2
0
0.5
1
1.5
2
2.5
3
0 1 2 3
N 次实验观测到r 次(二项式分布)
计数
??????? ???????? ??
N次 成功次数 r
?
4.1 二项式分布
( Binomial distribution)
几何分布
负二项式分布
超几何分布
作一系列独立的伯努利实验,前 r-1次实验失败,第 r次成功的概率,
1(,) (1 ) rg r p p p ???
1( ; ) ( 1 )
1
k r k
k
rP r p p p
k
????????
???
不是从 n次实验中抽取的。
作一系列独立的伯努利实验,在第 r次实验中事件是第 k次成功,这类
事件的概率为,
( ;,,) N a a NP r N n a n r r n?? ? ? ? ? ?? ? ? ? ? ? ??? ? ? ? ? ?
N个元素,其中 a个表示成功,N-a个表示失败,从 N个元素中一次抽
取 n个元素,其中有 r个成功,n-r个失败的概率为,
4.1 二项式分布
( Binomial distribution)
() naEr N?
超几何分布的期望值和方差为,
( ) ( 1 )1N n n a aVr N N N?? ? ? ??
当 时,超几何分布近似为二项式分布 nN
( ;,)B r n p
其中 。 ap
N?
r n-r a-r
N-a
第四章
特殊的概率密度函数
4.2 多项式分布
( Multinomial distribution)
4.2 多项式分布
( Multinomial distribution)
一、定义
设可能的实验结果可分成 k组,A1,A2, …, A k,每次实验结
果落入某一组 Ai的几率为 pi
1
1
??
?
k
i
ip
如果共进行了 n次独立的实验, 实验结果落入各个组的次数为 r1,r2, …,
rk的概率为 ( )
1k ii rn? ??
krkrr
k
ppprrr npnrM ?21 21
21 !!,,!
!),;( ?
二、性质
多项式分布是二项式分布的推广,除具有二项式分布的一些特性外,还具有
以下的附加性质,
4.2 多项式分布
( Multinomial distribution)
1) ri的期望值,E(ri) = Npi
2) ri的方差,v(ri) = npi (1 - pi)
3) ri和 rj的协方差,cov(ri,rj) = -npipj
相关系数,
即,ri和 rj总是负相关
一维直方图中,当 bin宽度足够小时( pi→ 0), ri和 rj相关度很小。
4)当 n很大时,多项式分布趋向于多维正态分布
)1)(1(
),c o v (),(
ji
ji
ji
ji
ji pp
pprrrr
????? ???
三、应用,
用于处理一次实验有多个可能的结果的情况
4.2 多项式分布
( Multinomial distribution)
例:设有 n个事例,分布于直方图的 k个 bin中,某事例落入 bin i的概率为
pi,落入 bin i的事例数为 ri,则 k个 bin中事例数分别为 r1,r2, …, rk的
概率为多项式分布
ri的期望值和方差,E(ri) = npi v(ri) = npi (1 - pi)
如果 pi << 1,即 bin的数目 k很大,则有 v(ri) ? npi =ri
ii rr ?)(?
带误差棒的一维直方图
r
x i
第四章
特殊的概率密度函数
4.3 泊松分布
( Possion distribution)
4.3 泊松分布
( Possion distribution)
一、定义
泊松分布是二项式分布的极限形式,p?0,n?∞,但 np=有限值 μ,
根据 Stirling公式, 当 n很大时
!2 nnn n e? ??
rnr pprnr n ??? )1()!(! ! rnr
rnrn
nn
nnernrn
enn
r ????
? ??
?
??
?
?
??? )1()()(2
2
!
1
)(
??
?
?
nr
rrn
n
nernrn
n
r )1()()(!
1 ?? ?
??? ?
nr
rn ne
n
rr )1()1(
1
!
1 ?? ?
?
?
nxr nxeer )1(!1 ???? ?? ??
?,2,1,0!1);( ?? ? rerrp r ???
4.3 泊松分布
( Possion distribution)
二、性质
? 期望值,E(γ)= μ
? 方差,V(γ)= μ
三、应用,
泊松分布给出在事例率为常数的情况下,在某一给定时间间隔内得到 r
个独立事例的概率。
例 1,气泡室中的气泡沿着带电粒子径迹的分布
设单位径迹长的上气泡的平均数目为常数 g,假定
1,在长度间隔 [ l,l +?l ]上最多只有一个气泡;
2,在 [l,l +?l ]这个间隔中找到一个气泡的概率正比于 ?l;
3,在两个不重迭的间隔中产生气泡的事件是互不相关的;
具有上述特点的随机过程就称为泊松过程 。
4.3 泊松分布
( Possion distribution)
由假设 1和 2,在 [l,l+?l] 中
有一个气泡的概率,p1(?l)=g?l
没有气泡的概率,p0(?l)=1- p1(?l)=1-g?l
根据假设 3
?在 [l,l+?l]长度上没有气泡的概率=在 l长度上没有气泡的概率 ?在 ?l长
度上没有气泡的概率
p0(l+?l)= p0(l) ·p0 (?l)
)()()( 000 lgpl lpllp ??? ???
)()(0 00 lgpdl ldpl ?????
?独立性
?平均值 ?=gl的泊松分布
glelp ??)(0
?? ??? ??? ?? ?? )()()()()( 110 ΔlplpΔlplpllp rrr ?????
)()()( 1 lgplgpdl ldp rrr ????
glr
r eglrlp
?? )(
!
1)(
取边界条件 p0(0)=1,
4.3 泊松分布
( Possion distribution)
求在长度 l上观测到 r个气泡的概率 pr(l),
根据假定,在间隔 [l,l+?l]内最多只能有一个气泡
r个气泡都在 l内 r-1个气泡在 l内,1个在 ?l
?
对 r=0(在 [0,l]中不产生气泡),概率是 0 () glp l e ??
4.3 泊松分布
( Possion distribution)
服从泊松分布的变量的加法定理:几个独立的泊松分布变量的和还是泊
松分布变量 。
tetrtrp xtrx
x
xxr
xx ???? ? ?? ?)(
!
1);(
t
b
b
bbr bb ettp
???
???
?? )(
!
1);(
),(),(),;( tpttpttp bbrtbrbxr ???????? ??
t
bx
b
bxet )(])[(
!
1 ?????
?
????
例 2 放射源和本底辐射的叠加
从放射源中辐射出的粒子的数目服从泊松分布。
?x:单位时间内从放射源中辐射出的平均粒子数
?x:时间间隔 t辐射出的粒子数目
如果将放射源放入一容器中,容器中的本底辐射服从 ?=?b的 泊松分布
可测量量是来自放射源和本底的总粒子数,其分布为
??=p?的泊松分布
? ? epv pvr
rN r
VNppNrBrp ??
?
?? ? !1),(),,()(
4.3 泊松分布
( Possion distribution)
例 3 计数器的计数分布
设计数器的计数效率为 p<1,在时间间隔 t内通过计数器的总粒子数 N服从平
均值为 v的泊松分布。求在时间间隔内,计数器所记录到的粒子数的分布
p(r)
要得到 r个计数,必须至少有 r个粒子通过探测器。对于一个取得的 N,得到
r个计数的概率服从二项式分布。
P(r)=所有可以给出 r个计数的概率之和
即:每个 Bin中的事例是独立的泊松变量
?
rrp ii
i NE ?? )( rr ii ?? )(?
4.3 泊松分布
( Possion distribution)
例 4 多项式分布和泊松分布间的关系
考虑有 k个 Bin的直方图,每个 Bin中的事例数 ri服从多项式分布,设总事
例数 N服从平均值为 ?的泊松分布,则联合概率密度
),(),(
)(
!
1
)(
!
1
!
1
!!!
!
),(),,(),,,(
11
1
1
21
11
21
11
21
kk
pr
k
k
pr
Nr
k
rr
k
k
prPprP
ep
r
ep
r
e
N
ppp
rrr
N
NPpNrMNrrrP
kk
k
??
??
?
?
??
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
?
1
11
1
1
,1
i i
k
i
ii
kk
ii
ii
k
r rN
i
kp
p
i
N r p
e e e
?
??
? ? ?
?
??
?
? ?
??
?
??
???
??
??
?
?
iiii rprVrE ??? ?)()(
第四章
特殊的概率密度函数
4.4 复合泊松分布
( Compound Possion distribution)
?
?
? n
i
irr
1
? ??
? ?
?????? ???
0 1
),();()(
n
n
i
i nprrprp ??
??? nrn
i i
enrrrp ?
?
?? ? )(!1);(
1
??
?
??
??
?
??
?
??
?
??
???
0
)!1(!1)( )(
n
nnr een
nrrp
?? ??
定义,
设是 r1,r2,… 是一组 N个独立的泊松变量,其平均值都为 ?,n也是泊松变量,
其平均值为 ?,求
的分布 P(r)
根据边缘概率的定义,p(r)应为产生 r个事例的所有的概率之和,
为 n个独立的泊松变量的联合概率
根据泊松变量的加法定理
4.4 复合泊松分布
( Compound Possion distribution)
4.4 复合泊松分布
( Compound Possion distribution)
性质,
E(r) = ??
V(r) = ?(?+1)?
应用,
泊松型的随机过程触发另外一个泊松型的随机过程
例:云室中的液滴
带电粒子通过云室时, 会受到一系列的散射, 而每次散射过程都会引
起液滴的产生 。 在一给定的径迹长度上, 粒子受到的散射的次数服从
泊松分布, 每次散射所产生的液滴的数目也服从泊松分布 。 因此, 在
给定的径迹长度上所产生的液滴的数目 r服从复合泊松分布 。
?,每次散射所产生的液滴的平均数目
?,在给定的径迹长度上粒子所受到的散射的平均次数
第四章
特殊的概率密度函数
4.5 均匀分布
( Uniform distribution)
4.5 均匀分布
(Uniform distribution)
? ?bax,?
bxa
bxax
ab
xf ?? ??
??
???
?
? 或1
0
)(
? ??? ba badxxxfxE )()()( 21
概率密度函数,
性质,
应用,
1、多丝室的位置分辨率:粒子在两丝间的击中位置分布是均匀分布,
1、期望值
2、方差
3、累积分布
? ???? ba abdxxfxExxV 21212 )()()]([)(
],[)()( baxab axxdxfxF xa ??????? ?
丝距 Δ= b- a
位置分辨率,12)( ??? xV?
2、均匀分布的随机数产生器
4.5 均匀分布
(Uniform distribution)
( ) ( )yx G y g t d t???? ?
任意连续分布的随机变量 Y的概率密度函数为 g(y)
2、均匀分布的随机数产生器
G(y)
y
x 0 1
1
( ) ( ) ( ) 1d y d Gf x g y g yd x d y
???
? ? ?????

x的概率密度分布为
x是 [0,1]区间的均匀分布的随机变量,是满足 g(y)分布的随机变量 1 ()y G x??
橡皮泥原有形状
橡皮泥压缩后的形状
第四章
特殊的概率密度函数
4.6 指数分布
( Exponential distribution)
4.6 指数分布
(Exponential distribution)
?
??
/1);( xexf ??
??E ( x )
2V(x ) ??
概率密度函数,
性质,
期望值,
方差,
应用,
指数分布在粒子物理的应用非常广泛:衰变过程,衰减过程 ……
4.6 指数分布
(Exponential distribution)
glg l e ??
例:泡室中粒子径迹的距离分布
在 [l,l+Δl]中出现第一个气泡
在位置 l 处单位长度内产生第一个气泡的概率(即概率密度)为
在 [0,l]中不出现气泡
根据泊松假设,两事件独立,
∩ 在 [l,l+Δl]中出现一个气泡概率
() glf l g e ??
联合概率密度=两事件概率密度之积
在 [l,l+Δl] 内出现第一个气泡的概率为
g为单位长度内平均气泡数目
4.6 指数分布
(Exponential distribution)
tte ?? ??
例:一个放射源两次相继的核衰变之间时间间隔的分布
在 [t,t+Δt]中发生第一次核衰变
在时刻 t 单位时间内发生一次核衰变的概率密度为
在 [0,t]中没有核衰变
根据泊松假设,两事件独立,
∩ 在 [t,t+Δt]中发生一次核衰变
() tf t e ?? ??
联合概率密度=两事件概率密度之积
在 [t,t+Δt] 内发生一次核衰变的概率为
λ为单位时间间隔内平均衰变次数
t 的平均值(称为核的平均寿命)为 ( ) 1 /Et????
两次衰变的时间间隔 >t 的概率为 1 ( ) tF t e ????
第四章
特殊的概率密度函数
4.7 正态分布(高斯分布)
(Normal or Gaussian distribution)
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
概率密度函数,
)(
2
1)(),( 22
2
1 )(2 ??????? ?? xexfN x ??
??
??
性质,
1、期望值,
2、方差,
3、累积分布,
??E ( x )
2V(x ) ??
)(F ( x ) ? ???? x
? ?? ??? z x dxez 22121)( ?
?误差函数
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
标准正态分布,( Standard Normal Distribution) N(0,1)

?
??? xy
得标准正态概率密度函数
21
21N ( 0,1 ) ( )
2
yg y e
?
??? ??=0,?=1的正态分布
累积标准正态分布函数,
21
21( ) ( ') '
2
yy yG y g y d y e d y
?
??
? ? ? ? ?????
)(1)( yGyG ???
G(y)的应用,
1、设 x是服从正态分布的随机变量,求 x落于区间 [a,b]内的概率
)()()( axpbxpbxap ??????
)()( ? ?? ?? ?? ? ???????? axpbxp
?? ?????? ?? ???? // ')'(')'( ab dyygdyyg
)()()( ? ?? ? ?????? aGbGbxap
1)()( ????? ??? ? aGbG ( ) 1 ( )G y G y? ? ? ?
1?区间,
2?区间,
3?区间,
6 8 2 7.01)1(2)( ??????? Gxp ????
9 5 4 5.01)2(2)22( ??????? Gxp ????
9 9 7 3.01)3(2)33( ??????? Gxp ????
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
规则 3?
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
2、已知概率值,求相对于平均值对称的区间 ],[ aa ?? ??
1)(2)()( ????? ???? aGaGaG
)1()( 21 ?? ??aG
查表可得出
?
a
? = 0.9 a = 1.645
=0.95 = 1.960
=0.99 = 20576
=0.999 = 3.290
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
正态变量加法定理,
如果某一随机变量是一些正态变量的函数,该变量的分布形式是什么?
如果是线性函数 ? 加法定理
设 x1,x2,…x n是相互独立的正态变量
),( iii Nx ???
则 ?
?
?
n
i
ii xay
1
也是服从正态分布的变量, 其平均值和方差分别为
?
?
? n
i
iiuayE
1
)(
?
?
?
n
i
iiayV
1
22)( ?
例:正态分布样本的样本平均值 和方差 的特征。 x 2s
设 n个独立的随机变量都服从正态分布, 其平均值和方差分别为 ?和
?2 。 对于由这 n个量构成的正态样本
?
?
? n
i
ixnx
1
1 ?
?
??? n
i
i xxns
1
22 )(
1
1
由正态变量的加法定理,样本平均值也是正态变量
??? ?
?
n
i
iiuaxE
1
)(
naxV
n
i
ii
2
1
22)( ?? ?? ?
?
?? ?? ii na,1?
),( 2nN ??的分布服从 x?
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
可以证明,
1,
2
2)1(
?
sn? 服从自由度为 n- 1的 ?2分布;
2,x 是相互独立的随机变量
定理,
如果独立的随机变量服从相同的正态分布,则统计量 和 是相互独
立的;
反过来,如果随机样本的平均值和方差是相互独立的,则这一样本所代
表的总体一定是正态分布。
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
2s和
x 2s
中心极限定理( Central Limit Theorm)
设 x1,x2,…… xn是一组 n个独立的随机变量, xi的平均值和方差分别为
μi和 ?i,则当 n→∞ 时, 变量
?? ?
?? ?
?????? ? n
i i
n
i
n
i iix 1
2
1 1 ?
?
服从标准正态分布 N(0,1)
例:高斯型随机变量产生器
设 x 是在 [0,1]之间均匀分布的随机数
对 n个 x的取值 xi( i=1,2,…,n) 定义随机变量
nny n
i ix 12
1
1 2
?????? ?? ?
?
121221 )()( ???? ?? xVxE
在 n→∞ 时,服从正态分布,在实际应用时,可取 n=12
612
1
?? ?
?i
ixz
4.7 正态分布(高斯分布)
( Normal or Gaussian distribution)
第四章
特殊的概率密度函数
4.8 ?2分布
(?2 distribution)
4.8 ?2分布
(?2 distribution)
定义,
设 x1,x2,…,x n,是一组 n个相互独立的服从正态分布 N(μ,?2)的随机变量。
这 n个 xi构成容量为 n的正态样本,所代表的正态总体的平均值和方差分
别为 μ和 ?2,定义
? ?????? ?
?
?
n
i
x i
1
2
2
?
??
变量 ?2的概率密度函数为
? ? ???
??????
? ?? 22122
2
2 0
2
1),(
2
2
??? e
x
nΓnf
n
n
?自由度为 n的 ?2分布
4.8 ?2分布
(?2 distribution)
性质,
1,期望值,E(?2)=n
2、方差,V(?2)=2n
3,?2分布的概率值
? ? ?????? ?? ??? ? 1,),( 2
0
2 x dfF
4.9 几种分布的关系
超几何分布
),,;( anNrF
泊松分布
);( ?rP
二项式分布
),;( pnrB
伽马分布
),;( ??xf
高斯分布
),( 2??N
?2分布
);( nxf
指数分布
);( ?xf
??N pNa ?
??n
0?p
??np
??n
2n??
2??
1??
1????