实验数据处理方法
第三部分:统计学方法
第十四章 假设检验
(Hypothesis Testing)
第十三章 假设检验
(Hypothesis Testing)
一, 假设检验的基本概念
二, 假设检验的一般方法
三, 假设检验的一个例子,Li- Ma显著性( Significance)
第十三章 假设检验
(Hypothesis Testing)
一, 假设检验的基本概念
1,什么是假设检验
实验的目的:验证一个科学论断的正确性
假设检验:利用概率和统计的语言,根据实验的结果来验证一个理论模
型是否可接受。
统计假设:待检验的理论模型
例,Ξ 0粒子的衰变。
实验结果:测量衰变时间求 Ξ 0粒子的平均寿命 τ 。
理论模型,ΔI=1/2 规则,Ξ 0的寿命是 Ξ - 的两倍,
Ξ - 的寿命 ? Ξ 0的寿命 τ 0
问题,τ = τ 0?
由于 τ 有测量误差,对该问题的回答,τ=τ 0概率是多少?
第十三章 假设检验
(Hypothesis Testing)
2,假设检验的分类
( 1)参数检验:如果欲检验的统计假设只包括某些参数的特定值,
( 2)非参数检验:被观测的随机变量的分布是否符合一个特定的
原假设:欲检验的统计假设,如
如,τ = τ 0?
函数形式?两个给定的实验分布是否具有相同
分布形式? ……
3,原假设和备择假设( Null Hypothesis,Alternative Hypothesis)
H0,τ=τ0
备择假设:实验结果有可能支持原假设,也可能支持别的假设而拒
绝原假设,与原假设不同的其它假设称为备择假设,如
H1,τ ≠ τ 0
第十三章 假设检验
(Hypothesis Testing)
一般情况下,是否接收原假设依赖于与备择假设的比较结果。
简单假设:假设中参数的值是一常数,如
4,简单假设和复合假设( Simple Hypothesis,Composite Hypothesis)
H0,τ=τ0
复合假设:假设中的某一参数的值不是完全确定的,如
H,τ ≠ τ 0, H1,τ ≥ τ 0
如何选择原假设和备择假设,要根据所要解决的实际问题决定
第十三章 假设检验
(Hypothesis Testing)
二, 假设检验的一般方法
随机变量 x
参数检验
观测结果:容量为 n的样本,( x1,x2,…,xn)
定义通过观测结果来接收原假设或拒绝原假设的标准
p.d.f.,f( x,θ),θ为未知参量
检验 θ 是否取某一值
原假设 H0,θ =θ 0
备择假设 H1,θ =θ 1
检验统计量,t = t(x1,x2,…,xn)
t 的定义域,ω
第十三章 假设检验
(Hypothesis Testing)
即:若 t 的观测量 tobs,
f (t |Ho),H0为真时,t 的 p.d.f,
α:显著性水平( Significance Level),tc:临界值
f (t |H1),H1为真时,t 的 p.d.f,
R,ω中的子域
α,t 落入 R中的概率。 0≤α≤1( H0为真时)
???? R dttfRt )H|()H|P( 00?
R,H0 的拒绝域
ω - R,H0 的接收域
否则,接收 H0
f (t |Ho)
ω - R R
tc t
落入 R,则拒绝 H0
第十三章 假设检验
(Hypothesis Testing)
第一类错误(弃真错误):当 H0为真时,tobs有 α的概率落入 R
? α应尽可能地小
? ????? R dttfRt ??? )H|()H|P( 11
1-β,H0 对 H0的检验势
当 tobs> tc时,H0被拒绝,而实验上 H0为真
I类错误的概率,
?? R dttf )H|( 0?
第二类错误(取伪错误),H0不为真,但却接收了 H0
II类错误的概率,
????? R dttfRt )H|()H|P(1 11?
f (t |Ho)
1 - α R
tc t
α
1-β大,II类错误的概率小
第十三章 假设检验
(Hypothesis Testing)
假设检验的方法,
? α应尽可能地小
设 x的 p.d.f.,
1,选择合适的检验统计量 t
?? R dttf )H|( 0?
标准,α尽可能地小,1-β尽可能大。
三, 复合假设的检验,似然比( Likelihood Ratio)
),,,( 21 n???? ?? ?
f (t |H1)
β
tc t
1-β
ω,Ω的子空间,即
2,选择适当的临界值 tc
)|( ??tf, x样本,(x1,x2,…,xn)
??:? 的取值空间
?? 的分量中只有一个受到某种约束
第十三章 假设检验
(Hypothesis Testing)
原假设
?
?
? n
i i
xf
1
)|( ??L
?? ??:H0
备择假设 ?? ????:H 1
设 )(??L, L 在 Ω中的极大值
)(??L, 在 H0为真时,L 在 ω中的极大值
定义,)( )(?? ??LL ??, 似然比( Likelihood Ratio)
不可能比 大 )(??? L )(??L 10 ??? ?
1~? )(~)( ??? LL ? ?H0 为真的可能性较大
0~? )()( ??? ?? LL ? ?H0 为真的可能性较小
λ可作为原假设 H0的检验统计量 ?
第十三章 假设检验
(Hypothesis Testing)
对 H0的检验
?? ?? ??0 0 )H|( dgL, L 在 Ω中的极大值
y=y(λ)
中当 H0 为真时有 γ个参数取固定值,则
当样本容量 n很大时,统计量 -2lnλ趋近于自由度为 γ的 χ2分布
?求在给定的显著性水平 α 下,λ 的临界值
λ α,
g(λ| H0):在 H0 为真时,λ的 p.d.f,
如果 g(λ| H0)的函数形式未知,
? h (y | H0)
?? ?? )( )0( 00 0 )H|()H|( ?? ?? ??? yy dyhdgL
y(λα) → λα
一般情况下,g(λ| H0)很难找到 ? 采用近似方法,
),,,( 21 k???? ?? ?设
? χ2(γ)分布求 λ α
令 ?? ?? ????0 2 ),( dL?? ln2?? ?λ α
第十三章 假设检验
(Hypothesis Testing)
例,γ点源寻找中的 Li-Ma显著性
问题:来自某一天体方向的事例数的超出是 γ点源信号还是背景
Non:向源事例数
未知量,γ事例数 Ns,源方向的背景事例数 NB
涨落,如果是信号,如何用统计学的方法描述这种超出?
实验测量,
背景事例:强子和核引起的簇射,是各向同性的,
Noff:离源事例数
ton:向源测量时间
toff:离源测量时间
可用似然比检验解决上述问题。
第十三章 假设检验
(Hypothesis Testing)
原假设
备择假设 0:H 1 ?sN
Non,Noff服从什么分布?
假定:事例率为常数,则 Non,Noff服从 Possion分布
令 L=ton / toff
如果 H0 为真,Ns=0,
??? ?? eNNP N!1),( μ:平均值
NS,NB的估计值,
o f fono f fo f fB Ntt
NN ?????
o f fonBonS NNNNN ????? ??
)(1? o f fonon
o f fon
o f fonB NNttt NNN ??????? ??
Non和 Noff的平均值,
( 1) H0 为真时,Non全为本底事例。
0:H 0 ?sN
第十三章 假设检验
(Hypothesis Testing)
参数空间,NB,x轴,NS,y轴
H0为真时,有一个参数取定值:自由度为 1
( 2) H1 为真时:,NS≠0
)(1? 0 o f fonon
o f fon
o f fonon NNt
tt
NNN ?
????
??
?
?
)(1 1? 0 o f fono f f
o f fon
o f fono f f NNt
tt
NNN ?
????
??
?
onBSon NNNN ??? ??1
o ffo ff NN ?1
H0, NS=0, ω= x轴
H1, NS≠0, Ω=NS >0,NB≥0
第十三章 假设检验
(Hypothesis Testing)
)()( o f fon NPNP ??L
000 !1)(,onon NNon
onon
eNNNPH ??
似然函数,
由于 Non和 Noff 是独立的随机变量,故一次实验获得测量量 Non和 Noff
概率为
00!1)( o f fo f f NNo f f
o f fo f f
eNNNP ??
?)|,( 0HNN o f fonL
onon NNon
onon
eNNNPH ?? !1)(:1
o f fo f f NNo f f
o f fo f f
eNNNP ?? !1)(
?)|,( 1HNN o f fonL
第十三章 假设检验
(Hypothesis Testing)
似然比,
2?
?
??
?
? ?? ? ?xu
o ffon N
o f f
o f fon
N
on
o f fon
o f fon
o f fon
N
NN
N
NN
HNN
HNN
???
?
???
?
???
?
???
? ?
???
??
?
?
???
?
???
? ?
??? ??
??
1
1
1)|,(
)|,(
1
0
L
L
如果 Non,Noff 不是很小,-2 lnλ ? χ2(1)
χ2分布的定义:如果 χ? N(μ,σ2)
? χ2
,x 偏离平均值 μ多少标准偏差 u
u ~ -2 lnλ
∴ 在 H0假设为真时,ln 2- ??S =观测结果偏离 H0多少个
标准偏差。
第十三章 假设检验
(Hypothesis Testing)
? ?
2
1
1ln
1
ln2
ln2
??
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
o f fon
o f f
o f f
o f fon
on
on
NN
N
N
NN
N
N
S
?
?
?
?
?李 -马显著性 (Li-Ma significance)