第八章 假设检验
假设检验的基本思想
正态总体均值和方差的检验
单正态总体
双正态总体
样本容量的选取
分布拟和检验
§8.1 假设检验统计估计假设检验
统计推断 ——由样本推断总体总体的分布---分布检验已知总体分布,但未知其参数---参数检验假设检验
参数的假设检验的基本思想
p213例:葡萄糖包装机正常工作时,均值为 0.5公斤,标准差为0.015公斤。某日抽取9袋样本,测得平均重0.511公斤。假设机器的标准差没有改变,
问机器是否正常工作?
分析:如果机器正常工作,那么对机器的全部产品
(总体)而言,平均总量应为0.5公斤。即 μ=0.5。
00
5.0,μμ ==H
假设 μ=0.5成立,即
XQ
是 μ的无偏估计。如果假设为真,
xx?=? 5.0
0
μ
一般不应太大。于是
n
x
/
0
σ
μ?
应在一定的范围内。
∴可选择一个适当的正数k,当
k
n
x

/
0
σ
μ
时,就拒绝假设 H
0

k
n
x
<
/
0
σ
μ
时,就接受假设 H
0
.
然而,由于做出决策的依据是一个样本,由部分推断总体就不可避免的会犯错误。但必须控制犯错误的概率 。
所陈述的假设H。
结论(样本)
拒绝假设H。
接受假设H。
真假正确正确第一类错误(弃真)
第二类错误(取伪)
这就是检验的两类错误
P{拒绝 H
0
|H
0
真}=犯第一类错误的概率;
P{接受 H
0
|H
0
假}=犯第二类错误的概率奈曼 —皮尔逊 (Neyman—Pearson)提出了一个原则:
“在控制犯第一类错误的概率不超过指定值 α的条件下,尽量使犯第二类错误的概率 β小”按这种法则做出的检验称为“显著性检验”,α称为显著性水平或检验水平。
控制犯第一类错误的概率不超过指定值 α,即
P{当 H
0
为真拒绝 H
0
}≤α
P{当 H
0
为真拒绝 H
0
}≤α
回到机器的问题
k
n
x

/
0
σ
μ
要选择适当的k,当时,就拒绝H
0
α/2
α/2
2
α
z?
2
0
α
z
1-α
)1,0(~
X
0
N
n
σ
μ?
Q
2
α
zk =
{} α
σ
μ
=

=∴ k
n
X
PP
/
HH
0
00
为真拒绝当令
2
α
zk =
2
0
/
α
σ
μ
z
n
x

∴找到时,就拒绝H
0
,反之,就接受H
0
将具体数据代入,取 α=0.05,得
96.12.2
/
2
0
=≥=
α
σ
μ
z
n
x
所以,拒绝假设 H
0
,认为机器工作不正常。
以上采用的检验方法符合实际推断原理。 p215
相关术语
00
5.0,μμ ==H
1,H
0
:θ=θ
0;原假设,零假设
H
1
:θ≠θ
0
备择假设
n
σ
μ
0
X
Z
=
2,α,显著性水平
3,检验统计量
2/
||
α
zz ≥
4,拒绝域
2/
2/
,
α
α
zz
zz
=
=
5,临界点
H
0
:μ=μ
0;H
1
:μ≠μ
0
双边检验
2/
||
α
zz ≥
拒绝域单边检验:右边检验、左边检验
H
0
:μ≥μ
0;H
1
:μ<μ
0
左边检验
α
zz?≤
拒绝域
H
0
:μ≤μ
0;H
1
:μ>μ
0
右边检验
α
α
zz ≥
拒绝域显著性检验的思想和步骤:
(1) 根据实际问题作出假设 H
0
与 H
1;
(2) 构造统计量,在 H
0
真时其分布已知;
(3) 给定显著性水平 α的值,参考 H
1,

P{拒绝 H
0
| H
0
真 }= α,求出拒绝域 W;
(4) 计算统计量的值,若统计量 ∈W,则拒绝 H
0
,否则接受 H
0
§8.2 正 态总体均值的假设检验一、单个总体N( μ,σ
2
),均值 μ的假设检验
1,σ
2
已知的情形---Z检验(U检验)
对于假设 H
0
,μ=μ
0; H
1
,μ≠μ
0
,构造双边检验:
)10
0
0
,~N(

μX

μX
Z
真H

=
=
查表,计算,比较大小,得出结论
22
αα
α zz,}zzP{ ≥=≥可得拒绝域:由类似地,对于右边检验,H
0
,μ≤μ
0; H
1
,μ>μ
0

拒绝域为
H
0
:μ≥μ
0;H
1
:μ<μ
0
α
zz?≤
α
zz ≥
α
左边检验拒绝域例1:设某厂生产一种灯管,其寿命 X~N(1500,200
2
),
现采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命1675小时。假设标准差没有改变。问采用新工艺后,灯管寿命是否有显著提高。( α=0.05)
1500:
0
≤μH 1500:
1
>μH
解:
645.1
05.0
=≥ zz拒绝域为:这里
645.1375.4
25200
15001675
>=
= z
拒绝H
0,
认为灯管寿命有显著提高。
已知某炼铁厂的铁水含碳量在正常情况下服从正态分布
N(4.55,0.11
2
).某日测得5炉铁水含碳量如下,4.28,
4.40,4.42,4.35,4.37,如果标准差不变,该日铁水的平均含碳量是否显著偏低?(取 α=0.05)
55.4:
1
<μH
55.4:
0
≥μH
解:
645.1
05.0
=?≤ zz拒绝域为:
364.4=x
这里
645.178.3
511.0
55.4364.4
<?=
= z
拒绝H
0
。认为含碳量偏低。
注:上题中,用双边检验或右边检验都不恰当。
若用双边检验,H
0
,μ=4.55;H
1
,μ≠4.55,则拒绝域为
96.1
025.0
=≥ zz
由|z|=3.78>1.96,故拒绝H
0
,说明可以认为该日铁水的平均含碳量显著异于4.55.但无法说明是显著高于还是低于4.55。
若用右边检验,H
0
,μ≤4.55;H
1
,μ>4.55,
则拒绝域为
645.1
05.0
=≥ zz
由z=-3.78<1.645,故接受H
0
,但无法区分是等于还是低于4.55。
2,σ
2
未知的情形--t检验
2
α
2
α
·双边检验:对于假设
H
0
:μ=μ
0;H
1
:μ≠μ
0
)1(~:
0
0
= nt
nS
X
TH
μ
真时由P{|T|≥t
α/2
(n?1)} =α,
得水平为 α的拒绝域为,|t| ≥ t
α/2
(n?1)
用热敏电阻测温仪间接温量地热勘探井底温度,重复测量7次,
测得温度℃):112.0,113.4,111.2,112.0,114.5,112.9,113.6.
而用某种精确办法测得温度的真值为112.6。试问用热敏电阻测温仪间接测温有无系统偏差? (设温度测量值X服从正态分布,取 α=0.05 )
解:H
0
:μ=112.6;H
1
:μ≠112.6
因为 σ未知,所以用t检验。
n=7,α=0.05,拒绝域为 |t|≥t
0.025
(6)=2.4469
135.1,8.112 == sx
这里
4469.2466.0|
7/135.1
6.1128.112
||| <=
=t
∴接受 H
0
,认为间接测温无系统偏差。
·右边检验
α
H
0
:μ≤μ
0;H
1
:μ >μ
0
,
由P{T≥t
α
(n?1)} =α,
得水平为 α的拒绝域为
T≥ t
α
(n?1)
某厂生产镍合金线,其抗拉强度的均值为10620(kg/mm
2
)。今改进工艺后生产一批镍合金线,抽取10根,测得抗拉强度为
10512,10623,10668,10554,10776,10707,10557,10581,10666
,10670。认为抗拉强度服从正态分布,取 α=0.05,问新生产的镍合金线的抗拉强度是否比过去生产的合金线抗拉强度要高?
解:H
0
:μ≤10620;H
1
:μ>10620
t ≥ t
0.05
(9)=1.8331
因为 σ未知,所以用 t检验。
n=10,α=0.05,拒绝域为
,81,4.10631 == sx
这里
8331.145.0
10
81
106204.10631
<=
=t
∴接受H
0
,认为新生产的线的强度不超过10620。
·左边检验
H
0
:μ≥μ
0;H
1
:μ <μ
0
,
α
由P{T≤ -t
α
(n?1)} =α,
得水平为 α的拒绝域为
T≤ -t
α
(n?1)
设正品镍合金线的抗拉强度服从均值不低于10620 (kg/mm
2
)
的正态分布,今从某厂生产的镍合金线中抽取10根,测得平均抗拉强度10600 (kg/mm
2
),样本标准差为80.,问该厂的镍合金线的抗拉强度是否不合格? ( α=0.1)
解:H
0
:μ≥10620;H
1
:μ<10620
因为 σ未知,所以用t检验。
n=10,α=0.1,拒绝域为 t ≤ -t
0.1
(9) =-1.383
,80,10600 == sx
这里
8331.179.0
10
80
1062010600
>?=
=t
∴接受H
0
,认为该厂的线的强度超过10620。
二,双正态总体均值差的假设检验
,,,,,,,设)u(NYY);u(NXX
2
22
iid
n1
2
11
iid
n1
~~
21
σσ LL
δμμδμμ
α
≠?=?
2112101
1
HH,
2
1
:;:检验假设,;,,,由观测值水平两样本独立,给定检验
n
n
yy
xx
L
L
注1:这是双边检验问题的提法,相应的单边检验问题,将等号改为不等号即可。
注2:常用的是 δ=0,也是下面讨论的重点。
1.假设两个总体的方差均未知,但它们相等 。即
22
2
2
1
σσσ ==假定用t检验
δμμδμμ ≠?=?
211210
HH,;:双边检验:
)2(~
11
,
21
21
0
+
+

= nnt
nnS
YX
TH
w
δ

).2(
)}2({
212/
212/
+≥
=?+≥
nntt
nntTP
α
α
α,即得拒绝域由对应的单边问题( δ=0)
211210
:,,μμμμ >≤ HH
右边问题:
)2(
21
+≥ nntt
α
拒绝域为
211210
:,,μμμμ <≥ HH
左边问题:
)2(
21
+?≤ nntt
α
拒绝域为比较甲,乙两种安眠药的疗效。将20名患者分成两组,
每组10人.其中10人服用甲药后延长睡眠的时数分别为1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,
4.6,3.4。另10人服用乙药后延长睡眠的时数分别为0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,
0.0,2.0。若服用两种安眠药后增加的睡眠时数服从 方差相同 的正态分布.试问两种安眠药的疗效有无显著性差异?( α=0.10)
解,因为两个总体方差未知但相等,所以用t检验。
211210
:;,μμμμ ≠= HH
)18(~
101101
,
0
t
S
YX
TH
w
+
=下
1.0,10
21
=== αnn
.7341.1)18(
05.0
=≥ tt拒绝域为
789.1,75.0
2
== sy
002.2,33.2
1
== sx
这里:
=
+
=
18
99
2
2
2
1
ss
s
w
898.1
=
+
=
101101
||
||
w
s
yx
t
86.1 7341.1>
拒绝H
0
,认为两种安眠药的疗效有显著性差异。
上题中,试检验是否甲安眠药比乙安眠药疗效显著?
211210
:;,μμμμ >≤ HH
解:
3304.1)18(:
1.0
=≥ tt拒绝域这里,t=1.86>1.3304,
故拒绝H
0,
认为甲安眠药比乙安眠药疗效显著上题中,试检验是否乙安眠药比甲安眠药疗效显著?
2.假设两个总体的方差已知,用Z检验。
δμμδμμ ≠?=?
211210
HH,;:
双边检验:
)10(
)()(
~
2
2
2
1
2
1
21
0
,为真时,当N
nn
YX
ZH
σσ
μμ
+

=
22
αα
α zz,}zzP{ ≥=≥可得拒绝域:由对应的单边问题( δ=0)
211210
:,,μμμμ >≤ HH
右边问题:
α
zz ≥
拒绝域为
211210
:,,μμμμ <≥ HH
左边问题:
α
zz?≤
拒绝域为
§8.3 正态总体方差的假设检验一、单个总体的情况
。检验未知,,,,设
22
1
,)(
~
σμσμNXX
iid
n
L
双边检验:
2
2
α
χ
2
2
1
α
χ
2
0
2
1
2
0
2
0
σσσσ ≠=:;:HH
)(n~χ
σ
)S(n-
H 1
1
2
2
0
2
2
0
=χ下
α)(nχ)(nχP =?≥∪?≤
}11{
2
2
22
2
1
2
αα
χχ由得水平为α的拒绝域为
。或)1()1(
2
2/
22
2/1
2
≥?≤
nn
αα
χχχχ
。拒绝域:
,:;:右边检验:;拒绝域:
,:;:左边检验:
)1(
)1(
22
2
0
2
1
2
0
2
0
2
1
2
2
0
2
1
2
0
2
0

>≤

<≥
n
HH
n
HH
α
α
χχ
σσσσ
χχ
σσσσ
某厂生产的保险丝,其熔化时间服从 N(μ,80)。取10
根测得数据为42,65,75,78,59,57,68,54,
55,71。问是否可以认为整批保险丝的熔化时间的方差偏大?( α=0.05)
8080
2
1
2
0
>≤ σσ:;:HH解:
n=10,α=0.05,s
2
=121.8,拒绝域为
919.16)9()9(
2
05.0
22
==≥ χχ
α
χ
2
0
2
2
9
σ
S

7.13
80
8.1219
=
×
=
这里接受H
0
,认为方差没有偏大。
设保险丝的融化时间服从正态分布,取9根测得其熔化时间(min)的样本均值为62,标准差为10.
(1)是否可以认为整批 保险丝的熔化时间服从
N(60,9
2
)? (α=0.05)
( 2)是否可以认为整批保 险丝的熔化时间的方差显著大于70?( α=0.05)
答:(1) |t|=0.6<2.306,接受 μ=60;
2.18<χ
2
=9.877<17.535,接受 σ=9。
(2) χ
2
=11.42<15.507,认为方差不显著大于70。
二、两个正态总体方差比的假设检验
,,,,,设),(NYY);,(NXX
2
22
iid
n1
2
11
iid
n1
~~
21
σμσμ LL
两样本独立,给定检验水平 α,由观测值
2
2
2
1
2
2
2
1
n1n1
21
yyxx
σ≠σσ=σ:;:检验假设
,,;,,
10
H H
LL
假定 μ
1

2
未知
)11(~,
21
2
2
2
1
0
= nnF
S
S
FH,真时
F
1?α/2
F
α/2
由P{F≤F
1?α/2
(n
1
1,n
2
1)
或F≥F
α/2
(n
1
1,n
2
1)} = α
得拒绝域
F≤F
1?α/2
(n
1
1,n
2
1)

F≥F
α/2
(n
1
1,n
2
1)
211210
:;,σσσσ >≤ HH
右边检验问题:
拒绝域为
F≥F
α
(n
1
1,n
2
1)
211210
:;,σσσσ <≥ HH
左边检验问题:
F≤F
1?α
(n
1
1,n
2
1)
拒绝域为注,对于两个总体,如果要做 t-检验,必须要方差相等。所以首先要做 F-检验。
有甲乙两种机床,加工同样产品,从这两台机床加工的产品中随机地抽取若干 产品,测得产品直径为(mm):
甲,20.5,19.8,19.7,20.4,20.1,20.9,19.6,19.9.
乙,19.7,20.8,20.5,19.8,19.4,20.6,19.2,
假定甲,乙 两台机床的产品直径都服从正态分布,试比较甲机床加工的产品是否偏大。( α=0.05 )
为比较产品的直径,要做 t-检验。为此,首先要检验两个总体的方差是否相等。
解:
2
2
2
11
2
2
2
10
H H σσσσ ≠=:;:
F
0.025
(6,7)=5.12
05.0,7,8
21
=== αnn
∴拒绝域为:F≥F
0.025
(7,6)=5.7
或F ≤ F
1?0.025
(7,6)=1/5.12 =0.1953
397.0,6298.0,20,7;204.0,4518.0,1125.20,8
2
222
2
111
====
====
ssyn
ssxn
7.551.01953.0.51.0
2
2
2
1
<<= Qss
∴接受H
0
,认为两个总体的方差相等。
( 2)检验甲的产品是否偏大。
211210
:;,μμμμ >≤ HH
7709.1)13()278(:
05.0
==?+> ttt
α
拒绝域为
397.0,6298.0,20,7;204.0,4518.0,1125.20,8
2
222
2
111
====
====
ssyn
ssxn
5414.02931.0
13
67
2
2
2
1
==
+
=
ss
s
w
)13(7709.14015.0
7181
05.0
t
s
yx
t
w
=<=
+
=
接受H
0
,认为甲机床的产品没有偏大 。
§8.4 置信区间与假设检验之间的关系
)2.4(:,:H:
1100
θθθθ ≠= H双边检验
),( θθ
检验假设(4.2)时,先求出 θ的置信度为1?α的置信区间 。然后考察 θ
0
是否落在该区间内。
若,则接受H
0;若,则拒绝H
0

),(
0
θθθ?
),(
0
θθθ ∈
为求出 θ的置信度为1?α的置信区间,先求出假设问题(4.2)的接受域(显著性水平 α)。该区域就是要求的置信区间。
单边检验问题与单侧置信区间的关系类似。
§8,6 分布拟合检验
(一) 两类问题
1、参数假设检验,,;,Θ∈θθ)(~
..
1
xfX,X
dii
n
L
总体分布已知,参数未知,由观测值 x
1
,

,x
n
检验参数,如假设 H
0
,θ=θ
0; H
1
,θ≠ θ
0
,,,XX X
~
iid
n1
L
2、非参数假设检验总体分布未知,由观测值 x
1
,

,x
n
检验关于分布的假设,如
H
0
,F(x)=F
0
(x;θ); H
1
,F(x)≠ F
0
(x;θ)
(二)数据的初步整理(拟合)
1.将样本数据画出直方图。(参见p247,例3)
2.直方图的外廓曲线接近总体X的概率密度曲线。
由此(并根据以往经验)假设总体的分布。
需要检验关于分布的假设。
(三) χ
2
分布拟合检验
H
0
,F(x)=F
0
(x;θ); H
1
,F(x)≠ F
0
(x;θ)
H
0
:总体的分布函数为 F(x)。(总体服从某分布)
H
1
:总体的分布函数不是 F(x)。(总体不服从某分布)
.,,
21
为样本观察值
n
xxx L
参见 p243例 1
.:的可能取值的全体X?
.:,,
21
的两两不相交的子集?
k
AAA L
f
i
:落在 A
i
中的样本值的个数 ——频数
f
i
/n,n次试验中 A
i
中发生的频率
p
i
=P(A
i
),n次试验中 A
i
中发生的概率若 H
0
为真,且试验次数又多时,频率与概率的差异不应太大。
当 F(x)中不含未知参数时,选择统计量
)5.6()(
1
2
2
1
2
∑∑
==
=?=
k
i
i
i
k
i
i
i
i
n
np
f
p
n
f
p
n
χ
当 F(x)中含未知参数时,选择统计量
)6.6(
)
(
1
2
2
1
2
∑∑
==
=?=
k
i
i
i
k
i
i
i
i
n
pn
f
p
n
f
p
n
χ
定理:若 n充分大 (n≥50),则当 H
0
为真,统计量
(6.5)近似服从 χ
2
(k-1)分布。统计量 (6.6)近似服从 χ
2
(k-r-1)分布。 r是被估计的参数个数。
频率与概率的差异不应太大。
22
)( χ
i
i
p
n
f
χ
2
过分大就拒绝 H
0
,所以拒绝域的形式为
χ
2
≥χ
2
α
(k-r-1)
解题步骤:
( 1)写出 H
0
( 2)估计未知参数。如没有未知参数,则 r=0。
( 3)计算概率
( 4)列表,求出 χ
2
值。
( 5)求临界点 χ
2
α
(k-r-1)。 r为估计的参数个数。
( 6)若 χ
2
≥χ
2
α
(k-r-1),则拒绝 H
0
若 χ
2

2
α
(k-r-1),则接受 H
0
p243例 1 解:
( 1) H
0
:总体服从泊松分布
( 2)由最大似然估计法得到:(可以直接用结论)
2.4100/)1111625110(
=?++?+?+?== Lxλ
!
)(
!
)()3(
i
e
iXPp
i
e
iXP
i
i
i λλ
λλ

===∴==Q
将 i=0,1,2,…,11代入上式,求出各个概率值。
002.0
1)12(
11
0
12
=?=≥=

=i
i
pXPp
( 4)列表,见 p244。
注意,对 的组要合并。
k=8 是合并后组的个数
5
<
i
pn
表的最后一列求和,得 Σ=106.281。
χ
2
= Σ - n =106.281-100=6.281.
( 5) k=8,r=1,α= 0.05,
χ
2
α
(k-r-1)=χ
2
0.05
(8-1-1)= χ
2
0.05
(6)=12.592
( 6) χ
2
=6.281<χ
2
α
(k-r-1)=12.592,
∴接受 H
0
,认为样本来自泊松分布总体 。
某仪器读数的最后一位是估读数字。理论上估读数值可以是 0,1,…,8,9这十个数码中的任何一个,
且各个数码的出现是等可能的。下表是 200次读数中估读数值的统计:
数码 0 1 2 3 4 5 6 7 8 9
出现次数 35 16 15 17 17 30 11 16 19 24
问估读数值是否有偏重某一数码的现象?
解,(1) H
0
:总体服从均匀分布。
(2) 无估计的参数。 n=200。
(3) p
i
=1/10=0.1。
(4) 列表
A
i
f
i
035
116
215
317
417
530
611
716
819
924
A
i
f
i
p
i
0350.1
1160.1
2150.1
3170.1
4170.1
5300.1
6110.1
7160.1
8190.1
9240.1
A
i
f
i
p
i
np
i
0350.120
1160.120
2150.120
3170.120
4170.120
5300.120
6110.120
7160.120
8190.120
9240.120
A
i
f
i
p
i
np
i
f
i
2
/ (np
I
)
0350.12061.25
1160.12012.8
2150.1201.25
3170.12014.5
4170.12014.5
5300.12045
6 11 0.1 20 6.05
7160.12012.8
8190.12018.05
9240.12028.
224.9
9
(4) χ
2
=224.9-n=24.9
(5) χ
2
0.05
(9)= 16.9。
(6) χ
2
=24.9 > χ
2
0.05
(9)= 16.9,
∴拒绝 H
0
,认为总体不是均匀分布。
考题( 1) P69,八。
( 2) P153,九。( P159答案要加上表格)
连续型:基本过程相同。
难点:概率值的计算。
p
i
:落在第 i 个区间的概率。
P246,例 3。