§ 6 总体参数的假设检验假设检验 是统计推断的另一个重要的组成部分。它分为参数检验与非参数检验。 参数检验 是已知总体 X的分布函数 F(x,θ) 的分布形式,对总体分布函数中的未知参数 θ 提出某种假设,然后利用样本 X1,X2,…,X n提供的信息对所提出的假设进行检验,根据检验的结果对所提出的假设作出拒绝或接受的判断。 非参数检验 是指总体 X的分布函数表达式 F(x)不知道时,假设总体 X的分布函数为某个指定的分布函数 F0(x),问怎样利用子样 X1,X2,…,X n 提供的信息来对所提出的假设作出判断,是拒绝或接受。随机变量 X与 Y之间的独立性等问题的假设检验,也属于非参数检验。
§ 6.1 假设检验的基本概念本节要求理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误。
例 1 某车间用一台包装机包装葡萄糖。包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,
其均值为 0.5公斤,标准差为 0.015公斤。某日开工后为检验包装机是否正常,随机地抽取它所包装的糖 9袋,称得净重为(公斤),0.497,0.506,0.518,0.524,0.498,
0.511,0.520,0.515,0.512,问机器是否正常?
以 μ,σ分别表示这一天袋装糖重总体 X的均值和标准差。由于长期实践表明标准差比较稳定,我们就设
σ=0.015。于是 X~N(μ,0.0152),这里 μ未知。问题是根据样本值来判断 μ=0.5,还是 μ≠0.5 。为此,我们提出两个相互对立的假设
H0,μ=μ0= 0.5 和 H1,μ≠μ0,
然后,我们给出一个合理的法则,即 实际推断原理 —小概率事件在一次实际观察中几乎不会发生 。根据这一法则,
利用已知样本作出决策是接受假设 H0 (即拒绝假设 H1 ),
还是拒绝假设 H0(即接受假设 H1 )。如果作出的决策是接受 H0,则认为 μ=μ0,即认为机器工作 是正常的,否则,则认为是不正常的。
由于要检验的假设涉及总体均值 μ,故首先想到是否可借助样本均值 这一统计量来进行判断。我们知道,
是 μ 的无偏估计,的观察值的大小在一定程度反映 μ 的大小。因此,如果假设 H0为真,则观察值与 μ0的偏差 一般不应太大。若过分大,我们就怀疑假设 H0的正确性而拒绝 H0,并考虑到当 H0为真时 。
X
X X
x 0x 0x
)1,0(~
/
0 N
n
X

而衡量 的大小可归结为衡量的大小。基于上面的想法,我们可适当选定一正数 k,使当观察值 满足时就拒绝假设 H0,反之,若,就接受 H0 。
然而,由于作出决策的依据是一个样本,当实际上
H0为真时仍可能作出拒绝 H0的决策( 这种可能性是无法消除的),这是一种错误,犯这种错误的概率记为
P{当 H0为真拒绝 H0 }或 或记号 表示参数 μ取 μ0时事件 {·}的概率,
表示 μ取 H0规定的值时事件 {·}的概率。
0x n
x
/
0

k
n
x
/
0
k
n
x
/
0
x
}{ 00 HP 拒绝? }{ 00 HP H 拒绝
}{0P }{
0HP?
我们无法排除犯这类错误的可能性。因此自然希望将犯这类错误的概率控制在一定限度之内,即给出一个较小的数 α(0<α<1),使犯这类错误的概率不超过 α,即使得
( 1)
为了确定常数 k,我们考虑统计量 。由于只允许犯这类错误的概率最大为 α,令( 1)式右端取等号,即令
}{ 00 HHP 为真拒绝当
n
X
/
0



k
n
XPHHP
/
}{ 000
0
为真拒绝当由于当 H0,为真时,
由标准正态分布分位点的定义知
k=uα/2
因而,若 U的观察值满足则拒绝 H0,而若则接受 H0 。
例如,在本例中取 α=0.05,则有 k=u0.05/2=1.96,又已知 n=6,σ=0.015,再由样本算得,
即有于是拒绝 H0,认为这天包装机工作不正常。
)1,0(~
/
0 N
n
XU

2/
0
/
uk
n
xu
2/
0
/
uk
n
xu
96.12.2
/
0
n
xu
5 1 1.0?x
上例中所采用的检验法则是符合实际推断原理的。因通常 α 总是取得较小,一般 α =0.01,0.05。若 H0为真,即当 μ=μ0 时,
是一个小概率事件,根据实际推断原理,
就可以认为,如果 H0为真,则由一次实验得到的观察值,满足不等式 几乎是不会发生的。现在在一次观察中竟然出现了满足 的,则我们有理由怀疑原来的假设 H0的正确性,因而拒绝 H0 。若出现的观察值满足,此时没有理由拒绝 H0,因此只能接受假设 H0 。
在上例的做法中,我们看到当样本容量固定时,选定 α 后,数 k
就可以确定,然后按照统计量 的观察值的绝对值




2/
0
/
u
n
X
x
2/
0
/
u
n
x
2/
0
/
u
n
x
n
XU
/
0

2/
0
/
u
n
x x
x
大于等于 k还是小于 k来作出决策。数 k是检验上述假设的一个门槛值。
如果,则称 与 μ0 的差异是显著的。
这时拒绝 H0 ;反之,如果,则称 与
μ0 的差异是不显著的,这时接受 H0 。数 α 称为 显著性水平,上面关于 与 μ0有无显著差异的判断是在显著性水平 α之下作出的。
统计量 称为检验统计量 。
前面的检验问题通常叙述成:在显著性水平 α下,检验假设
(2)
也常说成“在显著性水平 α下,针对 H1 检验 H0” 。 H0称为 原假设 或零假设,H1称为 备择假设 (意指在原假设被拒绝后可供选择的假设)
或对立假设。我们要进行的工作是,根据样本,按上述检验方法作出决策在 H0与 H1两者之间接受其一。
k
n
xu
/
0
xk
n
xu
/
0
n
XU
/
0

0100,,, HH
x
x
当检验统计量取某个区域 C中的值时,我们拒绝原假设 H0,则称区域 C为 拒绝域,拒绝域的边界点称为临界点 (临界值 )。而上例中拒绝域为,而 u= - uα/2,u=uα/2为临界点。
由于检验法则是根据样本作出的,总有可能作出错误的决策。
如上面所说的那样,在假设 H0实际上为真时,我们可能犯拒绝 H0的错误,称这类“弃真”的错误为 第一类错误 。又当 H0实际上不真时,
我们也有可能接受 H0 。称这类“取伪”的错误为 第二类错误 。犯第二类错误的概率(其大小用 β来表示)记为
P{当 H0不真接受 H0}或 。
为此,在确定检验法则时,我们应尽量使犯两类错误的概率都较小。但是,进一步讨论可知,一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往增大。若要使犯两类错误的概率都减小,除非增加样本容量。在给定样本容量的情况下,一般来说,我们总是控制犯第一类错误的概率,使它不大于 α 。 α 的大小视具体情况而定,通常 α 取 0.1,0.05,0.01,0.005等值。
这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的概率的检验,称为 显著性检验 。
}{ 01 HP H 接受
2/?uu?
形如( 2)式中的备择假设 H1表示 μ 可能大于 μ0,也可能小于
μ0,,称为双侧备择假设,而称形如( 2)式的假设检验为 双侧假设检验 。
有时,我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度。这时,所考虑的总体的均值应该越大越好。如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺。此时,我们需要检验假设
( 3)
形如( 3)的假设检验,称为 右侧检验 。类似地,有时我们需要检验假设 ( 4)
形如( 4)的假设检验,称为 左侧检验 。右侧检验和左侧检验统称为单侧检验 。
下面来讨论单侧检验的拒绝域。
设总体,σ 为已知,X1,X2,…,X n是来自 X
的样本。给定显著性水平 α 。我们来求检验问题
( 3)
的拒绝域。
因 H0中的全部 μ都比 H1中的 μ要小,当 H1为真时,观察值往往偏大,因此,拒绝域的形式为
( k是某一正常数)
0100,,, HH
0100,,, HH
),(~ 2NX
x
kx?
0100,,, HH
下面来确定常数 k,其做法与例 1中的做法类似。
(上式不等号成立是由于 事件要控制只需令
( 5)
由于由( 5)得到 o
x
f(x)
u






n
k
n
X
P
n
k
n
X
P
kXPHHP H
////
}{}{
000
00
00
0

为真拒绝当
n
X
n
X
//,
0
0?







n
k
n
X
n
k
n
X
////
000
}{ 00 HHP 为真拒绝当


n
k
n
XP
//
0
0
)1,0(~/ NnX

u
n
k
/
0
,即得检验问题的拒绝域为即 ( 6)
类似地,可得左侧检验问题的拒绝域为
( 7)
o
x
f(x)
u?
u
n
k 0
u
nx 0

u
n
xu
/
0
0100,,, HH

u
n
xu
/
0
例 2 某工厂生产的固体燃料推进器的燃烧率服从正态分布 N(μ,σ2),μ=40cm/s,σ=2cm/s 。现在用新方法生产一批推进器,从中随机取 n=25
只,测得燃烧率的样本均值 =41.25cm/s。设在新方法下总体方差仍为 2cm/s,问用新方法生产的推进器的燃烧率是否较以往的推进器的燃烧率有显著的提高?取显著性水平 α =0.05。
解 按题意需检验假设
(即假设新方法没有提高燃烧率)
(即假设新方法提高了燃烧率)
40,00H
01,H
x
综合所述,可得处理参数的假设检验问题的步骤如下:
1 根据实际问题的要求,提出原假设 H0及备择假设 H1 ;
2 给定显著性水平 α以及样本容量 n;
3 确定检验统计量以及拒绝域的形式;
4 按 求出拒绝域;
5 取样,根据样本观察值作出决策,是接受
H0还是拒绝 H0 。
在统计假设检验中如何确定原假设 H0和备择假设 H1?
}{ 00 HHP 为真拒绝当在实际问题中,通常把那些 需要着重考虑的假设视为原假设 。( 1)如果问题是要决定新提出的方法是否比旧方法好,往往 将原方法取为原假设 H0,而将新方法取为备择假设 H1 ; ( 2)若提出一个假设,检验的目的仅仅是为了判别这个假设是否成立,此时直接取此假设为原假设 H0即可。
在数学上看,原假设 H0与备择假设 H1 的地位是平等的,但在实际问题中,如果提出的假设检验仅仅控制了犯第一类错误的概率,那么选用哪个假设作为原假设 H0,
要依具体问题的目的和要求而定。 它取决于犯两类错误将会带来的后果,一般地可根据以下三个原则选择哪个作为原假设 H0,( 1)当目的是希望从样本观察值取得对某一论断强有力的支持时,把这一论断的否定作为原假设 H0 ;( 2)尽量使后果严重的一类错误成为第一类错误;( 3)把过去资料所提供的论断作为原假设 H0,
这样当检验后的最终结论为拒绝 H0时,由于犯第一类错误的概率被控制而显得有说服力或危害较小。
§ 6.2 单个正态总体的假设检验本节要求掌握单个正态总体的均值的 u检验,t检验和其方差的检验。
§ 6.2.1 已知 σ2 时正态总体均值的 u检验在 § 6.1中已讨论过正态总体 N(μ,σ2) 当 σ2已知时关于总体均值 μ的检验问题( 2)、( 3)、( 4)。在这些检验问题中,我们都是利用统计量 来确定拒绝域的。这种检验法常称为 u检验法 。
正态总体 u检验表条件 假设 统计量样本值 拒绝域正态 双侧总体,
σ2 左侧已知右侧
0100,,, HH
0100,,, HH
2?
n
XU
/
0

0100,,, HH
n
xu
/
0

2/?uu?
uu
uu?
下面按双侧检验分别介绍检验判断的三种方法。
1 临界值法 因为样本 X1,X2,…,X n 取自正态总体 且 σ2 已知,在原假设 H0:μ=μ0
成立下有
( 2.1)
选定检验水平 α 值后,查附表得双侧临界值 uα/2。
用统计量样本值的绝对值同 uα/2比较:若 则拒绝 H0,
否则接受 H0 。
),(~ 2NX





2/02/
//
u
n
XPu
n
XP
n
xu
/
0

2/?uu?
2置信区间法 若考虑临界值法中式 (2.1)的随机事件的对立事件,则在原假设 H0:μ=μ0 成立下有即
( 2.2)
这就是说,当一次研究观察所得置信度为 1-α的置信区间不包含 μ0 时,
则拒绝 H0,否则不拒绝 H0 。



1
2/02/ nuXnuXP


1
/ 2/
0 u
n
XP



nuxnux

2/2/,
3 P值方法 上节已经知道,检验中拒绝 H0时,犯第一类错误的概率 α 越小越好;接受 H0时,犯第二类错误的概率 β 越小越好 。然而,前面两种方法是在指定 α 后再由
α 定临界值,进而由所得拒绝域或置信区间作出判断。
对于预先指定的 α 所得的临界值往往与统计量的样本值相差较大,这就使得指定的 α 常常不能确切地反映该观察样本在拒绝 H0上所具有的概率水平。也不能反映在同一水平 α下拒绝 H0的两个不同样本的差别。因此,多数学者建议采用 P值方法。
P值是用统计量样本值作相应的临界值所确定的概率水平 。
在双侧检验中,以 作双侧临界值 uP/2,
按双侧分位数定义 P值为
n
xu
/
0








n
x
n
XPu
n
XPP
P ///
0
2/?
当原假设 H0:μ=μ0 成立时,有这时,对给定的检验水平 α,
当 P<α 时,则故拒绝 H0,否则不拒绝 H0。
这样,利用 P值是否小于
α作判断得出的结论不仅与临界值法相同,而且从 P值的大小还可以了解该观察样本在拒绝 α时所具有的概率水平。
Pu
n
XPu
n
XP?






//
0
2/?uu?
例 3 从总体 N(μ,0.0282) 中取得一组观察值:
1.98,1.88,2.06,2.00,1.80,2.04。试用临界值法、置信区间法和 P值方法对 H0:μ=2,H1:μ≠2 作判断。
解 ( 1)临界值法
1)提出假设 H0:μ=2,H1:μ≠2
2)统计量样本值:因为故在原假设 H0:μ=2成立下统计量样本值为
3) 给定 α 值求临界值作判断结论:取 α =0.05,查附表得
u0.05/2=1.96,由于,故按水平 α =0.05拒绝 H0 。
( 2) 置信区间法
1)提出假设 H0:μ=2,H1:μ≠2
2)给定 α求 1-α的置信区间:取 α =0.05,u0.05/2=1.96,而
σ2 = 0.0282,则
4993.36/028.0 296.1/ 0 nxu
96.1,028.0 x?
96.1?u
02.096.16028.096.196.12/2,1 nux
故 95%的置信区间为 [1.94,1.98]。
3)作判断结论:因为在原假设 H0:μ=2成立下 95%的置信区间不包含 μ0=2,故按水平 α =0.05拒绝 H0 。
( 3) P值方法
1)提出假设 H0:μ=2,H1:μ≠2
2)统计量样本值:因为故在原假设 H0:μ=2成立下统计量样本值为
3)定 P值范围作判断结论:以 作双侧临界值
uP/2,在 H0:μ=μ0 成立下有查附表有 u0.001/2=3.29053,u0.0001/2=3.89059,因而有 u0.001/2<uP/2<
u0.0001/2,即得 P值的所在范围,0.0001<P<0.001。故按 P<0.001拒绝
H0,即认为该样本的总体 μ 与 2有显著性差异。
96.1,028.0 x?
4993.36/028.0 296.1/ 0 nxu
4 9 9 3.3?u
Pu
n
XP
n
XP
P




2/00
/
4 9 9 3.3
/?
这里,虽然写的是按 P<0.001拒绝 H0,实际上是表示显著性水平
α 在取 0.05,0.01,…,0.001 等时,都有 P<α 或,因而,都会拒绝 H0 。 显然,这种以 P值大小作统计结论的方法,既给读者接受结论留出了足够的空间,同时也充分表达了该样本在拒绝 H0时所具有的概率水平。
单侧检验的三种判断方法与双侧检验类似。如对左侧检验的 P值方法,以 作为左侧临界值 -uP,则当 成立时,,则相关事件故这样,对选定的检验水平 α,当 P<α,则因而拒绝 H0,否则不拒绝 H0 。
2/?uu?
n
xu
/
0







n
x
n
XPu
n
XPP
P ///
0
0
n
X
n
X
//
0







n
x
n
X
n
x
n
X
////
000
PnxnXPnxnXP?


////
000

u
n
xu
/
0
§ 6.2.2 未知 σ2时正态总体均值的 t检验
1 t检验的原理 设 X1,X2,…,X n是 来自正态总体
X~N(μ,σ2) 的一个样本,σ2未知,我们来求检验问题
H0:μ=μ0,H1:μ μ0
的拒绝域(显著性水平为 α )。
由于 σ2未知,现在不能利用 来确定拒绝域了。
注意到 S2 是 σ2的无偏估计,用 S来代替 σ,采用作为检验统计量。当观察值 过分大时就拒绝 H0,
拒绝域的形式为
n
X
/
0

nS
Xt
/
0
ns
xt
/
0
k
ns
xt
/
0?
由抽样分布定理知,当 H0为真时,
故由得 k=tα/2(n-1),即得拒绝域为上述利用 t统计量得出的检验法称为 t检验法 。
正态总体 t 检验表条件 假设 统计量样本值 拒绝域正态 双侧总体,
σ2 左侧未知右侧
)1(~
/
0 nt
nS
X?




k
nS
XPHHP
/
}{ 000
0
为真拒绝当
)1(
/ 2/
0 nt
ns
xt
ns
xt
/
0
)1(2/ ntt?
tt
tt?
0100,,, HH
0100,,, HH
0100,,, HH
2 t检验方法 下面结合实例介绍 t检验的具体操作步骤。
例 4 某药厂生产复合维生素,要求每 50g中含铁
2400mg。现从某批产品中任取 5份样品,测定结果(单位,mg/50g)是 2434,2436,2440,2504,2441。若该批产品含量服从正态分布,试判断,
( 1)该批产品铁含量的总体均数与 2400是否有显著性差异?
( 2)该批产品铁含量的总体均数是否高于 2400?
最后需要指出的是,如果样本容量较大时,S2近似于 σ2,
这时 t检验与 u检验近似,因此,t检验可作为小样本的正态总体均数检验,u检验可作为大样本的正态总体均数检验。
§ 6.2.3 正态总体方差的 检验方差与标准差反映随机变量取值的离散程度。方差越大,数据越分散,方差越小,数据越集中在均数附近。在工农业生产中,为了使生产比较稳定,需要控制方差。
设总体 X~N(μ,σ2),μ,σ2均未知,X1,X2,…,X n是来自 X的样本。要求检验假设(显著性水平为 α ):
H0:σ2=σ02,H1:σ2≠σ02
σ02为已知常数。
由于 S2是 σ2的无偏估计,当 H0为真时,观察值 s2与 σ02
的比值一般来说应在 1附近摆动,而不应过分大于 1或过分小于 1。由抽样分布定理知当 H0为真时
2?
)1(~)1( 22
0
2
nSn
我们取作为检验统计量,如上所说知道上述检验问题的拒绝域具有以下的形式:
或此处 k1,k2 的值由下式确定:
2
0
2
2 )1(

Sn
12
0
2)1(
ksn 22
0
2)1(
ksn







22
0
2
12
0
2
00
)1()1(}{
2
0
2
0
kSnPkSnPHHP?为真拒绝当为计算方便起见,习惯上取故得于是得拒绝域为或
2
)1(,
2
)1(
22
0
2
12
0
2
2
0
2
0


kSnPkSnP
)1(),1( 2 2/22 2/11 nknk
)1()1( 2 2/12
0
2
nsn
)1()1( 2 2/2
0
2
nsn
下面来求单侧检验问题(显著性水平为 α )
H0:σ2≤σ02,H1:σ2>σ02
的拒绝域。因 H0中的全部 σ2都比 H1中的 σ2要小。当 H1为真时,S2的观察值 s2往往偏大,因此拒绝域的形式为 s2≥k
下面来确定常数 k。
要控制 P{当 H0为真拒绝 H0}≤α,只需令因由上式得
)(
)1()1(
)1()1(
}{}{
2
0
2
2
0
2
2
2
0
2
0
2
2
00
2
0
2
2
0
22
0
2









因为为真拒绝当
knSn
P
knSn
PkSPHHP


2
0
2
2 )1()1(
2
0
2
knSnP
)1(~)1( 22
2
nSn
)1()1( 22
0
nkn
于是,得检验问题的拒绝域为即类似地,可得左侧检验问题的拒绝域为以上检验法称为 检验法。
正态总体方差 的 检验表条件 假设 统计量样本值 拒绝域正 双态 侧总体 左侧右侧
)1(1 2
2
0?
nnk
)1(1 2
2
02?
nns
)1()1( 2
2
0
2
2 nsn

20212020,,, HH
)1()1( 212
0
2
2
n
sn

20212020,,, HH
20212020,,, HH
20212020,,, HH
2?
2
0
2
2 )1(

sn
212
22
2?
2
2/
2
2
2/1
2


或例 5 某制药车间为提高药物生产的稳定性,在采取措施后试产了 9批,其收率( %)是:
79.2,75.6,74.4,73.5,76.8,77.3,78.1,76.3,75.9。若已知收率服从正态分布,试判断,( 1)收率的总体方差是否同原方差 13有显著性差异?( 2)收率的总体方差是否低于原方差 13?
§ 6.3 两个正态总体的假设检验本节要求掌握两个正态总体均值的配对资料的 t检验和两个独立正态总体均值的成组资料的 t检验(方差齐性),
掌握两个独立正态总体方差比较的 F检验,了解方差不齐的两个独立正态总体均值的成组 t检验和多个独立样本正态总体方差齐性的 检验。
实际工作中,除需要判断某种处理结果与某一已知结果间的差异(单个正态总体的假设检验)外,还需比较两种处理的效果,即比较两个正态总体的同一参数的差异。
2?
§ 6.3.1 配对资料的 t检验在医药试验中,为提高检验效率,避免非处理因素干挠分析结果,在实验设计时,常把非处理因素相同或相近的试验对象配成对子,分 别用不同的处理方法,然后比较这两种处理结果的差异。这种方法经常用于比较两种产品,或两种仪器、两种方法等的差异。
设配对试验结果有如下数据资料,
甲种处理结果 Xi X1 X2 … X n
乙种处理结果 Yi Y1 Y2 … Y n
差值 Di=Xi-Yi D1 D2 … D n
显然,每一对数据 Xi与 Yi 并不独立,但是 n对数据
(X1,Y1),(X2,Y2),…,(X n,Yn)之间相互独立,令 D1=X1–Y1,
D2=X2–Y2,…,D n=Xn–Yn,则 D1 D2 … D n 相互独立 。又由于 D1 D2 … D n是由同一因素所引起的,可认为它们服从同一分布。(注意:表中的第一行或第二行不一定能看成是同分布随机变量的观察值,即不一定能看成是一个样本的样本值)
假设 Di~N(μD,σD2),i=1,2,…,n。这就是 D1
D2 … D n说构成正态总体 N(μD,σD2)的一个样本,其中
μD,σD2 未知。我们基于这一样本检验假设:
( 1) H0:μD=0,H1:μD≠0 (双侧检验)
( 2) H0:μD≤0,H1:μD>0 (右侧检验)
( 3) H0:μD≥0,H1:μD<0 (左侧检验)
分别记 D1 D2 … D n的样本均值和样本方为,且按单个正态总体均值的 t检验知在原假设 H0:μD=0成立下的统计量为检验问题 (1),(2),(3)的拒绝域分别为(检验水平为 α ):
2,dSD
)1(~
/
0 nt
nS
DT
d
)1(
/
)1(
/
)1(
/
2/


nt
ns
d
tnt
ns
d
t
nt
ns
d
t
dd
d

例 6 某药厂每次取一定量的石灰原料混匀后分成两份,分别用不同的流速生产无水醇,共生产 10批。其含醇率 (%)如下甲种流速含醇率 xi (%) 95 97 94 96 92 92 95 92 86 92
乙种流速含醇率 yi (%) 98 95 98 99 96 96 94 90 89 96
差值 di=xi–yi -3 2 -4 -3 -4 -4 1 2 -3 -4
试比较两种流速生产的无水醇含醇率有无差别。( α =0.05)
解 设差值 Di=Xi-Yi 服从 N(μ D,σ D2)
H0:μ D=0,H1:μ D≠ 0
由配对资料得则统计量样本值因为 α =0.05,df=n-1=9,查附表得 t0.05(9)=2.262 。因故拒绝 H0,即认为两种流速生产的无水醇含醇率有显著性差异。
3
60,
9
60)(
1
1,2
1
22
d
n
i
id sddnsd
449.2
103/60
2
/

ns
dt
d
)9(2/05.0tt?
试验并不都能进行配对设计,有时只能把试验对象随机分作两组,分别采用不同的处理,然后比较其结果,通常称两独立样本的比较为成组(两组)比较。 下面分别介绍有、无方差齐性两正态总体均值比较的检验原理和方法,
§ 6.3.2 两独立样本正态总体均数比较的 t检验
1 有方差齐性两正态总体均数比较的 t检验设两独立样本 X1,X2,…,X n1与 Y1,Y2,…,Y n2分别来自总体 N(μ1,σ12)和 N(μ2,σ22),且 σ12=σ22=σ2,由抽样分布定理可知:
其中
)2(~
11
)()(
21
21
21

nnt
nn
S
YX
T

2
)1()1(
21
2
22
2
112


nn
SnSnS
成组比较 t检验表假设 统计量样本值 拒绝域双侧左侧右侧
211
210
:
:


H
H
211
210
:
:


H
H
211
210
:
:


H
H
21
11
nn
s
yx
t
)2( 212/ nntt?
)2( 21 nntt?
)2( 21 nntt?
例 7甲乙两厂生产同一药物,现分别从其产品中抽取若干样品测定其含量,结果如下,
甲厂 (X) 0.51 0.49 0.52 0.55 0.48 0.47
乙厂 (y) 0.56 0.58 0.52 0.59 0.49 0.57 0.54
若已知两厂产品的药物含量均服从正态分布,且方差相同,试判断,(1)
两厂药物含量的总体均数是否相同? (2) 甲厂药物含量的总体均数是否低于乙厂?
解 设 X~ N(μ1,σ12),Y~ N(μ2,σ22),且 σ12=σ22=σ2 。
问题( 1)用双侧 t检验作判断,H0:μ1=μ2,H1:μ1≠μ2
由数据的则联合样本方差为故统计量样本值为
32
22
42
11
102 6 6 7.1,55.0,7
,106 6 6 7.8,5 0 3.0,6


syn
sxn
0 3 2 4 9.0,0 8 4 9.12 )1()1(
21
2
22
2
112

s
nn
snsns
5 6 4 6.2
7
1
6
1
0 3 2 9.0
55.05 0 3.0
11
21

nn
s
yx
t
给定 α =0.05,df=n1+n2–2 =11,查附表得 t0.05/2(11)=2.201 。因为
,故拒绝 H0,即认为甲乙两厂药物含量的总体均数有显著性差异。
问题( 2)用左侧 t检验作判断:
H0:μ1≥μ2,H1:μ1<μ2
统计量样本值 t= -2.5646
给定 α=0.025,df=n1+n2–2 =11,查附表得 t0.025 =t0.05/2(11)=2.201 。
因为 t< –t0.025(11),故拒绝 H0,即认为甲厂产品药物含量的总体均数低于乙厂有统计学意义。
)11(2/05.0tt?
2 无方差齐性两正态总体均值比较的 t检验设两独立样本的正态总体分别为 N(μ1,σ12)和 N(μ2,σ22),
若无方差齐性,即 σ12≠σ22,则不能用前一方法。因此,
必须寻找新的方法。最常用的一种方法是校正自由度 t检验法,这是一种近似方法,检验步骤与
t检验相同,检验统计量为自由度校正公式为显然,当 s12远大于 s22时,,检验的敏感性较差 。
2
2
2
1
2
1
n
S
n
S
YX
T




4
2
4
1
2
2
2
1
21 2
1)2(
ss
ssnndf
)2(21 21 nndf
例 8 设甲乙两种降压药的降压值( kPa)均服从正态分布,且方差不相等。今从临床分别获得甲乙两种药物治疗病例数及其降压值的均数和标准差如下:
试比较两种降压药的降压效果是否相同?
解 设甲乙两种药物的降压值 X~N(μ1,σ12)与 Y~N(μ2,σ22),且
σ12≠σ22,故用无方差齐性的正态总体均数比较的 t检验。
H0:μ1=μ2,H1:μ1≠μ2
由数据的统计量样本值因为给定 α =0.05,查附表 7有 t0.05/2(14)=2.145,t0.05/2(15)=2.131,因为故拒绝 H0,即认为甲乙两种降压药的降压效果有显著性差异。
43.0,78.1,12;66.1,85.2,16 2211 synsxn
47.2
12
43.0
16
66.1
78.185.2
22
2
2
2
1
2
1

n
s
n
s
yx
t
7 3 6 8.1421)2( 4
2
4
1
2
2
2
1
21


ss
ssnndf
)15(),14( 2/05.02/05.0 tttt
§ 6.3.3 两独立样本正态总体方差比较的 F检验在成组比较的 t检验中,必须先看两正态总体方差是否相等,
然后再决定检验方法。 那么,如何由样本观察值判断两正态总体方差是否相等呢?
设两独立样本 X1,X2,…,X n1与 Y1,Y2,…,Y n2分别来自总体 N(μ1,σ12)
与 N(μ2,σ22) 。其样本方差分别为 S12,S22。 且设 μ1,μ2,σ12,σ22均未知。我们讨论具有代表性的下述 2种检验问题:
( 1) H0,σ12=σ22,H1,σ12≠σ22
(2) H0:σ12≤σ22,H1:σ12>σ22
关于 (1),因为当 H0成立时,σ12/σ22 =1,而 S12,S22分别为 σ12,σ22的无偏估计量,所以通常 S12 / S22应接近 1,既不太大,也不太小。如果 S12 / S22
偏大或偏小,我们就不能认为 H0成立,而应认为 H1成立。特别当我们总是假定 s12≥ s22 时,则仅当 S12 / S22偏大时我们拒绝 H0,所以 H0
的拒绝域的形式为 S12 / S22 ≥ k
常数 k确定如下:
P{当 H0为真拒绝 H0}=
要控制 P{当 H0为真拒绝 H0} ≤ α
只需令


kS
SPk
S
SP
2
2
2
2
2
1
2
1
2
2
2
1
/
/
2
2
2
1
2
2
2
1?



kS
SP
2
2
2
2
2
1
2
1
/
/
2
2
2
1
由抽样分布定理知得 k=Fα/2(n1-1,n2-1) 。即得检验问题的拒绝域为上述检验法称为 F检验法 。
关于( 2),当 H0为真,E(S12)= σ12≤σ22 =E(S22),当 H1为真时,
E(S12)= σ12>σ22 =E(S22)。当 H1为真时,观察值 S12 / S22有偏大的趋势,
故拒绝域具有形式 S12 / S22 ≥ k
常数 k确定如下:
P{当 H0为真拒绝 H0}=
要控制 P{当 H0为真拒绝 H0} ≤ α
只需令
)1,1( 212/2
2
2
1 nnF
s
sF
)1,1(~// 212
2
2
2
2
1
2
1 nnF
S
S


kS
SPk
S
SP
2
2
2
2
2
1
2
1
2
2
2
1
/
/
2
2
2
1
2
2
2
1?



kS
SP
2
2
2
2
2
1
2
1
/
/
2
2
2
1
由抽样分布定理知得 k=Fα(n1-1,n2–1)。
即得检验问题( 2)的拒绝域为
)1,1( 212
2
2
1 nnF
s
sF
)1,1(~// 212
2
2
2
2
1
2
1 nnF
S
S
例 9 分别判断,( 1)例 7的两正态总体具有方差齐性;
( 2)例 8的两正态总体具有 σ12>σ22 。
解 ( 1)判断例 7的两正态总体具有方差齐性用双侧 F检验。
H0,σ12=σ22,H1,σ12≠σ22
由例 7的结果知,乙厂产品含量的样本方差值大于甲厂,故以
X~N(μ1,σ12) 表示乙厂产品药物含量,Y~N(μ2,σ22) 表示甲厂产品的药物含量。这样 s12=1.2667× 10-3,s22=8.6667× 10-4,因而统计量样本值给定 α =0.2,df1=n1-1=6,df2=n2-1=5,查附表得
F0.2/2(6,5)=F0.1(6,5)=3.4,因为 F<F0.2/2(6,5),故接受 H0,即可认为两正态总体方差齐性。
( 2) 判断例 8的两正态总体方差有 σ12>σ22,用单侧 F检验。
由例 8的结果知 s12=1.662,s22=0.432,因此,统计量样本值给定 α =0.01,df1=n1-1=15,df2=n2-1=11,查附表得 F0.01(15,11)=4.25,
因 F>F0.01(15,11),故拒绝 H0,即可认为 σ12>σ22 。
4 6 1 6.1106 6 6 7.8 102 6 6 7.1 4
3
2
2
2
1?

s
sF
9 0 3 2.1443.0 66.1 2
2
2
2
2
1
s
sF
例 10 某化工厂为了提高某种化工厂产品收率,提出了两种方案,为了研究哪一种方案好,分别用两种工艺各进行了 10 次试验,数据如下,
甲 68.1 62.4 64.3 64.7 68.4 66.0 65.5 66.7 67.3 66.2
乙 69.1 71.0 69.1 70.0 69.1 69.1 67.3 70.2 72.1 67.3
假设收率服从正态分布,问方案乙是否比方案甲显著提高收率?
解:设甲方案和乙方案的收率分别服从 N(μ1,σ12) 和 N(μ2,σ22) 。
由数据得
( 1)首先检验两正态总体方差是否齐性,作假设
H0,σ12=σ22,H1,σ12≠σ22
计算统计量样本值给定 α =0.2,df1=n1-1=9,df2=n2-1=9,查附表得
F0.2/2(9,9)=F0.1(9,9)=2.44 。因为 F<F0.2/2(9,9),所以接受 H0,即认为两正态总体方差齐性。
2244.2,43.69
3511.3,96.65
2
2
2
1


sy
sx
51.12 2 4 4.2 3 5 1 1.32
2
2
1
s
sF
( 2)再检验乙方案收率是否比甲方案收率有显著性提高。作假设
H0:μ1≥μ2,H1:μ1<μ2 (左侧检验)
给定 α =0.01,df= n1 + n2 -2=18,查附表得
t0.01(18)=t0.02/2(18)=2.552,因为 t< -t0.01(18),所以拒绝 H0,接受 H1,
即认为乙方案可以比甲方案显著提高收率。
6697.1
2
)1()1(
21
2
22
2
11?


nn
snsns
647.4
10
1
10
1
6697.1
43.6996.65
11
21


nn
s
yx
t
§ 6.3.4 多个独立样本正态总体方差齐性的 检验设从 k个正态总体 N(μi,σi2),分别独立地抽取样本
X1j,X2j,…,X nj,j(j=1,2,…k) 。检验假设为
H0:σ12=σ22=…=σ k2= σ2,H1,H0不成立记在 H0:σ12=σ22=…=σ k2= σ2成立时,常用 k个总体的样本方差 sj2
( j=1,2,…,k)的加权平均来估计其共同的方差 σ2 。即可以证明,在 H0成立时有
2
1
2
1
)(11,1


jj n
i
jij
j
j
n
i
ij
j
j XXnSXnX

k
j
j
k
j
jj
n
Sn
S
1
1
2
22
)1(
)1(

2?
)1(~ln)1( 2
1
2
2
2
k
S
Snjn
j j
j
若以样本值作上侧临界值,在 H0成立时有选定检验水平 α,当 P<α 时,有,因而拒绝 H0,否则不拒绝 H0 。
例 11 某种麻醉药对四种品系的小鼠的麻醉维持时间如下表所示,
如果每一品系小鼠的麻醉维持时间均服从正态分布,试判断四种品系小鼠麻醉维持时间的方差是否有显著性差异。
四种品系小鼠麻醉维持时间( min)
品系 A B C D
维 28 36 35 32
持 31 37 30 27
时 26 32 28 30
间 29 24 25
33
nj 4 3 4 5
sj2 4.333 7.0000 20.9167 11.3
ln sj2 1.4663 1.9459 3.0405 2.4248
)1(2?kP?
PkSSnPssnSSnP P
j
k
j
j
j
k
j
j
j
k
j
j








)1(ln)1(ln)1(ln)1( 22
2
1
2
2
1
2
2
1
22
解 设第 j( j=1,2,3,4)品系小鼠麻醉维持时间 X~N(μj,σj2)。
H0:σ12=σ22=…=σ k2= σ2,H1,H0不成立由表中数据得 n1=4,n2=3,n3=4,n4=5,
s12=4.3333,s22=7,s32=20.9167,s42=11.3,则以 查附表 6得因为 所以 0.5<P<0.7,故按 P>0.5 不拒绝 H0,即可认为四种品系小鼠麻醉维持时间的方差无显著性差异或者说四个总体具有方差齐性。
2 4 5 8.11
12
3.1149 1 6 7.203723 3 3 3.43
)1(
)1(
4
1
4
1
2
2
j
j
j
jj
n
sn
s
9 2 8 6.1
4 2 4 8.240 4 0 5.339 4 5 9.124 6 6 3.13(42.212
ln)1()1(lnln)1(
4
1
2
4
1
2
4
1
2
2
2


j
jj
j
j
j j
j snnss
s
n?
31,9 2 8 6.1)( 22 kdfdfP 424.1)3(,366.2)3( 2 7.02 5.0
)3()3()3( 2 5.022 7.0 P
§ 6.4 二项分布和泊松分布总体的参数检验
§ 6.4.1 单个总体的参数检验一、精确方法 ----置信区间法双侧检验用 p的( 1-α)置信区间;
单侧检验用 p的( 1- 2α)置信区间。
1.二项分布总体率 p的假设检验:
例 1:某药治疗偏头痛的有效率为 48%,现用一种新药对
12名患者进行治疗,结果 9人有效,试问新药的有效率是否与原来的药物的有效率相同。
2.泊松分布总体参数的假设检验例 2:将一个面积 100平方厘米的培养皿置于某病室中,1小时后取出培养 24小时,查得菌落 4个。
试判断该病室平均每 100平方厘米的菌落数是否低于 10个。
二、大样本正态近似法
1、二项分布根据中心极限定理,当 n较大时,近似有在原假设 成立时,检验的统计量为当具备条件,与 均大于 5,且 与均不接近于零,可用 u检验法进行检验。
),(~
1
pnBXX
n
i
i?
)1,0(~
/)1(
/)1()1(
N
npnp
pp
npp
p
n
X
pnp
npXU


00,ppH?
npp
ppu
/)1(
00
0

pn? )?1( pn? p?
p?1?
例 3:设从新工艺生产的一批药品中随机抽检了
90个样品,结果有 2个不合格。试判断新工艺产品的不合格率是否低于 5%。
2、泊松分布检验统计量例 4:对某放射标本连续测定 960分钟,计数器读数为 278。试判断该类标本计数器读数平均每分钟是否超过 0.25?
00,
)(~


H
X
0
0

k
u
§ 6.4.2 两个独立样本总体的参数检验
1、二项分布
,样本观察值 X=k1;
,样本观察值 Y=k2。
当 H0,p1=p2=p成立时,则近似有检验统计量例 5,P111例 5
),(~
),(~
22
21
pnBY
pnBX
)]11)(1(,0[~
2121 nn
ppNnYnX
)
11
)(?1(?

21
21
nn
pp
pp
u

2、泊松分布
,样本观察值 X=k1;
,样本观察值 Y=k2。
近似有当 成立时,检验统计量为例 6,P112例 6
)(~
)(~
2
1


Y
X
),(~ 2121 NYX
210,H
YX
YXu