1
概率论与数理统计第八章假设检验
2
第八章 假设检验
8.1 假设检验的基本概念
8.1.1 问题的提出
在前面的 6.1.1中,讨论过对总体分布中的某些未知参数或分布的形式作某种假设,然后通过抽取的样本,对假设的正确性进行判断的问题,称为 假设检验 问题,
同参数估计一样,假设检验是数理统计的主要内容之一,在实际中,有很多这样的问题需要人们去解决,
3
例 1 某药厂生产一种抗菌素,已知在正常生产情况下,每瓶抗菌素的某项主要指标服从均值为 23.0的正态分布,某日开工后,测得 5瓶的数据如下:
22.3,21.5,22.0,21.8,21.4,
问该日生产是否正常?
用 X表示该日生产的一瓶抗菌素的某项主要指标,如果已知 X~N(μ,σ 2)随机变量服从 分布,那么问题就是要检验假设,μ =23”是否成立,
4
例 2 为了研究一种新化肥对种植小麦的效力,选用
13块条件相同面积相等的土地进行试验,各块产量如下 (单位:公斤 ):
施肥的,34,35,30,33,34,32;
未施肥的,29,27,32,28,32,31,31.
问这种化肥对 小麦产量是否有显著影响?
用 X与 Y分别表示在一块土地上 施肥与未施肥情况下小麦的产量,如果已知它们分别 服从 N(μ 1,σ 12)与
(μ 2,σ 22)分布,那么问题就是检验假设,μ 1= μ 2”
是否成立?
5
例 3 在齿轮加工中,齿轮的径向综合误差 X是一个随机变量,在 6.2节例 1中给出了测得的 X的 200个数据并作出了直方图,根据直方图,就可估计 X服从正态分布,判断这个估计是否正确的问题就是检验假设
,X服从正态分布,是否成立的问题,
6
这些例子所代表的问题是很广泛的,其共同点就是先对总体分布中某些参数或对总体分布的类型作某种假设,然后根据抽取的样本值作出接受还是拒绝所作假设的结论,
今后,把对总体的分布所作的假设用 H0表示,并称为 原假设 或 零假设,
在对假设 H0的检验中,需要从样本出发,建立一个法则,一旦 样本值确定后,利用所制定的法则,即可作出是接受还是拒绝 H0的结论,这种法则有时就称为一个 检验,
7
例 1和例 2这样一类假设是在 总体分布类型已知的情况下,仅仅涉及到 未知参数的统计假设,称为 参数假设,
例 3这样一类假设是在未知 总体分布类型的情况下,
对总体分布类型或者总体分布的某些特性提出的 统计假设,称为 非参数假设,
在例 1~3中,只提出一个统计假设,而且目的也仅仅是判断这一个统计假设是否成立,并不同时研究其它统计假设,这类假设检验又称为 显著性检验,
本章将讨论参数假设与非参数假设的一些显著性检验方法,
8
对假设检验问题进一步深入讨论时,往往需要提出两个甚至多个统计假设,而且假设检验的目的是需要判断多个假设中哪一个是正确的,
例如,为了评价一个检验的好坏,除了要考虑原假设 H0外,还需要同时考虑另外一个备选的假设 H1,
H1称为 备择假设,
有两个假设的检验问题的一般提法是,在给定的备择假设 H1下对原假设 H0作出判断,若拒绝原假设 H0,
那就意味着接受备择假设 H1,否则就接受原假设 H0.
实际上这类假设检验问题就是要在原假设 H0和备择假设 H1中作出拒绝哪一个接受哪一个的判断,
由于本书不考虑评价检验好坏的问题,对这类假设检验问题,不予讨论,也就是说只研究显著性检验问题,
9
第八章 假设检验
8.1 假设检验的基本概念
8.1.2 假设检验的基本思想
根据贝努里大数定律,在大量的重复试验中,某事件 A出现的频率依概率收敛事件 A的概率,因而若某事件 A的概率 α 很小,则在大量的重复试验中,它出现的频率应该很小,
10
根据贝努里大数定律,在大量的重复试验中,某事件 A出现的频率依概率收敛事件 A的概率,因而若某事件 A的概率 α 很小,则在大量的重复试验中,它出现的频率应该很小,
例如 α =0.001,则大约在 1000次试验中,事件 A才出现一次,因此,概率很小的事件在一次实验中实际上不可能出现,人们称这样的事件为 实际不可能事件,
在概率统计的应用中,人们总是根据所研究的具体问题,规定一个界限 α (0<α <1),把概率不超过 α
的事件看成是实际不可能事件,认为这样的事件一次实验中是不会出现的,这就是所谓的,小概率原理,,
11
假设检验的基本思想是以小概率原理作为拒绝假设
H0的依据,
具体一点说,设有某个假设 H0要检验,先假设 H0是正确的,在此假定下,构造一个概率不超过
α (0<α <1)的小概率事件 A.
如果经过一次试验 (一次抽样 ),事件 A出现了,那么人们自然怀疑假设 H0的正确性,因而拒绝 (否定 )H0.
12
如果事件 A不出现,那么表明原假设 H0与试验结果不矛盾,不能拒绝 H0,当然人们也没有理由肯定 H0
是真实的,
这时,需要通过再次试验或其它方法作进一步研究,
不过,因为给出假设 H0是经过周密的调查和研究才作出的,是有一定依据的,所以对原假设需要加以保护,也就是说拒绝它要慎重;而当不拒绝它时,
一般实际上是接受了它,除非进一步的研究表明应该拒绝它,
13
如上所述,在假设检验中要指定一个很小的正数 α,
把概率不超过 α 的小概率事件 A认为是实际不可能事件,这个数 α 称为 显著性水平,
对于各种不同的问题,显著性水平 α 可以选取不一样,为查表方便起见,常选取 α =0.01,0.05,0.01
等等,
14
第八章 假设检验
8.1 假设检验的基本概念
8.1.3 假设检验中的两类错误
15
从上面的讨论可以看出,处理假设检验问题的推理方法类似于数学中的反证法,即假设命题 H0成立,
如果推出了矛盾,则否定命题 H0.
但是,这里又区别于数学中的反证法,因为在作出拒绝的结论时,所依据的矛盾并不是形式逻辑下绝对的矛盾,而是基于小概率原理,即认为在一次实验中小概率事件 A实际不可能出现,
人们对假设 H0作出判断的依据是在一次实验中看小概率事件 A是否出现,而小概率事件 A是否出现又是由一次抽样的结果来判断的,由于抽样的随机性,
人们无论拒绝 H0,还是接受 H0,都不会百分之百正确,有可能犯以下两类错误:
16
第一类错误是拒绝了真实的假设,即 H0本来正确,
却被拒绝了,这种,弃真,的错误称为 第一类错误,
由于人们只在小概率事件出现时才拒绝 H0,故犯这一类错误的概率为在 H0成立的条件下,A出现的概率 P(A|H0),它不超过显著性水平 α,
第二类错误是接受了不真实的假设,即 H0本来不正确,却被接受了,这种,取伪,的错误称为第二类错误,犯第二类错误的概率为 β,
)|( 0HAp
17
在进行假设检验时,应该力求犯两类错误的概率都尽可能地小,
然而,当样本容量 n固定时,建立犯两类错误的概率都最小的检验是不可能的,
考虑到原假设 H0的提出是有一定依据的,对它要加以保护,拒绝它要慎重,所以通常控制犯第一类错误的概率,即选定显著性水平 α (0<α <1),对固定的 n和 α 建立检验法则,使犯第一类错误的概率不大于 α,
18
下面就对各种参数假设、非参数假设建立相应的检验法则,当然进一步的讨论会发现对同一个假设检验问题,使犯第一类错误的概率不大于 α 的检验法则是很多的,应该在这些不同的检验法则中寻求犯第二类错误的概率尽可能小的检验法,这就是最优势检验问题,本书不予讨论,
19
第八章 假设检验 的基本概念
假设检验的基本概念
对总体中的某些未知参数或分布的形式作某种假设,
通过样本对假设的正确性作出判断的问题,称为假设检验问题,
(1)统计假设
对总体的分布所作的每一种假设都称为统计假设,
用 H表示,对分布参数的假设称为参数假设,否则称为非参数假设,
20
(2)原假设和备择假设
把我们所要验证的假设用 H0表示,称为原假设或零假设,而把其它容许假设记为 Hi(i=1,2,…,n),称为备择假设,
(3)显著性检验
如果我们只提出一个统计假设 H0,而我们的目的也仅仅是判断这一个统计假设是否成立,这类假设检验称为显著性检验,
21
(4)小概率原理,小概率事件,即实际不可能事件,
在一次实验中不应该发生,
根据贝努里大数定律,在大量的重复试验中,某事件 A出现的频率依概率收敛事件 A的概率,因而若某事件 A的概率很小,则在大量的重复试验中,它出现的频率应该很小,
(5)否定域
一个检验法则的本质,就是根据所选择的统计量及由此而构造的小概率事件 A把样本空间划分为两个不相交的子集,W和 W,
当样本值 (x1,x2,…,xn)∈ W时则否定 H0,反之则接受 H0.称 W为 H0的否定域或拒绝域,
22
(6)两类错误
第一类错误 ——,弃真,的错误,即 H0本来正确,
但小概率事件 A却发生了,于是 H0被否定,
犯第一类错误的概率为 P(A|H0),它不超过显著性水平 α,
第二类错误 ——,存伪,的错误,即 H0本来不正确,
但小概率事件 A却没有发生,于是 H0被接受,
犯第二类错误的概率为 β
).|( 0HAp
23
第八章 假设检验
8.2 单个正态总体参数的显著性检验
由前面的论述可以看到,对假设 H0的一个检验法完全决定于小概率事件 A的选择,
下面对各种假设检验问题,分别通过各自选择的统计量,来构造相应的小概率事件 A,从而给出具体的检验法,
24
设 x1,x2,…,xn为取自正态总体 N(μ,σ 2)的一个容量为 n的样本,x,S2分别表示样本均值和样本方差;
μ 0,σ 02为已知常数,σ 02>0.
现在来讨论关于未知参数 μ,σ 2的各种假设检验法,
25
第八章 假设检验
8.2 单个正态总体参数的显著性检验
8.2.1 u检验
26
1.已知 σ 2=σ 02,检验 H0:μ =μ 0
选择统计量
n
x
u
0
0

在 H0成立的假定下,它服从 N(0,1)分布,
对给定的显著性水平 α,查标准正态分布 N(0,1)表
(附表 2)得到临界值 uα /2,使得
P(|u|≥ uα /2)=α,
这说明 A={|u|≥ uα /2}为小概率事件 (图 8.1).
27
uO
φ (
u)
2/?u
α /2
2/?u?
28
这说明
A={|u|≥ uα /2}
为小概率事件,
将样本值代入到统计量
n
x
u
0
0

的表达式中算出统计量的值 u.
如果
|u|≥ uα /2
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.这种检验法称为 u检验,
29
例 1 某测距仪在 500m范围内,测距精度 σ =10m.今对距离 500m的目标,测量 9次,测得平均距离
x=510m.问该测距仪是否存在系统误差 (α =0.05)?
解 (1)用 X表示 测距仪对目标一次测量得到的距离,
设 X~N(μ,σ 2).
由题设 σ =10m,如果测距仪无系统误差,则应有
μ =500.
于是我们的问题是检验 假设,H0:μ =500”是否成立,
(2)计算 统计量的值,
由 n=9,x=510,μ 0=500,σ 0=10得
30
(2)计算 统计量的值,
由 n=9,x=510,μ 0=500,σ 0=10得
39
10
500510
0
0 nxu
(3)对给定的 α =0.05,查标准正态 N(0,1)分布表
(附表 2)得到临界值
uα /2=u0.05/2=u0.025=1.96.
(4)由于 |u|=3>1.96=uα /2,所以拒绝 H0,即认为该测距仪存在系统误差,
31
通过上面的分析,可以把已知方差时对正态总体均值的显著性检验归纳为以下几个步骤:
(1)提出统计假设 H0:μ =μ 0;
(2)选择统计量
n
x
u
0
0

并从样本值计算出统计量的值 u;
(3)对给定的显著性水平 α,从标准正态 N(0,1)分布表查出在 H0成立的条件下,满足等式
P(|u|≥ uα /2)=α 的临界值 uα /2;
32
(4)作结论:如果 |u|≥ uα /2,则拒绝 H0;反之,可接受 H0.
33
今后,对统计假设的各种显著性检验问题都按照以上类似的四个步骤进行,只是在不同的问题中要选择不同的统计量,从不同的分布表中查找临界值来构造相应的小概率事件,从而决定具体的检验法,
人们注意到一个检验法则的本质,就是根据所选择的统计量及由此而构造的小概率事件,把样本空间划分为两个互不相交的子集 W和 W.
当样本值 (x1,x2,…,xn)∈ W时,拒绝 H0;反之,则接受 H0.人们称为的一个 拒绝域 或 否定域,
实际上,为了给出原假设 H0的一种检验法,只要给出它的一个拒绝域就可以了,
34
对前面的 u检验来说,拒绝域为
W={(x1,x2,…,xn):|u|≥ uα /2}
其中
n
x
u
0
0

为简单起见,我们干脆说上述 u检验的拒绝域为
|u|≥ uα /2.
35
在前面的假设检验问题中,当构造小概率事件时,
利用了统计量 u的概率密度曲线两侧的尾部面积,这样的检验称为 双侧检验,
这里采用双侧检验有直观的解释:因为在任何情况下,x都是未知参数 μ 的无偏估计,所以当 H0成立时,即 μ =μ 0时,x与 μ 0不应相差太大,
因此,对固定的样本容量 n,如果 |u|太大,则有理由怀疑 H0的正确性,从而认为 μ 与 μ 0有显著的差异,
至于 |u|大到什么程度才有足够的理由拒绝 H0呢?这需要由给定的显著性水平 α 查得的临界值 uα /2来决定,
36
2.已知 σ 2=σ 02,检验 H0:μ ≤ μ 0
选择统计量
n
x
u
0
0

并令
n
x
u
0
~


);1,0(~~ Nu
37
在 H0:μ ≤ μ 0成立的假定下,还有
.~uu?
对给定的显著性水平 α,查标准正态分布 N(0,1)表
(附表 2)得到临界值 uα,使得
}~{ uuP
从而
}~{}{ uuPuuP
38
这说明
A={u≥ uα }
为小概率事件,
将样本值代入到统计量
n
x
u
0
0

的表达式中算出统计量的值 u.
如果
u≥ uα
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.H0的拒绝域为 u≥ uα,
39
注意:这里在构造小概率事件时,利用了 N(0,1)分布概率密度曲线单侧的尾部面积 (图 8.2).这样的检验称为 单侧检验,
直观的解释:因为在任何情况下,x都是未知参数 μ
的无偏估计,所以当 H0成立时,x比 μ 0的值就不应该大得太多,
因此,对固定的样本容量 n,如果 u太大,则有理由怀疑 H0的正确性,
至于 u大到什么程度才有足够的理由拒绝 H0呢?这需要由给定的显著性水平 α 查得的临界值 uα 来决定,
40
uO
φ (
u)
u
α
图 8.2
41
例 2 某厂生产一种灯管,其寿命 X~N(μ,2002)(单位:小时 ),从过去经验看 μ ≤ 1500h.今采用新工艺进行生产后,再从产品中随即抽 25只进行测试,得到寿命的平均值为 1675h小时。问采用新工艺后,灯管质量是否有显著提高 (α =0.05)?
解 (1)从过去经验看 μ ≤ 1500h,而测试的结果为
x=1675>1500h,但人们只有在拒绝了假设
H0:μ ≤ 1500
后才能作出 灯管质量有显著提高的结论,故要检验假设 H0:μ ≤ 1500;
(2)计算 统计量的值,
42
(2)计算 统计量的值,
由 μ 0=1500,σ 0=200,n=25,x=1675,得
375.425
200
15001675
0
0 nxu
(3)对给定的 α =0.05,查标准正态 N(0,1)分布表
(附表 2)得到临界值
uα =u0.05=1.65.
(4)由于 u=4.375>1.65=uα,所以拒绝 H0,即认为采用新工艺后,灯管质量提高了,
43
3.已知 σ 2=σ 02,检验 H0:μ ≥ μ 0
选择统计量
n
x
u
0
0

并令
n
x
u
0
~


);1,0(~~ Nu
44
在 H0:μ ≥ μ 0成立的假定下,还有
.~uu?
对给定的显著性水平 α,查标准正态分布 N(0,1)表
(附表 2)得到临界值 uα,使得
}~{ uuP
从而
}~{}{ uuPuuP
45
这说明
A={u≤?uα }
为小概率事件,
将样本值代入到统计量
n
x
u
0
0

的表达式中算出统计量的值 u.
如果
u≤?uα
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.H0的拒绝域为 u≤?uα,
46
注意:这里在构造小概率事件时,利用了 N(0,1)分布概率密度曲线单侧的尾部面积 (图 8.3).这样的检验称为 单侧检验,
直观的解释:因为在任何情况下,x都是未知参数 μ
的无偏估计,所以当 H0成立时,x比 μ 0的值就不应该小得太多,
因此,对固定的样本容量 n,如果 u太小,则有理由怀疑 H0的正确性,
至于 u小到什么程度才有足够的理由拒绝 H0呢?这需要由给定的显著性水平 α 查得的临界值?uα 来决定,
47
uO
φ (
u)
u
α
图 8.3
48
第八章 假设检验
8.2 单个正态总体参数的显著性检验
8.2.2 t检验
49
1.未知 σ 2,检验 H0:μ =μ 0
选择统计量
n
s
xt 0
在 H0成立的假定下,它服从 t(n?1)分布,
对给定的显著性水平 α,查 t分布表 (附表 4)得到临界值 tα /2(n?1),使得
P(|t|≥ tα /2(n?1))=α,
这说明 A={|t|≥ tα /2(n?1)}为小概率事件 (图 8.).
50
tO
f(t)
α /2
)1(2/ nt? )1(2/?nt?
51
这说明
A={|t|≥ tα /2(n?1)}
为小概率事件,
将样本值代入到统计量
n
s
xt 0
的表达式中算出统计量的值 t.
如果
|t|≥ tα /2(n?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.这种检验法称为 t检验,
52
由于这个检验法选择的统计量服从 t分布,所以称为
t检验,这里采用了双侧检验,
53
例 3 (8.1节例 1)某药厂生产一种抗菌素,已知在正常生产情况下,每瓶抗菌素的某项主要指标服从均值为 23.0的正态分布,某日开工后,测得 5瓶的数据如下:
22.3,21.5,22.0,21.8,21.4,
问该日生产是否正常?
用 X表示该日生产的一瓶抗菌素的某项主要指标,如果已知 X~N(μ,σ 2)随机变量服从 分布,那么问题就是要检验假设,μ =23”是否成立 (α =0.05).
54
解 (1)根据题意,待检验的假设是 H0:μ =23;
(2)由于 σ 2未知,故采用统计量
,0 n
s
xt
将 n=5,x=21.8,S2 =0.135代入得
30.75
1 3 5.0
0.238.210 n
s
xt?
55
(3)对给定的 α =0.05,查 t分布表 (附表 2)得到临界值
tα /2(n?1)=t0.05/2(5?1)=t0.025(4)=2.7664.
(4)由于 |t|=7.30>2.7664=tα /2(n?1),所以拒绝 H0,
即认为该日生产不正常,
56
2.未知 σ 2=σ 02,检验 H0:μ ≤ μ 0
选择统计量
n
s
xt 0
并令
n
s
xt~

);1(~~?ntt
57
在 H0:μ ≤ μ 0成立的假定下,还有
.~tt?
对给定的显著性水平 α,查 t分布表 (附表 4)得到临界值 tα (n?1),使得
)}1(~{ nttP
从而
)}1(~{)}1({ nttPnttP
58
这说明
A={t≥ tα (n?1)}
为小概率事件,
将样本值代入到统计量
n
s
xt 0
的表达式中算出统计量的值 t.
如果
t≥ tα (n?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.H0的拒绝域为 t≥ tα (n?1).
59
3.未知 σ 2=σ 02,检验 H0:μ ≥ μ 0
选择统计量
n
s
xt 0
并令
n
s
xt~

);1(~~?ntt
60
在 H0:μ ≥ μ 0成立的假定下,还有
.~tt?
对给定的显著性水平 α,查 t分布表 (附表 4)得到临界值 tα (n?1),使得
)}1(~{ nttP
从而
)}1(~{)}1({ nttPnttP
61
这说明
A={t≤?tα (n?1)}
为小概率事件,
将样本值代入到统计量
n
s
xt 0
的表达式中算出统计量的值 t.
如果
t≤?tα (n?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.H0的拒绝域为 t≤?tα (n?1).
62
例 4 设木材的小头直径 (单位:厘米
cm)X~N(μ,σ 2),μ ≥ 12cm为合格,今抽出 12根测得 小头直径的样本 均值为 x=11.2cm,样本方差为 S2
=1.44cm2.问该批 木材是否合格 (α =0.05)?
解 (1) μ ≥ 12cm为合格,而今测得 x=11.2cm<12cm,
这将引起人们对 木材质量的怀疑,但由于不能轻率地说这批木材是不合格的,故令原假设为
H0:μ ≥ 12;? (2)计算 统计量的值,
根据 x=11.2,μ 0=12,S=10,n=12,得到
3 09 4.212
2.1
122.110 n
s
xt?
63
(3)对给定的 α =0.05,查 t分布表 (附表 2)得到临界值
tα (n?1)=t0.05(12?1)=t0.05(11)=1.7959.
(4)由于 t=?2.3094<?1.7959=?tα (n?1),所以拒绝
H0,即认为该 批木材是不合格的,
64
第八章 假设检验
8.2 单个正态总体参数的显著性检验
8.2.3?2检验
65
1.未知 μ,检验 H0:σ 2=σ 02
选择统计量
2
0
2
2 )1(
sn?
在 H0成立的假定下,它服从?2(n?1)分布,
对给定的显著性水平 α,查?2分布表 (附表 3)得到临界值
)1()1( 2 2/2 2/1 nn 与
66
使得


2/)}1({
2/)}1({
2
2/
2
2
2/1
2


nP
nP
这说明事件
)}1({)}1({ 2 2/22 2/12 nnA
为小概率事件,
67
xO
f(x)
α /2
)1(2 2/1 n )1(2
2/?n
α /2
68
将样本值代入到统计量
2
0
2
2 )1(
sn?
的表达式中算出统计量的值?2.
如果
)1()1( 2 2/22 2/12 nn 或
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0,
69
H0的拒绝域为
).1()1( 2 2/22 2/12 nn 或
由于这个检验法选择的统计量服从?2分布,所以称为?2检验,
70
这里采用了双侧检验,
直观地看:因为 S2是 σ 2的无偏估计,所以在 H0成立的条件下,S2/σ 02与 1相差不应太大,
对固定的 n,?2=(n?1)S2/σ 02之值不应太大也不应太小,
至于?2=(n?1)S2/σ 02大到什么程度和小到什么程度才可以拒绝 H0呢?这由上面的检验法找到的两个临界值?21-α /2(n?1)与?2α /2(n?1)来决定,
71
不难看出,如果从?2分布表 (附表 3)查出临界值
)1()1( 221 21 nn 或
满足



2
22
1
2
1
2
)}1({
)}1({
2
1


nP
nP
那么,只要 α 1≥ 0,α 2≥ 0,α 1+α 2=α,则事件
)}1({)}1({ 22212 21 nnA
就是小概率事件,
72
可见对不同的 α 1和 α 2可决定不同的检验法则,
因而,对同一个检验统计量,检验法则也是很多的,
上面采用 α 1=α 2=α /2的形式主要是为查表方便,
而且这种检验法也是较好的,
73
例 5 已知维尼纶纤度在正常条件下服从正态分布
N(1.405,0.0482),某日抽取 5根纤维,测得其纤度为 1.32,1.55,1.36,1.40,1.44,问这一天 纤度的总体标准差是否正常 (α =0.05)?
解 (1)用 X表示这一天生产 维尼纶 的 纤度,则
X~N(μ,σ 2).
如果总体 标准差正常,则应有 σ 2= 0.0482.于是我们的问题是检验 假设,H0:σ 2=0.0482”是否成立,
(2)计算 统计量的值,
根据 n=5,x=1.414,(n?1)S2=0.03112,得到
74
.507.13
048.0
031 12.0)1(
22
0
2
2
sn
(3)对给定的显著性水平 α,查?2分布表 (附表 3)得到临界值


1 4 3.11)4()1(
4 8 4.0)4()1(
2
0 2 5.0
2
2/
2
9 7 5.0
2
2/1


n
n
(4)由于?2=13.507>11.143=?2α /2(n?1),所以拒绝
H0,即认为 总体标准差有显著的变化,
75
2.未知 μ,检验 H0:σ 2≤ σ 02
选择统计量
2
0
2
2 )1(
sn?
并令
2
2
2 )1(~
sn

);1(~~ 22?n
76
在 H0成立的假定下,还有
.~ 22
对给定的显著性水平 α,查?2分布表 (附表?2)得到临界值?2α (n?1),使得
)}1(~{ 22 nP
从而
)}1(~{)}1({ 2222 nPnP
77
这说明
A={?2≥?2α (n?1)}
为小概率事件,
将样本值代入到统计量
2
0
2
2 )1(
sn?
的表达式中算出统计量的值?2.
如果
2≥?2α (n?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.H0的拒绝域为?2≥?2α (n?1).
78
例 5 某种导线,要求其电阻的标准差不得超过 0.005
欧姆 (Ω).今在生产的一批导线中取样品 9根,测得
S=0.007欧姆,设总体为正态分布,问在显著性水平
α =0.05下能认为这批 导线电阻的标准差 显著地偏大吗?
解 (1)设这批 导线电阻 为 X欧姆,则 X~N(μ,σ 2).
按题意,我们要检验 假设,H0:σ 2≤ (0.005)2”;
(2)计算 统计量的值,
根据 n=9,S=0.007,σ 02=(0.005)2得到
79
68.15
)005.0(
)007.0(8)1(
2
2
2
0
2
2
sn
(3)对给定的显著性水平 α,查?2分布表 (附表 3)得到临界值
5 0 7.15)8()1( 2 05.02 n
(4)由于?2=15.68>15.507=?2α (n?1),所以拒绝 H0,
即认为这批 导线电阻的标准差 显著地偏大,
80
3.未知 μ,检验 H0:σ 2≥ σ 02
选择统计量
2
0
2
2 )1(
sn?
并令
2
2
2 )1(~
sn

);1(~~ 22?n
81
在 H0成立的假定下,还有
.~ 22
对给定的显著性水平 α,查?2分布表 (附表?2)得到临界值?21-α (n?1),使得
)}1(~{ 212 nP
从而
)}1(~{)}1({ 212212 nPnP
82
这说明
A={?2≤?21-α (n?1)}
为小概率事件,
将样本值代入到统计量
2
0
2
2 )1(
sn?
的表达式中算出统计量的值?2.
如果
2≤?21-α (n?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.H0的拒绝域为?2≤?21-α (n?1).
83
例 设某次考试的考生成绩服从正态分布,从中随机地抽取 36位考生的成绩,得平均成绩为 66.5分,标准差为 15分,问在显著性水平 0.05下是否可以认为这次考试成绩平均为 70分?给出检验过程,
解 (1)设 X为考生的成绩,则 X~N(μ,σ 2),
x1,x2,…,x36为样本,由题设 x=66.5,S=15.题目要求检验假设,H0,μ =70”;
选择统计量并算出其值
.4.136
15
705.660 n
s
xt?
84
对给定的显著性水平 α =0.05,查 t分布表 (附表 3)
得到临界值
tα /2(n?1)=t0.05/2(36?1)=t0.025(35)=2.0301,
使得 P(|t|≥ tα /2(n?1))=α,即否定域为
|t|≥ tα /2(n?1).? 因为
|t|=1.4<2.0301=t0.025(35),
故应接受 H0,即在显著性水平 0.05下,可以认为这次考试成绩平均为 70分,
85
第八章 假设检验
8.3 两个正态总体参数的显著性检验
设总体 X~N(μ 1,σ 12),总体 Y~N(μ 2,σ 22).
1,,,21 nxxx?
为取自正态总体 X的容量为 n1的一个样本,
2
1Sx和
分别表示它的样本均值和样本方差;
86
2,,,21 nyyy?
为取自正态总体 Y的容量为 n2的一个样本,
2
2Sy和
分别表示它的样本均值和样本方差,
又设这两个样本相互独立,现在考虑以下参数的各种假设检验问题,
87
第八章 假设检验
8.3 两个正态总体参数的显著性检验
8.3.1 t检验 (续 )
88
1.σ 12,σ 22未知,但已知 σ 12=σ 22,检验 H0:μ 1=
μ 2? 选择统计量
21
21
11
)(
nn
S
yx
t
W


其中
2
)1()1(
21
2
22
2
11


nn
snsn
S W
89
在 H0成立的假定下,
21
21
11
)(
nn
S
yx
t
W


服从 t(n1+n2?2)分布,
对给定的显著性水平 α,查 t分布表 (附表 4)得到临界值 tα /2(n1+n2?2),使得
P(|t|≥ tα /2(n1+n2?2))=α,
这说明 A={|t|≥ tα /2(n1+n2?2)}为小概率事件 (图 8.).
90
tO
f(t)
α /2
)2( 212/ nnt? )2( 212/ nnt?
91
这说明
A={|t|≥ tα /2(n1+n2?2)}
为小概率事件,
将样本值代入到统计量
21
21
11
)(
nn
S
yx
t
W


的表达式中算出统计量的值 t.
92
如果
|t|≥ tα /2(n1+n2?2)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
H0的拒绝域为
|t|≥ tα /2(n1+n2?2).
93
例 1 (8.1节例 2)为了研究一种新化肥对种植小麦的效力,选用 13块条件相同面积相等的土地进行试验,
各块产量如下 (单位:公斤 ):
施肥的,34,35,30,33,34,32;
未施肥的,29,27,32,28,32,31,31.
问这种化肥对 小麦产量是否有显著影响?
用 X与 Y分别表示在一块土地上 施肥与未施肥情况下小麦的产量,如果已知它们分别 服从 N(μ 1,σ 12)与
(μ 2,σ 22)分布,
如果知道 σ 12=σ 22,试检验假设
H0:μ 1= μ 2,α =0.05.
94
解 首先计算 t的值,
因为 n1=6,n2=7,x=33,(n1?1)S12=16,y=30,
(n2?1)S22=24,所以
8 2 8.2
)
7
1
6
1
(
276
2416
3033
11
21

nn
S
yx
t
W
95
对给定的显著性水平 α =0.05,查 t分布表 (附表 4)得到临界值
tα /2(n1+n2?2)=t0.025(11)=2.2010.
由于 |t|=2.828>2.2010=tα /2(n1+n2?2),所以拒绝 H0,
即认为该 种化肥对 小麦产量的影响是显著的,
96
2.σ 12,σ 22未知,但已知 σ 12=σ 22,检验
H0:μ 1≤ μ 2? 选择统计量
21
11
nn
S
yx
t
W
其中
2
)1()1(
21
2
22
2
11


nn
snsn
S W
97
并令
21
21
11
)(~
nn
S
yx
t
W



);2(~~ 21 nntt
在 H0成立的假定下,还有;~tt?
98
对给定的显著性水平 α,查 t分布表 (附表 4)得到临界值 tα (n1+n2?2),使得
)}2(~{ 21 nnttP
从而



)}2(~{
)}2({
21
21
nnttP
nnttP
这说明
A={t≥ tα (n1+n2?2)}
为小概率事件,
99
将样本值代入到统计量
21
21
11
)(
nn
S
yx
t
W


的表达式中算出统计量的值 t.
100
如果
t≥ tα (n1+n2?2)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
H0的拒绝域为
t≥ tα (n1+n2?2).
101
3.σ 12,σ 22未知,但已知 σ 12=σ 22,检验
H0:μ 1≥ μ 2? 选择统计量
21
11
nn
S
yx
t
W
其中
2
)1()1(
21
2
22
2
11


nn
snsn
S W
102
并令
21
21
11
)(~
nn
S
yx
t
W



);2(~~ 21 nntt
在 H0成立的假定下,还有;~tt?
103
对给定的显著性水平 α,查 t分布表 (附表 4)得到临界值 tα (n1+n2?2),使得
)}2(~{ 21 nnttP
从而



)}2(~{
)}2({
21
21
nnttP
nnttP
这说明
A={t≤?tα /2(n1+n2?2)}
为小概率事件,
104
将样本值代入到统计量
21
21
11
)(
nn
S
yx
t
W


的表达式中算出统计量的值 t.
105
如果
t≤?tα (n1+n2?2)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
H0的拒绝域为
t≤?tα (n1+n2?2).
106
4.σ 12,σ 22未知,n1=n2=n,检验 H0:μ 1=μ 2
采用 配对试验的 t检验法,

zi=xi?yi,i=1,2,…,n
则 z1,z2,…,zn独立同分布,zi~N(d,σ 2),其中
d=μ 1?μ 2,σ 2=σ 12?σ 22.
于是 z1,z2,…,zn可看作来自正态总体 N(d,σ 2)的样本,此时,检验 μ 1与 μ 2是否相等,就等价于检验假设
H0:d=0,
107
可用统计量
n
s
zt?
其中



n
i
i
n
i
i zz
n
sz
n
z
1
2
1
)(
1
1
,
1
拒绝域为 |t|≥ tα /2(n?1).
108
例 2 为判断两种工艺方法对产品的某种性能指标有无显著性差异,将九批材料用两种工艺方法进行生产,得到该指标的九对数据如下:
xi 0.20 0.30 0.40 0.50
yi 0.10 0.21 0.52 0.32
0.60 0.70 0.80 0.90 1.00
0.78 0.59 0.68 0.77 0.89
109
问:根据上述数据,能否说明在两种不同工艺方法下,产品的该性能指标有显著性差异 (α =0.05).
解 将九对数据作差 zi=xi?yi,得
0.10,0.09,?0.12,0.18,?0.18,0.11,0.12,0.13,0.11
由上可得
z=0.06,S2=0.015,

4 6 7.1 n
s
zt
110
对给定的显著性水平 α =0.05,查 t分布表 (附表 4)得到临界值
tα /2(n?1)= t0.05/2(9?1)=t0.025(8)=2.306.
由于 t=1.476<2.306=tα /2(n?1),故不能认为 在两种不同工艺方法下,产品的该性能指标有显著性差异,
111
第八章 假设检验
8.3 单个正态总体参数的显著性检验
8.3.2 F检验 (续 )
112
1.未知 μ 1,μ 2,检验 H0:σ 12=σ 22
选择统计量
2
2
2
1
s
s
F?
在 H0成立的假定下,
2
1
2
2
2
2
2
1
2
2
2
1
s
s
s
s
F
服从 F(n1?1,n2?1)分布,
113
对给定的 α,查 F分布表 (附表 3)得到临界值
F1-α /2(n1?1,n2?1)与 Fα /2(n1?1,n2?1)
(如图 )使得


2/)}1,1({
2/)}1,1({
212
2121
nnFFP
nnFFP
这说明
A={F≤ F1-α /2(n1?1,n2?1)}∪ {F≥ Fα /2(n1?1,n2?1)}
为小概率事件,
114
将样本值代入到统计量
2
2
2
1
s
s
F?
的表达式中算出统计量的值 F.
如果
F≤ F1-α /2(n1?1,n2?1)或 F≥ Fα /2(n1?1,n2?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
H0的拒绝域为
F≤ F1-α /2(n1?1,n2?1)或 F≥ Fα /2(n1?1,n2?1).
115
xO
f(x)
α /2
)1,1( 212/1 nnF? )1,1( 212/ nnF?
α /2
116
例 3 (8.1节例 2)为了研究一种新化肥对种植小麦的效力,选用 13块条件相同面积相等的土地进行试验,
各块产量如下 (单位:公斤 ):
施肥的,34,35,30,33,34,32;
未施肥的,29,27,32,28,32,31,31.
问这种化肥对 小麦产量是否有显著影响?
用 X与 Y分别表示在一块土地上 施肥与未施肥情况下小麦的产量,如果已知它们分别 服从 N(μ 1,σ 12)与
(μ 2,σ 22)分布,
如果知道 σ 12=σ 22,试检验假设
H0:μ 1= μ 2,α =0.05.
117
解 首先计算统计量 F的值,
因为 n1=6,n2=7,(n1?1)S12=16,(n2?1)S22=24,所以
8.0
6/24
5/16
2
2
2
1
s
s
F
对给定的显著性水平 α =0.05,查 F分布表 (附表 5)
得到临界值
99.5)6,5()1,1( 02 5.0212/ FnnF?
118

1 4 3.0
98.6
1
)5,6(
1
)6,5()1,1(
0 25.0
9 75.0212/1


F
FnnF
由于 0.1438<0.8<5.99,所以接受 H0,即认为该 种化肥对 小麦产量的影响是不显著的,
119
2.未知 μ 1,μ 2,检验 H0,σ 12≤ σ 22
选择统计量
2
2
2
1
s
s
F?
并令
2
1
2
2
2
2
2
1~
s
s
F?

);1,1(~~ 21 nnFF
120
在 H0成立的假定下,还有
.~FF?
对给定的显著性水平 α,查 F分布表 (附表 F)得到临界值 Fα (n1?1,n2?1),使得
)}1,1(~{ 21 nnFFP
从而



)}1,1(
~
{
)}1,1({
21
21
nnFFP
nnFFP
121
这说明
A={F≥ Fα (n1?1,n2?1)}
为小概率事件,
将样本值代入到统计量
2
2
2
1
s
s
F?
的表达式中算出统计量的值 F.
如果
F≥ Fα (n1?1,n2?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
122
如果
F≥ Fα (n1?1,n2?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
H0的拒绝域为
F≥ Fα (n1?1,n2?1),
123
3.未知 μ 1,μ 2,检验 H0,σ 12≥ σ 22
选择统计量
2
2
2
1
s
s
F?
并令
2
1
2
2
2
2
2
1~
s
s
F?

);1,1(~~ 21 nnFF
124
在 H0成立的假定下,还有
.~FF?
对给定的显著性水平 α,查 F分布表 (附表 F)得到临界值 F1-α (n1?1,n2?1),使得
)}1,1(~{ 211 nnFFP
从而



)}1,1(
~
{
)}1,1({
211
211
nnFFP
nnFFP
125
这说明
A={F≤ F1-α (n1?1,n2?1)}
为小概率事件,
将样本值代入到统计量
2
2
2
1
s
s
F?
的表达式中算出统计量的值 F.
如果
F≤ F1-α (n1?1,n2?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
126
如果
F≤ F1-α (n1?1,n2?1)
则表明在一次试验中小概率事件 A出现了,因而拒绝 H0;否则,接受 H0.
H0的拒绝域为
F≤ F1-α (n1?1,n2?1),
127
正态总体参数显著性检验法表名称 条 件 假 设 H0 拒 绝 域 统 计 量
u
检验
X~N(μ,
σ 2)
σ 2已知
H0:μ =
μ 0 |u|≥ uα /2
H0:μ ≤
μ 0 u≥ uα
H0:μ ≥
μ 0 u≤?uα
n
x
u
0
0

128
正态总体参数显著性检验法表名称 条 件假 设
H0 拒 绝 域 统 计 量
t
检验
X~N(μ,
σ 2)
σ 2未知
μ =μ 0 |t|≥ tα /2(n?1)
μ ≤ μ
0
t≥ tα (n?1)
μ ≥ μ
0
t≤?tα (n?1)
n
s
xt 0
129
正态总体参数显著性检验法表名称 条 件假 设
H0 拒 绝 域 统 计 量
t
检验
X~N(μ 1,
σ 2)
Y~N(μ 2,
σ 2) σ 2未知
μ 1=
μ 2
|t|≥
tα /2(n1+n2?2)
μ 1≤
μ 2
t≥ tα (n1+n2?
2)
μ 1≥
μ 2
t≤
tα (n1+n2?2)
21
21
11
)(
nn
S
yx
t
W?


2
)1()1(
21
2
22
2
11


nn
snsnS
W
130
正态总体参数显著性检验法表名称 条 件假 设
H0 拒 绝 域 统 计 量
2
检验
X~N(μ,
σ 2)
μ 已知
σ 2=σ
02
2 ≤?21-
α /2(n?1)或
2 ≥
2α /2(n?1)
σ 2≤
σ 02?
2 ≥?2α (n?1)
σ 2 ≥
σ 02
2 ≤?21-
α (n?1)
2
0
2
2 )1(
sn
131
正态总体参数显著性检验法表名称 条 件假 设
H0 拒 绝 域统 计量
F
检验
X~N(μ 1,
σ 2)
Y~N(μ 2,
σ 2)
μ 1,μ 2未知
σ 12=
σ 22
F≤ F1-α /2(n1?1,
n2?1)或
F≥ Fα /2(n1?1,n2?1)
σ 12≤
σ 22 F≥ Fα (n1?1,n2?1)
σ 12≥
σ 22 F≤ F1-α (n1?1,n2?1)
2
2
2
1
s
s
F?