上一页 下一页湘潭大学数学与计算科学学院 1
第五章 假设检验
§ 5.1 假设检验的基本概念
上一页 下一页湘潭大学数学与计算科学学院 2
假设检验
?
参数假设检验
非参数假设检验
这类问题称作假设检验问题,
总体分布已知,
检验关于未知参数
的某个假设
总体分布未知时的
假设检验问题
在本讲中, 我们将讨论不同于参数估计
的另一类重要的统计推断问题, 这就是 根据
样本的信息检验关于总体的某个假设是否
正确,
上一页 下一页湘潭大学数学与计算科学学院 3
让我们先看一个例子,
这一讲我们讨论对参数的假设检验,
上一页 下一页湘潭大学数学与计算科学学院 4
生产流水线上罐装可
乐不断地封装,然后装箱
外运, 怎么知道这批罐装
可乐的容量是否合格呢?
把每一罐都打开倒入量杯,
看看容量是否合于标准,
这样做显然
不行!
罐装可乐的容量按标准应在
350毫升和 360毫升之间,
上一页 下一页湘潭大学数学与计算科学学院 5
每隔一定时间,抽查若干罐, 如每隔 1小时,
抽查 5罐,得 5个容量的值 X1,…, X5,根
据这些值来判断生产是否正常,
如发现不正常,就应停产,找出原因,
排除故障,然后再生产;如没有问题,就
继续按规定时间再抽样,以此监督生产,
保证质量,
通常的办法是进行抽样检查,
上一页 下一页湘潭大学数学与计算科学学院 6
很明显,不能由 5罐容量的数据,在把
握不大的情况下就判断生产 不正常,因为
停产的损失是很大的,
当然也不能总认为正常,有了问题不能
及时发现,这也要造成损失,
如何处理这两者的关系,假设检验面
对的就是这种矛盾,
上一页 下一页湘潭大学数学与计算科学学院 7
在正常生产条件下,由于种种随机因素
的影响,每罐可乐的容量应在 355毫升上下
波动, 这些因素中没有哪一个占有特殊重要
的地位, 因此,根据中心极限定理,假定每
罐容量服从正态分布是合理的,
现在我们就来讨论这个问题,
罐装可乐的容量按标准应在
350毫升和 360毫升之间,
上一页 下一页湘潭大学数学与计算科学学院 8
它的对立假设是:
称 H0为原假设(或零假设,解消假设);
称 H1为备选假设(或对立假设),
在实际工作中,
往往把不轻易
否定的命题作
为原假设,
0?? ?
H0,( = 355)
0?
H1:
0?? ?
这样,我们可以认为 X1,…,X5是取自正态
总体 的样本,),( 2??N
是一个常数, 2?
当生产比较稳定时,
现在要检验的假设是:
上一页 下一页湘潭大学数学与计算科学学院 9
那么,如何判断原假设 H0 是否成立呢?
较大、较小是一个相对的概念,合理的界
限在何处?应由什么原则来确定?
由于 是正态分布的期望值,它的估计量是
样本均值,因此可以根据 与 的差距X X
?
0?
来判断 H0 是否成立,X - || 0?
较小时,可以认为 H0是成立的;当 X - || 0?
生产已不正常,
当 较大时,应认为 H0不成立,即- |X|
0?
上一页 下一页湘潭大学数学与计算科学学院 10
问题归结为对差异作定量的分析,以确定
其性质,
差异可能是由抽样的随机性引起的,称为
“抽样误差”或 随机误差
这种误差反映偶然、非本质的因素所引起
的随机波动,
上一页 下一页湘潭大学数学与计算科学学院 11
然而,这种随机性的波动是有一定限
度的,如果差异超过了这个限度,则我们
就不能用抽样的随机性来解释了,
必须认为这个差异反映了事物的本质差别,
即反映了生产已不正常,
这种差异称作,系统误差”
上一页 下一页湘潭大学数学与计算科学学院 12
问题是,根据所观察到的差异,如何
判断它究竟是由于偶然性在起作用,还是
生产确实不正常?
即差异是“抽样误差”还是“系统误差”
所引起的?
这里需要给出一个量的界限,
上一页 下一页湘潭大学数学与计算科学学院 13
问题是:如何给出这个量的界限?
这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验
中基本上不会发生,
上一页 下一页湘潭大学数学与计算科学学院 14
下面我们用一例说明这个原则,
小概率事件在一次试验
中基本上不会发生,
这里有两个盒子,各装有 100个球,
一盒中的白球和红球数
99个红球
一个白球
…99 个
另一盒中的白球和红球数
个白球
一个红球

上一页 下一页湘潭大学数学与计算科学学院 15
小概率事件在一次试验
中基本上不会发生,
现从两盒中随机取出一个盒子,问这个盒子
里是白球 99个还是红球 99个?
上一页 下一页湘潭大学数学与计算科学学院 16
小概率事件在一次试验
中基本上不会发生,
我们不妨先假设,这个盒子里有 99个白球,
现在我们从中随机摸出一个球,发现是
此时你如何判断这个假设是否成立呢?
上一页 下一页湘潭大学数学与计算科学学院 17
假设其中真有 99个白球,
摸出红球的概率只有 1/100,
这是小概率事件,
这个例子中所使用的推理方法,可以称为
小概率事件在一次试验中竟然发生了,不能不
使人怀疑所作的假设,
带概率性质的反证法
不妨称为概率反证法,
小概率事件在一次试验
中基本上不会发生,
上一页 下一页湘潭大学数学与计算科学学院 18
它不同于一般的反证法
概率反证法的逻辑是:如果小概率事件
在一次试验中居然发生,我们就以很大的把
握否定原假设,
一般的反证法要求在原假设成立的条件下
导出的结论是绝对成立的,如果事实与之矛盾,
则完全绝对地否定原假设,
上一页 下一页湘潭大学数学与计算科学学院 19
现在回到我们前面罐装可乐的例中:
在提出原假设 H0后,如何作出接受和拒绝
H0的结论呢?
在假设检验中,我们称这个小概率为 显
著性水平,用 表示,?
常取
的选择要根据实际情况而定。?
.05.0,01.0,1.0 ??? ???
上一页 下一页湘潭大学数学与计算科学学院 20
罐装可乐的容量按标准应在 350毫
升和 360毫升之间, 一批可乐出厂前应
进行抽样检查,现抽查了 n罐,测得容
量为 X1,X2,…,Xn,问这一批可乐的容量
是否合格?
上一页 下一页湘潭大学数学与计算科学学院 21
提出假设
选检验统计量
n
XU
?
? 0?? ~ N(0,1)
?? ?? }|{| 2uUP
H0,= 355 H1,≠ 355? ?
由于 已知,?
它能衡量差异 大小且分布已知,||
0??X
对给定的显著性水平,可以在 N(0,1)表
中查到分位点的值,使
2?u
?
上一页 下一页湘潭大学数学与计算科学学院 22
故我们可以取拒绝域为:
也就是说,“
2|| ?uU ?
”是一个小概率事件,
W:
2|| ?uU ?
如果由样本值算得该统计量的实测值落入
区域 W,则拒绝 H0 ;否则,不能拒绝 H0,
?? ?? }|{| 2uUP
上一页 下一页湘潭大学数学与计算科学学院 23
如果 H0 是对的,那么衡量差异大小的
某个统计量落入区域 W(拒绝域 ) 是个小概
率事件, 如果该统计量的实测值落入 W,
也就是说,H0 成立下的小概率事件发生
了,那么就认为 H0不可信而否定它, 否则
我们就不能否定 H0 (只好接受它),
这里所依据的逻辑是:
上一页 下一页湘潭大学数学与计算科学学院 24
不否定 H0并不是肯定 H0一定对,而
只是说差异还不够显著,还没有达到足
以否定 H0的程度,
所以假设检验又叫
“显著性检验”
上一页 下一页湘潭大学数学与计算科学学院 25
如果显著性水平 取得很小,则拒绝
域也会比较小,
?
其产生的后果是:
H0难于被拒绝,
如果在 很小的情况
下 H0仍被拒绝了,则说
明实际情况很可能与之
?
有显著差异,
01.0??
基于这个理由,人们常把 时拒绝
H0称为是 显著 的,而把在 时拒绝
H0称为是 高度显著 的,
05.0??
上一页 下一页湘潭大学数学与计算科学学院 26
在上面的例子的叙述中,我们已经初
步介绍了假设检验的基本思想和方法,
下面,我们再结合另一个例子,进一步
说明假设检验的一般步骤,
上一页 下一页湘潭大学数学与计算科学学院 27
例 2 某工厂生产的一种螺钉,标准要求长度
是 32.5毫米, 实际生产的产品,其长度 X假定服
从正态分布 未知,现从该厂生产
的一批产品中抽取 6件,得尺寸数据如下,
),,( 2??N 2?
32.56,29.66,31.64,30.00,31.87,31.03
问这批产品是否合格?

分析:这批产品 (螺钉长度 )
的全体组成问题的总体 X,
现在要 检验 E(X)是否为 32.5.
上一页 下一页湘潭大学数学与计算科学学院 28
提出原假设和备择假设
5.32:5.32,10 ??? ?? HH
第一步:
已知 X~ ),,( 2??N 2? 未知,
第二步:
能衡量差异
大小且分布
已知
取一检验统计量,在 H0成立下
求出它的分布
)5(~
6
5.32 t
S
Xt ??
上一页 下一页湘潭大学数学与计算科学学院 29
第三步:
即,”是一个小概率事件, )5(||
2?tt ?
小概率事件在一次
试验中基本上不会
发生,
?对给定的显著性水平 =0.01,查表确
定临界值 0 3 2 2.4)5()5(
005.02 ?? tt ?
,使
?? ?? )}5(|{| 2ttP
得否定域 W,|t |>4.0322
上一页 下一页湘潭大学数学与计算科学学院 30
得否定域 W,|t |>4.0322
故不能拒绝 H0,
第四步:
将样本值代入算出统计量 t 的实测值,
| t |=2.997<4.0322 没有落入
拒绝域
这并不意味着 H0一定对,只是差异
还不够显著,不足以否定 H0,
上一页 下一页湘潭大学数学与计算科学学院 31
假设检验会不会犯错误呢?
由于作出结论的依据是下述
小概率原理
小概率事件在一次试验中 基本上
不会发生,
不是一定不发生
上一页 下一页湘潭大学数学与计算科学学院 32
如果 H0成立,但统计量的实测值落
入否定域,从而作出 否定 H0的结论,那
就犯了,以真为假,的错误,
如果 H0不成立,但统计量的
实测值未落入否定域,从而没有
作出否定 H0的结论,即 接受了错
误的 H0,那就犯了,以假为真,
的错误,
请看下表
上一页 下一页湘潭大学数学与计算科学学院 33
假设检验的两类错误
H0为真
实际情况
决定
拒绝 H0
接受 H0
H0不真
第一类错误 正确
正确 第二类错误
?P{拒绝 H0|H0为真 }=,
?P{接受 H0|H0不真 }=,
犯两类错误的概率,
?显著性水平 为犯第一类错误的概率,
上一页 下一页湘潭大学数学与计算科学学院 34
两类错误是互相关联的,当样本容
量固定时,一类错误概率的减少导致另
一类错误概率的增加,
要同时降低两类错误的概率,或
者要在 不变的条件下降低,需要增
加样本容量,
??,
??
上一页 下一页湘潭大学数学与计算科学学院 35
)1,0(~21 N
n
XU
?
??
例 3 某织物强力指标 X的均值 =21公斤, 改
进工艺后生产一批织物,今从中取 30件,测
得 =21.55公斤, 假设强力指标服从正态分
布 且已知 =1.2公斤,问在显著
性水平 =0.01下,新生产织物比过去的织物
强力是否有提高?
0?
X
?),,( 2??N
?
解,提出假设, 21:21,10 ??? ?? HH
取统计量
否定域为 W,
01.0uU ?
=2.33

一小概率事件
}{ 01.0uU ?
上一页 下一页湘潭大学数学与计算科学学院 36
代入 =1.2,n=30,并由样本值计算得 统计?
量 U的实测值
U=2.51>2.33
故拒绝原假设 H0,
落入否定域
解,提出假设, 21:21,10 ??? ?? HH
)1,0(~21 N
n
XU
?
??取统计量
否定域为 W,
01.0uU ?
=2.33
此时可能犯第一类错误,犯错误的概率不
超过 0.01.
上一页 下一页湘潭大学数学与计算科学学院 37
例 4为比较两台自动机床的精度,分别取容
量为 10和 8的两个样本,测量某个指标的尺
寸 (假定服从正态分布 ),得到下列结果:
在 =0.1时,问这两台机床是否有同样
的精度?
?
车床甲,1.08,1.10,1.12,1.14,1.15,1.25,
1.36,1.38,1.40,1.42
车床乙,1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38
上一页 下一页湘潭大学数学与计算科学学院 38
2221122210,,???? ??? HH
解,设 两台自动机床的方差分别为
在 =0.1下检验假设,
,,2221 ??
?
其中 为两样本的样本方差
)7,9(~2
2
2
1 F
S
SF ?取统计量
2221,SS
)7,9(21 ??? FF否定域为 W,或
)7,9(2?FF ?
上一页 下一页湘潭大学数学与计算科学学院 39
由样本值可计算得 F的实测值为,
68.3)7,9()7,9( 05.02 ?? FF ?查表得
)7,9()7,9( 95.021 FF ?? ?
304.029.3/1 ??
)9,7(/1 05.0F?
由于 0.304<1.51<3.68,故接受 H0,
)7,9(21 ??? FF否定域为 W,或 )7,9(2?FF ?
F=1.51
这时可能犯第二类错误,
上一页 下一页湘潭大学数学与计算科学学院 40
其它情况可参看书上表,否定域请自
己写出,
注意:我们讨论的是 正态总体 均值和
方差的假设检验,或样本容量较大,可用
正态近似的情形,
下面我们对本讲内容作简单小结,
上一页 下一页湘潭大学数学与计算科学学院 41
提出
假设
根据统计调查的目的,提出
原假设 H0 和备选假设 H1
作出
决策
抽取
样本
检验
假设
对差异进行定量的分析,
确定其性质 (是随机误差
还是系统误差, 为给出两
者界限,找一检验统计量 T,
在 H0成立下其分布已知,)
拒绝还是不能
拒绝 H0
显著性
水平
?
P(T W)=
-----犯第一
类错误的概率,
W为拒绝域
? ?
?


上一页 下一页湘潭大学数学与计算科学学院 42
在大样本的条件下,若能求得检验统计量的
极限分布,依据它去决定临界值 C.
F 检验 用 F分布
一般说来,按照检验所用的统计量的分布,
分为
U 检验 用正态分布
t 检验 用 t 分布
2? 检验 2?用 分布
上一页 下一页湘潭大学数学与计算科学学院 43
按照对立假设的提法,分为
单侧检验,它的拒绝域取在左侧或右侧,
双侧检验,它的拒绝域取在两侧 ;