5-1
第五章 假设检验
? 第一节 假设检验概述
? 第二节 总体参数检验
? 第三节 非参数检验
5-2
第一节 假设检验概述
? 一、假设检验的基本概念
? 假设检验是统计推断的另一种方式,它与区
间估计的差别主要在于:区间估计是用给定
的大概率推断出总体参数的范围,而假设检
验是以小概率为标准,对总体的状况所做出
的假设进行判断。假设检验与区间估计结合
起来,构成完整的统计推断内容。假设检验
分为两类:一类是参数假设检验,另一类是
非参数假设检验。本章分别讨论这两类检验
方法。
5-3
? 小概率原理:即指概率很小的事件在一次试
验中实际上不可能出现。这种事件称为“实
际不可能事件”。
5-4
? 例 1:消费者协会接到消费者投诉,指控品牌
纸包装饮料存在容量不足,有欺骗消费者之
嫌。包装上标明的容量为 250毫升。消费者协
会从市场上随机抽取 50盒该品牌纸包装饮品,
测试发现平均含量为 248毫升,小于 250毫升。
这是生产中正常的波动,还是厂商的有意行
为?消费者协会能否根据该样本数据,判定
饮料厂商欺骗了消费者呢?
5-5
? 消费者协会实际要进行的是一项统计检验工
作。检验总体平均 =250是否成立。这就是一
个原假设 (null hypothesis),通常用 表示,
即:
,=250
?
?
0H
0H
5-6
? 与原假设对立的是备选假设 (alternative
hypothesis),备选假设是在原假设被否定时
另一种可能成立的结论。备选假设比原假设
还重要,这要由实际问题来确定,一般把期
望出现的结论作为备选假设。
1H
5-7
? 构造一个统计量来决定是“接受原假设,拒绝备选
假设”,还是“拒绝原假设,接受备选假设”。对
不同的问题,要选择不同的检验统计量。检验统计
量确定后,就要利用该统计的分布以及由实际问题
中所确定的显著性水平,来进一步确定检验统计量
拒绝原假设的取值范围,即拒绝域。在给定的显著
性水平 α下,检验统计量的可能取值范围被分成两部
分:小概率区域与大概率区域。小概率区域就是概
率不超过显著性水平 α的区域,是原假设的拒绝区域;
大概率区域是概率为 1-α的区域,是原假设的接受区
域。
5-8
二、两种类型的错误
接受 拒绝
真实 判断正确 弃真错误 (第一类错误或 α错误 )
不真实 取伪错误 (第二类错误或 β错误 ) 判断正确
0H
0H
0H 0H
5-9
三、检验功效
? 在犯第一类错误概率得到控制的条件下,犯
取伪错误的概率也要尽可能地小,或者说,
不取伪的概率 1-β应尽可能增大。 1-β越大,意
味着当原假设不真实时,检验判断出原假设
不真实的概率越大,检验的判别能力就越好;
1-β越小,意味着当原假设不真实时,检验结
论判断出原假设不真实的概率越小,检验的
判别能力就越差。可见 1-β是反映统计检验判
别能力大小的重要标志,我们称之为检验功
效或检验力。
5-10
第二节 总体参数检验
? 一、单侧检验与双侧检验
α/2 1–α α/2
-Zα/2 Zα/2
α
–Zα 0
α
0 Zα
双侧检验 左侧检验 右侧检验
5-11
? 用单侧检验还是双侧检验,使用左侧检验还
是右侧检验,决定于备选假设中的不等式形
式与方向。与“不相等”对应的是双侧检验,
与“小于”相对应的是左侧检验,与“大于”
相对应的是右侧检验。
5-12
二、参数检验
? 参数检验都是先对样本所属总体的性质作出
若干的假定,或对总体的分布形状加以限定,
然后对总体的有关参数情况进行统计假设检
验。因此,参数检验又称为限定分布检验。
如在总体服从正态分布条件下,对其均值进
行检验。下面通过具体例子来说明参数检验
方法。
5-13
? 在例 1中,按历史资料,总体的标准差是 4毫
升。我们通过检验总体均值是否等于 250毫升,
来判断饮料厂商是否欺骗了消费者。程序如
下:
5-14
? 第一步:确定原假设与备选假设。
?, =250;, <250
? 以上的备选假设是总体均值小于 250毫升,因
为消费者协会希望通过样本数据推断出厂商
的欺骗行为 (大于 250毫升一般不会发生 )。因
此使用左侧检验。
0H
? ?
1H
5-15
? 第二步:构造出检验统计量。
? 我们知道,如果总体的标准差已知,则正态
总体 (正常情况下,生产饮料的容量服从正态
分布 )的抽样平均数,也服从正态分布,对它
进行标准化变换,可得到:
?
? 可用 z作为检验统计量。
? ?1,0~0 NnXz ? ???
5-16
? 第三步:确定显著性水平,确定拒绝域。
? 通常显著水平由实际问题确定,我们这里取
α=0.05,左侧检验,拒绝域安排在左边,查
标准正态分布表得临界值:
? - =-1.645,拒绝域是 z<-1.645。
?z
5-17
? 第四步:计算检验统计量的数值。
? 样本平均数, n=50,代入检验统计量得:248?X
64 5.154.3
504
25 024 80 ????????
n
Xz
?
?
5-18
? 第五步:判断。
? 检验统计量的样本取值落入拒绝域。拒绝原
假设,接受备选假设,认为有足够的证据说
明该种纸包饮料的平均容量小于包装盒上注
明的 250毫升,厂商有欺诈之嫌。
5-19
? 总体标准差未知时对总体均值检验经常用 t统
计量:
? 但是,在大样本场合 (样本容量 n大于 30时 ),
t-统计量与标准正态分布统计量近似,通常用
z检验代替 t检验。
)1(~0 ??? nt
ns
Xt ?
5-20
总体成数的检验
? 当样本容量较大时,下列统计量服从标准正
态分布:
?
? 上式中,ρ代表总体的成数,p代表样本的成
数。
? 以上的 z统计量可以用作总体成数检验的检验
统计量。
? ?1
pz
n
?
??
??
?
5-21
? 例 2:某企业声明有 30%以上的消费者对其产
品质量满意。如果随机调查 600名消费者,表
示对该企业产品满意的有 220人。试在显著性
水平 α=0.05下,检验调查结果是否支持企业
的自我声明。
5-22
? 解:第一步:作出假设。
?, ρ =30%,,ρ> 30% 。
? 以上的备选假设是企业自我声明的结论,我
们希望该企业说的是实话。因此使用右侧检
验。
0H 1H
5-23
? 第二步:构造 z检验统计量。
? 第三步:确定拒绝域。
? 显著水平 α=0.05,查标准正态分布表得临界
值,=1.645,拒绝域是 z>1.645。
?z
5-24
? 第四步:计算检验统计量的数值。
? 样本成数 p=220/600=0.37,总体假设的成数 ρ
=0.3,代入 z检验统计量得:
? ? ? ?
0, 3 7 0, 3
3, 5
1 0, 3 1 0, 3 / 6 0 0
p
z
n
?
??
??
? ? ?
??
5-25
? 第五步:判断。
? 检验统计量的样本取值 z=3.5>1.645,落入拒
绝域。拒绝原假设,接受备选假设,认为样
本数据证明该企业声明属实。
5-26
三,p-值检验
? p-值检验就是通过计算 p-值,再将它与显著性
水平 α作比较,决定拒绝还是接受原假设。所
谓 p-值就是拒绝原假设所需的最低显著性水
平。 p-值判断的原则是:如果 p-值小于给定的
显著性水平 α,则拒绝原假设;否则,接受原
假设。或者,更直观来说就是:如果 p-值很
小,拒绝原假设,p-值很大,接受原假设。
请大家注意的是这里的 p-值是指概率,不要
与成数指标相混淆。
5-27
? z检验的 p-值:
? 检验统计量为 z统计量的 p-值计算公式,表示
检验统计量的抽样数据,则 p-值的计算方法
如下:
? 如果:, p-值 =2
? 如果:, p-值 =
? 如果:, p-值 =
0z
1H
1H
1H
0?? ?
0?? ?
0?? ?
? ?0zzp ?
? ?0zzp ?
? ?0zzp ?
5-28
? 例 3:利用 p-值检验重新检验例 1。
? 解:
? 第一、第二步与例 1完全相同,故省略之。
? 第三步:计算样本统计的数值。
? 样本平均数, n=50,代入检验统计量
得:
248?X
54.3
504
2502480
0 ??
????
n
Xz
?
?
5-29
? 第四步:计算 p-值。
? 使用左侧检验,p-值 = 。查标准正态
分布表得:
? p-值 = [1-F(3.54)]/2 = (1-0.999 8)/2 =0.000 1
? ?0zzp ?
5-30
? 第五步:判断。
? p-值小于给出的显著性水平 (0.05),拒绝原假
设,接受备选假设,与例 1的结论相同。
5-31
第三节 非参数检验
? 非参数检验是对总体的分布不作任何限制的
统计检验。故非参数检验又称为自由分布检
验。正因为如此,非参数检验成为管理科学
中应用较为广泛的一种统计检验方法。
5-32
一、自由分布检验概述
? 自由分布检验对比参数检验,具有以下优点:
? 首先,检验条件比较宽松,适应性强。
? 其次,自由分布检验的方法比较灵活,用途
广泛。对于那些不能进行加、减、乘、除运
算的定类数据与定序数据,可使用符号检验、
秩和检验等方法进行检验。
? 再次,自由分布检验的计算相对简单。由于
自由分布的检验方法不用复杂计算,一般使
用计数方法就可以了,它的计数过程与结果
都比较简单、直观与明显。
5-33
? 自由分布检验缺点:
? 由于它对原始数据中包含的信息利用得不够
充分,检验的功效相对较弱。当总体的分布
形式已知时,基于这种分布类型的参数方法,
一般说来比非参数方法为佳。例如,对于一
批资料,可同时适用于参数的 t-检验、非参数
的符秩检验和符号检验。其检验功效是,t-检
验的最好,符秩检验次之,符号检验最差。
这主要是由于符号检验对信息的利用最不充
分。
5-34
二、符号检验
? 该方法是建立在以正、负号表示样本数据与
假设参数值差异关系基础上的,因此称之为
符号检验。该方法既适用于单样本场合,也
适用于配对样本场合。
5-35
(一 )单样本场合的符号检验
? 中位数检验,
?, =A
? 样本每个数据都减去 A,只记录其差数的符号。
n+与 n-分别是正、负符号的个数,当原假设
为真是时, n+与 n-应该很接近;若两者相差
太远,就有有理由拒绝原假设。
0H eM
5-36
? 例 4:设有 20个工人,他们一天生产的产品件
数,抽样结果如下:
? 168,163,160,172,162,168,152,153,
167,165,164,142,173,166,160,165,
171,186,167,170。
? 试以 α=0.10的检验水平,判定总体中位数是
否是 160。
5-37
? 解:第一步:作出假设。
?, =160,,160
? 由备选假设知,这个检验是双侧的。
? 第二步:计数。
? 对样本数据,大于 160的记下,+”,小于 160的记下
,-”,等于 160的,予以剔除 (以 0记之 ),结果如下:
? + + 0 + + + - - + + + - + + 0 + + + + +
? 计数以上,+”的个数是 n+=15,“-”的个数 n-=3,剔除
数据 2个。最后有效的样本个数为 n=n++n-=18 。
0H eM 1H
?eM
5-38
? 第三步:确定拒绝域。
? 显著水平 α= 0.10,由于进行双侧检验,拒绝域分布
在两边,每侧概率 α/2=0.05,查二项分布临界值表,
得到拒绝域的临界值是 13。
? 第四步:选择 n+,n-较大者,再与临界值比较。
? 结果是 15>13。
? 第五步:判断。
? 由于上一步的比较结果可知,样本落入拒绝域,所
以拒绝原假设,认为样本数据不能证明总体中位数
等于 160件。
5-39
(二 )配对样本场合的符号检验
? 样本配对场合与单样本场合的符号检验,基
本原理是一致的。设从两个总体中分别抽出
一个容量相等的样本,然后将两样本的数据
进行一一配对,得到一组配对值。再将各对
配对值相减,记录下差数的符号,计算出,+”
的个数 n+与,-”的个数 n-。如果两个样本的总
体差异不显著,配对值之差的正负号出现的
概率各是 1/2,则 n+与 n-应当非常接近;如果
n+,n-相差太大的话,说明两总体存在显著
差异。例子见书上的。
5-40
三、秩和检验
? 秩和检验也称 Wilcoxon-Man-Whitney检验。
该检验方法可用于检验两个独立的样本是否
来自同一个总体,或判断总体间是否存在显
著性的差异。它和符号检验最主要的区别是,
符号检验只考虑样本间差数的符号,而秩和
检验还要考虑差数的顺序,比符号检验利用
数据信息更加充分,因此,检验功效就更强。
5-41
? 秩和检验原理:
? 设分别从两个未知的总体独立、随机地抽取容量为
n1和 n2的样本,把样本容量较小的总体称为总体 Ⅰ 。
如果两样本容量相等,就把任意一个总体称作总体
Ⅰ,另一个总体称作总体 Ⅱ,这里不妨设 n1<n2。
? 现将两个样本混合起来,并按数据的大小,从小到
大排列编号,每个数值的编号就是它的秩次。如果
混合样本中有若干个相同的数值,则把它们的秩次
进行简单算术平均,用此平均值作为这些数值的秩
次,计算来自总体 Ⅰ 的 n1个数据在混合样本中的秩
次之和,记为 T。
5-42
? 显然 T最小的可能值是,
? T1=1+2+3+…+n1=[n1(n1+1)]/2 ;
? 最大的可能值是
? T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/
2。
? 如果两个总体分布无显著差异,则 T值不应太大或太
小,等于中间值 (T1+T2)/2;如果总体 Ⅰ 分布于总体
Ⅱ 的右边,T将接近其最大值 T2;如果总体 Ⅰ 位于
总体 Ⅱ 的左边,T将接近于它的最小值 T1。因此,
我们可以用秩和 T作为检验的统计量。
5-43
? 第一种方法,当 n1和 n2都不超过 10时,查
“秩和检验表”确定临界值;
? 第二种方法,当 n1和 n2都超过 10时,秩和 T服
从正态分布:
? 先对 T进行标准化变换,再利用标准正态分布
表,确定检验的临界值。
? ? ? ?? ?12/1,2/1~ 2121211 ???? nnnnnnnNT
5-44
? 例 5:有 A,B两家厂商供应同一种商品,两
家商品价格与性能一致,但使用寿命是否一
致有待检验。今分别从两家生产产品中抽出
样本,测定产品使用寿命 (见下表,单位:小
时 ):
? 试以 0.05的显著性水平,检验两厂商产品寿命
是否有差异?
A 厂商产品,5 11 6 9 7 10
B 厂商产品,8 6 10 7 8
5-45
? 解:第一步:作出假设。
? H0,MA=MB,H1:
? 原假设是两厂商生产的产品没有差异,平均
寿命相同,备选假设是平均寿命不相同,是
双侧检验。
BA MM ?
5-46
? 第二步:求秩和。
? 将样本混合、排列:
数据,5 6 6 7 7 8 8 9 10 10 11
秩号,1 2,5 2,5 4,5 4,5 6,5 6,5 8 9,5 9,5 11
5-47
? 以上数据下面划横线的为 B厂商产品寿命。 B
厂商产品样本容量小,看做总体 Ⅰ, n1=5。 A
厂商产品是总体 Ⅱ, n2=6。总体 Ⅰ 的秩和
T=2.5+4.5+6.5+6.5+9.5=29.5。
5-48
? 第三步:确定拒绝域。
? 显著水平 α=0.05,进行双侧检验,查“秩和
检验表”,n1=5,n2=6,得临界值 T1(α)=20,
T2(α )=40。
? 第四步:比较秩和与临界值大小。
? 结果是,20<29.5<40,即 T1(α) <T< T2(α ) 。
? 第五步:判断。
? 样本落入接受域,所以接受原假设,样本数
据证明 A,B两厂商产品的寿命也是一致的。