第 八 章假设检验与方差分析
本章学习目的
理解 原假设、备择假设、两类错误、单侧检验、双侧检验、方差分析等概念。
掌握 三种不同的实际情况下 —— 陈述正确性、研究性、
决策 —— 建立假设检验的方法。
掌握 总体方差已知或未知时正态总体的均值假设检验和总体比例的假设检验。
本章重难点提示
重点 是三种不同情况下的假设检验方法,总体方差已知时正态总体均值和总体比例的假设检验。
难点 是总体方差未知时正态总体均值的假设检验和方差分析。
第一节 假设检验一、假设检验的概念假设 (hypothesis),又称统计假设,是对总体参数的具体数值所作的陈述。
假设检验 (hypothesis test) 是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
㈠ 原假设与备择假设原假设 (null hypothesis),又称零假设,用表示,是指研究者想收集证据予以反对的假设。
备择假设 (alternative hypothesis),用 或表示,是指研究者想收集证据予以支持的假设,它与原假设陈述的内容相反。
0H
1H
H?
假设检验的三种类型
1.对陈述正确性的检验在这种情况下,原假设通常是基于假定的陈述是正确的。然后建立备择假设,为拒绝提供统计证据,从而证明这个假定的陈述是错误的。
2.对研究性假设的检验在研究性假设检验的调查研究中,应该建立原假设和备择假设,并用备择假设来表示研究性假设,这样如果拒绝,将支持样本所得出的结论以及应该采取某些行动。
3.对决策情况下的检验在决策情况下的检验研究中,决策者必须从两种措施中挑选其中一种,无论是接受还是拒绝,都必须采取一定的措施。
假设检验的三种形式设 表示在原假设和备择假设中考虑的某一特定数值,表示总体的实际值。对总体的假设检验一定要采取下面的三种形式之一,



00H,10H:
00H,10H:
00H,10H:
0?
㈡ 拒绝域与检验统计量
拒绝域 是指能够作出拒绝原假设这一结论的所有可能的样本取值范围。
检验统计量 是根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种样本统计量。
㈢ 单侧检验与双侧检验
单侧检验 是指检验统计量的取值位于其抽样分布的某一侧范围内时拒绝原假设,也就是说抽样分布的某一侧构成了拒绝域。
双侧检验 是指检验统计量的取值位于其抽样分布的任何一侧范围内时拒绝原假设,也就是说抽样分布的左右两侧共同构成了拒绝域。
二、假设检验中的两类错误 **
第 Ⅰ 类错误 /弃真错误 (type Ⅰ error)
当原假设为真时拒绝原假设。犯第 Ⅰ 类错误的概率通常记为 。
第 Ⅱ 类错误 /取伪错误 (type Ⅱ error)
当原假设为假时没有拒绝原假设。犯第 Ⅱ 类错误的概率通常记为 。
在统计实践中,进行假设检验时一般先控制第 Ⅰ 类错误发生的概率,并确定犯第 Ⅰ 类错误的概率最大值,
称为检验的 显著性水平 。显著性水平一般选择为 0.05和
0.01。
假设检验的步骤
1.确定 原假设和备择假设 ;
2.选择 检验统计量 ;
3.确定检验的 显著性水平 ;
4.用显著性水平来确定拒绝原假设 的检验统计量的 临界值、拒绝域 ;
5.根据样本数据,计算检验统计量的值 ;
6.⑴ 将统计量的值与临界值进行比较,并作出决策:若统计量的值落在拒绝域内,拒绝原假设,否则不拒绝原假设 。
或 ⑵根据第 5步的检验统计量的值 计算 值 。
运用 值来确定是否拒绝。
0H
0H 0H
p
p
㈠ 总体方差已知时正态总体均值的假设检验当总体方差 已知,用正态分布来检验总体均值的假设值的情况如下:
⑴ 当样本数 (大样本)时的任意分布总体,(根据中心极限定理 );
⑵ 当样本数 (小样本)但是总体是正态分布的。
2?
30n?
30n
[例 8-1] 某公司称其应收账金额的均值为 RMB260.00,审计师希望通过选取一个的样本计算样本均值来检验是否如此。只有当样本均值与 RMB260.00的假设值差别较大时,
审计师才会拒绝这个假设,已知应收账款金额的标准差为,计算 0.05显著性水平下假设检验的样本均值临界值 。
43.00
示例计算过程假设:
显著性水平:
检验统计量:,的样本的因此,为了拒绝原假设,这个样本均值的值必须比 RMB 245.95小或者比 RMB 274.05大。所以,在双侧检验 (见下图 8-1)中有两个拒绝域。
01,2 6 0,0 0 ;,2 6 0,0 0HH
0,0 5
36n? 43.00 X
0
2
4 3,0 02 6 0,0 0 1,9 6
36
2 6 0,0 0 1 4,0 5 2 4 5,9 5 ~ 2 7 4,0 5
X

样 本 均 值 的 临 界 值 =
图 8-1 双边检验的拒绝域与接受域接 受 域拒 绝 域拒 绝 域
2 4 5,9 5
2 6 0,0 0
2 7 4,0 5
[例 8-2] 在例 8-1的假设检验中,如果样本的均值为,当显著性水平为 0.05时,原假设是否被拒绝。
当 时,对应于的双侧检验的临界值检验统计量的值为因为,落在拒绝域内,所以否定原假设,也就是说有 95%的可靠程度否定原假设。如果将样本均值与图 8-1中均值的临界值比较,将得到相同的结论。
0.05
0,0 2 52 1,9 6 0,0 2 52 1,9 6
0 2 4 0,0 0 2 6 0,0 0 2,7 9
4 3,0 0
36X
X?

240.00X?
2,7 9 1,9 6
接 受 域拒 绝 域拒 绝 域
- 1,9 6
1,9 6
图 8-2 双边检验的拒绝域与接受域
[例 8-3] 某商场销售一种产品,原每周销售量服从平均值为 75,方差为 14的正态分布。销售方案更新后,为了考察销售量是否提高,抽查了 6周销售量,求得平均销售量为 78,假定方差不变,问在显著性水平 0.05下,销售方案更新后对周销售量是否有显著提高?
示例
假设,左单边检验
显著性水平,
检验统计量,,的样本的 值
由于总体服从方差已知的正态分布,所以在原假设下,检验统计量
当 时,对应的临界值为因为,故否定原假设,这说明销售方案更新后,周销售量有明显提高。
01,7 5 ;,7 5HH
0,0 5
6n? 2 14
0 7 8 7 5 1,9 6 4
14
6
X
n

0.0 5 0,0 5 1,6 4 5
1,9 6 4 1,6 4 5
计算过程
㈡ 总体方差未知时正态总体均值的假设检验
⑴ 如果样本数,根据中心极限定理,可以假定抽样分布近似为正态概率分布;
⑵如果样本数,但均值的抽样分布是正态分布时。
无论哪一种情况,都应当使用 T分布计算标准的检验统计量,在计算检验统计量时,我们用样本标准差 来代替总体标准差 。
检验统计量
30n?
30n
s?
00
X
XXt
ss
n

[例 8-4] 某品牌笔记本电脑的说明书声称电池平均充电次数可达 4 200次。为验证其真实性,现随机抽取样本调查,结果显示平均充电次数是 4200次,样本标准差为 200
小时。若一般电脑的电池充电次数服从正态分布,在 5%
的显著性水平下,检验说明书是否属实?
假设,右单侧检验
显著性水平,
检验统计量,,的样本的 t 值
由于总体服从方差未知的正态分布,所以在原假设下,检验统计量
01,4 2 0 0 ;,4 2 0 0HH
0.05
10n? 200s?
0 4 0 0 0 4 2 0 0 3,1 6
100
10
Xt
s
n

当 时,
对应的临界值为
因为
所以原假设被拒绝,接受备择假设:可以认为电池的真实充电次数少于 4 200次,产品说明不属实。
3,1 6 1,8 3 3t
0,0 5
0,0 5 0,0 5( 1 ) ( 9 ) 1,8 3 3t n t
㈢ 总体比例的假设检验
总体比例又称总体成数,是指总体中具有某种相同特征的单位数所占的比例。
一般用 来表示总体比例,表示总体比例的某一特定假设值。总体中的某种特征可以是数值型的,如一定的重量、一定的长度或一定的规格等;也可以是品质型的,如男女性别、学历等级、城市农村等。
0PP
总体比例的假设检验步骤:
⑴ 建立总体比例检验的原假设和备择假设;
⑵ 用样本比例 和样本标准差 的来计算检验统计量 的值,
因为是大样本,中心极限定理保证了统计量服从正态分布,那么统计量 z就近似服从正态分布。
⑶ 将检验统计量的值与临界值相比较,确定是否应该拒绝原假设。
p p?
0
p
pP

p
[例 8-5] 某保龄球馆在过去几个月中,有 20%
的顾客是女性。为了提高女顾客比例,球馆采取了一些措施来吸引女性保龄球手。一周后随机抽取 400名球手作为样本,其中 100名女球手。该球馆经理要据此判断:在 0.05的显著性水平下,该球馆女性保龄球手的比例是否提高?
示例
假设,
因为
所以为大样本分布,检验统计量 近似服从正态分布。样本数据显示
0 0,2 0HP?,1 0,2 0HP:
4 0 0 0,2 8 0 5nP
1 4 0 0 1 0,2 3 2 0 5nP
100 0.25
400p

0 0,2 5 0,2 0 0,0 5 2,5
0,0 21 0,2 1 0,2
400
pP
PP
n


解题过程
在显著性水平 情况下,查表可知,
因为,拒绝原假设 。所以,该保龄球馆的经理可以得出结论:女性保龄球手的比例有所提高。
0.05
0,0 5 1,6 4 5
1,6 4 5? 0H
第二节 方差分析一、方差分析的基本问题
㈠ 概念方差分析是检验几个总体均值之间是否存在差别时最常用的统计方法,其基本原理是英国统计学家罗纳德 A· 费希尔 (Ronald A· Fisher) 在进行实验设计时为了解释试验数据而首先引入的。方差分析的原假设是多个总体均值彼此相等,抽样方法是独立地从每个分类范畴(即处理水平)中取样。
㈡ 方差分析的基本假设
⑴ 每个总体都应服从正态分布 。也就是说,
对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。
⑵ 各个总体的方差必须相同。 也就是说,各组观察数据是从具有相同方差的总体中抽取的。
⑶ 观察值之间是相互独立的 。
二、方差分析
在方差分析中,我们将那些影响实验指标的条件称为 因素,而将因素所处的条件称为 水平 。
如果所研究的问题只涉及一个影响因素,则称这样的方差分析为 单因素分析 ;
如果所研究的问题涉及多个影响因素,则称为 多因素分析 。
单因素方差分析只检验一个变量的影响,是最简单的形式的方差分析。它可以检验两个或两个以上的样本均值之间的差异。
本章小结本章共两节,主要介绍了假设检验和方差分析等内容 。
1.假设检验介绍了假设检验的概念,两类错误,
单侧检验,双侧检验等检验方法,重点介绍了正态总体均值,总体比例的检验方法 。
2.方差分析介绍了方差分析的概念和基本假设,
重点介绍单因素方差分析的方法 。
END