第七章 假设检验与方差
分析
第一节假设检验的意义和程序
一、假设检验的意义
所谓 假设检验,就是对某一总体参数先作
出假设的数值;然后搜集样本资料,用这些样本
资料确定假设数值与样本数值之间的差异;最后,
进一步判断两者差异是否显著,若两者差异很小,
则假设的参数是可信的,作出, 接受, 的结论,
若两者的差异很大,则假设的参数准确的可能性
很小,作出, 拒绝, 的结论。
某厂生产一批产品,必须检验合格才能
出厂,规定合格率为 95%,现从中抽取 100件
进行质量检查,发现合格率为 93%,假设检
验就是利用样本指标 p=93%的合格率,来判
断原来假设 P=95%合格率是否成立。如假设
成立,产品就能出厂,如假设不成立,这批
产品便不能出厂。
例 1
某地区去年职工家庭年收入为 72000元,
本年抽样调查结果表明,职工家庭年收入为
71000元,这是否意味着职工生活水平下降
呢?我们还不能下这个结论,最好通过假设
检验,检验这两年职工家庭收入是否存在显
著性统计差异,才能判断该地区今年职工家
庭年收入是否低于去年水平。
例 2
二, 假设检验的基本原理
( 一 ) 假设检验的基本思想与小概率原则
1,基本思想
2、小概率原则
(二)假设检验中命题的基本形式
1、原假设。它常常是根据已有的资料或经过周密
考虑后确定的,需要通过样本去推断其正确与否的命
题,一般用 H0表示。
2、备择假设。是与原假设相对立的假设,即原假设
被否定之后而决定选择的假设,一般用 H1表示,例如
00, ?? ?H 01, ?? ?H
00, ?? ?H 01, ?? ?H
(三)双侧检验与单侧检验
双侧检验与单侧检验
(假设的形式 )
假设
研究的问题
双侧检验 左侧检验 右侧检验
H0 ? = ?0 ? ??0 ? ??0
H1 ? ≠?0 ? < ?0 ? > ?0
双侧检验
(原假设与备择假设的确定)
1,双侧检验属于 决策中的假设检验 。 也就是说,
不论是拒绝 H0还是接受 H0,我们都必需采
取相应的行动措施
2,例如, 某种零件的尺寸, 要求其平均长度为
10厘米, 大于或小于 10厘米均属于不合格
3,建立的原假设与备择假设应为
? H0,?= 10 H1,?? 10
双侧检验
(例子)
,例如问题为, 检验该企业生产的零件平均
长度为 4厘米
该企业生产的零件平均长度是 4厘米吗?
(属于决策中的假设 )
? 提出备择提出原假设, H0,? = 4
? 假设, H1,?? 4
双侧检验
(显著性水平与拒绝域 )
H0值 临界值
临界值
a/2 a/2
样本统计量
拒绝域 拒绝域
接受域
抽样分布
1 - a
置信水平
双侧检验
(显著性水平与拒绝域 )
H0值 临界值临界值
a/2 a/2
样本统计量
拒绝域 拒绝域
接受域
抽样分布
1 - a
置信水平
单侧检验
(原假设与备择假设的确定)
? 检验 研究中的假设
1,将所研究的假设作为备择假设 H1
2,将认为研究结果是无效的说法或理论作
为原假设 H0。 或者说, 把希望 (想要 )证明
的假设作为备择假设
3,先确立备择假设 H1
单侧检验
(原假设与备择假设的确定)
? 例如, 采用新技术生产后, 将会使产品的
使用寿命明显延长到 1500小时以上
– 属于研究中的假设
– 建立的原假设与备择假设应为
? H0,?? 1500 H1,?? 1500
? 例如, 改进生产工艺后, 会使产品的废品
率降低到 2%以下
– 属于研究中的假设
– 建立的原假设与备择假设应为
? H0,?? 2% H1,?? 2%
单侧检验
(原假设与备择假设的确定)
? ?检验 某项声明的有效性
1,将所作出的说明 (声明 )作为原假设
2,对该说明的质疑作为备择假设
3,先确立原假设 H0
– 除非我们有证据表明, 声明, 无效, 否则
就应认为该, 声明, 是有效的
单侧检验
(原假设与备择假设的确定)
? 例如, 某灯泡制造商声称, 该企业所生
产的灯泡的平均使用寿命在 10000小时以

? 除非样本能提供证据表明使用寿命在
10000小时以下, 否则就应认为厂商的声
称是正确的
? 建立的原假设与备择假设应为
? H0,?? 10000 H1,?? 10000
单侧检验
(例子)
?该批产品的平均使用寿命超过 10000小时吗?
(属于检验声明的有效性,先提出原假设 )
? 提出原假设, H0,?? 10000
? 选择备择假设, H1,?? 10000
单侧检验
(例子)
? 学生中经常上网的人数超过 25%吗?
(属于研究中的假设,先提出备择假设)
? 提出原假设, H0,?? 25
? 选择备择假设, H1:, ?? 25
左侧检验
(显著性水平与拒绝域 )
H0值临界值
a
样本统计量
拒绝域
接受域
抽样分布
1 - a
置信水平
观察到的样本统计量
左侧检验
(显著性水平与拒绝域 )
H0值临界值
a
样本统计量
拒绝域
接受域
抽样分布
1 - a
置信水平
右侧检验
(显著性水平与拒绝域 )
H0值
临界值
a
样本统计量
拒绝域
接受域
抽样分布
1 - a
置信水平
观察到的样本统计量
右侧检验
(显著性水平与拒绝域 )
H0值
临界值
a
样本统计量
接受域
抽样分布
1 - a
置信水平
拒绝域
(四)假设检验的两类错误
陪审团审判
裁决
实际情况
无罪 有罪
无罪 正确 错误
有罪 错误 正确
H0 检验
决策
实际情况
H0为真 H0为假
接受 H0 1 - a 第二类错 误 (b)
拒绝 H0 第一类错 误 (a) 功效 (1-b)
H0,无罪 假设检验就好像一场审判过程
统计检验过程
a错误和 b 错误的关系
a
b
你不能同时减
少两类错误 !
a和 b的关系就像
翘翘板,a小 b就
大,a大 b就小
影响 b 错误的因素
? 1,总体参数的真值
? 随着假设的总体参数的减少而增大
? 2,显著性水平 a
? 当 a 减少时增大
? 3,总体标准差 ?
? 当 ? 增大时增大
? 4,样本容量 n
? 当 n 减少时增大
三、假设检验的程序
(一 )提出原假设和替代假设
原假设 (又称虚无假设 )是接受检验的假设,
记作 H0;
替代假设 (又称备选假设 )是当原假设被否定
时的另一种可成立的假设,记作 H1;
H0与 H1两者是对立的,如 H0真实,则 H1不真
实;如 H0不真实,则 H1为真实。 H0和 H1在统计学
中称为统计假设。
关于总体平均数的假设有三种情况:
(1) H0,μ =μ 0; H1,μ ≠ μ 0
(2) H0,μ ≥ μ 0; H1,μ <μ 0
(3) H0,μ ≤ μ 0; H1,μ >μ 0
以上三种类型,对第一种类型的检验,称双边
检验,因为 μ ≠ μ 0,包含 μ >μ 0和 μ <μ 0。而
对第二、三种类型的检验,称单边检验。

(二 )选择显著性水平
当 原假设 H0为真时,却因为样本指标的
差异而被否定,这种否定真实的原假设的概
率就是显著性水平。用 α 表示。
例 α=0.05( 即 5%)或 α=0.01( 即 1%)
在假设检验中,要分析样本数值与参数
假设值之间的差异,若两者差异越小,假设
值真实的可能性则越大;反之,假设值真实
的可能性越小。因此,要分析两者差异是否
显著,如两者差异是显著的,就要否定原假
设,因此,假设检验又称显著性检验。
(三 )选定检验统计量及其分布
=
如 下,
样 本 统 计
检 验 统 计 量 的 基 本
量 - 被 假 设 参 数检 验 统 计 量

形 式
计 量 的 标 准 差
XX
Z t
S
n n
? ? ? ?
==
?
检 验 总 体 平 均 值 的 统 有计

量, 例
(四)根据显著性水平确定统计量的否
定域及临界值
在 计算检验统计量时,要注意是双边
检验还是单边检验。要根据显著性水平 α 的
值确定统计量的否定域、接受域及临界值。
(五 )根据样本指标计算的检验统计量的数值作
出决策
如 果检验统计量的数值落在否定域内
(包括临界值 ),就说明原假设 H0与样本描述
的情况有显著差异,应该否定原假设;如果
该数值落在接受域内,就说明原假设 H0与样
本描述的情况无显著差异,则应接受原假设。
第二节 正态总体的参数检验
一, 总体方差已知时的均值检验
二, 总体方差未知时的均值检验
一个总体的检验
U检验
(单尾和双尾)
t 检验
(单尾和双尾)
U 检验
(单尾和双尾)
c2检验
(单尾和双尾)
均值
一个总体
比例 方差
检验的步骤
? 陈述原假设 H0
? 陈述备择假设 H1
? 选择显著性水平 a
? 选择检验统计量
? 选择 n
? 给出临界值
? 搜集数据
? 计算检验统计量
? 进行统计决策
? 表述决策结果
总体方差已知时的均值检验
(双尾 U 检验 )
一个总体的检验
U 检验
(单尾和双尾)
t 检验
(单尾和双尾)
U 检验
(单尾和双尾)
c2检验
(单尾和双尾)
均值
一个总体
比例 方差
均值的双尾 U 检验
(?2 已知 )
? 1,假定条件
? 总体服从正态分布
? 若不服从正态分布,可用正态分布来近似
(n?30)
? 2,原假设为,H0,?=?0; 备择假设为,H1:?
??0
3,使用 U-统计量
)1,0(~0 N
n
xU
?
??=
均值的双尾 U 检验
(实例 )
?【 例 】 某机床厂加工一种零件, 根据经验知道,
该厂加工零件的椭圆度近似服从正态分布, 其总
体均值为 ?0=0.081mm,总体标准差为 ?= 0.025 。
今换一种新机床进行加工, 抽取 n=200个零件进
行检验, 得到的椭圆度为 0.076mm。 试问新机床
加工零件的椭圆度的均值与以前有无显著差异?
( a= 0.05)
均值的双尾 U 检验
( 计算结果)
?H0,? = 0.081
?H1,?? 0.081
?a = 0.05
?n = 200
?临界值 (s):
检验统计量,
U0 1.96-1.96
.025
拒绝 H0 拒绝 H0
.025
决策,
结论,
拒绝 H0
有证据表明新机床加工的零件
的椭圆度与以前有显著差异
83.2
2 0 00 2 5.0
0 8 1.00 7 6.00 ?=?=?=
n
xU
?
?
总体方差已知时的均值检验
(单尾 U 检验 )
均值的单尾 U 检验
(?2 已知 )
1,假定条件
? 总体服从正态分布
? 若不服从正态分布,可以用正态分布来
近似 (n?30)
2,备择假设有 <或 >符号
3,使用 U-统计量
)1,0(~0 N
n
xU
?
??=
均值的单尾 U 检验
(提出假设)
左侧,H0:???0 H1:? < ?0
必须是 显著地 低于 ?0,大
的值满足 H0,不能拒绝
U0
拒绝 H0
a
右侧,H0:???0 H1,? > ?0
必须 显著地 大于 ?0,小的
值满足 H0,不能拒绝
U0
拒绝 H0
a
均值的单尾 U检验
(实例)
?【 例 】 某批发商欲从生产厂家购进一批灯泡, 根
据合同规定, 灯泡的使用寿命平均不能低于 1000小
时 。 已知灯泡使用寿命服从正态分布, 标准差为 20
小时 。 在总体中随机抽取 100只灯泡, 测得样本均
值为 960小时 。 批发商是否应该购买这批灯泡? (a
= 0.05)
均值的单尾 U检验
(计算结果)
?H0,?? 1000
?H1,? < 1000
?a = 0.05
?n = 100
?临界值 (s):
检验统计量,
在 a = 0.05的水平上拒绝 H0
有证据表明这批灯泡的使用
寿命低于 1000小时
决策,
结论,
2
1 0 020
1 0 0 09 6 00 ?=?=?=
n
xU
?
?
-1.645 U0
拒绝域
a
均值的单尾 U检验
(实例)
?【 例 】 根据过去大量资料, 某厂生产的灯泡的
使用寿命服从正态分布 N(1020,1002)。 现从最
近生产的一批产品中随机抽取 16只, 测得样本
平均寿命为 1080小时 。 试在 0.05的显著性水平
下判断这批产品的使用寿命是否有显著提高?
(a= 0.05)
均值的单尾 U检验
(计算结果)
?H0,?? 1020
?H1,? > 1020
?a = 0.05
?n = 16
?临界值 (s):
检验统计量,
在 a = 0.05的水平上拒绝 H0
有证据表明这批灯泡的使用
寿命有显著提高
决策,
结论,
4.2
14100
102010800 =?=?=
n
xU
?
?
U0
拒绝域
0.05
1.645
总体方差未知时的均值检验
(双尾 t 检验 )
一个总体的检验
U 检验
(单尾和双尾)
t 检验
(单尾和双尾)
U 检验
(单尾和双尾)
c2检验
(单尾和双尾)
均值
一个总体
比例 方差
均值的双尾 t 检验
(?2 未知 )
? 1,假定条件
? 总体为正态分布
? 如果不是正态分布,只有轻微偏斜和大样本
(n ?30)条件下
? 2,使用 t 统计量
)1(~0 ??= nt
ns
xt ?
均值的双尾 t 检验
(实例)
?【 例 】 某厂采用自动包装
机分装产品, 假定每包产
品的重量服从正态分布,
每包标准重量为 1000克 。
某日随机抽查 9包, 测得样
本平均重量为 986克, 样本
标准差为 24克 。 试问在
0.05的显著性水平上, 能
否认为这天自动包装机工
作正常?
属于决策中
的假设!
均值的双尾 t 检验
(计算结果)
?H0,? = 1000
?H1,?? 1000
?a = 0.05
?df = 9 - 1 = 8
?临界值 (s):
检验统计量,
在 a = 0.05的水平上接受 H0
有证据表明这天自动包装机
工作正常
决策:
结论:
75.1
924
1 0 0 09 8 60 ?=?=?=
ns
xt ?
t0 2.306-2.306
.025
拒绝 H0 拒绝 H0
.025
总体方差未知时的均值检验
(单尾 t 检验 )
均值的单尾 t 检验
(实例)
? 【 例 】 一个汽车轮胎制造商声
称, 某一等级的轮胎的平均寿命
在一定的汽车重量和正常行驶条
件下 大于 40000公里, 对一个由
20个轮胎组成的随机样本作了试
验, 测得平均值为 41000公里,
标准差为 5000公里 。 已知轮胎寿
命的公里数服从正态分布, 我们
能否根据这些数据作出结论, 该
制造商的产品同他所说的标准相
符? (a= 0.05)
属于检验声明有
效性的假设!
均值的单尾 t 检验
(计算结果)
?H0,?? 40000
?H1,? < 40000
?a = 0.05
?df = 20 - 1 = 19
?临界值 (s):
检验统计量,
在 a = 0.05的水平上接受 H0
有证据表明轮胎使用寿命显著
地大于 40000公里
决策,
结论,
8 94.0
205 00 0
4 00 0 04 10 0 0
0
=
?
=
?
=
ns
x
t
?
-1.7291 t0
拒绝域
.05
第三节 总体成数的假设检验
( U 检验)
适用的数据类型
离散数据 连续数据
数值型数据
数 据
品质数据
一个总体的检验
U 检验
(单尾和双尾)
t 检验
(单尾和双尾)
U 检验
(单尾和双尾)
c2检验
(单尾和双尾)
均值
一个总体
比例 方差
一个总体成数的 U 检验
1,假定条件
? 有两类结果
? 总体服从二项分布
? 可用正态分布来近似
2,比例检验的 U 统计量
P0为假设的总体比例
)1,0(~
)1(
?
00
0 N
n
pp
pp
U
?
?
=
一个总体比例的 U 检验
(实例)
?【 例 】 某研究者估计本
市居民家庭的电脑拥有率
为 30%。 现随机抽查了
200的家庭, 其中 68个家
庭拥有电脑 。 试问研究者
的估计是否可信? (a =
0.05)
属于决策中
的假设!
一个样本比例的 U 检验
(结果)
?H0,p = 0.3
?H1,p ? 0.3
?a = 0.05
?n = 200
?临界值 (s):
检验统计量,
在 a = 0.05的水平上接受 H0
有证据表明研究者的估计可信
决策,
结论,
234.1
200
7.03.0
3.034.0
)1(
?
00
0
=
?
?
=
?
?
=
n
pp
pp
U
U0 1.96-1.96
.025
拒绝 H0 拒绝 H0
.025
第四节 总体方差的检验
(c2 检验 )
一个总体的检验
U 检验
(单尾和双尾)
t 检验
(单尾和双尾)
U 检验
(单尾和双尾)
c2检验
(单尾和双尾)
均值
一个总体
比例 方差
方差的卡方 (c2) 检验
? 1.检验一个总体的方差或标准差
? 2.假设总体近似服从正态分布
? 3.原假设为 H0,?2 = ?02
? 4.检验统计量 样本方差
假设的总体方差
)1(~)1( 22
0
2
2 ??= nsn c
?
c
卡方 (c2)检验
实例
?【 例 】 根据长期正常生产的
资料可知, 某厂所产维尼纶的
纤度服从正态分布, 其方差为
0.0025。 现从某日产品中随机
抽取 20根, 测得样本方差为
0.0042。 试判断该日纤度的波
动 与 平 日 有 无 显 著 差 异?
(a=0.05 )
属于决策中
的假设!
卡方 (c2) 检验
计算结果
?H0,?2 = 0.0025
?H1,?2 ? 0.0025
?a = 0.05
?df = 20 - 1 = 19
?临界值 (s):
统计量,
在 a = 0.05的水平上接受 H0
有证据表明该日纤度的波动比
平时没有显著差异c20 32.8528.907
a /2 =.05
决策,
结论,
92.31
0 0 2 5.0
0 0 4 2.0)120(
)1(
2
0
2
2
=
?
=
?
=
?
c
sn
阅读材料
? 阅读材料七,doc
六月 20062 0 0 6 六月
星期一 星期二 星期三 星期四 星期五 星期六 星期日
29 30 31 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 1 2
3 4 5 6 7 8 9
End of Chapter 7