6 - 1
统计学
(核心课程 ) 第 6 章 假设检验
作者:中国人民大学统计学院
贾俊平
6 - 2
统计学
(核心课程 ) 第 6 章 假设检验
6.1 假设检验的基本问题
6.2 大样本情形下的总体均值检验
6.3 小样本情形下的总体均值检验
6.3 总体比例的检验
6 - 3
统计学
(核心课程 ) 假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计 假设检验
6 - 4
统计学
(核心课程 ) 学习目标
1,假设检验的基本思想和原理
2,假设检验的步骤
3,总体均值的检验
4,总体比例的检验
6 - 5
统计学
(核心课程 ) 6.1 假设检验的基本问题
一,原假设与备择假设备
二,拒绝域和检验统计量
三,两类错误和显著性水平
四,单侧检验与双侧检验
6 - 6
统计学
(核心课程 )
什么是假设检验
6 - 7
统计学
(核心课程 )
什么是假设?
(hypothesis)
? 对总体参数的具体数
值所作的陈述
? 总体参数包括 总体均
值, 比例, 方差 等
? 分析 之前 必需陈述
我认为这种新药的疗效
比原有的药物更有效 !
6 - 8
统计学
(核心课程 )
什么是假设检验?
(hypothesis test)
1,先对总体的参数 (或分布形式 )提出某种
假设, 然后利用样本信息判断假设是否
成立的过程
2,有参数检验和 非 参数检验
3,逻辑上运用反证法, 统计上依据小概率
原理
6 - 9
统计学
(核心课程 ) 假设检验的基本思想
..,因此我们拒
绝假设 ? = 50
..,如果这是总
体的真实均值
样本均值? = 50
抽样分布
H0
这个值不像我
们应该得到的
样本均值,..
20
6 - 10
统计学
(核心课程 )
总体
?
?
?
?
?
? ?
假设检验的过程
抽取随机样本
均值
?x = 20? ?
我认为人口的平
均年龄是 50岁
提出假设
拒绝假设
别无选择 !
作出决策
6 - 11
统计学
(核心课程 )
原假设与备择假设
6 - 12
统计学
(核心课程 )
原假设
(null hypothesis)
1,研 究者想收集证据予以反对的假设
2,又称,0假设”
3,总是有符号 ?,? 或 ??
4,表示为 H0
? H0, ? = 某一数值
? 指定为符号 =,? 或 ??
? 例如,H0, ? ? 10cm
为什么叫
0假设?
?
6 - 13
统计学
(核心课程 )
1,研究 者想收集证据予以支持的假设
2,也称, 研究假设,
3,总是有符号 ?,??或 ?
4,表示为 H1
? H1, ? <某一数值, 或 ? ?某一数值
? 例如,H1, ? < 10cm,或 ??10cm
备择假设
(alternative hypothesis)
6 - 14
统计学
(核心课程 )
【 例 】 一种零件的生产标准是直径应为 10cm,为对生
产过程进行控制, 质量监测人员定期对一台加工机
床检查, 确定这台机床生产的零件是否符合标准要
求 。 如果零件的平均直径大于或小于 10cm,则表
明生产过程不正常, 必须进行调整 。 试陈述用来检
验生产过程是否正常的原假设和被择假设
提出假设
(例题分析 )
解,研究者想收集证据予以证明的
假设应该是, 生产过程不正常, 。
建立的原假设和备择假设为
H0, ? ? 10cm H1, ? ? 10cm
6 - 15
统计学
(核心课程 )
【 例 】 某品牌洗涤剂在它的产品说明书中声称:平
均净含量不少于 500克 。 从消费者的利益出发,
有关研究人员要通过抽检其中的一批产品来验
证该产品制造商的说明是否属实 。 试陈述用于
检验的原假设与备择假设
提出假设
(例题分析 )
解,研究者抽检的意图是倾向于证
实这种洗涤剂的平均净含量并不符
合说明书中的陈述 。 建立的原假设
和备择假设为
H0, ? ?? 500 H1, ? < 500 500g
绿叶
洗涤剂
6 - 16
统计学
(核心课程 )
【 例 】 一家研究机构估计, 某城市中家庭拥有汽车
的比例超过 30%。 为验证这一估计是否正确,
该研究机构随机抽取了一个样本进行检验 。 试
陈述用于检验的原假设与备择假设
提出假设
(例题分析 )
解,研究者想收集证据予以支持的假
设是“该城市中家庭拥有汽车的比例
超过 30%”。建立的原假设和备择假设

H0, ? ? 30% H1, ?? 30%
6 - 17
统计学
(核心课程 )
1,原假设和备择假设是一个完备事件组, 而且
相互对立
? 在一项假设检验中, 原假设和备择假设必有一
个成立, 而且只有一个成立
2,先确定备择假设, 再确定原假设
3,等号, =”总是放在原假设上
4,因研究目的不同, 对同一问题可能提出不同
的假设 (也可能得出不同的结论 )
提出假设
(结论与建议 )
6 - 18
统计学
(核心课程 )
双侧检验与单侧检验
6 - 19
统计学
(核心课程 )
1,备择假设没有特定的方向性,并含有符号
,?”的假设检验,称为双侧检验或双尾
检验 (two-tailed test)
2,备择假设具有特定的方向性,并含有符号
,>”或,<”的假设检验,称为单侧检验或
单尾检验 (one-tailed test)
? 备择假设的方向为,<”,称为 左侧检验
? 备择假设的方向为,>”,称为 右侧检验
双侧检验与单侧检验
6 - 20
统计学
(核心课程 )
双侧检验与单侧检验
(假设的形式 )
假设 双侧检验 单侧检验
左侧检验 右侧检验
原假设 H0,?? = ?0 H0,????0 H0,????0
备择假设 H1,?? ≠?0 H1,? < ?0 H1,?? > ?0
6 - 21
统计学
(核心课程 )
两类错误与显著性水平
6 - 22
统计学
(核心课程 ) 假设检验中的两类错误
1,第 Ⅰ 类错误 (弃真错误 )
? 原假设为真时拒绝原假设
? 第 Ⅰ 类错误的概率记为 ?
? 被称为显著性水平
2,第 Ⅱ 类错误 (取伪错误 )
? 原假设为假时未拒绝原假

? 第 Ⅱ 类错误的概率记为
??(Beta)
?
?
6 - 23
统计学
(核心课程 )
H0,无罪
假设检验中的两类错误
(决策结果 )
陪审团审判
裁决
实际情况
无罪 有罪
无罪 正确 错误
有罪 错误 正确
H0 检验
决策
实际情况
H0为真 H0为假
未拒绝 H0 正确决策 (1 – ?) 第 Ⅱ 类错误 (??)
拒绝 H0 第 Ⅰ 类错误 (??) 正确决策 (1-??)
假设检验就好像一场审判过程 统计检验过程
6 - 24
统计学
(核心课程 ) ?错误和 ? 错误的关系
?
?
你不能同时减
少两类错误 !
?和 ?的关系就像
翘翘板,?小 ?就
大,?大 ?就小
6 - 25
统计学
(核心课程 ) 影响 ? 错误的因素
1,总体参数的真值
? 随着假设的总体参数的减少而增大
2,显著性水平 ?
? 当 ?减少时增大
3,总体标准差 ?
? 当 ?增大时增大
4,样本容量 n
? 当 n 减少时增大
6 - 26
统计学
(核心课程 )
显著性水平 ?
(significant level)
1,是一个概率值
2,原假设为真时,拒绝原假设的概率
? 被称为抽样分布的拒绝域
3,表示为 ??(alpha)
? 常用的 ??值有 0.01,0.05,0.10
4,由研究者事先确定
6 - 27
统计学
(核心课程 ) 假设检验中的小概率原理
?什么小概率?
1,在一次试验中, 一个几乎不可能发生的
事件发生的概率
2,在一次试验中小概率事件一旦发生, 我
们就有理由拒绝原假设
3,小概率由研究者事先确定
什么是小
概率??
6 - 28
统计学
(核心课程 )
统计量与拒绝域
6 - 29
统计学
(核心课程 )
1,根据样本观测结果计算得到的, 并据以对原
假设和备择假设作出决策的某个样本统计量
2,对样本估计量的标准化结果
? 原假设 H0为真
? 点估计量的抽样分布
检验统计量
(test statistic)
点估计量的抽样标准差
假设值—点估计量标准化检验统计量 ?
3,标准化的检验统计量
6 - 30
统计学
(核心课程 )
显著性水平和拒绝域
(双侧检验 )
抽样分布
0 临界值临界值
?/2 ?/2
样本统计量
拒绝 H0 拒绝 H0
1 - ?
置信水平
6 - 31
统计学
(核心课程 )
显著性水平和拒绝域
(双侧检验 )
0 临界值
临界值
??/2??/2
样本统计量
拒绝 H0 拒绝 H0
抽样分布
1 - ?
置信水平
6 - 32
统计学
(核心课程 )
显著性水平和拒绝域
(双侧检验 )
0 临界值临界值
??/2 ??/2
样本统计量
拒绝 H0 拒绝 H0
抽样分布
1 - ?
置信水平
6 - 33
统计学
(核心课程 )
显著性水平和拒绝域
(双侧检验 )
0 临界值临界值
??/2??/2
样本统计量
拒绝 H0 拒绝 H0
抽样分布
1 - ?
置信水平
6 - 34
统计学
(核心课程 )
显著性水平和拒绝域
(单侧检验 )
0临界值
?
样本统计量
拒绝 H0
抽样分布
1 - ?
置信水平
6 - 35
统计学
(核心课程 )
显著性水平和拒绝域
(左侧检验 )
0临界值
?
样本统计量
拒绝 H0
抽样分布
1 - ?
置信水平
观察到的样本统计量
6 - 36
统计学
(核心课程 )
显著性水平和拒绝域
(左侧检验 )
0临界值
?
样本统计量
拒绝 H0
抽样分布
1 - ?
置信水平
6 - 37
统计学
(核心课程 )
显著性水平和拒绝域
(右侧检验 )
0
临界值
?
样本统计量
拒绝 H0
抽样分布
1 - ?
置信水平
观察到的样本统计量
6 - 38
统计学
(核心课程 )
显著性水平和拒绝域
(右侧检验 )
0
临界值
?
样本统计量
抽样分布
1 - ?
置信水平
拒绝 H0
6 - 39
统计学
(核心课程 ) 决策规则
1,给定显著性水平 ?,查表得出相应的临界
值 z?或 z?/2,t?或 t?/2
2,将检验统计量的值与 ?水平的临界值进
行比较
3,作出决策
? 双侧检验,I统计量 I > 临界值,拒绝 H0
? 左侧检验,统计量 < -临界值,拒绝 H0
? 右侧检验,统计量 > 临界值,拒绝 H0
6 - 40
统计学
(核心课程 )
假设检验结论的表述
6 - 41
统计学
(核心课程 ) 假设检验结论的表述
1,假设检验的目的就在于试图找到拒绝原假设,
而不在于证明什么是正确的
2,拒绝原假设时结论是清楚的
? 例如, H0,?=10,拒绝 H0时, 我们可以说 ??10
3,当不拒绝原假设时
? 并未给出明确的结论
? 不能说原假设是正确的, 也不能说它不是正确的
? 例如, 当不拒绝 H0,?=10,我们并未说它就是 10
,但也未说它不是 10。 我们只能说样本提供的证
据还不足以推翻原假设
6 - 42
统计学
(核心课程 ) 假设检验步骤的总结
1,陈述原假设和备择假设
2,从所研究的总体中抽出一个随机样本
3,确定一个适当的检验统计量, 并利用样本数据
算出其具体数值
4,确定一个适当的显著性水平, 并计算出其临界
值, 指定拒绝域
5,将统计量的值与临界值进行比较, 作出决策
? 统计量的值落在拒绝域, 拒绝 H0,否则不拒绝 H0
? 也可以直接利用 P值 作出决策
6 - 43
统计学
(核心课程 ) 6.2 总体均值的检验
一,大样本情形下总体均值的检验
二,小样本情形下总体均值的检验
6 - 44
统计学
(核心课程 )
总体均值的检验
(作出判断 )
?是否已

小样本容量 n大
?是否已


t 检验
ns
xt 0???

z 检验
ns
xz 0???

z 检验
n
xz
?
?0??

z 检验
n
xz
?
?0??
6 - 45
统计学
(核心课程 )
总体 均值的检验
(大样本 )
6 - 46
统计学
(核心课程 )
总体均值的检验
(大样本 )
1,假定条件
? 正态总体或非正态总体大样本 (n?30)
2,使用 z检验统计量
? ? 2 已知:
? ? 2 未知:
)1,0(~0 N
n
xz
?
???
)1,0(~0 N
ns
xz ???
6 - 47
统计学
(核心课程 )
总体均值的检验 (? 2 已知 )
(例题分析 )
【 例 】 一种罐装饮料采用自动生
产线生产, 每罐的容量是 255ml,
标准差为 5ml。 为检验每罐容量是
否符合要求, 质检人员在某天生
产的饮料中随机抽取了 40罐进行
检验, 测 得 每 罐 平 均 容 量 为
255.8ml。 取显著性水平 ?=0.05
,检验该天生产的饮料容量是否
符合标准要求?
双侧检验
绿色
健康饮品绿色
健康饮品
255 255
6 - 48
统计学
(核心课程 )
总体均值的检验 (? 2 已知 )
(例题分析 )
H0, ? = 255
H1, ?? 255
? = 0.05
n = 40
临界值 (c):
检验统计量,
z0 1.96-1.96
0.025
拒绝 H0 拒绝 H0
0.025
决策,
结论,
不拒绝 H0
样本提供的证据还不足以推翻
,该天生产的饮料符合标准要
求, 的看法
01.1
405
2 5 58.2 5 50 ?????
n
xz
?
?
6 - 49
统计学
(核心课程 )
总体均值的检验 (? 2 未知 )
(例题分析 )
【 例 】 一种机床加工的零件尺
寸绝对平均误差为 1.35mm。 生
产厂家现采用一种新的机床进
行加工以期进一步降低误差 。
为检验新机床加工的零件平均
误差与旧机床相比是否有显著
降低, 从某天生产的零件中随
机抽取 50个进行检验 。 利用这
些样本数据, 检验新机床加工
的零件尺寸的平均误差与旧机
床 相 比 是 否 有 显 著 降 低?
(?=0.01)
左侧检验
50个零件尺寸的误差数据 (mm)
1.26 1.19 1.31 0.97 1.81
1.13 0.96 1.06 1.00 0.94
0.98 1.10 1.12 1.03 1.16
1.12 1.12 0.95 1.02 1.13
1.23 0.74 1.50 0.50 0.59
0.99 1.45 1.24 1.01 2.03
1.98 1.97 0.91 1.22 1.06
1.11 1.54 1.08 1.10 1.64
1.70 2.37 1.38 1.60 1.26
1.17 1.12 1.23 0.82 0.86
6 - 50
统计学
(核心课程 )
总体均值的检验 (? 2 未知 )
(例题分析 )
H0, ? ? 1.35
H1, ? < 1.35
? = 0.01
n = 50
临界值 (c):
检验统计量,
拒绝 H0
新机床加工的零件尺寸的平均误
差与旧机床相比有显著降低
决策,
结论,
6 0 6 1.2
503 6 5 7 4 9.0
35.13 1 5 2.1 ????z
-2.33 z0
拒绝 H0
0.01
6 - 51
统计学
(核心课程 )
总体均值的检验 (? 2 未知 )
(例题分析 )
【 例 】 某一小麦品种的平均产量为
5200kg/hm2 。 一家研究机构对小麦品
种进行了改良以期提高产量 。 为检验改
良后的新品种产量是否有显著提高, 随
机抽取了 36个地块进行试种, 得到的样
本平均产量为 5275kg/hm2,标准差为
120/hm2 。 试检验改良后的新品种产量
是否有显著提高? (?=0.05)
右侧检验
6 - 52
统计学
(核心课程 )
总体均值的检验 (? 2 未知 )
(例题分析 )
H0, ? ? 5200
H1, ? > 5200
? = 0.05
n = 36
临界值 (c):
检验统计量,
拒绝 H0
改良后的新品种产量有显著提高
决策,
结论,
75.3
361 2 0
5 2 0 05 2 7 5 ???z
z0
拒绝 H0
0.05
1.645
6 - 53
统计学
(核心课程 )
总体均值的检验
(大 样本检验方法的总结 )
假设 双侧检验 左侧检验 右侧检验
假设形式 H0, ??=?0H
1, ????0
H0, ????0
H1, ??<?0
H0, ??? ?0
H1, ??>?0
统计量
? 已知:
? 未知:
拒绝域
P值决策 拒绝 H0
n
xz
?
? 0??
ns
xz 0???
2/?zz ? ?zz ?? ?zz ?
??P
6 - 54
统计学
(核心课程 )
总体 均值的检验
(小样本 )
6 - 55
统计学
(核心课程 )
总体均值的检验
(小样本 )
1,假定条件
? 总体服从正态分布
? 小样本 (n ? 30)
2,检验统计量
? ? 2 已知:
? ? 2 未知:
)1,0(~0 N
n
xz
?
???
)1(~0 ??? nt
ns
xt ?
6 - 56
统计学
(核心课程 )
总体均值的检验
(小 样本检验方法的总结 )
假设 双侧检验 左侧检验 右侧检验
假设形式 H0, ??=?0H
1, ????0
H0, ????0
H1, ??<?0
H0, ????0
H1, ??>?0
统计量
? 已知:
? 未知:
拒绝域
P值决策 拒绝 H0
n
xz
?
? 0??
ns
xt 0???
)1(2/ ?? ntt ? )1( ??? ntt ? )1( ?? ntt ?
??P
注,?已知的拒绝域同大样本
6 - 57
统计学
(核心课程 )
总体均值的检验
(例题分析 )
【 例 】 一种汽车配件的平均长度要求为 12cm,高
于或低于该标准均被认为是不合格的 。 汽车生产
企业在购进配件时, 通常是经过招标, 然后对中
标的配件提供商提供的样品进行检验, 以决定是
否购进 。 现对一个配件提供商提供的 10个样本进
行了检验 。 假定该供货商生产的配件长度服从正
态分布, 在 0.05的显著性水平下, 检验该供货商
提供的配件是否符合要求?
10个零件尺寸的长度 (cm)
12.2 10.8 12.0 11.8 11.9
12.4 11.3 12.2 12.0 12.3
6 - 58
统计学
(核心课程 )
总体均值的检验
(例题分析 )
H0, ? =12
H1, ? ?12
? = 0.05
df = 10 - 1= 9
临界值 (c):
检验统计量,
不拒绝 H0
样本提供的证据还不足以推翻
,该供货商提供的零件符合要
求, 的看法
决策:
结论:
7035.0
104932.0
1289.11 ????t
t0 2.262-2.262
0.025
拒绝 H0 拒绝 H0
0.025
6 - 59
统计学
(核心课程 ) 6.2 总体比例的检验
6 - 60
统计学
(核心课程 ) 适用的数据类型
离散数据 连续数据
数值型数据
数 据
品质数据
6 - 61
统计学
(核心课程 ) 总体比例检验
1,假定条件
? 总体服从二项分布
? 可用正态分布来近似 (大样本 )
2,检验的 z 统计量
? 0为假设的总体比例
)1,0(~
)1( 00
0 N
n
p
z
??
?
?
?
?
6 - 62
统计学
(核心课程 )
总体比例的检验
(检验方法的总结 )
假设 双侧检验 左侧检验 右侧检验
假设形式 H0,? =? 0H
1,??? 0
H0, ??? 0
H1, ? <? 0
H0, ??? 0
H1, ? >? 0
统计量
拒绝域
P值决策 拒绝 H0??P
2/?zz ?
n
p
z
)1( 00
0
??
?
?
?
?
?zz ?? ?zz ?
6 - 63
统计学
(核心课程 )
总体比例的检验
(例题分析 )
【 例 】 一种以休闲和娱乐为
主题的杂志, 声称其读者群中
有 80%为女性 。 为验证这一说
法是否属实, 某研究部门抽取
了由 200人组成的一个随机样
本, 发现有 146个女性经常阅
读该杂志 。 分别取显著性水平
?=0.05和 ?=0.01, 检验该杂
志读者群中女性的比例是否为
80%? 它们的值各是多少?
双侧检验
6 - 64
统计学
(核心课程 )
总体比例的检验
(例题分析 )
H0, ? = 80%
H1, ? ? 80%
? = 0.05
n = 200
临界值 (c):
检验统计量,
拒绝 H0
该杂志的说法并不属实
决策,
结论,
4 7 5.2
2 0 0
)80.01(80.0
80.073.0
??
??
?
?z
z0 1.96-1.96
0.025
拒绝 H0 拒绝 H0
0.025
6 - 65
统计学
(核心课程 )
总体比例的检验
(例题分析 )
H0, ? = 80%
H1, ? ? 80%
? = 0.01
n = 200
临界值 (c):
检验统计量,
不拒绝 H0
样本提供的证据还不足以推翻, 该
杂志声称读者群中有 80%为女性,
的看法
决策,
结论,
4 7 5.2
2 0 0
)80.01(80.0
80.073.0
??
??
?
?z
z0 2.58-2.58
0.025
拒绝 H0 拒绝 H0
0.025
6 - 66
统计学
(核心课程 ) 本章小节
1,假设检验的基本问题
2,总体均值的检验
3,总体比例的检验
结 束