1
第八章
假设检验的基本概念
2
假设检验过去称显著性检验。它是利
用小概率反证法思想,从问题的对立面
(H0)出发间接判断要解决的问题 (H1)是否
成立。然后在 H0成立的条件下计算检验
统计量,最后获得 P值来判断 。
?假设检验 基本思想及步骤
3
问题实质上都是希望通过样本统计
量与总体参数的差别,或两个样本
统计量的差别,来推断总体参数是
否不同。这种识别的过程,就是本
章介绍的假设检验 (hypothesis test)。
4
例 8–1 通过以往大规模调查, 已知某地一般新
生儿的头围均数为 34.50cm,标准差为 1.99cm。
为研究某矿区新生儿的发育状况, 现从该地某
矿区随机抽取新生儿 55人, 测得其头围均数为
33.89cm,问该矿区新生儿的头围总体均数与
一般新生儿头围总体均数是否不同?
5
本例,0 3 4, 5 0,3 3, 8 9c m X c m? ??,
造成 0X ??? 的可能原因有二,
假设检验的目的 ——就是判断差别
是由哪种原因造成的 。
① 抽样误差造成的;
② 本质差异造成的 。
6
矿区新生儿头围
34.50cm
33.89cn
矿区新生儿头围
34.50cm
? ?
??X ?
一种假设 H0
另一种假设 H1
抽样误差
总体不同
7
1,建立检验假设,确定检验水准(选用单侧或双侧检验)
( 1 )无效假设又称零假设,记为 H
0;
( 2 )备择假设又称对立假设,记为 H
1

对于检验假设,须注意,
① 检验假设是针对总体而言,而不是针对样本;
② H
0
和 H
1
是相互联系,对立的假设,后面的结论是
根据 H
0
和 H
1
作出的,因此两者不是可有可无,而是
缺一不可;
8
③ H1的内容直接反映了检验单双侧 。 若 H1
中只是 ? ??0 或 ? <?0,则此检验为单侧检验 。
它不仅考虑有无差异, 而且还考虑差异的方向 。
④ 单双侧检验的确定, 首先根据专业知识,
其次根据所要解决的问题来确定 。 若从专业上
看一种方法结果不可能低于或高于另一种方法
结果, 此时应该用单侧检验 。 一般认为双侧检
验较保守和稳妥 。
9
(3) 检验水准 ?,过去称显著性水准, 是预
先规定的概率值, 它确定了小概率事件的
标准 。 在实际工作中常取 ? = 0.05。 可根据
不同研究目的给予不同设置 。
10
根据变量和资料类型、设计方
案、统计推断的目的、是否满足特
定条件等(如 数据的分布类型 )选
择相应的检验统计量。
2,计算检验统计量
11
3,确定 P值,下结论
12
/2,t??/2,t??? t
P
1 ??
13
若 P ??,按所取检验水准 ?,拒绝
0
H,
接受 1H,下“有差别”的结论。其统计学依
据是,在 0H 成立的条件下,得到现有检验结
果的概率小于
?
,因为小概率事件不可能在
一次试验中发生,所以拒绝 0
H

14
第三节
大样本均数的假设检验
15
均数比较 u检验的主要适用条件为:
1,单样本数据, 每组例数等于或大于 60例;两样本数
据, 两组例数的合计等于或大于 60例, 而且基本均等 。
2,样本数据不要求一定服从正态分布总体 。
3,两总体方差已知 。
4,理论上要求:单样本是从总体中随机抽取, 两样本
为随机分组资料 。 观察性资料要求组间具有可比性,
即比较组之间除了研究因素以外, 其他可能有影响的
非研究因素均应相同或相近 。
16
1.单样本 u检验 (one-sample u-test) 适
用于当 n较大 (如 n>60)或 已知时 。 验
统计量分别为
0?
00
00
0
0
( )
( )
X
X
XX
un
S Sn
XX
u
n
??
??
?
? ?
??
??
??
??
较大时
已知时
P121 例 8-2
17
12
1 2 1 2
22
12
12
XX
X X X X
u
S SS
nn
?
??
??
?
2.两样本 u检验 (two-sample u-test)
适用于 两样本含量较大 ( 如 n1>30 且
n2>30)时 。 检验统计量为
P122 例 8-3两均数之差的标准误的估计值
18
第五节
检验水准与两类错误
19
I型错误和 II型错误
假设检验是利用小概率反证法思想,
从问题的对立面 (H0)出发间接判断要解决
的问题 (H1)是否成立, 然后在假定 H0成立
的条件下计算检验统计量, 最后根据 P值判
断结果, 此推断结论具有概率性, 因而无
论 拒绝 还是 不拒绝 H0,都可能犯错误 。 详
见表 8-1。
20
I 型错误:, 实际无差别,但下了有差别
的结论,, 假阳性错误 。犯这种错误的概率
是 ?( 其值等于检验水准 )
II型错误,, 实际有差别,但下了不拒绝 H0
的结论,, 假阴性错误 。犯这种错误的概率
是 ?( 其值未知 ) 。
但 n 一定时,? 增大,? 则减少 。
21
假设检验的结果
客观实际
拒绝 H 0,接受” H 0
H 0 成立 I 型错误 ( ? ) 推断正确 (1 ? ? )
H 0 不成立
即 H 1 成立
推断正确 (1 ? ? ) II 型错误 ( ? )
表 3-10 可能发生的两类错误
22图 8-2 I型错误与 II型错误示意图 (以单侧 u检验为例 )
?
?
H
1
,? < ?
0
成立
? 界值 ?
0
1 ? ?
1 ? ?
23
1-?, 检验效能 ( power),当 两总体确有差别,
按 检验水准 ? 所能发现这种差别的能力。
24
减少 I型错误 的主要方法:假设检验时设定 ?值 。
减少 II型错误 的主要方法,提高 检验效能 。
提高 检验效能的最有效方法,增加样本量 。
如何 选择合适的样本量,实验设计 。
25
第六节 单侧检验与双侧检验
26
? 图 8–3 双侧 u检验的检验水准 α
? 图 8–4 单侧 u检验的检验水准 α
单侧检验 概念
27
第七节 假设检验的统计意义与
实际意义
28
1.要有严密的研究设计, 尤其是下 因果 结
论 。
2.不同的资料应选用不同检验方法。
3.正确理解, 显著性, 一词的含义 (用 统计
学意义 一词 替代 )。
29
4.结论不能绝对化, 提倡使用精确 P值 。
5.注意统计, 显著性, 与医学 /临床 /
生物
学, 显著性, 的区别
30
6.可信区间与假设检验各自不同的
作用,要结合使用。
一方面, 可信区间 亦可回答 假设检验
的问题,算得的可信区间若包含了 H0,则
按 ?水准,不拒绝 H0;若不包含 H0,则按
?水准,拒绝 H0,接受 H1。
31
另一方面,可信区间不但能回
答差别有无统计学意义,而且还能
比假设检验提供更多的信息,即提
示差别有无实际的专业意义。
32
有实际专业
意义的值
H
0
( 2)
( 3)
( 4)
( 5)
( 1)
有实际 可能有实际 无实际 样本例数 可接受
专业意义 专业意义 专业意义 太少 H
0
有统计学意义 无统计学意义
图 3-7 可信区间在统计推断上提供的信息
33
虽然 可信区间 亦可回答 假设检验 的
问题,并能提供更多的信息,但并不意
味着可信区间能够完全代替假设检验。
可信区间只能在预先规定的概率 ? 检验
水准 ?的前提下进行计算,而假设检验能
够获得一较为确切的概率 P值。
34
练习
P 134 三,2、