第七章 假设检验
一,教学 要求
1,理解显 著性检验的基本思想,了解假设检验可能产生的两类错误。 知道两类错误概率,
并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤。
2.了解单 个及两个正态总体的均值和方差的假设检验。
3.了解总 体分布假设的 拟合优度检验法。
本章重点:正态总体的参数的假设检验。
二,教学 内容
§ 7.1 假 设检验 的 基 本概念
假设检验是统计推断的另一类重要问题。 对总体的分布函数的某些参数或分布函数的形式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题称为假设检验,所作的假设称为原假设 (或统计假设 ),用 H
0
表示。
例 7.1 某厂 有一批产品,共有 200件,需检验合格才能出厂。 按国家 标准,次品率不得超过 3%。 今在其中随机地抽取 10件,发现其中有 2 件 次 品,问这批产品能否出厂?
分析,如果 用点估计方法作为检验方法,显然
10
2
> 3%,这批货物是要被拒出厂的。 但是厂家有理由反对用这种检验方法。 他们认为,由于抽样是随机的,在这次抽样中,次品的频 率超过 3%,不 等于说这批产品的次品率 (概率)超过了 3%。 就如同说掷一枚钱币,正反两面出现的概率各为 1/2,但若掷两次钱币,不见得正,反面正好各出现一次一样。 就是说,
即使该批货的次品率为 3%,仍有很大的概率使得在抽检 10 件 产品时出现 2 个以上的次 品,
因此需要用别的方法。
p
事实上,对 于这类问 题,通常就 是 采用假设 检 验的方法 。 具体来说 就 是先假设 次品 率
,然后从抽样的结果来说明%3≤p %3≤p 这一假设是否合理。 注意,这里用的是“合理”
一词,而不是“正确”,粗略地说就是“认为 %3≤p,能否说得过去。
例 7.2 某研 究所推出一种感冒特效新药,为证明其疗效,选择 200 名 患者为志愿者。
将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。
表 7.1
是否痊愈
服何种药
痊愈者 未痊愈者 合计
未服药者 48 52 100
服药者 56 44 100
合 计 104 96 200
问新药是否确有明显疗效?
分析,这个 问题就不存在估计什么的问题。 从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。 对于新药上市这样关系到 千万人健康 的事,一定 要采取慎重 的态度。 这 就需要用一 种统计方法 来检验药效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,
因此可以提出假设,新药无效”,除 非抽样结果显著地说明这假设不合理,否则,将 不能认为新药有明显的疗效。这种提出假设,然后做出否定或不否定的判断通常称为 显著性检验 。
假设检验可分为 参数检 验( Parametric test)和 非 参数检验 (Nonparametric test)。 当总体分布形式已知,只对某些参数做出假设,进而做出的检验称为参数检验; 对其它假设做出的检验为非参数检验。
如 例 7.1 中,总体是两点分布,只需对参数 做出假设检验,这是参数检验问题,而 例
7.2 则是非参 数检验的问题。
p
1,假设检验 的 基本原理
(1) 基本原理,小概率原理 (或实际推断 原理 ),即,概率很小的 事件在一次 试验中,实际上可认为几乎不会发生” ;
(2) 基本思想,采用概率性质的反证法,即先提出假设 H
0
,然后根据一次抽样所得的样本值进行计算,若导致小概率事件发生,则否定假设 H
0;否则,接受假设 H
0
。
注,所谓,小概率事件” 。 究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数 10,<<αα,认 为概率 不超 过 α的事 件是 在一次试 验 中不会发 生 的事件,这 个 α 称为 显著性水 平 。 对于实际 问题应根据不同的需要和侧重,指定不同的显著性水平。 但为了制表方便,通常可选取 α=0.01,0.05,0.10 等。
我们将通过下面的例子来阐述假设检验的一般原理和步骤。
例 7.3 某超 市为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、白两色球各 10 个的暗箱中连续摸 10 次(摸后放回),若 10 次都是摸得白球,
则中大奖。 某人按此规则去摸 10 次,皆为白球,商店认定此人作弊,拒付大奖,此人不服,
最后引出官司。
分析,从统 计的观点看,商店的怀疑是有道理的。 因为,如果此人摸球完全是随机的,则要正好在 10 次 摸球中均摸到白球的概率为
1024
1
)
2
1
(
10
=,这是一个很小的数。 由统计的基本原理知道,在一次试验中所发生的事件不应该是小概率事件。 现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。 上述的这一推断,实际 上就是假设检验的全部过程。
下面,我们用假设检验的语言来模拟商店的推断,
1° 提出假设,
H
0
:此人未作弊; H
1
:此人作弊
其中 H
0
称为 原假设,H
1
称为 备选假 设 或 对立假 设,备选假设也可以不写。
2° 构造统计 量,并由样本算出其观察值
取统计量为,N ={在 10次模球中,摸中白球的个数},由样本得 N 的观 察值为,10=N
3° 求出在 H
0
下,统计量 的分布 N
在 H
0
下,即如果此人是完全随机地摸球的话,则 ),
2
1
B(10,~N 其分布律为
10
10
)
2
1
(
k
k
Cp =,10,,2,1,0 "=k
4° 给定显著 性水平 α,构造对 H
0
不利的小概率事件
在 H
0
下,此人摸到的白球数应该在平均数 5 个 附 近,所以对 H
0
不利的小概率事件是:,白球数 大于某个较大的数,或小于某个较小的数” 。 在此问题中,若 HN
0
不成立,即此人作弊的话,不 可能故意少 摸白球,因 此只需考虑 事件,大于 某个较大的 数”,这个 数 常 称为临界值,即某个分位数。即取一数
N
)(αn,使得
P{ >N )(αn }=α
如取 α=0.01,由分布律算出,
,001.01024/1
10
≈=p,01.01024/10
9
≈=p
对于这种离 散型概率分 布,不一定 能取到 )(αn,取最接近的,使当 Hn
0
成立时,
α≤> }{ nNP,因此 。即该小概率事件是 。 9=n }9{ >N
5° 作判断,
已算得,即 发生了,而 被视为对 H10=N }9{ >N }9{ >N
0
不利的小概率事件,它在一次试验中是不应该发生的,现在 居然发生了,只能认为 H}9{ >N
0
是不成立的,即 H
1
:,此 人作弊”成立。
这一推断过 程,也是假设 检验的一般 步骤,在这 些步骤中,关键的技术 问题是确定 一 个适当的用以检验假设的统计量,这个统计量至少应该满足在 H
0
成立的情况下,其抽样分布易于计算(查到)。
2,拒 绝域与 临界值
设?是所有样本观察值 的集合,令 ),,,(
21 n
xxxx "=
}H,{
0
否定使xxxW?∈=
则称此集合为 H
0
的 拒绝域,其余集 W 称为 H
0
的 接受域 。
对应于拒绝域 W 边界点处的检验统计量的值称为检验 H
0
的 临界值 。
注,在检验 统计量选定以后,便可构造出由该统计量 T 描述某个显著性水平 α下的一小概率事件{ },这一小概 率事件发生的样本空间的点的全体
α
BT ∈
});(,{
α
θ BxTxxW ∈?∈=
即为 H
0
的 拒绝域,通常也 简记为 W ={
α
BT ∈ },最后的检验即是判断所给的样本是否落在 W
内,或 者是 是否成 立。 因此,从这 个意义 上可 以说,设计 一个检 验,本质上 就是 找到一个恰当的拒绝域 W,使得在 H
α
BT ∈
0
下,它的概率
aHWxP )()|(
0
≤=∈ 或成立
今后我们总是把统计检验中提到的“小概率事件”视为与拒绝域 W 是等价的概念。
3,假设检 验 的基本步 骤
(1)
根据实际问题的要求,提出原假设 H
0
及备选假设 H
1
,
(2) 构造适 当的检验统计量 T;
要求在 H
0
成立的条件下,统计量 T的分布是确定和已知的。
(3) 给定显 著性水平 α,确定临界值和拒绝域 W ;
(4)
由样本观察值计算统计量 T的值 t
0;
(5) 作出判 断:若 H,则拒绝Wt ∈
0
0;否则,接受 H
0
。
4,两类错 误
假设检验的依据是,小概率事件 在一次试验 中很难发生 。但很难发 生不等于不 发生,因而假设检验所作的结论也可能是错误的。这种错误有两类,
(1) 第一类错 误,当原假 设 H
0
为 真时,因观察值 落 在拒绝域 W 中,而错误 地 作出拒绝
H
0
的判断。犯第一类错误的概率恰好是显著性水平,
}.P{
00
为真拒绝 HH=α
(2) 第二类 错误,当原假设 H
0
不真时,因观察值未落在拒绝域 W 中,而错误地作出接受
H
0
的判断。犯第二类错误的概率记为
}.P{
00
不真接受 HH=β
5,单侧检 验 与双侧检 验
双侧检验,备选假设 H
1
的参数区域在原假设 H
0
的参数的两侧
如,H
0
,
0
μμ =
H
1
,
0
μμ ≠
单侧检验,备选假设 H
1
的参数区域在原假设 H
0
的参数的一侧
如,H
0
,
0
μμ =
H
1
,
0
μμ >
一,教学 要求
1,理解显 著性检验的基本思想,了解假设检验可能产生的两类错误。 知道两类错误概率,
并在较简单的情况能计算两类错误概率,掌握假设检验的基本步骤。
2.了解单 个及两个正态总体的均值和方差的假设检验。
3.了解总 体分布假设的 拟合优度检验法。
本章重点:正态总体的参数的假设检验。
二,教学 内容
§ 7.1 假 设检验 的 基 本概念
假设检验是统计推断的另一类重要问题。 对总体的分布函数的某些参数或分布函数的形式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题称为假设检验,所作的假设称为原假设 (或统计假设 ),用 H
0
表示。
例 7.1 某厂 有一批产品,共有 200件,需检验合格才能出厂。 按国家 标准,次品率不得超过 3%。 今在其中随机地抽取 10件,发现其中有 2 件 次 品,问这批产品能否出厂?
分析,如果 用点估计方法作为检验方法,显然
10
2
> 3%,这批货物是要被拒出厂的。 但是厂家有理由反对用这种检验方法。 他们认为,由于抽样是随机的,在这次抽样中,次品的频 率超过 3%,不 等于说这批产品的次品率 (概率)超过了 3%。 就如同说掷一枚钱币,正反两面出现的概率各为 1/2,但若掷两次钱币,不见得正,反面正好各出现一次一样。 就是说,
即使该批货的次品率为 3%,仍有很大的概率使得在抽检 10 件 产品时出现 2 个以上的次 品,
因此需要用别的方法。
p
事实上,对 于这类问 题,通常就 是 采用假设 检 验的方法 。 具体来说 就 是先假设 次品 率
,然后从抽样的结果来说明%3≤p %3≤p 这一假设是否合理。 注意,这里用的是“合理”
一词,而不是“正确”,粗略地说就是“认为 %3≤p,能否说得过去。
例 7.2 某研 究所推出一种感冒特效新药,为证明其疗效,选择 200 名 患者为志愿者。
将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。
表 7.1
是否痊愈
服何种药
痊愈者 未痊愈者 合计
未服药者 48 52 100
服药者 56 44 100
合 计 104 96 200
问新药是否确有明显疗效?
分析,这个 问题就不存在估计什么的问题。 从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。 对于新药上市这样关系到 千万人健康 的事,一定 要采取慎重 的态度。 这 就需要用一 种统计方法 来检验药效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,
因此可以提出假设,新药无效”,除 非抽样结果显著地说明这假设不合理,否则,将 不能认为新药有明显的疗效。这种提出假设,然后做出否定或不否定的判断通常称为 显著性检验 。
假设检验可分为 参数检 验( Parametric test)和 非 参数检验 (Nonparametric test)。 当总体分布形式已知,只对某些参数做出假设,进而做出的检验称为参数检验; 对其它假设做出的检验为非参数检验。
如 例 7.1 中,总体是两点分布,只需对参数 做出假设检验,这是参数检验问题,而 例
7.2 则是非参 数检验的问题。
p
1,假设检验 的 基本原理
(1) 基本原理,小概率原理 (或实际推断 原理 ),即,概率很小的 事件在一次 试验中,实际上可认为几乎不会发生” ;
(2) 基本思想,采用概率性质的反证法,即先提出假设 H
0
,然后根据一次抽样所得的样本值进行计算,若导致小概率事件发生,则否定假设 H
0;否则,接受假设 H
0
。
注,所谓,小概率事件” 。 究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数 10,<<αα,认 为概率 不超 过 α的事 件是 在一次试 验 中不会发 生 的事件,这 个 α 称为 显著性水 平 。 对于实际 问题应根据不同的需要和侧重,指定不同的显著性水平。 但为了制表方便,通常可选取 α=0.01,0.05,0.10 等。
我们将通过下面的例子来阐述假设检验的一般原理和步骤。
例 7.3 某超 市为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、白两色球各 10 个的暗箱中连续摸 10 次(摸后放回),若 10 次都是摸得白球,
则中大奖。 某人按此规则去摸 10 次,皆为白球,商店认定此人作弊,拒付大奖,此人不服,
最后引出官司。
分析,从统 计的观点看,商店的怀疑是有道理的。 因为,如果此人摸球完全是随机的,则要正好在 10 次 摸球中均摸到白球的概率为
1024
1
)
2
1
(
10
=,这是一个很小的数。 由统计的基本原理知道,在一次试验中所发生的事件不应该是小概率事件。 现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。 上述的这一推断,实际 上就是假设检验的全部过程。
下面,我们用假设检验的语言来模拟商店的推断,
1° 提出假设,
H
0
:此人未作弊; H
1
:此人作弊
其中 H
0
称为 原假设,H
1
称为 备选假 设 或 对立假 设,备选假设也可以不写。
2° 构造统计 量,并由样本算出其观察值
取统计量为,N ={在 10次模球中,摸中白球的个数},由样本得 N 的观 察值为,10=N
3° 求出在 H
0
下,统计量 的分布 N
在 H
0
下,即如果此人是完全随机地摸球的话,则 ),
2
1
B(10,~N 其分布律为
10
10
)
2
1
(
k
k
Cp =,10,,2,1,0 "=k
4° 给定显著 性水平 α,构造对 H
0
不利的小概率事件
在 H
0
下,此人摸到的白球数应该在平均数 5 个 附 近,所以对 H
0
不利的小概率事件是:,白球数 大于某个较大的数,或小于某个较小的数” 。 在此问题中,若 HN
0
不成立,即此人作弊的话,不 可能故意少 摸白球,因 此只需考虑 事件,大于 某个较大的 数”,这个 数 常 称为临界值,即某个分位数。即取一数
N
)(αn,使得
P{ >N )(αn }=α
如取 α=0.01,由分布律算出,
,001.01024/1
10
≈=p,01.01024/10
9
≈=p
对于这种离 散型概率分 布,不一定 能取到 )(αn,取最接近的,使当 Hn
0
成立时,
α≤> }{ nNP,因此 。即该小概率事件是 。 9=n }9{ >N
5° 作判断,
已算得,即 发生了,而 被视为对 H10=N }9{ >N }9{ >N
0
不利的小概率事件,它在一次试验中是不应该发生的,现在 居然发生了,只能认为 H}9{ >N
0
是不成立的,即 H
1
:,此 人作弊”成立。
这一推断过 程,也是假设 检验的一般 步骤,在这 些步骤中,关键的技术 问题是确定 一 个适当的用以检验假设的统计量,这个统计量至少应该满足在 H
0
成立的情况下,其抽样分布易于计算(查到)。
2,拒 绝域与 临界值
设?是所有样本观察值 的集合,令 ),,,(
21 n
xxxx "=
}H,{
0
否定使xxxW?∈=
则称此集合为 H
0
的 拒绝域,其余集 W 称为 H
0
的 接受域 。
对应于拒绝域 W 边界点处的检验统计量的值称为检验 H
0
的 临界值 。
注,在检验 统计量选定以后,便可构造出由该统计量 T 描述某个显著性水平 α下的一小概率事件{ },这一小概 率事件发生的样本空间的点的全体
α
BT ∈
});(,{
α
θ BxTxxW ∈?∈=
即为 H
0
的 拒绝域,通常也 简记为 W ={
α
BT ∈ },最后的检验即是判断所给的样本是否落在 W
内,或 者是 是否成 立。 因此,从这 个意义 上可 以说,设计 一个检 验,本质上 就是 找到一个恰当的拒绝域 W,使得在 H
α
BT ∈
0
下,它的概率
aHWxP )()|(
0
≤=∈ 或成立
今后我们总是把统计检验中提到的“小概率事件”视为与拒绝域 W 是等价的概念。
3,假设检 验 的基本步 骤
(1)
根据实际问题的要求,提出原假设 H
0
及备选假设 H
1
,
(2) 构造适 当的检验统计量 T;
要求在 H
0
成立的条件下,统计量 T的分布是确定和已知的。
(3) 给定显 著性水平 α,确定临界值和拒绝域 W ;
(4)
由样本观察值计算统计量 T的值 t
0;
(5) 作出判 断:若 H,则拒绝Wt ∈
0
0;否则,接受 H
0
。
4,两类错 误
假设检验的依据是,小概率事件 在一次试验 中很难发生 。但很难发 生不等于不 发生,因而假设检验所作的结论也可能是错误的。这种错误有两类,
(1) 第一类错 误,当原假 设 H
0
为 真时,因观察值 落 在拒绝域 W 中,而错误 地 作出拒绝
H
0
的判断。犯第一类错误的概率恰好是显著性水平,
}.P{
00
为真拒绝 HH=α
(2) 第二类 错误,当原假设 H
0
不真时,因观察值未落在拒绝域 W 中,而错误地作出接受
H
0
的判断。犯第二类错误的概率记为
}.P{
00
不真接受 HH=β
5,单侧检 验 与双侧检 验
双侧检验,备选假设 H
1
的参数区域在原假设 H
0
的参数的两侧
如,H
0
,
0
μμ =
H
1
,
0
μμ ≠
单侧检验,备选假设 H
1
的参数区域在原假设 H
0
的参数的一侧
如,H
0
,
0
μμ =
H
1
,
0
μμ >