西北工业大学：概率论与数理统计（概率论）：7.1

分类：数学格式：pdf 日期：2009年06月04日

第七章假设检验
一,教学要求
1,理解显著性检验的基本思想,了解假设检验可能产生的两类错误。知道两类错误概率，
并在较简单的情况能计算两类错误概率，掌握假设检验的基本步骤。
2．了解单个及两个正态总体的均值和方差的假设检验。
3．了解总体分布假设的拟合优度检验法。
本章重点：正态总体的参数的假设检验。
二,教学内容
§ 7.1 假设检验的基本概念
假设检验是统计推断的另一类重要问题。对总体的分布函数的某些参数或分布函数的形式作某种假设,然后利用样本的有关信息对所作的假设的正确性进行推断,这类统计问题称为假设检验，所作的假设称为原假设 (或统计假设 )，用 H
0
表示。
例 7.1 某厂有一批产品,共有 200件,需检验合格才能出厂。按国家标准,次品率不得超过 3%。今在其中随机地抽取 10件，发现其中有 2 件次品，问这批产品能否出厂？
分析,如果用点估计方法作为检验方法,显然
10
2
＞ 3％,这批货物是要被拒出厂的。但是厂家有理由反对用这种检验方法。他们认为,由于抽样是随机的,在这次抽样中,次品的频率超过 3%，不等于说这批产品的次品率（概率）超过了 3%。就如同说掷一枚钱币，正反两面出现的概率各为 1/2,但若掷两次钱币,不见得正,反面正好各出现一次一样。就是说，
即使该批货的次品率为 3％,仍有很大的概率使得在抽检 10 件产品时出现 2 个以上的次品,
因此需要用别的方法。
p
事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率
,然后从抽样的结果来说明%3≤p %3≤p 这一假设是否合理。注意,这里用的是“合理”
一词，而不是“正确”，粗略地说就是“认为 %3≤p,能否说得过去。
例 7.2 某研究所推出一种感冒特效新药，为证明其疗效，选择 200 名患者为志愿者。
将他们均分为两组，分别不服药或服药，观察三日后痊愈的情况，得出下列数据。
表 7.1
是否痊愈
服何种药
痊愈者未痊愈者合计
未服药者 48 52 100
服药者 56 44 100
合计 104 96 200
问新药是否确有明显疗效？
分析,这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样关系到千万人健康的事，一定要采取慎重的态度。这就需要用一种统计方法来检验药效，假设检验就是在这种场合下的常用手段。具体来说，我们先不轻易地相信新药的作用，
因此可以提出假设,新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药有明显的疗效。这种提出假设，然后做出否定或不否定的判断通常称为显著性检验。
假设检验可分为参数检验( Parametric test)和非参数检验 (Nonparametric test)。当总体分布形式已知,只对某些参数做出假设,进而做出的检验称为参数检验；对其它假设做出的检验为非参数检验。
如例 7.1 中,总体是两点分布,只需对参数做出假设检验,这是参数检验问题,而例
7.2 则是非参数检验的问题。
p
1,假设检验的基本原理
(1) 基本原理,小概率原理 (或实际推断原理 )，即,概率很小的事件在一次试验中,实际上可认为几乎不会发生” ；
(2) 基本思想,采用概率性质的反证法,即先提出假设 H
0
,然后根据一次抽样所得的样本值进行计算，若导致小概率事件发生，则否定假设 H
0；否则，接受假设 H
0
。
注,所谓,小概率事件” 。究竟多大概率为小概率事件？在一个问题中,通常是指定一个正数 10,<<αα,认为概率不超过 α的事件是在一次试验中不会发生的事件,这个 α 称为显著性水平。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制表方便，通常可选取 α=0.01,0.05,0.10 等。
我们将通过下面的例子来阐述假设检验的一般原理和步骤。
例 7.3 某超市为搞促销，对购买一定数额商品的顾客给予一次摸球中奖的机会，规定从装有红、白两色球各 10 个的暗箱中连续摸 10 次（摸后放回），若 10 次都是摸得白球，
则中大奖。某人按此规则去摸 10 次,皆为白球,商店认定此人作弊,拒付大奖,此人不服,
最后引出官司。
分析,从统计的观点看,商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要正好在 10 次摸球中均摸到白球的概率为
1024
1
)
2
1
(
10
=,这是一个很小的数。由统计的基本原理知道,在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。上述的这一推断,实际上就是假设检验的全部过程。
下面，我们用假设检验的语言来模拟商店的推断,
1° 提出假设,
H
0
：此人未作弊； H
1
：此人作弊
其中 H
0
称为原假设,H
1
称为备选假设或对立假设,备选假设也可以不写。
2° 构造统计量，并由样本算出其观察值
取统计量为,N ={在 10次模球中,摸中白球的个数},由样本得 N 的观察值为,10=N
3° 求出在 H
0
下，统计量的分布 N
在 H
0
下，即如果此人是完全随机地摸球的话，则 ),
2
1
B(10,~N 其分布律为
10
10
)
2
1
(
k
k
Cp =,10,,2,1,0"=k
4° 给定显著性水平 α，构造对 H
0
不利的小概率事件
在 H
0
下,此人摸到的白球数应该在平均数 5 个附近,所以对 H
0
不利的小概率事件是：,白球数大于某个较大的数,或小于某个较小的数” 。在此问题中,若 HN
0
不成立,即此人作弊的话，不可能故意少摸白球，因此只需考虑事件,大于某个较大的数”，这个数常称为临界值，即某个分位数。即取一数
N
)(αn,使得
P{ ＞N )(αn }=α
如取 α=0.01,由分布律算出,
,001.01024/1
10
≈=p,01.01024/10
9
≈=p
对于这种离散型概率分布,不一定能取到 )(αn,取最接近的,使当 Hn
0
成立时，
α≤> }{ nNP,因此。即该小概率事件是。 9=n }9{ >N
5° 作判断,
已算得,即发生了,而被视为对 H10=N }9{ >N }9{ >N
0
不利的小概率事件,它在一次试验中是不应该发生的,现在居然发生了,只能认为 H}9{ >N
0
是不成立的,即 H
1
：,此人作弊”成立。
这一推断过程,也是假设检验的一般步骤，在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量，这个统计量至少应该满足在 H
0
成立的情况下，其抽样分布易于计算（查到）。
2,拒绝域与临界值
设?是所有样本观察值的集合，令 ),,,(
21 n
xxxx"=
}H,{
0
否定使xxxW?∈=
则称此集合为 H
0
的拒绝域,其余集 W 称为 H
0
的接受域。
对应于拒绝域 W 边界点处的检验统计量的值称为检验 H
0
的临界值。
注,在检验统计量选定以后，便可构造出由该统计量 T 描述某个显著性水平 α下的一小概率事件{ }，这一小概率事件发生的样本空间的点的全体
α
BT ∈
});(,{
α
θ BxTxxW ∈?∈=
即为 H
0
的拒绝域,通常也简记为 W ={
α
BT ∈ },最后的检验即是判断所给的样本是否落在 W
内，或者是是否成立。因此,从这个意义上可以说,设计一个检验,本质上就是找到一个恰当的拒绝域 W,使得在 H
α
BT ∈
0
下，它的概率
aHWxP )()|(
0
≤=∈ 或成立
今后我们总是把统计检验中提到的“小概率事件”视为与拒绝域 W 是等价的概念。
3,假设检验的基本步骤
(1)
根据实际问题的要求，提出原假设 H
0
及备选假设 H
1
,
(2) 构造适当的检验统计量 T；
要求在 H
0
成立的条件下，统计量 T的分布是确定和已知的。
(3) 给定显著性水平 α，确定临界值和拒绝域 W ；
(4)
由样本观察值计算统计量 T的值 t
0；
(5) 作出判断：若 H,则拒绝Wt ∈
0
0；否则，接受 H
0
。
4,两类错误
假设检验的依据是,小概率事件在一次试验中很难发生。但很难发生不等于不发生,因而假设检验所作的结论也可能是错误的。这种错误有两类,
(1) 第一类错误,当原假设 H
0
为真时,因观察值落在拒绝域 W 中,而错误地作出拒绝
H
0
的判断。犯第一类错误的概率恰好是显著性水平,
}.P{
00
为真拒绝 HH=α
(2) 第二类错误,当原假设 H
0
不真时,因观察值未落在拒绝域 W 中,而错误地作出接受
H
0
的判断。犯第二类错误的概率记为
}.P{
00
不真接受 HH=β
5,单侧检验与双侧检验
双侧检验,备选假设 H
1
的参数区域在原假设 H
0
的参数的两侧
如,H
0
,
0
μμ =
H
1
,
0
μμ ≠
单侧检验,备选假设 H
1
的参数区域在原假设 H
0
的参数的一侧
如,H
0
,
0
μμ =
H
1
,
0
μμ >

课件简介

课件名称：	西北工业大学：概率论与数理统计（概率论）
课件分类：	数学
课件类型：	试卷习题
文件大小：	4.2MB
下载次数：	22
评论次数：	16
用户评分：	7.5