第八章 假设检验
【授课对象】理工类本科二年级
【授课时数】6学时
【授课方法】课堂讲授与提问相结合
【基本要求】1、理解显著性检验的基本思想,掌握显著性检验基本步骤和可能产生的两类错误;
2、掌握单个及两个正态总体的均值和方差的假设检验;
3、知道总体分布假设的检验法。
【本章重点】单个及两个正态总体的均值和方差的假设检验
【本章难点】两个正态总体的均值和方差的假设检验;总体分布假设的检验法。
【授课内容及学时分配】
§8.1 假设检验的基本思想假设检验是统计推断的另一类问题。在总体的分布函数完全未知,或只知其形式但不知其参数的形式的情况下,为了推断总体的某些性质,提出了关于总体的某些假设。
一、显著性检验的基本思想为了对总体的分布类型或分布中的未知参数作出推断,首先对它们提出一个假设,称为原假设,同时给出其对立假设。为判断正确还是正确,需要对总体进行抽样,然后在为真的条件下,通过选取恰当的统计量来构造一个小概率事件,若在一次试验中,小概率事件居然发生了,就完全有理由拒绝的正确性,否则没有充分理由拒绝的正确性,从而接受,这就是假设检验的基本思想。
怎样检验一个统计假设呢!下面结合例子来说明假设检验的基本思想和做法:
引例:设总体服从正态分布,其中仅包含一个未知参数,即数学期望,欲要求检验统计假设?
【分析】:在这里,总体的分布函数形式是已知的,为正态分布,其中仅含一个未知参数,同时也提出了一个统计假设。所以它是一个参数的显著性检验问题。
怎样判断这一统计假设的正确性呢?首先需要对总体进行一定次数的观察,获得数据,也就是说抽取样本。设我们从该总体中抽取了一个容量为10的简单随机样本,其观察值记为,样本来自总体,反映了总体的分布规律,因此样本中必然包含关于未知参数的信息。但是要从样本中直接推断统计假设是否成立是困难的,还必需对样本进行加工,把样本中包含的关于未知参数的信息集中起来,也就是说要构造一个适用于检验假设的统计量。这里是总体的均值,上一章已经看到,样本均值是的一个无偏估计,且比样本的每个分量更集中的分布在总体均值的周围,如果假设是真的,则样本均值的观察值应较集中在0点附近,否则就应有偏离0点的趋势。这表明样本均值较好的集中了样本中所包含的关于的信息。因此利用构造判断统计假设的方法是合适的。
若从样本观察值计算得到,那对假设的正确性能作出怎样的判断呢?当假设成立时,服从于分布,由抽样分布知,因而,这表明:如果假设成立,那么事件实际上不大可能出现,即若在1000次中,大约仅有两次使我们所观察到的样本均值大于1.01。现在可否根据事件的概率很小这一理由而证实不成立呢?当然不能。因为在假设成立的条件下,事件的概率虽很小,但这个事件仍可能出现。显然我们也不能作肯定的结论。但现在必须从“拒绝”和“接受”中选择一个较为合理的判断作为我们的决定。一般它可以这样处理:给定一个临界概率,如果在假设成立的条件下,出现观察到的事件的概率小于等于,就作拒绝假设的决定。一般应取为一个较小的数,这是因为我们给出假设是经过细致的调查和考察的,所以对假设需加以保护,也就是说拒绝它应当慎重。根据小概率事件在一次试验(观察)中不可能发生的实际推断原理,如果出现了这事件我们就有理由怀疑不真,因为它超出了在成立条件下能以随机波动来解释的范围,因而作出拒绝的判断。
二、假设检验的基本步骤
1.由实际问题提出原假设(与备选假设);
2.选取适当的统计量,并在为真的条件下确定该统计量的分布;
3.根据问题的要求确定显著性水平(一般题目中会给定),从而得到拒绝域;
4.由样本观测值计算统计量的观测值,看是否属于拒绝域,从而对作出判断。
三、两类错误尚需指出,虽然在假设为真时,发生作出拒绝这一错误判断的概率很小,它小于等于,但这一错误还是可以发生的。在统计学上,当本来是正确的,但检验后作出了拒绝的判断,这种错误称为第一类错误,也称拒真错误。所以显著水平是用来控制犯第一类错误的;同样,当本来是不正确的,但检验后作出了接受的判断,这种错误称为第二类错误,也称受伪错误。对于给定的一对和,总可找出许多临界域,人们自然希望找到这种临界域,使得犯两类错误的概率都很小。奈曼—皮尔逊 (Neyman—Pearson)提出了一个原则:“在控制犯第一类错误的概率不超过指定值(的条件下,尽量使犯第二类错误 (小”,按这种法则做出的检验称为“显著性检验”,(称为显著性水平或检验水平。
§8.2 参数的假设检验我们这里仅介绍总体的分布为正态分布时的几种显著性检验的方法。正态分布含有两个参数和,因此,这里的假设都是对这两个参数的假设。
一、-检验:(在已知下,对进行检验)
设总体服从正态分布,在方差已知的条件下,若对期望进行检验,可用-检验。
1.单总体-检验:
设总体,其中已知,未知,为从中抽取的一简单随机样本。
双侧检验要检验假设, (双侧检验)
在前面的学习中我们知道,检验问题的关键是基于样本寻找一个合适的统计量,在这里样本均值很好地集中了样本中所包含的关于的信息。当假设成立时,的观察值较集中地分布在的周围,否则就有偏离的趋势。所以可以用来检验假设。为了查表方便,将标准化,从而统计量。在为真时,,而当不真时,服从均值不为0的分布,这表明当不真时,的观察值有偏大的趋势。所以对给定显著水平,为使犯第二类错误的概率最小,查正态分布分位数表求出使得
,然后将样本观测值代入算出的观察值,并比较和,若,则拒绝假设,这样我们便得到了检验的拒绝域,即。否则接受假设。
例1:糖厂用自动包装机进行包糖,要求每袋0.5公斤,假定该机器包装重量
,现从生产线上随机取九袋乘重得,问该包装机生产是否正常?
解:由题意有包装机装糖重量,要检验假设
,由于已知,可用-检验,取显著水平,查表得,而没有落入拒绝域内,所以由该样本,还没有得到足够的理由来拒绝原假设,故接受原假设,即生产正常。
上述这种假设,其备择假设表明期望值可能大于,也可能小于,我们称这种检验为双侧检验。这种检验对给定的显著性水平,按照“使犯第二类错误的概率最小”的原则所确定的拒绝域,是小于一个给定较小的数而大于一个给定较大数的所有数值的集合,该拒绝域不能用一个区间来表示。
(2)单侧检验:
有时,我们只关心总体的期望是否增大,如产品的质量、材料的强度、元件的使用寿命等是否随着工艺改革而比以前提高,此时需检验假设,还有一些问题,如新工艺是否降低了产品中的次品数,此时要检验假设
,像这种备择假设表示期望值只可能大于(或只能小于),这种检验称为单侧检验。对于单侧检验,最终得到的拒绝域的形式又如何呢?下面以假设为例给予讨论:
 当为已知时,仍用-检验。统计量只有当成立时有变大的趋势,因此,对于给定的显著性水平,该检验的拒绝域应取为
。
 同理,对于假设在给定的显著性水平,该检验的拒绝域应取为。
例2:设某电子产品平均寿命5000小时为达到标准,现从一大批产品中抽出12件试验结果如下:5059,3897,3631,5050,7474,5077
4545,6279,3532,2773,7419,5116
假设该产品的寿命,试问此批产品是否合格?
解:由题意可知该产品寿命,要检验假设
,计算知,则
,取,查得,拒绝域,而此时-1.296>-1.645,故可接受,即认为该批产品合格。
2.两总体-检验:
实际工作中常常需要对两个正态总体进行比较,这种情况实际上就是两个正态总体参数的假设检验问题。
设,其中已知,且与相互独立。
分别为来自总体与的两个样本。
对检验下面的统计假设:
(双侧检验){或(单侧检验)},由抽样分布中的定理知,,又与独立,从而有。当原假设成立时,统计量
,否则有增大的趋势,故对给定的显著性水平,为使犯第二类错误的概率最小,取拒绝域。
例3:书P213例1
二、—检验(在未知下,对进行检验)
设总体服从正态分布,由前面我们知道:在方差已知的条件下,若对期望进行检验,可用-检验,但如果方差未知,对期望进行检验,可用—检验。
1.单总体—检验:
设总体,未知,为随机样本,要检验假设:
(双侧检验){或(单侧检验)}
现在总体方差未知,-检验不能使用,因为此时中含未知参数,它不是一个统计量,所以要选择别的统计量来进行检验。由点估计理论自然会想到用方差的无偏估计去代替总体方差,从而构造出新的统计量。当原假设成立时,由抽样分布定理知:,否则,它服从非中心分布,即的观察值有偏大的趋势。若给定的显著性水平,查分布表可得,使,从而得检验的拒绝域为,即。
同理,假设,其检验的拒绝域为
假设,其检验的拒绝域为
例4:今有两台仪器,对九件样品测量光谱,观察结果如下:
① 0.20,0.30,0.40,0.50,0.60,0.70,0.80,0.90,1.00
② 0.10,0.21,0.52,0.32,0.78,0.59,0.68,0.77,0.89
取显著性水平,问这两台仪器测量性能有无显著差异?(测量误差可看成是正态的)
解:用表示两台仪器测量的结果之差,则对可看到9个结果:
0.10,0.09,-0.12,0.18,-0.18,0.11,0.12,0.13,0.11
可假定未知,由题意,要检验假设
由于未知,可用—检验:
此时,n=9,,

从而,查分位数表得
,显然,,即该样本观察结果与没有显著性差异,故在显著水平下,不能认为这两台机器性能有显著性差异。
例5:(书P26例4)
2.两总体—检验:
—检验法还可以应用于比较两个带有未知方差,但方差相等的正态总体的均值是否相等的问题。
设总体,其中未知,
分别为从总体中抽取的简单样本,要求检验假设
(双侧检验)
{或(单侧检验)}
当原假设成立时,根据抽样分布定理知:
统计量
其中
否则,有增大的趋势,因而对给定的显著性水平可取拒绝域
例6:(书P214例2)
在上面我们介绍了—检验与—检验,它们都是有关均值假设的显著性检验问题。现在讨论有关方差假设的显著性检验问题。
先对单个正态总体而言:
三、—检验(对单个总体进行检验)
设取自正态总体的子样,要求检验假设
(双侧检验)
{或(单侧检验)}
现在分别对未知和已知两种情形进行讨论:
1.未知
在第七章中已经看到:样本方差是的最大似然估计,且,它们都与均值无关。由此可见,当原假设成立时,较集中在的周围波动,否则将偏离。因此,样本方差是构造检验假设的合适的统计量,为了查表便利,将它标准化得到,由抽样分布知,在原假设成立时统计量。对给定的显著性水平,为使犯第二类错误的概率近似达到最小,取拒绝域。
2.已知
设总体,未知,为其一简单样本。在第七章中已经看到:的极大似然估计为,当原假设成立时,由抽样分布知,统计量。对给定的显著性水平,为使犯第二类错误的概率近似达到最小,取拒绝域。
同理,对假设,给定的显著性水平下,它们检验的拒绝域分别为和
例6:一自动车床加工零件的长度服从正态分布,原来加工精度,经过一段时间生产后,抽取这车床所加工的个零件,测得数据如下所示:
长度
10.1
10.3
10.6
11.2
11.5
11.8
12.0
频数
1
3
7
10
6
3
1
问这一车床是否保持原来得加工精度。
解:由题意要检验假设,此时我们只要考虑单侧的情形,由题中所给的数据计算得:,对于给定的,查自由度为的分布分位数表得临界值,此时
,因此拒绝原假设,这说明自动车床工作一段时间后精度变差。
对于单个正态总体有关方差检验的问题,我们可用—检验来解决,但如果要比较两个正态总体的方差是否相等,我们就要用下面的—检验。
四、—检验(对两个总体进行检验)
我们在用—检验去检验两个总体的均值是否相等时,作了一个重要的假设就是这两个总体方差是相等的,即,否则我们就不能用—检验。如果我们事先不知道方差是否相等,就必须先进行方差是否相等的检验。
设是取自正态总体的样本,是取自正态总体的样本,并且与相互独立,考虑假设

1.当总体的期望均已知时选取统计量,其中,由抽样分布定理知,在原假设成立的条件下,,否则的观测值会有偏大或偏小的趋势,从而对给定的显著性水平,为使犯第二类错误的概率近似达到最小,取拒绝域。
2.当总体的期望均未知时选取统计量,其中,
若成立,由抽样分布定理知,则此时的拒绝域为

例6:(书P217例4)
【注】:估计理论与假设检验之间的关系:
从双侧检验的情形看:假设检验的接受域恰为参数估计的置信区间。
课后作业:1、认真阅读P195-211;
2、作业:P225 1,4,8;
3、总复习