第七章 假设检验
内容提要
本章主要讲述假设检验思想概述;正态总体参数检验(检验,检验,检验和检验);非正态总体参数检验(非正态总体均值检验的大样本方法,指数总体的参数检验);检验的实际意义及两类错误(检验结果的实际意义,检验中的两类错误,样本容量确定问题)等内容.
重点分析
理解假设检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两类错误。
了解单个和两个正态总体的均值与方差的假设检验。
了解总体分布假设的检验法。
难点分析
假设检验的基本思想、基本步骤及假设检验可能产生的两类错误。
习题布置
习题7 (1,3,5,7,10,13,16,18)
备注
教 学 内 容 ( Contents )
Chapter Seven 假设检验(Hypothesis Tests)
§7.1 假设检验思想概述(Summary of Hypothesis Test Idea)
前一章讲了对总体参数的估计问题,即是对样本进行适当的加工,以推断出参数的值(或置信区间)。本章介绍的假设检验,是另一大类统计推断问题。它是先假设总体具有某种特征(例如总体的参数为多少),然后再通过对样本的加工,即构造统计量,推断出假设的结论是否合理。从纯粹逻辑上考虑,似乎对参数的估计与对参数的检验不应有实质性的差别,犹如说:“求某方程的根”与“验证某数是否是某方程的根”这两个问题不会得出矛盾的结论一样。但从统计的角度看估计和检验,这两种统计推断是不同的,它们不是简单的“计算”和“验算”的关系。假设检验有它独特的统计思想,也就是说引入假设检验是完全必要的。我们来考虑下面的例子。
Example 7.1 某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平,定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件检验,发现有次品2件,问应如何处理这批货物?
如果双方商定用点估计方法作为验收方法,显然2/43>3%,这批货物是要被拒收的。但是厂家有理由反对用这种方法验收。他们认为,由于抽样是随机的,在这次抽样中,次品的频率超过3%,不等于说这批产品的次品率(概率)超过了3%.就如同说掷一枚钱币,正反两面出现的概率各为1/2,但若掷两次钱币,不见得正、反面正好各出现一次一样。就是说,即使该批货的次品率为3%,仍有很大的概率使得在抽检43件货物时出现2个以上的次品,因此需要用别的方法。如果百货商店也希望在维护自己利益的前提下,不轻易地失去一个有信誉的货源,也会同意采用别的更合理的方法。事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率,然后从抽样的结果来说明这一假设是否合理。注意,这里用的是“合理”一词,而不是“正确”,粗略地说就是“认为”能否说得过去。具体如何做,下面再说。
还有一类问题实际上很难用参数估计的方法去解决。
Example 7.2 某研究所推出一种感冒特效新药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据。
是否痊愈
服何种药
痊愈者
未痊愈者
合计
未服药者
48
52
100
服药者
56
44
100
合 计
104
96
200
问新药是否确有明显疗效?
这个问题就不存在估计什么的问题。从数据来看,新药似乎有一定疗效,但效果不明显,服药者在这次试验中的情况比未服药者好,完全可能是随机因素造成的。对于新药上市这样关系到千万人健康的事,一定要采取慎重的态度。这就需要用一种统计方法来检验药效,假设检验就是在这种场合下的常用手段。具体来说,我们先不轻易地相信新药的作用,因此可以提出假设“新药无效”,除非抽样结果显著地说明这假设不合理,否则,将不能认为新药有明显的疗效。这种提出假设然后做出否定或不否定的判断通常称为显著性检验(Significance test)。
假设检验也可分为参数检验(Parametric test)和非参数检验(Nonparametric test)。当总体分布形式已知,只对某些参数做出假设,进而做出的检验为参数检验;对其它假设做出的检验为非参数检验。如例7.1中,总体是两点分布,只需对参数做出假设检验,这是参数检验问题,而例7.2则是非参数检验的问题。与估计问题稍不同的是,一般来说非参数检验同参数检验一样,在实际中经常要用到,因此,我们准备花一定的篇幅分别加以介绍。
无论是参数检验还是非参数检验,其原理和步骤都有共同的地方,我们将通过下面的例子来阐述假设检验的一般原理和步骤。
Example 7.3 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
我们在此并不关心此人是否真正作弊,也不关心官司的最后结果,但从统计的观点看,商店的怀疑是有道理的。因为,如果此人摸球完全是随机的,则要正好在10次摸球中均摸到绿球的概率为,这是一个很小的数,一个统计的基本原理是在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当推测出此人摸球不是随机的,换句话说有作弊之嫌。
上述的这一推断,实际上就是假设检验的全部过程。它一般包含了这么几步:提出假设,抽样,并对样本进行加工(构造统计量),定出一个合理性界限,得出假设是否合理的结论。为了便于操作,我们将结合例7.3,把这一过程步骤表述得更加形式化一点。这里要说明一点的是所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数,认为概率不超过的事件是在一次试验中不会发生的事件,这个称为显著性水平(Level of significance)。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制表方便,通常可选取=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:
10 提出假设:
:此人未作弊;:此人作弊。
这里称为原假设(Null hypothesis),称为备选假设(Alternative hypothesis)或对立假设(Opposite hypothesis),备选假设也可以不写。
20 构造统计量,并由样本算出其具体值:
统计量取为10次模球中摸中绿球的个数.由抽样结果算出.
30 求出在下,统计量的分布,构造对不利的小概率事件:
易知,在下,即如果此人是完全随机地摸球的话,统计量服从二项分布B(10,1/2).其分布列为,.那么此人摸到的绿球数应该在平均数5个附近,所以对不利的小概率事件是:“绿球数大于某个较大的数,或小于某个较小的数。”在此问题中,若此不成立,即此人作弊的话,不可能故意少摸绿球,因此只需考虑事件“大于某个较大的数”,这个数常称为临界值,即某个分位数。
40 给定显著性水平,确定临界值:
即取一数使得P{>}=.如取=0.01,由分布列算出:
  .
对于这种离散型概率分布,不一定能取到.取最接近的,使当成立时,,因此.即该小概率事件是.
50 得出结论:
已算得,即发生了,而被视为对不利的小概率事件,它在一次试验中是不应该发生的,现在居然发生了,只能认为是不成立的,即:“此人作弊”成立。
这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在成立的情况下,其抽样分布易于计算(查到)。当然还应该尽量满足一些优良性条件,特别是在参数检验中。限于篇幅,我们不准备在本书中仔细讨论这些优良性条件。在统计量选定以后,便可构造出由该统计量描述某个显著性水平下的一小概率事件{},我们称使得这一小概率事件发生的样本空间的点的全体

为的否定域(Negation region)或拒绝域(Rejection region),通常也简记为={}.最后的检验即是判断所给的样本是否落在内,或者是是否成立。因此,从这个意义上可以说设计一个检验,本质上就是找到一个恰当的否定域,使得在下,它的概率

今后我们总是把统计检验中提到的“小概率事件”视为与否定域是等价的概念。另外,称的余集为的接受域。
§7.2 正态总体参数检验(Parameter Test of Normal Collectivity)
对于正态总体,其参数无非是两个:期望和方差,如果加上两总体的参数比较,概括起来,对参数的假设一般只有如下四种情形:(ⅰ)对,(ⅱ)对,(ⅲ)对,(ⅳ)对.其中情形(i)、(ⅲ)又分为(或)已知和未知的两种情况。下面我们将分别予以讨论。如前所提到的,对于设计一个检验,关键是构造一个统计量,它需满足的一个必要条件是在成立时,分布为已知(有表可查),同时它对于需要检验的参数来说应该是“较好”的,这一点与参数的区间估计很相似。在正态总体参数的区间估计中,我们正好也是讨论了上述四种情形的置信区间。在区间估计中,我们曾提到过,构造参数的置信区间的关键一步是从的点估计出发,构造一个分布已知的含未知参数的随机变量(),针对四种情况,当时我们构造的()分别是
C1,对,,
C2,对,
C3,对:

C4,对:
对于正态参数检验,我们也将针对不同情况,采用形式与上述随机变量完全一样的统计量,来作为检验统计量。但这里需要说明的是,作为区间估计中的与检验中的是有所不同的,第一,中含有待估的未知参数,因此,它不是统计量,只是一般的随机变量;而中的参数为一已知数,因此它是统计量。第二,的分布是已知的,这是因为其中的与总体中的参数是相一致的;而的分布则需在假设总体参数明确时分布才已知。除此之外,它们的分布形式是完全一样的。
上述统计量在成立时通常有4种分布:
D1.情形C1.、C3.中,;
D2.分布情形,C1.、C3.中,;
D3.分布,情形C2.;
D4.分布,情形C4.
我们分别称以它们为检验统计量的检验为检验、检验、检验和检验。下面将分别讨论这几种检验所适应的具体问题和检验的方法。
一,检验( test)
检验适应在方差已知的情况下,对期望的检验(单总体或双总体)。
(一)单总体情形考察下面的例子:
Example 7.4 一台包装机装洗衣粉,额定标准重量为500g,根据以往经验,包装机的实际装袋重量服从正态,其中=15g,为检验包装机工作是否正常,随机抽取9袋,称得洗衣粉净重数据如下(单位:g)
497 506 518 524 488 517 510 515 516
若取显著性水平=0.01,问这包装机工作是否正常?
所谓包装机工作正常,即是包装机包装洗衣粉的份量的期望值应为额定份量500g,多装了厂家要亏损,少装了损害消费者利益。因此要检验包装机工作是否正常,用参数表示就是=500是否成立。
首先,我们根据以往的经验认为,在没有特殊情况下,包装机工作应该是正常的,由此提出原假设和备选假设:
:=500; :500
然后对给定的显著性水平=0.01,构造统计量和小概率事件,来进行检验。
一般地,可将例7.4表述如下:设,已知,为的一子样,求对问题
:=; :
的显著水平为的检验。
这个问题就归结为,总体服从,已知,需检验,由前所述,用检验法。我们仿照例7.3的步骤来解这个问题。
Solution 10 提出假设(已有,略)。
20 构造统计量。此问题属情形C1.的u检验,故用统计量

并计算其具体值。在例7.4中

30 易知,在成立的条件下;服从正态分布,因此根据正态分布的特点,在成立的条件下,的值应以较大的概率出现在0的附近,因此对不利的小概率事件是的值出现在远离0的地方。即大于某个较大的数,或小于某个较小的数。这一小概率事件对应的否定域为

满足.构造这一否定域利用了的概率密度曲线两侧尾部面积(图7-1),故称具有这种形式的否定域的检验为双侧检验(Two-sided test)。

图7-1
40 给定显著性水平,在例7.4中=0.01,查出临界值=-2.575,=-=2.575.
50 从的值判断小概率事件是否发生,并由此得出接受或拒绝的结论。对于例7.4,因为在20中算出的值,其绝对值小于2.575,样本点在否定域之外,即小概率事件未发生,故接受,亦即认为包装机工作正常。
(二)双总体情形双总体检验适应的问题的一般提法如下:设为出自的样本,为出自的样本,,已知,两个总体的样本之间独立,求对于的显著水平为的检验。例如假设具有下列形式:

此问题属情形.的检验,故用统计量

当成立时,总体所服从的是一族分布,因此的分布也无法确定,通常我们是先取成立时的边界值,这时,据此来确定否定域。易知,此时若:成立,则的值应有变大的趋势。于是对不利的小概率事件应为

显然当时,;而当时,,此时

如图7-2所示。

图7-2
总之,当成立时,.它被认为是在一次试验中实际上不出现的事件。这一否定域的构造利用了概率密度单侧的尾部面积,故称这种形式的检验为单侧检验(One-sided test)。最后通过计算的具体值,观察小概率事件是否发生,未发生接受,发生了则拒绝.
一般地,检验统计量若为正态或分布,采用双侧或单侧检验仅与假设的形式有关,当备选假设中的参数区域在原假设的参数区域的两侧时,用双侧检验,在一侧时,用对应于该侧的单侧检验。
二, 检验( test)
检验用于当方差未知时对期望的检验,可以是单总体,也可是双总体。当然对于双总体,它们的样本之间应该是独立的。
(一)单总体情形考察如下例子:
Example 7.5 某部门对当前市场的价格情况进行调查。以鸡蛋为例,所抽查的全省20个集市上,售价分别为(单位:元/500克)
3.05 3.31 3.34 3.82 3.30 3.16 3.84 3.10 3.90 3.18
3.88 3.22 3.28 3.34 3.62 3.28 3.30 3.22 3.54 3.30
已知往年的平均售价一直稳定在3.25元/500克左右,能否认为全省当前的鸡蛋售价明显高于往年?
对于这样的实际问题,通常可以补充下列条件,首先,一般可认为全省鸡蛋价格服从正态分布,其次,我们定出一个显著水平如=0.05.针对这一问题,提出一个合理的假设是
:; :
将这一问题一般化就是:设为出自的样本,未知,求对问题
:=; :>
的显著水平为的检验。这属于情形C1.未知的情况,可用检验。即取检验统计量为

在成立的条件下,;又当成立时,有变大的趋势,因此用单侧检验,即取否定域为

最后根据计算出来的值,看样本是否落在内,若落在内,则拒绝,否则,接受.
具体到例7.5,可算出=20,=3.399,=0.2622,由此计算出=2.477.另外查表可得=2.093<2.477,故拒绝,即鸡蛋的价格较往年明显上涨。
(二)双总体的情形对于双总体,一般地讨论比较麻烦,通常考虑两种特殊情况,一种是(未知)的情形,这一情形问题的一般提法是:设为出自的样本,为出自的样本,两个总体的样本之间独立,求问题

的显著水平为的检验。
这是情形C3。中未知的场合,用统计量
 (7.1)
其中.在成立时,服从自由度为的分布.否定域则依照的具体内容来构造,即依照决定采用双侧或单侧检验。
第二种情形是未知,但,则可考虑所谓配对检验法(Method of paired-sample test)。此时令

由于当时,,且相互独立,则

且独立,故
可作为。
Example 7.6 某工厂生产某种电器材料。要检验原来使用的材料与一种新研制的材料的疲劳寿命有无显著性差异,各取若干样品,做疲劳寿命试验,所得数据如下(单位:小时):
原材料,40 110 150 65 90 210 270
新材料,60 150 220 310 380 350 250 450 110 175
一般认为,材料的疲劳寿命服从对数正态分布,并可以假定原材料疲劳寿命的对数与新材料疲劳寿命的对数有相同的方差,即可设~,~.
Solution 问题归结为下述检验:
:=; :
当成立时,与就有相同的分布,从而与有相同的分布,即两种材料的疲劳寿命没有显著性差异。将前面的试验数据取对数:
,1.602 2.041 2.176 1.813 1.954 2.322 2.431
,1.778 2.176 2.342 2.491 2.560 2.544 2.398 2.653 2.041 2.243
记的样本为,的样本为,则可算出

对此问题可用式(7.1)中的统计量,具体算出:

显然,这个问题须用双侧检验,若给显著性水平=0.05,否定域应为.
计算结果表明,因此不能否定,即认为两种材料的疲劳寿命没有显著性差异。
三,检验和检验(test and test)
检验和检验都是对于方差的检验,前者用于单参数的情形C2.,后者往往用于两参数的情形C4.
(一)检验设为出自的样本,要对参数进行检验,这里往往是未知的。假设的形式通常如
(ⅰ) ,=; ,
(ⅱ) ,; ,
(,; ,<类似)
都可选择统计量
 (7.2)
对于(i),当成立时,式(7.1)右边服从(n-1)分布。由于是的无偏估计,因此,当成立时,上述值应趋向于,而它也正好是(n-1)的期望值。比值太大或太小都不利于,自然地,可以来用双侧检验,取否定域为

如图7-3所示。

图7-3
此时对于(ii)当成立时,,令

则.注意到此时,不利于的事件是统计量变大,因此,采用单侧检验,即取否定域为

可知此时有

(二) 检验设为出自的样本,为出自的样本,且样本之间独立。考虑假设
(ⅰ) ,=; ,
(ⅱ) ,; ,
对此可采用统计量
 (7.3)
进行检验,易知,对于(i),在下,,我们可取否定域为

此时.
对于(ⅱ),类似前面的讨论,可取否定域为

此时.
Example 7.7 一台机床大修前曾加工一批零件,共=10件,加工尺寸的样本方差为.大修后加工一批零件,共件,加工尺寸的样本方差为.问此机床大修后,精度有明显提高的最小显著性水平大致有多大?
Solution 对此实际问题,可设加工尺寸服从正态分布,即机床大修前后加工尺寸分别服从和.于是由题意有
:=; :>
用统计量

否定域为{>},从表上查得

由此可知,在否定的前提下,最小显著性水平在0.001到0.005之间。
§7.3 检验的实际意义及两类错误
(Practical Significance of Tests and Two Types Error)
前面对参数的假设检验的方法进行了较详尽的讨论,但读者可能有不少疑问,如这些检验方法对于相应的问题是不是唯一的方法?若不是唯一的,是不是最优的方法?最优的标准又是什么?检验的优劣与显著性水平的关系如何?下面我们将研究一下这方面的问题。为了不涉及过多的概念和理论推证,我们的讨论只是较为简略的。
一,检验结果的实际意义(Practical significance of results of tests)
a)检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是接受或拒绝.但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生。仍以例7.3来说,尽管按统计推断结论,认为摸球人作弊,但事实上也完全可能没有作弊。试想如果在不作弊的情况下,10次全部摸中绿球绝对不可能的话,那么开设摸奖就没有意义了。因此,当摸奖人事实上的确是未作弊的话,商店的统计推断就犯了错误,关于犯检验的错误我们放到后面再讲。
b)在假设检验中,原假设与备选假设的地位是不对等的。一般来说是较小的,因而检验推断是“偏向”原假设,而“歧视”备选假设的。因为,通常若要否定原假设,需要有显著性的事实,即小概率事件发生,否则就认为原假设成立。因此在检验中接受,并不等于从逻辑上证明了的成立,只是找不到不成立的有力证据。在应用中,对同一问题若提出不同的原假设,甚至可以有完全不同的结论,为了理解这一点,举例如下:
Example 7.8 设总体,样本均值,样本容量=1,取=0.05,欲检验=0,还是=1.
这里有两种提出假设的方法,分别如下:
(ⅰ):=0; :=1
(ⅱ):=1; :=0
如果按一般逻辑论证的想法,当然认为无论怎样提假设,的最终结果应该是一样的。但事实不然,计算如下:
对于(ⅰ)显然应取否定域为,其中,当成立时,,实际算得

接受,即认为=0.
对于(ⅱ)应取否定域为.此时

接受,即认为=1.
这种矛盾现象可以解释为,试验结果既不否定=0,也不否定=1,究竟应认为=0,还是=1,就要看你要“保护”谁,即怎样取原假设。这一结果的几何解释如图7-4.在图7-4中,既不在密度函数的阴影部分所对应的区间里,也不在密度函数的阴影部分所对应的区间内。所以无论怎样提出都否定不了。

图7-4
这一事实提醒了我们,在应用中一定要慎重提出原假设,它应该是有一定背景依据的。因为它一经提出,通常在检验中是受到保护的,受保护的程度取决于显著性水平的大小,越小,以为概率的小概率事件就越难发生,就越难被否定。在实际问题中,这种保护是必要的,如对一个有传统生产工艺和良好信誉的厂家的商品检验,我们就应该取原假设为产品合格来加以保护,并通过检验来印证,以免因抽样的随机性而轻易否定该厂商品的质量。
C)从另一个角度看,既然是受保护的,则对于的肯定相对来说是较缺乏说服力的,充其量不过是原假设与试验结果没有明显矛盾;反之,对于的否定则是有力的,且越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题。在应用中,如果要用假设检验说明某个结论成立,那么最好设为该结论不成立。若通过检验拒绝了,则说明该结论的成立是很具有说服力的,如例7.3那样。而且取得较小,如果仍拒绝的话,结论成立的说服力越强。
二,检验中的两类错误(Two types error of tests)
前面已说到检验可能犯错误,所谓犯错误就是检验的结论与实际情况不符,这里有两种情况:一是实际情况是成立,而检验的结果表明不成立,即拒绝了,这时称该检验犯了第一类错误(type I error)或“弃真”的错误;二是实际情况是不成立,成立,而检验的结果表明成立,即接受了,这时称该检验犯了第二类错误(type II error),或称“取伪”的错误。我们来研究一下,对于一个检验,这两类错误有多大。
我们知道,一个检验本质上就是一个否定域,所谓拒绝,就是通过构造的统计量计算,得出样本点落在内的结论。所以,第一类错误的概率就是在成立的条件下的概率.从前几节的具体例子可知,一般地当形如时,.当形如或时,.由此可知,显著性水平也就是检验犯第一类错误的概率。
同样,接受,即是指样本点落在接受域中,因此犯第二类错误的概率是
 (7.9)
当中包含的参数不止一个时,一般的具体计算是较困难的。
我们来看一个具体例子,加深对两类错误概念的理解。
Example 7.9 设总体~,已知,样本容量为,求对问题
:=; :=>
的检验的两类错误的概率。
Solution 在此检验中,否定域应为
={>}
其中,为某一显著性水平,易知在成立时服从,在成立时服从.于是,犯第一类错误的概率为
=
犯第二类错误的概率为
 (7.10)
其中为标准正态分布函数。
上述两类错误概率的大小可用图7-5中的阴影面积表示。图中,,由图7-5或式(7.10)可以看出,若要第一类错误概率变小,则变大,从而第二类错误的概率也随之变大。

图7-5
设计一个检验,当然最理想的是犯两类错误的概率都尽可能地小,但由例7.12可以看出,在样本容量一定的情况下,要使两者都达到最小是不可能的。考虑到的提出既然是慎重的,否定它也要比较慎重。因此,在设计检验时,一般采取控制第一类错误的概率在某一显著性水平内,对于固定的,使第二类错误尽可能地小,并以此来建立评价检验是否最优的标准。关于这一点我们不准备深入讨论,只强调一点,在7.2节末表中所列出的检验都是某种意义下的最优检验,作为一个实例,可参看习题7.9,这也是对于正态总体参数的检验为什么要采用7.2节所介绍的那些方法的原因。
三,样本容量确定问题(Determinate problem of sample capacity)
对于固定的样本容量,若要控制第一类错误的概率,就不可能使第二类错误的概率尽可能地小。但另一方面,从(7.10)式可以看出,在例7.12中,如果保持不变,使增大,则减小(注意),当时,.也就是说,通过增大样本容量,犯第二类错误的概率可以小于任给的正数。
在实际问题中,样本容量是不可能无限制扩大的,因为做试验需要成本,抽样数量太大,既做不起,又没有必要。另一方面,若样本容量太小,又不能使犯两类错误的概率同时都令人满意地小。由此引出这样的问题,即能否确定一个最小的样本容量,使得检验的两类错误概率都在预先控制的范围内?这就是样本容量确定问题。我们讨论两种具体的检验。
(一)对于正态总体,已知,考虑
:=; :=>
的检验,(<类似可讨论),设两类错误的概率,均已确定,要求样本容量.事实上,由例7.12式(7.10)

可得 
即知
 (7.11)
当式(7.11)右边不是整数时,取不小于右边的最小的整数。
(二)对于正态总体,未知,考虑
:=; :=>
的检验(<类似)易知,此时对于给定的显著水平,否定域为

其中,而接受域为

注意到当成立时,,故
 (7.12)
可以证明,当>时,是的减函数,且由式(7.12)可得
 (7.13)
当然,从式(7.13)无法得到的解析表示,但对于给定的,,可以通过查表,采取“试算”的方式确定.
Example 7.10 一门炮需通过发射试验来进行精度验收,假设命中误差是纯随机的,又横向(或纵向)误差允许的标准差为,制造方要求采用的检验方法要求保证:如果产品合格而被拒绝的概率应不大于5%;使用方要求保证:若产品不合格且标准差超过而被接受的概率小于10%.试问,至少应发射多少发炮弹进行试验,才能满足双方的要求?
Solution 可以设炮弹落点的横向(或纵向)偏差是服从,由题意,可将问题简化为
:=; :==2
用检验,已知=0.05,又要求=0.1,利用式(7.13)试着取:
若取=36,(35)=49.802,;取=37,,.由此可知至少需要发射37发炮弹。
第七章小结(Summary of Chapter Seven)
本章我们研究了统计假设检验的基本原理和基本方法,假设检验可能产生的两类错误及其概率的计算。重点讨论了单个及两个正态总体的均值和方差的假设检验方法。介绍了拟合检验等非参数检验方法。
大家要正确理解假设检验的基本思想,务必掌握假设检验的基本步骤,了解假设检验可能产生的两类错误,熟练掌握单个及两个正态总体均值和方差的检验、检验、检验和检验方法,了解非正态总体参数检验及非参数检验方法。