第五章 统计推断所谓统计推断就是根据抽样分布率和概率理论,由样本结果(统计数)来推断总体特征(参数)。试验实践中所获得的资料,通常都是样本的结果;而我们希望了解的却是抽得样本的总体。
统计推断:统计假设测验
参 数 估 计统计假设测验 是根据某种实际需要对未知的或不完全知道的统计总体提出一些假设,然后由样本的实际结果,经过一定的计算,做出在概率意义上应当接受哪种假设的测验。
例如在相同的栽培管理条件下种植了甲、乙两个玉米品种各15个小区,如果测得甲品种平均亩产为=650 kg,乙品种平均亩产为=670 kg,亩产相差20 kg,这究竟是由于甲品种的总体平均数?1的确不同于乙品种的总体平均数?2呢?还是由于随机抽样误差(?1和?2并无不同)?这不能通过简单的比较来下结论,必须通过概率计算做出选择,这就是统计假设测验要研究的问题。
参数估计是指由样本统计数对总体参数做出点估计和区间估计。点估计是指由样本统计数估计相应参数。区间估计是指以一定的概率保证总体参数位于某两个数值之间。
第一节 统计假设测验的基本原理
一、统计假设测验的基本方法就是试验工作者提出有关某一总体参数的假设。例如假设某批产品符合标准。但是如何确切地证实假设是正确的还是错误的呢?当然可以把全部产品逐个检验,这种研究总体中全部个体的方法当然是很准确的,但往往是行不通的。我们不得不采用另一种方法,即研究样本。也就是从全部产品中抽取样本进行检验,然后推断这批产品是否合格。这种利用样本以测验假设是否正确或错误的过程,称为一个假设正确性(或不正确性)的统计证明。如果通过测验证明假设与试验结果相符,则该假设就被接受;反之,如果假设与试验结果不相符,则该假设就被否定。
对统计总体一般作两个假设,一个是假设总体参数与某一指定值相等或假设两个总体参数相等,即假设其没有效应,这一假设称为无效假设,记作H0;和无效假设相对应的另一统计假设,叫对应假设或备择假设,记作HA。H0 和HA应是对立的假设,即,如果接受H0就否定HA,如果否定H0就接受HA。例如:假设某一小麦新品种具有原当地品种的产量,是指就产量性状而言,将新品种样本看成原当地品种总体的一个随机样本,其总体平均产量?等于指定值0 (当地品种平均产量),故记作H0:=0,对应假设为HA:≠0。
测验前提出无效假设的目的在于:可从假设的总体里推论随机抽样平均数的分布,从而算出某一样本平均数指定值出现的概率,这样就可以研究样本与总体的关系,作为假设测验的理论依据。无论是平均数,百分数,还是变异数的统计假设,均应在试验前按研究目的提出。H0的形式和内容可以多种多样,但必须遵循两个原则:①有实际意义;②据之可以算出因抽样误差而获得样本结果的概率。下面通过例子来说明假设测验的基本方法。
[例5.1]设一水稻地方品种亩产0 = 500 kg,2 = 324 kg
现一新品种平均亩产 = 515 kg,=9(9个试验小区) 问:这样本是否从= 500 kg的总体中随机抽出的,即该的总体平均数?是否不同于0,亦即-0 = 15 kg,这一差数究竟是抽样误差造成的?还是?确实与0不同。
1、提出假设
这是测验单个平均数,则假该样本是从已知总体(总体平均数为指定值0)中随机抽出的,即H0:? =。如上例,即假设新品种的总体平均数?等于原当地品种总体0 = 500 kg,而样本平均数-0 = 515 - 500 = 15 kg乃是随机误差;在H0:? =0的假设下,我们就有一个具平均数? =0 = 500 kg、= =  = 36的分布,即N(500,36);据之才能算得因抽样误差而获得一个与0的相差≥15 kg的的概率。如测验两个平均数,则假设两个样本的总体平均数相等,即H0:?1 =2,也就是假设两个样本平均数的差数1-2乃随机误差,而非真实差数。
备择假设)HA是与H0 对立的假设,则HA:?1 ≠2,即两个样本的总体平均数不相等。
2、确定一个否定H0的概率标准这个标准叫显著水平,记作?。是人为规定的小概率标准。在生物学研究中常取? = 0.05或? = 0.01两个等级(水平)。也可选? = 0.10或? = 0.001等。显著水平的选择,应根据试验要求或试验结论的重要性而定。
3、在“无效假设是正确的”假定下,研究样本平均数的抽样分布算出试验所得平均数出现的概率有多大,即算出实得结果由抽样误差造成的概率。或者划出接受区和否定区。二法选一即可。
(1)计算概率的方法对例5.1,在H0:? =0的假设下可算得:
u =  =  = 2.5
查附表2,P(∣∣> 2.5) = 2 × 0.00621 = 0.01242。此即在0 = 500的总体中,如以n = 9作随机抽样,抽得一个与500 kg相差达15 kg以上的的概率为0.01242。
(2)划接受区与否定区的方法根据上章所述和u = 的分布,我们知道:
P(-1.96 ≤ u ≤1.96) = P(-1.96 ≤ ≤ 1.96) = 0.95
P(≥ 1.96) = 0.025,P( ≤ -1.96) = 0.025
因之可写为:
P[ ≥ (? + 1.96?)] = 0.025 和P[ ≤ (? - 1.96)] = 0.025
因此,在的抽样分布中落在(? - 1.96,? + 1.96)区间内的有95%,落在这一区间外(即 ≤? - 1.96和≥+ 1.96)的只有5%。如果以5%概率作为接受或否定H0的界限,则前者为接受假设的区域,简称接受区域(region of acceptance);后者为否定假设的区域,简称否定区域(region of rejection)。在测验时,一般将接受区域和否定区域的两个临界值写作? ± 1.96,即当在(? - 1.96,? + 1.96)区间内为接受区域;而≤(? - 1.96)和 ≥ (+ 1.96)为两个否定H0区域。所以在测验时先计算1.96,然后从?加上和减去1.96,(计算时?用0 = 500代替),即得两个否定区域的临界值。同理,从平均数离?为2.58的区间内,即从? – 2.58到? + 2.58区间为99%接受区域,任一样本平均数出现于这一区间外的概率仅为0.01。它的两个否定区域则为≤(? – 2.58)和≥(?+ 2.58)。例如5.1,?0 = 500 kg,1.96 = 1.96× = 11.76 kg。因此,它的两个5%概率的否定区域为≥ 500 + 11.76,≤ 500 – 11.76,接受区域为500 – 11.76 ≤  ≤ 500 + 11.76,其划分的几何意义见图5.1。即 ≥ 511.76 kg和 ≤488.24 kg的概率只有5%,488.24 kg ≤  ≤511.76 kg的概率为95%。
4,根据“小概率实际不可能性原理”接受或否定假设
“小概率实际不可能性原理”的基本内容为:概率很小的事件,在一次试验中几乎不可能发生或可以认为不可能发生。如果我们假设了一些条件,并在假设的条件下能够准确地算出事件A出现的概率很小,但在一次试验中,事件A竟出现了,那么,我们就可以认为这个假设不正确,从而否定这个假设。
若在H0:? =0的假设下,算出实得结果由抽样误差造成的概率P <? (=0.05或0.01),则否定H0,接受HA;并分别称? 和0的差异为显著 (significant)或极
显著(very significant)。如果由误差造成的概率P ≥? (=0.05)则接受H0,即?和0的差异不显著。对例5.1 已算得P(∣u∣> 2.5) = 0.01242 <? =0.05,所以结论是否定H0,即该水稻新品种的亩产的总体平均数?与原地方品种亩产的总体平均数0有显著差异。如果取? =0.01,P >?,则不应否定H0,可见? 的选择是很重要的。
也可以根据接受区域和否定区域作出推断,例5.1得=515 kg > 511.76 kg,已落入否定区域,所以我们冒5%以下的风险否定H0。
在实际测验时,计算可以简化。由于P(∣u∣> 1.96) = 0.05,P(∣u∣> 2.58) =0.01。因此,在用u分布作假设测验时,实际算得的∣u∣> 1.96就是在? = 0.05水平上差异显著,若∣u∣> 2.58就是在=0.01水平上差异显著(或称极显著),不必再计算所得u值的确切概率。综上所述,统计假设测验的步骤可总结如下:
(1)提出无效假设H0和备择假设HA。
(2)确定显著水平?。
(3)在H0为正确的假定下,根据统计数的抽样分布规律,算出实得差异由误差造成的概率;或划出否定区域。
(4)将算得的概率和?相比较,或者将试验结果和否定区域相比较,从而作出接受或否定假设的推断。
二、两尾测验与一尾测验
1,两尾测验如例5.1,无效假设为H0:? =0,即假设新品种亩产的总体平均数为500 kg。对应假设为HA:≠0,即假设平均亩产不是500 kg,而是有大于500 kg和小于500 kg两种可能性。因而在假设测验时所考虑的概率为正态曲线左边一尾概率(小于500 kg)和右边一尾概率(大于500 kg)之和,这类测验称为两尾测验。
2,一尾测验在某些情况下,两尾测验不一定符合实际需要。例如某种农药防治蚜虫的效果达到90%才合格,如果进行抽样测验,则在大于0 = 90%时,无论大多少都不需要否定H0;但如小于0,却可能为一批不合格的药品。因此,假设测验应为H0≥ 90%(即该药品合格),HA:< 90%(药品不合格)。这样,否定区域就只有左尾。由于P (u < - 1.645) =0.05,故如以?= 0.05 作u测验,则所得u < - 1.645就否定H0,于是不合格产品更易被发现。反之,如果<0是不需要否定H0的(如农牧产品中有毒物质的含量),而 >?0却可能有严重后果,则所有假设应为H0:≤0。对HA:? >0。这时,否定区域就只有右尾,所得u > 1.645就否定H0。
一般而论,如果凭借一定的知识和经验,推测?应当或可能是小于0的,为了测验是否显著小于?0,我们的假设应是H0:≥0。对HA:? <0。这时左尾是否定区域(图5.2a)反之,为了测验?是否显著大于0,我们的假设应是H0:≤0。对HA:>0。这时右尾是否定区域(图5.2b)。
三.统计假设测验的两类错误统计假设测验是根据一定的概率标准(?),由样本的结果对总体的特征作出推断。因此,不论是接受H0或是否定H0都没有100%的保证,也就是说,不能百分之百地肯定不发生错误,这就意味着我们需要冒一定的风险。如果H0是真实的,我们通过测验却否定了它,就犯了一个否定真实假设的错误。这叫第一类错误(first kind error)或I型错误(type I error)。I型错误只有在否定H0时才会发生。由于规定显著水平为?,故H0为真而被否定的概率最多为?;因而这类错误又叫错误。如例5.1,我们在? = 0.05水平上否定了H0,推断新品种平均亩产不同于原地方品种的亩产。但该新品种即使与地方品种平均亩产相同;以n = 9抽样,仍有5%以下的概率使和?0相差超过15 kg。所以上述推断为错误的概率P < 0.05。显然,规定=0.05为否定假设的概率标准,就是说我们假设测验结论仅有95%的把握,同时却冒着5%的下错误结论的风险。而采用更高的显著水平(如=0.01),则犯第一类错误的概率就更小了。如果H0是不真实的,我们通过测验却不能发现其不真实而接受了它,即犯了一个接受不真实的H0的错误。这叫第二类错误(second kind error)或Ⅱ型错误(type Ⅱerror) Ⅱ型错误只有在接受H0时才会发生。通常把犯第二类错误的概率记为β,所以这类错误又称作β错误。这两类错误的关系如表5.1。
如果H0是正确的
如果H0是错误的
如果H0被否定
第一类错误
没有错误
如果H0被接受
没有错误
第二类错误
表5.1 假设测验的两类错误犯第二类错误的概率β,可用例5.1水稻新品种产量为例说明如下:
例5.1中水稻地方品种亩产量服从0 = 500 kg,2 = 324 kg的正态分布。当以n = 9抽样时,其服从=0=500 kg、 = =36的正态分布。当以=0.05为显著水平时,其接受区域下限为500 - 19.6 ×  = 488.24 kg,上限为500 + 19.6 ×  = 511.76 kg。现假设新品种是一个?=505,而方差与地方品种亩产量方差2相同的正态总体,则H0:=0显然是错误的,但是?总体的有相当一部分落在0分布的接受区域内(图5.3),其概率β可估计为:
u1 =  = -2.79,u2 =  = 1.13
P(u < -2.79) = 0.0026,P(u < 1.13) = 0.8708
β = 0.8708 –0.0026 = 0.8682
因此,尽管?与0相差5 kg,但是由于误差较大,我们不能发现H0:=0为错误的概率却达到β = 0.8682。这就是犯第二类错误的概率。
如果将显著水平提高到=0.01,则由于0分布接受区域的扩大,?分布的落入该接受区域的将更多。因而更易接受H0,犯β错误的概率更大。故显著水平定得过高,虽然在否定H0时减少了?错误,但在接受H0时却可能增大β错误。
因此,在假设测验中如何既减少?错误,又减少β错误,是特别需要注意的问题。这可从两个方面考虑:
(1)如果?和0相差对于来说是大的,则显著水平可以提高,而犯β错误的概率又可大大减少。如上述例,若新品种的=525 kg,则即使取=0.01,犯β错误的概率也只有0.0559(图5.4);如果仍取?=0.05,则犯错误的概率就只有0.0136。
(2)由于?和?0相差不是主观能改变的客观存在,因此在试验实践中,减少? 是减少两类错误的关键。由于样本平均数标准误?  = ,因而通过精密的试验设计和改进试验技术以及增大样本容量可使? 减小,于是接受区域可变得十分狭窄,?和0的较小差异也易于被发现。如上述例,假定新品种的是n = 150的平均数,则= = 2.16,? = 1.47,因而在=0.05时的接受区域为500 ±1.96 ×1.47 = 497.12 - 502.88,在此情况下,若= 505 kg,则我们不能发现H0:=0为错误的概率β只有0.0749(图5.5)。如n继续增大,则犯两类错误的概率均可继续减小。
综上所述,有关两类错误的讨论可概括如下:
本节是以依据于u分布的一个平均数为例,说明统计假设测验的基本原理。这些原理对于其他统计数的假设测验以及依据于t、、F分布的假设测验,也同样适用。
第二节 平均数的假设测验一、单个样本平均数的假设测验这是测验一个样本平均数的总体平均数?与某一指定的总体平均数0是否相等。
1、u测验在第4章已述及,在正态总体N(,2)中抽样(无论样本容量n多大)或在非正态总体中以n > 30抽样时,均可用u测验H0(2未知时,用s2代替)。其方法已详细介绍于例5.1。
2、t测验若正态总体的2未知,而样本容量又不太大(n < 30),如以样本的s2估计2,则标准化离差服从自由度= n - 1的t分布。
[例5.2]某当地推广玉米品种百粒重0=32(g
现有一新品种百粒重  =33.67(g) ( 在十个小区种)
问:新品种的百粒重与原当地品种百粒重有无显著差异?
(1)H0:?=0=32g (即:新品种百粒重与当地品种百粒重相同) 对HA:≠ 32g。
(2)显著水平=0.05
(3)测验计算
 = (33.1 + 32.9 + … +33.6) =  = 33.67(g)
SS = 33.12 + 32.92 + … +33.6 2 - = 26.761
s =  =1.7244
s =  = 0.5453
t =  = 3.063
(4)查附表5,=9时,t0.05 = 2.262。现实得|t| > t0.05,故P < 0.05。
推断,否定H0:?=0=32g,即新品种百粒重与当地品种百粒重有显著差异。
二、两个样本平均数相比较的假设测验这是测验两个样本所属的总体平均数有无显著差异。
1、成组数据的平均数比较如果两个处理为完全随机设计,而处理间(组间)的试验单元彼此独立,则不论两处理的样本容量是否相同,所得数据皆称为成组数据。成组数据的平均数比较又依两个样本所属总体方差(和)是否已知、是否相等而采用不同的测验方法,现分述如下。
(1)u测验在两个样本所属的总体方差和为已知时,用u测验。
根据抽样分布的公式知,两个样本平均数1和2的差数标准误,在和已知时为:
=
并有:
u = 
在假设H0:?1 =?2=0下,正态离差u值为u = ,故可对两个平均数差数的差异作出假设测验。
[例5.3] A法 =1.2(kg) n1 = 122 = 0.4(kg)2
B法 =1.4(kg) n2 =8
比较A、B两法每平方米产量是否有显著差异?
H0:?12(或H0:?12=0);对HA:?1?≠2,
显著水平=0.05,0.05 = 1.96。
测验计算:
 = 0.4,n1 = 12,n2 = 8,
== 0.2887(kg)
 = -0.69
因为实得的|u|< u0.05 = 1.96,故P > 0.05,推断:接受H0:?12,即A、B两法取样方法所得每平方米产量没有显著差异。
(2)t测验
在两个总体方差和为未知时,用t测验。因总体方差和是否相等分为以下两种测验方法。
① 在两个总体方差和为未知,但可假定= = ,用t测验。
首先,应将样本变异合并成一个平均的均方,作为对的估计,即有:
=== 
 
=  = (5.2)
若n1=n2=n时,则:
= (5.3)
并有:
t = (5.4)
当假设H0:?1 =?2,上式为:
t = (5.5)
其自由度
(n1 – 1) + (n2 – 1) = n1 –n2 – 2 (5.6)
【例5。4]
假设H0:?1 =?2,对HA:?1 ≠?2
显著水平0.05
测验计算:
3.03(%)
SS1 = 12.62 + 13.42 + … + 13.02 –  = 1.2320
SS2 = 13.12 + 13.42 + … + 12.42 –  = 0.9943

 =  = 0.2226
=  = 0.2763
t =  = - 1.05
查附表5,4 + 610?时,t0.05 = 2.228。
推断:实得|t| < t0.05,故接受H0,即该小麦品种在甲、乙两地种植,蛋白质含量无显著差异。
[例5,5]
显著水平0.05
测验计算:
8.620?mg?3.575?mg)
SS1 = 2.2880 SS2 = 0.7874
 =  = 0.4393
故 =  = 0.4446
t =  = 11.34
查附表5,4 + 3 = 7时,t0.05 = 1.895(一尾)
推断:实得|t| > t0.05,故可冒5%的风险否定H0,接受HA,即前作喷过农药会显著增高后作植株农药残留量。
②在两个总体方差和为未知,且 (可由F测验得知)时,差数标准误需用两个样本的均方和分别估计和,用(5,2)计算,用(5,4)或(5.5)计算t值。
这时所得t值不再做成准确的t分布,在水平上显著的值需由下式算出:
 =  (5.7)
(5.7)中的(t1)?是1 – 1 的t?值,(t2)?是2 – 1 的t?值。若|t| > ,则否定H0;否则接受H0。由于的取值区间为(t1) (t2)?,故只有实得的t值恰巧在(t1) (t2)?之间才需计算。
以上是近似测验,一般在H0: =在 = 0.01被否定时才采用。同时在试验设计上最好使n1n2,这样可以减少误差,又不必计算(5.7)。
[例5.6]
该资料经F测验(方法见第三节)得知两品种脂肪含量是显著不同的,因而需按下述步骤测验:
假设两品种脂肪含量相等,即H0:?1 =?2,对HA:?1 ≠?2。
显著水平0.05
测验计算:
=  = 0.3531
t =  = - 2.294
查附表5,时的?t1)0.05 = 2.262,8 - 1时的?t2)0.05 = 2.365,实得t = 2.29,在?t1)0.05和?t2)0.05之间,故需计算的值:
=2.278
推断:实得|t| > ,否定H0:?1 =?2,接受HA:?1 ≠2,即辽豆10号和铁丰24号大豆的脂肪含量有显著差异。
2、成对数据的比较成对法是指先将试验单元按成对的要求两两配对,然后将每一个对内的两个试验单元独立随机地分配到两个处理中。例如:
在分析试验结果时只要假设两样本的总体差数的平均数?d =?120,而不必考虑两样本的总体方差和是否相等。
设样本1的j和样本2的j成一可比对,差数dj = j - j,且共有n对独立的比较,则差数的平均数、标准差和差数平均数的标准误依次为
= (5.8)  =  =  =  (5.9)
 =  (5.10)
因而
t =  (5.11)
具有n – 1,d为差数的总体平均数。因而由(5.11)可测验H0:d = 0。
[例5,7]
假设H0:d = 0,即A、B两种病毒对烟草的致病力没有显著差异,对H0:d  0。
显著水平0.05
测验计算:根据(5.8) ~ (5.11)得
= [(-1) + 6 + … +5] = 4
 =  = 4.3095
 =  = 1.5236
t =  = 2.625
查附表5、? = 8 – 1 = 7时,t0.05 = 2.365
推断:实得|t| > t0.05,因此否定H0:d = 0,接受H0:d  0,即A病毒的致病力与B病毒不同。这一推断属错误的概率小于0.05。
成对数据和成组数据平均数比较所依据的条件是不相同的
第三节 方差的假设测验在农业试验研究工作中,对总体平均数的假设测验是最常用的,但有时也需要对总体方差做假设测验。
一、单个方差的假设测验
这是测验一个样本方差s2所属的总体方差2和某一指定值c是否有显著差异,用?2测验。可根据实际需要采用一尾测验或两尾测验。需要注意的是:附表?中所给数值为右尾概率为?的临界?2值,记为,它直接适用于H0:2?≤ c,如果要测验? H0:2?≥ c,则否定H0需要?2,如要测验H0:2?= c,则否定H0需要?2和?2?,参见图5.6。
[例5.8]某水稻田施肥试验,预计施肥小区产量间方差=50(kg),试验后测量10个小区产量,实得s2 = 125.4(kg)。试问该试验小区产量间变异是否与原预计水平有显著差异?
假设H0:2=50(kg),即s2 = 125.4(kg)系2c = 50(kg)总体的一个随机样本,HA:2?≠50(kg)。
显著水平0.05,作两尾测验,显著所需的临界值为= 2.70和= 19.02。
测验计算:
22.572
推断:实得?2,即在区间[= 2.70,= 19.02]以外,故否定H0,接受HA,即该水稻小区产量的总体方差显著地不同于50。
[例5.9] 例5.9试验结果的s2 = 125.4;大于c = 50,试测验s2的总体方差是否显著大于c = 50?
假设H0:2?≤ 50,即总体方差不大于50,样本的方差2大于50是由于随机误差造成。HA:2。
一尾测验,否定区在右尾,显著水平0.05,查附表4,这一测验的?2临界为 = 16.92,而计算的222.572 > 所以H0被否定,即总体方差显著地大于50( kg2)。
[例5.10]测定106株某棉花品种的纤维得标准差 s= 1.045(mm),试问该品种棉纤维整齐度是否比纺织工艺上要求的1.5(mm)为优?
分析题目可知:(l)比较标准差实为比较方差,只需把标准差平方。(2)n = 106为大样本,需用u测验。(3)为优,即要求标准差小,纤维更整齐。
假设:H0:2?≥ 1.52,HA:21.52?。该测验为否定区在左尾的一尾测验。
显著水平0.05
测验计算:
2 = 50.96
因30,根据(4.52B)可得
u =  (5.12)
== - 4.36
查附表3,一尾的u0.05 = 两尾的u0.01 = 1.64,因此否定H0,接受HA,即该品种纤维长度的整齐度显著优于工艺规定的标准。
二、两个方差的假设测验这是测验两个抽自正态总体的独立样本的方差和所属的总体方差和是否有显著差异。已知样本方差和的比率遵循F分布,因此需采用F测验。需注意,附表6的F值是右尾概率为的临界值,是专为测验事先规划好的是否显著大于 (即H0:≤ 对HA: > )而设计的。如果测验H0:=?,对HA: ≠ ,则为两尾测验,表中列出的F值应变为F2;而测验时则应将大的2作分子,小的2作分母计算F。这样,实得F > F2时,该F为在水平上显著。
[例5.11]测量玉米A品种20株得穗位高标准差A = 13.88(cm),测量B品种15株得穗位高标准差B = 25.97(cm),试问这两个玉米品种穗位高的整齐度是否有显著差异?
假设H0:=?,对HA:,两尾测验。
显著水平取0.10,查附表6, =15 – 1 = 14 (大值均方的自由度),2= 20 - 1 = 19(小值均方自由度)时的F0.10/2 = 2.26。
测验计算:由(4.66)得
F =  =  = 3.5 (大值均方为分子)
推断:实得F > F0.10/2,故在0.10水平上否定H0,即品种A与品种B穗位高的整齐度有显著差异。
由于样本标准差是sB > sA,若想测验品种A穗位高的整齐度是否高于品种B的,即测验品种B穗位高的变异度是否大于品种A的,则应作一尾测验。所作假设是H0:≤?,即品种B的穗位高的变异度并不比品种A的高,之所以样本标准差sB > sA,是由于随机误差造成。对HA: > ,于是,F = 3.5 > F0.05 = 2.262,在0.05水平上否定H0。
三、多个方差的假设测验设在一正态总体中抽取k个(k ≥ 3)独立样本,其均方分别为,,…,,则
2)·ln - ln (5.13)
近似于k-1的?2分布,而
??2)·ln - ln] (5.14)
或?2)·lg - lg]
则遵循k-1的?2分布。
(5.14)中?i为各样本的自由度。i? = ni - 1,ni为样本i的容量,c为矫正数
c = 1 + [ - ] (5.15)
1n为自然对数,lg为常用对数,为各样本的合并方差值:
 =  =  =  (5.16)
因此,由5.14可测验各样本均方是否同质,即是否来自具有同一方差2的总体,亦即测验假设H0: =  = … = 对HA:、、…不相等。这一测验方法由Bartlett氏(1937)提出,故又称为Bartlett测验(Bartlett’s test)或方差的同质性测验(homogeneity test)
在实际计算时,宜先由(5.13)算出?2值。如果此?2值大于k-1的值,则再由(5.14)算出值;如算得的?2 < 则不必再算,而直接接受H0,因为(5.14)的一定小于(5.13)的?2值。当得到 > 时,则否定H0。
[例5.12]假定有3个样本估计方差=4.2 =6.0 =3.1,各具自由度,5,?3 = 11,试作同质性测验。
假设H0: =  = 对HA:、、不相等(这里的HA不能写成HA:,因为如H0被否定,仍然不能推断属于=、 = 、等情况的哪一种)
显著水平0.05。
测验计算:在表5.3进行。
由表5.3可得:
 =  = 4.045
)·ln = 20 × 4.045 = 20 × 1.39748 = 27.94860
c = 1 + ( +  +  - ) = 1.0818
??27.94860 – 27.14452) = 0.744
查附表4,当k-1 = 3 - 1 = 2时, = 5.99。
推断:实得 < ,因此,接受H0: =  = ,即三个样本的方差是同质的。实际上本例不需要用c矫正,因为?227.94960 – 27.14452 = 0.80508都小于,必然会小于。
若各样本的容量均相等,即i = 时,(5.14)式可化为:
2?k?iln -?iln)] (5.17A)
或?2?k?ilg -?ilg)]
矫正数为:
c = 1 +  (5.17B)
第四节 参数的区间估计参数估计又分为点估计和区间估计。点估计是以样本的统计数直接估计总体的相应参数,例如:以估计?,以s2估计等,但、s2等统计数来自样本,由于抽样误差,不同样本将有不同的、s2值,那么哪一个、s2最能代表?、2呢?这是难以判断的。因此有必要根据统计数的概率分布,给出一个区间[L1,L2],使总体参数?(? =?,2,…等)在[L1,L2]中的概率为l-?,即
P(L1 ≤? ≤ L2)= l-? (5.18)
式中L1和L2叫做参数?的l-?置信限,区间[L1,L2]叫做参数?的l-?置信区间,l-则叫做区间[L1,L2]的置信系数或置信度。因此,[L1,L2]就是在置信度 l-下对于参数?的区间估计。
一、总体平均数?的区间估计
1.在总体方差已知或虽未知但为大样本(n > 30)时在5.1节里我们已经讨论了接受区域和否定区域的划分。若从一个正态总体抽样,或从一个分布形式未知的总体抽出大样本(n > 30),则将落入(-?1.96)至(+?1.96)范围内的概率为0.95,参见;图5.1,即
P(-?1.96 ≤  ≤+?1.96) = 0.95
P(-?u ≤  ≤+? u) = 1 -? (5.19)
现在要对?作区间估计,因此要对上式进行一变形。实际上,落在[-?u,+ u]内的概率为1 -?,相当于不等式
-?u ≤  ≤+? u
成立的概率为1 -?,由于该不等式等价于
-?u ≤  - ≤? u
即 -  - u ≤ - ≤ -  + u
或  - u ≤ ≤  + u
故有 P( - u ≤ ≤  + u) = 1 -?
上式表明,尽管我们只有而不知,但知道区间[ - u, + u]包含在内的置信程度?可靠程度?为1 -?,因此,置信度P =1 -? 时,?的1 -?置信区间为:[ - u, + u],置信区间的下限L1和上限L2分别为
L1 =  - u
L2 =  + u (5.20)
(5.19)的几何意义为:任一样本平均数,如以为中心,以u为半个区间长度,则包含有的概率为1 -?。如? = 0.05,则表示根据任一样本平均数计算的估计区间[ - 1.96, + 1.96]包含总体平均数的概率为0.95。或解释为:若在总体中抽出了100个样本,计算出了100个这种估计区间,平均有95个包含了总体平均数。
若在总体方差未知但为大样本时,2用s2估计,则总体平均数的1 -?置信区间为:
[ - u?, + u?]
置信限:
L1 =  - u?
L2=  + u? (5.21)
[例5.13]试求例5.1资料新品种总体平均亩产 = 515kg, = = 6,u= 1.96,故由(5.20)得
L1 = 515 – 1.96 × 6 = 503.24(kg)
L2= 515 + 1.96 × 6 = 526.79(kg)
即该水稻新品种总体平均亩产在[503.24,526.76]区间内的置信度为95%。由于这一区间并不包括原地方品种的亩产平均数 = 500,所以在例5.1否定H0: =。
例5.14
由于2未知,需由s2估计,所以
 =  =  = 0.098
因为是在样本(n > 30),故可由(5.21)计算置信限,已知u= 1.96,因此
L1 = 2.47 – 1.96 × 0.098 = 2.28(m)
L2= 2.47 + 1.96 × 0.098 = 2.66(m)
即有95%的把握推断沈单10号玉米的株高的总体平均数?在[2.28,2.66]区间内。
在总体方差未知,又是小样本时
2需由s2估计,此时由于标准化离差服从= n - l的 t分布,因而需用t?取代(5.21)式的u?得?的l-?置信度的置信区间为[ - t?, + t?]。
L1 =  - t?
L2 =  + t? (5.22)
[例5.15]试估计例5.2资料玉米新品种百粒重的总体平均数的?的95%置信区间。
例5.2已算得 = 33.67(g), = 0.5453(g)。查附表5, = 9时,t0.05 = 2.262,故代入(5.22)式有
L1 = 33.67 – 2.262 × 0.5453 = 32.47
L2= 33.67 + 2.262 × 0.5435 = 34.90
即该玉米新品种总体平均百粒重?在[32.47,34.90]区间内的置信度为95%,由于这一区间并不包括当地推广的玉米品种百粒重32(g),故例5.2是否定H0: =。
在表达时,亦可将置信区间写作 ± t?形式,即该品种总体百粒重有95%置信度的区间是33.67 ± 2.262× 0.5435 = 33.67 ± 1.233(g)。
二、两总体平均数差数(?1 -?2)的区间估计这是在一定的置信度下,估计两总体平均数和差值大小的分布区间。
在两总体方差已知或虽未知但为大样本(n1、n2均大于30)时由5.19式可得?1 -2的(1 -?)置信区间为
[( - ) - u?,( - ) + u??
置信限
L1 = ( - ) - u?
L2 = ( - ) + u?(5.23)
在两总体方差未知时,上式中的由代。置信限为
L1 = ( - ) - u?
L2 = ( - ) + u?(5.24)
[例5.16]
在例5.3已算得 = 214.6(g), = 254.0(g),= 6.7502,已知u0.01 =2.58,代入(5.24)式有
L1 = (214.6 - 254.0) – 2.58 × 6.7502 = -56.82
L1 = (214.6 - 254.0) + 2.58 × 6.7502 = -21.98
上述结果说明,沈单4号玉米在中密度下平均穗粒重比低密度下平均穗粒重少21.98到56.82(g),这一估计的置信度为99%。
2、在两总体方差未知、小样本时
(1)两总体方差相等,即 =  = (可由F测验得知),根据(5.19)式可得?12的(1 -?)置信区间为:
[( - ) - t?,( - ) + t?]
由(5.3)和(5.4)式计算,置信限为
L1 = ( - ) - t?
L2 = ( - ) + t?5.25)
[例5.17]试估计例5.4资料种植在两个地区的某小麦品种的蛋白质含量相差在置信度为95%时的置信区间。
例5.14已算得 = 12.74(%), = 13.03(%), = 0.2763,并由附表5查得 = 10时,t0.05 = 2.228,代人(5.25)式有
L1 = (12.74 – 13.03) - 2.228 × 0.2763 = -0.91
L2 = (12.74 – 13.03) - 2.228 × 0.2763 = 0.33
上述结果说明,该小麦品种种植在甲地其蛋白质含量比种植在乙地的蛋白质含量低0.91%至高0.33%,由于区间[- 0.91,0.33]包含0,故例5.4在?水平上接受H0:?1 -2 = 0。
(2)两总体方差不相等,即  ,(可由F测验得知),这时置信限仍用(5.25)式,只是需由(5.15)式计算。
若n1 = n2 = n时,t临界值用 = n - 1的t?。
若n1  n2时,t临界值需由(5.15)式计算。
[例5.18]试估计例5.7资料两大豆品种脂肪含量相差的95%置信度的置信区间。
在例5.5已算得 = 19.45(%), = 18.64(%), = 0.3531, = 2.278,故有
L1 = (19.45 – 18.64) - 2.278 × 0.3531 = 5.64 × 10-3(%)
L2 = (19.45 – 18.64) + 2.278 × 0.3531 = 1.61(%)
上述结果说明,辽豆10号比铁丰25号大豆脂肪含量高5.64 × 10-3(%) ~ 1.61(%)。由于区间[5.64 × 10-3(%),1.61(%)]不包含0,故在? = 0.05水平上否定 H0:?12 = 0。
3、成对数据总体差数?d置信区间
据(5.19)式可得d的l-?置信区间为:
[- t?, + t??
置信限为:
L1 = - t?
L2 = + t? (5.26)
[例5.19]试估计例5.7资料的病毒A和 B致病力总体差数d的95%置信区间。
在例5.7已算得 = 4, = 1.523,t0.05 = 2.365,故
L1 = 4 –2.365 × 1.523 = 0.40
L2 = 4 +2.365 × 1.523 = 7.60
上述结果说明,A病毒在烟叶上产生的致病枯斑数要比B病毒多0.40 ~ 7.60个。这一估计的置信度为95%,由于区间[0.40,7.60]未包含0,所以在? = 0.05水平上否定H0:d = 0。
三、总体方差及标准差的区间估计由于方差的抽样分布是不对称的,因此正态分布或t分布均不能给出的置信限。但是,根据?2的定义,?2 = ,可以应用分布给出一个置信区间,在此区间内包含有总体2的概率为1 -?。
P[, ≤ ?≤ , = 1 - (5.27)
括号内的不等式经变换后,从而有
P[? ≤ ≤ = 1 - (5.28)
因此可以得到总体方差的1 -?置信区间为:
[?,?
置信限为:
L1 = 
L2 = (5.29)
应当注意,由于?2分布的不对称性,这一置信限并不对称,即从L1到s2的距离不等于s2到L1的距离。
总体标准差?的置信区间为:
[,] (5.30)
置信限为:
L1 = 
L2 = (5.31)
[例5.20]试估计例5.8资料水稻小区产量变异度(即2)的95%置信度的置信区间。
已知s2 = 12.54,? = 9, = 19.02, = 2.70,由(5.29)式得总体方差的95%置信限为:
L1 =  = 59.3(kg)2
L2 =  = 418.0(kg)2
即有95%的把握推断:施肥稻田水稻产量的总体方差在区间[59.3(kg)2,418.0(kg)2]中。
由(5.31)式得总体标准差的95%的置信限为:
L1 =  = 7.7(kg)
L2 =  = 20.4(kg)
即施肥稻田水稻产量的总体标准差95%的置信区间为[7.7(kg),20.4(kg)]。
在n > 30时,分布近似正态,u =  - 服从分布,可用u分布推断置信区间,即
P[-u? ≤  -  ≤ u?] = 1 -? (5.32)
整理得:
P[≤≤] = 1 -? (5.33)
置信限:
L1 = 
L2 = (5.34)
四、区间估计与假设测验的关系区间估计与假设测验之间存在着密切的关系,区间估计亦可用于假设测验。因为置信区间是一定置信度下总体参数的所在范围,故对参数所作假设若恰恰落在该范围内,则这个假设与参数就没有真实的不同,因而接受H0;反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,所以应否定H0接受HA。
区间估计与假设测验的关系可以总结为以下几点:
1.若在1 -?置信度下,两个置信限的符号相同(同正或同负),则H0:,H0:?12?,H0:?d 0,H0:2?= 0,…等皆在?水平上被否定而接受HA。
2,若在1 -?置信度下,两个置信限为异号(一正一负),即其区间包括零值,则H0:,H0:?12?,H0:d 0,H0:2?= 0,…等皆在?水平上被接受。
3,若两个置信限皆为正号,则有?1?>2。
若两个置信限皆为负号,则有?1?<2。