第五章 t检验统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括 假设检验 ( test of hypothesis) 和参数估计
( parametric estimation)二个内容。
下一张 主 页 退 出上一张假 设 检 验 又叫 显著性 检验 ( test of
significance)。显著性检验的方法很多,常用的有 t检验,F检验和?2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍 几种 t检验的方法,然 后 介 绍 总 体 参 数 的 区 间 估计( interval estimation)。
下一张 主 页 退 出上一张第一节 显著性检验的基本原理一、显著性检验的意义随机抽测 10头长白猪和 10头大白猪经产母猪的产仔数,资料如下:
长白,11,11,9,12,10,13,13,8,10,13
大白,8,11,12,10,9,8,8,9,10,7
经计算,得长白猪 10头经产母猪产仔平均数
=11头,标准差 S1=1.76头;大白猪 10头经产母猪产仔平均数 =9.2头,标 准 差 S2=1.549头。
1x
2x
下一张 主 页 退 出上一张能否仅凭这两个平均数的差值 - =1.8
头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的 。这是因为如果 我们再分别随机抽测
10 头长白猪和 10头大白猪经产母猪的产仔数,
又可得到两个样本资料 。由于 抽样误差的 随机性,两样本平均数就不一定是 11头和 9.2头,其差值也不一定是 1.8头 。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。
1x 2x
下一张 主 页 退 出上一张对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。
如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。
两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者 是 包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样下一张 主 页 退 出上一张样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试 验研究的目的,就是要给,是否相同 做出推断。由于总体平均数,未知,在进行显著性检验时只能以样本平均数,作为检验对象,
更确切地说,是以( - )作为检验对象。
为什么以样本平均数作为检验对象呢? 这是因为样本平均数具有下述特征:
1、离均差的平方和 ∑( - ) 2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
1?
2?
1? 2?
1? 2?
1x 2x
1x 2x
x x
下一张 主 页 退 出上一张
2、样本平均数 是 总体平均数的 无偏估计值,即 E( ) =μ。
3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。
所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。
由上所述,一方面我们有依据由 样本平均数 和 的差异来推断总体平均数,相同 与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于 试 验误差(或抽样误差)的不可避免性 。
x
x
1? 2?1x
2x
下一张 主 页 退 出上一张通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值 由两部分组成,即
= +
总体平均数 反映了总体特征,表示误差。
若 样本含量 为 n,则 可 得 到 n 个 观 测值:,,,。于是样本平均数
ix
ix
i?ix
i?
nx1x 2x
nnxx ii /)(
下一张 主 页 退 出上一张说明样本平均数并非总体平均数,它还包含试验误差的成分。
对于接受不同处理的两个样本来说,则有:
= +,= +
这说明两个样本平均数之差( - )也包括了两部分:
一部分是两个总体平均数的差( - ),叫 做试 验 的 处 理 效 应 ( treatment effect);另一部分是 试验误差 ( - )。
1? 2?1x 2x1? 2?
1x 2x
1? 2?
1? 2?
下一张 主 页 退 出上一张
)()( 212121 xx
也就是说样本平均数的差( - )包含有试验误差,它只是试验的表面效应。因此,仅凭
( - )就对总体平均数,是否相同 下结论是不可靠的。只有 通过 显著性检验 才能从
( - )中提取结论。
对( - )进行显著性检验就是要分析:
试验的表面效应( - )主要由处理效应
( - )引起的,还 是 主要 由试验误差所造成。
1x 2x
1x 2x
2x1x
1? 2?
1x 2x
1x 2x
1? 2?
下一张 主 页 退 出上一张虽然处理效应( - )未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可 从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。
二、显著性检验的基本步骤
(一)首先对试验样本所在的总体作假设
1? 2?
下一张 主 页 退 出上一张这里假设 = 或 - =0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应,-
=1.8头是试验误差,处理无效,这种假设称为无效假设 ( null hypothesis),记作,
= 或
。
无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出,= 或 - =0
的同时,相应地提出一对应假设,称为 备择假设
( alternative hypothesis),记作 。备择假设是在无效假设被否定时准备接受的假设。
1? 2? 1? 2?
1? 2?0H
1x 2x
021
0H 1? 2? 1? 2?
AH
下一张 主 页 退 出上一张本例的备择假设是,≠ 或 - ≠0,
即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数 与 不相等或 与 之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。
(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率
AH
1? 2? 1? 2?
1? 2? 1? 2?
下一张 主 页 退 出上一张对于上述例子,研究在无效假设,
= 成立的前提下,统计量( - )的抽样分布。经统计学研究,得到一个统计量 t:
其中 =
叫做 均数差异标准误 ; n1,n2为两样本的含量。
1?
2? 1x 2x
0H
21
21
xxS
xxt
21 xxS? )11(
)1()1(
)()(
2121
2
22
2
11
nnnn
xxxx
21 xxS?
下一张 主 页 退 出上一张所得的统计量 t服从自由度 df =( n1-1)
+(n2-1)的 t分布。
根据两个样本的数据,计算得,- =11-
9.2=1.8;
1x 2x
)11()1()1( )()(
2121
2
22
2
11
21 nnnn
xxxxS
xx
742.0)101101()110()110( 6.2128
4 2 6.2
7 4 2.0
2.911
21
21
xxS
xxt
下一张 主 页 退 出上一张我们需进一步估计出 |t|≥2.426的两尾概率,即估计 P( |t|≥2.426)是多少?
查附表 3,在 df =( n1-1) + (n2-1) =
( 10-1) +( 10-1) =18时,两尾概率为
0.05的临界值,=2.101,两尾概率为
0.01的临界 t值,=2.878,即:
P( |t|>2.101) = P( t>2.101)
+ P( t <-2.101) =0.05
P( |t|>2.878) = P( t>2.878)
+ P( t<-2.878) =0.01
)18(05.0t
)18(01.0t
下一张主 页退 出上一张由于 根据两样本数据计算所得的 t 值 为
2.426,介于两个临界 t值之间,即:
t0.05<2.426<t0.01
所以,| t |≥2.426的概率 P介于 0.01
和 0.05之间,即,0.01 <P< 0.05。
图 5-1 | t |≥2.426的两尾概率如 图 5-1所示,说明 无效假设成立的可能性,即试验的表面效应为试验误差的可能性在
0.01─ 0.05之间。
下一张 主 页 退 出上一张
(三)根据,小概率事件实际不可能性原理,
否定或接受无效假设在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于 0.05时,可以认为在一次试 验 中 试 验 表 面 效 应 是 试 验误差实际上是下一张 主 页 退 出上一张不可能的,因而否定原先所作的无效假设,
=,接受备择假设,≠,即 认为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于 0.05时,则说明 无效假设,= 成立的可能性大,不能被否定,因而也就不能接受备择假设,≠ 。
1? 2?
0H
1? 2?
AH
0H 1? 2?
AH
1? 2?
下一张 主 页 退 出上一张本例中,按所建立的,=,试验的表面效应是试验误差的概率在 0.01 ─ 0.05
之间,小于 0.05,故有理由否定,=,
从而接受,≠ 。可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数 和 不相同。
综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓,概率性质的反证法,对试验样本所属总体所作的无效假设的统计推断。
1? 2?0H
AH
0H 1? 2?
1? 2?
1? 2?
下一张 主 页 退 出上一张三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的依据是,小概率事件实际不可能性原理,。 用来确定否定或接受无效假设的概率标准 叫 显 著 水平 ( significance level),记作 α。在生物学研究中常取 α=0.05或 α=0.01。
对于上述例子所用的检验方法( t检验)来说:
下一张 主 页 退 出上一张若 |t|< t0.05,则说明试验的表面效应属于试验误差的概率 P>0.05,即表面效应属于试验误差的可能性大,不能否定,=,统计学上把这一检验结果表述为:,两个总体平均数 与 差异不显著,,在计算所得的 t值的右上方标记,ns”或不标记符号;
1? 2?0H
1? 2?
下一张 主 页 退 出上一张若 t0.05≤|t|< t0.01,则 说明 试验的表面效应属于试验误差的概率 P在 0.01—0.05之间,
即 0.01 <P≤0.05,表面效应属于试验误差的可能性较小,应否定,=,接受,≠,统计学上把这一检验结果表述为:,两个总体平均数 与 差异显著,,在计算所得的 t值的右上方标记,*” ;
1? 2?0H
AH 1? 2?
1? 2?
下一张 主 页 退 出上一张若 |t|≥t0.01,则说明试验的表面效应属于试验误差的概率 P不超过 0.01,即 P≤0.01,
表面效应属于试验误差的可能性更小,应否定,=,接受,≠,统计学上把这一检验结果表述为:,两个总体平均数与 差异极显著,,在计算所得的 t值的右上方标记,* *” 。
1? 2?0H AH 1
2?
1?
2?
下一张 主 页 退 出上一张这 里 可 以 看 到,是 否 否 定 无 效 假设,是用实际计算出的检验统计量 t的绝对值与显著水平 α对应的临界 t值,ta比较。若 |t|≥ta,
则在 α水平上否定 ;若 |t| < ta,则不能在
α水平上否定 。
区间 和 称为 α水平上的 否 定域,而区间( )则称为 α水平上的 接 受域 。
210:H
210:H
210:H
t,,?t
tt,?
下一张 主 页 退 出上一张假设检验时选用的显著水平,除 α=0.05
和 0.01 为 常 用 外,也 可 选 α= 0.10
或 α=0.001等等。到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即 α值取大些。反之,如试验耗费较大,对精确度的要求较高,
不 容 许反复,或者试验结论的应用事关重大,
则所选显著水平应高些,即 α值应该小些。显著水平 α对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。
下一张 主 页 退 出上一张因为显著性检验是根据,小概率事件实际不可能性原理,来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有
100%的把握。也就是说,在检验无效假设时可能犯两类错误。
第一类错误是真实情况为 H0成立,却否定了它,犯了,弃真,错误,也叫 Ⅰ 型错误 ( type
Ⅰ error)。 Ⅰ 型错误,就是把非真实差异错判为真实差异,即 为 真,却接 受了 。
210:H
21:AH
下一张 主 页 退 出上一张第二类错误是 H0不成立,却接受了它,犯了,纳伪,
错误,也叫 Ⅱ 型错误 ( type Ⅱ error)。 Ⅱ 型错误,
就是把真实差异错判为非真实差异,即为真,却未能否定 。
我们是基于,小概率事件实际不可能性原理,来否定 H0,但在一次试验中 小概率事件 并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与 H0 对应的抽样总体,但计算所得的统计量 t却落入了否定域中,因而否定了 H0,于是犯了 Ⅰ 型错误。但犯这类错误的概率不会超过 a。
210:H
21:AH
下一张 主 页 退 出上一张
Ⅱ 型错误发生的原因可以用 图 5-2来说明。
图中左边曲线是 为真时,( - )
的分布密度曲线;右边曲线是 为真时,( - )的分布密度曲线( > ),
它们构成的抽样分布相叠加 。 有 时 我 们 从抽样总体抽取一个( - )恰恰在 成立时的接受域内(如图中横线阴影部分),这样,实际是从 总体抽的样本,经显著性检验却不能否定,因而犯了 Ⅱ
型错误。犯 Ⅱ 型错误的概率用 表示 。 Ⅱ 型
210:H 1x 2x
21:AH
1x 2x
1? 2?
021 1x 2x
0H
021
0H
下一张 主 页 退 出上一张错误概率 值的大小较难确切估计,它只有与特定的 结合起来才有意义。一般与显著水平
α、原总体的标准差 σ、样本含量 n,以及相互比较的两样本所属总体平均数之差 - 等因素有关。在其它因素确定时,α值越小,值越大;反之,α值越大,值越小; 样本含量及
- 越大,σ越小,值越小。
AH
1? 2?
1? 2
下一张 主 页 退 出上一张由于 值的大小与 α值的大小有关,所以在选用检验的显著水平时应考虑到犯 Ⅰ,Ⅱ 型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。
若一个试验耗费大,可靠性要求高,不允许反复,那么 α值应取小些;
下一张 主 页 退 出上一张当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将 α值放宽到 0.1,甚至放宽到
0.25。
下一张 主 页 退 出上一张在提高显著水平,即减小 α值时,为了减小犯 Ⅱ 型错误的概率,可 适 当 增 大 样 本 含 量 。因为 增 大样 本 含 量 可 使 ( )分 布 的 方 差
σ2( 1/n1+1/n2)变小,使图 5-2左右两曲线变得比较,高,,,瘦,,叠加部分减少,即 值变小。
我们 的 愿 望 是 α 值不越过某个给定值,比如
α=0.05或 0.01的前提下,值越小越好 。 因为 在 具 体 问 题 中 和 σ相对不变,所以值的大小主要取决于样本含量的大小。
21 xx?
21
下一张 主 页 退 出上一张表 5-1 两类错误的关系两类错误的关系可归纳如下:
四、双侧检验与单侧检验在上述显著性检验中,无效假设与备择假设 。此时,备择假设中包括了 或 两种可能。 这个假设的目的在于判断与有无差异,而 不考虑 谁大谁小。 如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,也可能低于大白猪。
210:H
21:AH
2121
下一张 主 页 退 出上一张此时,在 α 平上 否 定 域 为和,对称地分配在 t分布曲线的两侧尾部,每侧的概率为 α/2,如 图 5-3所示。这种利用两尾概率进行的检验叫 双侧检验 ( two-
sided test),也叫 双尾检验 ( two-tailed
test),为双侧检验的临界 t值。
t,
,?t
t
下一张 主 页 退 出上一张但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。此时,若进行新技术与常规技术的比较试验,则无效假设应为,即假设新技术与常规技术产蛋量是相同的,备 择 假设应为,即 新配套 技术的实施使产蛋
210:H
21:AH
下一张 主 页 退 出上一张量有所提高。检验的目的在于推断实施新技术是否提高了产蛋量,这时 H0的否定域在 t分布曲线的右尾。在 α水平上否定域为,右侧的概率为 α,如 图 5-4A所示。
若无效假设 H0为,备择假设 HA
为,此时 H0的否定域在 t分布曲线的左尾。在 α水平上,H0的否定域为,左侧的概率为
α。如 图 5-4A所示。
,?t
21
21
下一张 主 页 退 出上一张这种利用一尾概率进行的检验叫 单侧检验
( one-sided test)也叫 单尾检验 ( one-
tailed test)。此时 tα为单侧检验的临界 t值。
显然,单侧检验的 tα=双侧检验的 t2α。
由上可以看出,若对同一资料进行双侧检验也进行单侧检验,那么在 α水平上单侧检验显著,只相当于双侧检验在 2α水平上显著。 所以,同一资料双侧检验与单侧检验所得的结论不一定相同。
双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。
下一张 主 页 退 出上一张五、显著性检验中应注意的问题上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题:
(一) 为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确。
下一张 主 页 退 出上一张
(二) 选用的显著性检验方法应符合其应用条件 。上面我们所举的例子属于,非配对设计两样本平均数差异显著性检验,。由于研究变量的类型、问题的性质、条件、试验设计方法、
样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。
下一张 主 页 退 出上一张
(三) 要正确理解差异显著或极显著的统计意义。显著性检验结论中的,差异显著,或,差异极显著,不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。
,显著,或,极显著,是指表面上如此差别的不同样本来自同一总体的可能性小于 0.05或 0.01,
已达到了可以认为它们有实质性差异的显著水平。
有些试验结果虽然差别大,但由于试验误差大,
也许还不能得出,差异显著,的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为,差异显著,。
下一张 主 页 退 出上一张显著水平的高低只表示下结论的可靠程度的高低,即在 0.01 水平下否定无效假设的可靠程度为 99%,而在 0.05水平下否定无效假设的可靠程度为 95%。
下一张 主 页 退 出上一张
“差异不显著,是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平 0.05,不能理解为试验结果间没有差异。下
,差异不显著,的结论时,客观上存在两种可能:
一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。
(四) 合理建立统计假设,正确计算检验统计量。就两个样本平均数差异显著性检验来说,
无效假设 与备择假设 的建立,一般如前所述,但也有时也例外。如经收益与成本的综合经济分析知道,饲喂畜禽以高质量的 Ⅰ 号饲料比饲喂 Ⅱ 号饲料提高的成本需用畜禽生产性能提高个
d单位获得的收益来相抵,那么在检验喂 Ⅰ 号饲料与 Ⅱ 号饲料在收益上是否有差异时,无效假设应为,备择假设为
(双侧检验)或 (单侧检验); t检验计算公式为:
dH 210,dH A 21:
dH A 21:
下一张 主 页 退 出上一张
0H AH
( 5-1)
如果不能否定无效假设,可以认为喂高质量的 Ⅰ 号饲料得失相抵,只有当( ) >d 达到一定程度而否定了 H0,才能 认为喂 Ⅰ 号饲料可获得更多的收益。
21
)( 21
xxS
dxxt
21 xx?
下一张 主 页 退 出上一张
(五 ) 结论不能绝对化。 经过显著性检验最终是否 否定无效假设 则由被研究事物有无 本质差异、
试验误差的大小及选用显著水平的高低决定的。 同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。 否定 H0时可能犯 Ⅰ 型错误,接受 H0时可能犯 Ⅱ 型错误。尤其在 P 接近 α时,下结论应慎重,有时应用 重复 试验来证明。 总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。
下一张 主 页 退 出上一张此外,报告结论时应列出,由样本算得的检验统计量值(如 t 值),注明是单侧检验还是双侧检验,并写出 P 值的确切范围,
如 0.01<P<0.05,以便读者结合有关资料进行对比分析。
下一张 主 页 退 出上一张第二节 样本平均数与总体平均数差异显著性检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,
即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。如畜禽正常生理指标、怀孕期、
家禽出雏日龄以及生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。检验的基本步骤是:
下一张 主 页 退 出上一张
(一) 提出无效假设与备择假设,,其中 为样本所在总体平均数,为已知总体平均数;
(二) 计算 t值 计算公式为:
( 5-2)
式中,n为样本含量,为样本标准误。
(三) 查临界 t值,作出统计推断 由查附表 3得临界值 t0.05,t0.01。将计算所得的 t
值的绝对值与其比较:
00:H 0:AH
xS
xt 0
1 ndf
下一张 主 页 退 出上一张
1 ndf
0?
若 |t| < t0.05,则 P> 0.05,不 能 否定,表明样本平均数 与总体平均数差异不显著,可以认为样本是取自该总体;
若 t0.05 ≤ |t| <t0.01,则 0.01<P≤0.05,否定,接受,表明样本平均数与总体平均数 差异显著,有 95%的把握认为样本不是取自该总体;
x00:H
00:H 0:AH
0?x
0?
若 |t|≥t0.01,则 P≤0.01,表明样本平均数与 总体平均数 差异极显著,有 99%
的把握认为样本不是取自该总体。
若在 0.05水平上进行单侧检验,只要将计算所得 t值的绝对值 |t|与由附表 3查得 a=0.10
的临界 t值 t0.10比较,即可作出统计推断。
0?x
下一张 主 页 退 出上一张
【 例 5.1】 母猪的怀孕期为 114天,今抽测 10头母猪的怀孕期分别为 116,115、
113,112,114,117,115,116、
114,113(天),试检验所得样本的平均数与总体平均数 114天有无显著差异?
根据题意,本例应进行双侧 t检验。
1、提出无效假设与备择假设
,
210:H 21:AH
下一张 主 页 退 出上一张
2、计算 t值经计算得,=114.5,S=1.581
所以
=
=
=1.000
x
xS
uxt 0
10581.1
1145.114?
5.0
5.0
91101 ndf
3、查临界 t值,作出统计推断由 =9,查 t值表(附表 3)得 t0.05( 9)
=2.262,因为 |t|<t0.05,P>0.05,故不能否定 H0,= 114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为 114天的总体。
df
下一张 主 页 退 出上一张
【 例 5.2】 按饲料配方规定,每 1000kg某种饲料中维生素 C不得少于 246g,现从工厂的产品中随机抽测 12个样品,测得维生素 C含量如下,255,260、
262,248,244,245,250,238,246、
248,258,270g/1000kg,若样品的维生素 C
含量服从正态分布,问此产品是否符合规定要求?
下一张 主 页 退 出上一张按题意,此例应采用单侧检验。
1、提出无效假设与备择假设
H0,= 246,HA,> 250
2、计算 t 值经计算得,=114.5,S=1.581
x
下一张 主 页 退 出上一张
所以
=
=
= 2.281
xS
xt
12115.9
246252?
631.2
6
111121 ndf
3、查临界 t值,作出统计推断因为单侧 = 双侧 = 1.796,
t=2.281 > 单侧 t0.05( 11),P < 0.05,否定 H0,=246,接受 HA,>246,可以认为该批饲料维生素 C含量符合规定要求。
)11(05.0t)11(10.0t
下一张 主 页 退 出上一张第三节 两个样本平均数的差异显著性检验在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计不同,一般可分为两种情况:
下一张 主 页 退 出上一张一是非配对设计或成组设计两样本平均数差异显著性检;
二是配对设计两样本平均数差异显著性检。
一、非配对设计两样本平均数的差异显著性检验非配对设计或成组设计 是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。非配对设计资料的一般形式见表 5-2。
下一张 主 页 退 出上一张表 5-2 非配对设计资料的一般形式下一张 主 页 退 出上一张非配对设计两样本平均数差异显著性检验的基本步骤如下:
(一)提出无效假设与备择假设
,
(二)计算 t值计算公式为:
( 5-3)
210:H 21:AH
21
21
xxS
xx
t
)1()1( 21 nndf
下一张 主 页 退 出上一张其中:
( 5-4)
)11(
)1()1(
)()(
2
21
121
2
22
2
11
nnnn
xxxx
S xx
2121
2
2
22
2
1
2
12
1
11
)1()1( nnnn
n
x
x
n
x
x
)11(
)1()1(
)1()1(
2121
2
22
2
11
nnnn
SnSn
当 时
( 5-5)
nnn 21
)1(
)()( 222211
21?
nn
xxxx
S xx
n
S
n
S 2221
22
21 xx
SS
下一张 主 页 退 出上一张为均数差异标准,、,,,,
分别为两样本含量、平均数、均方。
(三)根据 df=(n1-1)+(n2-1),查临界值,t0.05,t0.01,将 计算所得 t 值的绝对值与其比较,作出统计推断
【 例 5.3】 某种猪场分别测定长白后备种猪和蓝塘后备种猪 90kg时的背膘厚度,测定结果如表 5-3所示。设两品种后备种猪 90kg 时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪 90kg时的背膘厚度有无显著差异?
21 xxS? 1n 2n 1x 2x 2
1S
2
2S
下一张 主 页 退 出上一张表 5-3 长白与蓝塘后备种猪背膘厚度
1、提出无效假设与备择假设
,
2、计算 t值此例 n1=12,n2=11,经计算得,
=1.202,=0.0998,=0.1096,
=1.817,=0.123,=0.1508
210:H 21:AH
1x
2x
1S 1SS
2S 2SS
下一张主 页退 出上一张
,分别为两样本离均差平方和。
=0.0465
1SS 2SS
)
11
(
)1()1(
)()(
2
21
121
2
22
2
11
nnnn
xxxx
S xx
)
11
1
12
1(
)111()112(
1 5 0 8.01 0 9 6.0
0 0 2 1 6.0?
下一张 主 页 退 出上一张
=( 12-1) +( 11-1) =21
21
21
xxS
xx
t
**2 2 6.13
0 4 6 5.0
8 1 7.12 0 2.1
)1()1( 21 nndf
下一张 主 页 退 出上一张
3、查临界 t值,作出统计推断当 df=21时,查临界值得,t0.01( 21) =2.831,
|t|>2.831,P<0.01,否定,接受,表明长白后备种猪与蓝塘后备种猪 90kg背膘厚度差异极显著,这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度。
210:H
21:AH
下一张 主 页 退 出上一张
【 例 5.4】 某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为 60天,增重结果如表 5-
4,问两种饲料对粤黄鸡的增重效果有无显著差异?
表 5-4 粤黄鸡饲养试验增重下一张 主 页 退 出上一张此例,经计算得
1、提出无效假设与备择假设
,
2、计算 t值因为于是
821 nn,625.7051?x
,8 3 9.2 8 821?S,1 2 5.6 9 62?x 1 2 5.1 3 822?S
210:H 21:AH
306.78 125.138839.288
2
2
2
1
21
n SSS xx
21
21
xxS
xxt
3 0 0.13 0 6.7 1 2 5.6 9 66 2 5.7 0 5
141818)1()1( 21 )()(nndf
下一张 主 页 退 出上一张
3、查临界值,作出统计推断 当 df=14
时,查 临 界 值 得,t0.05( 14) = 2.145,
|t| < 2.145,P > 0.05,故不能否定无效假设,表明 两 种饲料饲喂粤黄鸡的增重效果差异不显著,可以认为两种饲料的质量是相同的。
210:H
下一张 主 页 退 出上一张在非配对设计两样本平均数的差异显著性检验中,若总的试验单位数( )不变,则两样 本 含 量相等比两样本含量不等有较高检验效率,因为此时使 最小,从 而使 t的绝对值最大。所以在进行非配对设计时,两样本含量以相同为好。
21 nn?
21 xxS?
下一张 主 页 退 出上一张二、配对设计两样本平均数的差异显著性检验非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到 系统 误 差的影响而降低试验的准确性与精确性。 为了 消除试验单位 不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。
下一张 主 页 退 出上一张配对设计 是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。 配对 的 方式有两种:自身配对与同源配对。
下一张 主 页 退 出上一张
1、自身配对 指同一试验单位在二个不同时间上分别接受前后两次处理,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种病畜治疗前后临床检查结果的变化;观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。
下一张 主 页 退 出上一张
2、同源配对 指将来源相同、性质相同的两个个体配成一对,如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对,
然后对配对的两个个体随机地实施不同处理。
配对设计试验资料的一般形式见表 5-5。
下一张 主 页 退 出上一张表 5-5 配对设计试验资料的一般形式配对设计两样本平均数差异显著性检验的基本步骤如下:
下一张 主 页 退 出上一张
(一)提出无效假设与备择假设
,
其中 为两样本配对数据差值 d总体平均数,它等于两样本所属总体平均数 与 之差,
即 = - 。所设无效假设、备择假设相当于,。
(二)计算 t值 计算公式为
( 5-6)
00?dH?:0?dAH?:
21:AH
d?
2?
210:H
d? 1? 2?
1, ndf
S
d
t
d
下一张 主 页 退 出上一张
1?
式中,为差异标准误,计算公式为,
( 5-7)
d为两样本各对数据之差
Sd为 d的标准差; n
为配对的对子数,即试验的重复数。
(三)查临界 t值,作出统计推断 根据
df=n-1查临界 t值,t0.02( n-1) 和 t0.01( n-1),
将计算所得 t值的绝对值与其比较,作出推断。
dS
)1(
)(
)1(
222
nn
dd
nn
dd
n
SS d
d
,21 jjj xxd;),,2,1( nj ;ndd j
下一张 主 页 退 出上一张
【 例 5.5】 用家兔 10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表 5-6。设体温服从正态分布,问注射前后体温有无显著差异?
表 5-6 10只家兔注射前后的体温下一张 主 页 退 出上一张
1、提出无效假设与备择假设
,即假定注射前后体温无差异
,即假定注射前后体温有差异
2、计算 t值 经过计算得故且 =10-1=9
00?dH?:
0?dAH?:
,73.0d
141.010445.0 nSS dd
1 7 7.5
1 4 1.0
73.0
dS
dt
1 ndf
下一张 主 页 退 出上一张
3、查临界 t值,作出统计推断 由 df=9,查 t值表得,t0.01( 9) =3.250,因为 |t|>t0.01( 9),
P<0.01,否定,接受,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。
【 例 5.6】 现从 8 窝 仔猪中每窝选出性别相同、
体重接近的仔猪两头进行饲料对比试验,将每窝 两头仔猪随机分配到两个饲料组中,时间 30天,试验结果见表 5-7。问两种饲料喂饲仔猪增重有无显著差异?
00?dH?,0?dAH?:
下一张 主 页 退 出上一张表 5-7 仔猪饲料对比试验 单位,kg
下一张 主 页 退 出上一张
1、提出无效假设与备择假设
,即假定两种饲料喂饲仔猪平均增重无差异
,即假定两种饲料喂饲仔猪平均增重有差异
2、计算 t值 计算得故且
00?dH?:
0?dAH?:
,975.0?d
2025.085726.0 nSS dd
815.4
2025.0
975.0
dS
dt
7181 ndf
下一张 主 页 退 出上一张
3、查临界 t值,作出统计推断 由 df=7,
查 t 值 表 得,t0.01( 7) = 3.499,因 为
|t|>3.499,P<0.01,表明甲种饲料与乙种饲料喂饲仔猪平均增重差异极显著,这里表现为甲种饲料喂饲仔猪的平均增重极显著高于乙种饲料喂饲的仔猪平均增重。
一般说来,相对于非配对设计,配对设计能够提高试验的精确性。
在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设 HA的建立和临界值的查取就行了,具体计算与双侧检验相同。
下一张 主 页 退 出上一张第三节 百分数资料差异显著性检验在第四章介绍二项分布时曾指出:由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分数资料,如成活率、死亡率、孵化率、感染率、阳性率等是服从二项分布的。这类百分数的假设检验应按二项分布进行。 当样本含量 n较大,p不过小,
下一张 主 页 退 出上一张且 np和 nq均大于 5时,二项分布接近于正态分布。所以,对于服从二项分布的百分数资料,
当 n足够大时,可以近似地用 u检验法,即自由度为无穷大时( df=∞)的 t 检验法,进行差异显著性检验。适用于近似地采用 u 检验所需的二项分布百分数资料的样本含量 n见表 5-8。
下一张 主 页 退 出上一张表 5-8 适用于近似地采用 u检验所需要的二项分布百分数资料的样本含量 n
下一张 主 页 退 出上一张一、样本百分数与总体百分数差异显著性检验需要检验一个服从二项分布的样本百分数与已知的二项总体百分数差异是否显著,其目的在于检验一个样本百分数 所在 二项总体百分数 p是否与已知二项总体百分数 p0相同,
换句话说,检验该样本百分数 是否 来自总体百分数为 p0的二项总体。
p?
p?
下一张 主 页 退 出上一张这里所讨论的百分数是服从二项分布的,但
n足够大,p不过小,np 和 nq均大于 5,可近似地采用 u 检验法来进行显著性检验 ;若 np
或 nq小于或等于 30时,应对 u进行连续性矫正。
检验的基本步骤是:
(一)提出无效假设与备择假设
,
(二)计算 u值或值 u值的计算公式为:
(5-8)
00,ppH? 0,ppH A?
pS
pp
u
0
下一张 主 页 退 出上一张矫正 u值 uc的计算公式为:
( 5-9)
其中 为样本百分数,P0为总体百分数,
为样本百分数标准误,计算公式为:
( 5-10)
(三)将 计 算 所 得 的 u或 uc的绝对值与
1.96,2.58比较,作出统计推断
p
c S
npp
u
0 5.0
p?
pS?
n
ppS
p
)1( 00
下一张 主 页 退 出上一张若 (或 ) <1.96,p > 0.05,不能否定,表明样本百分数与总体百分数差异不显著;
若 <2.58,0.01<p≤0.05,
否定,接受,表明样本百分数 与总体百分数 PO差异显著;
若,,否定,接受,表明样本百分数 与 总体百分数 PO差异极显著。
u cu
00,ppH?
)(96.1 cuu 或?
00,ppH? 0,ppH A?
p?
58.2)(?cuu 或 01.0?p 00,ppH?
0,ppH A? p?
下一张 主 页 退 出上一张
【 例 5.7】 据往年调查某地区的乳牛隐性乳房炎一般为 30%,现对某牛场 500 头乳牛进行检测,结果有 175头乳牛凝集反应阳性,问该牛场的隐性乳房炎是否与往年相同?
此例总体百分数 PO=30%,样本百 分 数
=175/500=35%,因为
=150>30,不须进行连续性矫正。
1、提出无效假设与备择假设
,
p? %305000np
%30:0?pH %30,?pH A
下一张 主 页 退 出上一张
2、计算 u值因为于是
3、作出统计推断因为 1.96<u<2.58,0.01<p<0.05,
表明样本百分数 = 35% 与 总 体 百分数
PO=30%差异显著,这里表现为该奶牛场的隐性乳房炎显著高于往年。
n
ppS
p
)1( 00
0205.0
500
)3.01(3.0
pS
ppu
0 439.2
0205.0
30.035.0
p?
二、两个样本百分数差异显著性检验检验服从二项分布的两个样本百分数差异是否显著。其 目的 在 于 检 验 两个样本百分数,所在的两个二项总体百分数 P1、
P2是否相同。当两样本的 np,nq均大于 5时,
可以近似地采用 u 检 验 法进行检验,但在
np和(或) nq 小 于 或 等 于 30时,需作连续性矫正。检验的基本步骤是:
1?p 2?p
下一张 主 页 退 出上一张
(一)提出无效假设与备择假设
,
(二)计算 u值或 uc值
( 5-11)
( 5-12)
其中,为两个样本百分数,为样本百分数差异标准误,计算公式为:
210,PPH? 21,PPH A?
21
21
ppS
pp
u
21
2121 5.05.0
pp
c S
nnpp
u
111? nxp? 222? nxp?
21 ppS?
为合并样本百分数:
( 三)将 u或 uc的绝对值与 1.96,2.58比较,作出统计推断若 (或 ) <1.96,p>0.05,不能否定,表明两个样本百分数,
差异不显著;
)11)(1(
21
21 nnppS pp
p
21
21
21
2211
nn
xx
nn
pnpnp
u cu
210,PPH? 1?p 2?p
下一张 主 页 退 出上一张若 <2.58,0.01<p≤0.05,否定,接受,表明两个样本百分数,差异显著;
若,,否定,接受,表明两个样本百分数,差异极显著。
u?96.1 )(
cu或
210,PPH? 21,PPH A?
1?p 2?p
58.2)(?cuu 或 01.0?p
210,PPH? 21,PPH A?
1?p 2?p
下一张 主 页 退 出上一张
【 例 5.8】 某养猪场第一年饲养杜长大商品仔猪 9800头,死亡 980头; 第二年饲养杜长大商品仔猪 10000头,死亡 950头,试检验第一年仔猪死亡率与第二年仔猪死亡率是否有显著差异?
此例,两样本死亡率分别为:
合并的样本死亡率为:
%10
9 8 0 0
9 8 0?
1
1
1 n
xp %5.9
1 0 0 0 0
9 5 0?
2
2
2 n
xp
%747.9100009800 950980
21
21?
nn
xxp
因为即,,,均大于 5,并且大于
30,可利用 u检验法,不需作连续矫正。检验基本步骤是:
1、提出无效假设与备择假设
,
206.955%747.998001pn
794.8 8 4 4%)747.91(9 8 0 0)1(11 pnqn
974%747.9100002pn
9 0 2 6%)747.91(1 0 0 0 0)1(22 pnqn
pn1 qn1 pn2 qn2
210,PPH? 21,PPH A?
下一张 主 页 退 出上一张
2、计算 u值因为
=0.00422
于是 =
3、作出统计推断 由于 u<1.96,p>0.05,
不能否定,表明第一年仔猪死亡率与第二年仔猪死亡率差异不显著。
)11)(1(
21
21 nnppS pp
)1 0 0 0 019 8 0 01(%)747.91(%747.9
21
21
ppS
ppu
1 8 5.10 0 4 2 2.0 %5.9%10
210,PPH?
下一张 主 页 退 出上一张第四节 总体参数的区间估计所谓参数估计就是用样本统计量来估计总体参数,有 点估计 ( point estimation)
和 区间估计 ( interval estimation) 之分。
将样本统计量直接作为总体相应参数的估计值叫 点估计 。点估计只给出了未知参数估计值的大小,没有考虑试验误差的影响,也没有指出估计的可靠程度。
下一张 主 页 退 出上一张区间估计 是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫 置 信 区 间
( confidence interval),给出的概率保证称为 置 信 度 或 置 信概 率 ( confidence
probability)。本节介绍正态总体平均数和二项总体百分数 P的区间估计。
下一张 主 页 退 出上一张一、正态总体平均数的置信区间设有一来自正态总体的样本,包含 n个观测值,样本平均数,标准误 。总体平均数为 μ 。
因为 服从自由度为 n-1的 t分布。双侧概率为 a时,有:
,也就是说 t在区间内取值的可能性为 1-a,即:
nxxx,,,21 nxx
nSS x?
xSxt )(
atttP aa 1)(aa tt,?
atSxtP a
x
a
1)(?
下一张 主 页 退 出上一张对 变形得:
( 5-13)
亦即
( 5-13)式称为 总体平均数 μ 置信度为 1-a
的置信区间 。其中 称为 置信半径 ;
和 分别称为 置信下限和置信上限 ; 置信上、下限之差称为 置信距,置信距越小,估计的精确度就越高。
a
x
a tS
xt
xaxa StxStx
aStxStxP xaxa 1)(?
xaSt xa Stx?
xa Stx?
下一张 主 页 退 出上一张常用的置信度为 95%和 99%,故由( 5-
13)式可得总体平均数 μ 的 95%和 99%的置信区间如下:
( 5-14)
( 5-15)
【 例 5.9】 某品种猪 10头仔猪的初生重为
1.5,1.2,1.3,1.4,1.8,0.9,1.0、
1.1,1.6,1.2( kg),求该品种猪仔猪初生重总体平均数的置信区间。
xx StxStx 05.005.0
xx StxStx 01.001.0
下一张 主 页 退 出上一张经计算得,,
由,查 t 值 表得,,因此
95%置信半径为
95%置信下限为
95%置信上限为
2.1?x 08.0?
xS
91101 ndf
262.2)9(05.0?t 250.3)9(01.0?t
18.008.026 2.2)(05.0xdf St
02.118.02.1)(05.0 xdf Stx
38.118.02.1)(05.0 xdf Stx
下一张 主 页 退 出上一张所以该品种仔猪初生重总体平均数 μ 的
95%置信区间为又因为
99%置信半径为
99%置信下限为
99%置信上限为
)(38.1)(02.1 kgkg
26.008.025.3)(01.0xdf St
94.026.02.1)(01.0 xdf Stx
46.126.02.1)(01.0 xdf Stx
下一张 主 页 退 出上一张所以该品种仔猪初生重总体平均数 μ 的
99%置信区间为二、二项总体百分数 ρ 的置信区间样本百分数 只是总体百分数 ρ 的点估计值。百分数的置信区间则是在一定置信度下对总体百分数作出区间估计。求总体数的置信区间有两种方法:正态近似法和查表法,这里仅介绍正态近似法。
)(46.1)(94.0 kgkg
P?
下一张 主 页 退 出上一张当,时,总 体 ρ 的
95%,99%置信区间为:
( 5-16)
( 5-17)
其中,为样本百分数,为样本百分数标准误,的计算公式为:
( 5-18)
1000?n %1?
PP SPSP 96.1
96.1
PP SPSP 58.2
58.2
P?
PS?
PS?
n
PPS
P
)?1(?
下一张 主 页 退 出上一张
P?
【 例 5.10】 调查某地 1500头奶牛,患结核病的有 150头,求该地区奶牛结核病患病率的 95%,99%置信区间。
由于 >1000,>1%,采用正态分布近似法求置信区间。
因为
P?
n
PPS
P
)?1(?
0 0 7 7.0
1 5 0 0
)1.01(1.0
下一张 主 页 退 出上一张所以该地区奶牛结核病患病率 ρ 的 95%、
99%置信区间为:
即
0077.096.11.00077.096.11.0
0 0 7 7.058.21.00 0 7 7.058.21.0
%15.11%49.8
%99.11%01.8
下一张 主 页 退 出上一张
( parametric estimation)二个内容。
下一张 主 页 退 出上一张假 设 检 验 又叫 显著性 检验 ( test of
significance)。显著性检验的方法很多,常用的有 t检验,F检验和?2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍 几种 t检验的方法,然 后 介 绍 总 体 参 数 的 区 间 估计( interval estimation)。
下一张 主 页 退 出上一张第一节 显著性检验的基本原理一、显著性检验的意义随机抽测 10头长白猪和 10头大白猪经产母猪的产仔数,资料如下:
长白,11,11,9,12,10,13,13,8,10,13
大白,8,11,12,10,9,8,8,9,10,7
经计算,得长白猪 10头经产母猪产仔平均数
=11头,标准差 S1=1.76头;大白猪 10头经产母猪产仔平均数 =9.2头,标 准 差 S2=1.549头。
1x
2x
下一张 主 页 退 出上一张能否仅凭这两个平均数的差值 - =1.8
头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的 。这是因为如果 我们再分别随机抽测
10 头长白猪和 10头大白猪经产母猪的产仔数,
又可得到两个样本资料 。由于 抽样误差的 随机性,两样本平均数就不一定是 11头和 9.2头,其差值也不一定是 1.8头 。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。
1x 2x
下一张 主 页 退 出上一张对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。
如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。
两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者 是 包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样下一张 主 页 退 出上一张样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试 验研究的目的,就是要给,是否相同 做出推断。由于总体平均数,未知,在进行显著性检验时只能以样本平均数,作为检验对象,
更确切地说,是以( - )作为检验对象。
为什么以样本平均数作为检验对象呢? 这是因为样本平均数具有下述特征:
1、离均差的平方和 ∑( - ) 2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
1?
2?
1? 2?
1? 2?
1x 2x
1x 2x
x x
下一张 主 页 退 出上一张
2、样本平均数 是 总体平均数的 无偏估计值,即 E( ) =μ。
3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。
所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。
由上所述,一方面我们有依据由 样本平均数 和 的差异来推断总体平均数,相同 与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于 试 验误差(或抽样误差)的不可避免性 。
x
x
1? 2?1x
2x
下一张 主 页 退 出上一张通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值 由两部分组成,即
= +
总体平均数 反映了总体特征,表示误差。
若 样本含量 为 n,则 可 得 到 n 个 观 测值:,,,。于是样本平均数
ix
ix
i?ix
i?
nx1x 2x
nnxx ii /)(
下一张 主 页 退 出上一张说明样本平均数并非总体平均数,它还包含试验误差的成分。
对于接受不同处理的两个样本来说,则有:
= +,= +
这说明两个样本平均数之差( - )也包括了两部分:
一部分是两个总体平均数的差( - ),叫 做试 验 的 处 理 效 应 ( treatment effect);另一部分是 试验误差 ( - )。
1? 2?1x 2x1? 2?
1x 2x
1? 2?
1? 2?
下一张 主 页 退 出上一张
)()( 212121 xx
也就是说样本平均数的差( - )包含有试验误差,它只是试验的表面效应。因此,仅凭
( - )就对总体平均数,是否相同 下结论是不可靠的。只有 通过 显著性检验 才能从
( - )中提取结论。
对( - )进行显著性检验就是要分析:
试验的表面效应( - )主要由处理效应
( - )引起的,还 是 主要 由试验误差所造成。
1x 2x
1x 2x
2x1x
1? 2?
1x 2x
1x 2x
1? 2?
下一张 主 页 退 出上一张虽然处理效应( - )未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可 从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。
二、显著性检验的基本步骤
(一)首先对试验样本所在的总体作假设
1? 2?
下一张 主 页 退 出上一张这里假设 = 或 - =0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应,-
=1.8头是试验误差,处理无效,这种假设称为无效假设 ( null hypothesis),记作,
= 或
。
无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出,= 或 - =0
的同时,相应地提出一对应假设,称为 备择假设
( alternative hypothesis),记作 。备择假设是在无效假设被否定时准备接受的假设。
1? 2? 1? 2?
1? 2?0H
1x 2x
021
0H 1? 2? 1? 2?
AH
下一张 主 页 退 出上一张本例的备择假设是,≠ 或 - ≠0,
即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数 与 不相等或 与 之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。
(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率
AH
1? 2? 1? 2?
1? 2? 1? 2?
下一张 主 页 退 出上一张对于上述例子,研究在无效假设,
= 成立的前提下,统计量( - )的抽样分布。经统计学研究,得到一个统计量 t:
其中 =
叫做 均数差异标准误 ; n1,n2为两样本的含量。
1?
2? 1x 2x
0H
21
21
xxS
xxt
21 xxS? )11(
)1()1(
)()(
2121
2
22
2
11
nnnn
xxxx
21 xxS?
下一张 主 页 退 出上一张所得的统计量 t服从自由度 df =( n1-1)
+(n2-1)的 t分布。
根据两个样本的数据,计算得,- =11-
9.2=1.8;
1x 2x
)11()1()1( )()(
2121
2
22
2
11
21 nnnn
xxxxS
xx
742.0)101101()110()110( 6.2128
4 2 6.2
7 4 2.0
2.911
21
21
xxS
xxt
下一张 主 页 退 出上一张我们需进一步估计出 |t|≥2.426的两尾概率,即估计 P( |t|≥2.426)是多少?
查附表 3,在 df =( n1-1) + (n2-1) =
( 10-1) +( 10-1) =18时,两尾概率为
0.05的临界值,=2.101,两尾概率为
0.01的临界 t值,=2.878,即:
P( |t|>2.101) = P( t>2.101)
+ P( t <-2.101) =0.05
P( |t|>2.878) = P( t>2.878)
+ P( t<-2.878) =0.01
)18(05.0t
)18(01.0t
下一张主 页退 出上一张由于 根据两样本数据计算所得的 t 值 为
2.426,介于两个临界 t值之间,即:
t0.05<2.426<t0.01
所以,| t |≥2.426的概率 P介于 0.01
和 0.05之间,即,0.01 <P< 0.05。
图 5-1 | t |≥2.426的两尾概率如 图 5-1所示,说明 无效假设成立的可能性,即试验的表面效应为试验误差的可能性在
0.01─ 0.05之间。
下一张 主 页 退 出上一张
(三)根据,小概率事件实际不可能性原理,
否定或接受无效假设在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于 0.05时,可以认为在一次试 验 中 试 验 表 面 效 应 是 试 验误差实际上是下一张 主 页 退 出上一张不可能的,因而否定原先所作的无效假设,
=,接受备择假设,≠,即 认为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于 0.05时,则说明 无效假设,= 成立的可能性大,不能被否定,因而也就不能接受备择假设,≠ 。
1? 2?
0H
1? 2?
AH
0H 1? 2?
AH
1? 2?
下一张 主 页 退 出上一张本例中,按所建立的,=,试验的表面效应是试验误差的概率在 0.01 ─ 0.05
之间,小于 0.05,故有理由否定,=,
从而接受,≠ 。可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数 和 不相同。
综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓,概率性质的反证法,对试验样本所属总体所作的无效假设的统计推断。
1? 2?0H
AH
0H 1? 2?
1? 2?
1? 2?
下一张 主 页 退 出上一张三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的依据是,小概率事件实际不可能性原理,。 用来确定否定或接受无效假设的概率标准 叫 显 著 水平 ( significance level),记作 α。在生物学研究中常取 α=0.05或 α=0.01。
对于上述例子所用的检验方法( t检验)来说:
下一张 主 页 退 出上一张若 |t|< t0.05,则说明试验的表面效应属于试验误差的概率 P>0.05,即表面效应属于试验误差的可能性大,不能否定,=,统计学上把这一检验结果表述为:,两个总体平均数 与 差异不显著,,在计算所得的 t值的右上方标记,ns”或不标记符号;
1? 2?0H
1? 2?
下一张 主 页 退 出上一张若 t0.05≤|t|< t0.01,则 说明 试验的表面效应属于试验误差的概率 P在 0.01—0.05之间,
即 0.01 <P≤0.05,表面效应属于试验误差的可能性较小,应否定,=,接受,≠,统计学上把这一检验结果表述为:,两个总体平均数 与 差异显著,,在计算所得的 t值的右上方标记,*” ;
1? 2?0H
AH 1? 2?
1? 2?
下一张 主 页 退 出上一张若 |t|≥t0.01,则说明试验的表面效应属于试验误差的概率 P不超过 0.01,即 P≤0.01,
表面效应属于试验误差的可能性更小,应否定,=,接受,≠,统计学上把这一检验结果表述为:,两个总体平均数与 差异极显著,,在计算所得的 t值的右上方标记,* *” 。
1? 2?0H AH 1
2?
1?
2?
下一张 主 页 退 出上一张这 里 可 以 看 到,是 否 否 定 无 效 假设,是用实际计算出的检验统计量 t的绝对值与显著水平 α对应的临界 t值,ta比较。若 |t|≥ta,
则在 α水平上否定 ;若 |t| < ta,则不能在
α水平上否定 。
区间 和 称为 α水平上的 否 定域,而区间( )则称为 α水平上的 接 受域 。
210:H
210:H
210:H
t,,?t
tt,?
下一张 主 页 退 出上一张假设检验时选用的显著水平,除 α=0.05
和 0.01 为 常 用 外,也 可 选 α= 0.10
或 α=0.001等等。到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即 α值取大些。反之,如试验耗费较大,对精确度的要求较高,
不 容 许反复,或者试验结论的应用事关重大,
则所选显著水平应高些,即 α值应该小些。显著水平 α对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。
下一张 主 页 退 出上一张因为显著性检验是根据,小概率事件实际不可能性原理,来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有
100%的把握。也就是说,在检验无效假设时可能犯两类错误。
第一类错误是真实情况为 H0成立,却否定了它,犯了,弃真,错误,也叫 Ⅰ 型错误 ( type
Ⅰ error)。 Ⅰ 型错误,就是把非真实差异错判为真实差异,即 为 真,却接 受了 。
210:H
21:AH
下一张 主 页 退 出上一张第二类错误是 H0不成立,却接受了它,犯了,纳伪,
错误,也叫 Ⅱ 型错误 ( type Ⅱ error)。 Ⅱ 型错误,
就是把真实差异错判为非真实差异,即为真,却未能否定 。
我们是基于,小概率事件实际不可能性原理,来否定 H0,但在一次试验中 小概率事件 并不是绝对不会发生的。如果我们抽得一个样本,它虽然来自与 H0 对应的抽样总体,但计算所得的统计量 t却落入了否定域中,因而否定了 H0,于是犯了 Ⅰ 型错误。但犯这类错误的概率不会超过 a。
210:H
21:AH
下一张 主 页 退 出上一张
Ⅱ 型错误发生的原因可以用 图 5-2来说明。
图中左边曲线是 为真时,( - )
的分布密度曲线;右边曲线是 为真时,( - )的分布密度曲线( > ),
它们构成的抽样分布相叠加 。 有 时 我 们 从抽样总体抽取一个( - )恰恰在 成立时的接受域内(如图中横线阴影部分),这样,实际是从 总体抽的样本,经显著性检验却不能否定,因而犯了 Ⅱ
型错误。犯 Ⅱ 型错误的概率用 表示 。 Ⅱ 型
210:H 1x 2x
21:AH
1x 2x
1? 2?
021 1x 2x
0H
021
0H
下一张 主 页 退 出上一张错误概率 值的大小较难确切估计,它只有与特定的 结合起来才有意义。一般与显著水平
α、原总体的标准差 σ、样本含量 n,以及相互比较的两样本所属总体平均数之差 - 等因素有关。在其它因素确定时,α值越小,值越大;反之,α值越大,值越小; 样本含量及
- 越大,σ越小,值越小。
AH
1? 2?
1? 2
下一张 主 页 退 出上一张由于 值的大小与 α值的大小有关,所以在选用检验的显著水平时应考虑到犯 Ⅰ,Ⅱ 型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的重要程度。
若一个试验耗费大,可靠性要求高,不允许反复,那么 α值应取小些;
下一张 主 页 退 出上一张当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,α值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将 α值放宽到 0.1,甚至放宽到
0.25。
下一张 主 页 退 出上一张在提高显著水平,即减小 α值时,为了减小犯 Ⅱ 型错误的概率,可 适 当 增 大 样 本 含 量 。因为 增 大样 本 含 量 可 使 ( )分 布 的 方 差
σ2( 1/n1+1/n2)变小,使图 5-2左右两曲线变得比较,高,,,瘦,,叠加部分减少,即 值变小。
我们 的 愿 望 是 α 值不越过某个给定值,比如
α=0.05或 0.01的前提下,值越小越好 。 因为 在 具 体 问 题 中 和 σ相对不变,所以值的大小主要取决于样本含量的大小。
21 xx?
21
下一张 主 页 退 出上一张表 5-1 两类错误的关系两类错误的关系可归纳如下:
四、双侧检验与单侧检验在上述显著性检验中,无效假设与备择假设 。此时,备择假设中包括了 或 两种可能。 这个假设的目的在于判断与有无差异,而 不考虑 谁大谁小。 如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,也可能低于大白猪。
210:H
21:AH
2121
下一张 主 页 退 出上一张此时,在 α 平上 否 定 域 为和,对称地分配在 t分布曲线的两侧尾部,每侧的概率为 α/2,如 图 5-3所示。这种利用两尾概率进行的检验叫 双侧检验 ( two-
sided test),也叫 双尾检验 ( two-tailed
test),为双侧检验的临界 t值。
t,
,?t
t
下一张 主 页 退 出上一张但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋量。此时,若进行新技术与常规技术的比较试验,则无效假设应为,即假设新技术与常规技术产蛋量是相同的,备 择 假设应为,即 新配套 技术的实施使产蛋
210:H
21:AH
下一张 主 页 退 出上一张量有所提高。检验的目的在于推断实施新技术是否提高了产蛋量,这时 H0的否定域在 t分布曲线的右尾。在 α水平上否定域为,右侧的概率为 α,如 图 5-4A所示。
若无效假设 H0为,备择假设 HA
为,此时 H0的否定域在 t分布曲线的左尾。在 α水平上,H0的否定域为,左侧的概率为
α。如 图 5-4A所示。
,?t
21
21
下一张 主 页 退 出上一张这种利用一尾概率进行的检验叫 单侧检验
( one-sided test)也叫 单尾检验 ( one-
tailed test)。此时 tα为单侧检验的临界 t值。
显然,单侧检验的 tα=双侧检验的 t2α。
由上可以看出,若对同一资料进行双侧检验也进行单侧检验,那么在 α水平上单侧检验显著,只相当于双侧检验在 2α水平上显著。 所以,同一资料双侧检验与单侧检验所得的结论不一定相同。
双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。
下一张 主 页 退 出上一张五、显著性检验中应注意的问题上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题:
(一) 为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确。
下一张 主 页 退 出上一张
(二) 选用的显著性检验方法应符合其应用条件 。上面我们所举的例子属于,非配对设计两样本平均数差异显著性检验,。由于研究变量的类型、问题的性质、条件、试验设计方法、
样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。
下一张 主 页 退 出上一张
(三) 要正确理解差异显著或极显著的统计意义。显著性检验结论中的,差异显著,或,差异极显著,不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。
,显著,或,极显著,是指表面上如此差别的不同样本来自同一总体的可能性小于 0.05或 0.01,
已达到了可以认为它们有实质性差异的显著水平。
有些试验结果虽然差别大,但由于试验误差大,
也许还不能得出,差异显著,的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为,差异显著,。
下一张 主 页 退 出上一张显著水平的高低只表示下结论的可靠程度的高低,即在 0.01 水平下否定无效假设的可靠程度为 99%,而在 0.05水平下否定无效假设的可靠程度为 95%。
下一张 主 页 退 出上一张
“差异不显著,是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平 0.05,不能理解为试验结果间没有差异。下
,差异不显著,的结论时,客观上存在两种可能:
一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。
(四) 合理建立统计假设,正确计算检验统计量。就两个样本平均数差异显著性检验来说,
无效假设 与备择假设 的建立,一般如前所述,但也有时也例外。如经收益与成本的综合经济分析知道,饲喂畜禽以高质量的 Ⅰ 号饲料比饲喂 Ⅱ 号饲料提高的成本需用畜禽生产性能提高个
d单位获得的收益来相抵,那么在检验喂 Ⅰ 号饲料与 Ⅱ 号饲料在收益上是否有差异时,无效假设应为,备择假设为
(双侧检验)或 (单侧检验); t检验计算公式为:
dH 210,dH A 21:
dH A 21:
下一张 主 页 退 出上一张
0H AH
( 5-1)
如果不能否定无效假设,可以认为喂高质量的 Ⅰ 号饲料得失相抵,只有当( ) >d 达到一定程度而否定了 H0,才能 认为喂 Ⅰ 号饲料可获得更多的收益。
21
)( 21
xxS
dxxt
21 xx?
下一张 主 页 退 出上一张
(五 ) 结论不能绝对化。 经过显著性检验最终是否 否定无效假设 则由被研究事物有无 本质差异、
试验误差的大小及选用显著水平的高低决定的。 同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。 否定 H0时可能犯 Ⅰ 型错误,接受 H0时可能犯 Ⅱ 型错误。尤其在 P 接近 α时,下结论应慎重,有时应用 重复 试验来证明。 总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。
下一张 主 页 退 出上一张此外,报告结论时应列出,由样本算得的检验统计量值(如 t 值),注明是单侧检验还是双侧检验,并写出 P 值的确切范围,
如 0.01<P<0.05,以便读者结合有关资料进行对比分析。
下一张 主 页 退 出上一张第二节 样本平均数与总体平均数差异显著性检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,
即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。如畜禽正常生理指标、怀孕期、
家禽出雏日龄以及生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。检验的基本步骤是:
下一张 主 页 退 出上一张
(一) 提出无效假设与备择假设,,其中 为样本所在总体平均数,为已知总体平均数;
(二) 计算 t值 计算公式为:
( 5-2)
式中,n为样本含量,为样本标准误。
(三) 查临界 t值,作出统计推断 由查附表 3得临界值 t0.05,t0.01。将计算所得的 t
值的绝对值与其比较:
00:H 0:AH
xS
xt 0
1 ndf
下一张 主 页 退 出上一张
1 ndf
0?
若 |t| < t0.05,则 P> 0.05,不 能 否定,表明样本平均数 与总体平均数差异不显著,可以认为样本是取自该总体;
若 t0.05 ≤ |t| <t0.01,则 0.01<P≤0.05,否定,接受,表明样本平均数与总体平均数 差异显著,有 95%的把握认为样本不是取自该总体;
x00:H
00:H 0:AH
0?x
0?
若 |t|≥t0.01,则 P≤0.01,表明样本平均数与 总体平均数 差异极显著,有 99%
的把握认为样本不是取自该总体。
若在 0.05水平上进行单侧检验,只要将计算所得 t值的绝对值 |t|与由附表 3查得 a=0.10
的临界 t值 t0.10比较,即可作出统计推断。
0?x
下一张 主 页 退 出上一张
【 例 5.1】 母猪的怀孕期为 114天,今抽测 10头母猪的怀孕期分别为 116,115、
113,112,114,117,115,116、
114,113(天),试检验所得样本的平均数与总体平均数 114天有无显著差异?
根据题意,本例应进行双侧 t检验。
1、提出无效假设与备择假设
,
210:H 21:AH
下一张 主 页 退 出上一张
2、计算 t值经计算得,=114.5,S=1.581
所以
=
=
=1.000
x
xS
uxt 0
10581.1
1145.114?
5.0
5.0
91101 ndf
3、查临界 t值,作出统计推断由 =9,查 t值表(附表 3)得 t0.05( 9)
=2.262,因为 |t|<t0.05,P>0.05,故不能否定 H0,= 114,表明样本平均数与总体平均数差异不显著,可以认为该样本取自母猪怀孕期为 114天的总体。
df
下一张 主 页 退 出上一张
【 例 5.2】 按饲料配方规定,每 1000kg某种饲料中维生素 C不得少于 246g,现从工厂的产品中随机抽测 12个样品,测得维生素 C含量如下,255,260、
262,248,244,245,250,238,246、
248,258,270g/1000kg,若样品的维生素 C
含量服从正态分布,问此产品是否符合规定要求?
下一张 主 页 退 出上一张按题意,此例应采用单侧检验。
1、提出无效假设与备择假设
H0,= 246,HA,> 250
2、计算 t 值经计算得,=114.5,S=1.581
x
下一张 主 页 退 出上一张
所以
=
=
= 2.281
xS
xt
12115.9
246252?
631.2
6
111121 ndf
3、查临界 t值,作出统计推断因为单侧 = 双侧 = 1.796,
t=2.281 > 单侧 t0.05( 11),P < 0.05,否定 H0,=246,接受 HA,>246,可以认为该批饲料维生素 C含量符合规定要求。
)11(05.0t)11(10.0t
下一张 主 页 退 出上一张第三节 两个样本平均数的差异显著性检验在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计不同,一般可分为两种情况:
下一张 主 页 退 出上一张一是非配对设计或成组设计两样本平均数差异显著性检;
二是配对设计两样本平均数差异显著性检。
一、非配对设计两样本平均数的差异显著性检验非配对设计或成组设计 是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。非配对设计资料的一般形式见表 5-2。
下一张 主 页 退 出上一张表 5-2 非配对设计资料的一般形式下一张 主 页 退 出上一张非配对设计两样本平均数差异显著性检验的基本步骤如下:
(一)提出无效假设与备择假设
,
(二)计算 t值计算公式为:
( 5-3)
210:H 21:AH
21
21
xxS
xx
t
)1()1( 21 nndf
下一张 主 页 退 出上一张其中:
( 5-4)
)11(
)1()1(
)()(
2
21
121
2
22
2
11
nnnn
xxxx
S xx
2121
2
2
22
2
1
2
12
1
11
)1()1( nnnn
n
x
x
n
x
x
)11(
)1()1(
)1()1(
2121
2
22
2
11
nnnn
SnSn
当 时
( 5-5)
nnn 21
)1(
)()( 222211
21?
nn
xxxx
S xx
n
S
n
S 2221
22
21 xx
SS
下一张 主 页 退 出上一张为均数差异标准,、,,,,
分别为两样本含量、平均数、均方。
(三)根据 df=(n1-1)+(n2-1),查临界值,t0.05,t0.01,将 计算所得 t 值的绝对值与其比较,作出统计推断
【 例 5.3】 某种猪场分别测定长白后备种猪和蓝塘后备种猪 90kg时的背膘厚度,测定结果如表 5-3所示。设两品种后备种猪 90kg 时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪 90kg时的背膘厚度有无显著差异?
21 xxS? 1n 2n 1x 2x 2
1S
2
2S
下一张 主 页 退 出上一张表 5-3 长白与蓝塘后备种猪背膘厚度
1、提出无效假设与备择假设
,
2、计算 t值此例 n1=12,n2=11,经计算得,
=1.202,=0.0998,=0.1096,
=1.817,=0.123,=0.1508
210:H 21:AH
1x
2x
1S 1SS
2S 2SS
下一张主 页退 出上一张
,分别为两样本离均差平方和。
=0.0465
1SS 2SS
)
11
(
)1()1(
)()(
2
21
121
2
22
2
11
nnnn
xxxx
S xx
)
11
1
12
1(
)111()112(
1 5 0 8.01 0 9 6.0
0 0 2 1 6.0?
下一张 主 页 退 出上一张
=( 12-1) +( 11-1) =21
21
21
xxS
xx
t
**2 2 6.13
0 4 6 5.0
8 1 7.12 0 2.1
)1()1( 21 nndf
下一张 主 页 退 出上一张
3、查临界 t值,作出统计推断当 df=21时,查临界值得,t0.01( 21) =2.831,
|t|>2.831,P<0.01,否定,接受,表明长白后备种猪与蓝塘后备种猪 90kg背膘厚度差异极显著,这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪的背膘厚度。
210:H
21:AH
下一张 主 页 退 出上一张
【 例 5.4】 某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为 60天,增重结果如表 5-
4,问两种饲料对粤黄鸡的增重效果有无显著差异?
表 5-4 粤黄鸡饲养试验增重下一张 主 页 退 出上一张此例,经计算得
1、提出无效假设与备择假设
,
2、计算 t值因为于是
821 nn,625.7051?x
,8 3 9.2 8 821?S,1 2 5.6 9 62?x 1 2 5.1 3 822?S
210:H 21:AH
306.78 125.138839.288
2
2
2
1
21
n SSS xx
21
21
xxS
xxt
3 0 0.13 0 6.7 1 2 5.6 9 66 2 5.7 0 5
141818)1()1( 21 )()(nndf
下一张 主 页 退 出上一张
3、查临界值,作出统计推断 当 df=14
时,查 临 界 值 得,t0.05( 14) = 2.145,
|t| < 2.145,P > 0.05,故不能否定无效假设,表明 两 种饲料饲喂粤黄鸡的增重效果差异不显著,可以认为两种饲料的质量是相同的。
210:H
下一张 主 页 退 出上一张在非配对设计两样本平均数的差异显著性检验中,若总的试验单位数( )不变,则两样 本 含 量相等比两样本含量不等有较高检验效率,因为此时使 最小,从 而使 t的绝对值最大。所以在进行非配对设计时,两样本含量以相同为好。
21 nn?
21 xxS?
下一张 主 页 退 出上一张二、配对设计两样本平均数的差异显著性检验非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到 系统 误 差的影响而降低试验的准确性与精确性。 为了 消除试验单位 不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。
下一张 主 页 退 出上一张配对设计 是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。 配对 的 方式有两种:自身配对与同源配对。
下一张 主 页 退 出上一张
1、自身配对 指同一试验单位在二个不同时间上分别接受前后两次处理,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种病畜治疗前后临床检查结果的变化;观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。
下一张 主 页 退 出上一张
2、同源配对 指将来源相同、性质相同的两个个体配成一对,如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对,
然后对配对的两个个体随机地实施不同处理。
配对设计试验资料的一般形式见表 5-5。
下一张 主 页 退 出上一张表 5-5 配对设计试验资料的一般形式配对设计两样本平均数差异显著性检验的基本步骤如下:
下一张 主 页 退 出上一张
(一)提出无效假设与备择假设
,
其中 为两样本配对数据差值 d总体平均数,它等于两样本所属总体平均数 与 之差,
即 = - 。所设无效假设、备择假设相当于,。
(二)计算 t值 计算公式为
( 5-6)
00?dH?:0?dAH?:
21:AH
d?
2?
210:H
d? 1? 2?
1, ndf
S
d
t
d
下一张 主 页 退 出上一张
1?
式中,为差异标准误,计算公式为,
( 5-7)
d为两样本各对数据之差
Sd为 d的标准差; n
为配对的对子数,即试验的重复数。
(三)查临界 t值,作出统计推断 根据
df=n-1查临界 t值,t0.02( n-1) 和 t0.01( n-1),
将计算所得 t值的绝对值与其比较,作出推断。
dS
)1(
)(
)1(
222
nn
dd
nn
dd
n
SS d
d
,21 jjj xxd;),,2,1( nj ;ndd j
下一张 主 页 退 出上一张
【 例 5.5】 用家兔 10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表 5-6。设体温服从正态分布,问注射前后体温有无显著差异?
表 5-6 10只家兔注射前后的体温下一张 主 页 退 出上一张
1、提出无效假设与备择假设
,即假定注射前后体温无差异
,即假定注射前后体温有差异
2、计算 t值 经过计算得故且 =10-1=9
00?dH?:
0?dAH?:
,73.0d
141.010445.0 nSS dd
1 7 7.5
1 4 1.0
73.0
dS
dt
1 ndf
下一张 主 页 退 出上一张
3、查临界 t值,作出统计推断 由 df=9,查 t值表得,t0.01( 9) =3.250,因为 |t|>t0.01( 9),
P<0.01,否定,接受,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液可使体温极显著升高。
【 例 5.6】 现从 8 窝 仔猪中每窝选出性别相同、
体重接近的仔猪两头进行饲料对比试验,将每窝 两头仔猪随机分配到两个饲料组中,时间 30天,试验结果见表 5-7。问两种饲料喂饲仔猪增重有无显著差异?
00?dH?,0?dAH?:
下一张 主 页 退 出上一张表 5-7 仔猪饲料对比试验 单位,kg
下一张 主 页 退 出上一张
1、提出无效假设与备择假设
,即假定两种饲料喂饲仔猪平均增重无差异
,即假定两种饲料喂饲仔猪平均增重有差异
2、计算 t值 计算得故且
00?dH?:
0?dAH?:
,975.0?d
2025.085726.0 nSS dd
815.4
2025.0
975.0
dS
dt
7181 ndf
下一张 主 页 退 出上一张
3、查临界 t值,作出统计推断 由 df=7,
查 t 值 表 得,t0.01( 7) = 3.499,因 为
|t|>3.499,P<0.01,表明甲种饲料与乙种饲料喂饲仔猪平均增重差异极显著,这里表现为甲种饲料喂饲仔猪的平均增重极显著高于乙种饲料喂饲的仔猪平均增重。
一般说来,相对于非配对设计,配对设计能够提高试验的精确性。
在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设 HA的建立和临界值的查取就行了,具体计算与双侧检验相同。
下一张 主 页 退 出上一张第三节 百分数资料差异显著性检验在第四章介绍二项分布时曾指出:由具有两个属性类别的质量性状利用统计次数法得来的次数资料进而计算出的百分数资料,如成活率、死亡率、孵化率、感染率、阳性率等是服从二项分布的。这类百分数的假设检验应按二项分布进行。 当样本含量 n较大,p不过小,
下一张 主 页 退 出上一张且 np和 nq均大于 5时,二项分布接近于正态分布。所以,对于服从二项分布的百分数资料,
当 n足够大时,可以近似地用 u检验法,即自由度为无穷大时( df=∞)的 t 检验法,进行差异显著性检验。适用于近似地采用 u 检验所需的二项分布百分数资料的样本含量 n见表 5-8。
下一张 主 页 退 出上一张表 5-8 适用于近似地采用 u检验所需要的二项分布百分数资料的样本含量 n
下一张 主 页 退 出上一张一、样本百分数与总体百分数差异显著性检验需要检验一个服从二项分布的样本百分数与已知的二项总体百分数差异是否显著,其目的在于检验一个样本百分数 所在 二项总体百分数 p是否与已知二项总体百分数 p0相同,
换句话说,检验该样本百分数 是否 来自总体百分数为 p0的二项总体。
p?
p?
下一张 主 页 退 出上一张这里所讨论的百分数是服从二项分布的,但
n足够大,p不过小,np 和 nq均大于 5,可近似地采用 u 检验法来进行显著性检验 ;若 np
或 nq小于或等于 30时,应对 u进行连续性矫正。
检验的基本步骤是:
(一)提出无效假设与备择假设
,
(二)计算 u值或值 u值的计算公式为:
(5-8)
00,ppH? 0,ppH A?
pS
pp
u
0
下一张 主 页 退 出上一张矫正 u值 uc的计算公式为:
( 5-9)
其中 为样本百分数,P0为总体百分数,
为样本百分数标准误,计算公式为:
( 5-10)
(三)将 计 算 所 得 的 u或 uc的绝对值与
1.96,2.58比较,作出统计推断
p
c S
npp
u
0 5.0
p?
pS?
n
ppS
p
)1( 00
下一张 主 页 退 出上一张若 (或 ) <1.96,p > 0.05,不能否定,表明样本百分数与总体百分数差异不显著;
若 <2.58,0.01<p≤0.05,
否定,接受,表明样本百分数 与总体百分数 PO差异显著;
若,,否定,接受,表明样本百分数 与 总体百分数 PO差异极显著。
u cu
00,ppH?
)(96.1 cuu 或?
00,ppH? 0,ppH A?
p?
58.2)(?cuu 或 01.0?p 00,ppH?
0,ppH A? p?
下一张 主 页 退 出上一张
【 例 5.7】 据往年调查某地区的乳牛隐性乳房炎一般为 30%,现对某牛场 500 头乳牛进行检测,结果有 175头乳牛凝集反应阳性,问该牛场的隐性乳房炎是否与往年相同?
此例总体百分数 PO=30%,样本百 分 数
=175/500=35%,因为
=150>30,不须进行连续性矫正。
1、提出无效假设与备择假设
,
p? %305000np
%30:0?pH %30,?pH A
下一张 主 页 退 出上一张
2、计算 u值因为于是
3、作出统计推断因为 1.96<u<2.58,0.01<p<0.05,
表明样本百分数 = 35% 与 总 体 百分数
PO=30%差异显著,这里表现为该奶牛场的隐性乳房炎显著高于往年。
n
ppS
p
)1( 00
0205.0
500
)3.01(3.0
pS
ppu
0 439.2
0205.0
30.035.0
p?
二、两个样本百分数差异显著性检验检验服从二项分布的两个样本百分数差异是否显著。其 目的 在 于 检 验 两个样本百分数,所在的两个二项总体百分数 P1、
P2是否相同。当两样本的 np,nq均大于 5时,
可以近似地采用 u 检 验 法进行检验,但在
np和(或) nq 小 于 或 等 于 30时,需作连续性矫正。检验的基本步骤是:
1?p 2?p
下一张 主 页 退 出上一张
(一)提出无效假设与备择假设
,
(二)计算 u值或 uc值
( 5-11)
( 5-12)
其中,为两个样本百分数,为样本百分数差异标准误,计算公式为:
210,PPH? 21,PPH A?
21
21
ppS
pp
u
21
2121 5.05.0
pp
c S
nnpp
u
111? nxp? 222? nxp?
21 ppS?
为合并样本百分数:
( 三)将 u或 uc的绝对值与 1.96,2.58比较,作出统计推断若 (或 ) <1.96,p>0.05,不能否定,表明两个样本百分数,
差异不显著;
)11)(1(
21
21 nnppS pp
p
21
21
21
2211
nn
xx
nn
pnpnp
u cu
210,PPH? 1?p 2?p
下一张 主 页 退 出上一张若 <2.58,0.01<p≤0.05,否定,接受,表明两个样本百分数,差异显著;
若,,否定,接受,表明两个样本百分数,差异极显著。
u?96.1 )(
cu或
210,PPH? 21,PPH A?
1?p 2?p
58.2)(?cuu 或 01.0?p
210,PPH? 21,PPH A?
1?p 2?p
下一张 主 页 退 出上一张
【 例 5.8】 某养猪场第一年饲养杜长大商品仔猪 9800头,死亡 980头; 第二年饲养杜长大商品仔猪 10000头,死亡 950头,试检验第一年仔猪死亡率与第二年仔猪死亡率是否有显著差异?
此例,两样本死亡率分别为:
合并的样本死亡率为:
%10
9 8 0 0
9 8 0?
1
1
1 n
xp %5.9
1 0 0 0 0
9 5 0?
2
2
2 n
xp
%747.9100009800 950980
21
21?
nn
xxp
因为即,,,均大于 5,并且大于
30,可利用 u检验法,不需作连续矫正。检验基本步骤是:
1、提出无效假设与备择假设
,
206.955%747.998001pn
794.8 8 4 4%)747.91(9 8 0 0)1(11 pnqn
974%747.9100002pn
9 0 2 6%)747.91(1 0 0 0 0)1(22 pnqn
pn1 qn1 pn2 qn2
210,PPH? 21,PPH A?
下一张 主 页 退 出上一张
2、计算 u值因为
=0.00422
于是 =
3、作出统计推断 由于 u<1.96,p>0.05,
不能否定,表明第一年仔猪死亡率与第二年仔猪死亡率差异不显著。
)11)(1(
21
21 nnppS pp
)1 0 0 0 019 8 0 01(%)747.91(%747.9
21
21
ppS
ppu
1 8 5.10 0 4 2 2.0 %5.9%10
210,PPH?
下一张 主 页 退 出上一张第四节 总体参数的区间估计所谓参数估计就是用样本统计量来估计总体参数,有 点估计 ( point estimation)
和 区间估计 ( interval estimation) 之分。
将样本统计量直接作为总体相应参数的估计值叫 点估计 。点估计只给出了未知参数估计值的大小,没有考虑试验误差的影响,也没有指出估计的可靠程度。
下一张 主 页 退 出上一张区间估计 是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫 置 信 区 间
( confidence interval),给出的概率保证称为 置 信 度 或 置 信概 率 ( confidence
probability)。本节介绍正态总体平均数和二项总体百分数 P的区间估计。
下一张 主 页 退 出上一张一、正态总体平均数的置信区间设有一来自正态总体的样本,包含 n个观测值,样本平均数,标准误 。总体平均数为 μ 。
因为 服从自由度为 n-1的 t分布。双侧概率为 a时,有:
,也就是说 t在区间内取值的可能性为 1-a,即:
nxxx,,,21 nxx
nSS x?
xSxt )(
atttP aa 1)(aa tt,?
atSxtP a
x
a
1)(?
下一张 主 页 退 出上一张对 变形得:
( 5-13)
亦即
( 5-13)式称为 总体平均数 μ 置信度为 1-a
的置信区间 。其中 称为 置信半径 ;
和 分别称为 置信下限和置信上限 ; 置信上、下限之差称为 置信距,置信距越小,估计的精确度就越高。
a
x
a tS
xt
xaxa StxStx
aStxStxP xaxa 1)(?
xaSt xa Stx?
xa Stx?
下一张 主 页 退 出上一张常用的置信度为 95%和 99%,故由( 5-
13)式可得总体平均数 μ 的 95%和 99%的置信区间如下:
( 5-14)
( 5-15)
【 例 5.9】 某品种猪 10头仔猪的初生重为
1.5,1.2,1.3,1.4,1.8,0.9,1.0、
1.1,1.6,1.2( kg),求该品种猪仔猪初生重总体平均数的置信区间。
xx StxStx 05.005.0
xx StxStx 01.001.0
下一张 主 页 退 出上一张经计算得,,
由,查 t 值 表得,,因此
95%置信半径为
95%置信下限为
95%置信上限为
2.1?x 08.0?
xS
91101 ndf
262.2)9(05.0?t 250.3)9(01.0?t
18.008.026 2.2)(05.0xdf St
02.118.02.1)(05.0 xdf Stx
38.118.02.1)(05.0 xdf Stx
下一张 主 页 退 出上一张所以该品种仔猪初生重总体平均数 μ 的
95%置信区间为又因为
99%置信半径为
99%置信下限为
99%置信上限为
)(38.1)(02.1 kgkg
26.008.025.3)(01.0xdf St
94.026.02.1)(01.0 xdf Stx
46.126.02.1)(01.0 xdf Stx
下一张 主 页 退 出上一张所以该品种仔猪初生重总体平均数 μ 的
99%置信区间为二、二项总体百分数 ρ 的置信区间样本百分数 只是总体百分数 ρ 的点估计值。百分数的置信区间则是在一定置信度下对总体百分数作出区间估计。求总体数的置信区间有两种方法:正态近似法和查表法,这里仅介绍正态近似法。
)(46.1)(94.0 kgkg
P?
下一张 主 页 退 出上一张当,时,总 体 ρ 的
95%,99%置信区间为:
( 5-16)
( 5-17)
其中,为样本百分数,为样本百分数标准误,的计算公式为:
( 5-18)
1000?n %1?
PP SPSP 96.1
96.1
PP SPSP 58.2
58.2
P?
PS?
PS?
n
PPS
P
)?1(?
下一张 主 页 退 出上一张
P?
【 例 5.10】 调查某地 1500头奶牛,患结核病的有 150头,求该地区奶牛结核病患病率的 95%,99%置信区间。
由于 >1000,>1%,采用正态分布近似法求置信区间。
因为
P?
n
PPS
P
)?1(?
0 0 7 7.0
1 5 0 0
)1.01(1.0
下一张 主 页 退 出上一张所以该地区奶牛结核病患病率 ρ 的 95%、
99%置信区间为:
即
0077.096.11.00077.096.11.0
0 0 7 7.058.21.00 0 7 7.058.21.0
%15.11%49.8
%99.11%01.8
下一张 主 页 退 出上一张