第六章 方差分析
t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较 多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用 t检验法就不适宜了。这是因为:
下一张 主 页 退 出上一张
1、检验过程烦琐例如,一试验包含 5个处理,采用 t检验法要进行 =10次两两平均数的差异显著性检验;若有 k个处理,则要作 k(k-1)/2次类似的检验。
2
5C
下一张 主 页 退 出上一张
2、无统一的试验误差,误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用 t 检验法作两两比较,由于每次比较需计算一个,
故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。
21 xxS?
下一张 主 页 退 出上一张例如,试验有 5个处理,每个处理 重复 6
次,共有 30个观测值。进行 t检验时,每次只能利用两个处理共 12个观测值估计试验误差,误差自由度为 2(6-1)=10 ;若利用整个试验的
30个观测值估计试验误差,显然估计的精确性高,且误差自由度为 5(6-1)=25。可见,在用
t检法进行检验时,由 于估计误差的精确性低,
误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。
下一张 主 页 退 出上一张
3、推断的可靠性低,检验的 I 型错误率大即使利用资料所提供的全部信息估计了试验误差,若用 t 检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因 而 会增大犯 I型错误的概率,降低推断的可靠性。
由于上述原因,多个平均数的差异显著性检验不宜用 t 检验,须采用方差分析法。
方差分析 (analysis of variance) 是由英国统计学家 R.A.Fisher于 1923年提出的。
这种方法是将 k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。
,方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术,,方差分析实质上是关于观测值变异原因的数量分析。
下一张 主 页 退 出上一张几个常用术语,
1,试验指标 (experimental index)
为 衡 量 试 验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽,水产试验中常用的试验指标有,日增重,产仔数,产奶量,产蛋率、瘦肉率、某些生理生化和体型指标 (如血糖含量、体高、体重 )等。
下一张 主 页 退 出上一张
2,试验因素 (experimental factor)
试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。
当试验中考察的因素只有一个时,称为 单因素试验 ;
若同时研究两个或两个以上的因素对试验指标的影响时,则称为 两因素或多因素试验 。试验因素常用大写字母 A,B,C,… 等表示。
下一张 主 页 退 出上一张
3,因素水平 (level of factor)
试验因素所处的某种特定状态或数量等级称为 因素水平,简称 水平 。
如比较 3个品种奶牛产奶量的高低,这 3个品种就是奶牛品种这个试验因素的 3个水平;
研究某种饲料中 4种不同能量水平对肥育猪瘦肉率的影响,这 4种特定的能量水平就是饲料能量这一试验因素的 4个水平。
下一张 主 页 退 出上一张因素水平用代表该因素的字母加添足标 1,
2,…,来表示。如 A1,A2,…,B1,
B2,…,等。
4,试验处理 (treatment)
事先设计好的实施在试验单位上的具体项目叫 试验处理,简称 处理 。
在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位 (某种畜禽 )上的具体项目就是喂饲某一种饲料。所以 进行单因素试验时,试验因素的一个水平就是一个处理 。
下一张 主 页 退 出上一张在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行 3种饲料和 3个品种对猪日增重影响的两因素试验,整个试验共有 3× 3=9个水平组合,实施在试验单位 (试验猪 )上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理 。
下一张 主 页 退 出上一张
5,试验单位 (experimental unit)
在试验中能接受不同试验处理的独立的试验载体叫试验单位。
在畜禽、水产试验中,一只家禽,一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。
试验单位往往也是观测数据的单位。
下一张 主 页 退 出上一张
6,重复 (repetition)
在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。
例如,用某种饲料喂 4头猪,就说这个处理 (饲料 )有 4次重复。
下一张 主 页 退 出上一张第一节 方差分析的基本原理与步骤本节结合单因素试验结果的方差分析介绍其原理与步骤。
一、线性模型与基本假定假设某单因素试验有 k个处理,每个处理有 n次重复,共有 nk个观测值。这类试验资料的数据模式如表 6-1所示。
下一张 主 页 退 出上一张表 6-1 k个处理每个处理有 n个观测值的数据模式下一张 主 页 退 出上一张表中 表示第 i个处理的第 j个观测值
( i=1,2,…,k; j=1,2,…,n);
表示第 i个处理 n个观测值的和;
表示全部观测值的总和;
表示第 i个处理的平均数;
表示全部观测值的总平均数;
可以分解为
ijx
n
j
iji xx
1
.
k
i
i
k
i
n
j
ij xxx
11 1
...
nxnxx i
n
j
iji /./.
1
knxknxx
k
i
n
j
ij /../..
1 1
ijx
下一张 主 页 退 出上一张
(6-1)
表示第 i个处理观测值总体的平均数。
为了看出各处理的影响大小,将 再进行分解,令
(6-2)
(6-3)
则
(6-4)
其中 μ表示全试验观测值总体的平均数;
ijiijx
k
i
ik
1
1
ii
ijiijx
下一张 主 页 退 出上一张
i?
i?
ai 是 第 i 个 处理的效应 ( treatment
effects)表示处理 i对试验结果产生的影响。
显然有
(6-5)
εij是试验误差,相互独立,且服从 正态分布 N( 0,σ2)。
( 6-4)式叫做 单因素试验 的 线 性 模 型
( linear model)亦称数学模型。
在这个模型中 Xii表示为总平均数 μ、处理效应 αi、试验误差 εij之和。
0
1
k
i
i?
下一张 主 页 退 出上一张由 εij 相 互独立且服从正态分布 N( 0,
σ2),可知各处理 Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布 N(μi,σ2)。
尽管各总体的均数 可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:
效 应 的 可 加 性 ( additivity)、
分布的正态性 ( normality),方差的同质性
( homogeneity)。这也是进行其它类型方差分析的前提或基本假定。
下一张 主 页 退 出上一张
i?
若 将 表 ( 6-1) 中 的 观 测 值 xij
( i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则
(6-6)
与( 6-4)式比较可知,
分 别是 μ、( μi-μ) =,
( xij- ) = 的估计值。
ijiiijiij etxxxxxxx,......,)()(
、,ii txxx )(..,..
ijiij exx )(,i?
ij?
下一张 主 页 退 出上一张
i?
( 6-4)、( 6-6)两式告诉我们:
每 个 观 测 值 都包含处理效应( μi-μ
或 ),与误差( 或 ),故
kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。
..,xxi? iijx,iij xx?
二、平方和与自由度的剖分在方差分析中是用样本方差即均方( mean
squares)来度量资料的变异程度的。
表 6-1中全部观测值的总变异可以用总均方来度量。
将总变异分解为处理间变异和处理内变异,
就是要将 总 均方 分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子 ── 称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母 ── 称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。
下一张 主 页 退 出上一张
(一)总平方和的剖分在表 6-1中,反映 全部观测值总变异的总平方和是各观测值 xij与总平均数的离均差平方和,记为 SST。即
k
i
n
j
ijT xxSS
1 1
2
.,)(
下一张 主 页 退 出上一张
k
i
n
j
iij
n
j
iij
k
i
k
i
ii
k
i
n
j
iijiijii
k
i
n
j
k
i
n
j
iijiij
xxxxxxxxn
xxxxxxxx
xxxxxx
1 1
2
11 1
2
1 1
22
1 1 1 1
22
.)(].)(..).[(2..).(
.)(.).,) (.(2..).(
.)(..).(..)(
因为其中所以 ( 6-7)
( 6-7)式中,为各处理平均数与总平均数的离均差平方和与重复数 n的乘积,反映了重复 n 次的处理间变异,称为处理间平方和,记为 SSt,即
n
j
iij xx
1
,0)(
k
i
n
j
k
i
k
i
n
j
iijiij xxxxnxx
1 1 1 1 1
2.2...2.,)()()(
k
i
i xxn
1
2..).(
k
i
it xxnSS
1
2..).(
下一张 主 页 退 出上一张
(6-7)式中,为 各处 理内离均差平方和之和,反映了各处理内的变异即误差,
称为处理内平方和或误差平方和,记为 SSe,即于是有
SST =SSt+SSe ( 6-8)
这个关系式中三种平方和的简便计算公式如下:
k
i
n
j
iij xx
1 1
2
,)(
k
i
n
j
iije xxSS
1 1
2
,)(
下一张 主 页 退 出上一张
(6-9)
其中,C= /kn称为矫正数。
(二)总自由度的剖分在计算总平方和时,资料中的各个观测值要受 这一条件的约束,故总自由度等于资料中观测值的总个数减 1,即 kn-1。总自由度记为 dfT,即 dfT=kn-1。
Cx
n
SS
CxSS
i
k
i
t
ij
n
j
k
i
T
2
.
1
2
11
1
tTe SSSSSS
k
i
n
j
ij xx
1 1
0..)(
下一张 主 页 退 出上一张
2x
在计算处理间平方和时,各处理均数 要受 这一条件的约束,故处理间自由度为处理数减 1,即 k-1。处理间自由度记为 dft,
即 dft=k-1。
在计算处理内平方和时,要受 k个条件的约束,即 ( i=1,2,…,k。故处理内自由度为资料中观测值的总个数减 k,即 kn-k 。处理内自由度记为 dfe,即 dfe=kn-k=k(n-1)。
.ix
k
i
i xx
1
..,0)(
n
j
iij xx
1
,0)(
下一张 主 页 退 出上一张因为所以
(6-10)
综合以上各式得:
(6-11)
)1()1()()1(1 nkkknkknk
etT dfdfdf
tTe
t
T
dfdfdf
kdf
kndf
1
1
下一张 主 页 退 出上一张各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 MST
(或 ),MSt(或 )和 MSe(或 )。
即
( 6-12)
总均方一般不等于处理间均方加处理内均方。
2TS 2
tS
2
eS
TTTT dfSSSMS /2
tttt dfSSSMS /2
eeee dfSSSMS /2
下一张 主 页 退 出上一张
【 例 6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼 20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
下一张 主 页 退 出上一张表 6-2 饲喂不同饲料的鱼的增重
(单位,10g)
下一张 主 页 退 出上一张这是一个单因素试验,处理数 k=4,重复数 n=5。各项平方和及自由度计算如下:
矫正数总平方和
03.1 5 1 6 9)54/(8.5 5 0/ 22., nkxC
C
CxSS ijT
222
2
5.289.279.31?
67.1 9 903.1 5 1 6 97.1 5 3 6 8
下一张 主 页 退 出上一张
27.11403.151693.15283
)8.1397.1234.1319.155(
5
1
.
1
2222
2
C
Cx
n
SS
i
t
处理间平方和处理内平方和
40.8527.11467.199
tTe SSSSSS
总自由度处理间自由度处理内自由度用 SSt,SSe分别除以 dft和 dfe便得到处理间均方 MSt及处理内均方 MSe。
因为方差分析中不涉及总均方的数值,所以不必计算之。
191451 nkdf T
3141 kdf t
16319 tTe dfdfdf
34.516/40.85/
09.383/27.1 1 4/
eee
ttt
dfSSMS
dfSSMS
下一张 主 页 退 出上一张三、期望均方如前所述,方差分析的一个基本假定是要求各 处 理 观 测 值 总 体 的 方 差 相 等,即
( i=1,2,…,k)表示第 i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差
S21,S22,…,S2k 都 是 σ2 的 无 偏 估 计
( unbiased estimate)量。
S2i(i=1,2,…,k) 是由试验资料中第 i个处理的 n个观测值算得的方差。
2222221,ik
下一张 主 页 退 出上一张显然,各 S2i的合并方差 (以各处理内的自由度 n-1为权的加权平均数)也是 σ2的无偏估计量,且估计的精确度更高。很容易推证处理内均方 MSe就是各 的合并。
2eS
2iS
22
21
22
22
2
11
21
21
2
.
)1()1(
)(
估计
e
k
kk
k
ki
iij
e
e
e
S
dfdfdf
SdfSdfSdf
dfdfdf
SSSSSS
nk
SS
nk
xx
df
SS
MS
下一张 主 页 退 出上一张其中 SSi,dfi( i=1,2,…,k)分别表示由试验资料中第 i个 处理的 n个观测值算得的平方和与自由度。这就是说,处理内均方 MSe
是误差方差 σ2的无偏估计量。
试验中各处理所属总体的本质差异体现在处理效应 的差异上。我们把称为 效应方差,它也反映了各处理观测值总体平均数 的变异程度,记为 。
i?
)1/()()1/( 22 kka ii
i? 2
下一张 主 页 退 出上一张
(6-13)
因为各 μi未知,所以无法求得 的 确切值,只能通过试验结果中各处理均数的差异去估计。然而,
并非 的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容,一是各处理本质上的差异即 αi(或 μi)间的差异,二 是本身的抽样误差。统计学上已经证明,
是 +σ2/n的无偏估计量。因而,我们前面所计算的处理间均方 MSt实际上是 n +σ2的无偏估计量。
1
2
2
k
i
a
2
)1/()( 2.., kxx i 2
)1/()( 2.., kxx i
2
2
下一张 主 页 退 出上一张因为 MSe是 σ2的无偏估计量,MSt是 n
+σ2的无偏估计量,所以 σ2为 MSe的数学期望
( mathematical expectation),n +σ2
为 MSt的数学期望。又因为它们是均方的期望值
( expected value),故 又 称 期 望 均方,简 记 为 EMS ( expected mean
squares)。
当处理效应的方差 =0,亦即各处理观测值总体平均数 ( i=1,2,…,k)相等时,处理间均方 MSt与处理内均方一样,也是误差方差
σ2的估计值,方差分析就是通过 MSt 与 MSe的比较来推断 是否为零即 是否相等的。
2
2
2
i?
2
i
下一张 主 页 退 出上一张四,F分布与 F检验
(一) F分布设想我们作这样的抽样试验,即在一正态总体 N( μ,σ2)中随机抽取样本含量为 n的样本
k个,将 各 样本观测值整理成 表 6-1 的形式。
此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,由( 6-12)式算出的和 都是误差方差 的估计量。以 为分母,为分子,求其比值。统计学上把两个均方之比值称为 F值。即
2tS 2eS 2? 2eS
2tS
下一张 主 页 退 出上一张
( 6-14)
F具有两个自由度:
若在给定的 k和 n的条件下,继续从该总体进行一系列抽样,则可获得一系列的 F值。这些 F值 所 具 有 的 概 率 分 布 称 为 F 分 布
( F distribution)。 F 分 布密度曲线是随自由度 df1,df2的变化而变化的一簇偏态曲线,
其形态随着 df1,df2的增大逐渐趋于对称,如图 6-1所示。
22 /
et SSF?
。)1(,1 21 nkdfdfkdfdf et
下一张 主 页 退 出上一张
F分布的取值范围是( 0,+∞),其平均值 =1。
用 表示 F分布的概率密度函数,则其分布函数 为:
(6-15)
因而 F分布右尾从 到 +∞的概率为:
(6-16)
F?
)(Ff
)(?FF
F dFFfFFPFF )()()(
F
F dFFfFFFFP )()(1)(
下一张 主 页 退 出上一张附 表 4 列 出 的 是 不 同 df1 和 df2 下,
P( F≥ ) =0.05和 P( F≥ ) =0.01时的 F
值,即右尾概率 α=0.05和 α=0.01时的临界 F值,
一般记作,。
F?F
),(05.0 21 dfdfF ),(01.0 21 dfdfF
下一张 主 页 退 出上一张
(二 )F检验附表 4是专门为检验 代表的总体方差是否比 代表的总体方差大而设计的。
若实际计算的 F值大于,则 F 值在 α=0.05的水平上显著,我们以 95% 的 可靠性 (即冒 5%的风险 )推断 代 表 的总体方差大于 代表的总体方差。这种用 F值出现概率的大小推断两个总体方差是否相等的方法称为 F检验
(F-test)。
2tS
2eS
),(05.0 21 dfdfF
2tS
2eS
下一张 主 页 退 出上一张在方差分析中所进行的 F 检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算 F 值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。
下一张 主 页 退 出上一张在单因素试验结果的方差分析中,无效假设为 H0,μ1=μ2=… =μk,备择假设为 HA:各
μi不全相等,或 H0,=0,HA,≠0;
F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内 (误差 )均方。
如果结论是肯定的,我们将否定 H0;反之,
不否定 H0。
2 2
下一张 主 页 退 出上一张反过来理解:如果 H0是正确的,那么 MSt
与 MSe都是总体误差 σ2的估计值,理论上讲 F值等于 1;如果 H0是不正确的,那么 MSt之期望均方中的就不等于零,理论上讲 F 值就必大于 1。
但是由于抽样的原因,即使 H0正确,F值也会出现大于 1的情况。所以,只有 F值大于 1达到一定程度时,才有理由否定 H0。
下一张 主 页 退 出上一张实际进行 F检验时,是将由试验资料所算得的 F值与根据 df1=dft (大均方,即分子均方的自由度 ),df2=dfe(小均方,即分母均方的自由度 )查附表 4所得的临界 F值,
相比较作出统计推断的。
若 F<,即 P> 0.05,不 能 否定
H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在 F值的右上方标记,ns”,
或 不标记符号;
),(05.0 21 dfdfF ),(01.0 21 dfdfF
),(05.0 21 dfdfF
若 ≤ F <,即
0.01< P≤0.05,否定 H0,接受 HA,统计学上,把这一检验结果表述为:各处理间差异显著,
在 F值的右上方标记,*” ;
若 F≥,即 P≤0.01,否定 H0,
接受 HA,统计学上,把这一检验结果表述为:
各处理间差异极显著,在 F 值 的 右上方标记
,**” 。
),(05.0 21 dfdfF ),(01.0 21 dfdf
F
),(01.0 21 dfdfF
下一张 主 页 退 出上一张对于 【 例 6.1】,
因为
F=MSt/MSe=38.09/5.34=7.13**;
根据 df1 = dft = 3,df2 = dfe = 16 查附表 4,
得 F0.01(3,16);
因为 F> F0.01(3,16) =5.29,P< 0.01
表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。
下一张 主 页 退 出上一张表 6-3 表 6-2资料方差分析表下一张 主 页 退 出上一张在方差分析中,通常将变异来源、平方和、
自由度、均方和 F值归纳成一张方差分析表,见表 6-3。
在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及 F检验可在方差分析表上进行。
下一张 主 页 退 出上一张五、多重比较
F值显著或极显著,否定了无效假设 HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
下一张 主 页 退 出上一张因而,有必要进行两两处理平均数间的比较,
以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较 (multiple comparisons)。
多重比较的方法甚多,常用的有 最小显著差数法 (LSD法 )和 最小显著极差法 (LSR法 ),现分别介绍如下。
(一)最小显著差数法 (LSD法,least
significant difference)
此法的基本作法是,在 F检验显著的 前提下,先 计 算 出 显 著 水 平为 α的最小显著差数,然后将任意两个处理平均数的差数的绝对值 与其比较。
LSD
.,ji xx?
下一张 主 页 退 出上一张若 > LSDα时,则 与 在 α水平上差异显著;反之,则在 α水平上差异不显著。最小显著差数由 (6-17)式计算。
(6-17)
式中,为在 F检验中误差自由度下,显著水平为 α的临界 t值,为 均 数差异标准误,由 (6-18)式算得。
(6-18)
.,ji xx?,ix,jx
..)( jie xxdfaa StL S D
)( edft?
.,ji xxS?
nMSS exx ji /2.,
下一张 主 页 退 出上一张其中 为 F检验中的误差均方,n为各处理的重复数。
当显著水平 α=0.05和 0.01时,从 t值表中查出 和,代入 (6-17)式得:
(6-19)
利用 LSD法进行多重比较时,可按如下步骤进行:
(1) 列出平均数的多重比较表 比较表中各处理按其平均数从大到小自上而下排列;
eMS
)(05.0 edft )(01.0 edft
..
..
)(01.001.0
)(05.005.0
jie
jie
xxdf
xxdf
StL S D
StL S D
(2)计算最小显著差数 和 ;
(3)将平均数多重比较表中两两平均数的差数与,比较,作出统计推断。
对于 【 例 6.1】,各 处 理 的多重比较如表 6-4所示。
05.0LSD 01.0LSD
05.0LSD 01.0LSD
下一张 主 页 退 出上一张表 6-4 四种饲料平均增重的多重比较表
(LSD法 )
注:表中 A4与 A3的差数 3.22用 q检验法与新复极差法时,在 α=0.05的水平上不显著。
因为查 t值表得:
t0.05(dfe) =t0.05(16) =2.120
t0.01(dfe) =t0.01(16) =2.921
所以,显著水平为 0.05与 0.01的最小显著差数为
462.15/34.52/2., nMSS exx ji
271.4462.1921.2
099.3462.1120.2
..
..
)(01.001.0
)(05.005.0
jie
jie
xxdf
xxdf
StL S D
StL S D
下一张 主 页 退 出上一张将表 6-4中的 6个差数与,
比较,05.0LSD
01.0LSD
小于 者不显著,在差数的右上方标记,ns”,或不标记符号;
介于 与 之间者显著,在差数的右上方标记,*” ;
大于 者极显著,在差数的右上方标记,**” 。
05.0LSD
05.0LSD 01.0LSD
01.0LSD
检验结果除差数 1.68,1.54不显著,3.22 显著外,其余两个差数
6.44,4.90极显著。表明 A1饲料对鱼的增重效果极显著高于 A2 和 A3,
显著高于 A4; A4饲料对鱼的增重效果极显著高于 A3饲料; A4 与 A2,A2 与
A3的增重效果差异不显著,以 A1饲料对鱼的增重效果最佳。
关于 LSD 法的应用有以下几点说明:
1,LSD 法实质上就是 t检验法。它是将 t 检验中由所求得的 t之绝对值 与临界 ta值的比较转为将各对均数差值的绝对值 与最小显著差数 的 比较而作出统计推断的 。 但是,由于 LSD法是利用 F检验中的误差自由度 df e 查临界 tα值,利用误差均 方 计 算 均 数 差 异标 准误,因而法又不同于每次利用两组数据进行多个 平 均 数 两 两 比较的检验法 。 它 解 决了本章开头指出的 检 验 法 检验过 程 烦 琐,无统一 的
)/)((,..,ji xxji Sxxt
.,ji xx?
.,ji xxa St?
eMS
.,ji xxS?
下一张 主 页 退 出上一张试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但 法并未解决推断的可靠性降低、犯
I型错误的概率变大的问题。
2、有人提出,与检验任何两个均数间的差异相比较,LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特 (Dunnett)法 (关于此法,
读者可参阅其它有关统计书籍 )。
LSD
3、因为 LSD法实质上是 t检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有 4个处理,设 计 时 已 确 定 只是处理 1
与处理 2、处理 3与处理 4(或 1与 3,2与 4;或
1与 4,2与 3)比较,而 其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯 I型错误的概率。
下一张 主 页 退 出上一张综上所述,对于多个处理平均数所有可能的两两比较,LSD法的优点在于方法比较简便,
克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯 I型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。
下一张 主 页 退 出上一张
(二 )最小显著极差法 (LSR法,Least
significant ranges)
LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数
(称为 秩次距 )k的不同而采用不同的检验尺度,
以克服 LSD法的不足。这些在显著水平 α上依秩次距 k的不同而采用的不同的检验尺度叫做 最小显著极差 LSR。
例如有 10 个要相互比较,先将 10个依其数值大小顺次排列,两 极 端平均数的差数
(极差 )的显著性,由 其 差 数 是 否 大于秩次距 k=10时的最小显著极差决定 (≥为显著,<
为不显著);而后是秩次距 k=9 的平均数的极差的显著性,则由极差是否大于 k=9 时 的最小显著极差决定; …… 直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距 k=2
时的最小显著极差决定为止。因此,有 k个平均数相互比较,就有 k-1 种秩次距 (k,k-1,
k-2,…,2),因而需求得 k-1个最小显著极差
(LSRα,k),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。
x x
下一张 主 页 退 出上一张因为 LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。
LSR法克服了 LSD法的不足,但检验的工作量有所增加。常用的 LSR法有 q检验法和新复极差法两种。
1,q检验法 (q test)
此法是以统计量 q的概率分布为基础的。 q
值由下式求得:
(6-20)xSq /
式中,ω为极差,为标准误,分布依赖于误差自由度 dfe及秩次距 k。
利用 q检验法进行多重比较时,为了简便起见,不是将由 (6-20)式算出的 q值 与 临界
q值 比较,而是将极差与比较,从而作出统计推断。 即为 α水平上的最小显著极差。
nMSS ex /?
),( kdfa eq xkdfa Sq e ),(
xkdfa Sq e ),(
下一张 主 页 退 出上一张
(6-21)
当显著水平 α=0.05和 0.01时,从 附 表
5(q值表 )中根据自由度 及 秩 次 距 k 查出和 代入 (6-21)式得
(6-22)
实际利用 q检验法进行多重比较时,可按如下步骤进行:
xkdfaka SqL S R e ),(,?
edf
),(05.0 kdf eq
),(01.0 kdf eq
xkdfk
xkdfk
SqL S R
SqL S R
e
e
),(01.0,01.0
),(05.0,05.0
(1)列出平均数多重比较表 ;
(2)由自由度 dfe、秩次距 k查临界 q值,计算最小显著极差 LSR0.05,k,LSR0.01,k;
(3)将平均数多重比较表中的各极差与相应的最小显著极差 LSR0.05,k,LSR0.01,k比较,作出统计推断。
对于 【 例 6.1】,各处理平均数多重比较表同表 6-4。 在表 6-4中,极差 1.54,1.68、
3.22的秩次距为 2;极差 3.22,4.90的秩次距为 3;极差 6.44的秩次距为 4。
下一张 主 页 退 出上一张因为,MSe=5.34,故标准误 为根据 dfe=16,k=2,3,4 由 附表 5查出
α=0.05,0.01水平下临界 q值,乘以标准误求 得各最小显著极差,所得结果列于表 6-5。
xS
0 3 3.15/34.5/ nMSS ex
xS
表 6-5 q值及 LSR值下一张 主 页 退 出上一张将表 6-4中的极差 1.54,1.68,3.22 与表 6-5
中的最小显著极差 3.099,4.266比较 ;
将极差 3.22,4.90与 3.770,4.948比较;
将极差 6.44与 4.184,5.361比较。
检验结果,除 A4与 A3的差数 3.22由 LSD法比较时的差异显著变为差异不显著外,其余检验结果同法。
2、新复极差法 (new multiple range
method)
此法是由邓肯 (Duncan) 于 1955年提出,
故又称 Duncan法,此法还称 SSR法
(shortest significant ranges)。
新复极差法与 q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查 SSR表 (附表 6)而不是查 q值表。最小显著极差计算公式为
(6-23)
xkdfaka SS S RL S R e ),(,?
下一张 主 页 退 出上一张其中是根据显著水平 α、误差自由度 dfe、秩次距 k,由 SSR表查得的临界 SSR,。
α=0.05 和 α=0.01 水平下 的 最小显著极差为:
(6-24)
对于 【 例 6.1】,各处理均数多重比较表同表 6-4。
已算出 =1.033,依 dfe=16 k=2,3,4,
由附表 6查临界 SSR0.05(16,k)和 SSR0.01(16,k)值,
乘以 =1.033,求得各最小显著极差,所得结果列于表 6-6。
nMSS ex /?
xkdfk
xkdfk
SSSRL S R
SSSRL S R
e
e
),(01.0,01.0
),(05.0,05.0
xS
xS
表 6-6 SSR值与 LSR值下一张 主 页 退 出上一张将表 6-4中的平均数差数 (极差 )与表 6-6中的最小显著极差比较,检验结果与 q检验法 相同。
当各处理重复数不等时,为简便起见,不论
LSD法还是 LSR法,可用 (6-25)式计算出一个各处理平均的重复数 n0,以代替计算 或所需的 n。
(6-25)
式中 k为试验的处理数,(i=1,2,…,k)
为第 i处理的重复数。
.,ji xxS? x
S
i
i
i n
nn
kn
2
0 1
1
in
以上介绍的三种多重比较方法,其检验尺度有如下关系:
LSD 法 ≤新复极差法 ≤q检验法当秩次距 k=2时,取等号; 秩次距 k ≥3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。用 上述排列顺序前面方 法 检 验 显 著 的 差 数,用 后 面 方 法 检 验未 必 显著;用后面 方 法 检 验 显 著 的 差 数,用前 面 方 法 检 验必 然 显 著 。 一 般 地 讲,一 个下一张 主 页 退 出上一张试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的 H0 和接受一个不正确的
H0的相对重要性来决定。如果否定正确的 H0是事关重大或后果严重的,或对试验要求严格时,
用检验法较为妥当 ;如果接受一个不正确的 H0
是事关重大或后果严重的,则宜用新复极差法。
生物试验中,由于试验误差较大,常采用新复极差法; F检验显著后,为了简便,也 可采用 LSD法。
(三 )多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。
1、三角形法 此法是将多重比较结果直接标记在平均数多重比较表上,如表 6-4所示。此法的优点是简便直观,缺点是占的篇幅较大。
2、标记字母法 此法是先将各处理平均数由大到小自上而下排列 ;
然后在最大平均数后标记字母,并 将 该 平均数与 以 下 各 平 均 数依次相比,凡 差 异 不显著标 记 同 一 字 母,直到某一个与其差异显著的平均数标记字母 b ;
下一张 主 页 退 出上一张再以标有字母 b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标 b,直至显著为止;
再以标记有字母 b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母
b,直至某一个与其差异显著的平均数标记 c; …… ;
如此重复下去,直至最小一个平均数被标记、比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。
用小写拉丁字母表示显著水平 α=0.05,用大写拉丁字母表示显著水平 α=0.01。
在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。
对于 【 例 6.1】,现根据表 6-4所表示的 用新复极差法进行多重比较结果用字母标记如表
6-7所示 (注意,用新复极差法进行多重比较,
表 6-4中 A4与 A3的差数 3.22在 α=0.05的水平上不显著,其余的与 LSD法同 )。
表 6-7 表 6-4多重比较结果的字母标记 (SSR法 )
下一张 主 页 退 出上一张在表 6-7中,先将各处理平均数由大到小自上而下排列。当显著水平 α=0.05时,先 在平均 数
31.18行上标记字母 a;由于 31.18与 27.96 之差为 3.22,在 α=0.05水平上显著,所以 在 平均数 27.96行上标记字母 b;然后以标记字母 b的平均数 27.96 与 其 下方的 平均数 26.28 比较,差数为 1.68,在 α=0.05水平上不显著,所以在平均数 26.28行上标记字母 b ;再将平均数 27.96与平均数 24.74比较,差数为 3.22,在 α=0.05水平上不显著,所以在平均数 24.74行上标记字母 b。类似地,可以在 α= 0.01 将 各 处理平均数标记上字母,结果见表 6-7。 q检验结果与 SSR法检验结果相同。 下一张 主 页 退 出上一张由表 6-7看到,A1饲料对鱼的平均增重极显著地高于 A2和 A3饲料,显著高于 A4饲料; A4、
A2,A3 三 种 饲料对鱼的平均增重差异不显著。
四种饲料其中以 A1饲料对鱼的增重效果最好。
应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。
下一张 主 页 退 出上一张七、方差分析的基本步骤方差分析的基本步骤归纳如下:
(一)计算各项平方和与自由度;
(二)列出方差分析表,进行 F检验;
(三)若 F检验显著,则进行多重比较。
多重比较的方法有最小显著差数法 (LSD法 )
和最小显著极差法 (LSR法,包括 q检验法和新复极差法 ) 。表示多重比较结果的方法有三角形法和标记字母法。
下一张 主 页 退 出上一张第二节 单因素试验资料的方差分析根据各处理内重复数是否相等,单因素试验资料的方差分析又分为重复数相等和重复数不等两种情况。本节各举一例予以说明。
下一张 主 页 退 出上一张一、各处理重复数相等的方差分析
【 例 6.3】 抽测 5个不同品种的若干头母猪的窝产仔数,结果见表 6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。
表 6-12 五个不同品种母猪的窝产仔数下一张 主 页 退 出上一张这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度
00.2 8 0 9)55/(2 6 5/ 22., knxC
20.7300.280920.2882
00.2809)6548604151(
5
11
00.13600.280900.2945
00.2809)1314138(
222222
.
22222
Cx
n
SS
CxSS
it
ijT
下一张 主 页 退 出上一张
80.6220.7300.1 3 6
tTe SSSSSS
20424
,4151
,241551
tTe
t
T
dfdfdf
kdf
kndf
2、列出方差分析表,进行 F检验表 6-13 不同品种母猪的窝产仔数的方差分析表下一张 主 页 退 出上一张根据 df1=dft=4,df2=dfe=20查临界 F值得,F0.05(4,20) =2.87,F0.05(4,20)
=4.43
因为 F> F0.01(4,20),即 P< 0.01,表明品种间产仔数的差异达到 1%显著水平。
3、多重比较 采用新复极差法,各处理平均数多重比较表见表 6-14。 下一张 主 页 退 出上一张表 6-14 不同品种母猪的平均窝产仔数多重比较表 (SSR法 )
下一张 主 页 退 出上一张因为 MSe=3.14,n=5,所以 为:
根据 dfe=20,秩次距 k=2,3,4,5由附表 6查出 α=0.05和 α=0.01的各临界 SSR值,
乘以 =0.7925,即得各最小显著极差,所得结果列于表 6-15。
xS
7 9 3.05/14.3/ nMSS tx
xS
下一张 主 页 退 出上一张表 6-15 SSR值及 LSR值下一张 主 页 退 出上一张将表 6-14中的差数与表 6-15中相应的最小显著极差比较并标记检验结果。
检验结果表明,5号品种母猪的平均窝产仔数极显著高于 2号品种母猪,显著高于 4号和 1
号品种,但与 3号品种差异不显著 ; 3号品种母猪的平均窝产仔数极显著高于 2号品种,与 1号和 4号品种差异不显著; 1号,4号,2号品种母猪的平均窝产仔数间差异均不显著。五个品种中以 5号品种母猪的窝产仔数最高,3号品种次之,
2号品种母猪的窝产仔数最低。
下一张 主 页 退 出上一张二、各处理重复数不等的方差分析设处理数为 k;各处理重复数为 n1,n2,…,
nk;试验观测值总数为 N=Σni。则
(6-28)
tTetT
tTeiitijT
dfdfdfkdfNdf
SSSSSSCnxSSCxSS
NxC
,1,1
,/,
/
2
.
2
2
..
下一张 主 页 退 出上一张
【 例 6.4】 5个不同品种猪的育肥试验,后期 30天增重 (kg)如表 6-16所示。试比较品种间增重有无差异。
表 6-16 5个品种猪 30天增重下一张 主 页 退 出上一张此例处理数 k=5,各处理重复数不等。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度
41.848225/5.460/ 22., NxC
下一张 主 页 退 出上一张
20424
4151
241251
84.3850.4634.85
50.4641.848291.8528
41.8482
)4/5.664/8.785/5.916/0.1036/0.121(
/
34.8541.848275.8567
41.8482)0.160.175.195.21(
22222
2
.
22222
tT
e
t
T
tT
e
ii
t
ij
T
dfdfdf
kdf
Ndf
SSSSSS
CnxSS
CxSS?
下一张 主 页 退 出上一张
2、列出方差分析表,进行 F检验临界 F值为,F0.05(4,20) =2.87,F0.01(4,20)
=4.43,因为品种间的 F值 5.99> F0.01(4,20),
P< 0.01,表明品种间差异极显著。
下一张 主 页 退 出上一张表 6-17 5个品种育肥猪增重方差分析表下一张 主 页 退 出上一张
3、多重比较 采用新复极差法,各处理平均数多重比较表见表 6-18。
因为各处理重复数不等,应先由 (6-25)式计算出平均重复次数 n0来代替标准误中的 n,此例于是,标准误 为:
nMSS ex /?
96.4
25
4456625
15
1
1
1 222222
0
i
i
i n
n
n
k
n
xS
625.096.4/94.1/ 0 nMSS ex
下一张 主 页 退 出上一张表 6-18 5个品种育肥猪平均增重多重比较表 (SSR法 )
下一张 主 页 退 出上一张根据 dfe=20,秩次距 k=2,3,4,5,从附表 6中查出 α=0.05与 α=0.01的临界 SSR值,
乘以 =0.625,即得各最小显极差,所得结果列于表 6-19。
xS
下一张 主 页 退 出上一张表 6-19 SSR值及 LSR值表下一张 主 页 退 出上一张将表 6-18中的各个差数与表 6-19中相应的最小显著极差比较,作出推断。检验结果已标记在表 6-18中。
多重比较结果表明 B1,B4品种的平均增重极显著或显著高于 B2,B5品种的平均增重,其余不同品种之间差异不显著。可以认为 B1,B4
品种增重最快,B2,B5品种增重较差,B3品种居中。
第三节 两因素试验资料的方差分析两因素试验资料的方差分析是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。两因素试验按水平组合的方式不同,
分为 交叉分组 和 系统分组 两类,因而对试验资料的方差分析方法也分为交叉分组方差分析和系统分组方差分析两种,现分别介绍如下。
下一张 主 页 退 出上一张一、交叉分组资料的方差分析设试验考察 A,B两个因素,A因素分 a个水平,B因素分 b个水平 。 所谓交叉分组是指 A因素每个水平与 B因素的每个水平都要碰到,两者交叉搭配形成 ab个水平组合即处理,试验因素 A,B在试验中处于平等地位 。 试验单位分成 ab 个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。这种试验以各处理是单独观测值还是有重复观测值又分为两种类型。
(一 )两因素单独观测值试验资料的方差分析对于 A,B两个试验因素的全部 ab个水平组合,每个水平组合只有一个观测值,全试验共有 ab个观测值,其数据模式如表 6-
20所示。
下一张 主 页 退 出上一张表 6-20 两因素单独观测值试验数据模式表 6-20中
a
i
b
j
ij
a
i
ijj
n
i
ij
b
j
jiji
b
j
iji
xxx
a
x
xxx
b
x
xx
1 1
..
1
.
11
..
1
.
,
1
,,
1
,
abxx
a
i
b
j
ij /..
1 1
两因素单独观测值试验资料的数学模型为:
(6-29)
式中,
μ为总平均数;
),,2,1;,,2,1( bjai
x ijljiijl
下一张 主 页 退 出上一张
αi,βj分别为 Ai,Bj的效应,
αi=μi-μ,
βj=μj-μ,μi、
μj分别为 Ai,Bj观测值总体平均数,
且 Σαi=0,Σβj=0;
εijl为随机误差,相互独立,且服从 N(0,σ2)。
交叉分组两因素单独观测值的试验,A因素的每个水平有 b次重复,B因素的每个水平有 a次重复,每个观测值同时受到 A,B 两 因素及随机误差的作用。因此全部 ab 个观测值的总变异可以剖分为 A 因素水平间变异,B因素水平间变异及试验误差三部分;自由度也相应剖分。平方和与自由度的剖分式如下:
下一张 主 页 退 出上一张
(6-30)
各项平方和与自由度的计算公式为,
矫正数总平方和
A因素平方和
B因素平方和 (6-31)
eBAT
eBAT
dfdfdfdf
SSSSSSSS
abxC /2..?
CxxxSS
a
i
b
j
ij
a
i
b
j
ijT
1 1
22
1
..
1
)(
CxbxxbSS
a
i
i
a
i
iA
1
2
.
2
..
1
.
1)(
CxaxxaSS
b
j
j
b
j
jB
1
2
.
2
..
1
.
1)(
误差平方和 SSe=SST-SSA-SSB
总自由度 dfT=ab-1
A因素自由度 dfA=a-1
B因素自由度 dfB=b-1
误差自由度 dfe= dfT - dfA – dfB
=(a-1)(b-1)
下一张 主 页 退 出上一张相应均方为
eee
BBB
AAA
dfSSMS
dfSSMS
dfSSMS
/
,/
,/
【 例 6.5】 为 研究雌激素对子宫发育的 影响,现有 4窝不同品系未成年的大白鼠,每窝 3
只,随机分别注射不同剂量的雌激素,然后在相同条件下试验,并称得它们的子宫重量,见 表
6-21,试作方差分析。
下一张 主 页 退 出上一张表 6-21 各品系大白鼠注射不同剂量雌激素的子宫重量 (g)
这是一个两因素单独观测值试验资料。 A因素 (品系 )有 4个水平,即 a=4; B因素 (雌激素注射剂量 ) 有 3 个 水 平,即 b = 3,共 有
a× b=3× 4=12个观测值。方差分析如下:
1、计算各项平方和与自由度
0 0 0 0.1 0 0 4 6 7)34/(1 0 9 8/.,22 abxC
下一张 主 页 退 出上一张
0000.60740000.1004670000.106541
0000.100467)480358260(
4
11
6667.64570000.1004676667.106924
0000.100467)192314225367(
3
11
0000.130750000.100467113542
0000.100467)8763116106(
2222
.
22222
.
22222
Cx
a
SS
Cx
b
SS
CxSS
jB
iA
ijT
62311
,2131
3141
,111341
3333.543
60700006667.64570000.13075
BATe
B
A
T
BATe
dfdfdfdf
bdf
adf
abdf
SSSSSSSS
2、列出方差分析表,进行 F检验表 6-22 表 6-21资料的方差分析表下一张 主 页 退 出上一张根据 df1=dfA=3,df2=dfe=6 查 临界 F值,
F0.01(3,6)=9.78;根据 df1=dfB=2,df2=dfe=6查临界 F值,F0.01(2,6)=10.92。
因为 A 因素 的 F 值 23.77 > F0.01(3,6),P<
0.01,表明不同品系间差异极显著 ; B 因 素 的 F 值
33.54> F0.01(2,6),P< 0.01,表明不同雌激素剂量间差异极显著。也就是说不同品系和不同雌激素剂量对大白鼠子宫的发育均有极显著影响,有 必 要进一步对
A,B两因素不同水平的平均测定结果进行多重比较。
3、多重比较
( 1)不同品系的子宫平均重量比较表 6-23 各品系子宫平均重量多重比较( q法)
下一张 主 页 退 出上一张在两因素单独观测值试验情况下,因为 A因素 (本例为品系 )每一水平的重复数恰为 B因素的水平数 b,故 A因素的标准误,此例 b=3,MSe=90.5556,故根据 dfe=6,秩次距 k=2,3,4从附表 5中查出 α=0.05 和 α=0.01的临界 q值,与标准误相乘,计 算 出最小显著极差 LSR,结果见表 6-
24。
bMSS ex i /,?
49 41.53/55 56.90/, bMSS ex i
4941.5,?ixS
下一张 主 页 退 出上一张表 6-24 q值及 LSR值检验结果表明,A1,A 3品系与 A2,A 4品系的子宫平均重量均有极显著的差异;但 A1与 A
3及 A2与 A4品系间差异不显著。
(2)不同激素剂量的子宫平均重量比较下一张 主 页 退 出上一张表 6-25 不同雌激素剂量的子宫平均重量多重比较 (q法 )
下一张 主 页 退 出上一张在两因素单独观测值试验情况下,B因素 (本例为雌激素剂量 )每一水平的重复数恰为 A因素的水平数 a,
故 B 因 素 的 标准误,此 例 a=4,
MSe=90.5556。故根据 dfe=6,秩次距 k=2,3 查临界 q 值 并与相乘,求得最小显著极差 LSR,见表 6-26。
aMSS ex j /,?
7 5 8 0.44/5 5 5 6.90/, aMSS ex j
jxS,
表 6-26 q值与 LSR值检验结果表明,注射雌激素剂量为 0.8 mg
的大白鼠子宫重量极显著大于注射剂量为 0.4
mg和 0.2mg的子宫重量,而后两种注射剂量的子宫重量间也有显著差异。
下一张 主 页 退 出上一张在进行两因素或多因素的试验时,除了研究每一因素对试验指标的影响外,往往更希望研究因素之间的交互作用。例如,通过对畜禽所处环境的温度、湿度、光照、噪音以及空气中各种有害气体等对畜禽生长发育的影响有无交互作用的研究,对最终确定有利于畜禽生产的最佳环境控制是有重要意义的。对畜禽的不同品种 (品系 )及其与饲料条件、各种环境因素互作的研究,有利于 合理 利用品种资源充分发挥不同畜禽的生产下一张 主 页 退 出上一张潜能。又如在饲料科学中,常常要研究各种营养成分间有无交互作用,从而找到最佳的饲料配方,
这对于合理利用饲料原料提高饲养水平等都是非常有意义的。
前面介绍的两因素单独观测值试验只适用于两个因素间无交互作用的情况。若两因素间有交互作用,则每个水平组合中只设 一个试验单位
(观察单位 )的试验设计是不正确的或不完善的。
这是因为:
下一张 主 页 退 出上一张
(1)在这种情况下,(6-31)式中 SSe,dfe实际上是 A,B 两因素交互作用平方和与自由度,所算得的 MSe是交互作用均方,主要反映由交互作用引起的变异。
(2)这时若仍按 【 例 6.5】 所采用的方法进行方差分析,由于误差均方值大 ( 包含交互作用在内 ),有可能掩盖试验因素的显著性,从而增大犯 Ⅱ 型错误的概率。
(3)因为每个水平组合只有一个观测值,所以无法估计真正的试验误差,因而不可能对因素的交互作用进行研究。
因此,进行两因素或多因素试验时,一般应设置重复,以便正确估计试验误差,深入研究因素间的交互作用。
(二 )两因素有重复观测值试验的方差分析对两因素和多因素有重复观测值试验结果的分析,
能研究因素的简单效应、主效应和因素间的交互作用
(互作 )效应。现介绍这三种效应的意义如下:
下一张 主 页 退 出上一张
1,简单效应 (simple effect)
在某因素同一水平上,另一因素不同水平对试验指标的影响称为 简单效应 。如在表 6-27中,在 A1(不加赖氨酸 )上,B2- B 1=480-470=10;在 A2 (加赖氨酸 )上,B2- B1=512-472=40;在 B1 (不加蛋氨酸 )
上,A2-A1=472-470=2; 在 B2 (加蛋氨酸 )上,
A2-A1=512-480=32等就是简单效应。简单效应实际上是特殊水平组合间的差数。
下一张 主 页 退 出上一张表 6-27 日粮中加与不加赖、蛋氨酸雏鸡的增重 (g)
2,主效应 (main effect) 由于因素水平的改变而引起的平均数的改变量称为 主效应 。
如在表 6-27中,当 A因素由 A1水平变到 A2
水平时,A因素的主效应为 A2水平的平均数减去
A1水平的平均数,即
A因素的主效应 =492-475=17
同理 B因素的主效应 =496-471=25
主效应也就是简单效应的平均,如
(32+2)÷ 2=17,(40+10)÷ 2=25。
下一张 主 页 退 出上一张
3,交互作用 (互作,interaction) 在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上所产生的效应不同,这种现象称为该两因素存在交互作用。 如在表 6-27中:
A在 B1水平上的效应 =472-470=2
A在 B2水平上的效应 =512-480=32
B在 A1水平上的效应 =480-470=10
B在 A2水平上的效应 =512-472=40
显而易见,A的效应随着 B因素水平的不 同而不同,反之亦然,此时称 A,B两因素间存 在交互作用,记为 A× B。或者说,某一因素的 简单效应随着另一因素水平的变化而变化时,则称该 两 因 素 间 存 在 交互作用 。 互作效应 可由
(A1B1+A2B2-A1B2-A2B1)/2来估计。
表 6-27中的互作效应为:
(470+512-480-472)/2=15
下一张 主 页 退 出上一张所谓互作效应实际指的就是由于两个或两个以上试验因素的相互作用而产生的效应。如在表 6-27中:
A2B1-A1B1=472-470=2,这是添加赖氨酸单独作用的效应;
A1B2-A1B1=480-470=10,这是添加蛋氨酸单独作用的效应,
两者单独作用的效应总和是 2+10=12;
但是,A2B2-A1B1=512-470=42,而不是 12;
这就是说,同时添加赖氨酸,蛋氨酸产生的 效应下一张 主 页 退 出上一张不是单独添加一种氨基酸所产生效应的和,而另外多增加了 30,这个 30是两种氨基酸共同作用的结果。若将其平均分到每种氨基酸上,则各为
15,即估计的互作效应。
下面介绍两因素有重复观测值试验结果的方差分析方法。
下一张 主 页 退 出上一张
t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较 多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用 t检验法就不适宜了。这是因为:
下一张 主 页 退 出上一张
1、检验过程烦琐例如,一试验包含 5个处理,采用 t检验法要进行 =10次两两平均数的差异显著性检验;若有 k个处理,则要作 k(k-1)/2次类似的检验。
2
5C
下一张 主 页 退 出上一张
2、无统一的试验误差,误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用 t 检验法作两两比较,由于每次比较需计算一个,
故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。
21 xxS?
下一张 主 页 退 出上一张例如,试验有 5个处理,每个处理 重复 6
次,共有 30个观测值。进行 t检验时,每次只能利用两个处理共 12个观测值估计试验误差,误差自由度为 2(6-1)=10 ;若利用整个试验的
30个观测值估计试验误差,显然估计的精确性高,且误差自由度为 5(6-1)=25。可见,在用
t检法进行检验时,由 于估计误差的精确性低,
误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。
下一张 主 页 退 出上一张
3、推断的可靠性低,检验的 I 型错误率大即使利用资料所提供的全部信息估计了试验误差,若用 t 检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因 而 会增大犯 I型错误的概率,降低推断的可靠性。
由于上述原因,多个平均数的差异显著性检验不宜用 t 检验,须采用方差分析法。
方差分析 (analysis of variance) 是由英国统计学家 R.A.Fisher于 1923年提出的。
这种方法是将 k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。
,方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术,,方差分析实质上是关于观测值变异原因的数量分析。
下一张 主 页 退 出上一张几个常用术语,
1,试验指标 (experimental index)
为 衡 量 试 验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽,水产试验中常用的试验指标有,日增重,产仔数,产奶量,产蛋率、瘦肉率、某些生理生化和体型指标 (如血糖含量、体高、体重 )等。
下一张 主 页 退 出上一张
2,试验因素 (experimental factor)
试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。
当试验中考察的因素只有一个时,称为 单因素试验 ;
若同时研究两个或两个以上的因素对试验指标的影响时,则称为 两因素或多因素试验 。试验因素常用大写字母 A,B,C,… 等表示。
下一张 主 页 退 出上一张
3,因素水平 (level of factor)
试验因素所处的某种特定状态或数量等级称为 因素水平,简称 水平 。
如比较 3个品种奶牛产奶量的高低,这 3个品种就是奶牛品种这个试验因素的 3个水平;
研究某种饲料中 4种不同能量水平对肥育猪瘦肉率的影响,这 4种特定的能量水平就是饲料能量这一试验因素的 4个水平。
下一张 主 页 退 出上一张因素水平用代表该因素的字母加添足标 1,
2,…,来表示。如 A1,A2,…,B1,
B2,…,等。
4,试验处理 (treatment)
事先设计好的实施在试验单位上的具体项目叫 试验处理,简称 处理 。
在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位 (某种畜禽 )上的具体项目就是喂饲某一种饲料。所以 进行单因素试验时,试验因素的一个水平就是一个处理 。
下一张 主 页 退 出上一张在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行 3种饲料和 3个品种对猪日增重影响的两因素试验,整个试验共有 3× 3=9个水平组合,实施在试验单位 (试验猪 )上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理 。
下一张 主 页 退 出上一张
5,试验单位 (experimental unit)
在试验中能接受不同试验处理的独立的试验载体叫试验单位。
在畜禽、水产试验中,一只家禽,一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。
试验单位往往也是观测数据的单位。
下一张 主 页 退 出上一张
6,重复 (repetition)
在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。
例如,用某种饲料喂 4头猪,就说这个处理 (饲料 )有 4次重复。
下一张 主 页 退 出上一张第一节 方差分析的基本原理与步骤本节结合单因素试验结果的方差分析介绍其原理与步骤。
一、线性模型与基本假定假设某单因素试验有 k个处理,每个处理有 n次重复,共有 nk个观测值。这类试验资料的数据模式如表 6-1所示。
下一张 主 页 退 出上一张表 6-1 k个处理每个处理有 n个观测值的数据模式下一张 主 页 退 出上一张表中 表示第 i个处理的第 j个观测值
( i=1,2,…,k; j=1,2,…,n);
表示第 i个处理 n个观测值的和;
表示全部观测值的总和;
表示第 i个处理的平均数;
表示全部观测值的总平均数;
可以分解为
ijx
n
j
iji xx
1
.
k
i
i
k
i
n
j
ij xxx
11 1
...
nxnxx i
n
j
iji /./.
1
knxknxx
k
i
n
j
ij /../..
1 1
ijx
下一张 主 页 退 出上一张
(6-1)
表示第 i个处理观测值总体的平均数。
为了看出各处理的影响大小,将 再进行分解,令
(6-2)
(6-3)
则
(6-4)
其中 μ表示全试验观测值总体的平均数;
ijiijx
k
i
ik
1
1
ii
ijiijx
下一张 主 页 退 出上一张
i?
i?
ai 是 第 i 个 处理的效应 ( treatment
effects)表示处理 i对试验结果产生的影响。
显然有
(6-5)
εij是试验误差,相互独立,且服从 正态分布 N( 0,σ2)。
( 6-4)式叫做 单因素试验 的 线 性 模 型
( linear model)亦称数学模型。
在这个模型中 Xii表示为总平均数 μ、处理效应 αi、试验误差 εij之和。
0
1
k
i
i?
下一张 主 页 退 出上一张由 εij 相 互独立且服从正态分布 N( 0,
σ2),可知各处理 Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布 N(μi,σ2)。
尽管各总体的均数 可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:
效 应 的 可 加 性 ( additivity)、
分布的正态性 ( normality),方差的同质性
( homogeneity)。这也是进行其它类型方差分析的前提或基本假定。
下一张 主 页 退 出上一张
i?
若 将 表 ( 6-1) 中 的 观 测 值 xij
( i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则
(6-6)
与( 6-4)式比较可知,
分 别是 μ、( μi-μ) =,
( xij- ) = 的估计值。
ijiiijiij etxxxxxxx,......,)()(
、,ii txxx )(..,..
ijiij exx )(,i?
ij?
下一张 主 页 退 出上一张
i?
( 6-4)、( 6-6)两式告诉我们:
每 个 观 测 值 都包含处理效应( μi-μ
或 ),与误差( 或 ),故
kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。
..,xxi? iijx,iij xx?
二、平方和与自由度的剖分在方差分析中是用样本方差即均方( mean
squares)来度量资料的变异程度的。
表 6-1中全部观测值的总变异可以用总均方来度量。
将总变异分解为处理间变异和处理内变异,
就是要将 总 均方 分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子 ── 称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母 ── 称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。
下一张 主 页 退 出上一张
(一)总平方和的剖分在表 6-1中,反映 全部观测值总变异的总平方和是各观测值 xij与总平均数的离均差平方和,记为 SST。即
k
i
n
j
ijT xxSS
1 1
2
.,)(
下一张 主 页 退 出上一张
k
i
n
j
iij
n
j
iij
k
i
k
i
ii
k
i
n
j
iijiijii
k
i
n
j
k
i
n
j
iijiij
xxxxxxxxn
xxxxxxxx
xxxxxx
1 1
2
11 1
2
1 1
22
1 1 1 1
22
.)(].)(..).[(2..).(
.)(.).,) (.(2..).(
.)(..).(..)(
因为其中所以 ( 6-7)
( 6-7)式中,为各处理平均数与总平均数的离均差平方和与重复数 n的乘积,反映了重复 n 次的处理间变异,称为处理间平方和,记为 SSt,即
n
j
iij xx
1
,0)(
k
i
n
j
k
i
k
i
n
j
iijiij xxxxnxx
1 1 1 1 1
2.2...2.,)()()(
k
i
i xxn
1
2..).(
k
i
it xxnSS
1
2..).(
下一张 主 页 退 出上一张
(6-7)式中,为 各处 理内离均差平方和之和,反映了各处理内的变异即误差,
称为处理内平方和或误差平方和,记为 SSe,即于是有
SST =SSt+SSe ( 6-8)
这个关系式中三种平方和的简便计算公式如下:
k
i
n
j
iij xx
1 1
2
,)(
k
i
n
j
iije xxSS
1 1
2
,)(
下一张 主 页 退 出上一张
(6-9)
其中,C= /kn称为矫正数。
(二)总自由度的剖分在计算总平方和时,资料中的各个观测值要受 这一条件的约束,故总自由度等于资料中观测值的总个数减 1,即 kn-1。总自由度记为 dfT,即 dfT=kn-1。
Cx
n
SS
CxSS
i
k
i
t
ij
n
j
k
i
T
2
.
1
2
11
1
tTe SSSSSS
k
i
n
j
ij xx
1 1
0..)(
下一张 主 页 退 出上一张
2x
在计算处理间平方和时,各处理均数 要受 这一条件的约束,故处理间自由度为处理数减 1,即 k-1。处理间自由度记为 dft,
即 dft=k-1。
在计算处理内平方和时,要受 k个条件的约束,即 ( i=1,2,…,k。故处理内自由度为资料中观测值的总个数减 k,即 kn-k 。处理内自由度记为 dfe,即 dfe=kn-k=k(n-1)。
.ix
k
i
i xx
1
..,0)(
n
j
iij xx
1
,0)(
下一张 主 页 退 出上一张因为所以
(6-10)
综合以上各式得:
(6-11)
)1()1()()1(1 nkkknkknk
etT dfdfdf
tTe
t
T
dfdfdf
kdf
kndf
1
1
下一张 主 页 退 出上一张各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 MST
(或 ),MSt(或 )和 MSe(或 )。
即
( 6-12)
总均方一般不等于处理间均方加处理内均方。
2TS 2
tS
2
eS
TTTT dfSSSMS /2
tttt dfSSSMS /2
eeee dfSSSMS /2
下一张 主 页 退 出上一张
【 例 6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼 20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。
下一张 主 页 退 出上一张表 6-2 饲喂不同饲料的鱼的增重
(单位,10g)
下一张 主 页 退 出上一张这是一个单因素试验,处理数 k=4,重复数 n=5。各项平方和及自由度计算如下:
矫正数总平方和
03.1 5 1 6 9)54/(8.5 5 0/ 22., nkxC
C
CxSS ijT
222
2
5.289.279.31?
67.1 9 903.1 5 1 6 97.1 5 3 6 8
下一张 主 页 退 出上一张
27.11403.151693.15283
)8.1397.1234.1319.155(
5
1
.
1
2222
2
C
Cx
n
SS
i
t
处理间平方和处理内平方和
40.8527.11467.199
tTe SSSSSS
总自由度处理间自由度处理内自由度用 SSt,SSe分别除以 dft和 dfe便得到处理间均方 MSt及处理内均方 MSe。
因为方差分析中不涉及总均方的数值,所以不必计算之。
191451 nkdf T
3141 kdf t
16319 tTe dfdfdf
34.516/40.85/
09.383/27.1 1 4/
eee
ttt
dfSSMS
dfSSMS
下一张 主 页 退 出上一张三、期望均方如前所述,方差分析的一个基本假定是要求各 处 理 观 测 值 总 体 的 方 差 相 等,即
( i=1,2,…,k)表示第 i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差
S21,S22,…,S2k 都 是 σ2 的 无 偏 估 计
( unbiased estimate)量。
S2i(i=1,2,…,k) 是由试验资料中第 i个处理的 n个观测值算得的方差。
2222221,ik
下一张 主 页 退 出上一张显然,各 S2i的合并方差 (以各处理内的自由度 n-1为权的加权平均数)也是 σ2的无偏估计量,且估计的精确度更高。很容易推证处理内均方 MSe就是各 的合并。
2eS
2iS
22
21
22
22
2
11
21
21
2
.
)1()1(
)(
估计
e
k
kk
k
ki
iij
e
e
e
S
dfdfdf
SdfSdfSdf
dfdfdf
SSSSSS
nk
SS
nk
xx
df
SS
MS
下一张 主 页 退 出上一张其中 SSi,dfi( i=1,2,…,k)分别表示由试验资料中第 i个 处理的 n个观测值算得的平方和与自由度。这就是说,处理内均方 MSe
是误差方差 σ2的无偏估计量。
试验中各处理所属总体的本质差异体现在处理效应 的差异上。我们把称为 效应方差,它也反映了各处理观测值总体平均数 的变异程度,记为 。
i?
)1/()()1/( 22 kka ii
i? 2
下一张 主 页 退 出上一张
(6-13)
因为各 μi未知,所以无法求得 的 确切值,只能通过试验结果中各处理均数的差异去估计。然而,
并非 的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容,一是各处理本质上的差异即 αi(或 μi)间的差异,二 是本身的抽样误差。统计学上已经证明,
是 +σ2/n的无偏估计量。因而,我们前面所计算的处理间均方 MSt实际上是 n +σ2的无偏估计量。
1
2
2
k
i
a
2
)1/()( 2.., kxx i 2
)1/()( 2.., kxx i
2
2
下一张 主 页 退 出上一张因为 MSe是 σ2的无偏估计量,MSt是 n
+σ2的无偏估计量,所以 σ2为 MSe的数学期望
( mathematical expectation),n +σ2
为 MSt的数学期望。又因为它们是均方的期望值
( expected value),故 又 称 期 望 均方,简 记 为 EMS ( expected mean
squares)。
当处理效应的方差 =0,亦即各处理观测值总体平均数 ( i=1,2,…,k)相等时,处理间均方 MSt与处理内均方一样,也是误差方差
σ2的估计值,方差分析就是通过 MSt 与 MSe的比较来推断 是否为零即 是否相等的。
2
2
2
i?
2
i
下一张 主 页 退 出上一张四,F分布与 F检验
(一) F分布设想我们作这样的抽样试验,即在一正态总体 N( μ,σ2)中随机抽取样本含量为 n的样本
k个,将 各 样本观测值整理成 表 6-1 的形式。
此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,由( 6-12)式算出的和 都是误差方差 的估计量。以 为分母,为分子,求其比值。统计学上把两个均方之比值称为 F值。即
2tS 2eS 2? 2eS
2tS
下一张 主 页 退 出上一张
( 6-14)
F具有两个自由度:
若在给定的 k和 n的条件下,继续从该总体进行一系列抽样,则可获得一系列的 F值。这些 F值 所 具 有 的 概 率 分 布 称 为 F 分 布
( F distribution)。 F 分 布密度曲线是随自由度 df1,df2的变化而变化的一簇偏态曲线,
其形态随着 df1,df2的增大逐渐趋于对称,如图 6-1所示。
22 /
et SSF?
。)1(,1 21 nkdfdfkdfdf et
下一张 主 页 退 出上一张
F分布的取值范围是( 0,+∞),其平均值 =1。
用 表示 F分布的概率密度函数,则其分布函数 为:
(6-15)
因而 F分布右尾从 到 +∞的概率为:
(6-16)
F?
)(Ff
)(?FF
F dFFfFFPFF )()()(
F
F dFFfFFFFP )()(1)(
下一张 主 页 退 出上一张附 表 4 列 出 的 是 不 同 df1 和 df2 下,
P( F≥ ) =0.05和 P( F≥ ) =0.01时的 F
值,即右尾概率 α=0.05和 α=0.01时的临界 F值,
一般记作,。
F?F
),(05.0 21 dfdfF ),(01.0 21 dfdfF
下一张 主 页 退 出上一张
(二 )F检验附表 4是专门为检验 代表的总体方差是否比 代表的总体方差大而设计的。
若实际计算的 F值大于,则 F 值在 α=0.05的水平上显著,我们以 95% 的 可靠性 (即冒 5%的风险 )推断 代 表 的总体方差大于 代表的总体方差。这种用 F值出现概率的大小推断两个总体方差是否相等的方法称为 F检验
(F-test)。
2tS
2eS
),(05.0 21 dfdfF
2tS
2eS
下一张 主 页 退 出上一张在方差分析中所进行的 F 检验目的在于推断处理间的差异是否存在,检验某项变异因素的效应方差是否为零。因此,在计算 F 值时总是以被检验因素的均方作分子,以误差均方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。
下一张 主 页 退 出上一张在单因素试验结果的方差分析中,无效假设为 H0,μ1=μ2=… =μk,备择假设为 HA:各
μi不全相等,或 H0,=0,HA,≠0;
F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内 (误差 )均方。
如果结论是肯定的,我们将否定 H0;反之,
不否定 H0。
2 2
下一张 主 页 退 出上一张反过来理解:如果 H0是正确的,那么 MSt
与 MSe都是总体误差 σ2的估计值,理论上讲 F值等于 1;如果 H0是不正确的,那么 MSt之期望均方中的就不等于零,理论上讲 F 值就必大于 1。
但是由于抽样的原因,即使 H0正确,F值也会出现大于 1的情况。所以,只有 F值大于 1达到一定程度时,才有理由否定 H0。
下一张 主 页 退 出上一张实际进行 F检验时,是将由试验资料所算得的 F值与根据 df1=dft (大均方,即分子均方的自由度 ),df2=dfe(小均方,即分母均方的自由度 )查附表 4所得的临界 F值,
相比较作出统计推断的。
若 F<,即 P> 0.05,不 能 否定
H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在 F值的右上方标记,ns”,
或 不标记符号;
),(05.0 21 dfdfF ),(01.0 21 dfdfF
),(05.0 21 dfdfF
若 ≤ F <,即
0.01< P≤0.05,否定 H0,接受 HA,统计学上,把这一检验结果表述为:各处理间差异显著,
在 F值的右上方标记,*” ;
若 F≥,即 P≤0.01,否定 H0,
接受 HA,统计学上,把这一检验结果表述为:
各处理间差异极显著,在 F 值 的 右上方标记
,**” 。
),(05.0 21 dfdfF ),(01.0 21 dfdf
F
),(01.0 21 dfdfF
下一张 主 页 退 出上一张对于 【 例 6.1】,
因为
F=MSt/MSe=38.09/5.34=7.13**;
根据 df1 = dft = 3,df2 = dfe = 16 查附表 4,
得 F0.01(3,16);
因为 F> F0.01(3,16) =5.29,P< 0.01
表明四种不同饲料对鱼的增重效果差异极显著,用不同的饲料饲喂,增重是不同的。
下一张 主 页 退 出上一张表 6-3 表 6-2资料方差分析表下一张 主 页 退 出上一张在方差分析中,通常将变异来源、平方和、
自由度、均方和 F值归纳成一张方差分析表,见表 6-3。
在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及 F检验可在方差分析表上进行。
下一张 主 页 退 出上一张五、多重比较
F值显著或极显著,否定了无效假设 HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。
下一张 主 页 退 出上一张因而,有必要进行两两处理平均数间的比较,
以具体判断两两处理平均数间的差异显著性。
统计上把多个平均数两两间的相互比较称为多重比较 (multiple comparisons)。
多重比较的方法甚多,常用的有 最小显著差数法 (LSD法 )和 最小显著极差法 (LSR法 ),现分别介绍如下。
(一)最小显著差数法 (LSD法,least
significant difference)
此法的基本作法是,在 F检验显著的 前提下,先 计 算 出 显 著 水 平为 α的最小显著差数,然后将任意两个处理平均数的差数的绝对值 与其比较。
LSD
.,ji xx?
下一张 主 页 退 出上一张若 > LSDα时,则 与 在 α水平上差异显著;反之,则在 α水平上差异不显著。最小显著差数由 (6-17)式计算。
(6-17)
式中,为在 F检验中误差自由度下,显著水平为 α的临界 t值,为 均 数差异标准误,由 (6-18)式算得。
(6-18)
.,ji xx?,ix,jx
..)( jie xxdfaa StL S D
)( edft?
.,ji xxS?
nMSS exx ji /2.,
下一张 主 页 退 出上一张其中 为 F检验中的误差均方,n为各处理的重复数。
当显著水平 α=0.05和 0.01时,从 t值表中查出 和,代入 (6-17)式得:
(6-19)
利用 LSD法进行多重比较时,可按如下步骤进行:
(1) 列出平均数的多重比较表 比较表中各处理按其平均数从大到小自上而下排列;
eMS
)(05.0 edft )(01.0 edft
..
..
)(01.001.0
)(05.005.0
jie
jie
xxdf
xxdf
StL S D
StL S D
(2)计算最小显著差数 和 ;
(3)将平均数多重比较表中两两平均数的差数与,比较,作出统计推断。
对于 【 例 6.1】,各 处 理 的多重比较如表 6-4所示。
05.0LSD 01.0LSD
05.0LSD 01.0LSD
下一张 主 页 退 出上一张表 6-4 四种饲料平均增重的多重比较表
(LSD法 )
注:表中 A4与 A3的差数 3.22用 q检验法与新复极差法时,在 α=0.05的水平上不显著。
因为查 t值表得:
t0.05(dfe) =t0.05(16) =2.120
t0.01(dfe) =t0.01(16) =2.921
所以,显著水平为 0.05与 0.01的最小显著差数为
462.15/34.52/2., nMSS exx ji
271.4462.1921.2
099.3462.1120.2
..
..
)(01.001.0
)(05.005.0
jie
jie
xxdf
xxdf
StL S D
StL S D
下一张 主 页 退 出上一张将表 6-4中的 6个差数与,
比较,05.0LSD
01.0LSD
小于 者不显著,在差数的右上方标记,ns”,或不标记符号;
介于 与 之间者显著,在差数的右上方标记,*” ;
大于 者极显著,在差数的右上方标记,**” 。
05.0LSD
05.0LSD 01.0LSD
01.0LSD
检验结果除差数 1.68,1.54不显著,3.22 显著外,其余两个差数
6.44,4.90极显著。表明 A1饲料对鱼的增重效果极显著高于 A2 和 A3,
显著高于 A4; A4饲料对鱼的增重效果极显著高于 A3饲料; A4 与 A2,A2 与
A3的增重效果差异不显著,以 A1饲料对鱼的增重效果最佳。
关于 LSD 法的应用有以下几点说明:
1,LSD 法实质上就是 t检验法。它是将 t 检验中由所求得的 t之绝对值 与临界 ta值的比较转为将各对均数差值的绝对值 与最小显著差数 的 比较而作出统计推断的 。 但是,由于 LSD法是利用 F检验中的误差自由度 df e 查临界 tα值,利用误差均 方 计 算 均 数 差 异标 准误,因而法又不同于每次利用两组数据进行多个 平 均 数 两 两 比较的检验法 。 它 解 决了本章开头指出的 检 验 法 检验过 程 烦 琐,无统一 的
)/)((,..,ji xxji Sxxt
.,ji xx?
.,ji xxa St?
eMS
.,ji xxS?
下一张 主 页 退 出上一张试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但 法并未解决推断的可靠性降低、犯
I型错误的概率变大的问题。
2、有人提出,与检验任何两个均数间的差异相比较,LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特 (Dunnett)法 (关于此法,
读者可参阅其它有关统计书籍 )。
LSD
3、因为 LSD法实质上是 t检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只比较一次。例如,在一个试验中共有 4个处理,设 计 时 已 确 定 只是处理 1
与处理 2、处理 3与处理 4(或 1与 3,2与 4;或
1与 4,2与 3)比较,而 其它的处理间不进行比较。因为这种比较形式实际上不涉及多个均数的极差问题,所以不会增大犯 I型错误的概率。
下一张 主 页 退 出上一张综上所述,对于多个处理平均数所有可能的两两比较,LSD法的优点在于方法比较简便,
克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯 I型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。
下一张 主 页 退 出上一张
(二 )最小显著极差法 (LSR法,Least
significant ranges)
LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数
(称为 秩次距 )k的不同而采用不同的检验尺度,
以克服 LSD法的不足。这些在显著水平 α上依秩次距 k的不同而采用的不同的检验尺度叫做 最小显著极差 LSR。
例如有 10 个要相互比较,先将 10个依其数值大小顺次排列,两 极 端平均数的差数
(极差 )的显著性,由 其 差 数 是 否 大于秩次距 k=10时的最小显著极差决定 (≥为显著,<
为不显著);而后是秩次距 k=9 的平均数的极差的显著性,则由极差是否大于 k=9 时 的最小显著极差决定; …… 直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距 k=2
时的最小显著极差决定为止。因此,有 k个平均数相互比较,就有 k-1 种秩次距 (k,k-1,
k-2,…,2),因而需求得 k-1个最小显著极差
(LSRα,k),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。
x x
下一张 主 页 退 出上一张因为 LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。
LSR法克服了 LSD法的不足,但检验的工作量有所增加。常用的 LSR法有 q检验法和新复极差法两种。
1,q检验法 (q test)
此法是以统计量 q的概率分布为基础的。 q
值由下式求得:
(6-20)xSq /
式中,ω为极差,为标准误,分布依赖于误差自由度 dfe及秩次距 k。
利用 q检验法进行多重比较时,为了简便起见,不是将由 (6-20)式算出的 q值 与 临界
q值 比较,而是将极差与比较,从而作出统计推断。 即为 α水平上的最小显著极差。
nMSS ex /?
),( kdfa eq xkdfa Sq e ),(
xkdfa Sq e ),(
下一张 主 页 退 出上一张
(6-21)
当显著水平 α=0.05和 0.01时,从 附 表
5(q值表 )中根据自由度 及 秩 次 距 k 查出和 代入 (6-21)式得
(6-22)
实际利用 q检验法进行多重比较时,可按如下步骤进行:
xkdfaka SqL S R e ),(,?
edf
),(05.0 kdf eq
),(01.0 kdf eq
xkdfk
xkdfk
SqL S R
SqL S R
e
e
),(01.0,01.0
),(05.0,05.0
(1)列出平均数多重比较表 ;
(2)由自由度 dfe、秩次距 k查临界 q值,计算最小显著极差 LSR0.05,k,LSR0.01,k;
(3)将平均数多重比较表中的各极差与相应的最小显著极差 LSR0.05,k,LSR0.01,k比较,作出统计推断。
对于 【 例 6.1】,各处理平均数多重比较表同表 6-4。 在表 6-4中,极差 1.54,1.68、
3.22的秩次距为 2;极差 3.22,4.90的秩次距为 3;极差 6.44的秩次距为 4。
下一张 主 页 退 出上一张因为,MSe=5.34,故标准误 为根据 dfe=16,k=2,3,4 由 附表 5查出
α=0.05,0.01水平下临界 q值,乘以标准误求 得各最小显著极差,所得结果列于表 6-5。
xS
0 3 3.15/34.5/ nMSS ex
xS
表 6-5 q值及 LSR值下一张 主 页 退 出上一张将表 6-4中的极差 1.54,1.68,3.22 与表 6-5
中的最小显著极差 3.099,4.266比较 ;
将极差 3.22,4.90与 3.770,4.948比较;
将极差 6.44与 4.184,5.361比较。
检验结果,除 A4与 A3的差数 3.22由 LSD法比较时的差异显著变为差异不显著外,其余检验结果同法。
2、新复极差法 (new multiple range
method)
此法是由邓肯 (Duncan) 于 1955年提出,
故又称 Duncan法,此法还称 SSR法
(shortest significant ranges)。
新复极差法与 q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查 SSR表 (附表 6)而不是查 q值表。最小显著极差计算公式为
(6-23)
xkdfaka SS S RL S R e ),(,?
下一张 主 页 退 出上一张其中是根据显著水平 α、误差自由度 dfe、秩次距 k,由 SSR表查得的临界 SSR,。
α=0.05 和 α=0.01 水平下 的 最小显著极差为:
(6-24)
对于 【 例 6.1】,各处理均数多重比较表同表 6-4。
已算出 =1.033,依 dfe=16 k=2,3,4,
由附表 6查临界 SSR0.05(16,k)和 SSR0.01(16,k)值,
乘以 =1.033,求得各最小显著极差,所得结果列于表 6-6。
nMSS ex /?
xkdfk
xkdfk
SSSRL S R
SSSRL S R
e
e
),(01.0,01.0
),(05.0,05.0
xS
xS
表 6-6 SSR值与 LSR值下一张 主 页 退 出上一张将表 6-4中的平均数差数 (极差 )与表 6-6中的最小显著极差比较,检验结果与 q检验法 相同。
当各处理重复数不等时,为简便起见,不论
LSD法还是 LSR法,可用 (6-25)式计算出一个各处理平均的重复数 n0,以代替计算 或所需的 n。
(6-25)
式中 k为试验的处理数,(i=1,2,…,k)
为第 i处理的重复数。
.,ji xxS? x
S
i
i
i n
nn
kn
2
0 1
1
in
以上介绍的三种多重比较方法,其检验尺度有如下关系:
LSD 法 ≤新复极差法 ≤q检验法当秩次距 k=2时,取等号; 秩次距 k ≥3时,取小于号。在多重比较中,LSD法的尺度最小,q检验法尺度最大,新复极差法尺度居中。用 上述排列顺序前面方 法 检 验 显 著 的 差 数,用 后 面 方 法 检 验未 必 显著;用后面 方 法 检 验 显 著 的 差 数,用前 面 方 法 检 验必 然 显 著 。 一 般 地 讲,一 个下一张 主 页 退 出上一张试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的 H0 和接受一个不正确的
H0的相对重要性来决定。如果否定正确的 H0是事关重大或后果严重的,或对试验要求严格时,
用检验法较为妥当 ;如果接受一个不正确的 H0
是事关重大或后果严重的,则宜用新复极差法。
生物试验中,由于试验误差较大,常采用新复极差法; F检验显著后,为了简便,也 可采用 LSD法。
(三 )多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。
1、三角形法 此法是将多重比较结果直接标记在平均数多重比较表上,如表 6-4所示。此法的优点是简便直观,缺点是占的篇幅较大。
2、标记字母法 此法是先将各处理平均数由大到小自上而下排列 ;
然后在最大平均数后标记字母,并 将 该 平均数与 以 下 各 平 均 数依次相比,凡 差 异 不显著标 记 同 一 字 母,直到某一个与其差异显著的平均数标记字母 b ;
下一张 主 页 退 出上一张再以标有字母 b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标 b,直至显著为止;
再以标记有字母 b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母
b,直至某一个与其差异显著的平均数标记 c; …… ;
如此重复下去,直至最小一个平均数被标记、比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。
用小写拉丁字母表示显著水平 α=0.05,用大写拉丁字母表示显著水平 α=0.01。
在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。
对于 【 例 6.1】,现根据表 6-4所表示的 用新复极差法进行多重比较结果用字母标记如表
6-7所示 (注意,用新复极差法进行多重比较,
表 6-4中 A4与 A3的差数 3.22在 α=0.05的水平上不显著,其余的与 LSD法同 )。
表 6-7 表 6-4多重比较结果的字母标记 (SSR法 )
下一张 主 页 退 出上一张在表 6-7中,先将各处理平均数由大到小自上而下排列。当显著水平 α=0.05时,先 在平均 数
31.18行上标记字母 a;由于 31.18与 27.96 之差为 3.22,在 α=0.05水平上显著,所以 在 平均数 27.96行上标记字母 b;然后以标记字母 b的平均数 27.96 与 其 下方的 平均数 26.28 比较,差数为 1.68,在 α=0.05水平上不显著,所以在平均数 26.28行上标记字母 b ;再将平均数 27.96与平均数 24.74比较,差数为 3.22,在 α=0.05水平上不显著,所以在平均数 24.74行上标记字母 b。类似地,可以在 α= 0.01 将 各 处理平均数标记上字母,结果见表 6-7。 q检验结果与 SSR法检验结果相同。 下一张 主 页 退 出上一张由表 6-7看到,A1饲料对鱼的平均增重极显著地高于 A2和 A3饲料,显著高于 A4饲料; A4、
A2,A3 三 种 饲料对鱼的平均增重差异不显著。
四种饲料其中以 A1饲料对鱼的增重效果最好。
应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。
下一张 主 页 退 出上一张七、方差分析的基本步骤方差分析的基本步骤归纳如下:
(一)计算各项平方和与自由度;
(二)列出方差分析表,进行 F检验;
(三)若 F检验显著,则进行多重比较。
多重比较的方法有最小显著差数法 (LSD法 )
和最小显著极差法 (LSR法,包括 q检验法和新复极差法 ) 。表示多重比较结果的方法有三角形法和标记字母法。
下一张 主 页 退 出上一张第二节 单因素试验资料的方差分析根据各处理内重复数是否相等,单因素试验资料的方差分析又分为重复数相等和重复数不等两种情况。本节各举一例予以说明。
下一张 主 页 退 出上一张一、各处理重复数相等的方差分析
【 例 6.3】 抽测 5个不同品种的若干头母猪的窝产仔数,结果见表 6-12,试检验不同品种母猪平均窝产仔数的差异是否显著。
表 6-12 五个不同品种母猪的窝产仔数下一张 主 页 退 出上一张这是一个单因素试验,k=5,n=5。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度
00.2 8 0 9)55/(2 6 5/ 22., knxC
20.7300.280920.2882
00.2809)6548604151(
5
11
00.13600.280900.2945
00.2809)1314138(
222222
.
22222
Cx
n
SS
CxSS
it
ijT
下一张 主 页 退 出上一张
80.6220.7300.1 3 6
tTe SSSSSS
20424
,4151
,241551
tTe
t
T
dfdfdf
kdf
kndf
2、列出方差分析表,进行 F检验表 6-13 不同品种母猪的窝产仔数的方差分析表下一张 主 页 退 出上一张根据 df1=dft=4,df2=dfe=20查临界 F值得,F0.05(4,20) =2.87,F0.05(4,20)
=4.43
因为 F> F0.01(4,20),即 P< 0.01,表明品种间产仔数的差异达到 1%显著水平。
3、多重比较 采用新复极差法,各处理平均数多重比较表见表 6-14。 下一张 主 页 退 出上一张表 6-14 不同品种母猪的平均窝产仔数多重比较表 (SSR法 )
下一张 主 页 退 出上一张因为 MSe=3.14,n=5,所以 为:
根据 dfe=20,秩次距 k=2,3,4,5由附表 6查出 α=0.05和 α=0.01的各临界 SSR值,
乘以 =0.7925,即得各最小显著极差,所得结果列于表 6-15。
xS
7 9 3.05/14.3/ nMSS tx
xS
下一张 主 页 退 出上一张表 6-15 SSR值及 LSR值下一张 主 页 退 出上一张将表 6-14中的差数与表 6-15中相应的最小显著极差比较并标记检验结果。
检验结果表明,5号品种母猪的平均窝产仔数极显著高于 2号品种母猪,显著高于 4号和 1
号品种,但与 3号品种差异不显著 ; 3号品种母猪的平均窝产仔数极显著高于 2号品种,与 1号和 4号品种差异不显著; 1号,4号,2号品种母猪的平均窝产仔数间差异均不显著。五个品种中以 5号品种母猪的窝产仔数最高,3号品种次之,
2号品种母猪的窝产仔数最低。
下一张 主 页 退 出上一张二、各处理重复数不等的方差分析设处理数为 k;各处理重复数为 n1,n2,…,
nk;试验观测值总数为 N=Σni。则
(6-28)
tTetT
tTeiitijT
dfdfdfkdfNdf
SSSSSSCnxSSCxSS
NxC
,1,1
,/,
/
2
.
2
2
..
下一张 主 页 退 出上一张
【 例 6.4】 5个不同品种猪的育肥试验,后期 30天增重 (kg)如表 6-16所示。试比较品种间增重有无差异。
表 6-16 5个品种猪 30天增重下一张 主 页 退 出上一张此例处理数 k=5,各处理重复数不等。现对此试验结果进行方差分析如下:
1、计算各项平方和与自由度
41.848225/5.460/ 22., NxC
下一张 主 页 退 出上一张
20424
4151
241251
84.3850.4634.85
50.4641.848291.8528
41.8482
)4/5.664/8.785/5.916/0.1036/0.121(
/
34.8541.848275.8567
41.8482)0.160.175.195.21(
22222
2
.
22222
tT
e
t
T
tT
e
ii
t
ij
T
dfdfdf
kdf
Ndf
SSSSSS
CnxSS
CxSS?
下一张 主 页 退 出上一张
2、列出方差分析表,进行 F检验临界 F值为,F0.05(4,20) =2.87,F0.01(4,20)
=4.43,因为品种间的 F值 5.99> F0.01(4,20),
P< 0.01,表明品种间差异极显著。
下一张 主 页 退 出上一张表 6-17 5个品种育肥猪增重方差分析表下一张 主 页 退 出上一张
3、多重比较 采用新复极差法,各处理平均数多重比较表见表 6-18。
因为各处理重复数不等,应先由 (6-25)式计算出平均重复次数 n0来代替标准误中的 n,此例于是,标准误 为:
nMSS ex /?
96.4
25
4456625
15
1
1
1 222222
0
i
i
i n
n
n
k
n
xS
625.096.4/94.1/ 0 nMSS ex
下一张 主 页 退 出上一张表 6-18 5个品种育肥猪平均增重多重比较表 (SSR法 )
下一张 主 页 退 出上一张根据 dfe=20,秩次距 k=2,3,4,5,从附表 6中查出 α=0.05与 α=0.01的临界 SSR值,
乘以 =0.625,即得各最小显极差,所得结果列于表 6-19。
xS
下一张 主 页 退 出上一张表 6-19 SSR值及 LSR值表下一张 主 页 退 出上一张将表 6-18中的各个差数与表 6-19中相应的最小显著极差比较,作出推断。检验结果已标记在表 6-18中。
多重比较结果表明 B1,B4品种的平均增重极显著或显著高于 B2,B5品种的平均增重,其余不同品种之间差异不显著。可以认为 B1,B4
品种增重最快,B2,B5品种增重较差,B3品种居中。
第三节 两因素试验资料的方差分析两因素试验资料的方差分析是指对试验指标同时受到两个试验因素作用的试验资料的方差分析。两因素试验按水平组合的方式不同,
分为 交叉分组 和 系统分组 两类,因而对试验资料的方差分析方法也分为交叉分组方差分析和系统分组方差分析两种,现分别介绍如下。
下一张 主 页 退 出上一张一、交叉分组资料的方差分析设试验考察 A,B两个因素,A因素分 a个水平,B因素分 b个水平 。 所谓交叉分组是指 A因素每个水平与 B因素的每个水平都要碰到,两者交叉搭配形成 ab个水平组合即处理,试验因素 A,B在试验中处于平等地位 。 试验单位分成 ab 个组,每组随机接受一种处理,因而试验数据也按两因素两方向分组。这种试验以各处理是单独观测值还是有重复观测值又分为两种类型。
(一 )两因素单独观测值试验资料的方差分析对于 A,B两个试验因素的全部 ab个水平组合,每个水平组合只有一个观测值,全试验共有 ab个观测值,其数据模式如表 6-
20所示。
下一张 主 页 退 出上一张表 6-20 两因素单独观测值试验数据模式表 6-20中
a
i
b
j
ij
a
i
ijj
n
i
ij
b
j
jiji
b
j
iji
xxx
a
x
xxx
b
x
xx
1 1
..
1
.
11
..
1
.
,
1
,,
1
,
abxx
a
i
b
j
ij /..
1 1
两因素单独观测值试验资料的数学模型为:
(6-29)
式中,
μ为总平均数;
),,2,1;,,2,1( bjai
x ijljiijl
下一张 主 页 退 出上一张
αi,βj分别为 Ai,Bj的效应,
αi=μi-μ,
βj=μj-μ,μi、
μj分别为 Ai,Bj观测值总体平均数,
且 Σαi=0,Σβj=0;
εijl为随机误差,相互独立,且服从 N(0,σ2)。
交叉分组两因素单独观测值的试验,A因素的每个水平有 b次重复,B因素的每个水平有 a次重复,每个观测值同时受到 A,B 两 因素及随机误差的作用。因此全部 ab 个观测值的总变异可以剖分为 A 因素水平间变异,B因素水平间变异及试验误差三部分;自由度也相应剖分。平方和与自由度的剖分式如下:
下一张 主 页 退 出上一张
(6-30)
各项平方和与自由度的计算公式为,
矫正数总平方和
A因素平方和
B因素平方和 (6-31)
eBAT
eBAT
dfdfdfdf
SSSSSSSS
abxC /2..?
CxxxSS
a
i
b
j
ij
a
i
b
j
ijT
1 1
22
1
..
1
)(
CxbxxbSS
a
i
i
a
i
iA
1
2
.
2
..
1
.
1)(
CxaxxaSS
b
j
j
b
j
jB
1
2
.
2
..
1
.
1)(
误差平方和 SSe=SST-SSA-SSB
总自由度 dfT=ab-1
A因素自由度 dfA=a-1
B因素自由度 dfB=b-1
误差自由度 dfe= dfT - dfA – dfB
=(a-1)(b-1)
下一张 主 页 退 出上一张相应均方为
eee
BBB
AAA
dfSSMS
dfSSMS
dfSSMS
/
,/
,/
【 例 6.5】 为 研究雌激素对子宫发育的 影响,现有 4窝不同品系未成年的大白鼠,每窝 3
只,随机分别注射不同剂量的雌激素,然后在相同条件下试验,并称得它们的子宫重量,见 表
6-21,试作方差分析。
下一张 主 页 退 出上一张表 6-21 各品系大白鼠注射不同剂量雌激素的子宫重量 (g)
这是一个两因素单独观测值试验资料。 A因素 (品系 )有 4个水平,即 a=4; B因素 (雌激素注射剂量 ) 有 3 个 水 平,即 b = 3,共 有
a× b=3× 4=12个观测值。方差分析如下:
1、计算各项平方和与自由度
0 0 0 0.1 0 0 4 6 7)34/(1 0 9 8/.,22 abxC
下一张 主 页 退 出上一张
0000.60740000.1004670000.106541
0000.100467)480358260(
4
11
6667.64570000.1004676667.106924
0000.100467)192314225367(
3
11
0000.130750000.100467113542
0000.100467)8763116106(
2222
.
22222
.
22222
Cx
a
SS
Cx
b
SS
CxSS
jB
iA
ijT
62311
,2131
3141
,111341
3333.543
60700006667.64570000.13075
BATe
B
A
T
BATe
dfdfdfdf
bdf
adf
abdf
SSSSSSSS
2、列出方差分析表,进行 F检验表 6-22 表 6-21资料的方差分析表下一张 主 页 退 出上一张根据 df1=dfA=3,df2=dfe=6 查 临界 F值,
F0.01(3,6)=9.78;根据 df1=dfB=2,df2=dfe=6查临界 F值,F0.01(2,6)=10.92。
因为 A 因素 的 F 值 23.77 > F0.01(3,6),P<
0.01,表明不同品系间差异极显著 ; B 因 素 的 F 值
33.54> F0.01(2,6),P< 0.01,表明不同雌激素剂量间差异极显著。也就是说不同品系和不同雌激素剂量对大白鼠子宫的发育均有极显著影响,有 必 要进一步对
A,B两因素不同水平的平均测定结果进行多重比较。
3、多重比较
( 1)不同品系的子宫平均重量比较表 6-23 各品系子宫平均重量多重比较( q法)
下一张 主 页 退 出上一张在两因素单独观测值试验情况下,因为 A因素 (本例为品系 )每一水平的重复数恰为 B因素的水平数 b,故 A因素的标准误,此例 b=3,MSe=90.5556,故根据 dfe=6,秩次距 k=2,3,4从附表 5中查出 α=0.05 和 α=0.01的临界 q值,与标准误相乘,计 算 出最小显著极差 LSR,结果见表 6-
24。
bMSS ex i /,?
49 41.53/55 56.90/, bMSS ex i
4941.5,?ixS
下一张 主 页 退 出上一张表 6-24 q值及 LSR值检验结果表明,A1,A 3品系与 A2,A 4品系的子宫平均重量均有极显著的差异;但 A1与 A
3及 A2与 A4品系间差异不显著。
(2)不同激素剂量的子宫平均重量比较下一张 主 页 退 出上一张表 6-25 不同雌激素剂量的子宫平均重量多重比较 (q法 )
下一张 主 页 退 出上一张在两因素单独观测值试验情况下,B因素 (本例为雌激素剂量 )每一水平的重复数恰为 A因素的水平数 a,
故 B 因 素 的 标准误,此 例 a=4,
MSe=90.5556。故根据 dfe=6,秩次距 k=2,3 查临界 q 值 并与相乘,求得最小显著极差 LSR,见表 6-26。
aMSS ex j /,?
7 5 8 0.44/5 5 5 6.90/, aMSS ex j
jxS,
表 6-26 q值与 LSR值检验结果表明,注射雌激素剂量为 0.8 mg
的大白鼠子宫重量极显著大于注射剂量为 0.4
mg和 0.2mg的子宫重量,而后两种注射剂量的子宫重量间也有显著差异。
下一张 主 页 退 出上一张在进行两因素或多因素的试验时,除了研究每一因素对试验指标的影响外,往往更希望研究因素之间的交互作用。例如,通过对畜禽所处环境的温度、湿度、光照、噪音以及空气中各种有害气体等对畜禽生长发育的影响有无交互作用的研究,对最终确定有利于畜禽生产的最佳环境控制是有重要意义的。对畜禽的不同品种 (品系 )及其与饲料条件、各种环境因素互作的研究,有利于 合理 利用品种资源充分发挥不同畜禽的生产下一张 主 页 退 出上一张潜能。又如在饲料科学中,常常要研究各种营养成分间有无交互作用,从而找到最佳的饲料配方,
这对于合理利用饲料原料提高饲养水平等都是非常有意义的。
前面介绍的两因素单独观测值试验只适用于两个因素间无交互作用的情况。若两因素间有交互作用,则每个水平组合中只设 一个试验单位
(观察单位 )的试验设计是不正确的或不完善的。
这是因为:
下一张 主 页 退 出上一张
(1)在这种情况下,(6-31)式中 SSe,dfe实际上是 A,B 两因素交互作用平方和与自由度,所算得的 MSe是交互作用均方,主要反映由交互作用引起的变异。
(2)这时若仍按 【 例 6.5】 所采用的方法进行方差分析,由于误差均方值大 ( 包含交互作用在内 ),有可能掩盖试验因素的显著性,从而增大犯 Ⅱ 型错误的概率。
(3)因为每个水平组合只有一个观测值,所以无法估计真正的试验误差,因而不可能对因素的交互作用进行研究。
因此,进行两因素或多因素试验时,一般应设置重复,以便正确估计试验误差,深入研究因素间的交互作用。
(二 )两因素有重复观测值试验的方差分析对两因素和多因素有重复观测值试验结果的分析,
能研究因素的简单效应、主效应和因素间的交互作用
(互作 )效应。现介绍这三种效应的意义如下:
下一张 主 页 退 出上一张
1,简单效应 (simple effect)
在某因素同一水平上,另一因素不同水平对试验指标的影响称为 简单效应 。如在表 6-27中,在 A1(不加赖氨酸 )上,B2- B 1=480-470=10;在 A2 (加赖氨酸 )上,B2- B1=512-472=40;在 B1 (不加蛋氨酸 )
上,A2-A1=472-470=2; 在 B2 (加蛋氨酸 )上,
A2-A1=512-480=32等就是简单效应。简单效应实际上是特殊水平组合间的差数。
下一张 主 页 退 出上一张表 6-27 日粮中加与不加赖、蛋氨酸雏鸡的增重 (g)
2,主效应 (main effect) 由于因素水平的改变而引起的平均数的改变量称为 主效应 。
如在表 6-27中,当 A因素由 A1水平变到 A2
水平时,A因素的主效应为 A2水平的平均数减去
A1水平的平均数,即
A因素的主效应 =492-475=17
同理 B因素的主效应 =496-471=25
主效应也就是简单效应的平均,如
(32+2)÷ 2=17,(40+10)÷ 2=25。
下一张 主 页 退 出上一张
3,交互作用 (互作,interaction) 在多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上所产生的效应不同,这种现象称为该两因素存在交互作用。 如在表 6-27中:
A在 B1水平上的效应 =472-470=2
A在 B2水平上的效应 =512-480=32
B在 A1水平上的效应 =480-470=10
B在 A2水平上的效应 =512-472=40
显而易见,A的效应随着 B因素水平的不 同而不同,反之亦然,此时称 A,B两因素间存 在交互作用,记为 A× B。或者说,某一因素的 简单效应随着另一因素水平的变化而变化时,则称该 两 因 素 间 存 在 交互作用 。 互作效应 可由
(A1B1+A2B2-A1B2-A2B1)/2来估计。
表 6-27中的互作效应为:
(470+512-480-472)/2=15
下一张 主 页 退 出上一张所谓互作效应实际指的就是由于两个或两个以上试验因素的相互作用而产生的效应。如在表 6-27中:
A2B1-A1B1=472-470=2,这是添加赖氨酸单独作用的效应;
A1B2-A1B1=480-470=10,这是添加蛋氨酸单独作用的效应,
两者单独作用的效应总和是 2+10=12;
但是,A2B2-A1B1=512-470=42,而不是 12;
这就是说,同时添加赖氨酸,蛋氨酸产生的 效应下一张 主 页 退 出上一张不是单独添加一种氨基酸所产生效应的和,而另外多增加了 30,这个 30是两种氨基酸共同作用的结果。若将其平均分到每种氨基酸上,则各为
15,即估计的互作效应。
下面介绍两因素有重复观测值试验结果的方差分析方法。
下一张 主 页 退 出上一张