设 A与 B两因素分别具有 a与 b个水平,共有 ab个水平组合,每个水平组合有 n次重复,
则全试验共有 abn个观测值。这类试验结果的数据模式如表 6-28所示。
下一张 主 页 退 出上一张表 6-28 两因素有重复观测值试验数据模式下一张 主 页 退 出上一张表 6-28中
a
i
b
j
n
l
ijl
a
i
n
l
ijlj
b
j
n
l
ijli
n
l
ijlij
xx
xx
xx
xx
1 1 1
1 1
1 1
1
.
..,
..
..
a
i
b
j
n
l
ijl
a
i
n
l
ijlj
b
j
n
l
ijli
n
l
ijlij
abnxx
anxx
bnxx
nxx
1 1 1
1 1
1 1
1
.
/...
/..
/..
/
下一张 主 页 退 出上一张两因素有重复观测值试验资料的数学模型为,
(6-32)
其中,为总平均数;
αi为 Ai的效应;
βj为 Bj的效应;
(αβ) ij为 Ai与 Bj的互作效应,
),,2,,1;,,2,1;,,2,1(
)(
nlbjai
x ijlijjiijl
分别为 Ai,Bj,Ai Bj观测值总体平均数;且
,0)()()(,0,0
1 1 1 11 1
n
i
b
j
a
i
b
j
ijijij
a
i
b
j
ji
jiij
jiijij
..
)()()()(
ijji,,
为随机误差,相互独立,且都服从
N(0,σ2)。
两因素有重复观测值试验结果方差分析平方和与自由度的剖分式为:
(6-33)
其中,SSA× B,dfA× B为 A因素与 B因素交互作用平方和与自由度。
ijl?
eBABAT
eBABAT
dfdfdfdfdf
SSSSSSSSSS
下一张 主 页 退 出上一张若用 SSAB,dfAB表示 A,B水平组合间的平方和与自由度,即处理间平方和与自由度,则因处理变异可剖分为 A因素,B因素及 A,B交互作用变异三部分,于是 SSAB,dfAB可剖分为:
(6-34)
各项平方和、自由度及均方的计算公式如下,BABAAB
BABAAB
dfdfdfdf
SSSSSSSS
下一张 主 页 退 出上一张矫正数
abnxC /2...?
B因素平方和与自由度
12 a b ndfCxSS TijlT,
11 2, abdfCxnSS ABijAB,
11 2., adfCxbnSS AiA,
11 2,, bdfCxanSS BjB,
总平方和与自由度水平组合平方和与自由度
A因素平方和与自由度
( 6-35)
交互作用平方和与自由度误差平方和与自由度
)1)(1(
,
badf
SSSSSSSS
BA
BAABBA
)1(
,
nabdf
SSSSSS
e
ABTe
下一张 主 页 退 出上一张相应均方为
eee
BABABA
BBB
AAA
dfSSMS
dfSSMS
dfSSMS
dfSSMS
/
,/
,/
,/
【 例 6.6】 为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙 (A)、磷 (B)
在饲料中的含量各分 4个水平进行交叉分组试验。选用品种、性别、日龄相同,初始体重基本一致的幼猪 48 头,随机分成
16组,每组 3头,用能量、蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果 (kg)列于表 6-29,试分析钙磷对幼猪生长发育的影响。
下一张 主 页 退 出上一张本例 A因素 ─ 钙的含量分 4个水平,即
a=4; B因素 ─ 磷的含量分 4个水平,即 b=4;
共有 ab=4× 4=16个水平组合;每个水平组合重复数 n=3;全试验共有 =4× 4× 3=48个观测值 。
表 6-29 不同钙磷用量 (%)的试验猪增重结果 (kg)
下一张 主 页 退 出上一张下一张 主 页 退 出上一张
1、计算各项平方和与自由度
4 9 1 9.3 6 6 8 0)344/(9.1 3 2 6
/
2
2
...
a b nxC
3181.9824919.3 6 6 8 08100.3 7 6 6 2
4919.3 6 6 8 0)0.190.205.260.22( 22222
CxSS ijlT
9048.8344919.3 6 6 8 03967.3 7 5 1 5
4919.3 6 6 8 0)5.575.839.72(
3
11 2222
.
Cx
n
SS ijAB
下一张 主 页 退 出上一张
7356.3834919.366802275.37064
4919.36680)1.2788.3578.3632.327(
34
11
5106.44
4919.366800025.36725
4919.36680)5.3194.3321.3509.324(
34
1
1
22222
..
2222
2
..
Cx
an
SS
Cx
bn
SS
jB
iA
6586.406
7356.3835106.449048.834
BAABBA
SSSSSSSS
151441
4713441
4133.1479048.8343181.982
abdf
abndf
SSSSSS
AB
T
ABTe
32)13(44)1(
9)14)(14()1)(1(
3141
3141
nabdf
badf
bdf
adf
e
BA
B
A
下一张 主 页 退 出上一张
2、列出方差分析表,进行 F检验表 6-30 不同钙磷用量方差分析表下一张 主 页 退 出上一张查临界 F值:
F0.05(3,32)=2.90,F0.01(3,32)=4.47;
F0.01(9,32)=3.02。
因为,FA> F0.05(3,32); FB> F0.01(3,32);
FA× B> F0.01(9,32),表明钙、磷及其互作对幼猪的生长发育均有显著或极显著影响。因此,应进一步进行钙各水平平均数间,磷各水平平均数间、钙与磷水平组合平均数间的多重比较和进行简单效应的检验。
下一张 主 页 退 出上一张
3,多重比较
(1)钙含量 (A)各水平平均数间的比较表 6-31 不同钙含量平均数比较表 (q法 )
下一张 主 页 退 出上一张因为 A因素各水平的重复数为 bn,故 A因素各水平的标准误 (记为 )的计算公式为:
此例,
由 dfe=32,秩次距 k=2,3,4,从附表 5中查出 α=0.05与 α=0.01的 临 界 q 值,乘以
=0.6196,即得各 LSR值,所得结果列于表 6-32。
..ixS
bnMSS ex i /...,?
6196.0)34/(6067.4.,ixS
..ixS
下一张 主 页 退 出上一张表 6-32 q值与 LSR值表下一张 主 页 退 出上一张检验结果标记在表 6-33中 。
(2) 磷含量 (B)各水平平均数间的比较表 6-33 不同磷含量平均数比较表 (q法 )
下一张 主 页 退 出上一张因 B因素各水平的重复数为 an,故 B因素各水平的标准误 (记为 )的计算公式为:
在本例,由于 A,B两因素水平数相等,即
a=b=4,故 。 因而,A、
B两因素各水平比较的 LSR值是一样的,所以用表 6-32的 LSR值去检验 B因素各水平平均数间差数的显著性,结果见表 6-33。
..jxS
anMSS ex j /.,?
6 1 9 6.0..., ij xx SS
下一张 主 页 退 出上一张以上所进行的两项多重比较,实 际 上是 A、
B两因素主效应的检验。结果表明,钙的含量以占饲料量的 0.8%(A2)增重效果最好;磷的含量以占饲料量的 0.6%(B2)增重效果最好。若 A,B
因素交互作用不显著,则可从主效应检验中分别选出 A,B因素的最优水平相组合,得到最优水平组合;若 A,B因素交互作用显著,则应进行水平组合平均数间的多重比较,以 选出最优水平组合,
同时可进行简单效应的检验。
下一张 主 页 退 出上一张
(3)各水平组合平均数间的比较因为水平组合数通常较大 (本例 ab=4× 4=16),
采用 最小显著极差法进行各水平组合平均数的比较,
计算较麻烦。为了简便起见,常采用 T检验法。所谓 T
检验法,实 际 上 就是以 q检测法中秩次距 k最大时的
LSR值作为检验尺度检验各水平组合平均数间的差异显著性。
下一张 主 页 退 出上一张因为水平组合的重复数为 n,故水平组合的标准误(记为 )的计算公式为:
此例由 dfe=32,k=16 从 附 表 5 中 查 出
a=0.05,a=0.01的临界 q值,乘以
=1.2392,得各 LSR值,即以上述 LSR值去检验各水平组合平均数间的差数,结果列于表 6-34。
.ijxS
nMSS ex ij /,?
2 3 9 2.13/6 0 6 7.4/, nMSS ex ij
.ijxS
65.72392.117.6
51.62392.125.5
.
.
)16,32(05.0)16,32(01.0
)16,32(05.0)16,32(05.0
ij
ij
x
x
SqLS R
SqLS R
下一张 主 页 退 出上一张表 6-34 各水平组合平均数比较表 (T法 )
下一张 主 页 退 出上一张各水平组合平均数的多重比较结果表明,
由于钙磷交互作用的存在,最优组合 (即增重好的组合 ) 并不是 A2B2,而是 A2B3,即钙含量
0.8%和磷含量 0.4%的组合增重效果最好 。
以上的比较结果告诉我们:当 A,B因素的交互作用显著时,一般不必进行两个因素主效应的显著性检验 (因为这时主效应的显著性在实用意义上并不重要 ),而直接进行各水平组合平均数的多重比较,选出最优水平组合。
下一张 主 页 退 出上一张
(4) 简单效应的检验简单效应实际上是特定水平组合平均数间的 差 数 。 检 验 尺 度 仍 为 (3) 中的
LSR0.05=6.51,LSR0.01=7.65。
① A因素各水平上 B因素各水平平均数间的比较
A1水平 (1.0)
下一张 主 页 退 出上一张
A2水平 (0.8)
A3水平 (0.6)
下一张 主 页 退 出上一张
A4水平 (0.4)
② B因素各水平上 A因素各水平平均数间的比较下一张 主 页 退 出上一张下一张 主 页 退 出上一张简单效应检验结果表明:当饲料中钙含量达 1.0%时,磷含量各水平平均数间差异不显著;当饲料中钙含量为 0.8% 时,磷含量以
0.4%为宜 ( 但与磷含量为 0.6% 的差异不显著 ) ;当钙为 0.6%时,磷以 0.6%为好,
且有小猪的生长发育对磷含量的变化反应比较敏感的迹象 ; 当钙含量为 0.4% 时,磷以
0.8%为好 (但与磷含量为 0.6%,0.4%的差异不显著 );就试验中所选择的钙磷含量水平来看,有一种随着饲料中钙含量的减少,要求磷含量增加的趋势。
下一张 主 页 退 出上一张当磷含量 0.8%时,钙以 0.4%为好,但除显著高于钙为 1.0% 的水平外,与 钙 为
0.6%,0.8%的差异不显著;当磷的水平为
0.6%时,钙的水平也以 0.6%为好,但除显著高于钙为 1.0%的水平外,与钙为 0.4%、
0.8%的差异不显著;磷含量 0.4%时,钙含量以 0.8%为好;磷含量为 0.2%时,钙水平达到 1.0%效果较好,但与钙为 0.8%的差异不显著。 同样 也呈现一种随着磷含量降低,钙水平应提高的趋势。
下一张 主 页 退 出上一张综观全试验,以 A2B3(钙 0.8%,
磷 0.4%)效果最好,钙磷含量均高或均低效果都差。
二、系统分组资料的方差分析在生物科学的研究中,实际问题是多种多样的,有些涉及多因素问题的研究或试验用交叉分组是困难的。例如,要比较 a头公畜的种用价值,就必须考虑到与配的母畜。 这是因为公畜的种用价值是通过后代的表现来评定的,而后代的表现除受公畜的影响外还要受到母畜 的影响。但是在同期,公畜和母畜这两个因素的不同水平 ( 不同公畜和不同母畜 ) 是 不能交叉的,即同一头母畜不能同时与不同的公畜交配产生后代。 合理的方法是,选择一些生产性能下一张 主 页 退 出上一张大体一致的同胎次母畜随机分配与 a头公畜交配,即公畜 A1与一组母畜交配,公畜 A2与另一组母畜交配 …… 。然后通过后代的性能表现来判断这些公畜的种用价值有无显著差异 。
又如,为了比较利用同一设备生产同一种饲料的不同班组产品质量有无差异,我们可从每班组所生产的饲料中随机抽取若干样品,每个样品作若干次测定,根据测定结果判断不同班组的产品质量有无差异。
下一张 主 页 退 出上一张在安排多因素试验方案时,将 A因素分为 a 个水平,在 A因素每个水平 Ai下又将 B因素分成 b个水平,再 在 B 因素每个水平 Bij下将 C因素分 c个水平 ……,这样得到各因素水平组合的方式称为 系统分组 (hierarchical classification) 或称 多层分组、套设计、窝设计 。
在系统分组中,首先划分水平的因素 (上述的不同公畜、不同班组 ) 叫 一级因素 ( 或 一 级样本 ),其次划分水平的因素 (如上述的母畜、抽取的样品 )叫二级因素 (二级样本,次级样本 ),类此有三级因素 …… 。在系统分组中,次级因素的各水平会套在一级因素的每个水平下,它们之间是从属关系而不是平等关系,分析侧重于一级因素。
下一张 主 页 退 出上一张由系统分组方式安排的多因素试验而得到的资料称为系统分组资料 。 根据次级样本含量是否相等,系统分组资料分为次级样本含量相等与不等两种 。 最简单的系统分组资料是二因素系统分组资料 。
如果 A因素有 a 个水平; A因素每个水平
Ai下,B因素分 b个水平; B因素每个水平 Bij下有 n个观测值,则共有 abn个观测值,其数据模式如表 6-35所示。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张表 6-35 二因素系统分组资料数据模式表 6-35中,
数学模型为
(6-36)
n
l
ijlij xx
1
,nxx ijij /.,?
b
j
n
l
ijli xx
1 1
.,bnxx ii /...,?
a
i
b
j
n
l
ijlxx
1 1 1
..,a b nxx /.....,?
),,2,,1;,,2,1;,,2,1( nlbjai
x ijlijiijl
下一张 主 页 退 出上一张式中 μ为总体平均数,ai为 Ai的效应,β ij
为 Ai内 Bij的效应,,
分别为 Ai,Bij观测值总体平均数。 为随机误差,相互独立,且都服从 N(0,σ2)。
表 6-35数据的总变异可分解为 A因素各水平
(Ai)间的变异 (一级样本间的变异 ),A因素各水平 (Ai)内 B因素各水平 (Bij)间的变异 (一级样本内二级样本间的变异 )和试验误差 (B因素各水平内观测值间的变异 )。 对两因素系统分组资料进行方差分析,平方和与自由度的剖分式为:;,iijijii i? ij?
ijl?
下一张 主 页 退 出上一张
SST=SSA+SSB(A)+SSe
dfT =dfA +dfB(A) +dfe (6-37)
各项平方和与自由度计算公式如下:
1
)(
/
1 1 1 1 1 1
22
...
2
2
...
abndf
CxxxSS
abnxC
T
a
i
b
j
n
l
a
i
b
j
n
l
ijlijlT
总平方和及其自由度下一张 主 页 退 出上一张
)1(
)(
)(
)1(
)(
1
)(
)(
1 1 1 1 1 1 1 1
2
.
1
22
.)(
)(
1 1 1 1 1
2
..
1
2
.
1
2
...)(
1 1
2
..
1
2
.....
nabdfdf
xxxxSSSS
badf
xxxxnSS
adf
CxxxbnSS
BCe
a
i
b
j
n
l
a
i
b
j
n
l
a
i
b
j
ijnijlijijlBCe
AB
a
i
b
j
a
i
b
j
a
i
ibnijniijAB
A
n
i
a
i
ibniA
平方和及其自由度二级因素内三级因素误差方和及其自由度一级因素内二级因素平由度一级因素平方和及其自
(6-38)
下一张 主 页 退 出上一张各项均方如下:
一级因素的均方一级因素内二级因素的均方误差 (二级因素内三级因素 )均方
F检验时 F值的计算:
当检验一级因素时,用 作分母,
即,
当检验一级因素内二级因素时,用 作分母,即,
AAA dfSSMS /?
)()()( / ABABAB dfSSMS?
eeBC dfSSMS /)(?
)( ABMS
)(/ ABA MSMSF?
eMS
eAB MSMSF /)(?
下一张 主 页 退 出上一张实际上,计算 F值时分母项的选择是由有关因素的效应是固定还是随机所决定的 (即是由数学模型决定的 ),有关这方面的内容将在 第四节介绍。
(一 ) 次级样本含量相等的系统分组资料的方差分析
【 例 6.7】 为测定 3种不同来源的鱼粉的蛋白质消化率,在不含蛋白质的饲料里按一定比例分别加入不同的鱼粉 A1,A2,A3,配制成饲料,各喂给 3头试验动物 (B)。收集排泄物、风干、粉碎、
混和均匀 。 分别从每头动物的排泄物中各取两份样品作化学分析 。 测定结果 (xijl)列于表 6-36,
试 分 析不同来源鱼粉的蛋白质消化率是否有显著差异。
下一张 主 页 退 出上一张表 6-36 蛋白质的消化率下一张 主 页 退 出上一张这是一个二因素系统分组资料,A因素的水平数 a=3,Ai内 B因素的水平数 b=3,Bij内重复测定次数 n=2,共有 abn=3× 3× 2=18
个观测值,方差分析如下 。
1,计算各项平方和与自由度矫正数总平方和及其自由度
2 6 7 2.1 2 6 5 2 118/1.1 5 0 9/ 22.., abnxC
1712331
3428.1322672.1265216100.126653
2672.126521)3.805.794.825.82( 22222
abndf
CxSS
T
ijlT?
下一张 主 页 退 出上一张鱼粉间平方和及其自由度鱼粉内个体间的平方和及其自由度
2131
5011.1052672.1265217683.126626
2672.126521)8.4839.5184.506(
23
11 2222
..
adf
Cx
bn
SS
A
iA
6)13(3)1(
4567.257683.1 2 6 6 2 62250.1 2 6 6 5 2)8.4839.5184.506(
23
1
)8.1595.1606.1739.164(
2
111
)(
222
22222
..
2
.)(
badf
x
bn
x
n
SS
AB
iijAB
下一张 主 页 退 出上一张误差(个体内分析样品间 )平方和及其自由度
2、列出方差分析表,进行 F检验表 6-37 不同来源鱼粉蛋白质消化率方差分析表
9)12(33)1(
3850.12250.1 2 6 6 5 26100.1 2 6 6 5 31
)(
2
.
2
)(
nabdfdf
x
n
xSSSS
BCe
ijijlBCe
下一张 主 页 退 出上一张查临界 F值:
F0.01(2,6)=10.92,F0.01(6,9)=5.80,
因为鱼粉间的 F> F0.01(2,6),鱼粉内个体间的 F>
F0.01(6,9),表明不同来源的鱼粉蛋白质消化率差异极显著,即 3种鱼粉的质量差异极显著;喂同一鱼粉的不同个体对鱼粉的消化利用能力差异也极显著。
3、三种鱼粉平均消化率的多重比较 ( SSR法)
因为对一级因素(鱼粉)进行 F检验时是以鱼粉内个体间均方作为分母,鱼粉的重复数为 bn,所以鱼粉的标准误为:
下一张 主 页 退 出上一张以 dfB(A)=6,查附表 6 得 k=2,3 时
SSR0.05和 SSR0.01的值与 相乘求出相应的
LSR0.05和 LSR0.01的值,得,
k=2,LSR0.05=2.91 LSR0.01=4.41
k=3,LSR0.05=3.01 LSR0.01=4.63
8 4 0 9.06/2 4 2 8.4/)( bnMSS ABx
xS
下一张 主 页 退 出上一张表 6-38 三种鱼粉蛋白质平均消化率比较表 (SSR法 )
下一张 主 页 退 出上一张多重比较结果表明:鱼粉 A2的消化率极显著高于鱼粉 A3;鱼粉 A1的消化率显著高于鱼粉
A3;鱼粉 A1,A2的消化率差异不显著 。
对于鱼粉内个体间的差异问题,由于不是我们研究的重点,故可以不进行多重比较。若要比较时,标准误 应由 计算,
SSR值或 q值应以自由度 dfe=9去查。
xS
nMS e /
下一张 主 页 退 出上一张
(二 ) 次级样本含量不等的系统分组资料的方差分析
【 例 6.8】 某品种 3头公猪和 8头母猪所生仔猪的 35日龄断奶重资料如表 6-39所示,试就这些数据分析 不同公猪和 不同母猪对仔猪断奶重的影响是否有显著差异。
下一张 主 页 退 出上一张表 6-39 3头公猪和 8头母猪所产仔猪断奶重下一张 主 页 退 出上一张表中,a为公猪数; bi为第 i头公猪与配母猪数; ny为第 i头公猪与配第 j头母猪所产的仔猪数;
为第 i头公猪仔猪数; 为母猪总数;
为仔猪总数。
方差分析如下:
1,计算各项平方和与自由度
ib
j
iji ndn
1
a
i
ib
1
a
i
b
j
ij
i nN
1 1
下一张 主 页 退 出上一张矫正数总平方和及其自由度
8 8 0 0.5 4 0 963/8.5 8 3/ 22.., NxC
621631
4600.1498800.54093400.5559
8800.5409)0.118.113.85.10(
...)(
2222
1 1 1
2
1 1 1
2
Ndf
CxxxSS
T
a
i
b
j
n
l
ijl
a
i
b
j
n
l
ijlT
i iji ij
下一张 主 页 退 出上一张公猪间的平方和及其自由度公猪内母猪间的平方和及其自由度
2131
0235.118800.5409)23/6.21024/0.23416/2.139(
/)(
222
1 1
2
..
2
.....
adf
CdnxxxdnSS
A
a
i
a
i
iiiiA
a
i
a
i
iiAB
a
i
b
j
a
i
b
j
a
i
iiijijiijijAB
abbdf
dnxnxxxnSS
i i
1 1
)(
222
2222
1 1 1 1 1
2
..
2
.
2
...)(
538)1(
4785.819035.54203820.5502
)23/6.21024/0.23416/2.139(
)8/2.828/1.907/9.569/3.82(
//)(
下一张 主 页 退 出上一张母猪内仔猪间 ( 误差 ) 平方和及其自由度或或
9580.563820.55023400.5559
)8/2.828/1.907/9.569/3.82()0.118.113.85.10(
/)(
22222222
1 1 1 1 1
2
.
2
1 1 1
2
.)(
a
i
b
j
n
l
a
i
b
j
ijijijl
a
i
b
j
n
l
ijijleBC
i ij ii ij
nxxxxSSSS
9580.564785.810235.114600.149
)()(
ABATeBC SSSSSSSSSS
a
i
b
j
a
i
iijeBC
i
bNndfdf
1 1 1
)( 55863)1(
555262)()( ABATeBC dfdfdfdfdf
下一张 主 页 退 出上一张
2,列出方差分析表,进行 F检验表 6-40 3头公猪和 8头母猪所生仔猪断奶重的方差分析下一张 主 页 退 出上一张因为公猪间的 FA=0.34< 1,即 P> 0.05,
所以公猪对仔猪的断奶重影响差异不显著,可以认为它们的种用价值是一致的;因为公猪内母猪间的 FB(A)=15.74> F0.01(5,55)=3.37,即 P<
0.01,所以母猪对仔猪的断奶重影响差异极显著,
即同一公猪内不同母猪的仔猪断奶重有极显著的差异 。
3、多重比较 如果需对一级因素 (公猪 )各水平以及一级因素内二级因素 (母猪 ) 各水平均数进行多重比较 (SSR法或 q法 ),当对公猪平均数进行多重比较时,标准误为:
0)( / dnMSS ABx?
下一张 主 页 退 出上一张式中的 dn0为每头公猪的平均仔猪数,用公式 (6-41)(见第四节 )计算;当对母猪平均数进行多重比较时,标准误为:
式中 n0为每头母猪的平均仔猪数,用公式
(6-39)(见第四节 )计算 。 实际上对于此类资料,同一公猪内母猪平均数的多重比较一般可不进行 。
0)( / nMSS BCx?
下一张 主 页 退 出上一张
*第四节 方差分析的数学模型与期望均方一、数学模型方差分析的数学模型就是指试验资料的数据结构或者说是每一观测值的线性组成,
它是方差分析的基础。本章所涉及的几种方差分析法,其数学模型已相继介绍。
下一张 主 页 退 出上一张数学模型中的处理效应 αi(或 βj,βij),由于处理性质的不同,有固定效应 (fixed
effect) 和随机效应 (random effect) 之分。若按处理效应的类别来划分方差分析的模型,则有三种,即固定模型、随机模型和混合模型。就试验资料的具体统计分析过程而言,
这三种模型的差别并不太大,但从解释和理论基础而言,它们之间是有很重要的区别的。不论设计试验、解释试验结果,还是最后进行统计推断,都 必须了解这三种模型的意义和区别。 下一张 主 页 退 出上一张
1,固定模型 (fixed model)
在单因素试验的方差分析中,把 k个处理看作 k个明晰的总体 。 如果研究的对象只限于这 k个总体的结果,而不需推广到其它总体;研究目的在于推断这 k
个总体平均数是否相同,即在于检验 k个总体平均数相等的假设 H0,μ1=μ2=… =μk; H0被否定,下步工作在于作多重比较;重复试验时的处理仍为原 k个处理 。 这样,则 k个处理的效应 (如 αi=μi-μ)固定于所试验的处理的范围内,处理效应是固定的 。 这种模型称为固定模型 。 一般的饲养试验及品种比较试验等均属固定模型 。
下一张 主 页 退 出上一张
2、随机模型 (random model)
在单因素试验中,k个处理并非特别指定,而 是从更大的处理总体中随机抽取的 k个处理而已,即研究的对象不局限于这 k个处理所对应的总体的结果,而是着眼于这 k个处理所在的更大的总体;研究的目的不在于推断当前 k个处理所属总体平均数是否相同,而是从这 k个处理所得结论推断所在大总体的变异情况,检验的假设一般为处理效应方差等于零,即 H0,=0;
如果 H0被否定,进一步的工作是估计 ;重复试验时,可 在 大 处 理 总 体 中 随 机抽取新的处理。
2
2
下一张 主 页 退 出上一张这样,处理效应并不固定,而是随机的,这种模型称为随机模型 。 随机模型在遗传,育种和生态试验研究方面有广泛的应用 。 如,为研究中国猪种的繁殖性能的变异情况,从大量地方品种中随机抽取部分品种为代表进行试验,观察,其结果推断中国猪种的繁殖性能的变异情况,这就属于随机模型 。
在多因素试验中,若各因素水平的效应均属随机,
则对应于随机模型 。
下一张 主 页 退 出上一张
3,混合模型 (mixed model)
在多因素试验中,若既包括固定效应的试验因素,又包括随机效应的试验因素,则该试验对应于混合模型 。 混合模型在试验研究中是经常采用的 。 如在某地区的 4个不同杂交组合的猪及其亲本,分布于 5个猪场进行育肥试验 。
这里猪种效应是固定的,而试验场所 (猪场 )效应是随机的 。 又如 【 例 6-8】,若目的在于比较该 3头公猪的种用价值,与配母猪是随机抽取的,则公猪效应是固定的,而母猪效应是随机的 。 再如随机采用三个蛋鸡品系研究三种饲料的效应试验,这里蛋鸡品系效应是随机的,
而饲料效应是固定的 。
下一张 主 页 退 出上一张二、期望均方在第一节我们提到了期望均方的概念。由于模型不同,方差分析中各项期望均方的计算也有所不同,因而 F检验时分母项均方的选择也有所不同。现将不同方差分析中各种模型下各项期望均方及 F值计算分别列于下面各表,以便正确地进行 F检验和估计方差组分。
下一张 主 页 退 出上一张为了区分效应的两种模型 (随机及固定 ),
用 表示随机模型下处理效应方差,用 表示固定模型下处理效应方差。如对于 A因素,
随机模型时用 表示处理效应方差;固定模型时用 表示处理效应方差,此时,
1,单因素试验资料方差分析的期望均方
(1) 各处理重复数相等时
2 2
k
)1/()1/()( 222 kkk iiA
2
2
k
下一张 主 页 退 出上一张表 6-41 单因素试验重复数相等期望均方与 F检验下一张 主 页 退 出上一张
(2) 各处理重复数不等时表 6-42 单因素试验重复数不等期望均方与 F检验下一张 主 页 退 出上一张在表 6-42中,固定模型时,处理间均方
MSt的期望值为,是在 的条件下获得的;若条件为
Σαi=0 时,则 MSt 之期望值为 。 随 机 模 型 时,
的系数 no由下式计算:
22 )1/( kn ii
0 iin?
222 )1/(/)( knnn iiiii
2
i
i
i n
n
n
k
n
2
0 1
1
下一张 主 页 退 出上一张单因素试验资料的方差分析,不论是固定还是随机模型,F值的计算方法是一致的 。
2,交叉分组试验资料方差分析的期望均方
(1) 二因素交叉分组单独观测值时下一张 主 页 退 出上一张表 6-43 两因素交叉分组单独观测值的期望均方与 F检验下一张 主 页 退 出上一张由表 6-43中可以看出,对两因素交叉分组单独观测值试验资料的 方 差 分 析,不论是固定、随机还是混合模型,F检验分母项都是误差均方 MSe,此时无法求得 。
(2) 两因素交叉分组有重复观测值时
2
BA
下一张 主 页 退 出上一张表 6-44 两因素交叉分组有重复观测值的期望均方与 F检验下一张 主 页 退 出上一张由表 6-44可知,两因素交叉分组有重复观测值试验资料的方差分析,对主效应和互作进行
F检验随模型不同而异 。 对于固定模型,均用
MSe作分母;对于随机模型,检验 H0,=0
时,用 MSe作分母,而检验 H0,=0 =0时都用 MSA× B作分母;对于混合模型 (A随机,B
固定 ),检验 H0,=0和 =0都用 MSe作分母,而检验 H0,K2B=0时,则以 MSA× B作分母 。
(A固定,B随机时,与此类似 )。
3,系统分组资料方差分析的期望均方
2
BA
2
A?
2
B?
2
A? 2 BA
下一张 主 页 退 出上一张表 6-45 二因素系统分组次级样本含量相等的期望均方与 F检验下一张 主 页 退 出上一张
A固定,B随机时的 F检验与随机模型同;
A随机,B固定时的 F检验与固定模型同 。
在随机模型下,当次级样本含量不等时,
各项均方的期望值与 F检验如下。
表 6-46 二因素系统分组次级样本含量不等的期望均方与 F检验下一张 主 页 退 出上一张表 6-45,6-46中,σ2是二级因素内观测值间的方差,即误差方差; 是 一级因素水平内二级因素水平效应方差; 是 一级因素水平效应方差; no和 都是每个 二级因素水平下的平均重复数 (即平均观测值个数 ),其中
no是一级因素水平内每个二级因素水平下 平均重复数; 是一级因素水平间每个二级因素水平的平均重复数; dn0是每个一级因素水平的平均重复数。 no,及 dno的计算公式如下:
2
)(AB?
2
A?
0'n
0'n
0'n
下一张 主 页 退 出上一张
(6-39)
(6-40)
(6-41)
式中,N 为全部观测值个数;
为一级因素 Ai水平内二级因素 Bij水平的重复数;
为一级因素 Ai水平的重复数;
)(
2
0
)(
AB
i i
j
ij
df
dn
n
N
n
A
i
ji
ij
i
j
ij
df
N
n
dn
n
n
,
22
0
)(
'
A
i
df
N
dn
N
dn
2
0
)(?
ijn
idn 下一张 主 页 退 出上一张为一级因素内二级因素的自由度;
为一级因素的自由度。
三、方差组分的估计上面我们分别介绍了单因素试验,交叉分组、系统分组多因素试验资料的方差分析 中各种均方在不同模型下的期望值。了解期望均 方的组成,不仅有助于正确进行 F检验,而且也有助于参数估计。最常见的就是估计 方差组分,
又称方差分量分析。方差组分,亦即 方差分量
(variance components),是指 方差的组成成分。根据资料模型和期望均方的组成,就可估计出所需要的方差组分。
)(ABdf
Adf
下一张 主 页 退 出上一张方差组分的估计主要是指对随机模型的方差组分估计 。 因为在这种模型下,我们研究的目的就在于从总体上了解各因素对试验指标所产生的效应方差 。
在研究数量性状的遗传变异时,对一些遗传参数的估计,如重复率,遗传力和性状间的遗传相关的估计都是在随机模型方差组分估计的基础上进行的 。
下面结合实例说明方差组分的估计。
下一张 主 页 退 出上一张如果将 【 例 6.8】 中 3头公猪,与配母猪及它们所生仔猪的断奶重资料,看作是从该品种总体中随机抽取的样本,则公猪及其与配母猪对所产仔猪断奶重影响的效应是随机的,因而 该资料属随机模型 。 方差组分估计如下:
因次级样体含量不等,由表 6-46可知:
下一张 主 页 退 出上一张公猪间期望均方公猪内母猪间期望均方母猪内仔猪间期望均方因而
202 )(02 ' AABA dnnMSE
2 )(02)( ABAB nMSE
2eMSE
eMS?2
0)(0
2
0)(
2
)(
/)?'(?
/)(?
dnnMSMS
nMSMS
ABeAA
eABAB
下一张 主 页 退 出上一张在方差分量分析中,当次级样本含量不相等时,需依公式 (6-39),(6-40),(6-41)
求三个相应的加权平均数。本例各公、母猪的仔猪数不等,故先算三个加权平均数如下:
因为下一张 主 页 退 出上一张
6032.21
63
232416)(
9524.7
63
177194130
63
87897879
9040.23
23
177
24
194
16
130
23
878
24
978
16
79
)(
222
2
22222222
,
2
22222222
2
N
dn
N
n
dn
n
i
ji
ij
i i
j
ij
代入公式 (6-39),(6-40),(6-41)得将 及 【 例 6-8】 算出的有关均方值代入上面各方差组分计算式得:
6984.202/)6032.2163(
9758.72/)9524.79040.23('
8192.75/)9040.2363(
0
0
0
dn
n
n
000 ' dnnn,、
5358.06984.20/)9516.19758.70356.15118.5(
/)?'(?
9516.18192.7/)0356.12957.16(
/)(?
0356.1?
0
2
)(0
2
0)(
2
)(
2
dnnMSMS
nMSMS
MS
ABeAA
eABAB
e
下一张 主 页 退 出上一张这里应当注意,公 猪效应方差的估计值为 -0.5358,这是不合理的。这主要是由于母猪间方差组分 ( )过大所致 (一般 MSB(A)
> MSA时,就是负值 )。在这种情况下,
可将原资料中二级因素 (母猪 )去掉,仅就公猪因素作随机模型下的各处理重复数 不等的单因素方差分析,进而重新估计公猪间方差组分。
过程如下:
2
)(AB?
2?A?
下一张 主 页 退 出上一张
MSA不变,仍为 5.5118
由表 6-42可知:
故再先由下式计算 no,〔 注意,这里的 no不同于由公式 (6-39)求得的 no〕 。
4.1380235.114600.149 ATe SSSSSS
3073.2)363/(4365.138)/( aNSSMS ee
220 AA nMSE
2eMSE
eMS?2 0/)(
2? nMSMS
A ea
下一张 主 页 退 出上一张这实际就是由公式 (6-41)求得的 dno。
于是:
1548.06984.20/)3073.25118.5(/)(?
3073.2?
0
2
2
nMSMS
MS
eAA
e
6984.20
63
1361
63
2
1
232416
232416
)232416(
13
1
1
1 222
2
0
i
i
i
dn
dn
dn
a
n
下一张 主 页 退 出上一张第五节 数据转换前面介绍的几种试验资料的方差分析法,尽管其数学模型的具体表达式有所不同,但以下三点却是共同的。
下一张 主 页 退 出上一张
1、效应的可加性我们据以进行方差分析的模型均为 线 性可加模型。这个模型明确提出了处理效应与误差效应应该是
,可加的,,正是由于这一,可加性,,才有了样本平方和的,可加性,,亦即有了试验观测值总平方和的,可剖分,性。如果试验资料不具备这一性质,那么变量的总变异依据变异原因的剖分将失去根据,方差分析不能正确进行。
下一张 主 页 退 出上一张
2,分布的正态性是指所有试验误差是相互独立的,且都服从正态分布 N(0,
σ2)。 只有在这样的条件下才能进行 F检验 。
3、方差的同质性即各个处理观测值总体方差 σ2应是相等的。只有这样,才有理由以各个处理均方的合并均方作为检验各处理差异显著性的共同的误差均方。
下一张 主 页 退 出上一张上述三点是进行方差分析的基本前提或基本假定 。 如果在分差分析前发现有某些异常的观测值,处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下应加以删除 。 但是,有些资料就其性质来说就不符合方差分析的基本假定 。 其中最常见的一种情况是处理平均数和均方有一定关系 (如二项分布资料,平均数,均方 ;
泊松分布资料的平均数与方差相等 )。 对这类
pn )?1( 2 ppn
下一张 主 页 退 出上一张资 料 不 能 直 接 进 行 方 差分析,而 因 考 虑 采用 非 参 数 方 法 分 析 或 进 行 适 当 数 据 转 换
(transformation of data)后再作方差分析。
这里我们介绍几种常用的数据转换方法。
1,平方根转换 ( square root
transformation )
此法适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。转换的方法是求出原数据的平方根 。若原观测值中有为 0的数或多数观测值小于 10,则把原数据变换成 对于稳定均方,使方差符合同质性的作用更加明显。变换也有利于满足效应可加性和正态性的要求。
x
1?x
下一张 主 页 退 出上一张
2,对 数 转 换 (logarithmic
transformation)
如果各组数据的标准差或全距与其平均数大体成比例,或者效应为相乘性或非相加性,
则将原数据变换为对数 (lgx或 lnx)后,可以使方差变成比较一致而且使效应由相乘性变成相加性 。
如果原数据包括有 0,可以采用 lg(x+1)
变换的方法。
一般而言,对数转换对于削弱大变数的作用要比平方根转换更强。例 如 变 数 1,10、
100作平方根转换是 1,3.16,10,作对数转换则是 0,1,2。
下一张 主 页 退 出上一张
3,反 正 弦 转 换 ( arcsine
transformation )
反正弦转换也称角度转换。此法 适用于 如发病率,感染率、病死率、受胎率等服从 二项分布 的资料。转换的方法是求出每个原数据 (用百分数或小数表示 )的反正弦,转换后的数值是以度为单位的角度。 二项分布的特点是其方差与平均数有着函数关系。这种关系表现在,当平均数接近极端值 (即接 近 于 0 和 100% )时,方 差 趋 向 于 较 小 ;
而 平均数处于 中 间 数 值 附 近 ( 50% 左 右 )
时,方 差 趋 向 于 较 大 。把 数 据 变 成 角 度 以
p1s in?
下一张 主 页 退 出上一张后,接近于 0和 100%的数值变异程度变大,
因此使方差较为增大,这 样 有利于满足方差同质性的要求。一 般,若 资 料 中 的 百 分数介于 30%— 70%之间时,因资料的分布接近于正态分布,数据变换与否对分析的影响不大。
应当注意的是,在对转换后的数据进行方差分析时,若经检验差异显著,则进行平均数的多重比较应用转换后的数据进行计算 。 但在解释分析最终结果时,应还原为原来的数值 。
【 例 6.9】 表 6-47为甲,乙,丙三个地区乳牛隐性乳房炎阳性率资料,试对资料进行方差分析 。
下一张 主 页 退 出上一张表 6-47 三地区乳牛隐性乳房炎阳性率 (%)
这是一个服从二项分布的阳性率资料,且有低于 30%和高于 70%的,应先对阳性率资料作反正弦转换,转换结果见表 6-48。
下一张 主 页 退 出上一张表 6-48 表 6-47资料的反正弦转换值表 6-48资料的方差分析,见表 6-49。
下一张 主 页 退 出上一张表 6-49 表 6-48资料的方差分析
F检验结果表明,各地区间乳牛隐性乳房炎阳性率差异极显著。下面进行多重比较。
表 6-50 表 6-48资料平均数多重比较表 (SSR法 )
下一张 主 页 退 出上一张因,SSR值 LSR
值见表 6-51
表 6-51 SSR值与 LSR值
18,54.37/7 5 0 0.87 ex dfS
下一张 主 页 退 出上一张对结论作解释时,应将各组平均数还原为阳性率。如表 6-50 中 平 均 数 53.27 根 据
P=sin2x,还原为 64.2%;均数 32.58还原为 29.0%;均数 28.56还原为 22.8%。但从变换过的数据所算出的方差或标准差不宜再换回原来的数据。
检验结果表明,甲地区乳牛隐性乳房炎阳性率极显著高于丙地区和乙地区,乙地区与丙地区阳性率差异不显著 。
下一张 主 页 退 出上一张以上介绍了三种数据转换常用方法。对于一般非连续性的数据,最好在方差分析前先检查各处理平均数与相应处理内均方是否存在相关性和各处理均方间的变异是否较大。如果存在相关性,或者变异较大,则应考虑对数据作出变换。 有 时 要确定适当的转换方法并不容易,可事先在试验中选取几个其平均数为大、
中、小的处理试验作转换。哪种方法能使处理平均数与其均方的相关性最小,哪种方法就是最合适的转换方法。另外,还有一些别的转换下一张 主 页 退 出上一张方法可以考虑。例如当各处理标准差与其 平均数 的 平 方 成 比 例 时,可 进 行 倒 数转换
(reciprocal transformation);对于一些分 布 明 显 偏 态 的 二项分布资料,有人进行的转换,可使 x呈良好的正态分布。
2/11 )( s in px
下一张 主 页 退 出上一张
则全试验共有 abn个观测值。这类试验结果的数据模式如表 6-28所示。
下一张 主 页 退 出上一张表 6-28 两因素有重复观测值试验数据模式下一张 主 页 退 出上一张表 6-28中
a
i
b
j
n
l
ijl
a
i
n
l
ijlj
b
j
n
l
ijli
n
l
ijlij
xx
xx
xx
xx
1 1 1
1 1
1 1
1
.
..,
..
..
a
i
b
j
n
l
ijl
a
i
n
l
ijlj
b
j
n
l
ijli
n
l
ijlij
abnxx
anxx
bnxx
nxx
1 1 1
1 1
1 1
1
.
/...
/..
/..
/
下一张 主 页 退 出上一张两因素有重复观测值试验资料的数学模型为,
(6-32)
其中,为总平均数;
αi为 Ai的效应;
βj为 Bj的效应;
(αβ) ij为 Ai与 Bj的互作效应,
),,2,,1;,,2,1;,,2,1(
)(
nlbjai
x ijlijjiijl
分别为 Ai,Bj,Ai Bj观测值总体平均数;且
,0)()()(,0,0
1 1 1 11 1
n
i
b
j
a
i
b
j
ijijij
a
i
b
j
ji
jiij
jiijij
..
)()()()(
ijji,,
为随机误差,相互独立,且都服从
N(0,σ2)。
两因素有重复观测值试验结果方差分析平方和与自由度的剖分式为:
(6-33)
其中,SSA× B,dfA× B为 A因素与 B因素交互作用平方和与自由度。
ijl?
eBABAT
eBABAT
dfdfdfdfdf
SSSSSSSSSS
下一张 主 页 退 出上一张若用 SSAB,dfAB表示 A,B水平组合间的平方和与自由度,即处理间平方和与自由度,则因处理变异可剖分为 A因素,B因素及 A,B交互作用变异三部分,于是 SSAB,dfAB可剖分为:
(6-34)
各项平方和、自由度及均方的计算公式如下,BABAAB
BABAAB
dfdfdfdf
SSSSSSSS
下一张 主 页 退 出上一张矫正数
abnxC /2...?
B因素平方和与自由度
12 a b ndfCxSS TijlT,
11 2, abdfCxnSS ABijAB,
11 2., adfCxbnSS AiA,
11 2,, bdfCxanSS BjB,
总平方和与自由度水平组合平方和与自由度
A因素平方和与自由度
( 6-35)
交互作用平方和与自由度误差平方和与自由度
)1)(1(
,
badf
SSSSSSSS
BA
BAABBA
)1(
,
nabdf
SSSSSS
e
ABTe
下一张 主 页 退 出上一张相应均方为
eee
BABABA
BBB
AAA
dfSSMS
dfSSMS
dfSSMS
dfSSMS
/
,/
,/
,/
【 例 6.6】 为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙 (A)、磷 (B)
在饲料中的含量各分 4个水平进行交叉分组试验。选用品种、性别、日龄相同,初始体重基本一致的幼猪 48 头,随机分成
16组,每组 3头,用能量、蛋白质含量相同的饲料在不同钙磷用量搭配下各喂一组猪,经两月试验,幼猪增重结果 (kg)列于表 6-29,试分析钙磷对幼猪生长发育的影响。
下一张 主 页 退 出上一张本例 A因素 ─ 钙的含量分 4个水平,即
a=4; B因素 ─ 磷的含量分 4个水平,即 b=4;
共有 ab=4× 4=16个水平组合;每个水平组合重复数 n=3;全试验共有 =4× 4× 3=48个观测值 。
表 6-29 不同钙磷用量 (%)的试验猪增重结果 (kg)
下一张 主 页 退 出上一张下一张 主 页 退 出上一张
1、计算各项平方和与自由度
4 9 1 9.3 6 6 8 0)344/(9.1 3 2 6
/
2
2
...
a b nxC
3181.9824919.3 6 6 8 08100.3 7 6 6 2
4919.3 6 6 8 0)0.190.205.260.22( 22222
CxSS ijlT
9048.8344919.3 6 6 8 03967.3 7 5 1 5
4919.3 6 6 8 0)5.575.839.72(
3
11 2222
.
Cx
n
SS ijAB
下一张 主 页 退 出上一张
7356.3834919.366802275.37064
4919.36680)1.2788.3578.3632.327(
34
11
5106.44
4919.366800025.36725
4919.36680)5.3194.3321.3509.324(
34
1
1
22222
..
2222
2
..
Cx
an
SS
Cx
bn
SS
jB
iA
6586.406
7356.3835106.449048.834
BAABBA
SSSSSSSS
151441
4713441
4133.1479048.8343181.982
abdf
abndf
SSSSSS
AB
T
ABTe
32)13(44)1(
9)14)(14()1)(1(
3141
3141
nabdf
badf
bdf
adf
e
BA
B
A
下一张 主 页 退 出上一张
2、列出方差分析表,进行 F检验表 6-30 不同钙磷用量方差分析表下一张 主 页 退 出上一张查临界 F值:
F0.05(3,32)=2.90,F0.01(3,32)=4.47;
F0.01(9,32)=3.02。
因为,FA> F0.05(3,32); FB> F0.01(3,32);
FA× B> F0.01(9,32),表明钙、磷及其互作对幼猪的生长发育均有显著或极显著影响。因此,应进一步进行钙各水平平均数间,磷各水平平均数间、钙与磷水平组合平均数间的多重比较和进行简单效应的检验。
下一张 主 页 退 出上一张
3,多重比较
(1)钙含量 (A)各水平平均数间的比较表 6-31 不同钙含量平均数比较表 (q法 )
下一张 主 页 退 出上一张因为 A因素各水平的重复数为 bn,故 A因素各水平的标准误 (记为 )的计算公式为:
此例,
由 dfe=32,秩次距 k=2,3,4,从附表 5中查出 α=0.05与 α=0.01的 临 界 q 值,乘以
=0.6196,即得各 LSR值,所得结果列于表 6-32。
..ixS
bnMSS ex i /...,?
6196.0)34/(6067.4.,ixS
..ixS
下一张 主 页 退 出上一张表 6-32 q值与 LSR值表下一张 主 页 退 出上一张检验结果标记在表 6-33中 。
(2) 磷含量 (B)各水平平均数间的比较表 6-33 不同磷含量平均数比较表 (q法 )
下一张 主 页 退 出上一张因 B因素各水平的重复数为 an,故 B因素各水平的标准误 (记为 )的计算公式为:
在本例,由于 A,B两因素水平数相等,即
a=b=4,故 。 因而,A、
B两因素各水平比较的 LSR值是一样的,所以用表 6-32的 LSR值去检验 B因素各水平平均数间差数的显著性,结果见表 6-33。
..jxS
anMSS ex j /.,?
6 1 9 6.0..., ij xx SS
下一张 主 页 退 出上一张以上所进行的两项多重比较,实 际 上是 A、
B两因素主效应的检验。结果表明,钙的含量以占饲料量的 0.8%(A2)增重效果最好;磷的含量以占饲料量的 0.6%(B2)增重效果最好。若 A,B
因素交互作用不显著,则可从主效应检验中分别选出 A,B因素的最优水平相组合,得到最优水平组合;若 A,B因素交互作用显著,则应进行水平组合平均数间的多重比较,以 选出最优水平组合,
同时可进行简单效应的检验。
下一张 主 页 退 出上一张
(3)各水平组合平均数间的比较因为水平组合数通常较大 (本例 ab=4× 4=16),
采用 最小显著极差法进行各水平组合平均数的比较,
计算较麻烦。为了简便起见,常采用 T检验法。所谓 T
检验法,实 际 上 就是以 q检测法中秩次距 k最大时的
LSR值作为检验尺度检验各水平组合平均数间的差异显著性。
下一张 主 页 退 出上一张因为水平组合的重复数为 n,故水平组合的标准误(记为 )的计算公式为:
此例由 dfe=32,k=16 从 附 表 5 中 查 出
a=0.05,a=0.01的临界 q值,乘以
=1.2392,得各 LSR值,即以上述 LSR值去检验各水平组合平均数间的差数,结果列于表 6-34。
.ijxS
nMSS ex ij /,?
2 3 9 2.13/6 0 6 7.4/, nMSS ex ij
.ijxS
65.72392.117.6
51.62392.125.5
.
.
)16,32(05.0)16,32(01.0
)16,32(05.0)16,32(05.0
ij
ij
x
x
SqLS R
SqLS R
下一张 主 页 退 出上一张表 6-34 各水平组合平均数比较表 (T法 )
下一张 主 页 退 出上一张各水平组合平均数的多重比较结果表明,
由于钙磷交互作用的存在,最优组合 (即增重好的组合 ) 并不是 A2B2,而是 A2B3,即钙含量
0.8%和磷含量 0.4%的组合增重效果最好 。
以上的比较结果告诉我们:当 A,B因素的交互作用显著时,一般不必进行两个因素主效应的显著性检验 (因为这时主效应的显著性在实用意义上并不重要 ),而直接进行各水平组合平均数的多重比较,选出最优水平组合。
下一张 主 页 退 出上一张
(4) 简单效应的检验简单效应实际上是特定水平组合平均数间的 差 数 。 检 验 尺 度 仍 为 (3) 中的
LSR0.05=6.51,LSR0.01=7.65。
① A因素各水平上 B因素各水平平均数间的比较
A1水平 (1.0)
下一张 主 页 退 出上一张
A2水平 (0.8)
A3水平 (0.6)
下一张 主 页 退 出上一张
A4水平 (0.4)
② B因素各水平上 A因素各水平平均数间的比较下一张 主 页 退 出上一张下一张 主 页 退 出上一张简单效应检验结果表明:当饲料中钙含量达 1.0%时,磷含量各水平平均数间差异不显著;当饲料中钙含量为 0.8% 时,磷含量以
0.4%为宜 ( 但与磷含量为 0.6% 的差异不显著 ) ;当钙为 0.6%时,磷以 0.6%为好,
且有小猪的生长发育对磷含量的变化反应比较敏感的迹象 ; 当钙含量为 0.4% 时,磷以
0.8%为好 (但与磷含量为 0.6%,0.4%的差异不显著 );就试验中所选择的钙磷含量水平来看,有一种随着饲料中钙含量的减少,要求磷含量增加的趋势。
下一张 主 页 退 出上一张当磷含量 0.8%时,钙以 0.4%为好,但除显著高于钙为 1.0% 的水平外,与 钙 为
0.6%,0.8%的差异不显著;当磷的水平为
0.6%时,钙的水平也以 0.6%为好,但除显著高于钙为 1.0%的水平外,与钙为 0.4%、
0.8%的差异不显著;磷含量 0.4%时,钙含量以 0.8%为好;磷含量为 0.2%时,钙水平达到 1.0%效果较好,但与钙为 0.8%的差异不显著。 同样 也呈现一种随着磷含量降低,钙水平应提高的趋势。
下一张 主 页 退 出上一张综观全试验,以 A2B3(钙 0.8%,
磷 0.4%)效果最好,钙磷含量均高或均低效果都差。
二、系统分组资料的方差分析在生物科学的研究中,实际问题是多种多样的,有些涉及多因素问题的研究或试验用交叉分组是困难的。例如,要比较 a头公畜的种用价值,就必须考虑到与配的母畜。 这是因为公畜的种用价值是通过后代的表现来评定的,而后代的表现除受公畜的影响外还要受到母畜 的影响。但是在同期,公畜和母畜这两个因素的不同水平 ( 不同公畜和不同母畜 ) 是 不能交叉的,即同一头母畜不能同时与不同的公畜交配产生后代。 合理的方法是,选择一些生产性能下一张 主 页 退 出上一张大体一致的同胎次母畜随机分配与 a头公畜交配,即公畜 A1与一组母畜交配,公畜 A2与另一组母畜交配 …… 。然后通过后代的性能表现来判断这些公畜的种用价值有无显著差异 。
又如,为了比较利用同一设备生产同一种饲料的不同班组产品质量有无差异,我们可从每班组所生产的饲料中随机抽取若干样品,每个样品作若干次测定,根据测定结果判断不同班组的产品质量有无差异。
下一张 主 页 退 出上一张在安排多因素试验方案时,将 A因素分为 a 个水平,在 A因素每个水平 Ai下又将 B因素分成 b个水平,再 在 B 因素每个水平 Bij下将 C因素分 c个水平 ……,这样得到各因素水平组合的方式称为 系统分组 (hierarchical classification) 或称 多层分组、套设计、窝设计 。
在系统分组中,首先划分水平的因素 (上述的不同公畜、不同班组 ) 叫 一级因素 ( 或 一 级样本 ),其次划分水平的因素 (如上述的母畜、抽取的样品 )叫二级因素 (二级样本,次级样本 ),类此有三级因素 …… 。在系统分组中,次级因素的各水平会套在一级因素的每个水平下,它们之间是从属关系而不是平等关系,分析侧重于一级因素。
下一张 主 页 退 出上一张由系统分组方式安排的多因素试验而得到的资料称为系统分组资料 。 根据次级样本含量是否相等,系统分组资料分为次级样本含量相等与不等两种 。 最简单的系统分组资料是二因素系统分组资料 。
如果 A因素有 a 个水平; A因素每个水平
Ai下,B因素分 b个水平; B因素每个水平 Bij下有 n个观测值,则共有 abn个观测值,其数据模式如表 6-35所示。
下一张 主 页 退 出上一张下一张 主 页 退 出上一张表 6-35 二因素系统分组资料数据模式表 6-35中,
数学模型为
(6-36)
n
l
ijlij xx
1
,nxx ijij /.,?
b
j
n
l
ijli xx
1 1
.,bnxx ii /...,?
a
i
b
j
n
l
ijlxx
1 1 1
..,a b nxx /.....,?
),,2,,1;,,2,1;,,2,1( nlbjai
x ijlijiijl
下一张 主 页 退 出上一张式中 μ为总体平均数,ai为 Ai的效应,β ij
为 Ai内 Bij的效应,,
分别为 Ai,Bij观测值总体平均数。 为随机误差,相互独立,且都服从 N(0,σ2)。
表 6-35数据的总变异可分解为 A因素各水平
(Ai)间的变异 (一级样本间的变异 ),A因素各水平 (Ai)内 B因素各水平 (Bij)间的变异 (一级样本内二级样本间的变异 )和试验误差 (B因素各水平内观测值间的变异 )。 对两因素系统分组资料进行方差分析,平方和与自由度的剖分式为:;,iijijii i? ij?
ijl?
下一张 主 页 退 出上一张
SST=SSA+SSB(A)+SSe
dfT =dfA +dfB(A) +dfe (6-37)
各项平方和与自由度计算公式如下:
1
)(
/
1 1 1 1 1 1
22
...
2
2
...
abndf
CxxxSS
abnxC
T
a
i
b
j
n
l
a
i
b
j
n
l
ijlijlT
总平方和及其自由度下一张 主 页 退 出上一张
)1(
)(
)(
)1(
)(
1
)(
)(
1 1 1 1 1 1 1 1
2
.
1
22
.)(
)(
1 1 1 1 1
2
..
1
2
.
1
2
...)(
1 1
2
..
1
2
.....
nabdfdf
xxxxSSSS
badf
xxxxnSS
adf
CxxxbnSS
BCe
a
i
b
j
n
l
a
i
b
j
n
l
a
i
b
j
ijnijlijijlBCe
AB
a
i
b
j
a
i
b
j
a
i
ibnijniijAB
A
n
i
a
i
ibniA
平方和及其自由度二级因素内三级因素误差方和及其自由度一级因素内二级因素平由度一级因素平方和及其自
(6-38)
下一张 主 页 退 出上一张各项均方如下:
一级因素的均方一级因素内二级因素的均方误差 (二级因素内三级因素 )均方
F检验时 F值的计算:
当检验一级因素时,用 作分母,
即,
当检验一级因素内二级因素时,用 作分母,即,
AAA dfSSMS /?
)()()( / ABABAB dfSSMS?
eeBC dfSSMS /)(?
)( ABMS
)(/ ABA MSMSF?
eMS
eAB MSMSF /)(?
下一张 主 页 退 出上一张实际上,计算 F值时分母项的选择是由有关因素的效应是固定还是随机所决定的 (即是由数学模型决定的 ),有关这方面的内容将在 第四节介绍。
(一 ) 次级样本含量相等的系统分组资料的方差分析
【 例 6.7】 为测定 3种不同来源的鱼粉的蛋白质消化率,在不含蛋白质的饲料里按一定比例分别加入不同的鱼粉 A1,A2,A3,配制成饲料,各喂给 3头试验动物 (B)。收集排泄物、风干、粉碎、
混和均匀 。 分别从每头动物的排泄物中各取两份样品作化学分析 。 测定结果 (xijl)列于表 6-36,
试 分 析不同来源鱼粉的蛋白质消化率是否有显著差异。
下一张 主 页 退 出上一张表 6-36 蛋白质的消化率下一张 主 页 退 出上一张这是一个二因素系统分组资料,A因素的水平数 a=3,Ai内 B因素的水平数 b=3,Bij内重复测定次数 n=2,共有 abn=3× 3× 2=18
个观测值,方差分析如下 。
1,计算各项平方和与自由度矫正数总平方和及其自由度
2 6 7 2.1 2 6 5 2 118/1.1 5 0 9/ 22.., abnxC
1712331
3428.1322672.1265216100.126653
2672.126521)3.805.794.825.82( 22222
abndf
CxSS
T
ijlT?
下一张 主 页 退 出上一张鱼粉间平方和及其自由度鱼粉内个体间的平方和及其自由度
2131
5011.1052672.1265217683.126626
2672.126521)8.4839.5184.506(
23
11 2222
..
adf
Cx
bn
SS
A
iA
6)13(3)1(
4567.257683.1 2 6 6 2 62250.1 2 6 6 5 2)8.4839.5184.506(
23
1
)8.1595.1606.1739.164(
2
111
)(
222
22222
..
2
.)(
badf
x
bn
x
n
SS
AB
iijAB
下一张 主 页 退 出上一张误差(个体内分析样品间 )平方和及其自由度
2、列出方差分析表,进行 F检验表 6-37 不同来源鱼粉蛋白质消化率方差分析表
9)12(33)1(
3850.12250.1 2 6 6 5 26100.1 2 6 6 5 31
)(
2
.
2
)(
nabdfdf
x
n
xSSSS
BCe
ijijlBCe
下一张 主 页 退 出上一张查临界 F值:
F0.01(2,6)=10.92,F0.01(6,9)=5.80,
因为鱼粉间的 F> F0.01(2,6),鱼粉内个体间的 F>
F0.01(6,9),表明不同来源的鱼粉蛋白质消化率差异极显著,即 3种鱼粉的质量差异极显著;喂同一鱼粉的不同个体对鱼粉的消化利用能力差异也极显著。
3、三种鱼粉平均消化率的多重比较 ( SSR法)
因为对一级因素(鱼粉)进行 F检验时是以鱼粉内个体间均方作为分母,鱼粉的重复数为 bn,所以鱼粉的标准误为:
下一张 主 页 退 出上一张以 dfB(A)=6,查附表 6 得 k=2,3 时
SSR0.05和 SSR0.01的值与 相乘求出相应的
LSR0.05和 LSR0.01的值,得,
k=2,LSR0.05=2.91 LSR0.01=4.41
k=3,LSR0.05=3.01 LSR0.01=4.63
8 4 0 9.06/2 4 2 8.4/)( bnMSS ABx
xS
下一张 主 页 退 出上一张表 6-38 三种鱼粉蛋白质平均消化率比较表 (SSR法 )
下一张 主 页 退 出上一张多重比较结果表明:鱼粉 A2的消化率极显著高于鱼粉 A3;鱼粉 A1的消化率显著高于鱼粉
A3;鱼粉 A1,A2的消化率差异不显著 。
对于鱼粉内个体间的差异问题,由于不是我们研究的重点,故可以不进行多重比较。若要比较时,标准误 应由 计算,
SSR值或 q值应以自由度 dfe=9去查。
xS
nMS e /
下一张 主 页 退 出上一张
(二 ) 次级样本含量不等的系统分组资料的方差分析
【 例 6.8】 某品种 3头公猪和 8头母猪所生仔猪的 35日龄断奶重资料如表 6-39所示,试就这些数据分析 不同公猪和 不同母猪对仔猪断奶重的影响是否有显著差异。
下一张 主 页 退 出上一张表 6-39 3头公猪和 8头母猪所产仔猪断奶重下一张 主 页 退 出上一张表中,a为公猪数; bi为第 i头公猪与配母猪数; ny为第 i头公猪与配第 j头母猪所产的仔猪数;
为第 i头公猪仔猪数; 为母猪总数;
为仔猪总数。
方差分析如下:
1,计算各项平方和与自由度
ib
j
iji ndn
1
a
i
ib
1
a
i
b
j
ij
i nN
1 1
下一张 主 页 退 出上一张矫正数总平方和及其自由度
8 8 0 0.5 4 0 963/8.5 8 3/ 22.., NxC
621631
4600.1498800.54093400.5559
8800.5409)0.118.113.85.10(
...)(
2222
1 1 1
2
1 1 1
2
Ndf
CxxxSS
T
a
i
b
j
n
l
ijl
a
i
b
j
n
l
ijlT
i iji ij
下一张 主 页 退 出上一张公猪间的平方和及其自由度公猪内母猪间的平方和及其自由度
2131
0235.118800.5409)23/6.21024/0.23416/2.139(
/)(
222
1 1
2
..
2
.....
adf
CdnxxxdnSS
A
a
i
a
i
iiiiA
a
i
a
i
iiAB
a
i
b
j
a
i
b
j
a
i
iiijijiijijAB
abbdf
dnxnxxxnSS
i i
1 1
)(
222
2222
1 1 1 1 1
2
..
2
.
2
...)(
538)1(
4785.819035.54203820.5502
)23/6.21024/0.23416/2.139(
)8/2.828/1.907/9.569/3.82(
//)(
下一张 主 页 退 出上一张母猪内仔猪间 ( 误差 ) 平方和及其自由度或或
9580.563820.55023400.5559
)8/2.828/1.907/9.569/3.82()0.118.113.85.10(
/)(
22222222
1 1 1 1 1
2
.
2
1 1 1
2
.)(
a
i
b
j
n
l
a
i
b
j
ijijijl
a
i
b
j
n
l
ijijleBC
i ij ii ij
nxxxxSSSS
9580.564785.810235.114600.149
)()(
ABATeBC SSSSSSSSSS
a
i
b
j
a
i
iijeBC
i
bNndfdf
1 1 1
)( 55863)1(
555262)()( ABATeBC dfdfdfdfdf
下一张 主 页 退 出上一张
2,列出方差分析表,进行 F检验表 6-40 3头公猪和 8头母猪所生仔猪断奶重的方差分析下一张 主 页 退 出上一张因为公猪间的 FA=0.34< 1,即 P> 0.05,
所以公猪对仔猪的断奶重影响差异不显著,可以认为它们的种用价值是一致的;因为公猪内母猪间的 FB(A)=15.74> F0.01(5,55)=3.37,即 P<
0.01,所以母猪对仔猪的断奶重影响差异极显著,
即同一公猪内不同母猪的仔猪断奶重有极显著的差异 。
3、多重比较 如果需对一级因素 (公猪 )各水平以及一级因素内二级因素 (母猪 ) 各水平均数进行多重比较 (SSR法或 q法 ),当对公猪平均数进行多重比较时,标准误为:
0)( / dnMSS ABx?
下一张 主 页 退 出上一张式中的 dn0为每头公猪的平均仔猪数,用公式 (6-41)(见第四节 )计算;当对母猪平均数进行多重比较时,标准误为:
式中 n0为每头母猪的平均仔猪数,用公式
(6-39)(见第四节 )计算 。 实际上对于此类资料,同一公猪内母猪平均数的多重比较一般可不进行 。
0)( / nMSS BCx?
下一张 主 页 退 出上一张
*第四节 方差分析的数学模型与期望均方一、数学模型方差分析的数学模型就是指试验资料的数据结构或者说是每一观测值的线性组成,
它是方差分析的基础。本章所涉及的几种方差分析法,其数学模型已相继介绍。
下一张 主 页 退 出上一张数学模型中的处理效应 αi(或 βj,βij),由于处理性质的不同,有固定效应 (fixed
effect) 和随机效应 (random effect) 之分。若按处理效应的类别来划分方差分析的模型,则有三种,即固定模型、随机模型和混合模型。就试验资料的具体统计分析过程而言,
这三种模型的差别并不太大,但从解释和理论基础而言,它们之间是有很重要的区别的。不论设计试验、解释试验结果,还是最后进行统计推断,都 必须了解这三种模型的意义和区别。 下一张 主 页 退 出上一张
1,固定模型 (fixed model)
在单因素试验的方差分析中,把 k个处理看作 k个明晰的总体 。 如果研究的对象只限于这 k个总体的结果,而不需推广到其它总体;研究目的在于推断这 k
个总体平均数是否相同,即在于检验 k个总体平均数相等的假设 H0,μ1=μ2=… =μk; H0被否定,下步工作在于作多重比较;重复试验时的处理仍为原 k个处理 。 这样,则 k个处理的效应 (如 αi=μi-μ)固定于所试验的处理的范围内,处理效应是固定的 。 这种模型称为固定模型 。 一般的饲养试验及品种比较试验等均属固定模型 。
下一张 主 页 退 出上一张
2、随机模型 (random model)
在单因素试验中,k个处理并非特别指定,而 是从更大的处理总体中随机抽取的 k个处理而已,即研究的对象不局限于这 k个处理所对应的总体的结果,而是着眼于这 k个处理所在的更大的总体;研究的目的不在于推断当前 k个处理所属总体平均数是否相同,而是从这 k个处理所得结论推断所在大总体的变异情况,检验的假设一般为处理效应方差等于零,即 H0,=0;
如果 H0被否定,进一步的工作是估计 ;重复试验时,可 在 大 处 理 总 体 中 随 机抽取新的处理。
2
2
下一张 主 页 退 出上一张这样,处理效应并不固定,而是随机的,这种模型称为随机模型 。 随机模型在遗传,育种和生态试验研究方面有广泛的应用 。 如,为研究中国猪种的繁殖性能的变异情况,从大量地方品种中随机抽取部分品种为代表进行试验,观察,其结果推断中国猪种的繁殖性能的变异情况,这就属于随机模型 。
在多因素试验中,若各因素水平的效应均属随机,
则对应于随机模型 。
下一张 主 页 退 出上一张
3,混合模型 (mixed model)
在多因素试验中,若既包括固定效应的试验因素,又包括随机效应的试验因素,则该试验对应于混合模型 。 混合模型在试验研究中是经常采用的 。 如在某地区的 4个不同杂交组合的猪及其亲本,分布于 5个猪场进行育肥试验 。
这里猪种效应是固定的,而试验场所 (猪场 )效应是随机的 。 又如 【 例 6-8】,若目的在于比较该 3头公猪的种用价值,与配母猪是随机抽取的,则公猪效应是固定的,而母猪效应是随机的 。 再如随机采用三个蛋鸡品系研究三种饲料的效应试验,这里蛋鸡品系效应是随机的,
而饲料效应是固定的 。
下一张 主 页 退 出上一张二、期望均方在第一节我们提到了期望均方的概念。由于模型不同,方差分析中各项期望均方的计算也有所不同,因而 F检验时分母项均方的选择也有所不同。现将不同方差分析中各种模型下各项期望均方及 F值计算分别列于下面各表,以便正确地进行 F检验和估计方差组分。
下一张 主 页 退 出上一张为了区分效应的两种模型 (随机及固定 ),
用 表示随机模型下处理效应方差,用 表示固定模型下处理效应方差。如对于 A因素,
随机模型时用 表示处理效应方差;固定模型时用 表示处理效应方差,此时,
1,单因素试验资料方差分析的期望均方
(1) 各处理重复数相等时
2 2
k
)1/()1/()( 222 kkk iiA
2
2
k
下一张 主 页 退 出上一张表 6-41 单因素试验重复数相等期望均方与 F检验下一张 主 页 退 出上一张
(2) 各处理重复数不等时表 6-42 单因素试验重复数不等期望均方与 F检验下一张 主 页 退 出上一张在表 6-42中,固定模型时,处理间均方
MSt的期望值为,是在 的条件下获得的;若条件为
Σαi=0 时,则 MSt 之期望值为 。 随 机 模 型 时,
的系数 no由下式计算:
22 )1/( kn ii
0 iin?
222 )1/(/)( knnn iiiii
2
i
i
i n
n
n
k
n
2
0 1
1
下一张 主 页 退 出上一张单因素试验资料的方差分析,不论是固定还是随机模型,F值的计算方法是一致的 。
2,交叉分组试验资料方差分析的期望均方
(1) 二因素交叉分组单独观测值时下一张 主 页 退 出上一张表 6-43 两因素交叉分组单独观测值的期望均方与 F检验下一张 主 页 退 出上一张由表 6-43中可以看出,对两因素交叉分组单独观测值试验资料的 方 差 分 析,不论是固定、随机还是混合模型,F检验分母项都是误差均方 MSe,此时无法求得 。
(2) 两因素交叉分组有重复观测值时
2
BA
下一张 主 页 退 出上一张表 6-44 两因素交叉分组有重复观测值的期望均方与 F检验下一张 主 页 退 出上一张由表 6-44可知,两因素交叉分组有重复观测值试验资料的方差分析,对主效应和互作进行
F检验随模型不同而异 。 对于固定模型,均用
MSe作分母;对于随机模型,检验 H0,=0
时,用 MSe作分母,而检验 H0,=0 =0时都用 MSA× B作分母;对于混合模型 (A随机,B
固定 ),检验 H0,=0和 =0都用 MSe作分母,而检验 H0,K2B=0时,则以 MSA× B作分母 。
(A固定,B随机时,与此类似 )。
3,系统分组资料方差分析的期望均方
2
BA
2
A?
2
B?
2
A? 2 BA
下一张 主 页 退 出上一张表 6-45 二因素系统分组次级样本含量相等的期望均方与 F检验下一张 主 页 退 出上一张
A固定,B随机时的 F检验与随机模型同;
A随机,B固定时的 F检验与固定模型同 。
在随机模型下,当次级样本含量不等时,
各项均方的期望值与 F检验如下。
表 6-46 二因素系统分组次级样本含量不等的期望均方与 F检验下一张 主 页 退 出上一张表 6-45,6-46中,σ2是二级因素内观测值间的方差,即误差方差; 是 一级因素水平内二级因素水平效应方差; 是 一级因素水平效应方差; no和 都是每个 二级因素水平下的平均重复数 (即平均观测值个数 ),其中
no是一级因素水平内每个二级因素水平下 平均重复数; 是一级因素水平间每个二级因素水平的平均重复数; dn0是每个一级因素水平的平均重复数。 no,及 dno的计算公式如下:
2
)(AB?
2
A?
0'n
0'n
0'n
下一张 主 页 退 出上一张
(6-39)
(6-40)
(6-41)
式中,N 为全部观测值个数;
为一级因素 Ai水平内二级因素 Bij水平的重复数;
为一级因素 Ai水平的重复数;
)(
2
0
)(
AB
i i
j
ij
df
dn
n
N
n
A
i
ji
ij
i
j
ij
df
N
n
dn
n
n
,
22
0
)(
'
A
i
df
N
dn
N
dn
2
0
)(?
ijn
idn 下一张 主 页 退 出上一张为一级因素内二级因素的自由度;
为一级因素的自由度。
三、方差组分的估计上面我们分别介绍了单因素试验,交叉分组、系统分组多因素试验资料的方差分析 中各种均方在不同模型下的期望值。了解期望均 方的组成,不仅有助于正确进行 F检验,而且也有助于参数估计。最常见的就是估计 方差组分,
又称方差分量分析。方差组分,亦即 方差分量
(variance components),是指 方差的组成成分。根据资料模型和期望均方的组成,就可估计出所需要的方差组分。
)(ABdf
Adf
下一张 主 页 退 出上一张方差组分的估计主要是指对随机模型的方差组分估计 。 因为在这种模型下,我们研究的目的就在于从总体上了解各因素对试验指标所产生的效应方差 。
在研究数量性状的遗传变异时,对一些遗传参数的估计,如重复率,遗传力和性状间的遗传相关的估计都是在随机模型方差组分估计的基础上进行的 。
下面结合实例说明方差组分的估计。
下一张 主 页 退 出上一张如果将 【 例 6.8】 中 3头公猪,与配母猪及它们所生仔猪的断奶重资料,看作是从该品种总体中随机抽取的样本,则公猪及其与配母猪对所产仔猪断奶重影响的效应是随机的,因而 该资料属随机模型 。 方差组分估计如下:
因次级样体含量不等,由表 6-46可知:
下一张 主 页 退 出上一张公猪间期望均方公猪内母猪间期望均方母猪内仔猪间期望均方因而
202 )(02 ' AABA dnnMSE
2 )(02)( ABAB nMSE
2eMSE
eMS?2
0)(0
2
0)(
2
)(
/)?'(?
/)(?
dnnMSMS
nMSMS
ABeAA
eABAB
下一张 主 页 退 出上一张在方差分量分析中,当次级样本含量不相等时,需依公式 (6-39),(6-40),(6-41)
求三个相应的加权平均数。本例各公、母猪的仔猪数不等,故先算三个加权平均数如下:
因为下一张 主 页 退 出上一张
6032.21
63
232416)(
9524.7
63
177194130
63
87897879
9040.23
23
177
24
194
16
130
23
878
24
978
16
79
)(
222
2
22222222
,
2
22222222
2
N
dn
N
n
dn
n
i
ji
ij
i i
j
ij
代入公式 (6-39),(6-40),(6-41)得将 及 【 例 6-8】 算出的有关均方值代入上面各方差组分计算式得:
6984.202/)6032.2163(
9758.72/)9524.79040.23('
8192.75/)9040.2363(
0
0
0
dn
n
n
000 ' dnnn,、
5358.06984.20/)9516.19758.70356.15118.5(
/)?'(?
9516.18192.7/)0356.12957.16(
/)(?
0356.1?
0
2
)(0
2
0)(
2
)(
2
dnnMSMS
nMSMS
MS
ABeAA
eABAB
e
下一张 主 页 退 出上一张这里应当注意,公 猪效应方差的估计值为 -0.5358,这是不合理的。这主要是由于母猪间方差组分 ( )过大所致 (一般 MSB(A)
> MSA时,就是负值 )。在这种情况下,
可将原资料中二级因素 (母猪 )去掉,仅就公猪因素作随机模型下的各处理重复数 不等的单因素方差分析,进而重新估计公猪间方差组分。
过程如下:
2
)(AB?
2?A?
下一张 主 页 退 出上一张
MSA不变,仍为 5.5118
由表 6-42可知:
故再先由下式计算 no,〔 注意,这里的 no不同于由公式 (6-39)求得的 no〕 。
4.1380235.114600.149 ATe SSSSSS
3073.2)363/(4365.138)/( aNSSMS ee
220 AA nMSE
2eMSE
eMS?2 0/)(
2? nMSMS
A ea
下一张 主 页 退 出上一张这实际就是由公式 (6-41)求得的 dno。
于是:
1548.06984.20/)3073.25118.5(/)(?
3073.2?
0
2
2
nMSMS
MS
eAA
e
6984.20
63
1361
63
2
1
232416
232416
)232416(
13
1
1
1 222
2
0
i
i
i
dn
dn
dn
a
n
下一张 主 页 退 出上一张第五节 数据转换前面介绍的几种试验资料的方差分析法,尽管其数学模型的具体表达式有所不同,但以下三点却是共同的。
下一张 主 页 退 出上一张
1、效应的可加性我们据以进行方差分析的模型均为 线 性可加模型。这个模型明确提出了处理效应与误差效应应该是
,可加的,,正是由于这一,可加性,,才有了样本平方和的,可加性,,亦即有了试验观测值总平方和的,可剖分,性。如果试验资料不具备这一性质,那么变量的总变异依据变异原因的剖分将失去根据,方差分析不能正确进行。
下一张 主 页 退 出上一张
2,分布的正态性是指所有试验误差是相互独立的,且都服从正态分布 N(0,
σ2)。 只有在这样的条件下才能进行 F检验 。
3、方差的同质性即各个处理观测值总体方差 σ2应是相等的。只有这样,才有理由以各个处理均方的合并均方作为检验各处理差异显著性的共同的误差均方。
下一张 主 页 退 出上一张上述三点是进行方差分析的基本前提或基本假定 。 如果在分差分析前发现有某些异常的观测值,处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下应加以删除 。 但是,有些资料就其性质来说就不符合方差分析的基本假定 。 其中最常见的一种情况是处理平均数和均方有一定关系 (如二项分布资料,平均数,均方 ;
泊松分布资料的平均数与方差相等 )。 对这类
pn )?1( 2 ppn
下一张 主 页 退 出上一张资 料 不 能 直 接 进 行 方 差分析,而 因 考 虑 采用 非 参 数 方 法 分 析 或 进 行 适 当 数 据 转 换
(transformation of data)后再作方差分析。
这里我们介绍几种常用的数据转换方法。
1,平方根转换 ( square root
transformation )
此法适用于各组均方与其平均数之间有某种比例关系的资料,尤其适用于总体呈泊松分布的资料。转换的方法是求出原数据的平方根 。若原观测值中有为 0的数或多数观测值小于 10,则把原数据变换成 对于稳定均方,使方差符合同质性的作用更加明显。变换也有利于满足效应可加性和正态性的要求。
x
1?x
下一张 主 页 退 出上一张
2,对 数 转 换 (logarithmic
transformation)
如果各组数据的标准差或全距与其平均数大体成比例,或者效应为相乘性或非相加性,
则将原数据变换为对数 (lgx或 lnx)后,可以使方差变成比较一致而且使效应由相乘性变成相加性 。
如果原数据包括有 0,可以采用 lg(x+1)
变换的方法。
一般而言,对数转换对于削弱大变数的作用要比平方根转换更强。例 如 变 数 1,10、
100作平方根转换是 1,3.16,10,作对数转换则是 0,1,2。
下一张 主 页 退 出上一张
3,反 正 弦 转 换 ( arcsine
transformation )
反正弦转换也称角度转换。此法 适用于 如发病率,感染率、病死率、受胎率等服从 二项分布 的资料。转换的方法是求出每个原数据 (用百分数或小数表示 )的反正弦,转换后的数值是以度为单位的角度。 二项分布的特点是其方差与平均数有着函数关系。这种关系表现在,当平均数接近极端值 (即接 近 于 0 和 100% )时,方 差 趋 向 于 较 小 ;
而 平均数处于 中 间 数 值 附 近 ( 50% 左 右 )
时,方 差 趋 向 于 较 大 。把 数 据 变 成 角 度 以
p1s in?
下一张 主 页 退 出上一张后,接近于 0和 100%的数值变异程度变大,
因此使方差较为增大,这 样 有利于满足方差同质性的要求。一 般,若 资 料 中 的 百 分数介于 30%— 70%之间时,因资料的分布接近于正态分布,数据变换与否对分析的影响不大。
应当注意的是,在对转换后的数据进行方差分析时,若经检验差异显著,则进行平均数的多重比较应用转换后的数据进行计算 。 但在解释分析最终结果时,应还原为原来的数值 。
【 例 6.9】 表 6-47为甲,乙,丙三个地区乳牛隐性乳房炎阳性率资料,试对资料进行方差分析 。
下一张 主 页 退 出上一张表 6-47 三地区乳牛隐性乳房炎阳性率 (%)
这是一个服从二项分布的阳性率资料,且有低于 30%和高于 70%的,应先对阳性率资料作反正弦转换,转换结果见表 6-48。
下一张 主 页 退 出上一张表 6-48 表 6-47资料的反正弦转换值表 6-48资料的方差分析,见表 6-49。
下一张 主 页 退 出上一张表 6-49 表 6-48资料的方差分析
F检验结果表明,各地区间乳牛隐性乳房炎阳性率差异极显著。下面进行多重比较。
表 6-50 表 6-48资料平均数多重比较表 (SSR法 )
下一张 主 页 退 出上一张因,SSR值 LSR
值见表 6-51
表 6-51 SSR值与 LSR值
18,54.37/7 5 0 0.87 ex dfS
下一张 主 页 退 出上一张对结论作解释时,应将各组平均数还原为阳性率。如表 6-50 中 平 均 数 53.27 根 据
P=sin2x,还原为 64.2%;均数 32.58还原为 29.0%;均数 28.56还原为 22.8%。但从变换过的数据所算出的方差或标准差不宜再换回原来的数据。
检验结果表明,甲地区乳牛隐性乳房炎阳性率极显著高于丙地区和乙地区,乙地区与丙地区阳性率差异不显著 。
下一张 主 页 退 出上一张以上介绍了三种数据转换常用方法。对于一般非连续性的数据,最好在方差分析前先检查各处理平均数与相应处理内均方是否存在相关性和各处理均方间的变异是否较大。如果存在相关性,或者变异较大,则应考虑对数据作出变换。 有 时 要确定适当的转换方法并不容易,可事先在试验中选取几个其平均数为大、
中、小的处理试验作转换。哪种方法能使处理平均数与其均方的相关性最小,哪种方法就是最合适的转换方法。另外,还有一些别的转换下一张 主 页 退 出上一张方法可以考虑。例如当各处理标准差与其 平均数 的 平 方 成 比 例 时,可 进 行 倒 数转换
(reciprocal transformation);对于一些分 布 明 显 偏 态 的 二项分布资料,有人进行的转换,可使 x呈良好的正态分布。
2/11 )( s in px
下一张 主 页 退 出上一张