第十章 协方差分析第一节 协方差分析的意义下一张 主 页 退 出上一张协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计,现分述如下。
一、对试验进行统计控制为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控制,
使它们在各处理间尽量一致,这叫 试验控制 。
但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研 下一张 主 页 退 出上一张发现:增重与初始重之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。 这时可利用仔猪的初始重 (记为 x)与其增重 (记为 y)的回归关系,将仔猪增重都矫正为初始重相同时的增重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始重控制一致而得到的,故叫 统计控制 。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应下一张 主 页 退 出上一张估计更为准确。若 y 的变异主要由 x的不同造成
(处理没有显著效应 ),则各矫正后的 间将没有显著差异 (但原 y间的差异可能是显著的 )。若 y
的变异除掉 x不同的影响外,尚存在不同处理的显著效应,则可期望各 间将有显著差异 (但原
y间差异可能是不显著的 )。此外,矫正后的 和原 y的大小次序也常不一致。所以,处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种 将回归分析与方差分析结合在一起,
对试验数据进行分析的方法,叫做协方差分析
(analysis of covariance)。
y?
y?
y?y?
二、估计协方差组分在第八章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:
若将公式右端的分子分母同除以自由度 (n-
1),得
( 10-1)



22 )()(
))((
yyxx
yyxx
r


)1(
)(
)1(
)(
)1/())((
22
n
yy
n
xx
nyyxx
r
下一张 主 页 退 出上一张其中是 x的均方 MSx,它是 x的方差 的无偏估计量;
是 y的均方 MSy,它是 y的方差 的无偏估计量;
1
)( 2

n
xx
2x?
1
)( 2

n
yy
2x?
1
))((

n
yyxx 称为 x与 y的平均的离均差的乘积和,简称均积,记为 MPxy,即
1
))((

n
yyxxMP
xy
1
))((

n
n
yx
xy ( 10-2)
与 均 积 相 应 的 总 体参 数 叫 协 方 差
( covariance),记为 COV(x,y)或 。统计学证明了,均积 MPxy是总体协方差 COV(x,y)
的无偏估计量,即 EMPxy= COV(x,y)。
于是,样本相关系数 r可用均方 MSx,MSy,
均积 MPxy表示为:
( 10-3)
xy?
yx
xy
MSMS
MP
r?
下一张 主 页 退 出上一张相应的总体相关系数 ρ 可用 x与 y的总体标准差,,总体协方差 COV(x,y)或 表示如下:
( 10-4)
x? y? xy?
yx
xy
yx
yxC O V



),(
均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种 把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。
下一张 主 页 退 出上一张在随机模型的方差分析中,根据均方 MS
和期望均方 EMS的关系,可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积 MP 和期望均积
EMP 的关系,可 得 到 不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的。
由于篇幅限制,本章只介绍对试验进行统控制的协方差分析。
第二节 单因素试验资料的协方差分析设有 k个处理,n次重复的双变量试验资料,
每处理组内皆有 n对观测值 x,y,则该资料为具 kn对 x,y观测值的单向分组资料,其数据一般模式如表 10— 1所示。
下一张 主 页 退 出上一张表 10— 1 kn对观测值 x,y的单向分组资料的一般形式表 10— 1的 x和 y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为:
总变异的乘积和 SPT是 xji与 和 yji与 的离均差乘积之和,即:
(10-5)
=kn-1
..x,.y
kn
yx
yx
yyxxSP
k
i
n
j
ijij
k
i
n
j
ijijT
....
..)..) ((
1 1
1 1






Tdf
下一张 主 页 退 出上一张
kn
y
y
kn
xx
yyxx
k
i
i
k
i
i
..
..
,....
,...,...
11


其中,
处理间的乘积和 SPt是 与 和 与 的离均差乘积之和乘以 n,即:
(10-6)
处理内的乘积和 SPe是 与 和 与 的离均差乘积之和,即:
(10-7)
.ix,.x,iy,.y



k
i
ii
k
i
iiiit kn
yxyx
n
yyxxnSP
1 1
....1..)..,) (.(
1 kdf t
ijx,ix ijy,iy



k
i
n
j
k
i
tT
k
i
ii
n
j
ijijiijiije SPSPyxnyxyyxxSP
1 1 1 11
..1.),) ((
=k(n-1)
以上是各处理重复数 n相等时的计算公式,
若各处理重复数 n不相等,分别为 n1,n2,…,
nk,其和为,则各项乘积和与自由度的计算公式为:
(10-8)
edf
k
i
in
1



k
i
n
j
k
i
i
ii
ijijT
i
n
yx
yxSP
1 1
1
..
1
1

k
i
iT ndf
下一张 主 页 退 出上一张
=SPT-SPt
= -k =dfT-dft (10-9)

k
i
i
k
kk
t
n
yx
n
yx
n
yx
n
yx
SP
1
2
22
1
11,............
1 kdf t


k
i
n
j
ijije
i
yxSP
1 1



k
kk
n
yx
n
yx
n
yx,........
2
22
1
11
k
i
in
1e
df
有了上述 SP和 df,再加上 x和 y的相应 SS,
就可进行协方差分析。
【 例 10.1】 为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验,试验设对照、配方 1、
配方 2、配方 3共四个处理,重复 12 次,选择初始条件尽量相近的长白种母猪的哺乳仔猪 48
头,完全随机分为 4组进行试验,结果见表
10— 2,试作分析。
下一张 主 页 退 出上一张表 10— 2 不同食欲增进剂仔猪生长情况表
(单位,kg)
下一张 主 页 退 出上一张此例,
=18.25+15.40+15.65+13.85=63.15
=141.80+130.10+144.80+133.80
=550.50
k=4,n=12,kn=4× 12=48
.....,4321 xxxxx
.....,4321 yyyyy
协方差分析的计算步骤如下:
(一 )求 x变量的各项平方和与自由度
1、总平方和与自由度
dfT( x) =kn-1=4× 12-1=47
75.1
48
15.63
8 3 2 5.84
48
15.63
)10.185.150.1(
2
2
222
2
2
)(





kn
x
xSS
ijxT
2、处理间平方和与自由度
83.0
48
15.63
)85.1365.1540.1525.18(
12
1
..
.
1
2
2222
2
1
2
)(


kn
x
x
n
SS
k
i
ixt
)(xtdf
=k-1=4-1=3
3、处理内平方和与自由度
(二 )求 y变量各项平方和与自由度
1、总平方和与自由度
92.083.075.1)()()( xtxTxe SSSSSS
44347)()()( xd f txd f Tdf xe
76.9648 5.55031.641048 5.550)00.11...00.1240.12( 222222..2)( knyySS ijyT
4711241)( kndf yT
下一张 主 页 退 出上一张
2、处理间平方和与自由度
3、处理内平方和与自由度
(三 ) 求 x和 y两变量的各项离均差乘积和与自由度
1、总乘积和与自由度
68.1148 50.550)80.13380.14410.13080.141(12 1.1 222222..2)( knyynSS iyt
3141)( kdf yt
08.8568.1176.96)()()( ytyTye SSSSSS
44347)()()( ytyTye dfdfdf
=kn-1=4× 12-1=47
2、处理间乘积和与自由度
=1.64
kn
yxyxSP k
i
n
j
ijijT
....
1 1


25.8
124
50.55015.63
50.732
124
50.55015.63
00.1110.1...00.1285.140.1250.1


),( yxTdf
kn
yxyx
nSP
k
i
iit
......1
1

124
50.55015.63)80.13385.1380.14465.1510.13040.1580.14125.18(
12
1

下一张 主 页 退 出上一张
=k-1=4-1=3
3、处理内乘积和与自由度平方和、乘积和与自由度的计算结果列于表 10— 3。
表 10— 3 x与 y的平方和与乘积和表
),( yxtdf
61.664.125.8 tTe SPSPSP
44347)()(),( vxtvxTyxe dfdfdf
(四 ) 对 x和 y各作方差分析 (表 10— 4)
表 10— 4 初生重与 50日龄重的方差分析表下一张 主 页 退 出上一张分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其 50 日龄平均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。
(五 ) 协方差分析下一张 主 页 退 出上一张
1、误差项回归关系的分析误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出 50日龄重 (y)与初生重 (x)之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,
若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正 y值 (50日龄重 )以消去仔猪初生重 (x)不同对它的影响。然后根据校正后的 y
值 (校正 50日龄重 )来进行方差分析。如线性回归关系不显著,则无需继续进行分析。
回归分析的步骤如下:
(1) 计算误差项回归系数,回归平方和,
离回归平方和与相应的自由度从误差项的平方和与乘积和求误差项回归系数:
(10-10)
误差项回归平方和与自由度
(10-11)
dfR(e)=1
1 8 4 8.792.0 61.6
)(
)(
xe
e
eyx SS
SPb
49.4792.0 61.6
2
)(
2
)(
xe
e
eR SS
SPSS
下一张 主 页 退 出上一张误差项离回归平方和与自由度
=85.08-47.49=37.59
(10-12)
(2) 检验回归关系的显著性 (表 10— 5)
表 10— 5 哺乳仔猪 50日龄重与初生重的回归关系显著性检验表
)()()( eRveer SSSSSS
43144)()()( eRveer dfdfdf
F检验表明,误差项回归关系极显著,表明哺乳仔猪 50 日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回归关系来校正 y,并对校正后的 y进行方差分析。
2、对校正后的 50日龄重作方差分析
(1)求校正后的 50日龄重的各项平方和及自由度利用线性回归关系对 50日龄重作校正,并由校正后的 50日龄重计算各项平方和是相当 麻烦的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。
下一张 主 页 退 出上一张
① 校正 50日龄重的总平方和与自由度,即总离回归平方和与自由度
(10-13)
= - =47-1=46
② 校正 50日龄重的误差项平方和与自由度,
即误差离回归平方和与自由度
(10-14)
= - =44-1=43
上述回归自由度均为 1,因仅有一个自变量 x。
87.5775.1 25.876.96
2
)(
2
)()()(
'
xT
T
yTyRyTT SS
SPSSSSSSSS
'Tdf
)(yTdf )(yRdf
59.3792.0 61.608.85
2
)(
2
)()()(
'
xe
e
yeeRyee SS
SPSSSSSSSS
'edf )(yedf )(Redf
③ 校正 50日龄重的处理间平方和与自由度
=57.87-37.59=20.28 (10-15)
=k-1=4-1=3
(2) 列出协方差分析表,对校正后的 50日龄重进行方差分析 (表 10— 6)
查 F值,=4.275(由线性内插法计算 ),由于 F=7.63>,P< 0.01,
表明对于校正后的 50日龄重不同食欲添加剂配方间存在极显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。
eTt SSSSSS
eTt fdfdfd
)43,3(01.0F
)43,3(01.0F
下一张 主 页 退 出上一张表 10— 6 表 10-2资料的协方差分析表
3、根据线性回归关系计算各处理的校正
50日龄平均重误差项的回归系数 表示初生重对 50日龄重影响的性质和程度,且不包含处理间差异的影响,于是可用 根据平均初生重的不同来校正每一处理的 50日龄平均重。校正 50日龄平均重计算公式如下:
(10-16)
)(eyxb
)(eyxb
..).(.,)( xxbyy ieyxii
下一张 主 页 退 出上一张公式中:
为第 i处理校正 50日龄平均重;
为第 i处理实际 50日龄平均重 (见表 10— 2);
为第 i处理实际平均初生重 (见表 10— 2);
为全试验的平均数,
为误差回归系数,=7.1848
将所需要的各数值代入 (10— 16)式中,即可计算出各处理的校正 50日龄平均重 (见表 10— 7)。
.iy?
.iy
.ix
..x
3 1 5 6.148 15.63..., knxx
)(eyxb )(eyxb
表 10— 7 各处理的校正 50日龄平均重计算表下一张 主 页 退 出上一张
4、各处理校正 50日龄平均重间的多重比较各处理校正 50日龄平均重间的多重比较,
即各种食欲添加剂的效果比较。
(1) t检验 检验两个处理校正平均数间的差异显著性,可应用 t检验法:
(10-17)
(10-18)
..
..
ji yy
ji
S
yy
t




)(
2
..
.).(2
xe
ji
eyy SS
xx
n
SMS
ji
下一张 主 页 退 出上一张式中,为两个处理校正平均数间的差异;
为两个处理校正平均数差数标准误;
为误差离回归均方;
n为各处理的重复数;
为处理 i的 x变量的平均数;
为处理 j的 x变量的平均数;
SSe(x)为 x变量的误差平方和例如,检验食欲添加剂配方 1与对照校正
50日龄平均重间的差异显著性:
.,ji yy
,,ji yyS
eSM?
.ix
.jx
=10.3514-12.0758=-1.7244
=37.59/43=0.8742 n=12
=1.52,=1.28,SSe(x)=0.92
将上面各数值代入 (10— 18)式得:
于是
.,21 yy
eSM?
.1x,2x
,.
21 yy
S 4 4 7 7.092.0
)28.152.1(
12
28 7 4 2.0 2?



85.34 4 7 7.0 0 7 5 8.123 5 1 4.10t
下一张 主 页 退 出上一张查 t值表,当自由度为 43时 (见表 10— 6误差自由度 ),t0.01(43)=2.70 (利用线性内插法计算 ),|t| > t0.01(43),P< 0.01,表明对照与食欲添加剂 1号配方校正 50日龄平均重间存在着极显著的差异,这里表现为 1号配方的校正 50
日龄平均重极显著高于对照。 其余的每两处理间的比较都须另行算出,再进行 t检验。
,.
ji yy
S
( 2)最小显著差数法 利用 t检验法进行多重比较,每一次比较都要算出各自的,比较麻烦。当误差项自由度在 20以上,x变量的变异不甚大 (即 x变量各处理平均数间差异不显著 ),为简便起见,可计算一个平均的 采用最小显著差数法进行多重比较。 的计算公式如下:
,,ji yyS
,,ji yyS
,,ji yyS
下一张 主 页 退 出上一张
(10-19)
公式中 SSt(x)为 x变量的处理间平方和。
然后按误差自由度查临界 t值,计算出最小显著差数:
(10-20)
,.
ji yy
S
)1(
12
)(
)(
'
kSS
SS
n
MS
xe
xte
)( d f etL S D,,ji yyS
本例 x变量处理平均数间差异极显著,不满足,x变量的变异不甚大,这一条件,不应采用此处所介绍的最小显著差数法进行多重比较。
为了便于读者熟悉该方法,仍以本例的数据说明之。
此时由 =43,查临界 t值得:
t0.05(43)=2.017,t0.01(43) =2.70
于是 LSD0.05=2.017× 0.4353=0.878
LSD0.01 =2.70× 0.4353 =1.175
,,ji yyS 4 3 54.0)14(92.0
83.01
12
8 7 42.02



'edf
下一张 主 页 退 出上一张不同食欲添加剂配方与对照校正 50日龄平均重比较结果见表 10— 8。
表 10— 8 不同食欲添加剂配方与对照间的效果比较表多重比较结果表明:
食欲添加剂配方 1,2,3号与对照比较,其校正 50 日龄平均重间均存在极 显 著的差异,这 里 表 现 为 配 方
1,2,3号的校正 50日龄平均重均极显著高于对照。
(3) 最小显著极差法当误差自由度在 20以上,x变量的变异不甚大,还可以计算出平均的平均数校正标准误,利用 LSR 法进行多重比较。
的计算公式如下:
(10-21)
yS

)1(
1
)(
)(
'
kSS
SS
n
MS
xe
xte
yS
yS
下一张 主 页 退 出上一张然后由误差自由度 和秩次距 k查 SSR表
(或 q表),计算最小显著极差:
( 10-22)
对于 【 例 10.1】 资料,由于不满足,x变量的变异不甚大,这一条件,不应采用此处所介绍的 LSR法进行多重比较。为了便于读者熟悉该方法,仍以 【 例 10.1】 的数据说明之。
efd?
ySSSRL S R
下一张 主 页 退 出上一张
=0.8742,n=12,
SSt(x)=0.83,SSe(x)=0.92,k=4,代入
(10— 21)式可计算得:
SSR值与 LSR值见表 10— 9。
'eMS
3 0 7 8.0
)14(92.0
83.01
12
8 7 4 2.0?

yS
下一张 主 页 退 出上一张此时表 10— 9 SSR值与 LSR值表下一张 主 页 退 出上一张各处理校正 50日龄平均重多重比较结果见表 10— 10。
表 10— 10 各处理校正 50日龄平均重多重比较表( SSR法 )
下一张 主 页 退 出上一张多重比较结果表明:
食欲添加剂配方 3,2,1号的哺乳仔猪校正 5 0 日龄平均重极显著高于对照,不同食欲添加剂配方间哺乳仔猪校正 50日龄平均重差异不显著。
下一张 主 页 退 出上一张