1
试验数据统计分析
一、攻关目标
建立节水型的优质高效农业发展
模式。
提高区域农业水资源利用率及生
产效率。
为节水条件下农业高效持续发展
提供技术支持和示范模式。
第三章 试验数据统计分析
第一节 方差分析
第二节 单因素试验结果的统计分析
第三节 多因素试验结果的统计分析
第四节 相关与回归分析
一、攻关目标
建立节水型的优质高效农业发展
模式。
提高区域农业水资源利用率及生
产效率。
为节水条件下农业高效持续发展
提供技术支持和示范模式。
一、方差分析的基本原理
二、单向分组资料的方差分析
三、两向分组资料的方差分析
第一节 方差分析
第一节 方差分析
一、方差分析的基本原理
(一)几个变异数的概念
1、极差,最大值 -最小值
2、离均差,观察值 -平均值( xi-x)
3、平方和:离均差平方的总和
4,方差,平方和 /观察值数
5、标准差:方差的平方根值
6、自由度及其意义:观察值数 -1( n-1)
一、攻关目标
第一节 方差分析
( 二)方差分析的作用
1、将总变异分裂为各个因素的相应变异,作出数量
估计;发现各个因素在变异中所占的重要程度。
2、准确估计试验误差。
(三)自由度和平方和的分解
设有 k组样本, 每样本皆具有 n个观察值, 则该资料共
有 nk个观察值, 其数据分组如表 1:
一、攻关目标
第一节 方差分析
组别 1 2 …,,i … … k
X
11
X
12
…
X
1j
…
X
1n
X2
1
X
22
…
X
2j
…
X
2n
X
i1
Xi
2
…
Xi
j
…
Xi
n
Xk
1
Xk
2
…
Xk
j
…
Xk
n
总和 T1 T2 Ti Tk T= ∑ Xi j = ∑
平均 X1 X2 Xi Xk X
均方
表 1 每组具有 n个观察值的 k组样本的符号表
( I=1,2,…,.,k; j=1,2,…… n)
一、攻关目标
第一节 方差分析
在表 1中,总变异是 nk个观察值的变异,故其自由
度 v=nk-1,而平方和 SST则为
总平方和:
? ? ???? nk nkijT CxxxSS
1 1
22)(
nk
T
nk
xC 22)( ?? ?矫正系数
?
?
????
k
k
it Cn
T
xxnSS
1
1
2
2)(组间平方和
一、攻关目标
第一节 方差分析
组内平方和,SSe= SST-SSt
自由度分解,( nk-1) =(k-1)+k(n-1)
总自由度 =组间自由度 +组内自由度
平方和分解:总平方和 =组间平方和 +组内平方和
[例 1] 以 A,B,C,D 4种药剂处理水稻种子, 其中
A为对照, 每处理各得 4个苗高观察值 ( cm), 其结
果如表 2,试分析其自由度和平方和 。
第一节 方差分析
第一节 方差分析
药剂 A( x1.) B( x2.) C( x3.) D( x4.)
19
23
21
13
21
24
27
20
20
18
19
15
22
25
27
22
总和 Ti 76 92 72 96 T=336
平均 xi 19 23 18 24 X=21
表 2 水稻不同药剂处理的苗高( cm)
总变异 =( 4× 4) -1=15
药剂间自由度 =4-1=3
药剂内自由度 =4( 4-1) =12
第一节 方差分析
104
4
96729276
2222......2319
7056
44
336
2222
222
2
??
???
?
?????
?
?
?
CSS
CSS
C
t
T
一、攻关目标
第一节 方差分析
83.9
12
118
67.34
3
104
80.14
15
222
118222
2
2
2
??
??
??
????
e
t
T
tTe
S
S
S
SSSSSS
( 试验误差加药剂效应 )
(试验误差估计)
一、攻关目标
第一节 方差分析
(四) F测验的概念:
对于两个独立的样本,分别求得其均方 S12和 S22
则将二者的比值定义为 F:
在方差分析的体系中, F测验是用于测验某项变异因素的
效应或方差是否真实存在 。 所以在计算 F值时, 总是将测验
项变异因素的均方作分子, 而将另一项变异因素 ( 例如试
验误差 ) 作分母 。 若所得 F>F0.05或 >F0.01,则 F值即为在
a=0.05或 a=0.01水平上显著;否则不显著 。
2
2
2
1
S
SF ?
一、攻关目标
第一节 方差分析
[例 2] 测定东方红 3号小麦的蛋白质含量 10次,
得均方;测定农大 139小麦的蛋白质含量 5次,得均
方。试测前者的变异是否比后者大。
显 著 水 平 面取 a=0.05,v1=9,v2=4时, 查附 表 得
F0.05=6.00。 测验计算:
F ? 01.12135.0 621.1 ?
此 F> F0.05,即东方红小麦蛋白质含量变异大于农
大 139
一、攻关目标
第一节 方差分析
[例 ]如前已算得的药剂间均方,
67.3431042 ??tS
药剂内均方,
83.9121 1 82 ??eS
具自由度 v1=3,v2=12。 试测验药剂间变异是否
大于药剂内变异?
第一节 方差分析
显著水平取 a=0.05,F0.05=3.49。
测验计算:
?F 53.383.9 67.34 ?
此 F> F0.05, 即药剂间变异大于药剂内变异,
不同药剂对水稻苗高是具有不同效应的 。
第一节 方差分析
(四 )多重比较
F测验 是一个整体的概念 。 仅能测出不同处
理效应的平均数的显著差异性 。 但是, 是否各个平
均数间都有显著差异性? 还是仅有部分平均数间有
显著差异而另一部分平均数间没有显著差异? 它不
曾提供任何信息 。 要明确各个平均数间的差异显著
性, 还必须对各平均数进行多重比较 。
第一节 方差分析
(一 ) 最小显著差法 ( LSD法 )
首先算得平均数差数的标准误:
n
s
xSxS e
2
21
2
??
式中,为方差分析时的误差均方值,n为
样本容量。由 t表查得 ta,即有最小显著差数:
2eS
L S D a = atxxS 21 ?
第一节 方差分析
若两个平均数的差数 >LSDa,即为 a水平上显著 。
LSD法实质上是 t测验,而 t测验只适用于两个相互
独立的样本平均数。
(二 )最小显著极差法 ( LSR法 )
这一方法的特点是不同平均数间的比较采用不同的
显著差数标准, 因而克服了 LSD法的局限性, 可用于
平均数间的所有相互比较 。 其常用的有新复极差测验
和 q测验两种 。
第一节 方差分析
1,新复极差测验 ( SSR测验 ),
平均数的标准误
SE = n
s e2
查 SSR表, 查得所具有的自由度下, p=2,3,……, k时
的 SSR值 ( p为某两极差间所包含的平均数个数 ) 。 进而算
得各个 p下的最小显著极差 LSR。
LSR= SE× SSRa
将各个平均数按大小顺序排列, 用各个 p的 LSRa值即可测
验各平均数的显著性;凡两极差 <LSRa者为不显著, 凡两
极差 >LSRa者为显著 。
第一节 方差分析
[例 3] 对前述资料的各个平均数作新复极差
测验 。
表 3 LSR值计算(新复极差测验)
P 2 3 4
SSR0.05 3.08 3.23 3.33
SSR0.01 4.32 4.55 4.68
LSR0.05 4.84 5.07 5.23
SSR0.01 6.78 7.14 7.35
第一节 方差分析
4种药剂对苗高效应的平均数大小顺序是 D=24,B=23,
A=19,C=18。 D与 B比,B与 A比,A与 C比时 p皆为 2; D与
A比,B与 C比时,p=3,D与 C比时 p=4,故测验结果为:
B与 A比,23-19=4<4.84,不显著
A与 C比,19-18=1<4.84,不显著
D与 A比,24-19=5<5.07,不显著
第一节 方差分析
B与 C比,23-18=5<5.07,不显著
D与 C比,24-18=6>5.23,显著
结论:只有处理 D和 C的差异在 a=0.05水平显著,
其余皆不显著 。
2.q测验:
q测验与 SSR测验相似, 其区别仅在于计算最小
显著极差 LSRa值时不是查 SSRa,而是查 qa。
查 qa值后, 即有, LSR=SE× qa
第一节 方差分析
三,各方法的异同
根据上述测验计算, 可以看到在两极差间所包含的平均数
个数 p=2时, t测验 ( LSD法 ), SSR测验和 q测验 的显著尺度都
是完全相同的 。 但是, 当 p>2时, 三种测验的显著尺度不相同,
LSD法最低, SSR测验次之, q测验最高 。 因此, ( 1) 对于试验
结果事关重大或有严格要求的试验, 宜用 q测验,( 2) 一般试
验可采用 SSR测验; ( 3) 试验中各个处理平均数皆与对照相比
的, 可用 LSD测验 。 ( 4) LSD测验必须经过 F测验确认各平均数
间有显著差异之后, 才宜应用; SSR测验和 q测验可不经过 F测
验 。
第一节 方差分析
( (四 )多重比较结果的表示方法
表 4,标记字母法
处理 平均苗高 差异显著性
D 24 a A
B 23 ab A
A 19 ab A
C 18 b A
第一节 方差分析
表 5.列梯形表法
:
差异 处理 平均数
Xi - 18 Xi - 19 Xi - 23
D
B
A
C
24
23
19
18
6
*
5
1
5
4
1
第一节 方差分析
(五 )方差分析的基本步骤
1,将资料总变异的自由度和平方和分解为各
变异因素的自由度和平方和, 并进而算得
其均方;
2,计算均方比, 作出 F测验, 以明了各变异
因素的重要程度;
3,对各平均数进行多重比较 。
第一节 方差分析
二,单向分组资料的方差分析
单向分组资料是指观察值仅按一个方向分组的资料,如试
验中将全部供试单位随机地分成若干组,然后按组给以不同处
理,这样所得的全部观察值就是单向分组资料,这种试验叫做完
全随机设计试验,
[例 4] 研究 6种氮肥施用方法 (K=6)对小麦的效应,每种
施肥方法种 5盆小麦 (n=5),完全随机设计,最后测定它
们的含氮量,其结果如下表,试作方差分析,
第一节 方差分析
表 6 6种施肥法小麦植株含氮量
处理 施 氮 法 总和
1 2 3 4 5 6
2.9 4.0 2.6 0.5 4.6 4.0
2.3 3.8 3.2 0.8 4.6 3.3
2.2 3.8 3.4 0.7 4.4 3.7
2.5 3.6 3.4 0.8 4.4 3.5
2.7 3.6 3.0 0.5 4.4 3.7
Ti 12.6 18.8 15.6 3.3 22.4 18.2 T=
90.9
第一节 方差分析
(一 )自由度和平方和的分解
总变异自由度 =6*5-1=29
处理间自由度 =6-1=5
误差 (处理内 )自由度 =6(5-1)=24
(二 )平方和分解
矫正数
4 2 7.2 7 5
30
)9.90( 2 ??C
? ???????? 763.457.3...3.29.2 2222 CCxSS T
4 6 3.445 2.18...8.186.12
2222
???????? ? CCnTSSt i
第一节 方差分析
300.14 6 6 3.44763.45 ????? tTe SSSSSS
变异来源 DF SS MS F F0.05
处理间 5 44.463 8.8926 164.07 3.90
误差 24 1.300 0.0542
总变异 29 45.763
表 7 方差分析表
07.1 6 40 5 4 2.0 8 9 2 6.8 ??F
第一节 方差分析
(三 )各处理平均数的比较
在此用新复极差测验 (LSR),算得
1 0 4 1.0
5
0 5 4 2.0 ??SE
表 8 新复极差测验的 LSR值
p 2 3 4 5 6
SSR0.05 2.92 3.07 3.15 3.22 3.28
SSR0.01 3.96 4.14 4.24 4.33 4.39
LSR0.05 0.304 0.319 0.328 0.335 0.341
LSR0.01 0.412 0.431 0.441 0.450 0.457
第一节 方差分析
表 9 6种施氮法植株含氮量的差异显性
施氮法 平均数 差异显著性
0.05 0.01
5 14.48 a A
2 13.76 b B
6 13.64 b B
3 13.12 c C
1 12.52 d D
4 10.66 e E
第一节 方差分析
二, 两向分组资料的方差分析
试验数据按两个因素交叉分组的,为两向分组资料。例如选
用几种灌水量和几种施肥量,研究其对作物生长和产量的影响,
其每一观察值都是某一灌水量和某一施肥量的组合同时作用的
结果,故属两向分组资料。两向分组又叫交叉分组。按完全随
机设计的两因素试验数据,都是两向分组资料;其方差分析按
各组有无重复观察值分为两种不同分析方法。
( 一)组合内只有单个观察值的两向分组资料的方差分析
[例 5] 用生长素处理豌豆试验,试验结果如下表:
第一节 方差分析
表 10 生长素处理豌豆的试验结果
处理
( A)
组(或重复,B) 总和
Ti
平均
I II III IV
对照
赤霉素
动力精
吲哚乙
腺嘌呤
马来酸
60
65
63
64
62
61
62
65
61
67
65
62
61
68
61
63
62
62
60
65
60
61
64
65
243
263
245
255
253
250
60.8
65.8
61.3
63.8
63.3
62.5
总和 T。 375 382 377 375 T=1509
ix
第一节 方差分析
( 一 ) 自由度和平方和的分解
30.4345.587.6562.114
45.5
6
375377382375
87.65
4
250.,,,,,263243
62.11465.,,,,,6560
38.9 4 8 7 8
46
1 5 0 9
2222
222
222
2
????
??
???
?
??
???
?
??????
?
?
?
SSe
CSS
CSS
CSS
C
B
A
T
第一节 方差分析
(二) F测验
变异
来源
DF SS MS F F0.05
区组间
处理间
误 差
3
5
15
5.45
65.87
43.30
1.82
13.17
2.89
<1
4.52 2.90
总变异 23 114.62
第一节 方差分析
( 三)处理间比较 此例有指定的对照,故用 LSD法。
处理 平均数 与对照的差数
对照 60.8 _
赤霉素 65.8 5.0**
动力精 61.3 0.5
吲哚乙酸 63.8 3.0*
腺嘌呤 63.3 2.5
马来酸 62.5 1.7
第一节 方差分析
二、组合内有重复观察值的两向分组资料的方差分析
[例 6],施用 A1,A2,A3 3种肥料于 B1,B2,B3 3种土壤,以
小麦为指示作物,每处理组合种 3盆,得产量结果如表 12,试
作方差分析。
肥料种类 盆 土壤种类( B) 总和 Ti.,平均 xi
A1 B1 B2 B3
1 21.4 19.6 17.6
2 21.2 18.8 16.6
3 20.1 16.4 17.5
Tij 62.7 54.8 51.7 169.2 18.8
第一节 方差分析
肥料
种类
盆 土壤种类( B) 总和
T i..
平均
Xi..
A2
B1 B2 B3
1 12.0 13.0 13.3
2 14.2 13.7 14.0
3 12.1 12.0 13.9
Tij 38.3 38.7 41.2 118.2 13.1
第一节 方差分析
肥料种类 盆 土壤种类( B) 总和 T i,平均 Xi..
A3
B1 B2 B3
1 12.8 14.2 12.0
2 13.8 13.6 14.6
3 13.7 13.3 14.0
Tij 40.3 41.1 40.6 122.0 13.6
总和 T.j,141.3 134.6 133.5 T=
409.4
平均 X.j,15.7 15 14.8
第一节 方差分析
(一)自由度和平方和的分解
70.1617.1996.345.17928.219
17.1996.345.179
3
6.40......8.547.62
96.3
33
5.1336.1343.141
45.179
33
0.1222.1182.169
28.2190.14......2.214.21
72.6207
333
4.409
222
222
222
222
2
?????
????
???
?
??
?
??
?
??
?
??
?
??????
?
??
?
e
AB
B
A
T
SS
CSS
CSS
CSS
CSS
C
第一节 方差分析
(二) F测验
变异来源 DF SS MS F F0.01
肥类间 2 179.45 89.73 96.8 6.01
土类 2 3.96 1.98 2.13 6.01
肥 X土 4 19.17 4.79 5.16 4.58
试验误差 18 16.70 0.928
总变异 26 219.28
第一节 方差分析
(三)平均数的比较
1、各处理组合平均数的比较,肥 X土的互作显著,说明肥效
随土类而不同,故进一步作比较。在此用新复极差测
验,求得
554.0
3
928.0 ??SE
根据 v=18,算得各LSR 0.05和LSR 0.01的值于下表。
第一节 方差分析
各处理组合平均数的LSR值(新复极差测验)
p 2 3 4 5 6 7 8 9
SSR0.05 2.97 3.12 3.21 3.27 3.32 3.35 3.37 3.39
SSR0.01 4.07 4.27 4.38 4.46 4.53 4.59 4.64 4.68
LSR0.05 1.65 1.73 1.78 1.81 1.84 1.86 1.87 1.88
LSR0.01 2.25 2.37 2.43 2.47 2.51 2.54 2.52 2.59
第一节 方差分析
各处理组合平均数的新复极差测验
处理组合 平均数 差异显著性
0.05 0.01
A1B1 20.9 a A
A1B2 18.3 b B
A1B3 17.2 b B
A2B3 13.7 c C
A3B2 13.7 c C
A3B3 13.5 c C
A3B1 13.4 c C
A2B2 12.9 c C
A2B1 12.8 c C
2.各肥类平均数的比较,肥类间的F测验极显著,求得肥类
平均数的标准误
第一节 方差分析
32.0
33
9 2 8.0
?
?
?SE
故有各肥类平均数的LSR值及显著性测验结果于下表:
第一节 方差分析
平均数的LSR值
p 2 3
SSR0.05 2.97 3.12
SSR0.01 4.07 4.27
LSR0.05 0.95 1.00
LSR0.01 1.30 1.37
肥料种类 平均
数
差异显著性
0.05 0.01
A1 18.8 a A
A2 13.6 b B
A3 13.1 b B
各肥类平均数的新复极差测验
第二节 单因素试验结果的分析
一、对比和间比试验的统计分析
二、随机区组试验的统计分析
第二节 单因素试验结果的分析
一、对比和间比试验的统计分析
(一)对比试验结果的统计分析
[例 7] 有一大豆品种比较试验,有 A,B,C,D,E、
F6个品种,另加一标准品种 CK,采用对比法设计,3
次重复,所得产量结果如下表( 13),试作分析。
第二节 单因素试验结果的分析
表 13 大豆品比试验(对比法)产量结果与分析
品种 各重复小区产量(斤) 总和
Ti
平均
xt
对邻近
Ck%I II III
ck 37.0 36.5 35.5 109.0 36.3 100.0
a 36.4 36.8 34.0 107.2 35.7 98.3
b 38.0 37.0 34.5 109.5 36.5 119.3
ck 31.5 30.8 29.5 91.8 30.6 100.0
c 36.5 35.0 31.0 102.5 34.2 111.7
d 35.2 32.0 30.1 97.3 32.4 106.7
ck 30.6 32.9 27.7 91.2 30.4 100.0
e 28.4 25.8 23.6 77.8 25.9 85.3
f 30.6 29.7 28.3 88.6 29.5 90.4
ck 35.2 32.3 30.5 98.0 32.7 100.0
第二节 单因素试验结果的分析
100
100%
??
??
平均产量邻近
某品种平均产量
总产量邻近
某品种总产量
的对邻近
CK
CK
CK
例如,a品种对邻近 ck的
3.981003.36 7.353.981000.109 2.107% ?????? 或
第二节 单因素试验结果的分析
(二)间比试验结果的统计分析
步骤:
1、将各处理在各重复的小区产量相加,得总和;
2、总和除以重复次数得小区平均数 X;
3、计算各处理的理论对照标准 CK,CK为前后两
个对照的平均数;
4、计算各处理产量对相应 CK产量的百分数。
第二节 单因素试验结果的分析
处理 各重复小区产量 平均
xt
对照
CK
对 CK
的 %I II III IV V
ck3 35.9 40.5 28.2 31.9 29.0 33.1
A 37.1 39.4 34.0 36.9 35.8 36.6 3.3 110
B 39.8 42.0 36.8 41.4 28.9 37.8 3.3 114
C 38.2 39.9 25.4 33.1 28.9 33.1 3.3 99
D 37.3 43.2 39.1 34.9 34.0 37.7 3.3 113
Ck2 33.0 42.1 29.0 34.6 28.8 33.5
E 38.0 40.2 34.5 39.8 37.5 38.0 34.2 111
F 36.1 34.3 32.8 27.1 29.7 32.0 34.2 94
G 37.8 36.3 41.3 34.2 39.9 37.8 34.2 111
H 34.0 39.1 27.3 34.7 28.9 32.8 34.2 96
ck3 36.0 40.1 31.5 37.8 29.6 35.0
第二节 单因素试验结果的分析
二、随机区组试验的统计分析
随机区组试验结果的统计分析,应用 方差分析部分所述两
向分组单个观察值资料的方差分析法。 在这里可将处理看作 A
因素,区组看作 B因素,其余部分则为试验误差。设试验有 n
个处理,k个区组,则其自由度和平方和的分解如下:
nk-1=(k-1)+(n-1)+(n-1)(k-1)
总自由度 =区组自由度 +处理自由度 +误差自由度
总平方和 =区组平方和 +处理平方和 +试验误差平方和
第二节 单因素试验结果的分析
[例 8]有一灌溉试验,共有 A,B,C,D,E,F,G、
H8个处理( k=8),其中 A是对照处理,采用随机区
组设计,重复 3次( n=3),其产量结果如下表
( 14):
第二节 单因素试验结果的分析
处理 I II III Tt Xt
A 10.9 9.1 12.2 32.2 10.7
B 10.8 12.3 14.0 37.1 12.4
C 11.1 12.5 10.5 34.1 11.4
D 9.1 10.7 10.1 29.9 10.0
E 11.8 13.9 16.8 42.5 14.2
F 10.1 10.6 11.8 32.5 10.8
G 10.0 11.5 14.1 35.6 11.9
H 9.3 10.4 14.4 34.1 11.4
Tr 83.1 91.0 103.9 278.0(T)
Xr 10.4 11.4 13.0 11.6(x)
第二节 单因素试验结果的分析
(一)自由度和平方和的分解
1。自由度的分解:
总自由度
14)18)(13()1)(1(
7181
2131
231)83(1
???????
?????
?????
??????
knDG
kDF
nDF
nkDF
误差
处理
区组
第二节 单因素试验结果的分析
2.平方和的分解:
97.2208.3456.2761.84
08.3416.3220
3
1.34......1.372.32
56.2716.3220
8
9.1030.911.83
61.84)4.14......1.99.10(
16.3220
83
0.278
222
2
222
2
1
2222
22
???????
??
???
???
??
??
???
????????
?
?
??
?
?
?
SSSSSSSS
C
n
T
SS
C
k
T
SS
CCxSS
nk
T
C
t
r
nk
处理区总误差
处理
区组
总
矫正数
第二节 单因素试验结果的分析
(二)方差分析和 F测验
将上述结果列入下表:
方差分析表
变异来源 DF SS MS F F0.05
区组间 2 27.56 13.78 8.40 3.74
处理间 7 34.08 4.87 2.97 2.77
误 差 14 22.97 1.64
总变异 23 84.61
第二节 单因素试验结果的分析
方差分析结果(根据上表):
对于区组 F=13.78/1.64=8.40>F0.05,说明区组
间土壤肥力有显著差异。
对于处理间 F=4.87/1.64=2.97>F0.05,说明 8个
处理间有显著差异。
但是到底哪些处理间有显著差异?哪些处理间没
有显著差异?则需作 多重比较 。
第二节 单因素试验结果的分析
(三)处理间比较
1。 T测验( LSD法),如果测验各处理与对照是否有差异,
宜用 LSD法。步骤如下:
( 1)计算处理间差数的标准误
以小区平均数为比较标准时,差数标准误为
01.02105.0
05.02105.0
2
21
2
txxSL S D
txxSL S D
n
S
xxS
e
???
???
??
并有
第二节 单因素试验结果的分析
以各处理的小区总产量为比较标准时,因总产量比平均产
量大 n倍,故差数标准误为
01.02101.0
05.02105.0
2
2
21
2
2
tSL S D
tSL S D
nSn
n
S
S
TT
TT
e
e
TT
?
?
?
?
?
???
并有
第二节 单因素试验结果的分析
在此以小区平均产量为比较标准,则
)xxS 斤(05.1
3
64.12
21
?
??
由于 v=14时,t0.05=2.145,t0.01=2.977,故
LSD0。 05=1.05*2.145=2.25( 斤)
LSD0。 01 =1.05*2.977=3.13( 斤)
第二节 单因素试验结果的分析
如以小区总产量为比较标准,则
35.99 7 7.214.3
74.61 4 5.214.3
14.364.132
01.0
05.0
21
???
???
????
?
LS D
LS D
S
TT
第二节 单因素试验结果的分析
如以亩产量为比较标准,则可算得化各品种总产
量为亩产量的改算系数:
10
2 0 03
6 0 0 0 ?
?
?cf
式中,3为小区数目,200为小区面积。
并有
5.931035.9
4.671074.6
01.0
05.0
???
???
L S D
L S D
第二节 单因素试验结果的分析
表 15 各处理产量和对照相比的差异显著性
处理 以平均数比较 以总产比较 以亩产比较
差异 差异 斤 /亩 差异
E 14.2 3.5** 42.5 10.3 425 103
B 12.4 1.7 37.1 4.9 371 49
G 11.9 1.2 35.6 3.4 356 34
H 11.4 0.7 34.1 1.9 341 19
C 11.4 0.7 34.1 1.9 341 19
F 10.8 0.1 32.5 0.3 325 3
A( ck) 10.7 32.2 322
D 10.0 -0.7 39.9 -2.3 299 -23
tx tT
第二节 单因素试验结果的分析
2、新复极差测验( LSR法),测验各处理相互比
较的差异显著性,宜应用 LSR法 。步骤如下:
( 1) 计算处理标准误 SE
以小区平均数比较时为
n
S
SE e
2
?
第二节 单因素试验结果的分析
以小区总数为比较时为
2
enSSE ?
以亩产量为比较时为
cfnSSE e ?? 2
第二节 单因素试验结果的分析
( 2)查表当 v=(n-1)(k-1)时 p自 2至 k的 SSR0.05和
SSR0.01值,进而算得 LSR0.05和 LSR0.01值
LSR0.05=SE* SSR0.05
LSR0.01=SE* SSR0.01
上式 LSR0.05和 LSR0.01即为测验各种 P下极差显著性
的尺度。
第二节 单因素试验结果的分析
在本例如以小区平均数为比较标准,则有
74.0
3
64.1 ??SE
查附表,v=14,P=2时,SSR0.05=3.03,
SSR0.01=4.21,故
12.321.474.0
24.203.374.0
01.0
05.0
???
???
L S R
L S R
第二节 单因素试验结果的分析
P=3时,SSR0.05=3.18,SSR0.01=4.42,故
27.342.474.0
35.218.374.0
01.0
05.0
???
???
L S R
L S R
P=4,5,…… 时,可以类推,在此应一直求至
P=k=8时为止。其全部结果录入下表:
第二节 单因素试验结果的分析
表 16 新复极差测验的最小显著极差
p 2 3 4 5 6 7 8
SSR0.05 3.03 3.18 3.27 3.33 3.37 3.39 3.41
SSR0.01 4.21 4.42 4.55 4.63 4.70 4.78 4.83
LSR0.05 2.24 2.35 2.24 2.24 2.49 2.51 2.52
LSR0.01 3.12 3.27 3.37 3.43 3.48 3.54 3.57
第二节 单因素试验结果的分析
表 17 新复极差测验
处理 小区平均 差异显著性5% 1%
E 14.2 a A
B 12.4 ab AB
G 11.9 ab AB
H 11.4 b AB
C 11.4 b AB
F 10.8 b AB
A 10.7 b AB
D 10.0 b B
第三节 多因素试验结果的分析
多因素试验结果的统计分析的基本原理,已在第
一节作过介绍。本节只是这些基本原理的引伸应用。
一、两因素随机区组试验结果的统计分析
设有 A和 B两个试验因素,各具 a和 b 个水平,作随
机区组设计,有 r次重复,则该试验共得 rab个观察
值。其各项变异来源的自由度可分解于下表:
第三节 多因素试验结果的分析
表 18 二因素随机区组试验自由度的分解
变异来源 DF
区组 r-1
处理:
A
B
A*B
ab-1
a-1
b-1
(a-1)(b-1)
误差 (r-1)(ab-1)
总变异 rab-1
第三节 多因素试验结果的分析
由表 18可见,二因素随机区组试验和单因素随机
区组试验,在变异来源上的区别仅在于:前者的处理
项可进而分解为 A因素水平间,B因素水平间、和 AB
互作间三个部分,因而也就可分解出相应的自由度和
平方和
(ab-1) = (a-1)+ (b-1)+ (a-1)(b-1)
处理自由度 =A的自由度 +B的自由度 +AB自由度
处理平方和 =A的平方和 +B的平方和 +AB平方和
第三节 多因素试验结果的分析
[例 9] 有一小麦二因素试验,A因素为品种,分 A1
( 早熟),A2( 中熟),A3( 晚熟)三个水平
( a=3),B因素为灌水量,分 B1( 50m3),B2( 100m3)、
B3( 150m3) 三个水平( b=3),共 ab=3*3=9个处理组
合,重复 3次( r=3),小区计产面积 60尺 2。其田间
排列和小区产量(斤)列于下图。试作分析。
第三节 多因素试验结果的分析
A1B1
8
A2B2
7
A3B3
10
A2B3
8
A3B2
8
A1B3
6
A3B1
7
A1B2
7
A2B1
9
A2B3
7
A3B2
7
A1B2
7
A3B1
7
A1B3
5
A2B1
9
A2B2
9
A3B3
9
A1B1
8
A3B1
6
A1B3
6
A2B1
8
A1B2
6
A2B2
6
A3B3
9
A1B1
8
A2B3
6
A3B2
8
小麦品种和灌水量随机区组试验
的田间排列和产量
I
II
III
第三节 多因素试验结果的分析
1.结果整理:( 1)将结果按处理和区组作两向分组整理成表:
处理 I II III TAB
A1B1 8 8 6 24
A1B1 7 7 6 20
A1B1 6 5 6 17
A1B1 9 9 8 26
A1B1 7 9 6 22
A1B1 8 7 6 21
A1B1 7 7 6 20
A1B1 8 7 8 23
A1B1 10 9 9 28
Tr 70 68 63 201(T)
第三节 多因素试验结果的分析
( 2) 按品种和灌水量作两向分组整理成表:
B
A B1 B2 B3 TA
A1 24 20 17 61
A2 26 22 21 69
A3 20 23 28 71
TB 70 65 66 201
第三节 多因素试验结果的分析
在上表中,Tr=区组总和,TAB=处理总和,TA =品
种总和,TB=灌水总和,T=全试验总和。
2.自由度和平方和的分解:
第三节 多因素试验结果的分析
11.867.2989.267.40
67.29
3
28.,,,,,2024
89.2
33
636870
67.409.,,,,,78
33.1 4 9 6
333
2 0 1
222
2
222
2
222
1
22
???????
??
???
???
??
?
??
???
????????
?
??
??
?
?
?
SSSSSSSS
CC
r
T
SS
CC
ab
T
SS
CCxSS
r a b
T
C
AB
r
r a b
处理组合区组总误差
处理组合
区组
总
矫正数
第三节 多因素试验结果的分析
对处理组合项 SS再进行分解:
73.2157.137.667.29
57.1
33
666570
37.6
33
716961
2222
2222
???????
??
?
??
???
??
?
??
???
?
?
BAAB
B
B
A
A
SSSSSSSS
CC
ra
T
SS
CC
rb
T
SS
处理组合
第三节 多因素试验结果的分析
3.方差分析和 F检验:
表 19 二因素试验的方差分析
变异来源 DF SS MS F F0.05
区 组 间 2 2.89 1.45 2.84 3.63
处理组合间 8 29.67 3.71 7.27* 2.59
品种 2 6.37 3.19 6.25 * 3.63
灌水 2 1.57 0.78 1.53 3.63
品 *水 4 21.73 5.43 10.65 * 3.01
误 差 16 8.11 0.51
总 变 异 26 40.67
第三节 多因素试验结果的分析
4.差异显著性测验
( 1)品种间比较
2 3 8.0
33
51.02 ?
?
??
rb
SSE e
查附表,P=2时,SSR0.05,16=3.00,SSR0.01,16=4.13,P=3时,
SSR0.05,16=3.15,SSR0.01,16=4.34。 因此有
P=2,LSR0.05,=0.238X3.00=0.71,
LSR0.01,=0.238X4.13=0.98,
第三节 多因素试验结果的分析
P=3,LSR0.05,=0.238X3.15=0.75,
LSR0.01,=0.238X4.34=1.03。
测验结果列于下表:
三个品种平均产量新复极差测验
品种 xA 差异显著性
5% 1%
A3 7.9 a A
A2 7.7 a AB
A1 6.8 b B
第三节 多因素试验结果的分析
( 2)品种 ? 灌水的互作:
灌水 产量 差异显著性
0.05 0.01
B1 8.0 a A
B2 6.7 b AB
B3 5.7 b B
( 1) A1品种作新复极差测验,算得
4 1 2.0351.0
2
??? rSSE e
P=2时,LSR0.05,16=1.24,
LSR0.01,16=1.70,
P=3时,LSR0.05,16=1.30,
LSR0.01,16=1.79。
第三节 多因素试验结果的分析
灌水 产量 差异显著性
0.05 0.01
B1 9.3 a A
B2 7.7 b AB
B3 6.7 b B
( 3) A3品种
灌水 产量 差异显著性
0.05 0.01
B1 8.7 a A
B2 7.3 b AB
B3 7.0 b B
( 2) A2品种
第三节 多因素试验结果的分析
5.试验结论
本试验品种主效有显著差异,以 A3产量最高,与
A1有显著差异,而与 A2无显著差异。灌水主效无显
著差异(?)。但品种与灌水互作极显著,A3品种
需用 B3灌水量,A2品种需用 B1灌水量,才能取得高
产。
第三节 多因素试验结果的分析
二、三因素随机区组试验结果的分析
设有 A,B,C三因素,各具 a,b,c个水平,作随
机区组设计,设有 r个区组,则该试验共有 rabc个观
察值,其各项变异来源及自由度的分解如下表:
第三节 多因素试验结果的分析
变异来源 DF
区组 r-1
处理,abc-1
A a-1
B b-1
C c-1
AXB (a-1)(b-1)
AXC (a-1)(c-1)
BXC (b-1)(c-1)
AXBXC (a-1)(b-1) (c-1)
误 差 (r-1)(abc-1)
总 变 异 rabc-1
三
因
素
随
机
区
组
试
验
自
由
度
的
分
解
第三节 多因素试验结果的分析
由上表可见,三因素随机区组试验和单因素随机
区组试验比起来,仅在于前者的处理间变异再被分解
为 7项,其中主效 3项,一级互作 3项,二级互作 1项。
各项都有相应的自由度和平方和,并且这些项的自由
度之和与平方和之和一定等于处理项的自由度和平方
和。
第三节 多因素试验结果的分析
[例 10] 有一随机区组设计的棉花栽培试验,有 A
( 品种),B( 播期),C( 灌水) 3个试验因素,各
具 a=2,b=2,c=3个水平,重复 3次,小区计产面积
200尺。其处理内容和代号见下表,田间排列和皮棉
产量见下图,试作分析。
第三节 多因素试验结果的分析
A品种 B播期 C灌水 处理代号
A1
B1
C1(100) 1
C2(150) 2
C3(200) 3
B2
C1(100) 4
C2(150) 5
C3(200) 6
A2
B1
C1(100) 7
C2(150) 8
C3(200) 9
B2
C1(100) 10
C2(150) 11
C3(200) 12
第三节 多因素试验结果的分析
2 5 9 12 4 8 1 10 3 7 11 6
12 10 2 11 1 9 6 7 8 4 3 5
3 1 11 2 12 9 5 10 6 8 7 4
区组 I
区组 II
区组 III
棉花三因素随机区组试验的田间排列示意图
第三节 多因素试验结果的分析
1.结果整理:将试验结果按区组和处理作两向分
组整理成表 1;再按任两个因素作两向分组整理成表
2,3,4。
以下页表中,Tr,TABC,TA, TB, TC依次分别
为各区组、处理、品种、播期、灌水的总和数,T为
试验总和数。各个总和数所包含的小区数目,必为总
小区数( rabc) 除以该总和数的下标所具有的水平。
第三节 多因素试验结果的分析
区 组 I II III TB
处理
A1
B1
C1
C2
C3
12 14 13 39
12 11 11 34
10 9 9 28
B2
C1
C2
C3
10 9 9 28
9 9 8 26
6 6 7 19
A2
B1
C1
C2
C3
3 2 4 9
4 3 4 11
7 6 7 20
B2
C1
C2
C3
2 2 3 7
3 4 5 12
5 7 7 19
Tr 83 82 87 252T
表
20
区
组
和
处
理
两
向
表
第三节 多因素试验结果的分析
B
A
B1 B2 TA
A1 101 73 174
A2 40 38 78
TB 141 11 252
dA1-A2 61 35 96
C
A
C1 C2 C3 TB
A1 67 60 47 174
A2 16 23 39 78
Tc 83 83 86 252
dA1-A2 51 37 8 96
AB两向表 AC两向表
第三节 多因素试验结果的分析
C
B
C1 C2 C3 TB
B1 48 45 48 141
B2 35 38 38 111
Tc 83 83 86 252
dB1-B2 13 7 10 30
BC两向表
第三节 多因素试验结果的分析
2.自由度和平方和的分解:
84.1200.3 8 216.100.3 9 6
00.3 8 2
3
19.,,,,,3439
16.1
322
878283
00.3 9 67.,,,,,1212
00.1 7 6 4
3223
2 5 2
2222
222
2
2222
22
????
??
???
???
??
??
??
???
????????
?
???
??
?
?
?
SS
CC
r
T
SS
CC
a b c
T
SS
CCxSS
r a b c
T
C
ABC
r
误差
处理
区组
总
矫正数
由区组和处理两向表可求得
第三节 多因素试验结果的分析
由 AB两向表求得
77.1800.2500.256
33
384073101
00.25
323
111141
00.256
323
78174
22222
222
222
????
?
???
?????
??
??
?
???
??
??
?
???
?
?
?
C
SSSSC
rc
T
SS
CC
r a c
T
SS
CC
r b c
T
SS
BA
AB
AB
B
B
A
A
第三节 多因素试验结果的分析
由 AC两向表求得
16.8050.000.2 5 6
23
39.,,,,,6067
50.0
223
868383
2222
2222
????
?
???
?????
??
??
??
???
?
?
C
SSSSC
rb
T
SS
CC
r a b
T
SS
CA
AC
AC
C
C
第三节 多因素试验结果的分析
由 BC两向表可求得
50.150.000.25
23
38.,,,,,4548
222
2
????
?
???
?
????
?
C
SSSSC
ra
T
SS
CB
BC
BC
SSABC=382.00-256.00-25.00-0.50-18.7-80.16-
1.50=0.07
第三节 多因素试验结果的分析
3.方差分析和 F 测验:
棉花品种、播期、灌水三因素试验的方差分析如下
页表( 21)。
第三节 多因素试验结果的分析
变异来源 DF SS MS F F0.05
区组 2 1.16 0.58 1.00
处理,11 382.00 34.72
A( 品种) 1 256.00 256.00 441.38 4.30
B( 播期) 1 25.00 25.00 43.10 4.30
C( 灌水) 2 0.50 0.25 <1
AXB 1 18.77 18.77 32.36 4.30
AXC 2 80.16 40.08 69.10 3.44
BXC 2 1.50 0.75 1.29 3.44
A XBXC 2 0.07 0.04 <1
误 差 22 12.84 0.58
总变异 35 396.00
第三节 多因素试验结果的分析
4、效应和互作的显著性测验,
( 1) 品种效应:如前表每个品种的 TA是
rac=3× 2× 3=18个小区的产量,故
67.1
2 0 018
6 0 0 0 ?
?
?cf
因此,A1品种亩产量 =174× 1.67=290.6(斤)
A2品种亩产量 =78 × 1.67=130.3(斤)
相 差 160.3(斤)
第三节 多因素试验结果的分析
为测验差数 160.3斤 /亩 的显著性,算得亩产量的标
准误
9.1595.239.5
39.567.158.018
22,05.0
2
???
??????
L S R
cfnsSE e
即 A1品种的产量显著高于 A2( 160.3>15.9)。
实际上,当因素或互作的 v=1时,t测验,q测验、
SSR测验的结果都完全相同,也和 F测验的结果完全
相同。所以遇到这种情况,可以据 F测验直接作出判
断,不需再作测验(见方差分析表)。
第三节 多因素试验结果的分析
( 2)播期效应:因为 v=1,由 F测验可直接判断是否
显著。
( 3)品种 X播期的互作:
A X B互作值 =61-35=26(斤)(见 AB两向表)。 F测
验已表明此差数亦显著。
( 4)品种 X灌水的互作:
由 AC两向表求得 A XC的各个互作值于下表:
第三节 多因素试验结果的分析
表 22 品种( A) X灌水( C) 的互作值
项 目 产量
(斤)
互作值
A1,C1并存 A1,C1并存
C1下,A1-A2 51
C2下,A1-A2 37 14( 35)
C3下,A1-A2 8 43( 107.50) 29( 72.5)
第三节 多因素试验结果的分析
求得亩产量标准误
5.2717.46.6
3.2008.36.63
5.2602.46.6
5.1995.26.62
6.65.258.012
22,01.0
22050
22,01.0
22050
2
???
????
???
????
??????
L S R
,L S RP
L S R
,L S RP
cfnsSE
,。
,。
e
时
时故
上述尺度测验 A与 C的互作值的亩产量,都达
0.01的水平。
5、试验结论:
试验品种和播期皆有显著效应,品种应选 A1,播
期应选 B1。 AXB互作显著,选用 A1B1组合,可取得
亩增收 43.4斤的互作; AXC的互作也显著,选用
A1C1也可取得亩增收 35.0-107.5斤的互作。因此
本试验的最优组合为 A1B1C1,即处理 1。
第三节 多因素试验结果的分析
三、裂区试验结果的统计分析
设有 A和 B两个试验因素,A因素为主处理,具 a个
水平,B因素为副处理,具 b个水平,设有 r个区组,
则该试验共得 rab个观察值。其各项变异来源和相
应的自由度如下表:
第三节 多因素试验结果的分析
表 23 二裂式裂区试验自由度的分解
第三节 多因素试验结果的分析
变 异 来 源 DF
主
区
部
分
区组 r-1
A a-1
误差 a (r-1)(a-1)
总变异 ra-1
副
区
部
分
B b-1
AXB (a-1)(b-1)
误差 b a(r-1)(b-1)
总变异 rab-1
由上表可见,二裂式裂区试验与二因素随机区组
试验在分析上的不同,仅在于前者有主区部分和副区
部分,因而有主区误差和副区误差。也就是说 裂区试
验有误差项的再分解。
[例 11] 有一小麦中耕次数( A) 和灌水( B) 试
验,主处理为 A,分 A1,A2,A3 3个水平;副处理为
B,分 B1,B2,B3,B4 4个水平,裂区设计,重复 3
次( r=3),副区计产面积 300平方尺,其田间排列和
产量如下图,试作分析。
第三节 多因素试验结果的分析
第三节 多因素试验结果的分析
B2
37
B1
30
B3
15
B2
31
B4
13
B3
13
B3
18
B4
17
B4
16
B1
30
B1
28
B2
31
A1 A3 A2
B1
27
B3
14
B4
12
B3
13
B2
32
B3
14
B4
15
B2
28
B2
28
B1
29
B4
16
B1
28
B4
15
B3
17
B2
31
B4
13
B1
25
B2
29
B3
31
B4
32
B4
26
B1
11
B1
10
B2
12
A3 A2 A1
A1 A3 A2
重复 I
重复 II
重复 III
(一)结果整理
按区组和处理作两向分组整理成下表( 24):
第三节 多因素试验结果的分析
主处理
A
副处理
B
区组 TAB TA
I II III
A1
B1 30 28 32 90
B2 37 32 31 100
B3 18 14 17 49
B4 17 16 15 48
Tm 102 90 95 287
第三节 多因素试验结果的分析
主处理
A
副处理
B
区组 TAB TA
I II III
A2
B1 28 29 25 82
B2 31 28 29 88
B3 13 13 10 36
B4 13 12 12 37
Tm 85 82 76 243
(续)
第三节 多因素试验结果的分析
主处理
A
副处理
B
区组 TAB TA
I II III
A3
B1 30 27 26 83
B2 31 28 31 90
B3 15 14 11 40
B4 16 15 13 44
Tm 92 84 81 257
Tr 279 256 252 787(T)
(续)
按 A 因素和 B 因素作两向分类整理成下表( 25):
第三节 多因素试验结果的分析
B
A
B1 B2 B3 B4 TA
A1 90 100 49 48 287
A2 82 88 36 37 243
A3 83 90 40 44 257
TB 255 278 125 129 787(T)
(二)自由度和平方和的分解
第三节 多因素试验结果的分析
39.35
43
2 5 22 5 62 7 9
06.1 2 9
4
81.,,,,,851 0 2
31.2 3 7 013.,,,,,3730
69.1 7 2 0 4
433
7 8 7
2222
2222
2222
22
??
?
??
???
??
???
???
????????
?
??
??
?
?
?
CC
ab
T
SS
CC
b
T
SS
CCxSS
r a b
T
C
r
m
区组
主区总
总
矫正数
(二)自由度和平方和的分解
第三节 多因素试验结果的分析
53.2 1 9 2
33
1 2 91 2 52 7 82 5 5
98.2 2 8 2
3
44.,,,,,1 0 090
44.923.8439.35
06.1 2 9
23.84
43
2 5 72 4 32 8 7
22222
2222
2222
??
?
???
???
??
???
???
??
?????
??
?
??
???
?
?
?
CC
ra
T
SS
CC
r
T
SS
SSSSSSSS
CC
rb
T
SS
B
B
AB
AEa
A
A
处理
区组主区总
(二)自由度和平方和的分解
第三节 多因素试验结果的分析
50.4244.998.2 2 8 239.3531.2 3 7 0
50.4222.653.2 1 9 206.1 2 931.2 3 7 0
22.653.2 1 9 2
23.8498.2 2 8 2
?????
????
?????
????
??
?????
EaEb
ABBEb
BAAB
SSSSSSSSSS
SSSSSSSSSS
SSSSSSSS
处理区组总或
主区总总
处理
(三) F 测验
第三节 多因素试验结果的分析
变异来源 DF SS MS F F0.05
主区
区组 2 35.39 17.69 7.49 6.94
A 2 84.23 42.11 17.84 6.94
Ea 4 9.44 2.36
总变异 8 129.06
副区
B 3 2192.53 730.84 309.68 3.16
AXB 6 6.22 1.04 <1
Eb 18 42.50 2.36
总变异 35 2370.31
(四)效应和互作的显著性测验
基本步骤(具体计算略):
1、计算标准误;
2、查附表得 SSRa值;
3、求得 LSRa值;
4、根据上述尺度测验各因素水平的差数。
测验结果如下页表:
第三节 多因素试验结果的分析
表 26 三种中耕处理亩产量的新复极差测验
第三节 多因素试验结果的分析
中耕次数 亩产量
差异显著性
0.05 0.01
A1 478.3 a A
A3 428.3 b AB
A2 405.0 b B
表 27 灌水处理亩产量的新复极差测验
第三节 多因素试验结果的分析
灌水量 亩产量
差异显著性
0.05 0.01
B2 617.8 a A
B1 566.7 b B
B4 286.7 c C
B3 277.8 c C
(五)试验结论
本试验中耕次数的 A1显著优于 A2,A3,灌水量的
B2显著优于 B1,B3,B4。 由于 AXB互作不存在,故应
取相加式,最优组合必为 A1B2。
第三节 多因素试验结果的分析
三、应用正交表分析试验结果
凡采用正交表设计的试验,皆可再用正交表分析
试验结果。首先将试验结果按处理列于正交表的右侧;
然后,按表头设计的列,将各水平的和用 T1,T2、
T3…… 等表示,记于正交表的下方。正交表上行(处
理)的自由度是为各列所分解的,而各列的自由度则
为该列的水平数减 1。所以,表头各因素的效应或互
作的自由度,即为该列的水平数减 1;其相应平方和
则可由列下的 T1,T2,T3…… 等值得出。
第三节 多因素试验结果的分析
试验误差的自由度和平方和为
误差 DF=总 DF-区组 DF-各列 DF之和
误差 SS=总 SS-区组 SS-各列 SS之和
[例 12] 有一早稻三因素试验,A因素为品种,有
A1,A2,A3,A4水平; B因素为栽插密度,有 B1,B2
水平; C因素为施氮量。有 C1,C2水平;选用 L8
( 4x24),其表头设计和产量结果如下页表( 27),
试作分析。
第三节 多因素试验结果的分析
表 27 4?2?2试验,L8( 4x24) 设计
第三节 多因素试验结果的分析
表头设计 A B C 产 量(斤)
处理 列号 1 2 3 4 5 I II III Tt
1=A1B1C1 1 1 1 1 1 17 16 19 52
2= A1B2C2 1 2 2 2 2 19 20 20 59
3= A2B1C2 2 1 1 2 2 26 24 21 71
4= A2B2C1 2 2 2 1 1 25 22 20 67
5= A3B1C2 3 1 2 1 2 16 15 19 50
6= A3B2C1 3 2 1 2 1 14 15 14 43
7= A4B1C1 4 1 2 2 1 24 25 23 72
8= A4B2C2 4 2 1 1 2 28 28 26 82
( 续)
第三节 多因素试验结果的分析
T1 111 245 234 Tr:
169 165 162
496
(T)
T2 138 251 262
T3 93
T4 154
R 61 6 28
(一)结果整理
在上表中:
1、将各处理小区产量相加得 Tt,将各区组的小
区产量相加得 Tr;
2,将各列下同水平的 Tt相加,如 T1=52+59=111;
3,空列不加,其变异归入误差;
4、根据列下各 Ti值可算得各列极差 R。
第三节 多因素试验结果的分析
(二)自由度和平方和的分解
总 DF=rt-1=(3x8)-1=23
区组 DF=r-1=3-1=2
A的 DF=a-1=4-1=3
B的 DF=b-1=2-1=1
C的 DF=c-1=2-1=1
误差 DF=23-2-( 3+1+1) =16
第三节 多因素试验结果的分析
按多因素试验的一般方法分解平方和,求得
第三节 多因素试验结果的分析
00.371
6
15493138111
08.3
8
162165169
33.45126......1917
67.10250
83
496
22222
2222
2222
22
??
???
???
??
??
???
????????
?
?
??
?
?
?
CC
b
T
SS
CC
t
T
SS
CCxSS
rt
T
C
A
A
r
区组
总
矫正数
第三节 多因素试验结果的分析
09.43)66.3250.100.371(08.333.451
66.32
83
)262234()(
50.1
83
)251245()(
22
21
2
21
2
??????
?
?
?
?
?
?
?
?
?
?
?
?
SS
rt
TT
SS
rt
TT
SS
CC
c
BB
B
误差
当因素只有两水平时,其效应平方和可用简
式计算:
( 三) F 测验
第三节 多因素试验结果的分析
变异来源 DF SS MS F F0.05
区组间 2 33.08 1.54 <1
A 3 371.00 123.67 45.97 3.24
B 1 1.50 1.50 <1
C 1 32.66 32.66 12.14 4.49
误差 16 43.09 2.69
总变异 23 415.23
( 四)差异性显著性测验
因为 C因素只有 2个水平,所以不需再作测验,即
知 C2显著优于 C1,其亩产量为
C2=262X6000/( 12X150) =873.2( 斤)
C1=234X6000/ ( 12X150) =780.0
相差 93.2(斤)
第三节 多因素试验结果的分析
A因素各水平的差异显著性需进一步测验。在此
以亩产量为比较标准,故
Cf=6000/ ( 6X150) =6.6667
亩产标准误(下页):
第三节 多因素试验结果的分析
第三节 多因素试验结果的分析
1.1 3 9,5.1 0 8,4
1.1 2 8,8.97,3
7.1 1 0,4.80,2
:
)(8.266 6 6 7.669.26
16,01.016,05.0
16,01.016,05.0
16,01.016,05.0
???
???
???
????
L S RL S Rp
L S RL S Rp
L S RL S Rp
q
SE
法求得应用
斤
表 28 各品种亩产量的 q测验
第三节 多因素试验结果的分析
品 种
亩产量
(斤)
差异显著性
0.05 0.01
A4 1026.7 a A
A2 920.0 b AB
A1 740.0 c C
A3 620.0 d D
对各处理组合间的差异性作显著性测验:
由于表中的 TA值是 3个小区的产量,故
Cf=6000/(3X150)=13.3333
亩产量的标准误
第三节 多因素试验结果的分析
)(9.373333.1369.23 斤????SE
应用 q测验法,可算得 p=2,3,……, 8,
v=16时的各个 LSR值于表 29。
表 29 LSR值的计算
第三节 多因素试验结果的分析
p q0.05 q0.01 LSR0.05 LSR0.01
2 3.00 4.13 113.7 156.5
3 3.65 4.78 138.3 181.2
4 4.05 5.19 153.5 196.7
5 4.34 5.49 164.5 208.1
6 4.56 5.72 172.8 216.8
7 4.74 5.92 179.6 224.4
8 4.90 6.08 185.7 230.4
表 30 各处理组合的差异显著性
第三节 多因素试验结果的分析
处理组合 亩产量 差异显著性
(斤) 0.05 0.01
A4B2C2 1093.3 a A
A4B1C1 960.0 b AB
A2B1C2 946.7 b AB
A2B2C1 893.3 bc B
A1B1C2 786.7 cd BC
A1B1C1 693.3 de CD
A3B1C2 666.7 de CD
A3B2C1 573.3 e D
一、回归和相关的概念
二、直线回归方程
三、直线回归的假设测验和区间估计
四、直线相关
第四节 直线回归与相关
第四节 直线回归与相关
?变量间的关系有两类:函数关系;统计关系
?函数关系有严格的数学依存关系
?统计关系又称相关关系,不能精确用固定不
变的数学公式表示
?统计关系有两种分析方法:相关分析法和回
归分析法
第四节 直线回归与相关
一、回归和相关的概念
科学实验中所要研究的变数往往不只是一个,而是两个或
两个以上。如:土壤水分与作物产量的关系,亩穗数,穗粒数
和产量的关系等。为了处理具有一定联系的两个以上的变数,
除继续应用符号 x外,还需引入符号 y.这样两个变数 ( x,y)
的各对观察值可用 ( x1,y1), ( x2,y2),… ( xn,yn)
表示。为初步考察 x和 y的关系,我们可将每一对 ( xi,yi)
都表示为直角坐标平面上的一个点,作成如下散布图:
第四节 直线回归与相关
X 生物产量 ( 克 )
图 1 水稻生物产量和稻谷产量散布图
第四节 直线回归与相关
图 2 水稻每米 2颖花数和结实率散布图
第四节 直线回归与相关
图 3 水稻最高叶面积指数和亩产量的散布图
第四节 直线回归与相关
由这种 散布图 可以了解,
( 1) 两个变数的性质和密切程度或由 x估计 y的精确
度;
( 2) 两个变数的关系是直线型的还是非直线型的;
( 3) 是否有一些特殊的不规则的点着有其它因素的
干扰等。
第四节 直线回归与相关
如从上述 3个不同散布图可以看出:
( 1) 图 1、图 2都是直线型的,但方向相反;前者 y随
x的增大而增大,表示两个变数的关系是正的;
后者 y随 x的增大而减小,表示关系是负的性质。
( 2) 图 1的各个点几乎都落在一直线上,图 2则较为
分散;因此,前者的相关程度高于后者。
( 3) 图 3 中 x和 y的关系不是直线型。本节仅讨论直
线型关系。
第四节 直线回归与相关
在统计上,x和 y的关系有两种理论模型:第一
种叫回归模型,第二种叫相关模型。
两种理论模型的区别是:
1、在回归模型中:
( 1) 自变数 x是固定的,无误差或误差很小;
( 2) 依变数 y随 x变化,有随机误差;
( 3) 有 x变化预测 y变化的作用,具有预测特征;
( 4) 回归资料的统计分析叫回归分析;就是要导
出由 x预测 y或控制 y的回归方程。
第四节 直线回归与相关
2,在相关模型中:
( 1) x和 y是平行变化关系;
( 2) x和 y皆有随机误差,因而不能区别哪个是自变
数,哪一个是依变数;
( 3) 相关模型的特征是表示两个变数的偕同变异,
不具预测性;
( 4) 相关分析是要测定两个变数在数量关系上的密
切程度和性质。
第四节 直线回归与相关
但是 回归和相关并不能截然分开,因为由回归可获
得相关的一些信息,由相关也可获得回归的一些
重要信息。
3、以防统计方法误用必须注意的问题:
( 1) 变数间是否存在相关,须有具体学科本身来定;
( 2) 由于自然界各种事物间的相互联系和制约,一
事物的变化通常都会受到其它事物的影响。因此,
如果仅研究一对事物的关系,其余事物的均匀性
必须尽可能得到严格控制。
第四节 直线回归与相关
( 3) 为提高回归和相关分析的准确性,两个变数的
成对观察值应尽可能地多一些,应有 5对以上观察值,
并使 x的取值范围尽可能大一些。
二、直线回归方程
(一)直线回归方程式
对于在散布图上呈直线趋势的两个变数,如果要
概括其在数量上的互变规律,即从 x的数量变化来预
测或估计 y的数量变化,则要采用回归方程来描述。
此方程的通式如下:
第四节 直线回归与相关
bxay ???
上式读作, y依 x的直线回归。其中 x是变数,是
和 x的量相对应的依变数 y的点估计值; a是 x=0时
的 值,即回归直线在 y轴上的截距,叫回归截距;
b是 x每增加一个单位数时,平均地将要增加
( b>0)或减少 (b<0)的单位数,叫回归系数。
y?
y?
y?
( 1)
第四节 直线回归与相关
要使 能够最好地代表 y和 x
在数量上的互变关系,根据最小平方法,须使 bxay ??
?
? ? ??????
n n
bxayyyQ
1 1
22 )()?( 最小
第四节 直线回归与相关
因此,a和 b值按微分学上求极小值原理得出,即有正
规方程
? ? ?
? ?
??
??
xyxbxa
yxban
2
以上是二元一次联立方程组,解之得
?
?
? ?
? ? ?
?
??
?
?
?
?
??
2
22 )(
))((
)(
1
))((
1
xx
yyxx
x
n
x
yx
n
xy
b
xbya
( 2)
( 3)
第四节 直线回归与相关
上述 ( 3) 式的分子是离均差的乘积和,记作 SP;
分母是离均差平方和,记作 SSx。 将 ( 2)、( 3) 式
算得的 a和 b值代入 ( 1) 式,即可保证 Q值最小。
A和 b可正可负,因具体资料而异。在 a>0时,回
归直线在第 I象限交于 y轴;在 a<0时,回归直线在第 I
象限交于 x轴;在 b>0时,表示 y随 x的增大而增大,成
正相关;在 b<0时,表示 y随 x的增大而减小,成负相
关;见下图。在 b=0或和 0的差异不显著时,则表明 y
的变异和 x的取值大小无关,直线回归关系不能成立。
第四节 直线回归与相关
图 4 直线回归方程的图象
第四节 直线回归与相关
将( 2)式代入( 1)式可得
)(? xxbybxxbyy ??????
( 4)
由( 4)式可见,若 x=,则 y=,所以回归直线必通过坐标
点(, )。记住这一点有助于绘制具体资料的回归直
线。
(二)直线回归方程的计算
[例 1] 如下表:
x y
x y
第四节 直线回归与相关
表 1 累积温和一代化螟蛾盛发期的关系
X累积温 Y盛发期
35.5 12
34.1 16
31.7 9
40.3 2
36.8 7
40.2 3
31.7 13
39.2 9
44.2 -1
第四节 直线回归与相关
首先由上表资料算得 6个一级数据:
9
4.2 4 3 6)]1(2.44[.,,,,,)161.34()125.35(
7 9 4)1.,,,,, (1612
70)1(.,,,,,1612
49.1 2 5 1 72.44.,,,,,1.345.35
7.3 3 32.44.,,,,,1.345.35
2222
2222
?
?????????
?????
??????
?????
?????
?
?
?
?
?
n
xy
y
y
x
x
然后,由一级数据算得二级数据:
第四节 直线回归与相关
0 4 4 4.1 5 9)707.3 3 3(
9
1
34.2 4 3 6
5 5 5 6.2 4 9)70(
9
1
7 9 4
)(
6 3 5 6.1 4 4)7.3 3 3(
9
1
49.1 2 5 1 7
)(
2
2
2
2
2
2
????
???
??
???
??
???
?
??
?
?
?
?
n
yx
xySP
n
y
ySS
n
x
xSS
y
x
第四节 直线回归与相关
5485.48)0778.370996.1(
7778.7)(
0996.1
6356.144
0444.159
7778.7
9
70
0778.37
9
7.333
???
????
??
?
??
???
???
?
?
xbya
SS
SP
b
n
y
y
n
x
x
x
第四节 直线回归与相关
故得直线回归方程为
xy 1.15.48? ??
(三)直线回归方程的图示
1、直线回归图包括回归直线图象和散布图;
2、制作回归图时,以 x为横坐标,y为纵坐标;
3、纵、横坐标皆需标明名称和单位;
4、取 x坐标上的一个小值 x1代入回归方程得 y1;再取
一个大值 x2代入回归方程得 y2。 连接坐标点( x1,y1)
和( x2,y2) 成一条回归直线(如下图 5)。
第四节 直线回归与相关
图 5 旬平均温度累积值和一代三化螟蛾盛发期的关系
第四节 直线回归与相关
(四)直线回归的估计标准误
由上图可见,直线回归方程和实测的坐标点并不
吻合。故应对其误差进行估计。由于 Q为离回归平方
和,且建立回归方程时用了 a和 b两个统计数,故 Q的
自由度 v=n-2。 则回归的标准误:
2
)?(
2
2
,?
?
?
?
? ?
n
yy
n
Qs
xy
( 4)
第四节 直线回归与相关
?
? ?
?
??
????
n
yx
xysp
ss
sp
ssyyQ
x
y
.
)(
)?(
2
2
(五)直线回归的数学模型和基本假定
在直线回归中,总体的每一个 Y值决定于三个因素:
( 1) Y的总体平均数 Y;( 2) 因 X的作用而使 Y发生的离均变
异,( 3) Y的随机误差 。因此,直线回归)( XX ??
第四节 直线回归与相关
的数学模型可表示为:
?? ???? )( XXYY
在按上述模型进行回归分析时,假定:
1、任一个 X上都存在一个 Y总体,它是作正态分布的;
2、所有 Y总体都具共同方差,因而直线回归总体具有
我们得到的观察值只是总体 N中的随机本。
3、直线回归的总体方差 是可分的。
4,X是没有误差的固定变数,而 Y是随机变数。
2.xy?
),(, xyXN ??? ?
2.xy?
第四节 直线回归与相关
三、直线回归的假设测验
1、回归关系的假设测验
对于样本的回归方程,必须测定其来自无直线回归关系的
总体的概率大小。只有当这种概率 a<0.05或 a<0.01时,才能确
认其所代表的总体存在直线回归关系。这就是回归关系的假设
测验,可由 t测验或 F测验给出。由于回归系数的标准误 Sb为
( 5)
x
xy
b ss
s
s,?
第四节 直线回归与相关
并且
bs
bt ???
遵循 v=n-2的 t分布,故由 t值即可知道样本回归系数 b
来自不存在回归关系总体的概率的大小。
例:试测上述回归关系的显著性。已算得 b=-1.0996,
SSx=144.6356,Sy.x=3.266,故有
第四节 直线回归与相关
05.4
2 7 1 5.0
0 9 9 6.1
2 7 1 5.0
6 3 5 6.1 4 4
2 6 6.3
??
?
?
??
t
S
b
查表得,t0。 05,7=2.36,t0。 01,7 =3.50。 现
实得 ltl=4.05,表明在总体中因抽样误差而得现
有样本的概率 a<0.01,或说此 b=-1.0996是极
显著的。因而所建回归方程是可靠的。
第四节 直线回归与相关
2,F测验:
当以 表示 y资料时(不考虑 x的影响),y变数有平方和
和自由度 v=n-1。 当以 表示 y资料时
(考虑 x的影响),则 SSy将分解成两个部分,
即
y
? ?? 2)( yySS y bxay ???
?
?
?????
????
x
y
x
y
SS
SP
QSSyyU
SS
SP
SSyyQ
2
2
2
)(
)?(
)(
)?(离回归平方和:
回归平方和:
第四节 直线回归与相关
由于回归和离回归的方差比遵循 v1=1,v2=n-2的 F分
布,故由
2/
/)( 2
?
?
nQ
SSSP
F x
即可测定回归关系的显著性。
[例 ]试测前述资料回归关系的显著性。
前已算得 Ssy=249.5556,Q=74.6670,故
第四节 直线回归与相关
U=249.5556-74.6670=174.8886,并有方差分析表:
回归关系的假设测验
变异来源 DF SS MS F F0.01
回 归 1 174.8886 174.8886 16.40 12.25
离 回 归 7 74.6670 10.6667
总 变 异 8 249.5556
第四节 直线回归与相关
上述 t和 F测验,在任何回归样本上,其结果都完
全一致。因为在同一概率值下,v1=1,v2=n-2的一尾
概率值恰巧等于 v=n-2 的两尾 t值的平方。如本例,
F=16.40,t=-4.05,(-4.05)2=16.40。 所以,对直线
回归作假设测验,只需选择上述方法的一种。
(二)两个回归系数比较时的假设测验
若有两个直线回归样本,分别具有样本回归系数 b1,b2和总
体回归系数 ?1,?2,则在测验 b1,b2的差异显著性时,两个
样本回归系数的差数的标准误 Sb1-b2为
第四节 直线回归与相关
?? ?
?
?
??
2
22
2
.
2
11
2
.
21 )()( xx
S
xx
S
S xyxybb
上式的分母分别为两个样本 x变数的平方和,分子为两个
样本回归估计标准误的合并方差,其值为
)2()2( 21
212
,???
??
nn
QQS
xy
第四节 直线回归与相关
上式中的 Q1和 Q2分别为两个样本的离回归平方和,n1
和 n2分别为两个样本的成对观察值数目。
由于( b1-b2)/Sb1-b2遵循 v=(n1 -2)+ n2 -2)的 t分布,
故有
21
21
bb
S
bb
t
?
?
?
第四节 直线回归与相关
四、直线回归的区间估计
(一)直线回归的抽样误差
设直线回归总体,具有总体回归方程 Y=a+?X和标
准差 ?Y.X( 它给定了坐标点的离散程度)。在对该总
体抽取若干个样本时,则由于 ?Y.X各样本的 a,b值都
有误差。因此,由 Y=a+bx给出的点估计的精确性,决
定于 SY。 X和 a,b的误差的大小。比较科学的方法应是
考虑到误差的大小和坐标点的离散程度,给出一个区
间估计,即给出对其总体的 ?,?,Y等的置信限。
第四节 直线回归与相关
(二)回归截距的置信限
样本回归截距 a的标准误为
x
xya SS
x
n
SS
2
.
1
??
而( a- ?)/Sa是遵循 v=n-2的 t分布的。所以对总
体回归截距 ?有 95%可靠度的置信限为
[L1=a-t0.05 Sa,L2=a+ t0.05 Sa]
第四节 直线回归与相关
置信限表示总体回归截距在 [L1,L2]区间内的可
靠度为 95%;或可解释为:样本的回归截距 a可预期每
100个中约有 95个 a值在 [L1,L2]区间内。
(三)回归系数的置信限
( b- ?)/Sb亦遵循 v=n-2的 t分布,故对总体回归系数
?有 95%可靠度的置信区间为
[L1=b- t0.05 Sb,L2=b+ t0.05 Sb]
第四节 直线回归与相关
上式中的 Q1和 Q2分别为两个样本的离回归平方和,n1
和 n2分别为两个样本的成对观察值数目。
由于( b1-b2)/Sb1-b2遵循 v=(n1 -2)+ n2 -2)的 t分布,
故有
21
21
bb
S
bb
t
?
?
?
第四节 直线回归与相关
四、直线相关
( 一)相关系数和决定系数
1、相关系数
对于坐标点呈直线型的两个变数,如果并不需要
由 x来估计 y,而仅需要了解 x和 y是否确有相关以及相
关的性质(正相关或负相关),则首先应算出表示 x
和 y相关密切程度及其性质的统计数 —— 相关系数
第四节 直线回归与相关
经过分析推导,样本相关系数( r) 的计算公式为:
yx SSSS
SP
yyxx
yyxx
r
.)(.)(
))((
22
?
??
??
?
? ?
?
前已述及,y变数的平方和
在回归分析时分成了两个部分:一部分是离回归
平方和
另一部分是回归平方和
? ?? 2)( yySS y
? ?? 2)( yyQ ?
? ???,/)()( 22 xSSSPyyU ?
第四节 直线回归与相关
显然,若坐标点愈靠近回归线,直线相关就愈密切。
上述分析还表明,当散布图上的点完全落在回归直线
上时,Q=0,SS y=U,故 r=± 1; 当 y的变异和 x无关时,
SS y=Q,U=0,故 r=0。 所以 r的取值区间是 [-1,1]。 双
变数的相关程度决定于 r的绝对值,r的绝对值越接近
于 1,相关越密切;越接近于 0,越可能无关。但是还
和自由度 v有关,v愈大,受抽样误差的影响越小,r
达到显著水平 a的值就越小。 r的正负是表示相关性质
的,正的 r值表示正相关,负的 r值表示负相关。
第四节 直线回归与相关
2、决定系数
决定系数定义为由 x不同而引起的 y变数平方和
? ?? 2)?( yyU
占 y变数总平方和
? ?? 2)( yySS y
的比率;
第四节 直线回归与相关
也可定义为由 y不同而引起的 x变数的平方和
。r
SSSS
SP
SS
SSSP
SS
SSSP
r
,xxxxx
yxy
y
y
x
的平方值数所以决定系数即相关系
其值为
的比率变数总平方和占
.
)(/)(/)(
)()?(
222
2
22
???
?? ??
第四节 直线回归与相关
3、决定系数和相关系数的区别
( 1)除掉 |r|=1和 0的情况外,r2总是小于 r。
( 2) r可正可负,而 r2总是取正值,其取值区间为
[0,1]。
( 3) r2一般只用于表示相关程度,而不表示相关性
质。
(二)相关系数和决定系数的计算
第四节 直线回归与相关
计算 [例 1]资料(积温与一代三化螟蛾盛发期的关系)
的相关系数和决定系数。在前面已算得该资料的
SSx=144.6356,SSy=249.5556,故代入公式有
7007.0
5556.2496356.144
)0441.159(
.
)(
8371.0
5556.2496356.144
0441.159
.
22
2
?
?
?
??
??
?
?
??
yx
yx
SSSS
SP
r
SSSS
SP
r
第四节 直线回归与相关
以上结果表明,一代三化螟蛾盛发期与 3月下旬至
4月中旬积温成负相关,即积温愈高,螟蛾盛发期愈
早。但一代螟蛾盛发期的变异平方和仅有 70.07%是由
积温不同造成的。
( 三)相关系数的假设测验
( 1)相关系数的标准误
第四节 直线回归与相关
05.4
2067.0
8371.0
2067.0
29
8371.01
2
1
22
??
?
??
?
?
?
?
?
?
?
r
r
S
r
t
n
r
S
查附表,t0.01=3.50,现实得 t=4.05> t0.01,
r在 a=0.01水平上显著,说明直线相关真实存
在,且积温愈高,螟蛾盛发期愈早( y愈小)。
第四节 直线回归与相关
请注意,本例 t=-4.05和该资料在作回归系数测验
时的 t=-4.05完全相同。这不是偶然巧合,而是必然
结果。对于同一资料来说,相关显著,回归必显著;
相关不显著,回归也必不显著。因此在计算程序上,
当得到二级数据后,可先算相关系数,如其显著可再
算回归(回归不需再作假设测验);如其不显著,就
不必再算下去。
谢谢大家
试验数据统计分析
一、攻关目标
建立节水型的优质高效农业发展
模式。
提高区域农业水资源利用率及生
产效率。
为节水条件下农业高效持续发展
提供技术支持和示范模式。
第三章 试验数据统计分析
第一节 方差分析
第二节 单因素试验结果的统计分析
第三节 多因素试验结果的统计分析
第四节 相关与回归分析
一、攻关目标
建立节水型的优质高效农业发展
模式。
提高区域农业水资源利用率及生
产效率。
为节水条件下农业高效持续发展
提供技术支持和示范模式。
一、方差分析的基本原理
二、单向分组资料的方差分析
三、两向分组资料的方差分析
第一节 方差分析
第一节 方差分析
一、方差分析的基本原理
(一)几个变异数的概念
1、极差,最大值 -最小值
2、离均差,观察值 -平均值( xi-x)
3、平方和:离均差平方的总和
4,方差,平方和 /观察值数
5、标准差:方差的平方根值
6、自由度及其意义:观察值数 -1( n-1)
一、攻关目标
第一节 方差分析
( 二)方差分析的作用
1、将总变异分裂为各个因素的相应变异,作出数量
估计;发现各个因素在变异中所占的重要程度。
2、准确估计试验误差。
(三)自由度和平方和的分解
设有 k组样本, 每样本皆具有 n个观察值, 则该资料共
有 nk个观察值, 其数据分组如表 1:
一、攻关目标
第一节 方差分析
组别 1 2 …,,i … … k
X
11
X
12
…
X
1j
…
X
1n
X2
1
X
22
…
X
2j
…
X
2n
X
i1
Xi
2
…
Xi
j
…
Xi
n
Xk
1
Xk
2
…
Xk
j
…
Xk
n
总和 T1 T2 Ti Tk T= ∑ Xi j = ∑
平均 X1 X2 Xi Xk X
均方
表 1 每组具有 n个观察值的 k组样本的符号表
( I=1,2,…,.,k; j=1,2,…… n)
一、攻关目标
第一节 方差分析
在表 1中,总变异是 nk个观察值的变异,故其自由
度 v=nk-1,而平方和 SST则为
总平方和:
? ? ???? nk nkijT CxxxSS
1 1
22)(
nk
T
nk
xC 22)( ?? ?矫正系数
?
?
????
k
k
it Cn
T
xxnSS
1
1
2
2)(组间平方和
一、攻关目标
第一节 方差分析
组内平方和,SSe= SST-SSt
自由度分解,( nk-1) =(k-1)+k(n-1)
总自由度 =组间自由度 +组内自由度
平方和分解:总平方和 =组间平方和 +组内平方和
[例 1] 以 A,B,C,D 4种药剂处理水稻种子, 其中
A为对照, 每处理各得 4个苗高观察值 ( cm), 其结
果如表 2,试分析其自由度和平方和 。
第一节 方差分析
第一节 方差分析
药剂 A( x1.) B( x2.) C( x3.) D( x4.)
19
23
21
13
21
24
27
20
20
18
19
15
22
25
27
22
总和 Ti 76 92 72 96 T=336
平均 xi 19 23 18 24 X=21
表 2 水稻不同药剂处理的苗高( cm)
总变异 =( 4× 4) -1=15
药剂间自由度 =4-1=3
药剂内自由度 =4( 4-1) =12
第一节 方差分析
104
4
96729276
2222......2319
7056
44
336
2222
222
2
??
???
?
?????
?
?
?
CSS
CSS
C
t
T
一、攻关目标
第一节 方差分析
83.9
12
118
67.34
3
104
80.14
15
222
118222
2
2
2
??
??
??
????
e
t
T
tTe
S
S
S
SSSSSS
( 试验误差加药剂效应 )
(试验误差估计)
一、攻关目标
第一节 方差分析
(四) F测验的概念:
对于两个独立的样本,分别求得其均方 S12和 S22
则将二者的比值定义为 F:
在方差分析的体系中, F测验是用于测验某项变异因素的
效应或方差是否真实存在 。 所以在计算 F值时, 总是将测验
项变异因素的均方作分子, 而将另一项变异因素 ( 例如试
验误差 ) 作分母 。 若所得 F>F0.05或 >F0.01,则 F值即为在
a=0.05或 a=0.01水平上显著;否则不显著 。
2
2
2
1
S
SF ?
一、攻关目标
第一节 方差分析
[例 2] 测定东方红 3号小麦的蛋白质含量 10次,
得均方;测定农大 139小麦的蛋白质含量 5次,得均
方。试测前者的变异是否比后者大。
显 著 水 平 面取 a=0.05,v1=9,v2=4时, 查附 表 得
F0.05=6.00。 测验计算:
F ? 01.12135.0 621.1 ?
此 F> F0.05,即东方红小麦蛋白质含量变异大于农
大 139
一、攻关目标
第一节 方差分析
[例 ]如前已算得的药剂间均方,
67.3431042 ??tS
药剂内均方,
83.9121 1 82 ??eS
具自由度 v1=3,v2=12。 试测验药剂间变异是否
大于药剂内变异?
第一节 方差分析
显著水平取 a=0.05,F0.05=3.49。
测验计算:
?F 53.383.9 67.34 ?
此 F> F0.05, 即药剂间变异大于药剂内变异,
不同药剂对水稻苗高是具有不同效应的 。
第一节 方差分析
(四 )多重比较
F测验 是一个整体的概念 。 仅能测出不同处
理效应的平均数的显著差异性 。 但是, 是否各个平
均数间都有显著差异性? 还是仅有部分平均数间有
显著差异而另一部分平均数间没有显著差异? 它不
曾提供任何信息 。 要明确各个平均数间的差异显著
性, 还必须对各平均数进行多重比较 。
第一节 方差分析
(一 ) 最小显著差法 ( LSD法 )
首先算得平均数差数的标准误:
n
s
xSxS e
2
21
2
??
式中,为方差分析时的误差均方值,n为
样本容量。由 t表查得 ta,即有最小显著差数:
2eS
L S D a = atxxS 21 ?
第一节 方差分析
若两个平均数的差数 >LSDa,即为 a水平上显著 。
LSD法实质上是 t测验,而 t测验只适用于两个相互
独立的样本平均数。
(二 )最小显著极差法 ( LSR法 )
这一方法的特点是不同平均数间的比较采用不同的
显著差数标准, 因而克服了 LSD法的局限性, 可用于
平均数间的所有相互比较 。 其常用的有新复极差测验
和 q测验两种 。
第一节 方差分析
1,新复极差测验 ( SSR测验 ),
平均数的标准误
SE = n
s e2
查 SSR表, 查得所具有的自由度下, p=2,3,……, k时
的 SSR值 ( p为某两极差间所包含的平均数个数 ) 。 进而算
得各个 p下的最小显著极差 LSR。
LSR= SE× SSRa
将各个平均数按大小顺序排列, 用各个 p的 LSRa值即可测
验各平均数的显著性;凡两极差 <LSRa者为不显著, 凡两
极差 >LSRa者为显著 。
第一节 方差分析
[例 3] 对前述资料的各个平均数作新复极差
测验 。
表 3 LSR值计算(新复极差测验)
P 2 3 4
SSR0.05 3.08 3.23 3.33
SSR0.01 4.32 4.55 4.68
LSR0.05 4.84 5.07 5.23
SSR0.01 6.78 7.14 7.35
第一节 方差分析
4种药剂对苗高效应的平均数大小顺序是 D=24,B=23,
A=19,C=18。 D与 B比,B与 A比,A与 C比时 p皆为 2; D与
A比,B与 C比时,p=3,D与 C比时 p=4,故测验结果为:
B与 A比,23-19=4<4.84,不显著
A与 C比,19-18=1<4.84,不显著
D与 A比,24-19=5<5.07,不显著
第一节 方差分析
B与 C比,23-18=5<5.07,不显著
D与 C比,24-18=6>5.23,显著
结论:只有处理 D和 C的差异在 a=0.05水平显著,
其余皆不显著 。
2.q测验:
q测验与 SSR测验相似, 其区别仅在于计算最小
显著极差 LSRa值时不是查 SSRa,而是查 qa。
查 qa值后, 即有, LSR=SE× qa
第一节 方差分析
三,各方法的异同
根据上述测验计算, 可以看到在两极差间所包含的平均数
个数 p=2时, t测验 ( LSD法 ), SSR测验和 q测验 的显著尺度都
是完全相同的 。 但是, 当 p>2时, 三种测验的显著尺度不相同,
LSD法最低, SSR测验次之, q测验最高 。 因此, ( 1) 对于试验
结果事关重大或有严格要求的试验, 宜用 q测验,( 2) 一般试
验可采用 SSR测验; ( 3) 试验中各个处理平均数皆与对照相比
的, 可用 LSD测验 。 ( 4) LSD测验必须经过 F测验确认各平均数
间有显著差异之后, 才宜应用; SSR测验和 q测验可不经过 F测
验 。
第一节 方差分析
( (四 )多重比较结果的表示方法
表 4,标记字母法
处理 平均苗高 差异显著性
D 24 a A
B 23 ab A
A 19 ab A
C 18 b A
第一节 方差分析
表 5.列梯形表法
:
差异 处理 平均数
Xi - 18 Xi - 19 Xi - 23
D
B
A
C
24
23
19
18
6
*
5
1
5
4
1
第一节 方差分析
(五 )方差分析的基本步骤
1,将资料总变异的自由度和平方和分解为各
变异因素的自由度和平方和, 并进而算得
其均方;
2,计算均方比, 作出 F测验, 以明了各变异
因素的重要程度;
3,对各平均数进行多重比较 。
第一节 方差分析
二,单向分组资料的方差分析
单向分组资料是指观察值仅按一个方向分组的资料,如试
验中将全部供试单位随机地分成若干组,然后按组给以不同处
理,这样所得的全部观察值就是单向分组资料,这种试验叫做完
全随机设计试验,
[例 4] 研究 6种氮肥施用方法 (K=6)对小麦的效应,每种
施肥方法种 5盆小麦 (n=5),完全随机设计,最后测定它
们的含氮量,其结果如下表,试作方差分析,
第一节 方差分析
表 6 6种施肥法小麦植株含氮量
处理 施 氮 法 总和
1 2 3 4 5 6
2.9 4.0 2.6 0.5 4.6 4.0
2.3 3.8 3.2 0.8 4.6 3.3
2.2 3.8 3.4 0.7 4.4 3.7
2.5 3.6 3.4 0.8 4.4 3.5
2.7 3.6 3.0 0.5 4.4 3.7
Ti 12.6 18.8 15.6 3.3 22.4 18.2 T=
90.9
第一节 方差分析
(一 )自由度和平方和的分解
总变异自由度 =6*5-1=29
处理间自由度 =6-1=5
误差 (处理内 )自由度 =6(5-1)=24
(二 )平方和分解
矫正数
4 2 7.2 7 5
30
)9.90( 2 ??C
? ???????? 763.457.3...3.29.2 2222 CCxSS T
4 6 3.445 2.18...8.186.12
2222
???????? ? CCnTSSt i
第一节 方差分析
300.14 6 6 3.44763.45 ????? tTe SSSSSS
变异来源 DF SS MS F F0.05
处理间 5 44.463 8.8926 164.07 3.90
误差 24 1.300 0.0542
总变异 29 45.763
表 7 方差分析表
07.1 6 40 5 4 2.0 8 9 2 6.8 ??F
第一节 方差分析
(三 )各处理平均数的比较
在此用新复极差测验 (LSR),算得
1 0 4 1.0
5
0 5 4 2.0 ??SE
表 8 新复极差测验的 LSR值
p 2 3 4 5 6
SSR0.05 2.92 3.07 3.15 3.22 3.28
SSR0.01 3.96 4.14 4.24 4.33 4.39
LSR0.05 0.304 0.319 0.328 0.335 0.341
LSR0.01 0.412 0.431 0.441 0.450 0.457
第一节 方差分析
表 9 6种施氮法植株含氮量的差异显性
施氮法 平均数 差异显著性
0.05 0.01
5 14.48 a A
2 13.76 b B
6 13.64 b B
3 13.12 c C
1 12.52 d D
4 10.66 e E
第一节 方差分析
二, 两向分组资料的方差分析
试验数据按两个因素交叉分组的,为两向分组资料。例如选
用几种灌水量和几种施肥量,研究其对作物生长和产量的影响,
其每一观察值都是某一灌水量和某一施肥量的组合同时作用的
结果,故属两向分组资料。两向分组又叫交叉分组。按完全随
机设计的两因素试验数据,都是两向分组资料;其方差分析按
各组有无重复观察值分为两种不同分析方法。
( 一)组合内只有单个观察值的两向分组资料的方差分析
[例 5] 用生长素处理豌豆试验,试验结果如下表:
第一节 方差分析
表 10 生长素处理豌豆的试验结果
处理
( A)
组(或重复,B) 总和
Ti
平均
I II III IV
对照
赤霉素
动力精
吲哚乙
腺嘌呤
马来酸
60
65
63
64
62
61
62
65
61
67
65
62
61
68
61
63
62
62
60
65
60
61
64
65
243
263
245
255
253
250
60.8
65.8
61.3
63.8
63.3
62.5
总和 T。 375 382 377 375 T=1509
ix
第一节 方差分析
( 一 ) 自由度和平方和的分解
30.4345.587.6562.114
45.5
6
375377382375
87.65
4
250.,,,,,263243
62.11465.,,,,,6560
38.9 4 8 7 8
46
1 5 0 9
2222
222
222
2
????
??
???
?
??
???
?
??????
?
?
?
SSe
CSS
CSS
CSS
C
B
A
T
第一节 方差分析
(二) F测验
变异
来源
DF SS MS F F0.05
区组间
处理间
误 差
3
5
15
5.45
65.87
43.30
1.82
13.17
2.89
<1
4.52 2.90
总变异 23 114.62
第一节 方差分析
( 三)处理间比较 此例有指定的对照,故用 LSD法。
处理 平均数 与对照的差数
对照 60.8 _
赤霉素 65.8 5.0**
动力精 61.3 0.5
吲哚乙酸 63.8 3.0*
腺嘌呤 63.3 2.5
马来酸 62.5 1.7
第一节 方差分析
二、组合内有重复观察值的两向分组资料的方差分析
[例 6],施用 A1,A2,A3 3种肥料于 B1,B2,B3 3种土壤,以
小麦为指示作物,每处理组合种 3盆,得产量结果如表 12,试
作方差分析。
肥料种类 盆 土壤种类( B) 总和 Ti.,平均 xi
A1 B1 B2 B3
1 21.4 19.6 17.6
2 21.2 18.8 16.6
3 20.1 16.4 17.5
Tij 62.7 54.8 51.7 169.2 18.8
第一节 方差分析
肥料
种类
盆 土壤种类( B) 总和
T i..
平均
Xi..
A2
B1 B2 B3
1 12.0 13.0 13.3
2 14.2 13.7 14.0
3 12.1 12.0 13.9
Tij 38.3 38.7 41.2 118.2 13.1
第一节 方差分析
肥料种类 盆 土壤种类( B) 总和 T i,平均 Xi..
A3
B1 B2 B3
1 12.8 14.2 12.0
2 13.8 13.6 14.6
3 13.7 13.3 14.0
Tij 40.3 41.1 40.6 122.0 13.6
总和 T.j,141.3 134.6 133.5 T=
409.4
平均 X.j,15.7 15 14.8
第一节 方差分析
(一)自由度和平方和的分解
70.1617.1996.345.17928.219
17.1996.345.179
3
6.40......8.547.62
96.3
33
5.1336.1343.141
45.179
33
0.1222.1182.169
28.2190.14......2.214.21
72.6207
333
4.409
222
222
222
222
2
?????
????
???
?
??
?
??
?
??
?
??
?
??????
?
??
?
e
AB
B
A
T
SS
CSS
CSS
CSS
CSS
C
第一节 方差分析
(二) F测验
变异来源 DF SS MS F F0.01
肥类间 2 179.45 89.73 96.8 6.01
土类 2 3.96 1.98 2.13 6.01
肥 X土 4 19.17 4.79 5.16 4.58
试验误差 18 16.70 0.928
总变异 26 219.28
第一节 方差分析
(三)平均数的比较
1、各处理组合平均数的比较,肥 X土的互作显著,说明肥效
随土类而不同,故进一步作比较。在此用新复极差测
验,求得
554.0
3
928.0 ??SE
根据 v=18,算得各LSR 0.05和LSR 0.01的值于下表。
第一节 方差分析
各处理组合平均数的LSR值(新复极差测验)
p 2 3 4 5 6 7 8 9
SSR0.05 2.97 3.12 3.21 3.27 3.32 3.35 3.37 3.39
SSR0.01 4.07 4.27 4.38 4.46 4.53 4.59 4.64 4.68
LSR0.05 1.65 1.73 1.78 1.81 1.84 1.86 1.87 1.88
LSR0.01 2.25 2.37 2.43 2.47 2.51 2.54 2.52 2.59
第一节 方差分析
各处理组合平均数的新复极差测验
处理组合 平均数 差异显著性
0.05 0.01
A1B1 20.9 a A
A1B2 18.3 b B
A1B3 17.2 b B
A2B3 13.7 c C
A3B2 13.7 c C
A3B3 13.5 c C
A3B1 13.4 c C
A2B2 12.9 c C
A2B1 12.8 c C
2.各肥类平均数的比较,肥类间的F测验极显著,求得肥类
平均数的标准误
第一节 方差分析
32.0
33
9 2 8.0
?
?
?SE
故有各肥类平均数的LSR值及显著性测验结果于下表:
第一节 方差分析
平均数的LSR值
p 2 3
SSR0.05 2.97 3.12
SSR0.01 4.07 4.27
LSR0.05 0.95 1.00
LSR0.01 1.30 1.37
肥料种类 平均
数
差异显著性
0.05 0.01
A1 18.8 a A
A2 13.6 b B
A3 13.1 b B
各肥类平均数的新复极差测验
第二节 单因素试验结果的分析
一、对比和间比试验的统计分析
二、随机区组试验的统计分析
第二节 单因素试验结果的分析
一、对比和间比试验的统计分析
(一)对比试验结果的统计分析
[例 7] 有一大豆品种比较试验,有 A,B,C,D,E、
F6个品种,另加一标准品种 CK,采用对比法设计,3
次重复,所得产量结果如下表( 13),试作分析。
第二节 单因素试验结果的分析
表 13 大豆品比试验(对比法)产量结果与分析
品种 各重复小区产量(斤) 总和
Ti
平均
xt
对邻近
Ck%I II III
ck 37.0 36.5 35.5 109.0 36.3 100.0
a 36.4 36.8 34.0 107.2 35.7 98.3
b 38.0 37.0 34.5 109.5 36.5 119.3
ck 31.5 30.8 29.5 91.8 30.6 100.0
c 36.5 35.0 31.0 102.5 34.2 111.7
d 35.2 32.0 30.1 97.3 32.4 106.7
ck 30.6 32.9 27.7 91.2 30.4 100.0
e 28.4 25.8 23.6 77.8 25.9 85.3
f 30.6 29.7 28.3 88.6 29.5 90.4
ck 35.2 32.3 30.5 98.0 32.7 100.0
第二节 单因素试验结果的分析
100
100%
??
??
平均产量邻近
某品种平均产量
总产量邻近
某品种总产量
的对邻近
CK
CK
CK
例如,a品种对邻近 ck的
3.981003.36 7.353.981000.109 2.107% ?????? 或
第二节 单因素试验结果的分析
(二)间比试验结果的统计分析
步骤:
1、将各处理在各重复的小区产量相加,得总和;
2、总和除以重复次数得小区平均数 X;
3、计算各处理的理论对照标准 CK,CK为前后两
个对照的平均数;
4、计算各处理产量对相应 CK产量的百分数。
第二节 单因素试验结果的分析
处理 各重复小区产量 平均
xt
对照
CK
对 CK
的 %I II III IV V
ck3 35.9 40.5 28.2 31.9 29.0 33.1
A 37.1 39.4 34.0 36.9 35.8 36.6 3.3 110
B 39.8 42.0 36.8 41.4 28.9 37.8 3.3 114
C 38.2 39.9 25.4 33.1 28.9 33.1 3.3 99
D 37.3 43.2 39.1 34.9 34.0 37.7 3.3 113
Ck2 33.0 42.1 29.0 34.6 28.8 33.5
E 38.0 40.2 34.5 39.8 37.5 38.0 34.2 111
F 36.1 34.3 32.8 27.1 29.7 32.0 34.2 94
G 37.8 36.3 41.3 34.2 39.9 37.8 34.2 111
H 34.0 39.1 27.3 34.7 28.9 32.8 34.2 96
ck3 36.0 40.1 31.5 37.8 29.6 35.0
第二节 单因素试验结果的分析
二、随机区组试验的统计分析
随机区组试验结果的统计分析,应用 方差分析部分所述两
向分组单个观察值资料的方差分析法。 在这里可将处理看作 A
因素,区组看作 B因素,其余部分则为试验误差。设试验有 n
个处理,k个区组,则其自由度和平方和的分解如下:
nk-1=(k-1)+(n-1)+(n-1)(k-1)
总自由度 =区组自由度 +处理自由度 +误差自由度
总平方和 =区组平方和 +处理平方和 +试验误差平方和
第二节 单因素试验结果的分析
[例 8]有一灌溉试验,共有 A,B,C,D,E,F,G、
H8个处理( k=8),其中 A是对照处理,采用随机区
组设计,重复 3次( n=3),其产量结果如下表
( 14):
第二节 单因素试验结果的分析
处理 I II III Tt Xt
A 10.9 9.1 12.2 32.2 10.7
B 10.8 12.3 14.0 37.1 12.4
C 11.1 12.5 10.5 34.1 11.4
D 9.1 10.7 10.1 29.9 10.0
E 11.8 13.9 16.8 42.5 14.2
F 10.1 10.6 11.8 32.5 10.8
G 10.0 11.5 14.1 35.6 11.9
H 9.3 10.4 14.4 34.1 11.4
Tr 83.1 91.0 103.9 278.0(T)
Xr 10.4 11.4 13.0 11.6(x)
第二节 单因素试验结果的分析
(一)自由度和平方和的分解
1。自由度的分解:
总自由度
14)18)(13()1)(1(
7181
2131
231)83(1
???????
?????
?????
??????
knDG
kDF
nDF
nkDF
误差
处理
区组
第二节 单因素试验结果的分析
2.平方和的分解:
97.2208.3456.2761.84
08.3416.3220
3
1.34......1.372.32
56.2716.3220
8
9.1030.911.83
61.84)4.14......1.99.10(
16.3220
83
0.278
222
2
222
2
1
2222
22
???????
??
???
???
??
??
???
????????
?
?
??
?
?
?
SSSSSSSS
C
n
T
SS
C
k
T
SS
CCxSS
nk
T
C
t
r
nk
处理区总误差
处理
区组
总
矫正数
第二节 单因素试验结果的分析
(二)方差分析和 F测验
将上述结果列入下表:
方差分析表
变异来源 DF SS MS F F0.05
区组间 2 27.56 13.78 8.40 3.74
处理间 7 34.08 4.87 2.97 2.77
误 差 14 22.97 1.64
总变异 23 84.61
第二节 单因素试验结果的分析
方差分析结果(根据上表):
对于区组 F=13.78/1.64=8.40>F0.05,说明区组
间土壤肥力有显著差异。
对于处理间 F=4.87/1.64=2.97>F0.05,说明 8个
处理间有显著差异。
但是到底哪些处理间有显著差异?哪些处理间没
有显著差异?则需作 多重比较 。
第二节 单因素试验结果的分析
(三)处理间比较
1。 T测验( LSD法),如果测验各处理与对照是否有差异,
宜用 LSD法。步骤如下:
( 1)计算处理间差数的标准误
以小区平均数为比较标准时,差数标准误为
01.02105.0
05.02105.0
2
21
2
txxSL S D
txxSL S D
n
S
xxS
e
???
???
??
并有
第二节 单因素试验结果的分析
以各处理的小区总产量为比较标准时,因总产量比平均产
量大 n倍,故差数标准误为
01.02101.0
05.02105.0
2
2
21
2
2
tSL S D
tSL S D
nSn
n
S
S
TT
TT
e
e
TT
?
?
?
?
?
???
并有
第二节 单因素试验结果的分析
在此以小区平均产量为比较标准,则
)xxS 斤(05.1
3
64.12
21
?
??
由于 v=14时,t0.05=2.145,t0.01=2.977,故
LSD0。 05=1.05*2.145=2.25( 斤)
LSD0。 01 =1.05*2.977=3.13( 斤)
第二节 单因素试验结果的分析
如以小区总产量为比较标准,则
35.99 7 7.214.3
74.61 4 5.214.3
14.364.132
01.0
05.0
21
???
???
????
?
LS D
LS D
S
TT
第二节 单因素试验结果的分析
如以亩产量为比较标准,则可算得化各品种总产
量为亩产量的改算系数:
10
2 0 03
6 0 0 0 ?
?
?cf
式中,3为小区数目,200为小区面积。
并有
5.931035.9
4.671074.6
01.0
05.0
???
???
L S D
L S D
第二节 单因素试验结果的分析
表 15 各处理产量和对照相比的差异显著性
处理 以平均数比较 以总产比较 以亩产比较
差异 差异 斤 /亩 差异
E 14.2 3.5** 42.5 10.3 425 103
B 12.4 1.7 37.1 4.9 371 49
G 11.9 1.2 35.6 3.4 356 34
H 11.4 0.7 34.1 1.9 341 19
C 11.4 0.7 34.1 1.9 341 19
F 10.8 0.1 32.5 0.3 325 3
A( ck) 10.7 32.2 322
D 10.0 -0.7 39.9 -2.3 299 -23
tx tT
第二节 单因素试验结果的分析
2、新复极差测验( LSR法),测验各处理相互比
较的差异显著性,宜应用 LSR法 。步骤如下:
( 1) 计算处理标准误 SE
以小区平均数比较时为
n
S
SE e
2
?
第二节 单因素试验结果的分析
以小区总数为比较时为
2
enSSE ?
以亩产量为比较时为
cfnSSE e ?? 2
第二节 单因素试验结果的分析
( 2)查表当 v=(n-1)(k-1)时 p自 2至 k的 SSR0.05和
SSR0.01值,进而算得 LSR0.05和 LSR0.01值
LSR0.05=SE* SSR0.05
LSR0.01=SE* SSR0.01
上式 LSR0.05和 LSR0.01即为测验各种 P下极差显著性
的尺度。
第二节 单因素试验结果的分析
在本例如以小区平均数为比较标准,则有
74.0
3
64.1 ??SE
查附表,v=14,P=2时,SSR0.05=3.03,
SSR0.01=4.21,故
12.321.474.0
24.203.374.0
01.0
05.0
???
???
L S R
L S R
第二节 单因素试验结果的分析
P=3时,SSR0.05=3.18,SSR0.01=4.42,故
27.342.474.0
35.218.374.0
01.0
05.0
???
???
L S R
L S R
P=4,5,…… 时,可以类推,在此应一直求至
P=k=8时为止。其全部结果录入下表:
第二节 单因素试验结果的分析
表 16 新复极差测验的最小显著极差
p 2 3 4 5 6 7 8
SSR0.05 3.03 3.18 3.27 3.33 3.37 3.39 3.41
SSR0.01 4.21 4.42 4.55 4.63 4.70 4.78 4.83
LSR0.05 2.24 2.35 2.24 2.24 2.49 2.51 2.52
LSR0.01 3.12 3.27 3.37 3.43 3.48 3.54 3.57
第二节 单因素试验结果的分析
表 17 新复极差测验
处理 小区平均 差异显著性5% 1%
E 14.2 a A
B 12.4 ab AB
G 11.9 ab AB
H 11.4 b AB
C 11.4 b AB
F 10.8 b AB
A 10.7 b AB
D 10.0 b B
第三节 多因素试验结果的分析
多因素试验结果的统计分析的基本原理,已在第
一节作过介绍。本节只是这些基本原理的引伸应用。
一、两因素随机区组试验结果的统计分析
设有 A和 B两个试验因素,各具 a和 b 个水平,作随
机区组设计,有 r次重复,则该试验共得 rab个观察
值。其各项变异来源的自由度可分解于下表:
第三节 多因素试验结果的分析
表 18 二因素随机区组试验自由度的分解
变异来源 DF
区组 r-1
处理:
A
B
A*B
ab-1
a-1
b-1
(a-1)(b-1)
误差 (r-1)(ab-1)
总变异 rab-1
第三节 多因素试验结果的分析
由表 18可见,二因素随机区组试验和单因素随机
区组试验,在变异来源上的区别仅在于:前者的处理
项可进而分解为 A因素水平间,B因素水平间、和 AB
互作间三个部分,因而也就可分解出相应的自由度和
平方和
(ab-1) = (a-1)+ (b-1)+ (a-1)(b-1)
处理自由度 =A的自由度 +B的自由度 +AB自由度
处理平方和 =A的平方和 +B的平方和 +AB平方和
第三节 多因素试验结果的分析
[例 9] 有一小麦二因素试验,A因素为品种,分 A1
( 早熟),A2( 中熟),A3( 晚熟)三个水平
( a=3),B因素为灌水量,分 B1( 50m3),B2( 100m3)、
B3( 150m3) 三个水平( b=3),共 ab=3*3=9个处理组
合,重复 3次( r=3),小区计产面积 60尺 2。其田间
排列和小区产量(斤)列于下图。试作分析。
第三节 多因素试验结果的分析
A1B1
8
A2B2
7
A3B3
10
A2B3
8
A3B2
8
A1B3
6
A3B1
7
A1B2
7
A2B1
9
A2B3
7
A3B2
7
A1B2
7
A3B1
7
A1B3
5
A2B1
9
A2B2
9
A3B3
9
A1B1
8
A3B1
6
A1B3
6
A2B1
8
A1B2
6
A2B2
6
A3B3
9
A1B1
8
A2B3
6
A3B2
8
小麦品种和灌水量随机区组试验
的田间排列和产量
I
II
III
第三节 多因素试验结果的分析
1.结果整理:( 1)将结果按处理和区组作两向分组整理成表:
处理 I II III TAB
A1B1 8 8 6 24
A1B1 7 7 6 20
A1B1 6 5 6 17
A1B1 9 9 8 26
A1B1 7 9 6 22
A1B1 8 7 6 21
A1B1 7 7 6 20
A1B1 8 7 8 23
A1B1 10 9 9 28
Tr 70 68 63 201(T)
第三节 多因素试验结果的分析
( 2) 按品种和灌水量作两向分组整理成表:
B
A B1 B2 B3 TA
A1 24 20 17 61
A2 26 22 21 69
A3 20 23 28 71
TB 70 65 66 201
第三节 多因素试验结果的分析
在上表中,Tr=区组总和,TAB=处理总和,TA =品
种总和,TB=灌水总和,T=全试验总和。
2.自由度和平方和的分解:
第三节 多因素试验结果的分析
11.867.2989.267.40
67.29
3
28.,,,,,2024
89.2
33
636870
67.409.,,,,,78
33.1 4 9 6
333
2 0 1
222
2
222
2
222
1
22
???????
??
???
???
??
?
??
???
????????
?
??
??
?
?
?
SSSSSSSS
CC
r
T
SS
CC
ab
T
SS
CCxSS
r a b
T
C
AB
r
r a b
处理组合区组总误差
处理组合
区组
总
矫正数
第三节 多因素试验结果的分析
对处理组合项 SS再进行分解:
73.2157.137.667.29
57.1
33
666570
37.6
33
716961
2222
2222
???????
??
?
??
???
??
?
??
???
?
?
BAAB
B
B
A
A
SSSSSSSS
CC
ra
T
SS
CC
rb
T
SS
处理组合
第三节 多因素试验结果的分析
3.方差分析和 F检验:
表 19 二因素试验的方差分析
变异来源 DF SS MS F F0.05
区 组 间 2 2.89 1.45 2.84 3.63
处理组合间 8 29.67 3.71 7.27* 2.59
品种 2 6.37 3.19 6.25 * 3.63
灌水 2 1.57 0.78 1.53 3.63
品 *水 4 21.73 5.43 10.65 * 3.01
误 差 16 8.11 0.51
总 变 异 26 40.67
第三节 多因素试验结果的分析
4.差异显著性测验
( 1)品种间比较
2 3 8.0
33
51.02 ?
?
??
rb
SSE e
查附表,P=2时,SSR0.05,16=3.00,SSR0.01,16=4.13,P=3时,
SSR0.05,16=3.15,SSR0.01,16=4.34。 因此有
P=2,LSR0.05,=0.238X3.00=0.71,
LSR0.01,=0.238X4.13=0.98,
第三节 多因素试验结果的分析
P=3,LSR0.05,=0.238X3.15=0.75,
LSR0.01,=0.238X4.34=1.03。
测验结果列于下表:
三个品种平均产量新复极差测验
品种 xA 差异显著性
5% 1%
A3 7.9 a A
A2 7.7 a AB
A1 6.8 b B
第三节 多因素试验结果的分析
( 2)品种 ? 灌水的互作:
灌水 产量 差异显著性
0.05 0.01
B1 8.0 a A
B2 6.7 b AB
B3 5.7 b B
( 1) A1品种作新复极差测验,算得
4 1 2.0351.0
2
??? rSSE e
P=2时,LSR0.05,16=1.24,
LSR0.01,16=1.70,
P=3时,LSR0.05,16=1.30,
LSR0.01,16=1.79。
第三节 多因素试验结果的分析
灌水 产量 差异显著性
0.05 0.01
B1 9.3 a A
B2 7.7 b AB
B3 6.7 b B
( 3) A3品种
灌水 产量 差异显著性
0.05 0.01
B1 8.7 a A
B2 7.3 b AB
B3 7.0 b B
( 2) A2品种
第三节 多因素试验结果的分析
5.试验结论
本试验品种主效有显著差异,以 A3产量最高,与
A1有显著差异,而与 A2无显著差异。灌水主效无显
著差异(?)。但品种与灌水互作极显著,A3品种
需用 B3灌水量,A2品种需用 B1灌水量,才能取得高
产。
第三节 多因素试验结果的分析
二、三因素随机区组试验结果的分析
设有 A,B,C三因素,各具 a,b,c个水平,作随
机区组设计,设有 r个区组,则该试验共有 rabc个观
察值,其各项变异来源及自由度的分解如下表:
第三节 多因素试验结果的分析
变异来源 DF
区组 r-1
处理,abc-1
A a-1
B b-1
C c-1
AXB (a-1)(b-1)
AXC (a-1)(c-1)
BXC (b-1)(c-1)
AXBXC (a-1)(b-1) (c-1)
误 差 (r-1)(abc-1)
总 变 异 rabc-1
三
因
素
随
机
区
组
试
验
自
由
度
的
分
解
第三节 多因素试验结果的分析
由上表可见,三因素随机区组试验和单因素随机
区组试验比起来,仅在于前者的处理间变异再被分解
为 7项,其中主效 3项,一级互作 3项,二级互作 1项。
各项都有相应的自由度和平方和,并且这些项的自由
度之和与平方和之和一定等于处理项的自由度和平方
和。
第三节 多因素试验结果的分析
[例 10] 有一随机区组设计的棉花栽培试验,有 A
( 品种),B( 播期),C( 灌水) 3个试验因素,各
具 a=2,b=2,c=3个水平,重复 3次,小区计产面积
200尺。其处理内容和代号见下表,田间排列和皮棉
产量见下图,试作分析。
第三节 多因素试验结果的分析
A品种 B播期 C灌水 处理代号
A1
B1
C1(100) 1
C2(150) 2
C3(200) 3
B2
C1(100) 4
C2(150) 5
C3(200) 6
A2
B1
C1(100) 7
C2(150) 8
C3(200) 9
B2
C1(100) 10
C2(150) 11
C3(200) 12
第三节 多因素试验结果的分析
2 5 9 12 4 8 1 10 3 7 11 6
12 10 2 11 1 9 6 7 8 4 3 5
3 1 11 2 12 9 5 10 6 8 7 4
区组 I
区组 II
区组 III
棉花三因素随机区组试验的田间排列示意图
第三节 多因素试验结果的分析
1.结果整理:将试验结果按区组和处理作两向分
组整理成表 1;再按任两个因素作两向分组整理成表
2,3,4。
以下页表中,Tr,TABC,TA, TB, TC依次分别
为各区组、处理、品种、播期、灌水的总和数,T为
试验总和数。各个总和数所包含的小区数目,必为总
小区数( rabc) 除以该总和数的下标所具有的水平。
第三节 多因素试验结果的分析
区 组 I II III TB
处理
A1
B1
C1
C2
C3
12 14 13 39
12 11 11 34
10 9 9 28
B2
C1
C2
C3
10 9 9 28
9 9 8 26
6 6 7 19
A2
B1
C1
C2
C3
3 2 4 9
4 3 4 11
7 6 7 20
B2
C1
C2
C3
2 2 3 7
3 4 5 12
5 7 7 19
Tr 83 82 87 252T
表
20
区
组
和
处
理
两
向
表
第三节 多因素试验结果的分析
B
A
B1 B2 TA
A1 101 73 174
A2 40 38 78
TB 141 11 252
dA1-A2 61 35 96
C
A
C1 C2 C3 TB
A1 67 60 47 174
A2 16 23 39 78
Tc 83 83 86 252
dA1-A2 51 37 8 96
AB两向表 AC两向表
第三节 多因素试验结果的分析
C
B
C1 C2 C3 TB
B1 48 45 48 141
B2 35 38 38 111
Tc 83 83 86 252
dB1-B2 13 7 10 30
BC两向表
第三节 多因素试验结果的分析
2.自由度和平方和的分解:
84.1200.3 8 216.100.3 9 6
00.3 8 2
3
19.,,,,,3439
16.1
322
878283
00.3 9 67.,,,,,1212
00.1 7 6 4
3223
2 5 2
2222
222
2
2222
22
????
??
???
???
??
??
??
???
????????
?
???
??
?
?
?
SS
CC
r
T
SS
CC
a b c
T
SS
CCxSS
r a b c
T
C
ABC
r
误差
处理
区组
总
矫正数
由区组和处理两向表可求得
第三节 多因素试验结果的分析
由 AB两向表求得
77.1800.2500.256
33
384073101
00.25
323
111141
00.256
323
78174
22222
222
222
????
?
???
?????
??
??
?
???
??
??
?
???
?
?
?
C
SSSSC
rc
T
SS
CC
r a c
T
SS
CC
r b c
T
SS
BA
AB
AB
B
B
A
A
第三节 多因素试验结果的分析
由 AC两向表求得
16.8050.000.2 5 6
23
39.,,,,,6067
50.0
223
868383
2222
2222
????
?
???
?????
??
??
??
???
?
?
C
SSSSC
rb
T
SS
CC
r a b
T
SS
CA
AC
AC
C
C
第三节 多因素试验结果的分析
由 BC两向表可求得
50.150.000.25
23
38.,,,,,4548
222
2
????
?
???
?
????
?
C
SSSSC
ra
T
SS
CB
BC
BC
SSABC=382.00-256.00-25.00-0.50-18.7-80.16-
1.50=0.07
第三节 多因素试验结果的分析
3.方差分析和 F 测验:
棉花品种、播期、灌水三因素试验的方差分析如下
页表( 21)。
第三节 多因素试验结果的分析
变异来源 DF SS MS F F0.05
区组 2 1.16 0.58 1.00
处理,11 382.00 34.72
A( 品种) 1 256.00 256.00 441.38 4.30
B( 播期) 1 25.00 25.00 43.10 4.30
C( 灌水) 2 0.50 0.25 <1
AXB 1 18.77 18.77 32.36 4.30
AXC 2 80.16 40.08 69.10 3.44
BXC 2 1.50 0.75 1.29 3.44
A XBXC 2 0.07 0.04 <1
误 差 22 12.84 0.58
总变异 35 396.00
第三节 多因素试验结果的分析
4、效应和互作的显著性测验,
( 1) 品种效应:如前表每个品种的 TA是
rac=3× 2× 3=18个小区的产量,故
67.1
2 0 018
6 0 0 0 ?
?
?cf
因此,A1品种亩产量 =174× 1.67=290.6(斤)
A2品种亩产量 =78 × 1.67=130.3(斤)
相 差 160.3(斤)
第三节 多因素试验结果的分析
为测验差数 160.3斤 /亩 的显著性,算得亩产量的标
准误
9.1595.239.5
39.567.158.018
22,05.0
2
???
??????
L S R
cfnsSE e
即 A1品种的产量显著高于 A2( 160.3>15.9)。
实际上,当因素或互作的 v=1时,t测验,q测验、
SSR测验的结果都完全相同,也和 F测验的结果完全
相同。所以遇到这种情况,可以据 F测验直接作出判
断,不需再作测验(见方差分析表)。
第三节 多因素试验结果的分析
( 2)播期效应:因为 v=1,由 F测验可直接判断是否
显著。
( 3)品种 X播期的互作:
A X B互作值 =61-35=26(斤)(见 AB两向表)。 F测
验已表明此差数亦显著。
( 4)品种 X灌水的互作:
由 AC两向表求得 A XC的各个互作值于下表:
第三节 多因素试验结果的分析
表 22 品种( A) X灌水( C) 的互作值
项 目 产量
(斤)
互作值
A1,C1并存 A1,C1并存
C1下,A1-A2 51
C2下,A1-A2 37 14( 35)
C3下,A1-A2 8 43( 107.50) 29( 72.5)
第三节 多因素试验结果的分析
求得亩产量标准误
5.2717.46.6
3.2008.36.63
5.2602.46.6
5.1995.26.62
6.65.258.012
22,01.0
22050
22,01.0
22050
2
???
????
???
????
??????
L S R
,L S RP
L S R
,L S RP
cfnsSE
,。
,。
e
时
时故
上述尺度测验 A与 C的互作值的亩产量,都达
0.01的水平。
5、试验结论:
试验品种和播期皆有显著效应,品种应选 A1,播
期应选 B1。 AXB互作显著,选用 A1B1组合,可取得
亩增收 43.4斤的互作; AXC的互作也显著,选用
A1C1也可取得亩增收 35.0-107.5斤的互作。因此
本试验的最优组合为 A1B1C1,即处理 1。
第三节 多因素试验结果的分析
三、裂区试验结果的统计分析
设有 A和 B两个试验因素,A因素为主处理,具 a个
水平,B因素为副处理,具 b个水平,设有 r个区组,
则该试验共得 rab个观察值。其各项变异来源和相
应的自由度如下表:
第三节 多因素试验结果的分析
表 23 二裂式裂区试验自由度的分解
第三节 多因素试验结果的分析
变 异 来 源 DF
主
区
部
分
区组 r-1
A a-1
误差 a (r-1)(a-1)
总变异 ra-1
副
区
部
分
B b-1
AXB (a-1)(b-1)
误差 b a(r-1)(b-1)
总变异 rab-1
由上表可见,二裂式裂区试验与二因素随机区组
试验在分析上的不同,仅在于前者有主区部分和副区
部分,因而有主区误差和副区误差。也就是说 裂区试
验有误差项的再分解。
[例 11] 有一小麦中耕次数( A) 和灌水( B) 试
验,主处理为 A,分 A1,A2,A3 3个水平;副处理为
B,分 B1,B2,B3,B4 4个水平,裂区设计,重复 3
次( r=3),副区计产面积 300平方尺,其田间排列和
产量如下图,试作分析。
第三节 多因素试验结果的分析
第三节 多因素试验结果的分析
B2
37
B1
30
B3
15
B2
31
B4
13
B3
13
B3
18
B4
17
B4
16
B1
30
B1
28
B2
31
A1 A3 A2
B1
27
B3
14
B4
12
B3
13
B2
32
B3
14
B4
15
B2
28
B2
28
B1
29
B4
16
B1
28
B4
15
B3
17
B2
31
B4
13
B1
25
B2
29
B3
31
B4
32
B4
26
B1
11
B1
10
B2
12
A3 A2 A1
A1 A3 A2
重复 I
重复 II
重复 III
(一)结果整理
按区组和处理作两向分组整理成下表( 24):
第三节 多因素试验结果的分析
主处理
A
副处理
B
区组 TAB TA
I II III
A1
B1 30 28 32 90
B2 37 32 31 100
B3 18 14 17 49
B4 17 16 15 48
Tm 102 90 95 287
第三节 多因素试验结果的分析
主处理
A
副处理
B
区组 TAB TA
I II III
A2
B1 28 29 25 82
B2 31 28 29 88
B3 13 13 10 36
B4 13 12 12 37
Tm 85 82 76 243
(续)
第三节 多因素试验结果的分析
主处理
A
副处理
B
区组 TAB TA
I II III
A3
B1 30 27 26 83
B2 31 28 31 90
B3 15 14 11 40
B4 16 15 13 44
Tm 92 84 81 257
Tr 279 256 252 787(T)
(续)
按 A 因素和 B 因素作两向分类整理成下表( 25):
第三节 多因素试验结果的分析
B
A
B1 B2 B3 B4 TA
A1 90 100 49 48 287
A2 82 88 36 37 243
A3 83 90 40 44 257
TB 255 278 125 129 787(T)
(二)自由度和平方和的分解
第三节 多因素试验结果的分析
39.35
43
2 5 22 5 62 7 9
06.1 2 9
4
81.,,,,,851 0 2
31.2 3 7 013.,,,,,3730
69.1 7 2 0 4
433
7 8 7
2222
2222
2222
22
??
?
??
???
??
???
???
????????
?
??
??
?
?
?
CC
ab
T
SS
CC
b
T
SS
CCxSS
r a b
T
C
r
m
区组
主区总
总
矫正数
(二)自由度和平方和的分解
第三节 多因素试验结果的分析
53.2 1 9 2
33
1 2 91 2 52 7 82 5 5
98.2 2 8 2
3
44.,,,,,1 0 090
44.923.8439.35
06.1 2 9
23.84
43
2 5 72 4 32 8 7
22222
2222
2222
??
?
???
???
??
???
???
??
?????
??
?
??
???
?
?
?
CC
ra
T
SS
CC
r
T
SS
SSSSSSSS
CC
rb
T
SS
B
B
AB
AEa
A
A
处理
区组主区总
(二)自由度和平方和的分解
第三节 多因素试验结果的分析
50.4244.998.2 2 8 239.3531.2 3 7 0
50.4222.653.2 1 9 206.1 2 931.2 3 7 0
22.653.2 1 9 2
23.8498.2 2 8 2
?????
????
?????
????
??
?????
EaEb
ABBEb
BAAB
SSSSSSSSSS
SSSSSSSSSS
SSSSSSSS
处理区组总或
主区总总
处理
(三) F 测验
第三节 多因素试验结果的分析
变异来源 DF SS MS F F0.05
主区
区组 2 35.39 17.69 7.49 6.94
A 2 84.23 42.11 17.84 6.94
Ea 4 9.44 2.36
总变异 8 129.06
副区
B 3 2192.53 730.84 309.68 3.16
AXB 6 6.22 1.04 <1
Eb 18 42.50 2.36
总变异 35 2370.31
(四)效应和互作的显著性测验
基本步骤(具体计算略):
1、计算标准误;
2、查附表得 SSRa值;
3、求得 LSRa值;
4、根据上述尺度测验各因素水平的差数。
测验结果如下页表:
第三节 多因素试验结果的分析
表 26 三种中耕处理亩产量的新复极差测验
第三节 多因素试验结果的分析
中耕次数 亩产量
差异显著性
0.05 0.01
A1 478.3 a A
A3 428.3 b AB
A2 405.0 b B
表 27 灌水处理亩产量的新复极差测验
第三节 多因素试验结果的分析
灌水量 亩产量
差异显著性
0.05 0.01
B2 617.8 a A
B1 566.7 b B
B4 286.7 c C
B3 277.8 c C
(五)试验结论
本试验中耕次数的 A1显著优于 A2,A3,灌水量的
B2显著优于 B1,B3,B4。 由于 AXB互作不存在,故应
取相加式,最优组合必为 A1B2。
第三节 多因素试验结果的分析
三、应用正交表分析试验结果
凡采用正交表设计的试验,皆可再用正交表分析
试验结果。首先将试验结果按处理列于正交表的右侧;
然后,按表头设计的列,将各水平的和用 T1,T2、
T3…… 等表示,记于正交表的下方。正交表上行(处
理)的自由度是为各列所分解的,而各列的自由度则
为该列的水平数减 1。所以,表头各因素的效应或互
作的自由度,即为该列的水平数减 1;其相应平方和
则可由列下的 T1,T2,T3…… 等值得出。
第三节 多因素试验结果的分析
试验误差的自由度和平方和为
误差 DF=总 DF-区组 DF-各列 DF之和
误差 SS=总 SS-区组 SS-各列 SS之和
[例 12] 有一早稻三因素试验,A因素为品种,有
A1,A2,A3,A4水平; B因素为栽插密度,有 B1,B2
水平; C因素为施氮量。有 C1,C2水平;选用 L8
( 4x24),其表头设计和产量结果如下页表( 27),
试作分析。
第三节 多因素试验结果的分析
表 27 4?2?2试验,L8( 4x24) 设计
第三节 多因素试验结果的分析
表头设计 A B C 产 量(斤)
处理 列号 1 2 3 4 5 I II III Tt
1=A1B1C1 1 1 1 1 1 17 16 19 52
2= A1B2C2 1 2 2 2 2 19 20 20 59
3= A2B1C2 2 1 1 2 2 26 24 21 71
4= A2B2C1 2 2 2 1 1 25 22 20 67
5= A3B1C2 3 1 2 1 2 16 15 19 50
6= A3B2C1 3 2 1 2 1 14 15 14 43
7= A4B1C1 4 1 2 2 1 24 25 23 72
8= A4B2C2 4 2 1 1 2 28 28 26 82
( 续)
第三节 多因素试验结果的分析
T1 111 245 234 Tr:
169 165 162
496
(T)
T2 138 251 262
T3 93
T4 154
R 61 6 28
(一)结果整理
在上表中:
1、将各处理小区产量相加得 Tt,将各区组的小
区产量相加得 Tr;
2,将各列下同水平的 Tt相加,如 T1=52+59=111;
3,空列不加,其变异归入误差;
4、根据列下各 Ti值可算得各列极差 R。
第三节 多因素试验结果的分析
(二)自由度和平方和的分解
总 DF=rt-1=(3x8)-1=23
区组 DF=r-1=3-1=2
A的 DF=a-1=4-1=3
B的 DF=b-1=2-1=1
C的 DF=c-1=2-1=1
误差 DF=23-2-( 3+1+1) =16
第三节 多因素试验结果的分析
按多因素试验的一般方法分解平方和,求得
第三节 多因素试验结果的分析
00.371
6
15493138111
08.3
8
162165169
33.45126......1917
67.10250
83
496
22222
2222
2222
22
??
???
???
??
??
???
????????
?
?
??
?
?
?
CC
b
T
SS
CC
t
T
SS
CCxSS
rt
T
C
A
A
r
区组
总
矫正数
第三节 多因素试验结果的分析
09.43)66.3250.100.371(08.333.451
66.32
83
)262234()(
50.1
83
)251245()(
22
21
2
21
2
??????
?
?
?
?
?
?
?
?
?
?
?
?
SS
rt
TT
SS
rt
TT
SS
CC
c
BB
B
误差
当因素只有两水平时,其效应平方和可用简
式计算:
( 三) F 测验
第三节 多因素试验结果的分析
变异来源 DF SS MS F F0.05
区组间 2 33.08 1.54 <1
A 3 371.00 123.67 45.97 3.24
B 1 1.50 1.50 <1
C 1 32.66 32.66 12.14 4.49
误差 16 43.09 2.69
总变异 23 415.23
( 四)差异性显著性测验
因为 C因素只有 2个水平,所以不需再作测验,即
知 C2显著优于 C1,其亩产量为
C2=262X6000/( 12X150) =873.2( 斤)
C1=234X6000/ ( 12X150) =780.0
相差 93.2(斤)
第三节 多因素试验结果的分析
A因素各水平的差异显著性需进一步测验。在此
以亩产量为比较标准,故
Cf=6000/ ( 6X150) =6.6667
亩产标准误(下页):
第三节 多因素试验结果的分析
第三节 多因素试验结果的分析
1.1 3 9,5.1 0 8,4
1.1 2 8,8.97,3
7.1 1 0,4.80,2
:
)(8.266 6 6 7.669.26
16,01.016,05.0
16,01.016,05.0
16,01.016,05.0
???
???
???
????
L S RL S Rp
L S RL S Rp
L S RL S Rp
q
SE
法求得应用
斤
表 28 各品种亩产量的 q测验
第三节 多因素试验结果的分析
品 种
亩产量
(斤)
差异显著性
0.05 0.01
A4 1026.7 a A
A2 920.0 b AB
A1 740.0 c C
A3 620.0 d D
对各处理组合间的差异性作显著性测验:
由于表中的 TA值是 3个小区的产量,故
Cf=6000/(3X150)=13.3333
亩产量的标准误
第三节 多因素试验结果的分析
)(9.373333.1369.23 斤????SE
应用 q测验法,可算得 p=2,3,……, 8,
v=16时的各个 LSR值于表 29。
表 29 LSR值的计算
第三节 多因素试验结果的分析
p q0.05 q0.01 LSR0.05 LSR0.01
2 3.00 4.13 113.7 156.5
3 3.65 4.78 138.3 181.2
4 4.05 5.19 153.5 196.7
5 4.34 5.49 164.5 208.1
6 4.56 5.72 172.8 216.8
7 4.74 5.92 179.6 224.4
8 4.90 6.08 185.7 230.4
表 30 各处理组合的差异显著性
第三节 多因素试验结果的分析
处理组合 亩产量 差异显著性
(斤) 0.05 0.01
A4B2C2 1093.3 a A
A4B1C1 960.0 b AB
A2B1C2 946.7 b AB
A2B2C1 893.3 bc B
A1B1C2 786.7 cd BC
A1B1C1 693.3 de CD
A3B1C2 666.7 de CD
A3B2C1 573.3 e D
一、回归和相关的概念
二、直线回归方程
三、直线回归的假设测验和区间估计
四、直线相关
第四节 直线回归与相关
第四节 直线回归与相关
?变量间的关系有两类:函数关系;统计关系
?函数关系有严格的数学依存关系
?统计关系又称相关关系,不能精确用固定不
变的数学公式表示
?统计关系有两种分析方法:相关分析法和回
归分析法
第四节 直线回归与相关
一、回归和相关的概念
科学实验中所要研究的变数往往不只是一个,而是两个或
两个以上。如:土壤水分与作物产量的关系,亩穗数,穗粒数
和产量的关系等。为了处理具有一定联系的两个以上的变数,
除继续应用符号 x外,还需引入符号 y.这样两个变数 ( x,y)
的各对观察值可用 ( x1,y1), ( x2,y2),… ( xn,yn)
表示。为初步考察 x和 y的关系,我们可将每一对 ( xi,yi)
都表示为直角坐标平面上的一个点,作成如下散布图:
第四节 直线回归与相关
X 生物产量 ( 克 )
图 1 水稻生物产量和稻谷产量散布图
第四节 直线回归与相关
图 2 水稻每米 2颖花数和结实率散布图
第四节 直线回归与相关
图 3 水稻最高叶面积指数和亩产量的散布图
第四节 直线回归与相关
由这种 散布图 可以了解,
( 1) 两个变数的性质和密切程度或由 x估计 y的精确
度;
( 2) 两个变数的关系是直线型的还是非直线型的;
( 3) 是否有一些特殊的不规则的点着有其它因素的
干扰等。
第四节 直线回归与相关
如从上述 3个不同散布图可以看出:
( 1) 图 1、图 2都是直线型的,但方向相反;前者 y随
x的增大而增大,表示两个变数的关系是正的;
后者 y随 x的增大而减小,表示关系是负的性质。
( 2) 图 1的各个点几乎都落在一直线上,图 2则较为
分散;因此,前者的相关程度高于后者。
( 3) 图 3 中 x和 y的关系不是直线型。本节仅讨论直
线型关系。
第四节 直线回归与相关
在统计上,x和 y的关系有两种理论模型:第一
种叫回归模型,第二种叫相关模型。
两种理论模型的区别是:
1、在回归模型中:
( 1) 自变数 x是固定的,无误差或误差很小;
( 2) 依变数 y随 x变化,有随机误差;
( 3) 有 x变化预测 y变化的作用,具有预测特征;
( 4) 回归资料的统计分析叫回归分析;就是要导
出由 x预测 y或控制 y的回归方程。
第四节 直线回归与相关
2,在相关模型中:
( 1) x和 y是平行变化关系;
( 2) x和 y皆有随机误差,因而不能区别哪个是自变
数,哪一个是依变数;
( 3) 相关模型的特征是表示两个变数的偕同变异,
不具预测性;
( 4) 相关分析是要测定两个变数在数量关系上的密
切程度和性质。
第四节 直线回归与相关
但是 回归和相关并不能截然分开,因为由回归可获
得相关的一些信息,由相关也可获得回归的一些
重要信息。
3、以防统计方法误用必须注意的问题:
( 1) 变数间是否存在相关,须有具体学科本身来定;
( 2) 由于自然界各种事物间的相互联系和制约,一
事物的变化通常都会受到其它事物的影响。因此,
如果仅研究一对事物的关系,其余事物的均匀性
必须尽可能得到严格控制。
第四节 直线回归与相关
( 3) 为提高回归和相关分析的准确性,两个变数的
成对观察值应尽可能地多一些,应有 5对以上观察值,
并使 x的取值范围尽可能大一些。
二、直线回归方程
(一)直线回归方程式
对于在散布图上呈直线趋势的两个变数,如果要
概括其在数量上的互变规律,即从 x的数量变化来预
测或估计 y的数量变化,则要采用回归方程来描述。
此方程的通式如下:
第四节 直线回归与相关
bxay ???
上式读作, y依 x的直线回归。其中 x是变数,是
和 x的量相对应的依变数 y的点估计值; a是 x=0时
的 值,即回归直线在 y轴上的截距,叫回归截距;
b是 x每增加一个单位数时,平均地将要增加
( b>0)或减少 (b<0)的单位数,叫回归系数。
y?
y?
y?
( 1)
第四节 直线回归与相关
要使 能够最好地代表 y和 x
在数量上的互变关系,根据最小平方法,须使 bxay ??
?
? ? ??????
n n
bxayyyQ
1 1
22 )()?( 最小
第四节 直线回归与相关
因此,a和 b值按微分学上求极小值原理得出,即有正
规方程
? ? ?
? ?
??
??
xyxbxa
yxban
2
以上是二元一次联立方程组,解之得
?
?
? ?
? ? ?
?
??
?
?
?
?
??
2
22 )(
))((
)(
1
))((
1
xx
yyxx
x
n
x
yx
n
xy
b
xbya
( 2)
( 3)
第四节 直线回归与相关
上述 ( 3) 式的分子是离均差的乘积和,记作 SP;
分母是离均差平方和,记作 SSx。 将 ( 2)、( 3) 式
算得的 a和 b值代入 ( 1) 式,即可保证 Q值最小。
A和 b可正可负,因具体资料而异。在 a>0时,回
归直线在第 I象限交于 y轴;在 a<0时,回归直线在第 I
象限交于 x轴;在 b>0时,表示 y随 x的增大而增大,成
正相关;在 b<0时,表示 y随 x的增大而减小,成负相
关;见下图。在 b=0或和 0的差异不显著时,则表明 y
的变异和 x的取值大小无关,直线回归关系不能成立。
第四节 直线回归与相关
图 4 直线回归方程的图象
第四节 直线回归与相关
将( 2)式代入( 1)式可得
)(? xxbybxxbyy ??????
( 4)
由( 4)式可见,若 x=,则 y=,所以回归直线必通过坐标
点(, )。记住这一点有助于绘制具体资料的回归直
线。
(二)直线回归方程的计算
[例 1] 如下表:
x y
x y
第四节 直线回归与相关
表 1 累积温和一代化螟蛾盛发期的关系
X累积温 Y盛发期
35.5 12
34.1 16
31.7 9
40.3 2
36.8 7
40.2 3
31.7 13
39.2 9
44.2 -1
第四节 直线回归与相关
首先由上表资料算得 6个一级数据:
9
4.2 4 3 6)]1(2.44[.,,,,,)161.34()125.35(
7 9 4)1.,,,,, (1612
70)1(.,,,,,1612
49.1 2 5 1 72.44.,,,,,1.345.35
7.3 3 32.44.,,,,,1.345.35
2222
2222
?
?????????
?????
??????
?????
?????
?
?
?
?
?
n
xy
y
y
x
x
然后,由一级数据算得二级数据:
第四节 直线回归与相关
0 4 4 4.1 5 9)707.3 3 3(
9
1
34.2 4 3 6
5 5 5 6.2 4 9)70(
9
1
7 9 4
)(
6 3 5 6.1 4 4)7.3 3 3(
9
1
49.1 2 5 1 7
)(
2
2
2
2
2
2
????
???
??
???
??
???
?
??
?
?
?
?
n
yx
xySP
n
y
ySS
n
x
xSS
y
x
第四节 直线回归与相关
5485.48)0778.370996.1(
7778.7)(
0996.1
6356.144
0444.159
7778.7
9
70
0778.37
9
7.333
???
????
??
?
??
???
???
?
?
xbya
SS
SP
b
n
y
y
n
x
x
x
第四节 直线回归与相关
故得直线回归方程为
xy 1.15.48? ??
(三)直线回归方程的图示
1、直线回归图包括回归直线图象和散布图;
2、制作回归图时,以 x为横坐标,y为纵坐标;
3、纵、横坐标皆需标明名称和单位;
4、取 x坐标上的一个小值 x1代入回归方程得 y1;再取
一个大值 x2代入回归方程得 y2。 连接坐标点( x1,y1)
和( x2,y2) 成一条回归直线(如下图 5)。
第四节 直线回归与相关
图 5 旬平均温度累积值和一代三化螟蛾盛发期的关系
第四节 直线回归与相关
(四)直线回归的估计标准误
由上图可见,直线回归方程和实测的坐标点并不
吻合。故应对其误差进行估计。由于 Q为离回归平方
和,且建立回归方程时用了 a和 b两个统计数,故 Q的
自由度 v=n-2。 则回归的标准误:
2
)?(
2
2
,?
?
?
?
? ?
n
yy
n
Qs
xy
( 4)
第四节 直线回归与相关
?
? ?
?
??
????
n
yx
xysp
ss
sp
ssyyQ
x
y
.
)(
)?(
2
2
(五)直线回归的数学模型和基本假定
在直线回归中,总体的每一个 Y值决定于三个因素:
( 1) Y的总体平均数 Y;( 2) 因 X的作用而使 Y发生的离均变
异,( 3) Y的随机误差 。因此,直线回归)( XX ??
第四节 直线回归与相关
的数学模型可表示为:
?? ???? )( XXYY
在按上述模型进行回归分析时,假定:
1、任一个 X上都存在一个 Y总体,它是作正态分布的;
2、所有 Y总体都具共同方差,因而直线回归总体具有
我们得到的观察值只是总体 N中的随机本。
3、直线回归的总体方差 是可分的。
4,X是没有误差的固定变数,而 Y是随机变数。
2.xy?
),(, xyXN ??? ?
2.xy?
第四节 直线回归与相关
三、直线回归的假设测验
1、回归关系的假设测验
对于样本的回归方程,必须测定其来自无直线回归关系的
总体的概率大小。只有当这种概率 a<0.05或 a<0.01时,才能确
认其所代表的总体存在直线回归关系。这就是回归关系的假设
测验,可由 t测验或 F测验给出。由于回归系数的标准误 Sb为
( 5)
x
xy
b ss
s
s,?
第四节 直线回归与相关
并且
bs
bt ???
遵循 v=n-2的 t分布,故由 t值即可知道样本回归系数 b
来自不存在回归关系总体的概率的大小。
例:试测上述回归关系的显著性。已算得 b=-1.0996,
SSx=144.6356,Sy.x=3.266,故有
第四节 直线回归与相关
05.4
2 7 1 5.0
0 9 9 6.1
2 7 1 5.0
6 3 5 6.1 4 4
2 6 6.3
??
?
?
??
t
S
b
查表得,t0。 05,7=2.36,t0。 01,7 =3.50。 现
实得 ltl=4.05,表明在总体中因抽样误差而得现
有样本的概率 a<0.01,或说此 b=-1.0996是极
显著的。因而所建回归方程是可靠的。
第四节 直线回归与相关
2,F测验:
当以 表示 y资料时(不考虑 x的影响),y变数有平方和
和自由度 v=n-1。 当以 表示 y资料时
(考虑 x的影响),则 SSy将分解成两个部分,
即
y
? ?? 2)( yySS y bxay ???
?
?
?????
????
x
y
x
y
SS
SP
QSSyyU
SS
SP
SSyyQ
2
2
2
)(
)?(
)(
)?(离回归平方和:
回归平方和:
第四节 直线回归与相关
由于回归和离回归的方差比遵循 v1=1,v2=n-2的 F分
布,故由
2/
/)( 2
?
?
nQ
SSSP
F x
即可测定回归关系的显著性。
[例 ]试测前述资料回归关系的显著性。
前已算得 Ssy=249.5556,Q=74.6670,故
第四节 直线回归与相关
U=249.5556-74.6670=174.8886,并有方差分析表:
回归关系的假设测验
变异来源 DF SS MS F F0.01
回 归 1 174.8886 174.8886 16.40 12.25
离 回 归 7 74.6670 10.6667
总 变 异 8 249.5556
第四节 直线回归与相关
上述 t和 F测验,在任何回归样本上,其结果都完
全一致。因为在同一概率值下,v1=1,v2=n-2的一尾
概率值恰巧等于 v=n-2 的两尾 t值的平方。如本例,
F=16.40,t=-4.05,(-4.05)2=16.40。 所以,对直线
回归作假设测验,只需选择上述方法的一种。
(二)两个回归系数比较时的假设测验
若有两个直线回归样本,分别具有样本回归系数 b1,b2和总
体回归系数 ?1,?2,则在测验 b1,b2的差异显著性时,两个
样本回归系数的差数的标准误 Sb1-b2为
第四节 直线回归与相关
?? ?
?
?
??
2
22
2
.
2
11
2
.
21 )()( xx
S
xx
S
S xyxybb
上式的分母分别为两个样本 x变数的平方和,分子为两个
样本回归估计标准误的合并方差,其值为
)2()2( 21
212
,???
??
nn
QQS
xy
第四节 直线回归与相关
上式中的 Q1和 Q2分别为两个样本的离回归平方和,n1
和 n2分别为两个样本的成对观察值数目。
由于( b1-b2)/Sb1-b2遵循 v=(n1 -2)+ n2 -2)的 t分布,
故有
21
21
bb
S
bb
t
?
?
?
第四节 直线回归与相关
四、直线回归的区间估计
(一)直线回归的抽样误差
设直线回归总体,具有总体回归方程 Y=a+?X和标
准差 ?Y.X( 它给定了坐标点的离散程度)。在对该总
体抽取若干个样本时,则由于 ?Y.X各样本的 a,b值都
有误差。因此,由 Y=a+bx给出的点估计的精确性,决
定于 SY。 X和 a,b的误差的大小。比较科学的方法应是
考虑到误差的大小和坐标点的离散程度,给出一个区
间估计,即给出对其总体的 ?,?,Y等的置信限。
第四节 直线回归与相关
(二)回归截距的置信限
样本回归截距 a的标准误为
x
xya SS
x
n
SS
2
.
1
??
而( a- ?)/Sa是遵循 v=n-2的 t分布的。所以对总
体回归截距 ?有 95%可靠度的置信限为
[L1=a-t0.05 Sa,L2=a+ t0.05 Sa]
第四节 直线回归与相关
置信限表示总体回归截距在 [L1,L2]区间内的可
靠度为 95%;或可解释为:样本的回归截距 a可预期每
100个中约有 95个 a值在 [L1,L2]区间内。
(三)回归系数的置信限
( b- ?)/Sb亦遵循 v=n-2的 t分布,故对总体回归系数
?有 95%可靠度的置信区间为
[L1=b- t0.05 Sb,L2=b+ t0.05 Sb]
第四节 直线回归与相关
上式中的 Q1和 Q2分别为两个样本的离回归平方和,n1
和 n2分别为两个样本的成对观察值数目。
由于( b1-b2)/Sb1-b2遵循 v=(n1 -2)+ n2 -2)的 t分布,
故有
21
21
bb
S
bb
t
?
?
?
第四节 直线回归与相关
四、直线相关
( 一)相关系数和决定系数
1、相关系数
对于坐标点呈直线型的两个变数,如果并不需要
由 x来估计 y,而仅需要了解 x和 y是否确有相关以及相
关的性质(正相关或负相关),则首先应算出表示 x
和 y相关密切程度及其性质的统计数 —— 相关系数
第四节 直线回归与相关
经过分析推导,样本相关系数( r) 的计算公式为:
yx SSSS
SP
yyxx
yyxx
r
.)(.)(
))((
22
?
??
??
?
? ?
?
前已述及,y变数的平方和
在回归分析时分成了两个部分:一部分是离回归
平方和
另一部分是回归平方和
? ?? 2)( yySS y
? ?? 2)( yyQ ?
? ???,/)()( 22 xSSSPyyU ?
第四节 直线回归与相关
显然,若坐标点愈靠近回归线,直线相关就愈密切。
上述分析还表明,当散布图上的点完全落在回归直线
上时,Q=0,SS y=U,故 r=± 1; 当 y的变异和 x无关时,
SS y=Q,U=0,故 r=0。 所以 r的取值区间是 [-1,1]。 双
变数的相关程度决定于 r的绝对值,r的绝对值越接近
于 1,相关越密切;越接近于 0,越可能无关。但是还
和自由度 v有关,v愈大,受抽样误差的影响越小,r
达到显著水平 a的值就越小。 r的正负是表示相关性质
的,正的 r值表示正相关,负的 r值表示负相关。
第四节 直线回归与相关
2、决定系数
决定系数定义为由 x不同而引起的 y变数平方和
? ?? 2)?( yyU
占 y变数总平方和
? ?? 2)( yySS y
的比率;
第四节 直线回归与相关
也可定义为由 y不同而引起的 x变数的平方和
。r
SSSS
SP
SS
SSSP
SS
SSSP
r
,xxxxx
yxy
y
y
x
的平方值数所以决定系数即相关系
其值为
的比率变数总平方和占
.
)(/)(/)(
)()?(
222
2
22
???
?? ??
第四节 直线回归与相关
3、决定系数和相关系数的区别
( 1)除掉 |r|=1和 0的情况外,r2总是小于 r。
( 2) r可正可负,而 r2总是取正值,其取值区间为
[0,1]。
( 3) r2一般只用于表示相关程度,而不表示相关性
质。
(二)相关系数和决定系数的计算
第四节 直线回归与相关
计算 [例 1]资料(积温与一代三化螟蛾盛发期的关系)
的相关系数和决定系数。在前面已算得该资料的
SSx=144.6356,SSy=249.5556,故代入公式有
7007.0
5556.2496356.144
)0441.159(
.
)(
8371.0
5556.2496356.144
0441.159
.
22
2
?
?
?
??
??
?
?
??
yx
yx
SSSS
SP
r
SSSS
SP
r
第四节 直线回归与相关
以上结果表明,一代三化螟蛾盛发期与 3月下旬至
4月中旬积温成负相关,即积温愈高,螟蛾盛发期愈
早。但一代螟蛾盛发期的变异平方和仅有 70.07%是由
积温不同造成的。
( 三)相关系数的假设测验
( 1)相关系数的标准误
第四节 直线回归与相关
05.4
2067.0
8371.0
2067.0
29
8371.01
2
1
22
??
?
??
?
?
?
?
?
?
?
r
r
S
r
t
n
r
S
查附表,t0.01=3.50,现实得 t=4.05> t0.01,
r在 a=0.01水平上显著,说明直线相关真实存
在,且积温愈高,螟蛾盛发期愈早( y愈小)。
第四节 直线回归与相关
请注意,本例 t=-4.05和该资料在作回归系数测验
时的 t=-4.05完全相同。这不是偶然巧合,而是必然
结果。对于同一资料来说,相关显著,回归必显著;
相关不显著,回归也必不显著。因此在计算程序上,
当得到二级数据后,可先算相关系数,如其显著可再
算回归(回归不需再作假设测验);如其不显著,就
不必再算下去。
谢谢大家