第八章 单因素试验资料的统计分析
第一节 对比法和间比法试验资料的统计分析
对比法和间比法试验,均属于顺序排列的试验设计,不能正确地估计出无偏的试验误差,因而试验结果不能采用方差分析的方法进行显著性测验,一般采用百分比法,即设对照(CK)的产量(或其他性状)为100,然后求出各处理的百分数和对照相比。顺序排列亦具有一定优点,如设计简单,播种、观察和收获等工作不易发生差错,可按品种的成熟期,株高等排列,以减少处理间的生长竞争。
一、对比法试验结果的统计分析对比法的主要优点是,处理和对照彼此相邻,由于相邻小区的的土壤肥力比较相似,所以供试处理与对照的比较有较高的精确度。其主要缺点是对照占地面积太大,土地利用率不高。本试验设计主要用于育种工作后期处理不很多而土壤肥力变化又较大,难以进行局部控制之时。
[例 8.l」有一大豆品种比较试验,A、B,C、D、E、F6个品种,另加一标准品种 CK,采用对比法设计,3次重复,小区计产面积 66.7m2,所得产量结果列于表 8.l,试作分析。
表8.1大豆品比试验(对比法)的产量结果与分析品种名称
各重复小区产量(kg)
总和TI
平均
对邻近CK的%
I
II
III
CK
A
B
CK
C
D
CK
E
F
CK
37.0
36.4
38.0
31.5
36.5
35.2
30.6
28.4
30.6
35.2
36.5
36.8
37.0
30.8
35.0
32.0
32.9
25.8
29.7
32.3
35.5
34.0
34.5
29.5
31.0
30.1
27.7
23.6
28.3
30.5
109.0
107.2
109.5
91.8
102.5
97.3
91.2
77.8
88.6
98.0
36.3
35.7
36.5
30.6
34.2
32.4
30.4
25.9
29.5
32.7
100.0
98.3
119.3
100.0
111.7
106.7
100.0
85.3
90.4
100.0
1.计算各品种对相邻CK的% 在表8.1,先将各品种在各重复中的小区产量相加,得66.7 x 3= 200m2面积上的产量总和Ti 。然后将各个Ti除以重复次数,得小区平均产量(这一步骤可省略)。再计算各品种产量对邻近CK产量的百分数,

例如:A品种对邻近CK的%。其余品种皆可类推。
2,试验结论 相对生产力大于100%的品种,其百分数愈高,就愈可能优于对照品种。但决不能认为超过100%的所有品种都是显著地优于对照的,因为将品种与相邻CK相比只是减少了误差,误差仍然是存在的,一般田间试验很难察觉处理间差异在5%以下的显著性。所以对于对比法(包括间比法)的试验结果,要判断某品种的生产力确实优于对照,其相对生产力一般至少应超过对照10%以上;凡相对生产力仅超过对照5%左右的品种,均宜继续试验再作结论。当然,由于不同试验的误差大小不同,上述标准仅供参考。
在本例,B品种和C品种的产量均超过对照10%以上,大体上可以认为它们确实优于对照,D品种产量仅超过对照6.7%(<10%),因而不能作出D品种的确优于对照的结论,尚需进一步试验。
在农业生产上,作物产量习惯于用每亩产量表示。对比法试验结果,当欲以亩产量表示时,首先应算得对照区的总产量。然后将对照区总产量乘以化对照区总产量为亩产量的改算系数cf,得到对照的亩产量。
 (8.1)
8.1式中的A是小区计产面积,以m2为单位;n是小区数目。最后用各品种的相对生产力乘对照的亩产量,即得各品种的亩产量。
如本例,上表8.1可算得对照区总产量=109.0+91.8+98.0=390.0(kg),cf=666.7/(12× 66.7)=0.8333,所以
对照种亩产量 =390.0×0.8333=325.0(kg)
A品种亩产量 =325.0×98.3%=319.5(kg)
B品种亩产量 =325.0×119.3%=387.7(kg)
……,依此类推二、间比法试验资料的统计分析
间比法的二个对照间安排了更多的小区,各处理要与两端对照的平均数(理论对照标准)相比,因此其精确度较对比法为差。这类设计常用于育种初期阶段,如选种圃、品系鉴定圃以及良种繁育时的株行圃,此时育种材料多、小区小,着重于优良性状的选择,产量仅作参考。
[例8.2] 有一小麦新品系鉴定试验,共12个品系,另加一对照品种,采用间比法设计,3次重复,小区计产面积20m2,每隔4个品系设一个对照。所得产量结果列于表8.2,试作分析。
表8.2 小麦品系鉴定试验(间比法)的产量结果与分析
品 系
各重复小区产量 (kg)
总和
平均
对照标准
对的%
Ⅰ Ⅱ Ⅲ
CK1
A1
A2
A3
A4
CK2
A5
A6
A7
A8
CK3
A9
A10
A11
A12
CK4
12.0 13.0 12.0
13.0 13.0 14.0
14.0 12.0 13.0
12.0 13.0 12.0
13.0 13.0 12.0
13.0 12.0 13.0
13.0 14.0 13.0
15.0 14.0 15.0
13.0 13.0 12.0
13.0 14.0 14.0
14.0 13.0 12.0
10.0 11.0 12.0
10.0 12.0 13.0
11.0 12.0 13.0
12.0 13.0 12.0
12.0 11.0 12.0
37.0
40.0
39.0
37.0
38.0
38.0
40.0
44.0
38.0
41.0
39.0
33.0
35.0
36.0
37.0
35.0
12.33
13.33
13.00
12.33
12.67
12.67
13.33
14.67
12.67
13.67
13.00
11.00
11.67
12.00
12.33
11.67
12.50
12.50
12.50
12.50
12.84
12.84
12.84
12.84
12.34
12.34
12.34
12.34
106.6
104.0
98.6
101.4
103.8
114.3
98.7
106.5
89.1
94.6
97.2
99.9
1.计算各品系和CK的平均产量 将各品系和CK在各重复的小区产量相加得,再除以重复数,得小区平均产量。
2,计算各品种的理论对照标准
如:A1、A2、A3、A44品系的 = ==12.5
其余各品种的依此类推。
3.计算各品系产量对相应产量的百分数,即得各品系的相对生产力(%)。
如品系A1的相对生产力(%)= ×100
=× 100=106.6
其余各品系的相对生产力按同法计算。
4,试验结论 试验结果表明,相对生产力超过 10%以上的有品系A6,相对生产力超过 5%以上的有品系A1和 A8 。其中A6的增产幅度最大,品系A1和 A8尚需作进一步试验。
第二节 单因素完全随机试验资料的统计分析
完全随机设计是将具有n次重复的k个处理完全随机地布置到各个试验单元中去的试验方法,并未施以“局部控制”,它是试验设计中最简单的一种,广泛应用于环境变异较小的盆栽试验、温室试验和实验室试验,在田间试验中很少应用。完全随机设计的主要优点为设计方便,分析简易,方差分析时不受缺失数据的影响;缺点是当土壤肥力差异增大时,会增大试验误差,故其应用范围有一定限制。
单因素完全随机设计的试验资料,只在一个因素内有不同的处理级别,因而,将其整理后的资料为单向分组资料(见表7.1),组间的总和数Ti或组间的平均数之间的差异反映的是处理效应;组内重复观察值之间的差异反映的是误差效应。
一、各处理观察值数目相等的单向分组资料在k个处理中,每处理皆含有n个供试单位的资料称为组内观察值数目相等的单向分组资料如表7.1。在作方差分析时,其任一观察值的线性模型皆由7.20式表示,方差分析表如表8.3。
表8.3 组内观察值数目相等的单向分组资料的方差分析变异来源
自由度
DF
平方和
SS
均 方
MS
F
期望均方(EMS )
固定模式
随机模式
处理间误 差
k-1
k(n-1)
n∑






总变异
nk-1

[例8.3]研究6种氮肥施用法(k=6)对小麦的效应,每种施肥法种5盆小麦(n=5),完全随机设计,最后测定它们的含氮量(mg),其结果如表8.4。试作方差分析。
表8.4 6种施肥法小麦植株的含氮量(mg)
施 氮 法
1
2
3
4
5
6
12.9
12.3
12.2
12.5
12.7
14.0
13.8
13.8
13.6
13.6
12.6
13.2
13.4
13.4
13.0
10.5
10.8
10.7
10.8
10.5
14.6
14.6
14.4
14.4
14.4
14.0
13.3
13.7
13.5
13.7

13.76
13.12
10.66
14.48
13.64
为了简化分析,首先将表8.4各xij值皆减去10(由此算得的平方和与由原观察值算得的完全相同,而得到表8.5。
表8.5 6种施氮法的小麦植株含氮量(将表8.4各值作xij-10转换)
处理
1
2
3
4
5
6
总和
2.9
2.3
2.2
2.5
2.7
4.0
3.8
3.8
3.6
3.6
2.6
3.2
3.4
3.4
3.0
0.5
0.8
0.7
0.8
0.5
4.6
4.6
4.4
4.4
4.4
4.0
3.3
3.7
3.5
3.7
Ti
12.6
18.8
15.6
3.3
22.4
18.2
T=90.9
1.结果整理 首先将原始资料整理成单向分组资料(如表8.4);然后将各处理(不同施氮法)的每盆含氮量相加得Ti(用于求处理平方和SSt),除以n得(用于进行多重比较);再将全试验各盆含氮量相加得T (用于求矫正数C)。
2.自由度与平方和的分解 据各自由度公式可得

以下按各平方和公式求得

3.F测验

表8.6 表8.5资料的方差分析变异来源
DF
SS
MS
F
F0.01
处理间误 差
5
24
44.463
1.300
8.8926
0.0542
164.07
3.90
总变异
29
45.763
按,查F表得F0.01=3.90,现实得F >>F0.01,故,P<<0.01,因而推断:否定,即6种施氮法的植株含量是显著不同的。
4.多重比较——各处理平均数的比较在此用新复极差测验,算得

然后按ve=24,从附表8查出p=2,3,…,6时的SSR0.05和SSR0.01,并按7.17式即算得各种p时的LSR0.05和LSR0.01值于表8.7。
表8.7 表8.5资料新复极差测验的LSR值
P
2
3
4
5
6
SSR0.05
SSR0.01
LSR0.05,24
LSR0.01,24
2.92
3.96
0.304
0.412
3.07
4.14
0.319
0.431
3.15
4.24
0.328
0.441
3.22
4.33
0.335
0.450
3.28
4.39
0.341
0.457
5.试验结论根据表8.7的LSR0.05和LSR0.01尺度,即可作出6个平均数的多重比较于表8.8。表8.8的测验结果说明,除掉第2法和第6法之间的差异为不显著外,其余各种方法间的差异都达到水平。
表8.8 6种施氮法植株含氮量的差异显著性施氮法
平均数

差异显著性
5%
1%
5
2
6
3
1
4
14.48
13.76
13.64
13.12
12.52
10.66
a
b
b
c
d
e
A
B
B
C
D
E
二、各处理观察值数目不等的单向分组资料若k处理中观察值的数目分别为n1、n2、……、nk,则为组内观察值数目不等的单向分组资料。其方差分析的原理、步骤与处理内观察值数目相等的资料完全相同,不同的是各处理的ni不等,所以在方差分析时,下列有关公式作了相应改变:
分解平方和与自由度的公式
总变异自由度 DFT = ∑ni -1
处理间自由度 DFt = k-1 (8.2)
误差自由度 DFe =∑n i -k

总变异平方和 
处理间平方和 
误差平方和  (8.3)
2.多重比较时标准误的公式 由于各处理的重复数不等,可先算得各ni的平均数n0。
 (8.4)
然后有  (8.5)
或  (8.6)
[例8.4] 小麦三个新品系A1、A2、A3和A4(对照)籽粒蛋白质的测定结果如表8.9所示,试测验其蛋白质含量的差异显著性。
表8.9 小麦新品系和对照籽粒蛋白质含量品 系
蛋白质含量(%)
n i
T i

A1
A2
A3
A4(CK)
10.8 13.1 12.3 12.5 13.1
13.2 12.8 13.4 12.1
11.2 11.8 12.1 10.5 11.8 11.2
11.2 12.1 12.4 11.8 12.8
6
5
7
5
72.9
63.8
78.9
60.3
12.15
12.76
11.27
12.06
∑n i =23
T =275.9
1.结果整理 先将原始资料整理成单向分组资料,再依次求出n i,Ti,、(ni 和T(如表8.9)。
自由度与平方和的分解 根据8.2式及8.3式可得
总变异自由度 DFT =∑n i-1=23-1=22
处理间自由度 DFt = k-1 = 4-1=3
误差自由度 DFe =∑ni-k=23-4=19

总变异平方和 SST =(11.12 + 10.82 + … + 12.82)-3309.60=17.15
处理间平方和 SSt =()-3309.60=6.77
误差平方和 SSe = 17.15-6.77=10.38
3.F 测验
表8.10 表8.9资料的方差分析变异来源
DF
SS
MS
F
显著水平
0.05
0.01
处 理误 差
3
19
6.77
10.38
2.26
0.55
4.11
3.13
5.01
总变异
22
17.15
F 测验结果,F > F0.05 ,说明不同小麦品系间蛋白质的含量有显著差异,应进一步作多重比较。
4.多重比较——各处理平均数的比较 由8.4式可得
在此用新复极差测验(LSR法) 该法不仅能测验各新品系与对照间差异显著性,还能测验各品种相互比较的差异显著性。由8.5式可得

由8.5式可得

查附表8,当误差自由度ve =19时,p 自2到4的SSR0.05和SSR0.01的值,并计算各LSR
值于表8.11。
表8.11 表8.9资料新复极差测验的LSR 表8.12 表8.9资料新复极差测验
p
2
3
4
处理
平均蛋白质
含 量
差异显著性
0.05
0.01
SSR0.05
SSR0.01
LSR0.05
LSR0.01
2.96
4.05
0.89
1.22
3.11
4.24
0.93
1.27
3.19
4.35
0.96
1.31
A2
A1
A4
A3(CK)
12.76
12.15
12.06
11.27
a
ab
ab
b
A
AB
AB
B
5.试验结论:表8.12表明A2、A3间蛋白质含量差异极显著,其它之间均不显著。
三、各处理又可分为亚组的单向分组资料单向分组资料,如果每组又分若干个亚组,而每个亚组内又有若干个观察值,则为组内分亚组的单向分组资料,简称系统分组资料。系统分组并不限于组内仅分亚组,亚组内还可分小组,小组内还可分小亚组,……如此一环套一环地分下去。这种试验的设计称为巢式设计(Nested design)。在农业试验上系统分组资料亦是常见的。如对数块土地取土样分析,每块地取了若干样点,而每一样点的土样又作了数次分析的资料,或调查某种果树危害,随机取若干株,每株取不同部位枝条,每枝条取若干叶片查其各叶片病斑数的资料等,皆为系统分组资料。以下我们仅讨论二级分组观察值数目相等的系统分组资料的方差分析。
设一系统分组资料共有l组,每组内又分m个亚组,每一亚组内有n个观察值,则该资料共有lmn个观察值,其资料类型如表8.13。
表8.13中每一观察值的线性可加模型为 
 (8.7)
表8.13 二级系统分组资料lmn个观察值的符号
(i=1,2,…,l; j=1,2,…,m; k=1,2,…,n)
组 别
1
2

i

l



1
2

m










亚组总和
组总和
亚组均数
组均数




……
……












以上为全体平均;为组效应或处理效应,可以是固定模型或随机模型;为同组中各亚组的效应,一般为随机变异,具有);为同一亚组中各观察值的变异,具有。上式说明,表8.13的任一观察值的总变异()可分解为3种变异因素的变异:(1)组间(或处理间)变异;(2)同一组内亚组间变异;(3)同一亚组内各观察值的变异。其自由度和平方和的估计如下:
1.总变异
 (8.8)
其中  (8.9)
2.组间(处理间)变异
 (8.10)
3.同一组内亚组间的差异
 (8.11)
4.亚组内的变异
 (8.12)
因而可得方差分析表于表8.14
表8.14 二级系统分组资料的方差分析变异来源
DF
SS
MS
F
期望均方(EMS)
混合模型
随机模型
组 间组内亚组间亚 组 内






总 变 异
Lmn-1

表8.14中,为测验各亚组间有无不同效应,即测验假设,需借
 (8.13)
而为测验各组间有无不同效应,测验假设,或,即
,需借
 (8.14)
这可从期望均方看出。
在进行组间平均数的多重比较时,平均数的标准误为
 (8.15)
若进行组内亚组平均数的多重比较,则平均数标准误为
 (8.16)
[例8.5] 在温室内以4种培养液(l=4)培养某作物,每种3盆(m=3),每盆4株(n=4),一个月后测定其株高生长量(mm),得结果于表8.15,试作方差分析。
表8.15 4种培养液下的株高增长量(mm)
培养液
A
B
C
D
总 和
盆 号
A1
A2
A3
B1
B2
B3
C1
C2
C3
D1
D2
D3
生长量
50
55
40
35
35
35
30
40
45
40
40
50
50
45
50
45
55
60
50
50
55
45
65
55
85
60
90
85
65
70
80
65
70
70
70
70
60
55
35
70
60
85
45
75
65
65
85
75
盆总和
180
140
175
190
215
220
320
280
280
220
265
290
培养液总和
495
625
880
775
T=2 775
培养液平均
41.3
52.1
73.3
64.6
1.结果整理 先将原始资料整理成组内又分亚组的单向分组资料,再将每盆内各株的株高增长量相加得盆总和(用于计算亚组间即培养液内盆间的平方和),将每种培养液内各盆的株高增长量相加得各培养液总和Ti(用于计算组间即培养液间的平方和SSt),除以mn得培养液平均(用于进行多重比较),最后再求出总和数T。
2.自由度和平方和根据8.9~8.12式由表8.15可算得

3.F测验
由上述结果得表8.17
表8.16 表8.15资料的方差分析变异来源
DF
SS
MS
F
F0。05
F0。01
培养液间培养液内盆间盆内株间
3
8
36
7127
1262
3206
2376
158
89
15.0
1.8
4.07
2.22
7.59
3.04
总 变 异
47
11595
(1)对液内盆之间有无不同影响作F测验,假设,求得

此F值小于,的F0.05=2.22,所以接受。
(2)对培养液间有无不同效应作F测验,假设,求得:

此F值大于vt=3,ve1=8的F0.01=7.59,故否定,接受。
推断:该试验同一培养液内各盆间的生长量无显著差异;而不同培养液间的生长量有极显著的差异。故前者不需再作多重比较,后者则需进一步测验各平均数间的差异显著性。
4.各培养液的平均数比较根据期望均方,培养液平均数的比较应用,求得

按ve1=8,由附表8查得p=2,3,4时的SSR0.05和SSR0.01值,并算得各LSR值于表8.17。根据表8.17的LSR值测验4种培养液植株生长量的差异显著性于表 8.18。
表8.17 4种培养液的LSR值 表8.18 4种培养液植株生长量(mm)
(新复极差测验) 的差异显著性
p
2
3
4
培养液
平均生长量
差异显著性
SSR0.05
SSR0.01
lSR0.05
LSR0.01
3.26
4.74
11.83
17.21
3.39
5.00
12.30
18.15
3.47
5.14
12.60
18.66
C
D
B
A
73.3
64.6
52.1
41.3
a A
a AB
b BC
b C
5.试验结论
由表8.18可见,4种培养液对生长的效应,除C与D、B与A差异不显著外,其余对比均有显著或极显著差异。
第三节 单因素随机区组试验资料的统计分析
在完全随机设计中,如果处理数较多,试验地面积较大,环境因素的均匀性就很难保证,其结果往往造成试验误差过大而降低了试验的灵敏度。随机区组设计就是针对完全随机设计的这一缺点而提出的。它是一个将整个试验地划分成若干个各自相对均匀而彼此相对差异较大的区组,然后在每一区组中设置k个试验单元,并随机地布置k个处理的设计。这类试验应用了重复、随机和局部控制的三原则,所以是一种比较合理的方法。完全随机区组中的“完全”二字是为了和某些在一个重复内可分成若干个不完全区组的特种设计相区别的。
一、单因素随机区组试验结果的分析设随机区组试验有k个处理,n个区组,则其自由度和平方和的分解式如下:
 (8.17)
总自由度=区组自由度+处理自由度+误差自由度
 (8.18)
总平方和=区组平方和+处理平方和+误差平方和上式中,x表示各小区产量(或其他性状),表示区组平均数,表示处理平均数,表示全试验平均数。
[例8.6] 有一小麦品比试验,共有A、B、C、D、E、F、G、H8个品种(k=8),其中A是标准品种,采用随机区组设计,重复3次(n=3),小区计产面积22.2m2,其产量结果列于表8.19,试作分析。
1.结果整理 首先将各品种在各区组的小区产量相加得Ti(用于求品种的平方和SSt),再除以n得;将各区组的各品种小区产量相加得Tj,(用于求区组的平方和SSr)再除以k得,将全试验各小区产量相加得T,再除以nk得。
2.自由度和平方和的分解表8.19 小麦品比试验(随机区组)的产量结果(kg)
区组品种
I
II
III


A
B
C
D
E
F
G
H
10.9
10.8
11.1
9.1
11.8
10.1
10.0
9.3
9.1
12.3
12.5
10.7
13.9
10.6
11.5
10.4
12.2
14.0
10.5
10.1
16.8
11.8
14.1
14.4
32.2
37.1
34.1
29.9
42.5
32.5
35.6
34.1
10.7
12.4
11.4
10.0
14.2
10.8
11.9
11.4

83.1
91.0
103.9
278.0(T)

10.4
11.4
13.0
11.6()
(1)自由度的分解:由8.17式可得

(2)平方和的分解

 (8.19)
 (8.20)
 (8.21)
 (8.22)
3.方差分析表和F测验将上述计算结果列入表8.20,并由各S除以相应的DF进而算得各变异来源的MS值。
表8.20 表8.19结果的方差分析变异来源
DF
SS
MS
F
F0.05
区组间品种间误 差
2
7
14
27.56
34.08
22.97
13.78
4.87
1.64
8.40*
2.97*
3.74
2.77
总变异
23
84.61
F测验结果表明,区组间的F值显著。因在通常情况下,区组间变异不是试验研究的对象,设置区组只是局部控制的手段以减少试验误差。区组变异显著,表明局部控制起到了明显降低试验误差的作用。区组变异不显著,则表明局部控制对降低试验误差没有显著效果。所以区组的F测验是不必进行的。品种间的F值显著,说明品种的生产能力有差异,但是,到底哪些品种间有显著差异?哪些品种间没有显著差异?则需进一步作多重比较才能明了。
4.品种间比较
(1)t测验(DLSD法):如果目的是要测验各供试品种是否与标准品种A有显著差异,则宜应用DLSD法。首先应算得品种间差数的标准误。
①在以各品种的小区平均产量作比较时,差数标准误为
 (8.23)
并有
 (8.24)
②如果以各品种的小区总产量作比较,则因总产量大n倍,故差数标准误为
 (8.25)
并有
 (8.26)
③如果试验结果最后需以亩产量表示,则只要将总产量和总产量的DLSD皆乘以cf即可。
8.23~8.26式中,为方差分析表中的误差项均方MSe;Dt值的ve=(n-1)(k-1),即误差项自由度。凡品种与对照的差异达到或超过DLSD0.05者为显著,达到或超过DLSD0.01者为极显著。
在此,我们如以各品种的小区平均产量(即表8.19的)进行比较,则

查附表7,当p=7,ve=14时,Dt0.05=3.10,Dt0.01=3.92,故

如对各品种的三个小区总产量(表8.19的Ti)进行比较,则

如以亩产量表示试验结果,则可算得化各品种总产量为亩产量的改算系数

因此, 品种A的亩产量=TA×cf=32.2×10=322(kg)
品种B的亩产量=TB×cf=37.1×10=371(kg)
……,余类推并且有

上述结果皆列于表8.21。由表8.21可见,不论哪一种比较,结果都完全一样,只有E品种对照有显著的差异,其余品种都和对照没有显著差异。
在实际应用时,仅需选择上述3种比较的任一种。
表8.21 表8.19资料各品种产量和对照相比的差异显著性品 种
的比较
Ti的比较
亩产量的比较

差 异
Ti
差 异
kg/亩
差 异
E
B
G
H
C
F
A(CK)
D
14.2
12.4
11.9
11.4
11.4
10.8
10.7
10.0
3.5*
1.7
1.2
0.7
0.7
0.1

-0.7
42.5
37.1
35.6
34.1
34.1
32.5
32.2
29.9
10.3*
4.9
3.4
1.9
1.9
0.3

-2.3
425
371
356
341
341
325
322
299
103*
49
34
19
19
3

-23
*显示差异显著性达5%水平。
(2)新复极差测验(LSR法):如果我们不仅要测验各品种和对照相比的差异显著性,而且要测验各品种相互比较的差异显著性,则宜应用LSR法。首先,应算得品种的标准误SE,这个SE在小区平均数的比较时为
 (8.27)
在小区总数的比较时为
 (8.28)
在亩产量的比较时为
 (8.29)
然后,查附表8,当ve=(n-1)(k-1)时,p自2至k的SSR0.05和SSR0.01值,进而算得LSR0.05和LSR0.01值
  (8.30)
上式的LSR0.05和LSR0.01即为测验各种p时极差显著的尺度。
在本例如以小区平均数为比较标准,则有

查附表8,ve=14,p=2时, SSR0.05=3.03,SSR0.01=4.21,故
LSR0.05=0.74×3.03=2.24(kg)
LSR0.01=0.74×4.21=3.12(kg)
p=3时,SSR0.05=3.18,SSR0.01=4.42,故
LSR0.05=0.74×3.18=2.35(kg)
LSR0.01=0.74×4.42=3.27(kg)
p=4、5、…时,可以类推,以此应一直求至p=k=8时为止。将全部结果录入表8.23。
表8.22 表8.19资料新复极差测验的最小显著极差
p
2
3
4
5
6
7
8
SSR0.05,14
SSR0.01,14
LSR0.05,14
LSR0.01,14
3.03
4.21
2.24
3.12
3.18
4.42
2.35
3.27
3.27
4.55
2.42
3.37
3.33
4.63
2.46
3.43
3.37
4.70
2.49
3.48
3.39
4.78
2.51
3.54
3.41
4.83
2.52
3.57
5.试验结论根据表8.22尺度,即可测验各品种小区平均产量的差异显著性于表8.23。结果表明:E品种与H、C、F、A、D5品种有5%水平上的显著性,E品种与D品种有1%水平上的显著性,其余各品种之间都没有显著差异。
表8.23 表8.19资料的新复极差测验品 种
产量()
差异显著性
5%
1%
E
B
G
H
C
F
A
D
14.2
12.4
11.9
11.4
11.4
10.8
10.7
10.0
a
ab
ab
b
b
b
b
b
A
AB
AB
AB
AB
AB
AB
B
以上是以各品种的小区平均产量为比较标准。如以各品种总产量或亩产量为比较标准,则只要应用由8.28或8.29式算出的SE值即可,方法类同,不再赘述。
二、随机区组的线性模型与期望均方
1.线性模型一个随机区组的试验结果,若以i代横行(处理),则i=1,2,…,k;以j代纵行(区组),则j=1,2,…,n,整个资料共有k行n列。所以,在第i行j列的方格可以ij表示之(参见表8.19)。如果每一方格内仅有一个观察值xij,则其线性模型为:
 (8.31)
上式中,为全体平均,为行的效应或处理效应,为列的效应或区组效应,而则为随机误差,是从的总体中抽得的。
在一个样本中,用估计,处理效应用t估计,区组效应用b估计,则处理效应和区组效应均用离均差来表示时为:
,并具有限制为。因而8.31式中(
)的估计值为

而的估计值则为:

2.期望均方随机区组的各种效应一般有3种模型(参见第7章),即固定模型(也称模型I),随机模型(也称模型II)和混合模型。这3种模型的期望均方(EMS)列于表8.24。
表8.24 随机区组设计的期望均方变异来源
DF
固定模型
(区组、处理均固定)
随机模型
(区组、处理均随机)
混 合 模 型
(区组随机,
处理固定)
(区组固定,
处理随机)
区组间处理或品种间试验误差
(n-1)
(k-1)
(n-1)(k-1)




从上表可以了解显著性测验时应该采用那种形式的均方比。如果随机区组中仅有两个或较少的处理或品种,则固定模型是合适的。因为这些处理或品种往往是比较有希望的,因而选来做试验,它们并不是从所有处理或品种总体中随机抽出的。因此处理品种效应是固定的;同样区组效应也是固定的。从这类试验所得的关于处理或品种和区组的推断,则仅仅局限于本试验范围内,不能应用于其他处理或品种或其他地区。假定处理或品种和区组没有互作,则处理或品种与区组均方均可和试验误差均方进行对比,作出假设测验。
如果随机区组试验是随机模型,则表示处理或品种和区组都是从处理或品种总体和区组总体中随机抽样的。试验结论则推断到有关处理或品种和区组总体,而不是仅涉及某一特定处理或特定品种。这时,试验误差均方仍然适用于测验处理或品种和区组的效应。
一般的随机区组试验,如品比试验,往往假定品种效应是固定的,而区组效应则是随机的。因为所试验的品种不仅是适用于该地区区组,而且也可以推广到其他地区。这样的随机区组试验就属于混合模型。凡采用这一模型的随机区组试验,必须注意所用地区区组的广泛代表性,例如在土壤、气候、耕作制度等等方面都要有广泛的代表性。这样所得的试验结论,才能起真实推断的作用。
三、随机区组的缺区估计和结果分析
在试验中,由于某些意外原因造成了某些小区缺失产量或其他性状的数据,缺失的这种观测值就称为缺值。试验若发生缺值,试验结果就丧失均衡性,方差分析就不能正常进行。解决这种困难,可根据一定的统计原理,估计出缺值的最可能值(最可信值),并以之代替缺值参加分析。一般地说,估计个别缺值尚属可行。如有较多缺值,则缺值估计并不可靠,因此,缺值估计是一种不得已的补救办法,试验应尽量避免缺失,在缺值较多时,可考虑重做试验或弃去缺值较多的处理或区组。
缺值估计的基本原理是应满足缺值的误差=0的条件。由前面介绍已知。
随机区组试验的误差表达式为:

故缺值需满足
=0
即  (8.32)
上式的n=区组数,k=处理数,= 不包括缺区的缺区处理总和,=不包括缺区的缺区区组总和,=不包括缺区的全试验总和。将上式移项可得
 (8.33)
1.随机区组试验缺一个小区产量的结果分析
[例8.7] 有一玉米栽培试验,缺失一区产量x(kg),其结果如表8.25,试作分析。
表8.25 玉米随机区组试验缺一区产量(kg)的试验结果处 理
I
II
III
IV

A
B
C
D
E
F
27.8
30.6
27.7
16.2
16.2
24.9
27.3
28.8
22.7
15.0
17.0
22.5
28.5
x
34.9
14.1
17.7
22.7
38.5
39.5
36.8
19.6
15.4
26.3
122.1
98.9+x
122.1
64.9
66.3
96.4

143.4
133.3
117.9+x
176.1
570.7+x
如将表8.25中有关数值代入8.33式中,得

将33补入缺值位置得表8.26,对其进行方差分析时应注意:
(1)因为x=33是一个误差为零的理论值,它不占有自由度,所以误差项和总变异项的自由度都要比常规的少一个,由此得到的方差分析表如表8.27。
(2)在多重比较时,具有缺值的处理,由于其实际重复数减少,有较大的误差,应进行矫正,一般用t测验。
对于非缺值处理间的比较,其仍由8.23式算出(假定以小区平均产量作为标准)
对于缺值处理和非缺值处理间的比较,则
 (8.34)
8.34式的为误差项均方,n为区组数,k为处理数。在本例可求得

表8.26 玉米随机区组试验结果(含一补上的缺区)
处 理
I
II
III
IV

A
B
C
D
E
F
27.8
30.6
27.7
16.2
16.2
24.9
27.3
28.8
22.7
15.0
17.0
22.5
28.5
(33.0)
34.9
14.1
17.7
22.7
38.5
39.5
36.8
19.6
15.4
26.3
122.1
131.9
122.1
64.9
66.3
96.4

143.4
133.3
150.9
176.1
603.7
表8.27 玉米栽培试验(缺一区)的方差分析变异来源
DF
SS
MS
F
F0.05
区 组处 理误 差
3
5
14
166.84
1 093.20
142.44
218.64
10.17
21.50
2.66
总 变 异
22
1 402.48
2.随机区组试验的缺两个小区产量的结果分析
[例8.8] 有一水稻栽培试验,假定缺失两区产量(x和y),其结果如表8.28分析。
表8.28 水稻随机区组试验缺两区产量(kg/小区)的试验结果处理
I
II
III
IV
V
VI

A
B
C
8
9
16
14
11
17
12
10
14
8
7
12
16
11
x
y
9
13
58+y
57
72+x

33
42
36
27
27+x
22+y
187+x+y
首先,应估计出缺值x和y。采用解方程法,根据8.32式,对x有方程

对y有方程

以上两方程组成二元一次联立方程,整理后有

解之得:x=18.09(kg),y=10.09(kg)
将x=18(kg),y=10(kg)置入表8.28中,即得表8.29。对表8.29进行方差分析时应注意:
(1)表8.29资料有两个缺区估计值,它们不占有自由度,故表8.30中误差项和总变异的自由度均比通常的少二个。
表8.29 水稻随机区组试验结果处理
I
II
III
IV
V
VI

A
B
C
8
9
16
14
11
17
12
10
14
8
7
12
16
11
(18)
(10)
9
13
68
57
90

33
42
36
27
45
32
215
表8.30 水稻机区组试验(缺二区)的方差分析变异来源
DF
SS
MS
F
F0.05
区 组处 理误 差总变异
5
2
8
15
74.28
94.11
18.56
186.95
47.06
2.32
20.28
3.68
(2)在进行处理间比较时,非缺区处理间比较的差数标准误仍由8.23式给出(当以各处理小区平均数相比较时);若相互比较的处理中有缺区的,则其平均数差数的标准误为
 (8.35)
8.35式中的为误差项均方,n1和n2分别表示两个相比较处理的有效重复数,其计算方法是:在同一区组内,若两处理都不缺区,则各记为1;若一处理缺区,另一处理不缺区,则缺区处理0,不缺区处理记(k-2)/(k-1),其中k为试验的处理数目。
例如,本试验在A和B比较时
A的有效重复数

B的有效重复数

故 
在A和C比较时
A的有效重复数

C的有效重复数

故 
第四节 单因素拉丁方试验资料的方差分析
田间土壤的差异,纵横两个方向都有。前述的随机区组设计,虽然可以分析出区组间一个方向的土壤差异,但另一个方向的土壤差异(即区组内的土壤差异),还无法分析出来,因此,随机区组设计的试验误差内还含有区组内小区间的一部分土壤差异。拉丁方设计的优点是能将任意方向的土壤差异从误差项中再划分出来,因而能够进一步减少试验误差,提高试验的精确性。
一、拉丁方试验结果的分析拉丁方试验在纵横两个方向都应用了局部控制,使得纵横两向皆成区组。因此在试验结果的统计分析上要比随机区组多一项区组间变异。设有k个处理(或品种)作拉丁方试验,则必有横行区组和纵行区组各k个,其自由度和平方和的分解式为
 (8.36)
总自由度=横行自由度+纵行自由度+处理自由度+误差自由度

(8.37)
总平方和=横行平方和+纵行平方和+处理平方和+误差平方和
上式中,x表示各小区产量(或其他性状),表示横行区组平均数,表示纵行区组平均数,表示处理平均数,表示全试验平均数。
[例8.9] 有A、B、C、D、E5个水稻品种作比较试验,其中E为标准品种,采用5×5拉丁设计,其田间排列和产量结果见表8.31,试作分析。
表8.31 水稻品比5×5拉丁试验的产量结果(kg)
纵 行 区 组

I
II
III
IV
V
横行区组
I
D
37
A
38
C
38
B
44
E
38
195
II
B
48
E
40
D
36
C
32
A
35
191
III
C
27
B
32
A
32
E
30
D
26
147
IV
E
28
D
37
B
43
A
38
C
41
187
V
A
34
C
30
E
27
D
30
B
41
162
Tc
174
177
176
174
181
882(T)
表8.32 表8.31资料的Ti和
品 种


A
B
C
D
E
38+35+32+38+34=177
44+48+32+43+41=208
38+32+27+41+30=168
37+36+26+37+30=166
38+40+30+28+27=163
35.4
41.6
33.6
33.2
33.6
1.结果整理首先,在表8.31算得各横行区组总和Tr和各纵行区组总和Te,并得全试验总和T=288。再在表8.32算得各品种的总和Ti和小区平均产量。
2.自由度和平方和的分解
(1)自由度的分解:由8.36式可得

(2)平方和的分解

 (8.38)



 (8.39)

 (8.40)


 (8.41)

3.方差分析表和F测验将上述结果列入8.33,并由各SS除以相应的DF进而算得各变异来源的MS值。
表8.33 表8.31资料的方差分析变异来源
DF
SS
MS
F
F0.05
横行区组纵行区组品 种试验误差
4
4
4
12
348.64
6.64
271.44
188.32
67.86
15.69
4.32
3.26
总 变 异
24
815.04
对品种间作F测验,在此有:、、…、不相等(、、…、分别代表A、B、…、E品种的总体平均数)得F=67.86/15.69=4.32,超过水平的F值,所以H0应被否定,即各供试品种的产量是有显著差异存在的。
4.品种平均数间的比较
(1)t测验(DLSD法),应用8.23与8.24式,在此有

查附表7,当p=4,v=12时,Dt0.05=2.88,Dt0.01=3.76,故

表8.34 表8.31资料各品种与标准品种相比的差异显著性品 种
小区平均产量(kg)
差 异
B
A
C
D
E(CK)
41.6
35.4
33.6
33.2
32.6
9.0*
2.8
1.0
0.6

以上为尺度,在表8.34测验各品种对标准品种(E)的差异显著性。结果只有B品种的产量显著地高于对照,其余品种皆与对照无显著差异。
(2)新复极差测验(LSR法):根据8.27式计算,求得

再根据v=12时的SSR0.05和SSR0.01的值算得p=2,3,4,5时的LSR0.05和LSR0.01的值于表8.35。根据表8.36的LSR0.05和LSR0.01的尺度,测验各品种小区平均产量的差异显著性于表8.36。
表8.35 表8.31资料各品种小区平均产量()互比时的LSR值
p
2
3
4
5
SSR0.05
SSR0.01
LSR0.05,12
LSR0.01,12
3.08
4.32
5.45
7.64
3.23
4.55
5.72
8.03
3.33
4.68
5.89
8.28
3.36
4.76
5.95
8.43
表8.36 水稻品比试验的新复极差测验品 种
小区平均产量()
差异显著性
5%
1%
B
A
C
D
E
41.6
35.4
33.6
33.2
32.6
a
b
b
b
b
A
AB
AB
B
B
5.试验结论由表8.36可见,B品种与其他各品种的差异都达到水平,而B品种与D、E品种的差异达到水平,A、C、D、E4品种之间则无显著差异。
二、拉丁方的线性模型与期望均方
假定以xij代表拉丁文的i横行、j纵行的交叉观察值,再以t代表处理,则拉丁方试验的线性模型为
 (8.42)
上式的应是独立的随机误差、并作正态分布,才能用来进行正确的假设测验。如果处理与纵行或横行区组有交互作用存在,则交互作用与误差相混杂,不能得到确切的误差估计,难以进行确切的测验。不过,只要土壤差异不太大,一般假定不存在互作。
拉丁方设计的固定模型和随机模型的期望均方如表8.37。
表8. 37 拉丁方设计的期望均方变异来源
DF
固定模型
随机模型
横行间纵行间处理间试验误差
k-1
k-1
k-1
(k-1)( k-2)


上表中没有写出混合模型,因为知道了固定模型和随机模型后,混合模型是可以方便地写出的。例如,要将横行由固定改为随机,则只要将改为即可。
三、拉丁方试验的缺区估计和结果分析拉丁方试验的缺区估计原理和随机区组试验一样。由拉丁方的线性模型,误差的估计值为。缺值的最佳估计值,其条件为,即
 (8.43)
式中的、、和依次分别为缺区所在的横行区组、纵行区组、处理和全试验的总和。为简单计,以x代,将上式移项可得
 (8.44)
当仅有一个缺区时,可由8.43或8.44式直接解得x值;当有多个缺区时,可由8.43式建立联立方程组,解出各个缺区估计值。
[例8.10] 有一甘蔗品种试验,采用5×5拉丁方设计,缺失一区产量,其结果见表8.38,试求该缺区估计值x并作分析。
表8.38 5×5甘蔗试验缺失一区产量的试验结果 (单位:kg/区)
纵 行 区 组

I
II
III
IV
V
横行区组
I
II
III
IV
V
A 14
D 19
B 23
C 21
E 23
E 22
B 21
A 15
D (x)
C 16
D 20
A 16
C 20
E 24
B 23
C 18
E 23
D 18
B 21
A 17
B 25
C 18
E 23
A 17
D 20
99
97
99
83+x
99

100
74+x
103
97
103
477+x
首先求缺区估计值x。将表8.38的有关数值代入8.43式可得

即 12x=216

同样,代入8.44式得
将x=18置入表8.38的x地位,得表8.39。
表 8.39可象没有缺区的拉丁方资料一样作出方差分析,仅仅是误差项和总变异项的自由度比没有缺区的拉丁方资料少一个;因为有一个缺区估计值,它不占有自由度。由此所得的结果列于表8.40。
表8.39 5×5甘蔗试验缺失一区产量的试验结果 (单位:kg/区)
纵 行 区 组

I
II
III
IV
V
横行区组
I
II
III
IV
V
A 14
D 19
B 23
C 21
E 23
E 22
B 21
A 15
D (18)
C 16
D 20
A 16
C 20
E 24
B 23
C 18
E 23
D 18
B 21
A 17
D 25
C 18
E 23
A 17
D 20
99
97
99
101
99

100
92
103
97
103
495

A=79
B=113
C=93
D=95
E=115

15.8
22.6
18.6
19.0
23.0
表8.40 甘蔗5×5拉丁方试验(缺一区)的方差分析变异来源
DF
SS
MS
F
F0.05
横 行纵 行品 种误 差
4
4
4
11
1.6
17.2
180.8
20.4
0.40
4.30
45.20
1.85
24.43
3.36
总 变 异
23
220.0
在对各品种的小区平均数作t测验时,没有缺区品种间的比较仍用8.23式;但当缺区品种与非缺区品种比较时,其差数标准误差应为
 (8.45)
如在本例中
 (8.46)
以上是有一个缺区的拉丁方试验的分析。如果拉丁方试验有几个缺区,则首先应算得各个缺区的估计值。这些估计值可由8.43式建立联立方程解出。算得各缺区估计值后,可按正常(没有缺区的)拉丁方资料计算各变异来源的平方和,但误差项和总变异项的自由度要比正常的少l个(l为缺区数目)。在对各处理小区平均数作t测验时,没有缺区的处理间比较的差数标准误仍由8.23式给出;若相互比较的处理中有缺区存在,则其平均数差数的标准误为
 (8.47)
(8.47)式中的为误差项均方,n1和n2分别代表两个相互比较的处理的有效重复数,其计算方法是:(1)若相互比较的甲、乙二处理在横行和纵行皆不缺一区,则分别记1;(2)若甲处理不缺区,而其所在的横行或纵行的乙处理缺一区,则甲记2/3;(3)若甲处理不缺区,而其所在的横行和纵行的乙处理皆缺区,则甲记1/3;(4)若甲处理本身为缺区,则记0。例如,有一5×5拉丁方试验为
A E D C B
D B A E C
B A C D E
C D E B (A)
E C B A (D)
以上有括号者表示缺区。则有B、C、E处理间比较时,其用8.23式,其余各处理相互比较都要先计算有效重复数,再代入8.47式计算。
如:A与E比较时,
A的有效重复数n1=1+1+1+0+1=4
E的有效重复数n2=

而A与D比较时,
A的有效重复数n1=
D的有效重复数n2=

其余类推。
习 题
8.1 为什么对比法和间比法试验不能正确地估计试验误差?对比法和间比法的试验结果如何分析?有何异同?
8.2 完全随机设计、随机区组设计和拉丁方设计的试验结果如何分析?有何异同?在处理间相互比较时,以小区平均数、处理总数或亩产量进行比较的标准误有何关系?DLSD法与LSR法有何异同?完全随机、随机区组和拉丁方试验的线性模型及期望均方各包括哪些分量?
8.3 如何估计随机区组试验和拉丁方试验的缺区产量,两者有何异同?估计原理有何根据?
8.4 左下表为大豆品种比较试验的产量结果(kg),对比法设计,小区计产面积为100m2,试作分析。最后结果用每亩产量(kg)表示。
8.5 右下表为水稻品系比较试验的产量结果(kg),间比法设计,小区计产面积6.7(m2),试作分析。
品种
重复I
重复II
重复III
品 系
重复I
重复II
重复III
重复IV
CK
A
B
CK
C
D
CK
E
F
CK
40.6
40.1
38.0
31.4
41.4
43.2
35.5
41.3
34.6
38.2
39.9
36.8
39.9
33.6
35.5
36.2
32.8
29.8
29.7
32.3
33.5
34.6
33.9
29.4
33.7
31.2
27.7
25.6
37.2
29.6
CK
A
B
C
D
CK
E
F
G
H
CK
7.9
7.0
6.9
6.2
6.0
6.9
7.0
6.6
7.1
6.1
7.1
7.4
6.9
6.7
6.6
6.0
7.1
7.2
6.7
7.5
6.2
7.3
7.2
6.3
6.6
6.0
5.8
6.8
7.4
6.4
7.2
6.5
7.5
7.2
6.9
7.1
6.7
6.1
6.7
7.0
6.6
7.6
6.6
7.2
8.6 下表为小麦栽培试验的产量结果(kg),随机区组设计,小区计产面积为6.7m2,试作分析。在表示最后结果时需化为每亩产量(kg)。
处 理
I
II
III
IV
A
B
C
D
E
F
6.2
5.8
7.2
5.6
6.9
7.5
6.6
6.7
6.6
6.8
7.2
7.8
6.9
6.0
6.8
5.4
7.0
7.3
6.1
6.3
7.0
6.0
7.4
7.6
8.7 下表为水稻品种比较试验的产量结果(kg),5×5拉丁方设计,小区计产面积22.2m2,试作分析。
B
25
E
23
A
27
C
28
D
20
D
22
A
28
E
20
B
28
C
26
E
18
B
25
C
28
D
24
A
25
A
26
C
26
D
22
E
19
B
24
C
23
D
23
B
26
A
33
E
20
8.8 左下表为玉米播期试验结果,缺失一区产量(kg),右下表为油菜品比试验结果,缺失二区产量(kg),皆为随机区组设计,试计算缺区的估计值。
播 期
I
II
III
品 种
I
II
III
IV
A
B
C
D
E
F
G
20.3
19.8
18.4
16.0
15.2
14.9
14.0
22.1
19.0
16.8
16.6
14.9
15.9
x
20.7
18.6
17.4
18.1
15.3
14.0
15.3
A
B
C
D
E
F
3.9
5.8
4.4
5.5
6.8
7.3
3.9
6.3
4.4
x
6.9
7.2
3.6
5.9
5.6
5.4
7.4
7.5
y
6.8
4.5
6.7
6.0
7.0
8.9 下表为水稻栽培试验的小区产量(kg)结果,5×5拉丁方设计,缺失一区产量,试予估计。
B
14
E
15
C
25
A
12
D
16
E
18
D
12
B
15
C
x
A
11
C
21
A
13
D
13
B
13
E
19
A
10
C
24
E
18
D
14
B
12
D
12
B
15
A
11
E
20
C
26
8.10 从3块稻田排出的水中各取3个水样,每水样分析含盐量2次,得结果如下:
稻田
1
2
3
水样
1
2
3
1
2
3
1
2
3
含盐量
(mg/l)
1.1
1.2
1.3
1.1
1.2
1.0
1.3
1.4
1.3
1.5
1.4
1.2
1.8
2.0
2.1
2.0
2.2
1.9
(1)试测验 ① 同一稻田不同水样的含盐量有无差别?② 不同稻田的含盐量有无差别?
(2)试写出该资料的线性模型与期望均方。