第九章 方差分析
第一节 方差分析的意义
当试验的 处理数目 K≥3 时,不能直接应用 t测验及 u测验
的两两测验方法进行平均数假设测验的原因有三,
1,当有 K个处理平均数时,将有 [k(k-1)]/2 个差数,
要对这诸多差数逐一进行比较测验,程序实为繁琐。
2,试验误差估计的精确度要受到损失。
3,两两测验的方法会随着 K的增加而大大增加犯 α 错误
的概率。
因此,当 处理数目 K≥3 时应该采用方差分析法。方差分
析的特点是将全部数据看成是一个整体,分析构成变量的变
异原因,进而 计算 不同变异来源的总体方差的估值。 然后

表 9-1 kn个观察值的单向分组资料的模式
处理 观察值 x 总和 Ti 平均
1
2


k
x11 x12 x13 … … … x1n
x21 x22 x 23 … … … x2n


xk1 xk2 xk3 … … … xkn
T1
T2


Tk


Σ xij T
ix
1x
2x
kx
x
x
注,i = 1,2,3,… … k ; j = 1,2,3,… … n
进行 F测验,判断各样本的总体平均数是否有显著差异,在
达到差异显著的基础上,再对两两样本的总体平均数间的
差异显著性作出判断。(看表 9-1解释)
第二节 方差分析的基本步骤及原理
(以单向分组资料为例,资料的整理模式见 9-1)
一、平方和与自由度的分解 C=T2/kn
总平方和 SST = ∑ x2- C 处理平方和 SSt = (∑T i2/n)- C
误差平方和 SSe = SST – SSt 总自由度 dfT = kn-1
处理自由度 dft= k-1 误差自由度 dfe = dfT – dft
此步骤分析的目的是要求出各个变因方差 S2的相应估计值 σ 2。
二,F测验
St2 = SSt / dft Se2 = SSe/ dfe
F = St2 / Se2
此步骤分析的目的是判断各个处理平均数之间是否存在显著差异。
三、多重比较
=TSS
此步骤分析的目的是在 F测验结果达到显著以后,进一步判断两两
处理平均数之间的差异显著性。
多重比较常用的方法有以下两种,
(一)保护性最小显著差数法,即 PLSD法。
步骤,1,根据 dfe 查出 tα 。
2,计算平均数差数标准误
3,计算显著尺度 PLSDα 值,
PLSDα = tα × 平均数差数标准误
4,将处理平均数由大到小排序,并依次求出各处理之间的差值,
将各差值均与 PLSDα 相比较,作出差异显著性判断。
PLSD0.01 > 平均数差值 ≥ PLSD0.05,则两处理平均数间差异为显著;
平均数差值 ≥ PLSD0.01,则两处理平均数间差异为极显著;
PLSD0.05 > 平均数差值,则两处理平均数间差异为不显著。
(二)最小显著极差法,即 LSR法。
包含有 SSR法和 q测验法,主要介绍 SSR法。 SSR法即邓肯氏新复极差法。
步骤,1,根据平均数秩次距 k和 dfe查出 SSRα 值。
2,计算平均数标准误。
3,计算各秩次距下的显著尺度 LSRα 或 Rα 值。
秩次距是指当平均数由大到小排序后,相比较的两个平均数之间(含这
两个平均数)包含的平均数个数。
4,将处理平均数由大到小排序,并依次求出各处理之间的差值,将各
差值与相应秩次距下的 Rα 相比较,作出差异显著性判断。同样有,
相应秩次距的 R0.01 > 平均数差值 ≥ 相应秩次距的 R0.05,则两处理平均
数间差异为显著;
平均数差值 ≥ 相应秩次距的 R0.01,则两处理平均数间差异为极显著;
相应秩次距的 R0.05 > 平均数差值,则两处理平均数间差异为不显著。
可将此方法求出的 Rα 以表表示更为清楚方便,见表 9-2。
表 9-2 各秩次距下的 Rα
上面介绍的是当试验各个处理的重复次数相等时进行方差分析的
方法。这种资料的分析例子可见教案例 9-1。
如果各处理的重复次数不相等,在分析过程中注意与上述方法仅
有的区别为以下三点,其余步骤完全相同(可见教案例 9-7)。
1,矫正数 C =T2/ ∑n i
2,处理平方和 SSt = ∑ (Ti2/ni)- C
3,以 n0代替 n进行平均数差数标准误和平均数标准误的计算。
n0 = ( 1/k-1)( ∑ ni- ∑n i2/ ∑n i)
K 2 3 4 … … …
SSR0.05
SSR0.01
R0.05
R0.01
四、方差分析的数学模型
(一)线性可加模型 (仍以上述单项分组资料为例)
方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模
型是指每一个观察值可以化分成若干个线性组成部分,它是分解平方和与
自由度的理论依据,即,
SST = SSt + SSe dfT = dft + dfe
因此该资料观察值的数学模型为,
xij = μ + τ i + ε ij
xij为任意观察值,μ 为总体平均数,τ i为处理效应,ε ij为误差
效应。
不同类型资料的线性可加模型是各不相同的。
(二)期望均方( EMS)
Se2的 EMS是 σ e2; St2的 EMS是 σ e2+n σ τ 2
∴ F = St2 / Se2 = (σ e2+n σ τ 2)/ σ e2
(三)固定模型和随机模型
在上述模型中,由于处理效应 τ i的不同又有 固定模型和随机模型的区
分。
固定模型是指 试验的各处理都抽自特定的处理总体,这些总体遵循
N(μ i,σ e2),因而处理效应 τ i =(μ i - μ )是固定的,我们分析的目的
就在于研究 τ i,如果重复做试验,所用的处理仍然是原来那些处理,而所
要测验的假设则是,H0,τ i =0或 H0,μ i = μ 对 HA,μ 1, μ 2, …
μ k不相等。 因此 我们的推断也仅限于供试处理的范围之内。
随机模型是指试验中的各处理皆是随机抽自 N(0,σ τ 2 )的一组随机样
本,因而处理效应 τ i是随机的,它会随试验的不同而不同。对于随机模型,
如果重复做试验,则必然是从总体 N(0,σ τ 2 )中随机抽取一组新的样本。
我们 分析 的目的不在于研究处理效应,而是在于研究的变异度,因此 我们的
推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。 所以 方
差分析要测验的假设是 H0,σ τ 2 =0对 HA,σ τ 2 > 0 。