第九章 方差分析
? 在工农业生产和科学研究中,经常遇到这样
的问题,影响产品产量、质量的因素很多,我们
需要了解在这众多的因素中,哪些因素对影响
产品产量、质量有显著影响,为此,要先做试验
,然后对测试的结果进行分析,方差分析就是分
析测试结果的一种方法,
? 在方差分析中,把在试验中变化的因素称为
因子,用 A,B,C,...表示 ;因子在试验中所取
的不同状态称为水平,因子 A的 r个不同水平用
A1,A2,...,Ar表示,
§ 1 单因子方差分析
§ 1.1 基本概念
为了 考察某个因素 A 对试验指标 ( 即随机变量 X)
的影响,在试验时,保持其他因素不变,而仅让因素 A
改变,这种试验称为单因子 ( 单因素 ) 试验, 设试验结
果如下表,
水平 观测值
A1 x11 x12,.,x1n1
A2 x21 x22 … x2n2
… … … … …
Ar xr1 xr2 … xrnr
? 例,为寻求适应本地区的高产油菜品种,今选了
五种不同品种进行试验,每一品种在四块试验田上
得到在每一块田上的亩产量如下,
品种
田块
A
1
A
2
A
3
A
4
A
5
1 256 244 250 288 206
2 222 300 277 280 212
3 280 290 230 315 220
4 298 275 322 259 212
? 我们要研究的问题是诸不同品种的平均亩
产量是否有显著差异,
? 试验的目的就是要检验假设
H0:μ 1=μ 2=μ 3=μ 4=μ 5
是否成立,若是拒绝,那么我们就认为这五种品种
的平均亩产量之间有显著差异 ;反之,就认为各品
种间产量的不同是由随机因素引起的,方差分析就
是检验假设的一种方法,
? 在本例中只考虑品种这一因子对亩产量的影响
,五个不同品种就是该因子的五个不同水平,由于
同一品种在不同田块上的亩产量不同,我们可以认
为一个品种的亩产量就是一个总体,在方差分析中
总假定各总体独立地服从同方差正态分布,即第 i
个品种的亩产量是一个随机变量,它服从分布
N(μ i,σ 2),i=1,2,3,4,5,
? 设在某试验中,因子 A有 r个不同水平
A1,A2,...,Ar,在 Ai水平下的试验结果 Xi服从正态
分布 N(μ i,σ 2),i=1,2,...,r,且 X1,X2,...,Xr间
相互独立,现在水平 Ai下做了 ni次试验,获得了 ni
个试验结果 Xij,j=1,2,...,ni这可以看成是取自 Xi
的一个容量为 ni的样本,i=1,2,...,r,
? 实际上,方差分析是检验同方差的若干正态总体
均值是否相等的一种统计方法,
? 在实际问题中影响总体均值的因素可能不止一
个,我们按试验中因子的个数,可以有单因子方差
分析,双因子分析,多因子分析等,例中是一个单因
子方差分析问题,
? 由于 Xij~N(μi,σ2),故 Xij与 μ i的差可以看成一个
随机误差 εij~N(0,σ2),这样一来,可以假定 Xij具有下
述数据结构式,
,,.,,,2,1,
1
11
ri
nnn
n
ii
r
i
i
r
i
ii
???
?? ??
??
???
??
? 为了今后方便起见,把参数的形式改变一下,并

称 μ 为一般平均,α i为因子 A的第 i 个水平的效应,
Xij= μi+ εij,i=1,2,...,r;j=1,2,...,ni
其中诸 εij~N(0,σ2),且相互独立,要检验的假设是
H0:μ1=μ2=…=μ r
? 在这样的改变下,单因子方差分析模型中的数
据结构式可以写成,
所要检验的假设可以写成,
iijiij njriX,.,,,2,1;,.,,,2,1,????? ???
0...,210 ??????? rH
? 为了导出检验假设的统计量,下面我们分析一
下什么是引起诸 Xij 波动的原因,
?
?
?
r
i
iin
1
0?
? 引起诸 Xij 波动的原因有两个,一个是假设 H0为
真时,诸 Xij的波动纯粹是随机性引起的 ;另一个可
能是假设 H0不真而引起的,因而我们就想用一个量
来刻划诸 Xij之间的波动,并把引起波动的两个原因
用另两个量表示出来,这就是方差分析中常用的平
方和分解法,
? ?
? ?
??
r
i
n
j
ijT
i
XXS
1 1
2)(
? ?
? ?
?
r
i
n
j
ij
i
X
n
X
1 1
1
其中
令之间的波动反映
之间的偏差平方和来与样本总平均通常用
.ij
ij
X
XX
§ 1.2 平方和分解公式
? ?? ?
? ?? ?
??????
r
i
n
j
iiij
r
i
n
j
ijT
ii
XXXXXXS
1 1
2
1 1
2 )..()(则
其中交叉乘积项
??? ?
??? ?
?????
ii n
j
iij
r
i
ii
r
i
n
j
iij XXXXXXXX
111 1
.)().(2).(.)(2
??
??
??
ii n
j
ij
i
i
n
j
iji XnXXX
11
1
.,.令
?? ?
?? ?
????
r
i
ii
r
i
n
j
iij XXnXX
i
1
22
1 1
).(.)(
0.).().(2
1
???? ?
?
ii
r
i
i XtXXX
).(.)(2).(.)(
1 11 1
2
1 1
2 XXXXXXXX
i
r
i
n
j
iij
r
i
n
j
i
r
i
n
j
iij
iii
??????? ? ?? ?? ?
? ?? ?? ?
.
).(.)(
1
22
1 1
为一个平方和分解式则

AET
r
i
iiA
r
i
n
j
iijE
SSS
XXnSXXS
i
??
???? ?? ?
?? ?
下面我们来看各式的意义
.,
1
1 1
称为总平均值是所有数据的平均值? ?
? ?
?
r
i
n
j
ij
i
X
n
X
.
,
1
.
1
为组平均值
称均值个总体中抽得的样本平是从第 iX
n
X
in
j
ij
i
i ?
?
?
).(,
,
)(
1 1
2
总离差平方和称为总偏差平方和指标
度的一个是描述全部数据离散程的离差平方和
值表示所有数据与总平均? ?
? ?
??
r
i
n
j
ijT
i
XXS
).(
,,
.)(
2
1 1
组内离差平方和偏差平方和
称为误差差反映了试验中的随机误的离差平方和
均值表示每个数据与其组平? ?
? ?
??
r
i
n
j
iijE
i
XXS
).(,
)(,
).(
1
2
组间离差平方和称为因子偏差平方和差异程度
均值之间的的不同水平因子反映了各总体平方和
值的离差表示组平均值与总平均
A
XXnS
r
i
iiA ?
?
??
§ 1.3 检验统计量的构造
.
),,(~,0...,2210
且相互独立
一切为真时当 ????? NXH ijn ????
2
1 1
2 )1()( SnXXS
r
i
n
j
ijT
i
???? ? ?
? ?
)1(~)1( 22
2
2 ?
?? nSnS T ?
??

.2 是全体样本的样本方差其中 S
对于各组样本有
2
1
2
,)1()( ii
n
j
iij SnXX
i
????
?
组样本的样本方差是第
组样本的样本容量是第其中
iS
in
i
i
2
因此
rinSn iii,,2,1),1(~)1( 22
2
???? ?
?
.,,,22221 相互独立且各组样本方差 rSSS ?
分布的可加性知及由 2
1
)1( ??
?
???
r
i
inrn
)(~
)1( 2
1
2
2
2 rn
SnS r
i
iiE ??? ?
?
?
??
.,...,,
,...,2,1),(~
...
)(~...
,,
,...,,,)1,0(
,...,,:)(
21
2
21
2
21
21
21
相互独立且


如果其自由度分别为线性组合的平方和
的是某些随机变量相互独立的
个为设分解定理柯赫伦
k
jj
k
k
j
nj
n
QQQ
kjfQ
nfff
nQQQ
f
XXXQN
nXXXC o c h ra n
?
????
???
?
?
.,,
)/(
)1/(
,
,0...:,
0
210
不真可以认为假设值过大时当也不应太大
从而的值不应太大
为真时故当假设异程度
均值之间的差反映的是因子不同水平由于
HF
rnS
rS
F
S
H
S
E
A
A
r
A
?
?
?
???? ???.
)1(~
,
)()1(1
2
2
222
相互独立与且
故有条件全部满足可知柯赫伦分解定理的
及由于
EA
A
EAT
SS
r
S
rnrn
SSS
?
???????
?
?
???
),1(~
)/(
)1/(
,0...:,
210
rnrF
rnS
rS
F
H
E
A
n
??
?
?
?
???? 为真时当由此可知 ???
.
,.
,,),1(
,,
0
01
下无显著差异间在显著性水平
认为因子各水平否则接受下有显著差异著性水平
认为因子各水平间在显拒绝假设时
当对给定的显著性水平按照显著性检验程序
?
?
?
?
H
HrnrF
F
??
?
?
? 一般,当 F>F0.01时,称因子的影响高度显著,记为
,**” ;当 F0.01>F≥F 0.05时,称因子的影响显著,记为
,*” ; 当 F< F0.05时,称因子无显著影响,即认为因
子各水平间无差异,
§ 1.4 检验过程
.,,
)/(
)1/(
1
1
1
1
,,
,
1 1
..
1
.
1
2
..
1
2
.
2
1
2
.
1 1
2
..
2
1 1
22
? ???
??
? ?? ?
? ???
??
? ?? ?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
????
??????
??????
r
i
n
j
ij
n
j
iji
r
i
i
E
A
EATE
A
r
i
i
i
r
i
i
i
A
r
r
i
n
j
ij
r
i
n
j
ijT
i
ii
ii
XTXXnn
rnS
rS
F
rnfSSS
rfT
nn
X
Xn
n
X
S
nfT
n
XXnXS
ni
为试验的总次数其中
可用下式则在具体计算时次个水平下试验了第
设在行的试验次数不等若因子的每一水平所进
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 S A r - 1 S A /(r - 1)
随机误差 S E n - r S E /( n - r)
总和 S T n - 1
F
等 重 复 试 验 计 算 表
各水平的试验号
水平
1 2 … t
和 x
i,
和平方 x
2
i,
1 x
11
x
12
… x
1t
2 x
21
x
22
… x
2t
… … … … …
r x
r1
x
r2
… x
rt
? 例,为寻求适应本地区的高产油菜品种,今选了
五种不同品种进行试验,每一品种在四块试验田上
得到在每一块田上的亩产量如下,
品种
田块
A
1
A
2
A
3
A
4
A
5
1 256 244 250 288 206
2 222 300 277 280 212
3 280 290 230 315 220
4 298 275 322 259 212
? 我们要研究的问题是诸不同品种的平均亩
产量是否有显著差异,
计算表
各水平的田块
品种
1 2 3 4
和 和平方
A
1
256 222 280 298 1056 1 1 1 5 1 3 6
A
2
244 300 290 275 1 1 0 9 1 2 2 9 8 8 1
A
3
250 277 230 322 1079 1 1 6 4 2 4 1
A
4
288 280 315 259 1 1 4 2 1 3 0 4 1 6 4
A
5
206 212 220 212 850 7 2 2 5 0 0
? 解,先列表计算
?? ?
?? ?
??
4
1
2
.
2
5
1
4
1
5 5 3 5 9 2 28.1 3 7 0 7 8 4)(
20
1
i
i
i j
ij xx
? ?? ?
? ?? ?
??
????
5
1
4
1
2
5
1
4
1
1 3 9 5 4 7 25 2 3 6
20,4,5
i j
ij
i j
ij
xx
ntr这里
2.246878.13707841395472 ???TS
7.131958.13707845535922
4
1 ????
AS
5.1 1 4 9 17.1 3 1 9 52.2 4 6 8 7 ????? ATE SSS
89.4)15,4(
06.3)15,4(
36.2)15,4(
99.0
95.0
90.0
?
?
?
F
F
F查表知
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 1 3 1 9 5, 7 4 3 2 9 8, 9 2 5
随机误差 1 1 4 9 1, 5 15 7 6 6, 1
总和 2 4 6 8 7, 2 19
4, 3 1 **
.
89.4)15,4(31.4)15,4(06.3 99.095.0
有显著差异所以不同品种的亩产量
因此 ????? FFF
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 S A r - 1 S A /(r - 1)
随机误差 S E n - r S E /( n - r)
总和 S T n - 1
F
不 等 重 复 试 验 计 算 表
各水平的试验号
水平
1 2 … t
i
和 x
i.
和平方 x
2
i.
1 x
11
x
12
… x
1 t i
2 x
21
x
22
… x
2 t i
… … … … …
r x
r1
x
r2
… x
r t i
例, 下面给出了随机选取的,用于计算器的四种
类型的电路的响应时间 (以毫秒计 ),
表, 电路的响应时间
类型 I 类型 II 类型 III 类型 IV
19 15
22
20
18
20 40
21
33
27
16 17
15
18
26
18
22
19
这里试验的指标是电路的响应时间, 电路类型为因素,
这一因素有四个水平,试验的目的是要考察各类型电
路对响应时间的影响,
设四种类型电路的响应时间的总体均为正态,
且各总体方差相同,但参数均未知, 又设各样本
相互独立,

分别以 ?1,?2,?3,?4记类型 I,II,III,IV四种电路响应
时间总体的平均值, 我们需检验 (?=0.05)
H0:?1=?2=?3=?4,
H1:?1,?2,?3,?4不全相等,
现在 n=18,s=4,n1=n2=n3=5,n4=3,
试验号 1 2 3 4 5 和 和平方
类型 I 19 15 22 20 18 94 8836
类型 II 20 40 21 33 27 141 19881
类型 III 16 17 15 18 26 92 8464
类型 IV 18 22 19 59 3481
ST,SA,SE的自由度依次为 17,3,14
44.714183868 9 9 2
18
2
24
1 1
2 ????? ??
? ?
? ? TxS
i
n
j
ijT
i
98.318
18
386
3
59)9214194(
5
1
18
22
222
24
1
2
???
?
?
?
?
?
?????? ??
?
?? T
n
XS
i i
i
A
46.395??? ATE SSS
表,方差分析表
方差来源 平方和 自由度 均方 F值 显著性
因素 318.98 3 106.33 3.76 *
误差 395.46 14 28.25
总和 714.44 17
因 F0.05(3,14)=3.34<3.76 <F0.01(3,14)=5.56,故认为各类
型电路的响应时间有显著差异,
§ 2 双因子方差分析
.),(
),(,,...,,,,...,,
,,
2
2121
分布独立地服从水平组合下的试验结果
在个不同水平取因子平
个不同水取因子有二个因子在变动设在某试验中
??
?
ij
jisr
N
BABBBsBAAA
rA
sj
r
ri
s
rs
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1
1;,...,2,1
1
1
,,
.
1
.
.
1
.
1 1
?????????
?????????
???
?
?
?
? ?
?
?
? ?
并令把参数改变一下为了研究方便
??
??
????
?
??
s
j
j
r
i
i
j
i
jB
iA
11
00
,
,,
它们满足关系式个水平的效应的第为因子
个水平的效应的第为因子为一般平均称
?
?
?
?
?
?
?
??
????
????????
????????
? ?
? ?
且相互独立
则如表所示并记结果为个组合各做一次试验
的每此时只需对型交互作用的方差分析模
为无则称这种方差分析模型若
),,0(~
,0,0
,,
),(.
,
2
1 1
N
X
X
BA
ij
r
i
s
j
ji
ijjiij
ij
ji
jiij
无 交 互 作 用 方 差 分 析 试 验 表
B 因子
B
1
B
2
… B
s
A
1
X
11
X
12
… X
1s
A
2
X
21
X
22
… X
2s
… … … … …
A


A
r
X
r1
X
r2
… X
rs
.
,;
,;
,
0...:
0...:
:
02
01
2102
2101
组合对结果无显著影响
的不同水平和因子则说明因子者均不拒绝
若二著影响的不同水平对结果有显为因子
则认若检验结果拒绝对结果有显著影响
的不同水平则认为因子若检验结果拒绝
假设有两个对这个模型所要检验的
BA
B
H
AH
H
H
s
r
???????
???????
?
????
???????
???????
???
???
?
?
?
?
? ?
?
?
? ?
X
sjX
riX
sjX
r
XXX
riX
s
XXX
X
rs
X
jjj
iii
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1,
,...,2,1,
,...,2,1,
1
,
,...,2,1,
1
,
1
:.
,
..
..
..
1
.
..
1
.
1 1
由此可知
为此先引进记号检验用的统计量
给出用分解平方和的思想来为了检验假设
其中
总的偏听偏信差平方和
BAE
s
j
j
r
i
i
r
i
s
j
jiij
r
i
s
j
ijT
SSS
XXrXXsXXXX
XXS
???
????????
??
?
??? ?
? ?
??? ?
? ?
1
2
.
1
2
.
1 1
2
..
1 1
2
)()()(
)(
? ?
? ?
????
r
i
s
j
jiijE XXXXS
1 1
2
.,)(
?
?
??
r
i
iA XXsS
1
2
,)(
?
?
??
s
j
jB XXrS
1
2
,)(
? SE表示试验的随机波动引起的误差,称为误差平方
和 ;SA除了反映了试验的随机波动引起的误差外,还
反映了因子 A的效应间的差异,称为因子 A的偏差平
方和 ; SB除了反映了试验的随机波动引起的误差外,
还反映了因子 B的效应间的差异,称为因子 B的偏差
平方和,
.
)1()(
,),,(~,
2
2
1 1
2
2
0201
的样本方差个样本是其中
故且相互独立一切为真时与当
ij
r
i
s
j
ijT
ij
XrsS
SrsXXS
NXHH
???? ? ?
? ?
??
)1(~1 22 ?rsS T ??故
)1()1()1)(1(1
1111
2222
????????
???
srsrrs
SSSS
BAET

由于
????
?
?
?
r
i
ii XXsNX
1
.
2
,),,(~ 且因
?
?
.,,,
)1()(
..2.1
2
2
1
2
.
的样本方差是其中
因此有
rA
A
r
i
i
XXXS
SrXX
?
????
?
)1(~
/
)1()1( 2
2
2
2
2
2 ?
???? r
s
SrSrsS AAA ?
???

)1(~
/
)1()1( 2
2
2
2
2
2 ?
???? s
r
SsSsrS BBB ?
???
同样有
))1)(1(,1(~,
))1)(1(,1(~,
:
))1)(1(,1(~
)1)(1/(
)1/(
))1)(1(,1(~
)1)(1/(
)1/(
,,
02
01
0201
???
???
???
??
?
?
???
??
?
?
srsFFH
srrFFH
srsF
srS
sS
F
srrF
srS
rS
F
HH
B
A
E
B
B
E
A
A
为真时在
为真时在
进一步可以证明
为真时可知在假设;,))1)(1(
,1(;,))1)(1(,1(
,,
02
1011
Hsr
sFFHsrrF
F
B
A
拒绝假设时
当拒绝假设时
当对给定的显著性水平按照显著性检验程序
??
?????
???
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
??
?
?
??????
????
????
????
?
?
? ?
?
?
? ?
)1)(1/(
)1/(
)1)(1/(
)1/(
)1)(1(
1
1
1
1
1
,
2
1
2
.
2
1
2
.
1 1
22
srS
sS
F
srS
rS
F
srfSSSS
sfXnX
r
S
rfXnX
s
S
rsfXnXS
E
B
B
E
A
A
EBATE
B
r
i
jB
A
r
i
iA
T
r
i
t
j
ijT
可用下式在具体计算时
无 交 互 作 用 方 差 分 析 计 算 表
B 因子 A 的
B
1
B
2
… B
s
x
i,
x
2
i,
A
1
x
11
x
12
… x
1s
A
2
x
21
x
22
… x
2s
… … … … …
A


A
r
x
r1
x
r2
… x
rs
x
.j
总和B

x
2
.j
? 具体计算时可用计算表和方差分析表,
无交互作用方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A S A r - 1 S A /(r - 1) F A
因子 B S B s - 1 S B /( s - 1) F B
误差 S E (r - 1 )(s - 1) S e / (r - 1 )( s - 1)
总和 S T rs - 1
? 一般,当 F>F0.01时,称因子的影响高度显著,记为
,**” ;当 F0.01>F≥F 0.05时,称因子的影响显著,记为
,*” ; 当 F< F0.05时,称因子无显著影响,即认为因
子各水平间无差异,
? 例,为了考察蒸馏水的 pH值和硫酸铜溶液浓度对
化验血清中白蛋白与球蛋白的影响,对蒸馏水的 pH
值 (A)取了 4个不同水平,对硫酸铜溶液浓度 (B)取了
3个不同水平,在不同水平组合 (Ai,Bj)下各测一次白
蛋白与球蛋白之比,其结果列于计算表的左上角,试
检验两因子对化验结果有无显著差异,

计算表
B A A
1
A
2
A
3
A
4
和 平方和
B
1
3, 5 2, 6 2, 0 1, 4 9, 5 9 0, 2 5
B
2
2, 3 2, 0 1, 5 0, 8 6, 6 4 3, 5 6
B
3
2, 0 1, 9 1, 2 0, 3 5, 4 2 9, 1 6
和 7, 8 6, 5 4, 7 2, 5 2 1, 5 1 6 2, 9 7
平方和 6 0, 8 4 3 0, 2 5 2 2, 0 9 6, 2 5 1 3 1, 4 3
26.0
22.252.3897.162
4
1
29.552.3843.131
3
1
77.752.3829.46
52.38)(
12
1
,29.46
12,3,4
2
4
1
3
1
4
1
3
1
2
????
????
????
???
??
?????
? ?? ?
? ?? ?
BATE
B
A
T
i j
ij
i j
ij
SSSS
S
S
S
xx
rsnsr这里
方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A 5,2 9 3 1,7 6 4 0, 9 **
因子 B 2,2 2 2 1, 1 1 2 5, 8 **
误差 0,2 6 6 0,0 4 3
总和 7,7 7 11
查 F-分布表得,F0.05(3,6)= 4.76,F0.05(2,6)= 5.14,
F0.01(3,6)=9.78,F0.01(2,6)=10.9,
由此可知 FA> F0.01(3,6); FB> F0.01(2,6).所以因子 A及
因子 B的不同水平对化验结果有高度显著影响,
.),(
),(,,...,,,,...,,
,,
2
2121
分布独立地服从水平组合下的试验结果
在个不同水平取因子平
个不同水取因子有二个因子在变动设在某试验中
??
?
ij
jisr
N
BABBBsBAAA
rA
sj
r
ri
s
rs
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1
1;,...,2,1
1
1
,,
.
1
.
.
1
.
1 1
?????????
?????????
???
?
?
?
? ?
?
?
? ?
并令把参数改变一下为了研究方便
§ 3 有交互作用的双因子方差分析
§ 3.1 模型
?
?
?
?
???
???
?????????
????????
s
j
ij
r
i
ij
jiijij
jiij
ri
sj
jBiA
1
1
,...,2,1,0
,...,2,1,0
,
,
它们满足关系式效应
个水平的交互的第个水平与因子的第为因子
则称若
??
??
????
?
??
s
j
j
r
i
i
j
i
jB
iA
11
00
,
,,
它们满足关系式个水平的效应的第为因子
个水平的效应的第为因子为一般平均称
tksjri
N
X
X
ttBA
i j k
s
j
ij
r
i
ij
r
i
s
j
ji
i j kijjii j k
i j k
ji
,...,2,1;,...,2,1;,...,2,1
),,0(~
,0,0
,0,0
:
,
,)2(),(
,
2
11
1 1
???
?
?
?
?
?
?
?
?
?
?
?
??
????
????
??????????
?
?
??
? ?
??
? ?
且相互独立

析模型则有交互作用的方差分如表所示结果为
并记次试验水平组合下至少要做在
那么结果是否有显著影响为了研究有交互效应对
有 交 互 作 用 方 差 分 析 试 验 表
B 因子
B
1
B
2
… B
s
A
1
X
11 1
,…,X
11 t
X
12 1
,…,X
12 t
… X
1s 1
,…,X
1s t
A
2
X
21 1
,…,X
21 t
X
22 1
,…,X
22 t
… X
2s 1
,…,X
2s t
… … … … …
A


A
r
X
r1 1
,…,X
r1 t
X
r2 1
,…,X
r2 t
… X
rs 1
,…,X
rs t
,,,0:
0...:
0...:
:
03
2102
2101
jiH
H
H
ij
s
r
???
???????
???????
? 设为对此模型要做的检验假
§ 3,2 平方和分解
? ? ?
? ? ?
?
r
i
s
j
t
k
i j kX
n
X
1 1 1
1
其中 n=rst
? 仍然用平方和分解的思想来给出检验用的统计
量,先引入下述记号,
sjX
rt
XXX
riX
st
XXX
sjriXXXX
ij
r
j
t
k
i j kj
ii
s
j
t
k
i j ki
ijtij
t
k
i j ki
,...,2,1..,
1
..,..
,...,2,1..,
1
..,..
,...,2,1;,...,2,1.,.,..
1 1
1 1
1
1
???
???
????
? ?
? ?
?
? ?
? ?
?
....
....
..
jjj
iji
ijijjiij
X
X
X
sX
??????
??????
??????????
???
由此可知
总的偏差平方和可作如下的分解,
BABAE
r
i
s
j
iiij
s
j
j
r
i
i
r
i
s
j
t
k
iji j k
r
i
s
j
t
k
i j kT
SSSS
XXXXtXXrt
XXstXX
XXS
?
?? ??
?? ? ?
? ? ?
????
??????
????
??
? ??
?? ? ?
? ? ?
11 1
2
1
2
1
2
1` 1 1
2
1` 1 1
2
).....()..(
)..(.)(
)(
其中各偏差平方和表达式如下,
? ? ?
? ? ?
??
r
i
s
j
t
k
iji j kE XXS
1 1 1
2.)(
?
?
??
r
i
iA XXstS
1
2)..(
?
?
??
s
j
jB XXrtS
1
2)..(
? ?
? ?
? ????
r
i
s
j
jiijBA XXXXtS
1 1
2).....(
§ 3.3 各偏差平方和的意义
? SE表示试验的随机波动引起的误差,称为误差
平方和 ;
?SA除了反映了试验的随机波动引起的误差外,还反
映了因子 A的效应间的差异,称为因子 A的偏差平方和 ;
?SB除了反映了试验的随机波动引起的误差外,还反映
了因子 B的效应间的差异,称为因子 B的偏差平方和 ;
?SA× B除了反映了试验的随机波动引起的误差外,还
反映了交互效应的差异所引起的波动,称为交互作
用的偏差平方和,
))1(,1(~
)1(/
)1/(,
01 ???
?? trsrF
trsS
rSFH
E
A
A为真时当
? 同无交互作用的情况类似可得,
§ 3.4 检验统计量及显著性检验
))1(),1)(1((~
)1(/
)1)(1/(
,
03
???
?
??
? ?
?
trssrF
trsS
srS
FH
E
BA
BA
为真时当
))1(,1(~
)1(/
)1/(,
02 ???
?? trssF
trsS
sSFH
E
B
B为真时当
? 这就是用来检验假设 H01,H02,H03,的统计量,按照显
著性假设检验程序,对给定的显著性水平 α,
? 当 FA>F1-α(r-1,rs(t-1))时拒绝 H01;
? 当 FB>F1-α(s-1,rs(t-1))时拒绝 H02;
? 当 FA× B>F1-α((r-1)(s-1),rs(t-1))时拒绝 H03,
? 具体的计算过程,各偏差平方和的计算也可用下
面简化的表达式,且可列成一张计算表和方差分析
表,
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??????
???????
????
????
????
?
?
?
?
?
?
?
?
? ? ?
? ?
?
?
? ? ?
)1(
)1)(1(
1
1
1
1
1
1
,
1 1
22
.
2
1
2
..
2
1
2
..
1 1 1
22
trsfSSSSS
srfSSXnX
t
S
sfXnX
rt
S
rfXnX
st
S
rs tfXnXS
EBABATE
r
i
BA
s
j
BAijBA
B
r
i
jB
A
r
i
iA
T
r
i
s
j
t
k
i j kT
可用下式在具体计算时
有 交 互 作 用 方 差 分 析 计 算 表
B 因子 A 的
B
1
B
2
… B
s
x
i,.
x
2
i,.
A
1
x
11,
x
12,
… x
1s,
A
2
x
21,
x
22,
… x
2s,
… … … … …
A


A
r
x
r1,
x
r2,
… x
rs,
x
.j,
总和B

x
2
.j,
有 交 互 作 用 方 差 分 析 表
来源 平方和 自由度 均方和 F 值 显著性
因子 A S
A
r-1 S
A
/ ( r - 1 ) F
A
因子 B S
B
s -1 S
B
/ ( s - 1 ) F
B
A × B S
A × B
( r - 1 ) ( s - 1 )
S
A × B
/
( r - 1 ) ( s - 1 )
F
A × B
误差 S
E
r s ( t - 1 ) S
E
/ r s ( t - 1 )
总和 S
T
r s t -1
? 一般,当 F>F0.01时,称因子的影响高度显著,记为,**” ;
当 F0.01>F≥F0.05时,称因子的影响显著,记为,*” ;当 F<
F0.05时,称因子无显著影响,即认为因子各水平间无差异,
? 例,在某化工生产中为了提高收率,选了三种不同浓
度,四种不同温度做试验,在同一浓度与同一温度组合
下各做二次试验,其收率数据如下而计算表所列 (数据
均已减去 75).试检验不同浓度,不同温度以及它们间的
交互作用对收率有无显著影响,
温度
浓度
B
1
B
2
B
3
B
4
x
i,.
x
2
i,.
A
1
14, 10
( 2 4 )
1 1,1 1
( 2 2 )
1 3,9
( 2 2 )
1 0,1 2
( 2 2 )
90 8100
A
2
9,7
( 1 6 )
1 0,8
( 1 8 )
7,1 1
( 1 8 )
6,1 0
( 1 6 )
68 4624
A
3
5,1 1
( 1 6 )
1 3,1 4
( 2 7 )
1 2,1 3
( 2 5 )
1 4,1 0
( 2 4 )
92 8464
x
.j,
56 67 65 62 250 2 1 1 8 8
x
2
.j,
3136 4489 4225 3844 15694
?解,
0000.65
0000.275000.113333.441667.26045374
2
1
5000.111667.260415694
6
1
3333.441667.260421188
8
1
8333.1471667.26042752
5374
1667.2604)(
24
1
2752
24,2,4,3
3
1
4
1
2
.
2
3
1
4
1
2
1
3
1
4
1
2
1
2
?????
??????
????
????
???
?
??
??????
?
?
? ?
? ? ?? ? ?
? ?
? ? ?? ? ?
BABATE
BA
B
A
T
i j
ij
i j k
i j k
i j k
i j k
SSSSS
S
S
S
S
x
xx
rs tntsr这里
方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A 4 4, 3 3 3 2 2 2, 1 6 6 7 4, 0 9 **
因子 B 1 1, 5 0 0 0 3 3, 8 3 3 3 <1
A × B 2 7, 0 0 0 0 6 4, 5 0 0 0 <1
误差 6 5, 0 0 0 0 12 5, 4 1 6 7
总和 1 4 7, 8 3 3 3 23
?查表知 F0.05(2,12)=3.89,F0.01(2,12)=6.93;
F0.05(3,12)=3.49,F0.01(3,12)=5.95;
F0.05(6,12)=3.00,F0.01(6,12)=4.81,
?由此知 F0.05<FA< F0.01,而 FB<F0.05,FA× B<F0.05.故浓度不同
将对收率产生显著影响 ;而温度和交互作用的影响都不
显著,