第九章 方差分析
? 在工农业生产和科学研究中,经常遇到这样
的问题,影响产品产量、质量的因素很多,我们
需要了解在这众多的因素中,哪些因素对影响
产品产量、质量有显著影响,为此,要先做试验
,然后对测试的结果进行分析,方差分析就是分
析测试结果的一种方法,
? 在方差分析中,把在试验中变化的因素称为
因子,用 A,B,C,...表示 ;因子在试验中所取
的不同状态称为水平,因子 A的 r个不同水平用
A1,A2,...,Ar表示,
§ 1 单因子方差分析
§ 1.1 基本概念
为了 考察某个因素 A 对试验指标 ( 即随机变量 X)
的影响,在试验时,保持其他因素不变,而仅让因素 A
改变,这种试验称为单因子 ( 单因素 ) 试验, 设试验结
果如下表,
水平 观测值
A1 x11 x12,.,x1n1
A2 x21 x22 … x2n2
… … … … …
Ar xr1 xr2 … xrnr
? 例,为寻求适应本地区的高产油菜品种,今选了
五种不同品种进行试验,每一品种在四块试验田上
得到在每一块田上的亩产量如下,
品种
田块
A
1
A
2
A
3
A
4
A
5
1 256 244 250 288 206
2 222 300 277 280 212
3 280 290 230 315 220
4 298 275 322 259 212
? 我们要研究的问题是诸不同品种的平均亩
产量是否有显著差异,
? 试验的目的就是要检验假设
H0:μ 1=μ 2=μ 3=μ 4=μ 5
是否成立,若是拒绝,那么我们就认为这五种品种
的平均亩产量之间有显著差异 ;反之,就认为各品
种间产量的不同是由随机因素引起的,方差分析就
是检验假设的一种方法,
? 在本例中只考虑品种这一因子对亩产量的影响
,五个不同品种就是该因子的五个不同水平,由于
同一品种在不同田块上的亩产量不同,我们可以认
为一个品种的亩产量就是一个总体,在方差分析中
总假定各总体独立地服从同方差正态分布,即第 i
个品种的亩产量是一个随机变量,它服从分布
N(μ i,σ 2),i=1,2,3,4,5,
? 设在某试验中,因子 A有 r个不同水平
A1,A2,...,Ar,在 Ai水平下的试验结果 Xi服从正态
分布 N(μ i,σ 2),i=1,2,...,r,且 X1,X2,...,Xr间
相互独立,现在水平 Ai下做了 ni次试验,获得了 ni
个试验结果 Xij,j=1,2,...,ni这可以看成是取自 Xi
的一个容量为 ni的样本,i=1,2,...,r,
? 实际上,方差分析是检验同方差的若干正态总体
均值是否相等的一种统计方法,
? 在实际问题中影响总体均值的因素可能不止一
个,我们按试验中因子的个数,可以有单因子方差
分析,双因子分析,多因子分析等,例中是一个单因
子方差分析问题,
? 由于 Xij~N(μi,σ2),故 Xij与 μ i的差可以看成一个
随机误差 εij~N(0,σ2),这样一来,可以假定 Xij具有下
述数据结构式,
,,.,,,2,1,
1
11
ri
nnn
n
ii
r
i
i
r
i
ii
???
?? ??
??
???
??
? 为了今后方便起见,把参数的形式改变一下,并
记
称 μ 为一般平均,α i为因子 A的第 i 个水平的效应,
Xij= μi+ εij,i=1,2,...,r;j=1,2,...,ni
其中诸 εij~N(0,σ2),且相互独立,要检验的假设是
H0:μ1=μ2=…=μ r
? 在这样的改变下,单因子方差分析模型中的数
据结构式可以写成,
所要检验的假设可以写成,
iijiij njriX,.,,,2,1;,.,,,2,1,????? ???
0...,210 ??????? rH
? 为了导出检验假设的统计量,下面我们分析一
下什么是引起诸 Xij 波动的原因,
?
?
?
r
i
iin
1
0?
? 引起诸 Xij 波动的原因有两个,一个是假设 H0为
真时,诸 Xij的波动纯粹是随机性引起的 ;另一个可
能是假设 H0不真而引起的,因而我们就想用一个量
来刻划诸 Xij之间的波动,并把引起波动的两个原因
用另两个量表示出来,这就是方差分析中常用的平
方和分解法,
? ?
? ?
??
r
i
n
j
ijT
i
XXS
1 1
2)(
? ?
? ?
?
r
i
n
j
ij
i
X
n
X
1 1
1
其中
令之间的波动反映
之间的偏差平方和来与样本总平均通常用
.ij
ij
X
XX
§ 1.2 平方和分解公式
? ?? ?
? ?? ?
??????
r
i
n
j
iiij
r
i
n
j
ijT
ii
XXXXXXS
1 1
2
1 1
2 )..()(则
其中交叉乘积项
??? ?
??? ?
?????
ii n
j
iij
r
i
ii
r
i
n
j
iij XXXXXXXX
111 1
.)().(2).(.)(2
??
??
??
ii n
j
ij
i
i
n
j
iji XnXXX
11
1
.,.令
?? ?
?? ?
????
r
i
ii
r
i
n
j
iij XXnXX
i
1
22
1 1
).(.)(
0.).().(2
1
???? ?
?
ii
r
i
i XtXXX
).(.)(2).(.)(
1 11 1
2
1 1
2 XXXXXXXX
i
r
i
n
j
iij
r
i
n
j
i
r
i
n
j
iij
iii
??????? ? ?? ?? ?
? ?? ?? ?
.
).(.)(
1
22
1 1
为一个平方和分解式则
记
AET
r
i
iiA
r
i
n
j
iijE
SSS
XXnSXXS
i
??
???? ?? ?
?? ?
下面我们来看各式的意义
.,
1
1 1
称为总平均值是所有数据的平均值? ?
? ?
?
r
i
n
j
ij
i
X
n
X
.
,
1
.
1
为组平均值
称均值个总体中抽得的样本平是从第 iX
n
X
in
j
ij
i
i ?
?
?
).(,
,
)(
1 1
2
总离差平方和称为总偏差平方和指标
度的一个是描述全部数据离散程的离差平方和
值表示所有数据与总平均? ?
? ?
??
r
i
n
j
ijT
i
XXS
).(
,,
.)(
2
1 1
组内离差平方和偏差平方和
称为误差差反映了试验中的随机误的离差平方和
均值表示每个数据与其组平? ?
? ?
??
r
i
n
j
iijE
i
XXS
).(,
)(,
).(
1
2
组间离差平方和称为因子偏差平方和差异程度
均值之间的的不同水平因子反映了各总体平方和
值的离差表示组平均值与总平均
A
XXnS
r
i
iiA ?
?
??
§ 1.3 检验统计量的构造
.
),,(~,0...,2210
且相互独立
一切为真时当 ????? NXH ijn ????
2
1 1
2 )1()( SnXXS
r
i
n
j
ijT
i
???? ? ?
? ?
)1(~)1( 22
2
2 ?
?? nSnS T ?
??
故
.2 是全体样本的样本方差其中 S
对于各组样本有
2
1
2
,)1()( ii
n
j
iij SnXX
i
????
?
组样本的样本方差是第
组样本的样本容量是第其中
iS
in
i
i
2
因此
rinSn iii,,2,1),1(~)1( 22
2
???? ?
?
.,,,22221 相互独立且各组样本方差 rSSS ?
分布的可加性知及由 2
1
)1( ??
?
???
r
i
inrn
)(~
)1( 2
1
2
2
2 rn
SnS r
i
iiE ??? ?
?
?
??
.,...,,
,...,2,1),(~
...
)(~...
,,
,...,,,)1,0(
,...,,:)(
21
2
21
2
21
21
21
相互独立且
则
且
如果其自由度分别为线性组合的平方和
的是某些随机变量相互独立的
个为设分解定理柯赫伦
k
jj
k
k
j
nj
n
QQQ
kjfQ
nfff
nQQQ
f
XXXQN
nXXXC o c h ra n
?
????
???
?
?
.,,
)/(
)1/(
,
,0...:,
0
210
不真可以认为假设值过大时当也不应太大
从而的值不应太大
为真时故当假设异程度
均值之间的差反映的是因子不同水平由于
HF
rnS
rS
F
S
H
S
E
A
A
r
A
?
?
?
???? ???.
)1(~
,
)()1(1
2
2
222
相互独立与且
故有条件全部满足可知柯赫伦分解定理的
及由于
EA
A
EAT
SS
r
S
rnrn
SSS
?
???????
?
?
???
),1(~
)/(
)1/(
,0...:,
210
rnrF
rnS
rS
F
H
E
A
n
??
?
?
?
???? 为真时当由此可知 ???
.
,.
,,),1(
,,
0
01
下无显著差异间在显著性水平
认为因子各水平否则接受下有显著差异著性水平
认为因子各水平间在显拒绝假设时
当对给定的显著性水平按照显著性检验程序
?
?
?
?
H
HrnrF
F
??
?
?
? 一般,当 F>F0.01时,称因子的影响高度显著,记为
,**” ;当 F0.01>F≥F 0.05时,称因子的影响显著,记为
,*” ; 当 F< F0.05时,称因子无显著影响,即认为因
子各水平间无差异,
§ 1.4 检验过程
.,,
)/(
)1/(
1
1
1
1
,,
,
1 1
..
1
.
1
2
..
1
2
.
2
1
2
.
1 1
2
..
2
1 1
22
? ???
??
? ?? ?
? ???
??
? ?? ?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
????
??????
??????
r
i
n
j
ij
n
j
iji
r
i
i
E
A
EATE
A
r
i
i
i
r
i
i
i
A
r
r
i
n
j
ij
r
i
n
j
ijT
i
ii
ii
XTXXnn
rnS
rS
F
rnfSSS
rfT
nn
X
Xn
n
X
S
nfT
n
XXnXS
ni
为试验的总次数其中
可用下式则在具体计算时次个水平下试验了第
设在行的试验次数不等若因子的每一水平所进
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 S A r - 1 S A /(r - 1)
随机误差 S E n - r S E /( n - r)
总和 S T n - 1
F
等 重 复 试 验 计 算 表
各水平的试验号
水平
1 2 … t
和 x
i,
和平方 x
2
i,
1 x
11
x
12
… x
1t
2 x
21
x
22
… x
2t
… … … … …
r x
r1
x
r2
… x
rt
? 例,为寻求适应本地区的高产油菜品种,今选了
五种不同品种进行试验,每一品种在四块试验田上
得到在每一块田上的亩产量如下,
品种
田块
A
1
A
2
A
3
A
4
A
5
1 256 244 250 288 206
2 222 300 277 280 212
3 280 290 230 315 220
4 298 275 322 259 212
? 我们要研究的问题是诸不同品种的平均亩
产量是否有显著差异,
计算表
各水平的田块
品种
1 2 3 4
和 和平方
A
1
256 222 280 298 1056 1 1 1 5 1 3 6
A
2
244 300 290 275 1 1 0 9 1 2 2 9 8 8 1
A
3
250 277 230 322 1079 1 1 6 4 2 4 1
A
4
288 280 315 259 1 1 4 2 1 3 0 4 1 6 4
A
5
206 212 220 212 850 7 2 2 5 0 0
? 解,先列表计算
?? ?
?? ?
??
4
1
2
.
2
5
1
4
1
5 5 3 5 9 2 28.1 3 7 0 7 8 4)(
20
1
i
i
i j
ij xx
? ?? ?
? ?? ?
??
????
5
1
4
1
2
5
1
4
1
1 3 9 5 4 7 25 2 3 6
20,4,5
i j
ij
i j
ij
xx
ntr这里
2.246878.13707841395472 ???TS
7.131958.13707845535922
4
1 ????
AS
5.1 1 4 9 17.1 3 1 9 52.2 4 6 8 7 ????? ATE SSS
89.4)15,4(
06.3)15,4(
36.2)15,4(
99.0
95.0
90.0
?
?
?
F
F
F查表知
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 1 3 1 9 5, 7 4 3 2 9 8, 9 2 5
随机误差 1 1 4 9 1, 5 15 7 6 6, 1
总和 2 4 6 8 7, 2 19
4, 3 1 **
.
89.4)15,4(31.4)15,4(06.3 99.095.0
有显著差异所以不同品种的亩产量
因此 ????? FFF
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 S A r - 1 S A /(r - 1)
随机误差 S E n - r S E /( n - r)
总和 S T n - 1
F
不 等 重 复 试 验 计 算 表
各水平的试验号
水平
1 2 … t
i
和 x
i.
和平方 x
2
i.
1 x
11
x
12
… x
1 t i
2 x
21
x
22
… x
2 t i
… … … … …
r x
r1
x
r2
… x
r t i
例, 下面给出了随机选取的,用于计算器的四种
类型的电路的响应时间 (以毫秒计 ),
表, 电路的响应时间
类型 I 类型 II 类型 III 类型 IV
19 15
22
20
18
20 40
21
33
27
16 17
15
18
26
18
22
19
这里试验的指标是电路的响应时间, 电路类型为因素,
这一因素有四个水平,试验的目的是要考察各类型电
路对响应时间的影响,
设四种类型电路的响应时间的总体均为正态,
且各总体方差相同,但参数均未知, 又设各样本
相互独立,
解
分别以 ?1,?2,?3,?4记类型 I,II,III,IV四种电路响应
时间总体的平均值, 我们需检验 (?=0.05)
H0:?1=?2=?3=?4,
H1:?1,?2,?3,?4不全相等,
现在 n=18,s=4,n1=n2=n3=5,n4=3,
试验号 1 2 3 4 5 和 和平方
类型 I 19 15 22 20 18 94 8836
类型 II 20 40 21 33 27 141 19881
类型 III 16 17 15 18 26 92 8464
类型 IV 18 22 19 59 3481
ST,SA,SE的自由度依次为 17,3,14
44.714183868 9 9 2
18
2
24
1 1
2 ????? ??
? ?
? ? TxS
i
n
j
ijT
i
98.318
18
386
3
59)9214194(
5
1
18
22
222
24
1
2
???
?
?
?
?
?
?????? ??
?
?? T
n
XS
i i
i
A
46.395??? ATE SSS
表,方差分析表
方差来源 平方和 自由度 均方 F值 显著性
因素 318.98 3 106.33 3.76 *
误差 395.46 14 28.25
总和 714.44 17
因 F0.05(3,14)=3.34<3.76 <F0.01(3,14)=5.56,故认为各类
型电路的响应时间有显著差异,
§ 2 双因子方差分析
.),(
),(,,...,,,,...,,
,,
2
2121
分布独立地服从水平组合下的试验结果
在个不同水平取因子平
个不同水取因子有二个因子在变动设在某试验中
??
?
ij
jisr
N
BABBBsBAAA
rA
sj
r
ri
s
rs
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1
1;,...,2,1
1
1
,,
.
1
.
.
1
.
1 1
?????????
?????????
???
?
?
?
? ?
?
?
? ?
并令把参数改变一下为了研究方便
??
??
????
?
??
s
j
j
r
i
i
j
i
jB
iA
11
00
,
,,
它们满足关系式个水平的效应的第为因子
个水平的效应的第为因子为一般平均称
?
?
?
?
?
?
?
??
????
????????
????????
? ?
? ?
且相互独立
则如表所示并记结果为个组合各做一次试验
的每此时只需对型交互作用的方差分析模
为无则称这种方差分析模型若
),,0(~
,0,0
,,
),(.
,
2
1 1
N
X
X
BA
ij
r
i
s
j
ji
ijjiij
ij
ji
jiij
无 交 互 作 用 方 差 分 析 试 验 表
B 因子
B
1
B
2
… B
s
A
1
X
11
X
12
… X
1s
A
2
X
21
X
22
… X
2s
… … … … …
A
因
子
A
r
X
r1
X
r2
… X
rs
.
,;
,;
,
0...:
0...:
:
02
01
2102
2101
组合对结果无显著影响
的不同水平和因子则说明因子者均不拒绝
若二著影响的不同水平对结果有显为因子
则认若检验结果拒绝对结果有显著影响
的不同水平则认为因子若检验结果拒绝
假设有两个对这个模型所要检验的
BA
B
H
AH
H
H
s
r
???????
???????
?
????
???????
???????
???
???
?
?
?
?
? ?
?
?
? ?
X
sjX
riX
sjX
r
XXX
riX
s
XXX
X
rs
X
jjj
iii
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1,
,...,2,1,
,...,2,1,
1
,
,...,2,1,
1
,
1
:.
,
..
..
..
1
.
..
1
.
1 1
由此可知
为此先引进记号检验用的统计量
给出用分解平方和的思想来为了检验假设
其中
总的偏听偏信差平方和
BAE
s
j
j
r
i
i
r
i
s
j
jiij
r
i
s
j
ijT
SSS
XXrXXsXXXX
XXS
???
????????
??
?
??? ?
? ?
??? ?
? ?
1
2
.
1
2
.
1 1
2
..
1 1
2
)()()(
)(
? ?
? ?
????
r
i
s
j
jiijE XXXXS
1 1
2
.,)(
?
?
??
r
i
iA XXsS
1
2
,)(
?
?
??
s
j
jB XXrS
1
2
,)(
? SE表示试验的随机波动引起的误差,称为误差平方
和 ;SA除了反映了试验的随机波动引起的误差外,还
反映了因子 A的效应间的差异,称为因子 A的偏差平
方和 ; SB除了反映了试验的随机波动引起的误差外,
还反映了因子 B的效应间的差异,称为因子 B的偏差
平方和,
.
)1()(
,),,(~,
2
2
1 1
2
2
0201
的样本方差个样本是其中
故且相互独立一切为真时与当
ij
r
i
s
j
ijT
ij
XrsS
SrsXXS
NXHH
???? ? ?
? ?
??
)1(~1 22 ?rsS T ??故
)1()1()1)(1(1
1111
2222
????????
???
srsrrs
SSSS
BAET
且
由于
????
?
?
?
r
i
ii XXsNX
1
.
2
,),,(~ 且因
?
?
.,,,
)1()(
..2.1
2
2
1
2
.
的样本方差是其中
因此有
rA
A
r
i
i
XXXS
SrXX
?
????
?
)1(~
/
)1()1( 2
2
2
2
2
2 ?
???? r
s
SrSrsS AAA ?
???
故
)1(~
/
)1()1( 2
2
2
2
2
2 ?
???? s
r
SsSsrS BBB ?
???
同样有
))1)(1(,1(~,
))1)(1(,1(~,
:
))1)(1(,1(~
)1)(1/(
)1/(
))1)(1(,1(~
)1)(1/(
)1/(
,,
02
01
0201
???
???
???
??
?
?
???
??
?
?
srsFFH
srrFFH
srsF
srS
sS
F
srrF
srS
rS
F
HH
B
A
E
B
B
E
A
A
为真时在
为真时在
进一步可以证明
为真时可知在假设;,))1)(1(
,1(;,))1)(1(,1(
,,
02
1011
Hsr
sFFHsrrF
F
B
A
拒绝假设时
当拒绝假设时
当对给定的显著性水平按照显著性检验程序
??
?????
???
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
??
?
?
??????
????
????
????
?
?
? ?
?
?
? ?
)1)(1/(
)1/(
)1)(1/(
)1/(
)1)(1(
1
1
1
1
1
,
2
1
2
.
2
1
2
.
1 1
22
srS
sS
F
srS
rS
F
srfSSSS
sfXnX
r
S
rfXnX
s
S
rsfXnXS
E
B
B
E
A
A
EBATE
B
r
i
jB
A
r
i
iA
T
r
i
t
j
ijT
可用下式在具体计算时
无 交 互 作 用 方 差 分 析 计 算 表
B 因子 A 的
B
1
B
2
… B
s
x
i,
x
2
i,
A
1
x
11
x
12
… x
1s
A
2
x
21
x
22
… x
2s
… … … … …
A
因
子
A
r
x
r1
x
r2
… x
rs
x
.j
总和B
的
x
2
.j
? 具体计算时可用计算表和方差分析表,
无交互作用方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A S A r - 1 S A /(r - 1) F A
因子 B S B s - 1 S B /( s - 1) F B
误差 S E (r - 1 )(s - 1) S e / (r - 1 )( s - 1)
总和 S T rs - 1
? 一般,当 F>F0.01时,称因子的影响高度显著,记为
,**” ;当 F0.01>F≥F 0.05时,称因子的影响显著,记为
,*” ; 当 F< F0.05时,称因子无显著影响,即认为因
子各水平间无差异,
? 例,为了考察蒸馏水的 pH值和硫酸铜溶液浓度对
化验血清中白蛋白与球蛋白的影响,对蒸馏水的 pH
值 (A)取了 4个不同水平,对硫酸铜溶液浓度 (B)取了
3个不同水平,在不同水平组合 (Ai,Bj)下各测一次白
蛋白与球蛋白之比,其结果列于计算表的左上角,试
检验两因子对化验结果有无显著差异,
解
计算表
B A A
1
A
2
A
3
A
4
和 平方和
B
1
3, 5 2, 6 2, 0 1, 4 9, 5 9 0, 2 5
B
2
2, 3 2, 0 1, 5 0, 8 6, 6 4 3, 5 6
B
3
2, 0 1, 9 1, 2 0, 3 5, 4 2 9, 1 6
和 7, 8 6, 5 4, 7 2, 5 2 1, 5 1 6 2, 9 7
平方和 6 0, 8 4 3 0, 2 5 2 2, 0 9 6, 2 5 1 3 1, 4 3
26.0
22.252.3897.162
4
1
29.552.3843.131
3
1
77.752.3829.46
52.38)(
12
1
,29.46
12,3,4
2
4
1
3
1
4
1
3
1
2
????
????
????
???
??
?????
? ?? ?
? ?? ?
BATE
B
A
T
i j
ij
i j
ij
SSSS
S
S
S
xx
rsnsr这里
方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A 5,2 9 3 1,7 6 4 0, 9 **
因子 B 2,2 2 2 1, 1 1 2 5, 8 **
误差 0,2 6 6 0,0 4 3
总和 7,7 7 11
查 F-分布表得,F0.05(3,6)= 4.76,F0.05(2,6)= 5.14,
F0.01(3,6)=9.78,F0.01(2,6)=10.9,
由此可知 FA> F0.01(3,6); FB> F0.01(2,6).所以因子 A及
因子 B的不同水平对化验结果有高度显著影响,
.),(
),(,,...,,,,...,,
,,
2
2121
分布独立地服从水平组合下的试验结果
在个不同水平取因子平
个不同水取因子有二个因子在变动设在某试验中
??
?
ij
jisr
N
BABBBsBAAA
rA
sj
r
ri
s
rs
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1
1;,...,2,1
1
1
,,
.
1
.
.
1
.
1 1
?????????
?????????
???
?
?
?
? ?
?
?
? ?
并令把参数改变一下为了研究方便
§ 3 有交互作用的双因子方差分析
§ 3.1 模型
?
?
?
?
???
???
?????????
????????
s
j
ij
r
i
ij
jiijij
jiij
ri
sj
jBiA
1
1
,...,2,1,0
,...,2,1,0
,
,
它们满足关系式效应
个水平的交互的第个水平与因子的第为因子
则称若
??
??
????
?
??
s
j
j
r
i
i
j
i
jB
iA
11
00
,
,,
它们满足关系式个水平的效应的第为因子
个水平的效应的第为因子为一般平均称
tksjri
N
X
X
ttBA
i j k
s
j
ij
r
i
ij
r
i
s
j
ji
i j kijjii j k
i j k
ji
,...,2,1;,...,2,1;,...,2,1
),,0(~
,0,0
,0,0
:
,
,)2(),(
,
2
11
1 1
???
?
?
?
?
?
?
?
?
?
?
?
??
????
????
??????????
?
?
??
? ?
??
? ?
且相互独立
为
析模型则有交互作用的方差分如表所示结果为
并记次试验水平组合下至少要做在
那么结果是否有显著影响为了研究有交互效应对
有 交 互 作 用 方 差 分 析 试 验 表
B 因子
B
1
B
2
… B
s
A
1
X
11 1
,…,X
11 t
X
12 1
,…,X
12 t
… X
1s 1
,…,X
1s t
A
2
X
21 1
,…,X
21 t
X
22 1
,…,X
22 t
… X
2s 1
,…,X
2s t
… … … … …
A
因
子
A
r
X
r1 1
,…,X
r1 t
X
r2 1
,…,X
r2 t
… X
rs 1
,…,X
rs t
,,,0:
0...:
0...:
:
03
2102
2101
jiH
H
H
ij
s
r
???
???????
???????
? 设为对此模型要做的检验假
§ 3,2 平方和分解
? ? ?
? ? ?
?
r
i
s
j
t
k
i j kX
n
X
1 1 1
1
其中 n=rst
? 仍然用平方和分解的思想来给出检验用的统计
量,先引入下述记号,
sjX
rt
XXX
riX
st
XXX
sjriXXXX
ij
r
j
t
k
i j kj
ii
s
j
t
k
i j ki
ijtij
t
k
i j ki
,...,2,1..,
1
..,..
,...,2,1..,
1
..,..
,...,2,1;,...,2,1.,.,..
1 1
1 1
1
1
???
???
????
? ?
? ?
?
? ?
? ?
?
....
....
..
jjj
iji
ijijjiij
X
X
X
sX
??????
??????
??????????
???
由此可知
总的偏差平方和可作如下的分解,
BABAE
r
i
s
j
iiij
s
j
j
r
i
i
r
i
s
j
t
k
iji j k
r
i
s
j
t
k
i j kT
SSSS
XXXXtXXrt
XXstXX
XXS
?
?? ??
?? ? ?
? ? ?
????
??????
????
??
? ??
?? ? ?
? ? ?
11 1
2
1
2
1
2
1` 1 1
2
1` 1 1
2
).....()..(
)..(.)(
)(
其中各偏差平方和表达式如下,
? ? ?
? ? ?
??
r
i
s
j
t
k
iji j kE XXS
1 1 1
2.)(
?
?
??
r
i
iA XXstS
1
2)..(
?
?
??
s
j
jB XXrtS
1
2)..(
? ?
? ?
? ????
r
i
s
j
jiijBA XXXXtS
1 1
2).....(
§ 3.3 各偏差平方和的意义
? SE表示试验的随机波动引起的误差,称为误差
平方和 ;
?SA除了反映了试验的随机波动引起的误差外,还反
映了因子 A的效应间的差异,称为因子 A的偏差平方和 ;
?SB除了反映了试验的随机波动引起的误差外,还反映
了因子 B的效应间的差异,称为因子 B的偏差平方和 ;
?SA× B除了反映了试验的随机波动引起的误差外,还
反映了交互效应的差异所引起的波动,称为交互作
用的偏差平方和,
))1(,1(~
)1(/
)1/(,
01 ???
?? trsrF
trsS
rSFH
E
A
A为真时当
? 同无交互作用的情况类似可得,
§ 3.4 检验统计量及显著性检验
))1(),1)(1((~
)1(/
)1)(1/(
,
03
???
?
??
? ?
?
trssrF
trsS
srS
FH
E
BA
BA
为真时当
))1(,1(~
)1(/
)1/(,
02 ???
?? trssF
trsS
sSFH
E
B
B为真时当
? 这就是用来检验假设 H01,H02,H03,的统计量,按照显
著性假设检验程序,对给定的显著性水平 α,
? 当 FA>F1-α(r-1,rs(t-1))时拒绝 H01;
? 当 FB>F1-α(s-1,rs(t-1))时拒绝 H02;
? 当 FA× B>F1-α((r-1)(s-1),rs(t-1))时拒绝 H03,
? 具体的计算过程,各偏差平方和的计算也可用下
面简化的表达式,且可列成一张计算表和方差分析
表,
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??????
???????
????
????
????
?
?
?
?
?
?
?
?
? ? ?
? ?
?
?
? ? ?
)1(
)1)(1(
1
1
1
1
1
1
,
1 1
22
.
2
1
2
..
2
1
2
..
1 1 1
22
trsfSSSSS
srfSSXnX
t
S
sfXnX
rt
S
rfXnX
st
S
rs tfXnXS
EBABATE
r
i
BA
s
j
BAijBA
B
r
i
jB
A
r
i
iA
T
r
i
s
j
t
k
i j kT
可用下式在具体计算时
有 交 互 作 用 方 差 分 析 计 算 表
B 因子 A 的
B
1
B
2
… B
s
x
i,.
x
2
i,.
A
1
x
11,
x
12,
… x
1s,
A
2
x
21,
x
22,
… x
2s,
… … … … …
A
因
子
A
r
x
r1,
x
r2,
… x
rs,
x
.j,
总和B
的
x
2
.j,
有 交 互 作 用 方 差 分 析 表
来源 平方和 自由度 均方和 F 值 显著性
因子 A S
A
r-1 S
A
/ ( r - 1 ) F
A
因子 B S
B
s -1 S
B
/ ( s - 1 ) F
B
A × B S
A × B
( r - 1 ) ( s - 1 )
S
A × B
/
( r - 1 ) ( s - 1 )
F
A × B
误差 S
E
r s ( t - 1 ) S
E
/ r s ( t - 1 )
总和 S
T
r s t -1
? 一般,当 F>F0.01时,称因子的影响高度显著,记为,**” ;
当 F0.01>F≥F0.05时,称因子的影响显著,记为,*” ;当 F<
F0.05时,称因子无显著影响,即认为因子各水平间无差异,
? 例,在某化工生产中为了提高收率,选了三种不同浓
度,四种不同温度做试验,在同一浓度与同一温度组合
下各做二次试验,其收率数据如下而计算表所列 (数据
均已减去 75).试检验不同浓度,不同温度以及它们间的
交互作用对收率有无显著影响,
温度
浓度
B
1
B
2
B
3
B
4
x
i,.
x
2
i,.
A
1
14, 10
( 2 4 )
1 1,1 1
( 2 2 )
1 3,9
( 2 2 )
1 0,1 2
( 2 2 )
90 8100
A
2
9,7
( 1 6 )
1 0,8
( 1 8 )
7,1 1
( 1 8 )
6,1 0
( 1 6 )
68 4624
A
3
5,1 1
( 1 6 )
1 3,1 4
( 2 7 )
1 2,1 3
( 2 5 )
1 4,1 0
( 2 4 )
92 8464
x
.j,
56 67 65 62 250 2 1 1 8 8
x
2
.j,
3136 4489 4225 3844 15694
?解,
0000.65
0000.275000.113333.441667.26045374
2
1
5000.111667.260415694
6
1
3333.441667.260421188
8
1
8333.1471667.26042752
5374
1667.2604)(
24
1
2752
24,2,4,3
3
1
4
1
2
.
2
3
1
4
1
2
1
3
1
4
1
2
1
2
?????
??????
????
????
???
?
??
??????
?
?
? ?
? ? ?? ? ?
? ?
? ? ?? ? ?
BABATE
BA
B
A
T
i j
ij
i j k
i j k
i j k
i j k
SSSSS
S
S
S
S
x
xx
rs tntsr这里
方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A 4 4, 3 3 3 2 2 2, 1 6 6 7 4, 0 9 **
因子 B 1 1, 5 0 0 0 3 3, 8 3 3 3 <1
A × B 2 7, 0 0 0 0 6 4, 5 0 0 0 <1
误差 6 5, 0 0 0 0 12 5, 4 1 6 7
总和 1 4 7, 8 3 3 3 23
?查表知 F0.05(2,12)=3.89,F0.01(2,12)=6.93;
F0.05(3,12)=3.49,F0.01(3,12)=5.95;
F0.05(6,12)=3.00,F0.01(6,12)=4.81,
?由此知 F0.05<FA< F0.01,而 FB<F0.05,FA× B<F0.05.故浓度不同
将对收率产生显著影响 ;而温度和交互作用的影响都不
显著,
? 在工农业生产和科学研究中,经常遇到这样
的问题,影响产品产量、质量的因素很多,我们
需要了解在这众多的因素中,哪些因素对影响
产品产量、质量有显著影响,为此,要先做试验
,然后对测试的结果进行分析,方差分析就是分
析测试结果的一种方法,
? 在方差分析中,把在试验中变化的因素称为
因子,用 A,B,C,...表示 ;因子在试验中所取
的不同状态称为水平,因子 A的 r个不同水平用
A1,A2,...,Ar表示,
§ 1 单因子方差分析
§ 1.1 基本概念
为了 考察某个因素 A 对试验指标 ( 即随机变量 X)
的影响,在试验时,保持其他因素不变,而仅让因素 A
改变,这种试验称为单因子 ( 单因素 ) 试验, 设试验结
果如下表,
水平 观测值
A1 x11 x12,.,x1n1
A2 x21 x22 … x2n2
… … … … …
Ar xr1 xr2 … xrnr
? 例,为寻求适应本地区的高产油菜品种,今选了
五种不同品种进行试验,每一品种在四块试验田上
得到在每一块田上的亩产量如下,
品种
田块
A
1
A
2
A
3
A
4
A
5
1 256 244 250 288 206
2 222 300 277 280 212
3 280 290 230 315 220
4 298 275 322 259 212
? 我们要研究的问题是诸不同品种的平均亩
产量是否有显著差异,
? 试验的目的就是要检验假设
H0:μ 1=μ 2=μ 3=μ 4=μ 5
是否成立,若是拒绝,那么我们就认为这五种品种
的平均亩产量之间有显著差异 ;反之,就认为各品
种间产量的不同是由随机因素引起的,方差分析就
是检验假设的一种方法,
? 在本例中只考虑品种这一因子对亩产量的影响
,五个不同品种就是该因子的五个不同水平,由于
同一品种在不同田块上的亩产量不同,我们可以认
为一个品种的亩产量就是一个总体,在方差分析中
总假定各总体独立地服从同方差正态分布,即第 i
个品种的亩产量是一个随机变量,它服从分布
N(μ i,σ 2),i=1,2,3,4,5,
? 设在某试验中,因子 A有 r个不同水平
A1,A2,...,Ar,在 Ai水平下的试验结果 Xi服从正态
分布 N(μ i,σ 2),i=1,2,...,r,且 X1,X2,...,Xr间
相互独立,现在水平 Ai下做了 ni次试验,获得了 ni
个试验结果 Xij,j=1,2,...,ni这可以看成是取自 Xi
的一个容量为 ni的样本,i=1,2,...,r,
? 实际上,方差分析是检验同方差的若干正态总体
均值是否相等的一种统计方法,
? 在实际问题中影响总体均值的因素可能不止一
个,我们按试验中因子的个数,可以有单因子方差
分析,双因子分析,多因子分析等,例中是一个单因
子方差分析问题,
? 由于 Xij~N(μi,σ2),故 Xij与 μ i的差可以看成一个
随机误差 εij~N(0,σ2),这样一来,可以假定 Xij具有下
述数据结构式,
,,.,,,2,1,
1
11
ri
nnn
n
ii
r
i
i
r
i
ii
???
?? ??
??
???
??
? 为了今后方便起见,把参数的形式改变一下,并
记
称 μ 为一般平均,α i为因子 A的第 i 个水平的效应,
Xij= μi+ εij,i=1,2,...,r;j=1,2,...,ni
其中诸 εij~N(0,σ2),且相互独立,要检验的假设是
H0:μ1=μ2=…=μ r
? 在这样的改变下,单因子方差分析模型中的数
据结构式可以写成,
所要检验的假设可以写成,
iijiij njriX,.,,,2,1;,.,,,2,1,????? ???
0...,210 ??????? rH
? 为了导出检验假设的统计量,下面我们分析一
下什么是引起诸 Xij 波动的原因,
?
?
?
r
i
iin
1
0?
? 引起诸 Xij 波动的原因有两个,一个是假设 H0为
真时,诸 Xij的波动纯粹是随机性引起的 ;另一个可
能是假设 H0不真而引起的,因而我们就想用一个量
来刻划诸 Xij之间的波动,并把引起波动的两个原因
用另两个量表示出来,这就是方差分析中常用的平
方和分解法,
? ?
? ?
??
r
i
n
j
ijT
i
XXS
1 1
2)(
? ?
? ?
?
r
i
n
j
ij
i
X
n
X
1 1
1
其中
令之间的波动反映
之间的偏差平方和来与样本总平均通常用
.ij
ij
X
XX
§ 1.2 平方和分解公式
? ?? ?
? ?? ?
??????
r
i
n
j
iiij
r
i
n
j
ijT
ii
XXXXXXS
1 1
2
1 1
2 )..()(则
其中交叉乘积项
??? ?
??? ?
?????
ii n
j
iij
r
i
ii
r
i
n
j
iij XXXXXXXX
111 1
.)().(2).(.)(2
??
??
??
ii n
j
ij
i
i
n
j
iji XnXXX
11
1
.,.令
?? ?
?? ?
????
r
i
ii
r
i
n
j
iij XXnXX
i
1
22
1 1
).(.)(
0.).().(2
1
???? ?
?
ii
r
i
i XtXXX
).(.)(2).(.)(
1 11 1
2
1 1
2 XXXXXXXX
i
r
i
n
j
iij
r
i
n
j
i
r
i
n
j
iij
iii
??????? ? ?? ?? ?
? ?? ?? ?
.
).(.)(
1
22
1 1
为一个平方和分解式则
记
AET
r
i
iiA
r
i
n
j
iijE
SSS
XXnSXXS
i
??
???? ?? ?
?? ?
下面我们来看各式的意义
.,
1
1 1
称为总平均值是所有数据的平均值? ?
? ?
?
r
i
n
j
ij
i
X
n
X
.
,
1
.
1
为组平均值
称均值个总体中抽得的样本平是从第 iX
n
X
in
j
ij
i
i ?
?
?
).(,
,
)(
1 1
2
总离差平方和称为总偏差平方和指标
度的一个是描述全部数据离散程的离差平方和
值表示所有数据与总平均? ?
? ?
??
r
i
n
j
ijT
i
XXS
).(
,,
.)(
2
1 1
组内离差平方和偏差平方和
称为误差差反映了试验中的随机误的离差平方和
均值表示每个数据与其组平? ?
? ?
??
r
i
n
j
iijE
i
XXS
).(,
)(,
).(
1
2
组间离差平方和称为因子偏差平方和差异程度
均值之间的的不同水平因子反映了各总体平方和
值的离差表示组平均值与总平均
A
XXnS
r
i
iiA ?
?
??
§ 1.3 检验统计量的构造
.
),,(~,0...,2210
且相互独立
一切为真时当 ????? NXH ijn ????
2
1 1
2 )1()( SnXXS
r
i
n
j
ijT
i
???? ? ?
? ?
)1(~)1( 22
2
2 ?
?? nSnS T ?
??
故
.2 是全体样本的样本方差其中 S
对于各组样本有
2
1
2
,)1()( ii
n
j
iij SnXX
i
????
?
组样本的样本方差是第
组样本的样本容量是第其中
iS
in
i
i
2
因此
rinSn iii,,2,1),1(~)1( 22
2
???? ?
?
.,,,22221 相互独立且各组样本方差 rSSS ?
分布的可加性知及由 2
1
)1( ??
?
???
r
i
inrn
)(~
)1( 2
1
2
2
2 rn
SnS r
i
iiE ??? ?
?
?
??
.,...,,
,...,2,1),(~
...
)(~...
,,
,...,,,)1,0(
,...,,:)(
21
2
21
2
21
21
21
相互独立且
则
且
如果其自由度分别为线性组合的平方和
的是某些随机变量相互独立的
个为设分解定理柯赫伦
k
jj
k
k
j
nj
n
QQQ
kjfQ
nfff
nQQQ
f
XXXQN
nXXXC o c h ra n
?
????
???
?
?
.,,
)/(
)1/(
,
,0...:,
0
210
不真可以认为假设值过大时当也不应太大
从而的值不应太大
为真时故当假设异程度
均值之间的差反映的是因子不同水平由于
HF
rnS
rS
F
S
H
S
E
A
A
r
A
?
?
?
???? ???.
)1(~
,
)()1(1
2
2
222
相互独立与且
故有条件全部满足可知柯赫伦分解定理的
及由于
EA
A
EAT
SS
r
S
rnrn
SSS
?
???????
?
?
???
),1(~
)/(
)1/(
,0...:,
210
rnrF
rnS
rS
F
H
E
A
n
??
?
?
?
???? 为真时当由此可知 ???
.
,.
,,),1(
,,
0
01
下无显著差异间在显著性水平
认为因子各水平否则接受下有显著差异著性水平
认为因子各水平间在显拒绝假设时
当对给定的显著性水平按照显著性检验程序
?
?
?
?
H
HrnrF
F
??
?
?
? 一般,当 F>F0.01时,称因子的影响高度显著,记为
,**” ;当 F0.01>F≥F 0.05时,称因子的影响显著,记为
,*” ; 当 F< F0.05时,称因子无显著影响,即认为因
子各水平间无差异,
§ 1.4 检验过程
.,,
)/(
)1/(
1
1
1
1
,,
,
1 1
..
1
.
1
2
..
1
2
.
2
1
2
.
1 1
2
..
2
1 1
22
? ???
??
? ?? ?
? ???
??
? ?? ?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
????
??????
??????
r
i
n
j
ij
n
j
iji
r
i
i
E
A
EATE
A
r
i
i
i
r
i
i
i
A
r
r
i
n
j
ij
r
i
n
j
ijT
i
ii
ii
XTXXnn
rnS
rS
F
rnfSSS
rfT
nn
X
Xn
n
X
S
nfT
n
XXnXS
ni
为试验的总次数其中
可用下式则在具体计算时次个水平下试验了第
设在行的试验次数不等若因子的每一水平所进
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 S A r - 1 S A /(r - 1)
随机误差 S E n - r S E /( n - r)
总和 S T n - 1
F
等 重 复 试 验 计 算 表
各水平的试验号
水平
1 2 … t
和 x
i,
和平方 x
2
i,
1 x
11
x
12
… x
1t
2 x
21
x
22
… x
2t
… … … … …
r x
r1
x
r2
… x
rt
? 例,为寻求适应本地区的高产油菜品种,今选了
五种不同品种进行试验,每一品种在四块试验田上
得到在每一块田上的亩产量如下,
品种
田块
A
1
A
2
A
3
A
4
A
5
1 256 244 250 288 206
2 222 300 277 280 212
3 280 290 230 315 220
4 298 275 322 259 212
? 我们要研究的问题是诸不同品种的平均亩
产量是否有显著差异,
计算表
各水平的田块
品种
1 2 3 4
和 和平方
A
1
256 222 280 298 1056 1 1 1 5 1 3 6
A
2
244 300 290 275 1 1 0 9 1 2 2 9 8 8 1
A
3
250 277 230 322 1079 1 1 6 4 2 4 1
A
4
288 280 315 259 1 1 4 2 1 3 0 4 1 6 4
A
5
206 212 220 212 850 7 2 2 5 0 0
? 解,先列表计算
?? ?
?? ?
??
4
1
2
.
2
5
1
4
1
5 5 3 5 9 2 28.1 3 7 0 7 8 4)(
20
1
i
i
i j
ij xx
? ?? ?
? ?? ?
??
????
5
1
4
1
2
5
1
4
1
1 3 9 5 4 7 25 2 3 6
20,4,5
i j
ij
i j
ij
xx
ntr这里
2.246878.13707841395472 ???TS
7.131958.13707845535922
4
1 ????
AS
5.1 1 4 9 17.1 3 1 9 52.2 4 6 8 7 ????? ATE SSS
89.4)15,4(
06.3)15,4(
36.2)15,4(
99.0
95.0
90.0
?
?
?
F
F
F查表知
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 1 3 1 9 5, 7 4 3 2 9 8, 9 2 5
随机误差 1 1 4 9 1, 5 15 7 6 6, 1
总和 2 4 6 8 7, 2 19
4, 3 1 **
.
89.4)15,4(31.4)15,4(06.3 99.095.0
有显著差异所以不同品种的亩产量
因此 ????? FFF
方差分析表
方差来源 平方和 自由度 均方和 F 值 显著性
因子影响 S A r - 1 S A /(r - 1)
随机误差 S E n - r S E /( n - r)
总和 S T n - 1
F
不 等 重 复 试 验 计 算 表
各水平的试验号
水平
1 2 … t
i
和 x
i.
和平方 x
2
i.
1 x
11
x
12
… x
1 t i
2 x
21
x
22
… x
2 t i
… … … … …
r x
r1
x
r2
… x
r t i
例, 下面给出了随机选取的,用于计算器的四种
类型的电路的响应时间 (以毫秒计 ),
表, 电路的响应时间
类型 I 类型 II 类型 III 类型 IV
19 15
22
20
18
20 40
21
33
27
16 17
15
18
26
18
22
19
这里试验的指标是电路的响应时间, 电路类型为因素,
这一因素有四个水平,试验的目的是要考察各类型电
路对响应时间的影响,
设四种类型电路的响应时间的总体均为正态,
且各总体方差相同,但参数均未知, 又设各样本
相互独立,
解
分别以 ?1,?2,?3,?4记类型 I,II,III,IV四种电路响应
时间总体的平均值, 我们需检验 (?=0.05)
H0:?1=?2=?3=?4,
H1:?1,?2,?3,?4不全相等,
现在 n=18,s=4,n1=n2=n3=5,n4=3,
试验号 1 2 3 4 5 和 和平方
类型 I 19 15 22 20 18 94 8836
类型 II 20 40 21 33 27 141 19881
类型 III 16 17 15 18 26 92 8464
类型 IV 18 22 19 59 3481
ST,SA,SE的自由度依次为 17,3,14
44.714183868 9 9 2
18
2
24
1 1
2 ????? ??
? ?
? ? TxS
i
n
j
ijT
i
98.318
18
386
3
59)9214194(
5
1
18
22
222
24
1
2
???
?
?
?
?
?
?????? ??
?
?? T
n
XS
i i
i
A
46.395??? ATE SSS
表,方差分析表
方差来源 平方和 自由度 均方 F值 显著性
因素 318.98 3 106.33 3.76 *
误差 395.46 14 28.25
总和 714.44 17
因 F0.05(3,14)=3.34<3.76 <F0.01(3,14)=5.56,故认为各类
型电路的响应时间有显著差异,
§ 2 双因子方差分析
.),(
),(,,...,,,,...,,
,,
2
2121
分布独立地服从水平组合下的试验结果
在个不同水平取因子平
个不同水取因子有二个因子在变动设在某试验中
??
?
ij
jisr
N
BABBBsBAAA
rA
sj
r
ri
s
rs
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1
1;,...,2,1
1
1
,,
.
1
.
.
1
.
1 1
?????????
?????????
???
?
?
?
? ?
?
?
? ?
并令把参数改变一下为了研究方便
??
??
????
?
??
s
j
j
r
i
i
j
i
jB
iA
11
00
,
,,
它们满足关系式个水平的效应的第为因子
个水平的效应的第为因子为一般平均称
?
?
?
?
?
?
?
??
????
????????
????????
? ?
? ?
且相互独立
则如表所示并记结果为个组合各做一次试验
的每此时只需对型交互作用的方差分析模
为无则称这种方差分析模型若
),,0(~
,0,0
,,
),(.
,
2
1 1
N
X
X
BA
ij
r
i
s
j
ji
ijjiij
ij
ji
jiij
无 交 互 作 用 方 差 分 析 试 验 表
B 因子
B
1
B
2
… B
s
A
1
X
11
X
12
… X
1s
A
2
X
21
X
22
… X
2s
… … … … …
A
因
子
A
r
X
r1
X
r2
… X
rs
.
,;
,;
,
0...:
0...:
:
02
01
2102
2101
组合对结果无显著影响
的不同水平和因子则说明因子者均不拒绝
若二著影响的不同水平对结果有显为因子
则认若检验结果拒绝对结果有显著影响
的不同水平则认为因子若检验结果拒绝
假设有两个对这个模型所要检验的
BA
B
H
AH
H
H
s
r
???????
???????
?
????
???????
???????
???
???
?
?
?
?
? ?
?
?
? ?
X
sjX
riX
sjX
r
XXX
riX
s
XXX
X
rs
X
jjj
iii
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1,
,...,2,1,
,...,2,1,
1
,
,...,2,1,
1
,
1
:.
,
..
..
..
1
.
..
1
.
1 1
由此可知
为此先引进记号检验用的统计量
给出用分解平方和的思想来为了检验假设
其中
总的偏听偏信差平方和
BAE
s
j
j
r
i
i
r
i
s
j
jiij
r
i
s
j
ijT
SSS
XXrXXsXXXX
XXS
???
????????
??
?
??? ?
? ?
??? ?
? ?
1
2
.
1
2
.
1 1
2
..
1 1
2
)()()(
)(
? ?
? ?
????
r
i
s
j
jiijE XXXXS
1 1
2
.,)(
?
?
??
r
i
iA XXsS
1
2
,)(
?
?
??
s
j
jB XXrS
1
2
,)(
? SE表示试验的随机波动引起的误差,称为误差平方
和 ;SA除了反映了试验的随机波动引起的误差外,还
反映了因子 A的效应间的差异,称为因子 A的偏差平
方和 ; SB除了反映了试验的随机波动引起的误差外,
还反映了因子 B的效应间的差异,称为因子 B的偏差
平方和,
.
)1()(
,),,(~,
2
2
1 1
2
2
0201
的样本方差个样本是其中
故且相互独立一切为真时与当
ij
r
i
s
j
ijT
ij
XrsS
SrsXXS
NXHH
???? ? ?
? ?
??
)1(~1 22 ?rsS T ??故
)1()1()1)(1(1
1111
2222
????????
???
srsrrs
SSSS
BAET
且
由于
????
?
?
?
r
i
ii XXsNX
1
.
2
,),,(~ 且因
?
?
.,,,
)1()(
..2.1
2
2
1
2
.
的样本方差是其中
因此有
rA
A
r
i
i
XXXS
SrXX
?
????
?
)1(~
/
)1()1( 2
2
2
2
2
2 ?
???? r
s
SrSrsS AAA ?
???
故
)1(~
/
)1()1( 2
2
2
2
2
2 ?
???? s
r
SsSsrS BBB ?
???
同样有
))1)(1(,1(~,
))1)(1(,1(~,
:
))1)(1(,1(~
)1)(1/(
)1/(
))1)(1(,1(~
)1)(1/(
)1/(
,,
02
01
0201
???
???
???
??
?
?
???
??
?
?
srsFFH
srrFFH
srsF
srS
sS
F
srrF
srS
rS
F
HH
B
A
E
B
B
E
A
A
为真时在
为真时在
进一步可以证明
为真时可知在假设;,))1)(1(
,1(;,))1)(1(,1(
,,
02
1011
Hsr
sFFHsrrF
F
B
A
拒绝假设时
当拒绝假设时
当对给定的显著性水平按照显著性检验程序
??
?????
???
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
??
?
?
??????
????
????
????
?
?
? ?
?
?
? ?
)1)(1/(
)1/(
)1)(1/(
)1/(
)1)(1(
1
1
1
1
1
,
2
1
2
.
2
1
2
.
1 1
22
srS
sS
F
srS
rS
F
srfSSSS
sfXnX
r
S
rfXnX
s
S
rsfXnXS
E
B
B
E
A
A
EBATE
B
r
i
jB
A
r
i
iA
T
r
i
t
j
ijT
可用下式在具体计算时
无 交 互 作 用 方 差 分 析 计 算 表
B 因子 A 的
B
1
B
2
… B
s
x
i,
x
2
i,
A
1
x
11
x
12
… x
1s
A
2
x
21
x
22
… x
2s
… … … … …
A
因
子
A
r
x
r1
x
r2
… x
rs
x
.j
总和B
的
x
2
.j
? 具体计算时可用计算表和方差分析表,
无交互作用方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A S A r - 1 S A /(r - 1) F A
因子 B S B s - 1 S B /( s - 1) F B
误差 S E (r - 1 )(s - 1) S e / (r - 1 )( s - 1)
总和 S T rs - 1
? 一般,当 F>F0.01时,称因子的影响高度显著,记为
,**” ;当 F0.01>F≥F 0.05时,称因子的影响显著,记为
,*” ; 当 F< F0.05时,称因子无显著影响,即认为因
子各水平间无差异,
? 例,为了考察蒸馏水的 pH值和硫酸铜溶液浓度对
化验血清中白蛋白与球蛋白的影响,对蒸馏水的 pH
值 (A)取了 4个不同水平,对硫酸铜溶液浓度 (B)取了
3个不同水平,在不同水平组合 (Ai,Bj)下各测一次白
蛋白与球蛋白之比,其结果列于计算表的左上角,试
检验两因子对化验结果有无显著差异,
解
计算表
B A A
1
A
2
A
3
A
4
和 平方和
B
1
3, 5 2, 6 2, 0 1, 4 9, 5 9 0, 2 5
B
2
2, 3 2, 0 1, 5 0, 8 6, 6 4 3, 5 6
B
3
2, 0 1, 9 1, 2 0, 3 5, 4 2 9, 1 6
和 7, 8 6, 5 4, 7 2, 5 2 1, 5 1 6 2, 9 7
平方和 6 0, 8 4 3 0, 2 5 2 2, 0 9 6, 2 5 1 3 1, 4 3
26.0
22.252.3897.162
4
1
29.552.3843.131
3
1
77.752.3829.46
52.38)(
12
1
,29.46
12,3,4
2
4
1
3
1
4
1
3
1
2
????
????
????
???
??
?????
? ?? ?
? ?? ?
BATE
B
A
T
i j
ij
i j
ij
SSSS
S
S
S
xx
rsnsr这里
方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A 5,2 9 3 1,7 6 4 0, 9 **
因子 B 2,2 2 2 1, 1 1 2 5, 8 **
误差 0,2 6 6 0,0 4 3
总和 7,7 7 11
查 F-分布表得,F0.05(3,6)= 4.76,F0.05(2,6)= 5.14,
F0.01(3,6)=9.78,F0.01(2,6)=10.9,
由此可知 FA> F0.01(3,6); FB> F0.01(2,6).所以因子 A及
因子 B的不同水平对化验结果有高度显著影响,
.),(
),(,,...,,,,...,,
,,
2
2121
分布独立地服从水平组合下的试验结果
在个不同水平取因子平
个不同水取因子有二个因子在变动设在某试验中
??
?
ij
jisr
N
BABBBsBAAA
rA
sj
r
ri
s
rs
jj
r
i
ijj
ii
s
j
iji
r
i
s
j
ij
,...,2,1
1;,...,2,1
1
1
,,
.
1
.
.
1
.
1 1
?????????
?????????
???
?
?
?
? ?
?
?
? ?
并令把参数改变一下为了研究方便
§ 3 有交互作用的双因子方差分析
§ 3.1 模型
?
?
?
?
???
???
?????????
????????
s
j
ij
r
i
ij
jiijij
jiij
ri
sj
jBiA
1
1
,...,2,1,0
,...,2,1,0
,
,
它们满足关系式效应
个水平的交互的第个水平与因子的第为因子
则称若
??
??
????
?
??
s
j
j
r
i
i
j
i
jB
iA
11
00
,
,,
它们满足关系式个水平的效应的第为因子
个水平的效应的第为因子为一般平均称
tksjri
N
X
X
ttBA
i j k
s
j
ij
r
i
ij
r
i
s
j
ji
i j kijjii j k
i j k
ji
,...,2,1;,...,2,1;,...,2,1
),,0(~
,0,0
,0,0
:
,
,)2(),(
,
2
11
1 1
???
?
?
?
?
?
?
?
?
?
?
?
??
????
????
??????????
?
?
??
? ?
??
? ?
且相互独立
为
析模型则有交互作用的方差分如表所示结果为
并记次试验水平组合下至少要做在
那么结果是否有显著影响为了研究有交互效应对
有 交 互 作 用 方 差 分 析 试 验 表
B 因子
B
1
B
2
… B
s
A
1
X
11 1
,…,X
11 t
X
12 1
,…,X
12 t
… X
1s 1
,…,X
1s t
A
2
X
21 1
,…,X
21 t
X
22 1
,…,X
22 t
… X
2s 1
,…,X
2s t
… … … … …
A
因
子
A
r
X
r1 1
,…,X
r1 t
X
r2 1
,…,X
r2 t
… X
rs 1
,…,X
rs t
,,,0:
0...:
0...:
:
03
2102
2101
jiH
H
H
ij
s
r
???
???????
???????
? 设为对此模型要做的检验假
§ 3,2 平方和分解
? ? ?
? ? ?
?
r
i
s
j
t
k
i j kX
n
X
1 1 1
1
其中 n=rst
? 仍然用平方和分解的思想来给出检验用的统计
量,先引入下述记号,
sjX
rt
XXX
riX
st
XXX
sjriXXXX
ij
r
j
t
k
i j kj
ii
s
j
t
k
i j ki
ijtij
t
k
i j ki
,...,2,1..,
1
..,..
,...,2,1..,
1
..,..
,...,2,1;,...,2,1.,.,..
1 1
1 1
1
1
???
???
????
? ?
? ?
?
? ?
? ?
?
....
....
..
jjj
iji
ijijjiij
X
X
X
sX
??????
??????
??????????
???
由此可知
总的偏差平方和可作如下的分解,
BABAE
r
i
s
j
iiij
s
j
j
r
i
i
r
i
s
j
t
k
iji j k
r
i
s
j
t
k
i j kT
SSSS
XXXXtXXrt
XXstXX
XXS
?
?? ??
?? ? ?
? ? ?
????
??????
????
??
? ??
?? ? ?
? ? ?
11 1
2
1
2
1
2
1` 1 1
2
1` 1 1
2
).....()..(
)..(.)(
)(
其中各偏差平方和表达式如下,
? ? ?
? ? ?
??
r
i
s
j
t
k
iji j kE XXS
1 1 1
2.)(
?
?
??
r
i
iA XXstS
1
2)..(
?
?
??
s
j
jB XXrtS
1
2)..(
? ?
? ?
? ????
r
i
s
j
jiijBA XXXXtS
1 1
2).....(
§ 3.3 各偏差平方和的意义
? SE表示试验的随机波动引起的误差,称为误差
平方和 ;
?SA除了反映了试验的随机波动引起的误差外,还反
映了因子 A的效应间的差异,称为因子 A的偏差平方和 ;
?SB除了反映了试验的随机波动引起的误差外,还反映
了因子 B的效应间的差异,称为因子 B的偏差平方和 ;
?SA× B除了反映了试验的随机波动引起的误差外,还
反映了交互效应的差异所引起的波动,称为交互作
用的偏差平方和,
))1(,1(~
)1(/
)1/(,
01 ???
?? trsrF
trsS
rSFH
E
A
A为真时当
? 同无交互作用的情况类似可得,
§ 3.4 检验统计量及显著性检验
))1(),1)(1((~
)1(/
)1)(1/(
,
03
???
?
??
? ?
?
trssrF
trsS
srS
FH
E
BA
BA
为真时当
))1(,1(~
)1(/
)1/(,
02 ???
?? trssF
trsS
sSFH
E
B
B为真时当
? 这就是用来检验假设 H01,H02,H03,的统计量,按照显
著性假设检验程序,对给定的显著性水平 α,
? 当 FA>F1-α(r-1,rs(t-1))时拒绝 H01;
? 当 FB>F1-α(s-1,rs(t-1))时拒绝 H02;
? 当 FA× B>F1-α((r-1)(s-1),rs(t-1))时拒绝 H03,
? 具体的计算过程,各偏差平方和的计算也可用下
面简化的表达式,且可列成一张计算表和方差分析
表,
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??????
???????
????
????
????
?
?
?
?
?
?
?
?
? ? ?
? ?
?
?
? ? ?
)1(
)1)(1(
1
1
1
1
1
1
,
1 1
22
.
2
1
2
..
2
1
2
..
1 1 1
22
trsfSSSSS
srfSSXnX
t
S
sfXnX
rt
S
rfXnX
st
S
rs tfXnXS
EBABATE
r
i
BA
s
j
BAijBA
B
r
i
jB
A
r
i
iA
T
r
i
s
j
t
k
i j kT
可用下式在具体计算时
有 交 互 作 用 方 差 分 析 计 算 表
B 因子 A 的
B
1
B
2
… B
s
x
i,.
x
2
i,.
A
1
x
11,
x
12,
… x
1s,
A
2
x
21,
x
22,
… x
2s,
… … … … …
A
因
子
A
r
x
r1,
x
r2,
… x
rs,
x
.j,
总和B
的
x
2
.j,
有 交 互 作 用 方 差 分 析 表
来源 平方和 自由度 均方和 F 值 显著性
因子 A S
A
r-1 S
A
/ ( r - 1 ) F
A
因子 B S
B
s -1 S
B
/ ( s - 1 ) F
B
A × B S
A × B
( r - 1 ) ( s - 1 )
S
A × B
/
( r - 1 ) ( s - 1 )
F
A × B
误差 S
E
r s ( t - 1 ) S
E
/ r s ( t - 1 )
总和 S
T
r s t -1
? 一般,当 F>F0.01时,称因子的影响高度显著,记为,**” ;
当 F0.01>F≥F0.05时,称因子的影响显著,记为,*” ;当 F<
F0.05时,称因子无显著影响,即认为因子各水平间无差异,
? 例,在某化工生产中为了提高收率,选了三种不同浓
度,四种不同温度做试验,在同一浓度与同一温度组合
下各做二次试验,其收率数据如下而计算表所列 (数据
均已减去 75).试检验不同浓度,不同温度以及它们间的
交互作用对收率有无显著影响,
温度
浓度
B
1
B
2
B
3
B
4
x
i,.
x
2
i,.
A
1
14, 10
( 2 4 )
1 1,1 1
( 2 2 )
1 3,9
( 2 2 )
1 0,1 2
( 2 2 )
90 8100
A
2
9,7
( 1 6 )
1 0,8
( 1 8 )
7,1 1
( 1 8 )
6,1 0
( 1 6 )
68 4624
A
3
5,1 1
( 1 6 )
1 3,1 4
( 2 7 )
1 2,1 3
( 2 5 )
1 4,1 0
( 2 4 )
92 8464
x
.j,
56 67 65 62 250 2 1 1 8 8
x
2
.j,
3136 4489 4225 3844 15694
?解,
0000.65
0000.275000.113333.441667.26045374
2
1
5000.111667.260415694
6
1
3333.441667.260421188
8
1
8333.1471667.26042752
5374
1667.2604)(
24
1
2752
24,2,4,3
3
1
4
1
2
.
2
3
1
4
1
2
1
3
1
4
1
2
1
2
?????
??????
????
????
???
?
??
??????
?
?
? ?
? ? ?? ? ?
? ?
? ? ?? ? ?
BABATE
BA
B
A
T
i j
ij
i j k
i j k
i j k
i j k
SSSSS
S
S
S
S
x
xx
rs tntsr这里
方差分析表
来源 平方和 自由度 均方和 F 值 显著性
因子 A 4 4, 3 3 3 2 2 2, 1 6 6 7 4, 0 9 **
因子 B 1 1, 5 0 0 0 3 3, 8 3 3 3 <1
A × B 2 7, 0 0 0 0 6 4, 5 0 0 0 <1
误差 6 5, 0 0 0 0 12 5, 4 1 6 7
总和 1 4 7, 8 3 3 3 23
?查表知 F0.05(2,12)=3.89,F0.01(2,12)=6.93;
F0.05(3,12)=3.49,F0.01(3,12)=5.95;
F0.05(6,12)=3.00,F0.01(6,12)=4.81,
?由此知 F0.05<FA< F0.01,而 FB<F0.05,FA× B<F0.05.故浓度不同
将对收率产生显著影响 ;而温度和交互作用的影响都不
显著,