返回
第 6章 方差分析
?第 6.1节 方差分析的基本思想
?第 6.2节 单因素方差分析
?第 6.3节 双因素方差分析
返回
返回
在现实的生产和经营管理中,经常要分析各种因素对研
究对象某些特征值的影响,
方差分析 (analysis of variance)就是采用数理统计方法
对数据进行分析,以鉴别各种因素对研究对象的某些
特征值影响大小的一种有效方法,
研究对象的特征值,即所考察的试验 (其涵义包括调查,
收集等 )结果(如产品质量、数量、销量、成本等)称为
试验指标,简称 指标,常用 x表示,
在试验中对所关心的“指标”有影响的、要加
以考察而改变状态的原因称为 因素,用 A,B,C
等大写英文字母表示,
第 6.1节 方差分析的基本思想
返回
因素在试验中所取的各种不同状态称为因素的 水平,
因素 A的 r个水平常用 A1,A2,…, A r表示,
其中 r称为因素 A的 水平数,
若在试验中考虑了因素的全部水平,则该因素称为 固定因
素 ;若在试验中仅随机选择了因素的部分水平,则该因素
称为 随机因素,
若只考察一个因素对指标的影响, 这种试验称为 单因素试
验, 相应的方差分析就称为 单因素方差分析 ;
若一个试验中同时考察两个因素, 则相应的试验称为 双因
素试验, 这时所作的方差分析称为 双因素方差分析,
在多因素试验中要考察的因素多于两个, 相应的方差分析
称为 多因素方差分析,
返回
例 6.1.1 某公司为了研究三种内容的广告宣传对某
种无季节性的大型机械销售量的影响进行了调查统计,经
广告广泛宣传后, 按寄回的广告上的订购数计算, 一年四
个季度的销售量 (单位,台 )为,
广告类型 第一季度 第二季度 第三季度 第四季度
A1 163 176 170 185
A2 184 198 179 190
A3 206 191 218 224
A1是强调运输方便性的广告,A2是强调节省燃料的经济性
的广告,A3是强调噪音低的优良性的广告,试判断,新闻广
告的类型对该种机械的销售量是否有显著影响?若影响显
著,哪一种广告内容为好?
新闻广告是所要 检验的因素,三种不同的内容是
三个 水平,这是一个 单因素三水平的试验,
返回
试验过程中各种偶然性 (随机性 )因素的干扰所致差异,称
为 试验误差,
如果差异单纯是由误差引起的,那么我们认为广告的不
同类型对销售量没有显著影响,则可简称 因素 (新闻广
告 )不显著,如果不同广告下销售量的不同,除了误差
影响外,主要是由于广告类型 (水平 )不同所造成的,那
么我们就认为因素的不同水平对销售量有显著影响,简
称 因素显著,
方差分析就是通过对试验结果的分析去判断因素本身及
各因素间交互作用对指标是否影响显著的一种统计方法,
返回
单因素方差分析 (single factor analysis of variance)是
要判断因素各水平对指标是否有显著影响, 归结为判
断不同总体是否有相同分布的问题,
由于实际中常遇到的是具有正态分布的总体, 同时,
在进行方差分析时, 除了所关心的因素外, 其他条件
总是尽可能使其保持一致, 这样就可以认为每个总体
的方差是相同的, 因而, 判断几个总体是否具有相同
分布的问题就简化为检验几个具有等方差的正态总体
均值是否相等的问题,
第 6.2节 单因素方差分析
返回
考虑的因素记为 A,假定它有 r个水平,并对水平 Ai作了
ni次观察,第 i水平的第 j次观察为,这样可得观察资料ijx
1 2 ? in
A 1
11
x
12
x ?
1
1 n
x
A 2
21
x
22
x ?
2
2 n
x
? ? ? ? ?
A r
1r
x 2rx ? rrn
x
设 是来自总体 的简单随机样本,),(N 2i ??)n,3,2,1j(x iij ??
),0(~,2???? Nx ijijiij ??
检验
rH ??? ??? ?210,
其中
1,数学模型
返回
????? ???? ??
??
ii
r
i
i
r
i
ii nnnn,,
1
11

.0n,x
r
1i
iiijiij ???? ?
?
???? 其中则
???? ???? r210,H ?
等价于 0:H r210 ????? ??? ?
记总观察次数,组平均值,
总平均值,则有平方和分解式,
?
?
?
r
1i
inn ?
?
?
in
1j
ij
i
i xn
1x
?? ?
?? ?
??
r
1i
ii
r
1i
n
1j
ij xnn
1x
n
1x i
2,方差分析
返回
21
r
1i
2
ii
r
1i
n
1j
2
iij
r
1i
n
1j
2
ij QQ)xx(n)xx()xx(Q
ii
???????? ?? ?? ?
?? ?? ?
Q称为总离差平方和,简称 总平方和,它反映全部数据之间
的差异;
Q1称为 误差平方和或组内平方和,反映了随机误差的影响;
Q2称为 组间平方和或因素 A的平方和,反映了各总体的样本
平均值之间的差异,在一定程度上反映了 间的差异程度,
因而通过 Q2与 Q1的相对大小可以反映 H0是否成立,
i?
若 Q2显著地大于 Q1,说明 间的差异显著地大于随机
误差,那么 H0可能不成立,
ix
返回
),rn,1r(F~|
rnQ
1rQF
0H
1
2 ??
?
??
成立

也就是说有 的把握认为因素对指标有显著影响,
即 间的差异是显著的,
??1
i?
给定显著性水平 ?? ???? }),1({,FrnrFP当 时,拒绝 H0.
返回
通常情况下要列出 方差分析表 (analysis of variance table):
方差来源 平方和 自由度 均方 F 值 显著性
因素
误差
总和 Q
Q
Q
1
2
1
1
?
?
?
n
rn
r
)/(
)1/(
1
2
1
2
2
2
rnQS
rQS
??
??
2
1
2
2
/ SS
采用 EXCEL软件可得到分析结果,
返回
例 6.1.1 某公司为了研究三种内容的广告宣传对某
种无季节性的大型机械销售量的影响进行了调查统计,经
广告广泛宣传后, 按寄回的广告上的订购数计算, 一年四
个季度的销售量 (单位,台 )为,
广告类型 第一季度 第二季度 第三季度 第四季度
A1 163 176 170 185
A2 184 198 179 190
A3 206 191 218 224
A1是强调运输方便性的广告,A2是强调节省燃料的经济性
的广告,A3是强调噪音低的优良性的广告,试判断,新闻广
告的类型对该种机械的销售量是否有显著影响?若影响显
著,哪一种广告内容为好?
返回
05.00 0 3 9 0 7.0}9 3 0 1 3.10)9,2(F{P ????
所以拒绝 H0,即认为广告内容不同对销售量的影
响是显著的,
分析结果如下,
返回
第 6.3节 双因素方差分析
双因素方差分析的数据结构为
1,无交互作用的双因素方差分析 (double factor
analysis of variance) B 1 B 2 B 3 ? B s
r
A
A
A
?
2
1
rsrrr
s
s
xxxx
xxxx
xxxx
?
????
?
?
321
2232221
1131211
因素
返回
因素 A的第 i种效应和因素 B的第 j种效应分别记作,
试验误差记作,那么
ij?
ji,??
)s,,2,1j;r,,2,1i(x ijjiij ?? ?????? ????
其 中
? ???
? ???
? ??
?
?
?
? ???
???
??????
????
r
i
s
j
ij
r
j
ijj
s
j
iji
jjii
r
i
s
j
ij
s
j
j
r
i
x
rs
xx
r
xx
s
x
sjxxrixx
x
rs
i
1 111
..
1 111
,
1
,
1
,
1
),,,2,1(
?
),,,2,1(?
,?,
1
,0,0
?? ??
?????
假定 ),0(N~ 2
ij ??
(1)数学模型
返回
判断因素 A是否显著,等价于检验假设
0:H r2101 ???? ??? ?
判断因素 B是否显著等价于检验假设
0:H s2102 ???? ??? ?
将总离差平方和 Q进行分解,
? ? ? ? ????????,)xxxx(Q,)xx(rQ,)xx(sQ 2j..iij32j.22.i1
其中
选取检验统计量,
,)1s)(1r/(Q )1s/(QF,)1s)(1r/(Q )1r/(QSSF
3
2
B
3
1
2
3
2
1
A ??
??
??
???
,QQQ)xx(Q 321
r
1i
s
1j
2
ij ????? ? ?
? ?
( 2)方差分析
返回
列出如下方差分析表,
方差来源 平方和 自由度 均方 F 值 显著性
A Q 1 r - 1 S 1
2
S 1
2
/S 3
2
B Q 2 s - 1 S 2
2
S 2
2
/S 3
2
误差 Q 3 ( r - 1 ) ( s - 1 ) S 3
2
总和 Q r s - 1
利用 EXCEL软件来实现计算问题,
返回
例 6.3.1 为提高某种产品的合格率,考察原料用量
和来源地对其是否有影响,原料来源地有三个,甲、乙、丙,
原料用量有三种,现用量、增加 5%、增加 8%.每个水平组合
各做一次试验,得到的数据如下, 现用量 ( 1 ) 增加 5% ( 2 ) 增加 8% ( 3 )
甲地 ( 1 ) 59 70 66
乙地 ( 2 ) 63 74 70
丙地 ( 3 ) 61 66 71
试分析原料用量及来源地对产品合格率的影响是否显著,
解, 设原料来源地为因素 A,三个地区为因素 A的三个水平,
第 i个水平对合格率的特殊效应为 ;原料用量为因素
B,三种用料量为因素 B的三个水平,第 j个水平对合格率的
特殊效应为,
)3,2,1i(i ??
)3,2,1j(j ?? 原假设为
0:H0:H 3210232101 ?????? ??????
返回
由 EXCEL软件可得如下成果:
最优条件为 A2B2,即采用乙地原料并在原有用料量上
增加 5%,这一方案为最佳,
返回
例 6.3.2 抗牵拉强度是硬橡胶的一项重要的性能指标, 现
试验考察下列两个因素对该指标的影响,
A( 硫化时间 ), A1( 40秒 ), A2( 60秒 ),
B( 催化剂种类 ), B1( 甲种 ),B2( 乙种 ),B3( 丙种 ),
六种组合水平下,各重复做了两次试验,测得数据 (单位:
kg/cm2)如下,试问因素 A,因素 B对该指标的影响是否显著? B 1 B 2 B 3
A 1 39 0 3 80 44 0 4 20 37 0 3 50
A 2 39 0 4 10 45 0 4 30 37 0 3 80
2,有交互作用的双因素方差分析
返回
应用 EXCEL软件可得如下结果:
从以上结果可见,乙种催化剂、硫化 60秒可使硬橡
胶的抗牵拉强度达到最大,