两因素方差分析两因素方差分析中的基本概念例1-1(pp1):四种疗法治疗缺铁性贫血后红细胞增加数服用A药,则A=2,否则A=1;服用B药,则B=2,否则B=1
疗法
X
总体均数
A
B
疗法1(一般疗法)
0.8,0.9,0.7
(11
1
1
疗法2(一般疗法+A药)
1.3,1.2,1.1
(21
2
1
疗法3(一般疗法+B药)
0.9,1.1,1.0
(12
1
2
疗法4(一般疗法+A药+B药)
2.1,2.2,2.0
(22
2
2
两因素Stata数据输入格式
x
a
b
1
0.8
1
1
2
0.9
1
1
3
0.7
1
1
4
1.3
2
1
5
1.2
2
1
6
1.1
2
1
7
0.9
1
2
8
1.1
1
2
9
1
1
2
10
2.1
2
2
11
2.2
2
2
12
2
2
2
命令 anova x a b a*b
其中a 表示A药疗效的主效应,b表示B药疗效的主效应,a*b表示A药与B药对疗效的交互作用结果如下
Number of obs = 12 R-squared = 0.9737
Root MSE =,10 Adj R-squared = 0.9638
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 2.96249994 3,98749998 98.75 0.0000
|
a | 1.6875 1 1.6875 168.75 0.0000
b |,907499974 1,907499974 90.75 0.0000
a*b |,367499967 1,367499967 36.75 0.0003
|
Residual |,080000002 8,01
-----------+----------------------------------------------------
Total | 3.04249994 11,276590904
结果表明:对于(=0.05而言
H10:没有交互作用并且A药和B药疗效的主效应都没有差异
H11:有交互作用或A药主效应有差异或B药主效应有差异
FModel=98.75,P值<0.05,因此认为模型是有效的(或有交互作用或有主效应)。
H20:没有交互作用
H21:有交互作用
FA×B=36.75,P值=0.0003<0.05,因此A药与B药的疗效有交互作用,并且有统计意义。
H30:A药没有差异
H31:A药主效应有差异
FA=168.75,P值<0.05,A药的主效应有统计意义
H40:B药没有差异
H41:B药主效应有差异
FB=90.75,P值<0.05,B药的主效应也有统计意义。
问题:模型是什么?
模型:
其中(ab是x的总体均数,(a称为A因素的主效应,(b称为B因素的主效应,((()ab称为A因素和B因素对因变量x(观察指标变量)的交互作用。
主效应的意义
A药
B药
平均
A主效应表示
未服用
服用
未服用
(11
(12


服用
(21
(22


平均



B主效应


称(1和(2为A因素的主效应,(1和(2为B因素的主效应。并且可以验证:(1+(2=0(即:(1=-(2)以及(1+(2=0((1=-(2)
若(1=(2(即(1=(2=0),则对应A因素的主效应没有作用。
若(1=(2(即(1=(2=0),则对应B因素的主效应没有作用。
交互作用的意义
A药
B药
A主效应表示
未服用
服用
未服用
(11=(..+(1+(1+((()11
(12=(..+(1+(2+((()12

服用
(21=(..+(2+(1+((()21
(22=(..+(2+(2+((()22

B主效应



即:((()11=(11-(..-(1-(1 ((()12=(12-(..-(1-(2
((()21=(21-(..-(2-(1 ((()22=(22-(..-(2-(2
并且根据(.1,(.2,(1.,(2.和(..定义,请验证:
((()11+((()12=0 =>((()11=-((()12
((()11+((()21=0 =>((()11=-((()21
((()21+((()22=0 => ((()22=-((()21=((()11=-((()12
((()12+((()22=0
若((()11=((()22=((()21=((()12=0,则称无交互作用。否则称A因素和B因素对观察指标构成交互作用。
例如:若无交互作用模型:并称为Reduced模型
(称有交互作用的模型为饱和模型或全模型)
A药
B药
A主效应表示
未服用
服用
未服用
(11=(..+(1+(1
(12=(..+(1+(2

服用
(21=(..+(2+(1
(22=(..+(2+(2

B主效应




A药
B药
平均
A主效应表示
未服用
服用
未服用
0.5
(0.65-0.05-0.1)
0.7
(0.65-0.05+0.1)
(1.=0.6
(1.=0.65-0.05
((1=-0.05)
服用
0.6
(0.65+0.05-0.1)
0.8
(0.65+0.05+0.1)
(2.=0.7
(2.=0.65+0.05
((2=0.05)
平均
(.1=0.55
(.2=0.75
(..=0.65
B主效应
(.1=0.65-0.1
((1=-0.1)
(.2=0.65+0.1
((2=0.1)
未服用A药时,未服用B药与服用B药均数差值(11-(12=(1-(2=2(1
服用A药时,未服用B药与服用B药均数差值为(21-(22=(1-(2=2(1
即:B药的疗效与是否服用A药无关,并且B药的疗效正好为B药的主效应的差异=2(1
未服用B药时,未服用A药与服用A药均数差值(11-(21=(1-(2=2(1
服用B药时,未服用A药与服用A药均数差值为(12-(22=(1-(2=2(1
即:A药的疗效与是否服用B药无关,并且A药的疗效正好为A药的主效应的差异=2(1。
有交互作用的情况
A药
B药
A主效应表示
未服用
服用
未服用
(11=(..+(1+(1+((()11
(12=(..+(1+(2+((()12

服用
(21=(..+(2+(1+((()21
(22=(..+(2+(2+((()22

B主效应



未服用A药时,未服用B药与服用B药均数差值:
(11-(12=(1-(2+((()11-((()12=2(1+2((()11
服用A药时,未服用B药与服用B药均数差值:
(21-(22=(1-(2+((()21-((()22=2(1-2((()11,因此((()11不为0时,未服用B药与服用B药均数差值与是否服用A药有关。即交互作用。
同理可以验证未服用A药与服用A药均数差值与是否服用B药有关。即交互作用。
如A药
B药
平均
A主效应表示
未服用
服用
未服用
0.4
(.75-.25-.15-.05)
0.8
(0.75+.25-.15+.05)
(1.=0.6
(1.=0.75-0.15
((1=-0.15)
服用
0.6
(.75-.25+.15+.05)
1.2
(.75+.25+.15-.05)
(2.=0.9
(2.=0.75+0.15
((2=0.15)
平均
(.1=0.5
(.2=1.0
(..=0.75
B主效应
(.1=0.75-0.25
((1=-0.25)
(.2=0.75+0.25
((2=0.25)
红色的数值为交互效应
如果有交互作用,则:
两个药都用的均数>A药的均数+B药的均数-两个药都未用的均数(本例即:(22>(12+(21-(11),则称协同作用。
两个药都用的均数<A药的均数+B药的均数-两个药都未用的均数(本例即:(22<(12+(21-(11),则称拮抗作用。
在实际统计时,如果检验的结果为有交互作用,只需用相应的样本均数代替总体均数验算一下:判断协同作用还是拮抗作用。
两因素方差分析中的两两比较(简单效应的组间比较Comparison of simple effect by group):有许多方法可以进行两两比较,这里介绍的LSD方法进行两两比较。分两个步骤进行。
一、借用单因素方差分析的方法进行方差齐性检验和统计描述:
以pp1中的例1-1为例:在该研究中有两个因素,每个因素有2个水平:用和不用,因此共有4种情况,对应有4组,两因素方差分析的两两比较时,可以转化为4组(各个因素的水平数之和)的单因素方差分析。
仍以上述Stata文件结构:产生分组变量group
gen group=a+(b-1)*2
对应的关系为:
A
B
group
1
1
1
2
1
2
1
2
3
2
2
4
oneway x group,t sidak
| Summary of x
group | Mean Std,Dev,Freq.
------------+------------------------------------
1 |,79999999,09999999 3
2 | 1.2,09999996 3
3 | 1,10000002 3
4 | 2.1,10000002 3
------------+------------------------------------
Total | 1.275,5259191 12
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 2.96249994 3,98749998 98.75 0.0000
Within groups,080000002 8,01
------------------------------------------------------------------------
Total 3.04249994 11,276590904
Bartlett's test for equal variances,chi2(3) = 0.0000 Prob>chi2 = 1.000
结果说明:各组方差齐性
anova x group
Number of obs = 12 R-squared = 0.9737
Root MSE =,10 Adj R-squared = 0.9638
Source | Partial SS df MS F Prob > F
-----------+----------------------------------------------------
Model | 2.96249994 3,98749998 98.75 0.0000
|
group | 2.96249994 3,98749998 98.75 0.0000
|
Residual |,080000002 8,01
-----------+----------------------------------------------------
Total | 3.04249994 11,276590904
4组的总体均数不全相同。
regress
------------------------------------------------------------------------------
x Coef,Std,Err,t P>|t| [95% Conf,Interval]
------------------------------------------------------------------------------
_cons 2.1,057735 36.37 0.000 1.966863 2.233137
group
1 -1.3,0816497 -15.92 0.000 -1.488284 -1.111716
2 -.9,0816497 -11.02 0.000 -1.088284 -.7117155
3 -1.1,0816497 -13.47 0.000 -1.288284 -.9117155
4 (dropped)
------------------------------------------------------------------------------
Coef.表示第4组均数-其他组的均数的差值,如:第4组均数-第2组均数的差值=-0.9。
P>|t|表示第4组均数与其他组的均数比较的P值,如第4组均数与第2组均数比较的P值=0.000。
即:第4组(用A药且用B药)的红细胞增加数均数大于其他3组的红细胞增加数均数,并且差别有统计学意义。
第1至3组的均数比较的检验操作如下:
第i组与第j组比较:test _b[group[i]]=_b[group[j]]
H0:(i=(j
检验命令
F值与P值
(1=(2
test _b[group[1]]=_b[group[2]]
F(1,8)=24.00
Prob>F=0.0012
(1=(3
test _b[group[1]]=_b[group[3]]
F(1,8)=6.00
Prob>F=0.0400
(2=(3
test _b[group[2]]=_b[group[3]]
F(1,8)=6.00
Prob>F=0.0400
结果说明:
第2组(不用B药情况下用A药)的红细胞增加数均数大于第1组(不用B药和A药)和第3组(不用A药情况下用B药)的红细胞增加数均数,差别有统计学意义。
第3组(不用A药情况下用B药)的红细胞增加数均数大于第1组(不用B药和A药)的红细胞增加数均数,差别有统计学意义。
判断何种交互作用组别
第1组
第4组
第2组
第3组
不用B药
用B药
不用B药
用B药
不用A药
用A药
用A药
不用A药
样本均数
0.8
2.1
1.2
1.0
0.8+2.1=2.9>
2.2=1.2+1.0
结合两因素方差分析的结果说明A药和B药的疗效构成协同作用。
结果小结:A药和B药均能使红细胞增加数提高。若仅用一个药的情况下,A药优于B药,但用两个药的疗效已经超过单独使用其中一个药的疗效之和(有协同作用)。
两因素方差分析的分析策略小结:
先做两因素方差分析确定是否有交互作用如果没有交互作用,看主效应的差别是否有统计学意义:若有统计学意义,考察相应的样本均数,确定哪种情况的均数高。
如果有交互作用,则不能分析主效应。而化为单因素的方差分析(组数为各个因素的水平数之和),作两两比较。
在有交互作用的情况下,通过计算样本均数确认交互作用为协同作用还是拮抗作用。