第四章 多个样本均数比较的
方差分析
第四节 拉丁方设计资料的方
差分析
问题的提出
? 设计方法 研究目的 非处理因素的控制
? 完全随机分组 处理因素 随机化分组平衡
? 随机区组 处理因素 区组(行方向)
? 可控制一个主要
? 的非处理因素
? 拉丁方 处理因素 可控制二个主要
? 的非处理因素
一、拉丁方设计
( Latin-square design)
? 拉丁方是用拉丁字母排列安排为 K
× K ( K =处理因素的水平数)方阵
的实验设计。
? 例:
? 列
? 1 2 3
? 1 A B C
? 行 2 B C A
? 3 C A B
?
处理水
平数 =3
? 是随机区组设计的扩展,通过行
和列两个方向的区组,控制两个
已知影响实验结果变异的因素,
缩小实验误差,提高统计检验效
率 。
优点:
? 实验设计方法
? 拉丁字母的个数代表处理因素的水平数
? 行和列安排两个需控制的非处理因素
? 特点:行数 =列数 =处理的水平数,处理的每个
水平在行或列中只出现一次。
? 使用时:在基本拉丁方基础上随机化重新分配
处理(方法见讲义),也可使用基本拉丁方。
? 列
? 1 2 3
? 1 A B C
? 行 2 B C A
? 3 C A B
?
处理水平数
=3的基本拉
丁方表
拉丁方设计实例
? 题目,比较不同剂量的重组人肿瘤坏死
因子对伤口愈合的研究
? 研究因素:肿瘤坏死因子
? 因素的水平,5个剂量( 0,25,50,100,
200)单位
? 实验对象:家兔 5只
? 实验效应指标:伤口愈合张力强度
? 控制因素 1:不同伤口的部位
? 控制因素 2:不同试验的对象(家兔)
? 方法:取家兔 5只,每只在 5个不同
部位做切口。
? 采用 5 × 5的拉丁方表,随机分配处
理的剂量。
5 × 5基本拉丁方排列表
? 行区组 伤口部位(列区组)
? 家兔编号 1 2 3 4 5
? 1 A B C D E
? 2 B C D E A
? 3 C D E A B
? 4 D E A B C
? 5 E A B C D
随机分配处理方法见讲义
处理因素:用 A,B,…E 表示
例:家兔伤口用不同剂量的 rh-
TNF后的张力强度
? 伤口编号
? 家兔编号 1 2 3 4 5 小计
? 1 A9.83 B6.34 C7.03 D4.40 E9.18 43.48
? 2 B3.75 C7.52 D7.64 E5.51 A7.60 36.95
? 3 C6.27 D8.34 E8.80 A9.91 B2.55 42.50
? 4 D5.54 E3.86 A5.55 B7.88 C5.94 39.18
? 5 E5.73 A3.22 B3.63 C7.12 D8.90 28.60
? 列小计 38.46 38.18 39.81 39.27 36.65
随机化过程(见讲义 60页)
? 1.随机化方法调换行字母
? 2.随机化方法调换列字母
? 3.拉丁字母的随机分配处理水平
? 方法:读 6个随机数
? 随机数 35 56 27 09 24 86
? 序号 4 5 3 1 2 6
? 字母 D E C A B F
? 处理药 甲 乙 丙 丁 戊 已
? (规定:按序号大小排列字母顺序,按字母前后
出现顺序分配不同水平)
二、拉丁方设计的方差分析
? 数据变异分解:
? 处理因素(不同剂量 +误差 )
? 总变异 行区组变异 (单位组或家兔间 +误差)
? 列区组变异(不同部位 +误差)
? 误差变异(随机因素 +未知因素)
?
?
误差
处理
MS
MS
F ?1
如 F处理 >F0.05,再对处理组做均数的多重比较 。
误差
家兔间
MS
MS
F ?2
误差
部位间
MS
MS
F ?3
注射部位编号(列区组) 行区组
合计行区组) 1 2 3 4 5 6
1 424
2 71.7
3 424
4 71.7
5 424
6 71.7
列区组
合计
428 417 440 431 469 467
药物
合计 Tk
D
428
E
467
C
439
A
459
B
420
F
439
表 4-11 拉丁方与试验结果(皮肤疱疹大小)
处理因素不同水平的结果
? 例:表 4-11
? D=77+60+64+71+69+87=428
? E=73+75+99+61+85+74=467
? 同理:
? C=439
? A=459
? B=420
? F=439
表 4-13 例 4-5的方差分析表
变异来源 SS MS F P
总变异 3036.00 35
药物间 268.67 5 53.73 0.98 >0.05
家兔间 383.33 5 76.67 1.39 >0.05
部位间 1283.33 5 256.67 4.66 <0.01
误 差 1100.67 20 55.03
?
71.220,5,05.0 ?F 10.420,5,01.0 ?F
表 4-13 例 4-5的方差分析表
变异来源 F P
总变异 35
药物间 0.98 5 >0.05
家兔间 1.39 5 >0.05
部位间 4.66 5 <0.01
误 差 20
? 21,,???F
71.220,5,05.0 ?F
71.220,5,05.0 ?F
10.420,5,01.0 ?F
71.220,5,05.0 ?F
拉丁方设计的统计检验假设
等处理因素对部位作用相:
等处理因素对家兔作用相:
:不等或不全等
处理因素作用相等
,...
,...
,...:
603
02
1
01
21
621
CCC
RRR
FBA
H
H
H
H
???
???
???
??
??
??
05.0??
例 4-4 统计检验结果
? 处理因素:按 α=0.05水准,还不能认为
处理( 6种药物)不同水平的实验效应
(皮肤疱疹)的结果不等( p> 0.05)。
? 非处理因素:药物对不同家兔的结果差
别无统计意义( p> 0.05)。对不同部位
结果差别有统计意义( p< 0.01)。
? 结论,还不能认为皮肤疱疹的大小与 6种
药物有关,但注射在不同部位有差别。
拉丁方设计的缺点(局限性)
? 1.要求行数(水平数) =列数(水平
数) =处理(水平数),条件不易满
足。
? 2.在处理数的水平数较少时,试验的
重复数( n)较少(如 3× 3拉丁方设
计,重复例数为 3),检验效率较低。
第五节、两阶段交叉试验
设计与方差分析
一、两阶段交叉设计
问题的提出
? 完全随机分组试验( RCT)设计
例:比较两种药物(如:试验药、对照药)
?
? 甲组( n1) 试验药
? N个对象随机分组
? 乙组( n2) 对照药
? 特点:每个患者接受一种处理,然后结果在两组
受试对象间做比较。
?
完全随机分组设计的缺点:
? 1.完全随机分组设计组间非处理因素差
别不可能完全一致(特别是例数较少
时)。
? 2.处理试验效应在患者间得到的,试验
效应受到个体差异的影响。
? 3.当影响因素作用大,处理的实验作用
小,所需样本例数较多。
消除(减少)个体变异的设计方法
? 1.试验前后设计
? 特点:每个研究对象只接受一种处理。
? 2.配对(配伍)设计
? 特点:每个研究对象只接受一种处理。
? 3.交叉设计
? 特点:每个研究对象可接受两种或多种
处理。
两阶段交叉设计 ( cross-over design)
模式
? 随机 试验阶段
? 分组 Ⅰ Ⅱ
? 甲组( n1) 甲药 乙药
? n,
? 乙组( n2) 乙药 甲药
两阶段交叉设计
? 交叉设计的优、缺点
? 优点:
? 1.每个试验对象先后接受两种处理,因此成
倍使用实验对象,例数少于随机分组设计。
? 2,患者的试验结果采用自身对照,减少个
体变异对结果的影响,效果观察较准确,
统计检验效率高于完全随机分组设计。
缺点,
? 1.两阶段间常安排洗脱阶段,比随机分组设
计试验的时间长
? 2 两阶段间不能有延滞效应( carry-over),
? 3.适用于反复发作的慢性病药物疗效比较
(止痛、安眠、降血压等)
? 延滞( carry-over)效应:是指前一时期处理的
效应延续到后一时期的处理结果上 。
二、两阶段交叉试验设计方法
? 设计的方法 (见 63页)
? 可采用
? 1.完全随机分组设计分配处理组的两阶
段交叉设计。
? 例 4-6,两种闪烁液测定血浆中 H-cGMP
? 2.配对设计分配两阶段的处理
两组比较完全随机化分组方法
? 研究对象( n=10)编号(按入组顺序):
? 编号 1 2 3 4 5 6 7 8 9 10
? 随机数 22 19 16 78 03 93 23 15 58 57
? 序号 5 4 3 9 1 10 6 2 8 7
? 规定:序号双号处理顺序 AB,单号处理顺序
BA
? 对象编号 处理顺序 阶段 1 阶段 2
? 1 BA B A
? 2 AB A B
? 3 BA B A
? 4 BA B A
? 5 BA B A
表 4-13两种闪烁液测定血浆中 H-
cGMP交叉试验结果
? 受试者 阶段 1 阶段 2 合计
? 编号 处理( GMP) 处理( GMP)
? 1 A 760 B 770 1530
? 2 B 860 A 855 1715
? 3 A 568 B 602 1170
? 4 A 780 B 880 1580
? 10 B 800 A 803 1603
? 阶段合计 S1=7271 S2=7370 14641
? 处理合计 A=7289 B=7352
iB
三,两阶段交叉设计数据的
统计方法 — 方差分析
? 数据变异来源和分解:
? 处理间变异( A和 B处理变异)
? 受试者间的变异(行变异)
? 阶段间变异(列变异)
? 误差变异
总变异
误差
处理
MS
MS
F ?1
误差
受试者间
MS
MS
F ?2
误差
阶段间
MS
MS
F ?3
两阶段交叉设计是拉丁方设计
处理水平 =2的扩展
?
? 试验 时间
? 对象 1 2
? 1 A B
? 2 B A
? 受试者(行间变异)
? 阶段间(列间变异)
? 处理间
? 误差
5 5 1 1 1...)1 7 1 51 5 3 0(
2
1
2
1 222
1 ??????? CCBss i
05.49020/)73707271()(
2
1 22
212 ????? SSNSS
45.19820/)7 3 5 27 2 8 9()(
2
1 22
213 ????? TTNSS
0.395????? 受试处理阶段总 SSSSSSSSSS E
变异分解
计算方法与拉丁方设计资料相同
表 4-14 方差分析
? 方差来源 DF SS MS F P
? 受试者间 9 551111 61234 1240 < 0.01
? 阶段间 1 490.05 490.05 9.92 <0.05
? 处理间 1 198.45 198.45 4.02 >0.05
? 误差 8 395.00 49.38
? 总 19 552194.95
32.58,1,05.0 ?F
度分子自由度,分母自由,?F
F界值
91.58,9,01.0 ?F
交叉设计的结论
? 反映三部分作用
? 1.反映处理间的否有作用(主要关心)
? 2.反映试验对象(行区组变异)作用
? 3.反映 处理顺序(列区组变异)的影响




本例:实验误差中消除了个体和不同阶
段顺序的影响后,两种闪烁液对测定结
果无差别,但个体间和顺序有差别。
单因素设计资料的方差分析小结
? 设计方法 总变异的分解
? 完全随机分组设计 处理间 + 实验误差
? 随机区组设计 处理 +行间(个体) +误差
? 拉丁方设计 处理 +行间 +列间 + 误差
? 交叉设计 处理 +行间 +列间 + 误差
? 不同设计的目的主要减少实验误差,显示处
理的作用。
第六节、多个均数差别的多重比较
? 意义:
? 方差分析结果(处理)有统计学意义时, 如了解
各水平间均数差别情况,做均数间的多重比较。
? 研究者的目的 常用多重比较方法
? 1.处理组两两之间 LSD-t检验
? 的比较 SNK-q检验
? 2.各处理组仅与对照组做 Dunnett-t检验
? 比较
? 注意:多个均数的组间比较不要采用 t检验方法,而用多
重比较统计方法。
注意:多个组间均数的比较采用两组
t检验计算将增大犯 1型误差的概率。
? 某次研究对三组数据比较,如用 t检验两两比较
? 比较次数,t检验 整个实验 犯 1型误差概率
? A组与 B组 ?=0.05
? A组与 C组 ?=0.05
? B组与 C组 ?=0.05
? 注,K=实验中比较的次数
? 多重比较检验,控制增大犯 1型误差的概率
1 42 6.0
)05.01(1 3
?
???
k)1(1 ???
均数多重比较的检验方法
? 一, LSD-t检验
? 最小显著性差异的 t检验( least significant
difference)均数两两比较方法
ji xx
ji
S
XX
tL SD
?
?
??
)
11
(
ji
xx nnMSS ji ??? 误差
4-14
4-13
两均数差值
的标准误
??,ttLS D ?? ??p
LSD-t检验和 t检验的区别
? LSD-t检验 t 检验
误差
自由度 方差分析的
误差自由度
查 t界值表
相同
?
221 ??? nn?
)
11
(
ji
xx nnMSS ji ??? 误差 )
11
(2
ji
C nnS ?
??,t ??,t
? 例,4-2 降血脂新药 2.4g组与安慰剂比较
? 2.4g组
? 安慰剂组
30,72.2 ?? nx
30,43.3 ?? nx
17.0)
30
1
30
1(43.0)11( ??????
?
ji
xx nnMSS ji 误差
18.417.0 43.372.2 ????? tLS D
98.1116,2/05.0 ?t
01.0?p
6 2 6.21 1 6,2/01.0 ?t
各实验组与对照组比较
? 比较组 均数 LSD-t值 p 值
? 对照组 3.43
? 2.4g 组 2.72 -4.18 < 0.01
? 4.8g组 2.70 -4.29 < 0.01
? 7.2g组 1.97 -8.59 < 0.01
? 结论:各剂量均能降低低密度脂蛋白
含量。
2.Dunnett-t检验
? 适用多个实验组与一个对照组的比较
? 公式:
区别,查附表 5.1( 527-528页),Dunnett-t检
验临界值表
4-17
4-18
0
0
xx
i
i
S
XX
t
?
?
?
)
11
(
ji
xx nnMSS ji ??? 误差
? 例,4-2 降血脂新药 2.4g组,4.8g组、
7.2g组与安慰剂比较
1,2 /? 误差,组数 ? ?
t
18.44.2 ??t 29.48.4 ??t 59.8
2.7 ??t
40, 2 3 116,2 / 05, 0?, t
98, 2 3 116,2 / 01, 0?, t
结论:各剂量组与安慰剂比较低密度脂蛋
白均数差别有统计意义,( p< 0.01)。
区别:查 Dunnett-t界值表,528页
3,SNK-q检验 (Student-Newman-keuls)
? 用于多组均数间的两两比较
4-18
4-17
aq,,误差??
区别,查 q界值表( 526页),q界值表示:
BA XX
BA
S
XX
q
?
?
?
)
11
(
2 jixx nn
MS
S
ji
??? 误差
公式:
表 4-15 表 4-9资料三种药物抑瘤效果的比较
? 比较组 a q q0.05 q0.01 P
? 1与 2 0.12 2 2.73 3.26 4.75 > 0.05
? 1与 3 0.30 3 6.85 4.04 5.64 <0.01
? 2与 3 0.18 2 4.11 3.26 4.75 <0.05
BA XX ?
C药 B药 A药
均数 0.314 0.434 0.614
排序 1 2 3
a为对比组所包
含的组数
结论,B和 C在抑瘤效果差别无统计意义,A
药抑瘤的重量高于 C和 B,疗效比 C和 B差。
用 q检验做均数两两比较,
? H0,?=0.05
? H1:,?A不等 ?B
BA ?? ?
0438.0)
5
1
5
1
(
2
0096.0
)
11
(
2
???
??
?
ji
xx
nn
MS
S
ji
误差
73.2
0 4 3 8.0
3 1 4.04 3 4.0 ???q
0 0 9 6.0?误差MS
aq,误差??,
8?误差本例 ?
三种多重方法比较的小结
? 例:多个均数的两组比较,设 α=0.05,误差自由度
=116时的界值比较
? 方法 0.05的界值 控制 α错误
? 1.LSD-t检验 t=1.98 小
? 2,Dunnett-t检验 t= 2.40 中
? 3,SNK-q检验 q=2.80( a=2) 强
? q= 3.36( a=3)
?
总结
? 方差分析
? 是多个均数间整体性的比较,如果 F值
无统计意义,或 F=1附近,说明处理因素作
用相等。
? 均数的多重比较
整体比较有统计意义后进行两两比较
方法,SNK,Dunnett,LSD