方差分析
( ANALYSIS OF VARIANCE)
方差分析 2
上次课小复习
标准差与标准误
正常值范围与可信区间
假设检验的原理与步骤
计算机操作 SPSS程序( 其实是第
三和第四步 )
常用的设计类型及分析方法
1,一组样本与总体的比较
2,两组样本的比较(成组设计)
3,两组样本的比较(配对设计)
4,单因素多组样本的比较(成组设计)
5,双因素多组样本的比较(配伍组设计)
6,三因素三组及以上设计(拉丁方设计)
7,三个或以上因素并交互作用(正交设计)
20名要求持续镇痛的病人被随机分到四组,接受同剂
量的吗啡,6小时后测量血中游离吗啡水平,问四组之
间 有无差别?
静脉点滴 肌肉注射 皮下注射 口服
12 12 9 12
10 16 7 8
7 15 6 8
8 10 11 10
9 16 7 9
14
均数 10 13.8 8 9.4
属于上述哪个类型?
方差分析 5
1,分析四种给药方式之间的吗啡水平是否有
显著差异, 也就是要判断, 给药方式, 对
,吗啡水平, 是否有显著影响 。
2,作出这种判断最终被归结为检验这四个给
药方式的吗啡水平的均值是否相等 。
3,若它们的均值相等, 则意味着给药方式对
吗啡水平没有影响的, 即它们之间的镇痛
效果没有显著差异;若均值不全相等, 则
意味着给药方式对镇痛效果是有影响的,
它们之间有显著差异 。
本章主要内容
第一节 方差分析的基本概念
第二节 成组设计的多个样本均数比较
第三节 配伍组设计的多个样本均数的比较
第四节 多个样本均数间的两两比较
方差分析 7
一、有关方差分析的几个符号
什么是方差?
离均差
离均差平方和 SS
方差( ?2 S2 ),也叫均方( MS)
标准差,S
自由度,?
关系,MS= SS/ ?
二、方差分析的基本思想
根据资料的设计类型,即变异的不同来
源,将全部观察值 总的离均差平方和 及
自由度 分解为两个或多个部分,除随机
误差外,其余每个部分的变异可由某个
因素的作用加以解释。
通过比较不同来源变异的均方( MS),
借助 F分布做出统计推断,从而了解该因
素对观察指标有无影响。
方差分析 9
三、统计量 F
F=MS组间 /MS组内
自由度,?组间 =组数 -1
?组内 =N-组数
通过这个公式计算出统计量 F,查表求出对应
的 P值,与 ?进行比较,以确定是否为小概率
事件。 (与 t检验公式进行对比,F 值不同,
结果有何不同)
第二节 成组设计的多个样本均数比较
(单因素方差分析)
21名要求持续镇痛的病人被随机分到四组,接受同剂
量的吗啡,6小时后测量血中游离吗啡水平,问四组之
间 有无差别?
静脉点滴 肌肉注射 皮下注射 口服
12 12 9 12
10 16 7 8
7 15 6 8
8 10 11 10
9 16 7 9
14
均数 10 13.8 8 9.4
属于以上哪个类型?如何建立数据库
列举存在的变异及意义
1、全部的 21个数据之间大小不等,与总体均
数也不同,这种变异称为总变异。
2、四个组均数不等,与总体均数也不相同,
存在变异:反映不同给药方式的效果和随机误
差。
3、四个组内个体间数据不同,与所在组的均
数也不相同:反映了观察值的随机误差。
各种变异的表示方法
各种变异的表示方法
SS总
?总
MS总
SS组内
?组内
MS组内
SS组间
?组间
MS组间
三者之间的关系,
SS总 = SS组内 + SS组间
?总 = ?组内 + ?组间
统计量 F 的计算及其意义
F=MS组间 /MS组内
自由度,?组间 =组数 -1
?组内 =N-组数
通过这个公式计算出统计量 F,查表求出对
应的 P值,与 ?进行比较,以确定是否为小概
率事件。
SPSS计算
ANALYZE- Compare Means- One-way
ANOVA- Dependent list()- Factor()
- OK
D e s c r i p t i v e s
吗 啡 水 平
6 1 0, 0 0 0 0 2, 6 0 7 6 8 1, 0 6 4 5 8 7, 2 6 3 4 1 2, 7 3 6 6 7, 0 0 1 4, 0 0
5 1 3, 8 0 0 0 2, 6 8 3 2 8 1, 2 0 0 0 0 1 0, 4 6 8 3 1 7, 1 3 1 7 1 0, 0 0 1 6, 0 0
5 8, 0 0 0 0 2, 0 0 0 0 0, 8 9 4 4 3 5, 5 1 6 7 1 0, 4 8 3 3 6, 0 0 1 1, 0 0
5 9, 4 0 0 0 1, 6 7 3 3 2, 7 4 8 3 3 7, 3 2 2 3 1 1, 4 7 7 7 8, 0 0 1 2, 0 0
21 1 0, 2 8 5 7 3, 0 1 8 9 9, 6 5 8 8 0 8, 9 1 1 5 1 1, 6 5 9 9 6, 0 0 1 6, 0 0
1, 0 0
2, 0 0
3, 0 0
4, 0 0
T o t a l
N M e a n S t d, D e v i a t i o n S t d, E r r o r L o w e r B o u n d U p p e r B o u n d
9 5 % C o n f i d e n c e I n t e r v a l f o r
M e a n
M i n i m u m M a x i m u m
A N O V A
吗 啡 水 平
9 2, 2 8 6 3 3 0, 7 6 2 5, 8 1 1, 0 0 6
9 0, 0 0 0 17 5, 2 9 4
1 8 2, 2 8 6 20
B e t w e e n G r o u p s
W i t h i n G r o u p s
T o t a l
S u m o f
S q u a r e s df M e a n S q u a r e F S i g,
SPSS计算结果
完整书写方差检验的过程
?建立假设,
H0, 4种给药方式的吗啡水平的总体均数相等 ?1 =
?2 = ?3 = ?4
H1, 4种给药方式的吗啡水平的总体均数不全相等
H1与 H0相反,如果 H0被否决,则 H1成立。
?确定显著性水平,用 ?表示。 区分大小概率事件的标准,
常取 0.05。
?计算统计量 F:根据资料的性质选择不同的统计方法。
注意都是在 H0成立的条件下进行计算。
?计算概率值 P,P的含义。
?做出推论:统计学结论和专业结论。
方差分析 20
应用条件(理论上讲)
?各样本是相互独立的随机样本
?各样本来自正态分布
?各样本方差相等,即方差齐。
例 题
某社区随机抽取糖尿病患者,IGT异常和正常
人共 30人进行载蛋白测定,结果如下,问 3种
人的载蛋白有无差别?
(单因素-??,观察值-??)
问题,1、分析问题,选择合适的统计方法
2、如何整理资料、输入计算机
方差分析 22
1 85.7 1 105.2 1 109.5 1 96.0 1
115.2 1 95.3 1 110.0 1 100.0 1 125.6
1 111.0 1 106.5 2 96.0 2 124.5 2
105.1 2 76.4 2 95.3 2 110.0 2 95.2
2 99.0 2 120.0 3 144.0 3 117.0 3
110.0 3 109.0 3 103.0 3 123.0 3 127.0
3 121.0 3 159.0 3 115.0
如何建立数据库?
方差分析 23
SPSS计算
ANALYZE- Compare Means- One-way
ANOVA- Dependent list()- Factor()
- OK
方差分析 24
D e s c r i pt i v e s
载 脂 蛋 白
11 1 0 5, 4 5 5 1 0, 8 7 3 1 3, 2 7 8 4 9 8, 1 5 0 1 1 2, 7 5 9 8 5, 7 1 2 5, 6
9 1 0 2, 3 8 9 1 4, 5 5 1 6 4, 8 5 0 5 9 1, 2 0 4 1 1 3, 5 7 4 7 6, 4 1 2 4, 5
10 1 2 2, 8 0 0 1 7, 0 6 7 2 5, 3 9 7 1 1 1 0, 5 9 1 1 3 5, 0 0 9 1 0 3, 0 1 5 9, 0
30 1 1 0, 3 1 7 1 6, 4 8 6 0 3, 0 0 9 9 1 0 4, 1 6 1 1 1 6, 4 7 3 7 6, 4 1 5 9, 0
1
2
3
To t a l
N M e a n S t d, D e v i a t i o n S t d, E r r o r L o w e r B o u n d U p p e r B o u n d
9 5 % C o n f i d e n c e I n t e r v a l f o r
M e a n
M i n i m u m M a x i m u m
A N O V A
载 脂 蛋 白
2 3 8 4, 0 2 6 2 1 1 9 2, 0 1 3 5, 8 5 4, 0 0 8
5 4 9 7, 8 3 6 27 2 0 3, 6 2 4
7 8 8 1, 8 6 2 29
B e t w e e n G r o u p s
W i t h i n G r o u p s
T o t a l
S u m o f
S q u a r e s df M e a n S q u a r e F S i g,
第三节 配伍组设计的多个样本均数的比较
(双因素方差分析)
应用分层的思想,事先将全部受试对象按某种
或某些特性分为若干个区组,使每个区组内的
观察对象与 研究对象的水平尽可能相近,减少
/分析个体间差异对研究结果的影响,比成组
设计更容易检验出处理因素间的差别,提高了
研究效率。
是配对(两个组)资料的扩充(两个以上组)。
方差分析 26
例 题
对小白鼠喂以 A,B,C三种不同的营养素了解
不同营养素的增重效果。 24只小白鼠分为 3组,
每组 8只,3周后测量体重。
问 3种不同营养素喂养后所增体重有无差别?
方差分析 27
对小白鼠喂以 A,B,C三种不同的营养素了解
不同营养素的增重效果。有同系同体重的 24只
小白鼠,来自 8个区组(窝),每窝 3只。以窝
别作为区组特征(消除遗传因素对体重增长的
影响)分为 3组,每组 8只。 3周后测量体重。
问 3种不同营养素喂养后所增体重有无差别?
1.00 1.00 50.10 1.00 2.00
58.20 1.00 3.00 64.50 2.00 1.00
47.80 2.00 2.00 48.50 2.00 3.00
62.40 3.00 1.00 53.10 3.00 2.00
53.80 3.00 3.00 58.60 4.00 1.00
63.50 4.00 2.00 64.20 4.00 3.00
72.50 5.00 1.00 71.20 5.00 2.00
68.40 5.00 3.00 79.30 6.00 1.00
41.40 6.00 2.00 45.70 6.00 3.00
38.40 7.00 1.00 61.60 7.00 2.00
53.00 7.00 3.00 51.20 8.00 1.00
42.20 8.00 2.00 39.80 8.00 3.00
46.20 有几个因素?观察值是什么?按单因素方差分
析如何处理?
方差分析 29
方差分析 30
分析变异
总变异,
组间变异(因素一的变异),
误差(组内)变异(随机误差),
配伍间变异(因素二的变异),
SS总
?总
SS组内
?组内
MS组内
SS组间
?组间
MS组间
变异之间的关系,
? SS总 = SS组内 + SS组间 + SS配伍 间
?总 = ?组内 + ?组间 +?配伍 间
变异间的关系
SS配伍间
?配伍 间
MS配伍 间
方差分析 32
统计量 F 的计算
F1=MS组间 /MS组内
F2=MS区间 /MS组内
自由度,?组间 =组数 -1=3-1=2
?区间 =区数 -1=8-1=7
?组内 =(组数 -1)(区数 -1) =14
都是和随机误差进行比较。
SPSS计算过程
ANALYZE-----General Liner Model---Univariate
体重进入 Dependent(因变量) 窝别和营养素
进入 Fixed Factors(自变量)
Model---Custom— Building Terms— Main
effect— Factors & Covariates (将窝别和营养素
选入)
B e t w e e n - S u b j e c t s F a c t o rs
3
3
3
3
3
3
3
3
8
8
8
1, 0 0
2, 0 0
3, 0 0
4, 0 0
5, 0 0
6, 0 0
7, 0 0
8, 0 0
窝别
1, 0 0
2, 0 0
3, 0 0
营养

N
T e s t s o f B e t w e e n - S u b j e c t s E f f e c t s
D e p e n d e n t V a r i a b l e, 体重
2 5 2 2, 5 6 3
a
9 2 8 0, 2 8 5 1 1, 6 9 2, 0 0 0
7 4 3 2 6, 1 4 0 1 7 4 3 2 6, 1 4 0 3 1 0 0, 4 5 2, 0 0 0
2 3 7 6, 5 8 0 7 3 3 9, 5 1 1 1 4, 1 6 2, 0 0 0
1 4 5, 9 8 3 2 7 2, 9 9 1 3, 0 4 5, 0 8 0
3 3 5, 6 1 8 14 2 3, 9 7 3
7 7 1 8 4, 3 2 0 24
2 8 5 8, 1 8 0 23
S o u r c e
C o r r e c t e d M o d e l
I n t e r c e p t
窝别
营 养 素
E r r o r
T o t a l
C o r r e c t e d T o t a l
T y p e I I I S u m
o f S q u a r e s df M e a n S q u a r e F S i g,
R S q u a r e d =, 8 8 3 ( A d j u s t e d R S q u a r e d =, 8 0 7 )a,
完整书写方差分析的过程
?建立假设,
H0, 3种营养素喂养的小白鼠体重增量相等
?1 = ?2 = ?3
H1, 3种营养素喂养的小白鼠体重增量不全相等
?确定显著性水平,用 ?表示。 区分大小概率事件的
标准,常取 0.05。
?计算统计量 F,F=MS组间 /MS组内
?计算概率值 P,P的含义。
?做出推论:统计学结论和专业结论。
完整书写方差分析的过程
?建立假设,
H0, 8窝小白鼠体重增量相等
?1 = ?2 = ?3…,
H1, 8窝小白鼠体重增量不全相等
?确定显著性水平,用 ?表示。 区分大小概率事件
的标准,常取 0.05。
?计算统计量 F,F2=MS区间 /MS组内
?计算概率值 P,P的含义。
?做出推论:统计学结论和专业结论。
存在问题
方差分析结果提供了各组均数间差别的总的信
息,但尚未提供各组间差别的具体信息,即尚
未指出哪几个组均数间的差别具有或不具有统
计学意义。
为了得到这方面的信息,可进行多个样本间的
两两比较。
方差分析 39
A N O V A
载 脂 蛋 白
2 3 8 4, 0 2 6 2 1 1 9 2, 0 1 3 5, 8 5 4, 0 0 8
5 4 9 7, 8 3 6 27 2 0 3, 6 2 4
7 8 8 1, 8 6 2 29
B e t w e e n G r o u p s
W i t h i n G r o u p s
T o t a l
S u m o f
S q u a r e s df M e a n S q u a r e F S i g,
3组不同的人载蛋白不同,到底是 3组
间都不同,还是只有 2组间不同?
第四节 多个样本均数间的两两比较
能否用 t检验或 μ检验?
每次不犯第一类错误的概率 0.95,10次都不
犯的概率不是 0.95,而是,
每次不犯一类错误的概率远大于 0.05,不是小
概率事件,会把本来无差别的两个总体均数判
断为有差别 。
方差分析 41
两种常用的检验方法
最小有意义 t( LSD- t)检验,检验 K
组中某一对或几对在专业上有特
殊意义的均数( DAB =XA-XB)的
总体水平是否为 0。
Q检验, 也叫 Student-Newman-Keuls
( SNK-Q)检验。
SPSS计算过程
ANALYZE-----Compare Means---One-
way ANOVA( 载脂蛋白 )
各组均数间多重比较,Post Hoc Multiple
Comparisons— S-N-K or LSD
方差分析 43
A N O V A
载脂蛋白
2 3 8 4, 0 2 6 2 1 1 9 2, 0 1 3 5, 8 5 4, 0 0 8
5 4 9 7, 8 3 6 27 2 0 3, 6 2 4
7 8 8 1, 8 6 2 29
B e t w e e n G r o u p s
W i t h in G r o u p s
T o t a l
S u m o f
S q u a r e s df M e a n S q u a r e F S ig,
方差分析 44
M u l t i p l e C om p a r i s on s
D e p e n d e n t V a r i a b l e, 载脂蛋白
3, 0 6 6 6, 4 1 3 7, 6 3 7 - 1 0, 0 9 4 1 6, 2 2 6
- 1 7, 3 4 5 * 6, 2 3 4 9, 0 1 0 - 3 0, 1 3 8 - 4, 5 5 3
- 3, 0 6 6 6, 4 1 3 7, 6 3 7 - 1 6, 2 2 6 1 0, 0 9 4
- 2 0, 4 1 1 * 6, 5 5 6 5, 0 0 4 - 3 3, 8 6 4 - 6, 9 5 8
1 7, 3 4 5 * 6, 2 3 4 9, 0 1 0 4, 5 5 3 3 0, 1 3 8
2 0, 4 1 1 * 6, 5 5 6 5, 0 0 4 6, 9 5 8 3 3, 8 6 4
(J ) 分组
2
3
1
3
1
2
(I ) 分组
1
2
3
L S D
Me a n
D i f f e r e n ce
(I - J ) S t d, E r r o r S i g, L o w e r B o u n d U p p e r B o u n d
9 5 % C o n f i d e n c e I n t e r v a l
T h e m e a n d i f f e r e n c e i s s i g n i f i c a n t a t t h e, 0 5 l e v e l,*,
方差分析 45
均数假设检验的注意事项
方差分析 46
1、正确理解假设检验的结论(概率性)
假设检验的结论是根据概率推断的,所以不是绝对
正确的,
(1)当 p < ?,拒绝 H0,接受 H1,按接受 H1下结论,可
能犯错误,可能 拒绝了实际上成立的 H0, 称为 ?
类错误(,弃真”的错误 ),其概率大小用 α
表示。(弃真是指两总体均数相等的真情)
方差分析 47
?(2) 当 p > ?,不能拒绝 H0,不能接受 H1,按不能接
受 H1下结论,也可能犯错误,没有 拒绝实际上不
成立的 H0,这类称为 II 类 错误 (,存伪”的错
误 ),其概率大小用 β 表示,β 值一般不能确切
的知道 ( 存伪 -是指两总体均数不相等)。
方差分析 48
II 类错误的概率 β 值的 两个规律,
1,当样本量一定时,α 愈小,则 β 愈大, 反之 ?;
2.当 α 一定时,样本量增加,β 减少,
(什么时候犯 I 类错误,什么时候犯 II 类错误? )
方差分析 49
2,统计学中的差异显著或不显著,和日常生
活中所说的差异大小概念不同, (不仅区别于均
数差异的大小,还区别于均数变异的大小 )
3、其它注意事项
?选择假设检验方法要注意符合其应用条件;
?当不能拒绝 H0时,即差异无显著性时,应考虑
的因素:可能是样本例数不够;
?单侧检验与双侧检验的问题