世间万物是普遍联系的
? 医学上,许多现象之间也都有相互联系,例如:身
高与体重、体温与脉搏、产前检查与婴儿体重、乙肝
病毒与乙肝等。
? 在这些有关系的现象中,它们之间联系的程度和性
质也各不相同。
?关系:可以说乙肝病毒感染是前因,得了乙肝是后
果,乙肝病毒和乙肝之间是因果关系;但是,有的现
象之间因果不清,只是伴随关系,例如丈夫的身高和
妻子的身高之间,就不能说有因果关系。
相关与偏相关 3
相关就是用于研究和解释两个变量
之间 相互 关系的。
相关与偏相关 4
主要内容
第一节 直线相关
一、相关的类型
二、相关系数
三、相关系数的假设检验
四、直线相关的应用
第二节 偏相关
一、概念
二、偏相关系数
三,SPSS计算程序
第一节 直线相关
Linear Correlation
? 为了研究父亲与成年儿子
身高之间的关系,卡尔,皮
尔逊测量了 1078对父子
的身高。把 1078对数字
表示在坐标上,如图。
? 它的形状象一块橄榄状的
云,中间的点密集,边沿
的点稀少,其主要部分是
一个椭圆。
一、相关的类型
★ 正相关 ★ 负相关 ★ 完全正相关 ★ 完全负相关 ★ 零相关
二、相关系数
◆ 样本的相关系数 用 r (correlation coefficient)
◆ 相关系数 r的值在 -1和 1之间。正相关时,r值在 0
和 1之间,这时一个变量增加,另一个变量也增
加;负相关时,r值在 -1和 0之间,此时一个变量
增加,另一个变量将减少。
◆ r的绝对值越接近 1,两变量的关联程度越强,r
的绝对值越接近 0,两变量的关联程度越弱。
? 一个产科医师发现孕妇尿中 雌三醇含量 与产儿的
体重 有关。于是设想,通过测量待产妇尿中雌三
醇含量,可以预测产儿体重,以便对低出生体重
进行预防。因此收集了 31例待产妇 24小时的尿,
测量其中的雌三醇含量,同时记录产儿的体重。
问尿中雌三醇含量与产儿体重之间 相关系数 是多
少?是正相关还是负相关?
? 分析问题:目的、变量、关系
编号
( 1)
尿雌三醇
mg/24h( 2
产儿体重
kg( 3)
编号
( 1)
尿雌三醇
mg/24h( 2)
产儿体重
kg( 3)
1
7
2.5
17
17
3.2
2
9
2.5
18
25
3.2
3
9
2.5
19
27
3.4
4
12
2.7
20
15
3.4
5
14
2.7
21
15
3.4
6
16
2.7
22
15
3.5
7
16
2.4
23
16
3.5
8
14
3.0
24
19
3.4
9
16
3.0
25
18
3.5
10
16
3.1
26
17
3.6
11
17
3.0
27
18
3.7
12
19
3.1
28
20
3.8
13
21
3.0
29
22
4.0
14
24
2.8
30
25
3.9
15
15
3.2
31
24
4.3
16
16
3.2
待产妇尿雌三醇含量与产儿体重关系
相关与偏相关 11
r ?
?
?
41 20
677 42 6 74
0 61
.
.,
.
计算结果
从计算结果可以知道,31例待产妇尿中雌三醇含
量与产儿体重之间程正相关,相关系数是 0.61。
问题:我们能否得出结论,待产
妇尿中雌三醇含量与产儿体重之
间成正相关,相关系数是 0.61?
为什么?
相关与偏相关 13
三、相关系数的假设检验
? 上例中的相关系数 r等于 0.61,说明了 31例样本中雌三醇
含量与出生体重之间存在相关关系。但是,这 31例只是
总体 中的 一个样本,由此得到的相关系数会存在抽样误
差。
? 因为,总体相关系数 ( ?) 为零时,由于抽样误差,从
总体抽出的 31例,其 r可能不等于零。
? 这就要对 r进行假设检验,判断 r不等于零是由于抽样误差
所致,还是两个变量之间确实存在相关关系。
相关与偏相关 14
对相关系数的假设检验,常用 t检验,选用
统计量 t的计算公式如下,
t
r
s r
r
r
n
r
n
r
?
?
?
?
?
?
?
?
0
1
2
2
1
22
?=n-2
?H0, ?=0
H1, ?≠0
?=0.05
r=0.61,n=31,代入公式 t=
r n
r
?
?
2
1 2
?=n-2=31-2=29
t=4.14
查 t值表,t0.05 (29) =2.045,
查 t值表,t0.05(29) =2.045,上述计算 t=4.14>2.045,由 t
所推断的 P值小于 0.05,按 ?=0.05水准拒绝,接受,
认为临产妇 24小时内尿中雌三醇浓度与产儿体重之间
有正相关关系。
相关与偏相关 16
选择不同的方法计算相关系数
Pearson:双变量正态分布资料,连续变量
Kendall,资料不服从双变量正态分布或
总体分布未知,等级资料。
Spearman:等级资料(非参检验)。
SPSS计算
1.做散点图:标题、标目、散点
GRAPHS-SCATTERT-SIMPLE-DEFIND
双击 TITLE加标题、标目
2,相关分析, ANALYZE--CORRELATION –
BIVARIATE -VARIABLES
相关与偏相关 18
孕妇尿中雌三醇含量与产儿体重之间的关系
尿雌三醇
3020100
产儿体重
4, 5
4, 0
3, 5
3, 0
2, 5
2, 0
相关与偏相关 19
C o r r e l a t io n s
1, 6 1 0 **
., 0 0 0
31 31
,6 1 0 ** 1
,0 0 0,
31 31
P e a r s o n C o r r e l a t io n
S ig, (2 - t a i le d )
N
P e a r s o n C o r r e l a t io n
S ig, (2 - t a i le d )
N
尿雌三醇
产儿体重
尿雌三醇 产儿体重
C o r r e la t io n is s ig n if ic a n t a t t h e 0, 0 1 le v e l
(2 - t a il e d ),
* *,
相关与偏相关 20
四、直线相关的应用
? 相关是研究两个变量间的相互关系,这种相互关系用相
关系数反应。如果 r的绝对值越大,说明两个变量之间的
关联程度越强。那么,已知一个变量对预测另一个变量
越有帮助;如果 r绝对值越小,则说明两个变量之间的关
系越弱,一个变量的信息对猜测另一个变量的值无多大
帮助。
? 一般说来,当样本量较大( n>100),并对 r进行假设检
验,有统计学意义时,r的绝对值大于 0.7,则表示两个
变量高度相关; r的绝对值大于 0.4,小于等于 0.7时,则
表示两个变量之间中度相关; r的绝对值大于 0.2,小于
等于 0.4时,则两个变量低度相关。
例题:已知某地 29名 13岁男童身高 X1
( cm)、体重 X2( kg)和肺活量 Y
( ml),请计算身高与肺活量,体重与肺
活量的相关关系。
相关与偏相关 22
身高与肺活量的简单相关系数
C o r r e l a t i o n s
1, 0 0 0, 5 8 8 **
., 0 0 1
29 29
,5 8 8 ** 1, 0 0 0
,0 0 1,
29 29
P e a r s o n
C o r r e l a t i o n
S i g,
( 2 - t a i l e d )
N
P e a r s o n
C o r r e l a t i o n
S i g,
( 2 - t a i l e d )
N
身高
肺活 量
身高 肺活 量
C o r r e l a t i o n i s s i g n i f i c a n t a t
t h e 0, 0 1 l e v e l ( 2 - t a i l e d ),
* *,
1、身高与肺活量的简单相关系数
相关与偏相关 23
2、体重与肺活量的简单相关系数
C o r r e l a t i o n s
1, 0 0 0, 6 5 3 **
., 0 0 0
29 29
,6 5 3 ** 1, 0 0 0
,0 0 0,
29 29
P e a r s o n
C o r r e l a t i o n
S i g,
( 2 - t a i l e d )
N
P e a r s o n
C o r r e l a t i o n
S i g,
( 2 - t a i l e d )
N
体重
肺活 量
体重 肺活 量
C o r r e l a t i o n i s s i g n i f i c a n t a t
t h e 0, 0 1 l e v e l ( 2 - t a i l e d ),
* *,
相关与偏相关 24
3、身高与体重的简单相关系数
C o r r e l a t i o n s
1, 0 0 0, 7 0 7 **
., 0 0 0
29 29
,7 0 7 ** 1, 0 0 0
,0 0 0,
29 29
P e a r s o n
C o r r e l a t i o n
S i g,
( 2 - t a i l e d )
N
P e a r s o n
C o r r e l a t i o n
S i g,
( 2 - t a i l e d )
N
身高
体重
身高 体重
C o r r e l a t i o n i s s i g n i f i c a n t a t
t h e 0, 0 1 l e v e l ( 2 - t a i l e d ),
* *,
相关与偏相关 25
另外的例子,
? 识字数,鞋大小
? 游泳票与冰激凌销售量
? 排除其它变量的干扰
第二节 偏相关
一、概念
当有多个变量存在时,为了研究任
何两个变量之间的关系,而使与这两个
变量有联系的其它变量都保持不变。即
控制了其它一个或多个变量的影响下,
计算两个变量的相关性。
二、偏相关系数
偏相关系数是用来衡量任何两个变量
之间的关系的大小。
相关与偏相关 28
Analyze-----Correlation-----Partial
把分析变量选入 Variable 框
把控制变量选入 Controlling for 框
点击 Options
点击 Statistics:选择
Mean and standard deviation
Zero-order correlation
Continue OK
三,SPSS操作步骤
相关与偏相关 29
Variable Mean Standard Dev Cases
X1( 身高 ) 152.5759 8.3622 29
Y (肺活量) 2206.8966 448.5541 29
X2 ( 体重 ) 37.3069 5.6704 29
结 果,
相关与偏相关 30
4、体重为控制变量,身高与肺活量的偏
相关系数
P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S
Controlling for.,X2 (体重)
Y(肺活量) X1(身高)
Y (肺活量) 1.0000,2361
( 0) ( 26)
P=, P=,226
X1 (身高),2361 1.0000
( 26) ( 0)
P=,226 P=,
相关与偏相关 31
P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S
Controlling for.,X1(身高)
Y(肺活量) X2(体重)
Y 1.0000,4152
( 0) ( 26)
P=, P=,028
X2,4152 1.0000
( 26) ( 0)
P=,028 P=,
5、身高作为控制变量,肺活量与体重的
偏相关系数
应用相关注意事项
1.实际意义
进行相关回归分析要有实际意义,不可把毫
无关系的两个事物或现象用来作相关回归分
析。
2.相关关系
相关关系不一定是因果关系,也可能是伴随
关系,并不能证明事物间有内在联系。
3.利用散点图
对于性质不明确的两组数据,可先做散点图,
在图上看它们有无关系、关系的密切程度、
是正相关还是负相关,然后再进行相关分析。
4.变量范围
相关分析和回归方程仅适用于样本的原始数
据范围之内,出了这个范围,我们不能得出
两变量的相关关系和原来的回归关系。
相关与偏相关 34
前半段课程 小 结
相关与偏相关 35
思考,
1.均数与标准差适合用于什么资料的描述?
2.标准差和标准误有何区别和联系?
3.可信区间和参考值范围有何不同?
4.假设检验的基本思想是什么?步骤是什么?
5.计量资料假设检验的类型有哪些?
6.方差分析适用于什么样的设计?
7.相关与回归的区别与联系是什么?
相关与偏相关 36
分析计算
要求,
1,选择合适的计算程序;
2,在计算机上计算出结果;
3,会看结果;
4,完整的书写出来。
相关与偏相关 37
1,随机将 20只雌性大鼠均匀的分为甲, 乙两组 。 甲组大鼠不接
受任何处理 (即空白对照 ),乙组中的每只大鼠接受 3mg/kg的内
毒素, 分别测得两组大鼠的肌酐
(μmol/L)数据, 请问内毒素对肌酐水平有无影响?
甲组,55,33,51,24,34,54,59,69,34,61
乙组,75,60,100,83,82,65,50,70,64,72
分析用什么样的统计方法
相关与偏相关 38
2,某职业病防治所对 31例石棉矿工中的石棉肺患
者、可疑患者和非患者进行了用力肺活量测定。
问三组石棉矿工的用力肺活量有无差别?(肺活
量,SAV)
相关与偏相关 39
3.某厂医务室测定了 10名氟作业工人工前、
工中和工后 4小时的尿氟浓度 (umol/L),
问氟作业工人在三个不同时间的尿氟浓
度有无差别?
相关与偏相关 40
谢 谢!