Spearman等级相关分析
Analyze\Correlate\ Bivariate…
问题,某地做肝癌病因研究,调查了 10个乡肝癌死亡率
( 1/10万,用 Y表示)与某种食物中黄曲霉素相对
含量(用 X表示)见下表,试作等级相关分析?
黄曲霉素相对含量( X),0.7 1.0 1.7 3.7 4.0 5.1 5.5 5.7
5.9 10.0
肝癌死亡率( Y),21.5 19.9 14.4 46.5 27.3 64.6 46.3 34.2
77.6 55.1
相关系数类型
假设检验选项
用 *或 **标记在 ?=0.05或 ?=0.01水平有统计学意义
的相关系数
C or r e l a t i o n s
1, 0 0 0, 7 4 5 *
., 0 1 3
10 10
,7 4 5 * 1, 0 0 0
,0 1 3,
10 10
C o r r e l a t i o n C o e f f ici e n t
S ig, (2 - t a i l e d )
N
C o r r e l a t i o n C o e f f ici e n t
S ig, (2 - t a i l e d )
N
黄曲 霉素相 对含量
肝癌 死亡率
S p e a r m a n 's r h o
黄曲 霉素
相对 含量 肝癌 死亡率
C o r r e l a t i o n is s i g n i f ic a n t a t t h e, 0 5 le v e l (2 - t a i le d ).*,
Spearman等级相关系数为 0.745,P=0.013,按 ?=0.05水准,
拒绝无效假设,故可以认为,黄曲霉素与肝癌死亡率间存
在正相关。
偏相关分析
Analyze\Correlate\ Partial…
问题,某地 29名 13岁男童身高( X1,cm)、体重( X2,
kg)及肺活量( Y,L)的实测数据如下表。试计
算其 Pearson相关系数。当体重( X2)控制(即固
定时),计算身高( X1)与肺活量( Y)的偏相
关系数,并作假设检验?
男童身高 (X1):135.1 139.9 163.6 146.5 156.2 156.4 167.8 149.7 145.0 148.5
165.5 135.0 153.3 152.0 160.5 153.0 147.6 157.5 155.1 160.5
143.0 149.4 160.8 159.0 158.2 150.0 144.5 154.6 156.5
体重 (X2),32.0 30.4 46.2 33.5 37.1 35.5 41.5 31.0 33.0 37.0 49.5 27.6 41.0
32.0 47.2 32.0 40.5 43.3 44.7 37.5 31.5 33.9 40.4 38.5 37.5 36.0
34.7 39.5 32.0
肺活量 (Y),1.75 2.00 2.75 2.50 2.75 2.00 2.75 1.50 2.50 2.25 3.00 1.25 2.75
1.75 2.25 1.75 2.00 2.25 2.75 2.00 1.75 2.25 2.75 2.50 2.00 1.75
2.25 2.50 1.75
变量
假设检验选项
控制变量
显示实际 P值
均数和标准偏差统计
零阶相关系数
各变量均数及标准偏差
X1(身高)与 Y(肺活量)的偏相关分析结果
从 Pearson相关系数来看,身高与肺活量之间( r=0.5884,P=0.001),
体重与肺活量之间( r=0.7361,P=0.000)均有相关关系;但从偏相关
关系来看,当排除或固定体重的影响后,达到在分析身高与肺活量的
相关关系时,排除了体重的干扰作用,则结果显示无相关关系。
各变量间的零阶相关系数 …… Pearson相关系数
线性回归分析
? 直线回归分析
? 多重线性回归分析
目录
相关统计学概念( 6)
线性回归分析( Linear Regression)是描述一个 因变量
( Dependent variable) Y与一个或多个 自变量 ( Independent
variable) X间的线性 依存关系 。可以根据一批样本值来估
计这种线性关系,建立回归方程。用回归方程可以进行预
测、控制以及由易测变量 X求得难测变量 Y等等。多元线性
回归还可起到对影响因素的识别作用。
回归分析要求应变量 Y服从正态分布,X可以是随机变
动的,也可以是人为取值的变量。
Linear过程 用于建立回归方程;回归方程的配合适度检
验包括回归方程和回归系数(或偏回归系数)的假设检验、
残差分析;直线回归的区间估计和直线相关及偏相关分析。
直线回归方程,y = b0 + bj x
Analyze\Correlate\ Bivariate…
问题,某地做肝癌病因研究,调查了 10个乡肝癌死亡率
( 1/10万,用 Y表示)与某种食物中黄曲霉素相对
含量(用 X表示)见下表,试作等级相关分析?
黄曲霉素相对含量( X),0.7 1.0 1.7 3.7 4.0 5.1 5.5 5.7
5.9 10.0
肝癌死亡率( Y),21.5 19.9 14.4 46.5 27.3 64.6 46.3 34.2
77.6 55.1
相关系数类型
假设检验选项
用 *或 **标记在 ?=0.05或 ?=0.01水平有统计学意义
的相关系数
C or r e l a t i o n s
1, 0 0 0, 7 4 5 *
., 0 1 3
10 10
,7 4 5 * 1, 0 0 0
,0 1 3,
10 10
C o r r e l a t i o n C o e f f ici e n t
S ig, (2 - t a i l e d )
N
C o r r e l a t i o n C o e f f ici e n t
S ig, (2 - t a i l e d )
N
黄曲 霉素相 对含量
肝癌 死亡率
S p e a r m a n 's r h o
黄曲 霉素
相对 含量 肝癌 死亡率
C o r r e l a t i o n is s i g n i f ic a n t a t t h e, 0 5 le v e l (2 - t a i le d ).*,
Spearman等级相关系数为 0.745,P=0.013,按 ?=0.05水准,
拒绝无效假设,故可以认为,黄曲霉素与肝癌死亡率间存
在正相关。
偏相关分析
Analyze\Correlate\ Partial…
问题,某地 29名 13岁男童身高( X1,cm)、体重( X2,
kg)及肺活量( Y,L)的实测数据如下表。试计
算其 Pearson相关系数。当体重( X2)控制(即固
定时),计算身高( X1)与肺活量( Y)的偏相
关系数,并作假设检验?
男童身高 (X1):135.1 139.9 163.6 146.5 156.2 156.4 167.8 149.7 145.0 148.5
165.5 135.0 153.3 152.0 160.5 153.0 147.6 157.5 155.1 160.5
143.0 149.4 160.8 159.0 158.2 150.0 144.5 154.6 156.5
体重 (X2),32.0 30.4 46.2 33.5 37.1 35.5 41.5 31.0 33.0 37.0 49.5 27.6 41.0
32.0 47.2 32.0 40.5 43.3 44.7 37.5 31.5 33.9 40.4 38.5 37.5 36.0
34.7 39.5 32.0
肺活量 (Y),1.75 2.00 2.75 2.50 2.75 2.00 2.75 1.50 2.50 2.25 3.00 1.25 2.75
1.75 2.25 1.75 2.00 2.25 2.75 2.00 1.75 2.25 2.75 2.50 2.00 1.75
2.25 2.50 1.75
变量
假设检验选项
控制变量
显示实际 P值
均数和标准偏差统计
零阶相关系数
各变量均数及标准偏差
X1(身高)与 Y(肺活量)的偏相关分析结果
从 Pearson相关系数来看,身高与肺活量之间( r=0.5884,P=0.001),
体重与肺活量之间( r=0.7361,P=0.000)均有相关关系;但从偏相关
关系来看,当排除或固定体重的影响后,达到在分析身高与肺活量的
相关关系时,排除了体重的干扰作用,则结果显示无相关关系。
各变量间的零阶相关系数 …… Pearson相关系数
线性回归分析
? 直线回归分析
? 多重线性回归分析
目录
相关统计学概念( 6)
线性回归分析( Linear Regression)是描述一个 因变量
( Dependent variable) Y与一个或多个 自变量 ( Independent
variable) X间的线性 依存关系 。可以根据一批样本值来估
计这种线性关系,建立回归方程。用回归方程可以进行预
测、控制以及由易测变量 X求得难测变量 Y等等。多元线性
回归还可起到对影响因素的识别作用。
回归分析要求应变量 Y服从正态分布,X可以是随机变
动的,也可以是人为取值的变量。
Linear过程 用于建立回归方程;回归方程的配合适度检
验包括回归方程和回归系数(或偏回归系数)的假设检验、
残差分析;直线回归的区间估计和直线相关及偏相关分析。
直线回归方程,y = b0 + bj x