第十章 简单相关与回归
第一节 相关和回归的概念
在园艺植物的生产或试验中,普遍存在着变数之间
相互影响的关系,例如温度、湿度与萌芽率的关系,果
树产量与施肥量的关系,某种病、虫害的发生与某气候
因素的关系等等,所以在园艺植物的生产和科研中,所
需研究的变数往往不只是一种,而是两种或两种以上,
为此必须介绍相关与回归的统计分析方法。
在科学研究中,变数 (x)和变数 (y)的相互关系存在
着两种类型,一种叫函数关系,另一种称之为相关关系。
函数关系是指一个变数的任一变量都必有另一个变数的
一个确定值与之对应的关系。这是事物间联系最严格的
一种关系,函数关系常存在于数学、物理和化学等科学
范畴中,在植物科学中极为少见。相关关系是指在一定范
围内,一个变数的任一变量 (x),虽然没有另一个变数的确
定值与之对应,而是有一个特定 y的正态分布总体与之对应。
即相关关系是事物间不完全的关系,在数量特征上,是一
类因素的变化,仅部分地受另一类因素,或几类因素变化
的影响。这在园艺植物研究中是常见的。
相关是研究两个及两个以上变数件相关变异程度,即
两个变数的共同变化规律。回归是研究一个变数随着另外
一个或一个以上变数的影响程度。 相关中的两个变数为平
行关系,无自变数和依变数之分,不具有预测意义;两个
变数均含有误差。回归中的两变数为依存关系,有严格的
自变数和依变数之分,具有预测意义;自变数不含或很少
含有误差,而依变数含有误差。
在对双变数资料统计处理时,我们把计算回归方程为
基础的统计方法称为回归分析,目的是要了解依变数 y在自
变数 x的影响下,将会在什么范围内变化。把计算相关系数
为基础的统计方法称为相关分析,以测定两个变数在数量
关系上的密切程度和性质。回归和相关分析之间存在着密
切的关系,不能截然分开,通过回归分析,可以获得许多
相关的信息,而相关分析中,也包含许多回归分析的信息。
研究两个变数间的相关和回归为简单的相关与回归,
研究两个以上变数间的相关和回归为多元相关与回归。相
关和回归依据其图形可分为线性(直线)相关与回归和曲
线相关与回归
第二节 直线相关
一、直线相关系数
? ?
?
??
???
22 )()(
))((
yyxx
yyxxr
相关系数是一个不带单位的纯数,其数值范围为
-1≤r≤1 。 r=1,两变数为完全正相关; r=-1,两变
数为完全负相关; r=0,两变数为零相关。生物资料中
r的绝对值多在 0-1之间。相关系数 r的绝对值大小可以
反映两个变数间的相关程度,其正负号反映两个变数间
的性质。
二、相关系数的计算
可以根据下面公式计算相关系数,
注意分子乘积和( SP)的计算。
22
22( ) ( )( ) ( )
xyxy
nr
xyxy
nn
?
?
??
???
????
三、决定系数
决定系数 r2和相关系数 r的异同点是,
? ???
? ? ?
??
?
?
))()()((
)(
2
2
2
2
2
2
n
yy
n
xx
n
yxxy
r