Chapter 1
回归分析的性质主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006
Wuhan University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
1.1 回归
回归是计量经济学的主要工具
– 回归是 研究一个因变量对一个或多个自变量的依赖关系的过程,其用意在于通过后者的设定去估计或预测前者的 均值(总体均值) 。
–,回归”最早是由英国统计学家 Galton
( 1886)提出,见 P3。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
在一篇论文中,Galton发现:
– 虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。
– 换言之,尽管父母双亲都异常高或异常矮,
而儿女的身高则有走向人口总体平均身高的趋势。
-- Galton的普遍回归定律
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
1.2 几个相关概念
统计关系与确定性关系
– 在回归分析中,我们考虑的是一种统计依赖关系,即我们处理的变量是随机的;
– 在确定性关系中,我们处理的变量不是随机的;
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
统计关系与确定性关系
一个例子(牛顿的引力定律)
上式为一确定性关系,非计量经济学研究范畴,但 k的测量有误差,则原确定性关系就变成了一个统计关系式,此时,
引力就只能根据给定的 k,m及 r近似地加以预测,F也就变成了随机变量。
12
2
mmFk
r?
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
回归与因果关系
回归分析研究一个变量对另一些变量的依赖关系,但这并不一定意味着变量间的因果关系 。 因为回归是一种统计关系,
而因果关系来自于统计学之外的各种理论 。
要谈因果关系,必须先有先验的或理论上的思考;
例子:降雨量与农作物产量
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
回归与相关
目的不同
– 相关分析是测度两个变量之间的线性关联度;
– 回归分析是试图根据其他变量的设定值来估计或预测某一变量的平均值。
变量之间的关系不同
– 相关分析中,两个变量是对称的,都是随机的
– 回归分析中,因变量是随机的,自变量是在重复抽样中固定取值的。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
1.3 数据类型
横截面数据( cross-sectional data)
– 一个或多个变量在同一时点上收集的数据。
时间序列数据( time series data)
– 变量在不同时间取值的一组观测值。
混合数据( pooled data)
– 不同时间的横截面数据的混合
– 混合数据中,最近流行的一类为面板数据( panel
data)
特点:不同年份的横截面数据混合且每年样本点相同
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
1.4 术语与符号
因变量:被解释变量、预测子、回归子、
响应变量、被控变量、内生变量
自变量:解释变量、预测元、回归元、
刺激变量、控制变量、外生变量
下标的使用惯例:
– 横截面数据-- i
– 时间序列数据-- t
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
习题
P14
1.2,1.3
回归分析的性质主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006
Wuhan University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
1.1 回归
回归是计量经济学的主要工具
– 回归是 研究一个因变量对一个或多个自变量的依赖关系的过程,其用意在于通过后者的设定去估计或预测前者的 均值(总体均值) 。
–,回归”最早是由英国统计学家 Galton
( 1886)提出,见 P3。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
在一篇论文中,Galton发现:
– 虽然有一个趋势,父母高,儿女也高;父母矮,儿女也矮,但给定父母的身高,儿女辈的平均身高却趋向于或者“回归”到全体人口的平均身高。
– 换言之,尽管父母双亲都异常高或异常矮,
而儿女的身高则有走向人口总体平均身高的趋势。
-- Galton的普遍回归定律
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
1.2 几个相关概念
统计关系与确定性关系
– 在回归分析中,我们考虑的是一种统计依赖关系,即我们处理的变量是随机的;
– 在确定性关系中,我们处理的变量不是随机的;
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
统计关系与确定性关系
一个例子(牛顿的引力定律)
上式为一确定性关系,非计量经济学研究范畴,但 k的测量有误差,则原确定性关系就变成了一个统计关系式,此时,
引力就只能根据给定的 k,m及 r近似地加以预测,F也就变成了随机变量。
12
2
mmFk
r?
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
回归与因果关系
回归分析研究一个变量对另一些变量的依赖关系,但这并不一定意味着变量间的因果关系 。 因为回归是一种统计关系,
而因果关系来自于统计学之外的各种理论 。
要谈因果关系,必须先有先验的或理论上的思考;
例子:降雨量与农作物产量
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
回归与相关
目的不同
– 相关分析是测度两个变量之间的线性关联度;
– 回归分析是试图根据其他变量的设定值来估计或预测某一变量的平均值。
变量之间的关系不同
– 相关分析中,两个变量是对称的,都是随机的
– 回归分析中,因变量是随机的,自变量是在重复抽样中固定取值的。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
1.3 数据类型
横截面数据( cross-sectional data)
– 一个或多个变量在同一时点上收集的数据。
时间序列数据( time series data)
– 变量在不同时间取值的一组观测值。
混合数据( pooled data)
– 不同时间的横截面数据的混合
– 混合数据中,最近流行的一类为面板数据( panel
data)
特点:不同年份的横截面数据混合且每年样本点相同
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
1.4 术语与符号
因变量:被解释变量、预测子、回归子、
响应变量、被控变量、内生变量
自变量:解释变量、预测元、回归元、
刺激变量、控制变量、外生变量
下标的使用惯例:
– 横截面数据-- i
– 时间序列数据-- t
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
习题
P14
1.2,1.3