Chapter 7
多元回归分析:估计问题主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006 Wuhan
University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
7.1 三变量模型:符号与假设
三变量 PRF的随机表达式:
含义:
– 截距:给出了所有未包含到模型中来的解释变量对 Y的平均影响
– 偏回归系数,表示在其他解释变量保持不变的情况下,Xj每变化 1个单位时,Y的均值 E(Y)的变化 ;
1 2 2 3 3i i i iY X X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
回顾第三章,CLRM的十大假定
假定 10:无多重共线性
– 解释变量之间没有完全的线性关系
多重共线性定义:
存在一组不全为零的数,使得
23
2 2 3 3 0iiXX
不 存 在 一 组 不 全 为 零 的 数 和,使 得,
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
讨论
问题:
2
32
10
ii
XX?若是 否 违 背 上 述 假 定?
为 什 么?
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
7.2 偏回归系数
讨论,经济学中的比较静态分析与偏回归系数的含义!
问题,我们如何评价某一解释变量对被解释变量的 真实 影响?
– 如,如何评价 X2对 Y变化的真实贡献?
控制住 X3影响!
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
如何控制住 X3影响?
以生产函数为例
– 假定在度量劳动投入 X2的单位变化对产出的影响时,我们要控制资本投入 X3的线性影响。
为此目的可进行如下步骤:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
步骤一
做 Y 对 X3的回归:
1 1 3 3 1i i iY b b X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
步骤二
做 X2对 X3的回归:
2 2 2 3 3 2i i iX b b X u
1 1 13 3
2 2 2 23 3
i i i
i i i
u Y b b X
u X b b X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
残差项的含义
– 除去 X3对 Y 的影响 Yi的值(“净化”了的 Y )
– 除去 X3对 X2 的影响 X2i的值 (“净化”了的 X2 )
1?iu
2? iu
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
步骤三
12
1 0 1 2 3
1
ii
i i i
uu
u a a u u
a
做 对 的 回 归,
=
其 中,是 的 单 位 变 化 对 的,真 实,影 响 。
净 边 际 劳 动 产 值
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
11
注意
注意:
– 实际估计时,并不需要分三个步骤做回归!
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
12
7.3 偏回归系数的估计
1 2 2 3 3
22
1 2 2 3 3
O L S
()
i i i i
i i i i
Y X X u
M in u Y X X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
13
2
1 2 2 3 3
1 2 2 3 3
1
2
1 2 2 3 3
1 2 2 3 3 2
2
2
1 2 2 3 3
1 2 2 3 3 3
3
()
0 2 ( ) 0
()
0 2 ( ) 0
()
0 2 ( ) 0
i i i
i i i
i i i
i i i i
i i i
i i i i
Y X X
Y X X
Y X X
Y X X X
Y X X
Y X X X
求极值
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
14
OLS估计量1 2 2 3 3
2
2 3 3 2 3
2 2 2 2
2 3 2 3
2
3 2 2 2 3
3 2 2 2
2 3 2 3
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( )
i i i i i i i
i i i i
i i i i i i i
i i i i
Y X X
y x x y x x x
x x x x
y x x y x x x
x x x x
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
15
OLS估计量的方差
2 2 2 2
2 3 3 2 2 3 2 3 2
1 2 2 2
2 3 2 3
2
3 2
2 2 2 2
2 3 2 3
2
2 2
3 2 2 2
2 3 2 3
2
2
21
()
( ) ( ) ( )
()
( ) ( ) ( )
()
( ) ( ) ( )
3
i i i i
i i i i
i
i i i i
i
i i i i
i
X x X x X X x x
VAR
n x x x x
x
VAR
x x x x
x
VAR
x x x x
u
n
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
16
7.4 复判定系数与复相关系数
2 2 3 32
2
i i i i
i
y x y xE S S
R W h y
T S S y
复判定系数:
复相关系数:没什么经济含义。
2 2 3 3
2
0 i i i i
i
y x y x
R
y
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
17
7.5 从复回归看简单回归:模型设定偏误
再次回顾第三章,CLRM的十大假定
– 假定 9:正确地设定了模型
– 若正确的模型为:
– 某人现用下面的模型估计
1 2 2 3 3t t t tY X X u
1 1 2 2 1t t tY b b X u
结果会如何?
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
18
模型设定偏误的后果
1 2 2 1 2 2
2
1 2 2 3 3 2 2
2
1 2 2 3 3 2
()
()
ii
i
bb
x u u
bb
x
E b b
不 是 的 无 偏 估 计 量,V A R ( ) 也 不 是 V A R ( ) 的 无 偏 估 计 量 。
实 际 上,
= +
+
经济含义,
简单回归系数 不仅度量了 X2对 Y的“净”影响,
还度量了 X2通过 X3对 Y的“间接”影响
度量了 X2对 Y的“总”影响
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
19
7.6 调整的复判定系数
问题,复判定系数越大越好吗?
原因,解释变量的个数越多,复判定系数越大!
– 这就给人一个错觉,要使得模型拟合得好,只要增加解释变量即可 。
如何在解释变量的个数与复判定系数的大小之间权衡?
– 我们需要一个判断标准--调整的复判定系数
记住,由增加解释变量个数引起的 R2的增大与拟合好坏无关 。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
20
调整的复判定系数在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是,将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响
)1/(
)1/(12
nT S S
knR S SR
其中,n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
21
调整的复判定系数与复判定系数之间的关系
1
1)1(1 22
kn
nRR
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
22
重新回顾一个问题
判定系数比较的前提条件:
– 被解释变量相同
– 样本容量相同
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
23
7.7 多项式回归模型
问题:边际成本与产量之间的关系?
–,U型的 MC曲线”
二阶多项式模型
20 1 2i i i iY X X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
24
k阶多项式模型
这类模型在有关成本和生产函数的计量经济研究中有广泛的用途。
20 1 2 ki i i k i iY X X X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
25
例:总成本函数的估计
短期某商品产出与其生产总成本之间的关系
什么类型的回归模型能拟合该关系?
– 借助于散点图
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
26
习题
7.20 7.21
多元回归分析:估计问题主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006 Wuhan
University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
7.1 三变量模型:符号与假设
三变量 PRF的随机表达式:
含义:
– 截距:给出了所有未包含到模型中来的解释变量对 Y的平均影响
– 偏回归系数,表示在其他解释变量保持不变的情况下,Xj每变化 1个单位时,Y的均值 E(Y)的变化 ;
1 2 2 3 3i i i iY X X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
回顾第三章,CLRM的十大假定
假定 10:无多重共线性
– 解释变量之间没有完全的线性关系
多重共线性定义:
存在一组不全为零的数,使得
23
2 2 3 3 0iiXX
不 存 在 一 组 不 全 为 零 的 数 和,使 得,
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
讨论
问题:
2
32
10
ii
XX?若是 否 违 背 上 述 假 定?
为 什 么?
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
7.2 偏回归系数
讨论,经济学中的比较静态分析与偏回归系数的含义!
问题,我们如何评价某一解释变量对被解释变量的 真实 影响?
– 如,如何评价 X2对 Y变化的真实贡献?
控制住 X3影响!
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
如何控制住 X3影响?
以生产函数为例
– 假定在度量劳动投入 X2的单位变化对产出的影响时,我们要控制资本投入 X3的线性影响。
为此目的可进行如下步骤:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
步骤一
做 Y 对 X3的回归:
1 1 3 3 1i i iY b b X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
步骤二
做 X2对 X3的回归:
2 2 2 3 3 2i i iX b b X u
1 1 13 3
2 2 2 23 3
i i i
i i i
u Y b b X
u X b b X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
残差项的含义
– 除去 X3对 Y 的影响 Yi的值(“净化”了的 Y )
– 除去 X3对 X2 的影响 X2i的值 (“净化”了的 X2 )
1?iu
2? iu
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
步骤三
12
1 0 1 2 3
1
ii
i i i
uu
u a a u u
a
做 对 的 回 归,
=
其 中,是 的 单 位 变 化 对 的,真 实,影 响 。
净 边 际 劳 动 产 值
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
11
注意
注意:
– 实际估计时,并不需要分三个步骤做回归!
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
12
7.3 偏回归系数的估计
1 2 2 3 3
22
1 2 2 3 3
O L S
()
i i i i
i i i i
Y X X u
M in u Y X X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
13
2
1 2 2 3 3
1 2 2 3 3
1
2
1 2 2 3 3
1 2 2 3 3 2
2
2
1 2 2 3 3
1 2 2 3 3 3
3
()
0 2 ( ) 0
()
0 2 ( ) 0
()
0 2 ( ) 0
i i i
i i i
i i i
i i i i
i i i
i i i i
Y X X
Y X X
Y X X
Y X X X
Y X X
Y X X X
求极值
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
14
OLS估计量1 2 2 3 3
2
2 3 3 2 3
2 2 2 2
2 3 2 3
2
3 2 2 2 3
3 2 2 2
2 3 2 3
( ) ( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( )
( ) ( ) ( )
i i i i i i i
i i i i
i i i i i i i
i i i i
Y X X
y x x y x x x
x x x x
y x x y x x x
x x x x
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
15
OLS估计量的方差
2 2 2 2
2 3 3 2 2 3 2 3 2
1 2 2 2
2 3 2 3
2
3 2
2 2 2 2
2 3 2 3
2
2 2
3 2 2 2
2 3 2 3
2
2
21
()
( ) ( ) ( )
()
( ) ( ) ( )
()
( ) ( ) ( )
3
i i i i
i i i i
i
i i i i
i
i i i i
i
X x X x X X x x
VAR
n x x x x
x
VAR
x x x x
x
VAR
x x x x
u
n
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
16
7.4 复判定系数与复相关系数
2 2 3 32
2
i i i i
i
y x y xE S S
R W h y
T S S y
复判定系数:
复相关系数:没什么经济含义。
2 2 3 3
2
0 i i i i
i
y x y x
R
y
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
17
7.5 从复回归看简单回归:模型设定偏误
再次回顾第三章,CLRM的十大假定
– 假定 9:正确地设定了模型
– 若正确的模型为:
– 某人现用下面的模型估计
1 2 2 3 3t t t tY X X u
1 1 2 2 1t t tY b b X u
结果会如何?
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
18
模型设定偏误的后果
1 2 2 1 2 2
2
1 2 2 3 3 2 2
2
1 2 2 3 3 2
()
()
ii
i
bb
x u u
bb
x
E b b
不 是 的 无 偏 估 计 量,V A R ( ) 也 不 是 V A R ( ) 的 无 偏 估 计 量 。
实 际 上,
= +
+
经济含义,
简单回归系数 不仅度量了 X2对 Y的“净”影响,
还度量了 X2通过 X3对 Y的“间接”影响
度量了 X2对 Y的“总”影响
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
19
7.6 调整的复判定系数
问题,复判定系数越大越好吗?
原因,解释变量的个数越多,复判定系数越大!
– 这就给人一个错觉,要使得模型拟合得好,只要增加解释变量即可 。
如何在解释变量的个数与复判定系数的大小之间权衡?
– 我们需要一个判断标准--调整的复判定系数
记住,由增加解释变量个数引起的 R2的增大与拟合好坏无关 。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
20
调整的复判定系数在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是,将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响
)1/(
)1/(12
nT S S
knR S SR
其中,n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
21
调整的复判定系数与复判定系数之间的关系
1
1)1(1 22
kn
nRR
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
22
重新回顾一个问题
判定系数比较的前提条件:
– 被解释变量相同
– 样本容量相同
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
23
7.7 多项式回归模型
问题:边际成本与产量之间的关系?
–,U型的 MC曲线”
二阶多项式模型
20 1 2i i i iY X X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
24
k阶多项式模型
这类模型在有关成本和生产函数的计量经济研究中有广泛的用途。
20 1 2 ki i i k i iY X X X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
25
例:总成本函数的估计
短期某商品产出与其生产总成本之间的关系
什么类型的回归模型能拟合该关系?
– 借助于散点图
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
26
习题
7.20 7.21