§ 2.8多重共线性
Multi-Collinearity
一、多重共线性的概念
二、多重共线性的后果
三、多重共线性的检验
四、克服多重共线性的方法
五、案例
六、分部回归与多重共线性
一、多重共线性的概念
1、多重共线性
对于模型
Yi=?0+?1X1i+?2X2i+?+?kXki+?i
i=1,2,…,n (2.6.1)
其基本假设之一是解释变量是互相独立的 。
如果某两个或多个解释变量之间出现了相关性,
则称为 多重共线性 。
如果存在
c1X1i+c2X2i+… +ckXki=0
i=1,2,…,n (2.6.2)
其中, ci不全为 0,即 某一个解释变量可以用其它解
释变量的线性组合表示, 则称为解释变量间存在 完
全共线性 。
如果存在
c1X1i+c2X2i+… +ckXki+vi=0
i=1,2,…,n (2.6.3)
其中 ci不全为 0,vi为随机误差项, 则称为 一般共线性
(近似共线性 )或 交互相关 (intercorrelated)。
在矩阵表示的线性回归模型
Y=XB+N
中,完全共线性指:秩 (X)<k+1,即矩阵 ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
knnn
k
k
XXX
XXX
XXX
X
?
?????
?
?
21
22212
12111
1
1
1
中,至少有一列向量可由其他列向量 (不包
括第一列)线性表出。
例如, X2=?X1,这时 X1与 X2的相关系数为 1,
解释变量 X2对因变量的作用完全可由 X1代替。
注意:
完全共线性的情况并不多见,一般出现的是在
一定程度上的共线性,即近似共线性 。
2、实际经济问题中的多重共线性现象
? 经济变量的共同变化趋势
时间序列样本,经济 繁荣时期,各基本经济
变量(收入、消费、投资、价格)都趋于增长;
衰退时期,又同时趋于下降。
横截面数据,生产函数中, 资本投入与劳动力
投入往往出现高度相关情况,大企业二者都大,
小企业都小。
? 滞后变量的引入
在计量经济模型中,往往需要引入滞后经济变
量来反映真实的经济关系。
例如,消费 =f(当期收入,前期收入)
显然,两期收入间有较强的线性相关性 。
? 一般经验
对于采用 时间序列数据 作样本、以简单线性形
式建立的计量经济学模型,往往存在多重共线性。
以 截面数据 作样本时,问题不那么严重,但多
重共线性仍然是存在的。
二、多重共线性的后果
1、完全共线性下参数估计量不存在
多元线性模型
Y X? ?? ?
的普通最小二乘参数估计量为:
? ( )? ? ? ??X X X Y1
( 2, 6, 4 )
如果存在完全共线性,则 (X’X) -1不存在,无法得
到参数的估计量。
例如,对一个离差形式的二元回归模型
??? ??? 2211 xxy
如果两个解释变量完全相关,如 12 xx ??,则有
?
??
??
??
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
12
1
22
1
2
1
2
1
2
212
21
2
1
1
??
?
??
?
i
ii
ii
iii
iii
x
xx
xx
xxx
xxx
XX
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
1
1
2
1
ii
ii
ii
yx
yx
yx
YX
该回归模型的正规方程为
YXBX)X ???
?(
或 ? ? ??? iiiii yxxxx 1212
2
11
?? ??
? ? ??? iiiii yxxxx 2
2
22121
?? ??
解该线性方程组得:
0
0
?
2
1
22
1
2
1
2
1
2
1
2
1
2
11
2
212
21
2
1
2
22
211
1
???
??
??
??
??
??
??
??
??
ii
ii
iii
iii
iii
iii
iii
iiii
xx
xx
xyx
xyx
xxx
xxx
xyx
xxyx
??
?
??
?
?
1
?? 为不定式;
同理,2?? 也为不定式,其值无法确定。
事实上,当 12 xx ?? 时,原二元回归模型退
化为一元回归模型:
???? ??? 121 )( xy
只能确定综合参数 21 ??? ? 的估计值:
????
2
1121
??
iii
xyx???
2、近似共线性下普通最小二乘法参数估计
量非有效
在一般共线性 ( 或称近似共线性 ) 下, 虽然可
以得到 OLS法参数估计量, 但是由参数估计量方
差的表达式为
12 )()?( ???? XX?C o v
可见, 由于此时 |X’X|?0,引起 (X’X) -1主对角
线元素较大, 从而使参数估计值的方差增大,
OLS参数估计量非有效 。
仍以一元模型中 1
?
? 为例,
1
?
? 的方差为
? ??
?
? ??
?
?
?
?
???
?
2
2
2
1
2
21
2
1
2
2
21
2
2
2
1
2
2
2
1
11
2
1
)(1
/
)(
)()
?
v ar (
iiii
i
iiii
i
xxxx
x
xxxx
x
XX
?
?
??
? ?
?
2
2
2
1
2
21
)(
ii
ii
xx
xx
恰为 1x 与 2x 的线性相关系数的平

2
r,由于
2
r ? 1,故 1
1
1
2
?
? r

即,多重共线性使参数估计值的方差增大,方差
扩大因子 (Variance Inflation Factor)为 1/(1-r2),
其增大趋势见下表:
当 完全不共线 时,2r =0, ?? 2121 /)?v a r ( ix??当 不完全共线 (近似共线)时,10 2 ?? r,
??
?
?
??
2
1
2
22
1
2
1
1
1
)?v a r (
ii xrx
??
?
相关系
数平方
0 0, 5 0, 8 0, 9 0, 9 5 0, 9 6 0, 9 7 0, 9 8 0, 9 9 0, 9 9 9
方差扩
大因子
1 2 5 10 20 25 33 50 100 1000
当完全共线时,
2
r =1, ??)?v a r (
1?
3、参数估计量经济含义不合理
如果模型中两个解释变量具有线性相关性,
例如 X1和 X2,那么它们中的一个变量可以由另一
个变量表征 。
这时, X1和 X2前的参数并不反映各自与被解
释变量之间的结构关系, 而是反映它们对被解释
变量的共同影响 。
所以各自的参数已经失去了应有的经济含义,
于是经常表现出似乎反常的现象, 例如本来应该
是正的, 结果恰是负的 。
4、变量的显著性检验失去意义
存在多重共线性时
参数估计值的方差与标准差变大
使 t统计量的拒绝域变小(临界值增大)
容易使通过样本计算的 t值小于临界值,
误导作出参数为 0的推断
可能将重要的解释变量排除在模型之外
5、模型的预测功能失效
? 变大的方差容易使区间预测的“区间”变大,
使预测失去意义。
? 能否说:如果存在完全共线性,预测值的置信
区间为(- ∞, +∞ )?
三、多重共线性的检验
? 由于多重共线性表现为解释变量之间具有相关
关系,所以 用于多重共线性的检验方法主要是统
计方法:如 判定系数检验法, 逐步回归检验法 等 。
? 多重共线性检验的任务 是:
( 1)检验多重共线性是否存在;
( 2)估计多重共线性的范围,即判断哪些变量
之间存在共线性。
1、检验多重共线性是否存在
(1)对两个解释变量的模型,采用 简单相关系数法
求出 X1与 X2的简单相关系数 r,若 |r|接近 1,则说
明两变量存在较强的多重共线性。
(2)对多个解释变量的模型,采用 综合统计检验法
若 在 OLS法下, 模型的 R2与 F值较大,但各参数
估计值的 t检验值较小,说明各解释变量对 Y的联合
线性作用显著,但各解释变量间存在共线性而使得
它们对 Y的独立作用不能分辨,故 t检验不显著。
2、判明存在多重共线性的范围
(1) 判定系数检验法
? 使模型中每一个解释变量分别以其余解释变量
为解释变量进行回归计算, 并计算相应的拟合优
度, 也称为判定系数 。 如果在某一种形式
Xji=?1X1i+?2X2i+??LXLi
中判定系数较大, 则说明在该形式中作为被解释
变量的 Xj可以用其他 X的线性组合代替, 即 Xj与
其他 X之间存在共线性 。
? 等价的检验是对上述回归方程作 F检验
式中,Rj?2为第 j个解释变量对其他解释变量的回
归方程的决定系数,
若存在较强的共线性,则 Rj?2较大且接近于 1,这
时( 1- Rj?2 )较小,从而 Fj的值较大。因此,可以在
给定的显著性水平 ?下,通过计算 F值的方法进行检
验。
构造如下 F 统计量:
)1,2(~)1/()1(
)2/(
2
.
2
.
???
???
?
? knkF
knR
kR
F
j
j
j
? 另一等价的检验,
在模型中排除某一个解释变量 Xj,估计模型,
如果拟合优度与包含 Xj时十分接近,则说明 Xj与
其它解释变量之间存在共线性。
(2) 逐步回归法
? 以 Y为被解释变量,逐个引入解释变量,构成
回归模型,进行模型估计。
? 根据拟合优度的变化决定新引入的变量是否可
以用其它变量的线性组合代替,而不作为独立的
解释变量。
? 如果拟合优度变化显著,则说明新引入的变量
是一个独立解释变量;
? 如果拟合优度变化很不显著,则说明新引入的
变量不是一个独立解释变量,它可以用其它变量
的线性组合代替,也就是说它与其它变量之间存
在共线性关系。
四、克服多重共线性的方法
1、第一类方法:排除引起共线性的变量
? 找出引起多重共线性的解释变量,将它排除出去,
是最为有效的克服多重共线性问题的方法。以逐步
回归法得到最广泛的应用。
? 注意:
剩余解释变量参数的经济含义和数值都发生了变化。
2、第二类方法:差分法
? 对于以时间序列数据为样本、以直接线性关系
为模型关系形式的计量经济学模型,将原模型变
换为差分模型
?Yi=?1 ? X1i+?2 ? X2i+?+?k ? Xki+ ? ?i
可以有效地消除存在于原模型中的多重共线性。
? 一般讲,增量之间的线性关系远比总量之间的
线性关系弱得多。
例如,在中国消费模型中的 2个变量,
收入 (Y, G D P ) 与消费 C 的总量与增量数据
Y C ( - 1 ) C ( - 1 ) / Y △ Y △ C ( - 1 ) △ C ( - 1 ) / △ Y
1981 4901 2976 0, 6 0 7 2
1982 5489 3309 0, 6 0 2 8 588 333 0, 5 6 6 3
1983 6076 3638 0, 5 9 9 6 587 329 0, 5 6 0 5
1984 7164 4021 0, 5 6 1 3 1088 383 0, 3 5 2 0
1985 8792 4694 0, 5 3 3 9 1628 673 0, 4 1 3 4
1986 1 0 1 3 3 5773 0, 5 6 9 7 1441 1079 0, 7 4 8 8
1987 1 1 7 8 4 6542 0, 5 5 5 2 1651 769 0, 4 6 5 8
1988 1 4 7 0 4 7451 0, 5 0 6 7 2920 909 0, 3 1 1 3
1989 1 6 4 6 6 9360 0, 5 6 8 4 1762 1909 1, 0 8 3
1990 1 8 3 2 0 1 0 5 5 6 0, 5 7 6 2 1854 1 1 9 6 0, 6 4 5 1
1991 2 1 2 8 0 1 1 3 6 2 0, 5 3 3 9 2960 806 0, 2 7 2 3
1992 2 5 8 6 4 1 3 1 4 6 0, 5 0 8 3 4584 1784 0, 3 8 9 2
1993 3 4 5 0 1 1 5 9 5 2 0, 4 6 2 4 8637 2806 0, 3 2 4 9
1994 4 7 1 1 1 2 0 1 8 2 0, 4 2 8 4 1 2 6 1 0 4230 0, 3 3 5 4
1995 5 9 4 0 5 2 7 2 1 6 0, 4 5 8 1 1 2 2 9 4 7034 0, 5 7 2 1
1996 6 8 4 9 8 3 4 5 2 9 0, 5 0 4 1 9093 7313 0, 8 0 4 2
? 由表中的比值可以直观地看到,两变量增量的
线性关系弱于总量之间的线性关系。
? 进一步分析:
Y与 C(-1)之间的判定系数为 0.9845,
△ Y与△ C(-1)之间的判定系数为 0.7456。
一般认为,两个变量之间的判定系数大于 0.8
时,二者之间存在线性关系。
所以,原模型经检验地被认为具有多重共线
性,而差分模型则可认为不具有多重共线性。
3、第三类方法:减小参数估计量的方差
? 多重共线性的主要后果是参数估计量具有较大
的方差,所以采取适当方法减小参数估计量的方
差,虽然没有消除模型中的多重共线性,但确能
消除多重共线性造成的后果。
?例如,增加样本容量,可使参数估计量的方差
减小。
? 再如, 岭回归法 ( Ridge Regression)
70年代发展的岭回归法, 以引入偏误为代价减小
参数估计量的方差, 受到人们的重视 。
具体方法是:引入矩阵 D,使参数估计量为
其中矩阵 D一般选择为主对角阵,即
D=aI (2.6.6)
a为大于 0的常数。
显然,与未含 D的参数 B的估计量相比,(2.6.5)的
估计量有较小的方差。
? ( )? ? ? ? ??X X D X Y1 ( 2, 6, 5 )
五、案例一:服装市场需求函数

1、建立模型
? 根据理论和经验分析, 影响居民服装类支出的
主要因素有:可支配收入, 居民流动资产拥有量,
服装价格指数, 物价总指数 。
? 已知某地区的有关资料, 根据散点图判断, 建
立线性服装消费支出模型:
Y=?0+?1X+?2K+?3P1+?4P0+?
2、样本数据
由于 R2较大且接近于 1,而且 F=638.4,大于临界
值,F 0.05(4,5)=15.19,故认为服装支出与上述解释
变量间总体线性关系显著。
但由于参数 K的估计值的 t检验值较小(未能通过
检验),故 解释变量间存在多重共线性 。
( 1 ) 用 O L S 法估计上述模型:
01 334.0197.0001.010.020.13
? PPKXY ??????
( - 1, 7 6 ) ( 3, 7 1 ) ( 0, 3 0 ) ( - 2, 2 0 ) ( 2, 2 4 )
r
2
= 0, 9 9 8 0 R
2
= 0, 9 9 6 5 F = 6 3 8, 4
3、估计模型
( 2)检验简单相关系数
? 各解释变量间存在高度相关性, 其中尤其以 P1,
P0间的相关系数为最高 。
列出 X, K, P1, P0 的相关系数矩阵:
X K P1 P0
X 1 0.9883 0.9804 0.9878
K 0.9883 1 0.9700 0.9695
P1 0.9804 0.9700 1 0.9918
P0 0.9878 0.9695 0.9918 1
( 3)找出最简单的回归形式
? 可见,应选 ①为初始的回归模型。
分别作 Y 与 X, K, P1, P0 间的回归:
① XY 118.024.1
?
??? ② KY 327.0118.2
?
??
(-3,36 ) ( 42, 48 ) (2.58) (15.31)
2
R = 0.99 5 0 F = 1805, 1
2
R = 0.9629 F = 234.4
③ 1
516.05.38
?
PY ???
④ 0
663.07.53
?
PY ???
(-9.16) (12.53) (-14.77) (18.66)
2
R
= 0.9455 F = 157,1
2
R
= 0.9747 F = 348,1
( 4)逐步回归
将其他解释变量分别导入上述初始回归模型,
寻找最佳回归方程 。
Y C X K P1 P0
2
R F
= f ( X ) - 1, 2 5 0, 1 2 0, 9 9 5 0 1 8 0 5, 1
t 值 - 3, 3 6 4 2, 4 9
= f ( X,P 1 ) 1, 5 3 0, 1 3 - 0, 0 4 0, 9 958 826, 9
t 0, 3 1 8, 5 7 - 0, 5 7
= f ( X,P 1,K ) 1, 0 6 0, 1 4 - 0, 0 4 - 0, 0 4 0, 9 9 4 1 5 0 9, 0
t 0, 2 1 5, 7 0 - 0, 6 8 - 0, 5 3
= f ( X,P 1,P 0 ) -1 2, 45 0, 1 0 - 0, 1 9 0,31 0, 9 9 7 0 1003,6
t - 1, 92 7, 55 - 2, 47 2,5 9
= f ( X,P 1,P 0,K ) - 1 3, 2 0 0, 1 0 0, 0 1 - 0, 2 0 0, 3 3 0, 9 9 6 5 6 3 8, 4
- 1, 7 9 3, 7 1 0, 3 0 - 2, 2 0 2, 2 4
4、讨论:
① 在初始模型中引入 P1,模型拟合优度提高, 且
参数符号合理, 但 P1的 t检验未通过;
② 再引入 K,拟合优度虽有提高, 但 K与 P1的 t检
验未能通过, 且 X与 P1的 t检验值及 F检验值有所下降,
表明引入 K并未对回归模型带来明显的, 好处,, K
可能是多余的;
③ 去掉 K,加入 P0,拟合优度有所提高, 且各解释
变量的 t检验全部通过, F值也增大了 。
④ 将 4个解释变量全部包括进模型, 拟合优度未有
明显改观, K的 t检验未能通过, K显然是多余的 。
5、结论
回归方程以 Y=f(X,P1,P0)为最优:
Y=-12.45+0.10X-0.19P1+0.31P0
五、案例二:中国消费函数模型
1,OLS估计结果
2、差分法估计结果
3、比较
β1,0.480728→0.491558
β2,0.196433→0.166864
在消除了共线性后,GDP对 CONS的影响增大,
CONS1对 CONS的影响减少。
六、分部回归与多重共线性
1、分部回归法 (Partitioned Regression)
对于模型
Y X? ?? ?
将解释变量分为两部分,对应的参数也分为两部分:
?????? 2211 XXY
在满足解释变量与随机误差项不相关的情况下,可
以写出关于参数估计量的方程组:
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
?
?
?
?
?
?
?
2
1
2212
2111
2
1
?
?
xxxx
xxxx
YX
YX
如果存在
)?()(
?)()(?
221
1
11
221
1
111
1
111
?????
????????
?
??
XYXXX
XXXXYXXX
0XX ?? 21
则有 YXXX
11111 )(? ???? ?
这就是仅以 X1作为解释变量时的参数估计量 。
同样有 YXXX
21222 )(? ???? ?
这就是仅以 X2作为解释变量时的参数估计量 。
2、由分部回归法导出
? 如果一个多元线性模型的解释变量之间完全正交,
可以将该多元模型分为多个一元模型、二元模
型,… 进行估计,参数估计结果不变;
? 实际模型由于存在或轻或重的共线性,如果将它
们分为多个一元模型、二元模型,… 进行估计,
参数估计结果将发生变化;
? 当模型存在共线性,将某个共线性变量去掉,
剩余变量的参数估计结果将发生变化,而且经
济含义有发生变化;
? 严格地说,实际模型由于总存在一定程度的共
线性,所以每个参数估计量并不 真正反映对应
变量与被解释变量之间的结构关系。