Chapter 8 多重共线性
Multicollinearity
1,何谓 Multicollinearity
One of the conditions for OLS:
1 1 1 0 1
1
1 2 2 1 2
1
1
1
,,,
1
k
k
n
n k n k n
X X b
Y
X X b
Y
X X b
Y X b ε
Y X b ε
r a n k ( ) = 1knX
OLSE for the CMLRM:
若干个自变量存在较高程度的近似线性关系。即 有或者,有 0XX
1? (b X X ) X Y
0 1 1 1 1 1 1
1,,
i i i i i k k
k
X a a X a X a X a X
aa
不 全 为 零
2,Causes for multicollinearity
有关经济变量(因素)是线性或近似线性相关的,
样本原因(碰巧是线性或近似线性相关的)
模型误设
3,Aftermath
变得很大。 T-检验失灵。
21v a r ( ) E [ ( ) ( ) ] ( )b b b b b X X
v a r ( )
jb
4,Testing for multicollinearity
1) Correlation Matrix
2) R-sq,F-statistic and t-statistics
3) Regress
R-sq:
Variance inflation factor (VIF),
0 1 1 1 1 1 1i i i i i k kX a a X a X a X a X
2
iX
R
2
1?V I F ( )
1
i
i
X
b
R
5,A case study and adjustment for
multicollinearity
6,多重共线性必定不好吗?
中国电信业务总量的计量模型经初步分析,认为影响中国电信业务总量变化的主要因素是 邮政业务总量
( x1),中国人口数 ( x2),市镇人口占总人口的比重 ( x3),人均 GDP( x4)、
全国居民人均消费水平 ( x5)
Homework:
1.就用线性模型为中国电信业务总量数据建模并做多重共线性分析。
2,研读 D,N,Gujarati的,Essentials of Econometrics》
(机械工业出版社)之第 10章
Multicollinearity
1,何谓 Multicollinearity
One of the conditions for OLS:
1 1 1 0 1
1
1 2 2 1 2
1
1
1
,,,
1
k
k
n
n k n k n
X X b
Y
X X b
Y
X X b
Y X b ε
Y X b ε
r a n k ( ) = 1knX
OLSE for the CMLRM:
若干个自变量存在较高程度的近似线性关系。即 有或者,有 0XX
1? (b X X ) X Y
0 1 1 1 1 1 1
1,,
i i i i i k k
k
X a a X a X a X a X
aa
不 全 为 零
2,Causes for multicollinearity
有关经济变量(因素)是线性或近似线性相关的,
样本原因(碰巧是线性或近似线性相关的)
模型误设
3,Aftermath
变得很大。 T-检验失灵。
21v a r ( ) E [ ( ) ( ) ] ( )b b b b b X X
v a r ( )
jb
4,Testing for multicollinearity
1) Correlation Matrix
2) R-sq,F-statistic and t-statistics
3) Regress
R-sq:
Variance inflation factor (VIF),
0 1 1 1 1 1 1i i i i i k kX a a X a X a X a X
2
iX
R
2
1?V I F ( )
1
i
i
X
b
R
5,A case study and adjustment for
multicollinearity
6,多重共线性必定不好吗?
中国电信业务总量的计量模型经初步分析,认为影响中国电信业务总量变化的主要因素是 邮政业务总量
( x1),中国人口数 ( x2),市镇人口占总人口的比重 ( x3),人均 GDP( x4)、
全国居民人均消费水平 ( x5)
Homework:
1.就用线性模型为中国电信业务总量数据建模并做多重共线性分析。
2,研读 D,N,Gujarati的,Essentials of Econometrics》
(机械工业出版社)之第 10章