第四章 经典单方程计量经济学模型:放宽基本假定的模型基本假定违背,不满足基本假定的情况 。 主要 包括:
( 1) 随机误差项序列存在 异方差 性;
( 2) 随机误差项序列存在 序列相关 性;
( 3) 解释变量之间存在 多重共线 性;
( 4) 解释变量是随机变量且与随机误差项相关
( 随机解释变量 ) ;
此外:
( 5) 模型设定有偏误
( 6) 解释变量的方差不随样本容量的增而收敛计量经济检验,对模型基本假定的检验本章主要学习:前 4类
§ 4.1 异方差性一、异方差的 概念二、异方差的类型三、实际经济问题中的异方差性四、异方差性的后果五、异方差性的检验六、异方差的修正七、案例对于模型
ikikiiii XXXY2210
如果出现
V a r i i( ) 2
即 对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了 异方差性
(Heteroskedasticity)。
一、异方差的概念二、异方差的类型同方差 性假定,?i2 = 常数? f(Xi)
异方差 时,?i2 = f(Xi)
异方差一般可归结为 三种类型,
(1)单调递增型,?i2随 X的增大而增大
(2)单调递减型,?i2随 X的增大而减小
(3)复 杂 型,?i2与 X的变化呈复杂形式三、实际经济问题中的异方差性例 4.1.1:截面资料下研究居民家庭的储蓄行为
Yi=?0+?1Xi+?i
Yi:第 i个家庭的储蓄额 Xi:第 i个家庭的可支配收入高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小
i的方差呈现单调递增型变化例 4.1,2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:
Ci=?0+?1Yi+?I
将居民按照收入等距离分成 n组,取组平均数为样本观测值。
一般情况下,居民收入服从正态分布,中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。
所以 样本观测值的 观测误差 随着解释变量观测值的不同而不同,往往引起异方差性。
例 4.1.3,以某一行业的企业为样本建立企业生产函数模型
Yi=Ai?1 Ki?2 Li?3e?i
被解释变量:产出量 Y
解释变量:资本 K,劳动 L,技术 A,
那么,每个企业所处的 外部环境 对产出量的影响被包含在随机误差项中 。
每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性 。
这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型 。
四、异方差性的后果计量经济学模型一旦出现异方差性,如果仍采用 OLS估计模型参数,会产生下列不良后果:
1、参数估计量非有效
OLS估计量 仍然具有 无偏性,但 不具有 有效性因为在有效性证明中利用了
E(’)=?2I
而且,在大样本情况下,尽管参数估计量 具有一致性,但仍然 不具有 渐近有效性 。
2、变量的显著性检验失去意义变量的显著性检验中,构造了 t统计量其他检验也是如此。
3、模型的预测失效一方面,由于上述后果,使得模型不具有良好的统计性质;
所以,当模型出现异方差性时,参数 OLS
估计值的变异程度增大,从而造成对 Y的预测误差变大,降低预测精度,预测功能失效。
五、异方差性的检验
检验思路:
由于 异方差性 就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:
检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。
问题在于用什么来表示随机误差项的方差一般的处理方法:
首先采用 O L S 法估计模型,以求得随机误差项的估计量 (注意,该估计量是不严格的),我们称之为,近似估计量,,用 ~e i 表示。于是有
V a r E ei i i( ) ( ) ~2 2
~ (? )e y yi i i ls 0
几种异方差的检验方法:
1、图示法
( 1)用 X-Y的散点图进行判断看是否存在明显的 散点扩大,缩小 或 复杂型趋势 (即不在一个固定的带型域中)
(2) X- ~e i 2 的散点图进行判断看是否形成一斜率为零的直线
~
e
i
2
~
e
i
2
X X
同方差 递增异方差
~
e
i
2
~
e
i
2
X X
递减异方差 复杂型异方差
2、帕克 (Park)检验与戈里瑟 (Gleiser)检验基本思想,
偿试建立方程:
ijii Xfe )(~ 2

ijii Xfe )(|~|
选择关于变量 X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
如,帕克检验常用的函数形式:
ieXXf jiji 2)(? 或 ijii Xe lnln)~ln ( 22
若?在统计上是显著的,表明存在异方差性 。
3、戈德菲尔德 -匡特 (Goldfeld-Quandt)检验
G-Q检验以 F检验为基础,适用于样本容量较大、
异方差递增或递减的情况。
G-Q检验的思想,
先将样本一分为二,对子样 ① 和子样 ② 分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。
由于该统计量服从 F分布,因此假如存在递增的异方差,则 F远大于 1;反之就会等于 1(同方差)、或小于 1(递减方差)。
G-Q检验的步骤:
① 将 n对样本观察值 (Xi,Yi)按观察值 Xi的大小排队
②将序列中间的 c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为 (n-c)/2
③ 对每个子样分别进行 OLS回归,并计算各自的残差平方和
④ 在同方差性假定下,构造如下满足 F分布的统计量
)1
2
,1
2
(~
)1
2
(~
)1
2
(~
2
1
2
2




k
cn
k
cn
F
k
cn
e
k
cn
e
F
i
i
⑤ 给定显著性水平?,确定临界值 F?(v1,v2),
若 F> F?(v1,v2),则拒绝同方差性假设,表明存在异方差 。
当然,还可根据两个残差平方和对应的子样的顺序判断是 递增型异方差 还是 递减异型方差 。
3、怀特( White)检验怀特检验不需要排序,且适合任何形式的异方差怀特检验的基本思想与步骤 (以二元为例):
iiii XXY 22110
然后做如下辅助回归
iiiiiiii XXXXXXe 215224213221102~
可以证明,在同方差假设下:
(*)
R2为 (*)的可决系数,h为 (*)式解释变量的个数,
表示渐近服从某分布。
注意:
辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。
如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的 t检验值较大 。
当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项 。
六,异方差的修正模型检验出存在异方差性,可用 加权最小二乘法 ( Weighted Least Squares,WLS) 进行估计。
加权最小二乘法的基本思想:
加权最小二乘法 是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用 OLS估计其参数。
在采用 OLS方法时,
对较小的残差平方 ei2赋予较大的权数,
对较大的残差平方 ei2赋予较小的权数。
2
1102 )]([ kkiiii XXYWeW
例如,如果对一多元模型,经检验知:
222 )()()( jiiii XfEVa r
i
ji
i
jiji
i
ji
X
Xf
X
XfXf
Y
Xf
22110
)(
1
)(
1
)(
1
)(
1

i
ji
ki
ji
k
Xf
X
Xf

)(
1
)(
1

新模型中,存在
222 )(
)(
1)
)(
1()
)(
1(
i
ji
i
ji
i
ji
EXfXfEXfV a r
即满足同方差性,可用 OLS法估计。
一般情况下,
对于模型
Y=X?+?
存在
Wμμμ
μ
2)()(
0)(

EC ov
E
W?
w
w
w n
1
2
即存在 异方差性 。
W是一对称正定矩阵,存在一可逆矩阵 D使得
W=DD’
用 D-1左乘 Y=X?+?
两边,得到一个新的模型:
μDX βDYD 111
*** μβXY
该模型具有同方差性。因为
121121
1111 )()()(




DDDDDΩD
DμμDDμμDμμ **

EEE
I2
**1*** )(? YXXXβ
YWXXWX
YDDXXDDX
111
11111
)(
)(




这就是原模型 Y=X?+?
的 加权最小二乘估计量,是无偏、有效的估计量。
这里权矩阵为 D-1,它来自于 原模型残差项?
的方差 -协方差矩阵?2W 。
如何得到?2W?
从前面的推导过程看,它来自于原模型残差项?
的方差 -协方差矩阵。因此仍对原模型进行 OLS估计,得到随机误差项的近似估计量 ěi,以此构成权矩阵的估计量,即
2
2
1
2
~
~
ne
e
W?
这时可直接以 |}~|/1,|,~|/1|,~|/1{ 211 neeed ia gD
作为权矩阵。
注意:
在实际操作中 人们通常采用如下的经验方法:
不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法七、案例 --中国农村居民人均消费函数例 4.1.4 中国农村居民人均消费支出主要由人均纯收入来决定。
农村人均纯收入包括 (1)从事农业经营的收入,
(2)包括从事其他产业的经营性收入 (3)工资性收入,(4)财产收入 (4)转移支付收入。
考察 从事农业经营的收入 (X1)和 其他收入 (X2)
对中国 农村居民消费支出 (Y)增长的影响,
22110 lnlnln XXY
表 4,1,1 中国 2001 年各地区农村居民家庭人 均纯收入与消费支 出相关数据(单位:元)
地区人均消费支出
Y
从事农业经营的收入
1
X
其他收入
2
X
地区人均消费支出
Y
从事农业经营的收入
1
X
其他收入
2
X
北 京 3 5 5 2,1 579.1 4 4 4 6,4 湖 北 2 7 0 3,3 6 1242.9 2 5 2 6,9
天 津 2 0 5 0,9 1314.6 2 6 3 3,1 湖 南 1 5 5 0,6 2 1068.8 875.6
河 北 1 4 2 9,8 928.8 1 6 7 4,8 广 东 1 3 5 7,4 3 1386.7 839.8
山 西 1 2 2 1,6 609.8 1 3 4 6,2 广 西 1 4 7 5,1 6 883.2 1 0 8 8,0
内蒙古 1 5 5 4,6 1492.8 480.5 海 南 1 4 9 7,5 2 919.3 1 0 6 7,7
辽 宁 1 7 8 6,3 1254.3 1 3 0 3,6 重 庆 1 0 9 8,3 9 764.0 647.8
吉 林 1 6 6 1,7 1634.6 547.6 四 川 1 3 3 6,2 5 889.4 644.3
黑龙江 1 6 0 4,5 1684.1 596.2 贵 州 1123,7 1 589.6 814.4
上 海 4 7 5 3,2 652.5 5 2 1 8,4 云 南 1 3 3 1,0 3 614.8 876.0
江 苏 2 3 7 4,7 1177.6 2 6 0 7,2 西 藏 1 1 2 7,3 7 621.6 887.0
浙 江 3 4 7 9,2 985.8 3 5 9 6,6 陕 西 1 3 3 0,4 5 803.8 753.5
安 徽 1 4 1 2,4 1013.1 1 0 0 6,9 甘 肃 1 3 8 8,7 9 859.6 963.4
福 建 2 5 0 3,1 1053.0 2 3 2 7,7 青 海 1 3 5 0,2 3 1300.1 410.3
江 西 1 7 2 0,0 1027.8 1 2 0 3,8 宁 夏 2 7 0 3,3 6 1242.9 2 5 2 6,9
山 东 1 9 0 5,0 1293.0 1 5 1 1,6 新 疆 1 5 5 0,6 2 1068.8 875.6
河 南 1 3 7 5,6 1083.8 1 0 1 4,1
普通最小二乘法的估计结果:
21 ln5084.0ln3166.0655.1
ln XXY
( 1,8 7 ) ( 3,0 2) ( 1 0,0 4 )
2R
= 0,7 8 3 1
2R
= 0,7676 D W = 1,89 F = 50,5 3 R S S = 0,8232
异方差检验进一步的统计检验
(1)G-Q检验将原始数据按 X2排成升序,去掉中间的 7个数据,
得两个容量为 12的子样本。
对两个子样本分别作 OLS回归,求各自的残差平方和 RSS1和 RSS2:
子样本 1,21 ln1 1 9.0ln3 4 3.00 6 1.4?ln XXY
(3.18) (4.13) (0.94)
R2=0.7068,RSS1=0.0648
子样本 2,21 ln7 7 6.0ln1 3 8.07 9 1.0?ln XXY
(0.43) (0.73) (6.53)
R2=0.8339,RSS2=0.2729
计算 F统计量:
F= RSS2/RSS1=0.2792/0.0648=4.31
查表给定?=5%,查得临界值 F0.05(9,9)=2.97
判断
F> F0.05(9,9)
否定两组子样方差相同的假设,从而 该总体随机项 存在递增异方差性 。
( 2)怀特检验作辅助回归,
2222112 )( l n0 2 6.0ln0 5 5.0)( l n0 1 5.0ln1 0 2.017.0? XXXXe
( -0.04) (0.10) (0.21) (-0.12) (1.47)
21 lnln0 4 3.0 XX?
(-1.11)
R2 =0.4638
似乎没有哪个参数的 t检验是显著的 。但
n R2 =31*0.4638=14.38
=5%下,临界值?20.05(5)=11.07,拒绝 同方差性去掉交叉项后的辅助回归结果
2222112 )( l n039.0ln539.0)( l n042.0ln570.0842.3? XXXXe
(1.36) (-0.64) (064) (-2.76) (2.90)
R2 =0.4374
X2项与 X2的平方项的参数的 t检验是显著的,且
n R2 =31? 0.4374=13.56
=5%下,临界值?20.05(4)=9.49
拒绝 同方差 的原假设原模型的加权最小二乘回归对原模型进行 OLS估计,得到随机误差项的近似估计量 ěi,以此构成权矩阵?2W的估计量;
再以 1/| ěi|为权重进行 WLS估计,得
21 ln527.0ln319.0497.1?ln XXY
( 5,1 2 ) ( 5,9 4 ) ( 2 8,9 4 )
2R
= 0,9 9 9 9
2R
= 0,9 9 9 9 D W = 2,4 9 F = 9 2 4 4 3 2 R S S = 0,0 7 0 6
各项统计检验指标全面改善