第四章 经典单方程计量经济学
模型:放宽基本假定的模型
基本假定违背, 不满足基本假定的情况 。 主要 包括:
( 1) 随机误差项序列存在 异方差 性;
( 2) 随机误差项序列存在 序列相关 性;
( 3) 解释变量之间存在 多重共线 性;
( 4) 解释变量是随机变量且与随机误差项相关
( 随机解释变量 ) ;
此外:
( 5) 模型设定有偏误
( 6) 解释变量的方差不随样本容量的增而收敛
计量经济检验,对模型基本假定的检验
本章主要学习:前 4类
§ 4.1 异方差性
一、异方差的 概念
二、异方差的类型
三、实际经济问题中的异方差性
四、异方差性的后果
五、异方差性的检验
六、异方差的修正
七、案例
对于模型
ikikiiii XXXY ????? ?????? ?2210
如果出现
V a r i i( )? ?? 2
即 对于不同的样本点, 随机误差项的方差不再
是常数, 而互不相同, 则认为出现了 异方差性
(Heteroskedasticity)。
一、异方差的概念
二、异方差的类型
同方差 性假定, ?i2 = 常数 ? f(Xi)
异方差 时,?i2 = f(Xi)
异方差一般可归结为 三种类型,
(1)单调递增型, ?i2随 X的增大而增大
(2)单调递减型, ?i2随 X的增大而减小
(3)复 杂 型, ?i2与 X的变化呈复杂形式
三、实际经济问题中的异方差性
例 4.1.1:截面资料下研究居民家庭的储蓄行为
Yi=?0+?1Xi+?i
Yi:第 i个家庭的储蓄额 Xi:第 i个家庭的可支配收入
高收入家庭:储蓄的差异较大
低收入家庭:储蓄则更有规律性,差异较小
?i的方差呈现单调递增型变化
例 4.1,2,以绝对收入假设为理论假设、以截面
数据为样本建立居民消费函数:
Ci=?0+?1Yi+?I
将居民按照收入等距离分成 n组,取组平均数为样
本观测值。
一般情况下,居民收入服从正态分布,中等收入
组人数多,两端收入组人数少。而人数多的组平均
数的误差小,人数少的组平均数的误差大。
所以 样本观测值的 观测误差 随着解释变量观测值
的不同而不同,往往引起异方差性。
例 4.1.3,以某一行业的企业为样本建立企业生产
函数模型
Yi=Ai?1 Ki?2 Li?3e?i
被解释变量:产出量 Y
解释变量:资本 K,劳动 L,技术 A,
那么,每个企业所处的 外部环境 对产出量的影响被
包含在随机误差项中 。
每个企业所处的外部环境对产出量的影响程度不
同, 造成了随机误差项的异方差性 。
这时, 随机误差项的方差并不随某一个解释变量
观测值的变化而呈规律性变化, 呈现复杂型 。
四、异方差性的后果
计量经济学模型一旦出现异方差性,如果仍采
用 OLS估计模型参数,会产生下列不良后果:
1、参数估计量非有效
OLS估计量 仍然具有 无偏性,但 不具有 有效性
因为在有效性证明中利用了
E(??’)=?2I
而且,在大样本情况下,尽管参数估计量 具有
一致性,但仍然 不具有 渐近有效性 。
2、变量的显著性检验失去意义
变量的显著性检验中,构造了 t统计量
其他检验也是如此。
3、模型的预测失效
一方面, 由于上述后果, 使得模型不具有
良好的统计性质;
所以,当模型出现异方差性时,参数 OLS
估计值的变异程度增大,从而造成对 Y的预测
误差变大,降低预测精度,预测功能失效。
五、异方差性的检验
? 检验思路:
由于 异方差性 就是相对于不同的解释变量
观测值,随机误差项具有不同的方差。那么:
检验异方差性,也就是检验随机误差项的
方差与解释变量观测值之间的相关性及其相
关的“形式”。
问题在于用什么来表示随机误差项的方差
一般的处理方法:
首先采用 O LS 法估计模型,以求得随机误差项的
估计量 (注意,该估计量是不严格的),我们称之为, 近
似估计量,,用
~e
i 表示。于是有
V a r E ei i i( ) ( ) ~? ?? ?2 2
~ ( ? )e y yi i i ls? ? 0
几种异方差的检验方法:
1、图示法
( 1)用 X-Y的散点图进行判断
看是否存在明显的 散点扩大, 缩小 或 复杂型
趋势 (即不在一个固定的带型域中)
(2) X- ~e i 2 的散点图进行判断
看是否形成一斜率为零的直线
~
e
i
2
~
e
i
2
X X
同方差 递增异方差
~
e
i
2
~
e
i
2
X X
递减异方差 复杂型异方差
2、帕克 (Park)检验与戈里瑟 (Gleiser)检验
基本思想,
偿试建立方程:
ijii Xfe ??? )(~ 2
或
ijii Xfe ??? )(|~|
选择关于变量 X的不同的函数形式,对方程进
行估计并进行显著性检验,如果存在某一种函
数形式,使得方程显著成立,则说明原模型存
在异方差性。
如,帕克检验常用的函数形式:
ieXXf jiji ??? 2)( ? 或 ijii Xe ??? ??? lnln)~l n ( 22
若 ?在统计上是显著的,表明存在异方差性 。
3、戈德菲尔德 -匡特 (Goldfeld-Quandt)检验
G-Q检验以 F检验为基础,适用于样本容量较大、
异方差递增或递减的情况。
G-Q检验的思想,
先将样本一分为二,对子样 ① 和子样 ② 分别
作回归,然后利用两个子样的残差平方和之比构
造统计量进行异方差检验。
由于该统计量服从 F分布,因此假如存在递增
的异方差,则 F远大于 1;反之就会等于 1(同方
差)、或小于 1(递减方差)。
G-Q检验的步骤:
① 将 n对样本观察值 (Xi,Yi)按观察值 Xi的大小
排队
②将序列中间的 c=n/4个观察值除去,并将剩
下的观察值划分为较小与较大的相同的两个
子样本,每个子样样本容量均为 (n-c)/2
③ 对每个子样分别进行 OLS回归,并计算各自
的残差平方和
④ 在同方差性假定下,构造如下满足 F分布的
统计量
)1
2
,1
2
(~
)1
2
(~
)1
2
(~
2
1
2
2
??
?
??
?
??
?
??
?
?
?
?
k
cn
k
cn
F
k
cn
e
k
cn
e
F
i
i
⑤ 给定显著性水平 ?,确定临界值 F?(v1,v2),
若 F> F?(v1,v2),则拒绝同方差性假设,表明
存在异方差 。
当然,还可根据两个残差平方和对应的子样
的顺序判断是 递增型异方差 还是 递减异型方差 。
3、怀特( White)检验
怀特检验不需要排序,且适合任何形式的异方差
怀特检验的基本思想与步骤 (以二元为例):
iiii XXY ???? ???? 22110
然后做如下辅助回归
iiiiiiii XXXXXXe ??????? ??????? 215224213221102~
可以证明,在同方差假设下:
(*)
R2为 (*)的可决系数,h为 (*)式解释变量的个数,
表示渐近服从某分布。
注意:
辅助回归仍是检验与解释变量可能的组合的
显著性,因此,辅助回归方程中还可引入解释
变量的更高次方。
如果存在异方差性, 则表明确与解释变量的
某种组合有显著的相关性, 这时往往显示出有
较高的可决系数以及某一参数的 t检验值较大 。
当然, 在多元回归中, 由于辅助回归方程中
可能有太多解释变量, 从而使自由度减少, 有
时可去掉交叉项 。
六,异方差的修正
模型检验出存在异方差性,可用 加权最小二乘
法 ( Weighted Least Squares,WLS) 进行估计。
加权最小二乘法的基本思想:
加权最小二乘法 是对原模型加权,使之变成一
个新的不存在异方差性的模型,然后采用 OLS估
计其参数。
在采用 OLS方法时,
对较小的残差平方 ei2赋予较大的权数,
对较大的残差平方 ei2赋予较小的权数。
2
1102 )]???([? ? ????? kkiiii XXYWeW ??? ?
例如, 如果对一多元模型, 经检验知:
222 )()()( ???? jiiii XfEV a r ???
?????
i
ji
i
jiji
i
ji
X
Xf
X
XfXf
Y
Xf
22110
)(
1
)(
1
)(
1
)(
1
???
i
ji
ki
ji
k
Xf
X
Xf
??
)(
1
)(
1
??
新模型中,存在
222 )(
)(
1)
)(
1()
)(
1( ???? ???
i
ji
i
ji
i
ji
EXfXfEXfV a r
即满足同方差性,可用 OLS法估计。
一般情况下,
对于模型
Y=X?+?
存在
Wμμμ
μ
2)()(
0)(
????
?
EC o v
E
W ?
?
?
?
?
?
?
?
?
?
?
?
?
w
w
w n
1
2
?
即存在 异方差性 。
W是一对称正定矩阵, 存在一可逆矩阵 D使得
W=DD’
用 D-1左乘 Y=X?+?
两边,得到一个新的模型:
μDX βDYD 111 ??? ??
*** μβXY ??
该模型具有同方差性。因为
121121
1111 )()()(
????
????
?????
???????
DDDDDΩD
DμμDDμμDμμ **
??
EEE
I2??
**1*** )(? YXXXβ ??? ?
YWXXWX
YDDXXDDX
111
11111
)(
)(
???
?????
???
?????
这就是原模型 Y=X?+?
的 加权最小二乘估计量,是无偏、有效的估计量。
这里权矩阵为 D-1,它来自于 原模型残差项 ?
的方差 -协方差矩阵 ?2W 。
如何得到 ?2W?
从前面的推导过程看,它来自于原模型残差项 ?
的方差 -协方差矩阵。因此
仍对原模型进行 OLS估计,得到随机误差项的
近似估计量 ěi,以此构成权矩阵的估计量,即
?
?
?
?
?
?
?
?
?
?
?
2
2
1
2
~
~
?
ne
e
?W?
这时可直接以 |}~|/1,|,~|/1|,~|/1{ 211 neeed i a g ???D
作为权矩阵。
注意:
在实际操作中 人们通常采用如下的经验
方法:
不对原模型进行异方差性检验,而是直接
选择加权最小二乘法,尤其是采用截面数据
作样本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法
等价于普通最小二乘法
七、案例 --中国农村居民人均消费函数
例 4.1.4 中国农村居民人均消费支出主要由人
均纯收入来决定。
农村人均纯收入包括 (1)从事农业经营的收入,
(2)包括从事其他产业的经营性收入 (3)工资性收
入,(4)财产收入 (4)转移支付收入。
考察 从事农业经营的收入 (X1)和 其他收入 (X2)
对中国 农村居民消费支出 (Y)增长的影响,
???? ???? 22110 lnlnln XXY
表 4, 1, 1 中国 2001 年各地区农村居民家庭人 均纯收入与消费支出相关数据(单位:元)
地区
人均消费
支出
Y
从事农业经营
的收入
1
X
其他收入
2
X
地区
人均消费
支出
Y
从事农业经营
的收入
1
X
其他收入
2
X
北 京 3 5 5 2, 1 579.1 4 4 4 6, 4 湖 北 2 7 0 3, 3 6 1242.9 2 5 2 6, 9
天 津 2 0 5 0, 9 1314.6 2 6 3 3, 1 湖 南 1 5 5 0, 6 2 1068.8 875.6
河 北 1 4 2 9, 8 928.8 1 6 7 4, 8 广 东 1 3 5 7, 4 3 1386.7 839.8
山 西 1 2 2 1, 6 609.8 1 3 4 6, 2 广 西 1 4 7 5, 1 6 883.2 1 0 8 8, 0
内蒙古 1 5 5 4, 6 1492.8 480.5 海 南 1 4 9 7, 5 2 919.3 1 0 6 7, 7
辽 宁 1 7 8 6, 3 1254.3 1 3 0 3, 6 重 庆 1 0 9 8, 3 9 764.0 647.8
吉 林 1 6 6 1, 7 1634.6 547.6 四 川 1 3 3 6, 2 5 889.4 644.3
黑龙江 1 6 0 4, 5 1684.1 596.2 贵 州 1123,7 1 589.6 814.4
上 海 4 7 5 3, 2 652.5 5 2 1 8, 4 云 南 1 3 3 1, 0 3 614.8 876.0
江 苏 2 3 7 4, 7 1177.6 2 6 0 7, 2 西 藏 1 1 2 7, 3 7 621.6 887.0
浙 江 3 4 7 9, 2 985.8 3 5 9 6, 6 陕 西 1 3 3 0, 4 5 803.8 753.5
安 徽 1 4 1 2, 4 1013.1 1 0 0 6, 9 甘 肃 1 3 8 8, 7 9 859.6 963.4
福 建 2 5 0 3, 1 1053.0 2 3 2 7, 7 青 海 1 3 5 0, 2 3 1300.1 410.3
江 西 1 7 2 0, 0 1027.8 1 2 0 3, 8 宁 夏 2 7 0 3, 3 6 1242.9 2 5 2 6, 9
山 东 1 9 0 5, 0 1293.0 1 5 1 1, 6 新 疆 1 5 5 0, 6 2 1068.8 875.6
河 南 1 3 7 5, 6 1083.8 1 0 1 4, 1
普通最小二乘法的估计结果:
21 ln5084.0ln3166.0655.1
?ln XXY ???
( 1, 8 7 ) ( 3, 0 2) ( 1 0, 0 4 )
2R
= 0, 7 8 3 1
2R
= 0, 7676 D W = 1, 89 F = 50,5 3 R S S = 0, 8232
异方差检验
进一步的统计检验
(1)G-Q检验
将原始数据按 X2排成升序,去掉中间的 7个数据,
得两个容量为 12的子样本。
对两个子样本分别作 OLS回归,求各自的残差平
方和 RSS1和 RSS2:
子样本 1,21 ln119.0ln343.0061.4?ln XXY ???
(3.18) (4.13) (0.94)
R2=0.7068,RSS1=0.0648
子样本 2,21 ln776.0ln138.0791.0?ln XXY ???
(0.43) (0.73) (6.53)
R2=0.8339,RSS2=0.2729
计算 F统计量:
F= RSS2/RSS1=0.2792/0.0648=4.31
查表
给定 ?=5%,查得临界值 F0.05(9,9)=2.97
判断
F> F0.05(9,9)
否定两组子样方差相同的假设, 从而 该总体随
机项 存在递增异方差性 。
( 2)怀特检验
作辅助回归,
2222112 )( l n026.0ln055.0)( l n015.0ln102.017.0? XXXXe ??????
( -0.04) (0.10) (0.21) (-0.12) (1.47)
21 lnln0 4 3.0 XX?
(-1.11)
R2 =0.4638
似乎没有哪个参数的 t检验是显著的 。但
n R2 =31*0.4638=14.38
?=5%下,临界值 ?20.05(5)=11.07,拒绝 同方差性
去掉交叉项后的辅助回归结果
2222112 )( l n039.0ln539.0)( l n042.0ln570.0842.3? XXXXe ?????
(1.36) (-0.64) (064) (-2.76) (2.90)
R2 =0.4374
X2项与 X2的平方项的参数的 t检验是显著的,且
n R2 =31? 0.4374=13.56
?=5%下,临界值 ?20.05(4)=9.49
拒绝 同方差 的原假设
原模型的加权最小二乘回归
对原模型进行 OLS估计,得到随机误差项的近
似估计量 ěi,以此构成权矩阵 ?2W的估计量;
再以 1/| ěi|为权重进行 WLS估计,得
21 ln5 2 7.0ln3 1 9.04 9 7.1?ln XXY ???
( 5, 1 2 ) ( 5, 9 4 ) ( 2 8, 9 4 )
2R
= 0, 9 9 9 9
2R
= 0, 9 9 9 9 D W = 2, 4 9 F = 9 2 4 4 3 2 R S S = 0, 0 7 0 6
各项统计检验指标全面改善
模型:放宽基本假定的模型
基本假定违背, 不满足基本假定的情况 。 主要 包括:
( 1) 随机误差项序列存在 异方差 性;
( 2) 随机误差项序列存在 序列相关 性;
( 3) 解释变量之间存在 多重共线 性;
( 4) 解释变量是随机变量且与随机误差项相关
( 随机解释变量 ) ;
此外:
( 5) 模型设定有偏误
( 6) 解释变量的方差不随样本容量的增而收敛
计量经济检验,对模型基本假定的检验
本章主要学习:前 4类
§ 4.1 异方差性
一、异方差的 概念
二、异方差的类型
三、实际经济问题中的异方差性
四、异方差性的后果
五、异方差性的检验
六、异方差的修正
七、案例
对于模型
ikikiiii XXXY ????? ?????? ?2210
如果出现
V a r i i( )? ?? 2
即 对于不同的样本点, 随机误差项的方差不再
是常数, 而互不相同, 则认为出现了 异方差性
(Heteroskedasticity)。
一、异方差的概念
二、异方差的类型
同方差 性假定, ?i2 = 常数 ? f(Xi)
异方差 时,?i2 = f(Xi)
异方差一般可归结为 三种类型,
(1)单调递增型, ?i2随 X的增大而增大
(2)单调递减型, ?i2随 X的增大而减小
(3)复 杂 型, ?i2与 X的变化呈复杂形式
三、实际经济问题中的异方差性
例 4.1.1:截面资料下研究居民家庭的储蓄行为
Yi=?0+?1Xi+?i
Yi:第 i个家庭的储蓄额 Xi:第 i个家庭的可支配收入
高收入家庭:储蓄的差异较大
低收入家庭:储蓄则更有规律性,差异较小
?i的方差呈现单调递增型变化
例 4.1,2,以绝对收入假设为理论假设、以截面
数据为样本建立居民消费函数:
Ci=?0+?1Yi+?I
将居民按照收入等距离分成 n组,取组平均数为样
本观测值。
一般情况下,居民收入服从正态分布,中等收入
组人数多,两端收入组人数少。而人数多的组平均
数的误差小,人数少的组平均数的误差大。
所以 样本观测值的 观测误差 随着解释变量观测值
的不同而不同,往往引起异方差性。
例 4.1.3,以某一行业的企业为样本建立企业生产
函数模型
Yi=Ai?1 Ki?2 Li?3e?i
被解释变量:产出量 Y
解释变量:资本 K,劳动 L,技术 A,
那么,每个企业所处的 外部环境 对产出量的影响被
包含在随机误差项中 。
每个企业所处的外部环境对产出量的影响程度不
同, 造成了随机误差项的异方差性 。
这时, 随机误差项的方差并不随某一个解释变量
观测值的变化而呈规律性变化, 呈现复杂型 。
四、异方差性的后果
计量经济学模型一旦出现异方差性,如果仍采
用 OLS估计模型参数,会产生下列不良后果:
1、参数估计量非有效
OLS估计量 仍然具有 无偏性,但 不具有 有效性
因为在有效性证明中利用了
E(??’)=?2I
而且,在大样本情况下,尽管参数估计量 具有
一致性,但仍然 不具有 渐近有效性 。
2、变量的显著性检验失去意义
变量的显著性检验中,构造了 t统计量
其他检验也是如此。
3、模型的预测失效
一方面, 由于上述后果, 使得模型不具有
良好的统计性质;
所以,当模型出现异方差性时,参数 OLS
估计值的变异程度增大,从而造成对 Y的预测
误差变大,降低预测精度,预测功能失效。
五、异方差性的检验
? 检验思路:
由于 异方差性 就是相对于不同的解释变量
观测值,随机误差项具有不同的方差。那么:
检验异方差性,也就是检验随机误差项的
方差与解释变量观测值之间的相关性及其相
关的“形式”。
问题在于用什么来表示随机误差项的方差
一般的处理方法:
首先采用 O LS 法估计模型,以求得随机误差项的
估计量 (注意,该估计量是不严格的),我们称之为, 近
似估计量,,用
~e
i 表示。于是有
V a r E ei i i( ) ( ) ~? ?? ?2 2
~ ( ? )e y yi i i ls? ? 0
几种异方差的检验方法:
1、图示法
( 1)用 X-Y的散点图进行判断
看是否存在明显的 散点扩大, 缩小 或 复杂型
趋势 (即不在一个固定的带型域中)
(2) X- ~e i 2 的散点图进行判断
看是否形成一斜率为零的直线
~
e
i
2
~
e
i
2
X X
同方差 递增异方差
~
e
i
2
~
e
i
2
X X
递减异方差 复杂型异方差
2、帕克 (Park)检验与戈里瑟 (Gleiser)检验
基本思想,
偿试建立方程:
ijii Xfe ??? )(~ 2
或
ijii Xfe ??? )(|~|
选择关于变量 X的不同的函数形式,对方程进
行估计并进行显著性检验,如果存在某一种函
数形式,使得方程显著成立,则说明原模型存
在异方差性。
如,帕克检验常用的函数形式:
ieXXf jiji ??? 2)( ? 或 ijii Xe ??? ??? lnln)~l n ( 22
若 ?在统计上是显著的,表明存在异方差性 。
3、戈德菲尔德 -匡特 (Goldfeld-Quandt)检验
G-Q检验以 F检验为基础,适用于样本容量较大、
异方差递增或递减的情况。
G-Q检验的思想,
先将样本一分为二,对子样 ① 和子样 ② 分别
作回归,然后利用两个子样的残差平方和之比构
造统计量进行异方差检验。
由于该统计量服从 F分布,因此假如存在递增
的异方差,则 F远大于 1;反之就会等于 1(同方
差)、或小于 1(递减方差)。
G-Q检验的步骤:
① 将 n对样本观察值 (Xi,Yi)按观察值 Xi的大小
排队
②将序列中间的 c=n/4个观察值除去,并将剩
下的观察值划分为较小与较大的相同的两个
子样本,每个子样样本容量均为 (n-c)/2
③ 对每个子样分别进行 OLS回归,并计算各自
的残差平方和
④ 在同方差性假定下,构造如下满足 F分布的
统计量
)1
2
,1
2
(~
)1
2
(~
)1
2
(~
2
1
2
2
??
?
??
?
??
?
??
?
?
?
?
k
cn
k
cn
F
k
cn
e
k
cn
e
F
i
i
⑤ 给定显著性水平 ?,确定临界值 F?(v1,v2),
若 F> F?(v1,v2),则拒绝同方差性假设,表明
存在异方差 。
当然,还可根据两个残差平方和对应的子样
的顺序判断是 递增型异方差 还是 递减异型方差 。
3、怀特( White)检验
怀特检验不需要排序,且适合任何形式的异方差
怀特检验的基本思想与步骤 (以二元为例):
iiii XXY ???? ???? 22110
然后做如下辅助回归
iiiiiiii XXXXXXe ??????? ??????? 215224213221102~
可以证明,在同方差假设下:
(*)
R2为 (*)的可决系数,h为 (*)式解释变量的个数,
表示渐近服从某分布。
注意:
辅助回归仍是检验与解释变量可能的组合的
显著性,因此,辅助回归方程中还可引入解释
变量的更高次方。
如果存在异方差性, 则表明确与解释变量的
某种组合有显著的相关性, 这时往往显示出有
较高的可决系数以及某一参数的 t检验值较大 。
当然, 在多元回归中, 由于辅助回归方程中
可能有太多解释变量, 从而使自由度减少, 有
时可去掉交叉项 。
六,异方差的修正
模型检验出存在异方差性,可用 加权最小二乘
法 ( Weighted Least Squares,WLS) 进行估计。
加权最小二乘法的基本思想:
加权最小二乘法 是对原模型加权,使之变成一
个新的不存在异方差性的模型,然后采用 OLS估
计其参数。
在采用 OLS方法时,
对较小的残差平方 ei2赋予较大的权数,
对较大的残差平方 ei2赋予较小的权数。
2
1102 )]???([? ? ????? kkiiii XXYWeW ??? ?
例如, 如果对一多元模型, 经检验知:
222 )()()( ???? jiiii XfEV a r ???
?????
i
ji
i
jiji
i
ji
X
Xf
X
XfXf
Y
Xf
22110
)(
1
)(
1
)(
1
)(
1
???
i
ji
ki
ji
k
Xf
X
Xf
??
)(
1
)(
1
??
新模型中,存在
222 )(
)(
1)
)(
1()
)(
1( ???? ???
i
ji
i
ji
i
ji
EXfXfEXfV a r
即满足同方差性,可用 OLS法估计。
一般情况下,
对于模型
Y=X?+?
存在
Wμμμ
μ
2)()(
0)(
????
?
EC o v
E
W ?
?
?
?
?
?
?
?
?
?
?
?
?
w
w
w n
1
2
?
即存在 异方差性 。
W是一对称正定矩阵, 存在一可逆矩阵 D使得
W=DD’
用 D-1左乘 Y=X?+?
两边,得到一个新的模型:
μDX βDYD 111 ??? ??
*** μβXY ??
该模型具有同方差性。因为
121121
1111 )()()(
????
????
?????
???????
DDDDDΩD
DμμDDμμDμμ **
??
EEE
I2??
**1*** )(? YXXXβ ??? ?
YWXXWX
YDDXXDDX
111
11111
)(
)(
???
?????
???
?????
这就是原模型 Y=X?+?
的 加权最小二乘估计量,是无偏、有效的估计量。
这里权矩阵为 D-1,它来自于 原模型残差项 ?
的方差 -协方差矩阵 ?2W 。
如何得到 ?2W?
从前面的推导过程看,它来自于原模型残差项 ?
的方差 -协方差矩阵。因此
仍对原模型进行 OLS估计,得到随机误差项的
近似估计量 ěi,以此构成权矩阵的估计量,即
?
?
?
?
?
?
?
?
?
?
?
2
2
1
2
~
~
?
ne
e
?W?
这时可直接以 |}~|/1,|,~|/1|,~|/1{ 211 neeed i a g ???D
作为权矩阵。
注意:
在实际操作中 人们通常采用如下的经验
方法:
不对原模型进行异方差性检验,而是直接
选择加权最小二乘法,尤其是采用截面数据
作样本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法
等价于普通最小二乘法
七、案例 --中国农村居民人均消费函数
例 4.1.4 中国农村居民人均消费支出主要由人
均纯收入来决定。
农村人均纯收入包括 (1)从事农业经营的收入,
(2)包括从事其他产业的经营性收入 (3)工资性收
入,(4)财产收入 (4)转移支付收入。
考察 从事农业经营的收入 (X1)和 其他收入 (X2)
对中国 农村居民消费支出 (Y)增长的影响,
???? ???? 22110 lnlnln XXY
表 4, 1, 1 中国 2001 年各地区农村居民家庭人 均纯收入与消费支出相关数据(单位:元)
地区
人均消费
支出
Y
从事农业经营
的收入
1
X
其他收入
2
X
地区
人均消费
支出
Y
从事农业经营
的收入
1
X
其他收入
2
X
北 京 3 5 5 2, 1 579.1 4 4 4 6, 4 湖 北 2 7 0 3, 3 6 1242.9 2 5 2 6, 9
天 津 2 0 5 0, 9 1314.6 2 6 3 3, 1 湖 南 1 5 5 0, 6 2 1068.8 875.6
河 北 1 4 2 9, 8 928.8 1 6 7 4, 8 广 东 1 3 5 7, 4 3 1386.7 839.8
山 西 1 2 2 1, 6 609.8 1 3 4 6, 2 广 西 1 4 7 5, 1 6 883.2 1 0 8 8, 0
内蒙古 1 5 5 4, 6 1492.8 480.5 海 南 1 4 9 7, 5 2 919.3 1 0 6 7, 7
辽 宁 1 7 8 6, 3 1254.3 1 3 0 3, 6 重 庆 1 0 9 8, 3 9 764.0 647.8
吉 林 1 6 6 1, 7 1634.6 547.6 四 川 1 3 3 6, 2 5 889.4 644.3
黑龙江 1 6 0 4, 5 1684.1 596.2 贵 州 1123,7 1 589.6 814.4
上 海 4 7 5 3, 2 652.5 5 2 1 8, 4 云 南 1 3 3 1, 0 3 614.8 876.0
江 苏 2 3 7 4, 7 1177.6 2 6 0 7, 2 西 藏 1 1 2 7, 3 7 621.6 887.0
浙 江 3 4 7 9, 2 985.8 3 5 9 6, 6 陕 西 1 3 3 0, 4 5 803.8 753.5
安 徽 1 4 1 2, 4 1013.1 1 0 0 6, 9 甘 肃 1 3 8 8, 7 9 859.6 963.4
福 建 2 5 0 3, 1 1053.0 2 3 2 7, 7 青 海 1 3 5 0, 2 3 1300.1 410.3
江 西 1 7 2 0, 0 1027.8 1 2 0 3, 8 宁 夏 2 7 0 3, 3 6 1242.9 2 5 2 6, 9
山 东 1 9 0 5, 0 1293.0 1 5 1 1, 6 新 疆 1 5 5 0, 6 2 1068.8 875.6
河 南 1 3 7 5, 6 1083.8 1 0 1 4, 1
普通最小二乘法的估计结果:
21 ln5084.0ln3166.0655.1
?ln XXY ???
( 1, 8 7 ) ( 3, 0 2) ( 1 0, 0 4 )
2R
= 0, 7 8 3 1
2R
= 0, 7676 D W = 1, 89 F = 50,5 3 R S S = 0, 8232
异方差检验
进一步的统计检验
(1)G-Q检验
将原始数据按 X2排成升序,去掉中间的 7个数据,
得两个容量为 12的子样本。
对两个子样本分别作 OLS回归,求各自的残差平
方和 RSS1和 RSS2:
子样本 1,21 ln119.0ln343.0061.4?ln XXY ???
(3.18) (4.13) (0.94)
R2=0.7068,RSS1=0.0648
子样本 2,21 ln776.0ln138.0791.0?ln XXY ???
(0.43) (0.73) (6.53)
R2=0.8339,RSS2=0.2729
计算 F统计量:
F= RSS2/RSS1=0.2792/0.0648=4.31
查表
给定 ?=5%,查得临界值 F0.05(9,9)=2.97
判断
F> F0.05(9,9)
否定两组子样方差相同的假设, 从而 该总体随
机项 存在递增异方差性 。
( 2)怀特检验
作辅助回归,
2222112 )( l n026.0ln055.0)( l n015.0ln102.017.0? XXXXe ??????
( -0.04) (0.10) (0.21) (-0.12) (1.47)
21 lnln0 4 3.0 XX?
(-1.11)
R2 =0.4638
似乎没有哪个参数的 t检验是显著的 。但
n R2 =31*0.4638=14.38
?=5%下,临界值 ?20.05(5)=11.07,拒绝 同方差性
去掉交叉项后的辅助回归结果
2222112 )( l n039.0ln539.0)( l n042.0ln570.0842.3? XXXXe ?????
(1.36) (-0.64) (064) (-2.76) (2.90)
R2 =0.4374
X2项与 X2的平方项的参数的 t检验是显著的,且
n R2 =31? 0.4374=13.56
?=5%下,临界值 ?20.05(4)=9.49
拒绝 同方差 的原假设
原模型的加权最小二乘回归
对原模型进行 OLS估计,得到随机误差项的近
似估计量 ěi,以此构成权矩阵 ?2W的估计量;
再以 1/| ěi|为权重进行 WLS估计,得
21 ln5 2 7.0ln3 1 9.04 9 7.1?ln XXY ???
( 5, 1 2 ) ( 5, 9 4 ) ( 2 8, 9 4 )
2R
= 0, 9 9 9 9
2R
= 0, 9 9 9 9 D W = 2, 4 9 F = 9 2 4 4 3 2 R S S = 0, 0 7 0 6
各项统计检验指标全面改善