一元线性回归模型的基本假设
( 1)随机误差项均值为 0 E(?i)=0 ;
( 2)随机误差项同方差 Var (?i)=??2;
( 3)随机误差项无序列相关 Cov(?i,?j)=0;
( 4) x是确定性的,非随机变量 Cov(xi,?i)=0;
( 5)随机误差项服从正态分布 ?i~N(0,??2 )
i,j=,2,…,n; i≠j
问题的提出
多元线性回归模型的基本假设
( 1)随机误差项均值为 0 E(?i)=0 ;
( 2)随机误差项同方差 Var (?i)=??2;
( 3)随机误差项无序列相关 Cov(?i,?j)=0;
( 4) x是确定性的,非随机变量 Cov(x ji,?i)=0;
( 5)随机误差项服从正态分布 ?i~N(0,??2 )
(6) 解释变量之间互不相关
i,j=,2,…,n; i≠j
? 在模型满足前述基本假设下,OLS估计具
有 BLUE的优良性,而且可以顺利的进行关
于模型的若干检验,检验结果准确可靠。
? 然而实际经济问题中,这些基本假定往往
不能完全得到满足。
? 如果所研究问题或模型出现了基本假设不
成立的情况,称 违背了基本假设 。
? 如果违背了某一条或某几条基本假设,使用 OLS
方法估计的参数不再具有 BLUE特性,而且显著
性检验和预测的结果都不再可靠。
? 因此,对于一个计量经济学模型,必须检验 基本
假设是否满足,并针对基本假设不满足的情况,
采取相应的补救措施或者新的方法。
? 判断基本假设是否满足的检验称为 计量经济学检
验
? 计量经济学检验 包含的主要内容:
1,检验随机误差项的方差是否相同 => 检验是否 违背
同方差假设 =>异方差 ( 2.6)
2,检验随机误差项是否不相关 =>检验是否 违背无序
列相关假设 =>序列相关 ( 2.7)
3,检验解释变量之间是否不相关 =>检验是否 违背解
释变量不相关假设 =>多重共线性(多元) ( 2.8)
4,检验是否 违背解释变量确定性假设 =>随机解释变
量 ( 2.9)
? 计量经济学检验的工作就是检验基本假设是否得
到满足 。
§ 2.6 异方差性
Heteroskedasticity
一、异方差性的概念 —— 违反基本假设的定义及违
反的原因
二、异方差性的后果 —— 违反基本假设会造成什么
样的后果
三、异方差性的检验 —— 怎样诊断是否违反基本假
设
四、出现异方差时的补救措施 —— 如何消除或减弱
对基本假设的违反
五、案例
探求四个问题的答案
? 异方差 的性质是什么?
? 异方差的后果是什么?
? 如何检验异方差的存在?
? 如果存在异方差,有哪些补救措施?
一、异方差的概念
如果出现
V a r i i( )? ?? 2 i=1,2,?,n
即对于不同的样本点, 随机误差项的方差不再是
常数而是互不相同, 则认为出现了 异方差性或称
为非同方差, 非常量方差 。
ikikiii xxxy ?bbbb ++…+++? 22110
对于模型
i=1,2,…,n
同方差性假设为 2)( ?? ?iVar i=1,2,…,n
1、异方差的概念
2、异方差的类型
? 同方差性 假设的意义是指每个 ?i,不论解释变
量观测值是大还是小, 每个 ?i的方差保持相同,
并不随解释变量 x的变化而变化, 即
?i2 =常数
? 在 异方差 的情况下, ?i2已不是常数, 它 随 x的
变化而变化, 即
?i2 =f(x)
同方差
x1 x2
X
?
Y
随着 x变化随机误差项 ?的方差不变
y= b 0+ b 1x
异方差
x1 x2
X
u 随着 x增加随机误
差项方差增大Y
异方差
x1 x2
X
u 随着 x增加随机误
差项方差减小Y
关于异方差的一点说明
? 所谓的“存在异方差”,指模型满足其它
所有假设,仅仅违背同方差假设。
? 在假定其它所有假设均成立的条件下,讨
论异方差问题。
??i的方差随 x的增加 而增加,呈单调递增
型变化。
? 例如 3,以绝对收入假设为理论假设、以截面数据作样本建
立居民消费函数:
ci= b0+b1yi+?i
将居民按照收入等距离分成 n组, 取组平均数 ( 每组的人均收
入, 人均消费 ) 为样本观测值 。
一般情况下:处于中等收入组中的人数最多, 处于两端收入
组 (低收入及高收入 )中的人数少 。 那么, 人数多的收入组的人
均数据会比人数少的收入组的数据具有更高的准确性 。 因此,
人数多的组人均收入的误差小, 人数少的组平均收入的误差大 。
所以样本观测值的 观测误差随着解释变量观测值的增大而 先减
后增 。
如果样本观测值的观测误差构成随机误差项的主要部分,
那么对于不同的样本点, 随机误差项的方差随着 解释变量观测
值 的增大而 先减后增, 出现了异方差性 。
? 例如 3,以绝对收入假设为理论假设、以截面数据作样本建
立居民消费函数:
ci= b0+b1yi+?i
将居民按照收入等距离分成 n组, 取组平均数 ( 每组的人均收
入, 人均消费 ) 为样本观测值 。
?例如 4,以某一行业的企业为样本建立企业生产函
数模型
产出量为被解释变量, 选择资本, 劳动, 技术等
投入要素为解释变量, 那么每个企业所处的外部
环境对产出量的影响被包含在随机误差项中 。
由于每个企业所处的外部环境对产出量的影响程
度不同,造成了随机误差项的异方差性。
这时,随机误差项的方差并不随某一个解释变
量观测值的变化而呈规律性变化,为复杂型的一
种。
4.异方差的性质
? 由上面的 4个例子可以看出异方差的两个
性质:
1,现实社会经济中异方差是很常见的,处理
截面数据 时,尤应注意。
2,一般地,大多数异方差是有规律的:随机
误差项的方差随着解释变量观测值的变化
而呈现出规律性的变化 。
? 当然也有例外。
? 我们主要考虑有规律可循的异方差问题。
? 一旦计量经济学模型存在异方差性,如果
仍然采用 OLS法估计模型参数,会产生什
么后果呢?
二、异方差性的后果
1、参数估计量非有效
?普通最小二乘法参数估计量 仍然具有线性性和无
偏性, 但 不具有有效性 。
?因为在有效性证明中利用了
E(NN’)=?2I
? 而且, 在大样本情况下, 参数估计量 仍然不具有
渐近有效性 。
以一元线性回归模型为例进行说明:
( 1)仍存在无偏性:证明过程与方差无关
由于 iii XY ?bb ++? 10 ( 2,4,1 )
的参数
1
b 的 O LS 估计量 1
?
b 为:
i
i
i
iiii
x
x
kYk ?b?bb ?
?
? ? +?+?? 2111
?
故 1
211
)()()
?
( b?bb ?+? ?
?
i
i
i
E
x
x
EE ( 2, 4, 2 )
( 2)不具备最小方差性
由于
?
?
?
?
????
22
2
2
2
2
111
)(
)(
)()
?
()
?
v a r (
i
ii
i
i
i
x
xE
x
x
EE
?
?bbb
2
2
22
)(
)(
?
?
?
i
ii
x
Ex ?
(注:交叉项 ?
?
))((
,jjii
ji
ji
xx ??
的期望为零)
在
i
?
为同方差的假定下,
22
)()va r( ??? ??
ii
E
??
?
??
2
2
22
22
1
)(
)
?
va r(
ii
i
xx
x ??
b
(2, 4, 3 )
在 i
?
存在异方差的情况下
)()()va r(
222
iiii
XfE ???? ???
假设
2
)(
ii
XXf ?
,并且记异方差情况下 1
b
的 O L S 估计为 1
~
b,则
?
?
??
?
???
2
22
2
2
22
22
1
)(
)(
)
~
v a r (
i
ii
ii
ii
x
Xx
xx
Xfx ??
b
(2, 4, 4 )
对大多数经济资料有:
1
222
???
iii
xXx
,
比较 (2, 4, 3 ) 与 (2, 4, 4 ),
)
?
v a r ()
~
v a r (
11
bb ?
( 2,4,5 )
? 2、根据常用的估计 OLS估计量方差的公式
得到的方差通常是有偏的,它高估或低估
了真实的参数估计量的方差。
3、变量和方程的显著性检验失去意义
在该统计量中包含有随机误差项共同的方差,并且有
t统计量服从自由度为 (n-k-1)的 t分布。如果出现了
异方差性,t检验就失去意义。
其它检验也类似。
关于变量的显著性检验中,构造了 t 统计 量
)?(/? jj St bb? (2.4,5 )
4、模型的预测失效
一方面, 由于上述后果, 使得模型不具有良
好的统计性质;
另一方面, 在预测值的置信区间中也包含有随
机误差项共同的方差 ?2。
所以, 当模型出现异方差性时, 参数 OLS估计
值的变异程度增大, 从而造成对 y的预测误差变
大, 降低预测精确度, 预测功能失效, 得到的预
测值的置信区间不再可靠 。
? 简言之,在存在异方差的情况下,我们不
能再相信参数估计值,不能相信计算得到
的 t值和预测值的置信区间。
? 所有这些后果都促使我们去解决异方差问
题。
三、异方差性的检验
1、检验方法的共同思路
? 由于 异方差性具有的性质 —— 相对于解释变量的
不同观测值,随机误差项具有不同的方差。即随机
误差项的方差与解释变量的观测值之间存在着某种
联系。那么:
检验异方差性,也就是检验随机误差项的方差与
解释变量观测值之间是否存在联系(相关性及其相
关的“形式”)。
异方差性的两类基本检验方法
? 在共同的思路指导下,到目前为止发展出了十多
种异方差的检验方法。共分为两大类:
? 图示法
? 解析法 — 包含戈德菲尔德 -匡特 Goldfeld-Quandt
检验,戈里瑟( Gleiser)检验与帕克( Park)检
验等。
? 所有方法中没有任何一种在任何情况下都是最好
的。一般地,在检验过程中需要综合几种方法来
帮助研究者判断异方差是否存在。
检验异方差性,也就是检验随机误差项的
方差 与解释变量观测值之间是否存在联系
(相关性及其相关的“形式”)。
随机误差项 ?i的方差 2?i 实际上是未知的由于随机项 i? 不可观测,
问题:用什么来表示未知的随机误差项的方差?
一般的处理方法:
问题:用什么来表示未知的随机误差项的方差?
OLSiii yye )?(
~ ??
Var E ei i i( ) ( ) ~? ?? ?2 2 (2.6.1)
即 用 ~ei2(残差平方)来表示相应随机误差项的方差 。2?i
i=1,2,…,n
首先采用 OLS 法估计模型,以求得 残差
书中称之为, 近 似估计量,,用 ~ei 表示。
于是有
2、图示检验法
? 图示检验法 是利用残差序列绘制出各种图
形,以供分析检验使用 。
? 异方差是指随机误差项的方差随着 x的变
化而变化。
? 故可以根据 x-y或残差 x-e2的散点图,对
异方差是否存在及其类型作出判断。
? 异方差大致可分为三种:
? ( 1)递增异方差
? ( 2)递减异方差
? ( 3)复杂型异方差
2、图示检验法
( 1)用 X-Y的散点图进行判断
看是否存在明显的 散点扩大, 缩小 或 复杂型趋
势 (即不在一个固定的带型域中)
~e 2
x
同方差
(2)x-~ei2 的散点图进行判断 ~
ei2x-(某一个解释变量 的散点图进行判断)
x
~e 2
递增异方差
经济问题的异方差性大多是递增性的
x
递减异方差
~e 2
复杂型的图形
~e 2
x
与解释变量存在二次关系异方差
x
~e 2
纺锤型 异方差
x
~e 2
反纺锤型 异方差
? 一,经济问题的异方差性大多是递增性的。 二、
图示检验法非常方便、直观。但它只能进行大
致的而非严格的判断,而却以方差的表现形式
远不止以上几种。因此,在进行异方差检验时,
一般先使用图示法进行观察,一旦怀疑存在异
方差,在分析时就应该更为谨慎,使用其他检
验工具作出进一步的判断。
关于图示检验法的两点说明
( 2)戈里瑟( Gleiser)检验
戈里瑟检验和帕克检验的思想:
如果存在某一种形式,使得模型显著成立,则说
明原模型存在异方差性,随机误差项的方差与 xj有
关 。
以 |e~ |或 ~ei2为被解释变量,以原模型的某一解释变量 jx 为
解释变量,建立如下回归模型,进行回归:
ijii xfe e+? )(|
~| i=1,2,…,n ( Gleiser)
或 ijii xfe e+? )(~ 2 i=1,2,…,n (Park)
选择关于变量 jx 的不同的函数形式 (如 )( jiji xxf ? 或
jiji xxf
?1)( ? )进行试验,对模型进行估计并进行显著性检验;
被认为与误差项方
差有关的解释变量
GEJSTER检验的步骤
1,用原始数据估计所建之模型,计算残差 ei.
2,用残差绝对值与选定的 x进行回归:
? | ei|=α0+α1xh+v ( 1)
? v满足基本假定,幂次通常需要选择 多种值 试
算,如 h=1,1/2,-1,(- ?) 等
3,对所得各种模型形式进行检验,由模型的拟合
优度、显著性 F,t检验判断异方差是否存在。
4,若其中一个或多个模型显著成立,则说明存在
异方差。并找出最优的回归方程形式,得到异方
差的函数形式。反之则不存在。
GEJSTER检验的总结
? 优点:
1,不仅能检验模型是否存在异方差,而且可
以近似地给出 异方差的存在形式,?2i = ?2
f(xi)。以便用 WLS法 消除异方差。
2,对大样本来说,GEJSTER检验一般能给
出令人满意的结果。
? 缺点:
1.由于构造的 | ei|与解释变量的回归模型是探测性的,
具体形式未知,因此需要进行各种形式的 反复 试
验,如果模型选得不好,则检验不出是否存在异
方差性。在选择形式的过程中要充分利用各种有
用信息,若知道异方差的产生与哪一个解释变量
有关,甚至知道二者的方程形式,将是检验过程
变得十分简单。
2.比较繁杂,建议与其他检验方法配套使用。
四、出现异方差时的补救措施 ——
如何消除或减弱异方差
2、补救异方差性的方法
① 加权最小二乘法 (WLS)
Weighted Least Squares
② 将原模型对数线性化
加权最小二乘法( WLS)
要利用到的方差的性质,var(ax)=a2var(x)
1、加权最小二乘法的基本思想
? 加权最小二乘法 是 对存在 异方差 的模型作 适当的
代数变换(加权),使之成为满足 同方差 假定的模
型,然后再运用 OLS方法估计新模型中的参数了 。
?加权最小二乘法的应用分两种情况:
?( 1)已知异方差的形式
( 2)异方差的形式未知
注意:在实践中,根据经验一些异方差的形式是可
知的。
2、已知异方差的形式的情况下加权最小二乘
法的应用
( 1)从一元入手:一元的一个例子
? ?2i = ?2 f( xi )的由来
? 大多数异方差是有规律的:
? 随机误差项的 方差 已不是常数,随着 解释变量观测值
( x1, x2,?,xn共 n个)的变化 而呈现出规律性的变
化。
? 例如:一元中,?的方差与 x有关
? 具体的说,?1的方差 ?21与 x1有关; ?2的方差 ?22与 x2
有关; ?n的方差 ?2n与 xn有关
注,f表示函数的一般形式,不表示具体的函数形式
y=f(x)表示 y是 x的函数;如, y=f(x) =3x;y=f(x)=5x-2
异方差
x1 x2
X
u 随着 x增加随机误
差项方差增大Y
? 加权最小二乘法实际就是给模型中的每一个 y和
x乘上一个数,这个数称之为权数。然
后对变换后的模型进行 OLS估计。所以这种方
法称为加权最小二乘法。用 WLS 得到的估计量
称为 WLS估计量( WLS estimators)。
)(
1
ixf
( 3)在已知异方差形式的情况下,
用 WLS法补救一元异方差性的具体步骤
? ?
? ?
? ? 得满足同方差的新模型去除原模型的两端即可用
,为常数。
的异方差形式为若原模型中随机扰动项
步骤一:
x
x
x
i
i
iii
f
f
f
0
2
22
?
?
?
???
步骤二:对变换后的新模型运用 OLS法进行估计
(4)多元的一般情形
? 例如:若
V a r E f xi i i ji( ) ( ) ( )? ? ? ?? ? ?2 2 2
即随机误差项的方差与解释变量 jx 之间存在
相关性,那么可以用 )( jixf 去除原模型,使之
变成如下形式的新模型:
即满足同方差性。于是可以用 OLS 估计其
参数,得到关于参数 b b b0 1,,,L k 的无偏的、有
效的估计量。这就是加权最小二乘法,在这
里权就是 )(1
jixf
。
在变换后的模型中,存在
222 )(
)(
1)
)(
1()
)(
1( ???? ???
i
ji
i
ji
i
ji
ExfxfExfVar
L+++? i
ji
i
jiji
i
ji
xxfxxfxfyxf 22110 )(1)(1)(1)(1 bbb
i
ji
ki
ji
k xfxxf ?b )(
1
)(
1 ++
( 5)在已知异方差形式的情况下,
用 WLS法补救多元异方差性的具体步骤
? ?
? ?
? ? 得满足同方差的新模型去除原模型的两端即可用
,为常数。
的异方差形式为若原模型中随机扰动项
步骤一:
x
x
x
ij
ij
ijii
f
f
f
0
2
22
?
?
?
???
步骤二:对变换后的新模型运用 OLS法进行估计
( 6)用矩阵表示的一般情况
对于模型
Y=XB+N (2.6.2)
存在
E
Cov E
( )
( ) ( )
N
NN NN
?
? ? ? ?
0
2? W
W ?
?
?
?
?
?
?
?
?
?
?
?
?
w
w
wn
1
2
O (2.6.3)
即存在 异方差性 。
设 W D D? ?
其中
?
?
?
?
?
?
?
?
?
?
?
?
?
n
w
w
D O
1
该模型具有同方差性。因为
?
??
?
N ?N?
? ???? 1111**
)()()( DDDD NNEENNE
IDDDDWDD
1111 222
??? ?????
????
用 D 1? 左乘 (2.4.8)两边,得到一个新的模型:
D Y D X D? ? ?? +1 1 1B N (2.6.4)
即 Y X* * *? +B N
这就是原模型 (2.6.2)的加权最小二乘估
计量, 它是无偏, 有效的 。
这里权矩阵为 D-1,它来自于矩阵 W 。
于是,可以用 OLS 法估计模型 (2.6.4),得
$ ( )* * * *B? ? ??X X X Y1
? ? ? ? ?
? ? ?
? ? ? ? ?
? ? ?
( )
( )
X D D X X D D Y
X W X X W Y
1 1 1 1 1
1 1 1 (2,6.5)
3、异方差形式未知的情况下,
加权最小二乘法的应用
OLSiii YYe )?(
~ ??
Var E ei i i( ) ( ) ~? ?? ?2 2 (2.6.1)
用 ~ei2 (残差平方)来表示相应随机误差项的方差 σi2
异方差形式未知的情况下
加权最小二乘法具体步骤
① 选择普通最小二乘法估计原模型,得到随机误差
项的近似估计量 ~e i ;
② 建立 |~|1 ie 的数据序列;
③ 选择加权最小二乘法,以 |
~
|1
i
e 序列作为权,进
行估计得到参数估计量。
实际上是以 |
~
|1
i
e 乘原模型的两边,得到一个新模
型,采用普通最小二乘法估计新模型。
此步骤也是上机操作时 加权最小二乘法的具体步骤
4,WLS法的总结
? 加权最小二乘法实际就是给 原模型 中的 每
一个 y和 x乘上一个权数,使得变换后的新
模型满足同方差假设,然后对 变换后的新
模型 进行 OLS估计 。
? 在实际建模过程中,尤其是截面数据作样本时,人
们通常 并不对原模型进行异方差性检验,而是直接
选择加权最小二乘法估计模型,尤其是采用截面数
据作样本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法等价于普
通最小二乘法。
用 ~ei2(残差平方)来表示相应 随机误差项的方差 σi 2
补救方法二:将原模型对数线性化
? 实践证明,对数线性模型是回避异方差的行之有
效的方法。
? 对数线性模型的一般形式,
? lnY=b0 +b1 lnx1+ …+ bk lnxk +μ
? 当然,在一个具体问题中,用线性模型还是用 对
数线性模型 要根据具体的经济理论以及其他一些
因素来决定。但如果选择两者中的任何一个并没
有太大的差别,并且在线性模型中异方差问题比
较严重时,不妨试一试 对数线性模型。
五、案例 — 1
— 某地区居民储蓄模型
某地区 31年来居民收入与储蓄额数据表
表 1 单位:万元
年份 居民收入
(X)
储蓄
(Y)
年份 居民收入
(X)
储蓄
(Y)
年份 居民收入
(X)
储蓄
(Y)
1968 8777 264 1979 17663 950 1990 29560 2105
1969 9210 105 1980 18575 779 1991 28150 1600
1970 9954 90 1981 19535 819 1992 32100 2250
1971 10508 131 1982 21163 1222 1993 32500 2420
1972 10979 122 1983 22880 1072 1994 35250 2570
1973 11912 107 1984 24127 1578 1995 33500 1720
1974 12747 406 1985 25604 1654 1996 36000 1900
1975 13499 503 1986 26500 1400 1997 36200 2100
1976 14269 431 1987 27670 1829 1998 38200 2300
1977 15522 588 1988 28300 2200
1978 16730 898 1989 27430 2017
1、普通最小二乘估计
1、直接使用 OLS法得:
xy 0846.060.665? +??
t= (-5.87) ( 18.04)
2r =0.9182
截面数据注意是否存在异方差性
2,异方差检验
( 1)图示检验
0
500
1000
1500
2000
2500
3000
0 5000 10000 15000 20000 25000 30000 35000 40000 45000
X
Y
(2)Park检验
显然,lnxi前的参数表现为统计上显著的,
表明原数据存在异方差性 。
对直接使用 OLS 法估计的残差项的平方
2~
ie 进行如下一般形式的回归:
iii vxe ++? ln
~ln 2 ba
得,iii vxe ++?? ln81.299.17~ln 2
t= ( -2.89) (4.48)
2r =0.4093
与 OLS估计结果相比较,拟合效果更好,t值更显著,
参数估计值发生变化 。
如果用估计的 ~ei 2 作为随机误差项方差的估计值,即相当于
用 |~|/1 ie 为权重进行加权最小二乘估计 ( WLS),则有
xy 0857.006.686? +??
t= (-29.14) ( 43.59)
2r =0.9925
3、异方差模型的估计
五、案例 — 2
— 居民消费二元模型
1,OLS估计结果
D e p e n d e n t V a r i a b l e, C O N S
M e t h o d, L e a st S q u a r e s
D a t e, 0 3 / 0 1 / 0 3 T i m e, 0 0, 4 6
S a m p l e, 1 9 8 1 1 9 9 6
I n cl u d e d o b se r v a t i o n s,1 6
V a r i a b l e C o e f f i ci e n t S t d, E r r o r t - S t a t i st i c P r o b,
C 5 4 0, 5 2 8 6 8 4, 3 0 1 5 3 6, 4 1 1 8 4 8 0, 0 0 0 0
G D P 0, 4 8 0 9 4 8 0, 0 2 1 8 6 1 2 2, 0 0 0 3 5 0, 0 0 0 0
C O N S 1 0, 1 9 8 5 4 5 0, 0 4 7 4 0 9 4, 1 8 7 9 6 9 0, 0 0 1 1
R - sq u a r e d 0, 9 9 9 7 7 3 M e a n d e p e n d e n t v a r 1 3 6 1 8, 9 4
A d j u st e d R - sq u a r e d 0, 9 9 9 7 3 9 S, D, d e p e n d e n t v a r 1 1 3 6 0, 4 7
S, E, o f r e g r e ss i o n 1 8 3, 6 8 3 1 A ka i ke i n f o cr i t e r i o n 1 3, 4 3 1 6 6
S u m sq u a r e d r e si d 4 3 8 6 1 3, 2 S ch w a r z cr i t e r i o n 1 3, 5 7 6 5 2
L o g l i ke l i h o o d - 1 0 4, 4 5 3 3 F - st a t i st i c 2 8 6 8 2, 5 1
D u r b i n - W a t so n st a t 1, 4 5 0 1 0 1 P r o b ( F - st a t i st i c) 0, 0 0 0 0 0 0
2,WLS估计结果
D e p e n d e n t V a r i a b l e, C O N S
M e t h o d, L e a s t S q u a r e s
D a t e, 0 3 / 0 1 / 0 3 T i m e, 0 0, 4 7
S a m p l e, 1 9 8 1 1 9 9 6
I n c l u d e d o b s e r v a t i o n s, 1 6
W e i g h t i n g s e r i e s, E
V a r i a b l e C o e f f i c i e n t S t d, E r r o r t - S t a t i s t i c P r o b,
C 5 1 8, 2 8 8 1 2 0, 5 2 6 2 0 2 5, 2 5 0 0 8 0, 0 0 0 0
G D P 0, 4 8 3 8 1 4 0, 0 0 3 6 0 7 1 3 4, 1 3 4 8 0, 0 0 0 0
C O N S 1 0, 1 9 3 5 2 5 0, 0 0 8 4 6 4 2 2, 8 6 4 7 7 0, 0 0 0 0
W e i g h t e d S t a t i s t i c s
R - s q u a r e d 0, 9 9 9 9 9 9 M e a n d e p e n d e n t v a r 1 9 9 4 3, 8 1
A d j u s t e d R - s q u a r e d 0, 9 9 9 9 9 9 S, D, d e p e n d e n t v a r 4 0 7 3 0, 3 1
S, E, o f r e g r e s s i o n 4 7, 5 8 5 7 4 A k a i k e i n f o c r i t e r i o n 1 0, 7 3 0 3 0
S u m s q u a r e d r e s i d 2 9 4 3 7, 2 3 S c h w a r z c r i t e r i o n 1 0, 8 7 5 1 6
L o g l i k e l i h o o d - 8 2, 8 4 2 4 3 F - s t a t i s t i c 9 8 0 7 3 6, 2
D u r b i n - W a t s o n s t a t 1, 8 1 0 4 7 1 P r o b ( F - s t a t i s t i c ) 0, 0 0 0 0 0 0
3、比较
各项统计检验指标全面改善
R2, 0.999739→0.999999
F,28682→980736
∑e2,438613→29437
t,6.4 22.0 4.2→25.2 134.1 22.9
D.W.,1.45→1.81
五、案例 — 3
—— 经纪佣金率放松管制
? 纽约股票交易所( NYSE)最初是极力反对对经纪
佣金率放松管制的。事实上,在引入放松管制以
前( 1975.5.1),NYSE向股票交易委员会提交了
一份计量经济研究报告,认为在经济行业中存在
着规模经济,因此(由垄断决定的)固定佣金率
是公正的。 NYSE所提交的计量经济分析基本上是
围绕着以下回归函数来进行的:
? 其中,y=总成本; x=股票交易的数量 。
( - 6, 5 4 ) ( 4 0, 3 9 ) ( 2, 9 8 ) t
9 3 4.0R )10*( 1, 0 8 33 4 8.314 7 6 0 0 0 22-6?
?
?+? xxy
iii
-
? 从模型可以看出:总成本与交易量正相关。但是由于交易
量的二次方项系数为负,并且是“统计显著的”,这意味
着总成本是以一个递减的速率在增加。因此,NYSE认为在
经济行业中存在着规模经济,从而证明了 NYSE的垄断地位
是正当的。
? 然而,美国司法部反托拉斯局却认为该模型中所声称的规
模经济只是幻想,因为回归函数存在着异方差问题。这是
因为在估计成本函数时,NYSE并未考虑到样本中所包含的
小公司与大公司的差别,也就是说,NYSE并没有考虑到规
模因素。
? 假设误差项与交易量成比例,反托拉斯局重新估计了方程,
得:
( - 6, 5 4 ) ( 4 0, 3 9 ) ( 2, 9 8 ) t
9 3 4.0R )10*( 1, 0 8 33 4 8.314 7 6 0 0 0 22-6?
?
?+? xxy ii
i
-
? 从式中可以看出,二次项不仅是统计不显著的,
而且其符号也发生了变化。因此,在经纪行业中
并不存在规模经济,这就推翻了 NYSE的垄断佣
金结构的论点。
)10*( 4, 3 457.523 4 2 0 0 0 2-6? xxy
iii
++?
探求四个问题的答案
? 异方差 的性质是什么?
? 异方差的后果是什么?
? 如何检验异方差的存在?
? 如果存在异方差,有哪些补救措施?
( 1)随机误差项均值为 0 E(?i)=0 ;
( 2)随机误差项同方差 Var (?i)=??2;
( 3)随机误差项无序列相关 Cov(?i,?j)=0;
( 4) x是确定性的,非随机变量 Cov(xi,?i)=0;
( 5)随机误差项服从正态分布 ?i~N(0,??2 )
i,j=,2,…,n; i≠j
问题的提出
多元线性回归模型的基本假设
( 1)随机误差项均值为 0 E(?i)=0 ;
( 2)随机误差项同方差 Var (?i)=??2;
( 3)随机误差项无序列相关 Cov(?i,?j)=0;
( 4) x是确定性的,非随机变量 Cov(x ji,?i)=0;
( 5)随机误差项服从正态分布 ?i~N(0,??2 )
(6) 解释变量之间互不相关
i,j=,2,…,n; i≠j
? 在模型满足前述基本假设下,OLS估计具
有 BLUE的优良性,而且可以顺利的进行关
于模型的若干检验,检验结果准确可靠。
? 然而实际经济问题中,这些基本假定往往
不能完全得到满足。
? 如果所研究问题或模型出现了基本假设不
成立的情况,称 违背了基本假设 。
? 如果违背了某一条或某几条基本假设,使用 OLS
方法估计的参数不再具有 BLUE特性,而且显著
性检验和预测的结果都不再可靠。
? 因此,对于一个计量经济学模型,必须检验 基本
假设是否满足,并针对基本假设不满足的情况,
采取相应的补救措施或者新的方法。
? 判断基本假设是否满足的检验称为 计量经济学检
验
? 计量经济学检验 包含的主要内容:
1,检验随机误差项的方差是否相同 => 检验是否 违背
同方差假设 =>异方差 ( 2.6)
2,检验随机误差项是否不相关 =>检验是否 违背无序
列相关假设 =>序列相关 ( 2.7)
3,检验解释变量之间是否不相关 =>检验是否 违背解
释变量不相关假设 =>多重共线性(多元) ( 2.8)
4,检验是否 违背解释变量确定性假设 =>随机解释变
量 ( 2.9)
? 计量经济学检验的工作就是检验基本假设是否得
到满足 。
§ 2.6 异方差性
Heteroskedasticity
一、异方差性的概念 —— 违反基本假设的定义及违
反的原因
二、异方差性的后果 —— 违反基本假设会造成什么
样的后果
三、异方差性的检验 —— 怎样诊断是否违反基本假
设
四、出现异方差时的补救措施 —— 如何消除或减弱
对基本假设的违反
五、案例
探求四个问题的答案
? 异方差 的性质是什么?
? 异方差的后果是什么?
? 如何检验异方差的存在?
? 如果存在异方差,有哪些补救措施?
一、异方差的概念
如果出现
V a r i i( )? ?? 2 i=1,2,?,n
即对于不同的样本点, 随机误差项的方差不再是
常数而是互不相同, 则认为出现了 异方差性或称
为非同方差, 非常量方差 。
ikikiii xxxy ?bbbb ++…+++? 22110
对于模型
i=1,2,…,n
同方差性假设为 2)( ?? ?iVar i=1,2,…,n
1、异方差的概念
2、异方差的类型
? 同方差性 假设的意义是指每个 ?i,不论解释变
量观测值是大还是小, 每个 ?i的方差保持相同,
并不随解释变量 x的变化而变化, 即
?i2 =常数
? 在 异方差 的情况下, ?i2已不是常数, 它 随 x的
变化而变化, 即
?i2 =f(x)
同方差
x1 x2
X
?
Y
随着 x变化随机误差项 ?的方差不变
y= b 0+ b 1x
异方差
x1 x2
X
u 随着 x增加随机误
差项方差增大Y
异方差
x1 x2
X
u 随着 x增加随机误
差项方差减小Y
关于异方差的一点说明
? 所谓的“存在异方差”,指模型满足其它
所有假设,仅仅违背同方差假设。
? 在假定其它所有假设均成立的条件下,讨
论异方差问题。
??i的方差随 x的增加 而增加,呈单调递增
型变化。
? 例如 3,以绝对收入假设为理论假设、以截面数据作样本建
立居民消费函数:
ci= b0+b1yi+?i
将居民按照收入等距离分成 n组, 取组平均数 ( 每组的人均收
入, 人均消费 ) 为样本观测值 。
一般情况下:处于中等收入组中的人数最多, 处于两端收入
组 (低收入及高收入 )中的人数少 。 那么, 人数多的收入组的人
均数据会比人数少的收入组的数据具有更高的准确性 。 因此,
人数多的组人均收入的误差小, 人数少的组平均收入的误差大 。
所以样本观测值的 观测误差随着解释变量观测值的增大而 先减
后增 。
如果样本观测值的观测误差构成随机误差项的主要部分,
那么对于不同的样本点, 随机误差项的方差随着 解释变量观测
值 的增大而 先减后增, 出现了异方差性 。
? 例如 3,以绝对收入假设为理论假设、以截面数据作样本建
立居民消费函数:
ci= b0+b1yi+?i
将居民按照收入等距离分成 n组, 取组平均数 ( 每组的人均收
入, 人均消费 ) 为样本观测值 。
?例如 4,以某一行业的企业为样本建立企业生产函
数模型
产出量为被解释变量, 选择资本, 劳动, 技术等
投入要素为解释变量, 那么每个企业所处的外部
环境对产出量的影响被包含在随机误差项中 。
由于每个企业所处的外部环境对产出量的影响程
度不同,造成了随机误差项的异方差性。
这时,随机误差项的方差并不随某一个解释变
量观测值的变化而呈规律性变化,为复杂型的一
种。
4.异方差的性质
? 由上面的 4个例子可以看出异方差的两个
性质:
1,现实社会经济中异方差是很常见的,处理
截面数据 时,尤应注意。
2,一般地,大多数异方差是有规律的:随机
误差项的方差随着解释变量观测值的变化
而呈现出规律性的变化 。
? 当然也有例外。
? 我们主要考虑有规律可循的异方差问题。
? 一旦计量经济学模型存在异方差性,如果
仍然采用 OLS法估计模型参数,会产生什
么后果呢?
二、异方差性的后果
1、参数估计量非有效
?普通最小二乘法参数估计量 仍然具有线性性和无
偏性, 但 不具有有效性 。
?因为在有效性证明中利用了
E(NN’)=?2I
? 而且, 在大样本情况下, 参数估计量 仍然不具有
渐近有效性 。
以一元线性回归模型为例进行说明:
( 1)仍存在无偏性:证明过程与方差无关
由于 iii XY ?bb ++? 10 ( 2,4,1 )
的参数
1
b 的 O LS 估计量 1
?
b 为:
i
i
i
iiii
x
x
kYk ?b?bb ?
?
? ? +?+?? 2111
?
故 1
211
)()()
?
( b?bb ?+? ?
?
i
i
i
E
x
x
EE ( 2, 4, 2 )
( 2)不具备最小方差性
由于
?
?
?
?
????
22
2
2
2
2
111
)(
)(
)()
?
()
?
v a r (
i
ii
i
i
i
x
xE
x
x
EE
?
?bbb
2
2
22
)(
)(
?
?
?
i
ii
x
Ex ?
(注:交叉项 ?
?
))((
,jjii
ji
ji
xx ??
的期望为零)
在
i
?
为同方差的假定下,
22
)()va r( ??? ??
ii
E
??
?
??
2
2
22
22
1
)(
)
?
va r(
ii
i
xx
x ??
b
(2, 4, 3 )
在 i
?
存在异方差的情况下
)()()va r(
222
iiii
XfE ???? ???
假设
2
)(
ii
XXf ?
,并且记异方差情况下 1
b
的 O L S 估计为 1
~
b,则
?
?
??
?
???
2
22
2
2
22
22
1
)(
)(
)
~
v a r (
i
ii
ii
ii
x
Xx
xx
Xfx ??
b
(2, 4, 4 )
对大多数经济资料有:
1
222
???
iii
xXx
,
比较 (2, 4, 3 ) 与 (2, 4, 4 ),
)
?
v a r ()
~
v a r (
11
bb ?
( 2,4,5 )
? 2、根据常用的估计 OLS估计量方差的公式
得到的方差通常是有偏的,它高估或低估
了真实的参数估计量的方差。
3、变量和方程的显著性检验失去意义
在该统计量中包含有随机误差项共同的方差,并且有
t统计量服从自由度为 (n-k-1)的 t分布。如果出现了
异方差性,t检验就失去意义。
其它检验也类似。
关于变量的显著性检验中,构造了 t 统计 量
)?(/? jj St bb? (2.4,5 )
4、模型的预测失效
一方面, 由于上述后果, 使得模型不具有良
好的统计性质;
另一方面, 在预测值的置信区间中也包含有随
机误差项共同的方差 ?2。
所以, 当模型出现异方差性时, 参数 OLS估计
值的变异程度增大, 从而造成对 y的预测误差变
大, 降低预测精确度, 预测功能失效, 得到的预
测值的置信区间不再可靠 。
? 简言之,在存在异方差的情况下,我们不
能再相信参数估计值,不能相信计算得到
的 t值和预测值的置信区间。
? 所有这些后果都促使我们去解决异方差问
题。
三、异方差性的检验
1、检验方法的共同思路
? 由于 异方差性具有的性质 —— 相对于解释变量的
不同观测值,随机误差项具有不同的方差。即随机
误差项的方差与解释变量的观测值之间存在着某种
联系。那么:
检验异方差性,也就是检验随机误差项的方差与
解释变量观测值之间是否存在联系(相关性及其相
关的“形式”)。
异方差性的两类基本检验方法
? 在共同的思路指导下,到目前为止发展出了十多
种异方差的检验方法。共分为两大类:
? 图示法
? 解析法 — 包含戈德菲尔德 -匡特 Goldfeld-Quandt
检验,戈里瑟( Gleiser)检验与帕克( Park)检
验等。
? 所有方法中没有任何一种在任何情况下都是最好
的。一般地,在检验过程中需要综合几种方法来
帮助研究者判断异方差是否存在。
检验异方差性,也就是检验随机误差项的
方差 与解释变量观测值之间是否存在联系
(相关性及其相关的“形式”)。
随机误差项 ?i的方差 2?i 实际上是未知的由于随机项 i? 不可观测,
问题:用什么来表示未知的随机误差项的方差?
一般的处理方法:
问题:用什么来表示未知的随机误差项的方差?
OLSiii yye )?(
~ ??
Var E ei i i( ) ( ) ~? ?? ?2 2 (2.6.1)
即 用 ~ei2(残差平方)来表示相应随机误差项的方差 。2?i
i=1,2,…,n
首先采用 OLS 法估计模型,以求得 残差
书中称之为, 近 似估计量,,用 ~ei 表示。
于是有
2、图示检验法
? 图示检验法 是利用残差序列绘制出各种图
形,以供分析检验使用 。
? 异方差是指随机误差项的方差随着 x的变
化而变化。
? 故可以根据 x-y或残差 x-e2的散点图,对
异方差是否存在及其类型作出判断。
? 异方差大致可分为三种:
? ( 1)递增异方差
? ( 2)递减异方差
? ( 3)复杂型异方差
2、图示检验法
( 1)用 X-Y的散点图进行判断
看是否存在明显的 散点扩大, 缩小 或 复杂型趋
势 (即不在一个固定的带型域中)
~e 2
x
同方差
(2)x-~ei2 的散点图进行判断 ~
ei2x-(某一个解释变量 的散点图进行判断)
x
~e 2
递增异方差
经济问题的异方差性大多是递增性的
x
递减异方差
~e 2
复杂型的图形
~e 2
x
与解释变量存在二次关系异方差
x
~e 2
纺锤型 异方差
x
~e 2
反纺锤型 异方差
? 一,经济问题的异方差性大多是递增性的。 二、
图示检验法非常方便、直观。但它只能进行大
致的而非严格的判断,而却以方差的表现形式
远不止以上几种。因此,在进行异方差检验时,
一般先使用图示法进行观察,一旦怀疑存在异
方差,在分析时就应该更为谨慎,使用其他检
验工具作出进一步的判断。
关于图示检验法的两点说明
( 2)戈里瑟( Gleiser)检验
戈里瑟检验和帕克检验的思想:
如果存在某一种形式,使得模型显著成立,则说
明原模型存在异方差性,随机误差项的方差与 xj有
关 。
以 |e~ |或 ~ei2为被解释变量,以原模型的某一解释变量 jx 为
解释变量,建立如下回归模型,进行回归:
ijii xfe e+? )(|
~| i=1,2,…,n ( Gleiser)
或 ijii xfe e+? )(~ 2 i=1,2,…,n (Park)
选择关于变量 jx 的不同的函数形式 (如 )( jiji xxf ? 或
jiji xxf
?1)( ? )进行试验,对模型进行估计并进行显著性检验;
被认为与误差项方
差有关的解释变量
GEJSTER检验的步骤
1,用原始数据估计所建之模型,计算残差 ei.
2,用残差绝对值与选定的 x进行回归:
? | ei|=α0+α1xh+v ( 1)
? v满足基本假定,幂次通常需要选择 多种值 试
算,如 h=1,1/2,-1,(- ?) 等
3,对所得各种模型形式进行检验,由模型的拟合
优度、显著性 F,t检验判断异方差是否存在。
4,若其中一个或多个模型显著成立,则说明存在
异方差。并找出最优的回归方程形式,得到异方
差的函数形式。反之则不存在。
GEJSTER检验的总结
? 优点:
1,不仅能检验模型是否存在异方差,而且可
以近似地给出 异方差的存在形式,?2i = ?2
f(xi)。以便用 WLS法 消除异方差。
2,对大样本来说,GEJSTER检验一般能给
出令人满意的结果。
? 缺点:
1.由于构造的 | ei|与解释变量的回归模型是探测性的,
具体形式未知,因此需要进行各种形式的 反复 试
验,如果模型选得不好,则检验不出是否存在异
方差性。在选择形式的过程中要充分利用各种有
用信息,若知道异方差的产生与哪一个解释变量
有关,甚至知道二者的方程形式,将是检验过程
变得十分简单。
2.比较繁杂,建议与其他检验方法配套使用。
四、出现异方差时的补救措施 ——
如何消除或减弱异方差
2、补救异方差性的方法
① 加权最小二乘法 (WLS)
Weighted Least Squares
② 将原模型对数线性化
加权最小二乘法( WLS)
要利用到的方差的性质,var(ax)=a2var(x)
1、加权最小二乘法的基本思想
? 加权最小二乘法 是 对存在 异方差 的模型作 适当的
代数变换(加权),使之成为满足 同方差 假定的模
型,然后再运用 OLS方法估计新模型中的参数了 。
?加权最小二乘法的应用分两种情况:
?( 1)已知异方差的形式
( 2)异方差的形式未知
注意:在实践中,根据经验一些异方差的形式是可
知的。
2、已知异方差的形式的情况下加权最小二乘
法的应用
( 1)从一元入手:一元的一个例子
? ?2i = ?2 f( xi )的由来
? 大多数异方差是有规律的:
? 随机误差项的 方差 已不是常数,随着 解释变量观测值
( x1, x2,?,xn共 n个)的变化 而呈现出规律性的变
化。
? 例如:一元中,?的方差与 x有关
? 具体的说,?1的方差 ?21与 x1有关; ?2的方差 ?22与 x2
有关; ?n的方差 ?2n与 xn有关
注,f表示函数的一般形式,不表示具体的函数形式
y=f(x)表示 y是 x的函数;如, y=f(x) =3x;y=f(x)=5x-2
异方差
x1 x2
X
u 随着 x增加随机误
差项方差增大Y
? 加权最小二乘法实际就是给模型中的每一个 y和
x乘上一个数,这个数称之为权数。然
后对变换后的模型进行 OLS估计。所以这种方
法称为加权最小二乘法。用 WLS 得到的估计量
称为 WLS估计量( WLS estimators)。
)(
1
ixf
( 3)在已知异方差形式的情况下,
用 WLS法补救一元异方差性的具体步骤
? ?
? ?
? ? 得满足同方差的新模型去除原模型的两端即可用
,为常数。
的异方差形式为若原模型中随机扰动项
步骤一:
x
x
x
i
i
iii
f
f
f
0
2
22
?
?
?
???
步骤二:对变换后的新模型运用 OLS法进行估计
(4)多元的一般情形
? 例如:若
V a r E f xi i i ji( ) ( ) ( )? ? ? ?? ? ?2 2 2
即随机误差项的方差与解释变量 jx 之间存在
相关性,那么可以用 )( jixf 去除原模型,使之
变成如下形式的新模型:
即满足同方差性。于是可以用 OLS 估计其
参数,得到关于参数 b b b0 1,,,L k 的无偏的、有
效的估计量。这就是加权最小二乘法,在这
里权就是 )(1
jixf
。
在变换后的模型中,存在
222 )(
)(
1)
)(
1()
)(
1( ???? ???
i
ji
i
ji
i
ji
ExfxfExfVar
L+++? i
ji
i
jiji
i
ji
xxfxxfxfyxf 22110 )(1)(1)(1)(1 bbb
i
ji
ki
ji
k xfxxf ?b )(
1
)(
1 ++
( 5)在已知异方差形式的情况下,
用 WLS法补救多元异方差性的具体步骤
? ?
? ?
? ? 得满足同方差的新模型去除原模型的两端即可用
,为常数。
的异方差形式为若原模型中随机扰动项
步骤一:
x
x
x
ij
ij
ijii
f
f
f
0
2
22
?
?
?
???
步骤二:对变换后的新模型运用 OLS法进行估计
( 6)用矩阵表示的一般情况
对于模型
Y=XB+N (2.6.2)
存在
E
Cov E
( )
( ) ( )
N
NN NN
?
? ? ? ?
0
2? W
W ?
?
?
?
?
?
?
?
?
?
?
?
?
w
w
wn
1
2
O (2.6.3)
即存在 异方差性 。
设 W D D? ?
其中
?
?
?
?
?
?
?
?
?
?
?
?
?
n
w
w
D O
1
该模型具有同方差性。因为
?
??
?
N ?N?
? ???? 1111**
)()()( DDDD NNEENNE
IDDDDWDD
1111 222
??? ?????
????
用 D 1? 左乘 (2.4.8)两边,得到一个新的模型:
D Y D X D? ? ?? +1 1 1B N (2.6.4)
即 Y X* * *? +B N
这就是原模型 (2.6.2)的加权最小二乘估
计量, 它是无偏, 有效的 。
这里权矩阵为 D-1,它来自于矩阵 W 。
于是,可以用 OLS 法估计模型 (2.6.4),得
$ ( )* * * *B? ? ??X X X Y1
? ? ? ? ?
? ? ?
? ? ? ? ?
? ? ?
( )
( )
X D D X X D D Y
X W X X W Y
1 1 1 1 1
1 1 1 (2,6.5)
3、异方差形式未知的情况下,
加权最小二乘法的应用
OLSiii YYe )?(
~ ??
Var E ei i i( ) ( ) ~? ?? ?2 2 (2.6.1)
用 ~ei2 (残差平方)来表示相应随机误差项的方差 σi2
异方差形式未知的情况下
加权最小二乘法具体步骤
① 选择普通最小二乘法估计原模型,得到随机误差
项的近似估计量 ~e i ;
② 建立 |~|1 ie 的数据序列;
③ 选择加权最小二乘法,以 |
~
|1
i
e 序列作为权,进
行估计得到参数估计量。
实际上是以 |
~
|1
i
e 乘原模型的两边,得到一个新模
型,采用普通最小二乘法估计新模型。
此步骤也是上机操作时 加权最小二乘法的具体步骤
4,WLS法的总结
? 加权最小二乘法实际就是给 原模型 中的 每
一个 y和 x乘上一个权数,使得变换后的新
模型满足同方差假设,然后对 变换后的新
模型 进行 OLS估计 。
? 在实际建模过程中,尤其是截面数据作样本时,人
们通常 并不对原模型进行异方差性检验,而是直接
选择加权最小二乘法估计模型,尤其是采用截面数
据作样本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法等价于普
通最小二乘法。
用 ~ei2(残差平方)来表示相应 随机误差项的方差 σi 2
补救方法二:将原模型对数线性化
? 实践证明,对数线性模型是回避异方差的行之有
效的方法。
? 对数线性模型的一般形式,
? lnY=b0 +b1 lnx1+ …+ bk lnxk +μ
? 当然,在一个具体问题中,用线性模型还是用 对
数线性模型 要根据具体的经济理论以及其他一些
因素来决定。但如果选择两者中的任何一个并没
有太大的差别,并且在线性模型中异方差问题比
较严重时,不妨试一试 对数线性模型。
五、案例 — 1
— 某地区居民储蓄模型
某地区 31年来居民收入与储蓄额数据表
表 1 单位:万元
年份 居民收入
(X)
储蓄
(Y)
年份 居民收入
(X)
储蓄
(Y)
年份 居民收入
(X)
储蓄
(Y)
1968 8777 264 1979 17663 950 1990 29560 2105
1969 9210 105 1980 18575 779 1991 28150 1600
1970 9954 90 1981 19535 819 1992 32100 2250
1971 10508 131 1982 21163 1222 1993 32500 2420
1972 10979 122 1983 22880 1072 1994 35250 2570
1973 11912 107 1984 24127 1578 1995 33500 1720
1974 12747 406 1985 25604 1654 1996 36000 1900
1975 13499 503 1986 26500 1400 1997 36200 2100
1976 14269 431 1987 27670 1829 1998 38200 2300
1977 15522 588 1988 28300 2200
1978 16730 898 1989 27430 2017
1、普通最小二乘估计
1、直接使用 OLS法得:
xy 0846.060.665? +??
t= (-5.87) ( 18.04)
2r =0.9182
截面数据注意是否存在异方差性
2,异方差检验
( 1)图示检验
0
500
1000
1500
2000
2500
3000
0 5000 10000 15000 20000 25000 30000 35000 40000 45000
X
Y
(2)Park检验
显然,lnxi前的参数表现为统计上显著的,
表明原数据存在异方差性 。
对直接使用 OLS 法估计的残差项的平方
2~
ie 进行如下一般形式的回归:
iii vxe ++? ln
~ln 2 ba
得,iii vxe ++?? ln81.299.17~ln 2
t= ( -2.89) (4.48)
2r =0.4093
与 OLS估计结果相比较,拟合效果更好,t值更显著,
参数估计值发生变化 。
如果用估计的 ~ei 2 作为随机误差项方差的估计值,即相当于
用 |~|/1 ie 为权重进行加权最小二乘估计 ( WLS),则有
xy 0857.006.686? +??
t= (-29.14) ( 43.59)
2r =0.9925
3、异方差模型的估计
五、案例 — 2
— 居民消费二元模型
1,OLS估计结果
D e p e n d e n t V a r i a b l e, C O N S
M e t h o d, L e a st S q u a r e s
D a t e, 0 3 / 0 1 / 0 3 T i m e, 0 0, 4 6
S a m p l e, 1 9 8 1 1 9 9 6
I n cl u d e d o b se r v a t i o n s,1 6
V a r i a b l e C o e f f i ci e n t S t d, E r r o r t - S t a t i st i c P r o b,
C 5 4 0, 5 2 8 6 8 4, 3 0 1 5 3 6, 4 1 1 8 4 8 0, 0 0 0 0
G D P 0, 4 8 0 9 4 8 0, 0 2 1 8 6 1 2 2, 0 0 0 3 5 0, 0 0 0 0
C O N S 1 0, 1 9 8 5 4 5 0, 0 4 7 4 0 9 4, 1 8 7 9 6 9 0, 0 0 1 1
R - sq u a r e d 0, 9 9 9 7 7 3 M e a n d e p e n d e n t v a r 1 3 6 1 8, 9 4
A d j u st e d R - sq u a r e d 0, 9 9 9 7 3 9 S, D, d e p e n d e n t v a r 1 1 3 6 0, 4 7
S, E, o f r e g r e ss i o n 1 8 3, 6 8 3 1 A ka i ke i n f o cr i t e r i o n 1 3, 4 3 1 6 6
S u m sq u a r e d r e si d 4 3 8 6 1 3, 2 S ch w a r z cr i t e r i o n 1 3, 5 7 6 5 2
L o g l i ke l i h o o d - 1 0 4, 4 5 3 3 F - st a t i st i c 2 8 6 8 2, 5 1
D u r b i n - W a t so n st a t 1, 4 5 0 1 0 1 P r o b ( F - st a t i st i c) 0, 0 0 0 0 0 0
2,WLS估计结果
D e p e n d e n t V a r i a b l e, C O N S
M e t h o d, L e a s t S q u a r e s
D a t e, 0 3 / 0 1 / 0 3 T i m e, 0 0, 4 7
S a m p l e, 1 9 8 1 1 9 9 6
I n c l u d e d o b s e r v a t i o n s, 1 6
W e i g h t i n g s e r i e s, E
V a r i a b l e C o e f f i c i e n t S t d, E r r o r t - S t a t i s t i c P r o b,
C 5 1 8, 2 8 8 1 2 0, 5 2 6 2 0 2 5, 2 5 0 0 8 0, 0 0 0 0
G D P 0, 4 8 3 8 1 4 0, 0 0 3 6 0 7 1 3 4, 1 3 4 8 0, 0 0 0 0
C O N S 1 0, 1 9 3 5 2 5 0, 0 0 8 4 6 4 2 2, 8 6 4 7 7 0, 0 0 0 0
W e i g h t e d S t a t i s t i c s
R - s q u a r e d 0, 9 9 9 9 9 9 M e a n d e p e n d e n t v a r 1 9 9 4 3, 8 1
A d j u s t e d R - s q u a r e d 0, 9 9 9 9 9 9 S, D, d e p e n d e n t v a r 4 0 7 3 0, 3 1
S, E, o f r e g r e s s i o n 4 7, 5 8 5 7 4 A k a i k e i n f o c r i t e r i o n 1 0, 7 3 0 3 0
S u m s q u a r e d r e s i d 2 9 4 3 7, 2 3 S c h w a r z c r i t e r i o n 1 0, 8 7 5 1 6
L o g l i k e l i h o o d - 8 2, 8 4 2 4 3 F - s t a t i s t i c 9 8 0 7 3 6, 2
D u r b i n - W a t s o n s t a t 1, 8 1 0 4 7 1 P r o b ( F - s t a t i s t i c ) 0, 0 0 0 0 0 0
3、比较
各项统计检验指标全面改善
R2, 0.999739→0.999999
F,28682→980736
∑e2,438613→29437
t,6.4 22.0 4.2→25.2 134.1 22.9
D.W.,1.45→1.81
五、案例 — 3
—— 经纪佣金率放松管制
? 纽约股票交易所( NYSE)最初是极力反对对经纪
佣金率放松管制的。事实上,在引入放松管制以
前( 1975.5.1),NYSE向股票交易委员会提交了
一份计量经济研究报告,认为在经济行业中存在
着规模经济,因此(由垄断决定的)固定佣金率
是公正的。 NYSE所提交的计量经济分析基本上是
围绕着以下回归函数来进行的:
? 其中,y=总成本; x=股票交易的数量 。
( - 6, 5 4 ) ( 4 0, 3 9 ) ( 2, 9 8 ) t
9 3 4.0R )10*( 1, 0 8 33 4 8.314 7 6 0 0 0 22-6?
?
?+? xxy
iii
-
? 从模型可以看出:总成本与交易量正相关。但是由于交易
量的二次方项系数为负,并且是“统计显著的”,这意味
着总成本是以一个递减的速率在增加。因此,NYSE认为在
经济行业中存在着规模经济,从而证明了 NYSE的垄断地位
是正当的。
? 然而,美国司法部反托拉斯局却认为该模型中所声称的规
模经济只是幻想,因为回归函数存在着异方差问题。这是
因为在估计成本函数时,NYSE并未考虑到样本中所包含的
小公司与大公司的差别,也就是说,NYSE并没有考虑到规
模因素。
? 假设误差项与交易量成比例,反托拉斯局重新估计了方程,
得:
( - 6, 5 4 ) ( 4 0, 3 9 ) ( 2, 9 8 ) t
9 3 4.0R )10*( 1, 0 8 33 4 8.314 7 6 0 0 0 22-6?
?
?+? xxy ii
i
-
? 从式中可以看出,二次项不仅是统计不显著的,
而且其符号也发生了变化。因此,在经纪行业中
并不存在规模经济,这就推翻了 NYSE的垄断佣
金结构的论点。
)10*( 4, 3 457.523 4 2 0 0 0 2-6? xxy
iii
++?
探求四个问题的答案
? 异方差 的性质是什么?
? 异方差的后果是什么?
? 如何检验异方差的存在?
? 如果存在异方差,有哪些补救措施?