§ 4.2 序列相关性
Serial Correlation
一,序列相关性概念二、实际经济问题中的序列相关性三、序列相关性的后果四、序列相关性的检验五、具有序列相关性模型的估计六、案例
§ 4.2 序列相关性一、序列相关性概念如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了 序列相关性 。
对于模型
Yi=?0+?1X1i+?2X2i+…+?kXki+?i i=1,2,…,n
随机项互不相关的基本假设表现为
Cov(?i,?j)=0 i?j,i,j=1,2,…,n
在其他假设仍成立的条件下,序列相关 即意味着
0)(?jiE

2
1
1
2
)(
)(
)()(



n
n
E
E
EC o v μμμ
2
1
1
2



n
n
IΩ 22
或称为 一阶列相关,或 自相关 ( autocorrelation)
其中,?被称为 自协方差系数 ( coefficient of
autocovariance) 或 一阶自相关系数 ( first-order
coefficient of autocorrelation)
i是满足以下标准的 OLS假定的随机干扰项:
如果仅存在
E(?i?i+1)?0 i=1,2,…,n
自相关 往往可写成如下形式,
i=i-1+?i -1<?<1
0)(?iE?,2)v a r (i,0),c o v ( sii 0?s
由于序列相关性经常出现在以时间序列为样本的模型中,
因此,本节将用下标 t代表 i。
二、实际经济问题中的序列相关性大多数经济时间数据都有一个明显的特点,惯性,
表现在时间序列不同时间的前后关联上。
由于 消费习惯 的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。
例如,绝对收入假设 下 居民总消费函数模型,
Ct=?0+?1Yt+?t t=1,2,…,n
1,经济变量固有的惯性
2、模型设定的偏误所谓模型 设定偏误 ( Specification error)是指所设定的模型,不正确,。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。
例如,本来应该估计的模型为
Yt=?0+?1X1t+?2X2t +?3X3t +?t
但在模型设定中做了下述回归:
Yt=?0+?1X1t+?1X2t + vt
因此,vt=?3X3t +?t,如果 X3确实影响 Y,则出现 序列相关。
但建模时设立了如下模型:
Yt=?0+?1Xt+vt
因此,由于 vt=?2Xt2+?t,,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。
又如,如果真实的边际成本回归模型应为:
Yt=?0+?1Xt+?2Xt2+?t
其中,Y=边际成本,X=产出,
3、数据的,编造,
例如,季度数据 来自 月度数据 的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。
还有就是两个时间点之间的,内插,技术往往导致随机项的序列相关性。
在实际经济问题中,有些数据是通过已知数据生成的。
因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
计量经济学模型一旦出现序列相关性,如果仍采用 OLS法估计模型参数,会产生下列不良后果:
二、序列相关性的后果
1、参数估计量非有效因为,在有效性证明中利用了
E(NN’)=?2I
即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。
其他检验也是如此。
3,模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。
所以,当模型出现序列相关性时,它的预测功能失效。
三、序列相关性的检验然后,通过分析这些,近似估计量,之间的相关性,以判断随机误差项是否具有序列相关性 。
序列相关性 检验方法有多种,但基本思路相同:首先,采用 O L S 法估计模型,以求得随机误差项的
,近似估计量,,用
~e
i 表示:
lsiii YYe 0)?(
~
基本思路,
三、序列相关性的检验
1、图示法
2、回归检验法以 te~ 为被解释变量,以各种可能的相关量,诸如以 1~?te,
2
~
te,
2~
te 等为解释变量,建立各种方程,
ttt ee 1~~
tttt eee 2211 ~~~
……
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。
回归检验法 的 优点 是,( 1) 能够确定序列相关的形式,( 2)适用于任何类型序列相关性问题的检验。
3、杜宾 -瓦森( Durbin-Watson)检验法
D-W 检验是杜宾 ( J.Durbin ) 和 瓦森 (G.S.
Watson)于 1951年提出的一种检验序列自相关的方法,
该方法的假定条件是,
( 1) 解释变量 X非随机;
( 2) 随机误差项?i为一阶自回归形式:
i=i-1+?i
( 3) 回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:
Yi=?0+?1X1i+kXki+?Yi-1+?i
( 4) 回归含有截距项该统计量 的分布与出现在给定样本中的 X值有复杂的关系,因此其 精确的分布很难得到 。
但是,他们 成功地导出了临界值的下限 dL和上限 dU,且这些上下限只与样本的容量 n和解释变量的个数 k有关,而与解释变量 X的取值无关。
杜宾和瓦森针对原 假设,H0,?=0,即不存在一阶自回归,构如下造统计量:

n
t
t
n
t
tt
e
ee
WD
1
2
2
2
1
~
)~~(
..
D.W,统计量,
D.W检验步骤,
( 1)计算 DW值
( 2)给定?,由 n和 k的大小查 DW分布表,得临界值 dL和 dU
( 3)比较、判断若 0<D.W.<dL 存在正自相关
dL<D.W.<dU 不能确定
dU <D.W.<4- dU 无自相关
4- dU <D.W.<4- dL 不能确定
4- dL <D.W.<4 存在负自相关
0 dL dU 2 4-dU 4-dL
正相关不能确定无自相关 不能确定负相关当 D.W.值在 2左右时,模型不存在一阶自相关。
证明:
展开 D.W.统计量:



n
t
t
n
t
n
t
n
t
tttt
e
eeee
WD
1
2
2 2 2
1
2
1
2
~
~~2~~
..
(*)
)1(2)
~
~~
1(2..
1
2
2
1

n
t
t
n
t
tt
e
ee
WD
如果存在 完全一阶正相关,即?=1,则 D.W.? 0
完全一阶负相关,即?= -1,则 D.W.? 4
完全不相关,即?=0,则 D.W.?2
这里,


n
t t
n
t tt
n
t t
n
t tt
eeeeee
2
2
2 11
2
2 1
~~~~~~
为一阶自回归模型
i=i-1+?i
的参数估计。
)1(2)
~
~~
1(2..
1
2
2
1

n
t
t
n
t
tt
e
ee
WD
4、拉格朗日乘数( Lagrange multiplier)检验拉格朗日乘数检验克服了 DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。
它是由布劳殊( Breusch)与戈弗雷( Godfrey)
于 1978年提出的,也被称为 GB检验 。
ikikiii XXXY22110
对于模型如果怀疑随机扰动项存在 p阶序列相关,
tptpttt2211
GB检验可用来检验如下受约束回归方程
tptptktktt XXY 11110
约束条件为:
H0,?1=?2=…=?p =0
约束条件 H0为真 时,大样本下
)(~)( 22 pRpnLM
其中,n为样本容量,R2为如下辅助回归的可决系数:
tptptktktt eeXXe ~~~ 11110
给定?,查临界值2(p),与 LM值比较,做出判断,
实际检验中,可从 1阶,2阶,… 逐次向更高阶检验。
如果模型被检验证明存在序列相关性,
则需要发展新的方法估计模型。
最常用的方法是 广义最小二乘法 ( GLS,
Generalized least squares)和 广义差分法
(Generalized Difference)。
四、序列相关的补救
1、广义最小二乘法对于模型
Y=X?+?
如果存在序列相关,同时存在异方差,即有
Ωμμ,μμ,2
2
21
2
2
221
112
2
1
)()C ov(?




nnn
n
n
E

是一对称正定矩阵,存在一可逆矩阵 D,使得
=DD’
变换原模型:
D-1Y=D-1X? +D-1?
即 Y*=X*? +?* (*)
121121
1111 )()()(




DDDDDΩD
DμμDDμμDμμ **

EEE
I2
(*)式的 OLS估计:
**1*** )(? YXXXβ
YΩXXΩX
YDDXXDDX
111
11111
)(
)(




这就是原模型的 广义最小二乘估计量 (GLS estimators),
是无偏的、有效的估计量。
该模型具有同方差性和随机误差项互相独立性,
如何得到矩阵??
对?的形式进行特殊设定后,才可得到其估计值 。
10000
01000
00010
00001
000001
2
1

D
Ωμμ,2
21
2
1
2
2
1
1
1
1
)(?







nn
n
n
C o v
如设定随机扰动项为 一阶序列相关形式
i=i-1+?i

2、广义差分法广义差分法 是将原模型变换为满足 OLS法的差分模型,再进行 OLS估计 。
ikikiii XXXY22110
如果原模型存在
tltlttt2211
可以将原模型变换为,
)()1( 1111111011 ltlttlltltt XXXYYY
tlktlktktk XXX )( 11
该模型为 广义差分模型,不存在序列相关问题。
可进行 OLS估计。
注意:
广义差分法 就是上述 广义最小二乘法,但是却损失了部分样本观测值。
如,一阶序列相关的情况下,广义差分是估计
tktktktttt XXXXYY )()()1( 1111101?
nt,,3,2
这相当于
10000
01000
00010
00001
000001
2
1

D
去掉第一行后左乘原模型 Y=X?+? 。即运用了 GLS法,
但第一次观测值被排除了。
3、随机误差项相关系数的估计应用 广义最小二乘法 或 广义差分法,必须已知随机误差项的相关系数?1,?2,…,?L 。
实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计 。
常用的估计方法有:
科克伦 -奥科特 ( Cochrane-Orcutt) 迭代法 。
杜宾 ( durbin) 两步法
( 1) 科克伦 -奥科特迭代法 。
以一元线性模型为例:
首先,采用 OLS法估计原模型
Yi=?0+?1Xi+?i
得到的?的,近似估计值,,并以之作为观测值使用 OLS法估计下式
i=?1?i-1+?2?i-2+L?i-L+?i
得到?,?,,1 2? l,作为随机误差项的相关系数1 2,,,? l 的 第一次估计值 。
求出?i新的,近拟估计值,,并以之作为样本观测值,再次估计
i=?1?i-1+?2?i-2+L?i-L+?i
i l l n1 2,,,?
ililiillilii XXXYYY )()1( 1111011
类似地,可进行第三次、第四次迭代。
关于迭代的次数,可根据具体的问题来定 。
一般是事先给出一个精度,当相邻两次?1,?2,
,?L的估计值之差小于这一精度时,迭代终止 。
实践中,有时只要迭代两次,就可得到较满意的结果 。 两次迭代过程也被称为 科克伦 -奥科特两步法 。
( 2)杜宾 ( durbin) 两步法该方法仍是先估计?1,?2,?,?l,再对差分模型进行估计第一步,变换差分模型为下列形式
ililiillilii XXXYYY )()1( 1111011
i l l n1 2,,,?
进行 OLS估计,得各 Yj( j=i-1,i-2,…,i-l)前的系数?1,?2,?,?l的估计值第二步,将估计的 l,,?,? 21? 代入差分模型
ililiillilii XXXYYY )()1( 1111011
i l l n1 2,,,?
采用 O L S 法估计,得到参数 110 ),1( l 的估计量,记为
*
0
,*
1

于是:
)1( 1*00 l,*11
应用软件中的广义差分法在 Eview/TSP软件包下,广义差分采用了科克伦 -
奥科特 ( Cochrane-Orcutt) 迭代法估计?。
在解释变量中引入 AR(1),AR(2),…,即可得到参数和 ρ1,ρ2,… 的估计值 。
其中 AR(m)表示随机误差项的 m阶自回归 。 在估计过程中自动完成了 ρ1,ρ2,… 的迭代 。
如果能够找到一种方法,求得 Ω或 各序列相关系数?j的估计量,使得 GLS能够实现,则称为可行的广义最小二乘法 ( FGLS,Feasible
Generalized Least Squares)。
FGLS估计量,也称为 可行的广义最小二乘估计量 ( feasible general least squares estimators)
可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦 -奥科特迭代法下,
估计量也具有渐近有效性。
前面提出的方法,就是 FGLS
注意:
4、虚假序列相关问题由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为 虚假序列相关 (false autocorrelation),应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。
五、案例:中国商品进口模型经济理论指出,商品进口 主要由进口国的 经济发展水平,以及 商品进口价格指数 与 国内价格指数 对比因素决定的。
由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。
(下表)。
表 4.2.1 1 97 8~ 20 01 年中国商品进口与国内生产总值国内生产总值
GDP
(亿元)
商品进口
M
(亿美元)
国内生产总值
GDP
(亿元)
商品进口
M
(亿美元)
1978 3624.1 108.9 1990 18547.9 533.5
1979 4038.2 156.7 1991 21617.8 637.9
1980 4517.8 200.2 1992 26638.1 805.9
1981 4862.4 220.2 1993 34634.4 1039.6
1982 5294.7 192.9 1994 46759.4 1156.1
1983 5934.5 213.9 1995 58478.1 1320.8
1984 7171.0 274.1 1996 67884.6 1388.3
1985 8964.4 422.5 1997 74462.6 1423.7
1986 10202.2 429.1 1998 78345.2 1402.4
1987 11962.5 432.1 1999 82067.46 1657
1988 14928.3 552.7 2000 89442.2 2250.9
1989 16909.2 591.4 2001 95933.3 2436.1
资料来源:《中国统计年鉴》( 1995,2000,2002 )。
1,通过 OLS法建立如下中国商品进口方程:
tt G D PM 02.091.152
( 2.32) ( 20.12)
2,进行序列相关性检验。
DW检验取?=5%,由于 n=24,k=2(包含常数项 ),查表得:
dl=1.27,du=1.45
由于 DW=0.628< dl,故,存在正自相关 。
拉格朗日乘数检验
21 ~7 8 6.0~0 9 4.10 0 0 3.05 9 3.6~ tttt eeGDPe( 0.23) ( -0.50) (6.23) ( -3.69)
R2=0.6614
于是,LM=22?0.6614=14.55
取?=5%,?2分布的临界值?20.05(2)=5.991
LM >?20.05(2) 故,存在正自相关
2阶滞后:
3阶滞后:
321 ~0 3 2.0~8 1 9.0~1 0 8.10 0 0 3.06 9 2.6~ tttt eeeG D Pe
(0.22) (-0.497) (4.541) ( -1.842) ( 0.087)
R2=0.6615
于是,LM=21?0.6614=13.89
取?=5%,?2分布的临界值?20.05(3)=7.815
LM >?20.05(3)
表明,存在正自相关;但 ět-3的参数不显著,说明不存在 3阶序列相关性。
3、运用广义差分法进行自相关的处理
( 1) 采用杜宾两步法估计?
第一步,估计模型
ttttttt GDPGDPGDPMMM 2*31*2*12211*0
2121 0 5 4.00 9 6.00 5 5.04 6 9.09 3 8.009.78 tttttt G D PG D PG D PMMM
( 1.76) (6.64) (-1.76) (5.88) (-5.19) (5.30)
第二步,作差分变换:
)469.0938.0( 21* tttt MMMM
)469.0938.0( 21* tttt G D PG D PG D PG D P
则 M*关于 GDP*的 OLS估计结果为:
** 0 2 0.018.86? tt GDPM
( 2.76) (16.46)
取?=5%,DW>du=1.43 (样本容量 24-2=22)
表明,已不存在自相关
1 6 2,3 00,4 6 9 )0,9 3 8- /( 18 6,1 8)1/( 21*00
于是原模型为:
tt GDPM 0 2 0.030.1 6 2
与 OLS估计结果的差别只在 截距项,
tt G D PM 02.091.152
( 2)采用科克伦 -奥科特迭代法估计?
在 Eviews软包下,2阶广义差分的结果为:
取?=5%,DW>du=1.66(样本容量,22)
表明,广义差分模型已不存在序列相关性。
]2[801.0]1[108.1020.032.169? ARARGDPM tt
(3.81) (18.45) (6.11) (-3.61)
可以验证,仅采用 1阶广义差分,变换后的模型仍存在 1阶自相关性;
采用 3阶广义差分,变换后的模型不再有自相关性,但 AR[3]的系数的 t值不显著。