§ 2.7 序列相关性
Serial Correlation
一,序列相关性
二、序列相关性的后果
三、序列相关性的检验
四、具有序列相关性模型的估计
五、案例
如果模型的随机误差项违背了互相独立
的基本假设的情况,称为 序列相关性 。
普通最小二乘法( OLS)要求计量模型
的随机误差项 相互独立 或 序列不相关 。
一、序列相关性
1、序列相关的概念
对于模型
ikikiii XXXY ????? ?????? ?22110 i = 1,2,?,n
随机误差项互不相关的基本假设表现为:
C o v i j(,)? ? ? 0 i ≠ j, i,j = 1,2,?,n
如果对于不同的样本点,随机误差项之间不再是
不相关的,而是存在某种相关性,则认为出现了 序
列相关性 。
在其他假设仍成立的条件下,序列相关 即意味着
0)( ?jiE ??

? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
n
T
ENNE ??
?
?
??
1
1
)(
?
?
?
?
?
?
?
?
?
?
?
2
1
1
2
1
nn
n
E
???
???
?
???
?
?
?
?
?
?
?
?
?
?
?
?
)()(
)()(
2
1
1
2
1
nn
n
EE
EE
???
???
?
???
?
?
?
?
?
?
?
?
?
?
?
?
2
1
1
2
1
)(
)(
nn
n
E
E
???
???
?
???
?
?
?
?
?
?
?
?
?
?
?
?
2
1
1
2
)(
)(
???
???
?
???
?
n
n
E
E
Ω
2
?? I
2
??
( 2, 5, 1 )
称为 一阶序列相关, 或 自相关 ( autocorrelation) 。
这是最常见的一种序列相关问题 。
自相关 往往可写成如下形式:
如果仅存在
E i i( )? ? ? ?1 0 i = 1,2,?,n -1 ( 2, 5, 2 )
ttt ???? ?? ? 1 11 ??? ? ( 2,5,3 )
其中,?被称为 自协方差系数 ( coefficient of
autocovariance) 或 一阶自相关系数 ( first-order
coefficient of autocorrelation) 。
2、序列相关产生的原因
( 1) 惯性
大多数经济时间数据都有一个明显的特点, 就是
它的惯性 。
GDP,价格指数, 生产, 就业与失业等时间序列都
呈周期性, 如周期中的复苏阶段, 大多数经济序列均
呈上升势, 序列在每一时刻的值都高于前一时刻的值,
似乎有一种内在的动力驱使这一势头继续下去, 直至
某些情况 ( 如利率或课税的升高 ) 出现才把它拖慢下
来 。
( 2)设定偏误:模型中遗漏了显著的变量
例如, 如果对牛肉需求的正确模型应为
Yt=?0+?1X1t+?2X2t+?3X3t+?t
其中,Y=牛肉需求量, X1=牛肉价格, X2=消费者收入,
X3=猪肉价格 。
如果模型设定为:
Yt= ?0+?1X1t+?2X2t+vt
那么该式中的随机误差项实际上是,vt= ?3X3t+?t,
于是在猪肉价格影响牛肉消费量的情况下, 这种模
型设定的偏误往往导致随机项中有一个重要的系统性
影响因素, 使其呈序列相关性 。
(3)设定偏误:不正确的函数形式
例如,如果边际成本模型应为:
Yt= ?0+?1Xt+?2Xt2+?t
其中,Y=边际成本, X=产出 。
但建模时设立了如下模型:
Yt= ?0+?1Xt+vt
因此,由于 vt= ?2Xt2+?t,,包含了产出的平方对随机
项的系统性影响,随机项也呈现序列相关性。
(4)蛛网现象
例如, 农产品供给对价格的反映本身存在一个
滞后期:
供给 t= ?0+?1价格 t-1+?t
意味着, 农民由于在年度 t的过量生产 ( 使该期价
格下降 ) 很可能导致在年度 t+1时削减产量, 因此
不能期望随机干扰项是随机的, 往往产生一种蛛
网模式 。
(5)数据的, 编造,
例如,季度数据来自月度数据的简单平均,这
种平均的计算减弱了每月数据的波动而引进了数
据中的匀滑性,这种匀滑性本身就能使干扰项中
出现系统性的因素,从而出现序列相关。
还有就是两个时间点之间的“内插”技术往往
导致随机项的序列相关性。
二、序列相关性的后果
1、参数估计量非有效
? OLS参数估计量仍具无偏性
? OLS估计量不具有有效性
? 在大样本情况下,参数估计量仍然不具有渐近有
效性,这就是说参数估计量不具有一致性
2、变量的显著性检验失去意义
在关于变量的显著性检验中,当存在序列相关
时,参数的 OLS估计量的方差增大,标准差也增
大,因此实际的 t 统计量变小,从而接受原假设
?i=0的可能性增大,检验就失去意义。
采用其它检验也是如此。
3,模型的预测失效
区间预测与参数估计量的方差有关, 在方差有
偏误的情况下, 使得预测估计不准确, 预测精度
降低 。 所以, 当模型出现序列相关性时, 它的预
测功能失效 。
三、序列相关性的检验
1、基本思路
? 序列相关性检验方法有多种,但基本思路是相
同的。
? 首先采用普通最小二乘法估计模型,以求得随
机误差项的, 近似估计量,,
~ ( ? )e y yi i i ls? ? 0
? 然后,通过分析这些, 近似估计量, 之间的相
关性,以达到判断随机误差项是否具有序列相关
性的目的。
2、图示法
由于残差
~
e
i 可以作为 i
? 的估计,因此如果
i
?
存在序列相关,必然会由残差项
~
e
i 反映出来,
因此可利用
~
e
i 的变化图形来判断随机项的序
列相关性。
3、解析法
( 1) 回归检验法

~
e
i 为被解释变量,以各种可能的相关量,
诸如以
~
e
i ? 1,
~
e
i ? 2,
~
e
i
2
等为解释变量,建立各
种方程:
~ ~
e e
i i i
? ?
?
? ?
1 i = 2,?,n
~ ~ ~
e e e
i i i i
? ? ?
? ?
? ? ?
1 1 2 2 i = 3,?,n
?
? 具体应用时需要反复试算。
? 回归检验法的优点是:
一旦确定了模型存在序列相关性,也就同时
知道了相关的形式;
它适用于任何类型的序列相关性问题的检验。
对各方程估计并进行显著性检验,如果存在某
一种函数形式,使得方程显著成立,则说明原模
型存在序列相关性。
( 2)杜宾 -瓦森( Durbin-Watson)检验法
? D-W检验是杜宾 ( J.Durbin) 和 瓦森 (G.S,Watson)
于 1951年提出的一种检验序列自相关的方法 。
? 该方法的假定条件是,
( 1) 解释变量 X非随机;
( 2) 随机误差项 ?i为一阶自回归形式:
?i=??i-1+?i
( 3) 回归模型中不应含有滞后因变量作为解释变
量, 即不应出现下列形式:
Yi=?0+?1X1i+??kXki+?Yi-1+?i
( 4) 回归含有截距项;
( 5) 没有缺落数据 。
Du r b i n 和 W a ts o n 假设:
0:
0
??H, 即
i
? 不存在一阶自回归;
0:
1
??H, 即
i
? 存在一阶自回归
并构如下造统计量:
D W
e e
e
i i
i
n
i
i
n
.,
(
~ ~
)
~
?
?
?
?
?
?
?
1
2
2
2
1
( 2, 5, 5 )
? D.W.统计量
? 该统计量 的分布与出现在给定样本中的 X值有
复杂的关系,因此其 精确的分布很难得到 。
? 但是, Durbin和 Watson成功地导出了临界值的
下限 dL和上限 dU,且这些上下限只与样本的容
量 n和解释变量的个数 k有关,而与解释变量 X
的取值无关。
? 检验步骤
①计算该统计量的值,
②根据样本容量 n和解释变量数目 k查 D.W.分
布表,得到临界值 dL和 dU,
③按照下列准则考察计算得到的 D.W.值,以判
断模型的自相关状态。
若 0< D,W,< d l 则存在正自相关
d l < D,W,< d u 不能确定
d u < D,W,< 4 - d u 无自相关
4 - d u < D,W,< 4 - d l 不能确定
4 -
d
l < D,W,< 4 存在负自相关
? 可以看出,当 D.W.值在 2左右时,模型不存在
一阶自相关。
证明,展开 D, W, 统计量:
D W
e e e e
e
i i i i
i
n
i
n
i
n
i
i
n
.,
~ ~ ~ ~
~
?
? ?
? ?
???
?
???
?
2
1
2
1
222
2
1
2
( 2, 5, 6 )当 n 较大时,~,~,~e e e
i
i
n
i
i
n
i
i
n
2
2
1
2
2
2
1?
?
? ?
? ? ? 大致相等,则 ( 2, 5, 6 ) 可以化简为:
)1(2)
~
~~
1(2..
1
2
2
1
?????
?
?
?
?
?
n
i
i
n
i
ii
e
ee
WD
式中,
??? ????
??
?
??
?
n
i
i
n
i
ii
n
i
i
n
i
ii
eeeeee
2
2
2
1
1
2
2
1
~~~~~~
为一阶自相关模型
ttt
???? ??
? 1
11 ??? ?
的参数估计,
如果存在完全一阶正相关, 即
?=1,则 D.W.? 0
如果存在完全一阶负相关, 即
?= -1,则 D.W.? 4
如果完全不相关, 即
?=0,则 D.W.?2
( 1) 从判断准则看到, 存在一个不能确定的
D.W.值区域, 这是这种检验方法的一大缺陷 。
( 2) D.W.检验虽然只能检验一阶自相关, 但在
实际计量经济学问题中, 一阶自相关是出现最多
的一类序列相关;
( 3) 经验表明, 如果不存在一阶自相关, 一般
也不存在高阶序列相关 。
所以在实际应用中, 对于序列相关问题一般只
进行 D.W.检验 。
?注意:
四、具有序列相关性模型的估计
? 如果模型被检验证明存在序列相关性,
则需要发展新的方法估计模型。
? 最常用的方法是 广义最小二乘法 ( GLS,
Generalized least squares),一阶差分
法 ( First-Order Difference)和 广义差分
法 (Generalized Difference)。
1,广义最小二乘法
? 对于模型
Y=XB+N (2.5.7)
如果存在序列相关, 同时存在异方差, 即有
E
C o v E
w w w
w w w
w w w
n
n
n n n
( )
( ) ( )
?
? ? ? ? ?
?
?
? ? ? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
2
1 12 1
21 2 2
1 2
?
?
?
?
?
? 设 ?=DD’
用 D-1左乘 (2.5.7)两边, 得到一个新的模型:
D-1 Y=D-1 XB+D-1 N (2.5.8)
即 Y*=X*B+N*
该模型具有同方差性和随机误差项互相独立性 。
E E( ) ( )* *? ? ? ?? ? ? ?? ?D D1 1? ?
?
?
?
? ?
?
?
? ?
? ?
? ?
D D
D WD
D D D D
I
1 1
1 2 1
1 2 1
2
E ( )? ?
?
?
?
? 于是,可以用 OLS法估计模型 (2.5.8),得
? ( )* * * *? ? ? ??X X X Y1
YΩXXΩX
YDDXXDDX
111
11111
)(
)(
???
?????
???
?
?
?
?? ( 2.5.9)
? 这就是原模型 (2.5.7)的 广义最小二乘估计量 (GLS
estimators),是无偏的、有效的估计量。
? 如何得到矩阵 ??
仍然是对原模型 (2.5.7)首先采用普通最小二乘
法, 得到随机误差项的 近似估计量, 以此构成矩
阵的估计量 ?,即
?
~ ~ ~ ~ ~
~ ~ ~ ~ ~
~ ~ ~ ~ ~
? ?
?
?
?
?
?
?
?
?
?
?
?
?
e e e e e
e e e e e
e e e e e
n
n
n n n
1
2
1 2 1
2 1 2
2
2
1 2
2
?
?
?
?
? 可行的广义最小二乘法 ( FGLS,Feasible
Generalized Least Squares)
文献中常见的术语
如果能够找到一种方法,求得到 Ω的估计量,
使得 GLS能够实现,都称为 FGLS
前面提出的方法,就是 FGLS
2、一阶差分法
一阶差分法是将原模型
iii XY ??? ??? 10 i = 1,2,?,n
变换为
11 ?
?????
iiii
XY ???
i = 2,?,n ( 2, 5,1 0 )
其中
?
1?
???
iii
YYY
? 即使对于非完全一阶正相关的情况,只要存在
一定程度的一阶正相关,差分模型就可以有效地
加以克服。
? 如果原模型存在完全一阶正自相关, 即在
?i=??i-1+?i
中, ?=1。 (2.5.10)可变换为:
?Yi= ?1?Xi+?I
由于 ?i不存在序列相关,该差分模型满足应用 OLS
法的基本假设,用 OLS法估计可得到原模型参数的
无偏的、有效的估计量。
3、广义差分法
模型 (2.5.12)为 广义差分模型,该模型不存在序列
相关问题。采用 OLS法估计可以得到原模型参数的
无偏、有效的估计量。
广义差分法 可以克服所有类型的序列相关带来的
问题,一阶差分法是它的一个特例。
如果原模型存在:
? ? ? ? ? ? ? ?i i i l i l i? ? ? ? ?? ? ?1 1 2 2 ? ( 2, 5,1 1)
可以将原模型变换为:
ililiillilii XXXYYY ????????? ???????????? ???? )()1( 1111011 ???
i l l n? ? ?1 2,,,?
( 2, 5, 1 2 )
4、随机误差项相关系数 ?的估计
? 应用广义差分法, 必须已知不同样本点之间随机
误差项的相关系数 ?1,?2,…,?l 。 实际上, 人们并
不知道它们的具体数值, 所以必须首先对它们进行
估计 。
? 常用的方法有:
( 1) 科克伦 -奥科特 ( Cochrane-Orcutt) 迭代法 。
( 2)杜宾( durbin)两步法
( 1)科克伦 -奥科特迭代法
首先,采用 OLS法估计原模型
Yi=?0+?1Xi+?i
得到的随机误差项的“近似估计值”,并以之作
为观测值采用 OLS法估计下式
?i=?1?i-1+?2?i-2+??L?i-L+?i
得到 ?,?,,?? ? ?1 2 ? l,作为随机误差项的相关系
数 ? ? ?1 2,,,? l 的 第一次估计值 。
其次,将上述 ?,?,,?? ? ?1 2 ? l 代入广义差分模型
ililiillilii
XXXYYY ????????? ????????????
????
)()1(
1111011
???
i l l n? ? ?1 2,,,?
并对之进行 O L S 估计,得到 0
??
?, 1
??
? 。
再次,将
0
?
?
?,
1
?
?
? 代回原模型,计算出原模型随机误
差项的新的,近拟估计值”,并以之作为模型
? ? ? ? ? ? ? ?
i i i l i l i
? ? ? ? ?
? ? ?1 1 2 2
?
的样本观测值,采用 O L S 法估计该方程,得到
l
???
?
?,,
?
?,
?
?
21
?,作为相关系数 ? ? ?1 2,,,? l 的 第二次估计值 。
类似地,可进行第三次、第四次迭代。
? 关于迭代的次数, 可根据具体的问题来定 。
? 一般是事先给出一个精度, 当相邻两次 ?1,?2,
?,?L的估计值之差小于这一精度时, 迭代终止 。
? 实践中, 有时只要迭代两次, 就可得到较满意
的结果 。 两次迭代过程也被称为 科克伦 -奥科特
两步法 。
( 2)杜宾 ( durbin) 两步法
该方法仍是先估计 ?1,?2,?,?L,再对差分
模型进行估计。 第一步,变换差分模型为下列形式:
ililiillilii XXXYYY ????????? ???????????? ???? )()1( 1111011 ???
i l l n? ? ?1 2,,,?
( 2, 5, 13 )
采用 O L S 法估计该方程,得各 ),2,1( liiijY j ???? ? 前的
系数 ? ? ?1 2,,,? l 的估计值 l??? ?,,?,? 21 ? 。
第二步,将估计的 l??? ?,,?,? 21 ? 代入差分模型
ililiillilii XXXYYY ????????? ???????????? ???? )()1( 1111011 ???
i l l n? ? ?1 2,,,?
采用 O L S 法估计,得到参数 110 ),??1( ???? l??? ? 的
估计量,记为
*
0
??, *
1
?? 。
于是:
)??1(?? 1*00 l???? ???? ?, *11 ?? ?? ?
5、应用软件中的广义差分法
? 在 Eview/TSP软件包下,广义差分采用了科克
伦 -奥科特( Cochrane-Orcutt)迭代法估计 ?。
? 在解释变量中引入 AR(1),AR(2),…, 即可得
到参数和 ρ1,ρ2,… 的估计值。 其中 AR(m)表示
随机误差项的 m阶自回归。在估计过程中自动
完成了 ρ1,ρ2,… 的迭代,
6、虚假序列相关问题
? 由于随机项的序列相关往往是在模型设定中遗
漏了重要的解释变量或对模型的函数形式设定有
误,这种情形可称为 虚假序列相关,应在模型设
定中排除。
? 避免产生虚假序列相关性的措施是在开始时建
立一个“一般”的模型,然后逐渐剔除确实不显
著的变量。
五、案例,地区商品出口模型
单位:万元
年份 出口
Y
国内生产总值
X
年份 出口
Y
国内生产总值
X
1967 4010 2 2 4 1 8 1977 5628 2 9 0 9 1
1968 3711 2 2 3 0 8 1978 5736 2 9 4 5 0
1969 4004 2 3 3 1 9 1979 5946 3 0 7 0 5
1970 4151 2 4 1 8 0 1980 6501 3 2 3 7 2
1971 4569 2 4 8 9 3 1981 6549 3 3 1 5 2
1972 4582 2 5 3 1 0 1982 6705 3 3 7 6 4
1973 4697 2 5 7 9 9 1983 7104 3 4 4 1 1
1974 4753 2 5 8 8 6 1984 7609 3 5 4 2 9
1975 5062 2 6 8 6 8 1985 8100 3 6 2 0 0
1976 5669 2 8 1 3 4
1、某地区商品出口总值与国内生产总值的数据
2、序列相关性检验
( 1)图示法检验
( 2) D.W.检验
在 5%在显著性水平下, n=19,k=2(包含常数
项 ),查表得 dL=1.18,dU=1.40,
由于 DW=0.9505<dL,故存在正自相关 。
回归结果:
tt XY 28.083.2 5 3 1
? ???
( - 9, 3 4 ) ( 3 0, 1 1 )
r
2
= 0.981 6,R
2
= 0.980 5 D,W,= 0.950 5
3、自相关的处理
⑴ 一阶差分法
ttt XY ????? 3185.0
?
( 6,8 0 9 8 )
R2=0.4971,D.W.=1.8842
由于 DW>du=1.39(注:样本容量为 18个 ),已不
存在自相关。
⑵ 广义差分法
① 采用杜宾两步法估计 ?
1 )估计模型
11
*
2
*
11
*
0 ???
?????
ttttt
XXYY ?????
得:
11
21 09.033 48.059 39.079.13 34
?
??
?????
tttt
XXYY
( -1, 86 ) (2,0 1 ) (3,4 1 ) (- 1,5 3 )
r
2
= 0,9 8 6 2,R
2
= 0,9 8 3 2,D,W,= 1,6 2 8 2
由于 DW>=1.39(注:样本容量为 19-1=18个 ),已
不存在自相关。
2 ) 将 ?
?
=0,5 9 3 9 代入差分模型
ttttt XXYY ??? ????? ?? )5939.0(5939.0 1
*
1
*
01
O L S 法估计得:
ttttt
XXYY ???????
??
)5 9 3 9.0(3 0 8 3.001.1 3 5 15 9 3 9.0
11
( -5,5 3 ) (1 5,5 8 )
r
2
= 0,9 3 8 2,R
2
= 0,9 3 4 3,D,W,= 1,6 5 7 0
② 采用科克伦 -奥科特迭代法估计 ?
一阶广义差分的结果:
]1[6 0 4 0.03 0 9 2.072.3 3 5 4? ARXY tt ????
( - 3, 3 3 0 ) ( 9, 4 1 7 ) ( 2, 1 2 2 )
r 2 = 0, 9 8 6 1,R 2 = 0, 9 8 4 2,D, W, = 1, 6 7 1 5
由于 DW>du=1.39(注:样本容量为 18个 ),已
不存在自相关。
二阶广义差分的结果:
由于 DW>du=1.38(注:样本容量为 19-2=17个 ),
已不存在自相关 。
但由于 AR[2]前的系数的 t值为 -0.15,在 5%的显
著性水平下并不显著, 说明随机干扰项不存在二
阶序列相关性, 模型中应去掉 AR[2]项 。
]2[0 5 4 2.0]1[6 7 1 3.03 0 2 5.094.3 1 3 1? ARARXY tt ?????
( - 2, 4 1 ) ( 7, 0 6 ) ( 2, 0 7 ) ( - 0, 1 5 )
r 2 = 0, 9 8 44,R 2 = 0, 9 8 08,D, W, = 1, 841 1