第七章 时间序列分析
(Time Series Analysis)
第一节 时间序列分析的基本概念
经济分析通常假定所研究的经济理论中涉及的
变量之间存在着长期均衡关系 。 按照这一假定, 在
估计这些长期关系时, 计量经济分析假定所涉及的
变量的均值和方差是常数, 不随时间而变 。
然而, 经验研究表明, 在大多数情况下, 时间
序列变量并不满足这一假设, 从而产生所谓的, 伪
回归, 问题 (‘spurious’ regression problem)。
为解决这类问题,研究人员提出了不少对传统
估计方法的改进建议,其中最重要的两项是对变量
的 非平稳性 (non-stationarity) 的系统性检验 和协整
(cointegration)。
协整
协整分析被认为是上世纪八十年代中期以来计量
经济学领域最具革命性的进展 。 简单地说, 协整分
析涉及的是一组变量, 它们各自都是不平稳的 ( 含
义是随时间的推移而上行或下行 ), 但它们一起漂
移 。 这种变量的共同漂移使得这些变量之间存在长
期的线性关系, 因而使人们能够研究经济变量间的
长期均衡关系 。 如果这些长时间内的线性关系不成
立, 则对应的变量被称为是, 非协整的, (not
cointegrated)。
误差修正模型
一般说来,协整分析是用于非平稳变量组成的关
系式中长期均衡参数估计的技术。它是用于动态模
型的设定、估计和检验的一种新技术。
此外,协整分析亦可用于短期或非均衡参数的估
计,这是因为短期参数的估计可以通过协整方法使
用长期参数估计值,采用的模型是 误差修正模型
(error correction model)。
在介绍上述方法之前,下面先介绍所涉及的一些
术语和定义。
一, 平稳性 ( Stationarity)
1,严格平稳性 (strict stationarity)
如果一个时间序列 Xt的联合概率分布不随时间而
变, 即对于任何 n和 k,X1,X2,…, Xn的联合概率分布
与 X1+k,X2+k,… Xn+k 的联合分布相同, 则称该时间序列
是严格平稳的 。
2,弱平稳性 (weak stationarity)
由于在实践中上述联合概率分布很难确定, 我们用
随机变量 Xt( t=1,2,… ) 的均值, 方差和协方差代替之 。
一个时间序列是, 弱平稳的,, 如果:
( 1) 均值 E(Xt) =μ,t=1,2,… ( 7.1)
( 2 ) 方差 Var(Xt) = E(Xt -μ)2 =ζ2,t =1,2,… ( 7.2)
( 3) 协方差
Cov(Xt,Xt+k) = E [(Xt -μ)(Xt+k -μ)]= rk,
t=1,2,…, k≠0 ( 7.3)
3,平稳性和非平稳性
通常情况下, 我们所说的平稳性指的就是弱平稳性 。
一般来说, 如果一个时间序列的均值和方差在任何时间
保持恒定, 并且两个时期 t和 t+k之间的协方差仅依赖于
两时期之间的距离 ( 间隔或滞后 ) k,而与计算这些协
方差的实际时期 t无关, 则该时间序列是平稳的 。
只要这三个条件不全满足, 则该时间序列是非平稳的 。
事实上, 大多数经济时间序列是非平稳的 。 例如, 在图
7.1中, 某国的私人消费 ( CP) 和个人可支配收入 ( PDI)
这两个时间序列都有一种向上的趋势, 几乎可以断定它
们不满足平稳性条件 ( 7.1), 因而是非平稳的 。
í? 7, 1 ?3 ?ú ?? è? ?? ?? 1í ·? è? ?é ?§?? ê? è? £? 1 9 6 0 ?a 1 9 9 5 ?ê ?è êy ?Y
μ¥ ?o £1 ?ù íò ?? ?a £¨1 9 7 0 ?ê 2o a? ?? £?
100000
200000
300000
400000
500000
600000
1960 1965 1970 1975 1980 1985 1990 1995
CP
PDI
二, 几种有用的时间序列模型
1,白噪声 ( Whitenoise)
白噪声通常用 εt表示, 是一个纯粹的随机过程, 满
足,
( 1) E(εt) = 0,对所有 t成立;
( 2) V ar(εt) = ζ2,对所有 t成立;
( 3) Cov (εt,εt+k) = 0,对所有 t和 k≠0成立。
白噪声可用符号表示为:
εt~ IID(0,ζ2) ( 7.4)
注:这里 IID为 Independently Identically Distributed(独立同分
布 )的缩写。
2,随机漫步 ( Randomwalk)
随机漫步是一个简单随机过程, 由下式确定:
Xt = Xt- 1+εt ( 7.5)
其中 εt为白噪声 。
Xt的均值:
E(Xt) = E(Xt-1+εt) = E(Xt- 1) + E(εt) = E(Xt- 1)
这表明 Xt的均值不随时间而变 。
为求 Xt的方差, 对 ( 7.5) 式进行一系列置换:
Xt = Xt- 1+εt
= Xt- 2+εt-1+εt
= Xt- 3+εt-2+εt-1+εt
=……
= X0+ε1+ε2+…… +εt
= X0+∑εt
其中 X0是 Xt的初始值, 可假定为任何常数或取初
值为 0,则
2
11
0 )()()(
?
??
t
V a rXV a rXV a r
t
t
t
t
t
tt
?
??? ??
??
这表明 Xt的方差随时间而增大,平稳性的第二个条
件( 7.2)不满足,因此,随机漫步时间序列是非平
稳时间序列。可是,若将( 7.5)式写成一阶差分形
式:
ΔXt=εt ( 7.6)
这个一阶差分新变量 ΔXt是平稳的,因为它就等
于白燥声 εt,而后者是平稳时间序列。
3,带漂移项的随机漫步 (Random walk with drift)
Xt=μ+Xt- 1+εt ( 7.7)
其中 μ是一非 0常数, εt为白燥声 。
μ之所以被称为, 漂移项,, 是因为 ( 7.7) 式的
一阶差分为
ΔXt = Xt- Xt-1=μ+εt
这表明时间序列 Xt向上或向下漂移, 取决于 μ的符
号是正还是负 。 显然, 带漂移项的随机漫步时间序
列也是非平稳时间序列 。
4,自回归过程
随机漫步过程 ( 7.5) ( Xt = Xt- 1+εt) 是最简单的
非平稳过程 。 它是
Xt=θXt- 1+εt ( 7.8)
的特例, ( 7.8) 称为一阶自回归过程 ( AR(1)),
该过程在- 1< θ< 1时是平稳的, 其他情况下, 则为
非平稳过程 。
更一般地,( 7.8)式又是
Xt=θ1Xt- 1+θ2Xt- 2+……+θ qXt-q+εt ( 7.9)
的特例,( 7.9)称为 q阶自回归过程( AR(q))。
可以证明,如果特征方程
1- θ1L- θ2L2- θ3L3- …… - θqLq = 0 ( 7.10)
的所有根的绝对值均大于 1,则此过程( 7.9)是平稳
的,否则为非平稳过程。
三, 单整的时间序列 ( Integrated series)
从 ( 7.6) 可知, 随机漫步序列的一阶差分序列
ΔXt = Xt- Xt-1是平稳序列 。 在这种情况下, 我们说原
非平稳序列 Xt是, 一阶单整的,, 表示为 I(1)。 与此
类似, 若非平稳序列必须取二阶差分 (Δ2Xt=ΔXt- ΔXt-
1)才变为平稳序列, 则原序列是, 二阶单整的,, 表
示为 I(2)。 一般地, 若一个非平稳序列必须取 d阶差分
才变为平稳序列, 则原序列是, d 阶单整
的, (Integrated of order d),表示为 I(d)。
由定义不难看出, I(0) 表示的是平稳序列, 意味着
该序列无需差分即是平稳的 。 另一方面, 如果一个序
列不管差分多少次, 也不能变为平稳序列, 则称为
,非单整的, 。
第二节 平稳性的检验
平稳性检验的方法可分为两类:传统方法和现代方
法 。 前者使用自相关函数 (Autocorrelation function),
后者使用单位根 (Unit roots)。 单位根方法是目前最常
用的方法, 因此本节中, 我们仅介绍单位根方法 。
一,单位根
考察( 7.8)式的一阶自回归过程,即
Xt=θXt- 1+εt ( 7.11)
其中 εt为白噪声,此过程可写成
Xt- θXt- 1=εt 或( 1- θL) Xt = εt ( 7.12)
其中 L为滞后运算符,其作用是取时间序列的滞后,
如 Xt 的一期滞后可表示为 L(Xt),即
L(Xt) = Xt- 1
Xt平稳的条件是特征方程 1- ΦL=0的根的绝对值大
于 1。方程 (7.12) 仅有一个根 L=1/θ,因而平稳性要
求- 1< θ< 1。
检验 Xt的平稳性的原假设和备择假设为:
H0,∣ θ∣ ≥1
Ha,∣ θ∣ < 1
接受原假设 H0表明 Xt是非平稳序列,而拒绝原假
设(即接受备择假设 Ha)则表明 Xt是平稳序列。
在 Φ=1的情况下, 即若原假设为真, 则 ( 7.11) 就
是随机漫步过程 ( 7.5), 从上节得知, 它是非平稳
的 。 因此, 检验非平稳性就是检验 Φ=1,或者说,
就是检验单位根 。 换句话说, 单位根是表示非平稳
性的另一方式 。 这样一来, 就将对非平稳性的检验
转化为对单位根的检验, 这就是单位根检验方法的
由来 。 一般来说, Xt的任何自回归模型可以用滞后
运算符 L写成
A(L)Xt =εt
其中 A(L)是 L的一个多项式 。 如果 A(L)的一个根
是 ( 1- L), 则 Xt有一个单位根 。
( 7.11) 式两端各减去 Xt-1,我们得到
Xt- Xt- 1= ΦXt- 1- Xt- 1+εt
即 ΔXt= δXt- 1+εt ( 7.13)
其中 Δ是差分运算符, δ=Φ- 1。
假设 Φ为正 ( 绝大多数经济时间序列确实如此 ),
前面的假设可写成如下等价形式:
H0,δ≥0
Ha,δ< 0
在 δ=0的情况下,即若原假设为真,则相应的过程
是非平稳的。换句话说,非平稳性或单位根问题,可
表示为 Φ=1或 δ=0。从而我们可以将检验时间序列 Xt的
非平稳性的问题简化成在方程( 7.11)的回归中,检
验参数 Φ=1 是否成立或者在方程( 7.13)的回归中,
检验参数 δ=0是否成立。
这类检验可分别用两个 t检验进行:
tΦ= 或 tδ= ( 7.14)
其中, 和 分别为参数估计值 和 的标准误差,
即 = Se( ),= Se( )。
这里的问题是,( 7.14)式计算的 t值不服从 t分布,
而是服从一个非标准的甚至是非对称的分布。因而
不能使用 t分布表,需要用另外的分布表。
?
??
Φ
1?
S
?
?
?
S
?
?ΦS
??S
?? ??
???ΦS ?
?S ??
二, Dickey-Fuller检验 ( DF检验 )
迪奇 ( Dickey) 和福勒 ( Fuller) 以蒙特卡罗模拟
为基础, 编制了 ( 7.14) 中 tδ统计量的临界值表, 表中
所列已非传统的 t统计值, 他们称之为 η统计量 。 这些
临界值如表 7.1所示 。 后来该表由麦金农 ( Mackinnon)
通过蒙特卡罗模拟法加以扩充 。
将表 7.1中临界值与标准 t分布表中临界值相比较 ( 按
绝对值比 ), η值要比相应的 t值大得多 。
表 7.1 D i c ke y - F ul l e r τ 统计量临界值表
取更小值的概率
样本容量 0,01 0,02 5 0,05 0,1 0 0,9 0 0,95 0,97 5 0,99
无常数项
无时间项
( 统计量 τ )
25 - 2,66 - 2,26 - 1,95 - 1,60 0,92 1,33 1,71 2,16
50 - 2,62 - 2,25 - 1,95 - 1,61 0,91 1,31 1,66 2,08
100 - 2,60 - 2,24 - 1,95 - 1,61 0,90 1,29 1,64 2,03
250 - 2,58 - 2,23 - 1,95 - 1,62 0,89 1,29 1,63 2,01
500 - 2,58 - 2,23 - 1,95 - 1,62 0,89 1,28 1,62 2,00
∞ - 2,58 - 2,23 - 1,95 - 1,62 0,89 1,28 1,62 2,00
有常数项
无时间项
( 统计量 τ
μ
)
25 - 3,75 - 3,33 - 3,00 - 2,62 - 0,37 0,00 0,34 0,72
50 - 3,58 - 3,22 - 2,93 - 2,60 - 0,40 - 0,03 0,29 0,66
100 - 3,51 - 3,17 - 2,89 - 2,58 - 0,42 - 0,05 0,26 0,63
250 - 3,46 - 3,14 - 2,88 - 2,57 - 0,42 - 0,06 0,24 0,62
500 - 3,44 - 3,13 - 2,87 - 2,57 - 0,43 - 0,07 0,24 0,61
∞ - 3,43 - 3,12 - 2,86 - 2,57 - 0,44 - 0,07 0,23 0,60
有常数项
有时间项
( 统计量 τ
τ
)
25 - 4,38 - 3,95 - 3,60 - 3,24 - 1,14 - 0,80 - 0,50 - 0,15
50 - 4,15 - 3,80 - 3,50 - 3,18 - 1,19 - 0,87 - 0,58 - 0,24
100 - 4,04 - 3,73 - 3,45 - 3,15 - 1,22 - 0,90 - 0,62 - 0,28
250 - 3,99 - 3,69 - 3,43 - 3,13 - 1,23 - 0,92 - 0,64 - 0,31
500 - 3,98 - 3,68 - 3,42 - 3,13 - 1,24 - 0,93 - 0,65 - 0,32
∞ - 3,96 - 3,66 - 3,41 - 3,12 - 1,25 - 0,94 - 0,66 - 0,33
有了 η表, 我们就可以进行 DF检验了, DF检验按以
下两步进行:
第一步:对 ( 7.13) 式执行 OLS回归, 即估计
△ Xt=δXt-1+εt ( 7.15)
得到常规 tδ值 。
第二步:检验假设
H0,δ= 0
Ha,δ< 0
用上一步得到的 tδ值与表 7.1中查到的 η临界值比较,
判别准则是:
若 tδ>η,则接受原假设 H0,即 Xt非平稳 。
若 tδ < τ, 则拒绝原假设 H0,Xt为平稳序列 。
Dickey和 Fuller注意到 τ 临界值依赖于回归方程
的类型 。 因此他们同时还编制了与另外两种类型方
程中相对应的 τ 统计表, 这两类方程是:
△ Xt=α +δ Xt-1+ε t ( 7.16)

△ Xt=α +β t+δ Xt-1+ε t ( 7.17)
二者的 τ 临界值分别记为 τ μ 和 τ T。 这些临界值
亦列在表 7.1中 。 尽管三种方程的 τ 临界值有所不同,
但有关时间序列平稳性的检验依赖的是 Xt-1的系数 δ,
而与 α, β 无关 。
例 7.1 检验某国私人消费时间序列的平稳性 。
表 7.2 某国私人消费和 个人可支配收入 ( 197 0 百万美元 )
年份 私人消费 个人可支配收入 消费价格指数
1960 107 808, 0 1 171 79,2 0,783 142
1961 1 151 47,0 127 598, 9 0,791 684
1962 120 050, 0 135 007, 1 0,801 758
1963 126 1 15,0 142 128, 3 0,828 688
1964 137 192, 0 159 648, 7 0,847 185
1965 147 707, 0 172 755, 9 0,885 828
1966 157 687, 0 182 365, 5 0,916 505
1967 167 528, 0 195 61 1,0 0,934 232
1968 179 025, 0 204 470, 4 0,941 193
1969 190 089, 0 222 637, 5 0,969 630
1970 206 813, 0 246 819, 0 1,000 000
1971 217 212, 0 269 248, 9 1,033 727
1972 232 312, 0 297 266, 0 1,068 064
1973 250 057, 0 335 521, 7 1,228 156
1974 251 650, 0 310 231, 1 1,517 795
1975 266 884, 0 327 521, 3 1,701 147
1976 281 066, 0 350 427, 4 1,929 906
1977 293 928, 0 366 730, 0 2,159 872
1978 310 640, 0 390 188, 5 2,436 364
1979 318 817, 0 406 857, 2 2,838 453
1980 319 341, 0 401 942, 8 3,459 030
1981 325 851, 0 419 669, 1 4,081 844
1982 338 507, 0 421 715, 6 5,1 141 69
1983 339 425, 0 417 930, 3 6,067 835
1984 345 194, 0 434 695, 7 7,130 602
1985 358 671, 0 456 576, 2 8,435 285
1986 361 026, 0 439 654, 1 10,300 810
1987 365 473, 0 438 453, 5 1 1,919 500
1988 378 488, 0 476 344, 7 13,614 480
1989 394 942, 0 492 334, 4 15,592 850
1990 403 194, 0 495 939, 2 18,595 390
1991 412 458, 0 513 173, 0 22,091 160
1992 420 028, 0 502 520, 1 25,401 220
1993 420 585, 0 523 066, 1 28,883 460
1994 426 893, 0 520 727, 5 32,003 850
1995 433 723, 0 518 406, 9 34,980 850
用表 7.2中的私人消费 ( Ct) 时间序列数据, 估计与 ( 7.16)
和 ( 7.17) 相对应的方程, 分别得到如下估计结果:
(1) △ =12330.48-0.01091 Ct-1 R2=0.052
(t:) (5.138) (-1.339) DW=1.765
(2) △ =15630.83+346.4522t-0.04536Ct-1 R2=0.057
(t:) (1.966) (0.436) (-0.5717) DW=1.716
两种情况下, tδ 值分别为 -1.339和 -0.571,二者分别大
于表 7.1中从 0.01到 0.10的各种显著性水平下的 τ μ 值和 τ τ 值 。
因此, 两种情况下都不能拒绝原假设, 即私人消费时间序列有
一个单位根, 或换句话说, 它是非平稳序列 。
?
tC
?
tC
下面看一下该序列的一阶差分 ( △ Ct) 的平稳性 。 做类似于上
面的回归, 得到如下结果:
(3) △ 2 = 7972.671-0.85112△ Ct-1 R2=0.425
(t:) (4.301) (-4.862) DW=1.967
(4) △ 2 =10524.35-114.461t-0.89738△ Ct-1 R2=0.454
(t:) (3.908) (-1.294) (-5.073) DW=1.988
其中 △ 2Ct=△ Ct-△ Ct-1。 两种情况下, tδ 值分别为 -4.862和
-5.073,二者分别小于表 7.1中从 0.01到 0.10的各种显著性水平
下的 τ μ 值和 τ T值 。 因此, 都拒绝原假设, 即私人消费一阶差
分时间序列没有单位根, 或者说该序列是平稳序列 。
综合以上结果, 我们的结论是:
△ Ct是平稳序列, △ Ct~ I(0) 。
而 Ct是非平稳序列, 由于 △ Ct~ I(0), 因而 Ct~ I(1) 。
?
tC
?
tC
第三节 协整
让我们考察弗里德曼的持久收入假设:私人总消费 ( Ct) 是
持久私人消费和暂时性私人消费 ( εt) 之和, 持久私人消费与
持久个人可支配收入 ( Yt) 成正比 。 则消费函数为:
(7.18)
其中 0< β1≤1。
用表 7.2中数据对此消费函数进行 OLS估计, 假定持久个人
收入等于个人可支配收入, 我们得到:
= 0.80969Yt R2=0.9924
(t:) (75.5662) DW=0.8667
tttPtt YcC ??? ???? 1
?
tC
除 DW值低以外,估计结果很好。 t值很高表明回归
系数显著,R2也很高,表明拟合很好。可是,由于方
程中的两个时间序列是趋势时间序列或非平稳时间序
列,因此这一估计结果有可能形成误导。结果是,
OLS估计量不是一致估计量,相应的常规推断程序不
正确。
这种结果看上去非常好但涉及的变量是趋势时间序
列的回归被 Granger 和 Newbold 称为“伪回归”
(Spurious regression)。
事实上,他们指出,如果在时间序列的回归中
DW值低而 R2高,则应怀疑有伪回归的可能。我们
上面的结果正是如此( R2 = 0.9924 > DW = 0.8667)。
考虑到经济学中大多数时间序列是非平稳序列,
则我们得到伪回归结果是常见的事。避免非平稳性
问题的常用方法是在回归中使用时间序列的一阶差
分。可是,使用变量为差分形式的关系式更适合描
述所研究的经济现象的短期状态或非均衡状态,而
不是其长期或均衡状态,描述所研究经济现象的长
期或均衡状态应采用变量本身。
由上面的讨论, 自然引出了一个明显的问题:我们
使用非均衡时间序列时是否必定会造成伪回归?
对此问题的回答是, 如果在一个回归中涉及的趋势
时间序列, 一起漂移,, 或者说, 同步,, 则可能没
有伪回归的问题, 因而取决于 t检验和 F检验的推断也
没有问题 。 这种非均衡时间序列的, 同步,, 引出了
我们下面要介绍的, 协整, 概念 。
一, 协整的概念
在方程 ( 7.18) 中, 持久收入假设要求两时间序列
Ct和 Yt的线性组合, 即时间序列 Ct- β1Yt必须是平稳
的, 这是因为此序列等于 εt,而暂时性私人消费 ( εt)
按定义是平稳时间序列 。
可是, Ct和 Yt都是非平稳时间序列, 事实上, 不难
验证,Ct~ I(1), Yt~ I(1) 。
也就是说, 尽管 Ct~ I(1), Yt~ I(1), 但持久收
入假设要求它们的线性组合 εt=Ct- β1Yt是平稳的, 即
εt=Ct- β1Yt~ I (0) 。 在这种情况下, 我们说时间序
列 Ct 和 Yt 是协整的 (Cointegrated) 。 下面给出协整
(Cointegration)的正式定义 。
定义:如果两时间序列 Yt~ I(d),Xt~ I(d),并且这两
个时间序列的线性组合 a1Yt+a2Xt 是 (d-b)阶单整的,即
a1Yt+a2Xt~ I(d-b)( d≥b≥0),则 Yt 和 Xt被称为是( d,
b)阶协整的。记为 Yt,Xt~ CI(d,b)这里 CI是协整的
符号。构成两变量线性组合的系数向量( a1,a2)称为
“协整向量”。
下面给出本节中要研究的两个特例 。
1,Yt,Xt~ CI(d,d)
在这种情况下, d=b,使得 a1Yt+a2Xt~ I(0), 即两时
间序列的线性组合是平稳的, 因而 Yt,Xt~ CI(d,d) 。
2,Yt,Xt~ CI(1,1)
在这种情况下, d=b=1,同样有 a1Yt+a2Xt~ I(0),即两
时间序列的线性组合是平稳的, 因而 Yt,Xt~ CI(1,1) 。
让我们考虑下面的关系
Yt = β0+β1Xt ( 7.19)
其中, Yt~ I(1), Xt~ I(1) 。
当 0= Yt- β0- β1Xt时, 该关系处于长期均衡状态 。
对长期均衡的偏离, 称为, 均衡误差,, 记为 εt:
εt = Yt- β0- β1Xt
若长期均衡存在, 则均衡误差应当围绕均衡值 0波动 。
也就是说, 均衡误差 εt应当是一个平稳时间序列, 即应
有 εt~ I(0), E(εt) = 0。 按照协整的定义, 由于
Yt~ I(1), Xt~ I(1), 且线性组合
εt=Yt- β0- β1Xt~ I(0), 我们可以说 Yt 和 Xt是
( 1,1) 阶协整的, 即 Yt,Xt~ CI(1,1), 协整向量是
( 1,- β0,- β1)
综合以上结果, 我们可以说, 两时间序列之间的协
整是表示它们之间存在长期均衡关系的另一种方式 。
因此, 若 Yt 和 Xt是协整的,并且均衡误差是平稳的且具
有零均值, 我们就可以确信, 方程
Yt=β0+β1Xt+εt ( 7.20)
将不会产生伪回归结果 。
Stock证明了对于大样本, 方程 ( 7.20) 的 OLS估计
量是, 超一致, 估计量, 即它是一致估计量, 并且非
常有效, 因为它向回归系数真值的收敛速度比涉及平
稳变量的 OLS估计量要快 。 但对于小样本, OLS估计
量是有偏的, 偏倚的水平依赖于 R2的值, R2越高, 偏
倚的水平越低 。
由上可知, 如果我们想避免伪回归问题, 就应该在
进行回归之前检验一下所涉及的变量是否协整 。
二, 协整的检验
我们下面介绍用于检验两变量之间协整的两种简
单方法 。
1,Engle-Granger法
步骤 1.
用上一节介绍的单位根方法求出两变量的单整的阶,
然后分情况处理,共有三种情况:
( 1) 若两变量的单整的阶相同, 进入下一步;
( 2) 若两变量的单整的阶不同,则两变量不是协整
的;
( 3) 若两变量是平稳的,则整个检验过程停止,因
为你可以采用标准回归技术处理。
步骤 2.
若两变量是同阶单整的, 如 I(1), 则用 OLS法估计
长期均衡方程 ( 称为协整回归 ),
Yt=β0+β1Xt+εt
并保存残差 et,作为均衡误差 εt的估计值 。
应注意的是, 虽然估计出的协整向量 ( 1,-,
- ) 是真实协整向量 ( 1,- β0,- β1) 的一致估计
值, 这些系数的标准误差估计值则不是一致估计值 。
由于这一原因, 标准误差估计值通常不在协整回归的
结果中提供 。
?
0?
?
1?
步骤 3.
对于两个协整变量来说, 均衡误差必须是平稳的 。
为检验其平稳性, 对上一步保存的均衡误差估计值
( 即协整回归的残差 et) 应用单位根方法 。 具体作法
是将 Dickey— Fuller检验法用于时间序列 et,也就是用
OLS法估计形如下式的方程:
△ et =δet-1 + +νt ( 7.21)
有两点须提请注意:
( 1) ( 7.21) 式不包含常数项, 这是因为 OLS残差 et
应以 0为中心波动 。
( 2) Dickey— Fullerη统计量不适于此检验, 表 7.3提
供了用于协整检验的临界值表 。
表 7, 3 协整检验 EG 或 A E G 的临界值
变量个数 m=2 m=3 m=4
显著性水平
样本容量 0, 0 1 0, 0 5 0, 1 0 0, 0 1 0, 0 5 0, 1 0 0, 0 1 0, 0 5 0, 1 0
25 - 4, 3 7 - 3, 5 9 - 3, 2 2 - 4, 9 2 - 4, 1 0 - 3, 7 1 - 5, 4 3 - 4, 5 6 - 4, 1 5
50 - 4, 1 2 - 3, 4 6 - 3, 1 3 - 4, 5 9 - 3, 9 2 - 3, 5 8 - 5, 0 2 - 4, 3 2 - 3, 9 8
100 - 4, 0 1 - 3, 3 9 - 3, 0 9 - 4, 4 4 - 3, 8 3 - 3, 5 1 - 4, 8 3 - 4, 2 1 - 3, 8 9
∞ - 3, 9 0 - 3, 3 3 - 3, 0 5 - 4, 3 0 - 3, 7 4 - 3, 4 5 - 4, 6 5 - 4, 1 0 - 3, 8 1
例 7,2 某国私人消费和个人可支配收入的协整。
第一步:求出两变量的单整的阶
私人消费变量:

?
t
C = 12330.48 -0,01091 C
t - 1
(7.22)
(t:)( 5, 138) (-1,339 )
R
2
=0,052 DW=1,765

2
?
t
C
=7972.671-0.85112 Δ C
t - 1
(7.2 3 )
(t:) ( 4.301) (- 4.862 )
R
2
=0,425 DW=1,967
个人可支配收入变量:

?
t
Y = 19903.93 -0,02479Y
t - 1
(7.2 4 )
(t:) ( 3.054) (-1,387 )
R
2
=0,055 DW= 2.270

2
?
t
Y
= 12889.39 - 1.11754 Δ Y
t - 1
(7.25)
(t:) ( 3.983) (- 6.270 )
R
2
=0,551 DW= 2.014
由表 7.3中可见, Ct和 Yt都是非平稳的, 而 Δ Ct
和 Δ Yt都是平稳的 。 这就是说,
Ct~ I(1), Yt~ I(1)
因而我们可以进入下一步 。
第二步,进行协整回归,结果如下:
?
t
C
= 11907.23+ 0,779585Y
t
(7.2 6 )
( t:) ( 3.123) ( 75.566 )
R
2
=0,994 DW =1,021
同时我们计算并保存残差 (均衡误差估计值) e
t

第三步,检验 e
t
的平稳性。

t
e?
= -0.51739e
t - 1
(7,27 )
(t:) (-3.150)
R
2
=0.224 DW =1.948
第四步, 得出有关两变量是否协整的结论 。
用 tδ=- 3.150与表 7- 3中的临界值相比较 ( m=2),
采用显著性水平 α=0.05,tδ大于临界值 η,因而接受 et
非平稳的原假设, 意味着两变量不是协整的, 我们不
能说在私人消费和个人可支配收入之间存在着长期均
衡关系 。
可是, 如果采用显著性水平 α=0.10,则- 3.150与表
7- 3 中的临界值大致相当, 因而可以预期, 若 α=0.11,
tδ将小于临界值 η,我们接受 et为平稳的备择假设, 即
两变量是协整的, 或者说两变量之间存在着长期均衡
关系 。
2,Durbin-Watson法
此方法非常简单, 步骤如下:
步骤 1,估计协整回归方程
Yt=β0+β1Xt+εt
保存残差 et,计算 DW统计值 ( 现称为, 协整回
归, Durbin— Watson统计值 ( CRDW)), 即
CRDW=
其中 为残差的算术平均值 。
?
?
?
? ?
2
2
1
)(
)(
ee
ee
t
tt
e
步骤 2.
根据下述原假设和备择假设得出有关两变量协整
的结论:
H0,et非平稳, 即非协整
Ht,et平稳, 即协整
若 CRDW< d,则接受原假设 H0;
若 CRDW> d,则拒绝原假设 H0。
Sargan,Enger和 Granger等人计算了原假设为 d = 0的
情况下的临界值, 对应于显著性水平为 0.01,0.05和
0.10的临界值分别为 0.511,0.386和 0.322。
例 7.3 某国私人消费和个人可支配收入的协整
将 CRDW应用于上例 。
第一步:由上例中 ( 7.26) 式知 CRDW=1.021
第二步:因为 CRDW=1.021大于上面提到的临界值,
故拒绝原假设, 接受备择假设, 因此得出结论:
私人消费和个人可支配收入可以协整 。
三, 误差修正模型 ( ECM) 的估计
协整分析中最重要的结果可能是所谓的, 戈林格尔
代表定理, ( Granger representation theorem) 。 按照
此定理, 如果两变量 Yt和 Xt是协整的, 则它们之间存
在长期均衡关系 。
当然, 在短期内, 这些变量可以是不均衡的, 扰动
项是均衡误差 εt。 两变量间这种短期不均衡关系的动
态结构可以由误差修正模型 ( error correction model)
来描述, ECM模型是由 Sargan提出的 。 这一联系两变
量的短期和长期行为的误差修正模型由下式给出:
ΔYt = 滞后的( ΔYt,ΔXt) +λεt-1 + vt ( 7.28)
- 1< λ< 0
其中 Yt~ I(1),Xt~ I(1),Yt, Xt~ CI (1,1),
εt= Yt- β0- β1Xt~ I( 0),vt=白噪声,λ为短期调整
系数。
不难看出,在( 7.28)中,所有变量都是平稳的,
因为
Yt~ I (1),Xt~ I (1)?ΔYt~ I (0),ΔXt~ I (0);
Yt,Xt~ CI (1,1) ?εt~ I (0))
因此,有人或许会说,该式可用 OLS法估计。但事
实上不行,因为均衡误差 εt不是可观测变量。因而
在估计该式之前,要先得到这一误差的值。
Engle 和 Granger建议采用下述两步方法估计方程 。
第一步:估计协整回归方程
Yt=β0+β1Xt+εt
得到协整向量的一致估计值 ( 1,-, - ), 用
它得出均衡误差 εt的估计值
et= Yt- - Xt
第二步:用 OLS法估计下面的方程
ΔYt = 滞后的 ( ΔYt,ΔXt) +λet-1+vt ( 7.29)
?
0?
?
1?
?
1?
?
0?
例 7.4 估计某国私人消费和个人可支配收入之间的误
差修正模型 。
第一步,由例 7.2 中 7.26式协整回归的结果:
= 11907.23 + 0.779585Yt (7.30)
(t:) (3.123) (75.566)
R2=0.994 DW=1.021
我们得到残差 et。
?
tC
第二步:估计误差修正模型, 结果如下:
△ = 5951.557+0.28432Δ Yt- 0.19996et-1 (7.31)
(t:) (7.822) (6.538) (- 2.486)
R2=0.572 DW=1.941
( 7.31) 中的结果表明个人可支配收入 Yt的短期
变动对私人消费存在正向影响 。 此外, 由于短期调
整系数是显著的, 表明每年实际发生的私人消费与
其长期均衡值的偏差中的 20%( 0.19996) 被修正 。
?
tC
小结
本章重点介绍了时间序列分析中用到的一些基本概念和方
法 。
一,平稳性和非平稳性
一般来说, 如果一个时间序列的均值和方差在任何时间保
持恒定, 并且两个时期 t和 t+k之间的协方差仅依赖于两时期之
间的距离 ( 间隔或滞后 ) k,而与计算这些协方差的实际时期
t无关, 则该时间序列是平稳的 。 只要这三个条件不全满足,
则该时间序列是非平稳的 。 事实上, 大多数经济时间序列是
非平稳的 。
若一个非平稳序列 Xt必须取 d阶差分才变为平稳序列, 则 Xt
是, d阶单整的,, 表示为 Xt~I(d) 。
二,平稳性检验
平稳性检验的方法有自相关函数法和单位根方法两类, 本章
中介绍了单位根方法 。 单位根是表示非平稳性的另一方式, 单
位根方法将对非平稳性的检验转化为对单位根的检验, 本章介
绍的 DF检验法简单实用, 是目前最常用的单位根方法 。 DF检验
按以下两步进行:
第一步:用 OLS法估计
△ Xt=δXt-1+εt, 得到常规 tδ值 。
第二步:检验假设
H0,δ= 0
Ha,δ< 0
若接受原假设 H0,则 Xt非平稳 。
三, 协整分析
协整分析是用于非平稳变量组成的关系式中长期均衡参数估
计的技术 。 协整分析涉及的是一组变量, 它们各自都是不平
稳的, 但它们同步 。 这种变量的同步使得这些变量之间存在
长期的线性关系, 因而使人们能够研究经济变量间的长期均
衡关系 。 如果这种长期线性关系不成立, 则对应的变量被称
为是, 非协整的, 。 协整的定义是:
如果两时间序列 Yt~ I(d), Xt~ I(d), 并且这两个时间序
列的线性组合 a1Yt+a2Xt 是 (d-b)阶单整的, 即 a1Yt+a2Xt~ I(d-b)
( d≥b≥0), 则 Yt 和 Xt被称为是 ( d,b) 阶协整的 。 记为
Yt,Xt~ CI(d,b) 。
当回归方程中涉及的时间序列是非平稳时间序列时,OLS估
计量不再是一致估计量,相应的常规推断程序会产生误导。
这就是所谓的“伪回归”问题。可是,如果 Yt 和 Xt是协整的,
并且均衡误差是平稳的且具有零均值,我们就可以确信,方

Yt =β0+β1Xt+εt 将不会产生伪回归结果。
因此,要避免伪回归问题,就应该在进行回归之前检验一
下所涉及的变量是否协整。本章介绍了两种检验协整的方法:
Engle-Granger法和 Durbin-Watson法。
协整分析亦可用于短期或非均衡参数的估计,按照戈林格
尔代表定理,如果两变量 Yt和 Xt是协整的,则它们之间存在长
期均衡关系。当然,在短期内,这些变量可以是不均衡的,
扰动项是均衡误差 εt。两变量间这种短期不均衡关系的动态结
构可以由误差修正模型来描述。
复习思考题
1,请说出平稳时间序列和非平稳时间序列的区别, 并解释为
什么在实证分析中确定经济时间序列的性质是十分必要的 。
2,什么是伪回归? 在回归中使用非均衡时间序列时是否必定
会造成伪回归?
3.有人说,协整分析实质上是一种缺乏理论基础的“归纳
(inductive)”方法。请对上述说法谈谈你的看法。