第九章
时间序列计量经济学模型的理论与方法
第一节 时间序列的平稳性及其检验
第二节 随机时间序列模型的识别和估计
第三节 协整分析与误差修正模型
§ 9.1 时间序列的平稳性及其检验
一、问题的引出:非平稳变量与经典回归
模型
二、时间序列数据的平稳性
三、平稳性的图示判断
四、平稳性的单位根检验
五、单整、趋势平稳与差分平稳随机过程
一、问题的引出:非平稳变量与经典
回归模型
⒈ 常见的数据类型
到目前为止,经典计量经济模型常用到的数据有:
? 时间序列数据 ( time-series data);
? 截面数据 (cross-sectional data)
? 平行 /面板数据 ( panel data/time-series cross-section
data)
★ 时间序列数据是最常见,也是最常用到的数据 。
⒉ 经典回归模型与数据的平稳性
? 经典回归分析 暗含 着一个重要 假设, 数据是平稳的。
? 数据非平稳,大样本下的统计推断基础 ——“一致
性”要求 ——被破怀。
? 经典回归分析的假设之一:解释变量 X是非随机变
量
? 放宽该假设,X是随机变量,则需进一步要求:
(1)X与随机扰动项 ?不相关 ∶ Cov(X,?)=0
? ? nXX i /)( 2 ? ???? QnXXP in )/)(( 2lim依概率收敛:(2)
第( 2)条是为了满足统计推断中大样本下的“一致
性”特性,?? ?
??
)?(lim
n
P
?
?
?
? ????
nx
nux
x
ux
i
ii
i
ii
/
/?
22 ???
???? ????? ??
?? QnxP
nuxPP
i
ii
n
0
/lim
/lim?lim
2
第( 1)条是 OLS估计的需要
▲ 如果 X是非平稳数据 (如表现出向上的趋势),
则( 2)不成立,回归估计量不满足“一致性”,基
于大样本的统计推断也就遇到麻烦。
因此:
注意,在双变量模型中:
表现在,两个本来没有任何因果关系的变量,却
有很高的相关性 (有较高的 R2):
例如,如果有两列时间序列数据表现出一致的变
化趋势(非平稳的),即使它们没有任何有意义的
关系,但进行回归也可表现出较高的可决系数。
在现实经济生活中,
情况往往是 实际的时间序列数据是非平稳的,而
且主要的经济变量如消费、收入、价格往往表现为
一致的上升或下降。这样,仍然通过经典的因果关
系模型进行分析,一般不会得到有意义的结果。
⒊ 数据非平稳,往往导致出现, 虚假回归,
问题
时间序列分析 模型方法 就是在这样的情况下,
以通过揭示时间序列自身的变化规律为主线而发
展起来的全新的计量经济学方法论 。
时间序列分析 已组成现代计量经济学的重要内
容,并广泛应用于经济分析与预测当中 。
二、时间序列数据的平稳性
时间序列分析中 首先遇到的问题 是关于时间序列
数据的 平稳性 问题。
假定某个时间序列是由某一 随机过程 ( stochastic
process)生成的,即假定时间序列 {Xt}( t=1,2,… )
的每一个数值都是从一个概率分布中随机得到,如果
满足下列条件:
1)均值 E(Xt)=?是 与时间 t 无关的常数;
2)方差 Var(Xt)=?2是 与时间 t 无关的常数;
3)协方差 Cov(Xt,Xt+k)=?k是 只与时期间隔 k有关,
与时间 t 无关的常数;
则称该随机时间序列是 平稳的 ( stationary),而该
随机过程是一 平稳随机过程 ( stationary stochastic
process)。
例 9.1.1,一个最简单的随机时间序列是一具有零
均值同方差的独立分布序列:
Xt=?t, ?t~N(0,?2)
例 9.1.2,另一个简单的随机时间列序被称为 随机
游走 ( random walk), 该序列由如下随机过程生成:
Xt=Xt-1+?t
这里, ?t是一个白噪声 。
该序列常被称为是一个 白噪声 ( white noise) 。
由于 Xt具有相同的均值与方差,且协方差为零,由
定义,一个白噪声序列是平稳的 。
为了检验该序列是否具有相同的方差,可假设 Xt的
初值为 X0,则易知
X1=X0+?1
X2=X1+?2=X0+?1+?2
… …
Xt=X0+?1+?2+… +?t
由于 X0为常数,?t是一个白噪声,因此 Var(Xt)=t?2
即 Xt的方差与时间 t有关而非常数, 它是一非平稳序
列 。
容易知道该序列有相同的 均值, E(Xt)=E(Xt-1)
? 然而,对 X取 一阶差分 ( first difference),
?Xt=Xt-Xt-1=?t
由于 ?t是一个白噪声,则序列 {Xt}是平稳的。
后面将会看到,如果一个时间序列是非平稳的,
它常常可通过取差分的方法而形成平稳序列 。
? 事实上, 随机游走过程 是下面我们称之为 1阶自回
归 AR(1)过程 的特例
Xt=?Xt-1+?t
不难验证,1)|?|>1时, 该随机过程生成的时间序列是
发散的, 表现为持续上升 (?>1)或持续下降 (?<-1),
因此是非平稳的;
第二节中将证明,只有当 -1<?<1时,该随机过程
才是平稳的。
2)?=1时,是一个随机游走过程,也是非平稳的 。
? 1阶自回归过程 AR(1)又是如下 k阶自回归 AR(K)过
程 的特例:
Xt= ?1Xt-1+?2Xt-2… +?kXt-k
该随机过程平稳性条件将在第二节中介绍。
三、平稳性检验的图示判断
? 给出一个随机时间序列,首先可通过该
序列的 时间路径图 来粗略地判断它是否
是平稳的。
? 一个 平稳的时间序列 在图形上往往表现
出一种围绕其均值不断波动的过程;
? 而 非平稳序列 则往往表现出在不同的时
间段具有不同的均值(如持续上升或持
续下降)。
t
X
t
X
t t
(a ) (b)
图 9.1 平稳时间序列与非平稳时间序 列图
? 进一步的判断,
检验样本自相关函数及其图形
定义随机时间序列的 自相关函数 ( autocorrelation
function,ACF) 如下:
?k=?k/?0
自相关函数是关于滞后期 k的递减函数 (Why?)。
实际上,对一个随机过程只有一个实现(样本),
因此,只能计算 样本自相关函数 ( Sample
autocorrelation function)。
一个时间序列的样本自相关函数定义为:
? ?? ?
? ??
?
?
?
?
?
?
??
?
n
t
t
kn
t
ktt
k
XX
XXXX
r
1
2
1 ?,3,2,1?k
易知, 随着 k的增加, 样本自相关函数下降且趋
于零 。 但从下降速度来看, 平稳序列要比非平稳
序列快得多 。
k
r
k
r
1 1
0 k 0 k
( a ) ( b )
图 9.1.2 平稳时间序列与非平稳时间序列样本相关图
? 注意,
确定样本自相关函数 rk某一数值是否足够接近
于 0是非常有用的,因为它可 检验对应的自相关
函数 ?k的真值是否为 0的假设。
Bartlett曾证明,如果时间序列由白噪声过程生成,
则对所有的 k>0,样本自相关系数近似地服从以 0
为均值, 1/n 为方差的正态分布, 其中 n为样本数 。
也可检验对所有 k>0,自相关系数都为 0的联合
假设, 这可通过如下 QLB统计量进行:
该统计量近似地服从自由度为 m的 ?2分
布( m为滞后长度)。
因此,如果计算的 Q值大于显著性水平
为 ?的临界值,则有 1-?的把握拒绝所有
?k(k>0)同时为 0的假设。
例 9.1.3,表 9.1.1序列 Random1是通过
一随机过程(随机函数)生成的有 19个样
本的随机时间序列。
?
?
???
?
???
?
???
m
k
k
LB kn
rnnQ
1
2
)2(
表 9.1.1 一个纯随机序列与随机游 走序列的检验
序号 R andom1 自相关系数
k
r
(k=0,1,… 17)
LB
Q
R andom2 自相关系数
k
r
(k=0,1,… 17)
LB
Q
1 - 0.031 K=0,1, 0 0 0 - 0.031 1.000
2 0.188 K=1,- 0, 0 5 1 0.059 0.157 0.480 5.116
3 0.108 K=2,- 0, 3 9 3 3.679 0.264 0.018 5.123
4 - 0.455 K=3,- 0, 1 4 7 4.216 - 0.191 - 0.069 5.241
5 - 0.426 K=4,0, 2 8 0 6.300 - 0.616 0.028 5.261
6 0.387 K=5,0, 1 8 7 7.297 - 0.229 - 0.016 5.269
7 - 0.156 K=6,- 0, 3 6 3 11.332 - 0.385 - 0.219 6.745
8 0.204 K=7,- 0, 1 4 8 12.058 - 0.181 - 0.063 6.876
9 - 0.340 K=8,0, 3 1 5 15.646 - 0.521 0.126 7.454
10 0.157 K=9,0, 1 9 4 17.153 - 0.364 0.024 7.477
11 0.228 K=10,- 0, 1 3 9 18.010 - 0.136 - 0.249 10.229
12 - 0.315 K=11,- 0, 2 9 7 22.414 - 0.451 - 0.404 18.389
13 - 0.377 K=12,0, 0 3 4 22.481 - 0.828 - 0.284 22.994
14 - 0.056 K=13,0, 1 6 5 24.288 - 0.884 - 0.088 23.514
15 0.478 K=14,- 0, 1 0 5 25.162 - 0.406 - 0.066 23.866
16 0.244 K=15,- 0, 0 9 4 26.036 - 0.162 0.037 24.004
17 - 0.215 K=16,0, 0 3 9 26.240 - 0.377 0.105 25.483
18 0.141 K=17,0, 0 2 7 26.381 - 0.236 0.093 27.198
19 0.236 0.000
? 容易验证,该样本序列的均值为 0,方差为 0.0789。
( a ) ( b )
- 0, 6
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
0, 6
2 4 6 8 10 12 14 16 18
R A N D O M 1
- 0, 8
- 0, 4
0, 0
0, 4
0, 8
1, 2
2 4 6 8 10 12 14 16 18
R A N D O M 1 A C
从图形看,它在其样本均值 0附近上下波动,且样本自相关
系数迅速下降到 0,随后在 0附近波动且逐渐收敛于 0。
由于该序列由一随机过程生成,可以认为不存
在序列相关性,因此 该序列为一白噪声。
? 根据 Bartlett的理论,?k~N(0,1/19)
因此任一 rk(k>0)的 95%的置信区间都将是
可以看出,k>0时,rk的值确实落在了该区间内,
因此可以接受 ?k(k>0)为 0的假设 。
同样地,从 QLB统计量的计算值看,滞后 17期
的计算值为 26.38,未超过 5%显著性水平的临界值
27.58,因此,可以接受所有的自相关系数 ?k(k>0)
都为 0的假设。
因此,该随机过程是一个平稳过程。
]4497.0,4497.0[]19/196.1,19/196.1[],[ 0 2 5.00 2 5.0 ????????? ?? ZZ
? 序列 Random2是由一随机游走过程
Xt=Xt-1+?t
生成的一随机游走时间序列样本。
其中,第 0项取值为 0,?t是由 Random1表示的白噪声。
( a ) ( b )
- 1, 0
- 0, 8
- 0, 6
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
2 4 6 8 10 12 14 16 18
R A N D O M 2
- 0, 8
- 0, 4
0, 0
0, 4
0, 8
1, 2
2 4 6 8 10 12 14 16 18
R A N D O M 2 A C
样本自相关系数显示, r1=0.48,落在
了区间 [-0.4497,0.4497]之外,因此在 5%
的显著性水平上拒绝 ?1的真值为 0的假设。
该随机游走序列是非平稳的。
图形表示出,该序列具有相同的均值,
但从样本自相关图看,虽然自相关系数迅速
下降到 0,但随着时间的推移,则在 0附近波
动且呈发散趋势。
例 9.1,4 检验中国支出法 GDP 时间序列的平稳性。
表 9.1.2 1978~2000 年中国支出法 GDP (单位:亿元)
年份 GDP 年份 GDP 年份 GDP
1978 3 6 0 5, 6 1986 1 0 1 3 2, 8 1994 4 6 6 9 0, 7
1979 4 0 7 3, 9 1987 1 1 7 8 4 1995 5 8 5 1 0, 5
1980 4 5 5 1, 3 1988 14704 1996 6 8 3 3 0, 4
1981 4 9 0 1, 4 1989 16466 1997 7 4 8 9 4, 2
1982 5 4 8 9, 2 1990 1 8 3 1 9, 5 1998 7 9 0 0 3, 3
1983 6 0 7 6, 3 1991 2 1 2 8 0, 4 1999 8 2 6 7 3, 1
1984 7 1 6 4, 4 1992 2 5 8 6 3, 6 2000 8 9 1 1 2, 5
1985 8 7 9 2, 1 1993 3 4 5 0 0, 6
? 图形:表现出了一个持续上升的过程,可
初步判断 是非平稳 的。
? 样本自相关系数:缓慢下降,再次表明它
的 非平稳 性。
图 9.1,5 1978 ~ 2 0 0 0 年中国 GDP 时间序列及其样本自相关图
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
0, 6
0, 8
1, 0
1, 2
2 4 6 8 10 12 14 16 18 20 22
G D P A C F
0
2 0 0 0 0
4 0 0 0 0
6 0 0 0 0
8 0 0 0 0
1 0 0 0 0 0
78 80 82 84 86 88 90 92 94 96 98 00
G D P
拒绝,该时间序列的自相关系数在滞后 1
期之后的值全部为 0的假设 。
结论,
1978~2000年间中国 GDP时间序列是非平稳
序列 。
?从滞后 18期的 QLB统计量看:
QLB(18)=57.18>28.86=?20.05
? 例 9.1.5 检验 § 2.10中关于人均居民消费与
人均国内生产总值这两时间序列的平稳性。
图 9, 1, 6 1 9 8 1 ~ 1 9 9 6 中国居民人均消费与人均 G D P 时间序列及其样本自 相关图
0
1000
2000
3000
4000
5000
6000
82 84 86 88 90 92 94 96
G D P P C C P C
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
0, 6
0, 8
1, 0
1, 2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
G D P P C C P C
原图 样本自相关图
? 从图形上看,人均居民消费( CPC)与人均国
内生产总值( GDPPC) 是非平稳的 。
? 从滞后 14期的 QLB统计量看:
CPC与 GDPPC序列的统计量计算值均为 57.18,
超过了显著性水平为 5%时的临界值 23.68。再次
表明它们的非平稳性。
就此来说,运用传统的回归方法建立它们的
回归方程是无实际意义的。
不过,第三节中将看到,如果两个非平稳时
间序列是 协整 的,则传统的回归结果却是有意义
的,而这两时间序列恰是 协整 的。
四、平稳性的单位根检验
对时间序列的平稳性除了通过图形直观判断外,
运用统计量进行统计检验则是更为准确与重要的。
单位根检验( unit root test) 是统计检验中普遍
应用的一种检验方法。
1,DF检验
我们已知道, 随机游走序列
Xt=Xt-1+?t
是 非平稳的, 其中 ?t是白噪声 。
而该序列可看成是随机模型
Xt=?Xt-1+?t
中参数 ?=1时的情形。
也就是说,我们对式
Xt=?Xt-1+?t ( *)
做回归,如果确实发现 ?=1,就说随机变量 Xt有
一个 单位根 。
? ( *)式可变形式成差分形式:
?Xt=(1-?)Xt-1+ ?t
=?Xt-1+ ?t (**)
检验 ( *) 式是否存在单位根 ?=1,也可通过
( **) 式判断是否有 ? =0。
一般地,
? 检验一个时间序列 Xt的平稳性,可通过检验
带有截距项的一阶自回归模型
Xt=?+?Xt-1+?t ( *)
中的参数 ?是否小于 1。
或者,检验其等价变形式
?Xt=?+?Xt-1+?t ( **)
中的参数 ?是否小于 0 。
在第二节中将证明,( *)式中的参数 ?>1或 ?=1时,
时间序列是非平稳的 ;
对应于( **)式,则是 ?>0或 ? =0。
? 因此,针对式 ?Xt=?+?Xt-1+?t
我们关心的检验为,零假设 H0,?=0。
备择假设 H1,?<0
上述检验可通过 OLS法下的 t检验完成 。
然而, 在零假设 ( 序列非平稳 ) 下, 即使在大样
本下 t统计量也是有偏误的 ( 向下偏倚 ), 通常的 t
检验无法使用 。
Dicky和 Fuller于 1976年提出了这一情形下 t统计量
服从的分布 ( 这时的 t统计量称为 ?统计量 ), 即 DF
分布 ( 见表 9.1.3) 。
由于 t统计量的向下偏倚性, 它呈现围绕小于零值
的偏态分布 。
? 因此,可通过 OLS法估计
?Xt=?+?Xt-1+?t
并计算 t统计量的值,与 DF分布表中给定显著性水平
下的临界值比较:
如果,t<临界值,则拒绝零假设 H0,?=0,
认为时间序列不存在单位根,是平稳的。
表 9, 1, 3 DF 分布临界值表
样 本 容 量
显著性水平 25 50 100 500 ∝ t 分布临界值
( n= ∝)
0.01 - 3.75 - 3.58 - 3.51 - 3.44 - 3.43 - 2.33
0.05 - 3.00 - 2.93 - 2.89 - 2.87 - 2.86 - 1.65
0.10 - 2.63 - 2.60 - 2.58 - 2.57 - 2.57 - 1.28
? 注意:在不同的教科书上有不同的描述,但是
结果是相同的。
例如:“如果计算得到的 t统计量的绝对值大于
临界值的绝对值,则拒绝 ρ=0”的假设,原序列
不存在单位根,为平稳序列。
进一步的问题, 在上述使用
?Xt=?+?Xt-1+?t
对时间序列进行平稳性检验中, 实际上 假定了时间序列是由
具有白噪声随机误差项的一阶自回归过程 AR(1)生成的 。
但在实际检验中, 时间序列可能由更高阶的自回归过程
生成的, 或者随机误差项并非是白噪声, 这样用 OLS法进行
估计均会表现出随机误差项出现自相关 ( autocorrelation),
导致 DF检验无效 。
另外, 如果时间序列包含有明显的随时间变化的某种趋
势 ( 如上升或下降 ), 则也容易导致上述检验中的 自相关随
机误差项问题 。
为了保证 DF检验中随机误差项的白噪声特性, Dicky和
Fuller对 DF检验进行了扩充, 形成了 ADF( Augment Dickey-
Fuller ) 检验 。
2,ADF检验
ADF检验是通过下面三个模型完成的:
? 模型 3 中的 t是时间变量, 代表了时间序列随时
间变化的某种趋势 ( 如果有的话 ) 。
? 检验的假设都是:针对 H1,?<0,检验 H0,?=0,
即存在一单位根 。 模型 1与另两模型的差别在于
是否包含有常数项和趋势项 。
模型 1,
t
m
i
ititt
XXX ??? ????? ?
?
??
1
1
( * )
模型 2,
t
m
i
ititt
XXX ???? ?????? ?
?
??
1
1
( ** )
模型 3, t
m
i
ititt
XXtX ????? ??????? ?
?
??
1
1 ( *** )
? 实际检验时从模型 3开始, 然后模型 2,模型 1。
何时检验拒绝零假设,即原序列不存在单位根,
为平稳序列,何时检验停止。否则,就要继续检
验,直到检验完模型 1为止。
检验原理 与 DF检验相同,只是对模型 1,2,3
进行检验时,有各自相应的临界值。
表 9.1.4给出了三个模型所使用的 ADF分布临界
值表。
表 9, 1,4 不同模型使用的 ADF 分布临界值表
模型 统计量 样本容量 0.01 0.025 0.05 0.10
25 -2.66 -2.26 -1.95 -1.60
50 -2.62 -2.25 -1.95 -1.61
100 -2.60 -2.24 -1.95 -1.61
250 -2.58 -2.23 -1.95 -1.61
500 -2.58 -2.23 -1.95 -1.61
1
?
?
>500 -2.58 -2.23 -1.95 -1.61
25 -3.75 -3.33 -3.00 -2.62
50 -3.58 -3.22 -2.93 -2.60
100 -3.51 -3.17 -2.89 -2.58
250 -3.46 -3.14 -2.88 -2.57
500 -3.44 -3.13 -2.87 -2.57
?
?
>500 -3.43 -3.12 -2.86 -2.57
25 3.41 2.97 2.61 2.20
50 3.28 2.89 2.56 2.18
100 3.22 2.86 2.54 2.17
250 3.19 2.84 2.53 2.16
500 3.18 2.83 2.52 2.16
2
?
?
>500 3.18 2.83 2.52 2.16
25 -4.38 -3.95 -3.60 -3.24
50 -4.15 -3.80 -3.50 -3.18
100 -4.04 -3.73 -3.45 -3.15
250 -3.99 -3.69 -3.43 -3.13
500 -3.98 -3.68 -3.42 -3.13
?
?
>500 -3.96 -3.66 -3.41 -3.12
25 4.05 3.59 3.20 2.77
50 3.87 3.47 3.14 2.75
100 3.78 3.42 3.11 2.73
250 3.74 3.39 3.09 2.73
500 3.72 3.38 3.08 2.72
?
?
>500 3.71 3.38 3.08 2.72
25 3.74 3.25 2.85 2.39
50 3.60 3.18 2.81 2.38
100 3.53 3.14 2.79 2.38
250 3.49 3.12 2.79 2.38
500 3.48 3.11 2.78 2.38
3
?
?
>500 3.46 3.11 2.78 2.38
同时估计出上述三个模型的适当形式, 然后通过
ADF临界值表检验 零假设 H0,?=0。
1) 只要其中有一个模型的检验结果拒绝了零假设,
就可以认为时间序列是平稳的;
2) 当三个模型的检验结果都不能拒绝零假设时, 则
认为时间序列是非平稳的 。
这里所谓 模型适当的形式 就是在每个模型中选取适
当的滞后差分项, 以使模型的残差项是一个白噪声
( 主要保证不存在自相关 ) 。
一个简单的检验过程:
例 9.1.6 检验 1978~2000年间中国支出法 GDP时间序列的平稳
性 。
211 01.150.10093.027.22933.1011 ??? ????????? tttt G D PG D PG D PTG D P
( - 1,26 ) ( 1, 91 ) ( 0, 31 ) ( 8, 94 ) ( - 4, 95 )
1)经过偿试,模型 3取了 2阶滞后:
通过 拉格朗日乘数检验 ( Lagrange multiplier test) 对随机误
差项的自相关性进行检验:
LM( 1) =0.92,LM( 2) =4.16,
小于 5%显著性水平下自由度分别为 1与 2的 ?2分布的临界值,
可见不存在自相关性, 因此该模型的设定是正确的 。
从 ?的系数看, t>临界值, 不能拒绝存在单位根的零假设 。
时间 T的 t统计量小于 ADF分布表中的临界值, 因此 不能拒绝
不存在趋势项的零假设 。 需进一步检验模型 2。
2) 经试验, 模型 2中滞后项取 2阶:
211 15.165.1057.045.357 ??? ??????? tttt G D PG D PG D PG D P
( - 0, 9 0 ) ( 3, 3 8 ) ( 1 0, 4 0 ) ( - 5, 6 3 )
LM ( 1 ) = 0, 5 7 LM ( 2 ) = 2, 8 5
LM检验表明模型残差不存在自相关性, 因此该模型
的设定是正确的 。
从 GDPt-1的参数值看, 其 t统计量为正值, 大于临界值,
不能拒绝存在单位根的零假设 。
常数项的 t统计量小于 AFD分布表中的临界值, 不能拒
绝不存常数项的零假设 。 需进一步检验模型 1。
3)经试验,模型 1中滞后项取 2阶:
LM检验表明模型残差项不存在自相关性, 因
此模型的设定是正确的 。
从 GDPt-1的参数值看, 其 t统计量为正值, 大于
临界值, 不能拒绝存在单位根的零假设 。
? 可断定中国支出法 GDP时间序列是非平稳的 。
211 194.1701.1063.0 ??? ?????? tttt G D PG D PG D PG D P
( 4, 1 5 ) ( 1 1, 4 6 ) ( - 6, 0 5 )
LM ( 1 ) = 0, 1 7 LM ( 2 ) = 2, 6 7
? 例 9.1.7 检验 § 2.10中关于人均居民消费与人均
国内生产总值这两时间序列的平稳性。
1)对 中国人均国内生产总值 GDPPC来说, 经过偿试, 三
个模型的适当形式分别为
模型 2,
211
425.1040.0652.002.192
???
????????
tttt
G D P P CG D P P CG D P P CG D P P C
( - 1, 7 8 ) ( 3, 2 6 ) ( 0, 0 8 ) ( - 2, 9 6 )
43 4 0 3.14 1 2.0 ?? ???? tt G D P P CG D P P C
( - 0, 6 7 ) ( - 2, 2 0 )
L M ( 1 ) = 1, 6 7 L M ( 2 ) = 1, 7 1 L M( 3 ) = 6, 2 8 L M ( 4 ) = 1 0, 9 2
模型 3,
11 03.115.036.4508.75 ?? ??????? ttt G D P P CG D P P CtG D P P C
( - 0, 7 5 ) ( 1, 9 3 ) ( - 1, 0 4 ) ( 2, 3 1 )
L M ( 1 ) =2, 8 8 L M ( 2 ) = 1, 8 6
? 三个模型中参数的估计值的 t统计量均大于各自
的临界值, 因此 不能拒绝存在单位根的零假设 。
? 结论,人均国内生产总值 ( GDPPC) 是非平稳
的 。
模型 1,
211 975.0875.0196.0 ??? ?????? tttt G D P P CG D P P CG D P P CG D P P C
( 2, 6 3 ) ( 2, 6 1 ) ( - 2, 7 2 )
L M ( 1 ) = 0, 2 0 L M ( 2 ) = 3, 5 3
2)对于人均居民消费 CPC时间序列来说,三个
模型的适当形式为
模型 3,
11 4 6 2 7.13 6 4 6.098.3423.26 ?? ??????? ttt C P CC P CtC P C
( - 0, 4 7 7 ) ( 2, 1 7 5 ) ( - 1, 4 7 8 ) ( 2, 3 1 8 )
L M ( 1 ) = 1, 5 7 7 L M ( 2 ) = 1, 8 3 4
模型 2,
3211 027.0655.1508.0545.088.79 ???? ?????????? ttttt C P CC P CC P CC P CC P C
( - 1, 3 7 ) ( 3, 3 7 ) ( 1, 1 6 ) ( - 3, 4 4 ) ( - 0, 0 5 )
48 2 4.1 ??? tC P C
( - 3, 0 3 )
L M( 1 ) = 3, 5 7 L M( 2 ) = 4, 1 0 L M( 3 ) = 4, 8 9 L M( 4 ) = 1 0, 9 9
? 三个模型中参数 CPCt-1的 t统计量的值均比 ADF
临界值表中各自的临界值大, 不能拒绝该时间
序列存在单位根的假设,
? 因此,可判断人均居民消费序列 CPC是非平稳
的 。
模型 1,
43211 71.108.048.188.037.0 ????? ?????????? tttttt C P CC P CC P CC P CC P CC P C
( 3, 6 0 ) ( 2, 3 7 ) ( - 2, 9 7 ) ( 0, 1 2 ) ( - 2, 6 8 )
L M ( 1 ) = 1, 8 3 L M ( 2 ) = 1, 8 4 L M ( 3 ) = 2, 0 0 L M ( 4 ) = 2, 3 3
五、单整、趋势平稳与差分平稳随机
过程
随机游走序列
Xt=Xt-1+?t
经差分后等价地变形为
?Xt=?t
由于 ?t是一个白噪声, 因此 差分后的序列 {?Xt}
是平稳的 。
⒈ 单整
一般地,如果一个时间序列经过 d次差分后变成平稳序列,
则称原序列是 d 阶单整 ( integrated of d) 序列,记为 I(d)。
显然,I(0)代表一平稳时间序列。
现实经济生活中,
1)只有少数经济指标的时间序列表现为平稳的, 如利率等 ;
2)大多数指标的时间序列是非平稳的, 如一些价格指数常常
是 2阶单整的, 以不变价格表示的消费额, 收入等常表现为 1
阶单整 。
大多数非平稳的时间序列一般可通过一次或多次差分的形式
变为平稳的 。
但也有一些时间序列, 无论经过多少次差分, 都不能变为平
稳的 。 这种序列被称为 非单整的 ( non-integrated) 。
如果一个时间序列经过一次差分变成平稳的,就称原
序列是 一阶单整 ( integrated of 1) 序列,记为 I(1)。
例 9.1.8 中国支出法 GDP的单整性 。
经过试算, 发现 中国支出法 GDP是 1阶单整的,
适当的检验模型为
1212 966.0495.025.26108.1174 ?? ??????? ttt G D PG D PtG D P
( - 1, 9 9 ) ( 4, 2 3 ) ( - 5, 1 8 ) ( 6, 4 2 )
2R
= 0, 7 5 0 1 L M( 1 ) = 0, 4 0 L M( 2 ) = 1, 2 9
例 9.1.9 中国人均居民消费与人均国内生产总值的
单整性 。
经过试算, 发现 中国人均国内生产总值 GDPPC是 2阶单
整的, 适当的检验模型为
123 60.0 ????? tt G D P P CG D P P C
( - 2, 1 7 )
2R
= 0, 2 7 7 8, L M ( 1 ) = 0, 3 1 L M ( 2 ) = 0, 5 4
同样地, CPC也是 2阶单整的, 适当的检验模型为
123 67.0 ????? tt C P CC P C
( - 2, 0 8 )
2R
= 0, 2 5 1 5 L M( 1 ) = 1, 9 9 LM( 2 ) = 2, 3 6
⒉ 趋势平稳与差分平稳随机过程
前文已指出, 一些非平稳的经济时间序列往往表
现出共同的变化趋势, 而这些序列间本身不一定有
直接的关联关系, 这时对这些数据进行回归, 尽管
有较高的 R2,但其结果是没有任何实际意义的 。 这
种现象我们称之为 虚假回归 或 伪回归 ( spurious
regression) 。
如:用中国的劳动力时间序列数据与美国 GDP
时间序列作回归, 会得到较高的 R2, 但不能认为两
者有直接的关联关系, 而只不过它们有共同的趋势
罢了, 这种回归结果我们认为是虚假的 。
为了避免这种虚假回归的产生, 通常的做法是引
入作为趋势变量的时间, 这样包含有时间趋势变
量的回归, 可以消除这种趋势性的影响 。
然而这种做法, 只有当趋势性变量是 确定性的
( deterministic) 而非 随机性的 ( stochastic),
才会是有效的 。
换言之, 如果一个包含有某种确定性趋势的非
平稳时间序列, 可以通过引入表示这一确定性趋
势的趋势变量, 而将确定性趋势分离出来 。
1)如果 ?=1,?=0,则 ( *) 式成为 一带位移的随机
游走过程,
Xt=?+Xt-1+?t ( **)
根据 ?的正负, Xt表现出明显的上升或下降趋势 。
这种趋势称为 随机性趋势 ( stochastic trend) 。
2)如果 ?=0,??0,则 ( *) 式成为一带时间趋势的
随机变化过程:
Xt=?+?t+?t ( ***)
根据 ?的正负, Xt表现出明显的上升或下降趋势 。
这种趋势称为 确定性趋势 ( deterministic trend) 。
考虑如下的含有一阶自回归的随机过程:
Xt=?+?t+?Xt-1+?t ( *)
其中,?t是一白噪声, t为一时间趋势 。
3) 如果 ?=1,??0,则 Xt包含有 确定性与随机性
两种趋势。
判断一个非平稳的时间序列, 它的趋势是随机性
的还是确定性的, 可通过 ADF检验中所用的第 3个
模型进行 。
该模型中已引入了表示确定性趋势的时间变量 t,
即分离出了确定性趋势的影响 。
因此, (1)如果检验结果表明所给时间序列有单位
根, 且时间变量前的参数显著为零, 则该序列显
示出随机性趋势 ;
(2)如果没有单位根, 且时间变量前的参数
显著地异于零, 则该序列显示出确定性趋势 。
随机性趋势可通过差分的方法消除
如:对式
Xt=?+Xt-1+?t
可通过差分变换为
?Xt= ?+?t
该时间序列称为 差分平稳过程( difference stationary
process) ;
确定性趋势无法通过差分的方法消除,而只能
通过除去趋势项消除,
如:对式
Xt=?+?t+?t
可通过除去 ?t变换为
Xt - ?t =?+?t
该时间序列是平稳的,因此称为 趋势平稳过程
( trend stationary process)。
最后需要说明的是,趋势平稳过程代表了一
个时间序列长期稳定的变化过程,因而用于进行
长期预测则是更为可靠的。
时间序列计量经济学模型的理论与方法
第一节 时间序列的平稳性及其检验
第二节 随机时间序列模型的识别和估计
第三节 协整分析与误差修正模型
§ 9.1 时间序列的平稳性及其检验
一、问题的引出:非平稳变量与经典回归
模型
二、时间序列数据的平稳性
三、平稳性的图示判断
四、平稳性的单位根检验
五、单整、趋势平稳与差分平稳随机过程
一、问题的引出:非平稳变量与经典
回归模型
⒈ 常见的数据类型
到目前为止,经典计量经济模型常用到的数据有:
? 时间序列数据 ( time-series data);
? 截面数据 (cross-sectional data)
? 平行 /面板数据 ( panel data/time-series cross-section
data)
★ 时间序列数据是最常见,也是最常用到的数据 。
⒉ 经典回归模型与数据的平稳性
? 经典回归分析 暗含 着一个重要 假设, 数据是平稳的。
? 数据非平稳,大样本下的统计推断基础 ——“一致
性”要求 ——被破怀。
? 经典回归分析的假设之一:解释变量 X是非随机变
量
? 放宽该假设,X是随机变量,则需进一步要求:
(1)X与随机扰动项 ?不相关 ∶ Cov(X,?)=0
? ? nXX i /)( 2 ? ???? QnXXP in )/)(( 2lim依概率收敛:(2)
第( 2)条是为了满足统计推断中大样本下的“一致
性”特性,?? ?
??
)?(lim
n
P
?
?
?
? ????
nx
nux
x
ux
i
ii
i
ii
/
/?
22 ???
???? ????? ??
?? QnxP
nuxPP
i
ii
n
0
/lim
/lim?lim
2
第( 1)条是 OLS估计的需要
▲ 如果 X是非平稳数据 (如表现出向上的趋势),
则( 2)不成立,回归估计量不满足“一致性”,基
于大样本的统计推断也就遇到麻烦。
因此:
注意,在双变量模型中:
表现在,两个本来没有任何因果关系的变量,却
有很高的相关性 (有较高的 R2):
例如,如果有两列时间序列数据表现出一致的变
化趋势(非平稳的),即使它们没有任何有意义的
关系,但进行回归也可表现出较高的可决系数。
在现实经济生活中,
情况往往是 实际的时间序列数据是非平稳的,而
且主要的经济变量如消费、收入、价格往往表现为
一致的上升或下降。这样,仍然通过经典的因果关
系模型进行分析,一般不会得到有意义的结果。
⒊ 数据非平稳,往往导致出现, 虚假回归,
问题
时间序列分析 模型方法 就是在这样的情况下,
以通过揭示时间序列自身的变化规律为主线而发
展起来的全新的计量经济学方法论 。
时间序列分析 已组成现代计量经济学的重要内
容,并广泛应用于经济分析与预测当中 。
二、时间序列数据的平稳性
时间序列分析中 首先遇到的问题 是关于时间序列
数据的 平稳性 问题。
假定某个时间序列是由某一 随机过程 ( stochastic
process)生成的,即假定时间序列 {Xt}( t=1,2,… )
的每一个数值都是从一个概率分布中随机得到,如果
满足下列条件:
1)均值 E(Xt)=?是 与时间 t 无关的常数;
2)方差 Var(Xt)=?2是 与时间 t 无关的常数;
3)协方差 Cov(Xt,Xt+k)=?k是 只与时期间隔 k有关,
与时间 t 无关的常数;
则称该随机时间序列是 平稳的 ( stationary),而该
随机过程是一 平稳随机过程 ( stationary stochastic
process)。
例 9.1.1,一个最简单的随机时间序列是一具有零
均值同方差的独立分布序列:
Xt=?t, ?t~N(0,?2)
例 9.1.2,另一个简单的随机时间列序被称为 随机
游走 ( random walk), 该序列由如下随机过程生成:
Xt=Xt-1+?t
这里, ?t是一个白噪声 。
该序列常被称为是一个 白噪声 ( white noise) 。
由于 Xt具有相同的均值与方差,且协方差为零,由
定义,一个白噪声序列是平稳的 。
为了检验该序列是否具有相同的方差,可假设 Xt的
初值为 X0,则易知
X1=X0+?1
X2=X1+?2=X0+?1+?2
… …
Xt=X0+?1+?2+… +?t
由于 X0为常数,?t是一个白噪声,因此 Var(Xt)=t?2
即 Xt的方差与时间 t有关而非常数, 它是一非平稳序
列 。
容易知道该序列有相同的 均值, E(Xt)=E(Xt-1)
? 然而,对 X取 一阶差分 ( first difference),
?Xt=Xt-Xt-1=?t
由于 ?t是一个白噪声,则序列 {Xt}是平稳的。
后面将会看到,如果一个时间序列是非平稳的,
它常常可通过取差分的方法而形成平稳序列 。
? 事实上, 随机游走过程 是下面我们称之为 1阶自回
归 AR(1)过程 的特例
Xt=?Xt-1+?t
不难验证,1)|?|>1时, 该随机过程生成的时间序列是
发散的, 表现为持续上升 (?>1)或持续下降 (?<-1),
因此是非平稳的;
第二节中将证明,只有当 -1<?<1时,该随机过程
才是平稳的。
2)?=1时,是一个随机游走过程,也是非平稳的 。
? 1阶自回归过程 AR(1)又是如下 k阶自回归 AR(K)过
程 的特例:
Xt= ?1Xt-1+?2Xt-2… +?kXt-k
该随机过程平稳性条件将在第二节中介绍。
三、平稳性检验的图示判断
? 给出一个随机时间序列,首先可通过该
序列的 时间路径图 来粗略地判断它是否
是平稳的。
? 一个 平稳的时间序列 在图形上往往表现
出一种围绕其均值不断波动的过程;
? 而 非平稳序列 则往往表现出在不同的时
间段具有不同的均值(如持续上升或持
续下降)。
t
X
t
X
t t
(a ) (b)
图 9.1 平稳时间序列与非平稳时间序 列图
? 进一步的判断,
检验样本自相关函数及其图形
定义随机时间序列的 自相关函数 ( autocorrelation
function,ACF) 如下:
?k=?k/?0
自相关函数是关于滞后期 k的递减函数 (Why?)。
实际上,对一个随机过程只有一个实现(样本),
因此,只能计算 样本自相关函数 ( Sample
autocorrelation function)。
一个时间序列的样本自相关函数定义为:
? ?? ?
? ??
?
?
?
?
?
?
??
?
n
t
t
kn
t
ktt
k
XX
XXXX
r
1
2
1 ?,3,2,1?k
易知, 随着 k的增加, 样本自相关函数下降且趋
于零 。 但从下降速度来看, 平稳序列要比非平稳
序列快得多 。
k
r
k
r
1 1
0 k 0 k
( a ) ( b )
图 9.1.2 平稳时间序列与非平稳时间序列样本相关图
? 注意,
确定样本自相关函数 rk某一数值是否足够接近
于 0是非常有用的,因为它可 检验对应的自相关
函数 ?k的真值是否为 0的假设。
Bartlett曾证明,如果时间序列由白噪声过程生成,
则对所有的 k>0,样本自相关系数近似地服从以 0
为均值, 1/n 为方差的正态分布, 其中 n为样本数 。
也可检验对所有 k>0,自相关系数都为 0的联合
假设, 这可通过如下 QLB统计量进行:
该统计量近似地服从自由度为 m的 ?2分
布( m为滞后长度)。
因此,如果计算的 Q值大于显著性水平
为 ?的临界值,则有 1-?的把握拒绝所有
?k(k>0)同时为 0的假设。
例 9.1.3,表 9.1.1序列 Random1是通过
一随机过程(随机函数)生成的有 19个样
本的随机时间序列。
?
?
???
?
???
?
???
m
k
k
LB kn
rnnQ
1
2
)2(
表 9.1.1 一个纯随机序列与随机游 走序列的检验
序号 R andom1 自相关系数
k
r
(k=0,1,… 17)
LB
Q
R andom2 自相关系数
k
r
(k=0,1,… 17)
LB
Q
1 - 0.031 K=0,1, 0 0 0 - 0.031 1.000
2 0.188 K=1,- 0, 0 5 1 0.059 0.157 0.480 5.116
3 0.108 K=2,- 0, 3 9 3 3.679 0.264 0.018 5.123
4 - 0.455 K=3,- 0, 1 4 7 4.216 - 0.191 - 0.069 5.241
5 - 0.426 K=4,0, 2 8 0 6.300 - 0.616 0.028 5.261
6 0.387 K=5,0, 1 8 7 7.297 - 0.229 - 0.016 5.269
7 - 0.156 K=6,- 0, 3 6 3 11.332 - 0.385 - 0.219 6.745
8 0.204 K=7,- 0, 1 4 8 12.058 - 0.181 - 0.063 6.876
9 - 0.340 K=8,0, 3 1 5 15.646 - 0.521 0.126 7.454
10 0.157 K=9,0, 1 9 4 17.153 - 0.364 0.024 7.477
11 0.228 K=10,- 0, 1 3 9 18.010 - 0.136 - 0.249 10.229
12 - 0.315 K=11,- 0, 2 9 7 22.414 - 0.451 - 0.404 18.389
13 - 0.377 K=12,0, 0 3 4 22.481 - 0.828 - 0.284 22.994
14 - 0.056 K=13,0, 1 6 5 24.288 - 0.884 - 0.088 23.514
15 0.478 K=14,- 0, 1 0 5 25.162 - 0.406 - 0.066 23.866
16 0.244 K=15,- 0, 0 9 4 26.036 - 0.162 0.037 24.004
17 - 0.215 K=16,0, 0 3 9 26.240 - 0.377 0.105 25.483
18 0.141 K=17,0, 0 2 7 26.381 - 0.236 0.093 27.198
19 0.236 0.000
? 容易验证,该样本序列的均值为 0,方差为 0.0789。
( a ) ( b )
- 0, 6
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
0, 6
2 4 6 8 10 12 14 16 18
R A N D O M 1
- 0, 8
- 0, 4
0, 0
0, 4
0, 8
1, 2
2 4 6 8 10 12 14 16 18
R A N D O M 1 A C
从图形看,它在其样本均值 0附近上下波动,且样本自相关
系数迅速下降到 0,随后在 0附近波动且逐渐收敛于 0。
由于该序列由一随机过程生成,可以认为不存
在序列相关性,因此 该序列为一白噪声。
? 根据 Bartlett的理论,?k~N(0,1/19)
因此任一 rk(k>0)的 95%的置信区间都将是
可以看出,k>0时,rk的值确实落在了该区间内,
因此可以接受 ?k(k>0)为 0的假设 。
同样地,从 QLB统计量的计算值看,滞后 17期
的计算值为 26.38,未超过 5%显著性水平的临界值
27.58,因此,可以接受所有的自相关系数 ?k(k>0)
都为 0的假设。
因此,该随机过程是一个平稳过程。
]4497.0,4497.0[]19/196.1,19/196.1[],[ 0 2 5.00 2 5.0 ????????? ?? ZZ
? 序列 Random2是由一随机游走过程
Xt=Xt-1+?t
生成的一随机游走时间序列样本。
其中,第 0项取值为 0,?t是由 Random1表示的白噪声。
( a ) ( b )
- 1, 0
- 0, 8
- 0, 6
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
2 4 6 8 10 12 14 16 18
R A N D O M 2
- 0, 8
- 0, 4
0, 0
0, 4
0, 8
1, 2
2 4 6 8 10 12 14 16 18
R A N D O M 2 A C
样本自相关系数显示, r1=0.48,落在
了区间 [-0.4497,0.4497]之外,因此在 5%
的显著性水平上拒绝 ?1的真值为 0的假设。
该随机游走序列是非平稳的。
图形表示出,该序列具有相同的均值,
但从样本自相关图看,虽然自相关系数迅速
下降到 0,但随着时间的推移,则在 0附近波
动且呈发散趋势。
例 9.1,4 检验中国支出法 GDP 时间序列的平稳性。
表 9.1.2 1978~2000 年中国支出法 GDP (单位:亿元)
年份 GDP 年份 GDP 年份 GDP
1978 3 6 0 5, 6 1986 1 0 1 3 2, 8 1994 4 6 6 9 0, 7
1979 4 0 7 3, 9 1987 1 1 7 8 4 1995 5 8 5 1 0, 5
1980 4 5 5 1, 3 1988 14704 1996 6 8 3 3 0, 4
1981 4 9 0 1, 4 1989 16466 1997 7 4 8 9 4, 2
1982 5 4 8 9, 2 1990 1 8 3 1 9, 5 1998 7 9 0 0 3, 3
1983 6 0 7 6, 3 1991 2 1 2 8 0, 4 1999 8 2 6 7 3, 1
1984 7 1 6 4, 4 1992 2 5 8 6 3, 6 2000 8 9 1 1 2, 5
1985 8 7 9 2, 1 1993 3 4 5 0 0, 6
? 图形:表现出了一个持续上升的过程,可
初步判断 是非平稳 的。
? 样本自相关系数:缓慢下降,再次表明它
的 非平稳 性。
图 9.1,5 1978 ~ 2 0 0 0 年中国 GDP 时间序列及其样本自相关图
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
0, 6
0, 8
1, 0
1, 2
2 4 6 8 10 12 14 16 18 20 22
G D P A C F
0
2 0 0 0 0
4 0 0 0 0
6 0 0 0 0
8 0 0 0 0
1 0 0 0 0 0
78 80 82 84 86 88 90 92 94 96 98 00
G D P
拒绝,该时间序列的自相关系数在滞后 1
期之后的值全部为 0的假设 。
结论,
1978~2000年间中国 GDP时间序列是非平稳
序列 。
?从滞后 18期的 QLB统计量看:
QLB(18)=57.18>28.86=?20.05
? 例 9.1.5 检验 § 2.10中关于人均居民消费与
人均国内生产总值这两时间序列的平稳性。
图 9, 1, 6 1 9 8 1 ~ 1 9 9 6 中国居民人均消费与人均 G D P 时间序列及其样本自 相关图
0
1000
2000
3000
4000
5000
6000
82 84 86 88 90 92 94 96
G D P P C C P C
- 0, 4
- 0, 2
0, 0
0, 2
0, 4
0, 6
0, 8
1, 0
1, 2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
G D P P C C P C
原图 样本自相关图
? 从图形上看,人均居民消费( CPC)与人均国
内生产总值( GDPPC) 是非平稳的 。
? 从滞后 14期的 QLB统计量看:
CPC与 GDPPC序列的统计量计算值均为 57.18,
超过了显著性水平为 5%时的临界值 23.68。再次
表明它们的非平稳性。
就此来说,运用传统的回归方法建立它们的
回归方程是无实际意义的。
不过,第三节中将看到,如果两个非平稳时
间序列是 协整 的,则传统的回归结果却是有意义
的,而这两时间序列恰是 协整 的。
四、平稳性的单位根检验
对时间序列的平稳性除了通过图形直观判断外,
运用统计量进行统计检验则是更为准确与重要的。
单位根检验( unit root test) 是统计检验中普遍
应用的一种检验方法。
1,DF检验
我们已知道, 随机游走序列
Xt=Xt-1+?t
是 非平稳的, 其中 ?t是白噪声 。
而该序列可看成是随机模型
Xt=?Xt-1+?t
中参数 ?=1时的情形。
也就是说,我们对式
Xt=?Xt-1+?t ( *)
做回归,如果确实发现 ?=1,就说随机变量 Xt有
一个 单位根 。
? ( *)式可变形式成差分形式:
?Xt=(1-?)Xt-1+ ?t
=?Xt-1+ ?t (**)
检验 ( *) 式是否存在单位根 ?=1,也可通过
( **) 式判断是否有 ? =0。
一般地,
? 检验一个时间序列 Xt的平稳性,可通过检验
带有截距项的一阶自回归模型
Xt=?+?Xt-1+?t ( *)
中的参数 ?是否小于 1。
或者,检验其等价变形式
?Xt=?+?Xt-1+?t ( **)
中的参数 ?是否小于 0 。
在第二节中将证明,( *)式中的参数 ?>1或 ?=1时,
时间序列是非平稳的 ;
对应于( **)式,则是 ?>0或 ? =0。
? 因此,针对式 ?Xt=?+?Xt-1+?t
我们关心的检验为,零假设 H0,?=0。
备择假设 H1,?<0
上述检验可通过 OLS法下的 t检验完成 。
然而, 在零假设 ( 序列非平稳 ) 下, 即使在大样
本下 t统计量也是有偏误的 ( 向下偏倚 ), 通常的 t
检验无法使用 。
Dicky和 Fuller于 1976年提出了这一情形下 t统计量
服从的分布 ( 这时的 t统计量称为 ?统计量 ), 即 DF
分布 ( 见表 9.1.3) 。
由于 t统计量的向下偏倚性, 它呈现围绕小于零值
的偏态分布 。
? 因此,可通过 OLS法估计
?Xt=?+?Xt-1+?t
并计算 t统计量的值,与 DF分布表中给定显著性水平
下的临界值比较:
如果,t<临界值,则拒绝零假设 H0,?=0,
认为时间序列不存在单位根,是平稳的。
表 9, 1, 3 DF 分布临界值表
样 本 容 量
显著性水平 25 50 100 500 ∝ t 分布临界值
( n= ∝)
0.01 - 3.75 - 3.58 - 3.51 - 3.44 - 3.43 - 2.33
0.05 - 3.00 - 2.93 - 2.89 - 2.87 - 2.86 - 1.65
0.10 - 2.63 - 2.60 - 2.58 - 2.57 - 2.57 - 1.28
? 注意:在不同的教科书上有不同的描述,但是
结果是相同的。
例如:“如果计算得到的 t统计量的绝对值大于
临界值的绝对值,则拒绝 ρ=0”的假设,原序列
不存在单位根,为平稳序列。
进一步的问题, 在上述使用
?Xt=?+?Xt-1+?t
对时间序列进行平稳性检验中, 实际上 假定了时间序列是由
具有白噪声随机误差项的一阶自回归过程 AR(1)生成的 。
但在实际检验中, 时间序列可能由更高阶的自回归过程
生成的, 或者随机误差项并非是白噪声, 这样用 OLS法进行
估计均会表现出随机误差项出现自相关 ( autocorrelation),
导致 DF检验无效 。
另外, 如果时间序列包含有明显的随时间变化的某种趋
势 ( 如上升或下降 ), 则也容易导致上述检验中的 自相关随
机误差项问题 。
为了保证 DF检验中随机误差项的白噪声特性, Dicky和
Fuller对 DF检验进行了扩充, 形成了 ADF( Augment Dickey-
Fuller ) 检验 。
2,ADF检验
ADF检验是通过下面三个模型完成的:
? 模型 3 中的 t是时间变量, 代表了时间序列随时
间变化的某种趋势 ( 如果有的话 ) 。
? 检验的假设都是:针对 H1,?<0,检验 H0,?=0,
即存在一单位根 。 模型 1与另两模型的差别在于
是否包含有常数项和趋势项 。
模型 1,
t
m
i
ititt
XXX ??? ????? ?
?
??
1
1
( * )
模型 2,
t
m
i
ititt
XXX ???? ?????? ?
?
??
1
1
( ** )
模型 3, t
m
i
ititt
XXtX ????? ??????? ?
?
??
1
1 ( *** )
? 实际检验时从模型 3开始, 然后模型 2,模型 1。
何时检验拒绝零假设,即原序列不存在单位根,
为平稳序列,何时检验停止。否则,就要继续检
验,直到检验完模型 1为止。
检验原理 与 DF检验相同,只是对模型 1,2,3
进行检验时,有各自相应的临界值。
表 9.1.4给出了三个模型所使用的 ADF分布临界
值表。
表 9, 1,4 不同模型使用的 ADF 分布临界值表
模型 统计量 样本容量 0.01 0.025 0.05 0.10
25 -2.66 -2.26 -1.95 -1.60
50 -2.62 -2.25 -1.95 -1.61
100 -2.60 -2.24 -1.95 -1.61
250 -2.58 -2.23 -1.95 -1.61
500 -2.58 -2.23 -1.95 -1.61
1
?
?
>500 -2.58 -2.23 -1.95 -1.61
25 -3.75 -3.33 -3.00 -2.62
50 -3.58 -3.22 -2.93 -2.60
100 -3.51 -3.17 -2.89 -2.58
250 -3.46 -3.14 -2.88 -2.57
500 -3.44 -3.13 -2.87 -2.57
?
?
>500 -3.43 -3.12 -2.86 -2.57
25 3.41 2.97 2.61 2.20
50 3.28 2.89 2.56 2.18
100 3.22 2.86 2.54 2.17
250 3.19 2.84 2.53 2.16
500 3.18 2.83 2.52 2.16
2
?
?
>500 3.18 2.83 2.52 2.16
25 -4.38 -3.95 -3.60 -3.24
50 -4.15 -3.80 -3.50 -3.18
100 -4.04 -3.73 -3.45 -3.15
250 -3.99 -3.69 -3.43 -3.13
500 -3.98 -3.68 -3.42 -3.13
?
?
>500 -3.96 -3.66 -3.41 -3.12
25 4.05 3.59 3.20 2.77
50 3.87 3.47 3.14 2.75
100 3.78 3.42 3.11 2.73
250 3.74 3.39 3.09 2.73
500 3.72 3.38 3.08 2.72
?
?
>500 3.71 3.38 3.08 2.72
25 3.74 3.25 2.85 2.39
50 3.60 3.18 2.81 2.38
100 3.53 3.14 2.79 2.38
250 3.49 3.12 2.79 2.38
500 3.48 3.11 2.78 2.38
3
?
?
>500 3.46 3.11 2.78 2.38
同时估计出上述三个模型的适当形式, 然后通过
ADF临界值表检验 零假设 H0,?=0。
1) 只要其中有一个模型的检验结果拒绝了零假设,
就可以认为时间序列是平稳的;
2) 当三个模型的检验结果都不能拒绝零假设时, 则
认为时间序列是非平稳的 。
这里所谓 模型适当的形式 就是在每个模型中选取适
当的滞后差分项, 以使模型的残差项是一个白噪声
( 主要保证不存在自相关 ) 。
一个简单的检验过程:
例 9.1.6 检验 1978~2000年间中国支出法 GDP时间序列的平稳
性 。
211 01.150.10093.027.22933.1011 ??? ????????? tttt G D PG D PG D PTG D P
( - 1,26 ) ( 1, 91 ) ( 0, 31 ) ( 8, 94 ) ( - 4, 95 )
1)经过偿试,模型 3取了 2阶滞后:
通过 拉格朗日乘数检验 ( Lagrange multiplier test) 对随机误
差项的自相关性进行检验:
LM( 1) =0.92,LM( 2) =4.16,
小于 5%显著性水平下自由度分别为 1与 2的 ?2分布的临界值,
可见不存在自相关性, 因此该模型的设定是正确的 。
从 ?的系数看, t>临界值, 不能拒绝存在单位根的零假设 。
时间 T的 t统计量小于 ADF分布表中的临界值, 因此 不能拒绝
不存在趋势项的零假设 。 需进一步检验模型 2。
2) 经试验, 模型 2中滞后项取 2阶:
211 15.165.1057.045.357 ??? ??????? tttt G D PG D PG D PG D P
( - 0, 9 0 ) ( 3, 3 8 ) ( 1 0, 4 0 ) ( - 5, 6 3 )
LM ( 1 ) = 0, 5 7 LM ( 2 ) = 2, 8 5
LM检验表明模型残差不存在自相关性, 因此该模型
的设定是正确的 。
从 GDPt-1的参数值看, 其 t统计量为正值, 大于临界值,
不能拒绝存在单位根的零假设 。
常数项的 t统计量小于 AFD分布表中的临界值, 不能拒
绝不存常数项的零假设 。 需进一步检验模型 1。
3)经试验,模型 1中滞后项取 2阶:
LM检验表明模型残差项不存在自相关性, 因
此模型的设定是正确的 。
从 GDPt-1的参数值看, 其 t统计量为正值, 大于
临界值, 不能拒绝存在单位根的零假设 。
? 可断定中国支出法 GDP时间序列是非平稳的 。
211 194.1701.1063.0 ??? ?????? tttt G D PG D PG D PG D P
( 4, 1 5 ) ( 1 1, 4 6 ) ( - 6, 0 5 )
LM ( 1 ) = 0, 1 7 LM ( 2 ) = 2, 6 7
? 例 9.1.7 检验 § 2.10中关于人均居民消费与人均
国内生产总值这两时间序列的平稳性。
1)对 中国人均国内生产总值 GDPPC来说, 经过偿试, 三
个模型的适当形式分别为
模型 2,
211
425.1040.0652.002.192
???
????????
tttt
G D P P CG D P P CG D P P CG D P P C
( - 1, 7 8 ) ( 3, 2 6 ) ( 0, 0 8 ) ( - 2, 9 6 )
43 4 0 3.14 1 2.0 ?? ???? tt G D P P CG D P P C
( - 0, 6 7 ) ( - 2, 2 0 )
L M ( 1 ) = 1, 6 7 L M ( 2 ) = 1, 7 1 L M( 3 ) = 6, 2 8 L M ( 4 ) = 1 0, 9 2
模型 3,
11 03.115.036.4508.75 ?? ??????? ttt G D P P CG D P P CtG D P P C
( - 0, 7 5 ) ( 1, 9 3 ) ( - 1, 0 4 ) ( 2, 3 1 )
L M ( 1 ) =2, 8 8 L M ( 2 ) = 1, 8 6
? 三个模型中参数的估计值的 t统计量均大于各自
的临界值, 因此 不能拒绝存在单位根的零假设 。
? 结论,人均国内生产总值 ( GDPPC) 是非平稳
的 。
模型 1,
211 975.0875.0196.0 ??? ?????? tttt G D P P CG D P P CG D P P CG D P P C
( 2, 6 3 ) ( 2, 6 1 ) ( - 2, 7 2 )
L M ( 1 ) = 0, 2 0 L M ( 2 ) = 3, 5 3
2)对于人均居民消费 CPC时间序列来说,三个
模型的适当形式为
模型 3,
11 4 6 2 7.13 6 4 6.098.3423.26 ?? ??????? ttt C P CC P CtC P C
( - 0, 4 7 7 ) ( 2, 1 7 5 ) ( - 1, 4 7 8 ) ( 2, 3 1 8 )
L M ( 1 ) = 1, 5 7 7 L M ( 2 ) = 1, 8 3 4
模型 2,
3211 027.0655.1508.0545.088.79 ???? ?????????? ttttt C P CC P CC P CC P CC P C
( - 1, 3 7 ) ( 3, 3 7 ) ( 1, 1 6 ) ( - 3, 4 4 ) ( - 0, 0 5 )
48 2 4.1 ??? tC P C
( - 3, 0 3 )
L M( 1 ) = 3, 5 7 L M( 2 ) = 4, 1 0 L M( 3 ) = 4, 8 9 L M( 4 ) = 1 0, 9 9
? 三个模型中参数 CPCt-1的 t统计量的值均比 ADF
临界值表中各自的临界值大, 不能拒绝该时间
序列存在单位根的假设,
? 因此,可判断人均居民消费序列 CPC是非平稳
的 。
模型 1,
43211 71.108.048.188.037.0 ????? ?????????? tttttt C P CC P CC P CC P CC P CC P C
( 3, 6 0 ) ( 2, 3 7 ) ( - 2, 9 7 ) ( 0, 1 2 ) ( - 2, 6 8 )
L M ( 1 ) = 1, 8 3 L M ( 2 ) = 1, 8 4 L M ( 3 ) = 2, 0 0 L M ( 4 ) = 2, 3 3
五、单整、趋势平稳与差分平稳随机
过程
随机游走序列
Xt=Xt-1+?t
经差分后等价地变形为
?Xt=?t
由于 ?t是一个白噪声, 因此 差分后的序列 {?Xt}
是平稳的 。
⒈ 单整
一般地,如果一个时间序列经过 d次差分后变成平稳序列,
则称原序列是 d 阶单整 ( integrated of d) 序列,记为 I(d)。
显然,I(0)代表一平稳时间序列。
现实经济生活中,
1)只有少数经济指标的时间序列表现为平稳的, 如利率等 ;
2)大多数指标的时间序列是非平稳的, 如一些价格指数常常
是 2阶单整的, 以不变价格表示的消费额, 收入等常表现为 1
阶单整 。
大多数非平稳的时间序列一般可通过一次或多次差分的形式
变为平稳的 。
但也有一些时间序列, 无论经过多少次差分, 都不能变为平
稳的 。 这种序列被称为 非单整的 ( non-integrated) 。
如果一个时间序列经过一次差分变成平稳的,就称原
序列是 一阶单整 ( integrated of 1) 序列,记为 I(1)。
例 9.1.8 中国支出法 GDP的单整性 。
经过试算, 发现 中国支出法 GDP是 1阶单整的,
适当的检验模型为
1212 966.0495.025.26108.1174 ?? ??????? ttt G D PG D PtG D P
( - 1, 9 9 ) ( 4, 2 3 ) ( - 5, 1 8 ) ( 6, 4 2 )
2R
= 0, 7 5 0 1 L M( 1 ) = 0, 4 0 L M( 2 ) = 1, 2 9
例 9.1.9 中国人均居民消费与人均国内生产总值的
单整性 。
经过试算, 发现 中国人均国内生产总值 GDPPC是 2阶单
整的, 适当的检验模型为
123 60.0 ????? tt G D P P CG D P P C
( - 2, 1 7 )
2R
= 0, 2 7 7 8, L M ( 1 ) = 0, 3 1 L M ( 2 ) = 0, 5 4
同样地, CPC也是 2阶单整的, 适当的检验模型为
123 67.0 ????? tt C P CC P C
( - 2, 0 8 )
2R
= 0, 2 5 1 5 L M( 1 ) = 1, 9 9 LM( 2 ) = 2, 3 6
⒉ 趋势平稳与差分平稳随机过程
前文已指出, 一些非平稳的经济时间序列往往表
现出共同的变化趋势, 而这些序列间本身不一定有
直接的关联关系, 这时对这些数据进行回归, 尽管
有较高的 R2,但其结果是没有任何实际意义的 。 这
种现象我们称之为 虚假回归 或 伪回归 ( spurious
regression) 。
如:用中国的劳动力时间序列数据与美国 GDP
时间序列作回归, 会得到较高的 R2, 但不能认为两
者有直接的关联关系, 而只不过它们有共同的趋势
罢了, 这种回归结果我们认为是虚假的 。
为了避免这种虚假回归的产生, 通常的做法是引
入作为趋势变量的时间, 这样包含有时间趋势变
量的回归, 可以消除这种趋势性的影响 。
然而这种做法, 只有当趋势性变量是 确定性的
( deterministic) 而非 随机性的 ( stochastic),
才会是有效的 。
换言之, 如果一个包含有某种确定性趋势的非
平稳时间序列, 可以通过引入表示这一确定性趋
势的趋势变量, 而将确定性趋势分离出来 。
1)如果 ?=1,?=0,则 ( *) 式成为 一带位移的随机
游走过程,
Xt=?+Xt-1+?t ( **)
根据 ?的正负, Xt表现出明显的上升或下降趋势 。
这种趋势称为 随机性趋势 ( stochastic trend) 。
2)如果 ?=0,??0,则 ( *) 式成为一带时间趋势的
随机变化过程:
Xt=?+?t+?t ( ***)
根据 ?的正负, Xt表现出明显的上升或下降趋势 。
这种趋势称为 确定性趋势 ( deterministic trend) 。
考虑如下的含有一阶自回归的随机过程:
Xt=?+?t+?Xt-1+?t ( *)
其中,?t是一白噪声, t为一时间趋势 。
3) 如果 ?=1,??0,则 Xt包含有 确定性与随机性
两种趋势。
判断一个非平稳的时间序列, 它的趋势是随机性
的还是确定性的, 可通过 ADF检验中所用的第 3个
模型进行 。
该模型中已引入了表示确定性趋势的时间变量 t,
即分离出了确定性趋势的影响 。
因此, (1)如果检验结果表明所给时间序列有单位
根, 且时间变量前的参数显著为零, 则该序列显
示出随机性趋势 ;
(2)如果没有单位根, 且时间变量前的参数
显著地异于零, 则该序列显示出确定性趋势 。
随机性趋势可通过差分的方法消除
如:对式
Xt=?+Xt-1+?t
可通过差分变换为
?Xt= ?+?t
该时间序列称为 差分平稳过程( difference stationary
process) ;
确定性趋势无法通过差分的方法消除,而只能
通过除去趋势项消除,
如:对式
Xt=?+?t+?t
可通过除去 ?t变换为
Xt - ?t =?+?t
该时间序列是平稳的,因此称为 趋势平稳过程
( trend stationary process)。
最后需要说明的是,趋势平稳过程代表了一
个时间序列长期稳定的变化过程,因而用于进行
长期预测则是更为可靠的。