第九章时间序列计量经济学模型的理论与方法第一节 时间序列的平稳性及其检验第二节 随机时间序列模型的识别和估计第三节 协整分析与误差修正模型
§ 9.1 时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归模型二、时间序列数据的平稳性三、平稳性的图示判断四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程一、问题的引出:非平稳变量与经典回归模型
⒈ 常见的数据类型到目前为止,经典计量经济模型常用到的数据有:
时间序列数据 ( time-series data);
截面数据 (cross-sectional data)
平行 /面板数据 ( panel data/time-series cross-section
data)
★ 时间序列数据是最常见,也是最常用到的数据 。
⒉ 经典回归模型与数据的平稳性
经典回归分析 暗含 着一个重要 假设,数据是平稳的。
数据非平稳,大样本下的统计推断基础 ——“一致性”要求 ——被破怀。
经典回归分析的假设之一:解释变量 X是非随机变量
放宽该假设,X是随机变量,则需进一步要求:
(1)X与随机扰动项?不相关 ∶ Cov(X,?)=0
nXX i /)( 2 QnXXP in )/)(( 2lim依概率收敛:(2)
第( 2)条是为了满足统计推断中大样本下的“一致性”特性:
)?(lim
n
P
nx
nux
x
ux
i
ii
i
ii
/
/?
22
QnxP
nuxPP
i
ii
n
0
/lim
/lim?lim
2
第( 1)条是 OLS估计的需要
▲ 如果 X是非平稳数据 (如表现出向上的趋势),
则( 2)不成立,回归估计量不满足“一致性”,基于大样本的统计推断也就遇到麻烦。
因此:
注意,在双变量模型中:
表现在,两个本来没有任何因果关系的变量,却有很高的相关性 (有较高的 R2):
例如,如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。
在现实经济生活中,
情况往往是 实际的时间序列数据是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。
⒊ 数据非平稳,往往导致出现,虚假回归,
问题时间序列分析 模型方法 就是在这样的情况下,
以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论 。
时间序列分析 已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中 。
二、时间序列数据的平稳性时间序列分析中 首先遇到的问题 是关于时间序列数据的 平稳性 问题。
假定某个时间序列是由某一 随机过程 ( stochastic
process)生成的,即假定时间序列 {Xt}( t=1,2,… )
的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:
1)均值 E(Xt)=?是 与时间 t 无关的常数;
2)方差 Var(Xt)=?2是 与时间 t 无关的常数;
3)协方差 Cov(Xt,Xt+k)=?k是 只与时期间隔 k有关,
与时间 t 无关的常数;
则称该随机时间序列是 平稳的 ( stationary),而该随机过程是一 平稳随机过程 ( stationary stochastic
process)。
例 9.1.1,一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:
Xt=?t,?t~N(0,?2)
例 9.1.2,另一个简单的随机时间列序被称为 随机游走 ( random walk),该序列由如下随机过程生成:
Xt=Xt-1+?t
这里,?t是一个白噪声 。
该序列常被称为是一个 白噪声 ( white noise) 。
由于 Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的 。
为了检验该序列是否具有相同的方差,可假设 Xt的初值为 X0,则易知
X1=X0+?1
X2=X1+?2=X0+?1+?2
… …
Xt=X0+?1+?2+… +?t
由于 X0为常数,?t是一个白噪声,因此 Var(Xt)=t?2
即 Xt的方差与时间 t有关而非常数,它是一非平稳序列 。
容易知道该序列有相同的 均值,E(Xt)=E(Xt-1)
然而,对 X取 一阶差分 ( first difference),
Xt=Xt-Xt-1=?t
由于?t是一个白噪声,则序列 {Xt}是平稳的。
后面将会看到,如果一个时间序列是非平稳的,
它常常可通过取差分的方法而形成平稳序列 。
事实上,随机游走过程 是下面我们称之为 1阶自回归 AR(1)过程 的特例
Xt=?Xt-1+?t
不难验证,1)|?|>1时,该随机过程生成的时间序列是发散的,表现为持续上升 (?>1)或持续下降 (?<-1),
因此是非平稳的;
第二节中将证明,只有当 -1<?<1时,该随机过程才是平稳的。
2)?=1时,是一个随机游走过程,也是非平稳的 。
1阶自回归过程 AR(1)又是如下 k阶自回归 AR(K)过程 的特例:
Xt=?1Xt-1+?2Xt-2… +?kXt-k
该随机过程平稳性条件将在第二节中介绍。
三、平稳性检验的图示判断
给出一个随机时间序列,首先可通过该序列的 时间路径图 来粗略地判断它是否是平稳的。
一个 平稳的时间序列 在图形上往往表现出一种围绕其均值不断波动的过程;
而 非平稳序列 则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。
t
X
t
X
t t
(a ) (b )
图 9.1 平稳时间序列与非平稳时间序 列图
进一步的判断,
检验样本自相关函数及其图形定义随机时间序列的 自相关函数 ( autocorrelation
function,ACF) 如下:
k=?k/?0
自相关函数是关于滞后期 k的递减函数 (Why?)。
实际上,对一个随机过程只有一个实现(样本),
因此,只能计算 样本自相关函数 ( Sample
autocorrelation function)。
一个时间序列的样本自相关函数定义为:
n
t
t
kn
t
ktt
k
XX
XXXX
r
1
2
1?,3,2,1?k
易知,随着 k的增加,样本自相关函数下降且趋于零 。 但从下降速度来看,平稳序列要比非平稳序列快得多 。
k
r
k
r
1 1
0 k 0 k
( a ) ( b )
图 9.1.2 平稳时间序列与非平稳 时间序列样本相关图
注意,
确定样本自相关函数 rk某一数值是否足够接近于 0是非常有用的,因为它可 检验对应的自相关函数?k的真值是否为 0的假设。
Bartlett曾证明,如果时间序列由白噪声过程生成,
则对所有的 k>0,样本自相关系数近似地服从以 0
为均值,1/n 为方差的正态分布,其中 n为样本数 。
也可检验对所有 k>0,自相关系数都为 0的联合假设,这可通过如下 QLB统计量进行:
该统计量近似地服从自由度为 m的?2分布( m为滞后长度)。
因此,如果计算的 Q值大于显著性水平为?的临界值,则有 1-?的把握拒绝所有
k(k>0)同时为 0的假设。
例 9.1.3,表 9.1.1序列 Random1是通过一随机过程(随机函数)生成的有 19个样本的随机时间序列。
m
k
k
LB kn
rnnQ
1
2
)2(
表 9.1.1 一个纯随机序列与随机游 走序列的检验序号 R andom1 自相关系数
k
r
(k=0,1,… 17)
LB
Q
R andom2 自相关系数
k
r
(k=0,1,… 17)
LB
Q
1 - 0.031 K=0,1,0 0 0 - 0.031 1.000
2 0.188 K=1,- 0,0 5 1 0.059 0.157 0.480 5.116
3 0.108 K=2,- 0,3 9 3 3.679 0.264 0.018 5.123
4 - 0.455 K=3,- 0,1 4 7 4.216 - 0.191 - 0.069 5.241
5 - 0.426 K=4,0,2 8 0 6.300 - 0.616 0.028 5.261
6 0.387 K=5,0,1 8 7 7.297 - 0.229 - 0.016 5.269
7 - 0.156 K=6,- 0,3 6 3 11.332 - 0.385 - 0.219 6.745
8 0.204 K=7,- 0,1 4 8 12.058 - 0.181 - 0.063 6.876
9 - 0.340 K=8,0,3 1 5 15.646 - 0.521 0.126 7.454
10 0.157 K=9,0,1 9 4 17.153 - 0.364 0.024 7.477
11 0.228 K=10,- 0,1 3 9 18.010 - 0.136 - 0.249 10.229
12 - 0.315 K=11,- 0,2 9 7 22.414 - 0.451 - 0.404 18.389
13 - 0.377 K=12,0,0 3 4 22.481 - 0.828 - 0.284 22.994
14 - 0.056 K=13,0,1 6 5 24.288 - 0.884 - 0.088 23.514
15 0.478 K=14,- 0,1 0 5 25.162 - 0.406 - 0.066 23.866
16 0.244 K=15,- 0,0 9 4 26.036 - 0.162 0.037 24.004
17 - 0.215 K=16,0,0 3 9 26.240 - 0.377 0.105 25.483
18 0.141 K=17,0,0 2 7 26.381 - 0.236 0.093 27.198
19 0.236 0.000
容易验证,该样本序列的均值为 0,方差为 0.0789。
( a ) ( b )
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
2 4 6 8 10 12 14 16 18
R A N D O M 1
-0,8
-0,4
0,0
0,4
0,8
1,2
2 4 6 8 10 12 14 16 18
R A N D O M 1 A C
从图形看,它在其样本均值 0附近上下波动,且样本自相关系数迅速下降到 0,随后在 0附近波动且逐渐收敛于 0。
由于该序列由一随机过程生成,可以认为不存在序列相关性,因此 该序列为一白噪声。
根据 Bartlett的理论,?k~N(0,1/19)
因此任一 rk(k>0)的 95%的置信区间都将是可以看出,k>0时,rk的值确实落在了该区间内,
因此可以接受?k(k>0)为 0的假设 。
同样地,从 QLB统计量的计算值看,滞后 17期的计算值为 26.38,未超过 5%显著性水平的临界值
27.58,因此,可以接受所有的自相关系数?k(k>0)
都为 0的假设。
因此,该随机过程是一个平稳过程。
]4 4 9 7.0,4 4 9 7.0[]19/196.1,19/196.1[],[ 025.0025.0 ZZ
序列 Random2是由一随机游走过程
Xt=Xt-1+?t
生成的一随机游走时间序列样本。
其中,第 0项取值为 0,?t是由 Random1表示的白噪声。
( a ) ( b )
-1,0
-0,8
-0,6
-0,4
-0,2
0.0
0.2
0.4
2 4 6 8 10 12 14 16 18
R A N D O M 2
-0,8
-0,4
0,0
0,4
0,8
1,2
2 4 6 8 10 12 14 16 18
R AN D O M 2 AC
样本自相关系数显示,r1=0.48,落在了区间 [-0.4497,0.4497]之外,因此在 5%
的显著性水平上拒绝?1的真值为 0的假设。
该随机游走序列是非平稳的。
图形表示出,该序列具有相同的均值,
但从样本自相关图看,虽然自相关系数迅速下降到 0,但随着时间的推移,则在 0附近波动且呈发散趋势。
例 9.1,4 检验中国支出法 GDP 时间序列的平稳性。
表 9.1.2 1978~2000 年中国支出法 GDP (单位:亿元)
年份 GDP 年份 GDP 年份 GDP
1978 3 6 0 5,6 1986 1 0 1 3 2,8 1994 4 6 6 9 0,7
1979 4 0 7 3,9 1987 1 1 7 8 4 1995 5 8 5 1 0,5
1980 4 5 5 1,3 1988 14704 1996 6 8 3 3 0,4
1981 4 9 0 1,4 1989 16466 1997 7 4 8 9 4,2
1982 5 4 8 9,2 1990 1 8 3 1 9,5 1998 7 9 0 0 3,3
1983 6 0 7 6,3 1991 2 1 2 8 0,4 1999 8 2 6 7 3,1
1984 7 1 6 4,4 1992 2 5 8 6 3,6 2000 8 9 1 1 2,5
1985 8 7 9 2,1 1993 3 4 5 0 0,6
图形:表现出了一个持续上升的过程,可初步判断 是非平稳 的。
样本自相关系数:缓慢下降,再次表明它的 非平稳 性。
图 9.1,5 1978 ~ 2 0 0 0 年中国 GDP 时间序列及其样本自相关图
- 0,4
- 0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
2 4 6 8 10 12 14 16 18 20 22
G D P A C F
0
2 0 0 0 0
4 0 0 0 0
6 0 0 0 0
8 0 0 0 0
1 0 0 0 0 0
78 80 82 84 86 88 90 92 94 96 98 00
G D P
拒绝,该时间序列的自相关系数在滞后 1
期之后的值全部为 0的假设 。
结论,
1978~2000年间中国 GDP时间序列是非平稳序列 。
从滞后 18期的 QLB统计量看:
QLB(18)=57.18>28.86=?20.05
例 9.1.5 检验 § 2.10中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。
图 9,1,6 1 9 8 1 ~ 1 9 9 6 中国居民人均消费与人均 G D P 时间序列及其样本自 相关图
0
1 0 0 0
2 0 0 0
3 0 0 0
4 0 0 0
5 0 0 0
6 0 0 0
82 84 86 88 90 92 94 96
G D P P C C P C
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
G D P P C C P C
原图 样本自相关图
从图形上看,人均居民消费( CPC)与人均国内生产总值( GDPPC) 是非平稳的 。
从滞后 14期的 QLB统计量看:
CPC与 GDPPC序列的统计量计算值均为 57.18,
超过了显著性水平为 5%时的临界值 23.68。再次表明它们的非平稳性。
就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。
不过,第三节中将看到,如果两个非平稳时间序列是 协整 的,则传统的回归结果却是有意义的,而这两时间序列恰是 协整 的。
四、平稳性的单位根检验对时间序列的平稳性除了通过图形直观判断外,
运用统计量进行统计检验则是更为准确与重要的。
单位根检验( unit root test) 是统计检验中普遍应用的一种检验方法。
1,DF检验我们已知道,随机游走序列
Xt=Xt-1+?t
是 非平稳的,其中?t是白噪声 。
而该序列可看成是随机模型
Xt=?Xt-1+?t
中参数?=1时的情形。
也就是说,我们对式
Xt=?Xt-1+?t ( *)
做回归,如果确实发现?=1,就说随机变量 Xt有一个 单位根 。
( *)式可变形式成差分形式:
Xt=(1-?)Xt-1+?t
=?Xt-1+?t (**)
检验 ( *) 式是否存在单位根?=1,也可通过
( **) 式判断是否有? =0。
一般地,
检验一个时间序列 Xt的平稳性,可通过检验带有截距项的一阶自回归模型
Xt=?+?Xt-1+?t ( *)
中的参数?是否小于 1。
或者,检验其等价变形式
Xt=?+?Xt-1+?t ( **)
中的参数?是否小于 0 。
在第二节中将证明,( *)式中的参数?>1或?=1时,
时间序列是非平稳的 ;
对应于( **)式,则是?>0或? =0。
因此,针对式?Xt=?+?Xt-1+?t
我们关心的检验为,零假设 H0,?=0。
备择假设 H1,?<0
上述检验可通过 OLS法下的 t检验完成 。
然而,在零假设 ( 序列非平稳 ) 下,即使在大样本下 t统计量也是有偏误的 ( 向下偏倚 ),通常的 t
检验无法使用 。
Dicky和 Fuller于 1976年提出了这一情形下 t统计量服从的分布 ( 这时的 t统计量称为?统计量 ),即 DF
分布 ( 见表 9.1.3) 。
由于 t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布 。
因此,可通过 OLS法估计
Xt=?+?Xt-1+?t
并计算 t统计量的值,与 DF分布表中给定显著性水平下的临界值比较:
如果,t<临界值,则拒绝零假设 H0,?=0,
认为时间序列不存在单位根,是平稳的。
表 9,1,3 DF 分布临界值表样 本 容 量显著性水平 25 50 100 500 ∝ t 分布临界值
( n= ∝)
0.01 - 3.75 - 3.58 - 3.51 - 3.44 - 3.43 - 2.33
0.05 - 3.00 - 2.93 - 2.89 - 2.87 - 2.86 - 1.65
0.10 - 2.63 - 2.60 - 2.58 - 2.57 - 2.57 - 1.28
注意:在不同的教科书上有不同的描述,但是结果是相同的。
例如:“如果计算得到的 t统计量的绝对值大于临界值的绝对值,则拒绝 ρ=0”的假设,原序列不存在单位根,为平稳序列。
进一步的问题,在上述使用
Xt=?+?Xt-1+?t
对时间序列进行平稳性检验中,实际上 假定了时间序列是由具有白噪声随机误差项的一阶自回归过程 AR(1)生成的 。
但在实际检验中,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声,这样用 OLS法进行估计均会表现出随机误差项出现自相关 ( autocorrelation),
导致 DF检验无效 。
另外,如果时间序列包含有明显的随时间变化的某种趋势 ( 如上升或下降 ),则也容易导致上述检验中的 自相关随机误差项问题 。
为了保证 DF检验中随机误差项的白噪声特性,Dicky和
Fuller对 DF检验进行了扩充,形成了 ADF( Augment Dickey-
Fuller ) 检验 。
2,ADF检验
ADF检验是通过下面三个模型完成的:
模型 3 中的 t是时间变量,代表了时间序列随时间变化的某种趋势 ( 如果有的话 ) 。
检验的假设都是:针对 H1,?<0,检验 H0,?=0,
即存在一单位根 。 模型 1与另两模型的差别在于是否包含有常数项和趋势项 。
模型 1,
t
m
i
ititt
XXX
1
1
( * )
模型 2,t
m
i
ititt
XXX
1
1 ( ** )
模型 3,
t
m
i
ititt
XXtX
1
1
( *** )
实际检验时从模型 3开始,然后模型 2,模型 1。
何时检验拒绝零假设,即原序列不存在单位根,
为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型 1为止。
检验原理 与 DF检验相同,只是对模型 1,2,3
进行检验时,有各自相应的临界值。
表 9.1.4给出了三个模型所使用的 ADF分布临界值表。
表 9,1,4 不同模型使用的 ADF 分布临界值表模型 统计量 样本容量 0.01 0.025 0.05 0.10
25 -2.66 -2.26 -1.95 -1.60
50 -2.62 -2.25 -1.95 -1.61
100 -2.60 -2.24 -1.95 -1.61
250 -2.58 -2.23 -1.95 -1.61
500 -2.58 -2.23 -1.95 -1.61
1
>500 -2.58 -2.23 -1.95 -1.61
25 -3.75 -3.33 -3.00 -2.62
50 -3.58 -3.22 -2.93 -2.60
100 -3.51 -3.17 -2.89 -2.58
250 -3.46 -3.14 -2.88 -2.57
500 -3.44 -3.13 -2.87 -2.57
>500 -3.43 -3.12 -2.86 -2.57
25 3.41 2.97 2.61 2.20
50 3.28 2.89 2.56 2.18
100 3.22 2.86 2.54 2.17
250 3.19 2.84 2.53 2.16
500 3.18 2.83 2.52 2.16
2
>500 3.18 2.83 2.52 2.16
25 -4.38 -3.95 -3.60 -3.24
50 -4.15 -3.80 -3.50 -3.18
100 -4.04 -3.73 -3.45 -3.15
250 -3.99 -3.69 -3.43 -3.13
500 -3.98 -3.68 -3.42 -3.13
>500 -3.96 -3.66 -3.41 -3.12
25 4.05 3.59 3.20 2.77
50 3.87 3.47 3.14 2.75
100 3.78 3.42 3.11 2.73
250 3.74 3.39 3.09 2.73
500 3.72 3.38 3.08 2.72
>500 3.71 3.38 3.08 2.72
25 3.74 3.25 2.85 2.39
50 3.60 3.18 2.81 2.38
100 3.53 3.14 2.79 2.38
250 3.49 3.12 2.79 2.38
500 3.48 3.11 2.78 2.38
3
>500 3.46 3.11 2.78 2.38
同时估计出上述三个模型的适当形式,然后通过
ADF临界值表检验 零假设 H0,?=0。
1) 只要其中有一个模型的检验结果拒绝了零假设,
就可以认为时间序列是平稳的;
2) 当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的 。
这里所谓 模型适当的形式 就是在每个模型中选取适当的滞后差分项,以使模型的残差项是一个白噪声
( 主要保证不存在自相关 ) 。
一个简单的检验过程:
例 9.1.6 检验 1978~2000年间中国支出法 GDP时间序列的平稳性 。
211 01.150.10 0 9 3.027.2 2 933.1 0 1 1 tttt G D PG D PG D PTG D P
( - 1,2 6 ) ( 1,9 1 ) ( 0,3 1 ) ( 8,9 4 ) ( - 4,9 5 )
1)经过偿试,模型 3取了 2阶滞后:
通过 拉格朗日乘数检验 ( Lagrange multiplier test) 对随机误差项的自相关性进行检验:
LM( 1) =0.92,LM( 2) =4.16,
小于 5%显著性水平下自由度分别为 1与 2的?2分布的临界值,
可见不存在自相关性,因此该模型的设定是正确的 。
从?的系数看,t>临界值,不能拒绝存在单位根的零假设 。
时间 T的 t统计量小于 ADF分布表中的临界值,因此 不能拒绝不存在趋势项的零假设 。 需进一步检验模型 2。
2) 经试验,模型 2中滞后项取 2阶:
211 15.165.10 5 7.045.3 5 7 tttt GDPGDPGDPGDP
( - 0,9 0 ) ( 3,3 8 ) ( 1 0,4 0 ) ( - 5,6 3 )
LM ( 1 ) = 0,5 7 LM ( 2 ) = 2,8 5
LM检验表明模型残差不存在自相关性,因此该模型的设定是正确的 。
从 GDPt-1的参数值看,其 t统计量为正值,大于临界值,
不能拒绝存在单位根的零假设 。
常数项的 t统计量小于 AFD分布表中的临界值,不能拒绝不存常数项的零假设 。 需进一步检验模型 1。
3)经试验,模型 1中滞后项取 2阶:
LM检验表明模型残差项不存在自相关性,因此模型的设定是正确的 。
从 GDPt-1的参数值看,其 t统计量为正值,大于临界值,不能拒绝存在单位根的零假设 。
可断定中国支出法 GDP时间序列是非平稳的 。
211 1 9 4.17 0 1.10 6 3.0 tttt G D PG D PG D PG D P
( 4,1 5 ) ( 1 1,4 6 ) ( - 6,0 5 )
LM ( 1 ) = 0,1 7 LM ( 2 ) = 2,6 7
例 9.1.7 检验 § 2.10中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。
1)对 中国人均国内生产总值 GDPPC来说,经过偿试,三个模型的适当形式分别为模型 2,
211
4 2 5.10 4 0.06 5 2.002.1 9 2
tttt
G D P P CG D P P CG D P P CG D P P C
( - 1,7 8 ) ( 3,2 6 ) ( 0,0 8 ) ( - 2,9 6 )
43 4 0 3.14 1 2.0 tt G D P P CG D P P C
( - 0,6 7 ) ( - 2,2 0 )
L M ( 1 ) = 1,6 7 L M ( 2 ) = 1,7 1 L M( 3 ) = 6,2 8 L M ( 4 ) = 1 0,9 2
模型 3,
11 03.115.036.4508.75 ttt G D P P CG D P P CtG D P P C
( - 0,7 5 ) ( 1,9 3 ) ( - 1,0 4 ) ( 2,3 1 )
L M ( 1 ) =2,8 8 L M ( 2 ) = 1,8 6
三个模型中参数的估计值的 t统计量均大于各自的临界值,因此 不能拒绝存在单位根的零假设 。
结论,人均国内生产总值 ( GDPPC) 是非平稳的 。
模型 1,
211 9 7 5.08 7 5.01 9 6.0 tttt G D P P CG D P P CG D P P CG D P P C
( 2,6 3 ) ( 2,6 1 ) ( - 2,7 2 )
LM ( 1 ) = 0,2 0 LM ( 2 ) = 3,5 3
2)对于人均居民消费 CPC时间序列来说,三个模型的适当形式为模型 3,
11 4 6 2 7.13 6 4 6.098.3423.26 ttt C P CC P CtC P C
( - 0,4 7 7 ) ( 2,1 7 5 ) ( - 1,4 7 8 ) ( 2,3 1 8 )
L M ( 1 ) = 1,5 7 7 LM( 2 ) = 1,8 3 4
模型 2,
3211 0 2 7.06 5 5.15 0 8.05 4 5.088.79 ttttt C P CC P CC P CC P CC P C
( - 1,3 7 ) ( 3,3 7 ) ( 1,1 6 ) ( - 3,4 4 ) ( - 0,0 5 )
4824.1 tC P C
( - 3,0 3 )
L M( 1 ) = 3,5 7 L M( 2 ) = 4,1 0 L M( 3 ) = 4,8 9 L M( 4 ) = 1 0,9 9
三个模型中参数 CPCt-1的 t统计量的值均比 ADF
临界值表中各自的临界值大,不能拒绝该时间序列存在单位根的假设,
因此,可判断人均居民消费序列 CPC是非平稳的 。
模型 1,
43211 71.108.048.188.037.0 tttttt C P CC P CC P CC P CC P CC P C
( 3,6 0 ) ( 2,3 7 ) ( - 2,9 7 ) ( 0,1 2 ) ( - 2,6 8 )
LM( 1 ) = 1,8 3 L M ( 2 ) = 1,8 4 L M ( 3 ) = 2,0 0 LM( 4 ) = 2,3 3
五、单整、趋势平稳与差分平稳随机过程随机游走序列
Xt=Xt-1+?t
经差分后等价地变形为
Xt=?t
由于?t是一个白噪声,因此 差分后的序列 {?Xt}
是平稳的 。
⒈ 单整一般地,如果一个时间序列经过 d次差分后变成平稳序列,
则称原序列是 d 阶单整 ( integrated of d) 序列,记为 I(d)。
显然,I(0)代表一平稳时间序列。
现实经济生活中,
1)只有少数经济指标的时间序列表现为平稳的,如利率等 ;
2)大多数指标的时间序列是非平稳的,如一些价格指数常常是 2阶单整的,以不变价格表示的消费额,收入等常表现为 1
阶单整 。
大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的 。
但也有一些时间序列,无论经过多少次差分,都不能变为平稳的 。 这种序列被称为 非单整的 ( non-integrated) 。
如果一个时间序列经过一次差分变成平稳的,就称原序列是 一阶单整 ( integrated of 1) 序列,记为 I(1)。
例 9.1.8 中国支出法 GDP的单整性 。
经过试算,发现 中国支出法 GDP是 1阶单整的,
适当的检验模型为
1212 9 6 6.04 9 5.025.2 6 108.1 1 7 4 ttt G D PG D PtG D P
( - 1,9 9 ) ( 4,2 3 ) ( - 5,1 8 ) ( 6,4 2 )
2R
= 0,7 5 0 1 L M( 1 ) = 0,4 0 L M( 2 ) = 1,2 9
例 9.1.9 中国人均居民消费与人均国内生产总值的单整性 。
经过试算,发现 中国人均国内生产总值 GDPPC是 2阶单整的,适当的检验模型为
1
23 60.0
tt G D P P CG D P P C
( - 2,1 7 )
2R
= 0,2 7 7 8,L M ( 1 ) = 0,3 1 LM( 2 ) = 0,5 4
同样地,CPC也是 2阶单整的,适当的检验模型为
123 67.0 tt C P CC P C
( - 2,0 8 )
2R = 0,2 5 1 5 L M( 1 ) = 1,9 9 L M( 2 ) = 2,3 6
⒉ 趋势平稳与差分平稳随机过程前文已指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联关系,这时对这些数据进行回归,尽管有较高的 R2,但其结果是没有任何实际意义的 。 这种现象我们称之为 虚假回归 或 伪回归 ( spurious
regression) 。
如:用中国的劳动力时间序列数据与美国 GDP
时间序列作回归,会得到较高的 R2,但不能认为两者有直接的关联关系,而只不过它们有共同的趋势罢了,这种回归结果我们认为是虚假的 。
为了避免这种虚假回归的产生,通常的做法是引入作为趋势变量的时间,这样包含有时间趋势变量的回归,可以消除这种趋势性的影响 。
然而这种做法,只有当趋势性变量是 确定性的
( deterministic) 而非 随机性的 ( stochastic),
才会是有效的 。
换言之,如果一个包含有某种确定性趋势的非平稳时间序列,可以通过引入表示这一确定性趋势的趋势变量,而将确定性趋势分离出来 。
1)如果?=1,?=0,则 ( *) 式成为 一带位移的随机游走过程,
Xt=?+Xt-1+?t ( **)
根据?的正负,Xt表现出明显的上升或下降趋势 。
这种趋势称为 随机性趋势 ( stochastic trend) 。
2)如果?=0,0,则 ( *) 式成为一带时间趋势的随机变化过程:
Xt=?+?t+?t ( ***)
根据?的正负,Xt表现出明显的上升或下降趋势 。
这种趋势称为 确定性趋势 ( deterministic trend) 。
考虑如下的含有一阶自回归的随机过程:
Xt=?+?t+?Xt-1+?t ( *)
其中,?t是一白噪声,t为一时间趋势 。
3) 如果?=1,0,则 Xt包含有 确定性与随机性两种趋势。
判断一个非平稳的时间序列,它的趋势是随机性的还是确定性的,可通过 ADF检验中所用的第 3个模型进行 。
该模型中已引入了表示确定性趋势的时间变量 t,
即分离出了确定性趋势的影响 。
因此,(1)如果检验结果表明所给时间序列有单位根,且时间变量前的参数显著为零,则该序列显示出随机性趋势 ;
(2)如果没有单位根,且时间变量前的参数显著地异于零,则该序列显示出确定性趋势 。
随机性趋势可通过差分的方法消除如:对式
Xt=?+Xt-1+?t
可通过差分变换为
Xt=?+?t
该时间序列称为 差分平稳过程( difference stationary
process) ;
确定性趋势无法通过差分的方法消除,而只能通过除去趋势项消除,
如:对式
Xt=?+?t+?t
可通过除去?t变换为
Xt -?t =?+?t
该时间序列是平稳的,因此称为 趋势平稳过程
( trend stationary process)。
最后需要说明的是,趋势平稳过程代表了一个时间序列长期稳定的变化过程,因而用于进行长期预测则是更为可靠的。
§ 9.1 时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归模型二、时间序列数据的平稳性三、平稳性的图示判断四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程一、问题的引出:非平稳变量与经典回归模型
⒈ 常见的数据类型到目前为止,经典计量经济模型常用到的数据有:
时间序列数据 ( time-series data);
截面数据 (cross-sectional data)
平行 /面板数据 ( panel data/time-series cross-section
data)
★ 时间序列数据是最常见,也是最常用到的数据 。
⒉ 经典回归模型与数据的平稳性
经典回归分析 暗含 着一个重要 假设,数据是平稳的。
数据非平稳,大样本下的统计推断基础 ——“一致性”要求 ——被破怀。
经典回归分析的假设之一:解释变量 X是非随机变量
放宽该假设,X是随机变量,则需进一步要求:
(1)X与随机扰动项?不相关 ∶ Cov(X,?)=0
nXX i /)( 2 QnXXP in )/)(( 2lim依概率收敛:(2)
第( 2)条是为了满足统计推断中大样本下的“一致性”特性:
)?(lim
n
P
nx
nux
x
ux
i
ii
i
ii
/
/?
22
QnxP
nuxPP
i
ii
n
0
/lim
/lim?lim
2
第( 1)条是 OLS估计的需要
▲ 如果 X是非平稳数据 (如表现出向上的趋势),
则( 2)不成立,回归估计量不满足“一致性”,基于大样本的统计推断也就遇到麻烦。
因此:
注意,在双变量模型中:
表现在,两个本来没有任何因果关系的变量,却有很高的相关性 (有较高的 R2):
例如,如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。
在现实经济生活中,
情况往往是 实际的时间序列数据是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。
⒊ 数据非平稳,往往导致出现,虚假回归,
问题时间序列分析 模型方法 就是在这样的情况下,
以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论 。
时间序列分析 已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中 。
二、时间序列数据的平稳性时间序列分析中 首先遇到的问题 是关于时间序列数据的 平稳性 问题。
假定某个时间序列是由某一 随机过程 ( stochastic
process)生成的,即假定时间序列 {Xt}( t=1,2,… )
的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:
1)均值 E(Xt)=?是 与时间 t 无关的常数;
2)方差 Var(Xt)=?2是 与时间 t 无关的常数;
3)协方差 Cov(Xt,Xt+k)=?k是 只与时期间隔 k有关,
与时间 t 无关的常数;
则称该随机时间序列是 平稳的 ( stationary),而该随机过程是一 平稳随机过程 ( stationary stochastic
process)。
例 9.1.1,一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:
Xt=?t,?t~N(0,?2)
例 9.1.2,另一个简单的随机时间列序被称为 随机游走 ( random walk),该序列由如下随机过程生成:
Xt=Xt-1+?t
这里,?t是一个白噪声 。
该序列常被称为是一个 白噪声 ( white noise) 。
由于 Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的 。
为了检验该序列是否具有相同的方差,可假设 Xt的初值为 X0,则易知
X1=X0+?1
X2=X1+?2=X0+?1+?2
… …
Xt=X0+?1+?2+… +?t
由于 X0为常数,?t是一个白噪声,因此 Var(Xt)=t?2
即 Xt的方差与时间 t有关而非常数,它是一非平稳序列 。
容易知道该序列有相同的 均值,E(Xt)=E(Xt-1)
然而,对 X取 一阶差分 ( first difference),
Xt=Xt-Xt-1=?t
由于?t是一个白噪声,则序列 {Xt}是平稳的。
后面将会看到,如果一个时间序列是非平稳的,
它常常可通过取差分的方法而形成平稳序列 。
事实上,随机游走过程 是下面我们称之为 1阶自回归 AR(1)过程 的特例
Xt=?Xt-1+?t
不难验证,1)|?|>1时,该随机过程生成的时间序列是发散的,表现为持续上升 (?>1)或持续下降 (?<-1),
因此是非平稳的;
第二节中将证明,只有当 -1<?<1时,该随机过程才是平稳的。
2)?=1时,是一个随机游走过程,也是非平稳的 。
1阶自回归过程 AR(1)又是如下 k阶自回归 AR(K)过程 的特例:
Xt=?1Xt-1+?2Xt-2… +?kXt-k
该随机过程平稳性条件将在第二节中介绍。
三、平稳性检验的图示判断
给出一个随机时间序列,首先可通过该序列的 时间路径图 来粗略地判断它是否是平稳的。
一个 平稳的时间序列 在图形上往往表现出一种围绕其均值不断波动的过程;
而 非平稳序列 则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。
t
X
t
X
t t
(a ) (b )
图 9.1 平稳时间序列与非平稳时间序 列图
进一步的判断,
检验样本自相关函数及其图形定义随机时间序列的 自相关函数 ( autocorrelation
function,ACF) 如下:
k=?k/?0
自相关函数是关于滞后期 k的递减函数 (Why?)。
实际上,对一个随机过程只有一个实现(样本),
因此,只能计算 样本自相关函数 ( Sample
autocorrelation function)。
一个时间序列的样本自相关函数定义为:
n
t
t
kn
t
ktt
k
XX
XXXX
r
1
2
1?,3,2,1?k
易知,随着 k的增加,样本自相关函数下降且趋于零 。 但从下降速度来看,平稳序列要比非平稳序列快得多 。
k
r
k
r
1 1
0 k 0 k
( a ) ( b )
图 9.1.2 平稳时间序列与非平稳 时间序列样本相关图
注意,
确定样本自相关函数 rk某一数值是否足够接近于 0是非常有用的,因为它可 检验对应的自相关函数?k的真值是否为 0的假设。
Bartlett曾证明,如果时间序列由白噪声过程生成,
则对所有的 k>0,样本自相关系数近似地服从以 0
为均值,1/n 为方差的正态分布,其中 n为样本数 。
也可检验对所有 k>0,自相关系数都为 0的联合假设,这可通过如下 QLB统计量进行:
该统计量近似地服从自由度为 m的?2分布( m为滞后长度)。
因此,如果计算的 Q值大于显著性水平为?的临界值,则有 1-?的把握拒绝所有
k(k>0)同时为 0的假设。
例 9.1.3,表 9.1.1序列 Random1是通过一随机过程(随机函数)生成的有 19个样本的随机时间序列。
m
k
k
LB kn
rnnQ
1
2
)2(
表 9.1.1 一个纯随机序列与随机游 走序列的检验序号 R andom1 自相关系数
k
r
(k=0,1,… 17)
LB
Q
R andom2 自相关系数
k
r
(k=0,1,… 17)
LB
Q
1 - 0.031 K=0,1,0 0 0 - 0.031 1.000
2 0.188 K=1,- 0,0 5 1 0.059 0.157 0.480 5.116
3 0.108 K=2,- 0,3 9 3 3.679 0.264 0.018 5.123
4 - 0.455 K=3,- 0,1 4 7 4.216 - 0.191 - 0.069 5.241
5 - 0.426 K=4,0,2 8 0 6.300 - 0.616 0.028 5.261
6 0.387 K=5,0,1 8 7 7.297 - 0.229 - 0.016 5.269
7 - 0.156 K=6,- 0,3 6 3 11.332 - 0.385 - 0.219 6.745
8 0.204 K=7,- 0,1 4 8 12.058 - 0.181 - 0.063 6.876
9 - 0.340 K=8,0,3 1 5 15.646 - 0.521 0.126 7.454
10 0.157 K=9,0,1 9 4 17.153 - 0.364 0.024 7.477
11 0.228 K=10,- 0,1 3 9 18.010 - 0.136 - 0.249 10.229
12 - 0.315 K=11,- 0,2 9 7 22.414 - 0.451 - 0.404 18.389
13 - 0.377 K=12,0,0 3 4 22.481 - 0.828 - 0.284 22.994
14 - 0.056 K=13,0,1 6 5 24.288 - 0.884 - 0.088 23.514
15 0.478 K=14,- 0,1 0 5 25.162 - 0.406 - 0.066 23.866
16 0.244 K=15,- 0,0 9 4 26.036 - 0.162 0.037 24.004
17 - 0.215 K=16,0,0 3 9 26.240 - 0.377 0.105 25.483
18 0.141 K=17,0,0 2 7 26.381 - 0.236 0.093 27.198
19 0.236 0.000
容易验证,该样本序列的均值为 0,方差为 0.0789。
( a ) ( b )
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
2 4 6 8 10 12 14 16 18
R A N D O M 1
-0,8
-0,4
0,0
0,4
0,8
1,2
2 4 6 8 10 12 14 16 18
R A N D O M 1 A C
从图形看,它在其样本均值 0附近上下波动,且样本自相关系数迅速下降到 0,随后在 0附近波动且逐渐收敛于 0。
由于该序列由一随机过程生成,可以认为不存在序列相关性,因此 该序列为一白噪声。
根据 Bartlett的理论,?k~N(0,1/19)
因此任一 rk(k>0)的 95%的置信区间都将是可以看出,k>0时,rk的值确实落在了该区间内,
因此可以接受?k(k>0)为 0的假设 。
同样地,从 QLB统计量的计算值看,滞后 17期的计算值为 26.38,未超过 5%显著性水平的临界值
27.58,因此,可以接受所有的自相关系数?k(k>0)
都为 0的假设。
因此,该随机过程是一个平稳过程。
]4 4 9 7.0,4 4 9 7.0[]19/196.1,19/196.1[],[ 025.0025.0 ZZ
序列 Random2是由一随机游走过程
Xt=Xt-1+?t
生成的一随机游走时间序列样本。
其中,第 0项取值为 0,?t是由 Random1表示的白噪声。
( a ) ( b )
-1,0
-0,8
-0,6
-0,4
-0,2
0.0
0.2
0.4
2 4 6 8 10 12 14 16 18
R A N D O M 2
-0,8
-0,4
0,0
0,4
0,8
1,2
2 4 6 8 10 12 14 16 18
R AN D O M 2 AC
样本自相关系数显示,r1=0.48,落在了区间 [-0.4497,0.4497]之外,因此在 5%
的显著性水平上拒绝?1的真值为 0的假设。
该随机游走序列是非平稳的。
图形表示出,该序列具有相同的均值,
但从样本自相关图看,虽然自相关系数迅速下降到 0,但随着时间的推移,则在 0附近波动且呈发散趋势。
例 9.1,4 检验中国支出法 GDP 时间序列的平稳性。
表 9.1.2 1978~2000 年中国支出法 GDP (单位:亿元)
年份 GDP 年份 GDP 年份 GDP
1978 3 6 0 5,6 1986 1 0 1 3 2,8 1994 4 6 6 9 0,7
1979 4 0 7 3,9 1987 1 1 7 8 4 1995 5 8 5 1 0,5
1980 4 5 5 1,3 1988 14704 1996 6 8 3 3 0,4
1981 4 9 0 1,4 1989 16466 1997 7 4 8 9 4,2
1982 5 4 8 9,2 1990 1 8 3 1 9,5 1998 7 9 0 0 3,3
1983 6 0 7 6,3 1991 2 1 2 8 0,4 1999 8 2 6 7 3,1
1984 7 1 6 4,4 1992 2 5 8 6 3,6 2000 8 9 1 1 2,5
1985 8 7 9 2,1 1993 3 4 5 0 0,6
图形:表现出了一个持续上升的过程,可初步判断 是非平稳 的。
样本自相关系数:缓慢下降,再次表明它的 非平稳 性。
图 9.1,5 1978 ~ 2 0 0 0 年中国 GDP 时间序列及其样本自相关图
- 0,4
- 0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
2 4 6 8 10 12 14 16 18 20 22
G D P A C F
0
2 0 0 0 0
4 0 0 0 0
6 0 0 0 0
8 0 0 0 0
1 0 0 0 0 0
78 80 82 84 86 88 90 92 94 96 98 00
G D P
拒绝,该时间序列的自相关系数在滞后 1
期之后的值全部为 0的假设 。
结论,
1978~2000年间中国 GDP时间序列是非平稳序列 。
从滞后 18期的 QLB统计量看:
QLB(18)=57.18>28.86=?20.05
例 9.1.5 检验 § 2.10中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。
图 9,1,6 1 9 8 1 ~ 1 9 9 6 中国居民人均消费与人均 G D P 时间序列及其样本自 相关图
0
1 0 0 0
2 0 0 0
3 0 0 0
4 0 0 0
5 0 0 0
6 0 0 0
82 84 86 88 90 92 94 96
G D P P C C P C
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
G D P P C C P C
原图 样本自相关图
从图形上看,人均居民消费( CPC)与人均国内生产总值( GDPPC) 是非平稳的 。
从滞后 14期的 QLB统计量看:
CPC与 GDPPC序列的统计量计算值均为 57.18,
超过了显著性水平为 5%时的临界值 23.68。再次表明它们的非平稳性。
就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。
不过,第三节中将看到,如果两个非平稳时间序列是 协整 的,则传统的回归结果却是有意义的,而这两时间序列恰是 协整 的。
四、平稳性的单位根检验对时间序列的平稳性除了通过图形直观判断外,
运用统计量进行统计检验则是更为准确与重要的。
单位根检验( unit root test) 是统计检验中普遍应用的一种检验方法。
1,DF检验我们已知道,随机游走序列
Xt=Xt-1+?t
是 非平稳的,其中?t是白噪声 。
而该序列可看成是随机模型
Xt=?Xt-1+?t
中参数?=1时的情形。
也就是说,我们对式
Xt=?Xt-1+?t ( *)
做回归,如果确实发现?=1,就说随机变量 Xt有一个 单位根 。
( *)式可变形式成差分形式:
Xt=(1-?)Xt-1+?t
=?Xt-1+?t (**)
检验 ( *) 式是否存在单位根?=1,也可通过
( **) 式判断是否有? =0。
一般地,
检验一个时间序列 Xt的平稳性,可通过检验带有截距项的一阶自回归模型
Xt=?+?Xt-1+?t ( *)
中的参数?是否小于 1。
或者,检验其等价变形式
Xt=?+?Xt-1+?t ( **)
中的参数?是否小于 0 。
在第二节中将证明,( *)式中的参数?>1或?=1时,
时间序列是非平稳的 ;
对应于( **)式,则是?>0或? =0。
因此,针对式?Xt=?+?Xt-1+?t
我们关心的检验为,零假设 H0,?=0。
备择假设 H1,?<0
上述检验可通过 OLS法下的 t检验完成 。
然而,在零假设 ( 序列非平稳 ) 下,即使在大样本下 t统计量也是有偏误的 ( 向下偏倚 ),通常的 t
检验无法使用 。
Dicky和 Fuller于 1976年提出了这一情形下 t统计量服从的分布 ( 这时的 t统计量称为?统计量 ),即 DF
分布 ( 见表 9.1.3) 。
由于 t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布 。
因此,可通过 OLS法估计
Xt=?+?Xt-1+?t
并计算 t统计量的值,与 DF分布表中给定显著性水平下的临界值比较:
如果,t<临界值,则拒绝零假设 H0,?=0,
认为时间序列不存在单位根,是平稳的。
表 9,1,3 DF 分布临界值表样 本 容 量显著性水平 25 50 100 500 ∝ t 分布临界值
( n= ∝)
0.01 - 3.75 - 3.58 - 3.51 - 3.44 - 3.43 - 2.33
0.05 - 3.00 - 2.93 - 2.89 - 2.87 - 2.86 - 1.65
0.10 - 2.63 - 2.60 - 2.58 - 2.57 - 2.57 - 1.28
注意:在不同的教科书上有不同的描述,但是结果是相同的。
例如:“如果计算得到的 t统计量的绝对值大于临界值的绝对值,则拒绝 ρ=0”的假设,原序列不存在单位根,为平稳序列。
进一步的问题,在上述使用
Xt=?+?Xt-1+?t
对时间序列进行平稳性检验中,实际上 假定了时间序列是由具有白噪声随机误差项的一阶自回归过程 AR(1)生成的 。
但在实际检验中,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声,这样用 OLS法进行估计均会表现出随机误差项出现自相关 ( autocorrelation),
导致 DF检验无效 。
另外,如果时间序列包含有明显的随时间变化的某种趋势 ( 如上升或下降 ),则也容易导致上述检验中的 自相关随机误差项问题 。
为了保证 DF检验中随机误差项的白噪声特性,Dicky和
Fuller对 DF检验进行了扩充,形成了 ADF( Augment Dickey-
Fuller ) 检验 。
2,ADF检验
ADF检验是通过下面三个模型完成的:
模型 3 中的 t是时间变量,代表了时间序列随时间变化的某种趋势 ( 如果有的话 ) 。
检验的假设都是:针对 H1,?<0,检验 H0,?=0,
即存在一单位根 。 模型 1与另两模型的差别在于是否包含有常数项和趋势项 。
模型 1,
t
m
i
ititt
XXX
1
1
( * )
模型 2,t
m
i
ititt
XXX
1
1 ( ** )
模型 3,
t
m
i
ititt
XXtX
1
1
( *** )
实际检验时从模型 3开始,然后模型 2,模型 1。
何时检验拒绝零假设,即原序列不存在单位根,
为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型 1为止。
检验原理 与 DF检验相同,只是对模型 1,2,3
进行检验时,有各自相应的临界值。
表 9.1.4给出了三个模型所使用的 ADF分布临界值表。
表 9,1,4 不同模型使用的 ADF 分布临界值表模型 统计量 样本容量 0.01 0.025 0.05 0.10
25 -2.66 -2.26 -1.95 -1.60
50 -2.62 -2.25 -1.95 -1.61
100 -2.60 -2.24 -1.95 -1.61
250 -2.58 -2.23 -1.95 -1.61
500 -2.58 -2.23 -1.95 -1.61
1
>500 -2.58 -2.23 -1.95 -1.61
25 -3.75 -3.33 -3.00 -2.62
50 -3.58 -3.22 -2.93 -2.60
100 -3.51 -3.17 -2.89 -2.58
250 -3.46 -3.14 -2.88 -2.57
500 -3.44 -3.13 -2.87 -2.57
>500 -3.43 -3.12 -2.86 -2.57
25 3.41 2.97 2.61 2.20
50 3.28 2.89 2.56 2.18
100 3.22 2.86 2.54 2.17
250 3.19 2.84 2.53 2.16
500 3.18 2.83 2.52 2.16
2
>500 3.18 2.83 2.52 2.16
25 -4.38 -3.95 -3.60 -3.24
50 -4.15 -3.80 -3.50 -3.18
100 -4.04 -3.73 -3.45 -3.15
250 -3.99 -3.69 -3.43 -3.13
500 -3.98 -3.68 -3.42 -3.13
>500 -3.96 -3.66 -3.41 -3.12
25 4.05 3.59 3.20 2.77
50 3.87 3.47 3.14 2.75
100 3.78 3.42 3.11 2.73
250 3.74 3.39 3.09 2.73
500 3.72 3.38 3.08 2.72
>500 3.71 3.38 3.08 2.72
25 3.74 3.25 2.85 2.39
50 3.60 3.18 2.81 2.38
100 3.53 3.14 2.79 2.38
250 3.49 3.12 2.79 2.38
500 3.48 3.11 2.78 2.38
3
>500 3.46 3.11 2.78 2.38
同时估计出上述三个模型的适当形式,然后通过
ADF临界值表检验 零假设 H0,?=0。
1) 只要其中有一个模型的检验结果拒绝了零假设,
就可以认为时间序列是平稳的;
2) 当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的 。
这里所谓 模型适当的形式 就是在每个模型中选取适当的滞后差分项,以使模型的残差项是一个白噪声
( 主要保证不存在自相关 ) 。
一个简单的检验过程:
例 9.1.6 检验 1978~2000年间中国支出法 GDP时间序列的平稳性 。
211 01.150.10 0 9 3.027.2 2 933.1 0 1 1 tttt G D PG D PG D PTG D P
( - 1,2 6 ) ( 1,9 1 ) ( 0,3 1 ) ( 8,9 4 ) ( - 4,9 5 )
1)经过偿试,模型 3取了 2阶滞后:
通过 拉格朗日乘数检验 ( Lagrange multiplier test) 对随机误差项的自相关性进行检验:
LM( 1) =0.92,LM( 2) =4.16,
小于 5%显著性水平下自由度分别为 1与 2的?2分布的临界值,
可见不存在自相关性,因此该模型的设定是正确的 。
从?的系数看,t>临界值,不能拒绝存在单位根的零假设 。
时间 T的 t统计量小于 ADF分布表中的临界值,因此 不能拒绝不存在趋势项的零假设 。 需进一步检验模型 2。
2) 经试验,模型 2中滞后项取 2阶:
211 15.165.10 5 7.045.3 5 7 tttt GDPGDPGDPGDP
( - 0,9 0 ) ( 3,3 8 ) ( 1 0,4 0 ) ( - 5,6 3 )
LM ( 1 ) = 0,5 7 LM ( 2 ) = 2,8 5
LM检验表明模型残差不存在自相关性,因此该模型的设定是正确的 。
从 GDPt-1的参数值看,其 t统计量为正值,大于临界值,
不能拒绝存在单位根的零假设 。
常数项的 t统计量小于 AFD分布表中的临界值,不能拒绝不存常数项的零假设 。 需进一步检验模型 1。
3)经试验,模型 1中滞后项取 2阶:
LM检验表明模型残差项不存在自相关性,因此模型的设定是正确的 。
从 GDPt-1的参数值看,其 t统计量为正值,大于临界值,不能拒绝存在单位根的零假设 。
可断定中国支出法 GDP时间序列是非平稳的 。
211 1 9 4.17 0 1.10 6 3.0 tttt G D PG D PG D PG D P
( 4,1 5 ) ( 1 1,4 6 ) ( - 6,0 5 )
LM ( 1 ) = 0,1 7 LM ( 2 ) = 2,6 7
例 9.1.7 检验 § 2.10中关于人均居民消费与人均国内生产总值这两时间序列的平稳性。
1)对 中国人均国内生产总值 GDPPC来说,经过偿试,三个模型的适当形式分别为模型 2,
211
4 2 5.10 4 0.06 5 2.002.1 9 2
tttt
G D P P CG D P P CG D P P CG D P P C
( - 1,7 8 ) ( 3,2 6 ) ( 0,0 8 ) ( - 2,9 6 )
43 4 0 3.14 1 2.0 tt G D P P CG D P P C
( - 0,6 7 ) ( - 2,2 0 )
L M ( 1 ) = 1,6 7 L M ( 2 ) = 1,7 1 L M( 3 ) = 6,2 8 L M ( 4 ) = 1 0,9 2
模型 3,
11 03.115.036.4508.75 ttt G D P P CG D P P CtG D P P C
( - 0,7 5 ) ( 1,9 3 ) ( - 1,0 4 ) ( 2,3 1 )
L M ( 1 ) =2,8 8 L M ( 2 ) = 1,8 6
三个模型中参数的估计值的 t统计量均大于各自的临界值,因此 不能拒绝存在单位根的零假设 。
结论,人均国内生产总值 ( GDPPC) 是非平稳的 。
模型 1,
211 9 7 5.08 7 5.01 9 6.0 tttt G D P P CG D P P CG D P P CG D P P C
( 2,6 3 ) ( 2,6 1 ) ( - 2,7 2 )
LM ( 1 ) = 0,2 0 LM ( 2 ) = 3,5 3
2)对于人均居民消费 CPC时间序列来说,三个模型的适当形式为模型 3,
11 4 6 2 7.13 6 4 6.098.3423.26 ttt C P CC P CtC P C
( - 0,4 7 7 ) ( 2,1 7 5 ) ( - 1,4 7 8 ) ( 2,3 1 8 )
L M ( 1 ) = 1,5 7 7 LM( 2 ) = 1,8 3 4
模型 2,
3211 0 2 7.06 5 5.15 0 8.05 4 5.088.79 ttttt C P CC P CC P CC P CC P C
( - 1,3 7 ) ( 3,3 7 ) ( 1,1 6 ) ( - 3,4 4 ) ( - 0,0 5 )
4824.1 tC P C
( - 3,0 3 )
L M( 1 ) = 3,5 7 L M( 2 ) = 4,1 0 L M( 3 ) = 4,8 9 L M( 4 ) = 1 0,9 9
三个模型中参数 CPCt-1的 t统计量的值均比 ADF
临界值表中各自的临界值大,不能拒绝该时间序列存在单位根的假设,
因此,可判断人均居民消费序列 CPC是非平稳的 。
模型 1,
43211 71.108.048.188.037.0 tttttt C P CC P CC P CC P CC P CC P C
( 3,6 0 ) ( 2,3 7 ) ( - 2,9 7 ) ( 0,1 2 ) ( - 2,6 8 )
LM( 1 ) = 1,8 3 L M ( 2 ) = 1,8 4 L M ( 3 ) = 2,0 0 LM( 4 ) = 2,3 3
五、单整、趋势平稳与差分平稳随机过程随机游走序列
Xt=Xt-1+?t
经差分后等价地变形为
Xt=?t
由于?t是一个白噪声,因此 差分后的序列 {?Xt}
是平稳的 。
⒈ 单整一般地,如果一个时间序列经过 d次差分后变成平稳序列,
则称原序列是 d 阶单整 ( integrated of d) 序列,记为 I(d)。
显然,I(0)代表一平稳时间序列。
现实经济生活中,
1)只有少数经济指标的时间序列表现为平稳的,如利率等 ;
2)大多数指标的时间序列是非平稳的,如一些价格指数常常是 2阶单整的,以不变价格表示的消费额,收入等常表现为 1
阶单整 。
大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的 。
但也有一些时间序列,无论经过多少次差分,都不能变为平稳的 。 这种序列被称为 非单整的 ( non-integrated) 。
如果一个时间序列经过一次差分变成平稳的,就称原序列是 一阶单整 ( integrated of 1) 序列,记为 I(1)。
例 9.1.8 中国支出法 GDP的单整性 。
经过试算,发现 中国支出法 GDP是 1阶单整的,
适当的检验模型为
1212 9 6 6.04 9 5.025.2 6 108.1 1 7 4 ttt G D PG D PtG D P
( - 1,9 9 ) ( 4,2 3 ) ( - 5,1 8 ) ( 6,4 2 )
2R
= 0,7 5 0 1 L M( 1 ) = 0,4 0 L M( 2 ) = 1,2 9
例 9.1.9 中国人均居民消费与人均国内生产总值的单整性 。
经过试算,发现 中国人均国内生产总值 GDPPC是 2阶单整的,适当的检验模型为
1
23 60.0
tt G D P P CG D P P C
( - 2,1 7 )
2R
= 0,2 7 7 8,L M ( 1 ) = 0,3 1 LM( 2 ) = 0,5 4
同样地,CPC也是 2阶单整的,适当的检验模型为
123 67.0 tt C P CC P C
( - 2,0 8 )
2R = 0,2 5 1 5 L M( 1 ) = 1,9 9 L M( 2 ) = 2,3 6
⒉ 趋势平稳与差分平稳随机过程前文已指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联关系,这时对这些数据进行回归,尽管有较高的 R2,但其结果是没有任何实际意义的 。 这种现象我们称之为 虚假回归 或 伪回归 ( spurious
regression) 。
如:用中国的劳动力时间序列数据与美国 GDP
时间序列作回归,会得到较高的 R2,但不能认为两者有直接的关联关系,而只不过它们有共同的趋势罢了,这种回归结果我们认为是虚假的 。
为了避免这种虚假回归的产生,通常的做法是引入作为趋势变量的时间,这样包含有时间趋势变量的回归,可以消除这种趋势性的影响 。
然而这种做法,只有当趋势性变量是 确定性的
( deterministic) 而非 随机性的 ( stochastic),
才会是有效的 。
换言之,如果一个包含有某种确定性趋势的非平稳时间序列,可以通过引入表示这一确定性趋势的趋势变量,而将确定性趋势分离出来 。
1)如果?=1,?=0,则 ( *) 式成为 一带位移的随机游走过程,
Xt=?+Xt-1+?t ( **)
根据?的正负,Xt表现出明显的上升或下降趋势 。
这种趋势称为 随机性趋势 ( stochastic trend) 。
2)如果?=0,0,则 ( *) 式成为一带时间趋势的随机变化过程:
Xt=?+?t+?t ( ***)
根据?的正负,Xt表现出明显的上升或下降趋势 。
这种趋势称为 确定性趋势 ( deterministic trend) 。
考虑如下的含有一阶自回归的随机过程:
Xt=?+?t+?Xt-1+?t ( *)
其中,?t是一白噪声,t为一时间趋势 。
3) 如果?=1,0,则 Xt包含有 确定性与随机性两种趋势。
判断一个非平稳的时间序列,它的趋势是随机性的还是确定性的,可通过 ADF检验中所用的第 3个模型进行 。
该模型中已引入了表示确定性趋势的时间变量 t,
即分离出了确定性趋势的影响 。
因此,(1)如果检验结果表明所给时间序列有单位根,且时间变量前的参数显著为零,则该序列显示出随机性趋势 ;
(2)如果没有单位根,且时间变量前的参数显著地异于零,则该序列显示出确定性趋势 。
随机性趋势可通过差分的方法消除如:对式
Xt=?+Xt-1+?t
可通过差分变换为
Xt=?+?t
该时间序列称为 差分平稳过程( difference stationary
process) ;
确定性趋势无法通过差分的方法消除,而只能通过除去趋势项消除,
如:对式
Xt=?+?t+?t
可通过除去?t变换为
Xt -?t =?+?t
该时间序列是平稳的,因此称为 趋势平稳过程
( trend stationary process)。
最后需要说明的是,趋势平稳过程代表了一个时间序列长期稳定的变化过程,因而用于进行长期预测则是更为可靠的。