第6讲 单位根检验
由于虚假回归问题的存在,在回归模型中应避免直接使用不存在协积关系的非平稳变量。因此检验变量的平稳性是一个必须解决的问题。在第二章中介绍用相关图判断时间序列的平稳性。这一章则给出序列平稳性的严格的统计检验方法,即单位根检验。
在介绍单位根检验之前,先认识四种典型的非平稳随机过程。
4.1 四种典型的非平稳随机过程
(1)随机游走过程。
yt = yt-1 + ut,y0 = 0,ut ( IID(0,( 2) (4.1)
由第2章知,其均值为零,方差无限大,但不含有确定性时间趋势。(见图4.1a)。
 
图4.1a 由yt = yt-1+ ut,ut ( IID(0,1)生成的序列 图4.1b 深证成指(file:stock)
(2)随机趋势过程。
yt = ( + yt-1 + ut,y0 = 0,ut ( IID(0,( 2) (4.2)
其中(称作位移项(漂移项)。由上式知,E(y1)= ((过程初始值的期望)。将(4.2) 式作如下迭代变换,
yt = ( + yt-1 + ut = ( + (( + yt-2 + ut-1) + ut = … = ( t +y0 +
yt由确定性时间趋势项( t和y0 +组成。可以把y0 +看作随机的截距项。在不存在任何冲击ut的情况下,截距项为y0。而每个冲击ut都表现为截距的移动。每个冲击ut对截距项的影响都是持久的,导致序列的条件均值发生变化,所以称这样的过程为随机趋势过程(stochastic trend process),或有漂移项的非平稳过程(non-stationary process with drift),有漂移项的随机游走过程(random walk with drift)见图 4.2,虽然总趋势不变,但随机游走过程围绕趋势项上下游动。由上式还可以看出,(是确定性时间趋势项的系数(原序列yt的增长速度)。(为正时,趋势向上;(为负时,趋势向下。
 
图4.2a 由yt =0.1+ yt-1+ ut,ut (IID(0,1)生成的序列 图4.2b 由yt =- 0.1+ yt-1+ ut,ut ( IID(0,1)生成的序列
因为对yt作一次差分后,序列就平稳了,
( yt = yt - yt-1 = ( + ut (平稳过程)
所以也称yt为差分平稳过程(difference- stationary process)。(0是(yt序列的均值,原序列yt的增长速度。
(3)趋势平稳过程
yt = (0 + (1 t + ut,ut = (ut-1 + vt,(( <1,vt ( IID(0,(2)) (4.3)
(4.3)式中yt 与趋势值 (0+(1t不同,差值为ut。因为ut是平稳的,yt只会暂时背离趋势。yt+k的长期预测值将趋近于趋势线(0+(1(t+k)。所以称其为趋势平稳过程(trend stationary process)。趋势平稳过程由确定性时间趋势(1 t所主导。趋势平稳过程见图 4.3,属于非平稳过程。
趋势平稳过程也称为退势平稳过程,因为减去趋势后,其为平稳过程,yt - (1t = (0+ ut。
整理上式,得趋势平稳过程的另一种表达形式。
yt = ( + ( t + (yt-1 + vt,(( <1,vt ( IID(0,(2))
其中( = (0 -( ((0-(1),( = (1(1-()。当( < 1时,必然有( (0,yt为退势平稳过程;当( = 1时,必然有( =0,yt为随机趋势过程。
趋势平稳过程的差分过程是过度差分过程。(yt = (1 + ut - ut-1。移动平均特征方程中含有单位根。所以应该用退势的方法获得平稳过程。yt - (1t = (0 + ut。
(4.3)式中的ut是AR(1)过程。进一步放宽时,可以看成是ARMA(p,q)过程;严格时可以看成是白噪声过程。
 
图4.3 yt = 0.05+0.1 t + AR(1),(=0.8 生成的序列 图4.4 yt = 0.01+ 0.01t + yt-1+ ut,ut ( IID(0,1)生成的序列
(4)趋势非平稳过程
yt = ( + ( t + yt-1 + ut,y0 = 0,ut ( IID(0,( 2) (4.4)
其中(0称作位移项(漂移项),( t称为趋势项。 (4.4) 式是含有随机趋势和确定性趋势的混合随机过程(见图 4.4)。对上式进行迭代运算
yt = ( + ( t + yt-1 + ut = ( + ( t + (( + ( (t-1) + yt-2 + ut-1) + ut
= … = y0 + ( t + ( [t + (t-1) +…+2 +1 ] +
= y0 + ( t +( 1+ t ) t += (( +) t +t 2 +,(设定y0 = 0)
趋势非平稳过程是含有随机趋势和确定性趋势的混合过程。趋势项中包括t的1次和2次项。这种过程在经济问题中非常少见。
由上面4种随机过程走势可以看出,对于对数的宏观经济变量,趋势平稳过程和退势平稳过程是两种最常见的表现形式。
下面分析随机趋势过程与平稳的AR(1)过程的区别。对于如下过程
yt = ( + (1 yt-1 + ut
当(1 = 1时,yt是一个随机趋势过程;当((1( ( 1时,yt是一个均值为的平稳过程。
随机趋势过程yt = 0.1 + yt-1 + ut和带有漂移项的平稳过程yt = 4 +0.6 yt-1 + ut的比较见下图。差别在于随机趋势过程的自回归系数为1,带有漂移项的平稳过程的自回归系数绝对值小于1。

图4.5 随机趋势过程和带有漂移项的平稳过程的比较
实际经济序列的增长趋势常常是指数形式的。如中国的国民收入和消费见图4.6。然而无论随机趋势过程还是趋势平稳过程所设定的趋势都是线性的。这是为什么?原因是原序列取对数后,趋势项常是线性的。例如yt = e ( t,则
Ln yt = ( t
所以用经济序列建立模型之前应先取对数。这样既可以用线性趋势模型描述,又可以消除异方差。对数的中国国民收入和消费见图4.7。
 
图4.6 中国的国民收入和消费 图4.7 对数的中国国民收入和消费
对于单位根过程(差分平稳),每个随机冲击都具有长记忆性,方差趋于无穷大,其均值概念变得毫无意义;
对于退势平稳过程,随机成分是一个白噪声或平稳的ARMA过程,所以接受冲击后只具有有限记忆能力,其影响会很快消失,由其引起的对趋势的偏离只是暂时的。对退势平稳序列,只要正确估计出其确定性趋势,即可实现长期趋势与平稳波动部分的分离。
大量的实证研究显示,不变价格的宏观经济序列为退势平稳过程的可能性远大于名义价格的宏观经济序列。中国的GDP、固定资产投资和居民消费等序列均为退势平稳序列。这意味着,改革开放以来,中国的经济增长虽然因为受到各种冲击因素的影响而出现不同程度的偏离趋势的上下波动,但这种偏离是暂时的,从较长时期来看,经济增长总体上沿着确定的均衡增长路径平稳运行。
而随机趋势过程虽然也有长期‘引力线’,但其数据生成过程含有单位根,随机冲击对它具有持续的长期影响。只有通过差分才能使其平稳,属于差分平稳过程。
例:给出对数的中国GDP序列(实线)如图4.8。无论采取线性退势,还是2次退势,所得序列都是平稳序列。

图4.8a 线性趋势 图4.8b 2次趋势
 
图4.9 ADF= -3.05 < ADF(0.05) = -1.95 图4.10 ADF= -4.36 < ADF(0.05) = -1.95
4.2 DF统计量和t统计量的分布特征在介绍检验方法之前,先讨论回归系数统计量的分布。
情形1:
数据生成过程(DGP):yt = yt-1 + ut,y0 = 0,ut ( IID(0,( 2) (4.1)
OLS估计式: (4.5)
H0:( = 1;H1:( ( 1
讨论的极限分布和有限样本分布特征。
以OLS估计式为例,若真值( = 0,统计量
=( t (T-1),(4.6)
的极限分布为标准正态分布。 若真值( ( ( < 1,统计量
=  (4.5)
渐近服从标准正态分布。根据中心极限定理,当T ( ( 时,
( N (0,( 2 (1- ( 2 ) ) (4.6)
如果数据生成过程是yt = yt-1 + ut,yt 是非平稳的。在( = 1条件下,统计量的极限分布发生退化(方差为零)。
在( = 1条件下,OLS估计式是,统计量服从什么分布呢?分析如下:
=  (4.9)
因已知y0 = 0,
== + = 1 +
-1= (4.10)
由上一章,当T( ∞,
T -2( (4.11)
T -1([( 2 (W(1) ) 2 - ( 2 ] = (W(1) 2 – 1),(4.13)
是Op(T)的。是Op (T 2 )的。所以当T ( ( 时,
plim() = plim(1 + ) ( 1
可见是 ( =1的一致估计量。
由(4.10)式、(4.11) 式和 (4.13) 式,当T ( ( 时,
T (- 1) =  ( 
(- 1) 是Op (T -1 )的。
 
T=100,模拟1万次的T (- 1)的分布
T (- 1)是检验单位根的一个常用统计量。有三个结论如下:
(1)由上式知是Op(T –1 )的。由 (4.10) 式知,当yt 平稳时,是Op(T –1 /2 )的。所以前者的收敛速度更快。以速度T接近真值( = 1,所以称是( = 1的超一致估计量。
(2)T(- 1)的极限分布是标准维纳过程的函数。它不服从正态分布,也不服从t分布。
(3) 因为T(- 1) 不服从t分布,所以假设检验时不能查t临界值表。
检验单位根的另一个统计量是统计量。统计量在这里称DF统计量。当T ( ( 时,
 (4.15)
DF统计量是Op(1 )的,其渐近分布与( 无关。
由于该极限分布无法用解析的方法求解,一般都是用模拟和数值计算的方法研究DF统计量的有限样本分布。
有限样本条件下的DF统计量的分布特征(蒙特卡罗模拟结果)。
表1 DF分布百分位数表生成过程
T

和估计式
0.01
0.025
0.05
0.10
0.90
0.95
0.975
0.99
25
- 2.66
- 2.26
- 1.95
- 1.60
0.92
1.33
1.70
2.16
50
- 2.62
- 2.25
- 1.95
- 1.61
0.91
1.31
1.66
2.08
情形1
100
- 2.60
- 2.24
- 1.95
- 1.61
0.90
1.29
1.64
2.03
250
- 2.58
- 2.23
- 1.95
- 1.62
0.89
1.29
1.63
2.01
500
- 2.58
- 2.23
- 1.95
- 1.62
0.89
1.28
1.62
2.00
(
- 2.58
- 2.23
- 1.95
- 1.62
0.89
1.28
1.62
2.00
注:数据生成过程(DGP):yt = yt-1 + ut,y0 = 0,ut ( IID(0,( 2),OLS估计式:。
T=100,模拟1万次的DF统计量的分布结果。
(file:5simudf1)
情形2:
数据生成过程(DGP):yt = yt-1 + ut,y0 = 0,ut ( IID(0,( 2) (4.1)
OLS估计式: (4.16)
H0:( = 0;( = 1; H1:( ( 0;( ( 1
讨论、的极限分布和有限样本分布特征。统计量= DF、的极限分布都是Wiener过程的泛函。可以证明,当T ( ( 时,

推导见Hamilton《时间序列分析》(17.4.36)式。DF统计量是O(1 )的。
不再服从t分布。的极限分布是Wiener过程的泛函。

统计量是Op(1 )的。(推导见张晓峒,攸频:DF检验式中漂移项和趋势项的t 统计量研究,《数量经济技术经济研究》,2006,2,p,126-137。)
有限样本条件下的DF统计量的分布特征(蒙特卡罗模拟结果)。
表2 DF分布百分位数表生成过程
T

和估计式
0.01
0.025
0.05
0.10
0.90
0.95
0.975
0.99
25
- 3.75
- 3.33
- 3.00
- 2.63
- 0.37
0.00
0.34
0.72
50
- 3.58
- 3.22
- 2.93
- 2.60
- 0.40
- 0.03
0.29
0.66
情形2
100
- 3.51
- 3.17
- 2.89
- 2.58
- 0.42
- 0.05
0.26
0.63
250
- 3.46
- 3.14
- 2.88
- 2.57
- 0.42
- 0.06
0.24
0.62
500
- 3.44
- 3.13
- 2.87
- 2.57
- 0.43
- 0.07
0.24
0.61
(
- 3.43
- 3.12
- 2.86
- 2.57
- 0.44
- 0.07
0.23
0.60
注:数据生成过程(DGP):yt = yt-1 + ut,y0 = 0,ut ( IID(0,( 2),OLS估计式:。
T=100,模拟1万次的DF统计量的分布结果。
(file:5simu-df2)
表3,估计式中的分布(模拟5万次)
T
CV0.005
CV0.025
CV0.05
CV0.95
CV0.975
CV0.995
30
-3.71607
-2.98201
-2.64194
2.51020
2.86467
3.56780
50
-3.57894
-2.91253
-2.58341
2.52826
2.88722
3.58953
100
-3.47011
-2.85596
-2.54997
2.55833
2.88539
3.50376
150
-3.44065
-2.85378
-2.54470
2.57503
2.90392
3.56663
200
-3.42902
-2.82471
-2.52979
2.54631
2.87799
3.56599
250
-3.37406
-2.82317
-2.53374
2.54035
2.88494
3.56644
注:(M.File:unitroot02)
注:数据生成过程为yt = yt-1 + ut,ut ( IID(0,1)。OLS估计式:
T = 100条件下,的分布见图。
(file:5simu-df2)
情形3:
数据生成过程(DGP):yt = ( + yt-1 + ut,(是否为零均可,y0 = 0,ut ( IID(0,( 2)
OLS估计式: (4.17)
为防止( 不为零时从而使估计式引入时间趋势项,导致解释变量多重共线性,等价的OLS估计式是

其中,
H0:( = (0;( = 1;( = 0。相当于:H0:(* = 0;(* = 1;(* = (0
H1:( ( (0;( ( 1;( ( 0
讨论DF=、、的极限分布和有限样本分布特征。可以证明,当T ( ( 时,

其中
F2=+
(A( = 
推导见Hamilton《时间序列分析》(17.4.55)式。DF统计量是Op(1 )的,其渐近分布既不依赖于(,也不依赖于(。
,服从的是如下极限分布。


其中F1和F2都是Wiener过程的泛函。,统计量是Op(1 )的,其渐近分布既不依赖于(,也不依赖于(。
有限样本条件下的DF统计量的分布特征(蒙特卡罗模拟结果)。
表4 DF分布百分位数表
生成过程
T

和估计式
0.01
0.025
0.05
0.10
0.90
0.95
0.975
0.99
25
- 4.38
- 3.95
- 3.60
- 3.24
- 1.14
- 0.80
- 0.50
- 0.15
50
- 4.15
- 3.80
- 3.50
- 3.18
- 1.19
- 0.87
- 0.58
- 0.24
情形3
100
- 4.04
- 3.73
- 3.45
- 3.15
- 1.22
- 0.90
- 0.62
- 0.28
250
- 3.99
- 3.69
- 3.43
- 3.13
- 1.23
- 0.92
- 0.64
- 0.31
500
- 3.98
- 3.68
- 3.42
- 3.13
- 1.24
- 0.93
- 0.65
- 0.32
(
- 3.96
- 3.66
- 3.41
- 3.12
- 1.25
- 0.94
- 0.66
- 0.33
注:数据生成过程:yt = yt-1 + ut,y0 = 0,ut ( IID(0,( 2),OLS估计式:。
T=100,模拟1万次的DF统计量的分布结果。
(file:5simu-df3)
有限样本条件下的分布的估计结果见表4。
表5,估计式中的分布(模拟5万次)
T
CV0.005
CV0.025
CV0.05
CV0.95
CV0.975
CV0.995
30
-4.07560
-3.32138
-2.92816
2.80000
3.19462
3.99269
50
-3.94834
-3.25371
-2.86465
2.83257
3.19808
3.87910
100
-3.85926
-3.17450
-2.81506
2.87025
3.21765
3.83482
150
-3.76003
-3.09851
-2.77422
2.89550
3.26019
3.90150
200
-3.76003
-3.10629
-2.77177
2.89391
3.25672
3.90993
250
-3.74954
-3.10582
-2.77119
2.91474
3.29941
3.95097
注:(M.File:unitroot01)
T =100,模拟1万次的分布见图。
(file:5simu-df3)
有限样本条件下的分布的估计结果见表5
表6,估计式中的分布(模拟5万次)
T
CV0.005
CV0.025
CV0.05
CV0.95
CV0.975
CV0.995
30
-3.96132
-3.20650
-2.83006
2.83372
3.23184
4.04315
50
-3.90374
-3.19471
-2.84496
2.78472
3.14982
3.85176
100
-3.85822
-3.25775
-2.91985
2.66820
3.02138
3.70615
150
-3.95734
-3,29940
-2.96328
2.65191
2.99519
3.62287
200
-3.91488
-3.31539
-2.96642
2.63986
2.96134
3.57071
250
-3.97728
-3.32261
-2.96771
2.63847
2.97243
3.56027
注:(M.File:unitroot01)
T =100,模拟1万次的分布见图。
(file:5simu-df3)
 
图4.14a,分布的蒙特卡罗模拟(T =100,模拟1万次)图4.14b ,分布与DF分布比较
( = -1时的DF的分布是( = 1时的DF分布的镜像,所以只研究( = 1条件下DF的分布即可。对于经济问题,很少出现 ( = -1的情形。
4.3 DF统计量的有限样本分布特征总结以模型 (4.1)为条件,取样本容量T = 100,用蒙特卡罗方法,分别用(4.17)、(4.16)和(4.15)式各模拟10000次得到的DF的分布见图4.11。黑、蓝、红色直方图分别代表(4.17)、(4.16)和(4.15)式中DF统计量的分布。随着确定项的增加,分布越来越向左移。蓝色DF分布近似于t分布,但整体向左大约移动了1.6个单位。

图4.11 (4.1) ( (4.3) 的DF统计量分布的蒙特卡罗模拟(T=50)
Full (1976) 用蒙特卡罗模拟方法得到T(- 1) 和DF统计量的百分位数表,分别见附表5和6。
DF分布百分位数表
模型
T

0.01
0.025
0.05
0.10
0.90
0.95
0.975
0.99
25
- 2.66
- 2.26
- 1.95
- 1.60
0.92
1.33
1.70
2.16
50
- 2.62
- 2.25
- 1.95
- 1.61
0.91
1.31
1.66
2.08
(a)
100
- 2.60
- 2.24
- 1.95
- 1.61
0.90
1.29
1.64
2.03
模型 (4.1)
250
- 2.58
- 2.23
- 1.95
- 1.62
0.89
1.29
1.63
2.01
500
- 2.58
- 2.23
- 1.95
- 1.62
0.89
1.28
1.62
2.00
(
- 2.58
- 2.23
- 1.95
- 1.62
0.89
1.28
1.62
2.00
25
- 3.75
- 3.33
- 3.00
- 2.63
- 0.37
0.00
0.34
0.72
50
- 3.58
- 3.22
- 2.93
- 2.60
- 0.40
- 0.03
0.29
0.66
(b)
100
- 3.51
- 3.17
- 2.89
- 2.58
- 0.42
- 0.05
0.26
0.63
模型 (4.2)
250
- 3.46
- 3.14
- 2.88
- 2.57
- 0.42
- 0.06
0.24
0.62
500
- 3.44
- 3.13
- 2.87
- 2.57
- 0.43
- 0.07
0.24
0.61
(
- 3.43
- 3.12
- 2.86
- 2.57
- 0.44
- 0.07
0.23
0.60
25
- 4.38
- 3.95
- 3.60
- 3.24
- 1.14
- 0.80
- 0.50
- 0.15
50
- 4.15
- 3.80
- 3.50
- 3.18
- 1.19
- 0.87
- 0.58
- 0.24
(c)
100
- 4.04
- 3.73
- 3.45
- 3.15
- 1.22
- 0.90
- 0.62
- 0.28
模型 (4.3)
250
- 3.99
- 3.69
- 3.43
- 3.13
- 1.23
- 0.92
- 0.64
- 0.31
500
- 3.98
- 3.68
- 3.42
- 3.13
- 1.24
- 0.93
- 0.65
- 0.32
(
- 3.96
- 3.66
- 3.41
- 3.12
- 1.25
- 0.94
- 0.66
- 0.33
t(()
N(0,1)
- 2.33
- 1.96
- 1.65
- 1.28
1.28
1.65
1.96
2.33
注:1,适用于模型(4.1),(4.2)和(4.3),条件( = 1。T:样本容量,(:检验水平。
2,摘自Fuller (1976)第373页。
4.4 进一步讨论
以上三个自回归模型对于研究实际经济变量太严格,还应该进一步讨论在AR(p) 模型条件下,随机误差项非白噪声条件下,检验用统计量的分布特征。
(1)对于AR(p)过程
yt = (1 yt-1 + (2 yt-2 + … + ( p yt-p + u t (4.18)
当yt中含有单位根时,可以通过如下模型研究 ( = 1条件下,检验用统计量DF的分布特征。
yt = ( yt-1 +  + ut (4.19)
其中( = ,(j* = -,j = 1,2,…,p – 1
(i 为 (4.18) 式中的自回归系数。为什么可以通过 (4.19) 式进行研究呢?解释如下。(4.18) 式可以用回归算子表示为
( (L) yt = ut (4.20)
若yt 中含有一个单位根,上式可以表达为
( (L)* (1 – L ) yt = ( (L)* ( yt = u t (4.21)
其中 ( (L)* 表示从p阶自回归算子 ( (L) 中分离出因子 (1 – L ) 后所得的p – 1 阶自回归算子。可见对于( yt,(4.21)式是一个p – 1 阶的自回归模型。
下面以AR (3) 过程为例,验证关系式 (4.10)。有
yt = (1 yt-1 + (2 yt-2 + (3 yt-3 + ut
上式右侧同时加减 (2 yt-1,(3 yt-1,(3 yt-2 然后合并同类项,
yt = (1 yt-1 + (2 yt-1 + (3 yt-1 - (2 yt-1 + (2 yt-2 - (3 yt-1 - (3 yt-2 + (3 yt-2 + (3 yt-3 + ut
= ((1 + (2 + (3) yt-1 - (2 ( yt-1 - (3 ( yt-1 - (3 ( yt-2 + ut
= ((1 + (2 + (3) yt-1 - ((2 + (3) ( yt-1 - (3 ( yt-2 + ut
= ( yt-1 - (1* ( yt-1 - (2* ( yt-2 + ut
= ( yt-1 - + ut
其中,
( = 
(j* = -,j = 1,2,
(4.19) 式中相对于( 的DF统计量的分布与 (4.1) 式中DF统计量的分布近似相同。 (4.19) 式中的差分项 ( yt-j,j = 1,2,…,p – 1之所以不会对DF统计量的分布产生影响是因为当 yt ( I(1),则全部 ( yt-j ( I(0)。yt与 ( yt-j的交叉积渐进被忽略。 从而使 (4.19) 式中 ( 的DF统计量的分布与 (4.1) 式中 ( 的DF统计量渐近相同。
当模型 (4.18) 中含有位移项 ( 和趋势项 ( t时,对应( 的DF统计量的分布分别与模型 (4.2) 和模型 (4.3) 中DF统计量的分布相同。
(2)现在进一步放宽对yt的限制。考虑如下AR(1) 过程
yt = ( yt-1 + ut,(4.22)
其中允许随机项ut是一个ARMA(p,q) 过程,甚至参数 p,q 的值也可未知。则可以用下式研究 ( 和DF统计量的分布。
yt = yt-1 + ( yt-i + ,(4.23)
若 ( = 1,上式是一个差分的AR(k) 过程。加入 ( yt 滞后项的目的是捕捉 (4.22) 式误差项ut中的自相关。(ut的自相关项对于模型 (4.22) 来说是移动平均项,所以 ( yt 滞后项的加入可以捕捉之。)因为可逆的移动平均过程可以转化为一个无限阶的自回归过程,所以对ut而言的移动平均项vt,t = 1,…,q完全可以通过增加ut 的滞后项而吸收。进而被足够的( yt-i项所吸收。从而使近似为一个白噪声过程。
Said-Dickey (1984) 证明 (4.23) 式中 ( 的DF统计量的分布与 (4.1) 式中 ( 的DF统计量的分布类似。 当 (4.23) 式中加入位移项 ( 和趋势项( t时,( 的DF分布分别与 (4.16) 式和 (4.17) 式中 ( 的DF分布类似。
4.5 单位根检验对于时间序列yt可用如下自回归模型检验单位根。
yt = ( yt-1 + ut,(4.24)
零假设和备择假设分别是,
H0:( = 1,( yt非平稳)
H1:( < 1,( yt平稳)
在零假设成立条件下,用DF统计量进行单位根检验。
DF = =  (4.25)
其中
s(u) =  (4.26)
以附表6中a部分的相应百分位数作为临界值,若用样本计算的
DF > 临界值,则接受H0,yt 非平稳;
DF < 临界值,则拒绝H0,yt是平稳的。

图4.12 单位根检验示意图
注意
1,因为用DF统计量作单位根检验,所以此检验称作DF检验(由Dickey-Fuller提出)。
2,DF检验采用的是OLS估计。
3,DF检验是左单端检验。因为 ( > 1意味着强非平稳,( < 1意味着平稳。当接受( < 1,拒绝 ( = 1时,自然也应拒绝( > 1。
4,用模型 (4.24) 检验单位根,临界值应从附表6的a部分查找。
上述DF检验还可用另一种形式表达。(4.24) 式两侧同减yt-1,得
( yt = (( -1) yt-1 + ut,(4.27)
令 ( = ( - 1,代入上式,
( yt = ( yt-1 + ut,(4.28)
与上述零假设和备择假设相对应,用于模型 (4.27) 的零假设和备择假设是
H0:( = 0,( yt非平稳)
H1:( < 0,( yt平稳)
这种变化并不影响DF统计量的值,所以检验规则仍然是
若DF > 临界值,则yt是非平稳的;
若DF < 临界值,则yt是平稳的。
这种检验方法是DF检验的常用方法。(便于在计算机上实现)
举例说明以上两种单位根检验方法的DF值相同。用同一组数据yt 得到的两个回归结果如下(括号内给出的是标准差),
 = 0.1474 yt-1,(4.29)
(0.1427) s.e,= 0.87,DW = 1.93
(= - 0.8526 yt-1 + ut,(4.30)
(0.1427) s.e,= 0.87,DW = 1.93
对应 (4.29) 式,因零假设是 ( = 1,所以统计量的计算方法是
DF = = -5.97,
对应 (4.30) 式,因零假设是 ( = 0,所以统计量的计算方法是
DF = = -5.97,
两种计算方法的结果相同。因为 -5.97 < -1.95 (临界值),所以拒绝H0,认为yt 是平稳的。
注意:
1.(4.28) 式中 ( yt 和 yt-1的下标分别为t和t-1,计算时不要用错!
2,在实际检验中,若H0不能被拒绝,说明yt是非平稳序列(起码为一阶非平稳序列)。接下来应该继续检验 ( yt 的平稳性。即
( 2 yt = ( ( yt-1 + ut,(4.31)
直至结论为平稳为止。从而获知 yt 为几阶单整序列。
3,当检验式中含有位移项(0和趋势项( t时,
yt = ( + ( yt-1 + ut
yt = ( + ( yt-1 + ( t + ut
也可以把检验式写成如下形式
( yt = ( +( yt-1 + ut (4.32)
( yt = ( +( yt-1 +( t + ut (4.33)
检验用临界值应分别从附表6的b,c部分中查找。
4,(4.28) 式的残差序列 不能存在自相关。如存在自相关,说明yt不是一个AR(1) 过程,则不能使用DF检验。
以上方法只适用于AR(1) 过程的单位根检验。当时间序列为AR(p) 形式,或者由以上形式检验得到的残差序列存在自相关时,应采用如下形式检验单位根。
( yt = yt-1 + ( yt-i + ,(4.34)
因为上式中含有( yt的滞后项,所以对于( = 0( yt非平稳)的检验称为增项DF检验或ADF检验。模型 (4.19) 研究的就是这种条件下的DF分布。
注意:
1,(4.34) 式中 ( yt 滞后项个数k的选择准则是 ⑴ 尽量小,以保持更大的自由度;⑵充分大以消除  内的自相关。
2,在4.1节中已经证明,上式中检验单位根的统计量近似服从标准的DF分布,所以检验用临界值可以从附表6 a部分中查找。
3,当 (4.34) 式中含有位移项 ( 和趋势项 ( t时,相应ADF检验用临界值应分别从附表6 b,c部分中查找。
4,因为实际经济时间序列一般不会是一个AR(1) 过程,所以最常用的单位根检验方法是ADF检验(增项DF检验)。
实际中并不知道被检验序列的d.g.p,属于哪一种形式,(4.1)、(4.2) 还是 (4.4) 式。怎样选择单位根检验式呢?一般方法是当被检验序列中存在趋势项时,则应该采用 (4.2) 式和(4.4) 式。如不存在趋势项时,则应该采用 (4.1) 式。同时还要区别退势平稳过程。
5,对(4.32)式可以通过联合检验,H0:(0 =( =0,检验真实过程中是否含有漂移项和单位根。但所用的F统计量不再服从F分布。实际分布见表1。
表1 对( yt = ( +( yt-1 + ut进行联合检验H0:( =( =0的F分布表
T
1-(
0.01
0.025
0.05
0.10
0.90
0.95
0.975
0.99
25
0.29
0.38
0.49
0.65
4.12
5.18
6.30
7.88
50
0.29
0.39
0.50
0.66
3.94
4.86
5.80
7.06
100
0.29
0.39
0.50
0.67
3.86
4.71
5.57
6.70
250
0.30
0.39
0.51
0.67
3.81
4.63
5.45
6.52
500
0.30
0.39
0.51
0.67
3.79
4.61
5.41
6.47
∞
0.30
0.40
0.51
0.67
3.78
4.59
5.38
6.43
s.e.
0.002
0.002
0.002
0.002
0.01
0.02
0.03
0.05
摘自:Dickey-Fuller(1981)
6,也可以对(4.33)式进行联合检验,H0:( =( =0,检验真实过程中是否含有趋势项和单位根。但所用的F统计量不再服从F分布。而服从如表2的分布。
表2 对( yt = ( +( yt-1 +( t + ut进行联合检验H0:( =( =0的F分布表
T
1-(
0.01
0.025
0.05
0.10
0.90
0.95
0.975
0.99
25
0.76
0.90
1.08
1.33
5.91
7.24
8.65
10.61
50
0.76
0.93
1.11
1.37
5.61
6.73
7.81
9.31
100
0.76
0.94
1.12
1.38
5.47
6.49
7.44
8.73
250
0.76
0.94
1.13
1.39
5.39
6.34
7.25
8.43
500
0.76
0.94
1.13
1.39
5.36
6.30
7.20
8.34
∞
0.77
0.94
1.13
1.39
5.34
6.25
7.16
8.27
s.e.
0.004
0.004
0.003
0.004
0.015
0.020
0.032
0.058
摘自:Dickey-Fuller(1981)
单位根检验的EViews操作:
从工作文件(Work File)中打开序列数据(Series)窗口。点击View键,选Unit root test功能。这时会打开一个对话框。其中有四项选择。
(1)ADF检验还是PP检验(缺省状态是ADF检验)。
(2)检验对象是当前序列(Level),还是其一阶差分序列(1st difference),二阶差分序列(2nd difference)?缺省状态是当前序列。
(3)检验式中应包括的附加项。有三种选择,“漂移项”(Intercept),“趋势项和漂移项”(Trend and Intercept),“无附加项”(None)。缺省状态是加漂移项。
(4)检验式中滞后差分项的个数。显示的数字随样本容量的不同而不同。


4.7 单位根检验举例:
例1,421天的深证成指序列(szindext)(file:5stock4)的单位根检验
421天的深证成指序列见图4.20。从序列走势看决不会是随机趋势非平稳序列,也不会是随机趋势序列。
检验方法(1):
不妨先按随机趋势序列设定检验式。带有截距项的DF检验式的估计结果如下,

图4.20 421天的深圳股市成分指数序列
Dszindext = 9.3279 - 0.0154 szindext-1 (4.35)
(2.6) (-2.6)* DW = 1.9,T = 420
括号中给出的是t统计量的值。带*号的t值也就是DF统计量的值。相应的EViews输出结果见图4.21。检验式(4.35)显示,DF = -2.6,深证成指序列存在单位根。
= 2.6,如果按通常t统计量的临界值对(4.35)式中截距项进行显著性检验,则认定序列中存在截距项,szindext是一个随机趋势过程。但实际上,以5%检验水平,按表3给定的临界值2.8或用响应面函数CV5计算临界值进行判断,截距项并不存在显著性。

图4.21 EViews输出结果从检验式中去掉截距项,继续进行单位根检验,得估计结果如下:
Dszindext = 0.0003 szindext-1
(0.4)* DW = 1,9,T = 420
DF = 0.4。可见该序列实际上是一个随机游走过程,并不含有随机趋势。这也与通常对股市价格序列性质的认识相一致。
对szindext的差分序列Dszindext继续作单位根检验,得
D2szindext = -0.9474 Dszindext-1
(-19.4)* DW = 2.0,T = 419
Dszindext ~I (0)是平稳序列,所以szindext ~I (1)。
检验方法(2):
也可以用F统计量检验判断漂移项的存在。对(4.35)式中两个参数做都等于零的F检验。
H0,( =( = 0
F检验结果如下。

F=3.56 小于临界值4.61,所以接受原假设H0:( =( =0。szindext序列有单位根,无漂移项。是随机游走过程,非随机趋势过程。
例2 (file:b4c1)日本失业率时间序列
 
图4.22 日本失业率序列yt 图4.23 日本失业率差分序列Dyt
检验方法(1):
从经济意义出发一个国家的失业率序列应该是平稳序列。至少不应该是随机趋势非平稳过程。为更可靠,可以用带漂移项和不带漂移项的两个单位根检验式进行检验。
Dyt = 0.0016 - 0.0667 yt-1+0.4270 Dyt-1
(1.3) (-0.8)* (3.1) DW = 1.8,T = 47 (1950~1996)
检验式中不含Dyt-1项不行。若不含Dyt-1项,检验式的DW值只有1.15。
漂移项没有显著性,继而作不带漂移项的单位根检验,得结果如下,
Dyt = 0.0090 yt-1+0.4006 Dyt-1
(0.6) * (2.9) DW = 1.8,T = 47 (1950~1996)
两个检验结果都认为失业率序列含有单位根。
对日本失业率差分序列继续作单位根检验,得结果如下,
D2yt = -0.7080 Dyt-1+0.2046 D2yt-1
(-4.4) * (1.4) DW = 1.84,T = 47 (1950~1996)
Dyt是一个平稳过程。日本失业率序列有可能是一个不带漂移项的单位根I(1)序列。
检验方法(2):
对日本失业率序列作退趋势单位根检验,首先退势
yt = 0.0114 +0.0003 t +
(8.2) * (6.3) DW = 0.23,T = 49 (1950~1996)
然后用退势序列作单位根检验
D= -0.1314+ 0.5094D- 0.1243D
(-1.8)* (3.5) (-0.8) DW = 1.85,T = 47 (1950~1996)
说明中仍然含有单位根。
综上,日本失业率序列是一个不带漂移项的单位根I(1)序列。应该注意的是这个结论只说明日本失业率序列1948~1996间的表现是单位根过程。并不能说明永远呈这种特征。
例3 美国GDP序列(file:consump/usa/x)。

图4.24 美国GDP序列(file:consump/usa/x)
检验方法(1):
应该选用如下两式检验单位根
yt = ( + ( yt-1 + ut
yt = ( + ( yt-1 + ( t + ut
检验结果如下,
( yt = 0.0867 +0.0019 t - 0.0171 yt-1 +0.2389 ( yt-1 + ut [t =1,(1980:1)]
(2.3) (1.3) (-1.0)* (2.3)
DW=2.1,DF= -1.0 > DF0.05= -3.45,T = 90
检验式中时间趋势项参数无显著性。去掉时间趋势项后继续检验,
( yt = 0.0409 + 0.0041 yt-1 +0.2378 ( yt-1 + ut (4.36)
(3.6) (2.3)* (2.3)
DW=2.0,DF= 2.3 > DF0.05= -2.89,T = 90
根据表3,漂移项有显著性,检验结果美国GDP是一个单位根过程。
检验方法(2):
对美国GDP序列作退趋势单位根检验,首先退势(eq05)
GDPt = 2.2200 +0.0873 t +
(44.5) * (93.6) DW = 0.03,T = 92,(1980:1~2002:4)
然后用退势序列作单位根检验(res)
D= -0.0175+ 0.3315D
(-1.0)* (3.4) DW = 2.1,T = 47 (1950~1996)
中仍然含有单位根。三种检验都说明美国GDP序列是一个无趋势项、有漂移项的单位根过程。因为
D2 yt = 0.0590 - 0.6734 Dyt-1 + ut
(6.3) (-6.9)* DW = 2.1,DF = -6.9 < DF0.05 = -2.89,T = 90
所以美国GDP序列是I(1)序列。
检验方法(3):
也可以用F检验判断漂移项的存在。对(4.36)式的前两个参数做都等于零的F检验。(eq06)
H0,( =( = 0
F检验结果如下,
 (EQ05)
根据表1,临界值为4.71。结论是推翻原假设。既然前面的结论是( = 0(美国GDP序列是单位根过程),而F检验又推翻了原假设,那么,只能是( ( 0。结论同样是该序列是无趋势项、有漂移项的单位根过程。

图4.24 美国的对数GDP序列(file:consump/usa/x)
( lnyt = 0.0237 - 0.0072 yt-1 +0.2688 ( lnyt-1 + ut (4.36)
(5.4) (-3.5)* (2.7)
DW=2.0,DF= -3.5 < DF0.05= -2.9,T = 90
对数的美国GDP序列是一个趋势平稳序列。
例4 (file:simu2)T = 250的理论退势平稳过程TREND1的检验结果如下:

图4.25 退势平稳过程(file:simu2,TREND1)

检验结果说明序列有趋势项无单位根,是退势平稳过程。
例5 (file:simu2)T = 1000的理论随机趋势过程Y3的检验结果如下:

图4.26 随机趋势过程(file:simu2,,Y3,)

检验结果说明序列有漂移项有单位根,是随机趋势过程。
非平稳过程统计量的极限分布
DGP和估计模型、H0和H1
统计量的极限分布
出处
情形(1):
真实过程(DGP):
yt = yt-1 + vt,y0 = 0,vt ( IID(0,( 2)
估计式:
原假设与被择假设:
H0:( = 1;H1:( ( 1


17-4-7
17-4-12
情形(2):
真实过程(DGP):
yt = yt-1 + vt,y0 = 0,vt ( IID(0,( 2)
估计式:

原假设与被择假设:
H0:( = 0;( = 1
H1:( ( 0;( ( 1




4-11
4-12
4-38
4-39
17-4-36
情形(3):
真实过程(DGP):
yt =( + yt-1 + vt,(任意取值,y0 = 0,
vt ( IID(0,( 2)
OLS估计式:

为防止( 不为零时从而使估计式引入时间趋势项,导致解释变量多重共线性,等价的OLS估计式是

其中,
原假设与被择假设:
H0:( = (0;( = 1;( = 0。相当于:
H0:(* = 0;(* = 1;(* = (0
H1:( ( (0;( ( 1;( ( 0



DF =

5-10
5-11
5-12
5-17
5-18
17-4-55
5-19
情形(4):
真实过程(DGP):
yt =( +(t+ vt,vt ( IID(0,( 2)
估计式:yt =( +(t+ vt
原假设与被择假设:
H0:( = (0;( = (0
H1:( ( (0;( ( (0

 N(0,1)
 N(0,1)
情形(5):
真实过程(DGP):
yt =( + yt-1 + vt,vt ( IID(0,( 2)
估计式:
原假设与被择假设:
H0:( = (0 ( 0;( = 1
H1:( ( (0;( ( 1

 N(0,1)
 N(0,1)
4.8 结构突变与单位根检验
Perron指出,对于在趋势或水平值存在结构突变的过程来说,如果不考虑这种突变,当用ADF统计量检验单位根时,将会把一个带结构突变(包括趋势突变或水平值突变)的平稳过程误判为随机趋势非平稳过程。即进行单位根检验时不考虑结构突变,会导致检验功效降低(实为趋势平稳过程,检验结果却认为是单位根过程)。
下面以均值突变的平稳自回归过程为例介绍为什么检验结果却认为是单位根过程。
 
a,yt时间序列图(file:gener2,y1) b,yt散点图
图4.27 平稳自回归过程,yt = 0.5 yt-1 + ut,ut (N(0,1)
 
a,yt时间序列图(file:gener2,y2) b,yt散点图
 
c,yt时间序列图与回归直线 d,相对于c图的散点图图4.28 均值突变的平稳自回归过程yt = 0.5 yt-1+5D+ ut,,ut (N(0,1),D= 0,(t =1~100); D= 1,(t=101~200)
图4.27b显示yt的自相关系数为0.51,应该是平稳过程。当均值发生突变时(从0变为10),如图3.28a、其相对应的自相关系数变为0.97,见图4.28b。这个值已接近单位根。另外从图4.28c也可分析出,当存在结构突变时,用回归直线剔出趋势后,得到的是一个带有强正自相关的序列,即自回归系数接近单位根。(不带常数项的一阶自回归模型中,变量的相关系数与自回归系数相等)。
下面利用单位根检验式分析。不考虑均值突变,直接进行单位根检验,
(yt = -0.0063 yt-1 -0.1356 (yt-1 + ut (4.37)
(-0.5)* (-1.9) R2=0.02,DW=2.06,ADF(0.05) = -1.95,T=200
ADF= -0.5 ( -1.95。由于ADF检验式没有考虑均值突变,检验结果yt是单位根过程。导致检验功效降低的原因是未考虑序列中存在结构突变。用虚拟变量
D=
区别突变前后两个时期,得ADF检验式如下:
(yt = -0.4576 yt-1 + 4.4878 D + ut (4.38)
(-9.3)* (9.3)
R2 = 0.31,DW=2.0,ADF0.05 = -1.95,T=100
因为ADF= -9.3 < -1.95,虚拟变量系数有极高的显著性,所以,yt为带有均值突变的退势平稳过程。
首先从理论上分析(1)均值突变的随机游走过程和均值突变的退势平稳过程;(2)斜率(线性趋势)突变的随机游走过程和斜率突变的退势平稳过程;(3)均值、斜率双突变的随机游走过程和均值斜率双突变的退势平稳过程。以样本容量为200,突变点发生在t =100为例定义三种类型的虚拟变量如下:
DP =
(脉冲式pulse)
DL =
(阶跃式level)
DT =
(累进式slope)
计算机生成的带结构突变的6种过程(file:gener2)如下:
(file:gener2,y5)
图4.29 均值突变的随机游走过程,yt = 0.1+ yt-1+ 30 DP+ ut,,ut (N(0,1),DP = 0,(t ( 101; DP = 1,(t = 101);
(y3)(y4)
图4.30a yt= 0.1+ 0.01t +15DL+ ut,ut (N(0,1) 图4.30b yt= 0.1+ 0.1t +20DL+ ut,ut (N(0,1)
图4.30 均值突变的退势平稳过程
(y6)
图4.31 斜率突变的随机游走过程yt = 0.1+ yt-1 + 0.5DL+ ut,ut (N(0,1),
(y7)
图4.32 斜率突变的退势平稳过程 yt= 0.1+ 0.1t + 0.2DT+ ut,ut (N(0,1),
(y10)
图4.33 均值斜率双突变的单位根过程 yt = 0.1+ yt-1 + 30 DP + 0.3 DL+ ut,ut (N(0,1)
(y8)
图4.34 均值斜率双突变的退势平稳过程 yt= 0.1+ 0.1t + 15DL+0.2DT + ut,ut (N(0,1),
4.8.1 结构突变点已知条件下的单位根检验方法
Perron (1989,1990)给出了结构突变点已知条件下的单位根检验方法。结构突变点已知时,称其为外生性结构突变点。假定发生结构突变的时点已知为tB。
模型(1):
H10:yt为水平(均值)突变的单位根过程(在tb +1期发生脉冲式突变)。表示为
yt = ( +yt-1 +( DPt +ut,ut (I(0) (4.39)
其中DPt代表脉冲虚拟变量。定义为
DPt = 
其中tb +1表示突变发生时点。因为模型是动态的,一个时刻的脉冲式新息冲击要扩散到序列的以后各期。
H11:含有一个水平(均值)突变点的退势平稳过程。
yt = ( +( t +( DLt + ut,(4.40)
其中DLt是阶跃式虚拟变量。
DLt = 
原假设是,yt 为水平(均值)突变(由( 变化到( +()的单位根过程;备择假设是,yt 为水平突变的趋势平稳过程。
模型(2):
H20:从tB +1期始发生漂移项突变(因为是动态模型,实为序列发生斜率突变)的单位根过程。(对于取对数的经济变量是增长率发生突变。)
yt = ( +( DLt +yt-1+ut,ut (I(0),(4.41)
其中DLt是阶跃式虚拟变量。
DLt = 
即在t ( (tB +1) 时,模型漂移项(序列的斜率)由( 突变到(+(。
H21:自(tB +1)期始,含有斜率(趋势)突变的退势平稳过程(原理见退势平稳过程)。(对于取对数的经济变量是增长率发生突变。)
yt = ( +( t +( DTt + ut,(4.42)
其中
DTt = 
原假设是,yt 为斜率突变的单位根过程;备择假设是,yt 为斜率突变(由( 变化到( +()的趋势平稳过程。
模型(3):
H30:从tB +1期始,同时发生脉冲式突变和漂移项突变,即序列的截距和斜率同时发生突变的单位根过程。(对于取对数的经济变量是增长率。)
yt = ( +yt-1+( 1DPt +( 2DLt +ut,ut (I(0) (4.43)
其中
DPt = ,DLt = 
即从t ( (tb +1) 时始,(1 表示截距发生突变;( 2表示斜率发生突变(对于取对数的经济变量是增长率),从截距为零,斜率为(,突变到截距为(1,斜率为(+(2。其中DPt是脉冲式虚拟变量,DLt是阶跃式虚拟变量。
H31:自(tB +1)期始,截距和斜率发生双突变的的退势平稳过程。
yt = ( +( t +(1DLt +( 2DTt + ut,(4.44)
其中
DLt = ,DTt = 
DLt是阶跃式虚拟变量。DTt是累进式虚拟变量。
原假设是,yt 为水平和斜率双突变的单位根过程;备择假设是,yt 为水平和斜率双突变(水平由( 变化为( +(1,斜率由( 变化为( +(2)的趋势平稳过程。
下面介绍带有结构突变的时间序列的单位根检验方法。
首先根据具体情况,按三个备择假设模型(4.40)、(4.42)、(4.44)之一回归,退结构(退势、退均值)变化,即从yt中剔出常数项、固定趋势和结构变化的影响,所得为退结构残差,用表示。其中i = 1,2,3,分别表示用(4.40)、(4.42)、(4.44)式回归得到的残差序列。ADF检验式写为,
,i = 1,2,3 (4.45)
定义( 所对应的统计量为AOADF(i)。其中i = 1,2,3,分别与(4.40)、(4.42)、(4.44)式相对应。AOADF(i) 不服从标准的ADF分布。其渐近分布与获得残差序列的回归式i有关,与突变点的位置( = tb / T有关。
AOADF(i) 临界值表见表6。AOADF(i) 统计量的临界值小于相应ADF临界值,并以( = 0.5(结构突变点发生在样本区间的中心点)时达到最大。给定检验水平和(值,有下式关系存在。
AOADF(3) < AOADF(2) < AOADF(1)
表6 AOADF(i) 统计量在( 已知、未知条件下以及最小t统计量检验用渐近临界值
(
检验式
( 已知
( 未知
Min(t)
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
(1)
-3.68
-3.77
-3.76
-3.72
-3.76
-3.76
-3.80
-3.75
-3.69
-4.80
-4.64
5%
(2)
-3.65
-3.80
-3.87
-3.94
-3.96
-3.95
-3.85
-3.82
-3.68
-4.42
-4.08
(3)
-3.75
-3.99
-4.17
-4.22
-4.24
-4.24
-4.18
-4.04
-3.80
-5.08
-4.62
(1)
-3.40
-3.47
-3.46
-3.44
-3.46
-3.47
-3.51
-3.46
-3.38
-4.58
-4.37
10%
(2)
-3.36
-3.49
-3.58
-3.66
-3.68
-3.66
-3.57
-3.50
-3.35
-4.11
-3.77
(3)
-3.45
-3.66
-3.87
-3.95
-3.96
-3.95
-3.86
-3.69
-3.46
-4.82
-4.28
注:引自Zivot and Andrews(1992)表2、3、4和Perron(1997)表1。
突变时点已知的以模型(1)为例的检验步骤如下:
(1)按备择假设模型形式(4.40)对yt退势,
yt =+t +DLt + (4.41)
得退势序列= yt --t -DLt。
(2)对退势序列做单位根检验。
=+ (4.42)

=+ (4.43)
退势序列的单位根检验统计量t()、t()不服从DF分布,必须查Perron(1997) 提供的临界值表(见表6)。临界值与突变点发生的位置tb有关。设突变点位置与样本容量T的比值为(,则突变点位置参数( = tb / T。依靠( 查找临界值。( 的取值范围为[0,1]。当( =0,1时,Perron临界值退化为DF临界值。当( ( 0,1时,Perron临界值小于DF临界值。而当( = 0.5时,Perron临界值达到最小,为-3.76。
(3)如果(4.42)或(4.43)式中的是自相关的,则应该用下两式检验单位根。
=++ (4.44)

=++ (4.45)
例8:中国就业总人数序列(1978-2004)研究(file,Dummy7)
1978-2004年中国就业人员数(labor,亿人)序列如下图。中国就业总人数在1990年突然比1989年多出0.942亿人,这是不可能的。

图3.33 中国就业总人数序列(1978~2004)
因为模型中有时间趋势项,所以中国就业人员数序列肯定是一个非平稳序列。但,中国就业人员数序列是单位根序列还是趋势平稳序列?需要谨慎判断。
从曲线变化情形看,这是一个带有均值和斜率突变的非平稳序列。当加入虚拟变量D1对这种变化进行描述时,就可以清楚地看到这一点。输出结果如下:
labort =3.8180 +0.1444 t +0.8306DL-0.0687 (t-12)DL+,(1978,t = 1) (4.46)
(308.2) (85.8) (53.7) (-33.2)
R2 = 0.9997,DW = 1.2,F = 31061.0,T= 27,(t-12)DL=DT
DL = 
(t-12)DL=DT= 
DL和(t-12)DL项都有显著性,说明序列确实存在结构变化。

图3.34
输出结果还可按两个时期写为
labort =
用退势的方法检验单位根。对(4.46)式作如下变换
= labort -3.8180 -0.1444 t -0.8306DL+0.0687 (t-12)DL
就是退势以后的序列。对做DF检验,
D= -0.7306 -1 (4.49)
(-4.6) R2 = 0.45,DW = 1.6,T= 26
从表6中提取临界值。因为结构变化发生在1989年,所以突变点位置参数( = tb / T = (1989-1977) / (2004-1977) = 12/27 = 0.44。退势用的是模型(3)H31。临界值为 -4.23。而-4.6 ( -4.23,所以误差序列是平稳的,中国就业人员数序列是一个退势平稳序列。

图3.35
如果不考虑序列中的结构突变因素,直接用ADF检验式检验单位根,检验结果如下:
Dlabort = 0.0206 labort-1 (4.47)
(3.6)* R2 = -0.10,DW = 1.9,T= 26
Dlabort = 0.3339 - 0.0335 labort-1 (4.48)
(2.0) (-1.2)* R2 = -0.05,DW = 2.12,T= 26
结论是序列中含有单位根。
这个例子非常清楚地说明,中国就业人员数序列是一个退势平稳序列。当序列存在结构突变,而又没考虑到这种突变时,就会把一个退势平稳序列错判为含有单位根的序列。并再一次说明,当序列存在结构突变,ADF检验式中如果不考虑这种结构突变,就会导致ADF检验的功效大大降低。
附表:1978-2004年中国就业人员数(labor,亿人)

labor
D1
年
labor
D1
1978
4.0152
0
1992
6.6152
1
1979
4.1024
0
1993
6.6808
1
1980
4.2361
0
1994
6.7455
1
1981
4.3725
0
1995
6.8065
1
1982
4.5295
0
1996
6.8950
1
1983
4.6436
0
1997
6.9820
1
1984
4.8197
0
1998
7.0637
1
1985
4.9873
0
1999
7.1394
1
1986
5.1282
0
2000
7.2085
1
1987
5.2783
0
2001
7.3025
1
1988
5.4334
0
2002
7.3740
1
1989
5.5329
0
2003
7.4432
1
1990
6.4749
1
2004
7.5200
1
1991
6.5491
1
注:摘自《中国统计年鉴》2005,第117页,中国统计出版社。
例9:日本职工家庭对数人均支出序列(Lnet,1949-1993)研究(file,B7C2)

图3.36
退势回归如下:

图3.37 @trend(1948)表示时间变量,1949年,t=1。D1=DL。描述1972年结构变化。
退势序列的单位根检验如下:

图3.38
( = tb / T = (1972-1948) / (1993-1948) = 24/45 = 0.53。退势用的是模型(3)H31。临界值为 -4.24。而-5.3 ( -4.24,所以误差序列是平稳的,日本职工家庭对数人均支出序列是一个退势平稳序列。
例10:均值斜率双突变的单位根过程的验证
(y10)
图4.39 均值斜率双突变的单位根过程,yt = 0.1+ yt-1 + 30 DP + 0.3 DL+ ut,ut (N(0,1)
退势回归如下:

图4.40 @trend(0)表示时间变量t。D1=DL,D2=DT,在t =101时发生变化。
得退结构突变序列(RES)如下:

图4.41
用退结构突变序列(RES)作单位根检验如下:
( = tb / T = 100 / 200 = 0.5。退势用的是模型(3)H31。临界值为 -2.78。而-2.78 ( -4.24,所以退结构突变序列含有单位根。原序列是一个均值斜率双突变的单位根过程。

图4.42
例11:人民币元兑美元汇率序列的单位根检验(file:break2)
1991年1月至1996年12月人民币元兑美元汇率序列见图4.43。
新中国成立以来至改革开放前,在传统的计划经济体制下,人民币汇率由国家实行严格的管理和控制。
1949~1952年,实行的是单一浮动汇率制。
1953~1972年,实行的是单一固定汇率制。
布雷顿森林体系后,1973~1980年,实行的是以“一篮子货币”计算的单一浮动汇率制。
党的十一届三中全会以后,我国进入了向社会主义市场经济过渡的改革开放新时期。我国的汇率体制从单一汇率制转为双重汇率制。
1981~1984年,经历了官方汇率与贸易外汇内部结算价并存。
1985~1993年,官方汇率与外汇调剂价格并存的两个汇率双轨制时期。造成了外汇市场秩序混乱,长期存在外汇黑市。
1980年4月1日开始,中国货币市场上出现了一种崭新而神秘的支付凭证,外汇兑换券。1995年7月1日起,外汇券在中国市场上停止流通。
1994年1月1日中国人民银行改人民币元兑美元汇率的双轨制为单轨制。官方汇价从5.81元兑1美元阶跃下调到8.70元兑1美元。
数据来源:中国经济信息网-中国经济统计数据库,http://db.cei.gov.cn/。



截取其中1991:1(1996:12一段检验单位根。以1993年12月为突变点,设
DL = 
(t-36)DL=DT= 
 
图4.43 人民币元兑美元汇率序列 图4.44 估计结果
输出结果如下:
ratet = 5.2029 +2.8168DL+0.0179 t -0.0305 (t-36)DL+,(1991:1,t = 1) (4.46)
(250.2) (97.7) (18.2) (-22.0)
R2 = 0.9983,DW = 0.3,F = 13635.6,T = 72,(t-36)DL=DT
D1的系数有显著性,说明序列确实存在结构变化。t和(t-36)D1项的系数都有显著性,且前者为正,后者为负;说明并轨之前,人民币元兑美元的长期趋势一直在贬值;而并轨之后,人民币元兑美元的长期趋势一直在升值。
输出结果还可按两个时期写为
ratet =

上式的残差序列是退势以后的序列(用RESt表示,见图4.44 residual)。对RESt做ADF检验,检验结果如下:
DRESt = -0.1957 RESt -1 +0.3258 DRESt-1 (4.49)
(-3.0)* (2.8)
R2 = 0.16,DW = 2.1,T= 70,(1991:03-1996:12)
从表6中提取临界值。因为结构变化发生在1993:12,所以( = tb / T = 36/72 = 0.5。退势用的是模型(3)H31。临界值为 -4.23。而-3.0 (-4.23,所以误差序列是非平稳的,人民币元兑美元汇率序列是一个含有均值、斜率双突变的单位根序列。