1
第3节 Dickey—Fuller单位根检验(DF检验)
前面两节已为检验单位根做了理论准备。
下面我们讨论Dickey—Fuller建立的单位根检验法。
任何一个序列都有其自身的真实生成过程。Dickey—Fuller 假设数据序列是由下列两种模型之一产生,
(1) ttt yy er +=?1,(6.3.1)
(2) ttt yy era ++=?1 ; (6.3.2)
其中,),0(~ 2se iidt 。然后分为如下四种情形建立估计模型,并在其中进行单位根检验,
情形一:假设数据由(真实过程)(6.3.1)产生,在回归模型(6.3.1)中检验假设,
1:0 =rH
情形二:假设数据由(真实过程)(6.3.1)产生,在回归模型(6.3.2)中检验假设,
0;1:0 == arH
情形三:假设数据由(真实过程)(6.3.2)产生,在其中检验假设,;1:0 =rH
情形四:假设数据由(真实过程)(6.3.2)产生,在回归模型
ttt tyy edra +++=?1 中检验假设,
0;1:0 == drH
对于上述各种情形下的回归模型,可以使用 OLS 法得到参数估计量和相应的t统计量。
但是,Dickey与Fuller的研究发现,在原假设成立的条件下,相应的t统
PDF created with pdfFactory trial version www.pdffactory.com
2
计量不再服从渐近正态分布,从而临界值与拒绝域发生变化。
具体分析如下,
一,情形一的DF检验法
1、检验方法
回归模型(6.3.1)系数r的OLS估计为,


=
2
1
1?
t
tt
y
yyr
构造统计量,
[ ] 212 12?
∑?
=?=
tys
t rrs rr
r
(6.3.3)
其中 2s 为模型的剩余方差。
在 1:0 =rH 成立的条件下,t统计量为,
[ ]
[ ] 212 122 1
11
212
1
2?
1)(
1?
1?
∑∑




=
=?=
tt
ttt
t
ysy
yyy
ys
t rsr
r
∑∑∑ ∑
==
212212
1
2
1
1
212212
1
1
][][][][ syN
yN
sy
y
t
tt
t
tt ee
在 1:0 =rH 成立的条件下,模型(6.3.1)为随机游动过程,有关随机游动的极限定理成立,因此,
[ ]{ }1)1(2 2
2
1
1→?∑
WyN L
tt
se
()∫∑?→ 1
0
222
1
2 drrWyN L
t s
其中W(r)为维纳过程。又因为 2s 为 2s 的一致估计,根据连续影射定理,t统计量具有如下极限,
PDF created with pdfFactory trial version www.pdffactory.com
3
{ } { }
( ){ }
(){ }212121 1
0
2
2
2
1
22
1
2
1
1
11
1?
∫∑
∑→?=?=
drrW
W
SYN
YNt L
t
tt e
s
r
r
(6.3.4)
即t统计量依分布收敛于维纳过程的泛函,表明t检验统计量不再服从传统的t
分布,传统的t检验法失效。
上面的极限分布一般称为Dickey—Fuller分布,对应的检验称为DF检验。
由于 )1(~)1( 22 cW,(6.3.4)式的分母恒正,分子是 )1(2c 分布与其均值之差,
因此上述检验统计量的极限分布是非对称、左偏的。又因 70.0}1)1({ 2?≤cP,所以检验值大都是负数。
Dickey—Fuller分布是非标准的,因此人们用Monte Carlo方法模拟得到检验的临界值,并编成DF检验临界值表(情形一)供查。
在进行DF检验时,比较t统计量值与DF检验临界值,就可在某个显著性水平上拒绝或接受原假设。
在实际应用中,可按如下检验步骤进行,
(1) 根据所观察的数据序列,用 OLS法估计不带常数项的一阶自回归模型,
ttt yy er +=?1
得到回归系数r的OLS估计


=
2
1
1?
t
tt
y
yyr
(2) 提出假设,
1:0 =rH
检验用统计量为常规t统计量,
[ ] 212 12?
∑?
=?=
tys
t rrs rr
r
根据(6.3.4)式,在 1:0 =rH 成立的条件下,该统计量的极限分布为
Dickey—Fuller分布。
(3) 计算在原假设成立条件下的t统计量值,查 DF检验临界值表(情形
PDF created with pdfFactory trial version www.pdffactory.com
4
一),得临界值,然后将t统计量值与DF检验临界值进行比较,
若t统计量值小于DF检验临界值,则拒绝原假设 1:0 =rH,说明序列不存在单位根;
若t统计量值大于或等于DF检验临界值,则接受原假设 1:0 =rH,说明序列存在单位根;
需要说明的是,在一般计量经济软件中对回归模型回归系数的检验,原假设都是回归系数为零。因此,为了能直接使用计算机输出结果,通常将回归模型(6.3.1)变形为,
ttt yy er +?=1)1(
令 1?= rw,上述模型等价地变成,
ttt yy ew +=1 (6.3.5)
原假设 1:0 =rH 则变为 0:0 =wH 。
1,实例分析
下面我们利用DF检验进行实例分析。
例6.3.1 本章附表1给出了1970—1991年美国3种宏观经济变量的季度数据序列(摘自(美)古扎拉蒂《计量经济学》中译本P706)。表中的3个序列分别为:国内生产总值(GDP)、个人可支配收入(PDI)、个人消费支出(PCE)。
图 5-3-1是三个序列的图形。
图5-3-1 美国GDP,PDI,PCE季度数据(1970—1991)
对每一个序列,采用模型(6.3.5)进行估计,回归结果如下,
1000
2000
3000
4000
5000
70 72 74 76 78 80 82 84 86 88 90
GDP PCE PDI
PDF created with pdfFactory trial version www.pdffactory.com
5
(1)GDP,
340574.1
)798077.5(
005765.0 1
=
=
=∧
DW
t
GDPGDP tt
(2)PCE,
586258.1
)303944.8(
006446.0 1
=
=
=∧
DW
t
PCEPCE tt
(3)PDI,
054157.2
)705903.5(
006115.0 1
=
=
=∧
DW
t
PDIPDI tt
查 DF检验临界值表(情形一),在显著性水平为 5%下,DF临界值为-1.95。由于三个回归方程回归系数的t统计量值都大于DF检验临界值,因此不能拒绝原假设 0:0 =wH (即 1:0 =rH ),说 明所考察的三个序列都存在单位根,它们是非平稳序列。
接下来的问题是,三个序列的一阶差分序列是否为平稳序列,即三个序列是否为一阶单整I(1)序列?为此,需要对序列 ttt PDIPCEGDP,,进行单位根检验。记
tttttt ZPDIYPCEXGDP =?=?=?,,
采用对应于模型(6.3.5)的形式进行回归,回归结果如下,
(1) 序列 tt XGDP =?,
192062.2
)181149.5(
4796201.0 1
=
=
=∧
DW
t
XX tt
(2) 序列 tt YPCE =?,
PDF created with pdfFactory trial version www.pdffactory.com
6
403875.2
)883922.4(
437799.0 1
=
=
=∧
DW
t
YY tt
(3) 序列 tt ZPDI =?,
11266.2
)137588.7(
745190.0 1
=
=
=∧
DW
t
ZZ tt
将回归系数的t统计量与DF检验临界值(-1.95)比较,在 5%的显著性水平上,
拒绝原假设 0:0 =wH (即 1:0 =rH ),说明所考察的三个序列 ttt PDIPCEGDP,,都不存在单位根,它们是平稳的,原序列为I(1)序列。
从图形上看,序列 ttt PDIPCEGDP,,已呈现为围绕其均值上下无规律波动的曲线。图5-3-2是 tGDP? 的一阶差分序列图。
-100
-50
0
50
100
150
70 72 74 76 78 80 82 84 86 88 90
图5-3-2 美国GDP 季度数据(1970—1991)一阶差分序列
例5.3.2 对上海证券市场综合指数的周数据 }{ tP 进行单位根检验。时间范围为1997-1999(数据来源:证券市场周刊)。数据序列的图形见图5-1-2(a)。
分别对原序列 }{ tP 和差分序列 }{ tP? 估计不带常数项的自回归模型,回归结果如下,
(1)
860102.1
)425859.0(
001388.0 1
=
=
=∧
DW
t
PP tt
PDF created with pdfFactory trial version www.pdffactory.com
7
(2)
989107.1
)09015.11(
930795.0 12
=
=
=

DW
t
PP tt
在 5%显著性水平下,DF临界值为-1.95。回归方程(1)的t统计量值大于 DF
检验临界值,接受原假设 0:0 =wH (即 1:0 =rH ),表明序列 }{ tP 存在单位根;回归方程(2)的t统计量值小于DF检验临界值,拒绝原假设 0:0 =wH,表明序列
}{ tP? 不存在单位根,即原序列 }{ tP ~I(1)。
二,情形二的DF检验法
对于情形二,估计模型,
ttt yy era ++=?1 ; (6.3.2)
中含有常数项,模型参数的OLS估计为,




=




∑∑


tt
t
tt
t
yy
y
yy
yN
1
1
2
11
1
r
a
在 1,0:0 == raH 成立时,上式可改写为,




=




∑∑


tt
t
tt
t
yyy
yN
e
e
r
a
1
1
2
11
1
1?
以矩阵 ( )NNdiagA,21= 左乘上式两端,得
( )




=












=




∑∑



∑∑




tt
t
tt
t
tt
t
tt
t
yN
N
yNyN
yN
yAAyy
yNA
N
N
e
e
e
e
r
a
1
1
1
2
1
2
1
1
1
1
1
1
2
11
11
21
23
23
21
1
1?
在 1,0:0 == raH 成立时,序列{ }ty 服从随机游动过程,利用有关随机游动的极限定理,可得
( )?




∫∫

]1)1([21
)1(
)()(
)(1
1?
22
1
1
0
221
0
1
0
21
W
W
drrWdrrW
drrW
N
N L
s
s
ss
s
r
a
PDF created with pdfFactory trial version www.pdffactory.com
8
据此,可得 a?21N 和 )1?(?rN 的极限分布分别为,
() () ()
() () 21
0
1
0
2
1
0
21
0
2
21
][
]11[21)1(
∫∫
∫∫

→?
drrWdrrW
drrWWdrrWW
N L
s
a (6.3.6)
)1?(?rN
() ()
() () 21
0
1
0
2
1
0
2
][
)1(]11[21
∫∫


→?
drrWdrrW
drrWWW
L (6.3.7)
另一方面,估计量r?的样本方差为
[ ]



=?

∑∑

1
01,0? 1
2
11
122
tt
t
yy
yNs
rs
其中 2s = ( )2121 ∑ tt yyN ra
为模型的剩余方差,它是随机扰动项方差 2s 的最小二乘估计。
可以证明,统计量 2?2?rsN 有以下极限分布,
() () 21
0
1
0
2
2
2
][
1?
∫∫?
→?
drrWdrrW
N Lrs (6.3.8)
由连续影射定理,可得t统计量的极限分布为
( ) ( ) (){ } () ()
() (){ }2121
0
1
0
2
1
0
2
2
1
212
2
][
111
)?(
1?
1?
∫∫


→=?=
drrWdrrW
drrWWW
N
Nt L
rr s
r
s
r (6.3.9)
这表明当估计模型中含有常数项时,t统计量的极限分布发生了变化,从而临界值也就不同。Dickey、Fuller利用Monte Carlo方法得到不同样本长度和显著性水平下DF检验临界值表(情形二)供查。
例5.3.3 对例5.3.1中的三个序列估计带常数项的一阶自回归模型,回归结果如下,
(1)GDP,
PDF created with pdfFactory trial version www.pdffactory.com
9
351998.1
)219165.0()157605.1(
003168.02054.28 1
=
=
=∧
DW
t
GDPGDP tt
(2)PCE,
629810.1
)207360.0()726352.1(
000896.016937.19 1
=
=
=∧
DW
t
PCEPCE tt
(3)PDI,
098069.2
)671576.0()652392.1(
004287.086419.29 1
=
=
=∧
DW
t
PDIPDI tt
给定显著性水平5%,查DF检验临界值表(情形二),临界值为-2.89。三个回归方程滞后项系数的t统计量值都大于DF检验临界值,从而接受原假设 0:0 =wH
(即 1:0 =rH ),再 一次表明三个序列存在单位根。
例5.3.4 对例 5.3.2中的上海证券市场综合指数的周数据 }{ tP 估计带常数项的一阶自回归模型,回归结果如下,
827656.1
)589131.2()665411.2(
065434.023557.86? 1
=
=
=
DW
t
PP tt
给定显著性水平5%,查DF检验临界值表(情形二),临界值为-2.89。由于t统计量值大于DF检验临界值,从而接受原假设 0:0 =wH (即 1:0 =rH ),再一次表明 序列 }{ tP 存在单位根。
三,其它情形的DF检验法
Dickey、Fuller 还考察了情形三、情形四下的单位根检验问题,检验统计量同前。可以证明,在情形三下,检验用的 t 统计量的极限分布为正态分布,
从而可按照传统检验法进行;在情形四下,检验用的 t 统计量的极限分布为非正规分布(极限分布的具体形式从略,可参见有关文献),由于极限分布不同,
PDF created with pdfFactory trial version www.pdffactory.com
10
临界值也就不相同。临界值由Monte Carlo模拟方法得到并编制成DF检验临界值表(情形四)供查。
此外,Dickey 和 Fuller(1981)还给出了在情形二下联合假设
0,1:0 == arH,在情形四下联合假设 0,1:0 == drH 及 0,1,0:0 === draH 的 F
检验统计量的极限分布。F统计量为
)/(?
/)?~(
2
22
knR
rRRF
= (6.3.10)
其中,2~R 为有约束的残差平方和,2?R 为无约束的残差平方和,r 为假设中受约束的个数,k为模型中待估参数的个数。F检验统计量的极限分布存在,但不再是标准的F分布,相应的临界值已由人们用Monte Carlo模拟方法得到并编制成表供查。
注意点,
最后需要说明的是,DF 单位根检验法,依赖于对数据真实生成过程的设定及估计模型类型的选择。如果模型选择不当,则可能会导致错误的结论。
在实际应用中,应尽可能从经济学和统计学的角度考虑数据的生成过程,以决定模型中是否应包含常数项。
在没有先验信息的情况下,应尽量先采用较一般的模型进行检验。
例如,在例5.3.1中,国内生产总值(GDP)、个人可支配收入(PDI)、
个人消费支出(PCE)三个序列具有较明显的时间趋势,而且从经济学的角度看,由于经济技术的持续发展,上述三个经济总量指标应该有不断增长的趋势。因此,在选择估计模型的类型时就应考虑到这一点,
更为恰当的做法是按照情形四进行单位根检验。
例5.3.5 对例5.3.1中的三个序列按情形四检验单位根。回归结果如下,
(1)GDP,
314680.1
)625296.1()610958.1()838999.1(
060317.047764.13837.190 1
=
=
+=∧
DW
t
GDPtGDP tt
PDF created with pdfFactory trial version www.pdffactory.com
11
(2)PCE,
595415.1
)376068.1()360435.1()674765.1(
044464.0798720.019111.74 1
=
=
+=∧
DW
t
PCEtPCE tt
(3)PDI,
938465.1
)58854.2()530769.2()753007.2(
156942.0875152.25080.329 1
=
=
+=∧
DW
t
PDItPDI tt
给定显著性水平5%,查DF检验临界值表(情形四),临界值为-3.45。
由于三个回归方程滞后项系数的t统计量值都大于DF检验临界值,因此接受原假设 0:0 =wH (即 1:0 =rH ),再 一 次 表明三个序列存在单位根。
但是需要指出的是,上述各例中,有些回归模型的DW值偏离2较远,表明扰动项存在序列相关性,这就违背了模型的假定条件。关于这一问题的处理,我们将在下一节中讨论。
PDF created with pdfFactory trial version www.pdffactory.com