第4节 PP单位根检验法与ADF单位根检验法
DF 检验要求模型的随机扰动项 te独立同分布。但在实际应用中这一条件往往不能满足(如上一节中的有关例子)。一般来说,如果估计模型的DW值偏离2较大,表明随机扰动项是序列相关的,在这种情况下使用 DF 检验可能会导致偏误,需要寻找新的检验方法。本节我们将介绍在随机扰动项服从一般平稳过程的情况下,检验单位根的PP
检验法和 ADF检验法。
一,PP(Phillips&Perron)检验
首先考虑上一节情形二中扰动项为一平稳过程的单位根检验。假设数据由
(真实过程)
∑∞
=
==+=
0
1 )(,
j
jtjttttt Buuyy ejejr (6.4.1)
产生,其中{ }te 独立同分布,∞<== 2)(,0)( see tt DE 。 ∑∞
=
=
0
)(
j
j
j BB jj,其中B为滞后算子,其系数满足条件 ∞<∑
∞
=0j
jjj 。在回归模型 ttt uyy ++=?1ra 中检验假设,
0;1:0 == arH
与DF检验(情形二)一样,模型参数的OLS估计为,
=
∑
∑
∑∑
∑
tt
t
tt
t
yy
y
yy
yN
1
1
2
11
1
r
a
在 1,0:0 == raH 成立时,上式可改写为,
PDF created with pdfFactory trial version www.pdffactory.com
=
∑
∑
∑∑
∑
tt
t
tt
t
uy
u
yy
yN
1
1
2
11
1
1?
r
a
以矩阵 ( )NNdiagA,21= 左乘上式两端,得
( )
=
=
∑
∑
∑∑
∑
∑
∑
∑∑
∑
tt
t
tt
t
tt
t
tt
t
uyN
uN
yNyN
yN
uy
uAA
yy
yNA
N
N
1
1
1
2
1
2
1
1
1
1
1
1
2
11
11
21
23
23
21
1
1?
r
a
利用有关单位根过程的极限分布(参见第2节),可得
( )?
→
∫∫
∫
])1([21
)1(
)()(
)(1
1?
0
22
1
1
0
221
0
1
0
21
gl
l
ll
l
r
a
W
W
drrWdrrW
drrW
N
N L
其中 )1(sjl =,∑∞
=
=
0
22
0
s
sjsg 。经过化简,可将统计量 )1?(?rN 的极限分离出来如下,
( ) ()[ ]{ } () ()()[ ] () ( )()[ ] ()
21
0
1
0
2
2
0
2
2
1
21
0
1
0
2
1
0
2
2
1
][
/
][
111
1?
drrWdrrWdrrWdrrW
drrWWW
N L
∫∫∫∫
∫
+
→ lglr (6.4.2)
此式表明,)1?(?rN 的极限为两项之和,其中第一项是 tu为独立同分布时 )1?(?rN 的极限分布(6.3.7);第二项是由 tu 的自相关性产生的,当 tu 独立时,它等于零。说明(6.4.2)是(6.3.7)的推广。
可以证明,统计量 2?2?rsN 有以下极限分布,
()[ ] () 21
0
1
0
22
02
2
][
1?
drrWdrrW
N L
∫∫?
→? lgs r (6.4.3)
与(6.3.8)式相比,此式多了一个因子 20lg,它反映了扰动项自相关程度对 2?2?rsN 的
PDF created with pdfFactory trial version www.pdffactory.com
极限分布的影响。当扰动项相互独立时,L,2,1,0,10 === jjjj,从而有 2 0lg =1,(6.4.3)
式就退化为(6.3.8)式。
现利用统计量 2?2?rsN 对 )1?(?rN 进行修正,修正式如下,
)?)((21)1?( 22202 sNN rsglr s (6.4.4)
其中 2s 为 02 )( g=tuE 的一致估计,结合(6.4.2)和(6.4.3),有
)?)((21)1?( 22202 sNN rsglr s
()[ ]{ } () ()
()[ ] () 21
0
1
0
2
1
0
2
2
1
][
111
drrWdrrW
drrWWWL
∫∫
∫
→? (6.4.5)
可以看出,修正后的统计量与 DF 检验情形二中的统计量 )1?(?rN 的极限分布(6.3.7)一致,从而可用相同的临界值表。
类似地,可以考虑t 统计量的极限分布和修正方法,根据(6.4.2)和(6.4.3),
有
( ) ( )?→=?= L
N
Nt
212
2
)?(
1?
1?
rr s
r
s
r
()[ ]{ } () ()
()[ ] (){ } ( )()[ ] (){ }2121
0
1
0
2
00
2
2
1
0
2121
0
1
0
2
1
0
2
2
1
][
/
][
111
drrWdrrWdrrWdrrW
drrWWW
∫∫∫∫
∫
+?
l
ggl
g
l (6.4.6)
对t统计量修正如下,
s
Nt rs
l
gl
l
g?
2
)( 020 (6.4.7)
结合(6.4.3)和(6.4.6),有如下极限分布,
s
Nt rs
l
gl
l
g?
2
)( 020 ()[ ]{ } () ()
()[ ] (){ }2121
0
1
0
2
1
0
2
2
1
][
111
∫∫
∫
→?
drrWdrrW
drrWWWL (6.4.8)
修正后的统计量与DF检验情形二中的t统计量有相同的极限分布(6.3.9),从而
PDF created with pdfFactory trial version www.pdffactory.com
可用相同的临界值表。
但是,修正统计量(6.4.4)与(6.4.7)不能直接用于检验,因为其中含有未知参数 0gl、,必需再进行修正。令
)?)((21)1?( 22202 sNNZ rr sglr s= (6.4.9)
s
NtZ
t
rs
l
gllg?
2
)()( 02
0?
= (6.4.10)
其中 ∑
+=
=
N
jt
jttj uuN
1
1g,
j
q
j q
j ggl?
112?
1
0
2
+?+= ∑=,q是残差序列自相关的最大阶数。
可以证明,修正后的统计量 tZZ,r 的极限分布与(6.4.5),(6.4.8)相同,从而可由(6.4.9)或 (6.4.10)计算统计量的值,然后与 DF 检验临界值表中情形二的临界值进行比较,以判断序列是否存在单位根。
此外,对于其它情形(情形一、四),Phillips&Perron证明了,修正统计量 rZ
和 tZ 的极限分布与DF检验中对应情形的极限分布相同,从而可使用DF检验的临界值表。
综上所述,PP单位根检验法是针对扰动项存在序列相关性而提出的,该方法是对DF单位根检验法的进一步推广,其关键点是,在 DF检验统计量的基础上进行修正,由于修正后的统计量与DF检验中的统计量有相同的极限分布,因此可借用DF检验临界值表进行检验。
下面给出PP检验的步骤,
(1) 以最小二乘法估计回归模型,得到参数估计和残差序列;
(2) 计算残差序列的样本自协方差,
∑
+=
=
N
jt
jttj uuN
1
1g,j=0,1,2,…,
PDF created with pdfFactory trial version www.pdffactory.com
及 )1(sjl = 的估计值,
j
q
j q
j ggl?
112?
1
0
2
+?+= ∑?
其中,q的大小根据实际情况确定。若从某一阶之后(比如从第h阶之后),jg? 对
2?l 的贡献可忽略不记,则q取为h。构造该估计量的Newey和West建议q取3
或4。
(3) 计算参数估计量r?的标准差 rs 和残差 tu 的估计方差 ∑?= 22?21 tuNs 。
(4) 将上述计算结果代入 rZ 或 tZ 统计量的表达式,得到统计量的值,查临界值并进行比较,然后作出推断。
例5.4.1 对例5.3.1中的国内生产总值(GDP)序列进行PP检验。
在上一节例5.3.5中对GDP序列进行DF检验,得到如下回归模型,
314680.1
)625296.1()610958.1()838999.1(
060317.047764.13837.190 1
=
=
+=∧
DW
t
GDPtGDP tt
rs =0.037111
DW值偏离2较远,说明残差序列存在相关性。下面用PP检验法进行检验。
残差序列 tu?的前三阶样本自协方差为,
∑= 20?1? tuNg 29775.34= ; ∑?= 111? ttuuNg 29775.34336.0 ×=
∑?= 221? ttuuNg 29775.34206.0 ×= ; ∑?= 331? ttuuNg 29775.34072.0 ×=
j
j
j ggl?
1312?
3
1
0
2
+?+= ∑=
PDF created with pdfFactory trial version www.pdffactory.com
29775.34=?
×+×+×+ 072.0
4
1206.0
4
2336.0
4
321
=2136.1009= 2218.46
∑?= 22?21 tuNs 23819.35=
代入修正统计量 tZ 可得,
sNtZt rslgllg2 )?
(
)( 0
2
0?
=
3819.35 037111.088218.462 9775.34218.46)6253.1()218.46/9775.34(
22 ×
×××=
1414.2?=
给定显著性水平 5%,查 DF 检验临界值表(情形四),临界值为-3.45。由于
tZ 1414.2?= >-3.45,从而接受原假设 0:0 =wH (即 1:0 =rH ),表明 GDP 序列存在单位根。
从该例可以看出,进行PP检验时 tZ 统计量的值较难计算。在实际应用中,
可使用包含有PP检验的计量经济软件。例如Eviews中的PP检验,就可直接输出 tZ 的值。
二、ADF (Augmented Dickey—Fuller)检验
ADF (Augmented Dickey—Fuller)检验法由Dickey和Fuller于1979年提出,该方法是对DF检验的推广,所以常称为增广DF检验。其特点是,假设时间数据序列{ }ty 是由一个P阶自回归过程AR(P)生成的,然后建立估计模型并进行单位根检验。
在介绍ADF检验法之前,先分析P阶自回归过程的特性。
PDF created with pdfFactory trial version www.pdffactory.com
1、P阶自回归过程的特性
假设时间序列{ }ty 服从AR(P)过程,
tptpttt yyyy efff ++++= L2211 (6.4.11)
其中,te 为白噪声。利用滞后算子,可将上式表示为,
=Ψ tyB)( ptpttt yyyy fff L2211
ttpp yBBB efff == )1( 221 L (6.4.12)
令
pfffr +++= L21
1,,2,1);( 1?=++?= + pjpjj LL ffz
可将滞后多项式 )(BΨ 分解成,
)(BΨ )1( 221 pp BBB fff= L
)1)(()1( 11221 BBBBB pp?+++=zzzr L (6.4.13)
则(6.4.12)式可转化为,
=Ψ tyB)( ttpp yBBBBB ezzzr =?+++ )}1)(()1{( 11221 L
整理可得,
tptptttt yyyyy ezzzr +?++?+?+= + 1122111 L (6.4.14)
若服从(6.4.11)的序列有且只有一个单位根,则其特征方程,
01 221 = pp zzz fff L
有且只有一个值为1的根,从而有,
011)1( 21 =?==Ψ rfff pL
上式等价于 1=r 。因此,对服从(6.4.11)的序列的单位根检验,就是检验模型
PDF created with pdfFactory trial version www.pdffactory.com
(6.4.14)中是否有 1=r 。
将模型(6.4.14)与(6.3.1)对比可以发现,模型(6.4.14)中多了 ty? 的 p-1 个滞后项。如果将这些滞后项归到随机扰动项中,则扰动项就成为序列相关的平稳过程,这样,在模型(6.4.14)中检验单位根,实际上就是对扰动项为一平稳过程的单位根检验。因为事实上,由(6.4.13)式可得特征多项式的如下表示形式,
)(zΨ )1( 221 pp zzz fff= L
)1)(()1( 11221 zzzzz pp?+++=zzzr L
当序列有且只有一个单位根时,1=r,从而有
)1( 221 pp zzz fff L )1)(()1( 11221 zzzzz pp?+++=zzzr L
)1)(1( 11221 zzzz pp=zzz L
使上式左边为零的根中,除了一个根为 1 外,其余的根全在单位圆之外。这一结论对于等式右边也成立,因此
0)1( 11221 = pp zzz zzz L
的根全在单位圆之外。这样,滞后多项式
=)(BC 112211 pp BBB zzz L
的逆存在,在 1=r 为真的情况下,(6.4.14)式可写成,
tt
p
p yBBB ezzz =
)1(
1
1
2
21 L (6.4.15)
进一步可表示为,
tttt uBBCy =Φ==?
ee )()(1 (6.4.16)
其中,)()( 1 BCB?=Φ 为一无穷阶的滞后多项式。(6.4.16) 式恰好为模型(6.4.1)在
1=r 时的形式。说明在模型(6.4.14)中检验单位根,与PP单位根检验在本质上是相通的。正因如此,基于模型(6.4.14)的单位根检验被称为增广DF检验。
PDF created with pdfFactory trial version www.pdffactory.com
2、ADF检验,
与 DF 检验一样,ADF 检验也分为四种情形建立估计模型,并在其中进行单位根检验。
情形一:数据序列由模型(6.4.14)生成,并在其中检验单位根,即 1:0 =rH 。
情形二:数据序列由模型(6.4.14)生成,在如下估计模型中检验 1:0 =rH 。
tptptttt yyyyy ezzzra +?++?+?++= + 1122111 L (6.4.17)
情形三:数据序列由模型(6.4.17)生成,在其中检验 1:0 =rH 。
情形四:数据序列由模型(6.4.17)生成,在如下估计模型中检验 1:0 =rH 。
tptptttt yyyyty ezzzrda +?++?+?+++= + 1122111 L (6.4.18)
首先考察情形二,
(1)可以证明,在 1:0 =rH 成立时,对模型(6.4.17)进行最小二乘估计,得到的r?是r的超一致估计,并且有如下极限,
1211
)1?(
p
N
zzz
r
L
()[ ]{ } () ()
()[ ] () 21
0
1
0
2
1
0
2
2
1
][
111
drrWdrrW
drrWWWL
∫∫
∫
→? (6.4.19)
可见,此极限分布与DF检验情形二中统计量 )1?(?rN 的极限分布(6.3.7)一致,从而可用相同的临界值表。但是,上述统计量中含有未知参数,因此不能直接用于检验。现用 jz (j=1,2,…,p-1)的最小二乘估计 jz? 代替 jz,得修正统计量,
121
1
)1?(
=
p
ADF
NZ
zzz
r
L (6.4.20)
该统计量的极限分布与(6.4.19)相同。
(2)对于检验 1:0 =rH 的t统计量,可以证明有如下极限分布,
PDF created with pdfFactory trial version www.pdffactory.com
( ) ()[ ]{ } () ()
()[ ] (){ }2121
0
1
0
2
1
0
2
2
1
][
111
1?
∫∫
∫
→=
drrWdrrW
drrWWW
t L
rs
r (6.4.21)
此极限与DF检验情形二中t统计量的极限分布(6.3.9)是完全一致的。说明在ADF
检验中,不需要对t统计量进行修正,就可直接利用DF检验中的临界值表进行检验。这与 PP 检验形成鲜明对照。我们知道,在 PP 检验中,需要对 t统计量进行修正。其原因主要是,PP 检验中对回归系数r的最小二乘估计没有考虑受扰动项序列相关性的影响。当扰动项序列相关时,最小二乘估计r?是r的超一致估计,但 t 统计量的极限分布由于受扰动项序列相关性的影响而发生了变化,为了能借用DF检验临界值表,就必须对t统计量进行修正,修正后的统计量 tZ(见
(6.4.10))的极限分布才与 DF检验情形二中 t 统计量的极限分布相同。ADF 检验则不同,在该检验法中,r?和 jz? 是同时估计的,由于增添了 ty? 的滞后项,随机扰动项不再序列相关,因此在构造t统计量时不需再作修正。
(3)可以证明,滞后项 ty? 的系数估计量 jz? 有正态的极限分布,从而对参数 jz 的假设检验可由一般的t统计量和F统计量进行检验,临界值可在一般的t
分布和F分布表中查得。
(4)对于联合假设 0,1:0 == arH,可用F统计量进行检验。F统计量为
)1/(?
2/)?~(
2
22
=
pNR
RRF (6.4.22)
其中,2~R为有约束的参差平方和,2?R为无约束的残差平方和,2 为假设中受约束的个数,p+1为模型中待估参数的个数。F检验统计量的极限分布存在,但不再是标准的F分布,相应的临界值已由人们用Monte Carlo模拟方法得到并编制成表供查。
此外,Dickey和Fuller还证明了,对于情形一和情形四,检验 1:0 =rH 的 ADFZ
统计量,
PDF created with pdfFactory trial version www.pdffactory.com
121
1
)1?(
=
p
ADF
NZ
zzz
r
L
和t统计量,
( )
rs
r
1=t
都有非常规的极限分布,它们的极限分布与DF检验中对应情形的极限分布完全一致,从而可直接使用DF检验对应情形的临界值表。而对于情形三,t统计量的极限分布为常规的t分布,因此可用常规的t检验,临界值由t分布表查得。
上面我们对ADF检验的相关理论做了简要介绍。在实际应用中,出于理论上和实践上的考虑,常用如下三种回归模型进行ADF检验,
t
k
i
ititt yyy ebv ∑
=
+?+=?
1
1 (6.4.23)
t
k
i
ititt yyy ebva ∑
=
+?++=?
1
1 (6.4.24)
t
k
i
ititt yyty ebvda ∑
=
+?+++=?
1
1 (6.4.25)
在模型中引入足够的滞后项 ity,目的在于使残差白化。因此,检验单位根的假设 1:0 =rH 在上述模型中就变为 0:0 =wH 。
例5.4.2 对例5.3.1中的国内生产总值(GDP)序列进行ADF检验。
由前面各例的分析可以看出,对GDP进行DF检验,DW值偏离2较远,
说明残差序列存在相关性,可采用 ADF检验。再从图形上看,数据序列呈现时间趋势,故采用情形四进行ADF检验。回归结果如下,
085875.2
)464708.3()215287.2()152260.2()383391.2(
355794.0078661.0892199.19729.234 11
=
=
+?+=
∧
DW
t
GDPGDPtGDP ttt
PDF created with pdfFactory trial version www.pdffactory.com
DW 值非常接近 2,说明通过引入 GDP? 的一期滞后项,已消除了扰动项的序列相关性。查DF检验情形四的临界值表,在 5%的显著性水平上,临界值为-3.46,
由于t=-2.215287>-3.46,因此接受原假设 0:0 =wH,即GDP序列存在单位根。
3,单位根检验小结
到目前为止,我们已讨论了检验单位根的一系列方法。这些方法可分为两类:一类是针对扰动项序列不相关的DF单位根检验;另一类是针对扰动项序列相关的 PP 单位根检验和 ADF 单位根检验。按照数据序列的真实生成过程与估计模型的不同,每一类检验方法又分为四种不同情形。现将它们综述如下,
表5-4-1 不同情形下的DF单位根检验(扰动项序列 te 不相关)
基本模型,ttt yty erda +++=?1 检验假设,1:
0 =rH
数据生成过程 估计模型 统计量 极限分布 查DF临界值表
情形一 不带常数项与趋势项
0=a,0=d
不带常数项与趋势项
0=a,0=d
rs
r
1=t 非标准 DF临界值表
情形一
情形二 不带常数项与趋势项
0=a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t 非标准 DF临界值表
情形二
情形三 带常数项不带趋势项
0≠a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t t分布 t分布表
情形四 带常数项不带趋势项
0≠a,0=d
带常数项带趋势项
0≠a,0≠d
rs
r
1=t 非标准 DF临界值表
情形四
表5-4-2 不同情形下的PP单位根检验(扰动项序列 tu 为平稳过程)
基本模型,ttt uyty +++=?1rda 检验假设,1:
0 =rH
数据生成过程 估计模型 统计量 极限分布 查临界值表
情形一 不带常数项与趋势项
0=a,0=d
不带常数项与趋势项
0=a,0=d
tZ 非标准 DF临界值表 情形一
情形二 不带常数项与趋势项
0=a,0=d
带常数项不带趋势项
0≠a,0=d
tZ 非标准 DF临界值表 情形二
情形三 带常数项不带趋势项
0≠a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t t分布 t分布表
情形四 带常数项不带趋势项
0≠a,0=d
带常数项带趋势项
0≠a,0≠d
tZ 非标准 DF临界值表 情形四
注,s
NtZ
t
rs
l
gllg?
2
)()( 02
0?
=
PDF created with pdfFactory trial version www.pdffactory.com
表5-4-3 不同情形下的ADF单位根检验(扰动项序列 tu 为平稳过程)
基本模型,(
ttt uyty +++=?1rda )
tptptttt yyyyty ezzzrda +?++?+?+++= + 1122111 L
检验假设,1:0 =rH
数据生成过程 估计模型 统计量 极限分布 查临界值表
情形一 不带常数项与趋势项 0=a,0=d
不带常数项与趋势项
0=a,0=d
rs
r
1=t 非标准 DF临界值表
情形一
情形二 不带常数项与趋势项 0=a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t 非标准 DF临界值表
情形二
情形三 带常数项不带趋势项 0≠a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t t分布 t分布表
情形四 带常数项不带趋势项 0≠a,0=d
带常数项带趋势项
0≠a,0≠d
rs
r
1=t 非标准 DF临界值表
情形四
PDF created with pdfFactory trial version www.pdffactory.com
DF 检验要求模型的随机扰动项 te独立同分布。但在实际应用中这一条件往往不能满足(如上一节中的有关例子)。一般来说,如果估计模型的DW值偏离2较大,表明随机扰动项是序列相关的,在这种情况下使用 DF 检验可能会导致偏误,需要寻找新的检验方法。本节我们将介绍在随机扰动项服从一般平稳过程的情况下,检验单位根的PP
检验法和 ADF检验法。
一,PP(Phillips&Perron)检验
首先考虑上一节情形二中扰动项为一平稳过程的单位根检验。假设数据由
(真实过程)
∑∞
=
==+=
0
1 )(,
j
jtjttttt Buuyy ejejr (6.4.1)
产生,其中{ }te 独立同分布,∞<== 2)(,0)( see tt DE 。 ∑∞
=
=
0
)(
j
j
j BB jj,其中B为滞后算子,其系数满足条件 ∞<∑
∞
=0j
jjj 。在回归模型 ttt uyy ++=?1ra 中检验假设,
0;1:0 == arH
与DF检验(情形二)一样,模型参数的OLS估计为,
=
∑
∑
∑∑
∑
tt
t
tt
t
yy
y
yy
yN
1
1
2
11
1
r
a
在 1,0:0 == raH 成立时,上式可改写为,
PDF created with pdfFactory trial version www.pdffactory.com
=
∑
∑
∑∑
∑
tt
t
tt
t
uy
u
yy
yN
1
1
2
11
1
1?
r
a
以矩阵 ( )NNdiagA,21= 左乘上式两端,得
( )
=
=
∑
∑
∑∑
∑
∑
∑
∑∑
∑
tt
t
tt
t
tt
t
tt
t
uyN
uN
yNyN
yN
uy
uAA
yy
yNA
N
N
1
1
1
2
1
2
1
1
1
1
1
1
2
11
11
21
23
23
21
1
1?
r
a
利用有关单位根过程的极限分布(参见第2节),可得
( )?
→
∫∫
∫
])1([21
)1(
)()(
)(1
1?
0
22
1
1
0
221
0
1
0
21
gl
l
ll
l
r
a
W
W
drrWdrrW
drrW
N
N L
其中 )1(sjl =,∑∞
=
=
0
22
0
s
sjsg 。经过化简,可将统计量 )1?(?rN 的极限分离出来如下,
( ) ()[ ]{ } () ()()[ ] () ( )()[ ] ()
21
0
1
0
2
2
0
2
2
1
21
0
1
0
2
1
0
2
2
1
][
/
][
111
1?
drrWdrrWdrrWdrrW
drrWWW
N L
∫∫∫∫
∫
+
→ lglr (6.4.2)
此式表明,)1?(?rN 的极限为两项之和,其中第一项是 tu为独立同分布时 )1?(?rN 的极限分布(6.3.7);第二项是由 tu 的自相关性产生的,当 tu 独立时,它等于零。说明(6.4.2)是(6.3.7)的推广。
可以证明,统计量 2?2?rsN 有以下极限分布,
()[ ] () 21
0
1
0
22
02
2
][
1?
drrWdrrW
N L
∫∫?
→? lgs r (6.4.3)
与(6.3.8)式相比,此式多了一个因子 20lg,它反映了扰动项自相关程度对 2?2?rsN 的
PDF created with pdfFactory trial version www.pdffactory.com
极限分布的影响。当扰动项相互独立时,L,2,1,0,10 === jjjj,从而有 2 0lg =1,(6.4.3)
式就退化为(6.3.8)式。
现利用统计量 2?2?rsN 对 )1?(?rN 进行修正,修正式如下,
)?)((21)1?( 22202 sNN rsglr s (6.4.4)
其中 2s 为 02 )( g=tuE 的一致估计,结合(6.4.2)和(6.4.3),有
)?)((21)1?( 22202 sNN rsglr s
()[ ]{ } () ()
()[ ] () 21
0
1
0
2
1
0
2
2
1
][
111
drrWdrrW
drrWWWL
∫∫
∫
→? (6.4.5)
可以看出,修正后的统计量与 DF 检验情形二中的统计量 )1?(?rN 的极限分布(6.3.7)一致,从而可用相同的临界值表。
类似地,可以考虑t 统计量的极限分布和修正方法,根据(6.4.2)和(6.4.3),
有
( ) ( )?→=?= L
N
Nt
212
2
)?(
1?
1?
rr s
r
s
r
()[ ]{ } () ()
()[ ] (){ } ( )()[ ] (){ }2121
0
1
0
2
00
2
2
1
0
2121
0
1
0
2
1
0
2
2
1
][
/
][
111
drrWdrrWdrrWdrrW
drrWWW
∫∫∫∫
∫
+?
l
ggl
g
l (6.4.6)
对t统计量修正如下,
s
Nt rs
l
gl
l
g?
2
)( 020 (6.4.7)
结合(6.4.3)和(6.4.6),有如下极限分布,
s
Nt rs
l
gl
l
g?
2
)( 020 ()[ ]{ } () ()
()[ ] (){ }2121
0
1
0
2
1
0
2
2
1
][
111
∫∫
∫
→?
drrWdrrW
drrWWWL (6.4.8)
修正后的统计量与DF检验情形二中的t统计量有相同的极限分布(6.3.9),从而
PDF created with pdfFactory trial version www.pdffactory.com
可用相同的临界值表。
但是,修正统计量(6.4.4)与(6.4.7)不能直接用于检验,因为其中含有未知参数 0gl、,必需再进行修正。令
)?)((21)1?( 22202 sNNZ rr sglr s= (6.4.9)
s
NtZ
t
rs
l
gllg?
2
)()( 02
0?
= (6.4.10)
其中 ∑
+=
=
N
jt
jttj uuN
1
1g,
j
q
j q
j ggl?
112?
1
0
2
+?+= ∑=,q是残差序列自相关的最大阶数。
可以证明,修正后的统计量 tZZ,r 的极限分布与(6.4.5),(6.4.8)相同,从而可由(6.4.9)或 (6.4.10)计算统计量的值,然后与 DF 检验临界值表中情形二的临界值进行比较,以判断序列是否存在单位根。
此外,对于其它情形(情形一、四),Phillips&Perron证明了,修正统计量 rZ
和 tZ 的极限分布与DF检验中对应情形的极限分布相同,从而可使用DF检验的临界值表。
综上所述,PP单位根检验法是针对扰动项存在序列相关性而提出的,该方法是对DF单位根检验法的进一步推广,其关键点是,在 DF检验统计量的基础上进行修正,由于修正后的统计量与DF检验中的统计量有相同的极限分布,因此可借用DF检验临界值表进行检验。
下面给出PP检验的步骤,
(1) 以最小二乘法估计回归模型,得到参数估计和残差序列;
(2) 计算残差序列的样本自协方差,
∑
+=
=
N
jt
jttj uuN
1
1g,j=0,1,2,…,
PDF created with pdfFactory trial version www.pdffactory.com
及 )1(sjl = 的估计值,
j
q
j q
j ggl?
112?
1
0
2
+?+= ∑?
其中,q的大小根据实际情况确定。若从某一阶之后(比如从第h阶之后),jg? 对
2?l 的贡献可忽略不记,则q取为h。构造该估计量的Newey和West建议q取3
或4。
(3) 计算参数估计量r?的标准差 rs 和残差 tu 的估计方差 ∑?= 22?21 tuNs 。
(4) 将上述计算结果代入 rZ 或 tZ 统计量的表达式,得到统计量的值,查临界值并进行比较,然后作出推断。
例5.4.1 对例5.3.1中的国内生产总值(GDP)序列进行PP检验。
在上一节例5.3.5中对GDP序列进行DF检验,得到如下回归模型,
314680.1
)625296.1()610958.1()838999.1(
060317.047764.13837.190 1
=
=
+=∧
DW
t
GDPtGDP tt
rs =0.037111
DW值偏离2较远,说明残差序列存在相关性。下面用PP检验法进行检验。
残差序列 tu?的前三阶样本自协方差为,
∑= 20?1? tuNg 29775.34= ; ∑?= 111? ttuuNg 29775.34336.0 ×=
∑?= 221? ttuuNg 29775.34206.0 ×= ; ∑?= 331? ttuuNg 29775.34072.0 ×=
j
j
j ggl?
1312?
3
1
0
2
+?+= ∑=
PDF created with pdfFactory trial version www.pdffactory.com
29775.34=?
×+×+×+ 072.0
4
1206.0
4
2336.0
4
321
=2136.1009= 2218.46
∑?= 22?21 tuNs 23819.35=
代入修正统计量 tZ 可得,
sNtZt rslgllg2 )?
(
)( 0
2
0?
=
3819.35 037111.088218.462 9775.34218.46)6253.1()218.46/9775.34(
22 ×
×××=
1414.2?=
给定显著性水平 5%,查 DF 检验临界值表(情形四),临界值为-3.45。由于
tZ 1414.2?= >-3.45,从而接受原假设 0:0 =wH (即 1:0 =rH ),表明 GDP 序列存在单位根。
从该例可以看出,进行PP检验时 tZ 统计量的值较难计算。在实际应用中,
可使用包含有PP检验的计量经济软件。例如Eviews中的PP检验,就可直接输出 tZ 的值。
二、ADF (Augmented Dickey—Fuller)检验
ADF (Augmented Dickey—Fuller)检验法由Dickey和Fuller于1979年提出,该方法是对DF检验的推广,所以常称为增广DF检验。其特点是,假设时间数据序列{ }ty 是由一个P阶自回归过程AR(P)生成的,然后建立估计模型并进行单位根检验。
在介绍ADF检验法之前,先分析P阶自回归过程的特性。
PDF created with pdfFactory trial version www.pdffactory.com
1、P阶自回归过程的特性
假设时间序列{ }ty 服从AR(P)过程,
tptpttt yyyy efff ++++= L2211 (6.4.11)
其中,te 为白噪声。利用滞后算子,可将上式表示为,
=Ψ tyB)( ptpttt yyyy fff L2211
ttpp yBBB efff == )1( 221 L (6.4.12)
令
pfffr +++= L21
1,,2,1);( 1?=++?= + pjpjj LL ffz
可将滞后多项式 )(BΨ 分解成,
)(BΨ )1( 221 pp BBB fff= L
)1)(()1( 11221 BBBBB pp?+++=zzzr L (6.4.13)
则(6.4.12)式可转化为,
=Ψ tyB)( ttpp yBBBBB ezzzr =?+++ )}1)(()1{( 11221 L
整理可得,
tptptttt yyyyy ezzzr +?++?+?+= + 1122111 L (6.4.14)
若服从(6.4.11)的序列有且只有一个单位根,则其特征方程,
01 221 = pp zzz fff L
有且只有一个值为1的根,从而有,
011)1( 21 =?==Ψ rfff pL
上式等价于 1=r 。因此,对服从(6.4.11)的序列的单位根检验,就是检验模型
PDF created with pdfFactory trial version www.pdffactory.com
(6.4.14)中是否有 1=r 。
将模型(6.4.14)与(6.3.1)对比可以发现,模型(6.4.14)中多了 ty? 的 p-1 个滞后项。如果将这些滞后项归到随机扰动项中,则扰动项就成为序列相关的平稳过程,这样,在模型(6.4.14)中检验单位根,实际上就是对扰动项为一平稳过程的单位根检验。因为事实上,由(6.4.13)式可得特征多项式的如下表示形式,
)(zΨ )1( 221 pp zzz fff= L
)1)(()1( 11221 zzzzz pp?+++=zzzr L
当序列有且只有一个单位根时,1=r,从而有
)1( 221 pp zzz fff L )1)(()1( 11221 zzzzz pp?+++=zzzr L
)1)(1( 11221 zzzz pp=zzz L
使上式左边为零的根中,除了一个根为 1 外,其余的根全在单位圆之外。这一结论对于等式右边也成立,因此
0)1( 11221 = pp zzz zzz L
的根全在单位圆之外。这样,滞后多项式
=)(BC 112211 pp BBB zzz L
的逆存在,在 1=r 为真的情况下,(6.4.14)式可写成,
tt
p
p yBBB ezzz =
)1(
1
1
2
21 L (6.4.15)
进一步可表示为,
tttt uBBCy =Φ==?
ee )()(1 (6.4.16)
其中,)()( 1 BCB?=Φ 为一无穷阶的滞后多项式。(6.4.16) 式恰好为模型(6.4.1)在
1=r 时的形式。说明在模型(6.4.14)中检验单位根,与PP单位根检验在本质上是相通的。正因如此,基于模型(6.4.14)的单位根检验被称为增广DF检验。
PDF created with pdfFactory trial version www.pdffactory.com
2、ADF检验,
与 DF 检验一样,ADF 检验也分为四种情形建立估计模型,并在其中进行单位根检验。
情形一:数据序列由模型(6.4.14)生成,并在其中检验单位根,即 1:0 =rH 。
情形二:数据序列由模型(6.4.14)生成,在如下估计模型中检验 1:0 =rH 。
tptptttt yyyyy ezzzra +?++?+?++= + 1122111 L (6.4.17)
情形三:数据序列由模型(6.4.17)生成,在其中检验 1:0 =rH 。
情形四:数据序列由模型(6.4.17)生成,在如下估计模型中检验 1:0 =rH 。
tptptttt yyyyty ezzzrda +?++?+?+++= + 1122111 L (6.4.18)
首先考察情形二,
(1)可以证明,在 1:0 =rH 成立时,对模型(6.4.17)进行最小二乘估计,得到的r?是r的超一致估计,并且有如下极限,
1211
)1?(
p
N
zzz
r
L
()[ ]{ } () ()
()[ ] () 21
0
1
0
2
1
0
2
2
1
][
111
drrWdrrW
drrWWWL
∫∫
∫
→? (6.4.19)
可见,此极限分布与DF检验情形二中统计量 )1?(?rN 的极限分布(6.3.7)一致,从而可用相同的临界值表。但是,上述统计量中含有未知参数,因此不能直接用于检验。现用 jz (j=1,2,…,p-1)的最小二乘估计 jz? 代替 jz,得修正统计量,
121
1
)1?(
=
p
ADF
NZ
zzz
r
L (6.4.20)
该统计量的极限分布与(6.4.19)相同。
(2)对于检验 1:0 =rH 的t统计量,可以证明有如下极限分布,
PDF created with pdfFactory trial version www.pdffactory.com
( ) ()[ ]{ } () ()
()[ ] (){ }2121
0
1
0
2
1
0
2
2
1
][
111
1?
∫∫
∫
→=
drrWdrrW
drrWWW
t L
rs
r (6.4.21)
此极限与DF检验情形二中t统计量的极限分布(6.3.9)是完全一致的。说明在ADF
检验中,不需要对t统计量进行修正,就可直接利用DF检验中的临界值表进行检验。这与 PP 检验形成鲜明对照。我们知道,在 PP 检验中,需要对 t统计量进行修正。其原因主要是,PP 检验中对回归系数r的最小二乘估计没有考虑受扰动项序列相关性的影响。当扰动项序列相关时,最小二乘估计r?是r的超一致估计,但 t 统计量的极限分布由于受扰动项序列相关性的影响而发生了变化,为了能借用DF检验临界值表,就必须对t统计量进行修正,修正后的统计量 tZ(见
(6.4.10))的极限分布才与 DF检验情形二中 t 统计量的极限分布相同。ADF 检验则不同,在该检验法中,r?和 jz? 是同时估计的,由于增添了 ty? 的滞后项,随机扰动项不再序列相关,因此在构造t统计量时不需再作修正。
(3)可以证明,滞后项 ty? 的系数估计量 jz? 有正态的极限分布,从而对参数 jz 的假设检验可由一般的t统计量和F统计量进行检验,临界值可在一般的t
分布和F分布表中查得。
(4)对于联合假设 0,1:0 == arH,可用F统计量进行检验。F统计量为
)1/(?
2/)?~(
2
22
=
pNR
RRF (6.4.22)
其中,2~R为有约束的参差平方和,2?R为无约束的残差平方和,2 为假设中受约束的个数,p+1为模型中待估参数的个数。F检验统计量的极限分布存在,但不再是标准的F分布,相应的临界值已由人们用Monte Carlo模拟方法得到并编制成表供查。
此外,Dickey和Fuller还证明了,对于情形一和情形四,检验 1:0 =rH 的 ADFZ
统计量,
PDF created with pdfFactory trial version www.pdffactory.com
121
1
)1?(
=
p
ADF
NZ
zzz
r
L
和t统计量,
( )
rs
r
1=t
都有非常规的极限分布,它们的极限分布与DF检验中对应情形的极限分布完全一致,从而可直接使用DF检验对应情形的临界值表。而对于情形三,t统计量的极限分布为常规的t分布,因此可用常规的t检验,临界值由t分布表查得。
上面我们对ADF检验的相关理论做了简要介绍。在实际应用中,出于理论上和实践上的考虑,常用如下三种回归模型进行ADF检验,
t
k
i
ititt yyy ebv ∑
=
+?+=?
1
1 (6.4.23)
t
k
i
ititt yyy ebva ∑
=
+?++=?
1
1 (6.4.24)
t
k
i
ititt yyty ebvda ∑
=
+?+++=?
1
1 (6.4.25)
在模型中引入足够的滞后项 ity,目的在于使残差白化。因此,检验单位根的假设 1:0 =rH 在上述模型中就变为 0:0 =wH 。
例5.4.2 对例5.3.1中的国内生产总值(GDP)序列进行ADF检验。
由前面各例的分析可以看出,对GDP进行DF检验,DW值偏离2较远,
说明残差序列存在相关性,可采用 ADF检验。再从图形上看,数据序列呈现时间趋势,故采用情形四进行ADF检验。回归结果如下,
085875.2
)464708.3()215287.2()152260.2()383391.2(
355794.0078661.0892199.19729.234 11
=
=
+?+=
∧
DW
t
GDPGDPtGDP ttt
PDF created with pdfFactory trial version www.pdffactory.com
DW 值非常接近 2,说明通过引入 GDP? 的一期滞后项,已消除了扰动项的序列相关性。查DF检验情形四的临界值表,在 5%的显著性水平上,临界值为-3.46,
由于t=-2.215287>-3.46,因此接受原假设 0:0 =wH,即GDP序列存在单位根。
3,单位根检验小结
到目前为止,我们已讨论了检验单位根的一系列方法。这些方法可分为两类:一类是针对扰动项序列不相关的DF单位根检验;另一类是针对扰动项序列相关的 PP 单位根检验和 ADF 单位根检验。按照数据序列的真实生成过程与估计模型的不同,每一类检验方法又分为四种不同情形。现将它们综述如下,
表5-4-1 不同情形下的DF单位根检验(扰动项序列 te 不相关)
基本模型,ttt yty erda +++=?1 检验假设,1:
0 =rH
数据生成过程 估计模型 统计量 极限分布 查DF临界值表
情形一 不带常数项与趋势项
0=a,0=d
不带常数项与趋势项
0=a,0=d
rs
r
1=t 非标准 DF临界值表
情形一
情形二 不带常数项与趋势项
0=a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t 非标准 DF临界值表
情形二
情形三 带常数项不带趋势项
0≠a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t t分布 t分布表
情形四 带常数项不带趋势项
0≠a,0=d
带常数项带趋势项
0≠a,0≠d
rs
r
1=t 非标准 DF临界值表
情形四
表5-4-2 不同情形下的PP单位根检验(扰动项序列 tu 为平稳过程)
基本模型,ttt uyty +++=?1rda 检验假设,1:
0 =rH
数据生成过程 估计模型 统计量 极限分布 查临界值表
情形一 不带常数项与趋势项
0=a,0=d
不带常数项与趋势项
0=a,0=d
tZ 非标准 DF临界值表 情形一
情形二 不带常数项与趋势项
0=a,0=d
带常数项不带趋势项
0≠a,0=d
tZ 非标准 DF临界值表 情形二
情形三 带常数项不带趋势项
0≠a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t t分布 t分布表
情形四 带常数项不带趋势项
0≠a,0=d
带常数项带趋势项
0≠a,0≠d
tZ 非标准 DF临界值表 情形四
注,s
NtZ
t
rs
l
gllg?
2
)()( 02
0?
=
PDF created with pdfFactory trial version www.pdffactory.com
表5-4-3 不同情形下的ADF单位根检验(扰动项序列 tu 为平稳过程)
基本模型,(
ttt uyty +++=?1rda )
tptptttt yyyyty ezzzrda +?++?+?+++= + 1122111 L
检验假设,1:0 =rH
数据生成过程 估计模型 统计量 极限分布 查临界值表
情形一 不带常数项与趋势项 0=a,0=d
不带常数项与趋势项
0=a,0=d
rs
r
1=t 非标准 DF临界值表
情形一
情形二 不带常数项与趋势项 0=a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t 非标准 DF临界值表
情形二
情形三 带常数项不带趋势项 0≠a,0=d
带常数项不带趋势项
0≠a,0=d
rs
r
1=t t分布 t分布表
情形四 带常数项不带趋势项 0≠a,0=d
带常数项带趋势项
0≠a,0≠d
rs
r
1=t 非标准 DF临界值表
情形四
PDF created with pdfFactory trial version www.pdffactory.com