金融时间序列课件：第六章__第3节

分类：经济格式：pdf 日期：2009年04月06日

1
第3节 Dickey—Fuller单位根检验（DF检验）
前面两节已为检验单位根做了理论准备。
下面我们讨论Dickey—Fuller建立的单位根检验法。
任何一个序列都有其自身的真实生成过程。Dickey—Fuller 假设数据序列是由下列两种模型之一产生,
（1） ttt yy er +=?1,(6.3.1)
（2） ttt yy era ++=?1 ； (6.3.2)
其中,),0(~ 2se iidt 。然后分为如下四种情形建立估计模型，并在其中进行单位根检验,
情形一：假设数据由（真实过程）(6.3.1)产生，在回归模型(6.3.1)中检验假设,
1:0 =rH
情形二：假设数据由（真实过程）(6.3.1)产生，在回归模型(6.3.2)中检验假设,
0;1:0 == arH
情形三：假设数据由（真实过程）(6.3.2)产生，在其中检验假设,;1:0 =rH
情形四：假设数据由（真实过程）(6.3.2)产生，在回归模型
ttt tyy edra +++=?1 中检验假设,
0;1:0 == drH
对于上述各种情形下的回归模型，可以使用 OLS 法得到参数估计量和相应的t统计量。
但是，Dickey与Fuller的研究发现，在原假设成立的条件下，相应的t统
PDF created with pdfFactory trial version www.pdffactory.com
2
计量不再服从渐近正态分布，从而临界值与拒绝域发生变化。
具体分析如下,
一,情形一的DF检验法
1、检验方法
回归模型(6.3.1)系数r的OLS估计为,
∑
∑
=
2
1
1?
t
tt
y
yyr
构造统计量,
[ ] 212 12?
∑?
=?=
tys
t rrs rr
r
(6.3.3)
其中 2s 为模型的剩余方差。
在 1:0 =rH 成立的条件下，t统计量为,
[ ]
[ ] 212 122 1
11
212
1
2?
1)(
1?
1?
∑∑
∑
∑

=
=?=
tt
ttt
t
ysy
yyy
ys
t rsr
r
∑∑∑ ∑
==
212212
1
2
1
1
212212
1
1
][][][][ syN
yN
sy
y
t
tt
t
tt ee
在 1:0 =rH 成立的条件下，模型(6.3.1)为随机游动过程，有关随机游动的极限定理成立，因此,
[ ]{ }1)1(2 2
2
1
1→?∑
WyN L
tt
se
()∫∑?→ 1
0
222
1
2 drrWyN L
t s
其中W(r)为维纳过程。又因为 2s 为 2s 的一致估计，根据连续影射定理，t统计量具有如下极限,
PDF created with pdfFactory trial version www.pdffactory.com
3
{ } { }
( ){ }
(){ }212121 1
0
2
2
2
1
22
1
2
1
1
11
1?
∫∑
∑→?=?=
drrW
W
SYN
YNt L
t
tt e
s
r
r
(6.3.4)
即t统计量依分布收敛于维纳过程的泛函，表明t检验统计量不再服从传统的t
分布，传统的t检验法失效。
上面的极限分布一般称为Dickey—Fuller分布，对应的检验称为DF检验。
由于 )1(~)1( 22 cW,(6.3.4)式的分母恒正，分子是 )1(2c 分布与其均值之差，
因此上述检验统计量的极限分布是非对称、左偏的。又因 70.0}1)1({ 2?≤cP,所以检验值大都是负数。
Dickey—Fuller分布是非标准的，因此人们用Monte Carlo方法模拟得到检验的临界值，并编成DF检验临界值表（情形一）供查。
在进行DF检验时，比较t统计量值与DF检验临界值，就可在某个显著性水平上拒绝或接受原假设。
在实际应用中，可按如下检验步骤进行,
(1) 根据所观察的数据序列，用 OLS法估计不带常数项的一阶自回归模型,
ttt yy er +=?1
得到回归系数r的OLS估计
∑
∑
=
2
1
1?
t
tt
y
yyr
(2) 提出假设,
1:0 =rH
检验用统计量为常规t统计量,
[ ] 212 12?
∑?
=?=
tys
t rrs rr
r
根据(6.3.4)式，在 1:0 =rH 成立的条件下，该统计量的极限分布为
Dickey—Fuller分布。
(3) 计算在原假设成立条件下的t统计量值，查 DF检验临界值表（情形
PDF created with pdfFactory trial version www.pdffactory.com
4
一），得临界值，然后将t统计量值与DF检验临界值进行比较,
若t统计量值小于DF检验临界值，则拒绝原假设 1:0 =rH,说明序列不存在单位根；
若t统计量值大于或等于DF检验临界值，则接受原假设 1:0 =rH,说明序列存在单位根；
需要说明的是，在一般计量经济软件中对回归模型回归系数的检验，原假设都是回归系数为零。因此，为了能直接使用计算机输出结果，通常将回归模型(6.3.1)变形为,
ttt yy er +?=1)1(
令 1?= rw,上述模型等价地变成,
ttt yy ew +=1 (6.3.5)
原假设 1:0 =rH 则变为 0:0 =wH 。
1,实例分析
下面我们利用DF检验进行实例分析。
例6.3.1 本章附表1给出了1970—1991年美国3种宏观经济变量的季度数据序列（摘自（美）古扎拉蒂《计量经济学》中译本P706）。表中的3个序列分别为：国内生产总值（GDP）、个人可支配收入（PDI）、个人消费支出（PCE）。
图 5-3-1是三个序列的图形。
图5-3-1 美国GDP,PDI,PCE季度数据（1970—1991）
对每一个序列，采用模型(6.3.5)进行估计，回归结果如下,
1000
2000
3000
4000
5000
70 72 74 76 78 80 82 84 86 88 90
GDP PCE PDI
PDF created with pdfFactory trial version www.pdffactory.com
5
（1）GDP,
340574.1
)798077.5(
005765.0 1
=
=
=∧
DW
t
GDPGDP tt
（2）PCE,
586258.1
)303944.8(
006446.0 1
=
=
=∧
DW
t
PCEPCE tt
（3）PDI,
054157.2
)705903.5(
006115.0 1
=
=
=∧
DW
t
PDIPDI tt
查 DF检验临界值表（情形一），在显著性水平为 5%下，DF临界值为-1.95。由于三个回归方程回归系数的t统计量值都大于DF检验临界值，因此不能拒绝原假设 0:0 =wH （即 1:0 =rH ），说明所考察的三个序列都存在单位根，它们是非平稳序列。
接下来的问题是，三个序列的一阶差分序列是否为平稳序列，即三个序列是否为一阶单整I（1）序列？为此，需要对序列 ttt PDIPCEGDP,,进行单位根检验。记
tttttt ZPDIYPCEXGDP =?=?=?,,
采用对应于模型(6.3.5)的形式进行回归，回归结果如下,
（1）序列 tt XGDP =?,
192062.2
)181149.5(
4796201.0 1
=
=
=∧
DW
t
XX tt
（2）序列 tt YPCE =?,
PDF created with pdfFactory trial version www.pdffactory.com
6
403875.2
)883922.4(
437799.0 1
=
=
=∧
DW
t
YY tt
（3）序列 tt ZPDI =?,
11266.2
)137588.7(
745190.0 1
=
=
=∧
DW
t
ZZ tt
将回归系数的t统计量与DF检验临界值（-1.95）比较，在 5%的显著性水平上，
拒绝原假设 0:0 =wH （即 1:0 =rH ），说明所考察的三个序列 ttt PDIPCEGDP,,都不存在单位根，它们是平稳的，原序列为I（1）序列。
从图形上看，序列 ttt PDIPCEGDP,,已呈现为围绕其均值上下无规律波动的曲线。图5-3-2是 tGDP? 的一阶差分序列图。
-100
-50
0
50
100
150
70 72 74 76 78 80 82 84 86 88 90
图5-3-2 美国GDP 季度数据（1970—1991）一阶差分序列
例5.3.2 对上海证券市场综合指数的周数据 }{ tP 进行单位根检验。时间范围为1997-1999（数据来源：证券市场周刊）。数据序列的图形见图5-1-2(a)。
分别对原序列 }{ tP 和差分序列 }{ tP? 估计不带常数项的自回归模型，回归结果如下,
（1）
860102.1
)425859.0(
001388.0 1
=
=
=∧
DW
t
PP tt
PDF created with pdfFactory trial version www.pdffactory.com
7
（2）
989107.1
)09015.11(
930795.0 12
=
=
=
∧
DW
t
PP tt
在 5%显著性水平下，DF临界值为-1.95。回归方程（1）的t统计量值大于 DF
检验临界值，接受原假设 0:0 =wH （即 1:0 =rH ），表明序列 }{ tP 存在单位根；回归方程（2）的t统计量值小于DF检验临界值，拒绝原假设 0:0 =wH,表明序列
}{ tP? 不存在单位根，即原序列 }{ tP ~I(1)。
二,情形二的DF检验法
对于情形二，估计模型,
ttt yy era ++=?1 ； (6.3.2)
中含有常数项，模型参数的OLS估计为,

=

∑
∑
∑∑
∑

tt
t
tt
t
yy
y
yy
yN
1
1
2
11
1
r
a
在 1,0:0 == raH 成立时，上式可改写为,

=

∑
∑
∑∑
∑

tt
t
tt
t
yyy
yN
e
e
r
a
1
1
2
11
1
1?
以矩阵 ( )NNdiagA,21= 左乘上式两端，得
( )

=

=

∑
∑
∑∑
∑
∑
∑
∑∑
∑

tt
t
tt
t
tt
t
tt
t
yN
N
yNyN
yN
yAAyy
yNA
N
N
e
e
e
e
r
a
1
1
1
2
1
2
1
1
1
1
1
1
2
11
11
21
23
23
21
1
1?
在 1,0:0 == raH 成立时，序列{ }ty 服从随机游动过程，利用有关随机游动的极限定理，可得
( )?

→

∫∫
∫
]1)1([21
)1(
)()(
)(1
1?
22
1
1
0
221
0
1
0
21
W
W
drrWdrrW
drrW
N
N L
s
s
ss
s
r
a
PDF created with pdfFactory trial version www.pdffactory.com
8
据此，可得 a?21N 和 )1?(?rN 的极限分布分别为,
() () ()
() () 21
0
1
0
2
1
0
21
0
2
21
][
]11[21)1(
∫∫
∫∫

→?
drrWdrrW
drrWWdrrWW
N L
s
a (6.3.6)
)1?(?rN
() ()
() () 21
0
1
0
2
1
0
2
][
)1(]11[21
∫∫
∫

→?
drrWdrrW
drrWWW
L (6.3.7)
另一方面，估计量r?的样本方差为
[ ]

=?

∑∑
∑
1
01,0? 1
2
11
122
tt
t
yy
yNs
rs
其中 2s = ( )2121 ∑ tt yyN ra
为模型的剩余方差，它是随机扰动项方差 2s 的最小二乘估计。
可以证明，统计量 2?2?rsN 有以下极限分布,
() () 21
0
1
0
2
2
2
][
1?
∫∫?
→?
drrWdrrW
N Lrs (6.3.8)
由连续影射定理，可得t统计量的极限分布为
( ) ( ) (){ } () ()
() (){ }2121
0
1
0
2
1
0
2
2
1
212
2
][
111
)?(
1?
1?
∫∫
∫

→=?=
drrWdrrW
drrWWW
N
Nt L
rr s
r
s
r (6.3.9)
这表明当估计模型中含有常数项时，t统计量的极限分布发生了变化，从而临界值也就不同。Dickey、Fuller利用Monte Carlo方法得到不同样本长度和显著性水平下DF检验临界值表（情形二）供查。
例5.3.3 对例5.3.1中的三个序列估计带常数项的一阶自回归模型，回归结果如下,
（1）GDP,
PDF created with pdfFactory trial version www.pdffactory.com
9
351998.1
)219165.0()157605.1(
003168.02054.28 1
=
=
=∧
DW
t
GDPGDP tt
（2）PCE,
629810.1
)207360.0()726352.1(
000896.016937.19 1
=
=
=∧
DW
t
PCEPCE tt
（3）PDI,
098069.2
)671576.0()652392.1(
004287.086419.29 1
=
=
=∧
DW
t
PDIPDI tt
给定显著性水平5%，查DF检验临界值表（情形二），临界值为-2.89。三个回归方程滞后项系数的t统计量值都大于DF检验临界值，从而接受原假设 0:0 =wH
（即 1:0 =rH ），再一次表明三个序列存在单位根。
例5.3.4 对例 5.3.2中的上海证券市场综合指数的周数据 }{ tP 估计带常数项的一阶自回归模型，回归结果如下,
827656.1
)589131.2()665411.2(
065434.023557.86? 1
=
=
=
DW
t
PP tt
给定显著性水平5%，查DF检验临界值表（情形二），临界值为-2.89。由于t统计量值大于DF检验临界值，从而接受原假设 0:0 =wH （即 1:0 =rH ），再一次表明序列 }{ tP 存在单位根。
三,其它情形的DF检验法
Dickey、Fuller 还考察了情形三、情形四下的单位根检验问题，检验统计量同前。可以证明，在情形三下，检验用的 t 统计量的极限分布为正态分布，
从而可按照传统检验法进行；在情形四下，检验用的 t 统计量的极限分布为非正规分布（极限分布的具体形式从略，可参见有关文献），由于极限分布不同，
PDF created with pdfFactory trial version www.pdffactory.com
10
临界值也就不相同。临界值由Monte Carlo模拟方法得到并编制成DF检验临界值表（情形四）供查。
此外，Dickey 和 Fuller（1981）还给出了在情形二下联合假设
0,1:0 == arH,在情形四下联合假设 0,1:0 == drH 及 0,1,0:0 === draH 的 F
检验统计量的极限分布。F统计量为
)/(?
/)?~(
2
22
knR
rRRF
= (6.3.10)
其中,2~R 为有约束的残差平方和,2?R 为无约束的残差平方和，r 为假设中受约束的个数，k为模型中待估参数的个数。F检验统计量的极限分布存在，但不再是标准的F分布，相应的临界值已由人们用Monte Carlo模拟方法得到并编制成表供查。
注意点,
最后需要说明的是，DF 单位根检验法，依赖于对数据真实生成过程的设定及估计模型类型的选择。如果模型选择不当，则可能会导致错误的结论。
在实际应用中，应尽可能从经济学和统计学的角度考虑数据的生成过程，以决定模型中是否应包含常数项。
在没有先验信息的情况下，应尽量先采用较一般的模型进行检验。
例如，在例5.3.1中，国内生产总值（GDP）、个人可支配收入（PDI）、
个人消费支出（PCE）三个序列具有较明显的时间趋势，而且从经济学的角度看，由于经济技术的持续发展，上述三个经济总量指标应该有不断增长的趋势。因此，在选择估计模型的类型时就应考虑到这一点，
更为恰当的做法是按照情形四进行单位根检验。
例5.3.5 对例5.3.1中的三个序列按情形四检验单位根。回归结果如下,
（1）GDP,
314680.1
)625296.1()610958.1()838999.1(
060317.047764.13837.190 1
=
=
+=∧
DW
t
GDPtGDP tt
PDF created with pdfFactory trial version www.pdffactory.com
11
（2）PCE,
595415.1
)376068.1()360435.1()674765.1(
044464.0798720.019111.74 1
=
=
+=∧
DW
t
PCEtPCE tt
（3）PDI,
938465.1
)58854.2()530769.2()753007.2(
156942.0875152.25080.329 1
=
=
+=∧
DW
t
PDItPDI tt
给定显著性水平5%，查DF检验临界值表（情形四）,临界值为-3.45。
由于三个回归方程滞后项系数的t统计量值都大于DF检验临界值，因此接受原假设 0:0 =wH （即 1:0 =rH ），再一次表明三个序列存在单位根。
但是需要指出的是，上述各例中，有些回归模型的DW值偏离2较远，表明扰动项存在序列相关性，这就违背了模型的假定条件。关于这一问题的处理，我们将在下一节中讨论。
PDF created with pdfFactory trial version www.pdffactory.com

课件简介

课件名称：	金融时间序列课件
课件分类：	经济
课件类型：	电子教案
文件大小：	2.15MB
下载次数：	16
评论次数：	6
用户评分：	7.7