1
第七章 协整与误差校正模型
本章将介绍:协整的概念及性质
协整检验
协整回归
误差校正模型。
节第一 伪回归问题
一、伪回归现象
所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。这是传统回归分析方法较易犯的一种错误。
经济学家早就发现经济变量之间可能会存在伪回归现象。
20世纪70年代,Grange、Newbold研究发现,造成“伪回归”的根本原因在于变量的时序序列的非平稳性。
他们用Monte Carlo模拟方法表明,如果用传统回归分析方法对彼此不相关联的非平稳变量进行回归,t检验值和 2R 值往往会倾向于显著,从而得出“变量相依”的“伪回归结果”。
二、非平稳性对回归分析有什么影响?
考察如下例子:假设{ }tx,{ }ty 是相互独立的随机游动过程(I(1)过程),即
ttt vxx +=?1 (7.1.1)
ttt uyy +=?1 (7.1.2)
其中,{ }tv,{ }tu 为白噪声,且 0),( =tt uvCv 。
形式地引入回归模型
PDF created with pdfFactory trial version www.pdffactory.com
2
ttt xy eba ++= (7.1.3)
显然,由于序列{ }tx 与{ }ty 互不相关,b应为0。
如果利用传统回归分析方法来进行检验,是否能得出b =0的结论?
为了回答上述问题,Grange等通过Monte Carlo方法进行模拟,
(1)他们首先用计算机生成样本容量为N=100的两个相互独立的随机序列样本:{ }tv,)1,0(~ INvt ;{ }tu,)1,0(~ INut 。
(2)将它们代入(7.1.1)和(7.1.2),并设 000 == yx,分别生成样本序列{ }tx
与{ }ty 。
(3)然后利用样本序列{ }tx 与{ }ty 估计回归方程(7.1.3),并用 t 检验法对回归系数的显著性进行检验。
(4)重复上述试验过程M=10000次,得到b的估计序列{ }Mii,,2,1,? L=b 及相应的估计标准差序列{ }MiSi,,2,1,L=,计算出各次试验的 t统计量值,然后考察
M次试验中拒绝零假设 0:0 =bH 的频率,以及y与x之间的样本相关系数的频率分布。
结果发现,
在显著性水平5%(t检验临界值为1.96)的情况下,拒绝零假设
0:0 =bH 的频率高达0.76,而且这种拒绝率随着样本容量T的增加而增大。
此外他们还发现,y与x之间的样本相关系数R接近 1± 的频率很大。
如图6-1-1,
(a)是两个非相关I(0)序列{ }tx 与{ }ty 的相关系数分布图,此分布的均值为零,近似为正态。表明{ }tx 与{ }ty 的样本相关系数以较大频率
PDF created with pdfFactory trial version www.pdffactory.com
3
取值于零的周围,这同{ }tx 与{ }ty 不相关是吻合的。
(b)是两个非相关I(1)序列{ }tx 与{ }ty 的样本相关系数分布图,此分布呈倒U字形。需注意的是,尽管{ }tx 与{ }ty 的真实相关系数仍然为零,
但从模拟结果看,{ }tx 与{ }ty 的样本相关系数为零的可能性与图(a)相比大大降低,实际上,相关系数以较大频率靠近 1± 。
(a)两个非相关I(0)序列R分布 (b)两个非相关I(1)序列R分布
图6-1-1
上述结论表明,
对于两个本来不相依的I(1)变量,如果用传统回归分析方法进行分析,会倾向于拒绝零假设 0:0 =bH,从而形成“伪回归”。换个角度说,当回归模型中包含非平稳序列时,如果用传统回归分析方法进行分析,即使t检验值和 2R 都显著,也不能据此推断变量间确实存在相依关系。
三、Phillips的严格证明
对于上述现象,Phillips(1986)从理论上给出了严格论证。
假设数据序列由相互独立的随机游动过程(7.1.1) 和(7.1.2)生成,设定回归模型如下
ttt xy eb += (7.1.4)
PDF created with pdfFactory trial version www.pdffactory.com
4
其中,{ }te 为白噪声序列。由OLS可得b的估计量如下,

∑=
2
t
tt
x
xyb (7.1.5)
根据第五章有关随机游动的极限分布,有
∫∑?→ 10 2222 )( drrWyN uLt s
∫∑?→ 10 2222 )( drrVxN vLt s (7.1.6)
∫∑?→ 102 )()( drrVrWxyN vuLtt ss
检验零假设 0:0 =bH 的t统计量为
[ ] 2122?

=?=
txs
t bs bb
b
其中 2s 为模型(7.1.4)的剩余方差。
由于
( )222?11?11 ∑∑=?= ttt xyNNs be
2
21
1 ∑





= tt
tt
t xx
yxy
N
( )
= ∑ ∑∑ 2
2
2
1
1
t
tt
t x
yxy
N
因此
[ ]
2122?

=?=
txs
t bs bb
b
PDF created with pdfFactory trial version www.pdffactory.com
5
( ) 2122 ∑∑∑= t
t
tt x
x
xy ( ) 21
2
2
2
1
1
∑ ∑∑
t
tt
t x
yxy
N
[ ]( )( ) ( )[ ] 2122222221 ∑∑∑∑= tttttt yxNyNxNyxNN
用 2
1?
N 对上述t统计量做变换,并利用(7.1.6)的结论,有
()
()[ ] ()[ ] (){ }2121
0
1
0
21
0
2
1
02
1
])([
)(
∫∫∫



drrVrWdrrVdrrW
drrVrW
tN L (7.1.7)
该结论表明,
表明在零假设下统计量 2
1?
N t弱收敛于维纳过程的泛函,2
1?
N t具有规范的极限分布;
原来的t统计量既不服从t分布,也不存在规范的极限分布,t统计量将随样本容量的增加而发散;
这从理论上解释了在对非平稳变量进行回归时,为什么t统计量值往往偏大。
因此,在对回归模型(7.1.4)的回归系数作显著性检验时,不能使用常规的t分布临界值,而应改用 2
1?
N t 的分布的临界值。
结论:在回归分析中,不能盲目依赖于t检验值和 2R 来对回归结果进行评价,必须注意变量的非平稳性可能带来的“伪回归”问题。
如何防止“伪回归”?
一种办法是,
采用变通的方式避免回归方程中出现非平稳项。例如,传统的做
PDF created with pdfFactory trial version www.pdffactory.com
6
法是对非平稳变量进行差分,使得差分序列变成平稳序列,然后对差分变量进行回归。
这种做法可以消除变量非平稳性可能带来的伪回归问题,但却会损失变量间长期关系的信息。例如,研究消费支出与收入的关系时,
如果对变量进行差分后做回归分析,所得到的结果实际上是消费支出的增量与收入增量的关系,而不是研究者感兴趣的消费支出与收入这两个水平变量的长期稳定关系。
另一种方法是,
直接对非平稳变量进行回归,但需要采用新的方法探测变量间是否真的存在相依关系,以建立起能反映水平变量间真实关系的回归方程。这种新的方法就是协整分析。
节第二 协整概念及性质
一,协整关系
在给出协整概念之前,先看一个例子。
货币需求分析是货币理论中的一个重要内容。经典的理论分析告诉我们,一国或一地区的货币需求量主要取决于规模变量和机会成本变量,即实际收入、价格水平以及利率。如果以对数形式的计量经济模型将货币需求函数描述出来,其形式为,
ttttt urypm ++++= 3210 bbbb (7.2.1)
其中,m为货币需求,p为价格水平,y为实际收入总额,r为利率,u
为扰动项,ib为模型参数。模型中的所有变量除了利率外都是对数形式。
PDF created with pdfFactory trial version www.pdffactory.com
7
在货币市场除清的假定下,可以通过搜集货币供给量而获得货币需求的时间序列数据,实际收入总额可以取为实际国民总收入即GNP,
此外,也可以搜集到价格水平和短期利率的数据。
对于研究者来说,他关心的问题是如何估计出上述回归模型,并检验模型参数是否满足条件,0,0,1 321 <>= bbb 。此外,考察货币需求中未被解释部分(即扰动项序列)的特性也是一重要内容。
如果上述货币需求函数是适当的,那么货币需求对长期均衡关系的偏离将是暂时的,扰动项序列是平稳序列,估计出来的货币需求函数就揭示了货币需求的长期均衡关系。相反,如果扰动项序列有随机趋势而呈现非平稳现象,那么模型中的误差会逐步积聚,使得货币需求对长期均衡关系的偏离在长时期内不会消失。因此,上述货币需求模型是否具有实际价值,关键一点在于扰动项序列是否平稳。
面临的问题是,货币供给量、实际收入、价格水平以及利率可能是非平稳的I(1)序列。根据第5章有关单位根过程的运算性质可知,
多个非平稳序列的线性组合在一般情况下也是非平稳序列。如果货币供给量、实际收入、价格水平以及利率的任何线性组合都是非平稳的,
那么货币需求模型(7.2.1)的扰动项序列就不可能是平稳的,从而模型并没有揭示出货币需求的长期稳定关系。反过来说,如果上述货币需求模型描述了货币需求的长期均衡关系,那么扰动项序列必定是平稳序列,也就是说,非平稳的货币供给量、实际收入、价格水平以及利率四变量之间存在平稳的线性组合。
上述例子向我们揭示了这样一个事实:“包含非平稳变量的均衡理论,必然意味着这些非平稳变量的某种组合是平稳的”。这正是协整理论的思想。
PDF created with pdfFactory trial version www.pdffactory.com
8
协整的概念:所谓协整,是指多个非平稳经济变量的某种线性组合是平稳的。
也就是说,尽管各个经济变量具有各自的长期波动规律,每一个序列的矩会随着时间而变化,但它们的某种线性组合却存在稳定的矩,
从而表现出这些非平稳经济变量之间存在着一个长期稳定的关系。
例如,收入与消费,工资与价格,政府支出与税收,出口与进口等,这些经济时间序列一般是非平稳序列,但它们之间却往往存在长期均衡关系。
协整的严格定义,
设有k )2(≥ 个序列{ } { } { },,,,21 kttt yyy L 用 ),,,( 21 ′= ktttt yyyY L 表示由此k个序列构成的k维向量序列,如果,
(1) 每一个序列{ } { } { }kttt yyy,,,21 L 都是d阶单整序列,即 )(~ dIy jt ;
(2) 存在非零向量 ),,,( 21 ′= kaaa La,使得 tYa′ ktktt yayaya +++= L2211 为(d-b)
阶单整序列,即 dbbdIYt ≤<?′ 0,)(~a 。
则称向量序列 ),,,( 21 ′= ktttt yyyY L 的分量间是d、b阶协整的,记为 ),(~ bdCIYt,向量 ),,,( 21 ′= kaaa La 称为协整向量。
特别地,若 1== bd,则 )1,1(~ CIYt,说明尽管各个分量序列是非平稳的一阶单整序列,但它们的某种线性组合却是平稳的。这种(1,1)阶协整关系在经济计量分析中较为常见。
例如,假设变量 ty1 与变量 ),,2( miyit L= 之间存在(1,1)阶协整关系,协整向量为 ),,,1( 2 ′= mbba L,则这种协整关系可表示为,
tmtmtt uyyy ++++= bba L221 (7.2.2)
PDF created with pdfFactory trial version www.pdffactory.com
9
组合变量 tu 就为I(0)过程。
由协整的定义可以看出,协整的含义就是两个或多个单整序列,其单整阶数为d,存在这些单整序列的线性组合,新的组合序列的单整阶数比d低。
当序列个数k大于2时,向量序列 ),,,( 21 ′= ktttt yyyY L 可能存在多个协整向量。
如果在这些协整向量中有某r个协整向量 raaa,,,21 L 形成一个极大线性无关组,
则这些协整向量组成的矩阵
[ ]kA aaa,,,21 L=
常称为协整矩阵,r称为协整秩。
可以证明,协整秩r不超过变量序列个数减1,即 1?≤ kr 。特别地,当序列个数 k=2 时,就变成考察二变量的协整关系。显然,在二变量情形下,协整向量在常数倍意义下惟一。
需要指出的是,上述协整定义所描述的变量均衡关系,要求序列都为 d 阶单整,这是一较强的条件。事实上,这一条件只对两变量情形是必须的。因为,
假设{ }tx 与{ }ty 为不同阶数的单整序列,例如 )0(~),1(~ IxIy tt 。根据第 5 章有关单整序列的运算性质可知,一个I(1)序列与一个I(0)序列之间不可能找到一种平稳的线性组合,即不存在一个合适的数b,使得 ttt uxy =? b 为I(0)
序列。也就是说,它们之间不可能存在协整关系。
对于三变量或更多变量的情形,当各变量的整形阶数不相同时,也有可能形成长期均衡关系。
以三变量为例,假设有
tttt uzxy ++= 21 bb
其中{ }tx,{ }ty 与{ }tz 的整形阶数可以不同,但{ }tu 却有可能是平稳的。比如,
)1(~),1(~),0(~ IzIxIy ttt,当存在 21,bb 使得 )0(~)( 21 Izx tt bb + 时,就有{ }tu ~I(0),
PDF created with pdfFactory trial version www.pdffactory.com
10
从而表明这三个变量之间存在长期均衡关系。
协整概念的提出对于用非平稳变量建立经济计量模型,以及检验这些变量之间的长期均衡关系非常重要。
(1)如果多个非平稳变量具有协整性,则这些变量可以合成一个平稳序列。
这个平稳序列就可以用来描述原变量之间的均衡关系。
(2)当且仅当多个非平稳变量之间具有协整性时,由这些变量建立的回归模型才有意义。所以协整性检验也是区别真实回归与伪回归的有效方法。
(3)具有协整关系的非平稳变量可以用来建立误差修正模型。由于误差修正模型把长期关系和短期动态特征结合在一个模型中,因此既可以克服传统计量经济模型忽视伪回归的问题,又可以克服建立差分模型忽视水平变量信息的弱点。
二,协整向量的最小二乘估计及性质
协整过程的协整向量往往是未知的,需要由观测样本估计得到。
假设 ),,,( 21 ′= ma aaa L 为 m 维向量序列 ),,,( 21 ′= mtttt yyyY L 的协整向量,则
tt Yaz ′= 为一单变量I(0)过程。
根据大数定理,有
( ) ( ) ∞<?→?= ∑∑
=
=
2
1
2'1
1
21
t
P
N
t
t
N
t
t zEYaNzN (7.2.3)
如果a不是 tY 的协整向量,则 tt Yaz ′= 仍为I(1)过程。
可以证明,在 tz 为I(1)的情况下,如下结论成立,
[ ] drrWzN
N
t
L
t
2
1
1
0
222 )(∑ ∫
=
→? l (7.2.4)
其中l由 tz? 的自协方差确定。从而有
PDF created with pdfFactory trial version www.pdffactory.com
11
∞+?→

=∑ ∑
= =

N
t
P
N
t
tt zNNzN
1 1
2221 (7.2.5)
因此,只要 tY 是协整的,并有协整向量a,那么通过求解如下最优化问题
( )


′∑
=
N
t
ta YaN
1
21min (7.2.6)
可以得到a的最小二乘估计。
不失一般性,设协整向量a形如 ( )′= ma bbb,,,,1 32 L,则(7.2.6)式的目标函数成为
( ) ( )∑∑
=
=
=′
N
t
mtmttt
N
t
t yyyyNYaN
1
2
33221
1
1
21 bbb L (7.2.7)
这样,( )′= ma bbb,,,,1 32 L 的估计可由 ty1 对 ),,3,2( miyit L= 作回归得到。
这种用OLS方法估计协整参数的回归叫协整回归。
如果 tY 有协整向量 ( )′= ma bbb,,,,1 32 L,那么由协整回归所得到的估计量将是a的超一致估计。
因为:对于模型
ttt uYy 1
)2(
1 +′+= ba (7.2.8)
tt uY 2)2( =?
其中,( )′= mbbbb,,,32 L,),,( 2)2( ′= mttt yyY L 。如果
() ∑∞
=
Ψ=Ψ=?

02
1 )(
s
t
s
st
t
t BB
u
u ee (7.2.9)
其中 ( ) 0,,0...~ ' >= PPdiite,且矩阵序列{ }∞=Ψ 0sss 中每一元素列绝对可和,矩阵 ∑∞
=
Ψ=Ψ
0
)1(
s
s为满秩m阶方阵。则参数a和b的最小二乘估计可由下式得到,
PDF created with pdfFactory trial version www.pdffactory.com
12
()
() () () ()

=



∑∑
∑?
tt
t
ttt
t
yY
y
YYY
YN
1
2
1
1
'222
'2
b
a (7.2.10)
并且可以证明
( )( ) ()[ ]{ }
() () ()[ ]{ }

ΛΛΛ
Λ?→?


∫∫

2
1
1
'
2
1
0
'
2
1
02
'
2
1
0
'1
21
h
h
drrWrWdrrW
drrW
N
N L
bb
aa (7.2.11)
其中 1l,2Λ 是m阶方阵 P)1(Ψ 的分块矩阵中的子矩阵,P)1(Ψ 的分块形式如下,


Λ
′=Ψ
2
1)1( lP
1l 为m维列向量,2Λ 为 mm ×? )1( 维矩阵。W(r)为m维标准维纳过程,并且
)1(11 Wh l′=
[ ]{ } ∑∫ ∞
=
++
′Λ=
0
,121
1
022
)()()(
s
stt uuErdWrWh l
上述结论(7.2.11)式说明,)?(21 aa?N 和 )?( bb?N 收敛于非零极限,所以
)?( aa? 和 )?( bb? 以概率收敛于零,即a?和b?是 ba,的(超)一致估计量。
这从理论上解释了根据 ty1 对 ),,3,2( miyit L= 作回归,由 OLS 法估计出的参数向量是协整向量的一致估计。
PDF created with pdfFactory trial version www.pdffactory.com
13
节第三 协整检验
上一节关于协整向量的最小二乘估计是建立在已知非平稳变量之间存在协整关系。在实际应用中,变量之间是否存在协整关系往往是未知的。因此,需要进行协整检验。
检验协整的方法从检验的对象上可分为两种,
一种是基于回归残差的协整检验,这种检验也称为单一方程的协整检验;
另一种是基于回归系数的协整检验。
一,基于回归残差的协整检验(EG检验)
由前可知,如果变量 ty1与变量 ),,2( miyit L= 之间存在(1,1)阶协整关系,
则由下式
tmtmtt uyyy ++++= bba L221 (7.2.2)
所体现的回归关系不是伪回归,回归系数的最小二乘估计是协整向量的一致估计,估计残差 tu?为一I(0)过程。
但若变量 ty1 与变量 ),,2( miyit L= 之间不协整,则上式是伪回归,所得的估计残差 tu?将为一I(1)过程。
因此,{ tu? }是否含有单位根反映了变量 ty1 与 ),,2( miyit L= 之间是否存在协整关系。这样,对变量间的协整检验就与单位根检验紧密联系起来了。
根据前面的章节可知,序列的单位根检验可用(A)DF检验或PP检验,但由于残差序列{ tu? }是最小二乘估计的残差,不是直接的观测样本,因此检验法需作适当修正。
假设 ),,,( 21 ′= mtttt yyyY L 为一 m维 I(1)向量序列,用 ty1 对 ),,3,2( miyit L= 作
PDF created with pdfFactory trial version www.pdffactory.com
14
回归,建立回归模型(7.2.8)式
ttt uYy 1
)2(
1 +′+= ba (7.2.8)
利用最小二乘法可得到参数a和b的最小二乘估计(7.2.10)式。估计残差为
( )2
1

ttt Yyu ba ′= (7.3.1)
现在需要检验{ }tu? 是否为平稳序列。构造{ }tu? 的一阶自回归模型,
ttt euu +=?1 r (7.3.2)
r的最小二乘估计为


= N
t
N
tt
u
uu
2
2
1
2
1

r (7.3.3)
以 2s 表示 te 的方差的最小二乘估计,
( ) ( ) ∑∑
=
=
== N
t
t
N
t
tt eNuuNs
2
21
2
2
1
12?)2(2 r
以 rs? 表示最小二乘估计r?的标准差,

=
= N
t
tu
s
2
2
2
rs (7.3.4)
以 jg? 表示 te? 的j阶样本自协方差,
jg? ∑
+=
=?=
N
jt
jtt qjeeN
2
1,,2,1,0)1( L (7.3.5)
下面给出检验残差序列{ tu? }是否存在单位根的几种方法,
方法一:构造检验 1:0 =rH 的PP检验的r统计量
PDF created with pdfFactory trial version www.pdffactory.com
15
{ } )(?)1(21)1?)(1( 02222 glsr rr= sNNZ (7.3.6)
其中 j
q
j q
j ggl?
112?
1
0

+?+= ∑= 。
若 rZ 是显著的,即由样本得到的计算值小于临界值,则拒绝原假设
1:0 =rH,接受{ }tu? 是I(0)过程,变量 ty1与变量 ),,2( miyit L= 之间协整。
反之,若 rZ 不显著,即由样本得到的计算值大于临界值,则接受原假设
1:0 =rH,拒绝{ }tu? 是I(0)过程,变量 ty1 与变量 ),,2( miyit L= 之间不协整。
方法二:构造检验 1:0 =rH 的PP检验的t统计量
( ){ } ( ){ }lglssrlg r
r
1
2
1
1?
0
2
21
0= sNZ
t (7.3.7)
tZ 统计量的用法与 rZ 统计量的用法类似。
方法三:除了 PP 检验法外,也可以用(A)DF 检验法对 1:0 =rH 作检验。
具体做法是,建立残差序列{ tu? }的如下回归模型
tptptttt euuuuu +?++?+?+= + 1122111 zzzr L (7.3.8)
然后根据回归参数r的t统计量进行检验。此时,t统计量不服从t分布,其极限分布与方法二中 tZ 的极限分布相同,从而与 tZ 有相同的临界值。
需要特别注意的是,以{ tu? }为基础的协整检验统计量 rZ 和 tZ 的极限分布,
与直接检验样本观测序列是否存在单位根的 rZ 和 tZ 的极限分布有所不同,从而有不同的临界值。
前人已针对协整回归模型中不带常数项和带常数项等几种情形,用 Monte
Carlo方法进行模拟进行计算,得到在不同显著性水平上 rZ 和 tZ (及(A)DF t
统计量)的临界值,编制成表供查用。
PDF created with pdfFactory trial version www.pdffactory.com
16
综上所述,基于回归残差的协整检验实际上可分为两个步骤:第一步是利用最小二乘法先作变量间的回归(称为协整回归);第二 步是检验协整回归的残差序列是否存在单位根,检验可用 rZ 和 tZ 统计量,也可用(A)DF— t统计量,
临界值需查专门用于检验协整关系的PP— rZ,tZ 检验和(A)DF— t检验临界值表。由于这种检验方法是 Engle-Granger(1987)提出的,所以也常称为 EG
检验。表(6-3-1)列出了在不同情形下如何选取检验统计量及查临界值表。
表6-3-1 不同情形下的协整检验
协整回归模型是否带常数项
协整回归模型是否带漂移
残差单位根检验统计量
查临界值表(检验协整专用表)
情形一
不带
不带
rZ
tZ
(A)DF --t
rZ 表情形一
tZ 表情形一
tZ 表情形一
情形二

不带
rZ
tZ
(A)DF--t
rZ 表情形二
tZ 表情形二
tZ 表情形二
情形三


rZ
tZ
(A)DF--t
rZ 表情形三
tZ 表情形三
tZ 表情形三
二,协整系统的完全信息最大似然检验(Johansen检验)(略)
(一) 协整空间与典型相关分析
协整系统的 Engle—Granger 方法,Phillips—Perron 或扩展的
Dickey—Fuller(ADF)检验是在系统中只有一个协整关系和协整系统的三角表示的基础上得出的。然而对于某些较为复杂的系统,许多相关变量交织形成多个协整关系,而在协整关系的三角表示中,不同的规范化选取也会产生不同的结果。本章介绍 Johansen(1988,1991) 所提出的完全信息最大似然方法
PDF created with pdfFactory trial version www.pdffactory.com
17
(full—information Maximum likelihood(FIML)),它可以估计由协整向量所产生的线性空间。FIML方法的另一优越性是可对系统中可能存在的协整关系个数进行统计检验。
设 ( )'21,,,tnttt YYYY L= 是 1×n 随机向量,且 )1(~ IYt 。如果存在h个线性无关的 1×n
向量 haaa,,,21 L,使得 ti Ya ' 是平稳的。记 [ ]haaaA L,,21=,而对于任一 1×n 向量 c(c
与 A中向量线性独立),则 tYc' 不平稳,我们称 tY 的分量之间恰好存在h个协整关系。显然向量 haaa,,,21 L 不唯一(因为它们的任一线性组合b也有 tYb' 平稳),但
haaa,,,21 L 形成协整空间的基底。
设 tY 是 1×n 向量,且 tY能表为一非平稳的p阶向量自回归形式,
tptpttt YYYY ea +Φ++Φ+Φ+= L2211 (7.3.9)
或 ( ) ttYB ea +=Φ
(7.3.10)
此处 ( ) ppn BBBIB ΦΦ?Φ?=Φ L221
[ ] 0=tE e [ ]?='ttE ee 和 [ ]='stE ee 0 st ≠
假设 tY? 有Wold 表示,( ) tt BY ed Ψ+=?
(7.3.11)
前乘(3)以 ( )BΦ 得,( ) ( ) ( ) ( ) tt BBYBB ed ΨΦ+Φ=Φ? 1)1( (7.3.
12)
故 有,( ) ( ) ( ) ( ) )0)1((11 =?ΨΦ+Φ=? aede BBBB tt Q
(7.3.13)
PDF created with pdfFactory trial version www.pdffactory.com
18
此式对一切 te成立,因而应有,( ) 01 =Φ d
(7.3.14)
和 ( ) ( ) ( ) zzzIz n?ΨΦ=?1
(7.3.15)
特 别 取 z=1 得 ( ) ( ) 011 =ΨΦ
(7.3.16)
记 ( )1Φ 的任意一行为 'p,由(6)和(8)知,( ) 01,0 '' =Ψ= pdp
Engle and Yao(1987),Ogaki and Park (1992)指出:满足此二条件的向量p是一协整向量。若 haaa,,,21 L 形成协整空间的基底,则p可表为它们的线性组合,
[ ] Abbaaa h ≡?=,,,21 Lp 或 ''' Ab=p
应用此结果于 ( )1Φ 的每一行,可知存在一 hn× 矩阵 B,合 ( ) '1 BA=Φ
(7.3.17)
(8)式蕴含 ( )1Φ 是一奇异 nn × 矩阵。事实上,可根据协整系统的Stock—Watson公共趋势表达式说明 ( )zΦ 包含h个单位根。
协整系统(1)的另一等价形式是,
,ttPtpttt YYYYY eVaVVV +++?++?+?=+ 10112211 L (7.3.18)
其中 ( )1)( 210 Φ?=ΦΦ?Φ≡ pnI LV
(7.3.19)
[ ] 1,,2,121?=Φ++Φ+Φ?= ++ pipiii LLV
(7.3.20)
PDF created with pdfFactory trial version www.pdffactory.com
19
假定 tY 的每一分量 ( )1~ IYti,而存在它的 h 个线性组合是平稳的,即 tY有 h
个协整关系,此时应有,( ) '0 1 BA?=Φ?=V 将其代入(10)式得,
ttptpttt YBAYYYY eaVVV +?+?++?+?=+ 1
'
112211 L (7.3.21)
定义 tt YAZ '≡ 它是平稳的 1×h 向量。于是(13)可写为,
ttptpttt BZYYYY eaVVV +?+?++?+?=+ 1112211 L (7.3.22)
方程(14)称为协整系统的误差校正表示。
考虑 tY 的 T+p 个观测样本。记为( )Tpp YYY,,,21 L+?+? 。如果 te 的分布是正态的,
则( )TYYY,,,21 L 在( )021,,,YYY pp L+?+? 条件下的对数似然函数为,
( ) ∑
=
=?
T
t
ttp
TTnL
1
1'
011 2
1||ln
22ln2,,,,,eepVaVV L (7.3.23)
其中 10112211?+= tptptttt YYYYY VaVVVe L
Johansen方法的重要特征是通过统计检验结果首先确定h,再进一步估计B,A
之值。由于最重要的分析是针对 '0 BA?=V 的(因为它包含了协整关系的主要特征),为此首先寻求当 0V 给定时,由(15)之极大化求得 ),,,,( 11 aVV pL 的(条件)
最大似然估计量。按Johansen算法,第一步计算辅助回归方程,
tptptt uYYY 1111 +?Γ++?Γ+Γ=? + L (7.3.24)
和 tptptt vYYY 11111 +?Θ++?Θ+Θ= + L (7.3.25)
其中 tt vu?,? 是相应回归方程的OLS残差。
第二步计算上述OLS残差之样本方差—协方差矩阵,
PDF created with pdfFactory trial version www.pdffactory.com
20
'
1
1? t
T
t
tvv vvT ∑
=
≡Σ ∑
=
≡Σ
T
t
ttuu uuT
1
'1? '
1
'1?
vu
T
t
ttuv vuT Σ==Σ ∑
=
(7.3.26)
求矩阵 uvuuvuvv ΣΣΣΣ 11 (7.3.27)
之有序特征根 nlll 21 ≥≥≥ L 当系统存在h个协整关系时可证:对数似然函数有最大值 ( )∑
=
Σ=
h
i
iuu
TTTnTnL
1
1ln
2|
|ln
222ln2 lp (7.3.28)
第三步计算参数之最大似然估计量。 设 haaa?,,?,? 21 L 是矩阵(19)的h个最大特征根相应的特征向量。则系统的任一协整向量之最大似然估计量可写为如下形式,
hhabababa 2211 +++= L
由于特征向量可以相差一常数因子,Johansen建议对 ia?作如下正则化处理,
即使之满足要求,hiaa ivvi,,11 ' L==Σ
记 [ ]haaaA?,,?, 21 L= (7.3.29)
可证,iV 的最大似然估计量(MLE)是,
'0 AAuvΣ=V hiiiii,,1 0 L=Θ?Γ= VV (7.3.30)
a的最大似然估计量MLE为,
Θ?Γ= 00 Va (7.3.31)
而?的MLE为,
( )( )∑
=
=?
T
t
tttt vuvuT
1
'
00
1 VV (7.3.32)
PDF created with pdfFactory trial version www.pdffactory.com
21
应指出:上述结果是在协整关系的个数h已知的条件下得到的。而协整空间由矩阵(19)的 h 个最大的特征根所对应的特征向量(经正则化)组成,其特征向量 il 恰为二辅助回归方程(16)和(17)之OLS残差 tt vu?,? 之第i个典型相关系数。并可证明,01 ≥> il
(二) 协整关系的假设检验
假设 1×n 向量 tY 能表为VAR形式,
ttptpttt YYYYY eVaVVV +++?++?+?=+ 10112211 L (7.3.33)
以 rH 表示 tY 中恰有r个协整关系的原假设.此即表明在上述VAR形式中要求
0V 能写为
'
0 BA?=V 其中B,A均为 hn× 矩阵。在 rH 条件下,(条件)对数似然函数有最大值,
)?1ln(2|?|ln222ln2
1

=
Σ=
h
i
iuuh
TTTnTnL lp (7.3.34)
若考虑另一对立假设 AH,存在n个协整关系。亦即 tY的每一线性组合都是平稳的。此时(25)式中 0V 将不受约束,而相应的对数似然函数有最大值
)?1ln(2|?|ln222ln2
1

=
Σ=
n
i
iuuA
TTTnTnL lp
(7.3.35)
关于 hH (相对于 AH )的似然比检验统计量是,
)?1ln(2
1
lTLL
n
hi
ihA ∑
+=
=? l
或 )?1ln()(2
1

+=
=?≡
n
hi
ihAh TLL lh (7.3.36)
Johanben得出:若(25)中 0=a 且在 hH 条件下,统计量 hh 有极限分布Q。
PDF created with pdfFactory trial version www.pdffactory.com
22
() () () () () ()≡ ∫∫∫
'1
0
11
0
'
'1
0
' rdWrWdrrWrWrdWrWQ
h (7.3.37)
其中 ( )rW 是 hn? 维标准布朗运动过程。 hQ 之临界值已由随机模拟方式给
出。特别当h=n-1时,( )rW 是一维标准布朗运动过程。
()( )()


1
0
2
222
1
112
drrW
Wd
nh 恰为单位根检验中之 D—F Tt 统计量之平方。
当样本容量够大时,hh 渐近于分布 )2( 22 mkc 。其中 hnm?=
12 )2(58.085.0= mk 。由于
nlll

21 >>> L,而假设 hH 事实上等价于条件,
021 ==== ++ nhh lll L 。因此对原假设 hH 的另一检验统计量也可取为
)?1ln( 1+= hh T lx,它是原假设 hH 关于对立假设 1+hH 的似然比检验统计量,称为 l
一 max 统计量。其极限分布也是非标准分布。在实际检验中,特别在小样本场合下两种检验方法为得出不同的结论 。因此在评价这些结果时应十分谨慎。必要时可增大样本容量。当(25)中 0≠a 时,由(3)和(14)可知应有 tBEZ=a,
与统计量 hh xh,相应的极限分布已得到。其临界值也列于相同的表中。在实际进行检验时,应对h=1,2……依次加以判定。
PDF created with pdfFactory trial version www.pdffactory.com
23
节第四 误差修正(ECM)模型
当变量间存在协整关系时,说明变量间存在一种长期均衡关系。从直观角度看,这些变量之间将受到一种“引力约束”,使它们协调一致而不至于分道扬镳,它们会象一个整体一样同向变动,呈现出一种均衡状态。就短期而言,这些变量之间可能不协调而存在偏差,但这种偏差会在以后时期得到校正。也就是说,变量在本期的变动,会根据上期偏差的情况作出调整,使其朝长期均衡关系靠拢。经济系统对均衡误差不断进行调整的过程常称为误差校正机制。
一,动态回归与误差修正模型
计量经济模型经历了由静态模型到动态模型的发展过程。动态模型是用变量的滞后值(特别是被解释变量的滞后值)做为解释变量的模型。常用的动态模型是自回归分布滞后模型,其一般形式为,
),0(~ 2
1 1 0
0 sbaa iiduuxyy tt
m
i
p
j
n
i
itjjiitit ∑ ∑∑
= =
+++= (7.4.1)
其中,),,2,1( pjx j L= 是外生变量,p为外生变量的滞后个数,m和n分别为被解释变量y和外生变量 ),,2,1( pjx j L= 的最大滞后期。这种模型通常记为ADL(m,n,
p)。
模型(7.4.1)的简单情形:一阶自回归分布滞后模型,
),0(~ 2110110 sbbaa iiduuxxyy tttttt ++++= (7.4.2)
记 tt ExxEyy ==,,对(7.4.2)式两边取期望得,
+++= xxyy
1010 bbaa
PDF created with pdfFactory trial version www.pdffactory.com
24
整理可得,
+=
++= xkkxy
10
1
100
1
)(
a
bba (7.4.3)
其中,)1/()(),1/( 1101100 abbaa?+=?= kk 。(7.4.3)式即为y与x的长期均衡关系。
1k 是y关于x的长期乘数。
下面我们以一阶自回归分布滞后模型为例,来看如何利用动态模型推导出误差修正模型。在(7.4.2)式两端同时减去 1?ty,再在右边同时加减 10?txb,整理得,
ttttt uxyxy +++?+?+= 1101100 )()1( bbaba (7.4.4)
利用 )1/()(),1/( 1101100 abbaa?+=?= kk,对(7.4.4)再做变形可得,
tttt
ttttt
uxkkyx
uxkyxy
++?=
++?+=?


))(1(
))(1(
110110
111100
ab
aba (7.4.5)
模型(7.4.5)称为误差修正模型,记为ECM。
模型中的 ))(1( 11011 tt xkkya 称为误差修正项。
)( 1101 tt xkky 称为非均衡误差,它表示上一期被解释变量偏离均衡状态的程度,)1( 1?a 称为修正系数,它表示非均衡误差对 ty? 的调整速度。
从 ECM 模型(7.4.5)可以看出,ty? 的取值取决于 tx? 和上一期误差修正项的值。变量在本期的变动,会根据上期偏差的情况作出调整。当 ty 平稳时,有 1a <1
成立,误差修正项的修正系数 )1( 1?a 是一个负数。
由此可见,误差修正机制实际上是一个反馈过程。当 1?ty 的值大于与 1?tx 相对应的均衡值时,均衡误差为正值,由于修正系数为负数,必然对y的本期变化 ty?
形成反向调节作用,从而导致本期y值的回落。同理,当 1?ty 的值低于与 1?tx 相对应的均衡值时,将导致本期y值的增大。
上面我们通过对动态模型变形得到了误差修正模型,并看到了误差修正模型
PDF created with pdfFactory trial version www.pdffactory.com
25
的误差修正机制。这种误差修正的思想最早是由 Sargan(1964)提出的。为了更加准确地考察被解释变量的调整变化,他将被解释变量偏离均衡状态的偏差值引入模型,同其它解释变量的变化量一道,联合解释因变量的变动。这种思想经过Hendry、Anderson等进一步完善,形成了误差修正模型的建模体系。
在经济分析中使用ECM模型有如下优点,
1,如果模型中的变量是平稳的,则 ECM 模型中包含的所有差分变量和非均衡误差项都具有平稳性,从而可以使用OLS方法得到ECM模型参数的一致估计。
2,与传统建模方法的不同之处在于,ECM模型不再单纯地用水平变量或单纯地用差分变量进行建模,而是将两者有机地结合起来,充分利用两者所提供的信息。从ECM模型(7.4.5)可以看出,模型的参数可分为长期参数和短期参数两类。非均衡误差项中的 10,kk 是长期参数,模型中的 )1(,10?ab 是短期参数。长期参数反映变量间的长期均衡关系,短期参数刻画了变量间的短期变化关系。从短期看,被解释变量的变动是由长期趋势和短期波动所决定的,但从长期看,变量之间的协同关系将起到引力作用,会将系统的非均衡偏离拉向均衡状态。以往,人们要么只讨论变量间的长期关系而忽略变量的短期变化,要么只讨论变量之间的短期变化而忽略变量间的长期信息,这两种处理方法都有缺陷。ECM模型则不同,它将变量之间的长期表现和短期效应综合在一起,从而大大增强模型的解释功能和预测能力。
3,当变量非平稳时,ECM模型与变量之间的协整性存在对应关系。正如前面我们已指出,当变量非平稳时,用传统回归方法对水平变量进行分析可能导致伪回归。而对差分变量进行建模又会损失变量的长期变化信息。由
(7.4.5)式可以看出,当 )1(~),1(~ IxIy tt 时,有 )0(~),0(~ IxIy tt,如果变
PDF created with pdfFactory trial version www.pdffactory.com
26
量间存在误差修正机制,则(7.4.5)式中的非均衡误差项 )( 1101 tt xkky 一定是平稳的,也就是说,y与x之间一定协整。反过来,如果y与x之间有协整关系 tt xkky 10 +=,那么 ECM模型(7.4.5)式中的误差修正项就具有平稳性,又因为差分变量也是平稳的,因此对ECM模型进行估计就不会存在伪回归问题。由此可以推测,如果非平稳变量之间存在协整关系,则一定有误差修正机制,反之,如果非平稳变量之间存在误差修正机制,则它们之间一定有协整关系。关于这一点,下面的Grange表示定理将加以阐述。
二,协整与误差修正模型:Grange表示定理
下面我们不加证明地给出描述协整与误差修正对应关系的Grange表示定理。
设 tY为n维I(1)过程,且满足
tt BY ed )(Ψ+=?
其中,{ }te 为白噪声序列,{ }∞=Ψ?== 0,)(,0)( sstt sDE ee 中的所有元素列绝对可和。
如果 tY中有r个线性独立的协整关系,则存在矩阵 rnA ×,使得
tt YAz ′=
为一r维I(0)过程,且有 0)1( =Ψ′A 。
如果 tY 可表示成VAR(P)形式,
tptpttt YYYY ea +Φ++Φ+Φ+= L2211

ttYB ea +=Φ )(
则存在矩阵 rnB ×,使得
PDF created with pdfFactory trial version www.pdffactory.com
27
AB ′=Φ )1(
并且 tY可表示成向量误差修正形式,
ttptptt
ttptpttt
zBYYY
YABYYYY
eazzz
eazzz
+?+?++?+?=
+′?+?++?+?=?
+
+
)(
)(
1112211
1112211
L
L (7.4.6)
其中,1?tz 为r个均衡误差构成的r维列向量。
例如,在两变量情形下,如果 ty 与 tx 之间存在协整,协整向量为 ),1( ′?= ba,
则误差校正模型的基本形式为,
tititttt
tititttt
xicyicxycx
xicyicxycy
2222122
1121111
)()()(
)()()(
eba
eba
+?+?+?+=?
+?+?+?+=?
∑∑
∑∑


其中,)( tt xy b? 为误差校正项。
至此,我们已较全面的分析了协整与误差修正之间的关系。从上述分析可以看出,建立误差修正模型需要解决一系列问题,
(1) 检验变量是否为非平稳的I(1)序列?
(2) 检验多个I(1)变量之间是否存在协整关系?
(3) 怎样估计协整向量?
(4) 怎样建立误差修正模型并进行估计?
下面我们介绍建立单一方程ECM模型的Engle-Granger两步法。关于建立向量
ECM模型的方法,比较复杂,并且这种方法还在不断完善过程中,读者可参阅有关文献。
三,估计ECM模型的EG两步法
估计 ECM 模型,必须先得到非均衡误差序列,而计算非均衡误差又必须已
PDF created with pdfFactory trial version www.pdffactory.com
28
知协整参数。但在实际应用中,事先往往并不知道所研究的 I(1)变量是否存在协整关系。因此,估计 ECM 模型之前,第一步必须先检验协整性,在存在协整关系的情况下,估计出协整参数。这一步在前面的协整回归中已经介绍了;
第二步是利用协整回归所得到的回归残差作为误差修正项加入到 ECM 模型中,
然后对ECM模型用OLS方法进行估计。这种方法是Engle-Granger(1987)建立的,所以叫做EG两步法。下面以二变量为例具体说明EG两步法的运用。
假设两个I(1)变量x与y之间存在协整关系如下,
ttt uxy ++= ba (7.4.7)
根据前面的结论知,变量 x与 y之间必存在误差修正机制,可以建立如下二变量误差修正模型,
ttttt xyxy ebagg ++?= )( 1121 (7.4.8)
EG两步法的第一步是,先对(7.4.7)式进行OLS协整回归,估计出协整参数,
得到变量间的长期均衡关系,然后计算残差项序列,
)(? ttt xyu ba +?= (7.4.9)
第二步是,用第一步得到的残差 1tu 替换(7.4.8)中的非均衡误差项
)( 11 tt xy ba,得到如下回归模型,
tttt uxy egg ++?=21
用OLS法进行估计,得到ECM的最终估计式。
PDF created with pdfFactory trial version www.pdffactory.com