1
第十五章 时间序列回归
本章我们讨论分析时间序列数据 ( 检验序列相关性, 估
计 ARMA模型, 使用分布滞后, 非平稳时间序列的单位根检
验 ) 的单方程回归方法 。
2
§ 15.1 序列相关理论
时间序列回归中的一个普遍现象是:残差和它自己的滞后值相关 。 这种
序列相关性违背了回归理论的标准假设:不同时点的扰动项互不相关 。 与序
列相关相联系的主要问题有,
① 在线性估计中 OLS不再是有效的;
② 使用 OLS公式计算出的标准差不正确;
③ 如果在方程右边有滞后因变量,OLS估计是有偏的且不一致。
EViews提供了检测序列相关和估计方法的工具。但首先必须排除虚假序
列相关。虚假序列相关是指模型的序列相关是由于省略了显著的解释变量而
引起的。例如,在生产函数模型中,如果省略了资本这个重要的解释变量,
资本对产出的影响就被归入随机误差项。由于资本在时间上的连续性,以及
对产出影响的连续性,必然导致随机误差项的序列相关。所以在这种情况下,
要把显著的变量引入到解释变量中。
3
平稳性定义,
如果随机过程 的均值和方
差、自协方差都不取决于 t,则称 Y t 是协方差平稳的或弱平稳的,
},,,,,,,,{ 12101 ????? ??? TTt yyyyyyY
??)( tYE
2)( ??tYV a r
对所有的 t
对所有的 t
对所有的 t 和 s
注意,如果一个随机过程是弱平稳的,则 Y t与 Y t- s之间的协方差仅取决
于 s,即仅与观测值之间的间隔长度 s有关,而与时期 t 无关。一般所说的
,平稳性, 含义就是上述的弱平稳定义。给定一个样本值为 T 的时间序列可
以看作是随机过程 Y t 的一个实现,仍记为 。 },,,{
21 Tt yyyY ???
sstt YYE ??? ??? ? ))((
4
一般地,我们考虑如下形式,
ttt uxy ??? ?
ttt zu ?? ??? ? 1
是在 t时刻的解释变量向量; 是前期已知变量向量; 是参数向量;
是残差; 是残差的扰动项; 可能包含 的滞后值或 的滞后值 。
是无条件残差,它是基于结构成分 的残差, 但它不使用 中包
含的信息 。
是一步预测误差,它是因变量真实值和以解释变量以及以前预测误
差为基础的预测值之差。
tx 1?tz ??,
tu
1?tz),( ?tx?tu
t?t? tu1?tz
t?
5
一、一阶自回归模型
最简单且最常用的序列相关模型是一阶自回归 AR(1)模型 。 定义如下,
ttt uxy ??? ?
ttt uu ?? ?? ? 1
参数 是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差
包含到现观测值的回归模型中。
?
二、高阶自回归模型
更为一般,带有 p阶自回归的模型,AR(p)误差由下式给出,
ttt uxy ??? ?
tptpttt uuuu ???? ????? ??? ?2211
AR(p)的自相关将渐渐衰减至零,同时高于 p阶的偏自相关也是零。
6
§ 15.2 检验序列相关
在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验
残差(序列相关的证据),EViews提供了几种方法来检验当前序列相关。
§ 15.2.1 Dubin-Waston统计量
EViews将 D-W统计量视为标准回归输出的一部分 。
D-W统计量用于检验一阶序列相关, 还可估算回归模型邻近残差的线性
联系 。 D-W统计量是在下面定义中检验原假设, 0??
ttt uu ?? ?? ? 1
如果序列不相关, D-W值在 2附近 。 如果存在正序列相关, D-W值将小于
2( 最小为 0), 如果存在负序列相关, D-W值将在 2 - 4之间 。
正序列相关最为普遍,根据经验,对于有大于 50个数据和较少的解释变
量,D-W值小于 1.5的情况,说明存在强正一阶序列相关。参考 Johnston and
DiNardo( 1997版 6.6.1章)关于 D-W检验和统计量显著性的论述。
7
Dubin-Waston统计量检验序列相关有三个主要不足,
1,D-W统计量的扰动项在原假设下依赖于数据矩阵 X。
2,回归方程右边如果存在滞后因变量, D-W检验不再有效 。
3,仅仅检验原假设 ( 无序列相关 ) 与备选假设 ( 一阶序列相关 ) 。
其他两种检验序列相关方法,Q-统计量和 Breush-Godfrey LM检验克
服了上述不足,应用于大多数场合。
例子:工作文件 15_1\eq_cs
8
§ 15.2.2 相关图和 Q-统计量
在方程工具栏选择 View/Residual Tests/correlogram-Q-statistics 。
EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的
Ljung-Box Q统计量 。 如果残差不存在序列相关, 在各阶滞后的自相关和
偏自相关值都接近于零 。 所有的 Q-统计量不显著, 并且有大的 P值 。
k 阶滞后的 Q-统计量是原假设为序列没有 k 阶自相关的统计量 。计算
式如下
? ??
? ?
??
k
j
j
LB jT
rTTQ
1
2
2
是 j 阶自相关系数,T是观测值的个数。 jr
9
例子,
下面是这些检验程序应用的例子,考虑用普通最小二乘估计的简单消费
函数的结果,
10
浏览这些结果:系数在统计上是很显著的, 并且拟合得很好 。 但是, 如果
误差项是序列相关的, 那么估计 OLS标准误差将是无效的, 并且估计系数由于
在方程右端有滞后因变量会发生偏倚和不一致 。 在这种情况下 D-W统计量作为
序列相关的检验是不合适的, 因为在方程右端存在着一个滞后因变量 。 选择
View/Residual test/Correlogram-Q-statistice会产生如下情况
11
§ 15.2.3 序列相关 LM检验
选择 View/Residual Tests/Serial correlation LM Test,一般地
对高阶的, 含有 ARMA误差项的情况执行 Breush-Godfrey LM
( Lagrange multiplier,拉格朗日乘数检验 ) 。 在滞后定义对话
框, 输入要检验序列的最高阶数 。
检验的原假设是:至给定阶数, 残差不具有序列相关 。
EViews将给出两个统计量,F统计量和 NR2(观测值个数乘
以 R2),NR2在原假设下服从 分布。 F统计量分布未知,但常
用来对原假设进行非正规检验。
2?
12
上一例子中相关图在滞后值 3时出现峰值 。 Q统计量在各阶滞后值中都
具有显著性, 它显示的是残差中的显著序列相关 。
进行 序列相关的 LM检验,选择 View/Residual Tests/Serial Correlation
LM Test,输入滞后 2产生如下结果,
此检验拒绝直至 2阶的无序列相关的假设。 Q-统计和 LM检验都表明:
残差是序列相关的,并且方程在被用于假设检验和预测之前应该重新定
义。
13
§ 15.3 估计 AR模型
在使用本章描述的工具之前,可以首先检验模型其他方面的错误。误差存
在序列相关是模型定义存在的严重问题。特别地,应注意使用 OLS得出的过分
限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关 。
§ 15.3.1 一阶序列相关
在 EViews中估计一个 AR(1)模型,选择 Quick/Estimate Equation打开一个方
程,用列表法输入方程后,最后将 AR(1)项加到列表中。例如:估计一个带有
AR(1)误差的简单消费函数
ttt uu ?? ?? ?1
应定义方程为,cs c gdp cs(-1) ar(1)。 例子:工作文件 15_1\eq_cs_ar1
tttt ucscGD Pcccs ???? ? 1321
cst = -22.35 + 0.0924 * GDPt + 0.874 * cst-1
ut = 0.2789 * ut-1
14
§ 15.3.2 高阶序列相关
估计高阶 AR模型稍稍复杂些,为估计 AR(k),应输入模型的定义和所包
括的各阶 AR值。如果想估计一个有 1-5阶自回归的模型
tttt uuu ??? ???? ?? 5511 ?
应输入,cs c gdp cs(-1) ar(1) ar(2) ar(3) ar(4) ar(5)
例子:工作文件 15_1\eq_cs_ar5
可以输入在模型中想包括的各个自回归, EViews在消除序列相关时给予
很大灵活性 。 例如, 如果有季度数据而且想用一个单项来说明季节自回归,
可以输入,cs c gdp cs(-1) ar(4)。
tttt ucscGD Pcccs ???? ? 1321
15
§ 15.3.3 存在序列相关的非线性模型
EViews可以估计带有 AR误差项的非线性回归模型 。 例如:估计如下的带
有附加 AR(2)误差的非线性方程
tctt uG D PcCS ??? 21
tttt ucucu ???? ?? 2413
使用 EViews表达式定义模型,在后面的方括号内描述 AR修正项,对每
一阶 AR滞后项都应包括一个系数,每项之间用逗号隔开。
cs=c(1)+gdp∧ c(2)+[ar(1)=c(3),ar(2)=c(4)]
EViews通过差分来转换这种非线性模型且使用 Gauss-Newton迭代法来估
计转换后的非线性模型。
16
§ 15.3.4 存在序列相关的二阶段回归模型
通过把二阶段最小二乘法或二阶段非线性最小二乘法和 AR项结合起来,
对于在回归因子和扰动项存在相关性的情况和残差存在序列相关一样估计模
型 。
如果原始回归模型是线性的, EViews使用 marquardt算法来估计变形后模
型的参数 。
如果原始回归模型是非线性的,EViews使用 Gauss-Newton算法来估计 AR
修正后的模型。
对于存在序列相关的情况,可以通过向方程添加 AR项来调整 TSLS。
EViews会自动将模型转化为非线性最小二乘问题,并用工具变量估计模型。
估计对话框中的 Options 钮用来改变非线性工具变量过程的迭代次数限制和收
敛标准。
17
例子,15_1\eq_cs_tsls_ar
假设用二阶段最小二乘估计消费函数, 考虑存在一阶序列相关 。
二阶段最小二乘变量列表为,cs c gdp ar (1)
工具变量列表为,c gov log(m1) cs(-1) gdp(-1)
注意因变量的滞后 ( cs(-1)) 和内生变量的滞后 ( gdp(-1)) 都包括
在工具变量表中 。
类似地, 考虑消费函数, cs c cs(-1) gdp ar(1)
有效的工具变量表为,c gov log(m1) cs(-1) cs(-2) gdp(-1)
18
§ 15.3.5 含有 AR项模型的估计输出
当估计某个含有 AR项的模型时, 在解释结果时一定要小心 。 在用通常的方
法解释估计系数, 系数标准误差和 t-统计量时, 涉及残差的结果会不同于 OLS的
估计结果 。
要理解这些差别, 记住一个含有 AR项的模型有两种残差,
第一种是 无条件残差
bxyu ttt ????
通过原始变量以及估计参数 算出。在用同期信息对 y t值进行预测时,
这些残差是可以观测出的误差,但要忽略滞后残差中包含的信息。
?
19
第二种残差是估计的 一期向前预测误差 。 如名所示, 这种残差代表预
测误差 。 如果使用前期数据残差和当前信息作预测, 实际上, 通过利用滞后
残差的预测能力, 改善了无条件预测和残差 。
对于含有 AR项的模型,基于残差的回归统计量,如 R2 (回归标准误差 )和
D-W值都是以一期向前预测误差为基础的。含有 AR项的模型独有的统计量是
估计的 AR系数 。对于简单 AR(1)模型,是无条件残差的序列相关系数。
对于平稳 AR(1)模型,在 -1(极端负序列相关)和 +1(极端正序列相关)之
间。 一般 AR(p)平稳条件是:滞后算子多项式的根的倒数在单位圆内。
EViews在回归输出的底部给出这些根,Inverted AR Roots。如果存在虚
根,根的模应该小于 1。
i?? ??
?
??
20
§ 15.3.6 EViews如何估计 AR模型
课本上经常描述估计 AR模型的技术 。 探讨最多的方法, 如 Cochrane-
Orcutt (科克兰内 -奥克特 ), Prais-Winsten,Hatanaka以及 Hildreth-Lu程序
都是使用标准线性回归进行估计的多步方法 。 当使用滞后因变量作为回
归自变量或使用高阶 AR项定义模型时所有这些方法都有严重的缺点 。 见
Davidson& MacKinnon (1994,pp.329-341),Greene(1997,p.600-607)。
EViews估计 AR模型采用非线性回归方法。这种方法的优点在于:易
被理解,应用广泛,易被扩展为非线性定义的模型。注意:非线性最小
二乘估计渐进等于极大似然估计且渐进有效。
21
为估计 AR(1)模型,EViews通过将线性模型
??
?
??
???
? ttt
ttt
uu
uxy
??
?
1
转换成非线性模型。将第二个方程代入第一个方程,整理
ttttt xxyy ???? ????? ?? )( 11
参数通过应用 Marquarat非线性最小二乘法估计。
对于非线性定义,EViews将非线性模型
??
?
??
??
? ttt
ttt
uu
uxfy
??
?
1
),(
转换成,ttttt xfxfyy ????? ???? ?? ),(),( 11
使用 Gauss-Newton算法来估计参数。
22
高阶 AR定义情况也类似。例如,在方程中运用非线性最小二乘估计的
非线性 AR(3)如下,
),(),()( 11332211 ?????? ???? ????? ttttyt xfxfyyyy
ttt xfxf ????? ??? ?? ),(),( 3322
23
§ 15.4.1 非平稳时间序列
ARMA估计理论都是基于平稳时间序列 。 如果一个序列的均值和自协方
差不依赖于时间, 就说它是平稳的 。
非平稳序列的典型例子是随机游动,
ttt yy ??? ?1
是平稳随机扰动项。序列 y的方差随时间增长,若设,则 的方差
是 。但是随机游动是差分平稳序列,因为 y一阶差分后平稳,
t?
tttt yLyy ????? ? )1(1
差分平稳序列称为单整, 记为 I(d),d为单整阶数 。 单整阶数是使序列平稳
而差分的阶数 。 对于上面的随机游动, 有一个单位根, 所以是 I(1),同样, 平
稳序列是 I(0)。 检查序列平稳性的标准方法是单位根检验 。
00 ?y ty
2?t
§ 15.4 ARIMA理论
24
ARIMA( Autoregressive Integrated Moving average,自回归单整动平均 ) 模
型是简单的 AR模型的一般化, 使用三种工具来为扰动项的序列相关建模 。
① 自回归 AR 上述的 AR(1)模型只运用了一阶 AR项,一般地,可以使用高
阶 AR项。每一个 AR项对应于在无条件残差预测方法中的滞后值。 P 阶的自回归
模型 AR(p)有下面的形式,
tptpttt uuuu ???? ????? ??? ?2211
② 单整 I 每一单整阶数对应于对序列进行差分。一阶单整意味着对原
始序列进行一次差分,二阶单整对应于进行两次差分,依此类推。
§ 15.4,2 ARIMA模型
25
③ 动平均 MA 动平均预测模型使用预测误差的滞后值来改善当前预测。一
阶动平均利用前期预测误差,二阶动平均利用前两期预测误差,以此类推。
MA(q)有如下形式,
qtqtttu ?? ??? ????? ?11
请注意, 一些教科书和软件包的系数使用的是与常规相反的符号, 因此
MA系数也可能是相反的 。
自回归和动平均可以结合在一起形成 ARMA(p,q)定义为,
tptpttt uuuu ???? ????? ??? ?2211
qtqtt ??? ???? ?????? ?2211
尽管计量经济学家常应用 ARMA模型于回归模型残差分析,它也可直接应
用于序列。后种方法提供了一种单变量模型,将条件序列均值设定为一个常数,
将残差估计成均值的序列差分。
26
§ 15.4.3 ARIMA模型建模原则 ( Box-Jenkins 1976)
在 ARIMA预测中, 用上述的三种程序块的结合来建立一个完整的预
测模型 。 建立残差序列 ARIMA模型的 第一步 是看其自相关性, 可以使用
相关图来达到这一目的 。 ARIMA模型建模过程被称为识别 ( 勿与有关联
立方程的著作中使用的同一词混淆 ) 。 残差当前值与过去值之间的相关性
为选择 ARIMA形式提供了导向 。 自相关很容易解释 —— 每一值是序列当
前值和滞后一定区间的值的相关系数 。 偏自相关有些复杂, 它们是考虑了
序列所有值滞后后的预测能力后, 计算当前和滞后序列的相关性 。 例如滞
后 6阶偏自相关是计算当 已在预测模型中时, 的预测能力 。
实际上, 偏自相关是当前期滞后已应用于 的预测后 的回归系数 。
如果怀疑左侧的因变量和其他的预测值之间存在一个分布滞后关系,
那么可以在执行估计前看它们的交叉相关 。
51 ?? tt uu ? 6?tu
6?tutu
27
第二步 是决定使用何种 ARIMA模型 。 如果自相关函数以几何速率衰减,
偏自相关函数一阶滞后后为零, 即为一阶自回归模型 。 同样, 如果自相关一
阶滞后后为零, 而偏自相关以几何速率衰减, 即为一阶动平均 。 如果自相关
有季节特征, 这说明存在季节 ARMA结构 。 例如:选择 EViews example
files\data\HS\HS序列工作栏中 View/Correlogram… 便可以检验基本住房序列相
关图 。
28
上图中存在季节频度的波动循环, 建议用季节 ARMA模型 拟合 HS序
列 。
ARIMA分析的目的是控制残差过程的一种过度节约的表示法 。 也可
仅用 AR或 MA来拟和残差的特性 。 使用 AIC 准则和 Schwarz准则来选择滞
后阶数 。
建立合适的 ARIMA模型后,应当确认模型没有残差自相关。检查扰
动项的自相关和偏自相关,还要考虑是否有重要的预测能力被忽略。
EViews提供了估计之后的诊断检查方案。
29
§ 15.5 估计 ARIMA模型
EViews估计的是考虑到具有右侧解释变量的 ARIMA(p,d,q)设定形式, 尽
管这样的模型有时叫做 ARIMAX模型,
ARIMA模型是 ARIMAX模型的特例, 但是我们把这一类的模型都叫做 ARIMA
模型 。
为建立 ARIMA模型, 首先需要做以下两点,
1,确定单整阶数, 差分因变量序列;
2.描述结构回归模型(因变量和解释变量),用前面介绍的方式加入 AR
或 MA项。
?
?
?
????????
??????
????? qtqttptpttt
tktkttt
uuuu
uxxxy
????????
????
??
?
112211
2211
30
§ 15.5.1 差分因变量序列
一, 差分
D算子被用来定义序列差分 。 定义一阶差分, 仅把序列名写入 D后的括
号 。 例如, D(GDP)定义 GDP的一阶差分, 或 GDP-GDP(-1)。 更复杂的差分形
式可以使用两个参数 n,s。 D(x,n)定义序列 x的 n 阶差分
xLnxD n)1(),( ??
L是滞后算子 。 例如,D(GDP,2)定义了 GDP的 2阶差分,
D(GDP,2)=GDP - 2*GDP(-1)+GDP(-2)
D(x,n,s)定义序列 x的 n阶普通差分,带有滞后 s阶的季节差分,
xLLsnxD sn )1()1(),,( ???
例如,D(GDP,0,4)定义带有滞后 4阶季节差分的零阶普通差分, 即 GDP-
GDP(-4)。
如果需要对数形式,可以使用 Dlog算子,它以对数值返回差分。例如:
Dlog(GDP)定义 log(GDP)的一阶差分,即 log(GDP)-log(GDP(-1))。
31
二、在 EViews中估计单整 模型
可以直接在估计定义式中包含差分算子 D。 例如,GDP~ I(1),即 GDP是
一阶单整序列 。 对 GDP估计 ARIMA(1,1,1)模型, 可以输入列表 (15_1\EQ_DY),
D(GDP) c ar(1) ma(1)
使用因变量差分因子 D(GDP)定义模型,EViews将提供水平变量 GDP的预测值。
§ 15.5.2 确定 ARMA形式
一,ARMA项
模型中 AR和 MA部分应使用关键词 ar和 ma定义。在上面 AR定义中,我们
已见过这种方法的例子。这对 MA也同样适用。
32
例如, 估计一个 2阶自回归和 1阶动平均过程 ARMA(2,1),应将 AR(1),
MA(1),AR(2)和其它解释变量一起包含在回归因子列表中,
y c gov ar(1) ar(2) ma(1)
不必连续使用 AR和 MA项 。 例如想用 4阶季节自回归模型来拟合季节
变化, 可以仅使用 AR(4),
y c gov ar(4 )
也可仅用 MA项来定义纯动平均模型 。 如可以表示出残差的 MA(2)模型 。
y c gov ma(1) ma(2)
传统的 Box-Jenkins模型或 ARIMA模型除了常数外不具有任何解释变量 。
在这种情况下, 解释变量将仅包含一个 c加上 AR,MA项, 例如,
y c ar(1) ar(2) ma(1) ma(2)
这是标准的 Box-Jenkins ARMA(2,2)模型。
33
二、季节 ARMA项
对于带有季节因素的季度数据, Box and Jenkins(1976) 建议使用季节自
回归 SAR和季节动平均 SMA。 SAR(p)定义为带有 p阶滞后的季节自回归项 。
估计中使用的滞后多项式是 AR项和 SAR项定义的结合 。
与此类似, SMA(q)定义为带有 q阶滞后的季节动平均 。 估计中使用的滞
后多项式是 MA项和 SMA项定义的结合 。 存在 SAR项则允许建立一个滞后多项
式 。
例如:没有季节项的 2阶 AR过程
tttt uuu ??? ??? ?? 2211
nttn xxLL ??,
用滞后算子,则上式可表示为,
ttuLL ??? ??? )1( 221
可以通过回归自变量的 ar(1),ar(2)项来估计这个过程。
34
对于季度数据, 可以加入 sar(4)来表示季节因素, 定义方程,
y c x ar(1) ar(2) sar(4)
估计误差结构为,
ttuLLL ???? ???? )1)(1( 4221
等价于
ttttttt uuuuuu ???????? ?????? ????? 625142211
参数 和季节因素相联系 。 注意:这是对系数有非线性约束的 AR(6)模型 。
在另一个例子中,无季节性的二阶 MA过程如下
?
,2211 ?? ??? ttttu ?????
可以通过包含 ma(1)和 ma(2)来估计二阶 MA过程。
35
对季度数据, 可以添加 sma(4)考虑季节性 。 例如定义方程,
y c x ma(1 ) ma(2) sma(4)
估计模型为,
tt LLLu ???? )1)(1( 4221 ????
等价于,
625142211 ????? ?????? tttttttu ?????????????
参数 和季节因素相联系。这是对系数有非线性约束的 MA(6)模型。还可以
在方程说明中同时包括 SAR,SMA项。
?
ttt uxy ??? 21 ??
36
§ 15.5.3 ARIMA估计的输出
含有 AR或 MA项的模型的估计输出和 OLS模型一样,只是在底部增加了一
个 AR,MA多项式的根的倒数。如果我们利用滞后多项式 和 写一般
的 ARMA模型,
)(L? )(L?
tt LuL ??? )()( ?
输出表中报告的结果相当于下列多项式
0)( 1 ??x? 和 0)( 1 ??x?
如果 有绝对值大于 1的实根或一对复根的逆在单位圆外 ( 即模大于 1),
这意味着自回归过程是发散的 。 如果 的根的倒数在单位圆外, 说明 MA过程是
不可逆的, 应使用不同的初值重新估计模型, 直到得到满足可逆性的动平均 。
如果估计的 MA模型的根的模接近于 1,有可能是对数据差分过多, 这就很难估
计和预测 。 如果可能的话, 应减少差分阶数重新估计 。
的根。这些根(可能是虚根)的模应小于 1,如果不满足这个条件,输出表中将
显示警告信息。
?
?
37
38
这个 ARMA估计输出例子的结果对应于如下定义,
或等同于,
注意,MA项的符号和教科书中的符号可能相反 。 倒根的模接近于 1,这对
于许多宏观经济序列是很典型的 。
541 57.091.063.0 ??? ??? ttt ???
?
?
?
?????
??
tt
tt
LLuLL
ur
?)91.01)(63.01()93.01)(86.01(
21.7
44
ttttt rrrr ?????? ??? 541 80.093.086.007.0
39
§ 15.5.4 ARMA估计选择
如前所述, 带有 AR或 MA的模型用非线性最小二乘法估计 。 非线性估计
方法对所有系数估计都要求初值 。 EViews自行确定初值 。
有时当迭代最大值达到时, 方程终止迭代, 尽管还未达到收敛 。 从前一
步初值重新开始方程, 使方程从中止处开始而不是从开始处开始 。 也可以试
试不同的初值来保证估计是全部而不是局部平方误差最小, 可以通过提供初
值加速估计过程 。
为控制 ARMA估计初值, 在方程定义对话框单击 options。 在 EViews提供
的选项中, 有几项设置初值的选择 。
EViews缺省方法是 OLS/TSLS,这种方法先进行没有 ARMA项的预备估计,
再从这些值开始非线性估计 。 另一选择是使用 OLS或 TSLS系数的一部分作为
初值 。 可以选择 0.3,0.5,0.8或者可以将所有初值设为零 。
用户确定初值选项是 User Supplied。在这个选项下,EViews使用 C系数向
量中的值。为设置初值,双击图标,为 C系数向量开一窗口,进行编辑。
40
为适当地设置初值, 需对 EViews如何为 ARMA设置系数多些了解 。 EViews
使用 C系数向量 。 它按下列规则为变量安排系数,
1,变量系数, 以输入为序 。
2,定义的 AR项, 以输入为序 。
3,SAR,MA,SMA系数 ( 以输入为序 )
这样, 下面两种定义将有同样规格的系数
Y c X ma(2) ma(1) sma(4) ar(1)
Y sma(4 ) c ar(1) ma(2) X ma(1)
也可使用程序指令安排 C向量值
param c(1) 50 c(2 ) 0.8 c(3) 0.2 c(4) 0.6 c(5) 0.1 c(6) 0.5
初值:常数是 50,X系数的初值是 0.8,ar(1),ma(2),ma(1),sma(4) 系数
的初值分别是 0.2, 0.6,0.1,0.5。
估计后, 可在方程表达式 Representation选项见到系数安排 。 也可以从估计
方程中填写 C向量, 选择 pros/update/ coefs from equations。
41
§ 15.5.5 处理估计问题
对于 ARMA模型估计, 要考虑一些问题 。 首先, MA模型很难估计 。
特别的, 应避免高阶 MA,除非模型非常需要, 因为它们可能引起估计困
难 。 例如, 相关图上滞后 57有一个大波峰并不要求必须在模型中包括
MA(57),除非知道每 57期都有特别事情发生 。 相关图中的突起很可能是序
列中的一个或多个奇异值的结果 。 模型中含有许多 MA项, 将会丧失自由
度, 并且可能牺牲估计的稳定性和可靠性 。
如果 MA过程的根的模接近于 1,可能会遇到估计困难 。 Eviews会报告
在迭代到最大次数时, 不能收敛或不能提高平方和, 这说明可能对数据差
分过多, 应检查序列相关图来看是否可以减少差分阶数来重新估计 。
42
1,带有 ARMA误差的 TSLS
对 ARIMA进行二阶段最小二乘法或工具变量法没有什么特殊困难 。
2,带有 ARMA误差的非线性模型
EViews将估计带有自回归项的非线性最小二乘模型 。
EViews目前不估计有 MA误差的非线性模型 。 然而, 可以运用状态空
间方法来定义估计这些模型 。
3,带有 ARMA误差的加权模型
EViews不会自动估计带有 ARMA误差项的加权模型 —— 如果对一加权
模型加入 AR项,加权序列会被忽略。
43
§ 15.6 诊断检验
如果 ARMA模型定义正确,模型残差将为白噪声。这意味着残差中应不存
在序列相关。 D-W统计量是当方程右边没有滞后变量时对一阶序列相关的检验。
如上所述,对残差中序列相关更多的检验可以如,View/Residual Tests/ Corre-
logram-Q-Statistic和 View/Residual Tests/Serial correlation LM Test。
44
§ 15.7 多项分布滞后 ( PDLS)
在经济分析中人们发现,一些经济变量,它们的数值是由自身的滞后量
或者其他变量的滞后量所决定的,表现在计量经济模型中,解释变量中经常
包含某些滞后变量。以投资函数为例,分析中国的投资问题发现,当年的投
资额除了取决于当年的收入(即国内生产总值)外,由于投资的连续性,它
还受到前 1 个,2个,3个 … 时期投资额的影响。已经开工的项目总是要继续下
去的,而每个时期的投资额又取决于每个时期的收入,所以可以建立如下关
于投资的计量经济方程
其中 I 表示投资额,Y 表示国内生产总值。
ttttt YYYI ????? ?????? ?? ?22110
45
对于有限滞后长度的情形,分布滞后模型的一般形式如下
tktktttt xxxy ?????? ?????? ?? ?110
系数 描述 x对 y作用的滞后。在模型中解释变量与随机误差项不相关的
情况下,可以直接使用 OLS估计参数。但是,一个显然的问题是解释变量之
间,即 x的当前和滞后值之间具有高度共线性,而共线性问题的一个直接后
果是参数估计量失去意义,不能揭示 x的各个滞后量对因变量的影响,所以
必须寻求另外的估计方法。
可以使用多项式分布滞后 ( Polynomial Distributed Lags,PDLs) 来减少
要估计的参数个数,以此来平滑滞后系数。平滑就是要求系数服从一个相对
低阶的多项式。 p 阶 PDLs模型限制 系数服从如下形式的 p阶多项式
?
ppj cjcjcj )()()( 12321 ???????? ?????? ? j = 0,1,2,…,k
(15.2)
(15.1)
一、多项式分布滞后模型的估计方法
?
46
是事先定义常数,
c
??
? ??
是偶数
是奇数(
pk
pkc
2/)(
2/)1(
PDLs有时被称为 Almon分布滞后模型。常数 仅用来避免共线性引起的数
值问题,不影响 的估计。这种定义允许仅使用参数 p 来估计一个 x 的 k 阶
滞后的模型(如果 p > k,将显示, 近似奇异, 错误信息)。
定义一个 PDL模型,EViews用 (15.2)式代入到 (15.1)式,将产生如下形式方

c
?
tppt zzzy ????? ?????? ?? 112211 ?
其中
kt
p
t
p
t
p
p
kttt
kttt
xckxcxcz
xckxcxcz
xxxz
???
??
??
???????
???????
????
)()1()(
)()1(
11
12
11
?
??
?
?
(15.3)
47
一旦从 (15.3)式估计出, 利用 (15.2)式就可得到 的各系数 。 这一过程
很明了, 因为是 的 线性变换 。 定义一个 PDLs要 有三个元素:滞后长度 k,
多项式阶数 ( 多项式最高次幂数 ) p和附加的约束条件 。
一个近端约束限制 x对 y一期超前作用为零,
? ?
? ?
0)1()1()1( 123211 ???????????? ?? pp ccc ????? ?
一个远端约束限制 x对 y的作用在大于定义滞后的数目衰减,
0)1()1()1( 123211 ???????????? ?? ppk ckckck ????? ?
如果限制滞后算子的近端或远端,参数个数将减少一个来解释这种约束。
如果对近端和远端都约束,参数个数将减少二个。
EViews缺省不加任何约束。
48
二、如何估计包含 PDLs的模型
通过 PDL项定义一个多项式分布滞后, 信息在随后的括号内, 按下列规则
用逗号隔开,
1,序列名
2,滞后长度 ( 序列滞后数 )
3,多项式阶数
4,一个数字限制码来约束滞后多项式,
1 = 限制滞后近端为零
2 = 限制远端
3 = 两者都限制
如果不限制滞后多项式, 可以省略限制码 。 方程中可以包含多个 PDL项 。。
例如,sales c pdl(y,8,3 )是 用常数, 解释变量 y的当前和 8阶分布滞后来
拟合因变量 sales,这里解释变量 y的滞后系数服从没有约束的 3阶多项式 。
49
类似地, y c pdl(x,12,4,2)
用常数, 解释变量 x的当前和 12阶分布滞后拟合因变量 y,这里解释变量 x的
系数服从带有远端约束的 4阶多项式 。
PDL也可用于二阶段最小二乘法 TSLS。 如果 PDL序列是外生变量, 应当在工
具表中也包括序列的 PDL项 。 为此目的, 可以定义 PDL(*)作为一个工具变量, 则
所有的 PDL变量都将被作为工具变量使用 。 例如:如果定义 TSLS方程为
sales c inc pdl(y(-1),12,4)
使用工具变量 z z(-1) pdl(*)
则 y的分布滞后和 z,z(-1)都被用作工具变量 。
PDLs不能用于非线性定义 。
50
三, 例子
投资 INV关于关于 GDP的 分布滞后模型的结果如下
51
逐个观察, INV滞后的系数统计上都不显著 。 但总体上讲回归具有一个合
理的 R2,(尽管 D— W统计量很低 )。 这是回归自变量中多重共线的典型现象,
建议拟合一个多项式分布滞后模型 。 估计一个无限制的 5阶多项式滞后模型,
输入变量列表,log(INV) c PDL(log(GDP),12,5),窗口中显示的多项式估计系
数, PDL01,PDL02,PDL03,… 分别对应方程 (15.3)中 Z1,Z 2,… 的系数 。
52
方程( 15.1)中的系数 在表格底部显示。
j?
表格底部的滞后值是分布滞后的估计系数值,并且在平稳的假设下有
GDP对 INV的长期影响的解释。
53
§ 15.8 单位根检验
EViews提供两种单位根检验,Dickey-Fuller(DF)、增广 DF(Augmented
DF)检验和 Phillips - Perron( PP)检验。本节提供这两种检验的一些理论背
景。
一, ADF检验
为说明 ADF检验的使用,先考虑一个 AR(1)过程
ttt yy ??? ??? ? 1
是参数,假设为白噪声。如果 -1< <1,y是 平稳序列。如果 =1,y是
非平稳序列(带漂移的随机游动)。如果这一过程在某一点开始,y的方差随
时间增长趋于无穷。如果 的绝对值大于 1,序列发散。因此,一个序列是否平
稳,可以检验 是否严格小于 1。 DF和 PP都用单位根作为原假设,。
因为发散序列没有经济学含义,所以备选假设为单边假设 。
??,t? ? ?
?
? 1:0 ??H
1:1 ??H
( 15.4)
54
从方程两边同时减去 1?ty
ttt yy ??? ???? ? 1
其中 1?? ??
所以原假设和备选假设可改为
??
?
?
?
0:
0:
1
0
?
?
H
H
( 15.5)
单位根检验可以看作对 进行 t 检验。对于( 15.5)可使用常规的 OLS方法
得到 的估计量和 t统计量 (即系数的估计量除以其标准偏差 ),但是这时 t统计量
不再渐近正态,甚至不对称。 Dickey和 Fuller(1979)通过蒙特卡洛方法研究发现,
检验 的统计量的临界值依赖于回归的形式 (是否引进了常数项和趋势项 ),
并且和样本长度 n有关,一般临界值随着 n的增大而减小。 t 统计量在原假设下不
具有一般 t 分布。 Dickey和 Fuller对选择的样本序列模拟了临界值,近年来
Mackinnon又进行了更大规模的模拟,允许 D-F计算的临界值适用于任何样本和
任何数目的右边变量。 EViews为单位根检验提供了这些临界值。
?
? ?0
?
( 15.6)
55
上面描述的简单单位根检验称为 DF检验, 该检验只有当序列为 AR(1)时才
有效 。 如果序列存在高阶滞后相关, 这就违背了扰动项是白噪声的假设 。 ADF
和 PP检验使用不同的方法来控制高阶序列相关 。
ADF方法 通过在回归方程右边加入因变量 y的滞后差分项来控制高阶相关
ptptttt yyyy ???? ????????? 1111 ????? ?
扩展定义将检验
??
?
?
?
0:
0:
1
0
?
?
H
H
EViews将 DF,ADF检验都看成为 ADF检验。 ADF检验考虑如下三种回归
形式,
t
p
i
ititt yyy ??? ????? ?
?
??
1
1
t
p
i
ititt ytayay ??? ?
?
?? ???????
1
210
t
p
i
ititt yyay ??? ?????? ?
?
??
1
10
56
通过在模型中增加的滞后项来消除残差的序列相关性 。 EViews在检验回
归时,询问是否包含有其它外生变量,即上面三种形式:包含截距,即常数项,
包含截距和线性趋势项,或两者都不包含。
如果序列含有趋势(确定的或随机的),序列回归中应既有常数又有趋势。
如果序列没有表现任何趋势且有非零均值,回归中应仅有常数。如果序列在零
均值波动,检验回归中应既不含有常数又不含有趋势。
二,Phillips-Perron(PP)检验
Phillips和 Perron( 1988)提出一种非参数方法来控制序列中高阶序列相关。
对 AR(1)的 PP检验为,
ttt yy ??? ???? ? 1
57
ADF检验通过在方程右边添加滞后差分项来修正高阶序列相关。 PP检验参
数的 t 统计量来修正 AR(1)的序列相关。这种修正方法是非参数的,因为我们
使用在零频率的谱估计。零频率对未知形式的异方差性和自相关性较稳健。
EViews使用 Newey-West异方差自相关一致估计
?
? ?
???
q
j
jq
1
0
2 )
11(2? ?
???
?
??
??
T
jt
jttj T
1
??1 ???
q是截断滞后值。 PP统计量由下式计算,
s
Tstt bb
pp ?
??
?
?
?2
)?(
?
0
221
0 ???
是 t 统计量; 是 的标准差; s是检验回归标准差。 bt bs ?
58
PP统计量渐进分布同 ADF的 t统计量一样 。 EViews显示 Mackinnon临界
值 。
对 PP检验,必须为 Newey-West 纠正定义截断滞后因子 q,即要包括的
序列相关期数。对话框开始包括 N-W自动截断滞后选择( f loor函数返回的
是不超过括号中数的最大整数)
))1 0 0/(4( 92Tf l o o rq ?
这仅基于检验回归中使用的观测值数,也可定义为任何整数。
59
三,EViews进行单位根检验
双击序列名打开序列窗口,选择 View/unit Root Test
60
进行单位根检验必须定义四项,
1,选择检验类型, ADF检验或 PP检验;
2,定义序列在水平值, 一阶差分, 二阶差分的情况下进行单位根检验 。
可以使用这个选项决定序列中单整的阶数 。 如果检验在水平值未拒绝检验而在
一阶差分拒绝检验, 序列中含有一个单位根, 是一阶单整 I(1)。
3,定义在检验回归中是否含有常数, 常数和趋势, 或二者都不包含 。 这
一选择很重要, 因为检验统计量在原假设下的分布随上 3种情况不同而变化 。
4,定义序列相关阶数 。 对于 ADF检验, 定义加入检验回归的滞后一阶差
分个数 。 对 PP检验, 定义计算 Newey-West异方差和自相关 ( HAC) 一致谱 ( 在
零频率 ) 估计的滞后截断 。
定义上述选项后,单击 OK进行检验。
61
EViews显示检验统计量和估计检验回归 。
对 ADF检验, 检验统计量是检验回归滞后因变量的 t 统计量, 注意关于
的统计检验是单边检验, 当计算得到的 t统计量的值小于临界值时拒
绝原假设 ( 即否定存在单位根 ) 。 对 PP检验, 检验统计量是调整 t统计量 。
如果 t统计量小于临界值, 拒绝原假设 。
单位根检验后, 应检查 EViews显示的估计检验回归, 尤其是如果对滞
后算子结构或序列确定性不肯定的话, 可以选择有常数项, 有常数项和趋
势或两者都没有三种不同的回归形式, 或滞后阶数来重新检验 。
下面的例子 ( 工作文件 BASIC\IP)是对序列 IP的水平值进行 ADF单位根
检验的结果 。 序列 IP的 t统计量是 -0.223277,大于所有的临界值, 因此接受
原假设, 即存在单位根, IP可能 是 I(1)的 。
0??
62
63
下面是对序列 IP的一阶差分进行 ADF单位根检验的结果。序列 D(IP(-1))的
系数的 t 统计量 -7,479534小于所有的临界值,因此拒绝原假设,即 IP的一阶差
分序列不存在单位根,即 D(IP)是平稳的 I(0)序列,并由此确定 IP是 I(1)序列。
64
§ 15.10 命 令
命令 equation eq_gdp.ls gdp c ar(1) ar (2) ma(1) ma(2)用来用一个 ARMA(2,
2)模型拟合序列 GDP并把结果储存在方程 EQ_GDP中 。
命令 eq1.auto(4) 用来检验方程 EQ1残差序列直到四阶的相关系数 。
命令 eq1.correlogram(12)用来显示方程直到 12阶的残差相关图 。
命令 equation eq2.ls gdp c pdl(m1,12,3) 使用一个三次多项式拟合 m1直
到 12阶的值 。
命令 gdp.ruoot(4,c)用来运行一个带常数和四阶滞后的 ADF检验 。
命令 gdp.uroot(4,t,h)用来运行一个带常数和线性趋势的 PP检验