第1讲 季节时间序列(SARIMA)模型
1.时间序列(ARIMA)模型回顾时间序列分析方法由Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。
时间序列模型不同于经济计量模型的两个特点是:
(1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。
(2)明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。
时间序列模型的应用:
(1)研究时间序列本身的变化规律(何种结构,建立模型,有无确定性趋势,有无单位根,有无季节性成分)。
(2)在回归模型的预测中首先预测解释变量的值。
(3)非经典经济计量学的基础知识之一。
滞后算子与差分算子滞后算子:表示时间滞后的算子,常用L或B表示。例,Lxt = xt- 1,Ln xt = xt- n 。
差分:时间序列变量的本期值与其滞后值相减的运算叫差分。表示差分运算的算子称作差分算子,常用(或D表示。
差分分为一阶差分和高阶差分,一次差分和高次差分。
例,一阶差分( xt = xt - xt -1 = xt - L xt = (1- L) xt。
例,高阶差分(k xt = xt - xt -k = xt – Lk xt = (1- Lk ) xt。
例,二次差分((xt = (1- L ) 2 xt = (1 – 2L + L 2 ) xt = xt –2 xt-1+ xt–2。
高阶差分常用于季节性数据的差分,如季度数据的4阶差分、月度数据的12阶差分等。
滞后算子与差分算子可以直接参与运算。
滞后算子有如下性质。
(1)常数与滞后算子相乘等于常数。Lc = c
(2)滞后算子适用于分配律。(Li + Lj) xt = Li xt + Lj xt = xt -i+ xt –j
(3)滞后算子适用于结合律。Li Lj xt = Li+ j xt = xt -i–j,(Lj)2xt = Lj Lj xt = L2 j xt = xt–2 j
(4)滞后算子的零次方等于1。L0 xt = xt
(5)滞后算子的负整数次方意味着超前。L-i xt = xt+i
中文对时间前后的描述混乱。
以前,从前,前年,滞后 现在 以后,今后,后年,超前
时间
backward,lag,now,lead,forward,
几种典型的随机过程
1.白噪声(white noise)过程对于随机过程{ xt,t(T },如果E(xt) = 0,Var (xt) = ( 2 ( (,t(T; Cov (xt,xt + k) = 0,(t + k ) ( T,k ( 0,则称{xt}为白噪声过程。
2.随机游走(random walk)过程对于下面的表达式
xt = xt -1 + ut
如果ut 为白噪声过程,则称xt 为随机游走(随机游动、随机漫游)过程。
3.自回归过程,AR(p)
如果一个剔出均值和确定性成分的线性过程可表达为
xt = ( 1xt-1 + ( 2 xt-2 + … + ( p xt-p + ut,
其中(i,i = 1,… p 是自回归参数,ut 是白噪声过程,则称xt为p阶自回归过程,用AR(p)表示。xt是由它的p个滞后变量的加权和以及ut相加而成。
4.移动平均过程,MA(q)
如果一个剔出均值和确定性成分的线性随机过程可用下式表达
xt = ut + ( 1 ut –1 +( 2 ut -2 + … + ( q ut – q = (1 + ( 1L + ( 2 L2 + … +( q Lq) ut = ((L) ut
其中( 1,( 2,…,( q是移动平均参数,ut为白噪声过程,则上式称为q阶移动平均过程,记为MA(q) 。之所以称“移动平均”,是因为xt是由q +1个ut和ut滞后项的加权和构造而成。“移动”指t的变化,“平均”指加权和。
5.自回归移动平均过程,ARMA(p,q)
由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均部分的最大阶数。ARMA(p,q) 的一般表达式是
xt = ( 1xt-1 + ( 2xt-2 +…+( p xt-p + ut +( 1ut-1 + ( 2 ut-2 +,..+ ( q ut-q
即
(1 - ( 1L - ( 2 L2 -… - ( p Lp ) xt = (1 + ( 1 L + ( 2 L2+ … +( q Lq ) ut
或
( (L) xt = ( (L) ut
其中 ( (L) 和 ( (L) 分别表示L的p,q阶特征多项式。
ARMA(p,q) 过程的平稳性只依赖于其自回归部分,即( (L) = 0的全部根取值在单位圆之外(绝对值大于1)。其可逆性则只依赖于移动平均部分,即( (L) = 0的根取值应在单位圆之外。
6.单整(单积)自回归移动平均过程,ARIMA (p,d,q)
考虑如下模型
( (L)(d yt = ( (L) ut
其中((L) 是一个平稳的自回归算子。即( (L) = 0 的根都大于1。( (L)表示可逆的移动平均算子。( (L) = 0 的根都大于1。则称yt 为(p,d,q)阶单整(单积)自回归移动平均过程,记为ARIMA (p,d,q)。其中( (L) (d称为广义自回归算子。
Wold分解定理:任何协方差平稳过程xt,都可以被表示为
xt - ( - (dt = ut + (1 ut-1+ (2 ut-2 + … + =
其中( 表示xt的期望。dt 表示xt的线性确定性成分,如周期性成分、时间t的多项式和指数形式,虚拟变量等,可以直接用xt的滞后值预测。(0 = 1,< ∞。ut为白噪声过程。ut表示用xt的滞后项预测xt时的误差。
ut = xt - E(xt ( xt-1,xt-2,…)
称为xt的线性非确定性成分。当dt = 0时,称xt为纯线性非确定性过程。
对于一般的(漂移项非零)ARMA(p,q)过程,
( (L) xt = ( +( (L) ut (1)
xt的期望是
E(xt) = E() +E(ut) == = (
这就是漂移项与均值的关系所以(1)式也可以写为,
( (L) (xt -() = ( (L) ut (2)
任何漂移项非零(含有确定性成分)的平稳过程都可以通过对该序列先退均值(退确定性成分)再研究。均值的大小并不影响模型的结构。所以以零均值过程研究模型类型具有代表性。
2.季节时间序列模型在某些时间序列中,存在明显的周期性变化。这种周期是由于季节性变化(包括季度、月度、周度等变化)或其他一些固有因素引起的。这类序列称为季节性序列。比如一个地区的气温值序列(每隔一小时取一个观测值)中除了含有以天为周期的变化,还含有以年为周期的变化。在经济领域中,季节性序列更是随处可见。如季度时间序列、月度时间序列、周度时间序列等。处理季节性时间序列只用以上介绍的方法是不够的。描述这类序列的模型之一是季节时间序列模型(seasonal ARIMA model),用SARIMA表示。较早文献也称其为乘积季节模型(multiplicative seasonal model)。
设季节性序列(月度、季度、周度等序列都包括其中)的变化周期为s,即时间间隔为s的观测值有相似之处。首先用季节差分的方法消除周期性变化。季节差分算子定义为,
(s = 1- Ls
若季节性时间序列用yt表示,则一次季节差分表示为
(s yt = (1- Ls) yt = yt - yt - s
对于非平稳季节性时间序列,有时需要进行D次季节差分之后才能转换为平稳的序列。在此基础上可以建立关于周期为s的P阶自回归Q阶移动平均季节时间序列模型(注意P、Q等于2时,滞后算子应为(Ls)2 = L2s。
(P (Ls) (sDyt = (Q (Ls) ut (2.60)
对于上述模型,相当于假定ut是平稳的、非自相关的。
当ut非平稳且存在ARMA成分时,则可以把ut描述为
(p (L) (dut = (q (L) vt (2.61)
其中vt为白噪声过程,p,q分别表示非季节自回归、移动平均算子的最大阶数,d表示ut的一阶(非季节)差分次数。由上式得
ut = (p-1(L) (-d (q (L) vt (2.62)
把 (2.62) 式代入 (2.60) 式,于是得到季节时间序列模型的一般表达式。
(p(L) (P(Ls) ((d(sDyt) = (q(L) (Q(Ls) vt (2.63)
其中下标P,Q,p,q分别表示季节与非季节自回归、移动平均算子的最大滞后阶数,d,D分别表示非季节和季节性差分次数。上式称作 (p,d,q) ( (P,D,Q)s 阶季节时间序列模型或乘积季节模型。
保证((d(sDyt)具有平稳性的条件是(p(L)(P(Ls) = 0的根在单位圆外;保证((d(sDyt)具有可逆性的条件是(q (L)(Q (Ls) = 0的根在单位圆外。
当P = D = Q = 0时,SARIMA模型退化为ARIMA模型;从这个意义上说,ARIMA模型是SARIMA模型的特例。当P = D = Q = p = q = d = 0时,SARIMA模型退化为白噪声模型。
(1,1,1) ( (1,1,1)12 阶月度SARIMA模型表达为
(1- (1 L) (1- (1 L12) ( (12 yt = (1+(1 L) (1+(1 L12) vt
( (12 yt具有平稳性的条件是 ( (1 ( < 1,( (1 ( < 1,( (12 yt具有可逆性的条件是 ( (1 ( < 1,( (1 ( < 1。
设log(Yt) = yt,变量( (12 yt在EViews中用DLOG(Y,1,12)表示(这样表示的好处是EViews可以直接预测到Y),上式的EViews估计命令是
DLOG(Y,1,12) AR(1) SAR(12) MA(1) SMA(12)
(0,1,1) ( (0,1,1)12 阶月度SARIMA模型表达为
( (12 yt = (1+ (1 L) (1+ (1 L12) vt (2.64)
(2.64) 式的EViews估计命令是
DLOG(Y,1,12) MA(1) SMA(12)
由(2.64) 式得
((12 yt = (1+(1 L) (1+(1 L12 ) vt = vt +(1 L vt +(1 L12vt + (1 (1 L13vt
= vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13
上式对应的EViews估计命令是
DLOG(Y,1,12) MA(1) MA(12) MA(13)
模型表达式是
((12 yt = vt +(1 vt –1 +(12 vt – 12 + (13 vt – 13
这是一个非季节模型表达式。以上两个EViews估计命令是等价的,都是估计MA(13)模型。
注意:唯一不同点是上式对vt – 13的系数(13没有约束,而对季节模型来说,相当于增加了一个约束条件,(13 =(1 (1。
进一步化简
( (yt – yt - 12) = vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13
( yt – ( yt - 12 = vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13
用于预测的模型型式是
yt = yt -1 + yt - 12 – yt – 13 + vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13 (2.65)
由季节时间序列模型的一般表达式。
(p(L) (P(Ls) ((d(sDyt) = (q(L) (Q(Ls) vt (2.63)
可写为
(p(L) (P(Ls) (sD ((dyt) = (q(L) (Q(Ls) vt
(*(L) (dyt = (*(L) vt
其中,(*(L) = (p(L) (P(Ls) (sD,(*(L) = (q(L) (Q(Ls)。从上式可以看出SARIMA模型(2.63)可以展开为ARIMA(p+PS+DS,d,q+QS) 模型。
对乘积季节模型的季节阶数,即周期长度s的识别可以通过对实际问题的分析、时间序列图以及时间序列的相关图和偏相关图分析得到。
以相关图和偏相关图为例,如果相关图和偏相关图不是呈线性衰减趋势,而是在变化周期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用SARIMA模型描述。
建立SARIMA模型,
(1)首先要确定d,D。通过差分和季节差分把原序列变换为一个平稳的序列。令
xt = (d(sD yt
(2)然后用xt 建立 (p (L) (P (Ls) xt = (q (L) (Q (Ls) vt模型。
注意:
(1)用对数的季节时间序列数据建模时通常D不会大于1,P和Q不会大于3。
(2)乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。利用乘积季节模型预测也与上面介绍的预测方法类似。
3.季节时间序列建模案例
案例1:(文件名:5b2c3)北京市1978:1~1989:12社会商品零售额月度数据(yt,单位:亿元人民币)曲线见图2.32,数据见表2.3。yt与时间呈指数关系且存在递增型异方差。对数的社会商品零售额月度数据(Ln yt)曲线见图2.33。Lnyt与时间近似呈线性关系(异方差问题也得到抑制)。
图2.32 yt 图2.33 Lnyt
通过Lnyt的相关图和偏相关图(见图2.34)可以看到Lnyt是一个非平稳序列(相关图衰减很慢)且Lnyt与其12倍数的滞后期存在自回归关系。
图2.34 Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一阶差分,得(Lnyt(图2.35)。图2.36是对Lnyt进行2次一阶差分的结果,序列(2Ln yt是过度差分序列。从 (Lnyt的相关图和偏相关图(图2.37)可以看到,通过差分 (Lnyt的平稳性得到很大改进,但与其12倍数的滞后期存在显著的自相关关系。
图2.35 (Ln yt 图2.36 (2Ln yt
图2.37 (Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一次季节性差分(或12阶差分),得 (12 Lnyt(图2.38)。从 (12 Lnyt的相关图和偏相关图(图2.39)可以看到 (12 Lnyt仍然是非平稳的。
图2.38 (12 Lnyt,(EViews:DLOG(Y,0,12))
图2.39 (12 Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一阶差分和一阶季节性差分,得((12 Lnyt(见图2.40)。从xt 的相关图和偏相关图(见图2.41)可以看到((12 Lnyt近似为一个平稳过程。
图2.40 ( (12 Lnyt = xt,(EViews:DLOG(Y,1,12))
图2.41 ((12 Lnyt的相关图(下)和偏相关图(上)
建模1:用1978:1~1989:11期间数据,估计yt 的 (1,1,1) ( (1,1,0)12阶季节时间序列模型,得结果如下:
(1+ 0.5924 L) (1 + 0.4093 L12) ((12Lnyt = (1+0.4734 L) vt (2.66)
(4.5) (5.4) (1.9)
R2 = 0.33,s.e,= 0.146,Q(36) = 15.5,(20.05(36-2-1) = 44
EViews估计命令是
DLOG(Y,1,12) AR(1) SAR(12) MA(1)
EViews输出结果见图2.42。
注意:
(1)仔细对照(2.66)式和图2.42输出结果,不要把自回归系数估计值的符号写错。通过自回归特征根倒数-0.59可知,把表达式中的算子写作(1+ 0.5924 L)是正确的。通过移动平均特征根倒数-0.47可知,把表达式中的算子写作(1+0.4734 L) 是正确的。
(2)表达式中,季节和非季节因子(特征多项式)之间是相乘关系。
(3)在EViews估计命令中把变量写作DLOG(Y,1,12)的好处是可以直接对yt和((12 Lnyt预测。
(4)以上EViews估计命令为例,如果命令中没有AR(1)项,那么SAR(12) 项的输出结果将变为AR(12),为什么?
模型残差序列的相关与偏相关图如图2.43。
图2.42 EViews估计结果
图2.43模型残差序列的相关与偏相关图
对于((12 Lnyt来,模型参数全部有显著性,Q(36) = 15.5 < (20.05(36-2-1) = 44。两种检验通过。见输出结果(2.42),对于((12 Lnyt,模型共有14个特征根。
图2.44 D12DLnyt的实际与静态预测序列 图2.45 yt的实际与静态预测序列
图2.44 D12DLnyt的实际与动态预测序列 图2.45 yt的实际与动态预测序列对1989年第12月份yt进行样本外1期预测,结果如图2.46。
图2.46 EViews预测结果 图2.47 1989年第12月份(样本外1期)预测评价预测误差是
( == 0.076
建模2:进一步分析((12 Lnyt的相关图和偏相关图,也可以建立成一个纯季节移动平均模型。用1978:1~1989:12期间数据得(0,1,1) ( (0,1,1)12 季节乘积模型EViews估计结果如下,
图2.41 ((12 Lnyt的相关图(下)和偏相关图(上)
( (12 Lnyt = (1- 0.35 L) (1 - 0.61 L12) vt (2.67)
(- 4.4) (- 9.1)
R2 = 0.36,DW = 1.86,F = 71.9,s.e,= 0.038,Q(36) = 21.88,(20.05 (36-2) = 44
模型参数全部有显著性,Q(36) = 21.88 < (20.05 (36-2) = 44。两种检验通过。上式变换为,
(Ln yt – ( Lnyt - 12 = vt - 0.35 vt –1 - 0.61 vt – 12 + 0.2135 vt – 13
Lnyt = Lnyt -1 +Ln yt - 12 –Lnyt – 13 + vt - 0.35 vt –1 - 0.61 vt – 12 + 0.2135 vt – 13 (2.68)
(2.67)式也是一个可以选用的模型。
表2.3 北京市社会商品零售额(yt)月度数据(单位:亿元人民币,1978:1~1989:12)
年:月
yt
年:月
yt
年:月
yt
年:月
yt
年:月
yt
1978:01
134.3
1980:06
168.2
1982:11
205.8
1985:04
343.4
1987:09
499.5
1978:02
119.4
1980:07
163.5
1982:12
248.2
1985:05
341.2
1987:10
505.2
1978:03
128.3
1980:08
161.6
1983:01
243.2
1985:06
346.0
1987:11
518.7
1978:04
126.4
1980:09
172.9
1983:02
217.5
1985:07
329.9
1987:12
617.9
1978:05
128.8
1980:10
166.5
1983:03
226.2
1985:08
328.1
1988:01
570.7
1978:06
127.8
1980:11
175.2
1983:04
223.5
1985:09
358.2
1988:02
561.3
1978:07
121.1
1980:12
197.7
1983:05
221.0
1985:10
358.4
1988:03
570.4
1978:08
118.4
1981:01
212.1
1983:06
220.5
1985:11
376.6
1988:04
567.9
1978:09
125.7
1981:02
177.9
1983:07
205.8
1985:12
451.0
1988:05
570.9
1978:10
123.6
1981:03
182.9
1983:08
206.9
1986:01
412.0
1988:06
603.9
1978:11
128.5
1981:04
184.2
1983:09
218.8
1986:02
374.5
1988:07
591.8
1978:12
145.2
1981:05
184.0
1983:10
216.0
1986:03
390.0
1988:08
636.2
1979:01
164.7
1981:06
182.4
1983:11
235.0
1986:04
387.0
1988:09
674.5
1979:02
126.2
1981:07
175.6
1983:12
282.0
1986:05
389.8
1988:10
647.7
1979:03
143.7
1981:08
172.0
1984:01
268.4
1986:06
397.7
1988:11
640.5
1979:04
143.7
1981:09
184.9
1984:02
227.6
1986:07
381.4
1988:12
804.2
1979:05
145.5
1981:10
184.7
1984:03
248.6
1986:08
386.9
1989:01
694.3
1979:06
143.7
1981:11
195.1
1984:04
247.0
1986:09
429.8
1989:02
673.8
1979:07
138.4
1981:12
224.8
1984:05
249.9
1986:10
428.8
1989:03
718.7
1979:08
136.7
1982:01
233.6
1984:06
253.1
1986:11
444.4
1989:04
690.3
1979:09
145.5
1982:02
182.0
1984:07
245.5
1986:12
527.7
1989:05
676.6
1979:10
150.7
1982:03
206.6
1984:08
249.6
1987:01
478.3
1989:06
665.8
1979:11
149.0
1982:04
202.2
1984:09
272.3
1987:02
442.4
1989:07
642.2
1979:12
164.7
1982:05
201.7
1984:10
278.7
1987:03
461.4
1989:08
638.9
1980:01
190.3
1982:06
202.6
1984:11
299.4
1987:04
458.2
1989:09
674.1
1980:02
174.9
1982:07
192.8
1984:12
366.3
1987:05
458.2
1989:10
652.7
1980:03
163.2
1982:08
186.2
1985:01
364.8
1987:06
468.5
1989:11
641.9
1980:04
168.4
1982:09
199.3
1985:02
349.1
1987:07
454.5
1989:12
734.1
1980:05
168.6
1982:10
198.2
1985:03
359.1
1987:08
458.9
案例2 香港季节GDPt数据的拟合(季节时间序列模型,file:HongKong)
1980:1~2002:4年香港季度GDPt序列曲线见图2.27(数据见表2.4,单位:港元)。1980~1997年GDPt随时间呈指数增长。1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDPt总量几乎没有增长。另一个特征是GDPt随时间呈递增型异方差。所以,用对数的季度GDPt数据(LnGDPt,曲线见图2.48)建立季节时间序列模型。
图2.47 GDPt 图2.48 LnGDPt
通过LnGDPt的相关图和偏相关图(图2.49)可以看到LnGDPt是一个非平稳序列(相关图衰减得很慢)。
图2.49 LnGDPt的相关图和偏相关图
对LnGDPt进行一阶差分,得 DLnGDPt(见图2.50)。DLnGDPt的平稳性得到很大改进,但其季节因素影响还很大。从 DLnGDPt的相关图和偏相关图(图2.51)也可以明显地看到这个特征。若对LnGDPt直接进行一次季节差分(四阶差分),得D4LnGDPt见图2.52。其波动性也很大。相关图和偏相关图见图2.53。D2LnGDPt显然是过度差分序列(图2.54)。
图2.50 DLnGDPt,(s.d,= 0.062) 图2.51 DLnGDPt的相关图和偏相关图
图2.52 D4LnGDPt,(s.d,= 0.076) 图2.53 D4LnGDPt的相关图和偏相关图
图2.54 D2LnGDPt,(s.d,= 0.062)
在DLnGDPt的基础上进行一阶季节差分,或在D4LnGDPt基础上进行一阶非季节差分,得 D4DLnGDPt(图2.55)。其相关图和偏相关图见图2.56。D4DLnGDPt中已经基本消除了季节变化因素。在D4DLnGDPt的基础上建立时间序列模型。
图2.55 D4DLnGDPt,(s.d,= 0.029) 图2.56 D4DLnGDPt的相关和偏相关图
通过对D4DLnGDPt的相关和偏相关图分析,应该建立(2,1,2) ( (1,1,1)4 模型。理由如下。因为相关图和偏相关图都呈欠阻尼衰减特征,说明至少存在非季节2阶自回归和非季节2阶移动平均成分。从图中看出季节特征仍然存在,当然,不容易判断是1阶季节自回归成分和1阶季节移动平均成分都有,还是只有1阶季节自回归成分,或者只有1阶季节移动平均成分。可以都加上,也可以只加一个1阶季节自回归,或者1阶季节移动平均。估计结果显示1阶季节自回归成分和1阶季节移动平均成分都应该加在模型里。
EViews估计命令是
DLOG(GDP,1,4) C AR(1) AR(2) SAR(4) MA(1) MA(2) SMA(4)
用1980:1~2002:3的数据得估计结果如下(EViews输出结果如图2.57):
D4DLnGDPt = - 0.0023 + ut (1980:1~2002:3)
(-2.4)
(1-1.20 L+0.66 L2) (1 - 0.33 L4) ut = (1 - 1.16 L+ 0.97 L2) (1 - 0.95 L4) vt (2.69)
(14.4) (-8.8) (2.8) (55.9) (86.1) (-32.8)
R2 = 0.57,DW = 2.0,F = 16.1,Q(36) = 19.3,(20.05 (36-3-3) = 43.8
图2.57 EViews估计结果
图2.57模型(2.99)误差项的相关和偏相关图
注意:
(1)不要把自回归系数估计值的符号写错。不要把均值(- 0.0023)项表达错。EViews仍然是对(D4DLnGDPt + 0.0023)建立(2,1,2) ( (1,1,1)4 阶季节时间序列模型,而不是对D4DLnGDPt建立季节时间序列模型。
(2)季节和非季节因子之间是相乘关系。
(3)在EViews估计命令中把变量写作DLOG(GDP,1,4),好处是预测时可直接预测GDPt,也可以预测D4DLnGDPt。
模型参数全部有显著性,Q(36) = 19.6 <(20.05 (36-3-3) = 43.8。两种检验通过。依据输出结果,对于D4DLnGDPt,模型共有12个特征根。4个实根,8个复根。
图2.58 D4DLnGDPt的实际与静态预测序列 图2.59 GDPt的实际与静态预测序列
图2.58 D4DLnGDPt的实际与动态预测序列 图2.59 GDPt的实际与动态预测序列
对2002年第4季度GDPt进行样本外1期预测,结果如下:
图2.60 样本外1期(2002年第4季度)GDPt预测预测误差是
( == 0.006
样本内及样本外1期预测评价:
图2.61 样本内与样本外1期(2002年第4季度)GDPt预测评价表2.4 香港季度GDPt数据(1980:1~2002:4,单位:港元)
年:月
GDPt /1011
年:月
GDPt /1011
年:月
GDPt /1011
年:月
GDPt /1011
1980:1
0.31489
1985:4
0.70951
1991:3
1.80580
1997:2
3.32335
1980:2
0.34505
1986:1
0.69108
1991:4
1.86722
1997:3
3.51501
1980:3
0.37641
1986:2
0.73102
1992:1
1.76661
1997:4
3.53431
1980:4
0.38566
1986:3
0.83372
1992:2
1.89129
1998:1
3.09548
1981:1
0.38830
1986:4
0.88419
1992:3
2.10027
1998:2
3.18978
1981:2
0.40632
1987:1
0.84318
1992:4
2.15501
1998:3
3.26421
1981:3
0.44307
1987:2
0.89861
1993:1
2.05568
1998:4
3.24905
1981:4
0.47473
1987:3
1.05262
1993:2
2.18604
1999:1
2.90525
1982:1
0.45042
1987:4
1.06886
1993:3
2.41488
1999:2
3.05798
1982:2
0.45973
1988:1
1.00261
1993:4
2.47149
1999:3
3.19225
1982:3
0.50703
1988:2
1.06898
1994:1
2.36370
1999:4
3.30586
1982:4
0.51368
1988:3
1.22224
1994:2
2.49299
2000:1
3.08457
1983:1
0.47199
1988:4
1.27865
1994:3
2.68834
2000:2
3.12780
1983:2
0.50214
1989:1
1.18206
1994:4
2.75271
2000:3
3.30500
1983:3
0.55978
1989:2
1.26058
1995:1
2.53532
2000:4
3.36602
1983:4
0.60088
1989:3
1.39551
1995:2
2.66221
2001:1
3.09551
1984:1
0.57852
1989:4
1.43266
1995:3
2.83671
2001:2
3.12460
1984:2
0.62840
1990:1
1.31033
1995:4
2.92840
2001:3
3.25707
1984:3
0.68580
1990:2
1.40688
1996:1
2.73698
2001:4
3.31276
1984:4
0.68200
1990:3
1.55950
1996:2
2.91996
2002:1
3.01482
1985:1
0.66118
1990:4
1.59949
1996:3
3.13538
2002:2
3.08443
1985:2
0.65849
1991:1
1.49003
1996:4
3.31695
2002:3
3.26417
1985:3
0.69969
1991:2
1.60942
1997:1
3.07279
2002:4
3.34740
1.时间序列(ARIMA)模型回顾时间序列分析方法由Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。
时间序列模型不同于经济计量模型的两个特点是:
(1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。
(2)明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。
时间序列模型的应用:
(1)研究时间序列本身的变化规律(何种结构,建立模型,有无确定性趋势,有无单位根,有无季节性成分)。
(2)在回归模型的预测中首先预测解释变量的值。
(3)非经典经济计量学的基础知识之一。
滞后算子与差分算子滞后算子:表示时间滞后的算子,常用L或B表示。例,Lxt = xt- 1,Ln xt = xt- n 。
差分:时间序列变量的本期值与其滞后值相减的运算叫差分。表示差分运算的算子称作差分算子,常用(或D表示。
差分分为一阶差分和高阶差分,一次差分和高次差分。
例,一阶差分( xt = xt - xt -1 = xt - L xt = (1- L) xt。
例,高阶差分(k xt = xt - xt -k = xt – Lk xt = (1- Lk ) xt。
例,二次差分((xt = (1- L ) 2 xt = (1 – 2L + L 2 ) xt = xt –2 xt-1+ xt–2。
高阶差分常用于季节性数据的差分,如季度数据的4阶差分、月度数据的12阶差分等。
滞后算子与差分算子可以直接参与运算。
滞后算子有如下性质。
(1)常数与滞后算子相乘等于常数。Lc = c
(2)滞后算子适用于分配律。(Li + Lj) xt = Li xt + Lj xt = xt -i+ xt –j
(3)滞后算子适用于结合律。Li Lj xt = Li+ j xt = xt -i–j,(Lj)2xt = Lj Lj xt = L2 j xt = xt–2 j
(4)滞后算子的零次方等于1。L0 xt = xt
(5)滞后算子的负整数次方意味着超前。L-i xt = xt+i
中文对时间前后的描述混乱。
以前,从前,前年,滞后 现在 以后,今后,后年,超前
时间
backward,lag,now,lead,forward,
几种典型的随机过程
1.白噪声(white noise)过程对于随机过程{ xt,t(T },如果E(xt) = 0,Var (xt) = ( 2 ( (,t(T; Cov (xt,xt + k) = 0,(t + k ) ( T,k ( 0,则称{xt}为白噪声过程。
2.随机游走(random walk)过程对于下面的表达式
xt = xt -1 + ut
如果ut 为白噪声过程,则称xt 为随机游走(随机游动、随机漫游)过程。
3.自回归过程,AR(p)
如果一个剔出均值和确定性成分的线性过程可表达为
xt = ( 1xt-1 + ( 2 xt-2 + … + ( p xt-p + ut,
其中(i,i = 1,… p 是自回归参数,ut 是白噪声过程,则称xt为p阶自回归过程,用AR(p)表示。xt是由它的p个滞后变量的加权和以及ut相加而成。
4.移动平均过程,MA(q)
如果一个剔出均值和确定性成分的线性随机过程可用下式表达
xt = ut + ( 1 ut –1 +( 2 ut -2 + … + ( q ut – q = (1 + ( 1L + ( 2 L2 + … +( q Lq) ut = ((L) ut
其中( 1,( 2,…,( q是移动平均参数,ut为白噪声过程,则上式称为q阶移动平均过程,记为MA(q) 。之所以称“移动平均”,是因为xt是由q +1个ut和ut滞后项的加权和构造而成。“移动”指t的变化,“平均”指加权和。
5.自回归移动平均过程,ARMA(p,q)
由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均部分的最大阶数。ARMA(p,q) 的一般表达式是
xt = ( 1xt-1 + ( 2xt-2 +…+( p xt-p + ut +( 1ut-1 + ( 2 ut-2 +,..+ ( q ut-q
即
(1 - ( 1L - ( 2 L2 -… - ( p Lp ) xt = (1 + ( 1 L + ( 2 L2+ … +( q Lq ) ut
或
( (L) xt = ( (L) ut
其中 ( (L) 和 ( (L) 分别表示L的p,q阶特征多项式。
ARMA(p,q) 过程的平稳性只依赖于其自回归部分,即( (L) = 0的全部根取值在单位圆之外(绝对值大于1)。其可逆性则只依赖于移动平均部分,即( (L) = 0的根取值应在单位圆之外。
6.单整(单积)自回归移动平均过程,ARIMA (p,d,q)
考虑如下模型
( (L)(d yt = ( (L) ut
其中((L) 是一个平稳的自回归算子。即( (L) = 0 的根都大于1。( (L)表示可逆的移动平均算子。( (L) = 0 的根都大于1。则称yt 为(p,d,q)阶单整(单积)自回归移动平均过程,记为ARIMA (p,d,q)。其中( (L) (d称为广义自回归算子。
Wold分解定理:任何协方差平稳过程xt,都可以被表示为
xt - ( - (dt = ut + (1 ut-1+ (2 ut-2 + … + =
其中( 表示xt的期望。dt 表示xt的线性确定性成分,如周期性成分、时间t的多项式和指数形式,虚拟变量等,可以直接用xt的滞后值预测。(0 = 1,< ∞。ut为白噪声过程。ut表示用xt的滞后项预测xt时的误差。
ut = xt - E(xt ( xt-1,xt-2,…)
称为xt的线性非确定性成分。当dt = 0时,称xt为纯线性非确定性过程。
对于一般的(漂移项非零)ARMA(p,q)过程,
( (L) xt = ( +( (L) ut (1)
xt的期望是
E(xt) = E() +E(ut) == = (
这就是漂移项与均值的关系所以(1)式也可以写为,
( (L) (xt -() = ( (L) ut (2)
任何漂移项非零(含有确定性成分)的平稳过程都可以通过对该序列先退均值(退确定性成分)再研究。均值的大小并不影响模型的结构。所以以零均值过程研究模型类型具有代表性。
2.季节时间序列模型在某些时间序列中,存在明显的周期性变化。这种周期是由于季节性变化(包括季度、月度、周度等变化)或其他一些固有因素引起的。这类序列称为季节性序列。比如一个地区的气温值序列(每隔一小时取一个观测值)中除了含有以天为周期的变化,还含有以年为周期的变化。在经济领域中,季节性序列更是随处可见。如季度时间序列、月度时间序列、周度时间序列等。处理季节性时间序列只用以上介绍的方法是不够的。描述这类序列的模型之一是季节时间序列模型(seasonal ARIMA model),用SARIMA表示。较早文献也称其为乘积季节模型(multiplicative seasonal model)。
设季节性序列(月度、季度、周度等序列都包括其中)的变化周期为s,即时间间隔为s的观测值有相似之处。首先用季节差分的方法消除周期性变化。季节差分算子定义为,
(s = 1- Ls
若季节性时间序列用yt表示,则一次季节差分表示为
(s yt = (1- Ls) yt = yt - yt - s
对于非平稳季节性时间序列,有时需要进行D次季节差分之后才能转换为平稳的序列。在此基础上可以建立关于周期为s的P阶自回归Q阶移动平均季节时间序列模型(注意P、Q等于2时,滞后算子应为(Ls)2 = L2s。
(P (Ls) (sDyt = (Q (Ls) ut (2.60)
对于上述模型,相当于假定ut是平稳的、非自相关的。
当ut非平稳且存在ARMA成分时,则可以把ut描述为
(p (L) (dut = (q (L) vt (2.61)
其中vt为白噪声过程,p,q分别表示非季节自回归、移动平均算子的最大阶数,d表示ut的一阶(非季节)差分次数。由上式得
ut = (p-1(L) (-d (q (L) vt (2.62)
把 (2.62) 式代入 (2.60) 式,于是得到季节时间序列模型的一般表达式。
(p(L) (P(Ls) ((d(sDyt) = (q(L) (Q(Ls) vt (2.63)
其中下标P,Q,p,q分别表示季节与非季节自回归、移动平均算子的最大滞后阶数,d,D分别表示非季节和季节性差分次数。上式称作 (p,d,q) ( (P,D,Q)s 阶季节时间序列模型或乘积季节模型。
保证((d(sDyt)具有平稳性的条件是(p(L)(P(Ls) = 0的根在单位圆外;保证((d(sDyt)具有可逆性的条件是(q (L)(Q (Ls) = 0的根在单位圆外。
当P = D = Q = 0时,SARIMA模型退化为ARIMA模型;从这个意义上说,ARIMA模型是SARIMA模型的特例。当P = D = Q = p = q = d = 0时,SARIMA模型退化为白噪声模型。
(1,1,1) ( (1,1,1)12 阶月度SARIMA模型表达为
(1- (1 L) (1- (1 L12) ( (12 yt = (1+(1 L) (1+(1 L12) vt
( (12 yt具有平稳性的条件是 ( (1 ( < 1,( (1 ( < 1,( (12 yt具有可逆性的条件是 ( (1 ( < 1,( (1 ( < 1。
设log(Yt) = yt,变量( (12 yt在EViews中用DLOG(Y,1,12)表示(这样表示的好处是EViews可以直接预测到Y),上式的EViews估计命令是
DLOG(Y,1,12) AR(1) SAR(12) MA(1) SMA(12)
(0,1,1) ( (0,1,1)12 阶月度SARIMA模型表达为
( (12 yt = (1+ (1 L) (1+ (1 L12) vt (2.64)
(2.64) 式的EViews估计命令是
DLOG(Y,1,12) MA(1) SMA(12)
由(2.64) 式得
((12 yt = (1+(1 L) (1+(1 L12 ) vt = vt +(1 L vt +(1 L12vt + (1 (1 L13vt
= vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13
上式对应的EViews估计命令是
DLOG(Y,1,12) MA(1) MA(12) MA(13)
模型表达式是
((12 yt = vt +(1 vt –1 +(12 vt – 12 + (13 vt – 13
这是一个非季节模型表达式。以上两个EViews估计命令是等价的,都是估计MA(13)模型。
注意:唯一不同点是上式对vt – 13的系数(13没有约束,而对季节模型来说,相当于增加了一个约束条件,(13 =(1 (1。
进一步化简
( (yt – yt - 12) = vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13
( yt – ( yt - 12 = vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13
用于预测的模型型式是
yt = yt -1 + yt - 12 – yt – 13 + vt +(1 vt –1 +(1 vt – 12 + (1 (1 vt – 13 (2.65)
由季节时间序列模型的一般表达式。
(p(L) (P(Ls) ((d(sDyt) = (q(L) (Q(Ls) vt (2.63)
可写为
(p(L) (P(Ls) (sD ((dyt) = (q(L) (Q(Ls) vt
(*(L) (dyt = (*(L) vt
其中,(*(L) = (p(L) (P(Ls) (sD,(*(L) = (q(L) (Q(Ls)。从上式可以看出SARIMA模型(2.63)可以展开为ARIMA(p+PS+DS,d,q+QS) 模型。
对乘积季节模型的季节阶数,即周期长度s的识别可以通过对实际问题的分析、时间序列图以及时间序列的相关图和偏相关图分析得到。
以相关图和偏相关图为例,如果相关图和偏相关图不是呈线性衰减趋势,而是在变化周期的整倍数时点上出现绝对值相当大的峰值并呈振荡式变化,就可以认为该时间序列可以用SARIMA模型描述。
建立SARIMA模型,
(1)首先要确定d,D。通过差分和季节差分把原序列变换为一个平稳的序列。令
xt = (d(sD yt
(2)然后用xt 建立 (p (L) (P (Ls) xt = (q (L) (Q (Ls) vt模型。
注意:
(1)用对数的季节时间序列数据建模时通常D不会大于1,P和Q不会大于3。
(2)乘积季节模型参数的估计、检验与前面介绍的估计、检验方法相同。利用乘积季节模型预测也与上面介绍的预测方法类似。
3.季节时间序列建模案例
案例1:(文件名:5b2c3)北京市1978:1~1989:12社会商品零售额月度数据(yt,单位:亿元人民币)曲线见图2.32,数据见表2.3。yt与时间呈指数关系且存在递增型异方差。对数的社会商品零售额月度数据(Ln yt)曲线见图2.33。Lnyt与时间近似呈线性关系(异方差问题也得到抑制)。
图2.32 yt 图2.33 Lnyt
通过Lnyt的相关图和偏相关图(见图2.34)可以看到Lnyt是一个非平稳序列(相关图衰减很慢)且Lnyt与其12倍数的滞后期存在自回归关系。
图2.34 Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一阶差分,得(Lnyt(图2.35)。图2.36是对Lnyt进行2次一阶差分的结果,序列(2Ln yt是过度差分序列。从 (Lnyt的相关图和偏相关图(图2.37)可以看到,通过差分 (Lnyt的平稳性得到很大改进,但与其12倍数的滞后期存在显著的自相关关系。
图2.35 (Ln yt 图2.36 (2Ln yt
图2.37 (Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一次季节性差分(或12阶差分),得 (12 Lnyt(图2.38)。从 (12 Lnyt的相关图和偏相关图(图2.39)可以看到 (12 Lnyt仍然是非平稳的。
图2.38 (12 Lnyt,(EViews:DLOG(Y,0,12))
图2.39 (12 Lnyt的相关图(下)和偏相关图(上)
对Lnyt进行一阶差分和一阶季节性差分,得((12 Lnyt(见图2.40)。从xt 的相关图和偏相关图(见图2.41)可以看到((12 Lnyt近似为一个平稳过程。
图2.40 ( (12 Lnyt = xt,(EViews:DLOG(Y,1,12))
图2.41 ((12 Lnyt的相关图(下)和偏相关图(上)
建模1:用1978:1~1989:11期间数据,估计yt 的 (1,1,1) ( (1,1,0)12阶季节时间序列模型,得结果如下:
(1+ 0.5924 L) (1 + 0.4093 L12) ((12Lnyt = (1+0.4734 L) vt (2.66)
(4.5) (5.4) (1.9)
R2 = 0.33,s.e,= 0.146,Q(36) = 15.5,(20.05(36-2-1) = 44
EViews估计命令是
DLOG(Y,1,12) AR(1) SAR(12) MA(1)
EViews输出结果见图2.42。
注意:
(1)仔细对照(2.66)式和图2.42输出结果,不要把自回归系数估计值的符号写错。通过自回归特征根倒数-0.59可知,把表达式中的算子写作(1+ 0.5924 L)是正确的。通过移动平均特征根倒数-0.47可知,把表达式中的算子写作(1+0.4734 L) 是正确的。
(2)表达式中,季节和非季节因子(特征多项式)之间是相乘关系。
(3)在EViews估计命令中把变量写作DLOG(Y,1,12)的好处是可以直接对yt和((12 Lnyt预测。
(4)以上EViews估计命令为例,如果命令中没有AR(1)项,那么SAR(12) 项的输出结果将变为AR(12),为什么?
模型残差序列的相关与偏相关图如图2.43。
图2.42 EViews估计结果
图2.43模型残差序列的相关与偏相关图
对于((12 Lnyt来,模型参数全部有显著性,Q(36) = 15.5 < (20.05(36-2-1) = 44。两种检验通过。见输出结果(2.42),对于((12 Lnyt,模型共有14个特征根。
图2.44 D12DLnyt的实际与静态预测序列 图2.45 yt的实际与静态预测序列
图2.44 D12DLnyt的实际与动态预测序列 图2.45 yt的实际与动态预测序列对1989年第12月份yt进行样本外1期预测,结果如图2.46。
图2.46 EViews预测结果 图2.47 1989年第12月份(样本外1期)预测评价预测误差是
( == 0.076
建模2:进一步分析((12 Lnyt的相关图和偏相关图,也可以建立成一个纯季节移动平均模型。用1978:1~1989:12期间数据得(0,1,1) ( (0,1,1)12 季节乘积模型EViews估计结果如下,
图2.41 ((12 Lnyt的相关图(下)和偏相关图(上)
( (12 Lnyt = (1- 0.35 L) (1 - 0.61 L12) vt (2.67)
(- 4.4) (- 9.1)
R2 = 0.36,DW = 1.86,F = 71.9,s.e,= 0.038,Q(36) = 21.88,(20.05 (36-2) = 44
模型参数全部有显著性,Q(36) = 21.88 < (20.05 (36-2) = 44。两种检验通过。上式变换为,
(Ln yt – ( Lnyt - 12 = vt - 0.35 vt –1 - 0.61 vt – 12 + 0.2135 vt – 13
Lnyt = Lnyt -1 +Ln yt - 12 –Lnyt – 13 + vt - 0.35 vt –1 - 0.61 vt – 12 + 0.2135 vt – 13 (2.68)
(2.67)式也是一个可以选用的模型。
表2.3 北京市社会商品零售额(yt)月度数据(单位:亿元人民币,1978:1~1989:12)
年:月
yt
年:月
yt
年:月
yt
年:月
yt
年:月
yt
1978:01
134.3
1980:06
168.2
1982:11
205.8
1985:04
343.4
1987:09
499.5
1978:02
119.4
1980:07
163.5
1982:12
248.2
1985:05
341.2
1987:10
505.2
1978:03
128.3
1980:08
161.6
1983:01
243.2
1985:06
346.0
1987:11
518.7
1978:04
126.4
1980:09
172.9
1983:02
217.5
1985:07
329.9
1987:12
617.9
1978:05
128.8
1980:10
166.5
1983:03
226.2
1985:08
328.1
1988:01
570.7
1978:06
127.8
1980:11
175.2
1983:04
223.5
1985:09
358.2
1988:02
561.3
1978:07
121.1
1980:12
197.7
1983:05
221.0
1985:10
358.4
1988:03
570.4
1978:08
118.4
1981:01
212.1
1983:06
220.5
1985:11
376.6
1988:04
567.9
1978:09
125.7
1981:02
177.9
1983:07
205.8
1985:12
451.0
1988:05
570.9
1978:10
123.6
1981:03
182.9
1983:08
206.9
1986:01
412.0
1988:06
603.9
1978:11
128.5
1981:04
184.2
1983:09
218.8
1986:02
374.5
1988:07
591.8
1978:12
145.2
1981:05
184.0
1983:10
216.0
1986:03
390.0
1988:08
636.2
1979:01
164.7
1981:06
182.4
1983:11
235.0
1986:04
387.0
1988:09
674.5
1979:02
126.2
1981:07
175.6
1983:12
282.0
1986:05
389.8
1988:10
647.7
1979:03
143.7
1981:08
172.0
1984:01
268.4
1986:06
397.7
1988:11
640.5
1979:04
143.7
1981:09
184.9
1984:02
227.6
1986:07
381.4
1988:12
804.2
1979:05
145.5
1981:10
184.7
1984:03
248.6
1986:08
386.9
1989:01
694.3
1979:06
143.7
1981:11
195.1
1984:04
247.0
1986:09
429.8
1989:02
673.8
1979:07
138.4
1981:12
224.8
1984:05
249.9
1986:10
428.8
1989:03
718.7
1979:08
136.7
1982:01
233.6
1984:06
253.1
1986:11
444.4
1989:04
690.3
1979:09
145.5
1982:02
182.0
1984:07
245.5
1986:12
527.7
1989:05
676.6
1979:10
150.7
1982:03
206.6
1984:08
249.6
1987:01
478.3
1989:06
665.8
1979:11
149.0
1982:04
202.2
1984:09
272.3
1987:02
442.4
1989:07
642.2
1979:12
164.7
1982:05
201.7
1984:10
278.7
1987:03
461.4
1989:08
638.9
1980:01
190.3
1982:06
202.6
1984:11
299.4
1987:04
458.2
1989:09
674.1
1980:02
174.9
1982:07
192.8
1984:12
366.3
1987:05
458.2
1989:10
652.7
1980:03
163.2
1982:08
186.2
1985:01
364.8
1987:06
468.5
1989:11
641.9
1980:04
168.4
1982:09
199.3
1985:02
349.1
1987:07
454.5
1989:12
734.1
1980:05
168.6
1982:10
198.2
1985:03
359.1
1987:08
458.9
案例2 香港季节GDPt数据的拟合(季节时间序列模型,file:HongKong)
1980:1~2002:4年香港季度GDPt序列曲线见图2.27(数据见表2.4,单位:港元)。1980~1997年GDPt随时间呈指数增长。1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDPt总量几乎没有增长。另一个特征是GDPt随时间呈递增型异方差。所以,用对数的季度GDPt数据(LnGDPt,曲线见图2.48)建立季节时间序列模型。
图2.47 GDPt 图2.48 LnGDPt
通过LnGDPt的相关图和偏相关图(图2.49)可以看到LnGDPt是一个非平稳序列(相关图衰减得很慢)。
图2.49 LnGDPt的相关图和偏相关图
对LnGDPt进行一阶差分,得 DLnGDPt(见图2.50)。DLnGDPt的平稳性得到很大改进,但其季节因素影响还很大。从 DLnGDPt的相关图和偏相关图(图2.51)也可以明显地看到这个特征。若对LnGDPt直接进行一次季节差分(四阶差分),得D4LnGDPt见图2.52。其波动性也很大。相关图和偏相关图见图2.53。D2LnGDPt显然是过度差分序列(图2.54)。
图2.50 DLnGDPt,(s.d,= 0.062) 图2.51 DLnGDPt的相关图和偏相关图
图2.52 D4LnGDPt,(s.d,= 0.076) 图2.53 D4LnGDPt的相关图和偏相关图
图2.54 D2LnGDPt,(s.d,= 0.062)
在DLnGDPt的基础上进行一阶季节差分,或在D4LnGDPt基础上进行一阶非季节差分,得 D4DLnGDPt(图2.55)。其相关图和偏相关图见图2.56。D4DLnGDPt中已经基本消除了季节变化因素。在D4DLnGDPt的基础上建立时间序列模型。
图2.55 D4DLnGDPt,(s.d,= 0.029) 图2.56 D4DLnGDPt的相关和偏相关图
通过对D4DLnGDPt的相关和偏相关图分析,应该建立(2,1,2) ( (1,1,1)4 模型。理由如下。因为相关图和偏相关图都呈欠阻尼衰减特征,说明至少存在非季节2阶自回归和非季节2阶移动平均成分。从图中看出季节特征仍然存在,当然,不容易判断是1阶季节自回归成分和1阶季节移动平均成分都有,还是只有1阶季节自回归成分,或者只有1阶季节移动平均成分。可以都加上,也可以只加一个1阶季节自回归,或者1阶季节移动平均。估计结果显示1阶季节自回归成分和1阶季节移动平均成分都应该加在模型里。
EViews估计命令是
DLOG(GDP,1,4) C AR(1) AR(2) SAR(4) MA(1) MA(2) SMA(4)
用1980:1~2002:3的数据得估计结果如下(EViews输出结果如图2.57):
D4DLnGDPt = - 0.0023 + ut (1980:1~2002:3)
(-2.4)
(1-1.20 L+0.66 L2) (1 - 0.33 L4) ut = (1 - 1.16 L+ 0.97 L2) (1 - 0.95 L4) vt (2.69)
(14.4) (-8.8) (2.8) (55.9) (86.1) (-32.8)
R2 = 0.57,DW = 2.0,F = 16.1,Q(36) = 19.3,(20.05 (36-3-3) = 43.8
图2.57 EViews估计结果
图2.57模型(2.99)误差项的相关和偏相关图
注意:
(1)不要把自回归系数估计值的符号写错。不要把均值(- 0.0023)项表达错。EViews仍然是对(D4DLnGDPt + 0.0023)建立(2,1,2) ( (1,1,1)4 阶季节时间序列模型,而不是对D4DLnGDPt建立季节时间序列模型。
(2)季节和非季节因子之间是相乘关系。
(3)在EViews估计命令中把变量写作DLOG(GDP,1,4),好处是预测时可直接预测GDPt,也可以预测D4DLnGDPt。
模型参数全部有显著性,Q(36) = 19.6 <(20.05 (36-3-3) = 43.8。两种检验通过。依据输出结果,对于D4DLnGDPt,模型共有12个特征根。4个实根,8个复根。
图2.58 D4DLnGDPt的实际与静态预测序列 图2.59 GDPt的实际与静态预测序列
图2.58 D4DLnGDPt的实际与动态预测序列 图2.59 GDPt的实际与动态预测序列
对2002年第4季度GDPt进行样本外1期预测,结果如下:
图2.60 样本外1期(2002年第4季度)GDPt预测预测误差是
( == 0.006
样本内及样本外1期预测评价:
图2.61 样本内与样本外1期(2002年第4季度)GDPt预测评价表2.4 香港季度GDPt数据(1980:1~2002:4,单位:港元)
年:月
GDPt /1011
年:月
GDPt /1011
年:月
GDPt /1011
年:月
GDPt /1011
1980:1
0.31489
1985:4
0.70951
1991:3
1.80580
1997:2
3.32335
1980:2
0.34505
1986:1
0.69108
1991:4
1.86722
1997:3
3.51501
1980:3
0.37641
1986:2
0.73102
1992:1
1.76661
1997:4
3.53431
1980:4
0.38566
1986:3
0.83372
1992:2
1.89129
1998:1
3.09548
1981:1
0.38830
1986:4
0.88419
1992:3
2.10027
1998:2
3.18978
1981:2
0.40632
1987:1
0.84318
1992:4
2.15501
1998:3
3.26421
1981:3
0.44307
1987:2
0.89861
1993:1
2.05568
1998:4
3.24905
1981:4
0.47473
1987:3
1.05262
1993:2
2.18604
1999:1
2.90525
1982:1
0.45042
1987:4
1.06886
1993:3
2.41488
1999:2
3.05798
1982:2
0.45973
1988:1
1.00261
1993:4
2.47149
1999:3
3.19225
1982:3
0.50703
1988:2
1.06898
1994:1
2.36370
1999:4
3.30586
1982:4
0.51368
1988:3
1.22224
1994:2
2.49299
2000:1
3.08457
1983:1
0.47199
1988:4
1.27865
1994:3
2.68834
2000:2
3.12780
1983:2
0.50214
1989:1
1.18206
1994:4
2.75271
2000:3
3.30500
1983:3
0.55978
1989:2
1.26058
1995:1
2.53532
2000:4
3.36602
1983:4
0.60088
1989:3
1.39551
1995:2
2.66221
2001:1
3.09551
1984:1
0.57852
1989:4
1.43266
1995:3
2.83671
2001:2
3.12460
1984:2
0.62840
1990:1
1.31033
1995:4
2.92840
2001:3
3.25707
1984:3
0.68580
1990:2
1.40688
1996:1
2.73698
2001:4
3.31276
1984:4
0.68200
1990:3
1.55950
1996:2
2.91996
2002:1
3.01482
1985:1
0.66118
1990:4
1.59949
1996:3
3.13538
2002:2
3.08443
1985:2
0.65849
1991:1
1.49003
1996:4
3.31695
2002:3
3.26417
1985:3
0.69969
1991:2
1.60942
1997:1
3.07279
2002:4
3.34740