第2讲 ARMA模型的干扰分析
ARMA模型的干扰分析就是对平稳时间序列的均值变化进行显著性检验。先以AR(1)过程为例,
yt = ( + (1 yt-1 + (D + ut,((1( < 1 (1)
其中ut,表示随机误差项,D表示虚拟变量。定义如下:
D = (2)
其中ti表示干扰时点。对(1)式两侧求期望,可得到yt的长期均值。当t < ti时,干扰前的长期均值是
E(yt) = 
当t ( ti,干扰后的长期均值是
E(yt) = 
那么施加干扰后对系统的长期影响是
-=
对于MA(1)过程,干扰分析的表达式是
yt = ( + ut + (1 ut-1 + (D (3)
干扰前的长期均值是
E(yt) = (
当t ( ti,干扰后的长期均值是
E(yt) = ( + (
那么施加干扰后对系统的长期影响是
(( + () - ( = (
对于ARMA过程,
yt = ( + ((L) yt-1 +((L)ut + (D (4)
其中((L)和((L)分别是yt-1和ut的滞后算子,干扰分析如下。
干扰前的长期均值是
E(yt) = 
当t ( ti,干扰后的长期均值是
E(yt) = 
那么施加干扰对系统的长期影响是
-=
总结如下表:
过程类型
干扰前的长期均值
干扰后的长期均值
干扰对系统的长期影响
AR(1)



ARMA (p,q)



MA(1)
(
( + (
(
MA ( q)
(
( + (
(
可以总结出如下两点:
(1)只要过程中存在自回归(AR)分量,那么无论有无移动平均分量(MA)以及移动平均分量滞后期有多长,对于干扰前后的均值都无影响。
(2)对于纯移动平均过程,无论滞后期有多长,干扰分析的结论相同。
对系统的干扰可以分成若干种类型,包括阶跃式干扰、脉冲式干扰、渐进式干扰、衰退式干扰等。(2)式表达的属于阶跃式干扰(如图1)。

图1 阶跃(level)式干扰
比如中国就业人员数统计,从1990年起包括了对农民工的统计。这种变化属于对中国就业人员数序列的阶跃式干扰。因为1990年以后将都按这种方式统计。
脉冲式干扰见图2。其定义是
DP= 
其中ti表示干扰时点。
比如中国人口年死亡率序列中在1960年就存在脉冲式冲击。
 
图2 脉冲(pulse)式干扰 中国人口死亡率(file:6popu-rate)
累进式干扰见图3。其定义是
D = 
其中ti1,ti2表示干扰时点。
 
图3 累进(slope)式 中国高校年招生人数(万人)(file:data1)
比如中国教育部近年来实施的普通高校扩招计划。这种扩招计划不是在一年内完成的,而是通过在连续若干年内的努力才使中国普通高校学生数序列达到一个新的水平,这相当于对中国普通高校学生数序列加载了一个渐进式冲击。
又如在农业生产领域推广水稻优良品种,这个过程不是在一年中完成的,而是经过若干年的努力从而使水稻产量达到一个新水平。
衰退式干扰见图4。其定义是
D = 
其中ti1,ti2表示干扰时点。

图4 衰退式根据不同的干扰模式还可以写出若干种其他类型的干扰表达式。如倒V字型干扰、梯形干扰、阶梯形干扰等。
例1 (file:5break4)中国全国居民对数的消费水平时间序列(1952(1997)见图11.12。从图中可以明显的看出1978年改革开放以后,对数的居民消费水平增加速度明显高于改革开放之前。
 
Lnyt D Lnyt
对对数的消费水平序列差分得差分序列如图。两个时期的均值分别是0.0320和0.1234。由于经济的快速发展,改革开放以后的消费水平比改革开放以前有了显著的提高。利用干扰模型分析这种提高是否存在显著性。设定虚拟变量如下,
D1=
得估计结果如下,
DLnYt = 0.0321 + 0.1030 D1 + vt + 0.9367vt-1
(2.1) (4.8) (15.4)
R2 = 0.69,Q(15) = 7.5 <(20.05 (14) = 23.7,DW=2.4,T= 45,(1952(1997)
由于D1的系数存在显著性(t = 4.8),说明改革开放的政策确实给居民的消费水平带来很大提高。干扰分析是
E(DLnYt) = 
改革开放以前对数的消费水平年增均值是0.0321,改革开放以后的消费水平年增均值是0.1351。改革开放的政策带来的提高是0.1030。
估计过程是用DLnYt先对常数和虚拟变量D1回归,然后通过相关图分析残差序列的结构。这是一个一阶移动平均过程。最终建立模型如上式。


例2 (file:5citypopu)用干扰模型分析中国城镇人口数(yt:万人,19491(995)序列。
中国城镇人口数序列明显在1978年存在一个转折点。年增加量大大增加。其原因并不是城镇人口自身的能力增加,而是新的城镇人口管理政策使农村人口向城镇人口转移的速度大大增加。
中国城镇人口数差分序列图如下。1977年前的城镇人口年增均值是389.4万人,1978年以后的城镇人口年增均值是1028.1万人。
 
下面用干扰模型分析这种提高是否存在显著性。设定虚拟变量
D1=
得估计结果如下,
Dyt = 397.06 + 618.98 D1 + vt + 0.2986 vt-1
(4.0) (3.9) (2.1)
R2= 0.41,Q(15) = 8.2 <(2(14) = 23.7,DW=2.1,T= 46,(1950(1995)
因为D1的系数存在显著性(t = 3.9),说明改革开放以后,城镇人口管理政策的松动使农村人口向城镇人口转移的速度增加。
上式也可写成,
Dyt =
干扰分析是
E(Dyt)=
改革开放以前城镇人口年均增加397.06万人,改革开放以后城镇人口年均增加1016.04万人。城镇人口管理政策的松动导致城镇人口年均增加618.98万人。

见图,注意到1978年以后,城镇人口管理政策的松动是在两年中完成的。所以可以把虚拟变量设计为累进式。定义D3如下,
D3=
这样得到的估计结果更好些。
Dyt = 384.87 + 668.29 D3 + vt + 0.3372 vt-1
(3.8) (4.1) (2.3)
R2= 0.43,Q(15) = 7.7 <(2(14) = 23.7,DW=2.1,T= 46,(1950(1995)
上式也可写成,
Dyt =
干扰分析是
E(Dyt) =
经济解释是改革开放以前城镇人口年均增加384.87万人,1987年城镇人口增加719.015万人;改革开放以后城镇人口年均增加1053.16万人。城镇人口管理政策的松动导致城镇人口年均增加668.29万人。