我们对经济量进行分析的最终目的,是为了预测某些经济变量的未来值。进行预测的方法有两种。一种是根据一定的经济理论,建立各种相互影响的经济变量之间的关系模型,根据观测到的经济数据估计出模型参数,
利用模型来预测有关变量的未来值。这种方法的优点在于精确地考虑到了各经济变量之间的相互影响,有理论依据,但是由于抽样信息不完备,经济模型和经济计量模型不可能真正准确地反映了经济现实,因而得到的结果不可能是相当准确。
另一种方法是利用要预测的经济变量的过去值来预测其未来值,而不考虑变量值产生的经济背景。这种方法假定数据是由随机过程产生的,根据单一变量的观测值建立时间序列模型进行预测。这种方法在短期预测方面是很成功的。
第十章 时间序列分析第一节 确定性时间序列模型一、移动平均模型并用于趋势预测。
示序列的趋势性变化,要作用是消除干扰,显模型。移动平均模型主平均表达式的模型称为移动的移动平均数序列。该称为时间序列平均数对于时间序列:
t
Ntttt
t
T
y
Nt
N
yyyy
y
yyy


,?
,,
121
21
二、加权移动平均模型
1/)(
,?
1
0
10
122110


Na
aaay
Nt
N
yayayaya
y
N
i
i
Nt
NtNttt
t
为加权因子:、、、。其中的加权移动平均数序列称为时间序列平均数
。,是趋势预测更加准确可通过加权因子的选取序列的趋势变化外,还用除消除干扰、显示权移动平均模型,其作该式表达的模型称为加三、二次移动平均模型对经过一次移动平均产生的序列才进行移动平均,即:
模型。模型称为二次移动平均
,该式表达的的二次移动平均数序列为时间序列由此构成的序列程 t
Ntttt
t NtN
yyyy
y
y
,

121?


四、指数平滑模型如果采用下式求得序列的平滑预测值:
的值。小为原则确定值之差的平方和最序列。以实际值与预测带入模型,计算预测值的选择:选择不同的育预测值的加权和。即预测只是前期实际智
)(
该式也可写为
。称为平滑常数,平滑模型,其中则称此预测模型为指数


11
111
1?
10
)?(





ttt
tttt
yyy
yyyy
五、二次指数平滑模型在一次指数平滑模型的基础上再进行指数平滑计算,即构成二次指数平滑模型。同样可以构成三次指数平滑模型。
第二节 随机时间序列模型的特征一、随机过程( stochastic process)
一个特定的变量在不同的时点或时期的观测值 y1,y2,…,yT,称为一个时间序列。假设这些观测值是随机变量 Y1,Y2,…,YT的实现,而随机变量 Y1,Y2,…,YT是无穷随机变量序列 Yt0,Yt0+1,…,Y1,
Y2,… 的一部分 (其中 t0可以是 -?)。这个无穷随机变量序列 Yt,t=?1,
2,…,称为一个随机过程。
一个具有均值为零和相同有限方差的的独立随机变量序列 et称为白噪声
(white noise)。如果 et服从正态分布,则称为高斯白噪声。
例如,一个一阶自回归过程:,是白噪声:
te,11ttt eYY1?
)(0),c o v (,0)v a r (,0)( tseeeeE stett 且?
假定改随机过程的起点为 t0= - ∞,可以证明 E(Yt)=0,var(Yt)=σy。这里每个随机变量的曲志都依赖于其前期水平,这是依据现在和过去的观测值预测未来值的基础。因此,度量时间序列元素之间的依赖性的协方差在序列特性描述方面非常重要。
二、自协方差函数和自相关函数自协方差函数是描述时间序列随机型结构的重要工具。

的自协方差函数)称为随机过程,,。自协方差序列且的函数是时间间隔。表示,因此可以用之间的时间间隔量,仅依赖于两个随机变不依赖于时点是时间不变量,这里
,有对于非负整数协方差的线性依赖关系。对于机过程两个元素之间)协方差度量了单一随称为自协方差(
之间的协方差为:和的两个元素一个随机过程
)c o v(
21(
,),c o v (
),c o v (
)()]([
)()()(
)]([)(),c o v (
])0][0([),c o v (
,
c o v
)])()][(([),c o v (
1
2
22
111
11
1
1
f u n c t i o na r i a n c ea u t o
Yk
kYYk
tYY
YYEeYYE
YYEeEYYE
eYYEYYEYY
k
YYEYY
eYY
a r i a n c ea u t o
YEYYEYEYY
YYY
tkkk
kkttk
kttY
Y
k
kttktktt
kttktktt
ktkttkttktt
Yktttt
ttt
ktktttktt
kttt



















。对于
:函数可以得到自相关除以随机过程的方 差每个将自协方差标准化,把方差不同:元和按美分计量的 自协资按美的计量单位。例如,工本质上依赖于随机 变量自协方差函数
,2,1,,
,2,1,0,
),(
,
),(E1 0 0 0 0)1 0 0,1 0 0(E),(E
2
2
0
1
0
0




keYY
k
A C Ff u n c ti o na t io na u t o c o r r e l
YYYYZZ
k
Y
Y
k
k
kttt
k
k
Yk
kttkttktt
k



由于只有随机过程的样本,只能根据样本数据计算出样本自相关函数
( Sample autocorrelation function),k
0
2
0
)
))(
k
k
t
ktt
k
n
YY
n
YYYY


样本自相关函数:

样本方差

样本协方差三、平稳随机过程并非所有随机过程的两个元素之间的协方差都只依赖于它们的时间间隔。我们把任意两个元素之间的协方差都只依赖于它们的时间间隔,且具有常数均值和有限方差的随机过程,称为平稳过程 (stationary process):
kkttktt
t
t
YYEYY
Y
YE



)])([(),c o v ()3(
)v a r (2
)()1(
)(
平稳过程。
)也是一个(个平稳过程,而显然,白噪声过程是一 1||1 ttt eYY
如果随机过程不满足上述条件,则称为非平稳随机过程。
平稳随机过程产生的时间序列,为平稳序列。平稳性是时间序列的一个重要的特性,它保证了随机过程基本上没有结构变动,而结构变动会给预测带来困难,甚至不可预测。
四、平稳性的检验
1、博克斯 -皮尔斯( Box-Pierce)Q统计量平稳过程的一个显著特征是自相关函数随时间间隔 k的增大而衰减,因此,对时间序列的样本自相关函数是否显著地不为零,来检验序列的平稳性。
序列。
为非平稳同时为零的假设,序列临界值,则拒绝大于一定显著水平下的统计量分布。如果计算的的遵循自由度为统计量近似(大样本)
为滞后长度。为样本容量,其中统计量定义为:
k
m
k
k
mQ
mnnQ
Q
Q
,?
2
1
2
2、单位根检验( Unit root test)
考虑以阶自回归模型:
则存在单位根。若是否显著等于作回归,检查。因此可对,则为非平稳时间序列如果白噪声。其中
11
1
e,
1
t1



ttt
ttt
eYY
eYY
影响。消除截距项和趋势项的后面的两个式子式为了
,即存在单位根。为以上形式中,原假设均为时间或趋势变量。在其中检验:常用以下形式的回归作是非平稳的。
列值的绝对值,则时间序,反之,如果小于临界时间序列是平稳的假设给的绝对值,则不拒绝所临界统计量的绝对值超过如果计算的检验。富勒(该检验称为迪基的假设。绝值的比较来决定是否拒统计量表,根据与临界通过查找统计量。分布,将之称为统计量不遵从的由于按通常方式计算的
。是否显著为检验进行估计,形式:或者对其一阶差分后的
0
)
1
t
0
)1(
121
11
1
11











t
eYtY
eYY
eYY
DF
DF
DF
t
eYeYY
ttt
ttt
ttt
k
ttttt
tpptpttt
p
pp
ttttt
ttt
YLYYYY
LLLL
eYeLYY
eYY
)(|
|1)(
)1(
2211
2
21
1



简洁地写为:可以把项式:使用滞后算子表示的多或
:利用滞后算子可改写为例如,





一、滞后算子定义滞后算子 (lag operator)L:
LYt = Yt-1
其中 Yt 和 Yt-1为随机过程中的元素,而
L2Yt = L[L(Yt)]= LYt-1= Yt-2
一般地,对任意正整数 n,有 LnYt = Yt-n,L0Yt = Yt
第四节 AR,MA,ARMA模型二、自回归模型( auto-regressive,AR)
1,AR模型如果时间序列 y1,y2,…,yT,的生成过程的形式为:
估计自回归参数。由此可知,可以利用不相关。、、、与且参数。参数,是模型的待估计为自回归、、、。阶自回归模型,缩写为上式表示的模型为归序列。则称该时间序列为 自回或和白噪声的线性函 数:
为它前期值时间序列阶自回归过程,生成的程称为具有这种形式的随 机过或用滞后算子可表示 为:
。时且为白噪声:其中
O L S
yyyeNe
pARp
eyLLLeyyyy
yp
eYLeYLLL
eetseEe
eYYYY
pttttet
p
tt
p
ptptpttt
t
ttptt
p
p
sttt
tptpttt








21
2
21
2
212211
2
21
2211
),,0(~
)(
)1(
)()1(
0)c o v (,0)(




pkpkk
k
k
pkpkk
pkttpkttktt
ktpktpktkttkttkttk
tptpttt
r
r
rrr
yyEyyEyyE
eyyYyEyyEyyr
eyyyy
p















2211
0
2211
2211
2211
2211
)()()(
)]([)(),c o v (
因此,自相关函数为:
的自协方差函数为阶自回归序列:
2,AR模型的自协方差函数和自相关函数
3,AR模型的平稳性
,则该序列是平稳的。的模解外,即:的所有根抖落在单位圆若多项式:
过程:对于
1||
1)(
)(
22
0210
2
21
2211
21



zzzizzz
zzzz
eyyyypAR
p
pp
tptpttt


二、移动平均模型( Moving Average,MA)
1,MA( q)模型如果时间序列 yt为它的当期和前期的误差和随机项的线性函数,即型的待估计参数。为移动平均参数,是模
、、、。其中阶移动平均模型,记为为具有这种形式的模型称或用滞后算子可表示为:
为移动平均序列。则称该时间序列
q
ttptt
q
q
t
qtqtttt
qMAq
yeLyeLLL
y
eeeey



21
2
21
2211
)(
)()1(


2,MA模型的自协方差函数和自相关函数
)](
)[()(
)1(])[()(
0)()(
,)(0,0)(0,0)(
2211
2211
22
2
2
1
22
2211
2211
2
qktqktktkt
qtqtttktt
qqtqttttt
qtqtttt
tjttjtt
eeee
eeeeEyyE
eeeeEyyE
eeeeEyE
eeEjeeEjeE
e
e















时,当时,而当根据
0,
1,0
0)(,
)(0
0
0
22
0
2
0
0
2





k
q
i
i
kq
i
kii
k
k
kttk
kq
i
kiikttk
qk
qk
yyEqk
yyEqk
e
e
e



时当
。其中时,当自相关函数为:
时当时,当三、自回归移动平均模型( ARMA)
如果时间序列 yt为它的当期和前期的误差和随机项,以及其前期值的线性函数,即
tqtp
t
p
pt
q
q
t
qtqtttptpttt
eLyL
yLLLeLLL
y
eeeeyyyy
)()(
)1()1(
2
21
2
21
22112211






或用滞后算子可表示为:
。为自回归移动平均序列则称该时间序列


待估计参数。
型的为移动平均参数,是模、、、为自回归参数,、、、其中
。,记为阶自回归移动平均模型为具有这种形式的模型称
qp
qpA R M Aqp
2121
),(),(
四,AR 模型的估计
1、已知阶数 p的 AR( p)模型的估计如果样本为 AR过程生成:
Tteyyyy tptpttt,2,12211,
。数估计量解方程组,即可得到参可得到正规方程组。求根据最小二乘原理,令残差平方和:
估计参数。
)最小二乘法(随机项相互独立,可用的情况下,由于单个的
,在知道阶数。根据模型的线性形式、、、待估计参数为
θ
θ
θ
0
)

(2
)
(
)]

([?)
(
1
2211
2
2211
11
2
21







it
T
pt
ptpttt
i
ptptt
T
pt
t
T
pt
p
yyyyy
S
yyyyeS
LS
p
t



把观测值写成矩阵形式:

。量:白噪声过程的方差估计
。)(一致估计量为:
。其中的方差协方差矩阵为:服从正态分布。为一致估计量,且渐进
)(
量:。参数的最小二乘估计即:
pT
T
yyE
e
e
e
yyy
yyy
yyy
y
y
y
pppppp
e
ppe
kttk
ppp
p
p
e
p
ppppp
ppp
Tp
p
p
p
pTtT
pp
pp
p
p
p
2
)()'(
/'?
)(,
''
1
0321
2101
1210
1
2
1
21
21
21
11
1
2
1




θxyθxy
xxΩ
Ω
θ
yxxxθ
eθxy
θ
θ






2,AR( p)模型的阶数 p的确定对于给定的一组时间序列数据,识别 AR过程阶数的一种方法,是估计递增阶 k,并检验 k阶 AR过程中第 k个系数 θ k的显著性。这个系数称为第 k个偏自相关系数 ( partial autocorrelation coefficient),记为 θ kk。偏自项关系数计量了不能由 AR(k-1)解释的 yt和 yt-k之间的相关程度。
偏自相关序列 θ kk( k=1,2,… )称为 偏自相关函数 ( partial auto-
correlation function)。
该区间内即可。),看估计值是否落在(
置信区间:可以建立为样本容量),因此,的正态分布(方差为值为零,的情况下,近似服从均在,则估计量的偏自相关阶数为的实际果。对于大样本来说,如统计量进行显著性检验可以计算
)。(假定样本均值为中最后一个下标对应的)(为估计值的估计量分布。对应的的显著性,需要知道为了检验
,时,,当时,当
,使实际上就是选择适当的确定阶数
TT
TT
pkp
ARt
pkpk
kkkk
kk
kkkkkk
kkkkkk
kkkk
2
,
2
%95/1
0''
00
kp,
1





yxxxθ
五,MA 模型的估计
1、阶的确定
MA过程的自相关函数为:
)(,2,1,))((
1
,,
0,
1,0
0
0
21
0
0
22
0
2
0
较小相对于其中,
的一个常用的估计量是,对于时间序列性检验。
估计值,再进行显著数据计算自相关系数的否为零,可以用得到的是定一个特定的的下标相对应。为了确的阶与非零的因此,
时当
。其中时,当
TNNkyyyy
T
c
c
c
r
yyy
MA
qk
qk
T
i
kttk
k
k
kT
kk
k
q
i
i
kq
i
kii
k
k
e
e






。)中,则拒绝,不落在区间(若置信水平,的正态分布。如果设定近似服从零均值方差为情况下,关的显著性。在大样本的显著性,以检验自相检验
0
22
0
%95/1
1
1


kkk
k
k
T
t
t
T
r
T
r
Tr
r
y
T
y
2、参数估计可采用最大似然法估计参数。若 MA(q)的样本均值为零,et服从正态分布,则可构造似然函数:
估计量。的的最大化,求解出通过的方差协方差矩阵。为为参数项量,其中
MLl
l
e
y
y
e
e
e
y



)|,(
e x p|)(|
)2(
1
)|,(
2
)
2
'
(
2/1
2
2
2
1
y

Ωy
yΩy
六,ARIMA 模型
1,ARMA与 ARIMA
ARMA(p,q)的阶的确定,仍可使用自相关和偏自相关函数。如果自相关函数小时很慢,则该过程可能是不平稳的。
对 yt进行差分,如果差分后的序列是平稳的,则称 yt为 自回归单整移动平均过程 ( autoregressive integrated moving-average process),用
ARMA(p,1,q)表示。如果 yt须经过 d次差分后转变为平稳过程,则称
ARIMA(p,d,q)。
在确定 p,d,q后,即可对模型进行估计。
2、博克斯 -詹金斯方法 (Box-Jenkins Approach)
时间序列的博克斯 -詹金斯方法是对于给定的彝族数据,寻求一个可适当表示数据生成过程的 ARIMA模型的一种方法。该方法分三个阶段:识别、
估计和诊断校验。
( 1)识别。在估计自相关和偏自相关的基础上,对数据设定一个试验性的
ARIMA模型。
如果自相关函数衰减慢或不消失,说明序列非平稳,需要进行差分,
直至得到一个平稳序列。
对于 MA(q)过程,可用样本的自相关函数找到截止点,确定阶数 q。
对于 AR(p)过程,利用偏自相关函数确定截止点 k和阶数 p。
如果自相关和偏自相关都没有截止点,则可考虑 ARMA模型,并设法确定模型的阶数。
( 2)估计。在确定模型及阶数的基础上,进行参数估计。
( 3)诊断校验。主要方法有:
i)进行残差分析,检验残差是否为白噪声。可利用残差的散点图,以及估计残差自相关进行检验。
检验残差的自相关可使用 Q统计量进行:
分布。)的近似于自由度为(的阶,如果正确设定了为滞后长度。为样本容量,其中
2
1
2
,
)2(
qpkQA R M A
mn
kT
TTQ
m
k
k


ii)过度拟合已设定的模型。如果以识别和估计 ARMA( p,q),则再估计
ARMA(p+1,q)和 ARMA(p,q+1),并检验而外参数的显著性。