时间序列分析简介
1,1 基本概念时间序列所研究的是时间上的相关结构。它的应用广泛,从海洋学到金融学都是它的应用范围。著名的 CAPM 模型(资本资产定价模型)和随机波动模型就是含有时间序列成份的金融模型的例子。当我们考虑一时间序列时,我们通常考虑一个数值的集合
,1,,tX t n?
,其中下标 t 表示数据
t
X
被观测到的时间。虽然直观上很清楚,我们还是来详细描述一下
t
X
的一系列非标准特性。
非等距数据 ( 缺损数据 ) 。例如,若时间序列是某一证券的日收益率,则在节假日等非交易日里就没有数据可得了。
连续时间序列 。在许多物理现象中,令人感兴趣的基本物理量往往是由连续演变的机制所控制的,因而观测到的数据就应该用连续时间序列 X ( t ) 来建模。在金融领域,我们可以把滴嗒一声记录一下所得数据看成是对市场连续演变的一种良好逼近。
总计性 。 观测到的序列可以表示一段时间上基本数量的累加。例如,日收益可看成是同一天内滴嗒一声记录一下的收益的总和。
重复观测的序列。 这数据还可以表示同一个量在不同的观测对象上重复测量的结果。例如,我们可以监察在某一期间内某一超市连锁店的一群顾客中的每一个人的每周总消费额。
多元时间序列 。此时
t
X
不是一维纯量,而是一个向量,其每一个分量都各自代表一个时间序列。例如,一个由 p 支股票构成的投资组合其收益率可表示为
1
(,,)
t t pt
XXX
,其中每一个
,1,,,
it
X i p?
各代表此投资组合中一支股票的收益率。在此情形,我们不仅对每一支股票内的序相关结构感兴趣,
而且也对不同股票间的横向相关结构感兴趣。
非线性性,非平稳性和异方差性 。实践中遇到的许多时间序列可能具有非线 性行为。有时对它们进行变换是有帮助的,但我们常常不得不去建立复杂费神的 模型以说明这种非标准的特性。例如,股票收益率的非对称行为推动了对
G A R C H 模型的研究。
虽然这些特性是重要的,但本书主要讨论标准的纯量时间序列。只有对分析 等距纯量时间序列的技术和困难之处有透彻的理解后,我们才能够处理非标准特 性的一些问题。
在经典统计中,我们通常假定
X
是独立的。在时间序列领域,
X
通常是序相 关的。时间序列分析的目的之一就是利用这种序相关结构去帮助我们建立更好的 模型。下面的例子在置信区间估计方面说明了这一点。
例 1.1 设
t
X
是由以下模型产生的,
1
,~N ( 0,1 ) i,i,d,
t t t t
X a a a

显然,
E ( )
t
X

2
v a r 1
t
X
。因此,
c o v (,) E ( ) ( )
t t k t t k
X X X X


11
E ( ) ( )
t t t k t k
a a a a


2
,1,
1,0,
0,
k
k


否 则,

1
()
n
tt
X X n

。由公式
1
22
1 1 1 1
1 1 2
v a r ( ) v a r ( ) c ov (,),
n n n t
t t t j
t t t j
X X X X
n n n


容易看出
2
v a r
X
X
2
22
12
( 1 ) ( 1 )nn
nn

2
2
12
( 1 2 )
12
( 1 )
nn
nn






因此,
2
~ N (,)
X
X
。于是
的约 9 5 % 的置信区间 ( C I ) 是

12
222
21
X
XX
nn







0
,这 CI 就成为
2
,X
n
此与独立同分布 ( i,i,d,) 情形重合。
0

0
时置信区间之间的差异可表白示为

12
2 2
1L
n






表 1.1
50n?
时置信区间的长度
L?
- 1

12
2
1 4 2
50
L




- 0,5 1,3 4
0 1
0,5 0,45
1 0,1 4
表 1,1 列出了
50n?
时此差异的数值。例如,若
1
而假如我们使用
0
时的置信区间来代替
1
时的置信区间,那么这错误地建立起来的置信区间比其应有的长度长得多。在本例这种情形,模型给出的时序相关结构帮助产生了更好的推断。
例 1.2 作为第二个例子,我们来考虑 K a o 和 S h u m a k e r ( 1 9 9 9 ) 讨论过的股票类型适时调配模型。在他们的文章里,作者试图用几个基本量去解释价值型股票与增长型股票间的利差。其中,最令人感兴趣的变量是在他们的文章里图 4 所报告的收益率差。这个变量解释了几乎 3 0 % 的价值型股票与增长型股票间的利差的变差并暗示收益率差很可能是富含信息的回归子。这个数据集的进一步描述请看他们的文章。我们这里重复这个特别的分析并把观测的时间顺序这个因素考虑进去。
现在,我们把注意力集中在重复制作 K a o 和 S h u m a k e r ( 1 9 9 9 ) 的 图 4 上。其图形如下,
正如从 图 1.1所见到的,散点图可分离成两块云状的部分,
一部分属于前两年的数据,另一部分属于接下来年份的数据。当把时间因素考虑进去时,我们发现似乎完全由位于 图 1.1右下角的 79年至 80年间的数据决定。
相应地,来自收益率差的如此高的解释力总的来看则似乎是不正确的。这个例子表明当时间因素没有恰当地考虑进去时,重要的信息就可能失去。
2 0.3R?
1.2 简单的描述性技术一般地说,时间序列可分解为宏观与微观两部分。宏观部分通常可由趋势和季节性来描述,而微观 部分则需要更复杂的方法去描述它。在本节,
我们通过一些简单的描述性技术来处理宏观部分,而把微观部分的研究推迟到后面几章。一般地,设时间序列
tX
分解成了时间趋势部分
t
T
,季节部分
t
S
和由噪音给出的微观部分
t
N
。正式地,
t t t t
X T S N
tt
N
( 1,1 )
1.2.1 趋势假定时间序列的季节部分不存在,那么我们有一个简单时间趋势结构,因而
t
T
可以表示为
t
的参数函数,例如,
t
Tt
。于是
t
T
可以通过好几种简单的方法识别出来。
最小二乘法 。使用最小二乘法 ( L S ),我们可以容易地把
t
T
估计出来 ( 即找出使得
2
()
tt
XT
最小化的

) 。虽然本方法方便,但它却有几点不足之处,
1,我们需要假设对于数据集的整个时间跨度而言有一个固定的趋势,这点一般是不正确的。事实上,趋势也可能跟随着时间一直在变动,因而我们需要一个适应性方法去适应这种变化。一个直接的例子就是一支选定的股票的每日股价。对于一个固定的时间跨度,这些股价可以相当令人满意地通过一个线性趋势来建 模。然而,人人都知道这固定的趋势对于长期而言将给出灾难性的预测。
2,为使 LS 法有效,我们只能处理
t
T
的简单的受限制的形式。
滤波法 。除了使用 LS 法外,为了估计趋势,我们还可以过滤或平滑这序列。这就是说使用一个平滑子或移动平均滤子使的
S m ( )
s
t t r t r
rq
Y X a X


我们可以把输出
t
Y
和输入
t
X
之间的关系表示为
f i l t e r S m ( )
t t t
X X Y
滤子的权数

r
a
通常假设为对称和标准化的 ( 即
rr
aa

1
r
a
) 。一个显然的例子是下式给出的简单移动平均滤子
1
21
q
t t r
rq
YX
q

此滤子的长度由数
q
决定。当
1q?
时,我们得到一个简单三项移动平均。
当然,每项的权数不一定要相同。
早期的异权数的一个例子是 S p e n c e r 的 15 - 项 滤子,它由英国精算学家 S p e n c e r 于 1 9 0 4 年引入。
其想法是利用这 15 - 项滤子去逼近使立方 ( 三次 ) 趋势通过的滤子。确切的说,定义权数
ra
如下,
rr
aa
0,
r
a?
7,r?

0 1 7
1
,,,7 4,6 7,4 6,2 1,3,5,6,3
320
a a a

容易证明 S p e n c e r 的 15 - 项 滤子 不会扭曲立方趋势。这就是说,
对于
32
,
t
T a t b t ct d
77
77
S m ( )
t r t r r t r
rr
X a T a N




7
7
r t r
r
aT

t
T? 。
一般地,可以证明当且仅当权数

r
a
满足如下描述的两个条件时,带有权数

r
a
的线性滤子过滤
t

k
次多项式
0
k
i
i
i
ct
时不会扭曲此多项式。
命题 1.1 当且仅当 1
s
r
rs
a


0
s
j
r
rs
ra

对 1,,jk? 都成立时,
对所有的
k
次多项式
01
k
tk
T c c t c t
,有
t r t r
r
T a T

利用这个结果,就可以直接验证 S p e n c e r 的 15 - 项滤子使三次多项式过滤而没有扭曲此多项式。现在让我们用线性趋势这一简单情形来说明关于滤子是怎样起作用的主要思想,这里
,
t t t
X T N
t
Tt

考虑将一个
21q
项的移动平均滤子 ( 平滑子 ) 施加于
t
X
,

1
0
21
q
tr
rq
N
q

,则
1
S m ( )
21
q
t t t r
rq
Y X X
q



1
21
q
tr
rq
t r N
q




t

换言之,如我们用
t
Y
去估计趋势,则其效果会相当好。我们启用记号
S m ( )
t t t
Y X T

R e s ( ) S m ( )
t t t t t t
X X T X X N
。在这种情形下,我们有所谓的低通滤子 [ 即一个滤子,其使低频部分 ( 平滑部分 ) 通过而将高频部分
t
N
滤掉 ] 。相反地,我们也可以构建一个将趋势滤掉的高通滤 子 。 低通滤子的一个不足之处是我们只能利用中间那部分数据。假如要利用两端的数据,我们不 得不相应地修改这滤子。例如,考虑如下滤子
0
S m ( ) ( 1 )
j
t t j
j
XX

,其中,
01
。此滤子被称为指数平滑技术,在许多经验研究中扮演着一个重要的角色。经验显示
应在 0,1 和 0,3 之间选取。
对一个明确的趋势寻找最佳滤子一度曾经是时间序列的重要课题。
差分法 。前述方法旨在于用一个平滑子
t
T
去估计趋势。在许多实际应用中,趋势可能事先就已知,因此估计它就不那么重要了。相反,也许我们感兴趣的是去剔除它的效应和专注于分析序列的微观部分。
此时,更让人想做的是剔除或削除趋势的效应。通过分析残差
Re s ( ) Sm ( )
t t t
X X X
,我们可以做到这点。然而,一个更方便的方法是直接从序列中削除趋势。此时,最简单的方法就是 差分法 。设
B
是后移算子,使得
1tt
BX X
。定义
1
( 1 )
t t t t
X B X X X

( 1 )
jj
tt
X B X
,j = 1,2,… 。
假如
,
t t t
X T N

0
p
j
tj j
T a t

,那么
!
jj
t j t
X j a N
,因而
t
T
便被剔除了。所以,差分 是高通 滤子 的一种形式,它将低频信号即趋势
t
T
滤掉而让高频部分
t
N
通过。从原理上讲,只要将序列 差分 足够多次,我们就可以剔除任何多项式趋势。然而,本法在实践上也有一处缺点,每 差分序列一次,我们就失掉一个数据点。因此,若将数据 差分 太多次,那就不明智了。
局部曲线拟合法 。假如趋势来得更加复杂,为了得到好的估计,简单移动平均可能行不通,这时,就可能需要用到局部曲线平滑技术了。
一些常用的方法包括样条曲线拟合和非参数回归等。感兴趣的读者可以在 有关 的书中找到关于样条平滑技术的讨论。
1,2,2 季节循环当季节部分
t
S
存在于方程 ( 1,1 ) 中时,1,2,1 节所述方法得进行修改以适应这种季节性。粗略地说,季节部分按以下形式分为两种情况 ( 要么是可加的要么是可乘的 ),
,
,
t t t
t
t t t
T S N
X
T S N


可 加 情 形可 乘 情 形再次依目标而定,我们不是用某种季节平滑子去估计季节部分,就是用差分运算把它从数据中剔除。现假设季节部分具有周期
d
( 即,
,
t d t
SS
1
0
d
jj
S

) 。
(A) 移动平均法。 我们首先用一个移动平均滤子去估计趋势部分,做法是让滤子走过一个完整的循环以便把季节性效应平均掉。根据周期
d
是奇数 还是偶数,我们实施以下步骤,
1,如果
2,dq?

11
1 1 1
22
t t q t q t q t q
T X X X X
d





,其中
1,,t q n q
2,如果
2 1,dq
则令
1
q
t t r
rq
TX
d


,其中
1,,t q n q
在估计出
t
T
后,把它从数据中过滤掉,进而从剩余的
tt
XT?
中去估计季节部分。为此,有几种方法可以利用,其中最普通的是移动平均法。关于此法的进一步讨论和说明,感兴趣的读者可参考 B r o c k w e l l
和 D a v i s ( 1 9 9 1 ) 的书。我们将在 1,4 节通过一个例子来说明该方法。
(B) 季节差分法。 另一方面,我们可以应用季节差分法去削除季节效应。考虑对数据的
d
次差分
t t dXX
,此差分削除方程
( 1,1 ) 中
tS
的效应。既然我们会失掉数据点,我们再一次不得不对数据的季节差分小心谨慎。
1.3 变换假如数据表现出方差随时间而增长的趋势,在分析它们之前,我们可能需要将数据做变换。此时,我们可以运用 B o x - C o x 变换。然而,
经验显示对数变换是最常用的变换。其它变换问题更多,会导致预测和结果解释方面的严重困难。
1.4 例子在本节,我们 要说明利用 描述性技术 去分析时间序列的思路。 图 1.2 显示了华盛顿水电公司 1 9 8 0 至 1 9 8 6 年 每 季 度营业 收入 的时间序列图。该 公司是电力和天然气方面的 公用事业公司,服务于东华 盛顿和北 爱达荷 。 我们从描绘此数据图开始我们的讨论。 通过查看此图,我们可以得到几个结论,
● 正如从图中所见到的,存在一个轻微的上升趋势。约在 1 9 8 5 至 1 9 8 6
年,此趋势似乎在下降。
● 存在一个相当清晰的 年 度 ( 1 2 个月 ) 周期。 第三 季 度 ( 七到九月 ) 的 收入几乎总是最低的,而在第一 季 度 ( 一到三月 ) 则是最高的。也许美国的这个地区在夏季 ( 比如说空调 ) 对电力的需求不是很大 ( 因而 收入 不多 ),
而冬季很冷,对天然气和电热有大量需求。
图 1.3是每年营业收入的框图。其中位数开始似乎年年都在上升,第三年后则回落。当中位数增长时,四分位数间的范围 (IQR)变大;当中位数回落时,四分位数间的范围则变小。反之亦然。大多数的框图是对称的或只有很轻微的正偏。此外,没有异常值。
在 图 1.3中,我们可以画出一条光滑的曲线,把每年季度营业收入的中位数连接起来。我们已经描述了关于中位数的较长时间的循环问题。这个循环模式在七年间重复了一次。这种较长时期的循环在原时间序列图 (图 1.2)中是很难看出来的。
为了评估季节性,我们实施移动平均法的如下步骤,
1,通过一个序列完整的循环去估计趋势,这里
2 8,n? 4,d? 2q?
,并且形成了
,
tt
XT? 3,,2 6t?
。在以下 程序中,
t
T
被表示为
w a s h s e a,m a 。
2,在数据的整个跨度上,计算差
ttXT?
的均值。然后通过计算减去这些均值所得之值,估计出季节部分
,1,,4
i
Si?
。最后,对于
1,,4,i?
4
,1,,6
i j i
S S j

。在以下 程序中,估计出的 季节部分
i
S
被记为 w as h,s ea,剔除了 季节部分的数据
tt
XS?
则记为
w as h,n o s ea 。
3,第三步是关于利用去季节化后的数据 w as h,n o s ea 来重新估计趋 势的。我们可以运用一个滤子或任何方便的方法将趋势
tT
重新 估计出来,而在以下 程序中,将其记为 w a s h,m a 2 。
4,最后,为了探测进一步的结构,检查残差

t t tX T S
。 在 程序中,将其记为 w a s h,r e s 。
图 1,4 给出了该时间序列图,它包括原始数据、去季节化后的数据以及季节性部分。假如需要,我们也可以画出残差 w a s h,re s 以 探测进一步的结构。但现在相当清楚,本例的大部分结构已经被识别出来了。
1.5 小结在本章中,我们学习了好几个描述性方法 以识别一个时间序列的宏观成分 ( 趋势和季节性 ) 。 在大部分时间里,这些成分可以容易地被识别和解释,因而没有理由用不必要的复杂模型去拟合它们。从现在开始,我们假定 这个 初步的 数据分析步骤已经完成并且为了了解微观结构,我们把注意力集中于分析残差部分
tN
。 为了完成这个目标,我们需要建立更复 杂的模型。