第5讲 非平稳随机过程
从本章起介绍计量经济学近20年来最新研究成果。如果把第1章内容称为经典计量经济学,那么将要介绍的内容则应该称为非经典计量经济学。
从1974年开始计量经济学工作者渐渐意识到当用含有单位根的时间序列建立经典计量经济模型时会出现一些问题,这就是虚假回归。
应该知道通过经济数据了解经济变量的变化规律有时是存在相当大的局限性的,所以在建立模型时,必须依靠经济理论,同时对参数进行假设检验。实际上,只有经济理论是不够的。比如处于调整中的经济变量,哪些是它的外生变量,哪些是它的无关变量,单凭经济理论就很难判别清楚。所以当研究经济变量参数变化规律时,常常采用另外一种方法,即依靠统计理论的方法,通过设计具有某种特征的能生成数据的随机过程或数据生成系统研究经济问题。下面常常用到数据生成系统这个概念。
3.1 单积性单积(整):若一个随机过程 {xt} 必须经过d次差分之后才能变换成一个平稳的可逆的ARMA过程,则称 {xt} 是d次单积(单整)过程。用xt ( I(d) 表示。
对于平稳过程表示为I(0)。注意:单积过程是指单积次数大于零的过程。
对于I(d) 过程xt
((L) (1- L) d xt = ((L) ut
因为含有d个单位根,所以常把时间序列单积次数的检验称为单位根检验(unit root test)。
若xt ( I(d),yt ( I(c),则
zt = (a xt + b yt) ( I (max[d,c]).
( zt = ( (a xt + b yt) = (a xt + b yt) - (a xt -1 + b yt - 1) = (a ( xt + b ( yt)
当 c > d 时,zt只有差分c次才能平稳。
一般来说,若xt ( I (c),yt ( I (c),则
zt = (a xt + b yt) ( I (c)
但也有zt的单积次数小于c的情形。当zt的单积次数小于c时,则称xt与yt存在协积(整)关系。
3.2单积过程的统计特征
以随机游走过程和平稳的AR(1)过程作比较,对于随机游走过程
xt = xt-1 + ut,x0 = 0,ut ( IN (0,(u2) (3.7)
有 xt = xt-2 + ut-1 + ut = … =  (具有永久记忆性)
Var(xt) = = t(u2 (随T的增加,方差变为无穷大)
下面求xT 和 xT - k的(相隔k期的)相关系数(k 。
Cov(xT,xT-k) = E(xT xT-k) = E() = E() = (T - k) (u2
(k = = = = 
只有当样本容量趋于无穷时,相关系数才等于1。有限样本条件下,特别是小样本条件下,随着滞后期k的增加,相关系数有所衰减。这正是在第2章求序列的自相关函数时看到的结果。
对于AR(1) 过程yt = (1 yt-1 + vt,( (1( < 1,y0 = 0,vt ( IN(0,(v2) 有 (3.8)
yt = vt + (1vt-1 + (12 yt-2 = … =  (yt只有有限记忆力)
Var(yt) = E()2 = (v2 (方差为有限值)
AR(1) 过程的自相关系数公式,(k =(1k,(推导见上一章)。
表3.1 随机游走过程和平稳的一阶自回归过程统计特征比较
随机游走过程
平稳的一阶自回归过程
方差
t(u2 (无限的)
(u2/(1-(12) (有限的)
自相关系数
(k =( 1,( k,T( (
(k =(1k
穿越零均值点的期望时间
无限的
有限的
记忆性
永久的
暂时的

T = 50、100、500条件下随机游走过程对应的自相关函数图(rho1000=(1-(@trend(0)/1000))^.5)
sigma=1/(1-(@trend(0)/20)^2)

AR(1)过程自相关系数(1与方差的关系
3.3 虚假回归
⑴ 用蒙特卡罗模拟方法分析相关系数的分布。
ut ( IN(0,1),ut ( I (0)
vt ( IN(0,1),vt ( I (0)
每次生成T=100的相互独立的{ut}和{vt},并计算Ruv。重复1万次,从而得到Ruv的分布。
xt = xt-1 + ut,x0 = 0,xt ( I (1)
yt = yt-1 + vt,y0 = 0,yt ( I (1)
利用{ut}和{vt},每次生成T=100的{xt}和{yt}并计算Rxy。重复1万次,从而得到Rxy的分布。
pt = pt-1 + xt,p0 = 0,pt ( I (2)
qt = qt-1 + yt,q0 = 0,qt ( I (2)
利用{xt}和{yt},每次生成T=100的{pt}和{qt}并计算Rpq。重复1万次,从而得到Rpq的分布。
1,两个相互独立的I(0)变量{ut}和{vt}的相关系数Ruv的分布为正态(见图3.1a)。
2,两个相互独立的I(1)变量{xt}和{yt}的相关系数Rxy的分布为倒U形(见图3.1b)。
3,两个相互独立的I(2)变量{pt}和{qt}的相关系数Rpq的分布为U形(见图3.1c)。

(file:5simu-r-1-2-,5simu5)


(file:5simu5)
 
图3.1a 图3.1b 图3.1c
问题的严重性在于当变量非平稳时,认为R服从的是正态分布,但实际上R服从的却是图3.1b和图3.1c那样的倒U和U字型分布,因此增加了拒绝概率,本不相关的两个变量结论却是相关!
 
图3.1三条曲线叠加示意图 图3.2 t(98)分布和虚假回归条件下的t分布
⑵ t统计量的分布有如下数据生成系统
xt = xt-1 + ut,x0 = 0,ut ( IID(0,1)
yt = yt-1 + vt,y0 = 0,vt ( IID (0,1)
E(ui vj) = 0,( i,j
可知xt和yt为I(1)变量且相互独立。作如下回归
yt = (0 + (1xt + wt,
t()的分布见图3.2。拒绝(1 = 0的概率大大增加。从而造成虚假回归(Granger 1974年提出)。
⑶ 简单回归中(1 = 0的拒绝概率与变量单积阶数的关系
两变量的单积阶数
P(t()>2)
I(0) 与I(0)
0.045
I(1) 与I(1)
0.77
I(2) 与I(2)
0.95
⑷ 样本容量与虚假回归的关系(回归变量均为I(1)变量)
随样本容量变化,拒绝 (1 = 0的概率,即P(t() > 2 ) 见图3.3。

图3.3
3.4 维纳过程、数量级概念、单积过程的极限分布维纳过程可看作是一个在 [0,1] 区间内连续的随机游走过程。
标准维纳过程:对于任意一个连续的随机过程V(i ),i ( 0,i ( [0,1],如果满足以下四个条件。
(1)P{V(0) = 0} = 1。
(2)对于每个i ( 0,有E[V(i)] = 0。
(3)对于每个i ( 0,V(i) 都是正态分布的并且是非退化的。
(4)V(i) 具有独立的增量。[V(i)- V(j)] ( N(0,i-j)
则称V(i )为标准布朗运动(Brownian motion)或标准Wiener过程,用W(i) 或B(i)表示。Norbert Wiener (1894-1964) 是研究随机过程的美国科学家,第二次世界大战时专门研究鱼雷击中潜艇的问题。Wiener过程是以他的名字命名的。
其他时间连续的过程可以由标准的维纳过程生成。比如,
Z(i) = ( W(i)
Z(i)有独立的增量,且在整个区间服从N(0,(2 t )分布。Z(i)称为方差为(2的维纳过程。因此,标准的维纳过程也称作方差为1的维纳过程。
例如,Z(i) = [ W(i)]2,其在整个区间服从i乘以一个(2变量的分布。
尽管W(i)是关于i连续的,但不能运用标准的微积分求导,原因是无论使用多么小的(,W(i)在时间i的变化方向与在i+(的变化方向完全不同。
函数中心极限定理:如果随即变量ut ( IID(0,(2),根据中心极限定理有

定义分段函数XT(r),r([0,1],

根据中心极限定理,XT(r)作为一个随机函数值渐近服从正态分布。

而随机函数序列渐近服从标准维纳过程。
 (3.20)
注意:XT(·)表示随机函数,XT(r)表示r期的随机函数值,所以XT(·)是一个函数,XT(r) 是一个随机变量。
连续映射定理:若f(() 是泛函空间D[0,1] 中的一个连续函数,则由(3.20)有以下结论,当T → ∞ 时,
f (VT (i) ) ( f ( W(i) ),(3.21)
概率测度的数量级(阶数)和收敛速度先讨论实数列的数量级(阶数)和收敛速度。
设 {aT}是一个实数列,{T( }是一个正实数列,则有如下定义。
1.如果 = 0,则称aT是T(的低阶数量级。记作aT = o(T()。
2.如果存在实数M,且对于所有的T有 ,则称aT的数量级不超过T(,或aT的最大数量级是T(,记作aT = O(T()。或者说aT的收敛速度是T(。
例,对于实数列
= (1 + 2 + 3 + 4 … + T ) = T (T + 1)
当T→∞时,因为,所以是O(T 2)的,或者说的收敛速度是T2。同理
= (1/6)T (T +1) (2T +1) 是O(T 3)的。
= [T (T +1)] 2 是O(T 4) 的。
对于数列{},因为当T→∞时,,所以是O(T -1)的。
对于随机变量序列,数量级应是概率测度的数量级。
概率极限定义:若对于任何( > 0,有p{ ( xT - x ( > ( } = 0,则称 {xT} 依概率收敛于随机变量x,或xT的概率极限是x。记作xT = x。
设是一个随机变量序列,{T(}定义如上。则有如下定义。
1.如果,则称是T(的概率测度低阶数量级。记作xT是op(T()的。
2.若对于任何( >0,存在一个正实数M,使(即是有界的),则称的概率测度最大数量级不超过T(,记作是Op(T()的。或者说aT的收敛速度是T(。
在计量经济学理论中,以OLS估计量为例,当变量具有平稳性,则{- ( } = Op(T -1/2),即T以速度收敛于(。若变量具有非平稳性,则以更快的速度依概率收敛于(。
对于残差平方和,因为当T→∞ 时,有界(表示方差),所以是Op(T ) 的。
当T(退化为1时,数量级表示为op(1)或Op(1)。

Op(T -1/2)、Op(T -1)、Op(T -3/2)数量级统计量随样本容量T增大分别以速度T-1/2、T-1、T-3/2收敛的路径
一般渐近理论与适用于非平稳过程的上述渐近理论的区别是对于前者样本矩收敛于一个常数,而对于后者标准化的样本矩收敛于一个随机变量。在推导非平稳随机过程的样本统计量的极限分布过程中泛函中心极限定理代替了传统的中心极限定理。
有随机游走过程xT = xT-1 + uT,x0 = 0,ut ( IN(0,1),则可证明(略),当T ( (,
T - 3 / 2 (  (3.23)
T -2(  (3.24)
3.5 虚假回归统计量的极限分布和有限分布
给出如下数据生成系统
yt = yt-1 + ut,y0 = 0,ut ( IID (0,(u2)
xt = xt-1 + vt,x0 = 0,vt ( IID (0,(v2)
E(ui vj) = 0,( i,j
xt和yt是相互独立的。对于以下回归
yt =+xt +,
求,,t(),R2,DW的极限分布。当T ( (,
T - 3 / 2 ( (v
T -3/2( (u,
T -2 ( (u 2
T -2( (v 2
T -2( (u2 []2 di - (di )2 ],
T -2( (v2 []2 di - (di )2 ]
T -2( (u (v Wv (i) di,
当T ( (,,,t(),R2,DW的极限分布见下式。给定条件ut,vt (IN (0,1),T = 50,100,模拟10000次得,,t(),R2,DW的分布模拟结果如下图。
⑴ T -1/2服从Wiener过程函数的分布。当T(∞时,有
T -1/2( (u [- ( ]
是Op(T 1/2)的。随着T的增大,的分布发散。

(p130,(3.54) )。T=50,100的模拟结果
⑵服从Wiener过程函数的分布。当T (∞时,得
 (
因为表达式分子中两个Wiener过程相互独立,所以其最大可能取值为零。是Op(1)的。

(p129,(3.51) )。T=50,100的模拟结果
⑶ T -1/2 t() 的极限分布存在。当T ( ∞ 时,
T -1/2 t() ( [-]
( { [- ()2 ] - [-]2 }1 / 2
t()是Op(T 1/2)的。t() 的分布发散。

(p131,(3.58) )。T=50,100的模拟结果
⑷ R2有非退化的极限分布(不收敛于零)。当T ( ∞ 时,
R 2( 

(p132,(3.59) )。T=50,100的模拟结果
⑸ DW统计量依概率收敛于零。当T ( ∞ 时,
DW = T-1= T-1 ( 0

(p132,(3.60) )。T=50,100的模拟结果