相关系数 — 度量两个变量 线性相关 程度的指标
? 对于所研究问题的总体而言,
? 总体相关系数用 ?表示,计算公式为
标准差的乘积
协方差
相关系数=
),c o v (
)V a r ()V a r (
),c o v (
,
yx
yx ??
?
yxyx
yx
??
△ 线性相关图示
200
400
600
800
1000
1200
0 500 1000 1500 2000 2500
Y
X
20
30
40
50
60
70
80
0 10 20 30 40
Y
X
相关系数与协方差含义的理解
? 协方差大于 0—— 相关系数 ?大于 0— 正相

? 协方差小于 0—— 相关系数 ?小于 0— 负相

? 协方差等于 0—— 相关系数 ?等于 0— 不相

一元线性回归模型的基本假设
( 1)随机误差项均值为 0 E(?i)=0 ;
( 2)随机误差项同方差 Var (?i)=??2;
( 3) 随机误差项无序列相关
COV(?i,? j) =E(?i?j)=0 ( i ≠ j)
( 4) x是确定性的,非随机变量 Cov(xi,?i)=0;
( 5)随机误差项服从正态分布 ?i~N(0,??2 )
i,j=,2,…,n; i≠j
多元线性回归模型的基本假设
( 1)随机误差项均值为 0 E(?i)=0 ;
( 2)随机误差项同方差 Var (?i)=??2;
( 3)随机误差项无序列相关
COV(?i,?j) =E(?i?j)=0 ( i ≠ j)
( 4) x是确定性的,非随机变量 Cov(x ji,?i)=0;
( 5)随机误差项服从正态分布 ?i~N(0,??2 )
(6) 解释变量之间互不相关
i,j=,2,…,n; i≠j
如果模型的随机误差项违背了 序列不相关
的基本假设的情况,称为 序列相关性 。
普通最小二乘法( OLS)要求计量模型
的随机误差项 相互独立 或 序列不相关 。
问题的提出
§ 2.7 序列相关性
Serial Correlation
一,序列相关性的概念 —— 违反基本假设的定义
及违反的原因
二、序列相关性的后果 —— 违反基本假设会造成
什么样的后果
三、序列相关性的检验 —— 怎样诊断是否违反基
本假设
四、具有序列相关性模型的估计 —— 如何消除或
减弱对基本假设的违反
五、案例
探求四个问题的答案
? 序列相关的性质是什么?
? 序列相关的后果是什么?
? 在实际中,如何检验序列相关的存在?
? 如果发现存在序列相关,如何采取补救
措施?
关于序列相关的一点说明
? 假定模型满足其它所有假设,仅仅违背
无序列相关假设的条件下,讨论序列相
关问题。
一、序列相关性的概念
1、序列相关的概念
如果对于不同的样本点,随机误差项之间不再是
不相关的,而是存在某种相关性,则认为出现了 序
列相关性,又称为自相关性 。
对于模型
ikikiii xxxy ?bbbb ?????? L22110 i=1,2,…,n
随机误差项互不相关的基本假设表现为:
COV(?i,? j) =E(?i? j)=0 i ≠ j,i,j=1,2,…,n

? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
n
T
ENNE ??
?
?
L?
1
1
)(
?
?
?
?
?
?
?
?
?
?
?
2
1
1
2
1
nn
n
E
???
???
L
???
L
?
?
?
?
?
?
?
?
?
?
?
)()(
)()(
2
1
1
2
1
nn
n
EE
EE
???
???
L
???
L
?
?
?
?
?
?
?
?
?
?
?
2
1
1
2
1
)(
)(
nn
n
E
E
???
???
L
???
L
?
?
?
?
?
?
?
?
?
?
?
2
1
1
2
)(
)(
???
???
L
???
L
n
n
E
E
Ω
2
??
I
2
??
( 2, 5, 1 )
在其他假设仍成立的条件下,序列相关 即意味着
0)( ?jiE ?? ( i ≠ j)
称为 一阶序列相关, 。 这是最常见的一种序
列相关问题 。
一阶序列相关中 最简单的形式为:
(?满足模型的 0均值、同方差、无序列相关 )
称为 一阶自回归模式, 记为 AR(1)。
其中,? 被称为 自 协 方 差 系 数 ( coefficient of
autocovariance) 或 一阶自相关系数 ( first-order
coefficient of autocorrelation) 。
如果仅存在
E i i( )??? ?1 0 i=1,2,…,n-1
ii ?i?μ? ?? -1 11 <<- ? i=2,…,n
? 所谓“一阶”是指序列相关只涉及 ?i和它的上
一期值 ?i-1,也就是说,最大间隔是一个时期
(单位)。
? 如果模型是
? 它将是 AR(2)或者说二阶自回归过程
? 注意:除非我们假设随机误差项的生成过程,
否则很难解决序列相关问题。对于序列相关,
在实践中,AR(1)假设证明是非常有用的。
ii ?i?1μ? ? ?2μi-2+? -1 i=3,…,n
随机误差项的一阶自回归图式
i?
0 0 0
i?
i?
1-i? 1-i? 1-i?
?? 无序列相关
?=0
a ??正序列相关
0<?<1
b ?? 负序列相关
-1<?<0
c
2、序列相关产生的原因(实际和理论)
( 1) 惯性 ( 经济行为的惯性 )
大多数经济时间数据都有一个明显的特点, 就是
它的惯性 。
GDP,价格指数, 生产, 就业与失业等时间序列都
呈周期性, 如周期中的复苏阶段, 大多数经济序列均
呈上升势, 序列在每一时刻的值都高于前一时刻的值,
似乎有一种内在的动力驱使这一势头继续下去, 直至
某些情况 ( 如利率或课税的升高 ) 出现才把它拖慢下
来 。
? 例 1,以绝对收入假设为理论假设、以 时间序列数据 作
样本建立居民总消费函数模型:
? Ct= b0+b1It+?t
? 以总收入作为解释变量,以总消费额作为被解释变量,
那么,?为除去总收入之外的影响消费的所有因素之
和。如消费习惯等。如果收入之外的因素发生变化,
显然会通过 ?对当期的消费产生影响。以消费习惯为例,
一个习惯形成后在短期内很难发生巨大改变。即消费
习惯具有惯性。若前一年它对消费产生正的影响,那
么后一年也会是正的影响,于是在不同的样本点(不
同年份)间,?之间存在关联从而出现序列相关性,
而且在这个例子中,?之间表现为 正相关性 。
? 例 2:以 时间序列数据 为样本建立农业生产函
数模型。
? 如果模型的解释变量中不包含气候变量,那么
它对农业产出的影响将反映在 ?中。
? 由于气候的变化往往呈现出好坏相间的趋势,
所谓“大灾之后必有丰年”,在第 t年它对产
出有正的影响,在第 t+1年一般就会产生负的
影响。
? 于是引起 ?之间存在关联,出现序列相关。而
且在此例中,?之间存在 负相关 。
? 由于经济行为的惯性,使得在采用 时间
序列数据 进行计量分析时,往往易出现
序列相关性。
( 2)设定偏误:模型中遗漏了显著的变量
例如, 如果对牛肉需求的正确模型应为
yt=b0+b1x1t+b2x2t+b3x3t+?t
其中,y=牛肉需求量, x1=牛肉价格, x2=消费者
收入, x3=猪肉价格 。
如果模型设定为:
yt= b0+b1x1t+b2x2t+vt
那么该式中的随机误差项实际上是,vt= b3x3t+?t,
于是在猪肉价格影响牛肉消费量的情况下,
这种模型设定的偏误往往导致随机项中有一个
重要的系统性影响因素, 使其呈序列相关性 。
(3)设定偏误:不正确的函数形式
例如,如果边际成本模型应为:
yt= b0+b1xt+b2xt2+?t
其中,y=边际成本, x=产出 。
但建模时设立了如下模型:
yt= b0+b1xt+vt
因此,由于 vt= b2xt2+?t,,包含了产出的平方对随机项
的系统性影响,随机误差项也呈现序列相关性。
(4)蛛网现象
例如, 农产品供给对价格的反映本身存在一个
滞后期:
供给 t= b0+b1价格 t-1+?t
意味着, 农民由于在年度 t的过量生产 ( 使该期价
格下降 ) 很可能导致在年度 t+1时削减产量, 因此
不能期望随机干扰项是随机的, 往往产生一种蛛
网模式 。
(5)数据的, 编造,
例如,季度数据来自月度数据的简单平均,这
种平均的计算减弱了每月数据的波动而引进了数
据中的匀滑性,这种匀滑性本身就能使干扰项中
出现系统性的因素,从而出现序列相关。
还有就是两个时间点之间的“内插”技术往往
导致随机项的序列相关性。
1,经济变量的一个显著特点是大多数都具有惯性,
尤其在 经济时间序列 的分析中,这个特点更加明
显,进而产生了序列相关性。所以在处理 时间序
列数据 时,尤其要注意序列相关问题。
2,而且经济模型中的误差项之间经常 出现序列正相
关 的情况。
3.序列相关的几点性质
3,一阶自回归模式 (模型)是一种在经济分析中非
常重要的序列相关模式。
理由在于:
? 首先这种模式代表了实证分析中大多数误差
项序列相关的形式,因为对于经济行为而言,观
测周期越长,这种惯性影响的严重想就越小。
? 其次由于它的特殊性、简单性和实用性,一般
情况下,在实证分析中不考虑误差项之间存在高
阶相关的情况,主要是处理起来比较麻烦的原因。
主要考虑一阶自回归形式的序列相关问题
二、序列相关性的后果
1、参数估计量非有效
? OLS参数估计量仍具无偏性
? OLS估计量不具有有效性
?在大样本情况下,参数估计量仍然不具有渐近有
效性,这就是说参数估计量不具有一致性
3、变量和方程的显著性检验失去意义
在关于变量的显著性检验中,当存在序列正相
关时,参数的 OLS估计量的方差通常低估了实际
的方差,,导致 t 统计量的值过大,容易造成拒
绝原假设 bj=0的结果,进而使人们产生对模型估
计值过度信赖的假象,检验就失去意义。
和 t 检验一样,F检验也不能使用。
2,根据常用的估计 OLS估计量方差的公式得
到的方差通常是有偏的
3,模型的预测失效
区间预测与参数估计量的方差有关, 在方差有
偏误的情况下, 使得预测估计不准确, 预测精度
降低 。 所以, 当模型出现序列相关性时, 它的预
测功能失效 。
三、序列相关性的检验
1、检验方法的共同思路
?由于序列相关性表现为随机误差项之间存在某种联
系,因此不同的 序列相关性检验方法的基本思路是
相同的:
?检验序列相关性,也就是检验不同的随机误差项之
间是否存在联系(相关性及其相关的“形式”)。
? 一般处理方法,
? 由于真实的 ?i是无法观察的,首先采用普通最
小二乘法估计模型,以求得随机误差项的, 近
似估计量, — 残差:
? 用残差 来表示相应的随机误差项 ?i。
O LS)?(
~
iii yye -?
?通过分析这些 残差之间的相关性,以达到判断随
机误差项是否具有序列相关性的目的。
ie~
i=1,2,…,n
问题:用什么来表示未知的随机误差项?
2、序列相关性的两类基本检验方法
? 在共同的思路指导下,到目前为止发展出了多
种序列相关性的检验方法。共分为两大类:
? 图示法
? 解析法 — 包含 杜宾 -瓦森( Durbin-Watson)检
验法,回归检验法与冯诺曼比检验法等。
? 所有方法中没有任何一种在任何情况下都是最
好的。一般地,在检验过程中需要综合几种方
法来帮助研究者判断序列相关是否存在。
I,图示法
由于残差 ~ei 可以作为 i? 的估计,因此如果 i?
存在序列相关,必然会由残差项 ~ei 反映出来,
因此可利用 ~ei 的变化图形来判断随机项的序
列相关性。
考虑时间序列数据的一阶自回归形式的图示检验
一阶
一阶
时间顺序图 将时刻 t的残差对时刻( t-1)的残差
描点
一阶自相关图形特征
? 一阶正自相关图形表现为:
1,时序图 —— 一段正一段负 (起点段正负均可 )
2,两相邻残差散点图 —— 散点基本上分布在一、
三象限
? 一阶负自相关图形表现为:
1,残差序列图 —— 一正一负的恒常运动 (起点正
负均可 )
2,两相邻残差散点图 —— 散点基本上分布在二、
四象限
单位:万元
年份 出口
Y
国内生产总值
X
年份 出口
Y
国内生产总值
X
1967 4010 2 2 4 1 8 1977 5628 2 9 0 9 1
1968 3711 2 2 3 0 8 1978 5736 2 9 4 5 0
1969 4004 2 3 3 1 9 1979 5946 3 0 7 0 5
1970 4151 2 4 1 8 0 1980 6501 3 2 3 7 2
1971 4569 2 4 8 9 3 1981 6549 3 3 1 5 2
1972 4582 2 5 3 1 0 1982 6705 3 3 7 6 4
1973 4697 2 5 7 9 9 1983 7104 3 4 4 1 1
1974 4753 2 5 8 8 6 1984 7609 3 5 4 2 9
1975 5062 2 6 8 6 8 1985 8100 3 6 2 0 0
1976 5669 2 8 1 3 4
例、某地区商品出口总值与国内生产总值的数据
2、序列相关性检验
( 1)图示法检验
关于图示检验法的两点说明
1,在计量研究中,图形尤其是有关残差的图形是一
个有力的工具。虽然残差不等同于 ?,但对残差作
图检查往往能对 ?中可能存有的序列相关提供一
些线索,
2,图示检验法是一种非严格的检验方法,它只能说明
?可能存在或不存在序列相关, 因此,在进行序列
相关检验时,一般先使用图示法进行初步判断,
然后再使用一些正式的方法作出进一步的判断。
II,解析法
( 1) 回归检验法

~
e
i 为被解释变量,以各种可能的相关量,
诸如以
~
e
i - 1,
~
e
i - 2,
~
e
i
2
等为解释变量,建立各
种方程:
~ ~
e e
i i i
? ?
-
? ?
1 i= 2,?,n
~ ~ ~
e e e
i i i i
? ? ?
- -
? ? ?
1 1 2 2 i= 3,?,n
?
? 具体应用时需要反复试算。
? 回归检验法的优点是:
一旦确定了模型存在序列相关性,也就同时
知道了相关的形式;
它适用于任何类型的序列相关性问题的检验。
对各方程估计并进行显著性检验,如果存在某
一种函数形式,使得方程显著成立,则说明原模
型存在序列相关性。
( 2)杜宾 -瓦森( Durbin-Watson)检验法
? D-W检验是杜宾 ( J.Durbin) 和 瓦森 (G.S,Watson)
于 1951年提出的一种检验序列自相关的方法 (一种假
设检验的方法 )。
? 该方法的假定条件是,
( 1) 解释变量 x非随机;
( 2) 随机误差项 ?i为一阶自回归形式:
?i=??i-1+?i
( 3) 回归模型中不应含有滞后被解释变量作为解
释变量, 即不应出现下列形式:
yi=b0+b1x1i+?bkxki+?yi-1+?i
( 4) 回归模型中含有截距项;
( 5) 没有缺落数据 (样本数据的完整性 )。
? D.W.统计量 (d或 DW统计量 )
D-W检验是一种假设检验的方法
Durbin 和 Watson 假设:
0:0 ??H, 即 i? 不存在一阶自回归;
0:1 ??H, 即 i? 存在一阶自回归
构如下造 统计量,
D W
e e
e
i i
i
n
i
i
n.,
(~ ~ )
~
?
- -
?
?
?
?
1
2
2
2
1
(2.7.1)
相邻残差之差的平方和
残差平方和 (注意取值范围 )
根据 D.W.值与临界值的关系判断模型的自相关状态
证明,展开 D.W.统计量:
D W
e e e e
e
i i i i
i
n
i
n
i
n
i
i
n.,
~ ~ ~ ~
~
?
? -- -
???
?
???
?
2
1
2
1
222
2
1
2
(2.7.2)
当 n 较大时,~,~,~e e ei
i
n
i
i
n
i
i
n
2
2
1
2
2
2
1?
-
? ?
? ? ? 大致相等,则 (2.7.2)可以化简为:
)1(2)
~
~~
1(2..
1
2
2
1
?-?-?
?
?
?
?
-
n
i
i
n
i
ii
e
ee
WD ^
?进行判断的依据:
^
式中,
??? ????
??
-
??
-
n
i
i
n
i
ii
n
i
i
n
i
ii eeeeee
2
2
2
1
1
2
2
1
~~~~~~
为一阶自相关模型
ttt ???? ?? -1 11 <<- ?
的参数估计 (一致估计量 ),
)1(2)
~
~~
1(2..
1
2
2
1
?-?-?
?
?
?
?
-
n
i
i
n
i
ii
e
ee
WD ^
如果存在完全一阶正相关, 即
?=1,则 D.W.? 0
当 D.W,值越接近于 0,表明存在一阶正自相关
如果存在完全一阶负相关, 即
?= -1,则 D.W.? 4
当 D.W,值越接近于 4,表明存在一阶负自相关
如果完全无自相关, 即
?=0,则 D.W.?2
当 D.W,值越接近于 0,表明倾向于无一阶正自相关
根据推导,用假设检验语言将结论正规化得出
判断序列相关的准则,
Durbin和 Watson成功地导出了临界值的下限 dL
和上限 dU
根据 D.W.值与临界值的关系判断模型的序列相
关状态,
?进行判断的准则:

则 若 0<D.W.< dL 则存在正自相关
dL <D.W.< du 不能确定
du <D.W.<4 - du 无自相关
4 - du <D.W.<4 - dL 不能确定
4 -dL <D.W.<4 存在负自相关
检验误差序列序列相关性 —— DW检验区域图
一阶自相关 无法判断 无一阶自相关性 无法判断 一阶负自相关
DW
0 2 4Ud-4 Ld-4UdLd
?D.W.检验步骤
①对原模型运用 OLS法得到残差值,计算
D.W.统计量的值
②根据样本容量 n和解释变量数目 k查 D.W.分布
表,得到临界值 dL(下限 )和 dU(上限 )
③ 按照准则考察计算得到的 D.W.值,以判断模
型的序列相关状态
ie~
( 2) D.W.检验
在 5%在显著性水平下, n=19( 67- 85年 ),
k+1=2(包含常数项 ),查表得 dL=1.18,dU=1.40,
由于 DW=0.9505<dL,故存在正自相关 。
回归结果:
tt xy 28.083.2531? ?-?
(-9.34) (30.11)
r 2=0.9816,D.W.=0.9505
( 1) D.W.检验 。 使用必须满足五个假定条件 。
( 2) D.W.检验是一种假设检验的方法, 根据 D.W.值与
两个临界值 dL和 dU的关系判断模型的自相关状态,检验中
有两个临界值:下限 dL和上限 dU, 它们只与样本的容量 n
和解释变量的个数 k有关, 而与解释变量 x的取值无关 。
( 3) 从判断准则看到, 存在两个不能确定的 D.W.值区
域, 这是这种检验方法的一大缺陷 。 若落入无法判定区,
选用其它检验方法, 比如回归检验法, 精确的 d检验
(shazam)。
?D.W.检验总结
( 4) D.W.检验虽然只能检验一阶自相关, 但在
实际计量经济学问题中, 一阶自相关是出现最
多的一类序列相关;
( 5) 经验表明, 如果不存在一阶自相关, 一般
也不存在高阶序列相关 。
所以在实际应用中, 对于序列相关问题一般只
进行 D.W.检验 。
四、具有序列相关性模型的估计
? 如果模型被检验证明存在序列相关性,则需要发
展新的方法估计模型。
? 最常用的方法是
? 差分法,
1,广义差分法 (Generalized Difference)。
2,一阶差分法 ( First-Order Difference)
? 广义最小二乘法 ( GLS,Generalized least
squares)、
2、补救序列相关性的方法
法 1:广义差分法
( 1)从一元入手,AR(1)时一元的一个例子
设线性回归模型为
已知 有一阶自回归形式,即
如何将序列相关的随机误差项为无序列相关的?
iii ?bb ??? xy 10
i?
iii ???? ?? - 1
( 1)从一元入手,AR(1)时一元的一个例子
设线性回归模型为 ( 1)
已知 有一阶自回归形式,即
把 滞后一期 的观测值代入模型,得方程:
( 2)
将( 1)减去( 2)* ?,可得
( 3)
根据 如果记
原模型变换为 ( 4)
iii ?bb ??? xy 10
i? iii ???? ?? - 1
iii ???? ?? - 1
11101 xy --- ??? iii ?bb
)(xx1
)(xxyy
1110
1111001
--
---
-?-?-
-?-?-?-
iiii
iiiiii
????bb?
????bb?bb?
)()=(
1* yyy --? iii ? 1* xxx --? iii ?
iii ?bb ??? ? *10* xy
? ??bb -?? 100
满足无序列相关的基本假设,问题解决
? 上述变换模型的方法称为 广义差分法
? 所谓“差分” — 将变量的当期值减去前期值
(前一期或前几期)的一个比例
? 例如:用变量的当期值减去前一期值的 0.5倍
? 用广义差分法得到的 模型 ( 3或 4) 称为 广义差
分模型(方程),该模型不存在序列相关问题。
采用 OLS法估计可以得到原模型参数的无偏、有
效的估计量。
1*1* x5.0xxy5.0yy -- -?-? iiiiii ;
设线性回归模型为 ( 1)
已知 有一阶自回归形式,即
把 滞后一期 的观测值代入模型,得方程:
( 2)
将( 1)减去( 2)* ?,可得
( 3)
根据 如果记
原模型变换为 ( 4)
iii ?bb ??? xy 10
i? iii ???? ?? - 1
iii ???? ?? - 1
11101 xy --- ??? iii ?bb
)(xx1
)(xxyy
1110
1111001
--
---
-?-?-
-?-?-?-
iiii
iiiiii
????bb?
????bb?bb?
)()=(
1* yyy --? iii ? 1* xxx --? iii ?
iii ?bb ??? ? *10* xy
? ??bb -?? 100
满足无序列相关的基本假设,问题解决
? 注意,广义差分模型(方程)中的斜率(偏斜
率)系数和原模型 一致,但其它指标(截距项、
解释变量、被解释变量)均发生了变化
? 用广义差分法对变量做的变换称为 广义差分变

? 当模型存在一阶自回归 时,消
除模型序列相关性所做的广义差分变换为
1*1* xxxyyy -- -?-? iiiiii ?? ;
iii ???? ?? - 1
AR(1)时一元模型广义差分法的特点
? 广义差分法可以有效地消除任何形式的序
列相关
? 当原一元模型中的随机误差项存在一阶自
回归时,广义差分法的具体做法:
1,对原模型 滞后一期并乘上一阶自相关系数
?得:
2,用原模型 减去 ( 2)即可,所得新模型消除
了序列相关性。
)( 2 xy 11101 --- ??? iii ???b?b?
iii ???? ?? - 1 A R ( 1 )
设线性回归模型为
( 1)
已知 有一阶自回归形式,即
把 滞后一期 的观测值代入变量关系,得方程:
( 2)
将( 1)减去( 2)* ?,可得
iiii ?bbb ????? kk110 xxy L
i? iii ???? ?? - 1
)(xx1
)(xxxx
yy
11kkk0
11kkkk11100
1
--
---
-
-?-??-
-?-??-?-?
-
iiii
iiiiii
ii
????bb?
????bb?bb?bb
?
)()=( L
L
1-1-kk1-1101- xxy iiii ?bbb ????? L
( 2) AR(1)时多元的情形
根据 如果记
原模型变换为
iiii ?bbb ?????
? *
kk
*
110
* xxy L
(广义差分模型)满足无序列相关的基本假设,
问题解决
? ??bb -?? 100 1* yyy --? iii ? 1jj*j xxx --? iii ?
iii ???? ?? - 1
( 3) AR( L)时的广义差分法
模型 (2.7.8)为 广义差分模型(方程),该模
型不存在序列相关问题。采用 OLS法估计可
以得到原模型参数的无偏、有效的估计量。
如果原模型存在 AR(L):
? ? ? ? ? ? ? ?i i i l i l i? ? ? ? ?- - -1 1 2 2 L (2.7.7)
可以将原模型变换为 ( 滞后 L期 ):
ililiillilii xxxyyy ???b??b?? ?---?---?--- ---- )()1( 1111011 LLL
i l l n? ? ?1 2,,,L
(2.7.8)
(4)广义差分法的特点
? 消除序列相关的目标:使求得的新模型中
的随机误差项无序列相关
? 具体做法:
第一步:原模型中的随机误差项存在几阶自回
归形式,就对原模型 滞后几期并给每期乘
上相应 ?m(m=1,2,?,l)
第二步:用原模型 减去 各滞后期模型,所得新
模型消除了序列相关性
? 引
? 广义差分法 可以克服所有类型的序列相关带
来的问题。
? 到目前为止,运用广义差分法,序列相关问
题是否已成功解决?
? 要成功的应用广义差分法,必须已知不同样
本点之间随机误差项的真实的相关系数 ?
? 实际上, 人们并不知道它们的具体数值, 所
以必须首先对它们进行估计 。
? 进入广义差分法的第二个部分 — 如何估计 ??
iii ???? ?? - 1
( 5)广义差分法中随机误差项相关系数 ?
的估计
? 常用的方法有:
I,从 D.W.统计量中估计
II,杜宾 ( durbin) 两步法
III,科克伦 -奥科特 ( Cochrane-Orcutt) 迭代
法 ( 软件中含 )
? 根据 D.W.与 ?之间的近似的关系
? 有
? 于是,根据 D.W.的值可得相关系数的估计值
? 注意:此法仅适用于存在 一阶自回归形式 的模
型,且只有当 样本容量很大 时才能得到较理想
的估计值
)1(2)
~
~~
1(2..
1
2
2
1
?-?-?
?
?
?
?
-
n
i
i
n
i
ii
e
ee
WD ^
2
D, W,-1? ??
I,从 D.W.统计量中估计
例:由 D.W.=0.9505
5248.029505.0-12D, W,-1? ????
II,杜宾两步法
例:
iii
iiiiii
??bb?b
????bb?bb?
?-?-
-?-?-?-
-
---
1110
1111001
xx)(1
)(xxyy

)(得 1 xy *10* iii ?bb ??? ?
iii ???? ?? - 1iii ?bb ??? xy 10
)(=得 2 xxy)(1y 11110 iiiii ??bb??b ?-??- --
将滞后的 y值移至等式右边
采用杜宾两步法估计 ?
1)估计模型( 2)
11
*
2
*
11
*
0 --- ????? ttttt xxyy ?bb?b
得:
11 2109.03348.05939.079.1334? -- -??-? tttt xxyy
( -1.86) (2.01) (3.41) (-1.53)
R 2 =0.9832,D.W.=1.6282
由于 DW>=1.39(注:样本容量为 19-1=18个 ),已
不存在自相关。 于是原模型估计式为:
2) 将 ?? =0.5939 代入差分模型( 1)
ttttt xxyy ?bb ?-??- -- )5939.0(5939.0 1
*
1
*
01
OLS 法估计得:
ttttt xxyy ??-?-?- -- )5939.0(3083.001.13515939.0 11
( -5.53) (15.58)
r 2=0.9382,D.W.=1.6570
tt xy 3083.079.3326? ?-?
II,杜宾 ( durbin) 两步法
该方法是先估计 ?1,?2,?,?L,再对差分模
型进行估计。
第一步,变换差分模型为下列形式:
ililiillilii xxxyyy ???b??b?? ?---?---???? ---- )()1( 1111011 LLL
i l l n? ? ?1 2,,,L
( 2.7.9 )
采用 OLS 法估计该方程,得各 ),2,1( liiijy j ---? L 前的
系数 ? ? ?1 2,,,L l 的估计值 l??? ?,,?,? 21 L 。
采用 O LS 法估计,得到参数 110 ),??1( b??b l--- L 的
估计量,记为
*
0
?b, *
1
?b 。
于是:
)??1(?? 1*00 l??bb ---? L, *11 ?? bb ?
第二步,将估计的 l??? ?,,?,? 21 L 代入差分模型
ililiillilii xxxyyy ???b??b?? ?---?---?--- ---- )()1( 1111011 LLL
i l l n? ? ?1 2,,,L
III,科克伦 -奥科特迭代法
首先,采用 OLS法估计原模型
yi=b0+b1xi+?i
得到的随机误差项的“近似估计值”,并以之作
为观测值采用 OLS法估计下式
?i=?1?i-1+?2?i-2+??L?i-L+?i
得到 ?,?,,?? ? ?1 2 L l,作为随机误差项的相关系
数 ? ? ?1 2,,,L l 的 第一次估计值 。
再次,将
0
?
?
b,
1
?
?
b 代回原模型,计算出原模型随机误
差项的新的,近拟估计值”,并以之作为模型
? ? ? ? ? ? ? ?
i i i l i l i
? ? ? ? ?
- - -1 1 2 2
L
的样本观测值,采用 O L S 法估计该方程,得到
l
???
?
?,,
?
?,
?
?
21
L,作为相关系数
? ? ?
1 2
,,,L
l 的 第二次估计值 。
其次,将上述 ?,?,,?? ? ?1 2 L l 代入广义差分模型
ililiillilii xxxyyy ???b??b?? ?---?---?--- ---- )()1( 1111011 LLL
i l l n? ? ?1 2,,,L
并对之进行 OLS 估计,得到 0??b, 1??b 。
类似地,可进行第三次、第四次迭代。
? 关于迭代的次数, 可根据具体的问题来定 。
? 一般是事先给出一个精度, 当相邻两次 ?1,?2,
?,?L的估计值之差小于这一精度时, 迭代终止 。
? 实践中, 有时只要迭代两次, 就可得到较满意
的结果 。 两次迭代过程也被称为 科克伦 -奥科特
两步法 。
( 6)应用软件中的广义差分法
? 在 Eview/TSP软件包下,广义差分采用了科克
伦 -奥科特( Cochrane-Orcutt)迭代法估计 ?。
? 在解释变量中引入 AR(1),AR(2),…, 即可得
到参数和 ρ1,ρ2,… 的估计值。 其中 AR(m)表示
随机误差项的 m阶自回归。在估计过程中自动
完成了 ρ1,ρ2,… 的迭代,
( 7)广义差分法的步骤
? 第一步:采用适当方法获得未知 ?的一个
估计值
? 第二步:用这个估计值对变量作广义差
分变换,以估计广义差分模型
法 2、一阶差分法
一阶差分法是将原模型
iii xy ?bb ??? 10 i=1,2,…,n
滞后一期 yi-1=b0+b1xi-1+?i-1,两式相减 变换为
11 --?D?D iiii xy ??b i=2,…,n
其中
L
1--?D iii yyy
一阶差分
将变量的当期值减去前期值
Dxi=xi- xi-1
? 即使对于非完全一阶正相关的情况,只要存在
一定程度的一阶正相关,差分模型就可以有效地
加以克服。
?显然,一阶差分法是 广义差分法 的一个特例。
?如果原模型存在完全一阶正自相关, 即在
?i=??i-1+? i
中, ?=1。 原模型可变换为,
Dyi= b1Dxi+?i (变换后的模型无截距项)
由于 ?i不存在序列相关,该差分模型满足应用 OLS
法的基本假设,用 OLS法估计可得到原模型参数的
无偏的、有效的估计量。
例:序列相关的处理
一阶差分法
r2=0.4747,D.W.=1.8623
由于 DW>du=1.39(注:样本容量为 18个 ),已不
存在自相关。
ttt xy ??D?D 3185.0?
( 6.8098)
法 3,广义最小二乘法
先将存在违背基本假设的原模型中的变量转换为满
足基本假设的新变量, 然后对新变量使用 OLS的估
计方法叫做 GLS,所得估计量称为 GLS估计量
? 在实际中 GLS的一种运用方式
对原模型首先采用普通最小二乘法, 得到随机误
差项的 残差 ( 近似估计量 ), 以此构成随机误差
项的方差和协方差的估计量, 即矩阵
?
~ ~ ~ ~ ~
~ ~ ~ ~ ~
~ ~ ~ ~ ~
? ?
?
?
?
?
?
?
?
?
?
?
?
?
e e e e e
e e e e e
e e e e e
n
n
n n n
1
2
1 2 1
2 1 2
2
2
1 2
2
L
L
?
L
此也为软件中广义 最小二乘法的运用
3、虚假序列相关问题
? 由于随机项的序列相关往往是在模型设定中遗
漏了重要的解释变量或对模型的函数形式设定有
误,这种情形可称为 虚假序列相关,应在模型设
定中排除。
4、实际运用中消除序列相关的步骤
? 第一步,当检验出模型存在序列相关性时,首
先分析序列相关产生的原因,判断是否存在虚假
的序列相关问题,
? 第二步,在断定随机误差项存在真正序列相关
的情况下,选用适当的方法消除序列相关问题,
总的原则是,变换原模型,使得变换后的新模型
的随机误差项满足无序列相关的假设,进而利用
OLS法估计参数。
五、案例:地区商品出口模型
单位:万元
年份 出口
Y
国内生产总值
X
年份 出口
Y
国内生产总值
X
1967 4010 2 2 4 1 8 1977 5628 2 9 0 9 1
1968 3711 2 2 3 0 8 1978 5736 2 9 4 5 0
1969 4004 2 3 3 1 9 1979 5946 3 0 7 0 5
1970 4151 2 4 1 8 0 1980 6501 3 2 3 7 2
1971 4569 2 4 8 9 3 1981 6549 3 3 1 5 2
1972 4582 2 5 3 1 0 1982 6705 3 3 7 6 4
1973 4697 2 5 7 9 9 1983 7104 3 4 4 1 1
1974 4753 2 5 8 8 6 1984 7609 3 5 4 2 9
1975 5062 2 6 8 6 8 1985 8100 3 6 2 0 0
1976 5669 2 8 1 3 4
1、某地区商品出口总值与国内生产总值的数据
2、序列相关性检验
( 1)图示法检验
( 2) D.W.检验
在 5%在显著性水平下, n=19,k+ 1=2(包含常
数项 ),查表得 dL=1.18,dU=1.40,
由于 DW=0.9505<dL,故存在正自相关 。
回归结果:
tt xy 28.083.2531? ?-?
(-9.34) (30.11)
r 2=0.9816,D.W.=0.9505
3、自相关的处理
⑴ 一阶差分法
R2=0.4747,D.W.=1.8623
由于 DW>du=1.39(注:样本容量为 18个 ),已不
存在自相关。
tt xy D?D 3185.0?
( 6.8098)
⑵ 广义差分法
① 采用杜宾两步法估计 ?
1)估计模型
11
*
2
*
11
*
0 --- ????? ttttt xxyy ?bb?b
得:
11 2109.03348.05939.079.1334? -- -??-? tttt xxyy
( -1.86) (2.01) (3.41) (-1.53)
R 2=0.9832,D.W.=1.6282
由于 DW>=1.39(注:样本容量为 19-1=18个 ),已
不存在自相关。 于是原模型估计式为:
2) 将 ?? =0.5939 代入差分模型
ttttt xxyy ?bb ?-??- -- )5939.0(5939.0 1
*
1
*
01
OLS 法估计得:
ttttt xxyy ??-?-?- -- )5939.0(3083.001.13515939.0 11
( -5.53) (15.58)
r 2=0.9382,D.W.=1.6570
tt xy 3083.079.3326? ?-?