第四章 非线性模型
kiuXXXYPRF ikikiii,,2,1,,33221
因变量和解释变量之间的线性关系,包括 参数线性 和 解释变量线性 两种。前面的分析假定总体回归函数的形式为:
但是根据经济现实或经济理论,变量之间不一定存在这种形式的线性关系。
如参数线性形式的回归函数:
i
i
i uXY
1
21
或参数、变量均为非线性形式的函数关系,如 C-D生产函数:
ueKALY 21
对于这些不符合线性假定的模型进行参数估计,必须加以适当的变换以后,才能用 OLS方法估计模型参数。
对于参数线性的模型,可以采用变量的直接代换,转化为参数、变量均为线性的形式进行估计。
一、倒数模型:
函数形式为:
i
i
i uXY
1
21
令变量,则回归函数可变为:
i
i XX
1*?
ii uXY i *21
根据解释变量的观测值,计算出 X*i 的之后进行 OLS估计,得到:
*21
iXY i
因此可得到原模型的估计方程:
i
i XY
1
21
二、对数线性模型:
通过对原模型的对数变换,函数形式可变为:
iiii uXXY 32221 lnlnln
令变量,则回归函数可变为:
kii XXYY kii ln,ln **
iuXXY iii *2*21* 32
根据解释变量的观测值,进行 OLS估计,得到:
因此可得到原模型的估计方程:
*2*21*
32 iii XXY
iii XXY 32221 ln?lnln
例如,估计 C-D 函数,ueKALY
21
,两边取对数后:
iiii uKLAK lnlnlnln 22
得到原模型的估计方程:
ii KLY ln?lnln 221
因此,C-D 函数的估计形式为,321 KLeY?
二、半对数线性模型:
模型的函数形式可变为:
iii
iii
uXY
uXY


ln
ln
21
21


或令变量,同样可以进行参数的 OLS估计。k
kiki XX?*
iiiii uXYuXY i *2121* 或根据解释变量的观测值,进行 OLS估计,得到:
因此可得到原模型的估计方程:
*2121*
iii XYXY i 或
iiXi XYeY i ln 21 21 或三、多项式模型:
模型的函数为:
kiuXXXY ikkii kii,,2,1,22110 2
我们关于经典线性回归模型( CLRM)有如下假定:
假定 1:回归模型对参数是线性的假定 2:在重复抽样中 X的值是固定的(非随机)
假定 3:干扰项的均值为零。即,E(ui|Xi)=0
假定 4:同方差性或 ui的方差相等。即
Var(ui|Xi)=E[ui-E(ui)|Xi]2 = E(ui2|Xi]2 =?2
假定 5:各个干扰项无自相关。即
Cov(ui,uj|Xi,Xj)=E[ui-E(ui|Xi) ][uj-E(uj|Xj)] = E(ui|Xi)(uj|Xj) = 0
假定 6,ui和 Xi的协方差为零。即
Cov(ui,Xi) = E[ui – E(ui)][Xi – E(Xi)] = E[ui (Xi – E(Xi))]
=E(ui Xi) – E(ui)E(Xi) = E(ui Xi) = 0
假定 7:观测次数必须大于待估计的参数个数。
假定 8:解释变量 X的只要有变异性。即一个样本中,Xi不能完全相同。
假定 9:模型没有设定误差。
假定 10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。
在现实中,以上假定不一定得到满足。本章讨论某些假定不成立时的估计问题。
第五章 多重共线性第一节 违背古典假定的估计问题第二节 多重共线性( multi-collinearity)
如果假定 10不成立,即在解释变量 X1,X2,…,Xk中,存在线性关系。
解释变量间的确定线系关系存在时,存在不全为零的常数
02211 kikii XXX
,使k,,21
ki
k
iii XXXX
1
3
1
3
2
1
2
1
1,0

则设这种关系为完全多重共线性,变量间的相关系数为 1。实际上更多的情况是,解释变量间有不完全的线性关系:存在不全为零的数:
02211 ikikii vXXX
,使k,,21
其中 vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系称为多重共线性。由于经济变量自身的性质,它们之间这种多重共线性或强或弱,普遍存在的。
11
3
1
32
1
21

i
kikiii
vXXXX
假定 λ1<>0,
第三节 多重共线性的影响一、完全多重共线性以两个解释变量的回归模型为例,假定回归模型为:
ii uXXY 33221
如果采用 OLS估计,则有:
2
3322
2
33221
2
33221
)(
)(?m i n

xxy
XXYu
XXY
i
ii







根据最小平方和原则,并求解正规方程组,可得到:
2
32
22
323
2
2
2 )())((
))(())((?
32
3



ii
iiiiii
xxxx
xxxyxxy
ii
i?
2
32
22
322
2
2
3 )())((
))(())((?
32
2



ii
iiiiii
xxxx
xxxyxxy
ii
i?
0
0
)())((
))(())((
)())((
))(())((
22
3
222
2
3
2
3
2
32
22
323
2
2
2
33
33
32
3




i
iiii
ii
iiiiii
xxx
xxyxxy
xxxx
xxxyxxy
ii
ii
ii
i


如果 X2与 X3存在完全共线性,即 则:
32 xx
因此,存在完全共线性时,不能利用 OLS估计参数,参数的方差变为无限大。








22222
3
2
2
3
2
232
2
32
2
3
2
2
2
2
2
32
3
)?(
)?(

)()(
时,在
)(
也是不确定的。而方差是不确定的。同样此时,
i
xx
x
V a rxx
xxxx
x
V a r
i
i
iiii
i
二、不完全多重共线性假定 X2,X3 间存在不完全多重共线性,以离差形式表示为,。
其中 vi 为随机项。则
ivxx 32?
。式中分母可化简为 0))((
])([)]()([
])()[()]()([?
22
2
33
22
3
333
2
3
2
3
3
3






i
iiiii
iiiiiiii
vx
xvxxvx
xvxxyxvxy
i
i
i?



)1{
)]/(1[
/
)
(

23
2
3
2
2
2
2
2
32
2
3
2
2
2
32
2
3
2
32
2
3
2
2
2
2
2
32
rx
xxxxx
xxxx
xxxx
x
V a r
i
iiiii
iiii
iiii
i


)(
)(
)(
也是可估计的。而方差是可估计的的。同样此时,
)1()?( 2232 23rxV a r i

显然,当解释变量 X2,X3 之间的相关系数 r23 的绝对值越大,共线性程度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大,
方差以更大的幅度增加。
三、多重共线性的影响
( 1)参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准确度和置信区间)。
( 2)参数估计值的标准差增大,使的 t 检验值变小,增大了接受 H0,舍弃对因变量有显著影响的变量。
( 3)尽管 t 检验不显著,但是 R2仍可能非常高。
( 4) OLS估计量对观测值的轻微变化相当敏感。
一、多重共线性的探查由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估计结果,因此我们关心的是共线性的程度,而不是共线性是否存在。
第三节 多重共线性的探查和解决在双边量回归模型中,可以直接对解释变量的相关系数进行显著性检验,以确定线性相关的程度(此时相关系数的平方等于样本决定系数)。
而对于多于两个结束变量的回归模型,则不能利用俩俩相关系数来检验。
对于有多个变量的回归模型,可以采用辅助回归的方法,分别以 k-1个解释变量中的第 i个对其他变量进行回归,可得到 k-2个回归方程的判定系数:
R22,R32,…,Rk2。假定这些判定系数中 Rj2最大且接近 1,则变量 Xj 与其他解释变量中的一个或多个有较高相关程度,因此回归方程出现高度多重共线性。 可以进行 F检验确定其显著性:
根据第三章的结果,检验 R2显著性的 F检验值为:
),1(~)/()1( )1/(22 knkFknR kRF
可以采用类似的方法检验:
),1(~)1/()1( )1/(2
2
knkFknR kRF
j
j


选择显著水平 α,计算 F 统计量的值,与 F分布表中的临界值进行比较,若
F检验值小于临界值,则多重共线性不显著,反之,则多重共线性显著。
二、解决多重共线性的方法如果发现监视变量之间存在高度得多重共线性,就必须消除这种多重共线性的影响,保证模型的正确性和估计的有效性。有以下几种解决方法。
1、除去不重要的变量把回归模型中引起多重共线性,而对因变量的影响不大的变量。但是变量的剔除可能导致模型的设定偏误。
服从 t (n-k+1)。给定显著水平 α,若统计量大于临界值 tα/2,则说明 Xj 与 Xi引起回归方程的多重共线性。
如果通过前的 F检验得到某解释变量 Xj 与其它解释变量存在多重共线性,则可以通过 t 检验寻找 Xj 与哪些变量引起多重共线性。
首先计算 Xj 与其它每个解释变量的偏相关系数:
)1/()1(
,3,2,,
2
)1)(1()1)(1(2.
)1)(1()1)(1(2.
)1)(1()1)(1(2.





knr
r
t
kijir
kiijjji
kiijjji
kiijjji



定义统计量:
已知 X2 和 X3 之间高度共线。根据先验信息,确定 β3=2β2,带入模型后可得:
。和可得到估计方程设变量
232
21
32
3221
32221
2
),2(
)2(
2








iii
iii
iii
iiii
uZY
XXZ
uXX
uXXY
例如,C-D生产函数,K与 L高度相关。已知规模收益不变,则 α+β=1。生产汉数的双对数模型可变为:
KALY?
u
K
LA
K
Y
uKLAY


ln)l n (ln
ln)1(ln)l n (ln

整理,可得:
可以对这一新回归方程进行估计。
2、利用先验信息假定对回归模型:
iiii uXXY 33221
3、变换模型的形式如果作为解释变量的某些经济变量间出现高度相关,而进行回归分析的目的是为了预测,不是研究单个经济变量对因变量的影响时,可以根据实际问题,改变模型模型的形式。
4、增加样本容量如果多重共线性是由样本引起,增加样本容量可以减少多重共线性的程度。以二元回归方程为例,根据第二节的结果,参数估计值的方差为:

)1(
)?(
22
3
2
32
2
3
2
2
2
2
2
23
rx
xxxx
x
V a r
i
iiii
i

)(
当样本容量增大时,增大,方差将减小,可以提高参数估计的精度。 2
2ix
5、横截面数据与时间序列数据并用如果时间序列数据中,解释变量间存在高度相关,可以先使用横截面数据估计出存在高度相关解释变量中的一个或多个,然后再在时间序列数据中剔除这些变量,在消除多重共线性影响下估计因变量与剩余变量间的回归式。
例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消费者收入的时间序列数据。设定回归式:
tttt uIPY lnln)l n ( 321
tttt IYYuPY tt ln?ln,ln 3*21* 其中新的回归式中消除了多重共线性的影响。
由于在时间序列数据中价格 Pt、收入 It 一般都具有高度共线的趋势。因此,直接估计上面的回归式将存在问题。由于在同一式点上,价格与收入的相关程度不高,可以先利用截面数据估计出收入弹性,再利用这一估计结果修改原回归式,变为:
3
6、利用时间序列数据的差分或离差进行估计如果时间序列数据中,解释变量间存在高度相关,那么这些变量的差分之间不一定相关。因此利用差分进行回归能降低多重共线性的程度。
第六章 异方差第一节 异方差的性质一、异方差在经典线性回归模型( CLRM)中,我们假定随即干扰项具有同方差性,
即:
Var(ui|Xi)=E[ui-E(ui)|Xi]2 = E(ui2|Xi]2 =?2
这实际上是假定了解释变量 Yi 的值围绕其期望值的分散程度相同。实际上,
对应于解释变量的不同取值,方差可能不同,即本假定不成立。
Y1
X1
Y2
X2
Yn
Xn
.,,
Y1
X1 X2
Yn
Xn
.,,
同方差异方差
2
2
2
00
00
00
)'( 2
1
n
E

uu
如果保持随机项的协方差为 0,则 的方差、协方差矩阵为:uX βY
或者说,。 )(,0),(,)( 2 jiuuC o vuV a r
jiii 常数?
在这种情况下,称随机项 ui 具有异方差性。
二、异方差的原因
1、因变量与解释变量间相互关系的性质。如“干中学”、经济行为规则等。
2、解释变量的遗漏。
3、异常观测值的出现。
4、时间序列数据中,观测技术的改进引起的观测值的变化。
三、异方差的后果由于异方差性,基于 CLRM假定的 OLS估计参数结果将受到影响。
1、考虑异方差性的 OLS估计如果假定,保留其它的 CLRM假定,以双变量回归模型为例,普通 OLS估计为:
常数 iiuE?)( 2
))?((
)(
)?(
)(
2
2
222
22
2
222
21






ii
ii
i
x
V a r
x
x
V a r
XXn
YXYXn
x
yx
uXY
i
iiii
i
ii
iii

同方差假定下,
可以证明该估计量是线性、无偏的(第二章的证明),但是否为最优估计量(具有最小方差性)性,则不一定。可以在考虑异方差性的前提下,
采用适当的 OLS估计方法来分析。
2、存在异方差性的 OLS估计 ——广义最小二乘法( GLS) 估计对于
iiii iuEuXY )(,221
可以进行变量代换,构造满足 CLRM假定的回归方程。
的同方差性假定。新模型满足
,此时模型可变为两边同除以在
C L R M
u
EvEuV a r
vXY
uXY
uXY
i
i
ii
ii
i
i
i
i
i
i
i
ii
i
i
iii
1
1
])[()()(
,:
2
2
22*
****
2
1
21
21








2
222
2
2
2*
2
*
1
2
2
)())((
))(())((
)

(
)*

*(m i n
,
1
i
i
i
i
xw
yxw
XwXww
YwXwYXww
G L S
XYw
XYv
w
i
iii
iiii
iiiiiiii
iii
ii
i







估计量为小:新模型的残差平方和最令
222
2
21
)())((
)?(
*
iiiii
i
ii
iii
i
ii
i
ii
XwXww
w
V a r
xw
yxw
Y
w
Xw
w
Yw




而在估计过程中,新模型的残差平方和实际上是原模型的残差的加权平方和:
22122 )**(mi n iiiiii XYwuwv
因此,这种 GLS估计,称为加权 最小二乘法( WLS)。显然,在求最小残差的过程中,对于方差较大的观测值赋予的权重较小(不符合“平均”意义上的“异常”观测值),而对于方差较小的观测值赋予较大的权重,使样本回归函数更接近总体回归函数。
这种先将原始变量转换成满足 CLRM假定的转换变量,再利用 OLS进行估计的方法,称为 广义最小二乘法( GLS),得到的估计量称为 GLS估计量。显然,GLS估计量是 BLUE的。
3、考虑 OLS估计与 GLS 估计的比较
OLS估计量:
22
22
2
222
)(
)?(
)(


i
ii
i
x
x
V a r
x
yx
XXn
YXYXn
i
ii
i
iiii
2222 )())((
))(())((~
ii xw
yxw
XwXww
YwXwYXww
i
iii
iiii
iiiiiiii



222 )())(()
~(
iiiii
i
XwXww
wV a r


GLS估计量:
1、两种估计量都是无偏的。
2,GLS估计量具有最小方差性,。
3、在假设检验中,OLS估计将降低检验的显著性。
4,OLS估计降低估计的精度。
4、忽略异方差的 OLS估计(同方差假定下的 OLS估计),不仅不具最小方差性,而且估计是有偏的。以此为基础的统计推断将可能产生严重的误导。
)?()~( 22 V a rV a r?
第二节 异方差性的探察由于异方差性可能导致的后果,在估计中要考虑如何探察异方差的存在,并采取相应的补救措施。
一、图示法由于在存在异方差的情况下,随机项 ui 的方差与解释变量的取值有关,
因此可以画出因变量 Y与解释变量 X的散点图,或同方差假定下以 OLS估计得到的残差平方与 X或 Y(多变量模型中 )的散点图,据此对异方差做出直观的近似判断。 (P359-360图 11.7,图 11.8)
二、帕克( Pack)检验
,则存在异方差。作显著性检验。若显著进行回归,对代替:估计得到的未知,以同方差假定下由于或有关与某一解释变量假定


iiki
i
iiki
v
i
iki
vXlu
uO L S
vXeX
X
i
i
ik


)l n ()?l n (
)l n ()l n ()l n (,
:
2
22
2222
2
且能确定影响随机项的解释变量。
二、格兰奇( Glejser)检验方差。验。若显著,则存在异和回归方程作显著性检进行回归,对形势作回归:有关。可以对以下函数与某一解释变量假定





i
ik
i
i
ik
i
iiki
iiki
iki
v
X
u
v
X
u
vXu
vXu
X




1
|?|
1
|?|
|?|
|?|
:
21
21
21
21
2
如果回归结果表明异方差与多个变量有关,可以引入多个变量进行回归,
并进行检验。
格兰奇( Glejser)检验的优点在于,在检验异方差的同时,可以得到异方差形式的信息(与解释变量的关系),在后续分析中据此处理样本数据和回归模型,以得到 BLUE估计。
三、斯皮尔曼( Spearman)等级相关系数检验通过随机项的方差与解释变量的等级相关系数的显著性检验,判断是否存在异方差性。步骤:
。,则说明存在异方差性若显著(超过临界值)
、计算统计量:
的等级差。和组观测值的为第其中关系数:、计算斯皮尔曼等级相
)。,,,值(按升序获降序赋予等级和、把
。估计,得到、作
),2(~
1
2
4
],
)1(
[61
3
212
1
2
2
2

nt
r
nr
t
Xuid
nn
d
r
nXu
uO L S
s
s
iii
i
s
ii
i
这一检验的依据,其实就是检查随着因变量的变化,方差是否随之变化(等级差异意味着变动)。
四、戈德菲尔德 —匡特( Goldfied-Quandt)检验
G-Q检验适用于大样本、随机项的方差与某异解释变量存在正相关的情况。检验的前提条件是:随机项服从正态分布;无序列相关。步骤:
。,则说明存在异方差性若显著(超过临界值)
、计算统计量:
:回归,并分别计算出行、分别对两个子样本进为宜)以总样本数的(略去的样本数头的两个子样本。个样本,把样本分为两、略去居中的观测值大小顺序排列。、把样本按解释变量
)
2
,
2
(~
)
2
(
)
2
(
4
,
3
4/1
2
1
1
2
2
21
2
11
k
cn
k
cn
F
k
cn
R S S
k
cn
R S S
F
uR S SuR S S
R S SO L S
c
c
X
ii
i

如果同方差,则 F ≈1 ;如果存在以方差性,根据正相关的假设,F>1。 F
越大(超过临界值),说明存在以方差性的可能性就越大。
第三节 异方差模型的处理一、随机项的方差已知的情况估计。已知,可以直接使用如果随机项的方差 W L Si2?
的同方差性假定。新模型满足

模型可变为两边同除以原模型
C L R M
vXXY
uXY
uXXY
ikiki
i
i
i
i
ii
i
i
ikikii
i



**
,
1
:
22
**
21
221
1



对新模型作 OLS回归可以估计出原模型参数的 BLUE估计。
二、随机项的方差未知的情况存在以方差性,则随机项的方差与一个或多个解释变量有关。如:
遍除原模型,以
,设原模型为:
),(
),(
3,2
3,2
22
221
miii
miii
ikikii
XXXf
XXXf
uXXY
i



),(),(
),(),(
3,23,2
3,2
2
21
3,2
miii
i
miii
ki
k
miii
i
miii
i
XXXf
u
XXXf
X
XXXf
X
XXXf
Y





可得到满足 CLRM假定的新模型:
,即可进行估计。如果知道 ),( 3,2 miii XXXf?
因此,关键的问题是找出异方差的具体形式。
第七章 自相关第一节 自相关一、自相关对于时间序列数据,不同期的样本观测值形成一个序列;横截面数据中按不同空间(省份、厂商、家庭等)排列的样本数据也可看为一个序列,
为了方便,先把横截面数据也视为不同期的数据。对于一个变量 u,可以得到其观测值序列:
u1,u2,…,ut-1,ut
下标 t代表不同时期。
如果在这个序列中,每期的观测值与其前一期或前几期的取值有关,

Cov(ui,uj) <> 0,i <>j
则称该序列存在自相关( Autocorrelation)。
在 CLRM中,假定干扰项 u不存在自相关,即
Cov(ui,uj) = 0,i <>j
如果这一条件被破坏,即干扰项存在自相关,那么使用 OLS估计就可能存在问题。实际上,在经济计量研究中,自相关士一种常见的现象。如,消费支出要受到当期和前几期收入的影响;某一年的 GDP要受到前期的 GDP
水平的影响;某种商品的供给量要受到前一期的其它变量影响,等等。
三、自相关的形式如果 u存在自相关,t期的取值与前 p期有关,关系可由:
ut = f (ut-1,…,ut-p ) +vt
决定,其中 vt满足:
即 vt满足 CLRM假定。一般把 f (ut-1,…,ut-p ) 假定为线性形式。
二、产生自相关的原因
( 1)经济变量的惯性 ——时间序列变量的自相关导致干扰项的自相关
( 2)应进入模型的变量未被引入模型,能引起自相关
( 3)回归模型的的形式设定存在错误
( 4)蛛网现象:应变量对子变量的反应滞后
( 5)滞后效应:应变量受其前几期取值的影响
( 6)数据“编造”。数据的加工过程(如季度数据)或推算过程(根据某种假定获得未调查数据)引起自相关
( 7)随机项自身可能存在“真正自相关”性(偶然性冲击对变量的长期影响)
自相关主要出现在世界序列数据中。横截面数据中也可能存在自相关
( spatial autocorrelation,空间自相关)。这种自相关可能来自样本观测值的排序依据 ——逻辑的或经济的排列的理由。
21
2
,0),c o v (
)v a r (
0)(
21
ttvv
v
vE
tt
vt
t

如果
1,1 ttt vuu
则称为马尔科夫一阶自回归模式(或简称为一阶自回归模式),记为 AR(1)。
其中 ρ被称为自协方差系数( coefficient of autocovariance),或自相关系数。
如果
tstttt vuuuu21
则称为 s阶自回归模式,记为 AR(s)。
对于 AR( 1),
22
11
111
2
2
22222
222
2
1
2
)(
))[(
])()c o v (
1
)()(
])[()()(
1
1
ut
uuu
tt
t
uE
uvuE
uuEuu
vEuE
vuEuEuV a r
ttt
tttt
v
v
ttt










而即
(同方差假定)

1
1
1
)'(
21
2
1

ss
s
s
u
u
E



Ωuu
这与异方差一样,影响 OLS
估计的结果。
第二节 存在自相关的 OLS估计一、考虑自相关的 GLS估计对于二元回归模型:
估计进行可以对可得到:令
,相减,观测值乘以每期观测值与滞后一期其中
O L SntvbXaY
vXY
vXY
XXXYYY
vuu
uXY
uXY
uXY
t
t
tttttt
ttt
ttt
ttt
tt
tt
),3,2(
)1()1(
)1()1(
,*,*
**
1
*
21
*
*
21
*
11
1
11211
11211
21
22
















D
xx
C
xx
yyxx
n
t
tt
vG
n
t
tt
n
t
tttt
G


2
2
1
2
2
1
2
11
)(
)?v a r (
)(
))((
2
2

估计系数和方差为:
其中,C和 D未校正因子(关于 ρ的表达式,较小)。
。得到可以利用
1
21

XY
二、忽略自相关使用 OLS估计的后果利用 OLS估计,得到的估计值和方差都与 GLS估计不同。根据前面关于
OLS估计的线性和无偏性的证明,OLS估计是线性无偏的,但是考虑到干扰项的自相关,OLS估计是无效的。
D
xx
C
xx
yyxx
n
t
tt
vG
n
t
tt
n
t
tttt
G


2
2
1
2
2
1
2
11
)(
)?v a r (
)(
))((
2
2

2
2
2
22
)?(
t
t
tt
x
V A R
x
yx
如果 ρ=0,估计结果是相同的。在存在自相关的情况下,参数的
GLS估计式和方差估计式中均有自相关系数 ρ,因此,忽略自相关的 OLS
估计值和方差都是不可信的。
1、绘制 的散点图第三节 自相关的探察一、图示法
1?,tt uu
首先利用 OLS回归后,求出残差 。
tt uuuu?,?,,?,? 121
的散点图。绘出 )?,?(,),?,?(),?,?( 13221 tt uuuuuu
如果大部分落在第 I、第三象限,则 存在正自相关。
1?,tt uu
如果大部分落在第 II、第 IV象限,则 存在负自相关。
1?,tt uu
tu
1?tu
tu
1?tu
2、按时间顺序绘制 图作出 随时间变化的图形,如果 呈由规律的变化,如锯齿形或循环形,则说明干扰项存在自相关。
若 随时间变化不断变换符号,说明存在负相关;若连续几个为正,
后边几个为负,则可能存在正相关。
tu?
tu?
tu?
tu
t
tu
t
tu?
二、杜宾 —瓦特森( Durbin-Watson)检验基本假定:
( 1)回归式中有截距项
( 2)解释变量是非随机的
( 3)干扰项的模式为一阶自回归模式,vuu
tt 1?
( 4)回归模型中,物质后因变量被当作解释变量。
( 5)没有缺落数据。
检验方法如下:






n
t
n
t
n
t
t
n
t
tt
n
t
n
t
n
t
t
n
t
tt
ttt
tt
tt
uu
u
uuuu
u
uu
d
d
H
H
vuu
2
2
2
2
2
2
2
1
2
2
2
2
2
2
2
2
1
1
0
1

2
)(
0:
0:
定义检验变量备择假设原假设
1?,4
0?,2
1?,0
401
12


12
2?2
2
2
2
1
2
2
2
1
2
2
2
1
2
2







当当当
)(,而
d
d
d
u
uu
u
uu
u
uuu
d
n
t
t
n
t
tt
n
t
t
n
t
tt
n
t
t
n
t
tt
n
t
t
当 d约接近 2,u的自相关性越小。
检验步骤:
( 1)做 OLS回归,得到残差。
( 2)计算统计量 d
( 3)对给定的样本数量和解释变量数目,在给定显著水平下,找出临界值的下界和上界 dL,dU 。
( 4)根据下表的决策规则决定是否接受原假设。
原假设 决策 条件无正自相关 拒绝 0<d<dL
无负自相关 拒绝 4 - dL≤d
无正或负的自相关 接受 dU≤d ≤4 -dL
无正或负的自相关 不能确定 dL<d <Du
4 – dU<d <4 -dL
D-W检验的缺陷是存在两个不确定域。如果统计量落入不确定域中时,
无法判断是否存在自相关。
第四节 自相关的解决方法一、差分法若存在一阶自相关,可采用广义差分,利用 GLS得到参数的 BLUE估计量。 对于二元回归模型,
估计进行可以对可得到:令
,相减,观测值乘以每期观测值与滞后一期其中
O L SntvbXaY
XXYY
vXY
vXY
XXXYYY
vuu
uXY
uXY
uXY
t
t
tttttt
ttt
ttt
ttt
tt
tt
),3,2(
1,1
)1()1(
)1()1(
,*,*
**
2
1
*2
1
*
1
*
21
*
*
21
*
11
1
11211
11211
21
11
22


















然后再计算出估计值。
二、杜宾两步法把二元回归模型的差分形式写为:
估计进行可以对可得到:令
,对原模型进行差分变换第二步估计出利用令第一步
O L SntvbXaY
XXYY
vXY
XXXYYY
O L S
bba
vXXYY
t
t
tttttt
tt
tt
tt
ttt
),3,2(
1,?1
)?1()?1(
,*,*
,),1(
)1(
**
2
1
*2
1
*
*
21
*
11
22211
2211
11












再计算出 β1,β2。