1
第五章 模型的建立与估计中的
问题及对策
2
我们已学到了许多有用的计量经济分析方法, 如建立
模型, 估计参数, 假设检验, 预测, 非线性模型的线性
化, 用虚拟变量将定性因素引入模型等 。
可是, 我们所使用的最小二乘法, 以及由此而得到的
OLS估计量令人满意的性质, 是根据一组假设条件而得到
的 。 在实践中, 如果某些假设条件不能满足, 则 OLS就不
再适用于模型的估计 。 在这种情况下, 分析方法就需要
改变 。 下面列出实践中可能碰到的一些常见问题:
l 误设定 ( Misspecification 或 specification error)
l 多重共线性( Multicollinearity)
l 异方差性( Heteroscedasticity)
l 自相关( Autocorrelation)
本章将对上述问题作简要讨论, 主要介绍问题的后果,
检测方法和解决途径 。
3
第一节 误设定
采用 OLS法估计模型时, 实际上有一个隐含的
假设, 即模型是正确设定的 。 这包括两方面的含
义:函数形式正确和解释变量选择正确 。 在实践
中, 这样一个假设或许从来也不现实 。 我们可能
犯下列三个方面的错误:
l 选择错误的函数形式
l 遗漏有关的解释变量
l 包括无关的解释变量
从而造成所谓的, 误设定, 问题 。
4
一, 选择错误的函数形式
这类错误中比较常见的是将非线性关系作为线性关系处理。
函数形式选择错误,所建立的模型当然无法反映所研究现象
的实际情况,后果是显而易见的。因此,我们应当根据实际
问题,选择正确的函数形式。
我们在前面各章的介绍中采用的函数形式以线性函数为主,
上一章介绍了应变量和解释变量都采用对数的双对数模型,
下面再介绍几种比较常见的函数形式的模型, 为读者的回归
实践多提供几种选择方案 。 这几种模型是:
? 半对数模型
? 双曲函数模型
? 多项式回归模型
5
1,半对数模型
半对数模型指的是应变量和解释变量中一个为对数形式而
另一个为线性的模型 。 应变量为对数形式的称为 对数 -线性模
型 (log-lin model)。 解释变量为对数形式的称为 线性 -对数模
型 (lin-log model)。 我们先介绍前者, 其形式如下:
对数 -线性模型中, 斜率的含义是 Y的百分比变动, 即解释
变量 X变动一个单位引起的应变量 Y的百分比变动 。 这是因
为, 利用微分可以得出:
ttt uXY ??? 10ln ??
)1(1ln1 ???????????????? dXYdYdXdYYdX Yd ??
6
这表明, 斜率度量的是解释变量 X的单位变动所
引起的应变量 Y的相对变动 。 将此相对变动乘以 100,
就得到 Y的百分比变动, 或者说得到 Y的增长率 。
由于对数 -线性模型中斜率系数的这一含义, 因而也
叫 增长模型 (growth model)。 增长模型通常用于测
度所关心的经济变量 ( 如 GDP) 的增长率 。 例如,
我们可以通过估计下面的半对数模型
得到一国 GDP的年增长率的估计值, 这里 t为时间趋
势变量 。
tt utGD P ??? 10)l n ( ??
7
线性 -对数模型的形式如下:
与前面类似, 我们可用微分得到
因此
这表明
ttt uXY ??? ln10 ??
??????? XdXdY 11?
XdX
dY
dX
dYX ??
1?
XX
Y
X
Y
?
???
的相对变动
的绝对变动
1?
?????? ??? XXY 1?
上式表明, Y的绝对变动量等于 乘以 X的相对变动量 。 因
此,线性 -对数模型通常用于研究解释变量每变动 1%引起的
因变量的绝对变动量是多少这类问题 。
1?
8
2,双曲函数模型
双曲函数模型的形式为:
不难看出, 这是一个仅存在变量非线性的模型, 很容易用
重新定义的方法将其线性化 。
双曲函数模型的特点是, 当 X趋向无穷时, Y趋向, 反
映到图上, 就是当 X趋向无穷时, Y将无限靠近其渐近线
( Y= ) 。
双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯
曲线 。
t
t
t uXY ???
?
?
???
??? 1
10 ??
0?
0?
9
3,多项式回归模型
多项式回归模型通常用于描述生产成本函数, 其一般形式
为:
其中 Y表示总成本, X表示产出, P为多项式的阶数, 一般
不超过四阶 。
多项式回归模型中, 解释变量 X以不同幂次出现在方程的
右端 。 这类模型也仅存在变量非线性, 因而很容易线性化,
可用 OLS法估计模型 。
iPiPiii uXXXY ?????? ????,,,,,,2210
10
二, 遗漏有关的解释变量
模型中遗漏了对因变量有显著影响的解释变量的
后果是:将使模型参数估计量不再是无偏估计量 。
三, 包括无关的解释变量
模型中包括无关的解释变量, 参数估计量仍无偏,
但会增大估计量的方差, 即增大误差 。
[注 ] 有关上述两点结论的说明请参见教科书 P101-102。
11
四, 解决解释变量误设定问题的原则
在模型设定中的一般原则是尽量不漏掉有关的解释
变量。因为估计量有偏比增大误差更严重。但如果方
差很大,得到的无偏估计量也就没有多大意义了,因
此也不宜随意乱增加解释变量。
在回归实践中,有时要对某个变量是否应该作为解
释变量包括在方程中作出准确的判断确实不是一件容
易的事,因为目前还没有行之有效的方法可供使用。
尽管如此,还是有一些有助于我们进行判断的准则可
用,它们是:
12
选择解释变量的四条准则
1,理论,从理论上看, 该变量是否应该作为解释变量包括
在方程中?
2,t检验:该变量的系数估计值是否显著?
3., 该变量加进方程中后, 是否增大?
4,偏倚,该变量加进方程中后, 其它变量的系数估计值是
否显著变化?
2R 2R
如果对四个问题的回答都是肯定的,则该变量应该包括在
方程中;如果对四个问题的回答都是“否”,则该变量是
无关变量,可以安全地从方程中删掉它。这是两种容易决
策的情形。
13
但根据以上准则判断并不总是这么简单 。 在很多情况下, 这
四项准则的判断结果会出现不一致 。 例如, 有可能某个变量
加进方程后, 增大, 但该变量不显著 。2R
在选择变量的问题上,应当坚定不移地根据理论而不是满
意的拟合结果来作决定,对于是否将一个变量包括在回归方
程中的问题,理论是最重要的判断准则。如果不这样做,产
生不正确结果的风险很大。
在这种情况下,作出正确判断不是一件容易的事,处理的原
则是将理论准则放在第一位,再多的统计证据也不能将一个理
论上很重要的变量变成“无关”变量。
14
五, 检验误设定的 RESET方法
上面给出了选择解释变量的四条准则 。 可是, 有时
这些准则不能提供足够的信息使研究人员确信其设
定是最恰当的, 在这种情况下, 可考虑使用一些更
正规的检验方法来比较不同估计方程的性质 。 这类
方法相当多, 这里就不一一列出, 仅介绍拉姆齐 ( J.
B,Ramsey) 的回归设定误差检验法 ( RESET法 ) 。
15
RESET检验法的思路
RESET检验法的思路是在要检验的回归方程中加
进 等项作为解释变量,然后看结果是否有
显著改善。如有,则可判断原方程存在遗漏有关变
量的问题或其它的误设定问题。
直观地看,这些添加的项是任何可能的遗漏变量
或错误的函数形式的替身,如果这些替身能够通过 F
检验,表明它们改善了原方程的拟合状况,则我们有
理由说原方程存在误设定问题。
等项形成多项式函数形式,多项式是一
种强有力的曲线拟合装置,因而如果存在误设定,
则用这样一个装置可以很好地代表它们 。
432 ??,? YYY 和
432 ??,? YYY 和
16
RESET检验法的步骤
拉姆齐 RESET检验的具体步骤是:
(1) 用 OLS法估计要检验的方程, 得到
(2) 由上一步得到的值 ( i=1,2,…,n), 计算, 然
后用 OLS法估计:
(3) 用 F检验比较两个方程的拟合情况 ( 类似于上一章中联合
假设检验采用的方法 ), 如果两方程总体拟合情况显著不同,
则我们得出原方程可能存在误设定的结论 。 使用的检验统计
量为:
iii XXY 22110 ???? ??? ???
432 ??,? YYY 和
iY?
iiiiiii uYYYXXY ??????? 45342322110 ??? ??????
17
)1/(
/)(
??
??
knR S S
MR S SR S SF M
其中,RSSM为第一步中回归 ( 有约束回归 ) 的残差平方和,
RSS为第二步中回归 ( 无约束回归 ) 的残差平方和,
M为约束条件的个数, 这里是 M=3。
应该指出的是, 拉姆齐 RESET检验仅能检验误设定的存
在, 而不能告诉我们到底是哪一类的误设定, 或者说, 不
能告诉我们正确的模型是什么 。 但该方法毕竟能给出模型
误设定的信号, 以便我们去进一步查找问题 。 另一方面,
如果模型设定正确, RESET检验使我们能够排除误设定的
存在, 转而去查找其它方面的问题 。
18
第二节 多重共线性
应用 OLS法的一个假设条件是;矩阵 X的秩 =K+1<N。
即自变量之间不存在严格的线性关系, 观测值个数大于待估
计的参数的个数 。 这两条无论哪一条不满足, 则 OLS估计值
的计算无法进行, 估计过程由于数学原因而中断, 就象分母
为 0一样 。
这两种情况都很罕见 。 然而, 自变量之间存在近似的线性
关系则是很可能的事 。 事实上, 在经济变量之间, 这种近似
的线性关系是很常见的 。
当某些解释变量高度相关时, 尽管估计过程不会中断, 但
会产生严重的估计问题, 我们称这种现象为 多重共线性 。 解
释变量间存在严格线性相关关系时, 称为 完全的多重共线性 。
19
一 定义
在实践中, 若两个或多个解释变量高度线性相关,
我们就说模型中存在多重共线性 。
二 后果
1,不改变参数估计量的无偏性;事实上, 对于不完
全多重共线性, 参数估计量仍为 BLUE。 这是因为,
尽管解释变量之间存在多重共线性, 但并不影响扰动
项和解释变量观测值的性质, 故仍有
? ?
? ?
β
)u()(β
)uβ()(
)()?(
1
1
1
?
????
????
???
?
?
?
EXXX
XXXXE
YXXXEE ?
20
2,但各共线变量的参数的 OLS估计值方差很大,即
估计值精度很低。( BLUE表明在各线性无偏估计量
中方差最小,但不等于方差的值很小。)
3 由于若干个 X变量共变,它们各自对因变量的影
响无法 确定。
4,各共线变量系数估计量的 t值低,使得犯第 Ⅱ 类
错误的可能性增加。
由于各共线变量的参数的 OLS估计值方差大,因
而系数估计量的 t值低,使得我们犯第 Ⅱ 类错误(接
受错误的原假设 H0,β j=0)的可能性增加,容易将本
应保留在模型中的解释变量舍弃了。
21
三 多重共线性的判别和检验
1,根据回归结果判别
判别是否存在多重共线性的最简单方法是分析回
归结果 。
如果发现,
系数估计值的符号不对;
某些重要的解释变量 t值低, 而 R2不低;
当一不太重要的解释变量被删除后, 回归结果
显著变化 。
则可能存在多重共线性 。 其中上述第二种现象是多
重共线性存在的典型迹象 。
此方法简便易行, 因而是实践中最常用的方法,
缺点是无 法确诊 。
22
2.使用相关矩阵检验
统计软件一般提供各解释变量两两之间的相关系数
矩阵, 如发现某些相关系数高 ( 绝对值高于 0.8或
0.90), 则表明多重共线性存在 。 但即使解释变量两
两之间的相关系数都低, 也不能排除存在多重共线性
的可能性 。
3.通过条件指数检验
条件指数( Condition index)或条件数 Condition
number)是 X’X矩阵的最大和最小特征根之比的平方
根,条件指数高,表明存在多重共线性。至于什么程
度算高,也没有一个绝对的标准。通常认为大于 10即
存在多重共线性,大于 30表明存在严重多重共线性。
大多数统计软件提供此检验值。
23
4,使用 VIF检验
VIF 是 方差 膨 胀因 子的 英文 (Variance Inflation
Factors) 缩写,这是一种比较正规的检验方法 。 该方法
通过检查指定的解释变量能够被回归方程中其它全部
解释变量所解释的程度来检测多重共线性 。
方程中每个解释变量有一个 VIF,该 VIF是关于多重
共线性使相应的系数估计值的方差增大了多少的一个
估计值。高 VIF表明多重共线性增大了系数估计值的
方差,从而产生一个减小了的 t值。
24
VIF检验的具体步骤如下:
设原方程为:
Y = ?0 + ?1X1 + ?2X2 + … + ?kXk + u
我们需要计算 K个不同的 VIF,每个 Xi一个。为指定
Xi计算 VIF涉及以下三步:
( 1) Xi 对原方程中其它全部解释变量进行 OLS回
归, 例如, 若 i =1,则回归下面的方程:
X1 = ?1 + ?2X2 + ?3X3 +… + ?kXk +v
( 2) 计算方差膨胀因子 (VIF):
其中 Ri2是第一步辅助回归的决定系数 。
)1(
1)?(
2
i
i RV IF ???
25
( 3)分析多重共线性的程度
VIF越高,多重共线性的影响越严重。
由于没有 VIF临界值表,我们只能使用经验法则:
若,则存在严重多重共线性。
也有人建议用 VIF>10作为存在严重多重共线性的标
准,特别在解释变量多的情形应当如此。
需要指出的是,所有 VIF值都低,并不能排除严
重多重共线性的存在,这与使用相关系数矩阵检验
的情况相似。
5)?( ?iV IF ?
26
四 解决多重共线性的方法
思路;加入额外信息 。 具体方法有以下几种:
? 增加数据
? 对模型施加某些约束条件
? 删除一个或几个共线变量
? 将模型适当变形
1.增加数据
多重共线性实质上是数据问题,因此,增加数据
就有可能消除或减缓多重共线性,具体方法包括增
加观测值、利用不同的数据集或采用新的样本。
27
例:需求函数 Yt = β 1+β 2Xt+β 3Pt+ ut
在时间序列数据中,收入( X)和价格( P)往往
是高度相关的,用时间序列数据估计往往会产生多
重共线性。然而,在横截面数据中,则不存在这个
问题,因为某个特定时点 P为常数。如果取一横截面
样本(如从 5000个家庭取得的数据),则可用来估
计
Yi = α 1+α 2Xi+ ui
然后将得到的估计值 作为一个约束条件( β 2 =
)施加于时间序列数据的回归计算中,即估计
Yt - Xt =β 1+β 3Pt+ ut,得到, 。
2??
2??
2?? 1?? 3??
28
2,对模型施加某些约束条件
在存在多重共线性的模型中, 依据经济理论施加某些约
束条件, 将减小系数估计量的方差, 如在 Cobb—Douglas生
产函数中加进规模效益不变的约束, 可解决资本和劳动的
高度相关而引起的多重共线性问题 。
3.删除一个或几个共线变量
这样做, 实际上就是利用给定数据估计较少的参数, 从
而降低对观测信息的需求, 以解决多重共线性问题 。 删除
哪些变量, 可根据假设检验的结果确定 。
应注意的是, 这种做法可能会使得到的系数估计量产生
偏倚, 因而需要权衡利弊 。
29
4,将模型适当变形
例 1,某商品的需求函数为:
其中,Q = 需求量, X = 收入,
P = 该商品的价格, P* = 替代商品的价格
在实际数据中, P和 P*往往呈同方向变动, 它们之间高度
相关, 模型存在多重共线性 。
如果我们仅要求在知道两种商品的相对价格变动时, 对
需求量进行预测, 则可将需求函数变为:
就可以解决多重共线性问题 。
uββββ *3210 ????? PPXQ
vPPXQ ???? )( *321 ???
30
例 2,有滞后变量的情形
Yt = β 1+β 2Xt+β 3 Xt-1 + ut
一般而言, Xt和 Xt –1往往高度相关, 将模型变换
为:
Yt = β 1+β 2( Xt - Xt –1) +β 3′Xt -1+ ut
其中 β 3′=β 3 +β 2
经验表明,△ Xt和 Xt –1的相关程度要远远小于和 Xt
和 Xt –1的相关程度, 因而这种变换有可能消除或减
缓多重共线性 。
31
5.主成分法
可将共线变量组合在一起形成一个综合指数 (变量 ),用
它来代表这组变量 。 构造综合指数的最常用方法是主成分
法 。 主成分法的计算相当复杂, 这里不做介绍 。
同学们需要了解的是,主成分的特点是,各主成分之间
互不相关,并且,用很少几个主成分就可以解释全部 X变
量的绝大部分方差,因而在出现多重共线性时,可以用主
成分替代原有解释变量进行回归计算,然后再将所得到的
系数还原成原模型中的参数估计值。
32
五, 处理多重共线性问题的原则
1,多重共线性是普遍存在的, 轻微的多重共线性
问题可不 采取措施 。
3,如果模型仅用于预测,则只要拟合好,可不处
理多重共线性问题,存在多重共线性的模型用于
预测时,往往不 影响预测结果。
2,严重的多重共线性问题,一般可根据经验或通
过分析回归结果发现。如影响系数的符号,重要的
解释变量 t 值很低。要根据不同情况采取必要措施
。
33
第三节 异方差性
回顾我们应用 OLS法所需假设条件, 其中大部分
是有关扰动项的统计假设, 它们是:
( 1) E(ut)=0,t=1,2,…,n,扰动项均值为 0
( 2) Cov(ui,uj) = E(uiuj) =0,i≠j,扰动项相互独立
( 3) Var(ut) = E(ut2) = ?2,t=1,2,…,n,常数方差
( 4) ut ~ N(0,?2),正态性
对于 ( 1), 我们可论证其合理性 。 而第 ( 4) 条,
也没有多大问题 。 大样本即可假定扰动项服从正态
分布 。 而对于 ( 2), ( 3) 两条, 则无法论证其合
理性 。 实际问题中, 这两条不成立的情况比比皆是 。
下面即将讨论它们不成立的情况, 即异方差性和自
相关的情形 。
34
一 异方差性及其后果
1,定义
若 Var(ut) = = 常数的假设不成立, 即
Var(ut) = ≠常数, 则称扰动项具有异方差性 。
2?
2t?
2,什么情况下可能发生异方差性问题?
解释变量取值变动幅度大时,常数方差的假设往
往难以成立。异方差性主要发生在横截面数据的情况,
时间序列问题中一般不会发生,除非时间跨度过大。
35
例,Yi = α +β Xi+ ui
其中,Y=指定规模和组成的家庭每月消费支出
X=这样的家庭的每月可支配收入
设 X的 N个观测值取自一个家庭可支配收入的横截
面样本 。 某些家庭接近于勉强维持生存的水平, 另
一些家庭则有很高的收入 。 不难设想, 低收入家庭
的消费支出不大可能离开他们的均值 E(Y)过远, 太
高无法支持, 太低则消费将处于维持生存的水平之
下 。 因此, 低收入家庭消费支出额的波动应当较小,
因而扰动项具有较小的方差 。 而高收入家庭则没有
这种限制, 其扰动项可能有大得多的方差 。
这就意味着异方差性 。
36
3,异方差性的后果
( 1) 参数估计量不再具有最小方差的性质
异方差性不破坏 OLS估计量的无偏性, 但不再是有效的 。
事实上, 异方差性的存在导致 OLS估计量既不是有效的,
也不具有渐近有效性 。
( 2) 系数的显著性检验失去意义
更为严重的是, 在异方差性的情况下, 矩阵 主对
角元素不再是 OLS估计量方差的无偏估计量, 从而导致系数的
置信区间和假设检验结果不可信赖 。
例如在双变量模型中, 如果 倾向于低估 的真
实方差, 则置信区间可能要比实际的窄, 给我们一个错误信
息, 好象得到 的点预测值很精确 。
? 22 /? x? ??
21 ?)( ???XX
37
二 异方差性的检验
异方差性后果的严重性意味着我们在实践中必须了
解是否存在异方差性 。
常用的检验方法有:
斯皮尔曼等级相关检验法 (Spearman Rank Relation test)
戈德弗尔德 —匡特检验法 (Goldfeld Quandt test)
格里瑟检验法 ( Glesjer test)
帕克检验法 ( Park test)
怀特检验法 (White’s General Heteroscedasticity test)
38
1,斯皮尔曼等级相关检验法
思路:
将异方差性与扰动项 u和某个解释变量 X之间的相关程度挂
钩 ( 即 与 Xt 的大小有关 ), 从而将对异方差性的研究
转化为对 ut与 Xt的相关程度的研究 。
由于扰动项无法观测, 因而用残差代替之, 转化为对 et与 Xt
的相关程度的研究, 若 et与 Xt高度相关, 则可推断异方差性存
在 。
在此无法用相关系数来检验, 因为 et与 Xt的相关系数恒等于
0:
因而改用 Xt和 ︱ et︳ 的等级相关系数检验 et和 Xt的相关程度 。
2t?
0
)()()()(
))((
2222
?
??
??
?
??
??
?
? ?
? ? ?
? ?
?
eeXX
xeeXeX
eeXX
eeXX
r tttt
39
等级相关系数的计算步骤
( 1) 将两变量的相应观测值分别按升序 ( 或降序 ) 排序,
所得到的序号即为等级 。
( 2) 计算两变量各观测值相应的等级之差 dt.
( 3) 计算等级相关系数
)12(
26
1
?
?
??
nn
tdr
40
例:等级相关系数的计算
假设我们有 Xt和 et如下:
Xt 25,40,52,58,65
et 1.6,-2.9,-10.7,–14.8,5.7
我们有 ︱ et︳ 1.6,2.9,10.7,14.8,5.7
Xt的等级 ︱ et︳ 的等级 dt
1 1 0
2 2 0
3 4 -1
4 5 -1
5 3 2
r = 1 – (6*6)/(5*24) = 1 - 0.3 = 0.7
计算出等级相关系数后, 就可判断异方差性是否存在 。 若相
关系数绝对值高, 则存在异方差性 。
对于多个解释变量的情况, 可分别计算 ︱ et︳ 与各解释变量
的等级相关系数进行检验 。
41
2.戈德弗尔德 ——匡特检验法
基本思路:假定 随 Yt的数值大小变动 。
检验步骤:
( 1) 将数据分为三组:小 Yt值组, 中 Yt值组, 大 Yt值组
( 数据项大致相等 )
( 2) 对小 Yt值组估计模型, 给出
( 3) 对大 Yt值组估计模型, 给出
2t?
1? 1
2
2
1 ???
?
kn
e?
1
?
3
2
2
3 ???
?
kn
e
?
42
( 4) H0:
H1,( 或 )
检验统计量为 F0 = ~ F( n3-k-1,n1-k-1)
若 F0> Fc,则拒绝 H0,存在异方差性 。
例,S=α +β Y + u 其中,S=储蓄 Y=收入
设 1951—60年, =0.01625
1970—79年, =0.9725
F0 = 0.9725/0.01625=59.9
查表得, d.f.为 ( 8,8) 时, 5% Fc=3.44
∵F 0> Fc 因而 拒绝 H0。
结论:存在异方差性 。
2321 ?? ?
2321 ?? ? 2321 ?? ?
2
1
2
3
?
?
?
?
21??
23??
43
三 广义最小二乘法
1,消除异方差性的思路
基本思路:变换原模型, 使经过变换后的模型具有同方差
性, 然后再用 OLS法进行估计 。
对于模型
Yt = β 0+β 1X1t+… +β k Xkt+ ut ( 1)
若扰动项满足 E(ut) = 0,E(uiuj) = 0,i≠j,但
E(ut2) = ≠常数,
也就是说, 该模型只有同方差性这一条件不满足, 则只要
能将具有异方差性的扰动项的方差表示成如下形式:
Var(ut) =, t=1,2,…, n
其中 为一未知常数, 表示一组已知数值, 则用 λ t去除
模型各项, 得变换模型,
2t?
222 tt ??? ?
2? 2t?
44
( 2)
由于
所以变换后的扰动项的方差为常数, 可以应用 OLS法进行
估计, 得到的参数估计量为 BLUE。 但这里得到的 OLS估
计量是变模后模型 ( 2) 的 OLS估计量 。 对于原模型而言,
它已不是 OLS估计量, 称为广义最小二乘估计量 ( GLS估
计量 ) 。
t
t
t
Kt
K
t
t
tt
t uXXY
??????
?
? ?????,..
1
1
0
222
22
1)(1)( ???
??? ??? ttttt
t uV a ruV a r
45
2,广义最小二乘法 (Generalized least squares)
下面用矩阵形式的模型来推导出 GLS估计量的一
般计算公式 。
设 GLS模型为 Y=Xβ +u ( 1)
满足 E(u) = 0,E(uu′)=?2Ω, X 非随机,
X的秩 =K+1< n,其中 Ω 为正定矩阵 。
( 注, 正定矩阵是和单位矩阵合同的矩阵;
正定矩阵 <=>所有顺序主子式均大于 0。 )
46
根据矩阵代数知识可知,对于任一正定矩阵 Ω,存在着一
个满秩(非退化,非奇异)矩阵 P,使得
用 P-1左乘原模型( 1)(对原模型进行变换):
令 Y* =P-1Y,X* = P-1X,u* = P-1u,得到
Y*= X*β + u* ( 2)
下面的问题是,模型( 2)的扰动项 u*是否 满足 OLS法的
基本假设条件。
111 )(,??? ?????? PPPP
uPXPYP 111 ??? ?? ?
47
))(()( 11** ???? ?? PuuPEuuE
))(( 11 ??? ?? PuuEP
))(( 121 ??? ?? PP ?
))(( 112 ??? ?? PPPP?
))(( 112 ?? ?? PPPP?
I2??
我们有
48
这表明, 模型 ( 2) 中的扰动项 u*满足 OLS法的基本假设,
可直接用 OLS估计, 估计量向量
这就是 的广义最小二乘估计量 ( GLS估计量 ) 的公式, 该
估计量是 BLUE。
从上述证明过程可知, 我们可将 GLS法应用于 Ω 为任意正定
矩阵的情形 。
**1** )(? YXXX ??? ??
YPPXXPPX 11111 )())(( ????? ?????
YXXX 111 )( ??? ?????
??
49
如果只存在异方差性, 则
其中
我们显然有
??? 2)( ?uuE
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
2
2
2
2
1
2
.......000
........
0......00
0......00
n
?
?
?
?
ntt,......,2,1,02 ???
PP
n
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
...,..,000
...,..,.
0...,..00
0...,..00
2
1
50
)(
1.......000
........
0......010
0......001
1
2
1
1
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
PP
n
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
2
2
2
2
1
1
1.......000
........
0......010
0......001
n
?
?
?
51
四 广义最小二乘法的应用
1,根据实际问题确定 Ω 矩阵
应用 GLS法的关键是确定 Ω 矩阵 。 对于仅存在异方差性的
实际问题, Ω 矩阵是一个对角矩阵, 即
现在的问题是, 的值为已知这一假设是否现实, 也就是
我们能否根据实际问题, 提出有关扰动项方差的某种合理的
设想 ( 即估计 Ω 矩阵 ), 使得
( 为未知常数, 为已知数值 )
下面通过例子说明这一问题 。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
2
2
1
......,000
......,.
0......00
0......00
n
?
?
?
2t?
2t?222 tt ??? ? 2?
52
例 1 Yt = β 1+β 2Xt+ ut t=1,2,…,n.
其中 Y=家庭消费支出 X=家庭可支配收入
我们在前面已分析过, 高收入家庭有较大的扰动项方差,
因此不妨假定扰动项方差与可支配收入成正比, 即
Var(ut)=δ Xt,t=1,2,…,n.
式中 δ 是一未知常数, 由于 Xt为已知, 相当于, 而 δ 相
当于, 因此
应用 GLS法, 即可得出 β 的 GLS估计量 。
?
?
?
?
?
?
?
?
?
?
?
?
??
n
X
X
X
..,..,..000
..,..,..
0..,..,00
0..,..,00
? 2
1
2t?
2?
53
2,格里瑟检验法 ( Glesjer test)
在上例中我们假设扰动项方差与解释变量的取值成正比,
这种假设是否真正合理呢? 根据经验和分析做出的这种假设,
虽然有一定道理, 但未免显得过于武断, 这方面还可做一些
比较细致的工作 。
Glesjer检验法不仅可检验异方差性的存在, 还可用于提供
有关异方差形式的进一步信息, 对于确定 Ω 矩阵很有用, 下
面我们扼要说明格里瑟检验法的步骤 。
格里瑟检验法的思路是假定扰动项方差与解释变量之间存
在幂次关系, 方法是用 对被认为与扰动项方差有关的解释
变量回归, 确定 和该解释变量的关系 。 由于与该解释变量
之间关系的实际形式是未知的, 因此需要用该解释变量的不
同幂次进行试验, 选择出最佳拟合形式 。
te
te
54
具体步骤如下:
(1)因变量 Y对所有解释变量回归, 计算残差 et
( t=1,2,…,n)
( 2) 对所选择解释变量的各种形式回归, 如
然后利用决定系数, 选择拟合最佳的函数形式 。
( 3) 对 β 1进行显著性检验, 若显著异于 0,则表明存在异
方差性, 否则再试其它形式 。
................
1
10
10
10
2
10
t
jt
t
tjtt
tjtt
tjtt
u
X
e
uXe
uXe
uXe
???
???
???
???
??
??
??
??
te
55
格里瑟检验法的最大优点是能够提供有关异方差性形式的
信息, 为 GLS法提供 Ω 矩阵 。 缺点是太繁琐 。 因此建议用其
它方法检验异方差性的存在, 然后再用格里瑟法确定异方差
性的具体形式, 进而应用 GLS法 。
例 2 Yt = β 1+β 2X1t+… +β k Xkt+ ut
假设我们根据经验知道扰动项方差与 Xjt有关, 并用 格里瑟
法试验, 得出:
则
jtt X?? ?2
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
jn
j
j
X
X
X
.....,..000
.....,..
0.....,00
0.....,00
? 2
1
56
3,加权最小二乘法
对于仅存在异方差性的问题, 其 Ω 矩阵是一个对角矩阵,
即
在这种情况下应用 广义最小二乘法, 也就是在原模型两端
左乘 矩阵
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
2
2
1
n
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
P
?
?
?
1
......
1
1
2
1
1
变换 原模型,再对 变换 后的模型应用普通最小二乘法进行估计。
57
这种作法实际上等价于在代数形式的原模型
Yt = β 0+β 1X1 t+… +β k X k t+ u t 的两端除以 ? t,得 变换 模
型:
t
t
t
Kt
K
t
t
tt
t uXXY
??????
?
? ????? ?
1
1
0
这种作法相当于在回归中给 应变量和解释变量的每个观测值
都赋予一个与相应 扰动项的方差相联系的权数
,然后再对这些变换后的数据进行 OLS回归, 因为这种作法相
当于每个观测值都以相应 扰动项的 标准差的估计值 的倒数
( 即 ) 为权数, 因而被称为 加权最小二乘法 ( WLS法,
Weighted Least Squares) 。
),...,2,1,1( ntt ??
t?
1 t
??
58
加权最小二乘法是广义最小二乘法的一个特例,在 Ω 矩阵
为对角矩阵这种特殊情形下,我们既可以直接应用矩阵形式
的 广义最小二乘 估计量公式得到 GLS估计值,亦可避开矩阵运
算,采用 加权最小二乘法 得到其 WLS估计值,两者结果完全相
同,无论你称之为 GLS估计值还是 WLS估计值,二者是一码事。
例, ( 1)
其中,Y=R&D支出, X=销售额
采用美国 1988年 18个行业的数据估计上述方程, 结果如
下 ( 括号中数字为 t值 ),
这里是横截面数据, 由于行业之间的差别, 可能存在 异
方差性 。
iii uXY ??? 21 ??
)8 4 3 4.3()1 9 4 8.0(
4 7 8 3.00 3 1 9.099.192? 2 ??? RXY ii
59
应用 格里瑟法试验,得到 异方差性形式为:
ii X?? ?2
将原模型 ( 1) 的两端除以, 得
用 OLS法估计 ( 2) 式, 结果如下 ( 括号中数字为 t值 ),
与 ( 1) 式的结果比较, 两个方程斜率系数的估计值相差
不大, 但 采用 WLS法估计的比直接用 OLS法估计的系数更为显
著, 这表明 OLS法高估了 X系数的标准差 。
iX
)2(1 21
i
i
i
ii
i
X
uX
XX
Y ??? ??
)172.5()647.0(:)(
6 2 5 8.00 3 6 8.0
1
68.246
?
2
?
??????
?
?
?
?
?
?
t
RX
XX
Y
i
ii
i
60
第四节 自相关
一 定义
若 Cov(ui,uj) = E(uiuj) =0,i≠j不成立, 即线性回归模型
扰动项的方差 —协方差矩阵的非主对角线元素不全为 0,则
称为扰动项自相关, 或序列相关 ( Serial Correlation) 。
二 自相关的原因及后果
1,原因
自相关主要发生在时间序列数据的情形, 因而亦称为序列
相关, 主要有以下两种原因:
( 1) 冲击的延期影响 ( 惯性 )
在时间序列数据的情况下, 随机冲击 ( 扰动 ) 的影响往往
持续不止一个时期 。 例如, 地震, 洪水, 罢工或战争等将在
发生期的后续若干期中影响经济运行 。
61
微观经济中也与此类似,如一个工厂的产量,由于某种
外部偶然因素的影响(如某种原材料的供应出了问题),该
厂某周产量低于正常水平,那么,随后的一周或几周中,由
于这种影响的存在或延续,产量也很可能低于正常水平(即
扰动项为负)。
不难看出,观测的周期越长,这种延期影响的严重性就
越小,因此,年度数据比起季度数据来,序列相关成为一个
问题可能性要小。
( 2)误设定
如果忽略了一个有关的解释变量, 而该变量是自相关的,
则将使扰动项自相关, 不正确的函数形式也将导致同样后果 。
在这些情况下, 解决的方法是纠正误设定 。 本章后面将介绍
的纠正自相关的方法都不适用于这种情况的自相关 。
62
2,后果
自相关的后果与异方差性类似 。
( 1) 在扰动项自相关的情况下, 尽管 OLS估计量
仍为无偏估计量, 但不再具有最小方差的性质,
即不是 BLUE。
( 2) OLS估计量的标准误差不再是真实标准误差
的无偏估计量, 使得在自相关的情况下, 无法
再信赖回归参数的置信区间或假设检验的结果 。
63
三 自相关的检验
1,检验一阶自相关的德宾 —沃森检验法 ( Durbin—Watson test)
( 1) 一阶自相关
自相关的最简单模式为:
ut = ρ ut-1 + ε t,t=1,2,…,n.
其中 ρ 称为自相关系数 ( -1≤ ρ ≤ 1), 这种扰动项的自
相关称为一阶自相关, 即扰动项仅与其前一期的值有关 。 我
们有:
ρ >0 正自相关
ρ <0 负自相关
ρ =0 无自相关
64
在一阶自相关 模式 中,假定 ε t具有以下性质:
E(ε t) = 0,E(ε t2) = ζ 2 = 常数,
E(ε iε j)=0,i≠ j,ε t服从正态分布。
在计量经济学中,具备上述性质的量称为白噪
声( White noise),表示为
ε t= White noise
或
ε t= 白噪声
65
( 2) 德宾 —沃森检验法 (Durbin- Watson d test)
统计软件包和研究报告在提供回归结果时通常都给出
DW( 或 d) 统计量的值, 该统计量是从 OLS回归的残差中
计算得来的, 它被用于一阶自相关的检验, 计算公式为:
DW和一阶自相关系数 ρ 的估计值之间存在以下近似关系:
DW ≈ 2 - 2
由于 -1 ≤ ρ ≤ 1,因而 0 ≤ DW ≤ 4。
不难看出, 直观判断准则是, 当 DW统计量接近 2时, 则无自
相关, DW值离 2越远, 则自相关存在的可能性越大 。
?
?
?
?
??
?
n
t
t
n
t
tt
e
ee
DW
1
2
2
2
1 )(
??
66
DW检验的缺陷
我们当然期望能够有一张能够给出相应的 n,k和 α 值下
各种 DW临界值的表 ( 就象 t检验, F检验一样 ), 使得我们
可以按常规假设检验那样根据临界值作出判断 。 这样的表
是根据检验统计量在原假设成立的情况下的抽样分布编制
的 。
不幸的是, DW统计量的分布依赖于解释变量的具体观测
值 ( 即依赖于 X矩阵 ) 。 因此不象 t,F检验那样, 有一张
能够给出 DW临界值的表 。
为解决这一问题, 德宾 和 沃森证明, DW统计量的真实
分布位于两个极限分布之间, 这两个分布分别称为下分布
和上分布, 如下图所示:
67
概率
密度
下分布 上分布
0 A B C D DW值
每个分布的 95%临界水平用 A,B,C,D表示。
68
现假设 DW统计量的值位于 A的左边, 则不管这种情况下
的 DW统计量服从何种分布 ( 上, 下或中间 ), 无自相关的
原假设将被拒绝 。 与此类似, 若 DW统计量的值位于 D的右
边, 则亦可拒绝无自相关的原假设 。
若 DW统计量的值位于 B和 C之间, 则可接受原假设 。 而
当 DW统计量的值位于 A和 B之间或 C和 D之间时, 则无法得
出结论 。 上述分析可以概括为:
DW<A或 DW>D 存在自相关
B<DW<C 无自相关
A<DW<B或 C<DW<D 无结论区
无结论区的存在是 DW法的最大缺陷 。
德宾 和 沃森据此导出了一个下界 dL和一个上界 du来检验
自相关,dL和 du仅依赖于观测值的数目 n、解释变量 k,以及
显著性水平 α,而不依赖于解释变量所取的值。(请参阅
DW表)
69
实际的检验程序可用下面的示意图说明 。
正自相关 无结论区 无自相关 无结论区 负自相关
0 dL du 2 4—du 4—dL 4
检验程序如下:
a,用 OLS法对原模型进行回归, 得残差 et (t=1,2,…,n)。
b,计算 DW值(计算机程序给出 DW值)。
c,用 N,K和 α 查表得 dL,du。
d,判别
70
若 DW < dL,则存在正相关
若 DW< 2 若 dL < DW < du,无结论
若 du < DW,则无自相关
若 DW>2,则令 DW′= 4 - DW,按上述准则进行判别。
例,DW=3.5,则 DW′= 4 - 3.5 = 0.5
查表 ( n=30,k=2,α =5%) 得,dL =1.28。
DW′=0.5 < 1.28
结论:存在自相关 。
71
2,其它检验自相关的方法
DW检验法只能检验一阶自相关, 并且, 如果方程中包括
滞后因变量 ( 如 Yt-1,Yt-2等 ) 时, 用 DW法检验容易产生偏差 。
因此, 在碰到较复杂的情形, 我们应采用一些其它检验自
相关的方法 。 下面列出几种方法及其适用环境 。
检验方法 适用环境
Durbin-Watson d检验法 一阶自相关, 方程中无 Y的滞后项
Durbin’s h 检验法 一阶自相关, 方程中有 Yt-1
Box-Pierce检验法 一般自相关 ( 一阶, 二阶, …, K阶 )
LM检验法 一般自相关 ( 一阶, 二阶, …, K阶 )
72
四 消除自相关的方法
1,一阶自相关
如果实际问题的自相关模式为一阶自相关, 则只要知道 ρ,
就可以完全消除自相关, 下面用双变量模型来说明, 但同样
的原理适用于多个解释变量的情形 。
设 Yt = α +β Xt+ ut ( 1)
ut=ρ ut-1+ε t
其中 ε t是白噪声, 且 ρ ≠ 0。
( 1) 式两端取一期滞后, 得
Yt-1 = α +β Xt-1+ ut -1 ( 2)
( 2) 式两端乘以 ρ, 得
ρ Yt-1 = αρ+βρXt-1 + ρ ut -1 ( 3)
73
( 1) -( 3),得:
Yt -ρ Yt-1 = α (1-ρ )+β (Xt-ρ Xt-1) + (ut -ρ ut -1) ( 4)
( 4)式中的扰动项为 ut -ρ ut–1 =ε t,从而满足标准假设
条件。
令 Yt′= Yt -ρ Yt-1 Xt′= Xt-ρ Xt-1
α ′=α (1-ρ ),有
Yt′ = α ′+β Xt′+ ε t ( 5)
若 ρ 为已知,我们就可用 OLS法直接统计( 5)式,否则需
要先估计 ρ 。
在 ρ 未知的情况下,通常用下列两种方法。
74
( 1) 科克伦 —奥克特法 ( Cochrane—Orcutt)
科克伦 —奥克特法是一个迭代过程, 步骤如下:
① 估计原模型 (( 1 ) 式 ), 计算 OLS 残差 et
( t=1,2,…,n) 。
② et对 et-1回归, 即估计 et=ρ et-1+ε t,得到 ρ 的估计值
③ 用 产生
然后估计 Yt′ = α ′+β Xt′+ ε t, 得到 α 和 β 的估计值
和 。
④ 重新计算残差, 返回第 ② 步 。
此过程不断修改, 和, 直至收敛 。
??
1? ???? ttt YYY ? 1? ???? ttt XXX ?
?? ??
??????
??
75
( 2) 希尔德雷斯 —卢法 ( Hildreth—lu)
此方法实际上是一种格点搜索法 ( Grid search),即在 ρ
的预先指定范围 ( 如 -1至 1) 内指定格点之间距离 ( 如 0.01),
然后用这样产生的全部 ρ 值 ( -1.00,-0.99,…, 1.00) 产
生
Yt′= Yt -ρ Yt—1 Xt′= Xt-ρ Xt—1
估计
Yt′ = α ′+β Xt′+ ε t
产生最小标准误差的 ρ 值即作为 ρ 的估计值, 用该 ρ 值得
到的 和 即为原模型的系数估计值 。?? ??
76
2,一般自相关
对于一般自相关问题, 我们可采用广义最小二乘法处理 。
自相关意味着扰动项 u的方差 —协方差矩阵
E(u12) E(u1u2) … E(u1un)
E(uu′) = E(u2u1) E(u22) … E(u2un)
…… …… …… …… ……
E(unu1) E(unu2) … E(un2)
中某些 E( uiuj) ≠ 0,i≠ j.即
E(uu’)=ζ 2Ω,
其中 Ω 为对称正定矩阵 。 因而可应用 GLS法 。 此方法可用
于任何类型的自相关, 步骤如下:
77
( 1) 规定自相关的形式
例:
( 2) 用代数方法确定 E(uu’) 矩阵的元素 E(ut2),E(utut-1),
E(utut-2),…,即用 ?1,? 2,…,?2等未知值表示上述元素,
于是得到了 Ω 矩阵 。
( 3) 用 OLS法得到原方程的最小二乘残差 e1,e2,…,en,然
后根据这些残差估计 ?1,?2,…,得到其估计值
代入上一步得到的 Ω 矩阵, 从而给出全部元素为已知的
矩阵 。
( 4) 计算
tttt uuu ??? ??? ?? 2211
,...,?,? 21 ??
??
YXXXG L S 111 ?)?(? ??? ??????
78
第五章 小结
一, 误设定
误设定包括函数形式的误设定和解释变量的误设定 。 我们
重点介绍了两种类型的误设定 。
1,模型中忽略了有关的解释变量
其后果是使参数估计量产生偏倚, 即 OLS估计量不再是无偏
估计量 。
2,模型中包括了无关的解释变量
其后果是增大了估计量的方差, 但估计量仍无偏 。
在实际工作中, 我们可用拉姆齐 RESET检验法检验模型是否
误设定, 但仍无法准确判断是何种类型的误设定 。 一般原则
是尽量不漏掉与因变量有关的解释变量尤其是理论上重要的
变量, 判断一个变量是否应加进回归方程中, 可依据本章介
绍的四项准则 。
79
二, 多重共线性
当解释变量之间存在着高度相关时, 就会发生多重共线性 。
多重共线性虽然不影响参数估计量的无偏性, 但会造成参数
估计量的高方差, 精度差和低 t值, 犯第 Ⅱ 类错误的可能性增
加,。
多重共线性可通过回归结果进行判断, 可以通过解释变量的
相关系数矩阵检验, 还可用条件指数检验 。
解决多重共线性问题主要从以下两个方向进行:
1,减少要估计的参数, 即利用给定的数据估计较少的参数 。
2、改变数据,即增加信息。
这是一个要在实践中反复摸索的问题 。
80
三, 异方差性
若 Var( ut) = σ2 = 常数 的假设不成立, 则称扰动项具有
异方差性 。
异方差性主要发生在横截面数据或时间跨度很大的时间
序列数据的情形 。
1,异方差性的后果
( 1) 虽然 OLS估计量仍是无偏的, 但不再具有最小方差的
性质, 即不再是有效的 。
( 2) 系数的置信区间和显著性检验结果不可信赖 。
2,异方差性的检验
常用的检验方法有斯皮尔曼等级相关检验法, 戈德弗尔德
-夸特检验法和格里瑟检验法 。 建议采用前两种方法检验异
方差性的存在, 用格里瑟检验法确定异方差性的形式 。
81
3,广义最小二乘法 ( GLS法 )
GLS模型 Y=Xβ+μ
满足 E( μ) =0,E( μμ’) =σ2Ω,X非随机
且 Rank( X) =k+1<n,Ω为正定矩阵, 则 GLS估计量
为 BLUE。
4,用 GLS法消除异方差性
如果仅存在异方差性, 则 Ω矩阵可假设为一个对角矩阵,
即
>0,t=1,2,…, n
问题转化为如何确定 ( t=1,2,…, n) 的值, 这需要
根据具体问题而定 。 在没有明确线索时, 通常采用格里瑟
法通过实验确定之 。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
n
2
2
2
1
?
?
?
? 2t?
2t?
YXXXG L S 111 )(? ??? ??????
82
四, 自相关
若 cov(ui,uj) = E(μiμj) =0,i≠j 不成立, 则我们说存在着扰动
项的自相关, 自相关也称为序列相关 。
当我们应用时间序列数据时, 往往会碰到自相关的问题 。 此
外, 遗漏有关的解释变量也可能产生自相关的现象 。 自相关
的后果与异方差性的后果类似 。
最常用的自相关检验法是德宾 -沃森检验法 。 DW法适用于一
阶自相关模式:
ut=ρut-1+εt
且方程中不包括因变量的滞后项的情形 。
其它方法包括适用于方程中有 Yt-1项的 h检验法 ( 检验一阶自
相关 ), 以及检验一般自相关的 Box-Pierce法和 LM法 。
83
一阶自相关的消除,通常采用科克伦 -奥克
特法或希尔德雷斯 -卢法估计自相关系数 ρ,得
到其估计值后,对原模型进行变换,以消除扰
动项的自相关型,得到原模型参数的估计值。
一般自相关的消除,可采用 GLS法处理。
84
第五章 习题
1,检验下列情况下是否存在扰动项的自相关 。
(1) DW=0.81,n=21,k=3
(2) DW=2.25,n=15,k=2
(3) DW=1.56,n=30,k=5
2,有人建立了一个回归模型来研究我国县一级的教育支出:
Y=β0+β1X1+β2X2+β3X3+ u
其中,Y,X1,X2 和 X3分别为所研究县份的教育支出, 居民
人均收入, 学龄儿童人数和可以利用的各级政府教育拨款 。
他打算用遍布我国各省, 市, 自治区的 100个县的数据来
估计上述模型 。
( 1) 所用数据是什么类型的数据?
( 2) 能否采用 OLS法进行估计? 为什么?
(3) 如不能采用 OLS法, 你认为应采用什么方法?
85
3,试从下列回归结果分析存在问题及解决方法:
( 1) = 24.7747 + 0.9415 - 0.0424 R=0.9635
(SE,) ( 6.7525) ( 0.8229) ( 0.0807)
其中,Y=消费, X2=收入, X3=财产, 且 n=5000
附,5%显著性水平下, tc(∞)=1.96
(2) = 0.4529 - 0.0041t R=0.5284
(t,) (-3.9606) DW=0.8252
其中 Y=劳动在增加值中 份额, t=时间
该估计结果是使用 1949-1964年度数据得到的 。
i2? i3?i??
i??
第五章 模型的建立与估计中的
问题及对策
2
我们已学到了许多有用的计量经济分析方法, 如建立
模型, 估计参数, 假设检验, 预测, 非线性模型的线性
化, 用虚拟变量将定性因素引入模型等 。
可是, 我们所使用的最小二乘法, 以及由此而得到的
OLS估计量令人满意的性质, 是根据一组假设条件而得到
的 。 在实践中, 如果某些假设条件不能满足, 则 OLS就不
再适用于模型的估计 。 在这种情况下, 分析方法就需要
改变 。 下面列出实践中可能碰到的一些常见问题:
l 误设定 ( Misspecification 或 specification error)
l 多重共线性( Multicollinearity)
l 异方差性( Heteroscedasticity)
l 自相关( Autocorrelation)
本章将对上述问题作简要讨论, 主要介绍问题的后果,
检测方法和解决途径 。
3
第一节 误设定
采用 OLS法估计模型时, 实际上有一个隐含的
假设, 即模型是正确设定的 。 这包括两方面的含
义:函数形式正确和解释变量选择正确 。 在实践
中, 这样一个假设或许从来也不现实 。 我们可能
犯下列三个方面的错误:
l 选择错误的函数形式
l 遗漏有关的解释变量
l 包括无关的解释变量
从而造成所谓的, 误设定, 问题 。
4
一, 选择错误的函数形式
这类错误中比较常见的是将非线性关系作为线性关系处理。
函数形式选择错误,所建立的模型当然无法反映所研究现象
的实际情况,后果是显而易见的。因此,我们应当根据实际
问题,选择正确的函数形式。
我们在前面各章的介绍中采用的函数形式以线性函数为主,
上一章介绍了应变量和解释变量都采用对数的双对数模型,
下面再介绍几种比较常见的函数形式的模型, 为读者的回归
实践多提供几种选择方案 。 这几种模型是:
? 半对数模型
? 双曲函数模型
? 多项式回归模型
5
1,半对数模型
半对数模型指的是应变量和解释变量中一个为对数形式而
另一个为线性的模型 。 应变量为对数形式的称为 对数 -线性模
型 (log-lin model)。 解释变量为对数形式的称为 线性 -对数模
型 (lin-log model)。 我们先介绍前者, 其形式如下:
对数 -线性模型中, 斜率的含义是 Y的百分比变动, 即解释
变量 X变动一个单位引起的应变量 Y的百分比变动 。 这是因
为, 利用微分可以得出:
ttt uXY ??? 10ln ??
)1(1ln1 ???????????????? dXYdYdXdYYdX Yd ??
6
这表明, 斜率度量的是解释变量 X的单位变动所
引起的应变量 Y的相对变动 。 将此相对变动乘以 100,
就得到 Y的百分比变动, 或者说得到 Y的增长率 。
由于对数 -线性模型中斜率系数的这一含义, 因而也
叫 增长模型 (growth model)。 增长模型通常用于测
度所关心的经济变量 ( 如 GDP) 的增长率 。 例如,
我们可以通过估计下面的半对数模型
得到一国 GDP的年增长率的估计值, 这里 t为时间趋
势变量 。
tt utGD P ??? 10)l n ( ??
7
线性 -对数模型的形式如下:
与前面类似, 我们可用微分得到
因此
这表明
ttt uXY ??? ln10 ??
??????? XdXdY 11?
XdX
dY
dX
dYX ??
1?
XX
Y
X
Y
?
???
的相对变动
的绝对变动
1?
?????? ??? XXY 1?
上式表明, Y的绝对变动量等于 乘以 X的相对变动量 。 因
此,线性 -对数模型通常用于研究解释变量每变动 1%引起的
因变量的绝对变动量是多少这类问题 。
1?
8
2,双曲函数模型
双曲函数模型的形式为:
不难看出, 这是一个仅存在变量非线性的模型, 很容易用
重新定义的方法将其线性化 。
双曲函数模型的特点是, 当 X趋向无穷时, Y趋向, 反
映到图上, 就是当 X趋向无穷时, Y将无限靠近其渐近线
( Y= ) 。
双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯
曲线 。
t
t
t uXY ???
?
?
???
??? 1
10 ??
0?
0?
9
3,多项式回归模型
多项式回归模型通常用于描述生产成本函数, 其一般形式
为:
其中 Y表示总成本, X表示产出, P为多项式的阶数, 一般
不超过四阶 。
多项式回归模型中, 解释变量 X以不同幂次出现在方程的
右端 。 这类模型也仅存在变量非线性, 因而很容易线性化,
可用 OLS法估计模型 。
iPiPiii uXXXY ?????? ????,,,,,,2210
10
二, 遗漏有关的解释变量
模型中遗漏了对因变量有显著影响的解释变量的
后果是:将使模型参数估计量不再是无偏估计量 。
三, 包括无关的解释变量
模型中包括无关的解释变量, 参数估计量仍无偏,
但会增大估计量的方差, 即增大误差 。
[注 ] 有关上述两点结论的说明请参见教科书 P101-102。
11
四, 解决解释变量误设定问题的原则
在模型设定中的一般原则是尽量不漏掉有关的解释
变量。因为估计量有偏比增大误差更严重。但如果方
差很大,得到的无偏估计量也就没有多大意义了,因
此也不宜随意乱增加解释变量。
在回归实践中,有时要对某个变量是否应该作为解
释变量包括在方程中作出准确的判断确实不是一件容
易的事,因为目前还没有行之有效的方法可供使用。
尽管如此,还是有一些有助于我们进行判断的准则可
用,它们是:
12
选择解释变量的四条准则
1,理论,从理论上看, 该变量是否应该作为解释变量包括
在方程中?
2,t检验:该变量的系数估计值是否显著?
3., 该变量加进方程中后, 是否增大?
4,偏倚,该变量加进方程中后, 其它变量的系数估计值是
否显著变化?
2R 2R
如果对四个问题的回答都是肯定的,则该变量应该包括在
方程中;如果对四个问题的回答都是“否”,则该变量是
无关变量,可以安全地从方程中删掉它。这是两种容易决
策的情形。
13
但根据以上准则判断并不总是这么简单 。 在很多情况下, 这
四项准则的判断结果会出现不一致 。 例如, 有可能某个变量
加进方程后, 增大, 但该变量不显著 。2R
在选择变量的问题上,应当坚定不移地根据理论而不是满
意的拟合结果来作决定,对于是否将一个变量包括在回归方
程中的问题,理论是最重要的判断准则。如果不这样做,产
生不正确结果的风险很大。
在这种情况下,作出正确判断不是一件容易的事,处理的原
则是将理论准则放在第一位,再多的统计证据也不能将一个理
论上很重要的变量变成“无关”变量。
14
五, 检验误设定的 RESET方法
上面给出了选择解释变量的四条准则 。 可是, 有时
这些准则不能提供足够的信息使研究人员确信其设
定是最恰当的, 在这种情况下, 可考虑使用一些更
正规的检验方法来比较不同估计方程的性质 。 这类
方法相当多, 这里就不一一列出, 仅介绍拉姆齐 ( J.
B,Ramsey) 的回归设定误差检验法 ( RESET法 ) 。
15
RESET检验法的思路
RESET检验法的思路是在要检验的回归方程中加
进 等项作为解释变量,然后看结果是否有
显著改善。如有,则可判断原方程存在遗漏有关变
量的问题或其它的误设定问题。
直观地看,这些添加的项是任何可能的遗漏变量
或错误的函数形式的替身,如果这些替身能够通过 F
检验,表明它们改善了原方程的拟合状况,则我们有
理由说原方程存在误设定问题。
等项形成多项式函数形式,多项式是一
种强有力的曲线拟合装置,因而如果存在误设定,
则用这样一个装置可以很好地代表它们 。
432 ??,? YYY 和
432 ??,? YYY 和
16
RESET检验法的步骤
拉姆齐 RESET检验的具体步骤是:
(1) 用 OLS法估计要检验的方程, 得到
(2) 由上一步得到的值 ( i=1,2,…,n), 计算, 然
后用 OLS法估计:
(3) 用 F检验比较两个方程的拟合情况 ( 类似于上一章中联合
假设检验采用的方法 ), 如果两方程总体拟合情况显著不同,
则我们得出原方程可能存在误设定的结论 。 使用的检验统计
量为:
iii XXY 22110 ???? ??? ???
432 ??,? YYY 和
iY?
iiiiiii uYYYXXY ??????? 45342322110 ??? ??????
17
)1/(
/)(
??
??
knR S S
MR S SR S SF M
其中,RSSM为第一步中回归 ( 有约束回归 ) 的残差平方和,
RSS为第二步中回归 ( 无约束回归 ) 的残差平方和,
M为约束条件的个数, 这里是 M=3。
应该指出的是, 拉姆齐 RESET检验仅能检验误设定的存
在, 而不能告诉我们到底是哪一类的误设定, 或者说, 不
能告诉我们正确的模型是什么 。 但该方法毕竟能给出模型
误设定的信号, 以便我们去进一步查找问题 。 另一方面,
如果模型设定正确, RESET检验使我们能够排除误设定的
存在, 转而去查找其它方面的问题 。
18
第二节 多重共线性
应用 OLS法的一个假设条件是;矩阵 X的秩 =K+1<N。
即自变量之间不存在严格的线性关系, 观测值个数大于待估
计的参数的个数 。 这两条无论哪一条不满足, 则 OLS估计值
的计算无法进行, 估计过程由于数学原因而中断, 就象分母
为 0一样 。
这两种情况都很罕见 。 然而, 自变量之间存在近似的线性
关系则是很可能的事 。 事实上, 在经济变量之间, 这种近似
的线性关系是很常见的 。
当某些解释变量高度相关时, 尽管估计过程不会中断, 但
会产生严重的估计问题, 我们称这种现象为 多重共线性 。 解
释变量间存在严格线性相关关系时, 称为 完全的多重共线性 。
19
一 定义
在实践中, 若两个或多个解释变量高度线性相关,
我们就说模型中存在多重共线性 。
二 后果
1,不改变参数估计量的无偏性;事实上, 对于不完
全多重共线性, 参数估计量仍为 BLUE。 这是因为,
尽管解释变量之间存在多重共线性, 但并不影响扰动
项和解释变量观测值的性质, 故仍有
? ?
? ?
β
)u()(β
)uβ()(
)()?(
1
1
1
?
????
????
???
?
?
?
EXXX
XXXXE
YXXXEE ?
20
2,但各共线变量的参数的 OLS估计值方差很大,即
估计值精度很低。( BLUE表明在各线性无偏估计量
中方差最小,但不等于方差的值很小。)
3 由于若干个 X变量共变,它们各自对因变量的影
响无法 确定。
4,各共线变量系数估计量的 t值低,使得犯第 Ⅱ 类
错误的可能性增加。
由于各共线变量的参数的 OLS估计值方差大,因
而系数估计量的 t值低,使得我们犯第 Ⅱ 类错误(接
受错误的原假设 H0,β j=0)的可能性增加,容易将本
应保留在模型中的解释变量舍弃了。
21
三 多重共线性的判别和检验
1,根据回归结果判别
判别是否存在多重共线性的最简单方法是分析回
归结果 。
如果发现,
系数估计值的符号不对;
某些重要的解释变量 t值低, 而 R2不低;
当一不太重要的解释变量被删除后, 回归结果
显著变化 。
则可能存在多重共线性 。 其中上述第二种现象是多
重共线性存在的典型迹象 。
此方法简便易行, 因而是实践中最常用的方法,
缺点是无 法确诊 。
22
2.使用相关矩阵检验
统计软件一般提供各解释变量两两之间的相关系数
矩阵, 如发现某些相关系数高 ( 绝对值高于 0.8或
0.90), 则表明多重共线性存在 。 但即使解释变量两
两之间的相关系数都低, 也不能排除存在多重共线性
的可能性 。
3.通过条件指数检验
条件指数( Condition index)或条件数 Condition
number)是 X’X矩阵的最大和最小特征根之比的平方
根,条件指数高,表明存在多重共线性。至于什么程
度算高,也没有一个绝对的标准。通常认为大于 10即
存在多重共线性,大于 30表明存在严重多重共线性。
大多数统计软件提供此检验值。
23
4,使用 VIF检验
VIF 是 方差 膨 胀因 子的 英文 (Variance Inflation
Factors) 缩写,这是一种比较正规的检验方法 。 该方法
通过检查指定的解释变量能够被回归方程中其它全部
解释变量所解释的程度来检测多重共线性 。
方程中每个解释变量有一个 VIF,该 VIF是关于多重
共线性使相应的系数估计值的方差增大了多少的一个
估计值。高 VIF表明多重共线性增大了系数估计值的
方差,从而产生一个减小了的 t值。
24
VIF检验的具体步骤如下:
设原方程为:
Y = ?0 + ?1X1 + ?2X2 + … + ?kXk + u
我们需要计算 K个不同的 VIF,每个 Xi一个。为指定
Xi计算 VIF涉及以下三步:
( 1) Xi 对原方程中其它全部解释变量进行 OLS回
归, 例如, 若 i =1,则回归下面的方程:
X1 = ?1 + ?2X2 + ?3X3 +… + ?kXk +v
( 2) 计算方差膨胀因子 (VIF):
其中 Ri2是第一步辅助回归的决定系数 。
)1(
1)?(
2
i
i RV IF ???
25
( 3)分析多重共线性的程度
VIF越高,多重共线性的影响越严重。
由于没有 VIF临界值表,我们只能使用经验法则:
若,则存在严重多重共线性。
也有人建议用 VIF>10作为存在严重多重共线性的标
准,特别在解释变量多的情形应当如此。
需要指出的是,所有 VIF值都低,并不能排除严
重多重共线性的存在,这与使用相关系数矩阵检验
的情况相似。
5)?( ?iV IF ?
26
四 解决多重共线性的方法
思路;加入额外信息 。 具体方法有以下几种:
? 增加数据
? 对模型施加某些约束条件
? 删除一个或几个共线变量
? 将模型适当变形
1.增加数据
多重共线性实质上是数据问题,因此,增加数据
就有可能消除或减缓多重共线性,具体方法包括增
加观测值、利用不同的数据集或采用新的样本。
27
例:需求函数 Yt = β 1+β 2Xt+β 3Pt+ ut
在时间序列数据中,收入( X)和价格( P)往往
是高度相关的,用时间序列数据估计往往会产生多
重共线性。然而,在横截面数据中,则不存在这个
问题,因为某个特定时点 P为常数。如果取一横截面
样本(如从 5000个家庭取得的数据),则可用来估
计
Yi = α 1+α 2Xi+ ui
然后将得到的估计值 作为一个约束条件( β 2 =
)施加于时间序列数据的回归计算中,即估计
Yt - Xt =β 1+β 3Pt+ ut,得到, 。
2??
2??
2?? 1?? 3??
28
2,对模型施加某些约束条件
在存在多重共线性的模型中, 依据经济理论施加某些约
束条件, 将减小系数估计量的方差, 如在 Cobb—Douglas生
产函数中加进规模效益不变的约束, 可解决资本和劳动的
高度相关而引起的多重共线性问题 。
3.删除一个或几个共线变量
这样做, 实际上就是利用给定数据估计较少的参数, 从
而降低对观测信息的需求, 以解决多重共线性问题 。 删除
哪些变量, 可根据假设检验的结果确定 。
应注意的是, 这种做法可能会使得到的系数估计量产生
偏倚, 因而需要权衡利弊 。
29
4,将模型适当变形
例 1,某商品的需求函数为:
其中,Q = 需求量, X = 收入,
P = 该商品的价格, P* = 替代商品的价格
在实际数据中, P和 P*往往呈同方向变动, 它们之间高度
相关, 模型存在多重共线性 。
如果我们仅要求在知道两种商品的相对价格变动时, 对
需求量进行预测, 则可将需求函数变为:
就可以解决多重共线性问题 。
uββββ *3210 ????? PPXQ
vPPXQ ???? )( *321 ???
30
例 2,有滞后变量的情形
Yt = β 1+β 2Xt+β 3 Xt-1 + ut
一般而言, Xt和 Xt –1往往高度相关, 将模型变换
为:
Yt = β 1+β 2( Xt - Xt –1) +β 3′Xt -1+ ut
其中 β 3′=β 3 +β 2
经验表明,△ Xt和 Xt –1的相关程度要远远小于和 Xt
和 Xt –1的相关程度, 因而这种变换有可能消除或减
缓多重共线性 。
31
5.主成分法
可将共线变量组合在一起形成一个综合指数 (变量 ),用
它来代表这组变量 。 构造综合指数的最常用方法是主成分
法 。 主成分法的计算相当复杂, 这里不做介绍 。
同学们需要了解的是,主成分的特点是,各主成分之间
互不相关,并且,用很少几个主成分就可以解释全部 X变
量的绝大部分方差,因而在出现多重共线性时,可以用主
成分替代原有解释变量进行回归计算,然后再将所得到的
系数还原成原模型中的参数估计值。
32
五, 处理多重共线性问题的原则
1,多重共线性是普遍存在的, 轻微的多重共线性
问题可不 采取措施 。
3,如果模型仅用于预测,则只要拟合好,可不处
理多重共线性问题,存在多重共线性的模型用于
预测时,往往不 影响预测结果。
2,严重的多重共线性问题,一般可根据经验或通
过分析回归结果发现。如影响系数的符号,重要的
解释变量 t 值很低。要根据不同情况采取必要措施
。
33
第三节 异方差性
回顾我们应用 OLS法所需假设条件, 其中大部分
是有关扰动项的统计假设, 它们是:
( 1) E(ut)=0,t=1,2,…,n,扰动项均值为 0
( 2) Cov(ui,uj) = E(uiuj) =0,i≠j,扰动项相互独立
( 3) Var(ut) = E(ut2) = ?2,t=1,2,…,n,常数方差
( 4) ut ~ N(0,?2),正态性
对于 ( 1), 我们可论证其合理性 。 而第 ( 4) 条,
也没有多大问题 。 大样本即可假定扰动项服从正态
分布 。 而对于 ( 2), ( 3) 两条, 则无法论证其合
理性 。 实际问题中, 这两条不成立的情况比比皆是 。
下面即将讨论它们不成立的情况, 即异方差性和自
相关的情形 。
34
一 异方差性及其后果
1,定义
若 Var(ut) = = 常数的假设不成立, 即
Var(ut) = ≠常数, 则称扰动项具有异方差性 。
2?
2t?
2,什么情况下可能发生异方差性问题?
解释变量取值变动幅度大时,常数方差的假设往
往难以成立。异方差性主要发生在横截面数据的情况,
时间序列问题中一般不会发生,除非时间跨度过大。
35
例,Yi = α +β Xi+ ui
其中,Y=指定规模和组成的家庭每月消费支出
X=这样的家庭的每月可支配收入
设 X的 N个观测值取自一个家庭可支配收入的横截
面样本 。 某些家庭接近于勉强维持生存的水平, 另
一些家庭则有很高的收入 。 不难设想, 低收入家庭
的消费支出不大可能离开他们的均值 E(Y)过远, 太
高无法支持, 太低则消费将处于维持生存的水平之
下 。 因此, 低收入家庭消费支出额的波动应当较小,
因而扰动项具有较小的方差 。 而高收入家庭则没有
这种限制, 其扰动项可能有大得多的方差 。
这就意味着异方差性 。
36
3,异方差性的后果
( 1) 参数估计量不再具有最小方差的性质
异方差性不破坏 OLS估计量的无偏性, 但不再是有效的 。
事实上, 异方差性的存在导致 OLS估计量既不是有效的,
也不具有渐近有效性 。
( 2) 系数的显著性检验失去意义
更为严重的是, 在异方差性的情况下, 矩阵 主对
角元素不再是 OLS估计量方差的无偏估计量, 从而导致系数的
置信区间和假设检验结果不可信赖 。
例如在双变量模型中, 如果 倾向于低估 的真
实方差, 则置信区间可能要比实际的窄, 给我们一个错误信
息, 好象得到 的点预测值很精确 。
? 22 /? x? ??
21 ?)( ???XX
37
二 异方差性的检验
异方差性后果的严重性意味着我们在实践中必须了
解是否存在异方差性 。
常用的检验方法有:
斯皮尔曼等级相关检验法 (Spearman Rank Relation test)
戈德弗尔德 —匡特检验法 (Goldfeld Quandt test)
格里瑟检验法 ( Glesjer test)
帕克检验法 ( Park test)
怀特检验法 (White’s General Heteroscedasticity test)
38
1,斯皮尔曼等级相关检验法
思路:
将异方差性与扰动项 u和某个解释变量 X之间的相关程度挂
钩 ( 即 与 Xt 的大小有关 ), 从而将对异方差性的研究
转化为对 ut与 Xt的相关程度的研究 。
由于扰动项无法观测, 因而用残差代替之, 转化为对 et与 Xt
的相关程度的研究, 若 et与 Xt高度相关, 则可推断异方差性存
在 。
在此无法用相关系数来检验, 因为 et与 Xt的相关系数恒等于
0:
因而改用 Xt和 ︱ et︳ 的等级相关系数检验 et和 Xt的相关程度 。
2t?
0
)()()()(
))((
2222
?
??
??
?
??
??
?
? ?
? ? ?
? ?
?
eeXX
xeeXeX
eeXX
eeXX
r tttt
39
等级相关系数的计算步骤
( 1) 将两变量的相应观测值分别按升序 ( 或降序 ) 排序,
所得到的序号即为等级 。
( 2) 计算两变量各观测值相应的等级之差 dt.
( 3) 计算等级相关系数
)12(
26
1
?
?
??
nn
tdr
40
例:等级相关系数的计算
假设我们有 Xt和 et如下:
Xt 25,40,52,58,65
et 1.6,-2.9,-10.7,–14.8,5.7
我们有 ︱ et︳ 1.6,2.9,10.7,14.8,5.7
Xt的等级 ︱ et︳ 的等级 dt
1 1 0
2 2 0
3 4 -1
4 5 -1
5 3 2
r = 1 – (6*6)/(5*24) = 1 - 0.3 = 0.7
计算出等级相关系数后, 就可判断异方差性是否存在 。 若相
关系数绝对值高, 则存在异方差性 。
对于多个解释变量的情况, 可分别计算 ︱ et︳ 与各解释变量
的等级相关系数进行检验 。
41
2.戈德弗尔德 ——匡特检验法
基本思路:假定 随 Yt的数值大小变动 。
检验步骤:
( 1) 将数据分为三组:小 Yt值组, 中 Yt值组, 大 Yt值组
( 数据项大致相等 )
( 2) 对小 Yt值组估计模型, 给出
( 3) 对大 Yt值组估计模型, 给出
2t?
1? 1
2
2
1 ???
?
kn
e?
1
?
3
2
2
3 ???
?
kn
e
?
42
( 4) H0:
H1,( 或 )
检验统计量为 F0 = ~ F( n3-k-1,n1-k-1)
若 F0> Fc,则拒绝 H0,存在异方差性 。
例,S=α +β Y + u 其中,S=储蓄 Y=收入
设 1951—60年, =0.01625
1970—79年, =0.9725
F0 = 0.9725/0.01625=59.9
查表得, d.f.为 ( 8,8) 时, 5% Fc=3.44
∵F 0> Fc 因而 拒绝 H0。
结论:存在异方差性 。
2321 ?? ?
2321 ?? ? 2321 ?? ?
2
1
2
3
?
?
?
?
21??
23??
43
三 广义最小二乘法
1,消除异方差性的思路
基本思路:变换原模型, 使经过变换后的模型具有同方差
性, 然后再用 OLS法进行估计 。
对于模型
Yt = β 0+β 1X1t+… +β k Xkt+ ut ( 1)
若扰动项满足 E(ut) = 0,E(uiuj) = 0,i≠j,但
E(ut2) = ≠常数,
也就是说, 该模型只有同方差性这一条件不满足, 则只要
能将具有异方差性的扰动项的方差表示成如下形式:
Var(ut) =, t=1,2,…, n
其中 为一未知常数, 表示一组已知数值, 则用 λ t去除
模型各项, 得变换模型,
2t?
222 tt ??? ?
2? 2t?
44
( 2)
由于
所以变换后的扰动项的方差为常数, 可以应用 OLS法进行
估计, 得到的参数估计量为 BLUE。 但这里得到的 OLS估
计量是变模后模型 ( 2) 的 OLS估计量 。 对于原模型而言,
它已不是 OLS估计量, 称为广义最小二乘估计量 ( GLS估
计量 ) 。
t
t
t
Kt
K
t
t
tt
t uXXY
??????
?
? ?????,..
1
1
0
222
22
1)(1)( ???
??? ??? ttttt
t uV a ruV a r
45
2,广义最小二乘法 (Generalized least squares)
下面用矩阵形式的模型来推导出 GLS估计量的一
般计算公式 。
设 GLS模型为 Y=Xβ +u ( 1)
满足 E(u) = 0,E(uu′)=?2Ω, X 非随机,
X的秩 =K+1< n,其中 Ω 为正定矩阵 。
( 注, 正定矩阵是和单位矩阵合同的矩阵;
正定矩阵 <=>所有顺序主子式均大于 0。 )
46
根据矩阵代数知识可知,对于任一正定矩阵 Ω,存在着一
个满秩(非退化,非奇异)矩阵 P,使得
用 P-1左乘原模型( 1)(对原模型进行变换):
令 Y* =P-1Y,X* = P-1X,u* = P-1u,得到
Y*= X*β + u* ( 2)
下面的问题是,模型( 2)的扰动项 u*是否 满足 OLS法的
基本假设条件。
111 )(,??? ?????? PPPP
uPXPYP 111 ??? ?? ?
47
))(()( 11** ???? ?? PuuPEuuE
))(( 11 ??? ?? PuuEP
))(( 121 ??? ?? PP ?
))(( 112 ??? ?? PPPP?
))(( 112 ?? ?? PPPP?
I2??
我们有
48
这表明, 模型 ( 2) 中的扰动项 u*满足 OLS法的基本假设,
可直接用 OLS估计, 估计量向量
这就是 的广义最小二乘估计量 ( GLS估计量 ) 的公式, 该
估计量是 BLUE。
从上述证明过程可知, 我们可将 GLS法应用于 Ω 为任意正定
矩阵的情形 。
**1** )(? YXXX ??? ??
YPPXXPPX 11111 )())(( ????? ?????
YXXX 111 )( ??? ?????
??
49
如果只存在异方差性, 则
其中
我们显然有
??? 2)( ?uuE
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
2
2
2
2
1
2
.......000
........
0......00
0......00
n
?
?
?
?
ntt,......,2,1,02 ???
PP
n
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
...,..,000
...,..,.
0...,..00
0...,..00
2
1
50
)(
1.......000
........
0......010
0......001
1
2
1
1
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
PP
n
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
2
2
2
2
1
1
1.......000
........
0......010
0......001
n
?
?
?
51
四 广义最小二乘法的应用
1,根据实际问题确定 Ω 矩阵
应用 GLS法的关键是确定 Ω 矩阵 。 对于仅存在异方差性的
实际问题, Ω 矩阵是一个对角矩阵, 即
现在的问题是, 的值为已知这一假设是否现实, 也就是
我们能否根据实际问题, 提出有关扰动项方差的某种合理的
设想 ( 即估计 Ω 矩阵 ), 使得
( 为未知常数, 为已知数值 )
下面通过例子说明这一问题 。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
2
2
1
......,000
......,.
0......00
0......00
n
?
?
?
2t?
2t?222 tt ??? ? 2?
52
例 1 Yt = β 1+β 2Xt+ ut t=1,2,…,n.
其中 Y=家庭消费支出 X=家庭可支配收入
我们在前面已分析过, 高收入家庭有较大的扰动项方差,
因此不妨假定扰动项方差与可支配收入成正比, 即
Var(ut)=δ Xt,t=1,2,…,n.
式中 δ 是一未知常数, 由于 Xt为已知, 相当于, 而 δ 相
当于, 因此
应用 GLS法, 即可得出 β 的 GLS估计量 。
?
?
?
?
?
?
?
?
?
?
?
?
??
n
X
X
X
..,..,..000
..,..,..
0..,..,00
0..,..,00
? 2
1
2t?
2?
53
2,格里瑟检验法 ( Glesjer test)
在上例中我们假设扰动项方差与解释变量的取值成正比,
这种假设是否真正合理呢? 根据经验和分析做出的这种假设,
虽然有一定道理, 但未免显得过于武断, 这方面还可做一些
比较细致的工作 。
Glesjer检验法不仅可检验异方差性的存在, 还可用于提供
有关异方差形式的进一步信息, 对于确定 Ω 矩阵很有用, 下
面我们扼要说明格里瑟检验法的步骤 。
格里瑟检验法的思路是假定扰动项方差与解释变量之间存
在幂次关系, 方法是用 对被认为与扰动项方差有关的解释
变量回归, 确定 和该解释变量的关系 。 由于与该解释变量
之间关系的实际形式是未知的, 因此需要用该解释变量的不
同幂次进行试验, 选择出最佳拟合形式 。
te
te
54
具体步骤如下:
(1)因变量 Y对所有解释变量回归, 计算残差 et
( t=1,2,…,n)
( 2) 对所选择解释变量的各种形式回归, 如
然后利用决定系数, 选择拟合最佳的函数形式 。
( 3) 对 β 1进行显著性检验, 若显著异于 0,则表明存在异
方差性, 否则再试其它形式 。
................
1
10
10
10
2
10
t
jt
t
tjtt
tjtt
tjtt
u
X
e
uXe
uXe
uXe
???
???
???
???
??
??
??
??
te
55
格里瑟检验法的最大优点是能够提供有关异方差性形式的
信息, 为 GLS法提供 Ω 矩阵 。 缺点是太繁琐 。 因此建议用其
它方法检验异方差性的存在, 然后再用格里瑟法确定异方差
性的具体形式, 进而应用 GLS法 。
例 2 Yt = β 1+β 2X1t+… +β k Xkt+ ut
假设我们根据经验知道扰动项方差与 Xjt有关, 并用 格里瑟
法试验, 得出:
则
jtt X?? ?2
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
jn
j
j
X
X
X
.....,..000
.....,..
0.....,00
0.....,00
? 2
1
56
3,加权最小二乘法
对于仅存在异方差性的问题, 其 Ω 矩阵是一个对角矩阵,
即
在这种情况下应用 广义最小二乘法, 也就是在原模型两端
左乘 矩阵
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
2
2
1
n
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
P
?
?
?
1
......
1
1
2
1
1
变换 原模型,再对 变换 后的模型应用普通最小二乘法进行估计。
57
这种作法实际上等价于在代数形式的原模型
Yt = β 0+β 1X1 t+… +β k X k t+ u t 的两端除以 ? t,得 变换 模
型:
t
t
t
Kt
K
t
t
tt
t uXXY
??????
?
? ????? ?
1
1
0
这种作法相当于在回归中给 应变量和解释变量的每个观测值
都赋予一个与相应 扰动项的方差相联系的权数
,然后再对这些变换后的数据进行 OLS回归, 因为这种作法相
当于每个观测值都以相应 扰动项的 标准差的估计值 的倒数
( 即 ) 为权数, 因而被称为 加权最小二乘法 ( WLS法,
Weighted Least Squares) 。
),...,2,1,1( ntt ??
t?
1 t
??
58
加权最小二乘法是广义最小二乘法的一个特例,在 Ω 矩阵
为对角矩阵这种特殊情形下,我们既可以直接应用矩阵形式
的 广义最小二乘 估计量公式得到 GLS估计值,亦可避开矩阵运
算,采用 加权最小二乘法 得到其 WLS估计值,两者结果完全相
同,无论你称之为 GLS估计值还是 WLS估计值,二者是一码事。
例, ( 1)
其中,Y=R&D支出, X=销售额
采用美国 1988年 18个行业的数据估计上述方程, 结果如
下 ( 括号中数字为 t值 ),
这里是横截面数据, 由于行业之间的差别, 可能存在 异
方差性 。
iii uXY ??? 21 ??
)8 4 3 4.3()1 9 4 8.0(
4 7 8 3.00 3 1 9.099.192? 2 ??? RXY ii
59
应用 格里瑟法试验,得到 异方差性形式为:
ii X?? ?2
将原模型 ( 1) 的两端除以, 得
用 OLS法估计 ( 2) 式, 结果如下 ( 括号中数字为 t值 ),
与 ( 1) 式的结果比较, 两个方程斜率系数的估计值相差
不大, 但 采用 WLS法估计的比直接用 OLS法估计的系数更为显
著, 这表明 OLS法高估了 X系数的标准差 。
iX
)2(1 21
i
i
i
ii
i
X
uX
XX
Y ??? ??
)172.5()647.0(:)(
6 2 5 8.00 3 6 8.0
1
68.246
?
2
?
??????
?
?
?
?
?
?
t
RX
XX
Y
i
ii
i
60
第四节 自相关
一 定义
若 Cov(ui,uj) = E(uiuj) =0,i≠j不成立, 即线性回归模型
扰动项的方差 —协方差矩阵的非主对角线元素不全为 0,则
称为扰动项自相关, 或序列相关 ( Serial Correlation) 。
二 自相关的原因及后果
1,原因
自相关主要发生在时间序列数据的情形, 因而亦称为序列
相关, 主要有以下两种原因:
( 1) 冲击的延期影响 ( 惯性 )
在时间序列数据的情况下, 随机冲击 ( 扰动 ) 的影响往往
持续不止一个时期 。 例如, 地震, 洪水, 罢工或战争等将在
发生期的后续若干期中影响经济运行 。
61
微观经济中也与此类似,如一个工厂的产量,由于某种
外部偶然因素的影响(如某种原材料的供应出了问题),该
厂某周产量低于正常水平,那么,随后的一周或几周中,由
于这种影响的存在或延续,产量也很可能低于正常水平(即
扰动项为负)。
不难看出,观测的周期越长,这种延期影响的严重性就
越小,因此,年度数据比起季度数据来,序列相关成为一个
问题可能性要小。
( 2)误设定
如果忽略了一个有关的解释变量, 而该变量是自相关的,
则将使扰动项自相关, 不正确的函数形式也将导致同样后果 。
在这些情况下, 解决的方法是纠正误设定 。 本章后面将介绍
的纠正自相关的方法都不适用于这种情况的自相关 。
62
2,后果
自相关的后果与异方差性类似 。
( 1) 在扰动项自相关的情况下, 尽管 OLS估计量
仍为无偏估计量, 但不再具有最小方差的性质,
即不是 BLUE。
( 2) OLS估计量的标准误差不再是真实标准误差
的无偏估计量, 使得在自相关的情况下, 无法
再信赖回归参数的置信区间或假设检验的结果 。
63
三 自相关的检验
1,检验一阶自相关的德宾 —沃森检验法 ( Durbin—Watson test)
( 1) 一阶自相关
自相关的最简单模式为:
ut = ρ ut-1 + ε t,t=1,2,…,n.
其中 ρ 称为自相关系数 ( -1≤ ρ ≤ 1), 这种扰动项的自
相关称为一阶自相关, 即扰动项仅与其前一期的值有关 。 我
们有:
ρ >0 正自相关
ρ <0 负自相关
ρ =0 无自相关
64
在一阶自相关 模式 中,假定 ε t具有以下性质:
E(ε t) = 0,E(ε t2) = ζ 2 = 常数,
E(ε iε j)=0,i≠ j,ε t服从正态分布。
在计量经济学中,具备上述性质的量称为白噪
声( White noise),表示为
ε t= White noise
或
ε t= 白噪声
65
( 2) 德宾 —沃森检验法 (Durbin- Watson d test)
统计软件包和研究报告在提供回归结果时通常都给出
DW( 或 d) 统计量的值, 该统计量是从 OLS回归的残差中
计算得来的, 它被用于一阶自相关的检验, 计算公式为:
DW和一阶自相关系数 ρ 的估计值之间存在以下近似关系:
DW ≈ 2 - 2
由于 -1 ≤ ρ ≤ 1,因而 0 ≤ DW ≤ 4。
不难看出, 直观判断准则是, 当 DW统计量接近 2时, 则无自
相关, DW值离 2越远, 则自相关存在的可能性越大 。
?
?
?
?
??
?
n
t
t
n
t
tt
e
ee
DW
1
2
2
2
1 )(
??
66
DW检验的缺陷
我们当然期望能够有一张能够给出相应的 n,k和 α 值下
各种 DW临界值的表 ( 就象 t检验, F检验一样 ), 使得我们
可以按常规假设检验那样根据临界值作出判断 。 这样的表
是根据检验统计量在原假设成立的情况下的抽样分布编制
的 。
不幸的是, DW统计量的分布依赖于解释变量的具体观测
值 ( 即依赖于 X矩阵 ) 。 因此不象 t,F检验那样, 有一张
能够给出 DW临界值的表 。
为解决这一问题, 德宾 和 沃森证明, DW统计量的真实
分布位于两个极限分布之间, 这两个分布分别称为下分布
和上分布, 如下图所示:
67
概率
密度
下分布 上分布
0 A B C D DW值
每个分布的 95%临界水平用 A,B,C,D表示。
68
现假设 DW统计量的值位于 A的左边, 则不管这种情况下
的 DW统计量服从何种分布 ( 上, 下或中间 ), 无自相关的
原假设将被拒绝 。 与此类似, 若 DW统计量的值位于 D的右
边, 则亦可拒绝无自相关的原假设 。
若 DW统计量的值位于 B和 C之间, 则可接受原假设 。 而
当 DW统计量的值位于 A和 B之间或 C和 D之间时, 则无法得
出结论 。 上述分析可以概括为:
DW<A或 DW>D 存在自相关
B<DW<C 无自相关
A<DW<B或 C<DW<D 无结论区
无结论区的存在是 DW法的最大缺陷 。
德宾 和 沃森据此导出了一个下界 dL和一个上界 du来检验
自相关,dL和 du仅依赖于观测值的数目 n、解释变量 k,以及
显著性水平 α,而不依赖于解释变量所取的值。(请参阅
DW表)
69
实际的检验程序可用下面的示意图说明 。
正自相关 无结论区 无自相关 无结论区 负自相关
0 dL du 2 4—du 4—dL 4
检验程序如下:
a,用 OLS法对原模型进行回归, 得残差 et (t=1,2,…,n)。
b,计算 DW值(计算机程序给出 DW值)。
c,用 N,K和 α 查表得 dL,du。
d,判别
70
若 DW < dL,则存在正相关
若 DW< 2 若 dL < DW < du,无结论
若 du < DW,则无自相关
若 DW>2,则令 DW′= 4 - DW,按上述准则进行判别。
例,DW=3.5,则 DW′= 4 - 3.5 = 0.5
查表 ( n=30,k=2,α =5%) 得,dL =1.28。
DW′=0.5 < 1.28
结论:存在自相关 。
71
2,其它检验自相关的方法
DW检验法只能检验一阶自相关, 并且, 如果方程中包括
滞后因变量 ( 如 Yt-1,Yt-2等 ) 时, 用 DW法检验容易产生偏差 。
因此, 在碰到较复杂的情形, 我们应采用一些其它检验自
相关的方法 。 下面列出几种方法及其适用环境 。
检验方法 适用环境
Durbin-Watson d检验法 一阶自相关, 方程中无 Y的滞后项
Durbin’s h 检验法 一阶自相关, 方程中有 Yt-1
Box-Pierce检验法 一般自相关 ( 一阶, 二阶, …, K阶 )
LM检验法 一般自相关 ( 一阶, 二阶, …, K阶 )
72
四 消除自相关的方法
1,一阶自相关
如果实际问题的自相关模式为一阶自相关, 则只要知道 ρ,
就可以完全消除自相关, 下面用双变量模型来说明, 但同样
的原理适用于多个解释变量的情形 。
设 Yt = α +β Xt+ ut ( 1)
ut=ρ ut-1+ε t
其中 ε t是白噪声, 且 ρ ≠ 0。
( 1) 式两端取一期滞后, 得
Yt-1 = α +β Xt-1+ ut -1 ( 2)
( 2) 式两端乘以 ρ, 得
ρ Yt-1 = αρ+βρXt-1 + ρ ut -1 ( 3)
73
( 1) -( 3),得:
Yt -ρ Yt-1 = α (1-ρ )+β (Xt-ρ Xt-1) + (ut -ρ ut -1) ( 4)
( 4)式中的扰动项为 ut -ρ ut–1 =ε t,从而满足标准假设
条件。
令 Yt′= Yt -ρ Yt-1 Xt′= Xt-ρ Xt-1
α ′=α (1-ρ ),有
Yt′ = α ′+β Xt′+ ε t ( 5)
若 ρ 为已知,我们就可用 OLS法直接统计( 5)式,否则需
要先估计 ρ 。
在 ρ 未知的情况下,通常用下列两种方法。
74
( 1) 科克伦 —奥克特法 ( Cochrane—Orcutt)
科克伦 —奥克特法是一个迭代过程, 步骤如下:
① 估计原模型 (( 1 ) 式 ), 计算 OLS 残差 et
( t=1,2,…,n) 。
② et对 et-1回归, 即估计 et=ρ et-1+ε t,得到 ρ 的估计值
③ 用 产生
然后估计 Yt′ = α ′+β Xt′+ ε t, 得到 α 和 β 的估计值
和 。
④ 重新计算残差, 返回第 ② 步 。
此过程不断修改, 和, 直至收敛 。
??
1? ???? ttt YYY ? 1? ???? ttt XXX ?
?? ??
??????
??
75
( 2) 希尔德雷斯 —卢法 ( Hildreth—lu)
此方法实际上是一种格点搜索法 ( Grid search),即在 ρ
的预先指定范围 ( 如 -1至 1) 内指定格点之间距离 ( 如 0.01),
然后用这样产生的全部 ρ 值 ( -1.00,-0.99,…, 1.00) 产
生
Yt′= Yt -ρ Yt—1 Xt′= Xt-ρ Xt—1
估计
Yt′ = α ′+β Xt′+ ε t
产生最小标准误差的 ρ 值即作为 ρ 的估计值, 用该 ρ 值得
到的 和 即为原模型的系数估计值 。?? ??
76
2,一般自相关
对于一般自相关问题, 我们可采用广义最小二乘法处理 。
自相关意味着扰动项 u的方差 —协方差矩阵
E(u12) E(u1u2) … E(u1un)
E(uu′) = E(u2u1) E(u22) … E(u2un)
…… …… …… …… ……
E(unu1) E(unu2) … E(un2)
中某些 E( uiuj) ≠ 0,i≠ j.即
E(uu’)=ζ 2Ω,
其中 Ω 为对称正定矩阵 。 因而可应用 GLS法 。 此方法可用
于任何类型的自相关, 步骤如下:
77
( 1) 规定自相关的形式
例:
( 2) 用代数方法确定 E(uu’) 矩阵的元素 E(ut2),E(utut-1),
E(utut-2),…,即用 ?1,? 2,…,?2等未知值表示上述元素,
于是得到了 Ω 矩阵 。
( 3) 用 OLS法得到原方程的最小二乘残差 e1,e2,…,en,然
后根据这些残差估计 ?1,?2,…,得到其估计值
代入上一步得到的 Ω 矩阵, 从而给出全部元素为已知的
矩阵 。
( 4) 计算
tttt uuu ??? ??? ?? 2211
,...,?,? 21 ??
??
YXXXG L S 111 ?)?(? ??? ??????
78
第五章 小结
一, 误设定
误设定包括函数形式的误设定和解释变量的误设定 。 我们
重点介绍了两种类型的误设定 。
1,模型中忽略了有关的解释变量
其后果是使参数估计量产生偏倚, 即 OLS估计量不再是无偏
估计量 。
2,模型中包括了无关的解释变量
其后果是增大了估计量的方差, 但估计量仍无偏 。
在实际工作中, 我们可用拉姆齐 RESET检验法检验模型是否
误设定, 但仍无法准确判断是何种类型的误设定 。 一般原则
是尽量不漏掉与因变量有关的解释变量尤其是理论上重要的
变量, 判断一个变量是否应加进回归方程中, 可依据本章介
绍的四项准则 。
79
二, 多重共线性
当解释变量之间存在着高度相关时, 就会发生多重共线性 。
多重共线性虽然不影响参数估计量的无偏性, 但会造成参数
估计量的高方差, 精度差和低 t值, 犯第 Ⅱ 类错误的可能性增
加,。
多重共线性可通过回归结果进行判断, 可以通过解释变量的
相关系数矩阵检验, 还可用条件指数检验 。
解决多重共线性问题主要从以下两个方向进行:
1,减少要估计的参数, 即利用给定的数据估计较少的参数 。
2、改变数据,即增加信息。
这是一个要在实践中反复摸索的问题 。
80
三, 异方差性
若 Var( ut) = σ2 = 常数 的假设不成立, 则称扰动项具有
异方差性 。
异方差性主要发生在横截面数据或时间跨度很大的时间
序列数据的情形 。
1,异方差性的后果
( 1) 虽然 OLS估计量仍是无偏的, 但不再具有最小方差的
性质, 即不再是有效的 。
( 2) 系数的置信区间和显著性检验结果不可信赖 。
2,异方差性的检验
常用的检验方法有斯皮尔曼等级相关检验法, 戈德弗尔德
-夸特检验法和格里瑟检验法 。 建议采用前两种方法检验异
方差性的存在, 用格里瑟检验法确定异方差性的形式 。
81
3,广义最小二乘法 ( GLS法 )
GLS模型 Y=Xβ+μ
满足 E( μ) =0,E( μμ’) =σ2Ω,X非随机
且 Rank( X) =k+1<n,Ω为正定矩阵, 则 GLS估计量
为 BLUE。
4,用 GLS法消除异方差性
如果仅存在异方差性, 则 Ω矩阵可假设为一个对角矩阵,
即
>0,t=1,2,…, n
问题转化为如何确定 ( t=1,2,…, n) 的值, 这需要
根据具体问题而定 。 在没有明确线索时, 通常采用格里瑟
法通过实验确定之 。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
n
2
2
2
1
?
?
?
? 2t?
2t?
YXXXG L S 111 )(? ??? ??????
82
四, 自相关
若 cov(ui,uj) = E(μiμj) =0,i≠j 不成立, 则我们说存在着扰动
项的自相关, 自相关也称为序列相关 。
当我们应用时间序列数据时, 往往会碰到自相关的问题 。 此
外, 遗漏有关的解释变量也可能产生自相关的现象 。 自相关
的后果与异方差性的后果类似 。
最常用的自相关检验法是德宾 -沃森检验法 。 DW法适用于一
阶自相关模式:
ut=ρut-1+εt
且方程中不包括因变量的滞后项的情形 。
其它方法包括适用于方程中有 Yt-1项的 h检验法 ( 检验一阶自
相关 ), 以及检验一般自相关的 Box-Pierce法和 LM法 。
83
一阶自相关的消除,通常采用科克伦 -奥克
特法或希尔德雷斯 -卢法估计自相关系数 ρ,得
到其估计值后,对原模型进行变换,以消除扰
动项的自相关型,得到原模型参数的估计值。
一般自相关的消除,可采用 GLS法处理。
84
第五章 习题
1,检验下列情况下是否存在扰动项的自相关 。
(1) DW=0.81,n=21,k=3
(2) DW=2.25,n=15,k=2
(3) DW=1.56,n=30,k=5
2,有人建立了一个回归模型来研究我国县一级的教育支出:
Y=β0+β1X1+β2X2+β3X3+ u
其中,Y,X1,X2 和 X3分别为所研究县份的教育支出, 居民
人均收入, 学龄儿童人数和可以利用的各级政府教育拨款 。
他打算用遍布我国各省, 市, 自治区的 100个县的数据来
估计上述模型 。
( 1) 所用数据是什么类型的数据?
( 2) 能否采用 OLS法进行估计? 为什么?
(3) 如不能采用 OLS法, 你认为应采用什么方法?
85
3,试从下列回归结果分析存在问题及解决方法:
( 1) = 24.7747 + 0.9415 - 0.0424 R=0.9635
(SE,) ( 6.7525) ( 0.8229) ( 0.0807)
其中,Y=消费, X2=收入, X3=财产, 且 n=5000
附,5%显著性水平下, tc(∞)=1.96
(2) = 0.4529 - 0.0041t R=0.5284
(t,) (-3.9606) DW=0.8252
其中 Y=劳动在增加值中 份额, t=时间
该估计结果是使用 1949-1964年度数据得到的 。
i2? i3?i??
i??