计量经济学：ets5

分类：经济格式：ppt 日期：2006年01月20日

1
第五章模型的建立与估计中的
问题及对策
2
我们已学到了许多有用的计量经济分析方法, 如建立
模型, 估计参数, 假设检验, 预测, 非线性模型的线性
化, 用虚拟变量将定性因素引入模型等。
可是, 我们所使用的最小二乘法, 以及由此而得到的
OLS估计量令人满意的性质, 是根据一组假设条件而得到
的。在实践中, 如果某些假设条件不能满足, 则 OLS就不
再适用于模型的估计。在这种情况下, 分析方法就需要
改变。下面列出实践中可能碰到的一些常见问题：
l 误设定（ Misspecification 或 specification error）
l 多重共线性（ Multicollinearity）
l 异方差性（ Heteroscedasticity）
l 自相关（ Autocorrelation）
本章将对上述问题作简要讨论, 主要介绍问题的后果,
检测方法和解决途径。
3
第一节误设定
采用 OLS法估计模型时, 实际上有一个隐含的
假设, 即模型是正确设定的。这包括两方面的含
义：函数形式正确和解释变量选择正确。在实践
中, 这样一个假设或许从来也不现实。我们可能
犯下列三个方面的错误：
l 选择错误的函数形式
l 遗漏有关的解释变量
l 包括无关的解释变量
从而造成所谓的, 误设定, 问题。
4
一, 选择错误的函数形式
这类错误中比较常见的是将非线性关系作为线性关系处理。
函数形式选择错误，所建立的模型当然无法反映所研究现象
的实际情况，后果是显而易见的。因此，我们应当根据实际
问题，选择正确的函数形式。
我们在前面各章的介绍中采用的函数形式以线性函数为主,
上一章介绍了应变量和解释变量都采用对数的双对数模型,
下面再介绍几种比较常见的函数形式的模型, 为读者的回归
实践多提供几种选择方案。这几种模型是：
? 半对数模型
? 双曲函数模型
? 多项式回归模型
5
1,半对数模型
半对数模型指的是应变量和解释变量中一个为对数形式而
另一个为线性的模型。应变量为对数形式的称为对数 -线性模
型 (log-lin model)。解释变量为对数形式的称为线性 -对数模
型 (lin-log model)。我们先介绍前者, 其形式如下：
对数 -线性模型中, 斜率的含义是 Y的百分比变动, 即解释
变量 X变动一个单位引起的应变量 Y的百分比变动。这是因
为, 利用微分可以得出：
ttt uXY ??? 10ln ??
)1(1ln1 ???????????????? dXYdYdXdYYdX Yd ??
6
这表明, 斜率度量的是解释变量 X的单位变动所
引起的应变量 Y的相对变动。将此相对变动乘以 100，
就得到 Y的百分比变动, 或者说得到 Y的增长率。
由于对数 -线性模型中斜率系数的这一含义, 因而也
叫增长模型 (growth model)。增长模型通常用于测
度所关心的经济变量（如 GDP）的增长率。例如,
我们可以通过估计下面的半对数模型
得到一国 GDP的年增长率的估计值, 这里 t为时间趋
势变量。
tt utGD P ??? 10)l n ( ??
7
线性 -对数模型的形式如下：
与前面类似, 我们可用微分得到
因此
这表明
ttt uXY ??? ln10 ??
??????? XdXdY 11?
XdX
dY
dX
dYX ??
1?
XX
Y
X
Y
?
???
的相对变动
的绝对变动
1?
?????? ??? XXY 1?
上式表明, Y的绝对变动量等于乘以 X的相对变动量。因
此,线性 -对数模型通常用于研究解释变量每变动 1%引起的
因变量的绝对变动量是多少这类问题。
1?
8
2,双曲函数模型
双曲函数模型的形式为：
不难看出, 这是一个仅存在变量非线性的模型, 很容易用
重新定义的方法将其线性化。
双曲函数模型的特点是, 当 X趋向无穷时, Y趋向, 反
映到图上, 就是当 X趋向无穷时, Y将无限靠近其渐近线
（ Y= ）。
双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯
曲线。
t
t
t uXY ???
?
?
???
??? 1
10 ??
0?
0?
9
3,多项式回归模型
多项式回归模型通常用于描述生产成本函数, 其一般形式
为：
其中 Y表示总成本, X表示产出, P为多项式的阶数, 一般
不超过四阶。
多项式回归模型中, 解释变量 X以不同幂次出现在方程的
右端。这类模型也仅存在变量非线性, 因而很容易线性化,
可用 OLS法估计模型。
iPiPiii uXXXY ?????? ????,,,,,,2210
10
二, 遗漏有关的解释变量
模型中遗漏了对因变量有显著影响的解释变量的
后果是：将使模型参数估计量不再是无偏估计量。
三, 包括无关的解释变量
模型中包括无关的解释变量, 参数估计量仍无偏,
但会增大估计量的方差, 即增大误差。
[注 ] 有关上述两点结论的说明请参见教科书 P101-102。
11
四, 解决解释变量误设定问题的原则
在模型设定中的一般原则是尽量不漏掉有关的解释
变量。因为估计量有偏比增大误差更严重。但如果方
差很大，得到的无偏估计量也就没有多大意义了，因
此也不宜随意乱增加解释变量。
在回归实践中，有时要对某个变量是否应该作为解
释变量包括在方程中作出准确的判断确实不是一件容
易的事，因为目前还没有行之有效的方法可供使用。
尽管如此，还是有一些有助于我们进行判断的准则可
用，它们是：
12
选择解释变量的四条准则
1,理论,从理论上看, 该变量是否应该作为解释变量包括
在方程中？
2,t检验：该变量的系数估计值是否显著？
3., 该变量加进方程中后, 是否增大？
4,偏倚,该变量加进方程中后, 其它变量的系数估计值是
否显著变化？
2R 2R
如果对四个问题的回答都是肯定的，则该变量应该包括在
方程中；如果对四个问题的回答都是“否”,则该变量是
无关变量，可以安全地从方程中删掉它。这是两种容易决
策的情形。
13
但根据以上准则判断并不总是这么简单。在很多情况下, 这
四项准则的判断结果会出现不一致。例如, 有可能某个变量
加进方程后, 增大, 但该变量不显著。2R
在选择变量的问题上，应当坚定不移地根据理论而不是满
意的拟合结果来作决定，对于是否将一个变量包括在回归方
程中的问题，理论是最重要的判断准则。如果不这样做，产
生不正确结果的风险很大。
在这种情况下，作出正确判断不是一件容易的事，处理的原
则是将理论准则放在第一位，再多的统计证据也不能将一个理
论上很重要的变量变成“无关”变量。
14
五, 检验误设定的 RESET方法
上面给出了选择解释变量的四条准则。可是, 有时
这些准则不能提供足够的信息使研究人员确信其设
定是最恰当的, 在这种情况下, 可考虑使用一些更
正规的检验方法来比较不同估计方程的性质。这类
方法相当多, 这里就不一一列出, 仅介绍拉姆齐（ J.
B,Ramsey）的回归设定误差检验法（ RESET法）。
15
RESET检验法的思路
RESET检验法的思路是在要检验的回归方程中加
进等项作为解释变量，然后看结果是否有
显著改善。如有，则可判断原方程存在遗漏有关变
量的问题或其它的误设定问题。
直观地看，这些添加的项是任何可能的遗漏变量
或错误的函数形式的替身，如果这些替身能够通过 F
检验,表明它们改善了原方程的拟合状况，则我们有
理由说原方程存在误设定问题。
等项形成多项式函数形式，多项式是一
种强有力的曲线拟合装置，因而如果存在误设定，
则用这样一个装置可以很好地代表它们。
432 ??,? YYY 和
432 ??,? YYY 和
16
RESET检验法的步骤
拉姆齐 RESET检验的具体步骤是：
(1) 用 OLS法估计要检验的方程, 得到
(2) 由上一步得到的值（ i=1,2,…,n）, 计算, 然
后用 OLS法估计：
(3) 用 F检验比较两个方程的拟合情况（类似于上一章中联合
假设检验采用的方法）, 如果两方程总体拟合情况显著不同,
则我们得出原方程可能存在误设定的结论。使用的检验统计
量为：
iii XXY 22110 ???? ??? ???
432 ??,? YYY 和
iY?
iiiiiii uYYYXXY ??????? 45342322110 ??? ??????
17
)1/(
/)(
??
??
knR S S
MR S SR S SF M
其中,RSSM为第一步中回归（有约束回归）的残差平方和,
RSS为第二步中回归（无约束回归）的残差平方和,
M为约束条件的个数, 这里是 M=3。
应该指出的是, 拉姆齐 RESET检验仅能检验误设定的存
在, 而不能告诉我们到底是哪一类的误设定, 或者说, 不
能告诉我们正确的模型是什么。但该方法毕竟能给出模型
误设定的信号, 以便我们去进一步查找问题。另一方面,
如果模型设定正确, RESET检验使我们能够排除误设定的
存在, 转而去查找其它方面的问题。
18
第二节多重共线性
应用 OLS法的一个假设条件是；矩阵 X的秩 =K+1<N。
即自变量之间不存在严格的线性关系, 观测值个数大于待估
计的参数的个数。这两条无论哪一条不满足, 则 OLS估计值
的计算无法进行, 估计过程由于数学原因而中断, 就象分母
为 0一样。
这两种情况都很罕见。然而, 自变量之间存在近似的线性
关系则是很可能的事。事实上, 在经济变量之间, 这种近似
的线性关系是很常见的。
当某些解释变量高度相关时, 尽管估计过程不会中断, 但
会产生严重的估计问题, 我们称这种现象为多重共线性。解
释变量间存在严格线性相关关系时, 称为完全的多重共线性。
19
一定义
在实践中, 若两个或多个解释变量高度线性相关,
我们就说模型中存在多重共线性。
二后果
1,不改变参数估计量的无偏性；事实上, 对于不完
全多重共线性, 参数估计量仍为 BLUE。这是因为,
尽管解释变量之间存在多重共线性, 但并不影响扰动
项和解释变量观测值的性质, 故仍有
? ?
? ?
β
)u()(β
)uβ()(
)()?(
1
1
1
?
????
????
???
?
?
?
EXXX
XXXXE
YXXXEE ?
20
2,但各共线变量的参数的 OLS估计值方差很大，即
估计值精度很低。（ BLUE表明在各线性无偏估计量
中方差最小，但不等于方差的值很小。）
3 由于若干个 X变量共变，它们各自对因变量的影
响无法确定。
4,各共线变量系数估计量的 t值低，使得犯第 Ⅱ 类
错误的可能性增加。
由于各共线变量的参数的 OLS估计值方差大，因
而系数估计量的 t值低，使得我们犯第 Ⅱ 类错误（接
受错误的原假设 H0,β j=0）的可能性增加，容易将本
应保留在模型中的解释变量舍弃了。
21
三多重共线性的判别和检验
1,根据回归结果判别
判别是否存在多重共线性的最简单方法是分析回
归结果。
如果发现,
系数估计值的符号不对；
某些重要的解释变量 t值低, 而 R2不低；
当一不太重要的解释变量被删除后, 回归结果
显著变化。
则可能存在多重共线性。其中上述第二种现象是多
重共线性存在的典型迹象。
此方法简便易行, 因而是实践中最常用的方法,
缺点是无法确诊。
22
2．使用相关矩阵检验
统计软件一般提供各解释变量两两之间的相关系数
矩阵, 如发现某些相关系数高（绝对值高于 0.8或
0.90）, 则表明多重共线性存在。但即使解释变量两
两之间的相关系数都低, 也不能排除存在多重共线性
的可能性。
3．通过条件指数检验
条件指数（ Condition index）或条件数 Condition
number）是 X’X矩阵的最大和最小特征根之比的平方
根，条件指数高，表明存在多重共线性。至于什么程
度算高，也没有一个绝对的标准。通常认为大于 10即
存在多重共线性，大于 30表明存在严重多重共线性。
大多数统计软件提供此检验值。
23
4,使用 VIF检验
VIF 是方差膨胀因子的英文 (Variance Inflation
Factors) 缩写,这是一种比较正规的检验方法。该方法
通过检查指定的解释变量能够被回归方程中其它全部
解释变量所解释的程度来检测多重共线性。
方程中每个解释变量有一个 VIF，该 VIF是关于多重
共线性使相应的系数估计值的方差增大了多少的一个
估计值。高 VIF表明多重共线性增大了系数估计值的
方差，从而产生一个减小了的 t值。
24
VIF检验的具体步骤如下：
设原方程为：
Y = ?0 + ?1X1 + ?2X2 + … + ?kXk + u
我们需要计算 K个不同的 VIF，每个 Xi一个。为指定
Xi计算 VIF涉及以下三步：
（ 1） Xi 对原方程中其它全部解释变量进行 OLS回
归, 例如, 若 i =1,则回归下面的方程：
X1 = ?1 + ?2X2 + ?3X3 +… + ?kXk +v
（ 2）计算方差膨胀因子 (VIF)：
其中 Ri2是第一步辅助回归的决定系数。
)1(
1)?(
2
i
i RV IF ???
25
（ 3）分析多重共线性的程度
VIF越高,多重共线性的影响越严重。
由于没有 VIF临界值表，我们只能使用经验法则：
若,则存在严重多重共线性。
也有人建议用 VIF>10作为存在严重多重共线性的标
准,特别在解释变量多的情形应当如此。
需要指出的是，所有 VIF值都低，并不能排除严
重多重共线性的存在，这与使用相关系数矩阵检验
的情况相似。
5)?( ?iV IF ?
26
四解决多重共线性的方法
思路；加入额外信息。具体方法有以下几种：
? 增加数据
? 对模型施加某些约束条件
? 删除一个或几个共线变量
? 将模型适当变形
1．增加数据
多重共线性实质上是数据问题，因此，增加数据
就有可能消除或减缓多重共线性，具体方法包括增
加观测值、利用不同的数据集或采用新的样本。
27
例：需求函数 Yt = β 1+β 2Xt+β 3Pt+ ut
在时间序列数据中，收入（ X）和价格（ P）往往
是高度相关的，用时间序列数据估计往往会产生多
重共线性。然而，在横截面数据中，则不存在这个
问题，因为某个特定时点 P为常数。如果取一横截面
样本（如从 5000个家庭取得的数据），则可用来估
计
Yi = α 1+α 2Xi+ ui
然后将得到的估计值作为一个约束条件（ β 2 =
）施加于时间序列数据的回归计算中，即估计
Yt - Xt =β 1+β 3Pt+ ut,得到, 。
2??
2??
2?? 1?? 3??
28
2,对模型施加某些约束条件
在存在多重共线性的模型中, 依据经济理论施加某些约
束条件, 将减小系数估计量的方差, 如在 Cobb—Douglas生
产函数中加进规模效益不变的约束, 可解决资本和劳动的
高度相关而引起的多重共线性问题。
3．删除一个或几个共线变量
这样做, 实际上就是利用给定数据估计较少的参数, 从
而降低对观测信息的需求, 以解决多重共线性问题。删除
哪些变量, 可根据假设检验的结果确定。
应注意的是, 这种做法可能会使得到的系数估计量产生
偏倚, 因而需要权衡利弊。
29
4,将模型适当变形
例 1,某商品的需求函数为：
其中,Q = 需求量, X = 收入,
P = 该商品的价格, P* = 替代商品的价格
在实际数据中, P和 P*往往呈同方向变动, 它们之间高度
相关, 模型存在多重共线性。
如果我们仅要求在知道两种商品的相对价格变动时, 对
需求量进行预测, 则可将需求函数变为：
就可以解决多重共线性问题。
uββββ *3210 ????? PPXQ
vPPXQ ???? )( *321 ???
30
例 2,有滞后变量的情形
Yt = β 1+β 2Xt+β 3 Xt-1 + ut
一般而言, Xt和 Xt –1往往高度相关, 将模型变换
为：
Yt = β 1+β 2（ Xt - Xt –1） +β 3′Xt -1+ ut
其中 β 3′=β 3 +β 2
经验表明,△ Xt和 Xt –1的相关程度要远远小于和 Xt
和 Xt –1的相关程度, 因而这种变换有可能消除或减
缓多重共线性。
31
5．主成分法
可将共线变量组合在一起形成一个综合指数 (变量 ),用
它来代表这组变量。构造综合指数的最常用方法是主成分
法。主成分法的计算相当复杂, 这里不做介绍。
同学们需要了解的是，主成分的特点是，各主成分之间
互不相关，并且，用很少几个主成分就可以解释全部 X变
量的绝大部分方差，因而在出现多重共线性时，可以用主
成分替代原有解释变量进行回归计算，然后再将所得到的
系数还原成原模型中的参数估计值。
32
五, 处理多重共线性问题的原则
1,多重共线性是普遍存在的, 轻微的多重共线性
问题可不采取措施。
3,如果模型仅用于预测，则只要拟合好，可不处
理多重共线性问题，存在多重共线性的模型用于
预测时，往往不影响预测结果。
2,严重的多重共线性问题，一般可根据经验或通
过分析回归结果发现。如影响系数的符号，重要的
解释变量 t 值很低。要根据不同情况采取必要措施
。
33
第三节异方差性
回顾我们应用 OLS法所需假设条件, 其中大部分
是有关扰动项的统计假设, 它们是：
（ 1） E(ut)=0,t=1,2,…,n,扰动项均值为 0
（ 2） Cov(ui,uj) = E(uiuj) =0,i≠j,扰动项相互独立
（ 3） Var(ut) = E(ut2) = ?2,t=1,2,…,n,常数方差
（ 4） ut ～ N(0,?2),正态性
对于（ 1）, 我们可论证其合理性。而第（ 4）条,
也没有多大问题。大样本即可假定扰动项服从正态
分布。而对于（ 2）, （ 3）两条, 则无法论证其合
理性。实际问题中, 这两条不成立的情况比比皆是。
下面即将讨论它们不成立的情况, 即异方差性和自
相关的情形。
34
一异方差性及其后果
1,定义
若 Var(ut) = = 常数的假设不成立, 即
Var(ut) = ≠常数, 则称扰动项具有异方差性。
2?
2t?
2,什么情况下可能发生异方差性问题？
解释变量取值变动幅度大时，常数方差的假设往
往难以成立。异方差性主要发生在横截面数据的情况，
时间序列问题中一般不会发生，除非时间跨度过大。
35
例,Yi = α +β Xi+ ui
其中,Y=指定规模和组成的家庭每月消费支出
X=这样的家庭的每月可支配收入
设 X的 N个观测值取自一个家庭可支配收入的横截
面样本。某些家庭接近于勉强维持生存的水平, 另
一些家庭则有很高的收入。不难设想, 低收入家庭
的消费支出不大可能离开他们的均值 E(Y)过远, 太
高无法支持, 太低则消费将处于维持生存的水平之
下。因此, 低收入家庭消费支出额的波动应当较小,
因而扰动项具有较小的方差。而高收入家庭则没有
这种限制, 其扰动项可能有大得多的方差。
这就意味着异方差性。
36
3,异方差性的后果
（ 1）参数估计量不再具有最小方差的性质
异方差性不破坏 OLS估计量的无偏性, 但不再是有效的。
事实上, 异方差性的存在导致 OLS估计量既不是有效的,
也不具有渐近有效性。
（ 2）系数的显著性检验失去意义
更为严重的是, 在异方差性的情况下, 矩阵主对
角元素不再是 OLS估计量方差的无偏估计量, 从而导致系数的
置信区间和假设检验结果不可信赖。
例如在双变量模型中, 如果倾向于低估的真
实方差, 则置信区间可能要比实际的窄, 给我们一个错误信
息, 好象得到的点预测值很精确。
? 22 /? x? ??
21 ?)( ???XX
37
二异方差性的检验
异方差性后果的严重性意味着我们在实践中必须了
解是否存在异方差性。
常用的检验方法有：
斯皮尔曼等级相关检验法 (Spearman Rank Relation test)
戈德弗尔德 —匡特检验法 (Goldfeld Quandt test)
格里瑟检验法（ Glesjer test）
帕克检验法（ Park test）
怀特检验法 (White’s General Heteroscedasticity test)
38
1,斯皮尔曼等级相关检验法
思路：
将异方差性与扰动项 u和某个解释变量 X之间的相关程度挂
钩（即与 Xt 的大小有关）, 从而将对异方差性的研究
转化为对 ut与 Xt的相关程度的研究。
由于扰动项无法观测, 因而用残差代替之, 转化为对 et与 Xt
的相关程度的研究, 若 et与 Xt高度相关, 则可推断异方差性存
在。
在此无法用相关系数来检验, 因为 et与 Xt的相关系数恒等于
0：
因而改用 Xt和︱ et︳的等级相关系数检验 et和 Xt的相关程度。
2t?
0
)()()()(
))((
2222
?
??
??
?
??
??
?
? ?
? ? ?
? ?
?
eeXX
xeeXeX
eeXX
eeXX
r tttt
39
等级相关系数的计算步骤
（ 1）将两变量的相应观测值分别按升序（或降序）排序,
所得到的序号即为等级。
（ 2）计算两变量各观测值相应的等级之差 dt.
（ 3）计算等级相关系数
)12(
26
1
?
?
??
nn
tdr
40
例：等级相关系数的计算
假设我们有 Xt和 et如下：
Xt 25,40,52,58,65
et 1.6,-2.9,-10.7,–14.8,5.7
我们有︱ et︳ 1.6,2.9,10.7,14.8,5.7
Xt的等级︱ et︳的等级 dt
1 1 0
2 2 0
3 4 -1
4 5 -1
5 3 2
r = 1 – (6*6)/(5*24) = 1 - 0.3 = 0.7
计算出等级相关系数后, 就可判断异方差性是否存在。若相
关系数绝对值高, 则存在异方差性。
对于多个解释变量的情况, 可分别计算︱ et︳与各解释变量
的等级相关系数进行检验。
41
2.戈德弗尔德 ——匡特检验法
基本思路：假定随 Yt的数值大小变动。
检验步骤：
（ 1）将数据分为三组：小 Yt值组, 中 Yt值组, 大 Yt值组
（数据项大致相等）
（ 2）对小 Yt值组估计模型, 给出
（ 3）对大 Yt值组估计模型, 给出
2t?
1? 1
2
2
1 ???
?
kn
e?
1
?
3
2
2
3 ???
?
kn
e
?
42
（ 4） H0：
H1,（或）
检验统计量为 F0 = ～ F（ n3-k-1,n1-k-1）
若 F0＞ Fc,则拒绝 H0,存在异方差性。
例,S=α +β Y + u 其中,S=储蓄 Y=收入
设 1951—60年, =0.01625
1970—79年, =0.9725
F0 = 0.9725/0.01625=59.9
查表得, d.f.为（ 8,8）时, 5% Fc=3.44
∵F 0＞ Fc 因而拒绝 H0。
结论：存在异方差性。
2321 ?? ?
2321 ?? ? 2321 ?? ?
2
1
2
3
?
?
?
?
21??
23??
43
三广义最小二乘法
1,消除异方差性的思路
基本思路：变换原模型, 使经过变换后的模型具有同方差
性, 然后再用 OLS法进行估计。
对于模型
Yt = β 0+β 1X1t+… +β k Xkt+ ut （ 1）
若扰动项满足 E(ut) = 0,E(uiuj) = 0,i≠j,但
E(ut2) = ≠常数,
也就是说, 该模型只有同方差性这一条件不满足, 则只要
能将具有异方差性的扰动项的方差表示成如下形式：
Var(ut) =, t=1,2,…, n
其中为一未知常数, 表示一组已知数值, 则用 λ t去除
模型各项, 得变换模型,
2t?
222 tt ??? ?
2? 2t?
44
（ 2）
由于
所以变换后的扰动项的方差为常数, 可以应用 OLS法进行
估计, 得到的参数估计量为 BLUE。但这里得到的 OLS估
计量是变模后模型（ 2）的 OLS估计量。对于原模型而言,
它已不是 OLS估计量, 称为广义最小二乘估计量（ GLS估
计量）。
t
t
t
Kt
K
t
t
tt
t uXXY
??????
?
? ?????,..
1
1
0
222
22
1)(1)( ???
??? ??? ttttt
t uV a ruV a r
45
2,广义最小二乘法 (Generalized least squares)
下面用矩阵形式的模型来推导出 GLS估计量的一
般计算公式。
设 GLS模型为 Y=Xβ +u （ 1）
满足 E(u） = 0,E(uu′)=?2Ω, X 非随机,
X的秩 =K+1＜ n,其中 Ω 为正定矩阵。
（注, 正定矩阵是和单位矩阵合同的矩阵；
正定矩阵 <=>所有顺序主子式均大于 0。）
46
根据矩阵代数知识可知，对于任一正定矩阵 Ω,存在着一
个满秩（非退化，非奇异）矩阵 P，使得
用 P-1左乘原模型（ 1）（对原模型进行变换）：
令 Y* =P-1Y,X* = P-1X,u* = P-1u，得到
Y*= X*β + u* （ 2）
下面的问题是，模型（ 2）的扰动项 u*是否满足 OLS法的
基本假设条件。
111 )(,??? ?????? PPPP
uPXPYP 111 ??? ?? ?
47
))(()( 11** ???? ?? PuuPEuuE
))(( 11 ??? ?? PuuEP
))(( 121 ??? ?? PP ?
))(( 112 ??? ?? PPPP?
))(( 112 ?? ?? PPPP?
I2??
我们有
48
这表明, 模型（ 2）中的扰动项 u*满足 OLS法的基本假设,
可直接用 OLS估计, 估计量向量
这就是的广义最小二乘估计量（ GLS估计量）的公式, 该
估计量是 BLUE。
从上述证明过程可知, 我们可将 GLS法应用于 Ω 为任意正定
矩阵的情形。
**1** )(? YXXX ??? ??
YPPXXPPX 11111 )())(( ????? ?????
YXXX 111 )( ??? ?????
??
49
如果只存在异方差性, 则
其中
我们显然有
??? 2)( ?uuE
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
2
2
2
2
1
2
.......000
........
0......00
0......00
n
?
?
?
?
ntt,......,2,1,02 ???
PP
n
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
...,..,000
...,..,.
0...,..00
0...,..00
2
1
50
)(
1.......000
........
0......010
0......001
1
2
1
1
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
PP
n
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
2
2
2
2
1
1
1.......000
........
0......010
0......001
n
?
?
?
51
四广义最小二乘法的应用
1,根据实际问题确定 Ω 矩阵
应用 GLS法的关键是确定 Ω 矩阵。对于仅存在异方差性的
实际问题, Ω 矩阵是一个对角矩阵, 即
现在的问题是, 的值为已知这一假设是否现实, 也就是
我们能否根据实际问题, 提出有关扰动项方差的某种合理的
设想（即估计 Ω 矩阵）, 使得
（为未知常数, 为已知数值）
下面通过例子说明这一问题。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
2
2
1
......,000
......,.
0......00
0......00
n
?
?
?
2t?
2t?222 tt ??? ? 2?
52
例 1 Yt = β 1+β 2Xt+ ut t=1,2,…,n.
其中 Y=家庭消费支出 X=家庭可支配收入
我们在前面已分析过, 高收入家庭有较大的扰动项方差,
因此不妨假定扰动项方差与可支配收入成正比, 即
Var(ut)=δ Xt,t=1,2,…,n.
式中 δ 是一未知常数, 由于 Xt为已知, 相当于, 而 δ 相
当于, 因此
应用 GLS法, 即可得出 β 的 GLS估计量。
?
?
?
?
?
?
?
?
?
?
?
?
??
n
X
X
X
..,..,..000
..,..,..
0..,..,00
0..,..,00
? 2
1
2t?
2?
53
2,格里瑟检验法（ Glesjer test）
在上例中我们假设扰动项方差与解释变量的取值成正比,
这种假设是否真正合理呢？根据经验和分析做出的这种假设,
虽然有一定道理, 但未免显得过于武断, 这方面还可做一些
比较细致的工作。
Glesjer检验法不仅可检验异方差性的存在, 还可用于提供
有关异方差形式的进一步信息, 对于确定 Ω 矩阵很有用, 下
面我们扼要说明格里瑟检验法的步骤。
格里瑟检验法的思路是假定扰动项方差与解释变量之间存
在幂次关系, 方法是用对被认为与扰动项方差有关的解释
变量回归, 确定和该解释变量的关系。由于与该解释变量
之间关系的实际形式是未知的, 因此需要用该解释变量的不
同幂次进行试验, 选择出最佳拟合形式。
te
te
54
具体步骤如下：
(1)因变量 Y对所有解释变量回归, 计算残差 et
（ t=1,2,…,n）
（ 2）对所选择解释变量的各种形式回归, 如
然后利用决定系数, 选择拟合最佳的函数形式。
（ 3）对 β 1进行显著性检验, 若显著异于 0,则表明存在异
方差性, 否则再试其它形式。
................
1
10
10
10
2
10
t
jt
t
tjtt
tjtt
tjtt
u
X
e
uXe
uXe
uXe
???
???
???
???
??
??
??
??
te
55
格里瑟检验法的最大优点是能够提供有关异方差性形式的
信息, 为 GLS法提供 Ω 矩阵。缺点是太繁琐。因此建议用其
它方法检验异方差性的存在, 然后再用格里瑟法确定异方差
性的具体形式, 进而应用 GLS法。
例 2 Yt = β 1+β 2X1t+… +β k Xkt+ ut
假设我们根据经验知道扰动项方差与 Xjt有关, 并用格里瑟
法试验, 得出：
则
jtt X?? ?2
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
jn
j
j
X
X
X
.....,..000
.....,..
0.....,00
0.....,00
? 2
1
56
3,加权最小二乘法
对于仅存在异方差性的问题, 其 Ω 矩阵是一个对角矩阵,
即
在这种情况下应用广义最小二乘法, 也就是在原模型两端
左乘矩阵
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
2
2
2
1
n
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
P
?
?
?
1
......
1
1
2
1
1
变换原模型，再对变换后的模型应用普通最小二乘法进行估计。
57
这种作法实际上等价于在代数形式的原模型
Yt = β 0+β 1X1 t+… +β k X k t+ u t 的两端除以 ? t,得变换模
型：
t
t
t
Kt
K
t
t
tt
t uXXY
??????
?
? ????? ?
1
1
0
这种作法相当于在回归中给应变量和解释变量的每个观测值
都赋予一个与相应扰动项的方差相联系的权数
,然后再对这些变换后的数据进行 OLS回归, 因为这种作法相
当于每个观测值都以相应扰动项的标准差的估计值的倒数
（即）为权数, 因而被称为加权最小二乘法（ WLS法,
Weighted Least Squares）。
),...,2,1,1( ntt ??
t?
1 t
??
58
加权最小二乘法是广义最小二乘法的一个特例，在 Ω 矩阵
为对角矩阵这种特殊情形下，我们既可以直接应用矩阵形式
的广义最小二乘估计量公式得到 GLS估计值，亦可避开矩阵运
算，采用加权最小二乘法得到其 WLS估计值，两者结果完全相
同，无论你称之为 GLS估计值还是 WLS估计值，二者是一码事。
例, （ 1）
其中,Y=R&D支出, X=销售额
采用美国 1988年 18个行业的数据估计上述方程, 结果如
下（括号中数字为 t值）,
这里是横截面数据, 由于行业之间的差别, 可能存在异
方差性。
iii uXY ??? 21 ??
)8 4 3 4.3()1 9 4 8.0(
4 7 8 3.00 3 1 9.099.192? 2 ??? RXY ii
59
应用格里瑟法试验，得到异方差性形式为：
ii X?? ?2
将原模型（ 1）的两端除以, 得
用 OLS法估计（ 2）式, 结果如下（括号中数字为 t值）,
与（ 1）式的结果比较, 两个方程斜率系数的估计值相差
不大, 但采用 WLS法估计的比直接用 OLS法估计的系数更为显
著, 这表明 OLS法高估了 X系数的标准差。
iX
)2(1 21
i
i
i
ii
i
X
uX
XX
Y ??? ??
)172.5()647.0(:)(
6 2 5 8.00 3 6 8.0
1
68.246
?
2
?
??????
?
?
?
?
?
?
t
RX
XX
Y
i
ii
i
60
第四节自相关
一定义
若 Cov(ui,uj) = E(uiuj) =0,i≠j不成立, 即线性回归模型
扰动项的方差 —协方差矩阵的非主对角线元素不全为 0,则
称为扰动项自相关, 或序列相关（ Serial Correlation）。
二自相关的原因及后果
1,原因
自相关主要发生在时间序列数据的情形, 因而亦称为序列
相关, 主要有以下两种原因：
（ 1）冲击的延期影响（惯性）
在时间序列数据的情况下, 随机冲击（扰动）的影响往往
持续不止一个时期。例如, 地震, 洪水, 罢工或战争等将在
发生期的后续若干期中影响经济运行。
61
微观经济中也与此类似，如一个工厂的产量，由于某种
外部偶然因素的影响（如某种原材料的供应出了问题），该
厂某周产量低于正常水平，那么，随后的一周或几周中，由
于这种影响的存在或延续，产量也很可能低于正常水平（即
扰动项为负）。
不难看出，观测的周期越长，这种延期影响的严重性就
越小，因此，年度数据比起季度数据来，序列相关成为一个
问题可能性要小。
（ 2）误设定
如果忽略了一个有关的解释变量, 而该变量是自相关的,
则将使扰动项自相关, 不正确的函数形式也将导致同样后果。
在这些情况下, 解决的方法是纠正误设定。本章后面将介绍
的纠正自相关的方法都不适用于这种情况的自相关。
62
2,后果
自相关的后果与异方差性类似。
（ 1）在扰动项自相关的情况下, 尽管 OLS估计量
仍为无偏估计量, 但不再具有最小方差的性质,
即不是 BLUE。
（ 2） OLS估计量的标准误差不再是真实标准误差
的无偏估计量, 使得在自相关的情况下, 无法
再信赖回归参数的置信区间或假设检验的结果。
63
三自相关的检验
1,检验一阶自相关的德宾 —沃森检验法（ Durbin—Watson test）
（ 1）一阶自相关
自相关的最简单模式为：
ut = ρ ut-1 + ε t,t=1,2,…,n.
其中 ρ 称为自相关系数（ -1≤ ρ ≤ 1）, 这种扰动项的自
相关称为一阶自相关, 即扰动项仅与其前一期的值有关。我
们有：
ρ >0 正自相关
ρ <0 负自相关
ρ =0 无自相关
64
在一阶自相关模式中，假定 ε t具有以下性质：
E(ε t) = 0,E(ε t2) = ζ 2 = 常数，
E(ε iε j)=0,i≠ j,ε t服从正态分布。
在计量经济学中，具备上述性质的量称为白噪
声（ White noise），表示为
ε t= White noise
或
ε t= 白噪声
65
（ 2）德宾 —沃森检验法 (Durbin－ Watson d test)
统计软件包和研究报告在提供回归结果时通常都给出
DW（或 d）统计量的值, 该统计量是从 OLS回归的残差中
计算得来的, 它被用于一阶自相关的检验, 计算公式为：
DW和一阶自相关系数 ρ 的估计值之间存在以下近似关系：
DW ≈ 2 - 2
由于 -1 ≤ ρ ≤ 1,因而 0 ≤ DW ≤ 4。
不难看出, 直观判断准则是, 当 DW统计量接近 2时, 则无自
相关, DW值离 2越远, 则自相关存在的可能性越大。
?
?
?
?
??
?
n
t
t
n
t
tt
e
ee
DW
1
2
2
2
1 )(
??
66
DW检验的缺陷
我们当然期望能够有一张能够给出相应的 n,k和 α 值下
各种 DW临界值的表（就象 t检验, F检验一样）, 使得我们
可以按常规假设检验那样根据临界值作出判断。这样的表
是根据检验统计量在原假设成立的情况下的抽样分布编制
的。
不幸的是, DW统计量的分布依赖于解释变量的具体观测
值（即依赖于 X矩阵）。因此不象 t,F检验那样, 有一张
能够给出 DW临界值的表。
为解决这一问题, 德宾和沃森证明, DW统计量的真实
分布位于两个极限分布之间, 这两个分布分别称为下分布
和上分布, 如下图所示：
67
概率
密度
下分布上分布
0 A B C D DW值
每个分布的 95%临界水平用 A,B,C,D表示。
68
现假设 DW统计量的值位于 A的左边, 则不管这种情况下
的 DW统计量服从何种分布（上, 下或中间）, 无自相关的
原假设将被拒绝。与此类似, 若 DW统计量的值位于 D的右
边, 则亦可拒绝无自相关的原假设。
若 DW统计量的值位于 B和 C之间, 则可接受原假设。而
当 DW统计量的值位于 A和 B之间或 C和 D之间时, 则无法得
出结论。上述分析可以概括为：
DW<A或 DW>D 存在自相关
B<DW<C 无自相关
A<DW<B或 C<DW<D 无结论区
无结论区的存在是 DW法的最大缺陷。
德宾和沃森据此导出了一个下界 dL和一个上界 du来检验
自相关,dL和 du仅依赖于观测值的数目 n、解释变量 k，以及
显著性水平 α,而不依赖于解释变量所取的值。（请参阅
DW表）
69
实际的检验程序可用下面的示意图说明。
正自相关无结论区无自相关无结论区负自相关
0 dL du 2 4—du 4—dL 4
检验程序如下：
a,用 OLS法对原模型进行回归, 得残差 et (t=1,2,…,n)。
b,计算 DW值（计算机程序给出 DW值）。
c,用 N,K和 α 查表得 dL,du。
d,判别
70
若 DW ＜ dL,则存在正相关
若 DW＜ 2 若 dL ＜ DW ＜ du,无结论
若 du ＜ DW,则无自相关
若 DW>2，则令 DW′= 4 - DW，按上述准则进行判别。
例,DW=3.5,则 DW′= 4 - 3.5 = 0.5
查表（ n=30,k=2,α =5%）得,dL =1.28。
DW′=0.5 ＜ 1.28
结论：存在自相关。
71
2,其它检验自相关的方法
DW检验法只能检验一阶自相关, 并且, 如果方程中包括
滞后因变量（如 Yt-1,Yt-2等）时, 用 DW法检验容易产生偏差。
因此, 在碰到较复杂的情形, 我们应采用一些其它检验自
相关的方法。下面列出几种方法及其适用环境。
检验方法适用环境
Durbin-Watson d检验法一阶自相关, 方程中无 Y的滞后项
Durbin’s h 检验法一阶自相关, 方程中有 Yt-1
Box-Pierce检验法一般自相关（一阶, 二阶, …, K阶）
LM检验法一般自相关（一阶, 二阶, …, K阶）
72
四消除自相关的方法
1,一阶自相关
如果实际问题的自相关模式为一阶自相关, 则只要知道 ρ,
就可以完全消除自相关, 下面用双变量模型来说明, 但同样
的原理适用于多个解释变量的情形。
设 Yt = α +β Xt+ ut （ 1）
ut=ρ ut-1+ε t
其中 ε t是白噪声, 且 ρ ≠ 0。
（ 1）式两端取一期滞后, 得
Yt-1 = α +β Xt-1+ ut -1 （ 2）
（ 2）式两端乘以 ρ, 得
ρ Yt-1 = αρ+βρXt-1 + ρ ut -1 （ 3）
73
（ 1） -（ 3），得：
Yt -ρ Yt-1 = α (1-ρ )+β (Xt-ρ Xt-1) + (ut -ρ ut -1) （ 4）
（ 4）式中的扰动项为 ut -ρ ut–1 =ε t，从而满足标准假设
条件。
令 Yt′= Yt -ρ Yt-1 Xt′= Xt-ρ Xt-1
α ′=α (1-ρ ),有
Yt′ = α ′+β Xt′+ ε t （ 5）
若 ρ 为已知，我们就可用 OLS法直接统计（ 5）式，否则需
要先估计 ρ 。
在 ρ 未知的情况下，通常用下列两种方法。
74
（ 1）科克伦 —奥克特法（ Cochrane—Orcutt）
科克伦 —奥克特法是一个迭代过程, 步骤如下：
① 估计原模型（（ 1 ）式）, 计算 OLS 残差 et
（ t=1,2,…,n）。
② et对 et-1回归, 即估计 et=ρ et-1+ε t,得到 ρ 的估计值
③ 用产生
然后估计 Yt′ = α ′+β Xt′+ ε t, 得到 α 和 β 的估计值
和。
④ 重新计算残差, 返回第 ② 步。
此过程不断修改, 和, 直至收敛。
??
1? ???? ttt YYY ? 1? ???? ttt XXX ?
?? ??
??????
??
75
（ 2）希尔德雷斯 —卢法（ Hildreth—lu）
此方法实际上是一种格点搜索法（ Grid search）,即在 ρ
的预先指定范围（如 -1至 1）内指定格点之间距离（如 0.01）,
然后用这样产生的全部 ρ 值（ -1.00,-0.99,…, 1.00）产
生
Yt′= Yt -ρ Yt—1 Xt′= Xt-ρ Xt—1
估计
Yt′ = α ′+β Xt′+ ε t
产生最小标准误差的 ρ 值即作为 ρ 的估计值, 用该 ρ 值得
到的和即为原模型的系数估计值。?? ??
76
2,一般自相关
对于一般自相关问题, 我们可采用广义最小二乘法处理。
自相关意味着扰动项 u的方差 —协方差矩阵
E(u12） E(u1u2） … E(u1un）
E(uu′) = E(u2u1) E(u22) … E(u2un）
…… …… …… …… ……
E(unu1) E(unu2) … E(un2）
中某些 E（ uiuj） ≠ 0,i≠ j.即
E(uu’)=ζ 2Ω,
其中 Ω 为对称正定矩阵。因而可应用 GLS法。此方法可用
于任何类型的自相关, 步骤如下：
77
（ 1）规定自相关的形式
例：
（ 2）用代数方法确定 E(uu’) 矩阵的元素 E(ut2),E(utut-1),
E(utut-2),…,即用 ?1,? 2,…,?2等未知值表示上述元素,
于是得到了 Ω 矩阵。
（ 3）用 OLS法得到原方程的最小二乘残差 e1,e2,…,en,然
后根据这些残差估计 ?1,?2,…,得到其估计值
代入上一步得到的 Ω 矩阵, 从而给出全部元素为已知的
矩阵。
（ 4）计算
tttt uuu ??? ??? ?? 2211
,...,?,? 21 ??
??
YXXXG L S 111 ?)?(? ??? ??????
78
第五章小结
一, 误设定
误设定包括函数形式的误设定和解释变量的误设定。我们
重点介绍了两种类型的误设定。
1,模型中忽略了有关的解释变量
其后果是使参数估计量产生偏倚, 即 OLS估计量不再是无偏
估计量。
2,模型中包括了无关的解释变量
其后果是增大了估计量的方差, 但估计量仍无偏。
在实际工作中, 我们可用拉姆齐 RESET检验法检验模型是否
误设定, 但仍无法准确判断是何种类型的误设定。一般原则
是尽量不漏掉与因变量有关的解释变量尤其是理论上重要的
变量, 判断一个变量是否应加进回归方程中, 可依据本章介
绍的四项准则。
79
二, 多重共线性
当解释变量之间存在着高度相关时, 就会发生多重共线性。
多重共线性虽然不影响参数估计量的无偏性, 但会造成参数
估计量的高方差, 精度差和低 t值, 犯第 Ⅱ 类错误的可能性增
加,。
多重共线性可通过回归结果进行判断, 可以通过解释变量的
相关系数矩阵检验, 还可用条件指数检验。
解决多重共线性问题主要从以下两个方向进行：
1,减少要估计的参数, 即利用给定的数据估计较少的参数。
2、改变数据，即增加信息。
这是一个要在实践中反复摸索的问题。
80
三, 异方差性
若 Var（ ut） = σ2 = 常数的假设不成立, 则称扰动项具有
异方差性。
异方差性主要发生在横截面数据或时间跨度很大的时间
序列数据的情形。
1,异方差性的后果
（ 1）虽然 OLS估计量仍是无偏的, 但不再具有最小方差的
性质, 即不再是有效的。
（ 2）系数的置信区间和显著性检验结果不可信赖。
2,异方差性的检验
常用的检验方法有斯皮尔曼等级相关检验法, 戈德弗尔德
-夸特检验法和格里瑟检验法。建议采用前两种方法检验异
方差性的存在, 用格里瑟检验法确定异方差性的形式。
81
3,广义最小二乘法（ GLS法）
GLS模型 Y=Xβ+μ
满足 E（ μ） =0,E（ μμ’） =σ2Ω,X非随机
且 Rank（ X） =k+1<n,Ω为正定矩阵, 则 GLS估计量
为 BLUE。
4,用 GLS法消除异方差性
如果仅存在异方差性, 则 Ω矩阵可假设为一个对角矩阵,
即
>0,t=1,2,…, n
问题转化为如何确定（ t=1,2,…, n）的值, 这需要
根据具体问题而定。在没有明确线索时, 通常采用格里瑟
法通过实验确定之。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
2
n
2
2
2
1
?
?
?
? 2t?
2t?
YXXXG L S 111 )(? ??? ??????
82
四, 自相关
若 cov(ui,uj) = E(μiμj) =0,i≠j 不成立, 则我们说存在着扰动
项的自相关, 自相关也称为序列相关。
当我们应用时间序列数据时, 往往会碰到自相关的问题。此
外, 遗漏有关的解释变量也可能产生自相关的现象。自相关
的后果与异方差性的后果类似。
最常用的自相关检验法是德宾 -沃森检验法。 DW法适用于一
阶自相关模式：
ut=ρut-1+εt
且方程中不包括因变量的滞后项的情形。
其它方法包括适用于方程中有 Yt-1项的 h检验法（检验一阶自
相关）, 以及检验一般自相关的 Box-Pierce法和 LM法。
83
一阶自相关的消除，通常采用科克伦 -奥克
特法或希尔德雷斯 -卢法估计自相关系数 ρ，得
到其估计值后，对原模型进行变换，以消除扰
动项的自相关型，得到原模型参数的估计值。
一般自相关的消除，可采用 GLS法处理。
84
第五章习题
1,检验下列情况下是否存在扰动项的自相关。
(1) DW=0.81,n=21,k=3
(2) DW=2.25,n=15,k=2
(3) DW=1.56,n=30,k=5
2,有人建立了一个回归模型来研究我国县一级的教育支出：
Y=β0+β1X1+β2X2+β3X3+ u
其中,Y,X1,X2 和 X3分别为所研究县份的教育支出, 居民
人均收入, 学龄儿童人数和可以利用的各级政府教育拨款。
他打算用遍布我国各省, 市, 自治区的 100个县的数据来
估计上述模型。
（ 1）所用数据是什么类型的数据？
（ 2）能否采用 OLS法进行估计？为什么？
(3）如不能采用 OLS法, 你认为应采用什么方法？
85
3,试从下列回归结果分析存在问题及解决方法：
（ 1） = 24.7747 + 0.9415 - 0.0424 R=0.9635
(SE,) （ 6.7525）（ 0.8229）（ 0.0807）
其中,Y=消费, X2=收入, X3=财产, 且 n=5000
附,5%显著性水平下, tc(∞)=1.96
(2) = 0.4529 - 0.0041t R=0.5284
(t,) (-3.9606) DW=0.8252
其中 Y=劳动在增加值中份额, t=时间
该估计结果是使用 1949-1964年度数据得到的。
i2? i3?i??
i??

课件简介

课件名称：	计量经济学
课件分类：	经济
课件类型：	电子教案
文件大小：	1.34MB
下载次数：	1
评论次数：	1
用户评分：	7

用户列表