§ 5.4 从传统建模理论到约化建模理论一、传统建模理论与数据开采问题二,,从一般到简单,——约化建模型理论三、非嵌套假设检验四、约化模型的准则亨德瑞的约化建模理论,吸收了向量自回归建模法与协整理论的部分内容,提出了,从一般到简单,的建模思想,在现代计量经济建模理论方面有着较大影响。
20世纪 70年代中叶以来,计量经济学建模方法与建模理论得到了迅速发展。出现了利莫尔
( Leamer)的 贝叶斯建模方法,西姆斯( Sims)
的 向量自回归建模型法,亨德瑞( Hendry)的 约化建模理论 以及第 10章将要学习的 协整建模理论 。
这些现代建模理论是在对传统建模理论的不断质疑与修正中发展起来的,
一、传统建模理论与数据开采问题传统计量经济学的主导建模理论是,结构模型方法论,,
以先验给定的经济理论为建立模型的出发点,
以模型参数的估计为重心,
以参数估计值与其理论预期值相一致为判断标准,
是一个,从简单到复杂,的建模过程( simple-
to-general approach),
对不同变量及其数据的偿试与筛选过程,
这种传统的建模方法却有着某些固有的缺陷。
其中备受质疑的是这种建模过程的所谓,数据开采,( Data minimg)问题。
数据开采,对不同变量及其数据的偿试与筛选这一过程对最终选择的变量的 t检验产生较大影响当在众多备选变量中选择变量进入模型时,其中 t检验的真实的显著性水平已不再是事先给出的名义显著性水平。
显著性水平意味着将一个无关变量作为相关变量选入模型而犯错误的概率。
罗维尔( Lovell)给出了一个从 c个备选变量中选取 k个变量进入模型时,真实显著性水平?*与名义显著性水平?的关系:
*=1-(1-?)c/k
如,给定?=5%,如果 有 2个相互独立且与被解释变量无关的备选变量,误选一个进入模型的概率就成了 1-(1-0.05)2=0.0975
传统建模方法的另一问题是它的“随意性”。
其结果是:对同一研究对象,使用同一数据,
但不同的建模者往往得出不同的最终模型。
二、“从一般到简单” ——约化建模型理论该理论认为,在模型的最初设定上,就设立一个,一般,的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,各种可能的,简单,模型都被,嵌套,( nested) 在这个,一般,
的模型之中 。 然后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较,简单,的最终模型 。
这就是所谓的,从一般到简单,( general-to-
specific) 的建模理论 。
(1)约化建模理论提出了一个对不同先验假设的更为系统的检验程序;
(2) 初始模型就是一个包括所有可能变量的
,一般,模型,也就避免了过度的,数据开采,
问题;
(3)由于初始模型的,一般,性,所有研究者的
,起点,都有是相同的,因此,在相同的约化程序下,最后得到的最终模型也应该是相同的。
特点:
“从一般到简单,的建模理论 例例 3.5.1曾建立了一个中国城镇居民食品消费模型:
Q=f(X,P1,P0)
然而,有理由认为 X,P1,P0的变化可能会经过一段时期才会对 Q起作用,因为消费者固有的消费习惯是不易改变的 。 于是,可建立如下更,一般,的模型:
ttttt
tttt
PPPP
XXQQ
1010111211
121110
lnlnlnln
lnlnlnln
在估计该模型之前,并不知道食品消费需求是怎样决定的,但可以考察几种可能的情况,
ttttt PPXQ 011110 lnlnlnln
也可以认为,(2)由于食品是必需品,P1的变化并不对 Q产生影响,但仍受 P0与 X变动的影响,然而后者的影响却有着一期的滞后:
tttttt PPXXQ 102011210 lnlnlnlnln
如,(1)对食品的消费需求是一个,静态,行为,只有当期的因素发生作用:
可以看出,(*),(**)都是 原一般模型 的特例,
即都可通过对 原一般模型 施加约束得到。
( *)
( **)
如果一个模型可通过对,一般,模型施加约束得到,则称该模型,嵌套,在一般模型之中。
ttttt
tttt
PPPP
XXQQ
1010111211
121110
lnlnlnln
lnlnlnln
ttt
ttt
PP
XXQ
10201
1210
lnln
lnlnln
约束,?1=?1=?2=0
tt
ttt
P
PXQ
01
1110
ln
lnlnln
约束,?1=?2=?2=?2=0
tttttt PPPXQ )/l n ()/l n (ln 011010
约束,?1+?1+?1=0
一般地,一个,一般模型,具有如下两个重要特性,第一,与所考察问题相关的不同的先验理论与假设都,嵌套,在该一般模型中;
第二,能较好地拟合数据,并能满足模型设定偏误的各种检验 。
该两条性质是相互关联的 。 例如,如果某一重要理论被忽略,则相关的变量也就被排除在该,一般,
模型之外,从而使得该模型不能通过模型设定偏误的多种检验 。
一个,一般,的模型是能够进行诸如遗漏相关变量,多选无关变量以及误设函数形式的多种设定偏误检验的 。
从一般到简单的约化建模过程一旦建立了一个,一般,模型,就可对其进行 约化 ( simplification research),寻找可能的简单模型。
这往往是通过检验,嵌套,于其中的各种简单模型进行的。主要包括( 1)各种,约束,检验与( 2)设定偏误检验,等。
一般模型的约化过程,是一个 自上而下
( top-down)逐级化简的建模过程。 只有当观测数据不支持约束条件时,才退回到上一级,检验其他可能的约束,或者得到最终模型。
“从 一般 到简单,的建模程序面临的主要问题在于无法在两个没有嵌套关系的模型间进行选择。
这时,可能通过通常的拟合优度检验、池赤信息准则来帮助决策,更主要的检验是 非嵌套假设检验 。
三、非嵌套假设检验假设要检验下面两个非嵌套模型:
H0,Y=?0+?1X+?2Z+?
H1,Y=?0+?1X+?2W+?
上述两模型之间没有嵌套关系,无法进行约束检验。
同时,H0与 H1不是对立假设,拒绝假设 H0未必意味着接受假设 H1。 因此,通常的假设检验程序无法直接使用。
WZXY 3210
于是,可针对一般模型 (*)分别检验 H0与 H1 。
(*)
为此,一种称为 包容性 F检验 ( encompassing F
tests)被提了出来。这种检验是人为地构造一个
,一般,模型:
包容性 F检验主要存在以下问题,
(1)人为构造的一般模型没有实际的经济意义,
尤其在 H0与 H1分别反映两种对立的经济理论的情况下更是如此;
(2)有可能出现同时接受或拒绝 H0与 H1的现象;
(3)当 Z与 W高度相关时,往往导致既不能拒绝 H0,
也不能拒绝 H1,因为在一般模型中去掉任何一个变量,都不会使拟合优度下降很多。
另一个解决办法是建立如下的一般模型:
如果?=0,则为模型 H0,
如果?=1,则为模型 H1。
因此,可通过检验施加的约束?=0是否为真来判断 H0是否为正选模型。
问题是由该模型无法直接估计出?的值。戴维森( Davidson)和麦金农( Mackinnon)建议通过下面步骤估计?:
WXZXY 2102101
第一步,对模型 H1进行 OLS估计,得到?:
WXY 210
第二步,用估计的代替,一般模型,中的
0+?1X+?2W,并进行 OLS估计:
YZXY?1 210
戴维森和麦金农证明,在大样本下,H0为真时,
的 OLS估计量的 t统计量服从标准正态分布:
t~N(0,1)。
因此,如果?的 t统计量的绝对值大于给定显著性水平下的临界值,就拒绝模型 H0。
如果要检验模型 H1是否为真,仍可通过上面两个步骤进行,但需先对 H0进行 OLS估计,得到
,以它为另一解释变量估计如下模型:
YWXY?1 210
如果?显著地异于 0,则拒绝模型 H1为真的假设。
该非嵌套假设检验也被称为 J检验 ( J test),
因为需将两非嵌套模型联合起来进行参数的联合估计( joint estimation)。
注意,(1)拒绝 H0(或 H1)不意味着接受 H1(或 H0);
(2)J检验仍然存在同时接受或拒绝 H0与 H1的现象。
四、约化模型的准则从一般到简单的建模过程,同样存在着数据开采问题。
一个,一般,模型经过 k步约化后得到最终的简化模型,可以证明,每一步中的名义显著性水平?与最终模型中各种检验的实际显著性水平?*
间有如下关系:
*=1-(1-?)k
然而,与,从简单到复杂,这一传统建模方法相比,,从一般到简单,的建模过程能够展现模型建立的全过程;
同时建模过程的程式化( systematic manner)
也避免了过度的“数据开采”问题。
由于一定程度的数据开采不可避免,,从一般到简单,建模理论倡导更加关注模型的样本外预测( out-of-sample forecast)。
“从一般到简单”的建模方法,初始模型就可能包括了所有的相关变量,没有必要再进行遗漏相关变量的设定偏误检验。
“从一般到简单,的建模过程本身就是一项十分艰巨复杂的工作。各约化步骤往往是需要反复进行的,约化步骤的顺序也需要灵活按排。
而且,从实践上看,由于各种因素的影响,
所建立的最终的简化模型不一定就是最,理想,
的模型。亨德瑞给出了一个 约化模型的基本准则,
第一,模型必须具有数据一致 (data-coherent)
性,即模型能够正确地解释已有的数据 。约化过程中需不断进行设定偏误检验。
第二,模型必须与经济理论相一致( consistent
with economic theory) 。
第三,解释变量必须是弱外生的 (exogenous),
即解释变量应与随机扰动项不同期相关。
第四,模型具有恒定的参数 (constant parameters)
第五,模型具有包容性,即模型应包容相竞争的对手模型。
第六,模型具有简洁性 (parsimonious),即在具有相同解释能力的情况下,一个拥有较少解释变量的模型优于拥有较多解释变量的模型。
例 5.4.1 在 § 3.5的例 3.5.1中,曾以传统的建模方法建立了 1981~1994年间的中国城镇居民食品消费需求模型。
ttttt
tttt
PPPP
XXQQ
1010111211
121110
lnlnlnln
lnlnlnln
用小写字母代表变量的自然对数,则该一般模型的估计结果为:
这里再以“从一般到简单”这一建模理论来做进一步的考察。
初始的一般模型设定为
11 2 8 5.02 6 2 0.10 4 2.02 9 7.3 tttt xxqq
100111 3 9 7.02 2 7.10 1 5.00 2 9.0 tttt pppp
( 1.41) (0.09) (8.24) (-0.57)
(-0.65) (-0.24) (-6.03) (0.85)
给定 5%的显著性水平,可以判断,尽管若干个变量的 t检验不显著,但 总体上看,不存在模型的相关变量遗漏与函数形式的设定偏误问题,
而且参数也具有稳定性。因此,以它作为初始的一般模型是合适的。
进一步考察模型的约化问题,
首先,检验模型
tt
ttt
P
PXQ
01
1110
ln
lnlnln
tttt ppxq 01 9 2 5.00 8 0.00 5 5.16 3 4.3
(9.03) (25.35) (-2.28) (-7.35)
该模型是由,一般模型,去掉滞后变量得到,
相当于对滞后变量施加了零约束,由受约束的 F检验得检验值 F=2.188,相伴概率 p=0.207,可见,在
5%的显著性水平下,可接受该约束。
但是,存在着结构变化,而且 RSS有明显增大。
如果忽略存在结构变化这一特征,则上面模型能够作为一个可接受的模型,并可进一步检验
tttttt PPPXQ )/l n ()/l n (ln 011010
)(091.0)(073.1825.3? 010 ttttt pppxq
( 75.86)( 52.66) ( -3.62)
取?=5%,RESET检验表明 可能存在遗漏相关变量的设定偏误,这时 RSS的值也有所增大,而且
CHOW检验 也表明存在明显的结构变化。
20世纪 70年代中叶以来,计量经济学建模方法与建模理论得到了迅速发展。出现了利莫尔
( Leamer)的 贝叶斯建模方法,西姆斯( Sims)
的 向量自回归建模型法,亨德瑞( Hendry)的 约化建模理论 以及第 10章将要学习的 协整建模理论 。
这些现代建模理论是在对传统建模理论的不断质疑与修正中发展起来的,
一、传统建模理论与数据开采问题传统计量经济学的主导建模理论是,结构模型方法论,,
以先验给定的经济理论为建立模型的出发点,
以模型参数的估计为重心,
以参数估计值与其理论预期值相一致为判断标准,
是一个,从简单到复杂,的建模过程( simple-
to-general approach),
对不同变量及其数据的偿试与筛选过程,
这种传统的建模方法却有着某些固有的缺陷。
其中备受质疑的是这种建模过程的所谓,数据开采,( Data minimg)问题。
数据开采,对不同变量及其数据的偿试与筛选这一过程对最终选择的变量的 t检验产生较大影响当在众多备选变量中选择变量进入模型时,其中 t检验的真实的显著性水平已不再是事先给出的名义显著性水平。
显著性水平意味着将一个无关变量作为相关变量选入模型而犯错误的概率。
罗维尔( Lovell)给出了一个从 c个备选变量中选取 k个变量进入模型时,真实显著性水平?*与名义显著性水平?的关系:
*=1-(1-?)c/k
如,给定?=5%,如果 有 2个相互独立且与被解释变量无关的备选变量,误选一个进入模型的概率就成了 1-(1-0.05)2=0.0975
传统建模方法的另一问题是它的“随意性”。
其结果是:对同一研究对象,使用同一数据,
但不同的建模者往往得出不同的最终模型。
二、“从一般到简单” ——约化建模型理论该理论认为,在模型的最初设定上,就设立一个,一般,的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,各种可能的,简单,模型都被,嵌套,( nested) 在这个,一般,
的模型之中 。 然后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较,简单,的最终模型 。
这就是所谓的,从一般到简单,( general-to-
specific) 的建模理论 。
(1)约化建模理论提出了一个对不同先验假设的更为系统的检验程序;
(2) 初始模型就是一个包括所有可能变量的
,一般,模型,也就避免了过度的,数据开采,
问题;
(3)由于初始模型的,一般,性,所有研究者的
,起点,都有是相同的,因此,在相同的约化程序下,最后得到的最终模型也应该是相同的。
特点:
“从一般到简单,的建模理论 例例 3.5.1曾建立了一个中国城镇居民食品消费模型:
Q=f(X,P1,P0)
然而,有理由认为 X,P1,P0的变化可能会经过一段时期才会对 Q起作用,因为消费者固有的消费习惯是不易改变的 。 于是,可建立如下更,一般,的模型:
ttttt
tttt
PPPP
XXQQ
1010111211
121110
lnlnlnln
lnlnlnln
在估计该模型之前,并不知道食品消费需求是怎样决定的,但可以考察几种可能的情况,
ttttt PPXQ 011110 lnlnlnln
也可以认为,(2)由于食品是必需品,P1的变化并不对 Q产生影响,但仍受 P0与 X变动的影响,然而后者的影响却有着一期的滞后:
tttttt PPXXQ 102011210 lnlnlnlnln
如,(1)对食品的消费需求是一个,静态,行为,只有当期的因素发生作用:
可以看出,(*),(**)都是 原一般模型 的特例,
即都可通过对 原一般模型 施加约束得到。
( *)
( **)
如果一个模型可通过对,一般,模型施加约束得到,则称该模型,嵌套,在一般模型之中。
ttttt
tttt
PPPP
XXQQ
1010111211
121110
lnlnlnln
lnlnlnln
ttt
ttt
PP
XXQ
10201
1210
lnln
lnlnln
约束,?1=?1=?2=0
tt
ttt
P
PXQ
01
1110
ln
lnlnln
约束,?1=?2=?2=?2=0
tttttt PPPXQ )/l n ()/l n (ln 011010
约束,?1+?1+?1=0
一般地,一个,一般模型,具有如下两个重要特性,第一,与所考察问题相关的不同的先验理论与假设都,嵌套,在该一般模型中;
第二,能较好地拟合数据,并能满足模型设定偏误的各种检验 。
该两条性质是相互关联的 。 例如,如果某一重要理论被忽略,则相关的变量也就被排除在该,一般,
模型之外,从而使得该模型不能通过模型设定偏误的多种检验 。
一个,一般,的模型是能够进行诸如遗漏相关变量,多选无关变量以及误设函数形式的多种设定偏误检验的 。
从一般到简单的约化建模过程一旦建立了一个,一般,模型,就可对其进行 约化 ( simplification research),寻找可能的简单模型。
这往往是通过检验,嵌套,于其中的各种简单模型进行的。主要包括( 1)各种,约束,检验与( 2)设定偏误检验,等。
一般模型的约化过程,是一个 自上而下
( top-down)逐级化简的建模过程。 只有当观测数据不支持约束条件时,才退回到上一级,检验其他可能的约束,或者得到最终模型。
“从 一般 到简单,的建模程序面临的主要问题在于无法在两个没有嵌套关系的模型间进行选择。
这时,可能通过通常的拟合优度检验、池赤信息准则来帮助决策,更主要的检验是 非嵌套假设检验 。
三、非嵌套假设检验假设要检验下面两个非嵌套模型:
H0,Y=?0+?1X+?2Z+?
H1,Y=?0+?1X+?2W+?
上述两模型之间没有嵌套关系,无法进行约束检验。
同时,H0与 H1不是对立假设,拒绝假设 H0未必意味着接受假设 H1。 因此,通常的假设检验程序无法直接使用。
WZXY 3210
于是,可针对一般模型 (*)分别检验 H0与 H1 。
(*)
为此,一种称为 包容性 F检验 ( encompassing F
tests)被提了出来。这种检验是人为地构造一个
,一般,模型:
包容性 F检验主要存在以下问题,
(1)人为构造的一般模型没有实际的经济意义,
尤其在 H0与 H1分别反映两种对立的经济理论的情况下更是如此;
(2)有可能出现同时接受或拒绝 H0与 H1的现象;
(3)当 Z与 W高度相关时,往往导致既不能拒绝 H0,
也不能拒绝 H1,因为在一般模型中去掉任何一个变量,都不会使拟合优度下降很多。
另一个解决办法是建立如下的一般模型:
如果?=0,则为模型 H0,
如果?=1,则为模型 H1。
因此,可通过检验施加的约束?=0是否为真来判断 H0是否为正选模型。
问题是由该模型无法直接估计出?的值。戴维森( Davidson)和麦金农( Mackinnon)建议通过下面步骤估计?:
WXZXY 2102101
第一步,对模型 H1进行 OLS估计,得到?:
WXY 210
第二步,用估计的代替,一般模型,中的
0+?1X+?2W,并进行 OLS估计:
YZXY?1 210
戴维森和麦金农证明,在大样本下,H0为真时,
的 OLS估计量的 t统计量服从标准正态分布:
t~N(0,1)。
因此,如果?的 t统计量的绝对值大于给定显著性水平下的临界值,就拒绝模型 H0。
如果要检验模型 H1是否为真,仍可通过上面两个步骤进行,但需先对 H0进行 OLS估计,得到
,以它为另一解释变量估计如下模型:
YWXY?1 210
如果?显著地异于 0,则拒绝模型 H1为真的假设。
该非嵌套假设检验也被称为 J检验 ( J test),
因为需将两非嵌套模型联合起来进行参数的联合估计( joint estimation)。
注意,(1)拒绝 H0(或 H1)不意味着接受 H1(或 H0);
(2)J检验仍然存在同时接受或拒绝 H0与 H1的现象。
四、约化模型的准则从一般到简单的建模过程,同样存在着数据开采问题。
一个,一般,模型经过 k步约化后得到最终的简化模型,可以证明,每一步中的名义显著性水平?与最终模型中各种检验的实际显著性水平?*
间有如下关系:
*=1-(1-?)k
然而,与,从简单到复杂,这一传统建模方法相比,,从一般到简单,的建模过程能够展现模型建立的全过程;
同时建模过程的程式化( systematic manner)
也避免了过度的“数据开采”问题。
由于一定程度的数据开采不可避免,,从一般到简单,建模理论倡导更加关注模型的样本外预测( out-of-sample forecast)。
“从一般到简单”的建模方法,初始模型就可能包括了所有的相关变量,没有必要再进行遗漏相关变量的设定偏误检验。
“从一般到简单,的建模过程本身就是一项十分艰巨复杂的工作。各约化步骤往往是需要反复进行的,约化步骤的顺序也需要灵活按排。
而且,从实践上看,由于各种因素的影响,
所建立的最终的简化模型不一定就是最,理想,
的模型。亨德瑞给出了一个 约化模型的基本准则,
第一,模型必须具有数据一致 (data-coherent)
性,即模型能够正确地解释已有的数据 。约化过程中需不断进行设定偏误检验。
第二,模型必须与经济理论相一致( consistent
with economic theory) 。
第三,解释变量必须是弱外生的 (exogenous),
即解释变量应与随机扰动项不同期相关。
第四,模型具有恒定的参数 (constant parameters)
第五,模型具有包容性,即模型应包容相竞争的对手模型。
第六,模型具有简洁性 (parsimonious),即在具有相同解释能力的情况下,一个拥有较少解释变量的模型优于拥有较多解释变量的模型。
例 5.4.1 在 § 3.5的例 3.5.1中,曾以传统的建模方法建立了 1981~1994年间的中国城镇居民食品消费需求模型。
ttttt
tttt
PPPP
XXQQ
1010111211
121110
lnlnlnln
lnlnlnln
用小写字母代表变量的自然对数,则该一般模型的估计结果为:
这里再以“从一般到简单”这一建模理论来做进一步的考察。
初始的一般模型设定为
11 2 8 5.02 6 2 0.10 4 2.02 9 7.3 tttt xxqq
100111 3 9 7.02 2 7.10 1 5.00 2 9.0 tttt pppp
( 1.41) (0.09) (8.24) (-0.57)
(-0.65) (-0.24) (-6.03) (0.85)
给定 5%的显著性水平,可以判断,尽管若干个变量的 t检验不显著,但 总体上看,不存在模型的相关变量遗漏与函数形式的设定偏误问题,
而且参数也具有稳定性。因此,以它作为初始的一般模型是合适的。
进一步考察模型的约化问题,
首先,检验模型
tt
ttt
P
PXQ
01
1110
ln
lnlnln
tttt ppxq 01 9 2 5.00 8 0.00 5 5.16 3 4.3
(9.03) (25.35) (-2.28) (-7.35)
该模型是由,一般模型,去掉滞后变量得到,
相当于对滞后变量施加了零约束,由受约束的 F检验得检验值 F=2.188,相伴概率 p=0.207,可见,在
5%的显著性水平下,可接受该约束。
但是,存在着结构变化,而且 RSS有明显增大。
如果忽略存在结构变化这一特征,则上面模型能够作为一个可接受的模型,并可进一步检验
tttttt PPPXQ )/l n ()/l n (ln 011010
)(091.0)(073.1825.3? 010 ttttt pppxq
( 75.86)( 52.66) ( -3.62)
取?=5%,RESET检验表明 可能存在遗漏相关变量的设定偏误,这时 RSS的值也有所增大,而且
CHOW检验 也表明存在明显的结构变化。