1
第二十五章 时间序列 /截面数据模型
在经典计量经济学模型中, 所利用的数据 ( 样本观测值 ) 的一个特征是,
或者只利用时间序列数据 (time series),或者只利用截面数据 (cross section)。
我们经常遇到在同一时间包含不同截面成员信息的数据, 或在若干时间区间
观测到相关的一些截面成员的数据 。 例如许多欧洲国家的 GDP时间序列数据,
或者是一段时间不同地区的失业状态数据 。 我们称这些数据为联合利用时间
序列 /截面数据 ( Pooled time series,cross section) 。 有的书中也称这类数据
为面板数据 (panel data),指在时间序列上取多个截面, 在这些截面上同时选
取样本观测值所构成的样本数据 。
处理时间序列 /截面数据的 EViews对象称为一个 Pool。 EViews提供了许多
专用工具处理 Pool数据, 包括数据管理, 选择时间序列长度和截面成员的多
少, 以及进行数据估计 。
本章将主要介绍怎样建立 Pool数据以及定义和处理 Pool对象 。
2
§ 25.1 Pool对象
Pool对象的核心是建立用来表示截面成员的名称表 。 为明显起见, 名
称要相对较短 。 例如, 国家作为截面成员时, 可以使用 USA代表美国,
CAN代表加拿大, UK代表英国 。
定义了 Pool的截面成员名称就等于告诉了 EViews,模型 的数据结构 。
在上面的例子中, EViews会自动把这个 Pool理解成对每个国家使用单独的
时间序列 。
必须注意,Pool对象本身不包含序列或数据。一个 Pool对象只是对基
本数据结构的一种描述。因此,删除一个 Pool并不会同时删除它所使用的
序列,但修改 Pool使用的原序列会同时改变 Pool中的数据。
3
一、创建 Pool对象
在本章中, 使用的是一个研究投资需求的例子, 包括了五家企业和三
个变量的 20个年度观测值的时间序列,
5家企业,3个变量,
CM:通用汽车公司 I, 总投资
CH:克莱斯勒公司 F,前一年企业的市场价值
GE:通用电器公司 S, 前一年末工厂存货和设备的价值
WE:西屋公司
US:美国钢铁公司
要创建 Pool对象,选择 Objects/New Object/Pool… 并在编辑窗口中输入
截面成员的识别名称,
4
对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建
立合法的 EViews序列名称。此处推荐在每个识别名中使用, _”字符,它不
是必须的,但把它作为序列名的一部分,可以很容易找到识别名称。
5
二, 观察或编辑 Pool定义
要显示 Pool中的截面成员识别名称,单击工具条的 Define按钮,或选择
View/Cross-Section Identifiers。如果需要,也可以对识别名称列进行编辑。
三、使用 Pool和序列
Pool中 使用的数据都存在普通 EViews序列中 。 这些序列可以按通常方式
使用:可以列表显示, 图形显示, 产生新序列, 或用于估计 。 也可以使用
Pool对象来处理各单独序列 。
四, 序列命名
在 Pool中使用序列的关键是序列命名:使用 基本名 和 截面识别名称 组合
命名 。 截面识别名称可以放在序列名中的任意位置, 只要保持一致即可 。
例如, 现有一个 Pool对象含有识别名 _ JPN,_ USA,_ UK,想建立
每个截面成员的 GDP的时间序列, 我们就使用, GDP”作为序列的基本名 。
可以把识别名称放在基本名的后面, 此时序列名为 GDP_ JPN,GDP_
USA,GDP_ UK;或者把识别名称放在基本名的前面, 此时序列名为 JPN_
GDP,USA_ GDP,UK_ GDP。
6
把识别名称放在序列名的前面, 中间或后面并没什么关系, 只要易于识
别就行了 。 但是必须注意要保持一致, 不能这样命名序列,JPNGDP,
GDPUSA,UKGDP1,因为 EViews无法在 Pool对象中识别这些序列 。
五, Pool序列
一旦选定的序列名和 Pool中的截面成员识别名称相对应, 就可以利用这
些序列使用 Pool了 。 其中关键是要理解 Pool序列 的概念 。
一个 Pool序列实际就是一组序列,序列名是由基本名和所有截面识别名构
成的 。 Pool序列名使用基本名和,?, 占位符, 其中,?, 代表截面识别名 。
如果序列名为 GDPJPN,GDPUSA,GDPUK,相应的 Pool序列为 GDP?。 如果
序列名为 JPNGDP,USAGDP,UKGDP,相应的 Pool序列为?GDP。
当使用一个 Pool序列名时,EViews认为将准备使用 Pool序列中的所有序
列。 EViews会自动循环查找所有截面识别名称并用识别名称替代,?, 。然
后会按指令使用这些替代后的名称了。 Pool序列必须通过 Pool对象来定义,
因为如果没有截面识别名称,占位符,?, 就没有意义。
7
§ 25.2 输入 Pool数据
有很多种输入数据的方法, 在介绍各种方法之前, 首先要理解时间序列 /
截面数据的结构, 区别堆积数据和非堆积数据形式 。
时间序列 /截面数据的数据信息用三维表示:时期, 截面成员, 变量 。 例
如,1950年, 通用汽车公司, 投资数据 。
使用三维数据比较困难, 一般要转化成二维数据 。 有几种常用的方法 。
一, 非堆积数据
存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成
员、给定变量的观测值放在一起,但和其他变量、其他截面成员的数据分开。
例如,假定我们的数据文件为下面的形式,
8
其中基本名 I代表企业总投资, F代表前一年企业的市场价值, S代表前
一年末工厂存货和设备的价值 。 每个企业都有单独的 I,F,S数据 。
EViews会自动按第四章介绍的标准输入程序读取非堆积数据。并把每个
截面变量看作一个单独序列。注意要按照上述的 Pool命名规则命名。
9
确认后 EViews会打开新建序列的堆积式数据表。我们看到的是按截
面成员堆积的序列,Pool序列名在每列表头,截面成员 /年代识别符标识
每行,
二、堆积数据
选择 View/Spreadsheet( stacked data),EViews会要求输入序列名列表
10
Pool数据排列成堆积形式, 一个变量的所有数据放在一起, 和其他
变量的数据分开 。 大多数情况下, 不同截面成员的数据从上到下依次堆
积, 每一列代表一个变量,
11
我们称上表数据是以截面成员堆积的,单击 Order+/-实现堆积方式转换,
也可以按日期堆积数据,
每一列代表一个变量,每一列内数据都是按年排列的。如果数据按年排列,
要确保各年内截面成员的排列顺序要一致。
12
三, 手工输入 /剪切和粘贴
可以通过手工输入数据, 也可以使用剪切和粘贴工具输入,
1.通过确定工作文件样本来指定堆积数据表中要包含哪些时间序列观测值 。
2.打开 Pool,选择 View/Spreadsheet( stacked data), EViews会要求输入
序列名列表, 可以输入普通序列名或 Pool序列名 。 如果是已有序列, EViews
会显示序列数据;如果这个序列不存在, EViews会使用已说明的 Pool序列的
截面成员识别名称建立新序列或序列组 。
3.打开 Pool序列的堆积式数据表 。 需要的话还可以单击 Order +/-按钮进行
按截面成员堆积和按日期堆积之间的转换 。
4.单击 Edit+/-按钮打开数据编辑模式输入数据 。
如果有一个 Pool包含识别名 _CM,_CH,_GE,_WE,_US,通过输入:
I? F? S?,指示 Eviews来创建如下序列,I_CM,I_CH,I_GE,I_WE,I_US;
F_CM,F_CH,F_GE,F_WE,F_US; S_CM,S_CH,S_GE,S_WE,
S_US,
13
四, 文件输入
可以使用 Pool对象从文件输入堆积数据到各单独序列 。 当文件数据按截面
成员或时期堆积成时, EViews要求,
1,堆积数据是平衡的
2,截面成员在文件中和在 Pool中的排列顺序相同 。
平衡的意思是, 如果按截面成员堆积数据, 每个截面成员应包括正好相同
的时期;如果按日期堆积数据, 每个日期应包含相同数量的截面成员观测值,
并按相同顺序排列 。
特别要指出的是, 基础数据并不一定是平衡的, 只要在输入文件中有表示
即可 。 如果观测值中有缺失数据, 一定要保证文件中给这些缺失值留有位置 。
要使用 Pool对象从文件读取数据, 先打开 Pool,然后选择 Procs/Import Pool
Data(ASCII,.XLS,.WK?)…, 要使用与 Pool对象对应的输入程序 。
14
15
通过第四章的学习, 大家对这个对话框应该比较熟悉, 填写说明如下,
注明 Pool序列是按行还是按列排列, 数据是按截面成员堆积还是按日期堆
积 。
在编辑框输入序列的名称 。 这些序列名应该是普通序列名或者是 Pool名 。
填入样本信息, 起始格位置和表单名 ( 可选项 ) 。
如果输入序列用 Pool序列名, EViews会用截面成员识别名创建和命名序列 。
如果用普通序列名, EViews会创建单个序列 。
EViews会使用样本信息读入文件到说明变量中 。 如果输入的是普通序列
名, EViews会把多个数据值输入到序列中, 直到从文件中读入的最后一组数
据 。
从 ASCII文件中输入数据基本类似,但相应的对话框包括许多附加选项处
理 ASCII文件的复杂问题。详情请见第四章附录。
16
§ 25.3 输出 Pool数据
按照和上面数据输入相反的程序可进行数据输出。由于 EViews可以
输入输出非堆积数据,按截面成员堆积和按日期堆积数据,因此可以利
用 EViews按照需要调整数据结构。
17
§ 25.4 使用 Pool数据
每个截面成员的基础序列都是普通序列, 因此 EViews中对各单个截面成
员序列适用的工具都可使用 。 另外, EViews还有专门适用于 Pool数据的专用工
具 。 可以使用 EViews对与一特定变量对应的所有序列进行类似操作 。
一, 检查数据
用数据表形式查看堆积数据 。 选择 View/Spreadsheet (stacked data),然后
列出要显示的序列 。 序列名包括普通序列名和 Pool序列名 。 点击 Order+/-按钮
进行数据堆积方式的转换 。
二, 描述数据
可以使用 Pool对象计算序列的描述统计量 。 在 Pool工具栏选择 View/
Descriptive Statistics…, EViews会打开如下对话框,
18
在编辑框内输入计算描述统计量的序列 。 EViews可以计算序列的平均值,
中位数, 最小值, 最大值, 标准差, 偏度, 峰度, 和 Jarque-Bera统计量 。
下一步选择样本选项,
19
( 1) Individual,利用所有的有效观测值 。 即使某一变量的观测值是针对
某一截面成员的, 也计算在内 。
( 2) Common,使用的有效观测值必须是某一截面成员的数据, 在同一
期对所有变量都有数值 。 而不管同期其他截面成员的变量是否有值 。
( 3) Balanced,使用的有效观测值必须是对所有截面成员, 所有变量在
同一期都有数值 。
最后还必须选择与计算方法相对应的数据结构,
( 1) Stacked data,计算表中每一变量所有截面成员, 所有时期的统计量 。
如果忽略数据的 pool性质, 得到的就是变量的描述统计量 。
( 2) Stacked-means removed,计算除去截面平均值之后的描述统计量值 。
( 3) Cross-section specific,计算每个截面变量所有时期的描述统计量 。
是通过对各单独序列计算统计量而得到的 。
( 4) Time period specific,计算时期特性描述统计量。对每一时期,使用
pool中所有截面成员的变量数据计算的统计量。
20
注意, 后面两种方法可能产生很多输出结果 。 截面成员描述计算会对每
一变量 /截面成员组合产生一系列结果 。 如果有三个 Pool变量, 20个截面成员,
EViews就会计算 60个序列的描述统计量 。
可以把时期特性统计量存储为序列对象 。 从 Pool窗口选择 Procs/Make
Period Stat Series… 出现以下对话框, 在编辑窗口输入想计算的时期统计量的
序列名 。 然后选择计算统计量和样本选择 。
21
三, 生成数据
1,可以使用 PoolGenr(panelgenr)程序生成或者修改 Pool序列 。 点击 Pool工
具栏的 Poolgenr并输入要生成的方程式, 使用正确的 Pool名称 。 例如上面的例
子, 输入,r?=I?/I_US,相当于输入下面五个命令,
r_CM = I_CM/I_US
r_CH = I_CH/I_US
r_GE = I_GE/I_US
r_WE = I_WE/I_US
r_US = I_US/I_US
PoolGenr按照输入的方程在各截面成员间进行循环计算, 生成新的序列
或修改已有序列 。
2,可联合使用 PoolGenr和 Genr生成新的变量 。
22
例如, 要生成一个虚拟变量, 在美国钢铁 ( US) 时取 1,其他企业时取 0,
先选择 PoolGenr,然后输入,dum?=0,从而初始化所有虚拟变量序列为 0。 然
后, 把 US值设置为 1,在主菜单选择 Genr,然后输入,dum_US=1。
3,使用 Pool修改序列, 选择 PoolGenr然后输入新 Pool序列表达式,
dum?=dum?*(I?>S?)
4,还可以利用数据的内在循环特性进行给定时期的截面成员间的计算 。 例
如, 建立一普通序列 sum,初始值设为 0,然后选 PoolGenr并输入,
sum=sum+I?
相当于对普通序列从 Genr输入下列计算,
sum=I_GM+I_CH+I_GE+I_WE+I_US
这个例子用来说明内在循环这个概念。
23
四, 生成 Pool组
如果希望使用 EViews的组对象工具处理一系列 Pool序列, 选择 Procs/
Make Group… 输入普通序列和 Pool序列名称, EViews就会生成一个包含这些
序列的未命名组对象 。
五, 删除和存取数据
Pool可用来删除和存取序列 。 只需选择 Procs/Delete pool series…,
Procs/Store pool series(DB)…, Procs/Fetch pool series(DB)…, 输入普通序列
和 Pool序列名称即可 。
24
§ 25.5 时间序列 /截面数据模型估计方法
使用时间序列 /截面数据模型数据结构信息, 有很多种方法进行方程估计 。
可以估计固定截距模型, 随机截距模型, 或者模型变量对各截面成员的系数
不同, 以及估计单独的 AR(1)系数 。 也可以为各个截面成员分别估计一个方
程 。
EViews的 Pool对象估计模型使用的方法有:最小二乘法, 估计截面权重
的加权最小二乘法或似乎不相关回归 。 这些方法的使用都不改变原数据的排
序 。
下面将介绍怎样使用 Pool和系统估计更一般和复杂的模型,包括二阶段
最小二乘估计和非线性模型,以及有复杂截面系数限制的模型。
25
Pool对象估计的方程模型形式为,
(25.1)
其中 是因变量, 和 分别是对应于 i =1,2,…,N 的截面成员的解
释变量 k维向量和 k维参数 。 每个截面成员的观测期为 t =1,2,…,T。
我们可以把这些数据看作一系列截面说明回归量, 因此有 N个截面方程,
(25.2)
模型 (25.2)常用的有如下三种情形,
情形 1,
情形 2,
情形 3,
itiititit xy ??? ????
ity itx i?
iiiii xy ??? ????
jiji ???? ??,
jiji ???? ??,
jiji ???? ??,
26
对于情形 1,在横截面上无个体影响, 无结构变化, 则普通最小二乘法
估计给出了 和 的一致有效估计 。 相当于将多个时期的截面数据放在一
起作为样本数据 。 对于情形 2,称为变截距模型, 在横截面上个体影响不同,
个体影响表现为模型中被忽略的反映个体差异的变量的影响, 又分为固定
影响和随机影响两种情况 。 对于情形 3,称为变系数模型, 除了存在个体影
响外, 在横截面上还存在变化的经济结构, 因而结构参数在不同横截面上
是不同的 。
有 T个观测值互相堆积 。 为讨论方便, 把堆积方程表示为,
(25.3)
其中 和 X 分别包含了截面成员间对参数的所有限制。用分
块矩阵形式表示如下,
??? ??? XY
??? ??? XY
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
NNNNN X
X
X
y
y
y
?
?
?
?
?
?
?
?
?
??
?
????
?
?
??
2
1
2
1
2
1
2
1
2
1
00
00
00
27
并且方程的残差协方差矩阵为,
(25.5)
基本说明把 Pool说明作为联立方程系统并使用系统最小二乘法估计模型 。
当残差同期不相关, 并且时期和截面同方差时,
(25.6)
对堆积数据模型使用普通最小二乘法估计系数和协方差。
?
?
?
?
?
?
?
?
?
?
?
?
???
???
???
????
NNNN
N
N
EE
??????
??????
??????
??
?
????
?
?
21
22212
12111
)(
TN II ??? 2?
28
一, 固定影响 (Fixed Effects)
固定影响估计量通过为每个截面成员估计不同常数项使 不同 。 EViews
将每个变量减去平均值, 并用转换后的数据, 通过最小二乘估计来计算固定
影响,
(25.7)
其中
设,, 代表了 X 减均值的差额, bFE是使用普
通最小二乘估计的系数 。 通过使用均值差模型的普通最小二乘协方差公式估
计系数协方差矩阵,
(25.8)
i?
)()( iiiiiii xxyy ??? ??????
12 )~~(?)v a r ( ??? XXb wFE ?
X~
TTxxTyy t itit itit iti /,/,/ ??? ??? ??
iiit yyy ??~ iii xxx ??~
29
(25.9)
其中, 是固定影响模型的 SSR。 如果 Pool中有缺
失值, 就用除去缺失值后的总观测数代替 。
固定影响本身不是直接估计的, 计算公式为
(25.10)
固定影响系数中不报告标准差 。 如果想得到标准差, 应该选择截距说明
中的 Common选项, 来重新估计模型 。
值得注意的是估计有太多截面成员的截面常数回归模型可能很费时。
KNNT
bxy
KNNT
ee it FEititFEFE
w ??
???
??
?? ? 22 )~~(??
FEFEee?
Nbxy
t
FEiii /)(? ? ????
NT
FEFE bXYe ~~ ??
30
二, 随机影响 (Random Effects)
随机影响模型假设 项是共同系数 和不随时间改变的截面说明随机变
量 的和, 和残差 是不相关的 。
EViews按下列步骤估计随机影响模型,
(1) 使用固定影响模型的残差 估计 的方差, 并使用上述的 。
(2) 估计组间 ( 截面平均 ) 模型并计算,
(25.11)
其中 i = 1,2,……,
是组间回归的 SSR。 如果 的估计值是负值, EViews将返回错误信息 。
有缺失观测值时 在各截面成员间是不同的,EViews在进行方差估计时
使用最大 的值。只要缺失观测值的数目可渐进忽略,估计程序就是一致的。
it? ?
i?
FEe it? 2?w?
TKN
ee w
Bu
BB
B
2
222 ???,? ???? ??
?
??
BBee? 2?u?
iT
iT
iu iu
ititiit xuy ??? ????
Tbxye t ititiB /))((? ??? ?
31
(3) 对 转换后变量使用 OLS (X 包括常数项和回归量 x )
(25.12)
其中 。
EViews在输出中给出了由 (3)得到的 的参数估计 。 使用协方差矩阵的标
准估计量计算标准差 。
EViews给出了随机影响的估计值 。 计算公式为,
(25.13)
得到的是 的最优线性无偏预测值 。
最后, EViews给出了加权和不加权的概括统计量 。 加权统计量来自 (3)中的
GLS估计方程 。 未加权统计量来自普通模型的残差, 普通模型中包括 (3)中的参
数和估计随机影响,
(25.14)
iititiitit XXXyyy ?? ?,? ** ????
Bw ??? ?/?1? ??
?
)(??? 2
2
REit
t
it
B
u
i bXyu ?? ??
?
iu
iREititit ubXy ?? ????
32
三, 截面加权
当残差具有截面异方差性和同步不相关时最好进行截面加权回归,
(25.15)
EViews进行 FGLS,并且 从一阶段 Pool最小二乘回归得出 。
估计方差计算公式为,
(25.16)
其中 是 OLS的拟合值 。
估计系数值和协方差矩阵由标准 GLS估计量给出。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
????
NTN
T
T
I
I
I
EE
2
2
2
2
1
0
00
00
)( 2
1
?
?
?
??
??
????
?
?
iit
T
t
iti Tyy
i /)?(? 2
1
2 ?? ?
?
?
2i?
ity?
33
四, SUR加权
当残差具有截面异方差性和同步相关性时, SUR加权最小二乘是可行的
GLS估计量,
(25.17)
其中 是同步相关的对称阵,
(25.18)
一般项,在所有的 t时为常数。
?
?
?
?
?
?
?
?
?
?
?
?
??
NNNN
N
N
???
???
???
?
???
?
21
22221
11211
T
TNNTN
TNTT
TNTT
I
II
III
III
E ???
?
?
?
?
?
?
?
?
?
?
?
?
????
??
???
???
??
?
???
?
1
22221
11211
)(
)( itjtij E ??? ?
?
34
EViews估计 SUR模型时使用的 是由一阶段 Pool最小二乘回归得到,
(25.19)
分母中的最大值函数是为了解决向下加权协方差项产生的不平衡数据情况 。
如果缺失值的数目可渐进忽略, 这种方法生成可逆的 的一致估计量 。
模型的参数估计和参数协方差矩阵计算使用标准的 GLS公式 。
五, 怀特 ( White) 协方差估计
在 Pool估计中可计算怀特的异方差性一致协方差估计 ( 除了 SUR和随机影
响估计 ) 。 EViews使用堆积模型计算怀特协方差矩阵,
(25.20)
其中 K是估计参数总数。这种方差估计量足以解释各截面成员产生的异方差性,
但不能解释截面成员间同步相关的可能。
),m a x ()?)(?(? jit jtjtititij TTyyyy? ????
1
,
21 )()(
)(
)()v a r ( ?? ??
?
??
?
? ? ??
??
?? XXxxuXX
KN
Nb
ti itititi
i
?
ij??
35
§ 25.6 如何估计 Pool方程
单击 Pool工具栏的 Estimate选项打开如下对话框,
36
1,因变量
在因变量对话框中输入 Pool变量或 Pool变量表达式 。
2,样本
在右上角的编辑窗口中输入样本说明 。 样本的缺省值是各截面成员中的
最大样本值 。 如果得不到某时期截面成员的解释变量或因变量的值, 那么此
观测值会被排除掉 。
复选框 Balanced Sample说明在各截面成员间进行数据排除 。 只要某一时
期数据对任何一个截面成员无效, 此时期就被排除 。 这种排除保证得到的样
本区间对所有截面成员都是有效的 。
如果某截面成员的所有观测值都没有,那么 Pool在进行估计时就排除这
个截面成员。同时 EViews会在输出中告诉漏掉的截面成员。
37
3,解释变量
在两个编辑框中输入解释变量 。
Common coefficients:—— 此栏中输入的变量对所有截面成员有相同的
系数, 而各变量的系数则不同, 并用一般名称或 Pool名称输出结果 。
Cross-section specific coefficients:—— 此栏中输入的变量对 Pool中每个截
面成员的系数不同 。 EViews会对每个截面成员估计不同的系数, 并使用截
面成员识别名后跟一般序列名, 中间用, _, 连接进行标签 。
例如, 如果在共同系数编辑框中输入一般变量 F?和 S?,会输出 F?和 S?
的估计系数 。 如果在特定系数编辑框中输入这两个变量, 会输出如下形式
的系数,_GM--F_GM,_CH--F_CH,_GE--F_GE, _WE--F_WE,_US--
F_US和 _GM--S_GM,_CH--S_CH,_GE--S_GE,_WE--S_WE,_US--S_US,
等等 。
注意, 使用截面成员特定系数法估计模型会生成很多系数 —— 等于 Pool
中截面成员数和所列变量数的乘积 。
38
4,截距
在 Intercept:标示区对截距进行选择说明,
?
i?
None
没有截距; = 0
Common
对所有 Pool成员截距相同; =
Fixed effects
对每个 Pool成员截距不同; =
Random effects
把截距看作随机变量,
it?
it?
it?
不能用截面成员特定系数,AR项或者加权进行随机影响模型估计。
0)(,??? itiiit uEu ???
39
5,权重
在 Pool方程估计中, 缺省值为没有加权, 但是可以选择加权项 。 有三种
权重选择,
如果选择 Cross section weights,EViews会假设出现截面异方差性进行广
义最小二乘估计 。 如果选择 SUR,EViews会进行广义最小二乘估计修正截面
异方差性和同期相关性 。
No weighting
所有观测值赋予相同的权重
Cross section weights
GLS使用估计的截面残差的方差
SUR
类似似乎不相关回归 —— GLS使用估计
的截面成员残差协方差矩阵
40
EViews不能估计这样的模型:很少的时期或者庞大的截面成员 。 所用的
时期数平均应至少不小于截面成员数 。 即使有足够的观测值, 估计的残差相
关矩阵还必须是非奇异的 。 如果有一条不满足 EViews的要求, EViews会显示
错误信息:, Near Singular Matrix”。
复选框 Iterate to convergence控制可行 GLS程序 。 如果选择, EViews就一
直迭代权重和系数直到收敛 。 如果模型中包括 AR项, 这个选择就没有意义,
因为在 AR估计中, EViews会一直迭代直至收敛 。
6,选项
(1) Iteration and Convergence Options( 迭代和收敛选择 )
如果选择加权估计和迭代至收敛, 可以通过规定收敛准则和最大迭代次
数控制迭代过程 。 点击方程对话框的 Options按钮并输入要求值即可 。
41
(2) White Heteroskedasticity Covariance( White 异方差协方差 )
EViews能估计那些广义异方差性的强的协方差 。 这种形式的异方差性比
上面介绍的截面异方差性更普遍, 因为一个截面成员内的方差可以随时间不
同 。 要得到怀特标准差和协方差,点 Options按钮, 选择 White heteroskedasticity
Consistent Covariance。 注意此选项不适用于 SUR和随机影响估计 。
7,Pool方程举例
我们以前述的 5个企业, 3个变量数据作为例子:通用汽车, 克莱斯勒,
通用电气, 西屋和美国钢铁 。 相应的 Pool识别名称为 _GM,_CH,_GE,_WE,
_US。
首先,我们估计一个总投资 I?的回归模型,解释变量是投资的滞后 I?(-1)
(注意 ‘? ’ 必须放在滞后符前面)、前一年企业的市场价值 F?、存货和设
备价值 S?。所有系数限定为对所有截面成员是一样的,这等价于对堆积数据
忽略截面信息进行模型估计。
42
43
§ 25.7 Pool方程视图和过程
估计出 Pool方程后, 可以按下述方法检验输出结果,
1,表达式
选择 View/Representations检查输出。 EViews把 Pool估计成一个方程的系
统,每个截面成员一个方程。
44
2,估计输出
View/Estimation Output选项会改变合并估计结果的输出形式 。
像其他估计对象一样, 可通过选择 View/Coef Covariance Matrix来检查系
数协方差矩阵的估计 。
3,检验
EViews 可以进行 Pool 方程估计参数的系数检验 。 选择 View/Wald
Coefficient tests… 并输入要检验的限制条件 。
4,残差
选择 View/Residuals/Table或 View/Residuals/Graph可把残差表示成表格形
式或图形形式 。 EViews会显示每个截面方程的残差 。 残差命名形式为基本名
RES后跟截面识别名 。 如果想用这些名称存储残差序列, 选择 Procs/Make
Resids。
5,残差协方差 /相关性
可以检查估计残差的同步协方差矩阵和相关矩阵 。 选择 View/Residual,然
后选择 Correlation Matrix或 Covariance Matrix查看矩阵 。
45
6,预测
要使用 Pool方程进行预测必须先建立一个模型 。 选择 Procs/Make Model
建立一个包括所有估计系数的未命名模型对象 。 模型可以根据需要进行编辑 。
求解模型能对每个截面成员的因变量进行预测 。 详情见第 23章 。
7,用 Pool创建系统
可能有些复杂的时间序列 /截面数据方程不能用 Pool对象进行估计 。 要使
用更多的估计方法, 如二阶段最小二乘法, 三阶段最小二乘法, GMM,或使
用任意系数限制, 需要用 Pool对象创建一个系统对象 。 可以用一个已估计的
Pool创建系统, 也可以提供信息从 Pool生成系统 。 系统对象可进一步使用高级
技术进行估计 。
选择 Procs/Make System…, 填写对话框 。 像前面一样输入因变量, 规定
截距, 填写共同系数和截面特定系数变量 。 还可以填入工具变量 。 在每个方
程中普通变量可作为工具变量, Pool变量会在对应截面方程中把截面特定变
量作为工具变量,
46
47
单击, OK”后,建立一个未命名的系统对象;
I_GM = C(8) + C(1)*F_GM + C(2)*S_GM + C(3)*I_GM(-1) @ I_GM(-1)
F_GM(-1) S_GM(-1)
I_CH = C(9) + C(1)*F_CH + C(2)*S_CH + C(4)*I_CH(-1) @ I_CH(-1)
F_CH(-1) S_CH(-1)
I_GE = C(10) + C(1)*F_GE + C(2)*S_GE + C(5)*I_GE(-1) @ I_GE(-1)
F_GE(-1) S_GE(-1)
I_WE = C(11) + C(1)*F_WE + C(2)*S_WE + C(6)*I_WE(-1) @ I_WE(-1)
F_WE(-1) S_WE(-1)
I_US = C(12) + C(1)*F_US + C(2)*S_US + C(7)*I_US(-1) @ I_US(-1)
F_US(-1) S_US(-1)
48
§ 25.7 命 令
创建一个新 Pool对象, 在 Pool命令后输入 Pool对象名,Pool g7,创建一
个名称为 G7的 Pool对象 。
定义 Pool的截面成员, 用 define命令,
g7.define us uk ita ger fra can jap
定义 Pool对象 g7的截面成员为 US,UK,ITA,GER,FRA,CAN,JAP 。
用固定影响估计 Pool,用 f选项,
g7.ls(f) cs? @ gdp?
估计固定影响模型, 不限制 GDP系数对每个 Pool成员都是相同的 。 ( 相当
于对每个成员分别进行最小二乘估计 ) 。
Command and Programming Reference中有完整的命令列表和 Pool对象的
可用选项。 返 回
第二十五章 时间序列 /截面数据模型
在经典计量经济学模型中, 所利用的数据 ( 样本观测值 ) 的一个特征是,
或者只利用时间序列数据 (time series),或者只利用截面数据 (cross section)。
我们经常遇到在同一时间包含不同截面成员信息的数据, 或在若干时间区间
观测到相关的一些截面成员的数据 。 例如许多欧洲国家的 GDP时间序列数据,
或者是一段时间不同地区的失业状态数据 。 我们称这些数据为联合利用时间
序列 /截面数据 ( Pooled time series,cross section) 。 有的书中也称这类数据
为面板数据 (panel data),指在时间序列上取多个截面, 在这些截面上同时选
取样本观测值所构成的样本数据 。
处理时间序列 /截面数据的 EViews对象称为一个 Pool。 EViews提供了许多
专用工具处理 Pool数据, 包括数据管理, 选择时间序列长度和截面成员的多
少, 以及进行数据估计 。
本章将主要介绍怎样建立 Pool数据以及定义和处理 Pool对象 。
2
§ 25.1 Pool对象
Pool对象的核心是建立用来表示截面成员的名称表 。 为明显起见, 名
称要相对较短 。 例如, 国家作为截面成员时, 可以使用 USA代表美国,
CAN代表加拿大, UK代表英国 。
定义了 Pool的截面成员名称就等于告诉了 EViews,模型 的数据结构 。
在上面的例子中, EViews会自动把这个 Pool理解成对每个国家使用单独的
时间序列 。
必须注意,Pool对象本身不包含序列或数据。一个 Pool对象只是对基
本数据结构的一种描述。因此,删除一个 Pool并不会同时删除它所使用的
序列,但修改 Pool使用的原序列会同时改变 Pool中的数据。
3
一、创建 Pool对象
在本章中, 使用的是一个研究投资需求的例子, 包括了五家企业和三
个变量的 20个年度观测值的时间序列,
5家企业,3个变量,
CM:通用汽车公司 I, 总投资
CH:克莱斯勒公司 F,前一年企业的市场价值
GE:通用电器公司 S, 前一年末工厂存货和设备的价值
WE:西屋公司
US:美国钢铁公司
要创建 Pool对象,选择 Objects/New Object/Pool… 并在编辑窗口中输入
截面成员的识别名称,
4
对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建
立合法的 EViews序列名称。此处推荐在每个识别名中使用, _”字符,它不
是必须的,但把它作为序列名的一部分,可以很容易找到识别名称。
5
二, 观察或编辑 Pool定义
要显示 Pool中的截面成员识别名称,单击工具条的 Define按钮,或选择
View/Cross-Section Identifiers。如果需要,也可以对识别名称列进行编辑。
三、使用 Pool和序列
Pool中 使用的数据都存在普通 EViews序列中 。 这些序列可以按通常方式
使用:可以列表显示, 图形显示, 产生新序列, 或用于估计 。 也可以使用
Pool对象来处理各单独序列 。
四, 序列命名
在 Pool中使用序列的关键是序列命名:使用 基本名 和 截面识别名称 组合
命名 。 截面识别名称可以放在序列名中的任意位置, 只要保持一致即可 。
例如, 现有一个 Pool对象含有识别名 _ JPN,_ USA,_ UK,想建立
每个截面成员的 GDP的时间序列, 我们就使用, GDP”作为序列的基本名 。
可以把识别名称放在基本名的后面, 此时序列名为 GDP_ JPN,GDP_
USA,GDP_ UK;或者把识别名称放在基本名的前面, 此时序列名为 JPN_
GDP,USA_ GDP,UK_ GDP。
6
把识别名称放在序列名的前面, 中间或后面并没什么关系, 只要易于识
别就行了 。 但是必须注意要保持一致, 不能这样命名序列,JPNGDP,
GDPUSA,UKGDP1,因为 EViews无法在 Pool对象中识别这些序列 。
五, Pool序列
一旦选定的序列名和 Pool中的截面成员识别名称相对应, 就可以利用这
些序列使用 Pool了 。 其中关键是要理解 Pool序列 的概念 。
一个 Pool序列实际就是一组序列,序列名是由基本名和所有截面识别名构
成的 。 Pool序列名使用基本名和,?, 占位符, 其中,?, 代表截面识别名 。
如果序列名为 GDPJPN,GDPUSA,GDPUK,相应的 Pool序列为 GDP?。 如果
序列名为 JPNGDP,USAGDP,UKGDP,相应的 Pool序列为?GDP。
当使用一个 Pool序列名时,EViews认为将准备使用 Pool序列中的所有序
列。 EViews会自动循环查找所有截面识别名称并用识别名称替代,?, 。然
后会按指令使用这些替代后的名称了。 Pool序列必须通过 Pool对象来定义,
因为如果没有截面识别名称,占位符,?, 就没有意义。
7
§ 25.2 输入 Pool数据
有很多种输入数据的方法, 在介绍各种方法之前, 首先要理解时间序列 /
截面数据的结构, 区别堆积数据和非堆积数据形式 。
时间序列 /截面数据的数据信息用三维表示:时期, 截面成员, 变量 。 例
如,1950年, 通用汽车公司, 投资数据 。
使用三维数据比较困难, 一般要转化成二维数据 。 有几种常用的方法 。
一, 非堆积数据
存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成
员、给定变量的观测值放在一起,但和其他变量、其他截面成员的数据分开。
例如,假定我们的数据文件为下面的形式,
8
其中基本名 I代表企业总投资, F代表前一年企业的市场价值, S代表前
一年末工厂存货和设备的价值 。 每个企业都有单独的 I,F,S数据 。
EViews会自动按第四章介绍的标准输入程序读取非堆积数据。并把每个
截面变量看作一个单独序列。注意要按照上述的 Pool命名规则命名。
9
确认后 EViews会打开新建序列的堆积式数据表。我们看到的是按截
面成员堆积的序列,Pool序列名在每列表头,截面成员 /年代识别符标识
每行,
二、堆积数据
选择 View/Spreadsheet( stacked data),EViews会要求输入序列名列表
10
Pool数据排列成堆积形式, 一个变量的所有数据放在一起, 和其他
变量的数据分开 。 大多数情况下, 不同截面成员的数据从上到下依次堆
积, 每一列代表一个变量,
11
我们称上表数据是以截面成员堆积的,单击 Order+/-实现堆积方式转换,
也可以按日期堆积数据,
每一列代表一个变量,每一列内数据都是按年排列的。如果数据按年排列,
要确保各年内截面成员的排列顺序要一致。
12
三, 手工输入 /剪切和粘贴
可以通过手工输入数据, 也可以使用剪切和粘贴工具输入,
1.通过确定工作文件样本来指定堆积数据表中要包含哪些时间序列观测值 。
2.打开 Pool,选择 View/Spreadsheet( stacked data), EViews会要求输入
序列名列表, 可以输入普通序列名或 Pool序列名 。 如果是已有序列, EViews
会显示序列数据;如果这个序列不存在, EViews会使用已说明的 Pool序列的
截面成员识别名称建立新序列或序列组 。
3.打开 Pool序列的堆积式数据表 。 需要的话还可以单击 Order +/-按钮进行
按截面成员堆积和按日期堆积之间的转换 。
4.单击 Edit+/-按钮打开数据编辑模式输入数据 。
如果有一个 Pool包含识别名 _CM,_CH,_GE,_WE,_US,通过输入:
I? F? S?,指示 Eviews来创建如下序列,I_CM,I_CH,I_GE,I_WE,I_US;
F_CM,F_CH,F_GE,F_WE,F_US; S_CM,S_CH,S_GE,S_WE,
S_US,
13
四, 文件输入
可以使用 Pool对象从文件输入堆积数据到各单独序列 。 当文件数据按截面
成员或时期堆积成时, EViews要求,
1,堆积数据是平衡的
2,截面成员在文件中和在 Pool中的排列顺序相同 。
平衡的意思是, 如果按截面成员堆积数据, 每个截面成员应包括正好相同
的时期;如果按日期堆积数据, 每个日期应包含相同数量的截面成员观测值,
并按相同顺序排列 。
特别要指出的是, 基础数据并不一定是平衡的, 只要在输入文件中有表示
即可 。 如果观测值中有缺失数据, 一定要保证文件中给这些缺失值留有位置 。
要使用 Pool对象从文件读取数据, 先打开 Pool,然后选择 Procs/Import Pool
Data(ASCII,.XLS,.WK?)…, 要使用与 Pool对象对应的输入程序 。
14
15
通过第四章的学习, 大家对这个对话框应该比较熟悉, 填写说明如下,
注明 Pool序列是按行还是按列排列, 数据是按截面成员堆积还是按日期堆
积 。
在编辑框输入序列的名称 。 这些序列名应该是普通序列名或者是 Pool名 。
填入样本信息, 起始格位置和表单名 ( 可选项 ) 。
如果输入序列用 Pool序列名, EViews会用截面成员识别名创建和命名序列 。
如果用普通序列名, EViews会创建单个序列 。
EViews会使用样本信息读入文件到说明变量中 。 如果输入的是普通序列
名, EViews会把多个数据值输入到序列中, 直到从文件中读入的最后一组数
据 。
从 ASCII文件中输入数据基本类似,但相应的对话框包括许多附加选项处
理 ASCII文件的复杂问题。详情请见第四章附录。
16
§ 25.3 输出 Pool数据
按照和上面数据输入相反的程序可进行数据输出。由于 EViews可以
输入输出非堆积数据,按截面成员堆积和按日期堆积数据,因此可以利
用 EViews按照需要调整数据结构。
17
§ 25.4 使用 Pool数据
每个截面成员的基础序列都是普通序列, 因此 EViews中对各单个截面成
员序列适用的工具都可使用 。 另外, EViews还有专门适用于 Pool数据的专用工
具 。 可以使用 EViews对与一特定变量对应的所有序列进行类似操作 。
一, 检查数据
用数据表形式查看堆积数据 。 选择 View/Spreadsheet (stacked data),然后
列出要显示的序列 。 序列名包括普通序列名和 Pool序列名 。 点击 Order+/-按钮
进行数据堆积方式的转换 。
二, 描述数据
可以使用 Pool对象计算序列的描述统计量 。 在 Pool工具栏选择 View/
Descriptive Statistics…, EViews会打开如下对话框,
18
在编辑框内输入计算描述统计量的序列 。 EViews可以计算序列的平均值,
中位数, 最小值, 最大值, 标准差, 偏度, 峰度, 和 Jarque-Bera统计量 。
下一步选择样本选项,
19
( 1) Individual,利用所有的有效观测值 。 即使某一变量的观测值是针对
某一截面成员的, 也计算在内 。
( 2) Common,使用的有效观测值必须是某一截面成员的数据, 在同一
期对所有变量都有数值 。 而不管同期其他截面成员的变量是否有值 。
( 3) Balanced,使用的有效观测值必须是对所有截面成员, 所有变量在
同一期都有数值 。
最后还必须选择与计算方法相对应的数据结构,
( 1) Stacked data,计算表中每一变量所有截面成员, 所有时期的统计量 。
如果忽略数据的 pool性质, 得到的就是变量的描述统计量 。
( 2) Stacked-means removed,计算除去截面平均值之后的描述统计量值 。
( 3) Cross-section specific,计算每个截面变量所有时期的描述统计量 。
是通过对各单独序列计算统计量而得到的 。
( 4) Time period specific,计算时期特性描述统计量。对每一时期,使用
pool中所有截面成员的变量数据计算的统计量。
20
注意, 后面两种方法可能产生很多输出结果 。 截面成员描述计算会对每
一变量 /截面成员组合产生一系列结果 。 如果有三个 Pool变量, 20个截面成员,
EViews就会计算 60个序列的描述统计量 。
可以把时期特性统计量存储为序列对象 。 从 Pool窗口选择 Procs/Make
Period Stat Series… 出现以下对话框, 在编辑窗口输入想计算的时期统计量的
序列名 。 然后选择计算统计量和样本选择 。
21
三, 生成数据
1,可以使用 PoolGenr(panelgenr)程序生成或者修改 Pool序列 。 点击 Pool工
具栏的 Poolgenr并输入要生成的方程式, 使用正确的 Pool名称 。 例如上面的例
子, 输入,r?=I?/I_US,相当于输入下面五个命令,
r_CM = I_CM/I_US
r_CH = I_CH/I_US
r_GE = I_GE/I_US
r_WE = I_WE/I_US
r_US = I_US/I_US
PoolGenr按照输入的方程在各截面成员间进行循环计算, 生成新的序列
或修改已有序列 。
2,可联合使用 PoolGenr和 Genr生成新的变量 。
22
例如, 要生成一个虚拟变量, 在美国钢铁 ( US) 时取 1,其他企业时取 0,
先选择 PoolGenr,然后输入,dum?=0,从而初始化所有虚拟变量序列为 0。 然
后, 把 US值设置为 1,在主菜单选择 Genr,然后输入,dum_US=1。
3,使用 Pool修改序列, 选择 PoolGenr然后输入新 Pool序列表达式,
dum?=dum?*(I?>S?)
4,还可以利用数据的内在循环特性进行给定时期的截面成员间的计算 。 例
如, 建立一普通序列 sum,初始值设为 0,然后选 PoolGenr并输入,
sum=sum+I?
相当于对普通序列从 Genr输入下列计算,
sum=I_GM+I_CH+I_GE+I_WE+I_US
这个例子用来说明内在循环这个概念。
23
四, 生成 Pool组
如果希望使用 EViews的组对象工具处理一系列 Pool序列, 选择 Procs/
Make Group… 输入普通序列和 Pool序列名称, EViews就会生成一个包含这些
序列的未命名组对象 。
五, 删除和存取数据
Pool可用来删除和存取序列 。 只需选择 Procs/Delete pool series…,
Procs/Store pool series(DB)…, Procs/Fetch pool series(DB)…, 输入普通序列
和 Pool序列名称即可 。
24
§ 25.5 时间序列 /截面数据模型估计方法
使用时间序列 /截面数据模型数据结构信息, 有很多种方法进行方程估计 。
可以估计固定截距模型, 随机截距模型, 或者模型变量对各截面成员的系数
不同, 以及估计单独的 AR(1)系数 。 也可以为各个截面成员分别估计一个方
程 。
EViews的 Pool对象估计模型使用的方法有:最小二乘法, 估计截面权重
的加权最小二乘法或似乎不相关回归 。 这些方法的使用都不改变原数据的排
序 。
下面将介绍怎样使用 Pool和系统估计更一般和复杂的模型,包括二阶段
最小二乘估计和非线性模型,以及有复杂截面系数限制的模型。
25
Pool对象估计的方程模型形式为,
(25.1)
其中 是因变量, 和 分别是对应于 i =1,2,…,N 的截面成员的解
释变量 k维向量和 k维参数 。 每个截面成员的观测期为 t =1,2,…,T。
我们可以把这些数据看作一系列截面说明回归量, 因此有 N个截面方程,
(25.2)
模型 (25.2)常用的有如下三种情形,
情形 1,
情形 2,
情形 3,
itiititit xy ??? ????
ity itx i?
iiiii xy ??? ????
jiji ???? ??,
jiji ???? ??,
jiji ???? ??,
26
对于情形 1,在横截面上无个体影响, 无结构变化, 则普通最小二乘法
估计给出了 和 的一致有效估计 。 相当于将多个时期的截面数据放在一
起作为样本数据 。 对于情形 2,称为变截距模型, 在横截面上个体影响不同,
个体影响表现为模型中被忽略的反映个体差异的变量的影响, 又分为固定
影响和随机影响两种情况 。 对于情形 3,称为变系数模型, 除了存在个体影
响外, 在横截面上还存在变化的经济结构, 因而结构参数在不同横截面上
是不同的 。
有 T个观测值互相堆积 。 为讨论方便, 把堆积方程表示为,
(25.3)
其中 和 X 分别包含了截面成员间对参数的所有限制。用分
块矩阵形式表示如下,
??? ??? XY
??? ??? XY
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
NNNNN X
X
X
y
y
y
?
?
?
?
?
?
?
?
?
??
?
????
?
?
??
2
1
2
1
2
1
2
1
2
1
00
00
00
27
并且方程的残差协方差矩阵为,
(25.5)
基本说明把 Pool说明作为联立方程系统并使用系统最小二乘法估计模型 。
当残差同期不相关, 并且时期和截面同方差时,
(25.6)
对堆积数据模型使用普通最小二乘法估计系数和协方差。
?
?
?
?
?
?
?
?
?
?
?
?
???
???
???
????
NNNN
N
N
EE
??????
??????
??????
??
?
????
?
?
21
22212
12111
)(
TN II ??? 2?
28
一, 固定影响 (Fixed Effects)
固定影响估计量通过为每个截面成员估计不同常数项使 不同 。 EViews
将每个变量减去平均值, 并用转换后的数据, 通过最小二乘估计来计算固定
影响,
(25.7)
其中
设,, 代表了 X 减均值的差额, bFE是使用普
通最小二乘估计的系数 。 通过使用均值差模型的普通最小二乘协方差公式估
计系数协方差矩阵,
(25.8)
i?
)()( iiiiiii xxyy ??? ??????
12 )~~(?)v a r ( ??? XXb wFE ?
X~
TTxxTyy t itit itit iti /,/,/ ??? ??? ??
iiit yyy ??~ iii xxx ??~
29
(25.9)
其中, 是固定影响模型的 SSR。 如果 Pool中有缺
失值, 就用除去缺失值后的总观测数代替 。
固定影响本身不是直接估计的, 计算公式为
(25.10)
固定影响系数中不报告标准差 。 如果想得到标准差, 应该选择截距说明
中的 Common选项, 来重新估计模型 。
值得注意的是估计有太多截面成员的截面常数回归模型可能很费时。
KNNT
bxy
KNNT
ee it FEititFEFE
w ??
???
??
?? ? 22 )~~(??
FEFEee?
Nbxy
t
FEiii /)(? ? ????
NT
FEFE bXYe ~~ ??
30
二, 随机影响 (Random Effects)
随机影响模型假设 项是共同系数 和不随时间改变的截面说明随机变
量 的和, 和残差 是不相关的 。
EViews按下列步骤估计随机影响模型,
(1) 使用固定影响模型的残差 估计 的方差, 并使用上述的 。
(2) 估计组间 ( 截面平均 ) 模型并计算,
(25.11)
其中 i = 1,2,……,
是组间回归的 SSR。 如果 的估计值是负值, EViews将返回错误信息 。
有缺失观测值时 在各截面成员间是不同的,EViews在进行方差估计时
使用最大 的值。只要缺失观测值的数目可渐进忽略,估计程序就是一致的。
it? ?
i?
FEe it? 2?w?
TKN
ee w
Bu
BB
B
2
222 ???,? ???? ??
?
??
BBee? 2?u?
iT
iT
iu iu
ititiit xuy ??? ????
Tbxye t ititiB /))((? ??? ?
31
(3) 对 转换后变量使用 OLS (X 包括常数项和回归量 x )
(25.12)
其中 。
EViews在输出中给出了由 (3)得到的 的参数估计 。 使用协方差矩阵的标
准估计量计算标准差 。
EViews给出了随机影响的估计值 。 计算公式为,
(25.13)
得到的是 的最优线性无偏预测值 。
最后, EViews给出了加权和不加权的概括统计量 。 加权统计量来自 (3)中的
GLS估计方程 。 未加权统计量来自普通模型的残差, 普通模型中包括 (3)中的参
数和估计随机影响,
(25.14)
iititiitit XXXyyy ?? ?,? ** ????
Bw ??? ?/?1? ??
?
)(??? 2
2
REit
t
it
B
u
i bXyu ?? ??
?
iu
iREititit ubXy ?? ????
32
三, 截面加权
当残差具有截面异方差性和同步不相关时最好进行截面加权回归,
(25.15)
EViews进行 FGLS,并且 从一阶段 Pool最小二乘回归得出 。
估计方差计算公式为,
(25.16)
其中 是 OLS的拟合值 。
估计系数值和协方差矩阵由标准 GLS估计量给出。
?
?
?
?
?
?
?
?
?
?
?
?
?
?
????
NTN
T
T
I
I
I
EE
2
2
2
2
1
0
00
00
)( 2
1
?
?
?
??
??
????
?
?
iit
T
t
iti Tyy
i /)?(? 2
1
2 ?? ?
?
?
2i?
ity?
33
四, SUR加权
当残差具有截面异方差性和同步相关性时, SUR加权最小二乘是可行的
GLS估计量,
(25.17)
其中 是同步相关的对称阵,
(25.18)
一般项,在所有的 t时为常数。
?
?
?
?
?
?
?
?
?
?
?
?
??
NNNN
N
N
???
???
???
?
???
?
21
22221
11211
T
TNNTN
TNTT
TNTT
I
II
III
III
E ???
?
?
?
?
?
?
?
?
?
?
?
?
????
??
???
???
??
?
???
?
1
22221
11211
)(
)( itjtij E ??? ?
?
34
EViews估计 SUR模型时使用的 是由一阶段 Pool最小二乘回归得到,
(25.19)
分母中的最大值函数是为了解决向下加权协方差项产生的不平衡数据情况 。
如果缺失值的数目可渐进忽略, 这种方法生成可逆的 的一致估计量 。
模型的参数估计和参数协方差矩阵计算使用标准的 GLS公式 。
五, 怀特 ( White) 协方差估计
在 Pool估计中可计算怀特的异方差性一致协方差估计 ( 除了 SUR和随机影
响估计 ) 。 EViews使用堆积模型计算怀特协方差矩阵,
(25.20)
其中 K是估计参数总数。这种方差估计量足以解释各截面成员产生的异方差性,
但不能解释截面成员间同步相关的可能。
),m a x ()?)(?(? jit jtjtititij TTyyyy? ????
1
,
21 )()(
)(
)()v a r ( ?? ??
?
??
?
? ? ??
??
?? XXxxuXX
KN
Nb
ti itititi
i
?
ij??
35
§ 25.6 如何估计 Pool方程
单击 Pool工具栏的 Estimate选项打开如下对话框,
36
1,因变量
在因变量对话框中输入 Pool变量或 Pool变量表达式 。
2,样本
在右上角的编辑窗口中输入样本说明 。 样本的缺省值是各截面成员中的
最大样本值 。 如果得不到某时期截面成员的解释变量或因变量的值, 那么此
观测值会被排除掉 。
复选框 Balanced Sample说明在各截面成员间进行数据排除 。 只要某一时
期数据对任何一个截面成员无效, 此时期就被排除 。 这种排除保证得到的样
本区间对所有截面成员都是有效的 。
如果某截面成员的所有观测值都没有,那么 Pool在进行估计时就排除这
个截面成员。同时 EViews会在输出中告诉漏掉的截面成员。
37
3,解释变量
在两个编辑框中输入解释变量 。
Common coefficients:—— 此栏中输入的变量对所有截面成员有相同的
系数, 而各变量的系数则不同, 并用一般名称或 Pool名称输出结果 。
Cross-section specific coefficients:—— 此栏中输入的变量对 Pool中每个截
面成员的系数不同 。 EViews会对每个截面成员估计不同的系数, 并使用截
面成员识别名后跟一般序列名, 中间用, _, 连接进行标签 。
例如, 如果在共同系数编辑框中输入一般变量 F?和 S?,会输出 F?和 S?
的估计系数 。 如果在特定系数编辑框中输入这两个变量, 会输出如下形式
的系数,_GM--F_GM,_CH--F_CH,_GE--F_GE, _WE--F_WE,_US--
F_US和 _GM--S_GM,_CH--S_CH,_GE--S_GE,_WE--S_WE,_US--S_US,
等等 。
注意, 使用截面成员特定系数法估计模型会生成很多系数 —— 等于 Pool
中截面成员数和所列变量数的乘积 。
38
4,截距
在 Intercept:标示区对截距进行选择说明,
?
i?
None
没有截距; = 0
Common
对所有 Pool成员截距相同; =
Fixed effects
对每个 Pool成员截距不同; =
Random effects
把截距看作随机变量,
it?
it?
it?
不能用截面成员特定系数,AR项或者加权进行随机影响模型估计。
0)(,??? itiiit uEu ???
39
5,权重
在 Pool方程估计中, 缺省值为没有加权, 但是可以选择加权项 。 有三种
权重选择,
如果选择 Cross section weights,EViews会假设出现截面异方差性进行广
义最小二乘估计 。 如果选择 SUR,EViews会进行广义最小二乘估计修正截面
异方差性和同期相关性 。
No weighting
所有观测值赋予相同的权重
Cross section weights
GLS使用估计的截面残差的方差
SUR
类似似乎不相关回归 —— GLS使用估计
的截面成员残差协方差矩阵
40
EViews不能估计这样的模型:很少的时期或者庞大的截面成员 。 所用的
时期数平均应至少不小于截面成员数 。 即使有足够的观测值, 估计的残差相
关矩阵还必须是非奇异的 。 如果有一条不满足 EViews的要求, EViews会显示
错误信息:, Near Singular Matrix”。
复选框 Iterate to convergence控制可行 GLS程序 。 如果选择, EViews就一
直迭代权重和系数直到收敛 。 如果模型中包括 AR项, 这个选择就没有意义,
因为在 AR估计中, EViews会一直迭代直至收敛 。
6,选项
(1) Iteration and Convergence Options( 迭代和收敛选择 )
如果选择加权估计和迭代至收敛, 可以通过规定收敛准则和最大迭代次
数控制迭代过程 。 点击方程对话框的 Options按钮并输入要求值即可 。
41
(2) White Heteroskedasticity Covariance( White 异方差协方差 )
EViews能估计那些广义异方差性的强的协方差 。 这种形式的异方差性比
上面介绍的截面异方差性更普遍, 因为一个截面成员内的方差可以随时间不
同 。 要得到怀特标准差和协方差,点 Options按钮, 选择 White heteroskedasticity
Consistent Covariance。 注意此选项不适用于 SUR和随机影响估计 。
7,Pool方程举例
我们以前述的 5个企业, 3个变量数据作为例子:通用汽车, 克莱斯勒,
通用电气, 西屋和美国钢铁 。 相应的 Pool识别名称为 _GM,_CH,_GE,_WE,
_US。
首先,我们估计一个总投资 I?的回归模型,解释变量是投资的滞后 I?(-1)
(注意 ‘? ’ 必须放在滞后符前面)、前一年企业的市场价值 F?、存货和设
备价值 S?。所有系数限定为对所有截面成员是一样的,这等价于对堆积数据
忽略截面信息进行模型估计。
42
43
§ 25.7 Pool方程视图和过程
估计出 Pool方程后, 可以按下述方法检验输出结果,
1,表达式
选择 View/Representations检查输出。 EViews把 Pool估计成一个方程的系
统,每个截面成员一个方程。
44
2,估计输出
View/Estimation Output选项会改变合并估计结果的输出形式 。
像其他估计对象一样, 可通过选择 View/Coef Covariance Matrix来检查系
数协方差矩阵的估计 。
3,检验
EViews 可以进行 Pool 方程估计参数的系数检验 。 选择 View/Wald
Coefficient tests… 并输入要检验的限制条件 。
4,残差
选择 View/Residuals/Table或 View/Residuals/Graph可把残差表示成表格形
式或图形形式 。 EViews会显示每个截面方程的残差 。 残差命名形式为基本名
RES后跟截面识别名 。 如果想用这些名称存储残差序列, 选择 Procs/Make
Resids。
5,残差协方差 /相关性
可以检查估计残差的同步协方差矩阵和相关矩阵 。 选择 View/Residual,然
后选择 Correlation Matrix或 Covariance Matrix查看矩阵 。
45
6,预测
要使用 Pool方程进行预测必须先建立一个模型 。 选择 Procs/Make Model
建立一个包括所有估计系数的未命名模型对象 。 模型可以根据需要进行编辑 。
求解模型能对每个截面成员的因变量进行预测 。 详情见第 23章 。
7,用 Pool创建系统
可能有些复杂的时间序列 /截面数据方程不能用 Pool对象进行估计 。 要使
用更多的估计方法, 如二阶段最小二乘法, 三阶段最小二乘法, GMM,或使
用任意系数限制, 需要用 Pool对象创建一个系统对象 。 可以用一个已估计的
Pool创建系统, 也可以提供信息从 Pool生成系统 。 系统对象可进一步使用高级
技术进行估计 。
选择 Procs/Make System…, 填写对话框 。 像前面一样输入因变量, 规定
截距, 填写共同系数和截面特定系数变量 。 还可以填入工具变量 。 在每个方
程中普通变量可作为工具变量, Pool变量会在对应截面方程中把截面特定变
量作为工具变量,
46
47
单击, OK”后,建立一个未命名的系统对象;
I_GM = C(8) + C(1)*F_GM + C(2)*S_GM + C(3)*I_GM(-1) @ I_GM(-1)
F_GM(-1) S_GM(-1)
I_CH = C(9) + C(1)*F_CH + C(2)*S_CH + C(4)*I_CH(-1) @ I_CH(-1)
F_CH(-1) S_CH(-1)
I_GE = C(10) + C(1)*F_GE + C(2)*S_GE + C(5)*I_GE(-1) @ I_GE(-1)
F_GE(-1) S_GE(-1)
I_WE = C(11) + C(1)*F_WE + C(2)*S_WE + C(6)*I_WE(-1) @ I_WE(-1)
F_WE(-1) S_WE(-1)
I_US = C(12) + C(1)*F_US + C(2)*S_US + C(7)*I_US(-1) @ I_US(-1)
F_US(-1) S_US(-1)
48
§ 25.7 命 令
创建一个新 Pool对象, 在 Pool命令后输入 Pool对象名,Pool g7,创建一
个名称为 G7的 Pool对象 。
定义 Pool的截面成员, 用 define命令,
g7.define us uk ita ger fra can jap
定义 Pool对象 g7的截面成员为 US,UK,ITA,GER,FRA,CAN,JAP 。
用固定影响估计 Pool,用 f选项,
g7.ls(f) cs? @ gdp?
估计固定影响模型, 不限制 GDP系数对每个 Pool成员都是相同的 。 ( 相当
于对每个成员分别进行最小二乘估计 ) 。
Command and Programming Reference中有完整的命令列表和 Pool对象的
可用选项。 返 回