第十一章 应用于序列和组的统计图
EViews提供了几种对数据进行初步分析的方法。在第九章
我们已列出了几种图来描述序列分布特征。在本章,列出了几
种散点图且允许我们可以用有参数或无参数过程来做拟合曲线
图。
这些图包含着复杂计算和大量的特殊操作,这些将在下面
详细论述。对某些完全技术性的介绍,不必掌握所有细节。
EViews中设置的缺省值除了对极特殊的分析外,对一般分析而
言是足够的。直接点击 ok键接受缺省设置,就可以轻松的展现
出每个图。
§ 11.1 序列分布图
本节列出了三种描述序列经验分布特征的图。
§ 11.1.1 CDF— Survivor— Quantile图
这个图描绘出带有加
或减两个标准误差带的经
验累积分布函数,残存函
数和分位数函数。在序列
菜单中或组菜单中选择
View /Distribution/ CDF—
Survivor— Quantile… 时
(组菜单的 Multiple Graphs
中),就会出现右面的对
话框,
其中, Cumulative Distribution(累积分布 )操作用来描绘序列的经验累积
函数 ( CDF) 。 CDF是序列中观测值不超过指定值 r的概率 )()( rxpr obrF
x ??
)(1)()( rFrxpr obrS xx ????Surivor(残存 )操作用来描绘序列的经验残存函数
Quantile(分位数 )操作用来描绘序列的经验分位数 。 对
的分位数 满足下式,
Xq,10 ??
)(qx
qxxpr ob q ?? )( )( qxxpr ob q ??? 1)( )(,且
分位数函数是 CDF的反函数, 可以通过调换 CDF的横纵坐标轴
得到 。
All选项包括 CDF,Survivor和 Quantile函数 。
Saved matrix name可以允许把结果保存在一个矩阵内 。
Include standard errors(包括标准误差 )操作标绘接近 95%的置信
区间的经验分布函数。
Options键提供了几种计算经验 CDF的方法,
给定 N个观测值,针对 r
的 (CDF)被估计为,
( 1) Rankit(缺省 )
( 2) Ordinary
( 3) Van der Waerden
( 4) Blom
( 5) Tukey
这几种方法的不同之处在于它们如何调整针对 CDF计算的
非连续性,这种区别将随样本数的增加而变得微不足道。
§ 11.1.2 Quantile— Quantile图
Quantile— Quantile ( QQ图 )对于比较两个分布是一种简单但
重要的工具 。 这个图标绘出一个被选序列的分位数分布相对于另
一个序列的分位数分布或一个理论分布的异同。如果这两个分布
是相同的, 则 QQ图将在一条直线上 。 如果 QQ图不在一条直线上,
则这两个分布是不同的 。
当选择 View/Distribution
Graphs/Quantile-Quantile….
下面的 QQ Plot对话框会出
现,
可以选与如下的理论分布的分位数相比较,
Normal(正态 )分布:钟形并且对称的分布,
Uniform(一致 )分布:矩形密度函数分布,
Exponential(指数 )分布:联合指数分布是一个有着一条长右尾的正态分布,
Logistic(逻辑 )分布:除比正态分布有更长的尾外是一种近似于正态的对称
分布,
Extreme value(极值 )分布,I型极小值分布是有一条左长尾的负偏分布,它非
常近似于对数正态分布,
可以在工作文件中选择一些序列来与这些典型序列的分位数相比较, 也可
以在编辑框中键入序列或组的名称来选择对照的序列或组, EViews将针对列出
的每个序列计算出 QQ图 。
Options钮提供计算经验分位数函数的几种方法。这与上面在 CDF-Survivor-
Quantile中相一致,除非样本非常小,几种方法的区别将随样本数的增加而变
得微不足道。
§ 11.2 带有拟合线的散点图
通过 view/Graph/Scatter打开一个组的视图菜单包括四种散点图。
§ 11.2.1 Simple Scatter( 简单散点图 )
其第一个序列在水平轴上,其余的在纵轴上。
§ 11.2.2 Scatter with Regression(回归散点图 )
在组中对第一个序
列及第二个序列进行总
体变换来进行二元回归,
选择 Regression后出现
对话框,
下面是针对二元拟合的序列变换,
None
Logarithmic
Inverse
Power
Box-Cox
Polynomial
y x
ylog xlog
y1 x1
ay bx
ay a )1( ? bxb )1( ?
bxxx,,,,1 2 ?
在编辑框中来指定参数 a,b。
如果变换是不可以的, 会出现错误提示, 对多项式 (Polynomial)的阶数定
的过高 。 Eviews会自动降低阶数以避免共线性 。
点击 ok后,Eviews拟合出一条回归线,可以在 Fitted Y series编辑框中键入
一个名称保存这个拟合的序列。
Robustness lterations(稳健叠代 )
最小二乘法对一些无关观测值的存在非常敏感,稳健叠代操
作就是产生一种对残差平方的加权形式,使无关的观测值在估计
参数时被加最小的权数。
2
1
)( ii
N
i
i bxayr ???
?
这里 是变形后的序列,权值 r通过下式得到,
ii yx,
??
?
?
? ??
?
o t h e r w i s e
mef o rmer ii
i 0
16)361( 222
, m是 的中间数,大的残差的观测值给一
个小权数。选择叠代次数应是一个整数。
iii bxaye ??? ie
§ 11.2.3 Scatter with Nearest Neighber Fit(最邻近拟合散点图 )
这是一种带宽基于最邻近点的局部回归。简而言之,对样本中的每一
数据点,它拟合出一条局部的并经加权的回归线。局部是说只用邻近点也就
是样本的子集来一步步回归,加权是说邻近点越远给越小的权数。当选择后,
会出现如下的对话框,
1,Method 操作
可以选择在样本中的每一个数据点作局部回归或在数据点
的子集中作局部回归 。
·Exact(full sample) 在样本中的每一数据点都作局部回归
·Cleveland subsampling 在选取的子样本中进行回归, 可以
在编辑框中键入子样本的大小 。
作回归实际上不是在样本每点都作,实际计算的点数非常
接近于 M。这里隐含着这样的原因,选用子样本回归不会丢失
信息,因为特别邻近点的回归值几乎没有差别。
2,Specification (说明 操作)
因为要靠子样本点周围的点来进行局部回归, 并来求拟合值, 因此
specification操作就是确定选择识别周围进行回归的观测值的规则 。
( 1) Bandwidth span( 带宽范围 )
用来决定在局部回归中应包括哪些观测值, 可以选取在 0,1之间的一个数 α。
带宽控制拟合线的平滑程度, 分数 α越大拟合线越平滑 。 这个分数 α指示
Eviews在给定点使用 [αN]个观测值做局部回归, [αN]是总样本个数的 100α%,再
取整 。
注意标准的最邻近定义意味着被估计点周围点的个数不必是对称的 。 如果
想对称, 就选 Symmetric neighbors。
( 2) Polynomial degree(多项式次数 )
制定多项式的次数来拟合每一局部回归
如果选择 Bracket bandwidth span(分类带宽)操作,Eviews将显示出带宽为
0.5α,α,1.5α 的三种最邻近拟合。
3.其他操作
( 1) Local weighting (Tricube)局部加权
给每个局部回归的观测值加权,加权回归使残差平方和最小
? ? 2221
1
k
ikiii
N
i
i xbxbxbay ??????
?
??
三次方权重通过下式给出,
? ?? ?? ? ? ?? ?
??
?
?
? ??
?
o t h e r w i s e
Nddf o rNdd ii
i
0
11
33
???
这里, 是距该样本点最近的第 个点
距样本点的距离。如果不做选择,将默认 =1。
xxd ii ?? ? ?? ?Nd ? ][ N?
?
( 2) Robustness Iterations(稳健叠代 )
通过调整权数去降低远离的观测值的权重来叠代局部回归 。
最初的拟合用权数 wi,若选择了 Local weighting 则 wi为 3次, 否则
为 1。 来自最初拟合的残差 ei,被用来计算权数 ri,在第二次叠代
中, 局部拟合用权数 wiri。 我们重复这个过程直到我们选定的叠
代次数, 在每次叠代里, 稳健权数 ri都通过来自上次叠代的残差
来重新计算 。
( 3) Symmetric Neighbors( 对称邻近 )
使被估计点的两侧有相同数目的观测值 。 可以在 Fitted series
( 拟合序列 ) 框中键入一名称来储存拟合值为一序列 。 如果选择
了 Bracket bandwidth span,那么 Eviews将给三个序列在定的名称
后自动分别加上 L,M,H并把它们存起来, 它们的带宽分别为
0.5α, α 和 1.5α 。
§ 11.3 函数命令
lwage.cdfplot(a) 表示对序列 LWAGE做 CDF,quantile和 survive函数 。
lwage.kdensity(k=n) 表示对序列 LWAGE做核密度估计, 核函数用正态, 带
宽自动选取 。
Lwage.kdensity( k=e,b=.25) 表示对序列做核密度估计, 核函数操作选缺省
项, 带宽为 0.25,并且为加括号带宽 。
group aa lwage age
aa.linefit (yl,xl)
表示建立一个组包括序列 LWAGE和 AGE,再经过对两个序列的对数变换然
后进行回归拟合 。
aa.linefit(yl,d=3)
对 Y轴上的序列经对数变换, 且次数取 3来拟合 X轴上的序列 。
aa.nnfit表示在组 aa中进行最邻近点拟合 。
aa.kerfit表示在组 aa中进行核拟合 。
返回