经济定量分析与预测
西南交通大学经管院 傅浩
TEL:7600822
13808177037
E-mail:kjyh@21cn.com
本讲座希望达到的目的
?对经济定量分析的基本概念有初步的了解
?对现实的经济定量分析中最主要的方法 —
—经典计量经济模型 的经济理论基础和数
理统计基础有比较系统的认识
?对计量经济模型的基本流程有系统的认识
?对实际建模中常用的软件 ——TSP软件包有
初步的掌握
若干深入的参考书目
?《应用经济计量学教程》,吴承业等,中
国铁道出版社,1996年
?《宏观经济计量模型史》,伯德金等,中
国财政经济出版社,1993年
?《动态经济模型分析》,童光荣,武汉大
学出版社,1996年
?《微观经济理论与计量方法》,谢为安,
同济大学出版社,1996年
第一部分
定量方法在经济研究中的应用
?一、经济研究的发展历史简介
?16-17世纪西方世界已经形成对经济问题的
系统、理性认识,重商主义学派成为经济
研究理论的发端。
?1776年亚当 ?斯密发表《国富论》,标志古
典政治经济学大厦的落成
?古典经济学的研究方法 ——定性分析为主
定性分析方法的根本缺陷
?对于同一概念,不同学者可能有相互矛盾
的不同理解,形成的学术观点和政策建议
可能大相径庭
?例证:商品的真实价格 ——耗费的劳动
(剩余价值论)、销售的收入(劳动、资
本、土地三位一体论)、换得的劳动(有
效需求论),古典学派由此陷于分裂
数量经济学成为现代经济学主流
?定义:泛指对社会经济运行进行定量分析
的经济学
?分支:计量经济学、投入产出经济学、经
济控制论、信息经济学、经济对策论(经
济博弈论)等
?工具:将经济学、统计学、数学和计算机
技术结合起来
一般的研究思路
?经济学 提供定量研究的经济理论基础
?数学 提供定量研究的技术手段与处理方法
?统计学 提供定量研究的实证数据基础
?由此形成的定量研究结果,广泛应用于经
济结构分析、政策模拟、经济预测等重要
领域,并开始从宏观经济领域发展到微观
领域
第二部分 计量经济学模型简介
?又称经济计量学,是以经济理论为前提,
利用数学、数理统计方法与计算技术,根
据实际观测统计资料来研究带有随机影响
的经济数量关系和规律的学科。
?自首届诺奖得主挪威的 Fisch于 1926提出这
一学科后,在战后得到迅速发展,已成为
西方经济学研究的主流手段。在获得诺奖
的学者中,四分之三为计量经济学家
计量经济模型研究的四个步骤
?1,建立模型,根据所研究的问题,依托一
定的经济理论,明确经济变量以及相互间
的因果关系,以问题为因变量( Y),影响
问题的主要因素为自变量( X),非主要因
素合并为随机项( U),建立模型如下:
? Y=?0+?1X+U 单变量模型
? Y=?0+?1X1+ ?2X2 +U 多变量模型
? ВY+ГX=U 联立模型
计量经济研究的四个步骤
?2、估计参数:
?根据模型中选择的变量,收集、整理得到
具体的历史数据或横截面数据
?根据实际数据,利用相应的计量经济方法
得到模型参数( ?)的估计值
?常用的估计方法,最小二乘估计( OLS)
法,极大似然估计法等
计量经济研究的四个步骤
?3、模型的检验
?估计得到的参数值需要通过一系列检验以
明确其是否可靠,只有通过各种检验才能
进行实际应用
?检验包括三个逐步深入的层次:经济理论
检验(定性)、一级检验(统计学检验)、
二级检验(计量经济学检验)
计量经济研究的四个步骤
?4、模型的应用
?单方程模型主要用于经济预测
?联立方程模型还可用于经济结构分析和经
济政策评价等方面
?一般而言,模型的应用(如预测)过程中
需要保证预测期的经济背景与模型样本取
值期的经济背景大致相同,否则需要对原
模型进行必要的修正
计量经济模型数据的几个问题
?数据的构成:
?时间序列数据、横截面数据、虚拟变量
(政策变量)数据
?对数据质量的要求:
?完整性 (数据长度相等)
?准确性 (统计口径与数据本身准确)
?可比性 (时间序列变量数据应有必要折算)
第三部分 单方程模型
?本章的基本思路:
?1、按照实际建模的步骤:
?从估计到检验到预测
?2、由简入繁:
?从一元模型(一个解释变量)到多元模型
(多个解释变量)
?3、以线形模型为主
§1、一元线形模型简介
?定义:一个自变量的线形模型
?模型构造,Y=b0+b1X+U ( 1)
?其中,Y为因变量,X为自变量,U为随机

?模型的样本取值区间(样本长度)设为 n
?模型的另一种构造方式:
? Yi=b0+b1Xi+Ui ( 2)
? ( i=1,2,……,n)
对随机项 Ui的三大古典假定
?1、零均值假定,U的平均值为 0
?数学表示 E(Ui)=0
?2,同方差性与无序列相关性假定
?方差:衡量数值分布情况的一个统计指标
?数学表示 Var(Ui)=?(Ui -E(U))
?同方差性即各次观测中的 Ui具有相同的方
差,设为 Var(Ui)=?(Ui -E(U))=σ 2u
对随机项 Ui的三大古典假定
?无序列相关性:指任意两次观测中的 Ui与 Uj
是不相关的
?即 Ui的取值不受 Uj的影响
?数学表示 Cov(Ui, Uj)= 0
?3,Ui与 Xi协方差为零的假定
?数学表示 Cov(Ui, Xi)= 0
对协方差概念 Cov(·)的解释
?衡量两个变量朝什么
方向以及在什么程度
上共同变动的尺度
?设对两个变量 U与 X进
行 n次观测,得到 n组
数据( ui,Xi),由此
得散点图见右
X
X
u
U
利用散点图进行直观判断的方法
?如右图,U与 X成
同方向变动的关
系,则表明 U与 X
正相关
?如散点集中分布
在新坐标系的二、
四象限,则负相

X
u
X
U
利用协方差公式进行定量分析
1
))((
),( 1
?
??
?
?
?
n
XXuu
XuC ov
n
i
ii
当 Cov(u,X)>0 时,认为 U与 X正相关
当 Cov(u,X)<0 时,认为 U与 X负相关
当 Cov(u,X)=0 时,才认为 U与 X满足 无相关性的古典假定
§ 2 模型的最小二乘估计法
( OLS法)
?估计的模型为一元线形回归模型
? Yi=b0+b1Xi+ui
?该模型满足上述三个古典假定
?对模型等式两边取均值得
?总体回归线 E(Yi)= b0+b1Xi ( 3)
?但上式事实上无法得到,只是理论上的存

作出一条直线成为总体回归线的
最优拟合,称为样本回归线
)4(10 ??? ???
I
XbbY i ??
求出样本回归直线的目的是用其来替代无法获得
的总体回归线,已知条件为 n组观测值( Xi,Yi)
即散点图上的 n个点
显然,利用这些点可以获得若干条直线
关键在于要求得到最优拟合线
确定样本回归线的方法,OLS法
?ei即实际观测值与其拟合(回归、预测)值
之差,称为残差,或拟合(回归、预测)
误差
?样本回归直线的确定即对 和 的确定
)5()??(? 10 ??iiiii XbbYYYe ?????
^
ob^
0b
确定 和 的准则
?使全部观测值的残差平方和 RSS最小
?这就是计量经济分析中最常用的最小二乘
分析方法,下面的( 6)式即其数学表示
^
1b^0b
??
??
????
N
i
ii
N
i
i
XbbYeR S S
1
^
1
^
0
1
2
)]([m in
由极值公式可知
?对( 6)式分别取一阶偏导得( 7):
0)]([0
0)]([0
1
1
1
0
?????
?
?
?????
?
?
?
?
??
?
??
?
iioi
ioi
XXbbY
b
R S S
XbbY
b
R S S
由( 2.7)两个方程得两个未知数
?利用已知条件(如 Xi,Yi,n等 ),可得( 8)
式如下:
n
XbY
b
XXn
YXYXn
b
ii
ii
iiii
? ?
? ?
? ? ?
?
?
?
?
?
?
?
?
1
0
221
)(
对上式进行简化
?令
?则由此将( 8)式简化为( 9)
YYyXXx
n
Y
Y
n
X
X
iiii
ii
????
??
??
,
,
XbYb
x
yx
b
i
ii
??
?
??
?
?
?
10
21
§ 3 模型的一级检验
?根据 (8)或 (9)式,即已经得到由最小二乘法
思路获得的模型拟合方程式,但在方程投
入使用(如预测)前,需要保证该方程是
“可靠”的 ——检验
?方程的检验划分为几个层次
?经济理论检验
?一级检验(数理统计检验)
?二级检验(计量经济检验)
一级检验的三个主要内容
?拟合优度的检验
?R2检验
?回归方程的显著性检验
?F检验
?最小二乘估计量 和 的显著性检验
?t检验
ob
?
1
?b
一、拟合优度的 R2检验
?拟合优度:考察所得到的样本回归直线与
由 X,Y的实际观测值所形成的散点图之间
是否“贴切”
?定义 Y的第 i个观测值 Yi与 Y的均值之差为离
差 yi
?这个离差可划分为两部分
)10(????YYy ii ??
)11(?)?()?( ??iiiiii yeYYYYy ??????
对离差进行分解的意义
?残差 ei,由随机项 ui所引起的回归直线不能
解释的部分
?,利用回归直线计算得到的回归值
(预测值)与均值之差,是回归直线所能
够解释的部分
?在离差中,回归直线能够解释的部分越大,
即不能解释的部分越小,则回归直线与样
本拟合得越好 ——预测效果越好
iy?
研究证明:
?总离差平方和=残差平方和+回归平方和
?残差平方和是回归直线所不能解释的部分
?越小越好
?回归平方和是回归直线所解释的部分
?越大越好
?整条直线的拟合优度的度量即转化为考察
回归平方和在总离差平方和中比例的大小
? ? ??? )12(? 222 ???iii yey
拟合优度的度量,样本决定系数 R2
?样本决定系数:回归平方和与总离差平方
和之比
?r2的取值范围在 0- 1之间
?越接近 1,则拟合越好 ————拟合优度高
?越接近 0,则拟合越差 ————拟合优度低
)13(
?
2
2
2 ????
?
??
i
i
y
y
r
R2检验回顾
?R2指标是一个反映回归直线(预测直线)
与样本的实际值之间拟合程度的数据
?要求所建立的模型的 R2指标 尽量接近 1
二、方程的显著性检验,F检验
?F检验的意义是考察模型所设定的线性关系
是否显著地成立,即考察预测直线(回归
直线)的斜率是否显著地不等于 0
?F检验最终形成一个 F统计量指标:
?按上式可计算得到模型的 F统计量值
)14(
)2(
?
2
2
????
?
?
?
?
n
e
y
F
i
i
将计算得到的 F值与临界值比较
?F的临界值:通过查,F分布 表”获得 F临界值
?查表步骤
?选取一个显著水平(如 1%,5%)
?确定两个指数( V1,V2),
? V1 为方程所使用的解释变量个数(一
元模型即为 1);
? V2= n- V1- 1( 一元模型即 n- 2)
判别法则
?当计算得到的 F>查 表得到的 F临界值 时:
?模型方程通过 F检验,
?即被解释变量 Y与解释变量 X的 线性关系成

?当计算得到的 F<查表得到的 F临界值 时:
?模型方程未通过 F检验,
?即 Y与 X的 线性关系不成立
三、
?以上的 R2检验和 F检验都针对模型整体进行
?T检验则分别针对求得的 是否显著
成立
?检验的结果是获得 T检验值,计算式为:
?
检验的显著性检验:和 Tbb 10 ??
的和 10 ?? bb
)15(
)2(
?
2
2
1
?
1
??
?
?
?
?
i
i
b
xn
e
b
T
T检验的说明
?一般 T检验只针对解释变量的系数进行,即
对常数项是否通过 T检验不做要求
?以上公式在一元模型中有效,多元模型的 T
检验值计算公式与其大同小异
?计算得到的 T检验值仍需与查表获得的临界
值进行比较
?关键在于正确地查表!
查 T分布表获得临界值的方法
?选取一个显著水平(如 5%,10%等)
?确定一个指数 V=n- K-1( 一元模型为 n
- 2)
?其中,n为样本长度; K为解释变量个数
?得到 T临界值
?判别法则:
?如,认为 不成立
?如,认为 成立-通过检验临界值
TT ?
b?
临界值TT ?
b?
总 结
?经过上述建模 ——估计 ——检验的过程,即
完成了建立单方程模型的基本流程
?如果模型比较好地通过了经济理论假设
(定性判断)、一级检验(定量判断,包
括 R2检验,F检验和 T检验)和二级检验
(暂未涉及)
?则可以进入模型的应用 ——经济预测
§ 4 回归预测
?回归预测:给定解释变量 X的一个观测值,
利用通过检验的计量方程对被解释变量 Y的
值进行预测(估计)
?预测包括两种方式:
?点预测
?区间预测
一、点预测简介
?假定已得到 通过 各种检验的回归方程如下
?将解释变量的一个特定值 X0代入上式
?得到 Y的预测值为
)4(10 ???? ???IXbbY i ??
)16(??? 0100 ???XbbY ??
二、区间预测
?预测只提供一个参考值,与实际值会有一
定的差距 ——点预测的偏差因此十分常见
?任何一种预测方法都不能得到完全准确的
预测值
?既然如此,往往更希望得到预测值以一定
的概率处于一个区间之中
?区间预测由此产生
区间预测过程
?引入一个新的概念:模型的残差标准差
?查 T分布表:
?给定显著水平( 1-a),V= n- 2
?得 T检验的临界值 T临界 值
2
2
?
? ?
n
e
S ie
区间预测过程
?得到在( 1- a) 的概率水平下 Y0的 预测区
间:
)17(
)
)(1
1
?
,
)(1
1
?
(
2
2
0
0
2
2
0
0
?????
?
?
?
???
?
???
i
e
i
e
x
XX
n
STY
x
XX
n
STY
临界值
临界值
对预测区间的说明
?由( 17)式所体现的预测区间看,X0的取
值越接近均值,区间越小
?意义:如果解释变量在预测期所取的值越
接近其均值,则预测区间越小,意味着预
测越可靠
?如果解释变量在预测期所取的值越偏离其
均值,则预测区间越大,意味着预测越不
可靠
第四部分 多元线性回归模型
?一元模型中只涉及唯一的一个解释变量
?实际经济问题分析中需要考虑的解释变量
往往超过一个
?假设被解释变量 Y与解释变量 X1,X2,~~,
Xk具有线性关系,则模型设定为( 18)式
uXbXbXbbY kk ?????? ?22110
§ 1 多元回归模型的估计与检验
?一、估计
?思路与一元模型完全一致
?根据 OLS法的原则,要求所求出的估计值
? 使全部实际观测值 Yi与回
归值(预测值) 的残差平方和最小 kbbbb ???? 210 ??、、
iY?
2
110
22
)???(m in
)?(m inm inm in
kikii
iii
XbXbbY
YYeSSR
?????
???
?
? ?
?
一 估计
?仍然由极值公式,当残差平方和最小时,
上式对每个待估计参数的偏导为 0
?共 k+1个待估计参数(未知数),求偏导得
到 K+1个方程
?K+1个方程当然可求出 K+1个未知数!
?具体的计算式过于复杂,且软件可自动生
成 ——不作推导
二 检验
?一元模型所进行的 R2检验,T检验和 F检验
仍然成立,且基本的计算公式仍然成立
?仅判别的法则相对有一定变化
?具体的检验值同样由软件自动生成
?不作详细推导
?仅介绍判别的法则
R2检验
?判别的法则同样越接近于 1越好
?但为避免过度依靠增加解释变量个数来提
高 R2检验值,常用调整后的 R2
)19(
1
1)1(1 22 ??
??
????
kn
nRA d j R
F检验
?一元模型中,当求出的 F>查表得到的临界
值 Fa(1,n-2)时通过检验
?多元模型中,当求出的 F>查表 得到的临界
值 Fa(1,n-k-1)时通过检验
T检验
?一元模型中,当求出的 T>查表 得到的临界
值 T2/a(n-2)时通过 检验
?多元模型中,当求出的 T>查表 得到的临界
值 T2/a(n-k-1)时通过 检验
§ 2 多元模型的构造:
解释变量的选择
?在一元模型中只涉及一个解释变量,往往
直接选择对被解释变量有最直接、最基础
影响的变量构造模型
?在多元模型中模型解释变量的恰当选择要
复杂得多
?经济变量之间存在复杂的相互联系,那些
联系要考虑,那些不考虑?
?选择变量、构造
模型的两种方法
?逐步增加变量
?逐步减少变量
?基本原则
?1、根据经济理

?2、根据实际研
究的需要
?3、根据数据的
可获得性
§ 3 多元模型的预测
?建立多元模型为:
?同样可表示为:
?其中,i=1,2,~~,n
?用向量表示为
?Yi=XiB+ui
uXbXbXbbY kk ?????? ?22110
ikikiii uXbXbXbbY ?????? ?22110
对向量的说明
?Xi=(1,X1i,X2i,~~,Xki)
?B=(b0,b1,b2,~~,bk)`
?根据样本的 n组观测值,利用最小二乘法求
得回归方程即
?预测即利用解释变量的特定值 X0=(1,X10,
X20,~~,Xk0)对因变量的预测值 Y0进行
估计
BXY ii ?? ?
点预测
?同一元模型相仿,直接将 X0代入方程
?计算得到被解释变量的预测值
区间预测
?残差标准差的计算公
式较一元模型稍有变

?分子的变化
?分母的变化
2
2
?
?
?
n
e
S
i
e
1
`
??
?
kn
ee
S
e
T临界值 的变化
?查 T分布表的参数 V在一元模型中是 V=n-2
?在多元模型中 V=n-k-1
最终的预测区间为
))(1
?
,)(1
?
(
`
0
1`
00
`
0
1`
00
XXXXSTY
XXXXSTY
e
e
?
?
??
??
临界值
临界值
第五部分
实际模型研究的几个问题
§ 1 虚拟变量问题
?一般的经济变量数据多可连续取值
?如价格、利率、销售率等
?在实际模型构造中可能有部分变量不能连
续取值
?如职业、性别、地区、季节等
?如自然灾害、战争、经济体制、政府政策
的突然改变等
一、虚拟变量的定义
?反映定性因素对模型被解释变量的影响,
取值通常为 0或 1的人工变量
?一般用 D表示
?由于虚拟变量可较好地体现政府经济政策
变动对经济的影响
?因此又被称为“政策变量”
?EX,当气候正常时,D取0;异常时取 1
二 虚拟变量举例
?Ex1,某种出口依赖程度较大的商品的生产,
除受该产业的劳动力投入、资本投入的影
响外,还受到本国政府出口政策和国际市
场贸易保护主义措施的影响
?建立模型为
uDbDb
bbb
???
???
2413
210
资本劳动产量
?D1,本国政府实施正常的鼓励出口政策时
取 0;取消鼓励出口政策时取 1
?D2, 国际市场状况正常时取 0;出现贸易
壁垒时取 1
?Ex2 针对某地区居民的购房行为建立决策
模型 ——虚拟因变量
?X,居民收入;
?Y,居民的购房决策,未买住房时取 0;购
买住房时取 1
iii uXbbY ??? 10
三 虚拟变量的设置原则
?若一个定性影响因素有 m个水平,则设置
( m- 1) 个虚拟变量
?如:体制改革是一个因素,分为改革前后两个水
平 ——则设置一个虚拟变量
?如:季节是一个因素,分为春夏秋冬四个水平 —
—则设置三个虚拟变量
?防止“虚拟变量陷阱”
?虚拟变量之和恒等于 1
§ 2 滞后变量问题
?滞后变量:回归模型中用解释变量的时间
滞后量(前期量)作为另一个解释变量
?使用滞后变量的模型称为滞后变量模型
?滞后变量存在一系列估计上的困难,往往
需要进行必要的处理,用一定手段对滞后
变量模型进行转换
tjtjttt uXbXbXbaY ?????? ?? ?110
阿尔蒙( Almon) 多项式法
tjtjttt uXbXbXbaY ?????? ?? ?110
原模型为有 j期滞后的模型如 (20)式
第一步 对待估计参数作变换
?其中,k=0,1,~~,j
? r<j,一般取 3或 4
?即 b0=a0
? b1=a0+a1+~~+ar
? b2 =a0+2a1+~~+2rar
? bj=a0+ja1+~~+jrar
)2(2210 ??? rrk kakakaab ?????
(3)
第二步 将( 3)代入( 1)得
tjtr
r
trtt
uXajjaa
XaaaXaaY
??????
??????
?
?
)(
)(
10
1100
??
?
)4(
)2(
)2(
)(
1100
21
211
10
???
?
?
??
?
trtrtt
tjt
r
t
r
tr
jttt
jtttt
uWaWaWaa
uXjXXa
jXXXa
XXXaaY
??????
????
?????
??????
???
???
??
第二步 将( 3)代入( 1)得
?其中:
jt
r
t
r
trt
jtttt
jtttt
XjXXW
jXXXW
XXXW
???
???
??
????
????
????
?
??
?
?
11
211
10
2
2
(5 )
第三步 估计
?对( 4)式用 OLS法求得 a,a0,~~,ar的
估计值
第四步 求原始模型的参数 b
?将上一步获得的 a代入(3)式
?得到 b的估计值
?阿尔蒙多项式法结束!
?优点:较好地解决了原滞后变量模型中滞
后变量之间的相互影响问题;明显地减少
了待估计参数的个数(原模型,j+2; 转换
后,r+2)
例:滞后变量模型为
?该模型滞后 7期,待估计参数 9个
?一、作 Almon多项式变换,取 r=2
ttttt uXbXbXbaY ?????? ?? 77110 ?
2
2
107
2
2
102
2101
00
2
210
77
22
aaab
aaab
aaab
ab
kakaab
k
???
???
???
?
???
二、得到新生成的 W变量为
?W0t=Xt+Xt-1+~~+Xt-7
?W1t=Xt-1+2Xt-2+~~+7Xt-7
?W2t=Xt-1+22Xt-2+~~+72Xt-7
?新模型为,Yt=a+a0 W0t +a1 W1t +a2 W2t
+ut
结 束 语
?经济预测“在很大程度上是经验与艺术的
结合”
?本讲座仅仅对经典计量经济学的理论、方
法进行了介绍
?谢谢大家!