内容回顾
?变量间关系
?不相关关系;相关关系;
?因果关系;互为因果关系
△对于变量间关系的几点注意:
? 不线性相关并不意味着不相关;
? 有因果关系意味着一定有相关关系;
? 有相关关系并不意味着一定有因果关系 ;
相关分析和回归分析的异同:
? 共同点:
? 相关分析和回归分析均是对变量间的相关
关系进行讨论,但它们并不意味着一定有
因果关系 。
? 不同点:
? 相关分析是以相关系数的大小来分析变量
间相关程度的;
? 回归分析则是通过建立合适的数学模型来
分析变量间相关程度的
回归分析回顾
例如,C = ? + ?Y+?
? 等式左边的变量被称为 被解释变量 ( Explained
Variable)或 应变量 ( Dependent Variable),
等式右边的变量被称为 解释变量 ( Explanatory
Variable)或 自变量 ( Independent Variable)。
? 由于变量间关系的随机性,回归分析关心的是根
据解释变量的已知或给定值,考察被解释变量的
平均变化程度,即当解释变量取某个确定值时,
与之具有相关关系的被解释变量所有可能出现的
对应值的平均值。
本次课内容及重点内容介绍
? 第二节 建立计量经济学模型的步骤和要点
? ⒈ 理论模型的设计
? ⒉ 样本数据的收集
相关概念明晰
? 总体 —— 根据一定目的确定的所要研究对象的全体,称为总
体或母体;
? 个体 —— 组成总体的每个基本单位称为个体;
? 样本 —— 总体中抽出若干个个体组成的集合称为样本。
? 样本的容量 —— 样本中包含的个体的数目称为样本的容量,
又称为样本的大小。通常用小写英文字母 n来表示。
? 通常将样本容量不少于 30个的样本称为大样本,不及 30个
的称为小样本。
? 随着样本容量的增大,样本对总体的代表性越来越高。
? 社会经济统计的抽样调查多属于大样本调查。
一、关于总体与样本
样本与总体之间的关系
? 样本是总体的一部分,是对
? 总体抽样后得到的集合。
? 之所以需要抽取样本,
? 是因为在有些情况下,
? 当分析总体的特征时,涉及
? 的总体容量太大,以至于
? 不可能对整个总体进行检查,
? 或者这样做耗费太大,
? 因此只能使用样本。
……
Xn+1
Xn

X1 样本
总体
? 对观察者而言,总体一般是不了解的,了解的只
是样本的具体情况。我们所要做的就是通过对这
些具体样本的情况的研究,来推知整个总体的情
况。
? 由于在某种程度上样本可以作为总体的代表(随
着样本容量的增大,样本对总体的代表性越来越
高),因此这种推断有一定合理性。
? 例如:研究湘潭市所有家庭的平均收入
? 研究平均收入,很显然需要全体湘潭市家庭的收入数据。
? 总体:湘潭市所有家庭的收入状况
? 可是,要收集每个家庭的收入是一件很困难的事。在实践
中,我们可以抽取一个由 5000户家庭组成的样本,然后
计算这 5000户的平均收入,作为湘潭市家庭的真实平均
收入的估计值。
? 样本:随机抽取 5000户,这 5000户家庭的收入状况就是
一个样本
(某一具体样本情况可知)
二、参数、估计量、估计值
? 对于总体,我们希望了解它的某些重要的数量特征,这些
特征就是参数;
? 参数 —— 用来描述总体特征的数字指标,常用的参数有总
体平均数、总体标准差(或总体方差 )等;
? 对于一个问题总体是唯一确定的,所以参数也是唯一确定
的,它是待估计的常数;
? 例子:
? 参数:湘潭市所有家庭的平均收入
? 想了解平均收入,一个可行的办法是随机抽取若干个家庭
组成一个有关家庭收入的样本,然后计算样本的平均收入,
作为湘潭市家庭的真实平均收入的估计值。
? 这种利用样本数据来估计未知的总体参数的方法称为参数
估计。
? 在参数估计中,对于总体参数,我们用根据样本得到的估
计量来估计它。
? 统计量 —— 根据样本数据计算出来的一个量,用来描述样
本特征,比如样本平均数、样本标准差(或样本方差 );
? 对于一次抽样调查,总体是唯一确定的,但样本不是这样,
样本是不确定的,一个总体可能抽出很多个样本;
? 样本个数又称样本可能数目。指从一个总体中可能抽取的
样本个数 ;
? 一个总体有多少样本,则统计量就有多少种取值,所以统
计量的取值随样本的不同而发生变化,是一个随机变量;
? 估计量 —— 用来估计总体参数的统计量,是一个随机变量;
与总体参数相对应,估计量有样本平均数、样本标准差
(或样本方差 )等 ;
? 若总体参数记为 θ,则相应估计量记为
? 估计值 —— 用来估计总体参数时计算出来的估计量的具体
数值
??
? 参数:湘潭市所有家庭的平均收入
? 样本:随机抽取 5000户,这 5000户家庭的收入状
况就是一个样本
? 估计量:根据容量为 5000的样本计算得出的家庭
平均收入
? 估计值:抽取一个具体容量为 5000的样本,假定
根据这个样本计算出该样本中家庭平均收入为
2000元,这个 2000元就是估计量的具体取值,即
估计值。
我们的目的是分析说明某一现象总
体的数量特征,
在许多场合下,我们只能从总体中抽
取一个样本作为总体的代表,
此时,我们
用样本推断总体 ;
用估计量推断总体参数
第二节 建立计量经济学模型的步骤和要点
? ⒈ 理论模型的设计
? ⒉ 样本数据的收集
? ⒊ 模型参数的估计
? ⒋ 模型的检验
⒈ 理论模型的设计
? 模型设计的定义
? 依据一定的经济理论,用一个或一组随机方程式表示被研
究系统内经济变量之间的关系。这阶段的工作称为理论模
型的设计。
? 这是计量经济学研究中最重要也是最困难的阶段,为此主
要需要作以下工作:
? 1.研究有关经济理论
? 2.确定变量和模型的数学形式
研究有关经济理论
? 建立模型需要理论抽象。模型是对客观事
物的基本特征和发展规律的概括,是对现
实抓住本质的简化。
? 这种概括和简化就是理论分析的成果。
? 因此,在模型设定阶段,首先要注意基于
经济理论的定性分析,
凯恩斯( Keynesian)消费理论
? 根据凯恩斯( Keynesian)消费理论:
?, 平均说来,当人们收入增多时,他们倾
向于消费,但消费增长的程度并不和收入
增加的程度一样多。,
? 按照凯恩斯的观点反映收入与消费关系的
0<边际消费倾向 <1。
库兹涅茨假设
? 但是,库兹涅茨对凯恩斯这种边际消费倾
向下降的观点持否定态度。他研究的结论,
消费与国民收入之间存在稳定的上升比例。
因此,根据不同的消费理论将会设定不同
的消费模型。
邓小平理论是中国计量经济学研
究的理论基础
? 我国即将建成有中国特色的社会主义市场
经济体制,
? 因此应该以中国改革的设计师邓小平的理
论框架作为模型设定的基础,
? 实事求是地对国情、国力进行深入的理论
分析。
理论模型设计阶段具体技术工作:
? ⑴ 确定模型包含的变量
? 模型应该包括那些变量?哪些是被解释变
量?哪些是解释变量?
? ⑵确定模型的数学形式(建立计量经济学
理论模型)
? 是线性的?亦或是非线性的?
⑶ 拟定模型中待估计参数的理论期望值区
间、符号、大小,关系
计量经济学模型的建模第一步 —— 理论模型的设计
⑴ 确定模型包含的变量
研究一个经济现象,首先必须要了解经济理论对这一现象是
如何阐述的,或者说必须了解这一经济现象中所包含的经济理
论和经济行为规律。只有这样才有可能正确选择模型中应包含
的变量。
例如:在生产问题中,在C — D生产函数中,研究者认为影
响产出量的主要因素是技术,劳动和资本。那么,是否在任何
情况下影响产出量的主要因素都是这三者呢?
供给不足时 —— 影响产出的因素体现在投入要素方面:技术,
劳动和 资本
需求不足时 —— 影响产出的因素体现在需求方面:居民收入、
等,而不是投入要素方面
由此可见,同样是建立生产模型,所处的经济环境不同,研
究的行业不同,变量的选择是不同的。
注意点1:根据经济学理论和经济行为分析。
注意点 3:
在选择变量时要考虑数据的可得性,即要保证所选择的变
量有可靠的数据来源。
另外,选择变量是要考虑入选变量之间的关系。这是计量
经济学模型技术素要求的。在第二章中有介绍。
确定模型所包含的变量的3大注意点
注意点1:
根据经济学理论和经济行为分析。
? 注意点2:
? 建模的目的不是包含现实中的所有影响因素(解
释变量),而仅仅是一些关键的影响因素,最终
选择的模型应该是对现实的合理复制而不是完全
复制。
? 注意点3:
? 在选择变量时要考虑数据的可得性,即要保证所
选择的变量有可靠的数据来源。
? 总之在实际操作中,变量的选择必须慎重,
因为多选和少选变量都将影响模型的准确
性。模型中变量的选择不是一次完成的,
往往要经过多次反复。
⑵ 确定模型的数学形式
选择模型数学形式的主要依据是经济行为理论
选择方法通常有两种:
1)采用数理经济学的成果 —— 数理经济模型
2)根据样本数据作出的变量之间关系的散点图,由散点图
显示的变量之间的数学关系作为理论模型的形式。
选择方法 3:
选择可能的形式试模拟
⑶ 拟定模型中待估计参数的理论期望值区间,符号、大小、
关系
理论模型中的待估参数一般都有特定的经济含义,它们的数
值范围即理论期望值根据其经济含义可以拟定出来。
这一理论期望值可以帮助我们检验模型的估计结果。
理论模型设计三步走:
? ⑴ 确定模型包含的变量
? ⑵确定模型的数学形式(建立计量经济学
理论模型)
? ⑶ 拟定模型中待估计参数的理论期望值区
间、符号、大小,关系
计量经济学模型的建模第二步 —— 样本数据
的收集
? 在经济问题研究中,数字往往是证明观点的证据,
基于事实的证据是我们透过大千世界的外表而探
求其运行本质的基础。
? 数据是基础,建立在数据之上的是变量,变量之
间的关系构成方程,随机方程式构成模型。模型
是对现实社会经济系统的抽象和简化。
? 样本数据的收集是建立计量经济学模型步
骤中基础的一环,也是对模型质量影响极
大的一项工作
⑴ 计量经济研究中几类常用的样本数据
时间序列数据
截面数据
虚变量数据
⑵ 样本数据的质量问题
完整性
准确性
可比性
一致性
1.时间序列数据
( Time Series Data)
? 时间序列数据又俗称为纵向数据。
? 定义:按一定时间间隔收集并按时间先后排列的数据
? 例如,我国自改革开放的 1978-2004年 GNP数据;某
支股票每日成交量。
? 在西方经济学中称它为流量,在经济统计学上称它为
时期数。
? 时间序列数据与时间有关,在时间序列中,时间是变
化的。研究的是不同时间同一变量的变化情况。
? 时间序列数据一般由统计部门提供。
2.截面数据
( Cross-Section Data)
? 截面数据又称俗横向数据
? 定义:在同一时间点上能够收集的不同实体(个人、公司、
家庭、国家等)的数据。
? 例如,2004年 7月 1日 0点,我国三十一个省市的人口数;
各国 2003年国民生产总值;经济普查数据。
? 在西方经济学中称它为存量,在统计经济学上称它为时点
数。
? 截面数据的时间是凝固的。研究同一时点上变量的变化情
况。
? 截面数据也可由官方资料获得。
哪个是存量?哪个是流量?
3、虚变量数据
( Dummy Variables Data )
? 定性变量 —— 不能计数(不能用数值表示)的变量
? 虚变量 (虚拟变量 )—— 可以将定性变量“定量化”的变量
? 例如:定性变量 — 性别:男和女
? 定量化:记 x=1为男性,x=0为女性
? X为虚变量
? 虚变量取值一般为 0和 1。
? 注意,0”和,1”只起着名义的或符号的作用,并不代表数
值 0和 1。
? 计量经济学模型要求定量变量。对于涉及到政策、气候这
类定性变量的模型就可以使用虚变量将这些定性变量引入
模型中。
数据来源
? 计量经济分析所需要的数据可以充分利用
统计部门提供的资料或是其他一些诸如网
上期刊得到的二手资料,以减少收集数据
的工作量。
? 在没有有效来源时,可由自己通过调查得
到。
4.平行数据( Panel Data)
? 平行数据是时间序列数据与截面数据的合
成体。
? 例如,1978-1999年我国各省市城镇居民消
费结构的调查资料。
样本数据的质量问题
数据高质量的标准:
完整性;准确性;可比性;一致性
( 1)完整性 —— 模型中包含的所有变量都必须拥
有相同容量的样本观测值
对于“遗失数据”的处理方法:
法一:样本容量足够大且样本点间的联系并不紧密
时,将出现遗失数据的所在样本点整个去掉
法二:样本容量有限,或样本点间的联系紧密时,
采取特定技术将遗失数据补上。
? ( 2)准确性 — 数据本身是准确的,真实反
映经济变量的情况;数据是模型研究中所
准确需要的
? ( 3)可比性(数据口径问题) — 数据必须以统一
的标准得来
? 例:去年 100元,今年 105元,今年比去年物价上
涨 5%,问:今年比去年更有钱吗?
? 105>100吗?
? 105= 100*( 1+ 5%)
? 在分析数据时,不能看数据的表面,而要将数据
用统一的标准来衡量,保证数据是可以比较的。
? 通常的做法,将数据以不变价格计算(以某一年作
为基准年,将其余年份的数据都向这一基准年作
调整)。
? 在使用数据,尤其是 时间序列数据 时,一定要注
意数据是否具有可比性。
( 4)一致性 — 样本与总体必须保持一致
例:建立一个人均收入与人均消费额的方程:
? C = ? + ?Y (方程 1)
? 其中人均消费额( C);人均收入( Y)
? 以人均数据(人均消费额和人均收入)作为样本
数据,来估计人均消费水平。
? 若以此方程估计某一群体的消费总额
? D = ? + ?I (方程 2)
? 其中居民消费总额( D);全国居民总收入( I)
? 方程 2对吗?能得出准确结果吗?
方程 2 D = ? + ?I是错误的
? 按人均方程 1 C = ? + ?Y
? 则
? 总消费额 D = C * N=( ? + ?Y)* N
? =N ? + N?Y= N ? + ?I (方程 3)
? 其中全国总人口( N)
? 而直接利用人均方程 1估计某一群体的消费总额
? D = ? + ?I (方程 2)
? 两个计算结果相差 (N- 1) ?
? 方程 1正确的原因:符合一致性原则
? 样本 — 人均数据 总体 — 人均数据
? 方程 2的错误原因:违背了一致性原则
? 样本 — 人均数据 总体 — 总量数据
? 在使用数据,尤其是 截面数据 时,一定要
注意数据是否具有一致性。
判断
? 生产问题:
? 资本 — 所拥有的全部资本?
? 准确性问题
? 产出量用产出总值衡量 — 用当年价格表示
? 可比性问题
? 用全国大中型煤炭企业的截面数据得到的
模型预测未来整个煤炭行业的产出量?
? 一致性问题
关于数据的几点说明:
? 一般说来,收集的数据都需要经过统计分
组,整理加工,使之系统化,成为能为模
型所用,反映问题特征的综合资料。
? 数据整理工作包括分类,调整口径,汇总,
编制变量列表。还包括建立研究问题的数
据库。
? 经过加工的数据称为加工好的数据。
? 实际上模型的设定和样本数据的收集通常
是同时进行的。
计量经济学模型的建模第三步 —— 模型参数的估计
? 计量经济学理论模型设定以后且样本数据得到后,就要选
择适当的方法估计理论模型了,即估计模型中的参数。
? 参数将各种变量连接在模型之中,具体说明解释变量对被
解释变量的影响程度。
? 在未经实际资料估计之前,参数是未知的。理论模型设定
之后,依据可利用的数据资料,选择适当的估计方法,例
如最小二乘进行估计。
? 参数一经确定。模型亦随之确定了 。
? 例子
参数估计的意义
? 参数估计为经济理论提供了实际经验的内
容,并验证经济理论。
? 如上述空调的需求模型,参数 ?的估计值为
-3.88,它不仅说明了价格与需求间关系的
实际内容,同时也证实了需求法则关于 ?<0
的假定。
计量经济学模型的建模第四步 —— 模型检验
? 得到参数估计以后,可以说一个计量经济学模型便已建立。
但模型是否符合实际,能否解释实际经济过程,还需要进
行检验。检验分四方面内容:经济意义检验、统计学检验、
计量经济学检验和预测检验。
? 经济意义检验
? 主要检验各个参数是否与经济理论和实际经验相符,这是
一项最基本且必须通过的检验。
? 具体做法,根据在第一步模型的设计中拟定的参数符号、
大小、关系来判断
? 统计检验
? 主要利用统计理论知识,检验由样本得到的模型是否能准
确反映总体的真实情况。
? 包含拟合优度检验,变量和方程的显著性检验。
⑶ 计量经济学检验
? 主要利用计量经济学理论知识,检验模型的假设条件
是否得到满足。
? 包含序列相关、异方差、多重共线性检验等。
⑷ 模型预测检验
预测检验主要讲演所建立的模型是否可以用于样本观
测值以外的范围
计量经济学研究是一个动态过程
? 模型只有通过上述各项检验之后,才能实
际应用,检验不能通过,则需修整模型,
再设定,再估计,再检验。
2004-10-5 6
建立计量经济学模型的步骤和要点
提出、界定问题
理论模型设计
经济理论
或假说 现实经济行为 的观测数据
模型参数估计与模型检验
估计模型的应用
数理经济模型
设计,确定变量、
确定模型的数学形式
拟定待估参数预期值
加工好的样本数据 X
YesNo
检验,经济意义检验
统计检验
计量经济学检验
预测检验
估计与检验方法
计量经济研究中几类常用的样本数据
⑴ 时间序列数据 — 时间序列数据与时间有关,在
时间序列中,时间是变化的。研究的是不同时间
同一变量的变化情况。
( 2)截面数据 — 截面数据的时间是凝固的。研究
同一时点上变量的变化情况。
( 3)虚变量数据 — 可以将定性变量“定量化”的
变量,取值一般为 0和 1。
样本数据的质量问题
完整性 —— 模型中包含的所有变量都必须拥有相同容量的
样本观测值
准确性 —— 数据本身是准确的,真实反映经济变量的情
况;数据是模型研究中所准确需要的
可比性 —— 数据必须以统一的标准得来
在使用数据,尤其是 时间序列数据 时,一定要注意数据
是否具有可比性。
一致性 —— 样本与总体必须保持一致
在使用数据,尤其是 截面数据 时,一定要注意数据是否
具有一致性。