1
第二章 数据与模型
2
问题的提出
? 在经济问题研究中,数字往往是证明观
点的证据,基于事实的证据是我们透过
大千世界的外表而探求其运行本质的基
础。
? 数据是基础,建立在数据之上的是变量,
变量之间的关系构成方程,随机方程构
成系统,系统加上恒等式构成模型。模
型是对现实社会经济系统的抽象和简化。
3
解决问题的思路
? 了解模型的构成及其种类
? 模型函数形式的选择 —— 线性与非线性
? 变量关系的度量 —— 协方差与相关系数
4
第一节 数据、变量和模型
? 一、数据及其类型
? 二、变量及其类型
? 三、参数
? 四、随机扰动项
? 五、方程及其种类
? 六、模型
5
一、数据及其类型
1.何谓数据
2.数据的意义
3.数据的类型
( 1)按数据的性质划分
( 2)按数据与时间的关系
1*名义型数据
2*有序型数据
3*间隔型数据
4*比率型数据
1*.截面数据( Cross-Section Data)
2*.时间序列数据( Time Series Data)
3*.平行数据 ( Panel Data)
6
1.何谓数据
? 数据是客体反映信息之一,这种信息如以量的
标志显现出来,就称其为数据。数据是一定条
件下客体在量的方面的综合表现。在开始一项
研究工作时,最基本的工作之一,就是收集数
据。
? 数据按其本义来说是定量的(计数或计量)的。
但在实际应用中,它们可以是定量的,也可以
是定性的,或者是两者的结合。随着人类认识
客体技术的提高与认识层次的深化,数据的外
延还在不断的扩大。
7
2.数据的意义
? 数据是经济计量模型的基础
8
3.数据的类型
? ( 1)按数据的性质划分
? 1*名义型数据
? 2*有序型数据
? 3*间隔型数据
? 4*比率型数据
? ( 2)按数据与时间的关系
? 1.截面数据( Cross-Section Data)
? 2.时间序列数据( Time Series Data)
? 3.平行数据
9
( 1)按数据的性质划分
1*名义型数据
2*有序型数据
3*间隔型数据
4*比率型数据
10
1*名义型数据
? 这是一种纯粹的数学符号,没有量的概念。例如,盈
利的有无,早于文化大革命、等于文化大革命和晚于
文化大革命等。
? 这些有无、是否、上下、早晚之类的概念,可以用,0”
和,1”两个数构成的虚拟变量(或称二态变量)来表
示。
? 若记 XA为男性,XB为女性,则 XA=1,XB=0,这时
XA与 XB之间,有且仅有以下三种关系,XA=XA,
XB=XB,XA ?XB。或简记 X=1为男性,X=0为女性。
? 注意,0”和,1”只起着名义的或符号的作用,其量的
概念已不复存在。
11
2*有序型数据
? 有序就是指有先后次序。例如经济发展就有先后顺序,
从第一产业到第四产业产业的升级就形成了一个序列。
记第二产业为 XB,第四产业为 XD,那么两者的关系
不仅有等与不等的关系,还可以有 XD>XB,XB<XD,
但这里不包含“大多少”、“小多少”的概念。如记
最清洁为 XA、清洁为 XB、不清洁为 XC。三者排成序
列,XA>XB>XC,但是它们三者的间隔并不相等。
因此对这类数据不能简单地作算术四则运算。
? 在实际应用中往往不用具体的数表示有序关系。人们
习惯把它们变成名义数据进行处理。
? 序列中若有个 m状态就要用 m-1个虚拟变量。
12
用虚拟变量表示定性数据
D? ±e D ?à éú μè ?? D1 D2
?D 0 2? ?? ?à 1 0
?? 1 ?? ?à 0 1
×? ?? ?à 1 1
13
3*间隔型数据
? 不仅可以比较两两的大小,而且还可以确定相差的量。
温度是最典型的间隔型数据之一,例如 10?C,20?C
和 30?C。我们不仅可以比较温度的高低,还可以知道
10?C比 20?C低 10?C,30?C比 20?C高 10?C。
? 它具有通常意义下数据的性质,可以作复杂的四则运
算。但是,这类数据仍然包含了某种人为的因素:
? 首先,间隔的确定的任意性,当然,间隔一旦确定就
成为比较数据的标准
? 其次,0点的确定是任意的,而且 0?C并不是没有温度。
14
4*比率型数据
? 这类数据的突出特点是 0点具有明确的含义。
? 例如,重量尽管有不同的计量单位,但 0点的意义很明
确,不会因为不同的计量单位而有不同的含义。
? 而且,任何计量单位都可以通过一个比例常数换算成
另一种相应的单位。
? 这种简单的比例关系在间隔数据中是不存在的。
? 定性数据与定量数据
? 从以上讨论,四种数据按照叙述的顺序,其量的概念,
后者比前者多一些内容。
? 习惯上把前两种称为定性数据,把后两种成为定量数
据。
15
( 2)按数据与时间的关系分
? 1.截面数据( Cross-Section Data)
? 2.时间序列数据( Time Series Data)
? 3.平行数据( Panel Data)
16
1.截面数据
( Cross-Section Data)
? 截面数据又称俗横向数据,研究某个时
点上的变化情况。例如 1990年 7月 1日 0
点,我国三十一个省市的人口数。
? 在西方经济学中称它为存量,在统计经
济学上称它为时点数。
? 截面数据的时间是凝固的。
? 截面数据中大多存在异方差,必须引起
注意。
17
2.时间序列数据
( Time Series Data)
? 时间序列数据又俗称为纵向数据。例如,我国
自改革开放的 1978-1998年 GNP数据。
? 在西方经济学中称它为流量,在统计经济学上
称它为时期数。
? 时间序列的时间是变化的。
? 时间序列数据通常存在季节变动和序列相关 —
— 自相关(误差的协方差不等于 0,即前期误
差与后期误差之间存在相关)。
? 截面数据通常存在异方差(误差方差不是一个
常数)。
18
哪个是存量?哪个是流量?
19
3.平行数据( Panel Data)
? 平行数据是时间序列数据与截面数据的
合成体。
? 例如,1978-1999年我国各省市城镇居
民消费结构的调查资料。
20
二、变量及其类型
? 1.问题的提出
? 2.何谓变量
? 3.变量的种类
? (1)按变量取值划分
? (2)按变量的时间属性划分
? (3)按变量的在方程中的地位划分
21
问题的提出
? 经济计量模型的设定、估计、检验和实
际应用的范围日益宽广。
? 例如,农业生产的需求供给模型就是一
个简单的经济计量模型。
? 那么,经济计量模型是由什么构成的?
? 从农业生产的需求供给模型的示例说起
22
农业生产的需求供给模型
? 由于模型用方程式或方程组代表所研究的某个真实系
统,所以属代数模型。
? 方程式中包含 D,S,P及随机扰动项 u,因此是随机
方程式。方程式由变量、系数和运算符构成,而随机
方程构成系统,系统加上恒等式构成模型。
降雨量。
表示,表示消费者可支配收入供给量和价格,
求量、分别表示某农产品的需和、其中,
RI
PSD
SD
RPS
IPD
ubbb
uaaa
?
?
?
?
?
?
????
????
2210
1210
23
经济计量模型属代数模型
? 经济计量模型是研究分析某个经济系统
中经济变量之间的数量关系所采用的随
机代数模型,是客观经济现象在数学上
的描述和概括。
? 经济计量模型之所以成为重要的数量分
析工具,起作抽象经济理论与实际观测
资料之间的桥梁作用,是与模型的内部
结构及其运算能力的机制有关。
24
任何经济计量模型都由以下 4
个要素构成的
( 1)变量
( 2)参数
( 3)随机扰动项
( 4)方程式
25
何谓变量
? 人们总是从发展和运动的观点来认识世界,从
客体收集到的数量信息,构成数据集。例如
1978-1998年我国的 GNP,又如四川省
1998年各个县市的 NI就是这样的数据集合。
? 变量就是数据集合的名称,通过对变量名的引
用,可以简便地对数据集合进行处理。
? 计量经济学中使用的变量的概念与统计学中指
标的概念一样,包括变量名及其对应的数据。
26
变量的种类
? 按变量取值划分
? 按变量的时间属性划分
? 按变量的在方程中的地位划分
? ( 1)单一方程中
? ( 2)联立方程中 —— 内生变量、外生变量、
前定变量
27
按变量取值划分
? ( 1)离散型
? (包括表示定性数据的虚拟变量 — 只取 0和 1)
? ( 2)连续型
28
按变量的时间属性划分
本期变量
滞后变量
29
滞后变量举例
obs Y Y(-1) Y(-2) Y(-3) Y(-4)
1981 249 NA NA NA NA
1982 267 249 NA NA NA
1983 289 267 249 NA NA
1984 329 289 267 249 NA
1985 406 329 289 267 249
1986 451 406 329 289 267
1987 513 451 406 329 289
1988 643 513 451 406 329
1989 699 643 513 451 406
1990 713 699 643 513 451
1991 803 713 699 643 513
1992 947 803 713 699 643
1993 1148 947 803 713 699
30
按变量的在方程中的地位划分
( 1)单一方程中
( 2)联立方程中
31
( 1)单一方程中
? 被解释变量(因变量、左端变量)
? 解释变量(自变量、右端变量)
32
( 2)联立方程中
? 内生变量
? 外生变量
? 政策变量、目标变量和非政策变量 ——
宏观调控
? 变量分类的相对性
? 静态模型与动态模型
? 简单宏观经济模型举例
? 前定变量
33
内生变量
? 是所研究的经济系统的模型本身确定的
? 是该模型求解的结果,
? 属于因变量;
? 在决策模型中可以使用虚拟变量做内生
变量。
34
小布什当选总统的决策
? ? uxbxbxb
ikk
ayP
y
y
???????
?
?
?
?
?
?
2211
1
0
1
35
外生变量
? 外生变量的数值是在研究的模型之外确
定的,不受模型内部因素的影响;
? 在模型求解之前事先规定的,是“给定
的”或“已知的”值
? 属于自变量
? 计数变量和虚拟变量可以作外生变量
36
外生变量分为
政策变量和非政策变量
政策变量
政策变量是决策者可以控制的变量,如政
府支出、利率、货币供应量等等。
非政策变量
非政策变量是难以控制或不能控制的变量,
例如气候、自然灾害、农业收成、汇率
等等。
37
工具变量与目标变量
? 运用模型时可以把政策变量看作工具变
量,而把内生变量看作目标变量。
? 通过对有关工具变量的调节,以便达到
事先确定的目标变量的水平。例如,通
常用适当的经济增长率,较低的失业率
和通货膨胀率等作为目标变量,事先固
定下来,然后计算调整相应的工具变量,
例如税率、公共支出预算水平等数值。
38
变量分类的相对性
? 某个变量是内生变量还是外生变量,是
目标变量还是工具变量,并不是先验确
定的
? 主要结合分析的目的,取决于它们在模
型中的地位和作用。
? 例如在农产品需求供给模型中,D,S和
P是内生变量,I和 R是外生变量。
39
静态模型与动态模型
上述农产品需求供给模型是一个静态模型,
因为时间因素在模型中不起作用。
在动态模型中时间因素起主要作用,涉及到
一个内生变量取决于另一个内生变量(或本身)
的前期数值。
例如投资方程,
i=c(4)+c(5)*(gnp(-1)-gnp(-2))+c(6)*gnp+c(7)*r(-4)+u
40
简单宏观经济模型
? 由于引进了 Yt-1这一滞后内生变量,表明
投资是 Yt和 Yt-1以及随机扰动项的函数。
是一个动态模型。
滞后变量。
是量。年的政府支出,外生变是是内生变量,
收入,年的消费、投资和国民分别表示、、其中,
yG
yic
Gicy
uybybbi
uyaac
t
t
t
tt
tt
t
t
tt
t
t
t
t
t
t
1
2
,2
1
321
,121
?
?
?
?
?
?
?
?
?
???
????
???
41
前定变量
? 滞后内生变量的数值是前期所决定的,
? 因此,它和外生变量都是在求解本期内
生变量之前已经确定了的变量
? 滞后变量与外生变量合称为前定变量
? 用作解释变量
42
三、参数
? 参数的定义和分类
? 参数在方程中的作用
? 对参数的约束
43
参数的定义和分类
? 反映模型中各类方程式的经济结构特性
的参数,称为结构参数
? 它有显含参数和隐含参数之分。
? 显含参数就是与变量相乘的常系数,例
如上述需求供给模型中的
? 隐含参数如随机扰动项的概率分布。
44
参数在方程中的作用
? 通过参数把各种变量连接在方程之中,
借以说明外生变量或前定变量的变化对
内生变量变化的影响程度。
? 参数值可以利用数理统计学方法根据样
本资料进行估计。
? 参数一经确定。函数关系亦随之确定了
? 就可以按外生变量和前定变量的值预测
内生变量的值。
45
对参数的约束
? 对参数的约束
? 确定参数的大小及其正负号就是对模型
的事前约束。
? 零约束或非零约束
? 模型中排除或包含某个变量,可以看作
是对模型中某个变量的参数施加零约束
或非零约束。
46
四、随机扰动项
? 理论经济学和数理经济学一般假定经济变量之
间存在确定性的规律,从而建立确定性的模型。
? 经济计量模型 与 一般经济理论模型的主要区别
就在于模型中添加随机扰动项或误差项,建立
的是所谓的概率性模型。
? 引入随机扰动项是为了更准确地描述社会经济
系统。
? 随机扰动项是不可观察的,只能通过残差 ——
实际值与拟合值的差 —— 进行估计
47
方程中列入随机扰动项的主要
原因
? ( 1)观测误差
? ( 2)由于忽略了次要因素引起的误差
? ( 3)由于社会经济现象固有的不可重复性,
即使相同条件下进行试验,也不可得出完全相
同的结果,因而出现随机误差,即固有的随机
性特性。
? 这些误差越小,表明内生变量 与 前定变量或外
生变量的相关程度越高,亦即模型较好地描述
各个经济变量 之间 的关系。
48
五、方程及其种类
? 1.方程的定义
? 2.方程的种类
? ( 1)按方程个数的多少和方程间的关系分:
? ( 2)按方程反映的经济关系分:
? 1*行为方程
? 2*技术(工艺)方程
? Cobb-Douglas生产函数是典型的技术方程
? 3*制度(法规)方程
? 4*定义式(恒等式)方程
? 3.方程的特性
49
1.方程的定义
? 经济计量模型由一个或多个方程构成。
? 方程是根据经济理论的判断和分析,参
照实际需要和可能,把变量、参数和随
机扰动项组成的数学表达式。
? 运用方程反映各个经济变量之间以及它
们同外部条件之间的函数关系。
50
2.方程的种类
? ( 1)按方程个数的多少和方程间的关系
分
? ( 2)按方程反映的经济关系分
? 1*行为方程
? 2*技术(工艺)方程
? 3*制度(法规)方程
? 4*定义式(恒等式)方程
51
( 1)按方程个数的多少和方
程间的关系分
? 单个方程,例如研究 1998年 GNP与
消费的关系,考察消费对 GNP的拉动:
? 多个方程,方程之间不存在必然联系。
? 联立方程,方程之间是联立的,必须
同时求解,如前述简单宏观经济模型。
uCG N P iii ba ???
vI n c o m eF o o d
uI n c o m eC l o t h
iii
iii
dc
ba
???
???
52
( 2)按反映的经济关系分
? 1*行为方程
? 2*技术(工艺)方程
? Cobb-Douglas生产函数是典型的技术
(工艺)方程
? 3*制度(法规)方程
? 4*定义式(恒等式)方程
53
1*行为方程
? 描述市场主体(居民、企业、政府等决
策单位)的经济行为,说明这些主体对
外界刺激或影响在自身经济活动中的反
映。
? 例如,消费函数,投资函数和供给函数
等等。
54
2*技术(工艺)方程
? 由科学技术水平确定的可能的物质生产
技术关系的方程式
? 一般说明投入的生产要素与产出成果之
间的工艺技术关系
55
Cobb-Douglas生产函数是典
型的技术(工艺)方程
? 美国经济学家柯布和道格拉斯研究 1900-
1922美国经济,得到的结果:
称为资金密集型。不变,
,规模报酬。反映效益称为技术进步结构,
反映生产和劳力,资本,产量,其中,
或
或
??
??
??
??
??
??
?
??
???
????
?
?
?
1
lnlnlnln
1
A
LKQ
uLKaQ
uAQ
uAQ
LK
LK
LKQ 75.025.001.1?
56
技术性关系
? 生产函数表示在一定的技术水平条件下,
生产要素的某种组合与可能生产的最大
产量之间的关系。
? 若技术水平发生了变化,生产函数亦即
随之发生变化。
? 生产技术关系既有确定性的,也有概率
性的。
? 生产函数也可能是动态性的。
57
动态生产函数
微观模型与宏观模型
? 某企业在不同年份中购买生产资料(资
本存量)具有不同生产率时,生产函数
扩展为:
? 这是一个微观关系方程。
? 如果 Q,K,L是全国的产量、资本存量
和劳力,这时的方程为宏观关系式。
uLkkkAQ tbttttt aaa 121 210 ????
58
3*制度(法规)方程
? 根据法律、制度和政策等制度性规则所
规定的经济变量之间的数量关系方程式。
? 例如:税金 =应税额 X税率
? 其中税率是由政府确定的,所以这种制
度法规方程是确定性方程。
59
4*定义式(恒等式)方程
? 根据经济理论或假设所确定的有关经济
变量之间的定义关系,用方程或恒等式
表示。例如:
? GNP=C+I+G+X-M
? 销售额 =销售量 X单价
? QS=QD
? 这类方程用来描述定义或者均衡条件,
不包括随机扰动项,属确定性方程。
60
3.方程的特性
? ( 1)反映经济结构关系,用以进行结构
分析,如比较静力学、弹性、乘数、加
速数等分析。
? ( 2)具有运算机制,用以进行预测、仿
真和政策评价。
? ( 3)具有概率性,结论具有一定的可靠
性。
61
六、模型
? 系统 —— 由多个相互联系的随机方程组成。设
定系统(待定)经估计后才成为已定的系统,
已定的系统才能用以生成模型。
? 模型 —— 由一个或多个已定系统与恒等式构成,
或由几个子模型构成。即经济计量模型是由变
量、参数、随机扰动项和方程四个要素有机结
合而成的随机性代数模型。
? 模型具有运算能力。
? 建立模型时,方程的个数必须等于内生变量的
个数。
62
第二节 方程的形式
? 方程的形式指的是是反映经济变量之间
数量关系的函数形式。
? 最简单而又容易估计和解释的是线性方
程。
? 一、何谓线性方程
? 二、可以线性化的方程
63
一、何谓线性方程
? 这里的线性方程指的是方程中系数是线性的。系数是
非线性的称为非线性方程。
? Y=b0+b1X1+b2X2+? +bkXk+e
? 是线性方程。
? Y=b0+b1X+(b2)1/2X2+b3X3+? +bkXk+e
? 是非线性方程。
? Y=b0+b1X+b2X2+? +bkXk+e
? 变量是非线性的,但它仍然是线性方程。因为,令
X=X1,X2=X2,?,Xk=Xk,就化成线性方程:
? Y=b0+b1X1+b2X2+? +bkXk+e
64
二、可以线性化的方程
? 复杂的社会经济现象并不总能用线性方
程来描述。有时,需要采用指数函数、
对数函数、双曲函数等的形式来描述。
? 下面讨论可线性化的非线性方程形式:
? 1.线性方程
? 2.双对数方程
? 3.半对数方程
? 4.逻辑方程
65
1.线性方程
? 一次方程,Y=a+bX
? 二次方程,Y=a+bX+cX2
? 双曲函数,Y=a+b/X
? 二次函数和双曲函数仍然是线性方程。
66
总成本函数与平均成本函数
? Y(TC)=b0+b1X+b2X2+b3X3+u
? AC=Y/X= b0/X+b1+b2X+b3X2
? 其中 Y( TC)为总成本,X为产量,AC为平
均成本。
Y/X
X
AC
选择成本达到
最低的生产规
模具有意义。
67
2.双对数方程
? lnY=lna+blnX
? 双对数模型可以表述为幂函数
? 双对数模型的弹性 =b。弹性是指一个变
量对另一个变量微小的百分比变动所作
出的反应。
b
a
ab
ab
a
x
dx
dY
Y
x
aY
x
xx
x
x
b
b
b
b
b
?????
?
? 1
68
3.半对数方程
? lnY=a+bx
? Y=lna+blnX
Y Y
X X
69
4.逻辑方程
bxa
y
c
y
c
y
c
c
y
e
e
e
bxa
bxa
bxa
??
?
?
?
?
?
?
?
?
?
???
???
?
?
?
?
?
?
1ln
1
1
1
X
Y
C
70
对双曲函数的线性化
b
x
a
y
b
x
a
y
bxa
x
y
??
?
?
?
?
?
??
???
?
?
11
1
71
第三节 相关系数
? 协方差和相关系数都是描述两个随机变量相互
关联程度的参数或统计量。
? 顾名思义,方差是度量一个随机变量变异程度
的指标,而协方差,顾名思义则是度量两个随
机变量协同变动的指标。要度量两个随机变量
之间 的关系,自然要考察两个变量同时变化 —
— 协同变化的情况,于是需要定义协方差。为
了弥补协方差的不足 —— 受计量单位和数量尺
度的影响,进而定义了度量两个随机变量呈线
性相关程度的指标 —— 相关系数。
72
一、协方差
? 1.协方差的定义
? 2.协方差的计算
? 3.协方差的缺陷
73
1.协方差的定义
? 离均差度量变量的变动 Y-@MEAN(Y),两个离均
差的乘积 (Y-@MEAN(Y))( X-@MEAN(X))度量同
时变动
? 离均差乘积和 ?(Y-@MEAN(Y))( X-@MEAN(X))度
量总的协同变异,为了可比性 —— 消除容量大
小的影响 —— 再除以容量,定义为协方差。
? 协方差用以度量两个随机变量究竟同时为正又
同时为负的程度大些,亦或是一个为正另一个
为负的程度大些,亦或不发生同时变动。
74
协方差的定义式
? ? ? ?? ?? ?
? ?? ?
? ?? ?
n
yx
yx
n
yx
yxEyx
yx
p
yxp
yx
i
i
ij
i
i
ij
i
i
?
?
??
?
?
???
???
),c o v (
,
1
,c o v
那么,一般说来,人们认为
75
2.协方差的计算
76
EViews的输出结果
77
YY X Y X
YY 1.61E+08 10000 Y 16088.89 100
X 10000 0.666667 X 100 0.666667
YY X Y X
100 1 10000 1
320 2 32000 2
400 3 40000 3
YY ó? X oí Y ó? X D- ·? 2? ?? ?ó
教科书 P65示例
78
3.协方差的缺陷
? ( 1)协方差是一个有单位的指标。例如,Y为身高
(厘米),X为体重(千克),那么它们的协方差
COV( Y,X)的单位为厘米,千克。所以不便于用作
相互比较。
? ( 2)协方差受数据尺度的影响。例如,Y为身高(毫
米),X为体重(克),那么它们的协方差 COV( Y,
X)的单位为毫米,克。同一组数据计算出来的协方差,
( 2)比( 1)大了 10倍。因此,也不便于用作相互比
较。
? 于是,需要引入一个度量两个随机变量之间线性关系
的指标 —— 相关系数,以克服单位与尺度的影响。
79
二、相关系数
? 1.相关系数的定义
? 2.相关系数的计算
? 3.根据相关系数初步判定变量之间的关
系
? 4.简单相关系数的缺陷
80
1.相关系数的定义
? ? ? ?
? ? ?
?
?
?
?
?
???
???
?
?? ?
?? ?
yyyys
xxxxs
ss
n
n
i
n
n
n
i
n
yx
i
yy
ixx
yyxx
yx
222
22
2
,
11
11
),c o v (
?
81
2.相关系数的计算
82
3.根据相关系数初步判定变
量之间的关系
( 1)根据相关系数的符号,判定正相关
(正比例)、负相关(反比例)
( 2)根据相关系数的大小,判定:
1,0.3原则 与 0.7原则
( 0.3的平方 =0.1,0.7的平方 =0.5)
2,0.4~0.7低度相关
3,0.8以上高度相关
注意,相关系数存在假象。
83
正相关(我国人均消费函数)
Y为我国人均消费
X为我国人均国民收入
相关系数,0.982 0 0
4 0 0
6 0 0
8 0 0
1 0 0 0
1 2 0 0
0 5 0 0 1 0 0 0 1 5 0 0 2 0 0 0 2 5 0 0
Y
X
84
负相关(教科书 P82)
Y与 X的相关系数:
-0.92
20
30
40
50
60
70
80
0 10 20 30 40
Y
X
85
不相关(不排除存在曲线相关)
? 相关系数为:
? 4.24E-18
-60
-40
-20
0
20
40
60
-60 -40 -20 0 20 40 60
Y
X
86
4.简单相关系数的缺陷
? ( 1)裹胁了其它变量的影响
? ( 2)只能度量两个变量之间呈线性相
关 —— 比例变化的关系
? ( 3)复相关系数
87
( 1)裹胁了其它变量的影响
? 大千世界中复杂的、多种因素存在相互关联。
为了描述其间的关联,这里定义的相关系数虽
然比协方差指标优越,但是仍然存在不足之处:
它裹胁了其它变量的影响或者它们之间的关系
乃是其它变量的变化所致,再或者其间存在非
线性的相关关系。
? 要剔除其它变量的影响,只研究指定两个变量
的影响,必须再定义偏相关系数 —— 令其它变
量保持不变,此时这两个变量的相关系数,称
为偏相关系数。
88
( 2)只能度量两个变量之间
呈线性(比例)相关的关系
? 对变量之间存在的曲线相关关系无能为
力。所以称为简单相关系数。
? 可以采用灰色系统理论中的关联度来度
量非线性相关关系的程度。
89
( 3)复相关系数
? 度量不止两个,更多个变量之间的线性
相关关系,简单相关系数也无能为力,
需要定义复相关系数。
? 例如,在 Y=f(x1,?,xn)+e中,度量 Y与
x1,?,xn之间的线性相关系数,就是复
相关系数。复相关系数乃是多员回归方
程中判定系数(决定系数)的平方根。
90
Cov(x,y)或 ?( x,y )系统的方程 变量
第四节 复习与提高
数据
截面数据
时间序列数据
平行数据
基础的基础
内生变量
外生变量
数据
截面数据
时间序列数据
平行数据
模型的建立 方程
单方程
多方程
联立方程
线性方程
对数方程
半对数方程
逻辑斯蒂方程
第二章 数据与模型
2
问题的提出
? 在经济问题研究中,数字往往是证明观
点的证据,基于事实的证据是我们透过
大千世界的外表而探求其运行本质的基
础。
? 数据是基础,建立在数据之上的是变量,
变量之间的关系构成方程,随机方程构
成系统,系统加上恒等式构成模型。模
型是对现实社会经济系统的抽象和简化。
3
解决问题的思路
? 了解模型的构成及其种类
? 模型函数形式的选择 —— 线性与非线性
? 变量关系的度量 —— 协方差与相关系数
4
第一节 数据、变量和模型
? 一、数据及其类型
? 二、变量及其类型
? 三、参数
? 四、随机扰动项
? 五、方程及其种类
? 六、模型
5
一、数据及其类型
1.何谓数据
2.数据的意义
3.数据的类型
( 1)按数据的性质划分
( 2)按数据与时间的关系
1*名义型数据
2*有序型数据
3*间隔型数据
4*比率型数据
1*.截面数据( Cross-Section Data)
2*.时间序列数据( Time Series Data)
3*.平行数据 ( Panel Data)
6
1.何谓数据
? 数据是客体反映信息之一,这种信息如以量的
标志显现出来,就称其为数据。数据是一定条
件下客体在量的方面的综合表现。在开始一项
研究工作时,最基本的工作之一,就是收集数
据。
? 数据按其本义来说是定量的(计数或计量)的。
但在实际应用中,它们可以是定量的,也可以
是定性的,或者是两者的结合。随着人类认识
客体技术的提高与认识层次的深化,数据的外
延还在不断的扩大。
7
2.数据的意义
? 数据是经济计量模型的基础
8
3.数据的类型
? ( 1)按数据的性质划分
? 1*名义型数据
? 2*有序型数据
? 3*间隔型数据
? 4*比率型数据
? ( 2)按数据与时间的关系
? 1.截面数据( Cross-Section Data)
? 2.时间序列数据( Time Series Data)
? 3.平行数据
9
( 1)按数据的性质划分
1*名义型数据
2*有序型数据
3*间隔型数据
4*比率型数据
10
1*名义型数据
? 这是一种纯粹的数学符号,没有量的概念。例如,盈
利的有无,早于文化大革命、等于文化大革命和晚于
文化大革命等。
? 这些有无、是否、上下、早晚之类的概念,可以用,0”
和,1”两个数构成的虚拟变量(或称二态变量)来表
示。
? 若记 XA为男性,XB为女性,则 XA=1,XB=0,这时
XA与 XB之间,有且仅有以下三种关系,XA=XA,
XB=XB,XA ?XB。或简记 X=1为男性,X=0为女性。
? 注意,0”和,1”只起着名义的或符号的作用,其量的
概念已不复存在。
11
2*有序型数据
? 有序就是指有先后次序。例如经济发展就有先后顺序,
从第一产业到第四产业产业的升级就形成了一个序列。
记第二产业为 XB,第四产业为 XD,那么两者的关系
不仅有等与不等的关系,还可以有 XD>XB,XB<XD,
但这里不包含“大多少”、“小多少”的概念。如记
最清洁为 XA、清洁为 XB、不清洁为 XC。三者排成序
列,XA>XB>XC,但是它们三者的间隔并不相等。
因此对这类数据不能简单地作算术四则运算。
? 在实际应用中往往不用具体的数表示有序关系。人们
习惯把它们变成名义数据进行处理。
? 序列中若有个 m状态就要用 m-1个虚拟变量。
12
用虚拟变量表示定性数据
D? ±e D ?à éú μè ?? D1 D2
?D 0 2? ?? ?à 1 0
?? 1 ?? ?à 0 1
×? ?? ?à 1 1
13
3*间隔型数据
? 不仅可以比较两两的大小,而且还可以确定相差的量。
温度是最典型的间隔型数据之一,例如 10?C,20?C
和 30?C。我们不仅可以比较温度的高低,还可以知道
10?C比 20?C低 10?C,30?C比 20?C高 10?C。
? 它具有通常意义下数据的性质,可以作复杂的四则运
算。但是,这类数据仍然包含了某种人为的因素:
? 首先,间隔的确定的任意性,当然,间隔一旦确定就
成为比较数据的标准
? 其次,0点的确定是任意的,而且 0?C并不是没有温度。
14
4*比率型数据
? 这类数据的突出特点是 0点具有明确的含义。
? 例如,重量尽管有不同的计量单位,但 0点的意义很明
确,不会因为不同的计量单位而有不同的含义。
? 而且,任何计量单位都可以通过一个比例常数换算成
另一种相应的单位。
? 这种简单的比例关系在间隔数据中是不存在的。
? 定性数据与定量数据
? 从以上讨论,四种数据按照叙述的顺序,其量的概念,
后者比前者多一些内容。
? 习惯上把前两种称为定性数据,把后两种成为定量数
据。
15
( 2)按数据与时间的关系分
? 1.截面数据( Cross-Section Data)
? 2.时间序列数据( Time Series Data)
? 3.平行数据( Panel Data)
16
1.截面数据
( Cross-Section Data)
? 截面数据又称俗横向数据,研究某个时
点上的变化情况。例如 1990年 7月 1日 0
点,我国三十一个省市的人口数。
? 在西方经济学中称它为存量,在统计经
济学上称它为时点数。
? 截面数据的时间是凝固的。
? 截面数据中大多存在异方差,必须引起
注意。
17
2.时间序列数据
( Time Series Data)
? 时间序列数据又俗称为纵向数据。例如,我国
自改革开放的 1978-1998年 GNP数据。
? 在西方经济学中称它为流量,在统计经济学上
称它为时期数。
? 时间序列的时间是变化的。
? 时间序列数据通常存在季节变动和序列相关 —
— 自相关(误差的协方差不等于 0,即前期误
差与后期误差之间存在相关)。
? 截面数据通常存在异方差(误差方差不是一个
常数)。
18
哪个是存量?哪个是流量?
19
3.平行数据( Panel Data)
? 平行数据是时间序列数据与截面数据的
合成体。
? 例如,1978-1999年我国各省市城镇居
民消费结构的调查资料。
20
二、变量及其类型
? 1.问题的提出
? 2.何谓变量
? 3.变量的种类
? (1)按变量取值划分
? (2)按变量的时间属性划分
? (3)按变量的在方程中的地位划分
21
问题的提出
? 经济计量模型的设定、估计、检验和实
际应用的范围日益宽广。
? 例如,农业生产的需求供给模型就是一
个简单的经济计量模型。
? 那么,经济计量模型是由什么构成的?
? 从农业生产的需求供给模型的示例说起
22
农业生产的需求供给模型
? 由于模型用方程式或方程组代表所研究的某个真实系
统,所以属代数模型。
? 方程式中包含 D,S,P及随机扰动项 u,因此是随机
方程式。方程式由变量、系数和运算符构成,而随机
方程构成系统,系统加上恒等式构成模型。
降雨量。
表示,表示消费者可支配收入供给量和价格,
求量、分别表示某农产品的需和、其中,
RI
PSD
SD
RPS
IPD
ubbb
uaaa
?
?
?
?
?
?
????
????
2210
1210
23
经济计量模型属代数模型
? 经济计量模型是研究分析某个经济系统
中经济变量之间的数量关系所采用的随
机代数模型,是客观经济现象在数学上
的描述和概括。
? 经济计量模型之所以成为重要的数量分
析工具,起作抽象经济理论与实际观测
资料之间的桥梁作用,是与模型的内部
结构及其运算能力的机制有关。
24
任何经济计量模型都由以下 4
个要素构成的
( 1)变量
( 2)参数
( 3)随机扰动项
( 4)方程式
25
何谓变量
? 人们总是从发展和运动的观点来认识世界,从
客体收集到的数量信息,构成数据集。例如
1978-1998年我国的 GNP,又如四川省
1998年各个县市的 NI就是这样的数据集合。
? 变量就是数据集合的名称,通过对变量名的引
用,可以简便地对数据集合进行处理。
? 计量经济学中使用的变量的概念与统计学中指
标的概念一样,包括变量名及其对应的数据。
26
变量的种类
? 按变量取值划分
? 按变量的时间属性划分
? 按变量的在方程中的地位划分
? ( 1)单一方程中
? ( 2)联立方程中 —— 内生变量、外生变量、
前定变量
27
按变量取值划分
? ( 1)离散型
? (包括表示定性数据的虚拟变量 — 只取 0和 1)
? ( 2)连续型
28
按变量的时间属性划分
本期变量
滞后变量
29
滞后变量举例
obs Y Y(-1) Y(-2) Y(-3) Y(-4)
1981 249 NA NA NA NA
1982 267 249 NA NA NA
1983 289 267 249 NA NA
1984 329 289 267 249 NA
1985 406 329 289 267 249
1986 451 406 329 289 267
1987 513 451 406 329 289
1988 643 513 451 406 329
1989 699 643 513 451 406
1990 713 699 643 513 451
1991 803 713 699 643 513
1992 947 803 713 699 643
1993 1148 947 803 713 699
30
按变量的在方程中的地位划分
( 1)单一方程中
( 2)联立方程中
31
( 1)单一方程中
? 被解释变量(因变量、左端变量)
? 解释变量(自变量、右端变量)
32
( 2)联立方程中
? 内生变量
? 外生变量
? 政策变量、目标变量和非政策变量 ——
宏观调控
? 变量分类的相对性
? 静态模型与动态模型
? 简单宏观经济模型举例
? 前定变量
33
内生变量
? 是所研究的经济系统的模型本身确定的
? 是该模型求解的结果,
? 属于因变量;
? 在决策模型中可以使用虚拟变量做内生
变量。
34
小布什当选总统的决策
? ? uxbxbxb
ikk
ayP
y
y
???????
?
?
?
?
?
?
2211
1
0
1
35
外生变量
? 外生变量的数值是在研究的模型之外确
定的,不受模型内部因素的影响;
? 在模型求解之前事先规定的,是“给定
的”或“已知的”值
? 属于自变量
? 计数变量和虚拟变量可以作外生变量
36
外生变量分为
政策变量和非政策变量
政策变量
政策变量是决策者可以控制的变量,如政
府支出、利率、货币供应量等等。
非政策变量
非政策变量是难以控制或不能控制的变量,
例如气候、自然灾害、农业收成、汇率
等等。
37
工具变量与目标变量
? 运用模型时可以把政策变量看作工具变
量,而把内生变量看作目标变量。
? 通过对有关工具变量的调节,以便达到
事先确定的目标变量的水平。例如,通
常用适当的经济增长率,较低的失业率
和通货膨胀率等作为目标变量,事先固
定下来,然后计算调整相应的工具变量,
例如税率、公共支出预算水平等数值。
38
变量分类的相对性
? 某个变量是内生变量还是外生变量,是
目标变量还是工具变量,并不是先验确
定的
? 主要结合分析的目的,取决于它们在模
型中的地位和作用。
? 例如在农产品需求供给模型中,D,S和
P是内生变量,I和 R是外生变量。
39
静态模型与动态模型
上述农产品需求供给模型是一个静态模型,
因为时间因素在模型中不起作用。
在动态模型中时间因素起主要作用,涉及到
一个内生变量取决于另一个内生变量(或本身)
的前期数值。
例如投资方程,
i=c(4)+c(5)*(gnp(-1)-gnp(-2))+c(6)*gnp+c(7)*r(-4)+u
40
简单宏观经济模型
? 由于引进了 Yt-1这一滞后内生变量,表明
投资是 Yt和 Yt-1以及随机扰动项的函数。
是一个动态模型。
滞后变量。
是量。年的政府支出,外生变是是内生变量,
收入,年的消费、投资和国民分别表示、、其中,
yG
yic
Gicy
uybybbi
uyaac
t
t
t
tt
tt
t
t
tt
t
t
t
t
t
t
1
2
,2
1
321
,121
?
?
?
?
?
?
?
?
?
???
????
???
41
前定变量
? 滞后内生变量的数值是前期所决定的,
? 因此,它和外生变量都是在求解本期内
生变量之前已经确定了的变量
? 滞后变量与外生变量合称为前定变量
? 用作解释变量
42
三、参数
? 参数的定义和分类
? 参数在方程中的作用
? 对参数的约束
43
参数的定义和分类
? 反映模型中各类方程式的经济结构特性
的参数,称为结构参数
? 它有显含参数和隐含参数之分。
? 显含参数就是与变量相乘的常系数,例
如上述需求供给模型中的
? 隐含参数如随机扰动项的概率分布。
44
参数在方程中的作用
? 通过参数把各种变量连接在方程之中,
借以说明外生变量或前定变量的变化对
内生变量变化的影响程度。
? 参数值可以利用数理统计学方法根据样
本资料进行估计。
? 参数一经确定。函数关系亦随之确定了
? 就可以按外生变量和前定变量的值预测
内生变量的值。
45
对参数的约束
? 对参数的约束
? 确定参数的大小及其正负号就是对模型
的事前约束。
? 零约束或非零约束
? 模型中排除或包含某个变量,可以看作
是对模型中某个变量的参数施加零约束
或非零约束。
46
四、随机扰动项
? 理论经济学和数理经济学一般假定经济变量之
间存在确定性的规律,从而建立确定性的模型。
? 经济计量模型 与 一般经济理论模型的主要区别
就在于模型中添加随机扰动项或误差项,建立
的是所谓的概率性模型。
? 引入随机扰动项是为了更准确地描述社会经济
系统。
? 随机扰动项是不可观察的,只能通过残差 ——
实际值与拟合值的差 —— 进行估计
47
方程中列入随机扰动项的主要
原因
? ( 1)观测误差
? ( 2)由于忽略了次要因素引起的误差
? ( 3)由于社会经济现象固有的不可重复性,
即使相同条件下进行试验,也不可得出完全相
同的结果,因而出现随机误差,即固有的随机
性特性。
? 这些误差越小,表明内生变量 与 前定变量或外
生变量的相关程度越高,亦即模型较好地描述
各个经济变量 之间 的关系。
48
五、方程及其种类
? 1.方程的定义
? 2.方程的种类
? ( 1)按方程个数的多少和方程间的关系分:
? ( 2)按方程反映的经济关系分:
? 1*行为方程
? 2*技术(工艺)方程
? Cobb-Douglas生产函数是典型的技术方程
? 3*制度(法规)方程
? 4*定义式(恒等式)方程
? 3.方程的特性
49
1.方程的定义
? 经济计量模型由一个或多个方程构成。
? 方程是根据经济理论的判断和分析,参
照实际需要和可能,把变量、参数和随
机扰动项组成的数学表达式。
? 运用方程反映各个经济变量之间以及它
们同外部条件之间的函数关系。
50
2.方程的种类
? ( 1)按方程个数的多少和方程间的关系
分
? ( 2)按方程反映的经济关系分
? 1*行为方程
? 2*技术(工艺)方程
? 3*制度(法规)方程
? 4*定义式(恒等式)方程
51
( 1)按方程个数的多少和方
程间的关系分
? 单个方程,例如研究 1998年 GNP与
消费的关系,考察消费对 GNP的拉动:
? 多个方程,方程之间不存在必然联系。
? 联立方程,方程之间是联立的,必须
同时求解,如前述简单宏观经济模型。
uCG N P iii ba ???
vI n c o m eF o o d
uI n c o m eC l o t h
iii
iii
dc
ba
???
???
52
( 2)按反映的经济关系分
? 1*行为方程
? 2*技术(工艺)方程
? Cobb-Douglas生产函数是典型的技术
(工艺)方程
? 3*制度(法规)方程
? 4*定义式(恒等式)方程
53
1*行为方程
? 描述市场主体(居民、企业、政府等决
策单位)的经济行为,说明这些主体对
外界刺激或影响在自身经济活动中的反
映。
? 例如,消费函数,投资函数和供给函数
等等。
54
2*技术(工艺)方程
? 由科学技术水平确定的可能的物质生产
技术关系的方程式
? 一般说明投入的生产要素与产出成果之
间的工艺技术关系
55
Cobb-Douglas生产函数是典
型的技术(工艺)方程
? 美国经济学家柯布和道格拉斯研究 1900-
1922美国经济,得到的结果:
称为资金密集型。不变,
,规模报酬。反映效益称为技术进步结构,
反映生产和劳力,资本,产量,其中,
或
或
??
??
??
??
??
??
?
??
???
????
?
?
?
1
lnlnlnln
1
A
LKQ
uLKaQ
uAQ
uAQ
LK
LK
LKQ 75.025.001.1?
56
技术性关系
? 生产函数表示在一定的技术水平条件下,
生产要素的某种组合与可能生产的最大
产量之间的关系。
? 若技术水平发生了变化,生产函数亦即
随之发生变化。
? 生产技术关系既有确定性的,也有概率
性的。
? 生产函数也可能是动态性的。
57
动态生产函数
微观模型与宏观模型
? 某企业在不同年份中购买生产资料(资
本存量)具有不同生产率时,生产函数
扩展为:
? 这是一个微观关系方程。
? 如果 Q,K,L是全国的产量、资本存量
和劳力,这时的方程为宏观关系式。
uLkkkAQ tbttttt aaa 121 210 ????
58
3*制度(法规)方程
? 根据法律、制度和政策等制度性规则所
规定的经济变量之间的数量关系方程式。
? 例如:税金 =应税额 X税率
? 其中税率是由政府确定的,所以这种制
度法规方程是确定性方程。
59
4*定义式(恒等式)方程
? 根据经济理论或假设所确定的有关经济
变量之间的定义关系,用方程或恒等式
表示。例如:
? GNP=C+I+G+X-M
? 销售额 =销售量 X单价
? QS=QD
? 这类方程用来描述定义或者均衡条件,
不包括随机扰动项,属确定性方程。
60
3.方程的特性
? ( 1)反映经济结构关系,用以进行结构
分析,如比较静力学、弹性、乘数、加
速数等分析。
? ( 2)具有运算机制,用以进行预测、仿
真和政策评价。
? ( 3)具有概率性,结论具有一定的可靠
性。
61
六、模型
? 系统 —— 由多个相互联系的随机方程组成。设
定系统(待定)经估计后才成为已定的系统,
已定的系统才能用以生成模型。
? 模型 —— 由一个或多个已定系统与恒等式构成,
或由几个子模型构成。即经济计量模型是由变
量、参数、随机扰动项和方程四个要素有机结
合而成的随机性代数模型。
? 模型具有运算能力。
? 建立模型时,方程的个数必须等于内生变量的
个数。
62
第二节 方程的形式
? 方程的形式指的是是反映经济变量之间
数量关系的函数形式。
? 最简单而又容易估计和解释的是线性方
程。
? 一、何谓线性方程
? 二、可以线性化的方程
63
一、何谓线性方程
? 这里的线性方程指的是方程中系数是线性的。系数是
非线性的称为非线性方程。
? Y=b0+b1X1+b2X2+? +bkXk+e
? 是线性方程。
? Y=b0+b1X+(b2)1/2X2+b3X3+? +bkXk+e
? 是非线性方程。
? Y=b0+b1X+b2X2+? +bkXk+e
? 变量是非线性的,但它仍然是线性方程。因为,令
X=X1,X2=X2,?,Xk=Xk,就化成线性方程:
? Y=b0+b1X1+b2X2+? +bkXk+e
64
二、可以线性化的方程
? 复杂的社会经济现象并不总能用线性方
程来描述。有时,需要采用指数函数、
对数函数、双曲函数等的形式来描述。
? 下面讨论可线性化的非线性方程形式:
? 1.线性方程
? 2.双对数方程
? 3.半对数方程
? 4.逻辑方程
65
1.线性方程
? 一次方程,Y=a+bX
? 二次方程,Y=a+bX+cX2
? 双曲函数,Y=a+b/X
? 二次函数和双曲函数仍然是线性方程。
66
总成本函数与平均成本函数
? Y(TC)=b0+b1X+b2X2+b3X3+u
? AC=Y/X= b0/X+b1+b2X+b3X2
? 其中 Y( TC)为总成本,X为产量,AC为平
均成本。
Y/X
X
AC
选择成本达到
最低的生产规
模具有意义。
67
2.双对数方程
? lnY=lna+blnX
? 双对数模型可以表述为幂函数
? 双对数模型的弹性 =b。弹性是指一个变
量对另一个变量微小的百分比变动所作
出的反应。
b
a
ab
ab
a
x
dx
dY
Y
x
aY
x
xx
x
x
b
b
b
b
b
?????
?
? 1
68
3.半对数方程
? lnY=a+bx
? Y=lna+blnX
Y Y
X X
69
4.逻辑方程
bxa
y
c
y
c
y
c
c
y
e
e
e
bxa
bxa
bxa
??
?
?
?
?
?
?
?
?
?
???
???
?
?
?
?
?
?
1ln
1
1
1
X
Y
C
70
对双曲函数的线性化
b
x
a
y
b
x
a
y
bxa
x
y
??
?
?
?
?
?
??
???
?
?
11
1
71
第三节 相关系数
? 协方差和相关系数都是描述两个随机变量相互
关联程度的参数或统计量。
? 顾名思义,方差是度量一个随机变量变异程度
的指标,而协方差,顾名思义则是度量两个随
机变量协同变动的指标。要度量两个随机变量
之间 的关系,自然要考察两个变量同时变化 —
— 协同变化的情况,于是需要定义协方差。为
了弥补协方差的不足 —— 受计量单位和数量尺
度的影响,进而定义了度量两个随机变量呈线
性相关程度的指标 —— 相关系数。
72
一、协方差
? 1.协方差的定义
? 2.协方差的计算
? 3.协方差的缺陷
73
1.协方差的定义
? 离均差度量变量的变动 Y-@MEAN(Y),两个离均
差的乘积 (Y-@MEAN(Y))( X-@MEAN(X))度量同
时变动
? 离均差乘积和 ?(Y-@MEAN(Y))( X-@MEAN(X))度
量总的协同变异,为了可比性 —— 消除容量大
小的影响 —— 再除以容量,定义为协方差。
? 协方差用以度量两个随机变量究竟同时为正又
同时为负的程度大些,亦或是一个为正另一个
为负的程度大些,亦或不发生同时变动。
74
协方差的定义式
? ? ? ?? ?? ?
? ?? ?
? ?? ?
n
yx
yx
n
yx
yxEyx
yx
p
yxp
yx
i
i
ij
i
i
ij
i
i
?
?
??
?
?
???
???
),c o v (
,
1
,c o v
那么,一般说来,人们认为
75
2.协方差的计算
76
EViews的输出结果
77
YY X Y X
YY 1.61E+08 10000 Y 16088.89 100
X 10000 0.666667 X 100 0.666667
YY X Y X
100 1 10000 1
320 2 32000 2
400 3 40000 3
YY ó? X oí Y ó? X D- ·? 2? ?? ?ó
教科书 P65示例
78
3.协方差的缺陷
? ( 1)协方差是一个有单位的指标。例如,Y为身高
(厘米),X为体重(千克),那么它们的协方差
COV( Y,X)的单位为厘米,千克。所以不便于用作
相互比较。
? ( 2)协方差受数据尺度的影响。例如,Y为身高(毫
米),X为体重(克),那么它们的协方差 COV( Y,
X)的单位为毫米,克。同一组数据计算出来的协方差,
( 2)比( 1)大了 10倍。因此,也不便于用作相互比
较。
? 于是,需要引入一个度量两个随机变量之间线性关系
的指标 —— 相关系数,以克服单位与尺度的影响。
79
二、相关系数
? 1.相关系数的定义
? 2.相关系数的计算
? 3.根据相关系数初步判定变量之间的关
系
? 4.简单相关系数的缺陷
80
1.相关系数的定义
? ? ? ?
? ? ?
?
?
?
?
?
???
???
?
?? ?
?? ?
yyyys
xxxxs
ss
n
n
i
n
n
n
i
n
yx
i
yy
ixx
yyxx
yx
222
22
2
,
11
11
),c o v (
?
81
2.相关系数的计算
82
3.根据相关系数初步判定变
量之间的关系
( 1)根据相关系数的符号,判定正相关
(正比例)、负相关(反比例)
( 2)根据相关系数的大小,判定:
1,0.3原则 与 0.7原则
( 0.3的平方 =0.1,0.7的平方 =0.5)
2,0.4~0.7低度相关
3,0.8以上高度相关
注意,相关系数存在假象。
83
正相关(我国人均消费函数)
Y为我国人均消费
X为我国人均国民收入
相关系数,0.982 0 0
4 0 0
6 0 0
8 0 0
1 0 0 0
1 2 0 0
0 5 0 0 1 0 0 0 1 5 0 0 2 0 0 0 2 5 0 0
Y
X
84
负相关(教科书 P82)
Y与 X的相关系数:
-0.92
20
30
40
50
60
70
80
0 10 20 30 40
Y
X
85
不相关(不排除存在曲线相关)
? 相关系数为:
? 4.24E-18
-60
-40
-20
0
20
40
60
-60 -40 -20 0 20 40 60
Y
X
86
4.简单相关系数的缺陷
? ( 1)裹胁了其它变量的影响
? ( 2)只能度量两个变量之间呈线性相
关 —— 比例变化的关系
? ( 3)复相关系数
87
( 1)裹胁了其它变量的影响
? 大千世界中复杂的、多种因素存在相互关联。
为了描述其间的关联,这里定义的相关系数虽
然比协方差指标优越,但是仍然存在不足之处:
它裹胁了其它变量的影响或者它们之间的关系
乃是其它变量的变化所致,再或者其间存在非
线性的相关关系。
? 要剔除其它变量的影响,只研究指定两个变量
的影响,必须再定义偏相关系数 —— 令其它变
量保持不变,此时这两个变量的相关系数,称
为偏相关系数。
88
( 2)只能度量两个变量之间
呈线性(比例)相关的关系
? 对变量之间存在的曲线相关关系无能为
力。所以称为简单相关系数。
? 可以采用灰色系统理论中的关联度来度
量非线性相关关系的程度。
89
( 3)复相关系数
? 度量不止两个,更多个变量之间的线性
相关关系,简单相关系数也无能为力,
需要定义复相关系数。
? 例如,在 Y=f(x1,?,xn)+e中,度量 Y与
x1,?,xn之间的线性相关系数,就是复
相关系数。复相关系数乃是多员回归方
程中判定系数(决定系数)的平方根。
90
Cov(x,y)或 ?( x,y )系统的方程 变量
第四节 复习与提高
数据
截面数据
时间序列数据
平行数据
基础的基础
内生变量
外生变量
数据
截面数据
时间序列数据
平行数据
模型的建立 方程
单方程
多方程
联立方程
线性方程
对数方程
半对数方程
逻辑斯蒂方程