计量经济学
第二章
单方程计量经济学模型理
论与方法
计量经济学
§ 2.1线性回归模型概述
计量经济学
一、线性回归模型的特征
? 消费量由什么决定呢?
? 在现实生活中,影响各家各户消费的因素很多,如
收入水平、商品价格水平、利率水平、消费者偏好、
消费者年龄结构、风俗习惯等。凯恩斯认为,这些
因素中有决定意义的是家庭收入。
? 凯恩斯认为,存在一条基本心理规律:随着收入的
增加,消费也会增加,但消费的增加不及收入的增
加多。
计量经济学
? 由凯恩斯的绝对收入假设消费理论,认为消费是
由收入唯一决定的,是收入的线性函数,随着收
入的增加,消费增加,但消费的增长低于收入的
增长,即边际消费倾向递减。它的数学描述为:
0 1,
cy
c c c
y y y
????
??
? ? ?
??
其中,c 为消费额,
y
为收入。
计量经济学
消费和收入的关系并不是精确实现的,一般由下列
因素决定,
( 1 ) 消费除了受到收入的影响外,还受到其他一些因
素的影响,诸如消费者所外群体的平均收入水
平、消费习惯、对未来收入的期望等;
( 2 ) 线性关系的近似性,即所假定的线性关系并不是
严格的;
( 3 ) 收入数值的近似性,即所给定的收入数据本身并
不绝对准确地反映收入水平。
计量经济学
用更符合实际的是将消费与收入之间的关系用如下方程描述,
cy ? ? ?? ? ?
其中:
?
是一个随机误差项。根据该方程,每给定一个收入的
值,消费并不是单一确定的,而是有许多值,它们的概率分布
与随机误差项
?
的概率分布相同。此时它是一个计量经济学方
程。
引入随机误差项,将变量之间的关系用一个线性随机方程来描
述,用随机数学的方法来估计方程中的参数,这就是线性回归
的模型特征,也是线性计量经济学模型的特征。
计量经济学
在许多实际问题中,和 被解释 变量 y 有关系的变量往
往不至一个,而是多个。所以,要研究 被解释 变量 y 与 解
释 变量
1,,kxx
之间的相关关系,这便是多元线性回归问
题。为了研究 y 与
1,,kxx
之间的关系,首先必须收集 n 组
独立观测数据,
1(,,,) (,)?i k i i i ix x y x y?
,ni,,2,1 ??
计量经济学
单方程线性回归模型的一般形式为,
0 1 1 1,2,,i i i k i iy x x i n? ? ? ?? ? ? ? ? ?
其中
01,,k? ? ?
是 1k ? 个未知参数,
12,,,kx x x
是 解释 变
量,其值是可精确测定或被控制,y 是可观测的 被解释 变量,
?
是不可测的随机误差。
计量经济学
客观经济现象是十分复杂的,是很难用有限个变量、某一种
确定的形式来描述的,这就是设置随机误差项的原因。随机
误差项主要包括下列因素的影响,
? 在解释变量中被忽略的因素的影响;
? 变量观测值的观测误差的影响;
? 模型关系的设定误差的影响;
? 其他随机因素的影响;
计量经济学
二、线性回归模型的普遍性
? 从经济学课程中我们知道,在实际经济活动中,经
济变量的关系是复杂的,直接表现为线性关系的情
况很少。但它们中的大部分又可以通过一些简单的
数学处理,使之化为数学上的线性关系。
计量经济学
? 商品的需求曲线是一种双曲线形式
商品需求量
q
与商品价格
p
之间的关系表现为非线性关系;
11
ab
qp
??
? 著名的拉弗曲线描述的税收
s
与税率 r 的关系是一种抛物线形式
2 ( 0)s a br c r c? ? ? ?
? 生产成本
C
与产量 q 的关系有时呈指数关系,
qC a b?
计量经济学
? 著名的 CD 生产函数将产出量
Q
与投入要素(
LK,
)之间的关
系描述为幂函数的形式,
Q A K L???
? 著名的 CES 生产函数将产出量
Q
与投入要素( LK,)之间的
关系描述为如下的形式,
1
1 2 1 2( ) ( 1 )Q A K L
?? ?? ? ? ?
?
??? ? ? ?
计量经济学
一般线性假设:
0 1 1i i i k i iy x x? ? ? ?? ? ? ? ?
Semi - log,
0 1 1l o g ( )i i i k i iy x x? ? ? ?? ? ? ? ?
在计量经济研究中,线性的假设常用的有二类:
计量经济学
三、线性回归模型的基本假设
( 1 ) 解释变量
12,,,kx x x
是确定变量,不是随机变量;
而且解释变量之间互不相关。
( 2 ) 随机误差且有 0 均值和同方差,
( 3 ) 随机误差项在不同样本点之间是独立的,不存在序
列相关。
( 4 ) 随机误差项服从均值为 0,方差为
2
??
的正态分布。
计量经济学
更一般的假设:
在计量经济学中,解释变量
12,,,kx x x
在 一般情形
下是随机的,所以在通常更一般的假设是,
( 1 ) 随机误差且有 0 均值,
( ) 0iE ? ?;
( 2 ) 随机解释变量与随机误差之间是不相关的,
( ) 0iiEx ? ?;
( 3 ) 随机误差且有同方差,
22()
iE ?? ? ? ?;
计量经济学
( 4 ) 随机解释变量方差有限,
2
1
( ) ( ),1,2,
k
i i ji
j
E x x E x i n
?
? ? ? ? ??;
( 5 ) 随机解释变量协方差矩阵为半正定的,
1 1 1 2 1
2 1 2 2 2
12
( ) 0,1,2,
i i i i i k i
i i i i i k i
ii
k i i k i i k i k i
E x x E x x E x x
E x x E x x E x x
Q E x x i n
E x x E x x E x x
??
??
?
? ? ? ?
??
??
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
计量经济学
§ 2.2一元线性回归模型的
参数估计
计量经济学
综 合 上 面 的 所 述, 对 我 们 所 获 得 的 观 测 数 据
? ? niyx ii ?,2,1,? 来说,我们可得到如下的一元线性数学模型,
?
?
?
?
?
??
??
????
ji
DE
nixy
ji
ii
iii
,0),c o v (
,,0
2.1
2
10
??
???
???
?
?
参数估计的二个任务是:
( 1)求出反映变量之间数量关系的结构参数的估计量。
( 2)求出随机误差的分布参数。
计量经济学
一、普通最小二乘估计( OLS)
可以有许多方法获得模型中参数的估计值。这里讨论最常用的最
小二乘法,即根据使随机误差的平方和达到最小来取得参数的估计
值。
若记,
? ? ? ???
??
????
n
i
ii
n
i
i xyQ
1
2
10
1
2
10,?????
则
10
?,? ??
作为未知参数
10,??
的点估计,应满足,
? ?
01
0 1 0 1
,
,m i n (,)Q
??
? ? ? ??
计量经济学
),( 10 ??Q
是
10,??
的非负函数,且关于
10,??
可导微,
由微积分原理中关于极值存在的必要条件有
0
),(
1100
?,?
0
10
?
?
?
?? ?????
??Q
0
),(
1100
?,?
1
10 ?
?
?
?? ?????
??Q
由此可得正规方程组
?
?
?
?
?
?
?
???
???
?
?
?
?
n
i
iii
n
i
ii
xxy
xy
1
10
1
10
0)
??
(
0)
??
(
??
??
计量经济学
经简化求得
?
?
? 2
1
?
i
ii
x
yx
?
??
?
,
xy 10 ?? ?? ??
其中,
?
?
?
n
i
i
x
n
x
1
1
?
?
?
n
i
i
y
n
y
1
1
yyyxxx iiii ???? ??,
0
??
和
1
??
分别称
10,??
的最小二乘估计,简记为 OLS 。
计量经济学
最小二乘估计法求得
o?
?
及
1
??
后,
? ?iii yye ???
参数 σ
2
无偏估计 为:
2
?
2
22
?
??
?
n
e
s
i
?
计量经济学
SAS上机指导 1
? 对上述的参数估计可用 SAS软件中的 REG过程进行运算,一
般可采用下列语句:
? proc reg data=example.ex11;①
? model y=x; ②
? run; ③
? 这三个语句是最基本的语句,其意义如下:
? 调用 REG过程,并应用于数据集 example.ex11,其中 example
是库标名,ex11为数据集的文件名;
? 给出模型的形式;
? 提交 SAS执行。
计量经济学
? Model,MODEL1
? Dependent Variable,Y
? Analysis of Variance⑥
? Sum of Mean
? Source DF Squares Square F Value Prob>F
? Model 1 255.41159 255.41159 74.333 0.0001
? Error 8 27.48841 3.43605
? C Total 9 282.90000
? Root MSE 1.85366 R-square 0.9028
? Dep Mean 44.90000 Adj R-sq 0.8907
? C.V,4.12842
? Parameter Estimates
? Parameter Standard T for H0:
? Variable DF Estimate Error Parameter=0 Prob > |T|
? INTERCEP 1 35.450605④ 1.24291488⑦ 28.522 0.0001
? X 1 92.641129⑤ 10.74517100⑧ 8.622 0.0001
计量经济学
? ④⑤ 分别为所求的最小二乘估计;
? ⑥方差分析表;
? ⑦⑧分别标准误。
计量经济学
二、极大似然估计法( ML)
? ? ? ? 21 2 0 11 2
1 2
11 ?,,e x p
2( 2 )
n
k i i
i
p y y y y x
?
?
??
????
??
? ? ? ???
??
?
计量经济学
? 利用极大似然估计所得到的回归系数的估计与
最小二乘估计一致。
? 但对于误差方差的估计与最小二乘估计不一致。
参数 σ
2
的极大似然 估计为,
n
e i
L
?
?
2
2??
其中:
? ?iii yye ???
计量经济学
三、参数估计量的性质
? 线性性
? 无偏性
? 有效性(最小方差性)
? 方差估计量的无偏性问题
计量经济学
性质 1
1
??
? ? ?
2
21,
i
x
??
?
? ??? ?
性质 2
2
2
00 2
1
? ~ (,( ) )
i
x
N
nx
? ? ??
?
性质 3
2
01 2
? ?c ov (,)
i
x
x
? ? ???
?
?
计量经济学
方差的有效性是指在所有的线性无偏估计中,最小二
乘法所得到的估计是方差最小的,若另有一个线性无偏估
计,其方差与最小二乘估计的方差相等,则一定与最小二
乘估计相等。
关于方差的有效性和随机误差方差估计的无偏性我们
在下一节将继续讨论。
计量经济学
四、估计实例
? 我国国家财政中用于文教
卫生事业费的支出,主要
由国家财政收入决定,二
者之间具有线性关系,其
中 ED为国家文教卫生事业
费支出额(亿元),FI为
国家财政收入(亿元)。
年份 ED FI
1991 708 3149
1992 793 3483
1993 958 4349
1994 1278 5218
1995 1467 6242
1996 1704 7408
1997 1904 8651
计量经济学
§ 2.3多元线性回归模型的
参数估计
计量经济学
单方程线性回归模型的一般形式为,
0 1 1 1,2,,i i k k i iy x x i n? ? ? ?? ? ? ? ? ?
其中
01,,k? ? ?
是
1k ?
个未知参数,
12,,,kx x x
是 解释 变
量,其值是可精确测定或被控制,y 是可 观 测的 被解 释 变
量,
?
是不可测的随机误差。
用矩阵的表达式,
Y X B N??
计量经济学
Y =
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
y
y
y
.
.
.
2
1
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
k
?
?
?
.
.
.
1
0
??????? X=
11 1
12 2
1
1,,,
1,,,
.,,,,,
.,,,,,
.,,,,,
1,,,
k
k
n k n
xx
xx
xx
??
??
??
??
??
??
??
??
??
N ?
1
2
.
.
.
n
?
?
?
??
??
??
??
??
??
??
??
??
??
计量经济学
一、普通最小二乘估计( OLS)
2
0 1 0 0 1 1
1
(,,) (,....,)
n
k i k k i
i
Q y x x? ? ? ? ? ?
?
? ? ? ? ??
则名
i?
的
LS
估计
i?
?
0,1,ik?
,满足
0
? ?(,,,,,, )
kQ ??
=
0
0
,,
m i n (,,)
k
kQ
??
??
根据微积分原理,
? ?
......
00
0
? ?
......
00
|0
|0
k
kk
k
j
Q
Q
? ? ? ?
? ? ? ?
?
?
??
??
??
?
?
?
?
?
?
?
?
? ?
?
1,2,jk?
计量经济学
整理可得正规方程组,
0 1 1
1 0 1 1
2
0
? ? ?
( ),,,,,, ( )
? ?
( ),,,,,, ( )
.............
? ?
( ),,,,,, ( )
i k i k i
i i k i k i i
k i k i k k i i
n x x y
x x x x y
x x x y
? ? ?
??
??
?
? ? ? ?
?
? ? ??
?
?
?
? ? ?
?
? ? ?
? ? ?
? ? ?
用 (2.1.3) 矩阵形式表示上述方程组,
?()X X B X Y?? ?
,
当
1)( ??XX
存在时,B 的最小二乘估计为,
1? ()B X X X Y????
计量经济学
记,BXYe ???
1
? 22
??
???
kn
ees
??
是 2? 的无偏估计。
计量经济学
三、参数估计量的性质
? 线性性
? 无偏性
? 有效性(最小方差性)
? 方差估计量的无偏性问题
计量经济学
无偏性
性质一, ?BB? 的线性无偏估计,?
且 ??
21? ()D B X X
??
???
?? 。 ?
计量经济学
有效性
性质二, (高斯 - 马尔可夫定理)
在假设 E Y X B?,
2
nD Y I???
下,B 的任一
线性函数
B? ?
的最小方差线性无偏估计为 ?
B? ?
,其
中
?
是任一不为零的
1k ?
维向量,?B 是 B 最小二乘
估计。
计量经济学
方差估计量的无偏性问题
性质三, 2)1(' ???? kneEe
计量经济学
四、样本容量问题
收集与整理数据是一件困难的工作,所以选择合适
的样本容量,既能满足建模的需要,又能减轻收集数据
的困难,是一个重要的实际问题。
( 1 ) 最小样本容量 1nk??,
( 2 ) 满足基本要求的样本容量 30n ? 或者至少 31n ??(k ) 。
计量经济学
五、应用实例
? 建立中国消费模型。根据消费模型的一般形式,
选择消费总额为解释变量,国内生产总值和前
一年的消费总额为解释变量,变量之间关系为
简单的线性关系,选取 1981年至 1996年统计
数据为样本观测值。数据如下所示:
计量经济学
年份 消费总额 国内生产总值 前一年消费额
1981 3309 4901 2976
1982 3638 5489 3309
1983 4021 6076 3638
……, ……, ……, ……,
……, ……, ……, ……,
1994 1781 3923 1331
1995 2311 4854 1781
1996 2677 5634 2311
以 y 代表消费总额,
1x
代表国内生产总值,
2x
代表 前一年
消费总额,用 S A S 软件分析得到 结果 。
计量经济学
§ 2.4多元线性回归模型的
统计检验
计量经济学
平方和的分解
2 2 2
1 1 1
? ?( ) ( ) ( )
n n n
i i i i
i i i
TSS y y y y y y R S S E S S
? ? ?
? ? ? ? ? ? ? ?? ? ?
? T SS 称为总的平方和,反映了样本观测值总体离差的大小 ;
? ES S 称回归平方和,反映由模型中解释变量所解释的那部分离差的
大小;
? R SS 称为残差平方和,反映样本观测值与估计值偏离的大小 。
计量经济学
一、拟合优度检验
? 拟合优度检验,是检验模型对样本观测值的拟合程
度。
? r^2和 R^2统计量
2 111 (,)
11
r
rt
t
SR S R S S S T S S
S n k n? ? ? ?? ? ?
2 1E S S R S Sr
TS S TS S? ? ?
( r称为决定系数,或复相关系数)
( R称为调整的复相关系数)
计量经济学
? 决定系数要达到多大才算模型通过了检验,
没有绝对的标准,要看具体情况而定。模型
的拟合优度不是判断模型质量的唯一标准,
有时甚至为了追求模型的经济意义,可以牺
牲一点拟合优度。
计量经济学
二、方程显著性检验
? 方程的显著性检验,旨在对模型中解释变量与
被解释变量之间的线性关系在总体上是否显著
成立作出推断。
? 用于显著性检验的方法主要有三种,F检验,t
检验,r检验。
计量经济学
可以证明:
2
2
~ ( 1 )
R S S
nk?
?
??
。当
0H
为真时,多元线性模型可改写为:
0
2
., ~ ( 0,)
ii
i
y
i i d N
??
??
???
?
?
即
),(~ 20 ??Ny i
为
dii,.
的正态随机变量,所以,由
数理统计中的知识可知,
2
2
~ ( 1 )
T S S
n?
?
?
,所以,当
0H
为真时,
2
2
~ ( )
E SS
k?
?
,
并且
SSR
与
SSE
独立。由上述讨论构造检验统计量,
1
E S S k
F
R S S n k
?
??
当
0H
为真时,
)1,(~ ?? knkFF
。
计量经济学
在实际问题中,随机变量
y
与一般变量
12,,,kx x x
之间究竟是否存在
线性相关关系呢?如果
Ey
不随
12,,,kx x x
的变化而变化,则应有:
1 0k?? ? ? ?
。否则
Ey
应随
12,,,kx x x
的变化而作变化,所以有必要
对回归方程作显著性检验。即,
:oH 1 0k?? ? ? ?
当我们拒绝假设
0H
时,则至少存在一个
0?i?
,即至少存在一个
ix
与
y
之间存在着线性相关关系。
计量经济学
可以证明,当
0H
为真时,
0?j?
1,2,,jk?
,即
2E S S k ??? 。而对一般情形,2E S S k ??? 。 所以,
我们对给定的显著水平 ? 给出拒绝域如下,
? ?(,1 )W F F k n k?? ? ? ?
计量经济学
方差分析表
? ? 2? ?? yyT S S i
,
? ? 2?? ?? yyE S S i
来源 平方和 自由度 均方和 F 比
回归
E S S
k
SSR
k
残差
R S S
1nk??
1
SSE
nk ??
F=
1
S S R k
S S E n k??
总和
T S S
1?n
1 (,1 )F k n k?? ??
计量经济学
? 拟合优度与方程显著性检验
2 11
1
nR
n k k F
???
? ? ?
计量经济学
三、变量显著性检验
当回归方程的显著性检验得出拒绝
0H
时,我们并不能说明所
有的
ix
均与
y
有线性相关关系,而只仅仅说明至少有一个
ix
与
y
有线性相关关系,而对有此
0?j?
时,说明相应的的变量
jx
与
y
的变化无关,即不会引起
Ey
的线性变化,为了使方程简单明了,
我们应把
jx
从方程中去掉。所以在进行了回归方程的显著性检验
后,还应对每个
j?
( 1,2 )jk?
进行检验。
计量经济学
01,0, 0i i i iHH ??? ? ?
可知:
12? )D B X X
??
???(
,记
? ?1
( 1 ) ( 1 )
( ii
kk
X X c?
? ? ?
? ?)
即
i?
,
?
iD ?
的
方差为
2
( 1 ) ( 1 )iic ????
。 由此可 给出检验
0,0iiH ? ?
统计量为,
( 1 ) ( 1 )
( 1 ) ( 1 )
2
?
?
1
i i i
i
i
ii
c
t
R S S c s
nk
?
?
??
?
?
??
??
??
??
(
,'
1
RSS
s R S S e e
nk
??
??
)
在当
0 iH
为真时,
~ ( 1 )it t n k??
。对给定的显著水平
?
,给出检
验假设的拒绝域为,
? ?/2 ( 1 )iW t t n k?? ? ? ?
计量经济学
? 对于变量的显著性检验没有绝对的显著水平。
? 关键是考察变量在经济关系上是否对解释变量
有影响,显著性检验起到验证的作用;同时还
要看显著性水平不太高的变量在模型及模型应
用中的作用。
计量经济学
几个例子
1,中国消费函数模型
2,粮食生产模型
计量经济学
中国消费函数模型
根据消费模型的一般形式,选择消费总额
为被解释变量,国内生产总值和前一年的消费
总额为解释变量,变量之间关系为简单线性关
系,选取 1981年至 1996年统计数据为样本观
测量。
计量经济学
粮食生产模型
( 1 ) 确定模型的包含的变量
被解释变量 —— 粮食产量
解释变量 —— 农用化肥施用量、粮食种植面积、
成灾面积、农业机械总动力、农业劳力
( 2 ) 确定模型的数学形式和参数范围
0 1 1 2 2l n l n l nY a a X a X ?? ? ? ?
1、选择变量和模型的关系形式
计量经济学
2、样本数据收集
year y x1 x2 x3 x4 x5
1983 38728 1659.8 114047 16209.3 18022 31645.1
1984 40731 1739.8 112884 15264 19497 31685
1985 37911 1775.8 108845 22705.3 20913 30351.5
1986 39151 1930.6 110933 23656 22950 30467
1987 40298 1999.3 111268 20392.7 24836 30870
1988 39408 2141.5 110123 23944.7 26575 31455.7
1989 40755 2357.1 112205 24448.7 28067 32440.5
1990 44624 2590.3 113466 17819.3 28708 33330.4
1991 43529 2805.1 112314 27814 29389 34186.3
1992 44266 2930.2 110560 25894.7 30308 34037
1993 45649 3151.9 110509 23133 31817 33258.2
1994 44510 3317.9 109544 31383 33802 32690.3
1995 46662 3593.7 110060 22267 36118 32334.5
计量经济学
3、参数估计结果及统计检验
? ?23
14
5
2 3 2 3
?l n 3, 7 5 4 0, 6 6 0 l n
0, 0 5 7 l n 0, 3 7 2 l n 0, 1 0 0 l n
Y X X
XX
X
X X X X
? ? ?
? ? ? ?
? ? ?? ? ? ?
??? ? ? ?
2 0, 9 7 1 2, 3 6 2 6 8, 2 2 7R D W F? ? ?,,
计量经济学
? ?
1
2 3 5
23
?l n 2, 4 3 5 0, 6 9 8 l n 0, 1 2 6 l n 0, 2 8 9 l n
X
Y X X X
XX
??
? ? ? ? ? ??
???
2 0, 9 6 7 1, 8 7 3 8 6, 8 7 7R D W F? ? ?,,
? ?
14
23
2 3 2 3
?l n 4, 2 3 7 0, 6 7 3 l n 0, 3 8 6 l n 0, 1 1 0 l n
XX
Y X X
X X X X
? ? ? ?
? ? ? ? ?? ? ? ?
??? ? ? ?
2 0, 9 7 1 2, 3 6 9 1 0 0, 9 6 0R D W F? ? ?,,
? ?
1
23
23
?l n 3, 3 2 3 0, 7 4 0 l n 0, 3 0 6 l n
X
Y X X
XX
??
? ? ? ? ??
???
2 0, 9 6 5 1, 8 5 7 1 3 6, 2 0 0R D W F? ? ?,,
计量经济学
4、预测及分析
? 1996年的数据如下:
? 粮食产量 =50454万吨;
? 农业劳力 =32260.4万人;
? 农业机械总动力 =38546.9万千瓦;
? 农用化肥施用量 =3827.9万公斤;
? 粮食种植面积 =112548千公顷;
? 成灾面积 =21234公顷。
计量经济学
代入最终方程,
? ?
1
23
23
?l n 3, 3 2 3 0, 7 4 0 l n 0, 3 0 6 l n
X
Y X X
XX
??
? ? ? ? ??
???
得出,?
49118Y ?
,所以其偏差为,
? 5 0 4 5 4 4 9 1 1 8 1 3 3 6YY ? ? ? ?
即,?
0,0 2 6
YY
Y
?
?
计量经济学
§ 2.5多元线性回归模型的
置信区间
计量经济学
一、参数估计量的置信区间
( 1 ) ( 1 )
?
~ ( 1 )jj
jj
t n k
cs
??
??
?
??
,即
j?
的置信水平为 ??1 的置信区间为,
/ 2 ( 1 ) ( 1 ) / 2 ( 1 ) ( 1 )? ?( ( 1 ),( 1 ) )j j j j j jt n t c s t n t c s???? ? ? ? ?? ? ? ? ? ?
计量经济学
二、预测值的置信区间
通过回归方程,当给定
0 10 20 0(,,)kx x x x ??
时,可求出
0?y
0 0 0 0
11
? ? ?? )
tt
j j j j j
jj
y x y x x? ? ?
??
? ? ? ? ??? (
0?y
相应可作为
0Ey
或
0y
的点估计,并且是
0Ey
或
0y
的无偏估计。
计量经济学
SAS上机指导 2
? 对上述多元回归分析的参数估计及显著性检验同样可采用 SAS软件中的 REG过程进行运算,
一般可采用下列语句:
? data example.ex21; ①
? input x1 x2 x3 y@@;
? cards;
? 9 4,5 3 90,98 9 4,5 1 84,54
? 9 2,5 3 87,70 9 2,5 1 85,60
? 5 4,5 3 85,40 5 4,5 1 82,63
? 5 2,5 3 85,50 5 2,5 1 83,20
? 9 4,5 3 93,73 9 4,5 1 87,67
? 9 2,5 3 91,46 9 2,5 1 88,50
? 5 4,5 3 86,01 5 4,5 1 83,88
? 5 2,5 3 82,40 5 2,5 1 83,55
? run;
? proc reg data=ex21 outest=example.ex21out1② ;
? model y=x1 x2 x3③ ;
? run;
计量经济学
? 这三个语句是最基本的语句,其意义如下:
? 建立一个以 example为库标名的数据文件,ex21为数据集的文件
名;
? 把模型的参数估计的值存入一个名为 example.ex21out1的数据文
件;可用打印语句输出此数据文件:
? proc print data=ex21out1 noobs;
? run;
? 输出结果如下:
? _MODEL_ _TYPE_ _DEPVAR_ _RMSE_ INTERCEP X1 X2 X3 Y
? MODEL1 PARMS Y 1.88754 73.7275 1.17531 0.43313 1.47562 -1
? 给出模型的形式,以 x1,x2 x3为自变量,以 y为应变量;
计量经济学
经 SAS软件计算,输出结果如下:
Model,MODEL1
Dependent Variable,Y
Analysis of Variance④
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 3 126.24807 42.08269 11.812 0.0007
Error 12 42.75358 3.56280
C Total 15 169.00164
Root MSE 1.88754 R-square 0.7470
Dep Mean 86.42188 Adj R-sq 0.6838
C.V,2.18410
Parameter Estimates⑤
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 73.727500 2.56298823 28.766 0.0001
X1 1 1.175312 0.23594219 4.981 0.0003
X2 1 0.433125 0.47188438 0.918 0.3768
X3 1 1.475625 0.47188438 3.127 0.0087
计量经济学
? 方差分析表,其中 R-square表示复相关系数的
平方;
? 分别为参数的最小二乘估计,共有 5列,其中第
一列为变量名,第二列为参数的最小二乘估计,
第三列为相应参数的最小二乘估计的标准误,
第四列是参数的显著性检验( t检验)的统计量
的值,第五列的尾概率,当小于 0.05时说明此
参数在显著水平 =0.05下是显著。
计量经济学
残差及残差图
计量经济学
普通残差
我们假定
2( ),( )
nE Y XB D Y I???
,此时模型的最小二
乘估计为,
1()B X X X Y????
,由此可得拟合向量,
1? () ?Y XB X X X X Y HY???? ? ?
,
其中
XXXXH ??? ? 1)(
。
记:
YHIYYe )(? ????
,则称
e
残差向量。残差向量是我们
分 析 异 方 差 性, 序 列 相 关 性 的重要工具 。
计量经济学
容易验证:
HHHH ??? 2,
,即 H 矩阵是幂等对称
矩阵。
?
)(,0 2 HIDeEe ??? ?
?
0),?( ?eYC o v
? 当
),0(~ 2 nIN ??
时,
)(,0(~ 2 HINe ??
计量经济学
学生化残差
称,
),,2,1(
1
ni
sh
e
r
ii
i
i ??
?
?
为学生化残差(或标准化残差),其中:
iih
为 H 矩阵的第 i 个对角元,
1
RSS
s
nk
?
??
。
计量经济学
一般说来,
ir
的确切分布由于
ie
与
s
是不独立的所以很难
求得,但
nrrr,,,21 ?
近似独立,且近似服从
)1,0(N
,邓
可以近似认为
nrrr,,,21 ?
是来自
)1,0(N
的随机子样。依
据标准化残差
nrrr,,,21 ?
近似服从 N(0,1) 近似相互独立
这一结论,常用残差图对模型假设的合理性进行检验。
计量经济学
残差图
所谓残差图是 一 种直观的工具,它是以学生化残差 r 或普
通残差 e 为纵坐标,以任何其它的量为横坐标的散点图。常用
的横坐标有如下三种,
? 以拟合值
y?
为横坐标;
? 以
njx i,,2,1 ??
为横坐标;
? 以观测时间或序号为横坐标。
计量经济学
一般残差图均要求 n 个点的散布是元规则的。当残差图中
的点呈现某种规律或趋向时,就可以对模型的假设提出怀
疑。利用残差图上点的散布规律作判断的模型是否是适合
的方法是回归分析中对模型的诊断的最有效的方法之一 。
计量经济学
无偏性
性质一 ?BB? 的线性无偏估计,且 ??
21? ()D B X X
??
???
?? ?
证明:因
1? ()B X X X Y????
是 Y 的线性函数,故为线性估计。
又:
11? ( ) ( )E B X X X E Y X X X X B B??? ? ? ?? ? ?
,即,?B 为 B 的无偏估计。
1 2 1? ( ) ( ) ( )D B X X X D Y X X X X X
??
??? ? ? ???
计量经济学
有效性
性质二(高斯 - 马尔可夫定理)
在假设 E Y X B?,
2
nD Y I???
下,B 的任一线性函数
B? ?
的最小
方差线性无偏估计为 ?
B? ?
,其中
?
是任一不为零的
1k ?
维向量,?B 是 B
最小二乘估计。
证明:( 1 )
1? ()B X X X Y?? ?? ? ? ??
是 Y 的线性函数,所以是线性估计。
( 2 )
1?( ) ( ) ( )E B X X X E Y?? ?? ? ? ?? 1()X X X X B B?? ?? ? ? ???
故 ?
B? ?
是
B? ?
的无偏估计。
计量经济学
( 3 ) ?
B? ?
是
B? ?
的 的一切线性无偏估计中的方差最小者,可
设
Yl?
为
B? ?
的 一 个 线 性 无 偏 估 计, 即 对 一 切 B 有
E l Y l X B B?? ? ???
,从而必要:
? ???Xl
,又
2 2 1?( ) ( ) ( )D l Y D B l l X X
??? ? ? ? ?
?? ? ? ? ?? ? ?
21[ ( ) ]l l l X X X X l
??
?? ? ? ???
由于
2 ( 1 )H
?? ?
是 N 的协方差矩阵,故必要为非负定矩阵,
从而对一切
n
维向量
l
有
0)1( ??? lHl
,即 ?
B? ?
是
B? ?
的一
切线性无偏估计中方差最小者。
计量经济学
方差估计量的无偏性问题
性质四
2)1( ???? tnE S S E
证明:利用附录 1 的矩阵迹的性质及
0)1( ?? XH
可知
))1(( YHYEE SS E ???
))(1()( ?? XYHXYE ?????
=
]))()(1[( ???? ?? XYXYHE t r
DYHtr )1( ?? )1(2 Htr ?? ?
)])(([ 12 ???? XXXtrt r I? ) ) ])(([ 12 XXXXtrn ???? ??
)( 12 ??? tt r In? )1(2 ??? tn?
计量经济学
记:
1? () ?Y XB X X X X Y HY???? ? ?
为拟合向量。其中:
XXXXH ??? ? 1)(
为方阵,其元素记为
}{ ijh
,
显然,H 是对称并且幂等矩阵。
记:
? ( 1 )e Y Y H Y? ? ? ?
为残差向量。
记:
YHYYYYYSSE )1()?()?( ???????
为残差平方和。
计量经济学
2
2
1 1 1
22
22
1 1 1 1
( ) ( ) ( )
( ) ( ) ( 1 ) ( )
n n t
i j i j j i
i i j
n t n t
j i j j i j i j j
i j i j
T S S y y x x
x x n x x
? ? ?
? ? ? ? ?
? ? ?
? ? ? ?
??
? ? ? ? ? ? ? ? ?
??
??
? ? ? ?
? ? ? ? ? ? ? ? ?
? ? ? ?
? ? ? ?
? ? ?
? ? ? ?
2
2
11
()
nt
j ij j
ij
ESS t x x??
??
??
? ? ? ???
??
??
当
0H
为真时,
0?j?
tj,,2,1 ??
,即 2
E S S t???
。而对一般情形,
2E S S t??? 。故,我们对给定的显著水平 ? 给出拒绝域如下,
? ?)1,(1 ???? ? tntFFW ?
第二章
单方程计量经济学模型理
论与方法
计量经济学
§ 2.1线性回归模型概述
计量经济学
一、线性回归模型的特征
? 消费量由什么决定呢?
? 在现实生活中,影响各家各户消费的因素很多,如
收入水平、商品价格水平、利率水平、消费者偏好、
消费者年龄结构、风俗习惯等。凯恩斯认为,这些
因素中有决定意义的是家庭收入。
? 凯恩斯认为,存在一条基本心理规律:随着收入的
增加,消费也会增加,但消费的增加不及收入的增
加多。
计量经济学
? 由凯恩斯的绝对收入假设消费理论,认为消费是
由收入唯一决定的,是收入的线性函数,随着收
入的增加,消费增加,但消费的增长低于收入的
增长,即边际消费倾向递减。它的数学描述为:
0 1,
cy
c c c
y y y
????
??
? ? ?
??
其中,c 为消费额,
y
为收入。
计量经济学
消费和收入的关系并不是精确实现的,一般由下列
因素决定,
( 1 ) 消费除了受到收入的影响外,还受到其他一些因
素的影响,诸如消费者所外群体的平均收入水
平、消费习惯、对未来收入的期望等;
( 2 ) 线性关系的近似性,即所假定的线性关系并不是
严格的;
( 3 ) 收入数值的近似性,即所给定的收入数据本身并
不绝对准确地反映收入水平。
计量经济学
用更符合实际的是将消费与收入之间的关系用如下方程描述,
cy ? ? ?? ? ?
其中:
?
是一个随机误差项。根据该方程,每给定一个收入的
值,消费并不是单一确定的,而是有许多值,它们的概率分布
与随机误差项
?
的概率分布相同。此时它是一个计量经济学方
程。
引入随机误差项,将变量之间的关系用一个线性随机方程来描
述,用随机数学的方法来估计方程中的参数,这就是线性回归
的模型特征,也是线性计量经济学模型的特征。
计量经济学
在许多实际问题中,和 被解释 变量 y 有关系的变量往
往不至一个,而是多个。所以,要研究 被解释 变量 y 与 解
释 变量
1,,kxx
之间的相关关系,这便是多元线性回归问
题。为了研究 y 与
1,,kxx
之间的关系,首先必须收集 n 组
独立观测数据,
1(,,,) (,)?i k i i i ix x y x y?
,ni,,2,1 ??
计量经济学
单方程线性回归模型的一般形式为,
0 1 1 1,2,,i i i k i iy x x i n? ? ? ?? ? ? ? ? ?
其中
01,,k? ? ?
是 1k ? 个未知参数,
12,,,kx x x
是 解释 变
量,其值是可精确测定或被控制,y 是可观测的 被解释 变量,
?
是不可测的随机误差。
计量经济学
客观经济现象是十分复杂的,是很难用有限个变量、某一种
确定的形式来描述的,这就是设置随机误差项的原因。随机
误差项主要包括下列因素的影响,
? 在解释变量中被忽略的因素的影响;
? 变量观测值的观测误差的影响;
? 模型关系的设定误差的影响;
? 其他随机因素的影响;
计量经济学
二、线性回归模型的普遍性
? 从经济学课程中我们知道,在实际经济活动中,经
济变量的关系是复杂的,直接表现为线性关系的情
况很少。但它们中的大部分又可以通过一些简单的
数学处理,使之化为数学上的线性关系。
计量经济学
? 商品的需求曲线是一种双曲线形式
商品需求量
q
与商品价格
p
之间的关系表现为非线性关系;
11
ab
qp
??
? 著名的拉弗曲线描述的税收
s
与税率 r 的关系是一种抛物线形式
2 ( 0)s a br c r c? ? ? ?
? 生产成本
C
与产量 q 的关系有时呈指数关系,
qC a b?
计量经济学
? 著名的 CD 生产函数将产出量
Q
与投入要素(
LK,
)之间的关
系描述为幂函数的形式,
Q A K L???
? 著名的 CES 生产函数将产出量
Q
与投入要素( LK,)之间的
关系描述为如下的形式,
1
1 2 1 2( ) ( 1 )Q A K L
?? ?? ? ? ?
?
??? ? ? ?
计量经济学
一般线性假设:
0 1 1i i i k i iy x x? ? ? ?? ? ? ? ?
Semi - log,
0 1 1l o g ( )i i i k i iy x x? ? ? ?? ? ? ? ?
在计量经济研究中,线性的假设常用的有二类:
计量经济学
三、线性回归模型的基本假设
( 1 ) 解释变量
12,,,kx x x
是确定变量,不是随机变量;
而且解释变量之间互不相关。
( 2 ) 随机误差且有 0 均值和同方差,
( 3 ) 随机误差项在不同样本点之间是独立的,不存在序
列相关。
( 4 ) 随机误差项服从均值为 0,方差为
2
??
的正态分布。
计量经济学
更一般的假设:
在计量经济学中,解释变量
12,,,kx x x
在 一般情形
下是随机的,所以在通常更一般的假设是,
( 1 ) 随机误差且有 0 均值,
( ) 0iE ? ?;
( 2 ) 随机解释变量与随机误差之间是不相关的,
( ) 0iiEx ? ?;
( 3 ) 随机误差且有同方差,
22()
iE ?? ? ? ?;
计量经济学
( 4 ) 随机解释变量方差有限,
2
1
( ) ( ),1,2,
k
i i ji
j
E x x E x i n
?
? ? ? ? ??;
( 5 ) 随机解释变量协方差矩阵为半正定的,
1 1 1 2 1
2 1 2 2 2
12
( ) 0,1,2,
i i i i i k i
i i i i i k i
ii
k i i k i i k i k i
E x x E x x E x x
E x x E x x E x x
Q E x x i n
E x x E x x E x x
??
??
?
? ? ? ?
??
??
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
计量经济学
§ 2.2一元线性回归模型的
参数估计
计量经济学
综 合 上 面 的 所 述, 对 我 们 所 获 得 的 观 测 数 据
? ? niyx ii ?,2,1,? 来说,我们可得到如下的一元线性数学模型,
?
?
?
?
?
??
??
????
ji
DE
nixy
ji
ii
iii
,0),c o v (
,,0
2.1
2
10
??
???
???
?
?
参数估计的二个任务是:
( 1)求出反映变量之间数量关系的结构参数的估计量。
( 2)求出随机误差的分布参数。
计量经济学
一、普通最小二乘估计( OLS)
可以有许多方法获得模型中参数的估计值。这里讨论最常用的最
小二乘法,即根据使随机误差的平方和达到最小来取得参数的估计
值。
若记,
? ? ? ???
??
????
n
i
ii
n
i
i xyQ
1
2
10
1
2
10,?????
则
10
?,? ??
作为未知参数
10,??
的点估计,应满足,
? ?
01
0 1 0 1
,
,m i n (,)Q
??
? ? ? ??
计量经济学
),( 10 ??Q
是
10,??
的非负函数,且关于
10,??
可导微,
由微积分原理中关于极值存在的必要条件有
0
),(
1100
?,?
0
10
?
?
?
?? ?????
??Q
0
),(
1100
?,?
1
10 ?
?
?
?? ?????
??Q
由此可得正规方程组
?
?
?
?
?
?
?
???
???
?
?
?
?
n
i
iii
n
i
ii
xxy
xy
1
10
1
10
0)
??
(
0)
??
(
??
??
计量经济学
经简化求得
?
?
? 2
1
?
i
ii
x
yx
?
??
?
,
xy 10 ?? ?? ??
其中,
?
?
?
n
i
i
x
n
x
1
1
?
?
?
n
i
i
y
n
y
1
1
yyyxxx iiii ???? ??,
0
??
和
1
??
分别称
10,??
的最小二乘估计,简记为 OLS 。
计量经济学
最小二乘估计法求得
o?
?
及
1
??
后,
? ?iii yye ???
参数 σ
2
无偏估计 为:
2
?
2
22
?
??
?
n
e
s
i
?
计量经济学
SAS上机指导 1
? 对上述的参数估计可用 SAS软件中的 REG过程进行运算,一
般可采用下列语句:
? proc reg data=example.ex11;①
? model y=x; ②
? run; ③
? 这三个语句是最基本的语句,其意义如下:
? 调用 REG过程,并应用于数据集 example.ex11,其中 example
是库标名,ex11为数据集的文件名;
? 给出模型的形式;
? 提交 SAS执行。
计量经济学
? Model,MODEL1
? Dependent Variable,Y
? Analysis of Variance⑥
? Sum of Mean
? Source DF Squares Square F Value Prob>F
? Model 1 255.41159 255.41159 74.333 0.0001
? Error 8 27.48841 3.43605
? C Total 9 282.90000
? Root MSE 1.85366 R-square 0.9028
? Dep Mean 44.90000 Adj R-sq 0.8907
? C.V,4.12842
? Parameter Estimates
? Parameter Standard T for H0:
? Variable DF Estimate Error Parameter=0 Prob > |T|
? INTERCEP 1 35.450605④ 1.24291488⑦ 28.522 0.0001
? X 1 92.641129⑤ 10.74517100⑧ 8.622 0.0001
计量经济学
? ④⑤ 分别为所求的最小二乘估计;
? ⑥方差分析表;
? ⑦⑧分别标准误。
计量经济学
二、极大似然估计法( ML)
? ? ? ? 21 2 0 11 2
1 2
11 ?,,e x p
2( 2 )
n
k i i
i
p y y y y x
?
?
??
????
??
? ? ? ???
??
?
计量经济学
? 利用极大似然估计所得到的回归系数的估计与
最小二乘估计一致。
? 但对于误差方差的估计与最小二乘估计不一致。
参数 σ
2
的极大似然 估计为,
n
e i
L
?
?
2
2??
其中:
? ?iii yye ???
计量经济学
三、参数估计量的性质
? 线性性
? 无偏性
? 有效性(最小方差性)
? 方差估计量的无偏性问题
计量经济学
性质 1
1
??
? ? ?
2
21,
i
x
??
?
? ??? ?
性质 2
2
2
00 2
1
? ~ (,( ) )
i
x
N
nx
? ? ??
?
性质 3
2
01 2
? ?c ov (,)
i
x
x
? ? ???
?
?
计量经济学
方差的有效性是指在所有的线性无偏估计中,最小二
乘法所得到的估计是方差最小的,若另有一个线性无偏估
计,其方差与最小二乘估计的方差相等,则一定与最小二
乘估计相等。
关于方差的有效性和随机误差方差估计的无偏性我们
在下一节将继续讨论。
计量经济学
四、估计实例
? 我国国家财政中用于文教
卫生事业费的支出,主要
由国家财政收入决定,二
者之间具有线性关系,其
中 ED为国家文教卫生事业
费支出额(亿元),FI为
国家财政收入(亿元)。
年份 ED FI
1991 708 3149
1992 793 3483
1993 958 4349
1994 1278 5218
1995 1467 6242
1996 1704 7408
1997 1904 8651
计量经济学
§ 2.3多元线性回归模型的
参数估计
计量经济学
单方程线性回归模型的一般形式为,
0 1 1 1,2,,i i k k i iy x x i n? ? ? ?? ? ? ? ? ?
其中
01,,k? ? ?
是
1k ?
个未知参数,
12,,,kx x x
是 解释 变
量,其值是可精确测定或被控制,y 是可 观 测的 被解 释 变
量,
?
是不可测的随机误差。
用矩阵的表达式,
Y X B N??
计量经济学
Y =
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
n
y
y
y
.
.
.
2
1
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
k
?
?
?
.
.
.
1
0
??????? X=
11 1
12 2
1
1,,,
1,,,
.,,,,,
.,,,,,
.,,,,,
1,,,
k
k
n k n
xx
xx
xx
??
??
??
??
??
??
??
??
??
N ?
1
2
.
.
.
n
?
?
?
??
??
??
??
??
??
??
??
??
??
计量经济学
一、普通最小二乘估计( OLS)
2
0 1 0 0 1 1
1
(,,) (,....,)
n
k i k k i
i
Q y x x? ? ? ? ? ?
?
? ? ? ? ??
则名
i?
的
LS
估计
i?
?
0,1,ik?
,满足
0
? ?(,,,,,, )
kQ ??
=
0
0
,,
m i n (,,)
k
kQ
??
??
根据微积分原理,
? ?
......
00
0
? ?
......
00
|0
|0
k
kk
k
j
Q
Q
? ? ? ?
? ? ? ?
?
?
??
??
??
?
?
?
?
?
?
?
?
? ?
?
1,2,jk?
计量经济学
整理可得正规方程组,
0 1 1
1 0 1 1
2
0
? ? ?
( ),,,,,, ( )
? ?
( ),,,,,, ( )
.............
? ?
( ),,,,,, ( )
i k i k i
i i k i k i i
k i k i k k i i
n x x y
x x x x y
x x x y
? ? ?
??
??
?
? ? ? ?
?
? ? ??
?
?
?
? ? ?
?
? ? ?
? ? ?
? ? ?
用 (2.1.3) 矩阵形式表示上述方程组,
?()X X B X Y?? ?
,
当
1)( ??XX
存在时,B 的最小二乘估计为,
1? ()B X X X Y????
计量经济学
记,BXYe ???
1
? 22
??
???
kn
ees
??
是 2? 的无偏估计。
计量经济学
三、参数估计量的性质
? 线性性
? 无偏性
? 有效性(最小方差性)
? 方差估计量的无偏性问题
计量经济学
无偏性
性质一, ?BB? 的线性无偏估计,?
且 ??
21? ()D B X X
??
???
?? 。 ?
计量经济学
有效性
性质二, (高斯 - 马尔可夫定理)
在假设 E Y X B?,
2
nD Y I???
下,B 的任一
线性函数
B? ?
的最小方差线性无偏估计为 ?
B? ?
,其
中
?
是任一不为零的
1k ?
维向量,?B 是 B 最小二乘
估计。
计量经济学
方差估计量的无偏性问题
性质三, 2)1(' ???? kneEe
计量经济学
四、样本容量问题
收集与整理数据是一件困难的工作,所以选择合适
的样本容量,既能满足建模的需要,又能减轻收集数据
的困难,是一个重要的实际问题。
( 1 ) 最小样本容量 1nk??,
( 2 ) 满足基本要求的样本容量 30n ? 或者至少 31n ??(k ) 。
计量经济学
五、应用实例
? 建立中国消费模型。根据消费模型的一般形式,
选择消费总额为解释变量,国内生产总值和前
一年的消费总额为解释变量,变量之间关系为
简单的线性关系,选取 1981年至 1996年统计
数据为样本观测值。数据如下所示:
计量经济学
年份 消费总额 国内生产总值 前一年消费额
1981 3309 4901 2976
1982 3638 5489 3309
1983 4021 6076 3638
……, ……, ……, ……,
……, ……, ……, ……,
1994 1781 3923 1331
1995 2311 4854 1781
1996 2677 5634 2311
以 y 代表消费总额,
1x
代表国内生产总值,
2x
代表 前一年
消费总额,用 S A S 软件分析得到 结果 。
计量经济学
§ 2.4多元线性回归模型的
统计检验
计量经济学
平方和的分解
2 2 2
1 1 1
? ?( ) ( ) ( )
n n n
i i i i
i i i
TSS y y y y y y R S S E S S
? ? ?
? ? ? ? ? ? ? ?? ? ?
? T SS 称为总的平方和,反映了样本观测值总体离差的大小 ;
? ES S 称回归平方和,反映由模型中解释变量所解释的那部分离差的
大小;
? R SS 称为残差平方和,反映样本观测值与估计值偏离的大小 。
计量经济学
一、拟合优度检验
? 拟合优度检验,是检验模型对样本观测值的拟合程
度。
? r^2和 R^2统计量
2 111 (,)
11
r
rt
t
SR S R S S S T S S
S n k n? ? ? ?? ? ?
2 1E S S R S Sr
TS S TS S? ? ?
( r称为决定系数,或复相关系数)
( R称为调整的复相关系数)
计量经济学
? 决定系数要达到多大才算模型通过了检验,
没有绝对的标准,要看具体情况而定。模型
的拟合优度不是判断模型质量的唯一标准,
有时甚至为了追求模型的经济意义,可以牺
牲一点拟合优度。
计量经济学
二、方程显著性检验
? 方程的显著性检验,旨在对模型中解释变量与
被解释变量之间的线性关系在总体上是否显著
成立作出推断。
? 用于显著性检验的方法主要有三种,F检验,t
检验,r检验。
计量经济学
可以证明:
2
2
~ ( 1 )
R S S
nk?
?
??
。当
0H
为真时,多元线性模型可改写为:
0
2
., ~ ( 0,)
ii
i
y
i i d N
??
??
???
?
?
即
),(~ 20 ??Ny i
为
dii,.
的正态随机变量,所以,由
数理统计中的知识可知,
2
2
~ ( 1 )
T S S
n?
?
?
,所以,当
0H
为真时,
2
2
~ ( )
E SS
k?
?
,
并且
SSR
与
SSE
独立。由上述讨论构造检验统计量,
1
E S S k
F
R S S n k
?
??
当
0H
为真时,
)1,(~ ?? knkFF
。
计量经济学
在实际问题中,随机变量
y
与一般变量
12,,,kx x x
之间究竟是否存在
线性相关关系呢?如果
Ey
不随
12,,,kx x x
的变化而变化,则应有:
1 0k?? ? ? ?
。否则
Ey
应随
12,,,kx x x
的变化而作变化,所以有必要
对回归方程作显著性检验。即,
:oH 1 0k?? ? ? ?
当我们拒绝假设
0H
时,则至少存在一个
0?i?
,即至少存在一个
ix
与
y
之间存在着线性相关关系。
计量经济学
可以证明,当
0H
为真时,
0?j?
1,2,,jk?
,即
2E S S k ??? 。而对一般情形,2E S S k ??? 。 所以,
我们对给定的显著水平 ? 给出拒绝域如下,
? ?(,1 )W F F k n k?? ? ? ?
计量经济学
方差分析表
? ? 2? ?? yyT S S i
,
? ? 2?? ?? yyE S S i
来源 平方和 自由度 均方和 F 比
回归
E S S
k
SSR
k
残差
R S S
1nk??
1
SSE
nk ??
F=
1
S S R k
S S E n k??
总和
T S S
1?n
1 (,1 )F k n k?? ??
计量经济学
? 拟合优度与方程显著性检验
2 11
1
nR
n k k F
???
? ? ?
计量经济学
三、变量显著性检验
当回归方程的显著性检验得出拒绝
0H
时,我们并不能说明所
有的
ix
均与
y
有线性相关关系,而只仅仅说明至少有一个
ix
与
y
有线性相关关系,而对有此
0?j?
时,说明相应的的变量
jx
与
y
的变化无关,即不会引起
Ey
的线性变化,为了使方程简单明了,
我们应把
jx
从方程中去掉。所以在进行了回归方程的显著性检验
后,还应对每个
j?
( 1,2 )jk?
进行检验。
计量经济学
01,0, 0i i i iHH ??? ? ?
可知:
12? )D B X X
??
???(
,记
? ?1
( 1 ) ( 1 )
( ii
kk
X X c?
? ? ?
? ?)
即
i?
,
?
iD ?
的
方差为
2
( 1 ) ( 1 )iic ????
。 由此可 给出检验
0,0iiH ? ?
统计量为,
( 1 ) ( 1 )
( 1 ) ( 1 )
2
?
?
1
i i i
i
i
ii
c
t
R S S c s
nk
?
?
??
?
?
??
??
??
??
(
,'
1
RSS
s R S S e e
nk
??
??
)
在当
0 iH
为真时,
~ ( 1 )it t n k??
。对给定的显著水平
?
,给出检
验假设的拒绝域为,
? ?/2 ( 1 )iW t t n k?? ? ? ?
计量经济学
? 对于变量的显著性检验没有绝对的显著水平。
? 关键是考察变量在经济关系上是否对解释变量
有影响,显著性检验起到验证的作用;同时还
要看显著性水平不太高的变量在模型及模型应
用中的作用。
计量经济学
几个例子
1,中国消费函数模型
2,粮食生产模型
计量经济学
中国消费函数模型
根据消费模型的一般形式,选择消费总额
为被解释变量,国内生产总值和前一年的消费
总额为解释变量,变量之间关系为简单线性关
系,选取 1981年至 1996年统计数据为样本观
测量。
计量经济学
粮食生产模型
( 1 ) 确定模型的包含的变量
被解释变量 —— 粮食产量
解释变量 —— 农用化肥施用量、粮食种植面积、
成灾面积、农业机械总动力、农业劳力
( 2 ) 确定模型的数学形式和参数范围
0 1 1 2 2l n l n l nY a a X a X ?? ? ? ?
1、选择变量和模型的关系形式
计量经济学
2、样本数据收集
year y x1 x2 x3 x4 x5
1983 38728 1659.8 114047 16209.3 18022 31645.1
1984 40731 1739.8 112884 15264 19497 31685
1985 37911 1775.8 108845 22705.3 20913 30351.5
1986 39151 1930.6 110933 23656 22950 30467
1987 40298 1999.3 111268 20392.7 24836 30870
1988 39408 2141.5 110123 23944.7 26575 31455.7
1989 40755 2357.1 112205 24448.7 28067 32440.5
1990 44624 2590.3 113466 17819.3 28708 33330.4
1991 43529 2805.1 112314 27814 29389 34186.3
1992 44266 2930.2 110560 25894.7 30308 34037
1993 45649 3151.9 110509 23133 31817 33258.2
1994 44510 3317.9 109544 31383 33802 32690.3
1995 46662 3593.7 110060 22267 36118 32334.5
计量经济学
3、参数估计结果及统计检验
? ?23
14
5
2 3 2 3
?l n 3, 7 5 4 0, 6 6 0 l n
0, 0 5 7 l n 0, 3 7 2 l n 0, 1 0 0 l n
Y X X
XX
X
X X X X
? ? ?
? ? ? ?
? ? ?? ? ? ?
??? ? ? ?
2 0, 9 7 1 2, 3 6 2 6 8, 2 2 7R D W F? ? ?,,
计量经济学
? ?
1
2 3 5
23
?l n 2, 4 3 5 0, 6 9 8 l n 0, 1 2 6 l n 0, 2 8 9 l n
X
Y X X X
XX
??
? ? ? ? ? ??
???
2 0, 9 6 7 1, 8 7 3 8 6, 8 7 7R D W F? ? ?,,
? ?
14
23
2 3 2 3
?l n 4, 2 3 7 0, 6 7 3 l n 0, 3 8 6 l n 0, 1 1 0 l n
XX
Y X X
X X X X
? ? ? ?
? ? ? ? ?? ? ? ?
??? ? ? ?
2 0, 9 7 1 2, 3 6 9 1 0 0, 9 6 0R D W F? ? ?,,
? ?
1
23
23
?l n 3, 3 2 3 0, 7 4 0 l n 0, 3 0 6 l n
X
Y X X
XX
??
? ? ? ? ??
???
2 0, 9 6 5 1, 8 5 7 1 3 6, 2 0 0R D W F? ? ?,,
计量经济学
4、预测及分析
? 1996年的数据如下:
? 粮食产量 =50454万吨;
? 农业劳力 =32260.4万人;
? 农业机械总动力 =38546.9万千瓦;
? 农用化肥施用量 =3827.9万公斤;
? 粮食种植面积 =112548千公顷;
? 成灾面积 =21234公顷。
计量经济学
代入最终方程,
? ?
1
23
23
?l n 3, 3 2 3 0, 7 4 0 l n 0, 3 0 6 l n
X
Y X X
XX
??
? ? ? ? ??
???
得出,?
49118Y ?
,所以其偏差为,
? 5 0 4 5 4 4 9 1 1 8 1 3 3 6YY ? ? ? ?
即,?
0,0 2 6
YY
Y
?
?
计量经济学
§ 2.5多元线性回归模型的
置信区间
计量经济学
一、参数估计量的置信区间
( 1 ) ( 1 )
?
~ ( 1 )jj
jj
t n k
cs
??
??
?
??
,即
j?
的置信水平为 ??1 的置信区间为,
/ 2 ( 1 ) ( 1 ) / 2 ( 1 ) ( 1 )? ?( ( 1 ),( 1 ) )j j j j j jt n t c s t n t c s???? ? ? ? ?? ? ? ? ? ?
计量经济学
二、预测值的置信区间
通过回归方程,当给定
0 10 20 0(,,)kx x x x ??
时,可求出
0?y
0 0 0 0
11
? ? ?? )
tt
j j j j j
jj
y x y x x? ? ?
??
? ? ? ? ??? (
0?y
相应可作为
0Ey
或
0y
的点估计,并且是
0Ey
或
0y
的无偏估计。
计量经济学
SAS上机指导 2
? 对上述多元回归分析的参数估计及显著性检验同样可采用 SAS软件中的 REG过程进行运算,
一般可采用下列语句:
? data example.ex21; ①
? input x1 x2 x3 y@@;
? cards;
? 9 4,5 3 90,98 9 4,5 1 84,54
? 9 2,5 3 87,70 9 2,5 1 85,60
? 5 4,5 3 85,40 5 4,5 1 82,63
? 5 2,5 3 85,50 5 2,5 1 83,20
? 9 4,5 3 93,73 9 4,5 1 87,67
? 9 2,5 3 91,46 9 2,5 1 88,50
? 5 4,5 3 86,01 5 4,5 1 83,88
? 5 2,5 3 82,40 5 2,5 1 83,55
? run;
? proc reg data=ex21 outest=example.ex21out1② ;
? model y=x1 x2 x3③ ;
? run;
计量经济学
? 这三个语句是最基本的语句,其意义如下:
? 建立一个以 example为库标名的数据文件,ex21为数据集的文件
名;
? 把模型的参数估计的值存入一个名为 example.ex21out1的数据文
件;可用打印语句输出此数据文件:
? proc print data=ex21out1 noobs;
? run;
? 输出结果如下:
? _MODEL_ _TYPE_ _DEPVAR_ _RMSE_ INTERCEP X1 X2 X3 Y
? MODEL1 PARMS Y 1.88754 73.7275 1.17531 0.43313 1.47562 -1
? 给出模型的形式,以 x1,x2 x3为自变量,以 y为应变量;
计量经济学
经 SAS软件计算,输出结果如下:
Model,MODEL1
Dependent Variable,Y
Analysis of Variance④
Sum of Mean
Source DF Squares Square F Value Prob>F
Model 3 126.24807 42.08269 11.812 0.0007
Error 12 42.75358 3.56280
C Total 15 169.00164
Root MSE 1.88754 R-square 0.7470
Dep Mean 86.42188 Adj R-sq 0.6838
C.V,2.18410
Parameter Estimates⑤
Parameter Standard T for H0:
Variable DF Estimate Error Parameter=0 Prob > |T|
INTERCEP 1 73.727500 2.56298823 28.766 0.0001
X1 1 1.175312 0.23594219 4.981 0.0003
X2 1 0.433125 0.47188438 0.918 0.3768
X3 1 1.475625 0.47188438 3.127 0.0087
计量经济学
? 方差分析表,其中 R-square表示复相关系数的
平方;
? 分别为参数的最小二乘估计,共有 5列,其中第
一列为变量名,第二列为参数的最小二乘估计,
第三列为相应参数的最小二乘估计的标准误,
第四列是参数的显著性检验( t检验)的统计量
的值,第五列的尾概率,当小于 0.05时说明此
参数在显著水平 =0.05下是显著。
计量经济学
残差及残差图
计量经济学
普通残差
我们假定
2( ),( )
nE Y XB D Y I???
,此时模型的最小二
乘估计为,
1()B X X X Y????
,由此可得拟合向量,
1? () ?Y XB X X X X Y HY???? ? ?
,
其中
XXXXH ??? ? 1)(
。
记:
YHIYYe )(? ????
,则称
e
残差向量。残差向量是我们
分 析 异 方 差 性, 序 列 相 关 性 的重要工具 。
计量经济学
容易验证:
HHHH ??? 2,
,即 H 矩阵是幂等对称
矩阵。
?
)(,0 2 HIDeEe ??? ?
?
0),?( ?eYC o v
? 当
),0(~ 2 nIN ??
时,
)(,0(~ 2 HINe ??
计量经济学
学生化残差
称,
),,2,1(
1
ni
sh
e
r
ii
i
i ??
?
?
为学生化残差(或标准化残差),其中:
iih
为 H 矩阵的第 i 个对角元,
1
RSS
s
nk
?
??
。
计量经济学
一般说来,
ir
的确切分布由于
ie
与
s
是不独立的所以很难
求得,但
nrrr,,,21 ?
近似独立,且近似服从
)1,0(N
,邓
可以近似认为
nrrr,,,21 ?
是来自
)1,0(N
的随机子样。依
据标准化残差
nrrr,,,21 ?
近似服从 N(0,1) 近似相互独立
这一结论,常用残差图对模型假设的合理性进行检验。
计量经济学
残差图
所谓残差图是 一 种直观的工具,它是以学生化残差 r 或普
通残差 e 为纵坐标,以任何其它的量为横坐标的散点图。常用
的横坐标有如下三种,
? 以拟合值
y?
为横坐标;
? 以
njx i,,2,1 ??
为横坐标;
? 以观测时间或序号为横坐标。
计量经济学
一般残差图均要求 n 个点的散布是元规则的。当残差图中
的点呈现某种规律或趋向时,就可以对模型的假设提出怀
疑。利用残差图上点的散布规律作判断的模型是否是适合
的方法是回归分析中对模型的诊断的最有效的方法之一 。
计量经济学
无偏性
性质一 ?BB? 的线性无偏估计,且 ??
21? ()D B X X
??
???
?? ?
证明:因
1? ()B X X X Y????
是 Y 的线性函数,故为线性估计。
又:
11? ( ) ( )E B X X X E Y X X X X B B??? ? ? ?? ? ?
,即,?B 为 B 的无偏估计。
1 2 1? ( ) ( ) ( )D B X X X D Y X X X X X
??
??? ? ? ???
计量经济学
有效性
性质二(高斯 - 马尔可夫定理)
在假设 E Y X B?,
2
nD Y I???
下,B 的任一线性函数
B? ?
的最小
方差线性无偏估计为 ?
B? ?
,其中
?
是任一不为零的
1k ?
维向量,?B 是 B
最小二乘估计。
证明:( 1 )
1? ()B X X X Y?? ?? ? ? ??
是 Y 的线性函数,所以是线性估计。
( 2 )
1?( ) ( ) ( )E B X X X E Y?? ?? ? ? ?? 1()X X X X B B?? ?? ? ? ???
故 ?
B? ?
是
B? ?
的无偏估计。
计量经济学
( 3 ) ?
B? ?
是
B? ?
的 的一切线性无偏估计中的方差最小者,可
设
Yl?
为
B? ?
的 一 个 线 性 无 偏 估 计, 即 对 一 切 B 有
E l Y l X B B?? ? ???
,从而必要:
? ???Xl
,又
2 2 1?( ) ( ) ( )D l Y D B l l X X
??? ? ? ? ?
?? ? ? ? ?? ? ?
21[ ( ) ]l l l X X X X l
??
?? ? ? ???
由于
2 ( 1 )H
?? ?
是 N 的协方差矩阵,故必要为非负定矩阵,
从而对一切
n
维向量
l
有
0)1( ??? lHl
,即 ?
B? ?
是
B? ?
的一
切线性无偏估计中方差最小者。
计量经济学
方差估计量的无偏性问题
性质四
2)1( ???? tnE S S E
证明:利用附录 1 的矩阵迹的性质及
0)1( ?? XH
可知
))1(( YHYEE SS E ???
))(1()( ?? XYHXYE ?????
=
]))()(1[( ???? ?? XYXYHE t r
DYHtr )1( ?? )1(2 Htr ?? ?
)])(([ 12 ???? XXXtrt r I? ) ) ])(([ 12 XXXXtrn ???? ??
)( 12 ??? tt r In? )1(2 ??? tn?
计量经济学
记:
1? () ?Y XB X X X X Y HY???? ? ?
为拟合向量。其中:
XXXXH ??? ? 1)(
为方阵,其元素记为
}{ ijh
,
显然,H 是对称并且幂等矩阵。
记:
? ( 1 )e Y Y H Y? ? ? ?
为残差向量。
记:
YHYYYYYSSE )1()?()?( ???????
为残差平方和。
计量经济学
2
2
1 1 1
22
22
1 1 1 1
( ) ( ) ( )
( ) ( ) ( 1 ) ( )
n n t
i j i j j i
i i j
n t n t
j i j j i j i j j
i j i j
T S S y y x x
x x n x x
? ? ?
? ? ? ? ?
? ? ?
? ? ? ?
??
? ? ? ? ? ? ? ? ?
??
??
? ? ? ?
? ? ? ? ? ? ? ? ?
? ? ? ?
? ? ? ?
? ? ?
? ? ? ?
2
2
11
()
nt
j ij j
ij
ESS t x x??
??
??
? ? ? ???
??
??
当
0H
为真时,
0?j?
tj,,2,1 ??
,即 2
E S S t???
。而对一般情形,
2E S S t??? 。故,我们对给定的显著水平 ? 给出拒绝域如下,
? ?)1,(1 ???? ? tntFFW ?