§ 2.5单方程线性模型的区间估计
Interval Estimation of Multiple Linear
Regression Model
一、参数估计量的区间估计
二、预测值的区间估计
一、参数估计量的区间估计
1、问题的提出
? 人们经常说,,通过建立生产函数模型,得到资
本的产出弹性是 0.5”,,通过建立消费函数模型,
得到收入的边际消费倾向是 0.6”,等等。其中 0.5、
0.6是模型具有特定经济含义的参数估计值。
这样的说法正确吗?
应该如何表述才是正确的?
? 线性回归模型的参数估计量是随机变量, 利用一
次抽样的样本观测值, 估计得到的只是参数的一
个点估计值 。
如果用参数估计量的一个点估计值近似代表参数
值, 那么, 二者的接近程度如何? 以多大的概率
达到该接近程度?
? 这就要构造参数的一个区间, 以点估计值为中
心 的 一 个 区 间 ( 称为 置 信 区 间, confidence
interval), 该区间以一定的概率 ( 称为 置信水平,
confidence coefficient ) 包含该参数 。
? 参数估计量的区间估计的目的就是求得与 α 相对
应的 a。
???? ?????? 1)??( aaP iii
2、参数估计量的区间估计
)1(~
?
?
??
?
? knt
s
t
i
ii
?
??
P t t t( )? ? ? ? ?? ? ?
2 2
1
P t
s
ti i
i
(
?
)
?
? ?
?
? ? ?? ?
? ?
?
?
2 2
1
P t s t si i i
i i
( ? ? )? ?? ? ? ?? ?? ?? ? ? ? ? ? ? ?
2 2
1
3、如何缩小置信区间
? 增大样本容量 n,因为在同样的置信水平下,n越
大,t分布表中的临界值越小,同时,增大样本
容量,还可使样本参数估计量的标准差减小;
? 提高模型的拟合优度,因为样本参数估计量的标
准差与残差平方和呈正比,模型优度越高,残差
平方和应越小。
? 提高样本观测值的分散度 。
二、预测值的区间估计
1、问题的提出
但是,严格地说,这只是被解释变量的 预测值的
估计值,而不是 预测值 。
为什么?
计量经济学模型的一个重要应用是经济预测。对于模型
? ?
Y X? ?
如果给定样本以外的解释变量的观测值 ),,,,1( 02010 kXXX ??0X,
可以得到被解释变量的预测值
?? ??
00
XY
? 由于随机因素的影响,模型中的参数估计量是
不确定的。
? 所以,我们得到的仅能是预测值的一个估计值,
预测值仅以某一个置信水平处于以该估计值为
中心的一个区间中。
? 于是,又是一个区间估计问题。
? 下面进行置信区间的推导:
2、预测值置信区间的推导
如果已经知道实际的预测值
0
Y,那么预测误差为:
000
?YYe ??
容易证明,e 0 服从正态分布,即
e
0 ~
)))(1(,0(
0
1
0
2
XXXX ???
?
?N
取 e
0
的方差的估计量为
)))(1(?? 0
1
0
22
0
XXXX ????
?
??
e
0
1
0
)(1??
0
XXXX ????
?
??
e
构造统计量
0
?
?
00
e
YY
t
?
?
? ~
t n k( )? ? 1
利用该统计量,类似于前面的推导过程,得到
在给定( 1-α)的置信水平下,预测值 Y0的置信区
间为:
0
1
00
00
1
00
)(1??
)(1??
2
2
XXXX
XXXX
??????
??????
?
?
?
?
?
?
?
?
ty
yty
这就是说,当给定解释变量值 X0后,能得到被解释
变量 Y0以( 1-?) 的置信水平处于该区间的结论。
同理,可得均值 )( 0X|YE 的 ( )1 ? ? 预测区间:
01000100 )(??)()(??
22
XXXXX|YXXXX 0 ?????????? ?? ?? ?? tYEtY
3、一点启示
? 计量经济学模型用于预测时,必须严格科学地
描述预测结果。
? 如果要求给出一个, 准确, 的预测值,那么真
实值与该预测值相同的概率为 0。
? 如果要求以 100%的概率给出区间,那么该区间
是 ∞ 。
? 模型研制者的任务是尽可能地 缩小置信区间。
4、如何缩小置信区间
? 增大样本容量 n,因为在同样的置信水平下,n
越大,t分布表中的临界值越小,同时,增大
样本容量,还可使随机误差项的标准差减小;
? 提高模型的拟合优度,模型优度越高,残差平
方和应越小。
? 提高样本观测值的分散度 。
三、多元线性回归分析计算步骤
及主要公式
1、由样本观测值 ),,2,1(),,,,,( 21 niXXXY kiiii ?? ?,写出
Y ?
?
?
?
?
?
?
?
?
?
?
?
?
?
y
y
y
n n
1
2
1
?; X ?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
1
1
1
11 21 1
12 22 2
1 2 1
x x x
x x x
x x x
k
k
n n kn n k
?
?
? ? ? ?
?
( )
2、计算 XX ?, 1)( ??XX, YX ?
3、计算 O L S 估计量
? ( )? ? ? ??X X X Y1
4、计算残差及残差平方和
YYe ???
YXBYYee ?????? ?
5、计算随机项标准差的估计值
1
?
??
?
?
kn
ee
?
6、作拟合优度检验
2
2
2
?
Yn
Yn
r
??
???
?
YY
YXB
)1(
)1(
)1(1
22
??
?
???
kn
n
RR
7、计算样本参数估计值的标准差
ii
i
iii
c
kn
e
cS
1
?)?(
2
2
??
??
?
??
其中,1)( ??? iiiic XX
8、进行F检验与 t 检验
)1/()?(
/)?(
)1(
2
??????
???
?
??
?
kn
kYn
kn
R S S
k
E S S
F
XXBYY
YXB
)?(
?
i
i
S
t
?
?
?
9、在 0XX ? 处进行点预测与区间预测
BX 0 ?0 ?Y
0
1
0000
1
00 )(1
??)(1??
22
XXXXXXXX ???????????? ?? ?? ?? tYYtY
例,设某中心城市对各地区商品流出量 Y取决于
各地区的社会商品购买力 X1以及各地区对该市的商
品流入 X2,即可能有如下总体回归方程:
Y=?0+?1X1+?2X2
在下列样本下进行回归分析:
地区 该市对各地区销售额
Y (万元)
各地区社会购买力
X1 (亿元)
各地区商品流入该市量
X2 (万元)
1 6800 1300 400
2 1900 350 1200
3 2800 180 700
4 1000 340 400
5 700 70 1600
6 500 200 1200
7 60 30 240
8 50 20 400
( 1 )估计总体回归模型 NBXY ?? ?
?
?
?
?
?
?
?
?
?
?
??
6 4 6 7 6 0 01 5 6 9 2 0 06 1 4 0
1 5 6 9 2 0 02 0 0 6 7 0 02 4 9 0
6 1 4 02 4 9 08
XX,
?
?
?
?
?
?
?
?
?
?
??
9114400
10500800
13810
YX
?
?
?
?
?
?
?
?
?
?
???
???
??
??
?
070231.6076 7 1 8 3.10 0 0 5 1.0
076718.1075 8 2 9 9.80004.0
0005.00 0 0 4 0.06 4 2 8 2.0
)(
1
EE
EEXX
参数的最小二乘估计
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
??
?
?
?
?
?
143.0
075.5
085.37
?
?
?
?
2
1
0
?
?
?
B
( 2)统计检验
方差分析计算表
Y Y^ y y
2
e=Y-Y^ e
2
y^ Y^
2
6800 6692 5074 25742939 108 11654 4966 24659152
1900 1985 174 30189 -85 7159 258 66749
2800 1050 1074 1152939 1750 3060796 -676 456656
1000 1820 -726 527439 -820 671984 93 8742
700 621 -1026 1053189 79 6308 -1106 1222517
500 1223 -1226 1503689 -723 523179 -503 252947
60 224 -1666 2776389 -164 26757 -1503 2258026
50 196 -1676 2809814 -146 21213 -1531 2342749
和 13810 35596588 4329050 31267537
均值 1726 TSS RSS ESS
自由度 8-1=7 8-3=5 3-1=2
均方差 865810 15633769
拟合优度检验:
总体显著性检验 ( F检验 ),
8 7 8 4.0
3 5 5 9 6 5 8 8
3 1 2 6 7 5 3 72
???
T S S
E S S
r,
8 2 9 7.0
38
18
)8 7 8 4.01(12 ?
?
?
????R
06.18
)38(
)13/(
?
?
?
?
R S S
E S S
F
查表,在 5% 的显著性水平下,临界值
?
F (3 -1,8 -3 )= 5, 7 9
因为通过样本计算的 F 值大于临界值 ?F,因此模型总体
上是显著的。
参数显著性检验( t检验)
参数估计的方差 - 协方差矩阵
12
)(?)?c ov (v a r
?
??? XX?B
=8 6 5 8 1 0
?
?
?
?
?
?
?
?
?
?
???
???
??
070 2 3 1.6076 7 1 8 3.10 0 0 5 1.0
076 7 1 8.1075 8 2 9 9.80 0 0 4.0
0 0 0 5.00 0 0 4 0.06 4 2 8 2.0
EE
EE
对参数
0
?
?,
1
?
?,
2
?
? 分别作 t 检验:
0
?
?, 0 4 9 7.0
6 4 2 8.08 6 5 8 1 0
09.37
?
)
?
(
?
00
2
0
0
0
?
?
???
cS
t
?
?
?
?
1
?
?, 8 8 8.5
075 8 3.88 6 5 8 1 0
0 7 5.5
?
)
?
(
?
11
2
1
1
1
?
??
???
EcS
t
?
?
?
?
2
?
?, 1 9 8.0
070 2 3.68 6 5 8 1 0
1 4 3.0
?
)
?
(
?
22
2
2
2
2
?
??
???
EcS
t
?
?
?
?
查表:在 5% 的显著性水平下,2/05.0t =2, 5 7 1,
因此,
1
?? 显著不为 0,而
2
?? 显著为 0,
说明各地区商品流入量 2X 不是一个重要的影响因素,而
各地区社会购买力 1X 是重要的因素。
在模型中册去 2X,重新建立模型
??? ??? 110 XY
利用表中资料通过 O LS 法得到的回归结果如下:
1
0 3 5 7.588.1 5 8? XY ??
t, ( 0, 4 1 2 8 ) ( 6, 5 4 0 )
r
2
=0, 8 7 7 4 F =4 2, 9 5 4 4
Eviews 软件输出
( 1) 模型中包括 X1与 X2:
D e p e n d e n t V a r i a b l e, Y
M e t h o d, L e a st S q u a r e s
D a t e, 0 2 / 0 7 / 0 3 T i m e, 0 9, 3 9
S a m p l e, 1 8
I n cl u d e d o b se r va t io n s,8
V a r i a b l e C o e f f i ci e n t S t d, E r r o r t - S t a t i st i c P r o b,
C 3 7, 0 8 5 0 4 7 4 6, 0 3 0 6 0, 0 4 9 7 1 0 0, 9 6 2 3
X1 5, 0 7 5 3 1 4 0, 8 6 2 0 4 6 5, 8 8 7 5 2 1 0, 0 0 2 0
X2 0, 1 4 2 6 3 6 0, 7 2 2 1 4 4 0, 1 9 7 5 1 8 0, 8 5 1 2
R - sq u a r e d 0, 8 7 8 3 8 6 M e a n d e p e n d e n t va r 1 7 2 6, 2 5 0
A d j u st e d R - sq u a r e d 0, 8 2 9 7 4 0 S, D, d e p e n d e n t va r 2 2 5 5, 0 4 5
S, E, o f r e g r e ssi o n 9 3 0, 4 8 9 1 A ka i ke i n f o cr i t e r io n 1 6, 7 8 9 2 9
S u m sq u a r e d r e si d 4 3 2 9 0 5 0, S ch w a r z cr i t e r i o n 1 6, 8 1 9 0 8
L o g l i ke l i h o o d - 6 4, 1 5 7 1 8 F - st a t i st i c 1 8, 0 5 6 8 1
D u r b i n - W a t so n st a t 2, 7 1 8 5 4 0 P r o b ( F - st a t i st i c) 0, 0 0 5 1 5 8
( 2) 模型中仅包括 X1
D e p e n d e n t V a r i a b l e, Y
M e t h o d, L e a st S q u a r e s
D a t e, 0 2 / 0 7 / 0 3 T i m e, 0 9, 4 2
S a m p l e, 1 8
I n cl u d e d o b se r va t io n s,8
V a r i a b l e C o e f f i ci e n t S t d, E r r o r t - S t a t i st i c P r o b,
C 1 5 8, 8 8 1 1 3 8 4, 8 1 7 1 0, 4 1 2 8 7 4 0, 6 9 4 0
X1 5, 0 3 5 7 2 3 0, 7 6 8 3 4 8 6, 5 5 3 9 5 9 0, 0 0 0 6
R - sq u a r e d 0, 8 7 7 4 3 7 M e a n d e p e n d e n t va r 1 7 2 6, 2 5 0
A d j u st e d R - sq u a r e d 0, 8 5 7 0 1 0 S, D, d e p e n d e n t va r 2 2 5 5, 0 4 5
S, E, o f r e g r e ss i o n 8 5 2, 7 2 3 9 A ka i ke i n f o cr i t e r io n 1 6, 5 4 7 0 7
S u m sq u a r e d r e si d 4 3 6 2 8 2 8, S ch w a r z cr i t e r i o n 1 6, 5 6 6 9 3
L o g l i ke l i h o o d - 6 4, 1 8 8 2 7 F - st a t i st i c 4 2, 9 5 4 3 7
D u r b i n - W a t so n st a t 2, 7 3 1 0 3 3 P r o b ( F - st a t i st i c) 0, 0 0 0 6 0 4