§ 3.4 多元线性回归模型的预测
一,E(Y0)的置信区间
二,Y0的置信区间
对于模型
βXY ?? ?
给 定 样 本 以 外 的 解 释 变 量 的 观 测 值
X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预
测值:
βX ?? 00 ?Y
它可以是总体均值 E(Y0)或个值 Y0的预测。
但严格地说,这只是被解释变量的预测值的估
计值,而不是预测值。
为了进行科学预测,还需求出预测值的置信
区间,包括 E(Y0)和 Y0的 置信区间 。
一,E(Y0)的置信区间
易知
)()?()?()?( 00 YEEEYE ???? βXβXβX 000
))??()?()?( 20 ββ()Xββ(XβXβX 0000 ????? EEYV a r
0
1
0
2
0
00
)(
??
)??()?(
XXXX
X)ββ)(ββ(X
X)ββ)(ββ(X
0
0
???
?????
?????
??
E
EYV a r
容易证明
),(~? 020 XX)X(XβX 100 ?? ??NY
)1(~
?
?
??
??
?
?
knt)E ( YY 00
0
1
0 XX)X(X?
于是,得到 (1-?)的置信水平下 E(Y0)的 置信区间,
010000100 )(??)()(?? 22 XXXXXXXX ?????????? ?? ?? ?? tYYEtY
其中,t?/2为 (1-?)的置信水平下的 临界值 。
二,Y0的置信区间
如果已经知道实际的预测值 Y0,那么预测误差为:
000 ?YYe ??
容易证明
0
))((
))?((
)?()(
1
00
00
0000
?
????
???
???
?
μXXXX
ββX
βXβX
?
?
?
E
E
EeE
))(1(
))((
)()(
0
1
0
2
21
00
2
00
XXXX
μXXXX
????
????
?
?
?
?
?E
eEeV a r
e0服从正态分布,即
)))(1(,0(~ 01020 XXXX ??? ??Ne
)))(1(?? 01022 0 XXXX ???? ??? e
构造 t统 计量
)1(~?
?
0
00 ???? kntYYt
e?
可得给定 (1-?)的置信水平下 Y0的 置信区间,
010000100 )(1??)(1?? 22 XXXXXXXX ???????????? ?? ?? ?? tYYtY
中国居民人均收入 -消费支出 二元模型 例中:
2001年人均 GDP,4033.1元,
于是 人均居民消费的预测值 为
?2001=120.7+0.2213× 4033.1+0.4515× 1690.8=1776.8(元)
实测值 ( 90年价) =1782.2元,相对误差,-0.31%
预测的置信区间,
?
?
?
?
?
?
?
?
?
?
??
?
?
?? ?
0 0 0 0 4.00 0 0 0 1.00 0 8 2 8.0
0 0 0 0 1.00 0 0 0 1.00 0 2 8 5.0
0 0 8 2 8.00 0 2 8 5.08 8 9 5 2.1
)( 1XX
3938.0??? ? 010 XX)X(X
于是 E(?2001) 的 95%的置信区间为,
3 9 3 8.05.705093.28.1 7 7 6 ???
或 ( 1741.8,1811.7)
3 9 3 8.15.7 0 50 9 3.28.1 7 7 6 ???
或 ( 1711.1,1842.4)
同样,易得 ?2001的 95%的置信区间为