§ 3.4 多元线性回归模型的预测一,E(Y0)的置信区间二,Y0的置信区间对于模型
βXY
给 定 样 本 以 外 的 解 释 变 量 的 观 测 值
X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预测值:
βX 00?Y
它可以是总体均值 E(Y0)或个值 Y0的预测。
但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。
为了进行科学预测,还需求出预测值的置信区间,包括 E(Y0)和 Y0的 置信区间 。
一,E(Y0)的置信区间易知
)()?()?()?( 00 YEEEYE βXβXβX 000
))()?()?( 20 ββ()Xββ(XβXβX 0000 EEYV ar
0
1
0
2
0
00
)(
)()?(
XXXX
X)ββ)(ββ(X
X)ββ)(ββ(X
0
0
E
EYV a r
容易证明
),(~? 020 XX)X(XβX 100NY
)1(~
knt)E ( YY 00
0
1
0 XX)X(X?
于是,得到 (1-?)的置信水平下 E(Y0)的 置信区间,
010000100 )()()( 22 XXXXXXXX tYYEtY
其中,t?/2为 (1-?)的置信水平下的 临界值 。
二,Y0的置信区间如果已经知道实际的预测值 Y0,那么预测误差为:
000?YYe
容易证明
0
))((
))?((
)?()(
1
00
00
0000
μXXXX
ββX
βXβX
E
E
EeE
))(1(
))((
)()(
0
1
0
2
21
00
2
00
XXXX
μXXXX
E
eEeV a r
e0服从正态分布,即
)))(1(,0(~ 01020 XXXXNe
)))(1( 01022 0 XXXX e
构造 t统 计量
)1(~?
0
00 kntYYt
e?
可得给定 (1-?)的置信水平下 Y0的 置信区间,
010000100 )(1)(1 22 XXXXXXXX tYYtY
中国居民人均收入 -消费支出 二元模型 例中:
2001年人均 GDP,4033.1元,
于是 人均居民消费的预测值 为
2001=120.7+0.2213× 4033.1+0.4515× 1690.8=1776.8(元)
实测值 ( 90年价) =1782.2元,相对误差,-0.31%
预测的置信区间,
0 0 0 0 4.00 0 0 0 1.00 0 8 2 8.0
0 0 0 0 1.00 0 0 0 1.00 0 2 8 5.0
0 0 8 2 8.00 0 2 8 5.08 8 9 5 2.1
)( 1XX
3938.0 010 XX)X(X
于是 E(?2001) 的 95%的置信区间为,
3938.05.705093.28.1776
或 ( 1741.8,1811.7)
3938.15.705093.28.1776
或 ( 1711.1,1842.4)
同样,易得?2001的 95%的置信区间为
βXY
给 定 样 本 以 外 的 解 释 变 量 的 观 测 值
X0=(1,X10,X20,…,Xk0),可以得到被解释变量的预测值:
βX 00?Y
它可以是总体均值 E(Y0)或个值 Y0的预测。
但严格地说,这只是被解释变量的预测值的估计值,而不是预测值。
为了进行科学预测,还需求出预测值的置信区间,包括 E(Y0)和 Y0的 置信区间 。
一,E(Y0)的置信区间易知
)()?()?()?( 00 YEEEYE βXβXβX 000
))()?()?( 20 ββ()Xββ(XβXβX 0000 EEYV ar
0
1
0
2
0
00
)(
)()?(
XXXX
X)ββ)(ββ(X
X)ββ)(ββ(X
0
0
E
EYV a r
容易证明
),(~? 020 XX)X(XβX 100NY
)1(~
knt)E ( YY 00
0
1
0 XX)X(X?
于是,得到 (1-?)的置信水平下 E(Y0)的 置信区间,
010000100 )()()( 22 XXXXXXXX tYYEtY
其中,t?/2为 (1-?)的置信水平下的 临界值 。
二,Y0的置信区间如果已经知道实际的预测值 Y0,那么预测误差为:
000?YYe
容易证明
0
))((
))?((
)?()(
1
00
00
0000
μXXXX
ββX
βXβX
E
E
EeE
))(1(
))((
)()(
0
1
0
2
21
00
2
00
XXXX
μXXXX
E
eEeV a r
e0服从正态分布,即
)))(1(,0(~ 01020 XXXXNe
)))(1( 01022 0 XXXX e
构造 t统 计量
)1(~?
0
00 kntYYt
e?
可得给定 (1-?)的置信水平下 Y0的 置信区间,
010000100 )(1)(1 22 XXXXXXXX tYYtY
中国居民人均收入 -消费支出 二元模型 例中:
2001年人均 GDP,4033.1元,
于是 人均居民消费的预测值 为
2001=120.7+0.2213× 4033.1+0.4515× 1690.8=1776.8(元)
实测值 ( 90年价) =1782.2元,相对误差,-0.31%
预测的置信区间,
0 0 0 0 4.00 0 0 0 1.00 0 8 2 8.0
0 0 0 0 1.00 0 0 0 1.00 0 2 8 5.0
0 0 8 2 8.00 0 2 8 5.08 8 9 5 2.1
)( 1XX
3938.0 010 XX)X(X
于是 E(?2001) 的 95%的置信区间为,
3938.05.705093.28.1776
或 ( 1741.8,1811.7)
3938.15.705093.28.1776
或 ( 1711.1,1842.4)
同样,易得?2001的 95%的置信区间为