第六章 正态条件下回归的推论
问题的提出
? 在前述各章中我们假定随机扰动项服从均值 =0,方差
等于(常数),独立同分布。但是,并没有假定随机
扰动项服从何种具体的分布。
? 由于没有假定服从何种具体的分布,因而无法计算随
机扰动项取不小于某值的概率,因而也无法计算估计
量取某种值的概率,也就无法对统计量进行假设检验
和进行区间估计。
? 点估计给出是某个具体的数值,无法给出相应的可靠
性,也就是我们得出的结论的缺乏可靠性,从而降低
了结论的有效性与实用性。
? 如果假定随机扰动项服从正态分布,那么估计量就可
立即得到相应的区间估计及其概率,也就是结论具有
了可靠性。
? ?
? ?
? ? ? ? ? ?
? ?? ?
种假定呢?为什么要进一步作出这
的性质是什么?、、现在,假定
布总之仍然不知是什么分
BNii
XXBdiiB
XXBV a rBBEYXXXB
V a rM i nE
adiidii
a
b
yu
bbbywb
xbxbyu
uxbxby
ii
i
ii
ii
i
i
ikki
i
i
iikki
i
?
),0(..~
,..~
?
?
)
?
(
?
)()(
,..~),0(..~
?
??
2
21
211
2
11
2
11
?
?
?
??
??
???????
???
????
?????
?
??
?
?
?
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
2
2
2
00
0
00
00
?
???
?
?
u iV a r
同方差 =常数,协方差 =0
同方差 =常数,协方差 =0
nxn,x
Z自变量与随机扰动项无关,
从而自变量之间也无关。
X是确定性变量,Y只有
垂直变动
解决问题的思路
? 首先,复习有关正态分布的一些结论
? 进而假定随机扰动项服从正态分布
? 导出估计量也服从正态分布
? 给出关于估计量的假设检验和区间估计
? 再给出利用模型进行预测的可靠性,使
模型能够运用于实际
有关正态分布的一些结论
? 1、正态分布的线性组合也服从正态分布
? 2、标准正态分布的平方和服从卡平方分

? 3、标准正态分布除以卡平方分布及其自
由度的商,服从 t分布
? 4、两个卡平方分布分别除以各自自由度
的商之比服从 F分布
? ? ? ?
? ?
? ?
F
Z
Z
ZZ
t
N
NN
aaNaN
nn
nn
n
n
n
n
i
ii
n
i
ii
i
iiii
i
i
n
n
F
n
Z
N
t
ZN
N
NN
2,1
2
2
1
1
2
2
2
2
1
1
2
2
2
1
22
1
222
~
~,~.4
~
~,0~.3
~,0~.2
,~,~.1
??
??
?
?
?
? ? ?
?
?
??
??
??
????
第一节 问题的引入
? 1、假定随机扰动项服从正态分布,导出
Yi也服从正态分布
? 2、一元模型中斜率也服从正态分布
? 3、一元模型中截距也服从正态分布
? 4、回归估计系数的分布的总结
1、假定随机扰动项服从正态分布,导出 Yi
也服从正态分布
? ?
? ?
? ? ? ?
? ? ? ? ? ?
? ?
?
?
?
2
2
2
,..~
,0..~
xy
uuxy
xuxy
y
uxyuy
uuxy
i
i
iii
i
iii
i
i
ii
i
i
i
iii
i
baNii
V a rbaV a rV a r
baEbaE
ba
Niiba
??
?????
?????
?
???
???


也服从正态分布
然服从正态分布正态分布的线性组合仍
的线性组合是服从正态分布
?
?
2、一元模型中斜率也服从正态分布
? ? ? ?
? ?
? ?
? ? ? ?
? ?
? ? ?
?
?
?
?
?
?
?
?
?
?
???
??
?
?
?????
? ?
? ?
?
? ?
?
xx
xx
yywy
xx
x
xyuuxy
i
i
ii
i
i
i
i
i
i
iii
i
bNb
bV a rbbEb
b
x
b
baNiiNiiba
2
2
2
2
2
22
,~
?
???
??
,..~,0..~
?
?
??

且也服从正态分布
的线性组合是?
? ? ? ?
? ?
? ?
? ? ? ?
? ?
? ? ? ?
? ?
? ?
? ? ? ?
? ? ? ?? ?
?
? ?
?
? ?
??
? ?
? ?
? ?
? ?
?
? ?
? ?
?
? ?
?
?
??
?
???
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
??
?
?
?????
x
x
x
x
x
xxx
x
x
xxxx
x
x
xxx
x
x
x
x
x
x
x
x
x
x
yywy
x
x
x
xyuuxy
i
i
i
i
i
ii
i
i
i
i
i
i
i
ii
i
i
i
i
i
i
iii
i
nn
nn
n
nnx
n
n
n
n
aNabNb
bV a rbbEb
b
x
b
baNiiNiiba
2
2
2
222
2
222
2
2
2
2
2
2
2
2
2
2
2
2
2
22
22
2
1
,~?,~
?
???
??
,..~,0..~
?
?
?
??
同理即
且也服从正态分布
然服从正态分布正态分布的线性组合仍
的线性组合是
?
?
3、一元模型中截距也服从正态分布
? ? ? ?
? ? ? ?
? ?
? ? ?
?
?
?
?
?
?
?
?
?
?
???
??
?
?
?
?
?
??????
?????
? ?
?
? ?
?
????
?
?
??
2
2
2
2
2
2
22
,~?
???
?
11
?
?
,..~,0..~
xx
x
xx
x
y
ykywywy
xyuuxy
i
i
i
i
i
i
i
i
i
i
i
i
i
i
iii
i
n
aNa
n
aV a raaEa
a
x
n
x
n
xbya
baNiiNiiba
且也服从正态分布
的线性组合是
?
4、回归估计系数的分布的总结
? ?
? ?
? ?
? ?
? ? ? ? ? ?
? ?? ?
估计出来?将
未知,怎样决:参数仍然有一个问题有待解

服从正态分布的线性组合是
现假定
原假定
?
?
?
?
?
?
?
2
2
2
1
2
1
1
2
2
2
,~
?
??
??
,~
,0~
,0..~
XXXBNB
XXBV a rBBE
BYYXXXB
IXBNY
INuuXBY
IdiiuuXBY
??
???
????
?
??
??
?
?
?
第二节 问题的解决
? 1、解决问题的关键是样本带来了总体的
信息,所以用样本的信息去估计总体的
信息。
? 2、用残差去估计总体的随机扰动项,进
而用残差的方差去估计随机扰动项的方

? 3、构造残差的方差为随机扰动项方差的
无偏估计量。
? 4、随机扰动项方差的估计量 S2的分布
1、解决问题的关键是用样本残差去估计
总体的随机扰动项
? 解决问题的关键是用样本残差去估计总
体的随机扰动项。
? 进而用样本残差的方差 S2去估计随机扰
动项的方差 ——?2
? 最后,在随机扰动项服从正态分布的假
定下,导出样本残差方差 S2的性质或分

2、随机扰动项方差的估计量
? ?
? ? ? ?
? ?
?
?
?
?
?
?
?
?
??
?
??
?
2
1
2
2
2
1
2
1
2
2
1
2
1
2
1
2
1
1
2
1
2
2
2222
222
1
2
11
2
11
~
1
~
1
1
)1(
~)1,0(~
0
)?(
~1)2(1
,,,?,
,~),0(~
?
?
?
?
???
?
???
????
?
??
?
?
??
??
?
?
?
?
?
?
?
?
??
???
??
?
?
?
???????
???
?
????
?????
?
?
?
knkn
n
i
i
kn
n
i
i
n
i
i
i
i
ii
ik
k
i
iii
i
kn
iki
ikki
i
i
iikki
i
s
u
u
N
u
N
yy
xbxbyyyu
s
ss
ss
y
bb
y
xbxbyu
uxbxby
knkn
kn
N
a
knE
a
aNN
a
的也服从正态分布。这一线性组合当之无愧
的无偏估计量是)(
的性质:。首先讨论去估计现在用
也服从正态分布服从正态分布,从而
?
?
?
?
为什么是
n-k-1?
(第三节)
3、随机扰动项方差估计量的性质
? ( 1)无偏性 E(S2)=?2
? ( 2)随机扰动项方差估计量 S2服从卡方
分布,自由度 = n-k-1
? ?
? ? ?
?
??
?
2
1
2
2
2222
2
22
1
2
2
~1)2(
1
1
?
??
?
??
?
??
?
?
kn
n
i
i
s
ss
s
s
u
s
kn
E
kn
的无偏估计量是)(
的性质:
。去估计现在用
第三节 派生内容:自由度
? 1、什么是自由度
? 2、对应于平方和分解的自由度的分解
? 3,k元模型中随机扰动项的自由度为什
么 =n-k-1?
1、什么是自由度
? 模型中样本值可以自由变动的个数,称
为自由度
? 自由度 =样本个数 -样本数据受约束条件
(方程)的个数
? 例如,样本数据个数 =n,它们受 k+1个方
程的约束(这 n个数必须满足这 k+1个方
程)
? 那么,自由度 df = n-k-1
数据个数与约束方程
? Y1+Y2+Y3=7
? Y1=7
? 那么 Y2,Y3中只有 1个是自由的。
? 又如:
? Y1+Y2+Y3+Y4=7
? Y1=7
? 那么,Y2,Y3,Y4中只有 2个是自由的
2、对应于平方和分解的自由度的分解
?自由度 =变量个数 - 约束方程个数
?TSS=RSS+ESS dfT=dfR+dfE
?dfT=n-1
?dfR=k
?dfE=dfT-dfR= n-1-k = n - (k+1)
? ?
? ? ? ?
1
0
0
2
1 1
22
2
?
?
??
?????
?
?
?
?
??
???
?
? ? ?? ?
?? ?
? ?
knR S ST S SE S S
nk
kk
R S S
ynT S S
df
y
b
u
b
dfb
xxbyy
yyy
E
i
j
i
j
Rj
k
j
n
i
jij
ji
ii
所以,
约束个个方程对方程求出,共有由而
在变,个只有
一个方程的约束受
3,k元模型中随机扰动项的自由度为什么
=n-k-1?
? ?
? ?
? ?
? ?
的由来。个方程求出。这就是过上列
个通个是自由的,其余中只有个
的自由度个方程的约束。因此,受个变数这里共有
求导)(对
求导)(对
求导)(对
求偏导数:
?
2
1
1
11
1111
11
11
2
2
1
11,1)1(
1
0
0
0
0
0
0
??
?
????????
??
?
?
?
?
?
?
?
?
?
?
?????
?????
?????
?
?
?
?
?
?
?
?????
kn
i
ii
k i
i
i
kikki
i
ik
ikki
i
i
ikki
i
iikkii
k
kknnknkn
kn
a
a
aa
M i nM i n
u
uu
ux
ux
u
bxbxbyx
bxbxbyx
xbxby
uxbxbau
?
?
?
?
?
?
第四节 回归系数的假设检验
? 1、大样本与小样本
? 2、斜率的分布
? 3、回归系数假设检验的意义
? 4、假设检验的原理
? 5、假设检验的种类
? 6,F检验的步骤
? 7,t检验的步骤
? 8、回归分析进行假设检验的步骤
1、大样本与小样本
? 中心极限定理告述我们:
? 随机变量 X无论服从什么分布,只要它的
方差存在,只要样本个数 n充分的大,X
的平均数就服从正态分布。
? 那么,充分大在实际应用中怎样掌握呢?
? 凡是 n >30,我们就可以认为它具有此种
极限性质,称为大样本。
? 否则,就称为小样本,小样本不具有此
种极限性质。
2、斜率的分布
? ( 1)已知 ?2或大样本情形
? ( 2)未知 ?2且为小样本情形
? ?
? ?
? ?1,0~
?
,~?
2
22
2
N
bb
NbNb
xx
xx
i
i
? ?
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
( 2)未知 ?2且为小样本情形
? ?
? ?
? ?
? ?
? ?? ?
? ?
? ?
?
?
?
?
??
?
??
?
?
?
??
??
xx
ss
xx
t
s
xx
i
i
kn
kn
i
bb
bb
t
kn
Z
N
t
kn
ZN
bb
N
2
2
2
2
2
2
1
2
1
2
2
2
2
?
?
~
1
~
1
1,0~
?
?
?
?
??
? ?
? ? ? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ? ? ? ? ? ? ?
t
xxR
s
b
xxR
s
bb
b
bb
bb
Rx
s
b
s
Rx
b
xx
xx
xx
x
xxxx
x
b
kn
ii
xxi
xxi
ii
ii
ii
i
iiii
i
SE
t
V a rSE
V a r
V a r
V a r
1
11
2
2
12
2
1
11
2
2
12
2
1
1
1
1
1
11
2
21
2
1
2
1
22
2
21
2
1
2
1
2
2
2
2
1
21
2
2
2
2
1
2
2
2
21
2
2
2
2
1
2
2
1
~
11
1
1
1
??
?
?
??
?
?
?
??
? ?? ?
?
?
??
??
?
??
?
?
?
?
?
?
?
?
??
?
??
?
?
?
?
?
?
?
?
?
?
??
?
?
???
?
?
?
??
??
??
?
????
?
?
?
??
估计现在用
0:0:
,0)(
10
2211
??
?????
HbH
uuxbxby
A
iiiii
Ea
欲检验
未知方差
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? ?
定。的概率越小,结论越肯绝的绝对值越大越好,拒
,软件给出这个,否则不拒绝,那么拒绝如果
H
HHt
tt
xxR
s
b
xxR
s
bb
tt
xxR
s
b
xxR
s
bb
t
tt
t
t
kn
nkn
ii
nkn
ii
0
001,
121
22
2
2
21
2
2
22
2
2
21
2
2
2
121
11
2
2
12
2
1
11
2
2
12
2
1
1
~
11
~
11
??
??
??
????
????
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?? ?
? ?? ?
?
0:0:
,0)(
10
2211
??
?????
HbH
uuxbxby
A
iiiii
Ea
欲检验
未知方差
3、回归系数假设检验的意义
? 通过 F检验只是对方程作为一个整体进行
检验,只要其中一个或几个自变量的系
数显著不为零,整个方程就是有意义的。
? 但是,还必须继续对各个自变量的系数
进行检验,否则方程中会包含一些对因
变量从统计意义上说没有意义的自变量
3、回归系数假设检验的意义
? 例如,Y^=1.78+1.56X1+0.036X2
? 对多元回归除了进行整体检验外,还需要分别
对 X1和 X2的系数进行 t检验。
? 对 X1的系数检验,计算出来的 t大于临界值,
拒绝 H0,即 X1的系数与 0有显著的差异,认为
X1对 Y有意义;
? 对 X2的系数检验,计算出来的 t小于临界值,
不拒绝 H0,认为 X2的系数与 0没有本质的差异,
虽然它 =0.036,于是认为 X2对 Y没有意义,是
方程中的累赘,应剔除,重新估计方程。
? 因此,要求方程中所有系数都应与 0差异显著。
4、假设检验的原理
? 1、提出二择一的假设 H0(往往与试验目的相反)与
HA(往往是欲得到的结论)
? 2、给定显著水平(小概率)
? 3、在 H0成立下,收集数据,寻找检验统计量(如 t、
F),肯定知道统计量的分布,可计算各种取值的概率
? 4、找出小概率发生的临界值
? 5、将样本值和 H0代入检验统计量进行计算
? 6、将计算结果与临界值比较,若大于临界值,小概率
事件发生,根据小概率原理,在一次试验中小概率事
件是不会发生的。现在,居然发生了。错在哪里?
? 7、原来是假设 H0错了,因为一切都是在 H0成立下推
证的,于是拒绝 H0。否则,不拒绝 H0
大海里捞针 ——反证法
? H0:一棵针掉进了大海里(海底只有一棵针)
? HA:海底不只一棵针
? 显著水平 =0.01(小概率)
? 进行试验 ——到海底捞针
? 通常用大海里捞针比喻不可能发生的事
? 现在,一次潜水(试验)就捞上一棵针,这掉
下的一棵针居然被我们捞上来,不可能发生的
事件发生了,于是拒绝 H0,认为大海里不只一
个针。
两类错误之一 ——弃真
? 1,H0:海底只有一棵针。但一次试验捞了上
来。因为小概率事件发生,必须拒绝( H0)。
然而海底真的只有一棵针,结论说不只一棵针。
犯弃真错误了,只有拒绝 H0时才会犯弃真错误
? 2、此时犯了弃真的错误,但是犯弃真错误的
可能性,事先已经控制 ——只有显著水平 ?
( 小概率)那么大
? 3、所以拒绝不仅是坚决的,而且犯错误的概
率(冒险率是事先控制的)也很小。所得结论
的可靠性 = 1-??
? 4、所以,人们提出的 H0通常是无效的
犯两类错误之二 ——纳伪
? H0:某某(高考的考生) = 大学生(准予参考
就是提出这个假设,即假设他是优秀青年)
? 进行抽样试验 ——参加高考
? 检验统计量 ——考试总分(包括加分)
? 众所周知,大学生乃同龄人中的佼佼者,而该
某某平时素质和学业平平,距高等学府之路遥
遥,被录取(总分超过报考学校的录取线)的
概率很小。 H0成立下,优秀毕业生考分低于录
取线(失常)的概率很小。
? 在此次抽样中他的总分喜煞人,由于小概率事
件(优秀者失常)没有发生,于是不能拒绝 H0。
某某顺利进入重庆某学院,显然属于纳伪。
不拒绝 H0是无可奈何
? 某某进入高校,招生犯了纳伪的错误
? 进行检验时,没有事先控制纳伪的概率 ?——
无法度量犯纳伪的可能性。也就不能给出不拒
绝 H0结论(录取进大学)的可靠性( 1- ? )。
? 就本次试验而言,不拒绝 H0是无可奈何的。
? 千万不可,以接受 H0作为我们研究的结论。欲
证明 H0成立必须继续抽样、继续检验,并采用
功效函数。
? 所以某某进校后不断地被抽样、被检验
5、假设检验的种类
? 1、参数检验
? 已知分布形式,检验分布的参数,例如
检验均值或检验方差
? 2、非参数检验
? 检验随机变量的分布形式,例如是否服
从正态分布
? 本课程主要讨论参数检验
6、假设检验的步骤 ——t检验为例
? 1、提出假设 H0和 HA
? 2、收集数据估计出 b^
? 3、计算出 ?2的估计量 s2
? 4、计算检验统计量 t(代入假设 H0)
? 5、根据显著水平 ?,查出临界值 t?
? 6、作出统计推断:如果 t>t ?,拒绝 H0;
否则不拒绝 H0。 t的绝对值越大,自变量
对因变量的作用越显著。
? ?
? ?
? ? ? ?
比较,下结论(绝对值)与
查出临界值根据
t
t
xx
s
xx
s
xx
s
s
kn
kn
ii
i
t
kn
b
t
bb
t
bSE
kn
E S S
1,
2
1,
2
2
2
2
2
2
2
2
,1,
??
?
1
??
??
??
?
?
?
?
??
?
? ?? ?
? ?
?
??t检验的步骤
t
f(t)
t kn 1,2 ???t kn 1,2 ??? ?
不拒绝 H0区域
拒绝域
拒绝域
t
f(t)
t kn 1,2 ???t kn 1,2 ??? ?
不拒绝 H0区域
拒绝域
拒绝域
t
f(t)
t kn 1,2 ???t kn 1,2 ??? ?
不拒绝 H0区域
拒绝域
拒绝域
? ?
? ?
? ?
? ?
? ?
? ?
? ? ? ? ?
?
?
??
??
?
??
??
???
?
?
?
?
?
????
???
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
???
?
?
?
?
?
?
????
??
????
????
? ?
? ?
1
????
1
??
1
?
?
?
?
?
?
1
1,
2
1,
2
1,
2
1,
2
1,
2
2
2
2
2
1,
2
1,
2
tt
t
tt
xx
s
xx
s
tt
knkn
kn
knkn
i
i
knkn
bSEbbbSEbP
bSEbbP
bSE
bb
ptp
bSE
bb
bSE
bb
t
tptp
H
H
b
b
0
0
?
?
1
在置信区间内,不拒绝
在置信区间外,拒绝
间置信区间是一个随机区
置信度
显著水平(冒险率)
?
?
?
b^
f(b^)
? ?bSEb t kn ?? 1,
2 ??
? ?? ?bSEb t kn ?? 1,
2 ??
? ?
置信区间
上限下限
假设检验与区间估计是一个问题的两个方面
b^
f(b^)
? ?bSEb t kn ?? 1,
2 ??
? ?? ?bSEb t kn ?? 1,
2 ??
? ?
置信区间
上限下限
t
f(t)
t kn 1,2 ???t kn 1,2 ??? ?
F检验的步骤
? 假定随机扰动项 u服从正态分布 。 检验目标是联合检验,
? ( 1) 提出假设 H0:b1 = b2 =b3 =…… =bk=0
? ( 2) 适合的检验统计量
? ( 3) 根据冒险率 ?,确定临界值 F?
? ( 4) 将计算出的 F与临界值 F?比较
? ( 5) 下结论:若 F>临界值 F?,则拒绝 H0;若 F<=临界值 F?,则不拒绝
H0
? ( 6) 结合经济学理论与经验, 下经济学的结论或进行经济学分析
? ?? ?
? ? ? ?1/
/
1/
/
?
?
2
2
1,?????
??
? ?
?
?? knE S S
kR S S
kn
k
yy
yyF
ii
i
knk
1-?
F? F
f(F)
?
7、回归分析进行假设检验的步骤
? ( 1)查看拟合优度,进行 F检验,从整体上判
断回归方程是否成立,如果 F检验通不过,无
须进行下一步;否则进行下一步
? ( 2)查看各个变量的 t值及其相应的概率,进
行 t检验,如果相应的概率小于给定的显著水平,
该自变量的系数显著地不为 0,该自变量对因
变量作用显著;否则系数与 0无显著差异(本
质上 =0),该自变量对因变量无显著的作用,
应从方程中删去,重新估计方程。
? ( 3)但是,一次只能将最不显著(相应概率
最大)的删除。
第五节 预测
? 1、预测的定义
? 2、利用模型进行预测的种类
? 3、一般水平的预测
? 4、个体水平的预测
? 5、预测的精度
? 6、滞后模型进行预测
? 7、案例分析 ——假日旅馆房间收入的预测
? 8、指数平滑预测
1、预测的定义
? 预测是对于未来或未知的预计与推测
? 预测不是臆测,这里的预测是科学的预测,它
是建立在对预测对象认识、分析和科学的推理
基础之上的。
? 由于客观世界的复杂性和不确定性与人类认识
的矛盾,以及预测科学(又称未来学)仍然处
于成长阶段,还有预测手段的不完善,尤其是
与进行预测人员的素质、知识、经验、魄力、
胆略、价值取向密切相关,所以预测既是一门
科学又是一门艺术。
2、利用模型进行预测的种类
? ( 1)定性预测与定量预测
? ( 2)模型预测与非模型预测
– 即利用回归直线或其它模型进行预测,由于
回归直线本身有一个变动幅度(随抽样不同
而不同),也一定存在误差。
– 一般水平预测与个别值的预测
– 点预测与区间预测
? ( 3)超长期预测、长期预测、中期预测、
短期预测
? ( 4)情景预测
3、一般水平的预测
? 关于平均水平的预测 ——关于 E(y^)=a^+b^x均
值的预测
? 因为随机扰动项的平均数 =0,所以随机扰动项
对预测值没有影响
? 随机扰动项有一个变动幅度,由于没有考虑随
机扰动项的变动幅度
? 因此,预测的方差会相应的小些
? 为什么一般水平的预测也会存在预测误差呢?
因为 a^和 b^随着样本的不同而不同,有一个变
动幅度,所以 E(y^)也有一个变动幅度。
? ? ? ?
? ? ? ? ? ?
? ?
? ?
? ?
? ?
? ?
? ?
? ?? ?
? ?
? ?
? ?
? ?
? ?
? ?? ?
? ?
? ?
? ?
? ?? ? ? ?? ? ???
?
?
??
?
?
?
?
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
?
??
?
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
?
?
??
???????
????
? ?
?
? ?
?? ?
?
? ?
?
? ?? ?? ?
? ?? ?
1,
)1(~
1
1,0~
1
1
,~
1
2
1
)
?
,?(2
1
)
?
,?(2)
?
()?()
?
?()(
?
?
1,
2
1,
2
2
2
2
2
2
2
2
2
2
2
2
2
2
22
22
2
2
2
2
22
2
2
2
????
??
?
??
??
?
??
??
??
tyytyy
s
xx
xx
yy
y
yy
xx
xx
yy
y
yy
xx
xx
yy
xx
xx
xx
x
xx
x
xx
x
x
xx
x
xx
x
xxxyxy
kn
ii
kn
ii
i
i
ii
i
ii
i
i
ii
i
ii
i
i
ii
i
i
i
i
i
i
i
i
i
i
i
iii
i
i
i
V a rSEV a rSEP
knt
n
E
V a rSE
E
N
n
E
V a rSE
E
n
EN
n
x
n
ba
n
baC o vbV a raV a rbaV a rV a rba
? ? ? ?
? ? ? ? ? ?
? ?
? ?
? ?
? ?
? ?
? ?
? ?? ?
? ?
? ?
? ?
? ?
? ?
? ?? ?
? ?
? ?
? ?
? ?? ? ? ?? ? ???
?
?
??
?
?
?
?
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
?
??
?
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
?
?
??
???????
????
? ?
?
? ?
?? ?
?
? ?
?
? ?? ?? ?
? ?? ?
1,
)1(~
1
1,0~
1
1
,~
1
2
1
)
?
,?(2
1
)
?
,?(2)
?
()?()
?
?()(
?
?
1,
2
1,
2
2
2
2
2
2
2
2
2
2
2
2
2
2
22
22
2
2
2
2
22
2
2
2
????
??
?
??
??
?
??
??
??
tyytyy
s
xx
xx
yy
y
yy
xx
xx
yy
y
yy
xx
xx
yy
xx
xx
xx
x
xx
x
xx
x
x
xx
x
xx
x
xxxyxy
kn
ii
kn
ii
i
i
ii
i
ii
i
i
ii
i
ii
i
i
ii
i
i
i
i
i
i
i
i
i
i
i
iii
i
i
i
V a rSEV a rSEP
knt
n
E
V a rSE
E
N
n
E
V a rSE
E
n
EN
n
x
n
ba
n
baC o vbV a raV a rbaV a rV a rba
nst
1?
? ?
? ?? ?
???
xx
xx
i
i
n
st 2
2
1
xiba ???
x xi
X
Y
0
=平均数时,预测误差最小x
i
影响预测误差的因素
? 1,???( 1-?) ??t???预测误差 ?
(只有这么多信息,可靠性 ??预测误差
?,可靠性 ??预测误差 ?)
? 2,x?均值 ?预测误差 ?
? 3,x方差 ??预测误差 ?
? 4,n ??预测误差 ?
? ?? ? ? ?
? ?
? ?? ? ? ?? ? ??? ???
?
?
?
?
? ????
??
?
?
?
??
?
?
?
??
??
????
? ?
?
1,
1
??
1,
2
1,
2
2
2
2
??
?
tyytyy
s
xx
xxy
xy
kniiknii
i
i
i
ii
V a rSEV a rSEP
n
V a rSE
ba
4、个体水平的预测
? 是关于个别值( Yi)的预测,
? 因为一个 Xi会对应多个 Yi,由于考虑了
随机扰动项的变动(一般水平预测,随
机扰动项 =0,不于考虑)
? 个别值总是在均值附近振动外再加一个
随机扰动项的变动,所以个体预测值的
变动幅度大些。
? 个体水平的预测是关于 Yi=a+bXi+ui的预

? ?
? ?
? ?
? ?
? ?
? ?
? ?
? ?
? ?
? ?? ?
? ?
? ?
? ?? ?
? ?
? ?
? ?
? ?? ? ? ?? ? ???
??
???
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
?
?
???
??????
????
? ?
?
? ?
?
? ?
?
? ?
?
1,
)1(~
1
1
1,0~
1
1,~
1
1
1
)
??
()(
??
1,
2
1,
2
2
2
2
22
2
2
2
2
2
2
2
2
2
????
??
?
??
?
??
??
tyytyy
s
xx
xx
yy
y
yy
y
yy
xx
xx
yy
xx
xx
xx
xx
xuyuxy
kniiknii
i
i
ii
i
ii
i
ii
i
i
ii
i
i
i
i
iiiiii
V a rSEV a rSEP
knt
n
E
V a rSE
E
N
V a rSE
E
n
EN
nn
baV a rV a rV a rba
)(已知
个别值的预测误差自然比一般水平的预测误差增大
5、滞后模型进行预测
7、案例分析 ——假日旅馆房间收入的预测
? 已知(美国 1970-1980年间):
? 房间总收入 =
? 房间租用率 X 房间总数 X 平均租金
? 要求:
? 根据美国假日旅馆近年来的年报和美国
政府公布的资料,预测假日旅馆明年房
间总收入?
REV OCCP RRATE ROOMS GNP PGNP UNEMP CPR
697.3471 68.5 15.55 179364.0 922.7 91.45 4.90 7.72
813.7161 67.4 16.50 200464.0 1077.6 96.01 5.90 5.11
962.5911 70.7 16.87 221113.0 1185.9 100.00 5.60 4.69
1121.7400 70.6 17.63 246913.0 1326.4 105.69 4.90 8.15
1223.5500 68.3 18.38 267032.0 1434.2 114.92 5.60 9.87
1369.2100 65.4 20.86 274969.0 1549.2 125.56 8.50 6.33
1539.0700 68.4 22.17 278064.0 1718.0 132.11 7.70 5.35
1780.4900 71.2 24.56 278957.0 1818.0 139.83 7.00 5.60
2160.9780 74.3 27.81 286529.0 2156.1 150.05 6.00 7.99
2605.0000 73.8 32.65 296251.0 2413.9 162.77 5.80 10.91
2915.5300 71.5 36.80 303578.0 2627.4 177.45 7.10 12.29
资料( LX4\SHM31)
a? á? ?? ?? aê o? ò? ??μ¥ ??
F J Z S R ?? ?? ?ü ê? è? £? ?? í? ?à ?2
FZ ?? ?a £ ?? ?ù ?? ìì ?a 3? ?? ?? μ? ?? ?? aè
F J S H M ?? è? ?? 1Y ?? ?? ?ü êy
G N P ?à 1ú 1ú ?? éú 2ú ?ü ?μ £¨ó? ?? ?? ?? £?
P G N P aí ê? G N P òt o? μ? ?? ?? ò? ?× £? ó? ò? DT ?y G N P ìT 3y ?? ?? ò? ?×
S H Y L ?à 1ú ê§òμ ?ê
S Y Z Q L L ?÷ òa éì òμ ?¤èˉ à? ?ê
预测步骤
? 1、预测房间租用率 FJZYL
? 2、预测平均房租 FZ
? 3、预测房间数目 FJSHM
? 4、预测房间总收入
? =FJZYL X FZ X FJSHM
分析房间租用率
? 假日旅馆的房间租用率与美国经济形势
有关,而失业率是一个反映经济形势的
很好的指标
? 而且,经验表明短期利率是反映和预测
今后一般经济活动很好的指标
? 当然,不能仅用失业率的下降趋势来解
释租用率的上升,它们还受发展趋势的
影响,所以生成一个增长趋势指标 QSH
租用率关于失业率和趋势回归
考虑不知道当期值不能预测
当含有被解释变量滞后值滞后就不使用趋势变量
引入商业证券利率
预测房租
预测房间数目
Variable Coefficient Std,Error T-Statistic Prob,
SHYL -1.854182 0.385229 -4.813194 0.0013
QSH 0.784188 0.134062 5.849461 0.0004
C 69.87705 2.329669 29.99441 0.0000
R-squared 0.831986 Mean dependent var 70.00909
Adjusted R-squared 0.789983 S.D,dependent var 2.703499
S.E,of regression 1.238950 Akaike info criterion 0.655529
Sum squared resid 12.27998 Schwartz criterion 0.764046
Log likelihood -16.21373 F-statistic 19.80757
Durbin-Watson stat 1.556777 Prob(F-statistic) 0.000797
租用率关于失业率 和趋势回归
? 由于不能事先得到 1981年的失业率,所
以不能利用上述方程进行预测,
? 但是方程反映出变量之间的关系,进一
步证实租用率与失业率有非常相似的周

? 不过,假日旅馆的租用率呈上升趋势,
大约每年递增 0.7%
8、指数平滑预测
? ?
? ?10
1
1
?
?
??
1
1
??
?
???
?
?
??
??
平滑常数
期的平滑值(预测值)在平滑序列
期的实际值在平滑序列
期的平滑值(预测值)在平滑序列
ty
ty
ty
y
y
y
yyy
t
t
t
ttt
指数平滑法的使用
指数平滑报告表
第六节 复习与提高
? 1、随机扰动项的分布
? 2、因变量 Yi的分布
? 3、回归分析估计量的分布
? 4、影响预测的精度因素
1、随机扰动项的分布
? ?
? ? ? ?
? ?
? ? ? ?? ?
? ?)?(),?(~)?(
,~
??
,~
,0,0..~
,0..~
2
11
2
22
2
YV a rYENYE
XXBNBYXXXB
XBN
NNii
dii
y
u
u
i
i
i
?
????
?
?
?
??
?
?
??
?

估计出结论可靠性)和区间为了进行假设检验(给
2、因变量 Yi的分布
? ?
? ??
?
2
2
,~
,0~
xy
uuxy
ii
iiii
baN
Nba
?
?
???
3、回归分析估计量的分布
? ?
? ?
? ?
? ? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
? ?
? ?
?
?
?
?
2
2
2
2
2
2
2
1
,~
?
1
,~?
,~
,0~
xx
xx
x
xy
uuxy
i
i
i
i
iii
i
bNb
n
aNa
baN
Nba
的分布和 yy
ii
?
? ?
? ?
? ?
? ?
? ?
? ?
? ?
? ?
??
??
2
2
2
2
2
2
2
2
1
1
1
1,~
11
,~
??
?
???
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?????
? ?? ?
? ?? ?
xx
x
y
xx
x
yy
xx
x
y
xx
x
yy
xyuxy
i
i
i
i
i
ii
i
i
i
i
i
ii
iiiii
x
n
V a r
x
n
EN
x
n
V a r
x
n
EN
baba
4、影响预测的精度因素
? 1,???( 1-?) ??t???预测误差 ?
(只有这么多信息,可靠性 ??预测误差
?,可靠性 ??预测误差 ?)
? 2,x?均值 ?预测误差 ?
? 3,x方差 ??预测误差 ?
? 4,n ??预测误差 ?
? ?? ? ? ?
? ?
? ?? ? ? ?? ? ??? ???
?
?
?
?
?
????
?
?
?
?
?
?
?
?
?
?
??
??
????
? ?
?
1,
1
??
1,
2
1,
2
2
2
2
??
?
tyytyy
s
xx
xx
y
xy
kniiknii
i
i
i
ii
V a rSEV a rSEP
n
V a rSE
ba