第九章 回归预测什么是回归预测回归预测的常用方法一元线性回归一元非线性回归二元线性回归二元非线性回归多元线性回归多元非线性回归
9.1 回归预测概述( 1)
回归预测以因果关系为前提,应用统计方法寻找一个适当的回归模型,对未来市场的变化进行预测。
回归分析具有比较严密的理论基础和成熟的计算分析方法;回归预测是回归分析在预测中的具体运用。
在回归预测中,预测对象称为因变量,相关的分析对象称为自变量。
回归分析根据自变量的多少分为一元回归分析、二元回归分析与多元回归分析,但有时候二元回归分析被并入到多元回归分析之中;回归分析根据回归关系可分为线性回归分析与非线性回归分析。
9.1 回归预测概述( 2)
回归分析的 基本步骤 如下:
第一步:判断变量之间是否存在有相关关系第二步:确定因变量与自变量第三步:建立回归预测模型第四步:对回归预测模型进行评价第五步:利用回归模型进行预测,分析评价预测值
9.2 一元线性回归预测一元线性回归预测是在一个因变量与一个自变量之间进行的线性相关关系的回归预测。
一元线性回归的基本步骤如下:
第一步:绘制散点图,观察自变量与因变量之间的相互关系;
第二步:估计参数,建立一元线性回归预测模型 ;
第三步,对预测模型进行检验 ;
第四步,计算与确定置信区间 。
9.2.1 建立一元线性回归预测模型一元线性回归预测的基本模型如下:
xbya
xxx
yxxy
xxn
yxxyn
b
bxay
222
)(
其中
9.2.2 预测模型检验相关系数检验相关系数是描述两个变量之间线性关系能密切程度的数量指标。相关系数 r的取值范围是 [-1,1]。若 r=1则说明完全正相关,若 r=-1则说明完全负相关; r=0说明不相关; r的值在( 0,1)之间则正相关,
在( -1,0)之间则为负相关。
t检验
t检验是利用 t统计量来检验回归参数 a和 b是否具有统计意义。
9.2.2 预测模型检验(相关系数检验)
相关系数的计算公式是:
另一个来自于方差分析的相关系数的计算公式是:
2222
22
)(
1
)(
1
1
)()(
))((
y
n
yx
n
x
yx
n
xy
r
yyxx
yyxx
r
或者写成
2
2
)(
)(1
yy
yyr?
9.2.2 预测模型检验( t检验)
t检验使用的统计量计算公式是:
不成立。线性相关成立。反之则当有取其中
)2(
050
)()2(
)(
2
2
2
ntt

xxn
yy
S
S
b
t
b
b
9.2.3 计算与确定置信区间由于预测值与实际值之间存在有不确定的偏差,因而需要确定预测值的有效区间,即置信区间。
一元线性回归预测的置信区间有下述表达式确定:
为给定值。
其中
],[
:置信区 间
0
2
2
0
2
22
)(
)(1
1
2
)(
)(
)()2()()2(
x
xx
xx
nn
yy
yS
ySntyySnty
9.2.4 一元线性回归预测案例研究( 1)
例,x,y两变量的观察数据如下表所示,根据数据进行回归预测。
数据序号 x y x2 y2 xy
1 1.5 4.8 2.25 23.04 7.20
2 1.8 5.7 3.24 32.49 10.26
3 2.4 7.0 5.76 49.00 16.80
4 3.0 8.3 9.00 68.89 24.90
5 3.5 10.9 12.25 118.81 38.15
6 3.9 12.4 15.21 153.76 48.36
7 4.4 13.1 19.36 171.61 57.64
8 4.8 13.6 23.04 184.96 65.28
9 5.0 15.3 25.00 234.09 76.50
合计 30.3 91.1 115.11 1036.65 345.09
9.2.4 一元线性回归预测案例研究( 2)
根据前表可知:
xbxay
xbya
xxn
yxxyn
b
9 3 0 3.22 5 7 9.0
2 5 7 9.0
9
3.30
9 3 0 3.2
9
1.91
9 3 0 3.2
3.3011.1 1 59
1.913.3009.3 4 59
)(
222
所以有
9.2.4 一元线性回归预测案例研究( 3)
相关系数检验。
根据前表数据以及相关系数计算公式可知本例为显著线性相关。
)7(
6 6 6.0)7()29()2(
9 9 1 1.0
1.91
9
1
65.1 0 3 63.30
9
1
11.1 1 5
1.913.30
9
1
09.3 4 5
)(
1
)(
1
1
05.0
05.005.0
22
2222
rr
rrnr
y
n
yx
n
x
yx
n
xy
r
即有查表得
9.2.4 一元线性回归预测案例研究( 4)
t检验。 t检验的分析计算表如下:
数据序号 x y
1 1.5 4.8 4.65 -1.87 0.15 3.50 0.02
2 1.8 5.7 5.53 -1.57 0.17 2.46 0.03
3 2.4 7.0 7.29 -0.97 -0.29 0.94 0.08
4 3.0 8.3 9.05 -0.37 -0.75 0.14 0.56
5 3.5 10.9 10.51 0.13 0.39 0.02 0.15
6 3.9 12.4 11.68 0.53 0.72 0.28 0.52
7 4.4 13.1 13.15 1.03 -0.05 1.06 0.00
8 4.8 13.6 14.32 1.43 -0.72 2.04 0.52
9 5.0 15.3 14.91 1.63 0.39 2.66 0.15
合计 13.1 2.03
y? xx? yy 2)( xx? 2)( yy
9.2.4 一元线性回归预测案例研究( 5)
根据上表数据以及 t统计量的计算公式有:
线性相关成立。
即有取
)7(6 9 2.19
3 6 5.2)7()2(
050
6 9 2.19
1 4 8 8.0
9 3 0 3.2
1 4 8 8.0
1.13)29(
03.2
)()2(
)(
025.0
025.0
2
2
2
tt
tnt

S
b
t
xxn
yy
S
b
b
9.2.4 一元线性回归预测案例研究( 6)
计算确定置信区间。计算得到置信区间为 [10.42,13.54],具体计算过程如下:
54.136 6 1 2.03 6 5.298.11)()2(
42.106 6 1 2.03 6 5.298.11)()2(
6 6 1 2.0
1.13
)37.34(
9
1
1
29
03.2
)(
)(1
1
2
)(
)(
2
2
0
2
2
2
0
2
ySnty
ySnty
x
xx
xx
nn
yy
yS
4)( 令
9.3 一元非线性回归预测一元非线性回归预测的基本步骤一元非线性回归预测的主要模型指数曲线模型双曲线模型对数曲线模型
S型曲线模型案例研究
9.3.1 一元非线性回归预测的基本步骤一元非线性回归预测的 基本步骤 如下:
第一步:确定非线性回归模型的类型。
第二步:通过变换将非线性方程转化为线性方程。
第三步:用最小二乘法建立回归方程。
第四步:进行逆变换,将线性方程转换为需要的非线性方程。
9.3.2 指数曲线模型设有指数曲线如下:
bxay
aayy
bxaeay
aey
bx
bx
则有:
设两边取对数:
ln,ln
lnlnlnln
9.3.3 双曲线模型设有双曲线方程如下:
xbay
x
x
y
y
x
ba
y
则有:

1
,
1
11
9.3.4 对数曲线模型设有对数曲线方程如下:
xbay
x
xbay
则有:
logx 设
lo g
9.3.5 S型曲线模型设有 S形曲线方程如下:
xbay
ex
y
y
bea
y
x
x
则有:
设,
1
1
9.3.6 一元非线性回归预测案例研究( 1)
根据下表资料预测 2002年变量值。
观察年份 1994 1995 1996 1997 1998 1999 2000 2001
时序 (x) 1 2 3 4 5 6 7 8
观察值 (y) 3.0 4.2 5.7 8.3 11.5 16.0 22.4 31.0
9.3.6 一元非线性回归预测案例研究( 2)
根据上表可绘制出时间序列的散点图如下:
观 察 值时间 序列散点 图
0
5
10
15
20
25
30
35
0 2 4 6 8 10
时 序观察值系列 1
9.3.6 一元非线性回归预测案例研究( 3)
所以在本例中,预测模型的类型应该是指数曲线。即有:
bxay
aayy
bxaeay
aey
bx
bx
则有:
设两边取对数:
ln,ln
lnlnlnln
9.3.6 一元非线性回归预测案例研究( 4)
由最小二乘法有:
x
ey
xy
xb
n
y
aa
xxn
yxyxn
b
335.0761.0
222
335.0761.0
761.0
8
36
335.0
8
1485.18
ln
335.0
362048
1485.18367378.958
)(
即有:
所以有:
9.4 多元线性回归预测二元一次线性回归预测多元线性回归方程的矩阵解法
9.4.1 二元一次线性回归预测( 1)
二元一次线性回归的预测模型是:
二元一次线性回归的正规方程是:
2211 XbXbaY
2211
22
2
22222111
1122112
2
111
))(()())((
))(())(()(
XbXbYa
YYXXXXbXXXXb
YYXXXXXXbXXb
iiiii
iiiii
9.4.1 二元一次线性回归预测( 2)
例:根据下表进行二元一次线性回归预测。
时序 1 2 3 4 5 6 7 8 9 10 合计
516 557 641 682 736 813 824 901 1115 1410 8195
31.8 34.3 40.5 45.3 43.5 47.7 47.1 49.1 58.5 71.2 469
49 56 63 66 77 96 99 113 162 225 1006
228.01 158.76 40.96 2.56 11.56 0.64 0.04 4.84 134.56 590.49 1172.42
2662.56 1989.16 1413.8 1197.2 556.96 21.16 2.56 153.76 3769.96 15476.4 27242.4
779.16 561.96 240.64 55.36 80.24 -3.68 -0.32 27.28 712.24 3022.92 5475.8
4582.25 3307.5 1142.4 220 283.9 -5.2 0.9 179.3 3427.8 14349.2 27488.6
15860.6 11707.5 6711.6 4757.5 1970.6 29.9 -7.2 1010.6 18143.7 73458.2 133443
Y
iX1
iX2
211 )( XX i?
222 )( XX i?
))(( 2211 XXXX ii
))(( 11 YYXX ii
))(( 22 XXYY ii
9.4.1 二元一次线性回归预测( 3)
将有关数据代入到正规方程,得到:
21
2211
22
21
21
21
03259.3282288.908.79
08.796.10103259.39.46282288.95.819
03259.3
8.54754.2724242.1172
8.54756.2748842.1172133443
282288.9
8.54754.2724242.1172
8.54751334434.272426.27488
1334434.272428.5475
6.274888.547542.1172
XXY
XbXbYa
b
b
bb
bb
解方程有:
9.4.2 多元线性回归方程的矩阵解法( 1)
设有多元一次线性方程组如下所示:
nmnmmmm
nn
nn
nn
XbXbXbXbbY
XbXbXbXbbY
XbXbXbXbbY
XbXbXbXbbY
.,,
.,,
.,,
.,,
3322110
232322212102
131321211101
3322110
9.4.2 多元线性回归方程的矩阵解法( 2)
所以有:
mnmm
n
n
nm
nmnmm
n
n
m
xxx
xxx
xxx
X
b
b
b
B
Y
Y
Y
b
b
b
xxx
xxx
xxx
Y
Y
Y
21
22221
12111
2
1
2
1
2
1
21
22221
12111
2
1
1
1
1
1
1
1
Y

9.4.2 多元线性回归方程的矩阵解法( 3)
所以有:
XX
XXa d j
XX
YXXXB
XBXXXYXXX
XBXYX
XBY
T
T
T
TT
TTTT
TT
)(
)(
)(
)()(
1
1
11
其中
9.4.2 多元线性回归方程的矩阵解法( 4)
例:若有如下资料,请求回归方程。
时序 因变量 (y) 自变量 (x1) 自变量 (x2)
1 10 2 1
2 12 2 2
3 17 8 10
4 13 2 4
5 15 6 8
6 10 3 4
7 14 5 7
8 12 3 3
9 16 9 10
10 18 10 11
9.4.2 多元线性回归方程的矩阵解法( 5)
本例计算过程如下:
4 8 03 9 860
3 9 83 3 650
605010
11101
221
121
1121
1022
111
11101
221
121
18
12
10
XX
X
T
Y
9.4.2 多元线性回归方程的矩阵解法( 6)
21
1
6 1 7 4.01 2 6 5.03 8 7 1.9
6 1 7 4.0
1 2 6 5.0
3 8 7 1.9
9 0 8
7 5 6
1 3 7
8 6 09 8 02 6 0
9 8 01 2 0 01 2 0
2 6 01 2 02 8 7 6
7 1 6 0
1)(
)(
9 0 8
7 5 6
1 3 7
18
12
10
1121
1022
111
8 6 09 8 02 6 0
9 8 01 2 0 01 2 0
2 6 01 2 02 8 7 6
)(
XXY
YX
XX
XXa d j
YXXXB
YX
XXa d j
T
T
T
TT
T
T
相关系数检验表
0.05 0.01 0.05 0.01 0.05 0.01
1 0.997 1.000 11 0.553 0.684 21 0.413 0.526
2 0.950 0.990 12 0.532 0.661 22 0.404 0.515
3 0.878 0.959 13 0.514 0.641 23 0.396 0.505
4 0.811 0.917 14 0.497 0.623 24 0.388 0.496
5 0.754 0.874 15 0.482 0.606 25 0.381 0.487
6 0.707 0.834 16 0.468 0.590 26 0.374 0.478
7 0.666 0.798 17 0.456 0.575 27 0.367 0.470
8 0.632 0.765 18 0.444 0.561 28 0.361 0.463
9 0.602 0.735 19 0.423 0.549 29 0.355 0.456
10 0.576 0.708 20 0.423 0.537 30 0.349 0.449
2?n 2?n 2?n