第八章 预测技术
第八章 预测技术
第一节 定性预测法
第二节 简单线性回归
第三节 时间序列
【 案例应用 】 预测学生综合测验
成绩
【 计算机应用 】
消费者调查股份有限公司
( Consumer Research,Inc.)是
一家独立的机构,该机构为各种类
型的厂商调查消费者的态度和行为。
在一项研究中,客户为了能预测用
信用卡进行支付的数额,要求对消
费者的特点进行调查研究。
【 开篇案例 】
消费者调查股份有限公司
对于由 50名消费者组成的一个
样本,采集了有关年收入、家庭
成员人数和年信用卡支付数额的
统计资料见讲义:
【 讨论题 】
1.你知道用什么方法整理这些数据吗?
2,上述数据能向我们提供哪些有用
的信息呢?
广义的预测,既包括在同一时期
根据已知事件测定未知事件的静态预
测,也包括根据现有的已知事件测定
未来的未知事件的动态预测。
狭义的预测,仅指动态预测。预测
理论作为通用的方法论,既可以应用
于研究自然现象,又可应用于研究社
会现象。
将预测理论、方法和个别领域
现象发生的实际相结合,就产生
了预测的各个分支。如社会预测、
人口预测、经济预测、政治预测、
科技预测、军事预测、气象预测
等等。
第一节 定性预测法
一、定性预测概述
定性预测是预测者根据自己掌握
的实际情况、实践经验、专业水平,
对经济发展前景的性质、方向和程
度做出的判断。
由于定性预测主要靠预测者的经
验和判断力, 易受主观因素的影响,
主要目的不在数量估计, 为了提高
定性预测的准确程度, 应注意以下
几个问题:
第一, 应加强经济调查研究, 努
力掌握影响经济发展的有利条件,
不利因素和各种活的情况, 从而使对
经济发展前景的分析判断更加接近实
际 。
第二, 进行经济调查研究, 搜集资
料时, 应数据和情况并重;使定性分
析数量化 。 也就是通过质的分析进行
量的估计, 进行有数据有情况的分析
判断, 提高定性预测的说服力 。
第三,应将定性预测和定量预测
相结合,提高经济预测质量。在经济
预测过程中,应先进行定性分析,为
经济预测开路;然后进行定量预测,
使经济预测具体化,最后再进行定性
分析,对经济预测进行调整定案。
二、市场调查预测法
1,经营管理人员意见调查预测法
这种方法是由企业的经理(厂
长)召开熟悉市场情况的各业务主
管人员的座谈会,将与会人员对市
场商情的预测意见,加以归纳、分
析、判断,制定企业的预测方案。
这种预测方法的优点是使上下结
合进行预测,有利于调动经理(厂长)
和业务管理人员开展市场预测的积极
性,发挥集体智慧;再加上他们处于
生产与经营管理第一线,领导与管理
企业的产供销活动,熟悉市场商情的
动向,他们的判断接近市场商品供需
发展变化实际,使预测结果比较准确
可靠。
这种方法的缺点是,对市场商情
的变化了解得不够深入具体,主要靠
经验判断,受主观因素影响大,只能
作出粗略的数量估计。
2.销售人员意见调查预测法(推销人
员估计法)
这种方法是向销售人员进行调查,
征询他们对产销情况、市场动态以及
他们对自己负责的销售区、商店、柜
台未来销售量(额)的估计,加以汇
总整理,对市场销售前景做出综合判
断。
这种预测除由公司、企业管理部
门提供必要的调查统计资料和经济信
息外,主要依靠销售人员掌握的情况、
经验、水平和分析判断能力,还要经
过从基层到企业管理部门逐级审核、
汇总和经理厂长批准才能定案。
这种预测方法的优点是销售人员
在市场前哨,最接近顾客,熟悉市场
情况,预测经过多次审核、修正,比
较接近实际;根据预测确定的销售任
务由自己负责完成,使销售人员具有
光荣感和责任感,易于发挥积极性和
首创精神。
其缺点是,销售人员为了超额完成
销售计划,获得奖金,估计易于偏于
保守,由于工作岗位所限,对经济发
展和市场变化全局了解不够,所预测
的结果有一定局限性。
3.商品展销、订货会调查预测法
这种方法是通过商品展销、订货
会直接向用户发表调查,以了解用户
对商品的花色、品种、质量、价格的
意见和需求量,将意见加以汇总整理,
综合判断商品销售的发展前景。
4.消费者购买意向调查预测法
这种方法是采用随机抽样或典型
调查方式,从调查对象中抽取一定数
目的消费者,通过发表、访问进行调
查,将消费者的购买意向加以汇总分
析,推断商品未来需要量的方法。
三、专家评估法 —— 德尔菲预测法
专家评估法是向一组专家征询意
见, 将专家们过去历史资料的解释和
对未来的分析判断汇总整理, 尽可能
取得统一意见, 对经济现象发展变化
前景进行预测的方法 。
专家评估法的特点
( 1)匿名性
( 2)反馈性
( 3)集中性
四、主观概率法
主观概率法是对市场调查预测法,
专家评估法的不同定量估计, 进行集
中整理的常用方法 。 主观概率是指在
一定条件下, 个人对某一事件在未来
发生或不发生可能性的估计, 反映个
人对未来事件的主观判断和信任程度 。
主观概率 也必须符合概率论的基
本公理,即每一事件发生的概率大干
等于零,小于等于 1;必然发生的事
件概率等于 1,必然不发生的事件概
率等于零;两个互斥事件之和的概率
等于它们的概率之和。
客观概率,是指某一随机事件经
过反复试验后,出现的相对次数,
也就是对某一随机事件发生的可能
性大小的客观度量。如掷一枚硬币,
出现国徽面和出现数字面的客观概
率各为 1/2。
客观概率与主观概率的根本区别
在于,客观概率具有可检验性,主
观概率则不具有这种可检验性。
第二节 简单线性回归
管理决策,经常取决于对两个或
更多个变量的分析。
通常管理人员要依靠直觉去判断
两个变量的关系。但是,如果能取
得数据,就能利用统计方法去建立
一个表示变量间相互关系的方程,
我们将这一统计方法称为回归分析。
在回归术语中,把被预测的变
量称为因变量,把用来预测因变
量值的一个或多个变量称为自变
量。
一、简单线性回归模型
某连锁店是经营快餐的餐馆,坐
落在 5个不同的地区内。连锁店的最
佳位置是在大学校园附近。管理人员
确信,这些连锁店的季度销售收入
(用 y表示)与学生人数(用 x表示)
是正相关的。
利用回归分析,我们能求出一个
说明因变量 y是如何依赖自变量 x的方
程。
1.回归模型和回归方程
描述 y如何依赖于 x和误差项的方
程称为回归模型。
简单线性回归模型:
0?
??? ??? xy 10
??? ??? xy 1
0
β 0和 β 1称为模型的参数,ε
是被称为误差项的随机变量。误
差项说明了包含在 y里面但不能被
x和 y之间的线性关系解释的变异
性。
描述 y的平均值如何依赖于 x的方程
称为回归方程。对于简单线性回归情
形,回归方程如下:
x10 ?? ?
xyE 10)( ?? ??
简单线性回归方程的图示是一
条直线; β 0是回归直线的截矩,
β 1是斜率,对于一个给定的 x值,
E( y)是 y的平均值或期望值。
2.估计的回归方程
在实际中参数 β 0和 β 1的值未知,
必须利用样本数据去估计它们,我们
计算样本统计量 b0和 b1作为参数 β 0和
β 1的估计。用样本统计量 b0和 b1替代
回归方程中的未知参数 β 0和 β 1,得
到估计的回归方程。
xbby 10? ??
xbby 10? ??
对于简单线性回归情形,估计的回
归方程如下:
简单线性回归的估计步骤
回归模型
回归方程
未知参数
样本数据
x y
x1 y1
x2 y2
估计量 估计的回归方程 样本统计量
b0和 b1
注释:不能把回归分析看作是在
变量间建立一个因果关系的过程 。
回归分析只能表明, 变量是如何或
者是以怎样的程度彼此联系在一起 。
有关因果关系的任何结论, 必须建
立在对个体或许多个体的有关应用
的大量信息的判断基础上 。
二、最小二乘法
最小二乘法是利用样本数据求估
计的回归方程的一种方法。为了说
明最小二乘法,假定由位于大学校
园附近的 10家连锁店组成一个样本,
并对这个样本采集有关数据。对一
样本中的第 i家连锁店,表示学
生人数(千名),表示销售收入
(千元)。
ix
iy
ix
ix
iy
10家连锁店的学生人数和季度销售收入数据
连锁店( i) 学生人数( ) /千人 销售收入( ) /千美元
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
iyix
连锁店的学生人数和季度销售收入散点图






/


学生人数 /千人
y
20
40
6080
100
120
140
160
180
200
220
0 2 4 6 8 10 12 14 16 18 20 21 24 26 x
选择用简单线性回归模型来描述
季度销售收入与学生人数之间的关系。
在这一选择的假定下,接下来是利用
上表中的样本数据,去决定估计的简
单线性回归方程中的 b0和 b1的值。
式中,为第 i家连锁店的学生人
数(千人); 为估计的回归直线的
截距; 为估计的回归直线的斜率;
为第 i家连锁店季度销售收入的估计
值(千元)。
ix
1b
0b
ii xbby 10? ??
对于第 i家连锁店,估计的简单线
性回归方程是
最小二乘准则
最小二乘法是利用样本数据,通过
使应变量的观测值与估计值之间的离
差平方和达到最小的方法求得 和
的值。
最小二乘法准则,
0b 1b
? ? 2)?(m in ii yy
式中,为对第 i次观测,因变
量的观测值; 为对第 i次观测,
因变量的估计值。微分学可以证明,
估计的回归方程的斜率和截距
? ?
? ??
?
?
?
nxx
nyxyx
b
ii
iiii
/)(
/)(
221
xbyb 10 ??
iy
iy?
式中,为对第 i次观测,自变
量的观测值; 为对第 i次观测,
因变量的观测值; 为自变量的
样本平均值; 为因变量的样本平
均值; n为总的观测次数。
x
iy
y
ix
在 10家连锁店的例子中,应用最
小二乘法估计回归方程的一些必要的
计算,在下表中列出。在这个例子中,
有 10家连锁店,或者说有 10次观测,
因此 n= 10。利用前面的公式和下表
中提供的资料,能计算连锁店的估计
的回归方程的斜率和截距。
连锁店的最小二乘估计的回归方程的计算
连锁店 i
1 2 58 116 4
2 6 105 630 36
3 8 88 704 64
4 8 118 944 64
5 12 117 1404 144
6 16 137 2192 256
7 20 157 3140 400
8 20 169 3380 400
9 22 149 3278 484
10 26 202 5252 676
合计 140 1300 21040 2528
iiyx
2ixix iy
? 2ix?ix ?iy ? ii yx
5
10/1402528
10/)1300140(21040
/)(
/)(
2
221
?
?
??
?
?
?
?
? ?
? ??
nxx
nyxyx
b
ii
iiii斜率的计算过程如下,
截距 b0的计算如下:
14
10
140 ??? ?
n
x
x i 13010
1300 ??? ?
n
y
y i
601451 3 010 ?????? xbyb
于是,应用最小二乘法得到的估计
的回归方程是为
xy 560? ??
斜率 b1=5






/


学生人数 /千人
20
y
40
60
80
100
120
140
160
180
200
220
截距
b0=60 0 2 4 6 8 10 12 14 16 18 20 21 24 26 x
注释:最小二乘法是通过使因变
量的观测值 和因变量的估计值
之间的离差平方和达到最小的方法,
得到了一个估计的回归方程。最小二
乘准则就是选择与样本数据有最佳拟
合的方程的原则。如果利用某些其他
准则,例如最小化 和 之间的绝
对离差的和,将得到一个不同的方程。
在实践中,最小二乘法是应用最广泛
的方法。
iy
iy
iy?
iy?
第三节 时间序列
时间数列是一个变量在一个连续
时点或一个连续时期上测量的观测值
的集合。本节将介绍几种分析时间数
列的方法,这些分析的目的是对时间
数列的未来值提供合适的预测或判断。
一、时间数列的成分
1.趋势成分
在时间数列的分析中,可以每
小时、每天、每星期、每月、每年
或每隔任何一段时间进行测量。尽
管时间数列的资料一般呈现随机起
伏的形态,但在一段较长的时间内,
时间数列仍然呈现逐渐增加或逐渐
减少的转变或变化。时间数列的逐
渐转变称为时间数列的趋势。
1988 1993 1998
26000
22000
18000
年份
·
·
·
··
·
·
·
·
·
·
年销售量/台
照相机销售的线性趋势
2,循环成分
尽管一个时间数列可以显示长期趋
势,但时间数列的所有未来值不可能
准确地落在趋势线上。事实上,时间
数列常常呈现环绕趋势线上、下的波
动。任何时间间隔超过一年的环绕趋
势线上、下的波动都可归结为时间数
列的循环成分。下图是一个有明显循
环成分的时间数列的图形,它是以一
年为一个时间间隔来得到观测值。
时间
数量
趋势线
循环成分由环绕趋势线上、下波
动的观察值表示
时间数列的趋势和循环成分
3,季节成分
尽管时间数列的趋势和循环成分
根据分析历史料各年的运动而识别,
但许多时间数列往往显示在一年内有
规则的运动。
4,不规则成分
时间数列的不规则成分是剩余的
或, 包罗万象, 的因素, 它用来说明
在分离了趋势, 循环和季节成分的给
定期望值后, 时间数列值的真正偏差 。
二、利用平滑法进行预测
1,移动平均法
移动平均法使用时间数列中
最近几个时期数据值的平均数作
为下一个时期的预测值 。 因此,
移动平均数的计算公式为:
n
n 期数据和最近移动平均数=
汽油销售时间数列
周 销售量 /升 周 销售量 /升
1 17 7 20
2 21 8 18
3 19 9 22
4 23 10 20
5 18 11 15
6 16 12 22
0 1 2 3 4 5 6 7 8 9 10 11 12
5
10
15
20
25




/

汽油销售量的图形
为了用移动平均法预测汽油的销
售量,首先应选择移动平均法中包含
的数据值的个数。我们以 3周的移动
平均数计算预测值为例,加以说明。
汽油销售量时间数列的第一个 3周的
移动平均数的计算结果为
19
3
192117)3~1( =++=周第移动平均数
然后用这个移动平均数作为第 4
周的预测值。由于第 4周的实际值为
23,则第 4周的预测误差为 23-19= 4。
一般地,任何与预测相关的误差是指
时间数列的实际值与预测值之间的差
数。
第二个移动平均数的计算为
21
3
329112)4~2( =++=周第移动平均数
汽油销售量时间数列的第一个
3周的移动平均数的计算结果为
213 329112)4~2( =++=周第移动平均数 一般地, 任何与预测相关的误差
是指时间数列的实际值与预测值之间
的差数 。 第二个移动平均数的计算为
误差平方和的平均数 = 22.10
9
92 ?
预测精度 。 在选择预测方法时,
需要考虑的一个重要事情就是预测
精度 。 显然我们希望预测误差很小 。
误差平方和的平均数通常称为
均方误差 ( MSE), 均方误差是最
常用的预测方法精度的测度, 也是
本节所要用到的 。
周 时间数列值 移动平均预测值 预测误差 预测误差的平方
1 17
2 21
3 19
4 23 19 4 16
5 18 21 -3 9
6 16 20 -4 16
7 20 19 1 1
8 18 18 0 0
9 22 18 4 16
10 20 20 0 0
11 15 20 -5 25
12 22 19 3 9
合计 - - 0 92
0 1 2 3 4 5 6 7 8 9 10 11 12
5
10
15
20
25




/

3 周移动平均预测值
汽油销售量和 3周移动平均预测的图形
2,加权移动平均法
加权移动平均法, 需要对每个数据
值选择不同的权数, 然后计算最近个
时期数值的加权平均数作为预测值 。
在大多数情况下, 最近时期的预测
值应取得最大的权数, 而比较远的时
期权数应依次递减 。
n
用汽油销售量时间数列来说明 3周
加权移动平均数的计算。最近时期观
测值的权数为最远时期观测值的 3倍
,中间时期观测值的权数为最远时期
的 2倍,则第 4周的预测值为:
33.191963216217614 =++周的预测值=第 ???
3,指数平滑法
指数平滑法是用过去时间数列值的
加权平均数作为预测值, 它是加权移
动平均法的一种特殊情形 。 这里只选
择一个权数, 即最近时期观测值的权
数, 其它时期数据值的权数可以自动
推算出来, 而且当观测值离预测时期
越久远时, 权 数变得越小 。 基本指数
平滑法模型为:
t1
)-(1 FYF
tt
?? ??
?
周( t)
1 17
2 21 17.00 4.00
3 19 17.80 1.20
4 23 18.04 4.96
5 18 19.03 -1.03
6 16 18.83 -2.83
7 20 18.26 1.74
8 18 18.61 -0.61
9 22 18.49 3.51
10 20 19.19 0.81
11 15 19.35 -4.35
12 22 18.48 3.52
时间数列值 ( ) 指数平滑预 测( ) 预测误差( )
tY tF tt FY ?
汽油销售量的指数平滑预测和预则误差的总结
周( t) 时间数列值 ( Y
t)
预测( Ft) 预测误差( Y
t- Ft)
预测误差平方
( Yt- Ft) 2
1 17
2 21 17.00 4.00 16.00
3 19 17.80 1.20 0.64
4 23 18.04 4.96 20.79
5 18 19.03 -1.03 3.28
6 16 18.83 -2.83 10.69
7 20 18.26 1.74 2.92
8 18 18.61 -0.61 0.64
9 22 18.49 3.51 11.83
10 20 19.19 0.81 0.17
11 15 19.35 -4.35 22.18
12 22 19.48 -3.52 13.69
合计 - - - 102.83
周( t) 时间数列值 ( Y
t)
预测
( Ft)
预测误差
( Yt- Ft)
预测误差平方
( Yt- Ft) 2
1 17
2 21 17.00 4.00 16.00
3 19 18.20 0.80 0.64
4 23 18.44 4.56 20.79
5 18 19.81 -1.81 3.28
6 16 19.27 -3.27 10.69
7 20 18.29 1.71 2.92
8 18 18.80 -0.80 0.64
9 22 18.56 3.44 11.83
10 20 19.59 0.41 0.17
11 15 19.71 -4.71 22.18
12 22 19.80 3.70 13.69
合计 - - - 102.83
三、利用趋势推测进行预测
本节将说明如何对拥有长期
线性趋势的时间数列进行预测 。
这类时间数列随时间呈现持续增
加或减少的形态, 因此趋势推测
法是可行的 。
考虑一个特殊工厂过去 10年的自
行车销售量时间数列, 资料见表 6
和图 8。 注意第 1年销售了 21600辆,
第 2年销售了 22900辆, …, 第 10年
( 即最近一年 ) 销售了 31400辆,
尽管图 8显示在过去 10年中销售量
有上下波动, 但时间数列总的趋势
是增长的或向上的 。
年( t) 销售量 /千辆 年( t) 销售量 /千辆
1 21.6 6 27.5
2 22.9 7 31.5
3 25.5 8 29.7
4 21.9 9 28.6
5 23.9 10 31.4
自行车销售量时间数列
自行车销售量时间数列的图形
0 1 2 3 4 5 6 7 8 9 10
20
21
22
23
24
25
26
27
28
30
31
32
29



量/


用线性函数对自行车销售量的趋势描述
0 1 2 3 4 5 6 7 8 9 10
20
21
22
23
24
25
26
27
28
30
31
32
29



量/


自变量 x和因变量 y之间直线关系的估计回
归方程为:
xbby 10? ??
tbbY t 10 ??
ntt
nYttY
b
tt
/)(
/)(
221 ? ?
? ??
?
?
?
tbYb 10 ??
线性趋势方程计算斜率( b
1 )和截距( b0)的公
式为:1b0
tYttY2t1 21.6 21.6 1
2 22.9 45.8 4
3 25.5 76.5 9
4 21.9 87.6 16
5 23.9 119.5 25
6 27.5 165.0 36
7 31.5 220.5 49
8 29.7 237.6 64
9 28.6 257.4 81
10 21.4 314.0 100
合计 55 264.5 1545.5 385
t Y
ttY
2t
在自行车销售量时间数列的线
性趋势成分的表达式中, 斜率 1.1表
明在过去的 10年中, 商家每年的销
售量平均增长大约 1100个单位 。 如
果我们假设过去 10年的销售量的趋
势对未来是合适的, 则式 8可用来预
测时间数列的趋势成分 。
例如, 将 t =11代入式 8,可得到
下一年的趋势预测值, 即
可见, 仅仅根据趋势成分, 就可
以预测出下一年的自行车销售量为
32500辆 。
5.32114.2011 ???Y
非线性曲线形态的几种可能形式
t时间
a 指数趋势
t时间
b 冈珀茨增长曲线
tYtY
剔除季节影响的时间数列称为消
除季节影响的时间数列。剔除季节
影响后,一期与一期的对比将更有
意义,而且可以帮助确定是否存在
趋势。我们所介绍的方法适用于只
有季节影响的情形或同时有季节和
趋势成分的情形。
四、利用趋势和季节成分进行预测
首先是计算季节指数,并用
它们得到消除季节影响的资料;
然后,如果消除季节影响的
资料有明显的趋势,则用回归
分析估计该资料的趋势成分。
1.乘法模型
tttt ISTY ???
除了趋势成分( T)和季节成分
( S)外,假设时间序列还有不规则
成分( I)。不规则成分说明时间数
列中不能由趋势和季节成分解释说明
的任何随机影响。假设用 Tt,St和 It
分别表示 t期的趋势、季节和不规则
成分。用 Yt表示时间数列的数值,
tttt ISTY ???
在这个模型中,Tt是被预测项目
所测量出的趋势,但是,St和 It成分
由相应的项目测量,其数值大于 1.00
表明它们的影响在趋势之上,而小
1.00表明它们的影响在趋势之下。
则它可由下列时间数列的乘法模
型描述。
tttt ISTY ???
年 季度 销售量 /千台
1 1 4.8
2 4.1
3 6.0
4 6.5
2 1 5.8
2 5.2
3 68
4 7.4
3 1 6.0
2 5.6
3 7.5
4 7.8
4 1 63
2 5.9
3 8.0
4 8.4
2.季节指数的计算
下图表明每年第 2季度的销售量
最小,第 3和第 4季度的销售量是增
加的,因此对电视机销售量的资料,
可知存在季节影响。首先通过计算
移动平均数,将趋势成分 Tt与季节
和不规则成分 St和 It分开,然后使
用计算程序,确定每个季度的季节
影响。
电视机销售量时间数列的季度图形
8.0
7.0
6.0
5.0
4.0







量/


1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
第 1年 第 2年 第 3年 第 4年
年 /季度
年份 季度 销售量 /千件 4个季度的移动 平均数 中心化的移动 平均数
1 1 4.8
2 4.1 5.350
3 6.0 5.600 5.475
4 6.5 5.875 5.738
2 1 5.8 6.075 5.975
2 5.2 6.300 6.188
3 6.8 6.350 6.325
4 7.4 6.450 6.400
3 1 6.0 6.625 6.538
2 5.6 6.725 6.675
3 7.5 6.800 6.763
4 7.8 6.875 6.838
4 1 6.3 7.000 6.938
2 5.9 7.150 7.075
3 8.0
4 8.4
从下图可以看到中心化的移动平
均数,在, 消除, 了时间数列的季
节和不规则波动之后,有非常明显
的趋势。计算出的 4个季度的移动
平均数中,将不包含由于季节影响
产生的波动,这时因为季节影响已
经被去掉了。中心化的移动平均数
中每一个点表示的是没有季节或不
规则波动的时间数列的值 。
用时间数列的第一个观察值除以
相应的中心化的移动平均数,可以
确定时间数列的季节不规则影响值。
例如,第 1年第 3季度的季节不规则
值为 6.0/5.475=1.096。表 9是时间
数列季节不规则值的全部结果。
电视机季度销售量时间数列和中心化的移动
平均数的图形
8.0
7.0
6.0
5.0
4.0







量/


1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
第 1年 第 2年 第 3年 第 4年 年 /季度
中心化的移动
平均时间数列
年份 季度 销售量 /千台 中心化的移动 平均数 季节不规则值
1 1 4.8
2 4.1
3 6.0 5.475 1.096
4 6.5 5.738 1.133
2 1 5.8 5.975 0.971
2 5.2 6.188 0.840
3 6.8 6.325 1.075
4 7.4 6.400 1.156
3 1 6.0 6.538 0.918
2 5.6 6.675 0.839
3 7.5 6.763 1.109
4 7.8 6.838 1.141
4 1 6.3 6.938 0.908
2 5.9 7.075 0.835
3 8.0
4 8.4
下表中的数值的解释提供了电视
机销售的季节成分的一些信息。最
佳销售季节是第 4季度,它的销售水
平比总平均水平高出 14%,最差或低
的销售季节是第 2季度,它的季节指
数为 0.84,说明其销售水平比总平
均季度销售水平低 16%。季节成分符
合人们收看电视的直观上的期望。
电视机销售量时间数列的季节指数计算结果
季度 季节不规则成分的数值( StIt) 季节指数( St)
1 0.971,0.918,0.908 0.93
2 0.840,0.839,0.934 0.84
3 1.096,1.075,1.109 1.09
4 1.133,1.156,1.141 1.14
在取得季节指数时,有时候需
要对季节指数进行调整。乘法模型
需要平均季节指数等于 1.00,因此,
表中 4个季度的季节指数总和必须等
于 4.00。
例如,对季度数据,每个季节
指数乘以 4再除以未调整季节指数之
和。有些练习将需要这种调整。以
获得合理的季节指数。
3,消除时间数列的季节影响
找出季节指数的目的是为了从
时间数列中去掉季节影响 。 这种过
程称为时间数列消除季节影响 。 乘
法模型为
tttt ISTY ???
用时间数列的每个观察值除以
相应的季节指数, 则可以对时间数
列消除季节影响 。 在下表中是电视
机销售量消除季节影响后的时间数
列资料, 图 13是电视机销售量时间
数列消除季节影响后的图形 。
年份 季度
1 1 4.8 0.93 5.16
2 4.1 0.84 4.88
3 6.0 1.09 5.50
4 6.5 1.14 5.70
2 1 5.8 0.93 6.24
2 5.2 0.84 6.19
3 6.8 1.09 6.24
4 7.4 1.14 6.49
3 1 6.0 0.93 6.45
2 5.6 0.84 6.67
3 7.5 1.09 6.88
4 7.8 1.14 6.84
4 1 6.3 0.93 6.77
2 5.9 0.84 7.02
3 8.0 1.09 7.34
4 8.4 1.14 7.37
季节指数
tS
消除季节影响的
销售量 ttt ITSY ?/
tY
4,利用消除季节影响的时间数列确
定趋势
尽管下图中的图形显示过去 16
个季度的资料有一些上、下的随机
波,但时间数列似乎有一个向上的
线性趋势。为确定这个趋势,使用
同上一节相同的程序。
但这种情形中,所用的资料是消
除季节影响的季度销售量数据。因
此对于这个线性趋势,估计的销售
量被作为时间的函数,即
tbbT t 10 ??
消除季节影响的电视机销售量时
间数列
8.0
7.0
6.0
5.0
4.0








量/

台 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4第 1年 第 2年 第 3年 第 4年
年 /季度
同前面一样, t=1对应时间数列
的第 1个观察值的时间, t=2对应时
间数列第 2个观察值的时间, 依此
类推 。 所以计算的公式为:
? ?
? ? ?
?
?
?
ntt
nYttY
b t
/)(
/)(
22
1
1
tbYb 10 ??
注意,这时表示 t期消除季节影
响后时间数列的数值,而不是时间
数列的实际值。根据给出的的表达
式及表 11中消除季节影响的销售量
资料,有如下的计算结果。
t tY
ttY
2t(消除季节影响)
1 5.16 5.16 1
2 4.88 9.76 4
3 5.50 16.50 9
4 5.70 22.80 16
5 6.24 31.20 25
6 6.19 37.14 36
7 6.24 43.68 49
8 6.49 51.92 64
9 6.45 58.05 81
10 6.67 66.70 100
11 6.88 75.68 121
12 6.84 82.08 144
13 6.77 88.01 169
14 7.02 98.28 196
15 7.34 110.10 225
16 7.37 117.92 256
合计 136 101.74 914.98 1496
5,季节调整
对同时有趋势和季节成分的时间数列,
进行预测的最后一步是用季节指数调整
趋势推测值。再回到电视机销售量的例
子,现在已得到了下 4个季度的趋势推测
值,下面必须用季节影响调整预测值。
第 5度第 1季度( t=17)的季节指数为
0.03,因此用趋势值( T17= 7617)乘以
季节指数( 0.93),得到这个季度的预
测值为 7617× 0.93= 7084台。
电视机销售量时简述列的季度预测值
年份 季度 趋势预测值 季节指数 季度预测值
5 1 7617 0.93 7917× 0.93= 7084
2 7765 0.84 7765× 0.84= 6523
3 7913 1.09 7913× 0.93= 8625
4 8061 1.14 8061× 1.14= 9190
6.根据月度资料的模型
在前面电视机销售的例子中,利
用季度资料来说明季节指数的计算,
但是许多商业情况的预测使用月度资
料多于季度资料。在这种情况下,本
节介绍的方法要做一些调整才能应用。
首先是用 12个月的移动平均数代替 4
个季度的移动平均数,然后是计算每
个月的季节指数,而不是每个季度的
指数。
7,循环成分
同季节成分一样, 循环成分也可表示
为趋势的百分比 。 正如前面所提到的,
循环成分是由于时间数列的多年循环出
现的, 它与季节成分类似, 但是它的时
间周期更长一些 。 由于包含时间长度,
因此获得比较恰当的资料来估计循环成
分常常是困难的 。 另一个困难是循环的
长度是变化的 。
为了预测一个学区的学习成绩可
以用收入的高低程度来说明,,辛
辛那提调查, 采集了俄亥俄州教育
部教育管理服务局和俄亥俄州税收
部( The Cincinnati Enquirer,
1997.11.30)的数据 。
【 案例应用 】 —— 预测学生综
合测验成绩
首先,他们从报纸上得到了 1996
年上半年 4年级,6年级,9年级和
12年级的数字、阅读、科学、写作
和品德表现考试的通过率数据。
然后,他们把这些数据综合起
来,计算出每一个学区通过测验的
学生比例。
在学区的学生中,享受对受抚
养儿童补助( ADC)的学生的比例、
享受免费午餐或减价午餐资格的学
生的比例、学区中等家庭的收入等
资料也被记录下来。搜集的 608个
学区的一部分数据见讲义。
数据按照标题为, 通过率( %),
列的数值大小排序,这列的数据就
是通过测验的学生比例。标题为
,ADC( %), 列的数据是每一学区
享受对受抚养儿童补助( ADC)的
学生的比例,标题为, 免费午餐
( %), 列的数据是每一个学区享
受免费午餐或减价午餐资格的学生
的比例。
标题为, 中等家庭收入, 列的数
据是每一个学区中等家庭的收入。
对每一个学区还表明了该学区位于
哪一个县。注意,有时候, 免费午
餐( %), 列的数据是 0,表明这个
学区的学生没有参加享受免费午餐
或减价午餐的计划。
【 复习题 】
利用已介绍的方法分析这个数
据集。写一篇管理报告,概要地介
绍你的分析,包括关键的统计结果、
结论和建议。在附录里应包含你觉
得是合适的那些技术资料。
THANK YOU!