第八章 预测技术第八章 预测技术第一节 定性预测法第二节 简单线性回归第三节 时间序列
【 案例应用 】 预测学生综合测验成绩
【 计算机应用 】
消费者调查股份有限公司
( Consumer Research,Inc.)是一家独立的机构,该机构为各种类型的厂商调查消费者的态度和行为。
在一项研究中,客户为了能预测用信用卡进行支付的数额,要求对消费者的特点进行调查研究。
【 开篇案例 】
消费者调查股份有限公司对于由 50名消费者组成的一个样本,采集了有关年收入、家庭成员人数和年信用卡支付数额的统计资料见讲义:
【 讨论题 】
1.你知道用什么方法整理这些数据吗?
2,上述数据能向我们提供哪些有用的信息呢?
广义的预测,既包括在同一时期根据已知事件测定未知事件的静态预测,也包括根据现有的已知事件测定未来的未知事件的动态预测。
狭义的预测,仅指动态预测。预测理论作为通用的方法论,既可以应用于研究自然现象,又可应用于研究社会现象。
将预测理论、方法和个别领域现象发生的实际相结合,就产生了预测的各个分支。如社会预测、
人口预测、经济预测、政治预测、
科技预测、军事预测、气象预测等等。
第一节 定性预测法一、定性预测概述定性预测是预测者根据自己掌握的实际情况、实践经验、专业水平,
对经济发展前景的性质、方向和程度做出的判断。
由于定性预测主要靠预测者的经验和判断力,易受主观因素的影响,
主要目的不在数量估计,为了提高定性预测的准确程度,应注意以下几个问题:
第一,应加强经济调查研究,努力掌握影响经济发展的有利条件,
不利因素和各种活的情况,从而使对经济发展前景的分析判断更加接近实际 。
第二,进行经济调查研究,搜集资料时,应数据和情况并重;使定性分析数量化 。 也就是通过质的分析进行量的估计,进行有数据有情况的分析判断,提高定性预测的说服力 。
第三,应将定性预测和定量预测相结合,提高经济预测质量。在经济预测过程中,应先进行定性分析,为经济预测开路;然后进行定量预测,
使经济预测具体化,最后再进行定性分析,对经济预测进行调整定案。
二、市场调查预测法
1,经营管理人员意见调查预测法这种方法是由企业的经理(厂长)召开熟悉市场情况的各业务主管人员的座谈会,将与会人员对市场商情的预测意见,加以归纳、分析、判断,制定企业的预测方案。
这种预测方法的优点是使上下结合进行预测,有利于调动经理(厂长)
和业务管理人员开展市场预测的积极性,发挥集体智慧;再加上他们处于生产与经营管理第一线,领导与管理企业的产供销活动,熟悉市场商情的动向,他们的判断接近市场商品供需发展变化实际,使预测结果比较准确可靠。
这种方法的缺点是,对市场商情的变化了解得不够深入具体,主要靠经验判断,受主观因素影响大,只能作出粗略的数量估计。
2.销售人员意见调查预测法(推销人员估计法)
这种方法是向销售人员进行调查,
征询他们对产销情况、市场动态以及他们对自己负责的销售区、商店、柜台未来销售量(额)的估计,加以汇总整理,对市场销售前景做出综合判断。
这种预测除由公司、企业管理部门提供必要的调查统计资料和经济信息外,主要依靠销售人员掌握的情况、
经验、水平和分析判断能力,还要经过从基层到企业管理部门逐级审核、
汇总和经理厂长批准才能定案。
这种预测方法的优点是销售人员在市场前哨,最接近顾客,熟悉市场情况,预测经过多次审核、修正,比较接近实际;根据预测确定的销售任务由自己负责完成,使销售人员具有光荣感和责任感,易于发挥积极性和首创精神。
其缺点是,销售人员为了超额完成销售计划,获得奖金,估计易于偏于保守,由于工作岗位所限,对经济发展和市场变化全局了解不够,所预测的结果有一定局限性。
3.商品展销、订货会调查预测法这种方法是通过商品展销、订货会直接向用户发表调查,以了解用户对商品的花色、品种、质量、价格的意见和需求量,将意见加以汇总整理,
综合判断商品销售的发展前景。
4.消费者购买意向调查预测法这种方法是采用随机抽样或典型调查方式,从调查对象中抽取一定数目的消费者,通过发表、访问进行调查,将消费者的购买意向加以汇总分析,推断商品未来需要量的方法。
三、专家评估法 —— 德尔菲预测法专家评估法是向一组专家征询意见,将专家们过去历史资料的解释和对未来的分析判断汇总整理,尽可能取得统一意见,对经济现象发展变化前景进行预测的方法 。
专家评估法的特点
( 1)匿名性
( 2)反馈性
( 3)集中性四、主观概率法主观概率法是对市场调查预测法,
专家评估法的不同定量估计,进行集中整理的常用方法 。 主观概率是指在一定条件下,个人对某一事件在未来发生或不发生可能性的估计,反映个人对未来事件的主观判断和信任程度 。
主观概率 也必须符合概率论的基本公理,即每一事件发生的概率大干等于零,小于等于 1;必然发生的事件概率等于 1,必然不发生的事件概率等于零;两个互斥事件之和的概率等于它们的概率之和。
客观概率,是指某一随机事件经过反复试验后,出现的相对次数,
也就是对某一随机事件发生的可能性大小的客观度量。如掷一枚硬币,
出现国徽面和出现数字面的客观概率各为 1/2。
客观概率与主观概率的根本区别在于,客观概率具有可检验性,主观概率则不具有这种可检验性。
第二节 简单线性回归管理决策,经常取决于对两个或更多个变量的分析。
通常管理人员要依靠直觉去判断两个变量的关系。但是,如果能取得数据,就能利用统计方法去建立一个表示变量间相互关系的方程,
我们将这一统计方法称为回归分析。
在回归术语中,把被预测的变量称为因变量,把用来预测因变量值的一个或多个变量称为自变量。
一、简单线性回归模型某连锁店是经营快餐的餐馆,坐落在 5个不同的地区内。连锁店的最佳位置是在大学校园附近。管理人员确信,这些连锁店的季度销售收入
(用 y表示)与学生人数(用 x表示)
是正相关的。
利用回归分析,我们能求出一个说明因变量 y是如何依赖自变量 x的方程。
1.回归模型和回归方程描述 y如何依赖于 x和误差项的方程称为回归模型。
简单线性回归模型:
0?
xy 10
xy 1
0
β 0和 β 1称为模型的参数,ε
是被称为误差项的随机变量。误差项说明了包含在 y里面但不能被
x和 y之间的线性关系解释的变异性。
描述 y的平均值如何依赖于 x的方程称为回归方程。对于简单线性回归情形,回归方程如下:
x10
xyE 10)(
简单线性回归方程的图示是一条直线; β 0是回归直线的截矩,
β 1是斜率,对于一个给定的 x值,
E( y)是 y的平均值或期望值。
2.估计的回归方程在实际中参数 β 0和 β 1的值未知,
必须利用样本数据去估计它们,我们计算样本统计量 b0和 b1作为参数 β 0和
β 1的估计。用样本统计量 b0和 b1替代回归方程中的未知参数 β 0和 β 1,得到估计的回归方程。
xbby 10
xbby 10
对于简单线性回归情形,估计的回归方程如下:
简单线性回归的估计步骤回归模型回归方程未知参数样本数据
x y
x1 y1
x2 y2
估计量 估计的回归方程 样本统计量
b0和 b1
注释:不能把回归分析看作是在变量间建立一个因果关系的过程 。
回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在一起 。
有关因果关系的任何结论,必须建立在对个体或许多个体的有关应用的大量信息的判断基础上 。
二、最小二乘法最小二乘法是利用样本数据求估计的回归方程的一种方法。为了说明最小二乘法,假定由位于大学校园附近的 10家连锁店组成一个样本,
并对这个样本采集有关数据。对一样本中的第 i家连锁店,表示学生人数(千名),表示销售收入
(千元)。
ix
iy
ix
ix
iy
10家连锁店的学生人数和季度销售收入数据连锁店( i) 学生人数( ) /千人 销售收入( ) /千美元
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
iyix
连锁店的学生人数和季度销售收入散点图季度销售收入
/
千元学生人数 /千人
y
20
40
6080
100
120
140
160
180
200
220
0 2 4 6 8 10 12 14 16 18 20 21 24 26 x
选择用简单线性回归模型来描述季度销售收入与学生人数之间的关系。
在这一选择的假定下,接下来是利用上表中的样本数据,去决定估计的简单线性回归方程中的 b0和 b1的值。
式中,为第 i家连锁店的学生人数(千人); 为估计的回归直线的截距; 为估计的回归直线的斜率;
为第 i家连锁店季度销售收入的估计值(千元)。
ix
1b
0b
ii xbby 10
对于第 i家连锁店,估计的简单线性回归方程是最小二乘准则最小二乘法是利用样本数据,通过使应变量的观测值与估计值之间的离差平方和达到最小的方法求得 和的值。
最小二乘法准则,
0b 1b
2)?(m in ii yy
式中,为对第 i次观测,因变量的观测值; 为对第 i次观测,
因变量的估计值。微分学可以证明,
估计的回归方程的斜率和截距


nxx
nyxyx
b
ii
iiii
/)(
/)(
221
xbyb 10
iy
iy?
式中,为对第 i次观测,自变量的观测值; 为对第 i次观测,
因变量的观测值; 为自变量的样本平均值; 为因变量的样本平均值; n为总的观测次数。
x
iy
y
ix
在 10家连锁店的例子中,应用最小二乘法估计回归方程的一些必要的计算,在下表中列出。在这个例子中,
有 10家连锁店,或者说有 10次观测,
因此 n= 10。利用前面的公式和下表中提供的资料,能计算连锁店的估计的回归方程的斜率和截距。
连锁店的最小二乘估计的回归方程的计算连锁店 i
1 2 58 116 4
2 6 105 630 36
3 8 88 704 64
4 8 118 944 64
5 12 117 1404 144
6 16 137 2192 256
7 20 157 3140 400
8 20 169 3380 400
9 22 149 3278 484
10 26 202 5252 676
合计 140 1300 21040 2528
iiyx
2ixix iy
2ix?ix?iy? ii yx
5
10/1402528
10/)1300140(21040
/)(
/)(
2
221



nxx
nyxyx
b
ii
iiii
斜率的计算过程如下,
截距 b0的计算如下:
14
10
140
n
x
x i 13010
1300
n
y
y i
601451 3 010 xbyb
于是,应用最小二乘法得到的估计的回归方程是为
xy 560
斜率 b1=5
季度销售收入
/
千元学生人数 /千人
20
y
40
60
80
100
120
140
160
180
200
220
截距
b0=60 0 2 4 6 8 10 12 14 16 18 20 21 24 26 x
注释:最小二乘法是通过使因变量的观测值 和因变量的估计值之间的离差平方和达到最小的方法,
得到了一个估计的回归方程。最小二乘准则就是选择与样本数据有最佳拟合的方程的原则。如果利用某些其他准则,例如最小化 和 之间的绝对离差的和,将得到一个不同的方程。
在实践中,最小二乘法是应用最广泛的方法。
iy
iy
iy?
iy?
第三节 时间序列时间数列是一个变量在一个连续时点或一个连续时期上测量的观测值的集合。本节将介绍几种分析时间数列的方法,这些分析的目的是对时间数列的未来值提供合适的预测或判断。
一、时间数列的成分
1.趋势成分在时间数列的分析中,可以每小时、每天、每星期、每月、每年或每隔任何一段时间进行测量。尽管时间数列的资料一般呈现随机起伏的形态,但在一段较长的时间内,
时间数列仍然呈现逐渐增加或逐渐减少的转变或变化。时间数列的逐渐转变称为时间数列的趋势。
1988 1993 1998
26000
22000
18000
年份
·
·
·
··
·
·
·
·
·
·
年销售量/台照相机销售的线性趋势
2,循环成分尽管一个时间数列可以显示长期趋势,但时间数列的所有未来值不可能准确地落在趋势线上。事实上,时间数列常常呈现环绕趋势线上、下的波动。任何时间间隔超过一年的环绕趋势线上、下的波动都可归结为时间数列的循环成分。下图是一个有明显循环成分的时间数列的图形,它是以一年为一个时间间隔来得到观测值。
时间数量趋势线循环成分由环绕趋势线上、下波动的观察值表示时间数列的趋势和循环成分
3,季节成分尽管时间数列的趋势和循环成分根据分析历史料各年的运动而识别,
但许多时间数列往往显示在一年内有规则的运动。
4,不规则成分时间数列的不规则成分是剩余的或,包罗万象,的因素,它用来说明在分离了趋势,循环和季节成分的给定期望值后,时间数列值的真正偏差 。
二、利用平滑法进行预测
1,移动平均法移动平均法使用时间数列中最近几个时期数据值的平均数作为下一个时期的预测值 。 因此,
移动平均数的计算公式为:
n
n 期数据和最近移动平均数=
汽油销售时间数列周 销售量 /升 周 销售量 /升
1 17 7 20
2 21 8 18
3 19 9 22
4 23 10 20
5 18 11 15
6 16 12 22
0 1 2 3 4 5 6 7 8 9 10 11 12
5
10
15
20
25
周销售量
/
升汽油销售量的图形为了用移动平均法预测汽油的销售量,首先应选择移动平均法中包含的数据值的个数。我们以 3周的移动平均数计算预测值为例,加以说明。
汽油销售量时间数列的第一个 3周的移动平均数的计算结果为
19
3
192117)3~1( =++=周第移动平均数然后用这个移动平均数作为第 4
周的预测值。由于第 4周的实际值为
23,则第 4周的预测误差为 23-19= 4。
一般地,任何与预测相关的误差是指时间数列的实际值与预测值之间的差数。
第二个移动平均数的计算为
21
3
329112)4~2( =++=周第移动平均数汽油销售量时间数列的第一个
3周的移动平均数的计算结果为
213 329112)4~2( =++=周第移动平均数一般地,任何与预测相关的误差是指时间数列的实际值与预测值之间的差数 。 第二个移动平均数的计算为误差平方和的平均数 = 22.10
9
92?
预测精度 。 在选择预测方法时,
需要考虑的一个重要事情就是预测精度 。 显然我们希望预测误差很小 。
误差平方和的平均数通常称为均方误差 ( MSE),均方误差是最常用的预测方法精度的测度,也是本节所要用到的 。
周 时间数列值 移动平均预测值 预测误差 预测误差的平方
1 17
2 21
3 19
4 23 19 4 16
5 18 21 -3 9
6 16 20 -4 16
7 20 19 1 1
8 18 18 0 0
9 22 18 4 16
10 20 20 0 0
11 15 20 -5 25
12 22 19 3 9
合计 - - 0 92
0 1 2 3 4 5 6 7 8 9 10 11 12
5
10
15
20
25
周销售量
/

3 周移动平均预测值汽油销售量和 3周移动平均预测的图形
2,加权移动平均法加权移动平均法,需要对每个数据值选择不同的权数,然后计算最近个时期数值的加权平均数作为预测值 。
在大多数情况下,最近时期的预测值应取得最大的权数,而比较远的时期权数应依次递减 。
n
用汽油销售量时间数列来说明 3周加权移动平均数的计算。最近时期观测值的权数为最远时期观测值的 3倍
,中间时期观测值的权数为最远时期的 2倍,则第 4周的预测值为:
33.191963216217614 =++周的预测值=第
3,指数平滑法指数平滑法是用过去时间数列值的加权平均数作为预测值,它是加权移动平均法的一种特殊情形 。 这里只选择一个权数,即最近时期观测值的权数,其它时期数据值的权数可以自动推算出来,而且当观测值离预测时期越久远时,权 数变得越小 。 基本指数平滑法模型为:
t1
)-(1 FYF
tt

周( t)
1 17
2 21 17.00 4.00
3 19 17.80 1.20
4 23 18.04 4.96
5 18 19.03 -1.03
6 16 18.83 -2.83
7 20 18.26 1.74
8 18 18.61 -0.61
9 22 18.49 3.51
10 20 19.19 0.81
11 15 19.35 -4.35
12 22 18.48 3.52
时间数列值 ( ) 指数平滑预 测( ) 预测误差( )
tY tF tt FY?
汽油销售量的指数平滑预测和预则误差的总结周( t) 时间数列值 ( Y
t)
预测( Ft) 预测误差( Y
t- Ft)
预测误差平方
( Yt- Ft) 2
1 17
2 21 17.00 4.00 16.00
3 19 17.80 1.20 0.64
4 23 18.04 4.96 20.79
5 18 19.03 -1.03 3.28
6 16 18.83 -2.83 10.69
7 20 18.26 1.74 2.92
8 18 18.61 -0.61 0.64
9 22 18.49 3.51 11.83
10 20 19.19 0.81 0.17
11 15 19.35 -4.35 22.18
12 22 19.48 -3.52 13.69
合计 - - - 102.83
周( t) 时间数列值 ( Y
t)
预测
( Ft)
预测误差
( Yt- Ft)
预测误差平方
( Yt- Ft) 2
1 17
2 21 17.00 4.00 16.00
3 19 18.20 0.80 0.64
4 23 18.44 4.56 20.79
5 18 19.81 -1.81 3.28
6 16 19.27 -3.27 10.69
7 20 18.29 1.71 2.92
8 18 18.80 -0.80 0.64
9 22 18.56 3.44 11.83
10 20 19.59 0.41 0.17
11 15 19.71 -4.71 22.18
12 22 19.80 3.70 13.69
合计 - - - 102.83
三、利用趋势推测进行预测本节将说明如何对拥有长期线性趋势的时间数列进行预测 。
这类时间数列随时间呈现持续增加或减少的形态,因此趋势推测法是可行的 。
考虑一个特殊工厂过去 10年的自行车销售量时间数列,资料见表 6
和图 8。 注意第 1年销售了 21600辆,
第 2年销售了 22900辆,…,第 10年
( 即最近一年 ) 销售了 31400辆,
尽管图 8显示在过去 10年中销售量有上下波动,但时间数列总的趋势是增长的或向上的 。
年( t) 销售量 /千辆 年( t) 销售量 /千辆
1 21.6 6 27.5
2 22.9 7 31.5
3 25.5 8 29.7
4 21.9 9 28.6
5 23.9 10 31.4
自行车销售量时间数列自行车销售量时间数列的图形
0 1 2 3 4 5 6 7 8 9 10
20
21
22
23
24
25
26
27
28
30
31
32
29
年销售量/
千辆用线性函数对自行车销售量的趋势描述
0 1 2 3 4 5 6 7 8 9 10
20
21
22
23
24
25
26
27
28
30
31
32
29
年销售量/
千辆自变量 x和因变量 y之间直线关系的估计回归方程为,xbby
10
tbbY t 10
ntt
nYttY
b
tt
/)(
/)(
221

tbYb 10
线性趋势方程计算斜率( b
1 )和截距( b0)的公式为:1b0
tYttY2t1 21.6 21.6 1
2 22.9 45.8 4
3 25.5 76.5 9
4 21.9 87.6 16
5 23.9 119.5 25
6 27.5 165.0 36
7 31.5 220.5 49
8 29.7 237.6 64
9 28.6 257.4 81
10 21.4 314.0 100
合计 55 264.5 1545.5 385
t Y
ttY
2t
在自行车销售量时间数列的线性趋势成分的表达式中,斜率 1.1表明在过去的 10年中,商家每年的销售量平均增长大约 1100个单位 。 如果我们假设过去 10年的销售量的趋势对未来是合适的,则式 8可用来预测时间数列的趋势成分 。
例如,将 t =11代入式 8,可得到下一年的趋势预测值,即可见,仅仅根据趋势成分,就可以预测出下一年的自行车销售量为
32500辆 。
5.32114.2011Y
非线性曲线形态的几种可能形式
t时间
a 指数趋势
t时间
b 冈珀茨增长曲线
tYtY
剔除季节影响的时间数列称为消除季节影响的时间数列。剔除季节影响后,一期与一期的对比将更有意义,而且可以帮助确定是否存在趋势。我们所介绍的方法适用于只有季节影响的情形或同时有季节和趋势成分的情形。
四、利用趋势和季节成分进行预测首先是计算季节指数,并用它们得到消除季节影响的资料;
然后,如果消除季节影响的资料有明显的趋势,则用回归分析估计该资料的趋势成分。
1.乘法模型
tttt ISTY
除了趋势成分( T)和季节成分
( S)外,假设时间序列还有不规则成分( I)。不规则成分说明时间数列中不能由趋势和季节成分解释说明的任何随机影响。假设用 Tt,St和 It
分别表示 t期的趋势、季节和不规则成分。用 Yt表示时间数列的数值,
tttt ISTY
在这个模型中,Tt是被预测项目所测量出的趋势,但是,St和 It成分由相应的项目测量,其数值大于 1.00
表明它们的影响在趋势之上,而小
1.00表明它们的影响在趋势之下。
则它可由下列时间数列的乘法模型描述。
tttt ISTY
年 季度 销售量 /千台
1 1 4.8
2 4.1
3 6.0
4 6.5
2 1 5.8
2 5.2
3 68
4 7.4
3 1 6.0
2 5.6
3 7.5
4 7.8
4 1 63
2 5.9
3 8.0
4 8.4
2.季节指数的计算下图表明每年第 2季度的销售量最小,第 3和第 4季度的销售量是增加的,因此对电视机销售量的资料,
可知存在季节影响。首先通过计算移动平均数,将趋势成分 Tt与季节和不规则成分 St和 It分开,然后使用计算程序,确定每个季度的季节影响。
电视机销售量时间数列的季度图形
8.0
7.0
6.0
5.0
4.0
电视机季度销售量/
千台
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
第 1年 第 2年 第 3年 第 4年年 /季度年份 季度 销售量 /千件 4个季度的移动 平均数 中心化的移动 平均数
1 1 4.8
2 4.1 5.350
3 6.0 5.600 5.475
4 6.5 5.875 5.738
2 1 5.8 6.075 5.975
2 5.2 6.300 6.188
3 6.8 6.350 6.325
4 7.4 6.450 6.400
3 1 6.0 6.625 6.538
2 5.6 6.725 6.675
3 7.5 6.800 6.763
4 7.8 6.875 6.838
4 1 6.3 7.000 6.938
2 5.9 7.150 7.075
3 8.0
4 8.4
从下图可以看到中心化的移动平均数,在,消除,了时间数列的季节和不规则波动之后,有非常明显的趋势。计算出的 4个季度的移动平均数中,将不包含由于季节影响产生的波动,这时因为季节影响已经被去掉了。中心化的移动平均数中每一个点表示的是没有季节或不规则波动的时间数列的值 。
用时间数列的第一个观察值除以相应的中心化的移动平均数,可以确定时间数列的季节不规则影响值。
例如,第 1年第 3季度的季节不规则值为 6.0/5.475=1.096。表 9是时间数列季节不规则值的全部结果。
电视机季度销售量时间数列和中心化的移动平均数的图形
8.0
7.0
6.0
5.0
4.0
电视机季度销售量/
千台
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
第 1年 第 2年 第 3年 第 4年 年 /季度中心化的移动平均时间数列年份 季度 销售量 /千台 中心化的移动 平均数 季节不规则值
1 1 4.8
2 4.1
3 6.0 5.475 1.096
4 6.5 5.738 1.133
2 1 5.8 5.975 0.971
2 5.2 6.188 0.840
3 6.8 6.325 1.075
4 7.4 6.400 1.156
3 1 6.0 6.538 0.918
2 5.6 6.675 0.839
3 7.5 6.763 1.109
4 7.8 6.838 1.141
4 1 6.3 6.938 0.908
2 5.9 7.075 0.835
3 8.0
4 8.4
下表中的数值的解释提供了电视机销售的季节成分的一些信息。最佳销售季节是第 4季度,它的销售水平比总平均水平高出 14%,最差或低的销售季节是第 2季度,它的季节指数为 0.84,说明其销售水平比总平均季度销售水平低 16%。季节成分符合人们收看电视的直观上的期望。
电视机销售量时间数列的季节指数计算结果季度 季节不规则成分的数值( StIt) 季节指数( St)
1 0.971,0.918,0.908 0.93
2 0.840,0.839,0.934 0.84
3 1.096,1.075,1.109 1.09
4 1.133,1.156,1.141 1.14
在取得季节指数时,有时候需要对季节指数进行调整。乘法模型需要平均季节指数等于 1.00,因此,
表中 4个季度的季节指数总和必须等于 4.00。
例如,对季度数据,每个季节指数乘以 4再除以未调整季节指数之和。有些练习将需要这种调整。以获得合理的季节指数。
3,消除时间数列的季节影响找出季节指数的目的是为了从时间数列中去掉季节影响 。 这种过程称为时间数列消除季节影响 。 乘法模型为
tttt ISTY
用时间数列的每个观察值除以相应的季节指数,则可以对时间数列消除季节影响 。 在下表中是电视机销售量消除季节影响后的时间数列资料,图 13是电视机销售量时间数列消除季节影响后的图形 。
年份 季度
1 1 4.8 0.93 5.16
2 4.1 0.84 4.88
3 6.0 1.09 5.50
4 6.5 1.14 5.70
2 1 5.8 0.93 6.24
2 5.2 0.84 6.19
3 6.8 1.09 6.24
4 7.4 1.14 6.49
3 1 6.0 0.93 6.45
2 5.6 0.84 6.67
3 7.5 1.09 6.88
4 7.8 1.14 6.84
4 1 6.3 0.93 6.77
2 5.9 0.84 7.02
3 8.0 1.09 7.34
4 8.4 1.14 7.37
季节指数
tS
消除季节影响的销售量 ttt ITSY?/
tY
4,利用消除季节影响的时间数列确定趋势尽管下图中的图形显示过去 16
个季度的资料有一些上、下的随机波,但时间数列似乎有一个向上的线性趋势。为确定这个趋势,使用同上一节相同的程序。
但这种情形中,所用的资料是消除季节影响的季度销售量数据。因此对于这个线性趋势,估计的销售量被作为时间的函数,即
tbbT t 10
消除季节影响的电视机销售量时间数列
8.0
7.0
6.0
5.0
4.0
消除季节影响销售量/
千台 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4第 1年 第 2年 第 3年 第 4年年 /季度同前面一样,t=1对应时间数列的第 1个观察值的时间,t=2对应时间数列第 2个观察值的时间,依此类推 。 所以计算的公式为:


ntt
nYttY
b t
/)(
/)(
22
1
1
tbYb 10
注意,这时表示 t期消除季节影响后时间数列的数值,而不是时间数列的实际值。根据给出的的表达式及表 11中消除季节影响的销售量资料,有如下的计算结果。
t tY ttY 2t(消除季节影响)
1 5.16 5.16 1
2 4.88 9.76 4
3 5.50 16.50 9
4 5.70 22.80 16
5 6.24 31.20 25
6 6.19 37.14 36
7 6.24 43.68 49
8 6.49 51.92 64
9 6.45 58.05 81
10 6.67 66.70 100
11 6.88 75.68 121
12 6.84 82.08 144
13 6.77 88.01 169
14 7.02 98.28 196
15 7.34 110.10 225
16 7.37 117.92 256
合计 136 101.74 914.98 1496
5,季节调整对同时有趋势和季节成分的时间数列,
进行预测的最后一步是用季节指数调整趋势推测值。再回到电视机销售量的例子,现在已得到了下 4个季度的趋势推测值,下面必须用季节影响调整预测值。
第 5度第 1季度( t=17)的季节指数为
0.03,因此用趋势值( T17= 7617)乘以季节指数( 0.93),得到这个季度的预测值为 7617× 0.93= 7084台。
电视机销售量时简述列的季度预测值年份 季度 趋势预测值 季节指数 季度预测值
5 1 7617 0.93 7917× 0.93= 7084
2 7765 0.84 7765× 0.84= 6523
3 7913 1.09 7913× 0.93= 8625
4 8061 1.14 8061× 1.14= 9190
6.根据月度资料的模型在前面电视机销售的例子中,利用季度资料来说明季节指数的计算,
但是许多商业情况的预测使用月度资料多于季度资料。在这种情况下,本节介绍的方法要做一些调整才能应用。
首先是用 12个月的移动平均数代替 4
个季度的移动平均数,然后是计算每个月的季节指数,而不是每个季度的指数。
7,循环成分同季节成分一样,循环成分也可表示为趋势的百分比 。 正如前面所提到的,
循环成分是由于时间数列的多年循环出现的,它与季节成分类似,但是它的时间周期更长一些 。 由于包含时间长度,
因此获得比较恰当的资料来估计循环成分常常是困难的 。 另一个困难是循环的长度是变化的 。
为了预测一个学区的学习成绩可以用收入的高低程度来说明,,辛辛那提调查,采集了俄亥俄州教育部教育管理服务局和俄亥俄州税收部( The Cincinnati Enquirer,
1997.11.30)的数据 。
【 案例应用 】 —— 预测学生综合测验成绩首先,他们从报纸上得到了 1996
年上半年 4年级,6年级,9年级和
12年级的数字、阅读、科学、写作和品德表现考试的通过率数据。
然后,他们把这些数据综合起来,计算出每一个学区通过测验的学生比例。
在学区的学生中,享受对受抚养儿童补助( ADC)的学生的比例、
享受免费午餐或减价午餐资格的学生的比例、学区中等家庭的收入等资料也被记录下来。搜集的 608个学区的一部分数据见讲义。
数据按照标题为,通过率( %),
列的数值大小排序,这列的数据就是通过测验的学生比例。标题为
,ADC( %),列的数据是每一学区享受对受抚养儿童补助( ADC)的学生的比例,标题为,免费午餐
( %),列的数据是每一个学区享受免费午餐或减价午餐资格的学生的比例。
标题为,中等家庭收入,列的数据是每一个学区中等家庭的收入。
对每一个学区还表明了该学区位于哪一个县。注意,有时候,免费午餐( %),列的数据是 0,表明这个学区的学生没有参加享受免费午餐或减价午餐的计划。
【 复习题 】
利用已介绍的方法分析这个数据集。写一篇管理报告,概要地介绍你的分析,包括关键的统计结果、
结论和建议。在附录里应包含你觉得是合适的那些技术资料。
THANK YOU!