物流信息系统
朱春鹤
第八章 支持物流决策的模型及信息分析技术
?利用物流管理信息系统解决了物流数据处理的
基本问题,进一步 利用其数据与信息进行分析、
支持物流企业领导决策是物流信息系统进一步
发展的必然要求 。
?本章介绍决策以及决策支持的相关概念,以及
物流决策的一般方法、物流决策模型和预测技
术,然后介绍决策支持系统、物流信息分析技
术和物流系统模拟。其目的是使读者掌握基于
决策的支持方法。
第一节 概 述
?一、决策支持与模型
? 自 20世纪 70年代 DSS的概念提出以来,
随着决策理论、信息技术等相关技术的
发展,决策支持系统的研究与应用水平
不断提高,尤其是 人工智能,Internet、
DW,DM,OLAP等的发展,为 DSS提供
了强大的技术支持,DSS的应用取得了
显著的成效。
?(一 )典型决策支持系统的组成
? 一个典型的决策支持系统 (即“三库”
系统 )主要由 数据管理子系统、模型库管
理子系统、方法库管理子系统、用户界
面子系统和用户 组成,
?数据管理子系统由 数据库 (DB)和数据管
理库系统 (DBMS)组成,完成 对数据仓库
的维护、使用 等功能。
?数据仓库的数据通常 从内部和外部数据
源中抽取。
?模型库管理子系统由模型库 (MB,Model
Base)和模型库管理系统 (MBMS,Model
Base Management Systems)组成。模型库
中存储了包含描述决策问题的相对独立
的子模型。
? 方法库管理子系统由方法库 (M*B:
Method Base)和方法库管理系统 (M*BMS:
Method Base Management Systems)组成。
?方法库 存储了解决决策模型的各种方法,
例如各种寻优方法等。方法库管理系统
则是对方法库中方法进行管理 (包括描述、
增加、删除、修改、使用等 ),为决策模
型求解的需要提供方法的支持。
?用户界面子系统 (User Interface)是用
户与 DSS决策支持系统之间 交流的界
面,用户和系统进行交互式对话,
用户向系统完成问题的描述,而系
统将处理的结果报告给用户。
? DSS的用户主要是指企业各层次
的管理者和分析人员 。
?许多非结构化和半结构化的问题非常复
杂,以至于除了通常的 DSS能力外,它
们还需要特别的专业知识。因此 DSS也
由“三库”结构,发展为“四库”结构
(增加知识库,即 IDSS)、“五库”结构
(增加知识库、数据仓库 )。
(二 ) 模型
?所谓模型就是 对问题的要素以及
要素之间关系的一种抽象表示,
?例如简单的二元一次方程组就可
以用来描述具有两个要素,且要
素之间是线性关系的某问题。
? 模型集 (如财务风险分析模型集 )都有特定的职
能,灵敏度分析模型是其中应用最为广泛的模
型之一。它通过重复的“如果 …… 则”的方法
来确定一个或多个要素的变化对其他要素 (如支
出额 )的影响或影响程度。
?为了在标准变化的情况下更好地预测支出情况
“如 …… 则”问题,从已知条件或假设条件出
发,允许用户根据标准的不同检测结果,“如
果把售价提高 5%或把广告预算增加 100,000
美元将会怎样呢?”“如果保持价格和广告预算不
变则又如何呢?”后向型灵敏度分析软件应用于
目标搜索:如果想在明年售出一百万个产品单
位,那么产品的价格应降多少?
(三 )管理信息系统和 DSS的决策支持能力的比较
?由于高层管理具有非结构化和流动性因素的特
点,管理信息系统对高层的决策支持能力较弱 。
如高级管理人员对公司的关键成功因素法产生
分歧或者公司面临一场危机而急需战略变更,
而原有的关键成功因素法已不适宜进行决策。
在现存系统的基础上整合决策支持系统,即系
统的创建者确实知道决策支持系统的信息需求,
但想利用现有的管理信息系统来满足这些信息
需求也许是不可能的,这是因为管理信息系统
早已用不同方法定义了重要的数据。
? 管理信息系统集中于结构化的信息流,
而决策支持系统强调的是变化、灵活和
快速反应。决策支持系统较少涉及用户
联结结构化信息流和相应的较强调模式、
假设、随机访问、列示图表的需求。
? 决策支持系统和管理信息系统都依赖于
专业化的分析设计,然而不同之处在于
管理信息系统通常遵循传统系统开发的
方法论 (如:生命周期法 ),在设计前及其
整个生命周期中确定信息需求,而决策
支持系统则是自觉地反复地并且不会被
中断确定用户需求。
二 决策支持的方式
?(一)两种基本的决策支持方式
?当今存在两种基本的决策支持系统,模型驱动
型和数据驱动型
? 早期的决策支持系统从公司数据库抽取数据、
建立模型,是典型的模型驱动型的决策支持系
统。近来随着数据处理和数据库技术的发展决
策支持系统正向数据驱动型的系统发展。
?1.模型驱动型决策支持
? 模型驱动型决策支持系统是发现问题
的 影响要素 和 内在关联,利用模型和数
据,建立问题的模型,然后 求解模型,
以 达到找到决策问题的方法,或者按照
构造的模型指导行动。
? 2.数据驱动型决策支持
? 第二种决策支持系统是数据驱动型的。
这种系统的分析来自主要组织系统的大
量数据。它允许用户从原来隐藏的大量
信息中选取有用的信息。
?例如可以从 DW里得到,然后 利用在线分
析程序和 DM技术可用来分析这些数据,
回答用户关心的问题,如“编号为 403的
产品在 2002年 5月装运出多少?”“以季度
为单位比较编号为 403的相关产品的实际
销量与计划销量”。
? 根据决策支持层度和难度的分析,可
知 数据驱动型的 DSS比模型驱动型的 DSS
应用更广 。
? (二 )以数据驱动型的
决策支持系统的元素
数据驱动型的决策支
持系统包括一个应用
于查询和分析的数据
单元、一定模式的软
件、数据分析技术和
用户界面,如图 8—1
所示。
?1.数据单元
? 决策支持系统的数据单元是当前和历史资料的
汇总。它可能是存处于一台个人电脑上的公司数
据资料的一部分,它可能包括一部分外部信息。
?另外,决策支持系统也可能连接的是一个被组织
传输协议系统不断更新的超大数据库。决策支持
系统中的数据单元大多是产品数据单元的复本,
以便使用起来不会影响其他系统的运行。
? 2.分析软件系统
? 分析软件系统包含用于数据分析的软件
工具,它包括各种在线分析程序,DM工
具等分析模型,并且这些工具很容易为
用户所用。
?3.用户界面
? 用户界面具有简单易用的画面、灵活
的用户支持界面支持用户和系统间的对
话,使用户可以容易地使用这些软件工
具。
?三、决策支持系统应用实例
? 决策支持系统已经应用许多方面,表 8—1给
出了部分应用实例。沃尔马采用的是数据驱动
型的决策支持系统,加拿大卡普国际系统 (Carp
?Systems International of Kanata,Ontario)销售的
高级策划系统 (APS)能使用原有的 MRPⅡ 中的
数据并使其具备决策支持功能。
第二节 物流的决策模型与预测模型
?一、物流决策的种类
? 在第二章,通过对物流系统以及主要业
务和业务流程的分析可知,物流系统中
除了数据处理和结构化决策外,还有大
量的半结构化和非结构化决策 。
? 运输中的决策 主要包括选择较合理的运输方式和路线、
具体物品的运输物流计划。
? 储存中的决策信息 主要是物品出库规则、最低库存量、
安全库存量、最高库存量、订货策略等。
? 物流加工中的决策 主要有加工方式、加工周期、加工
报价以及相关的配套决策。
? 配送中的决策 主要是如何按用户的需求,在充分利用
资源的前提下,确定备货规模、物资来源、配送方式、
配送路线等。按配送商品的种类和数量分类:少品种
(或单品种 )、大批量配送;多种品种、少批量、多批次
配送;成套配套配送。按配送时间及数量分类:定时
配送;定量配送;定时定量定点配送;即时配送。按
配送的组织形式不同分类:集中配送;共同配送;分
散配送。不同的配送有不同的决策要求。
二、物流决策的相关模型
?每个模型有各自应用的假设或者前提,
因此模型有各自适应的应用范围。而不
同的决策问题有不同的特点和结构,不
同的决策者有不同要求,有自己的决策
偏好和决策风格,因此在采取模型驱动
型的决策支持时,应该根据上述因素,
选择合适的模型。
?表 8—2从决策问题、可采用的相关模型、
模型使用的效果、模型使用的条件、模
型使用需要的主要相关数据以及求解方
法等方面,对物流中的部分决策可用的
主要相关模型进行了描述。
三、预测模型
?决策离不开预测,预测能够在一定程度上反映
客观事物发展的趋势,因此能为正确的决策提
供一定信息。物流预测能为 科学地编制物流经
营计划和物流业务计划、调度提供参考 。只有
通过物流预测,才能了解宏观物流活动发展动
态,分析对象发展趋势从而避免盲目地编制物
流企业的作业计划和宏观计划,有利于提高现
代物流经营管理水平,为正确地经营决策打下
基础,有利于分析各种变化对物流企业的影响,
有利于为物流企业的管理现代化创造良好的条
件。
(一 )预测的概念
? 1.预测的概念
? 预测是一门掌握对象变化动态的科学,
它是对对象变动趋势的预见、分析和判
断,也是一种动态分析方法。
?2.预测的基本步骤
? (1)确定预测目标,包括预测对象、目的、
对象范围;
? (2)搜集分析内部和外部资料;
? (3)数据的处理及模型的选择;
? (4)预测模型的分析,修正;
? (5)确定预测值。
(二 )预测的方法
? 预测的准确程度不仅取决于对错综复杂的对象发展变
化情况掌握的程度,而且还在于采取怎样的 预测方法,
特别在占有资料的同时要选定适合的预测方法。预测
方法一般有 定性分析预测法和定量预测法,其中定性
预测包括集合意见、用户意见法 (对象调查法 )、员工意
见法、专家评估法、类推法、判断预测和目标分解法
等;定量预测方法包括:情景分析法、时间序列分析
法 (移动平均,指数平滑,季节系数,DOx—
TENKENS法 )、因果分析法 (线性,回归,非线性模型:
含生命周期法,经济计量模型,灰色系统模型,状态
转移分析法,模拟法,系统模型 )等。
? 1.定性预测
? 它是在对象调查的基础上,根据预测者个人经验,
阅历,学识和智慧,采用类比分析和综合的方法对对
象进行直观判断的方法。根据对象,可分为:
? (1)集合意见法 (三种估计加权预测法 ),它是一种加
权综合判断法;
? (2)用户意见调查法 (设计调查表 );
? (3)员工意见法;
? (4)专家意见法;
? (5)类推法。
? 2.定量 (分析预测 )
? (1)时间序列分析法。这种预测对时间序列的
原始数据要求:在时间上具有连续性 (如果 1~ 5
月中除 4月都有数据,可采用合适的平均值办
?法补足 );数据之间的可比性 (例如,每个月天
数是不同的,可化为相同的天数先求出某月每
天的平均销售量 );应可采用交叉预测如预测 9
月,可用 1月~ 9月也可用不同年份 9月数据 )。
?时间序列可划为四种变化特征:趋势性 (T)、季
节性 (s)、周期性 (c)、不规则性 (I),可以利用散
点图识别来变化特征。
? 时间序列分析法一般有方法:简单平均、移
动平均、加权移动平均、指数平滑、一元线性
回归、相关比例推算。例如:
? 一元线性回归 (趋势外推 )Y=a0+a1*x
? 系数用最小二乘法确定系数,a0 a1
? 相关比例推算 (首先找出影响产品销售量,主要因
素,再据各种比例关系,推出预测值 )。例如,某
第三方物流企业市场的需求预测 (如表 8—4所示 )。
?2)回归预测:
? 一元线性回归 (趋势外推 ),Y=ao+a1’x
? 多元回归 (因果关系 ), Y=ao+al。
X1+a2x2+…+anx 。
? 系数用最小二乘法确定系数,a0
a1..,aIl
?(3)非线性模型:
? Y=A+B*LOG(X)
? Y=1/ (A+B。 EXP(一 X)
? Y=1/ (A+B”X)
? Y=X/ (A+B’X)
? Y=A。 )(^B,(A>0)
? Y=A’EXP(B。 X),(A>0)
? Y=A’EXP(B/ X),(A>0)
? Y=A’ExP(B。 x“2),(A>0)
?将以上模型进行线性处理再转化为一元回归模
型。
? (4)灰色预测模型 GM(1,1)。
? (5)组合预测。采用不同合理的模型预测
后,再进行回归得出组合预测模型。
? (三 )预测模型选取的原则
? 据有关研究资料表明,以预测方法应用多少
为标准进行从大到小排序是,回归分析、指
数平滑、数量经济模型、专家会议、主观概率
法、多变量时间序列模型、趋势外推、抽样调
查、移动平均、投入产出、相关数、类推法等;
在高层次经济预测方面以国家统计为例,主要
应用数量经济模型、其他有投入产出模型、回
归分析、移动平均等;在低层次方面为专家会
议、类推法、移动平均、主观概率法、指数平
滑、回归分析等。
? 定量预测、定性预测和计算机相结合是
当今预测的主导方向。神经网络预测理
论、基于规则的预测系统、专家预测系
统、判断预测、组合预测是当今世界预
测科学发展的最新动向。
?模型选择的原则:要在数据识别上建模、
建立何种模型,并不取决于预测者意图;
应考虑适用、数据易采集和时效的原则;
定量与定性相结合的原则等。
? 对数据选取选用的原则:数据应该具
有代表性,有一定客观规律。对于异常
的数据可采用比例法、移动平均、指数
平滑等方法进行适当的修正。
第三节 支持物流决策的信息分析技术
? 一、数据仓库
? (一 )基本概念
? 1.数据仓库的定义
? 什么是数据仓库,有不同的看法:
?, DW是作为 DSS服务基础的分析型 DB,用来存放
大容量的只读数据,为制订决策提供所需的信息。”
?, DW是与操作型系统相分离的、基于标准企业模型
集成的、带有时间属性的 (即与企业定义的时间区段相
关 )、面向主题及不可更新的数据集合。”
? 综合对数据仓库多种理解以及其作用,
数据仓库可以定义为支持管理决策过程
的、面向主题的、集成的、稳定的、不
可更新的、随时间变化的、分层次的数
据集合。它是一个综合的、面向分析的
数据环境,利用现有的数据进行分析和
推理,从而为决策提供依据而建立的综
合体系。
? 2.数据仓库的作用
? 数据仓库具有两个主要作用:
?一是从各信息源提取决策需要的数据,
加工处理后,存储到数据仓库中;
?二是用户的查询和决策分析的基础。
?(二 )数据仓库的分析
? 1.主题与面向主题
? 数据库 面向应用 进行的数据组织,DW
中的数据是 面向主题 进行数据的组织。
? 主题是一个 抽象的概念,是在较高层
次上将企业信息系统中的数据综合、归
类并进行分析利用的抽象,每一个主题
是决策者关心的问题。
?面向应用进行数据组织方式的特点如下:
? 第一,面向应用进行数据组织,是指
对企业中相关的组织、部门等进行详细
调查,搜集数据库的基础数据以及其处
理的过程。调查的重点是“数据”和
“处理”,在进行数据组织时充分了解
企业的部门组织结构,考虑到企业各部
门的业务活动特点。
? 第二,面向应用进行数据组织应反映一
个企业内数据的动态特征,即要表达每
个部门的实际业务处理数据流程:即从
哪儿获取输人数据,在部门内进行什么
样的数据处理,以及向什么地方输出数
据。按照实际应用即业务处理流程来组
织数据,其主要目的是为了进行联机事
务处理,以提高日常业务处理的速度和
准确性等,提高服务质量。
?第三,这种数据组织方式生成的各项数
据库模式与企业中实际的业务处理流程
中所涉及的单据或文档有很好的对应关
系,这种对应关系使得数据库模式具有
很强的操作性,因而可以较好地在这些
数据库模式上建立起各项实际的应用处
理。
?第四,面向应用进行数据组织的方式并
没有体现数据库这一概念提出的原本意
图; 数据与数据处理的分离 ;要将数据
从数据处理或应用中抽象出来、解放出
来,组织成一个和具体的应用独立的数
据世界。
? 按照面向主题的方式数据的组织应该分
为两个步骤:抽取主题以及确定每个主
题所应包含的数据内容。主题是对应某
一分析领域的分析对象,所以主题的抽
取,应该是按照分析的要求来确定的。
这与按照数据处理或应用的要求来组织
数据的主要不同在于关心的数据内容不
同。
?面向主题的数据组织方式是根据分析要
求将数据组织成一个完备的分析领域,
即主题域。主题域应该具有:
? (1)独立性,如分析所要求的是“商品”
主题域,这一主题域可以和其他的主题
域有交叉,但它必须具有独立内涵,有
明确的界限,规定某项数据是否该属于
“商品”主题。
? (2)完备性,如,在“商品”这一主题内
找到该分析处理所要求的一切内容;如
果涉及现存“商品”主题之外的数据,
就应增加新数据到“商品”主题中来,
从而逐步完善“商品”主题。
?主题只是一个逻辑上的概念,实现时,主题的
数据项多了,可以采取化大为小。主题是一个
在较高层次上对数据的抽象,这使得面向主题
的数据组织可以独立于数据的处理逻辑,因而
可以在这种数据环境上方便地开发新的分析型
应用。同时,这种独立性也是建设企业全局数
据库所要求的,所以面向主题不仅是适用于分
析型数据环境的数据组织方式,且是适用于建
设企业全局数据库的数据组织方式。
?2,Dw数据的集成性
? Dw的数据 是从原有的 分散的数据库的数据 中
抽取来的。两者之间的差别:第一,Dw的每
一个主题所对应的源数据在原有的各自分散数
据库中有许多重复和不一致的地方,且来源于
不同的联机系统的数据都和相同的应用逻辑捆
绑在一起;第二,Dw中的综合数据不能从原
有的数据库系统直接得到。
?因此在数据进入 Dw之前,必然要经过统
一与综合,这是 DW建设中最关键、最复
杂的一步,所要完成的工作有:
? (1)要统一源数据中所有矛盾之处,如
字段的同名异义、异名同义、单位不统
一、字长不一致,等等。
? (2)进行数据综合和计算。 DW中的数
据综合工作可以从原有数据库抽取数据
时生成,但许多是在 DW内部生成的,即
进入 DW以后进行综合生成的。
? 3,DW数据的不可更新性
? DW的数据主要供企业决策分析之用,所涉及的数据
操作主要是数据查询,一般情况下并不进行修改操作。
DW的数据反映的是一段相当长的时间内历史数据的内
容,是不同时点的数据库快照的集合,以及基于这些
快照进行统计、综合和重组的导出数据,而不是联机
处理的数据。数据库中进行联机处理的数据经过集成
输入到 DW中,一旦 DW存放的数据已经超过 DW的数
据存储期限,这些数据将从当前的 DW中删去。因为
DW只进行数据查询操作,所以 DW管理系统 (DWMS)
相比 DBMS而言要简单得多。但是由于 DW的查询数据
量往往很大,所以就对数据查询提出了更高的要求,
它要求采用各种复杂的索引技术。
?4,DW数据的时态性
? DW中的数据不可更新是针对应用来说
的,即 DW的用户进行分析处理时不是进
行数据更新操作的。
?DW的数据是随时间的变化而不断变化的,这
是 DW数据的第四个特征。这一特征表现在以
下三个方面:
? (1)DW随时间变化不断增加新的数据内容,
要不断地生成数据库的快照,经统一集成后增
加到数据库中,但对于每次的数据库快照是不
再变化的,捕捉到新的变化数据,只不过又生
成一个数据库的快照增加进去,而不会对原来
的数据库快照进行修改。
?(2)DW的数据也有存储期限,一旦超过
了这一期限,过期数据就要被删除。只
是 DW内的数据时限要远远长于操作型环
境中的数据时限。
?在操作型环境中一般只保存有 60~ 90天
的数据,而在 DW中则需要保存较长的时
限的数据 (如 5~ 10年 ),以适应 DSS进行
趋势分析的要求。
?(3)DW中包含有大量的综合数据,这些
综合数据中很多跟时间有关,如数据经
常按照时间段进行综合,或每隔一定的
时间片进行抽样等等。这些数据要随着
时间的变化不断地进行重新综合。因此,
DW数据的码键都包含时间项,以标明数
据的历史时期。
二、联机分析处理
? (一 )联机分析处理的定义与特点
? 1.定义
?通过专门的数据综合引擎,辅之以更加
直观的数据方问界面,力图统一分散的
公共应用逻辑,在短时间内响应非数据
处理专业人员的复杂查询要求。 1993年,
E,F,Codd将这类技术定义为,OLAP"。
?2.特点
?一般数据库由于主要用于企业的日常事
务处理工作,存放在数据库中的数据也
就大体符合操作型数据的特点。而为适
应数据分析处理要求而产生的 Dw中所存
放的数据就应该是分析型的数据。
(二 ) OLAP的基本术语
?OLAP是针对特定问题的联机访问和分析
数据。通过对信息 (这些信息已经从原始
的数据进行了转换,以反映用户所能理
解的企业的真实的“维” )的很多种可能
的观察形式进行快速、稳定一致和交互
性的存取,允许管理决策人员对数据进
行深观察。
?1.变量
? 变量是数据的实际意义,描述数据“是什
么”。一般情况下,变量总是一个数值度量指
标。
? 2.维
? 维是人们观察数据的特定角度。
例如,企业常常关心服务收入随着服务水平提
高而产生的变化情况,这时该企业是从服务水
平的角度来观察产品的服务收入,所以服务水
平就是一个维 (服务维 )。
?3.维的层次
? 人们观察数据的特定角度 (即某个维 )还可以
存在细节程度不同的多个描述方面,我们称这
多个描述方面为维的层次。
?例如描述维时间,可以从日期、月份、季度、
年等不同层次来描述,那么日期、月份、季度、
年等就是时间维的层次;同样,城市、地区、
国家等构成了一个地理维的多个层次。
?4.维成员
? 维的一个取值称为该维的一个维成员。
如果一个维是多层次的,那么,该维的
维成员是在不同维层次的取值的组合。
?5.多维数组
? 一个多维数组可以表示为,(维 1,维 2,……,
维 n,变量 )。
?例如,日用品销售数据是按时间、地区和销售
渠道组织起来的三维立方体,加上变量“销售
额”,就组成了一个多维数组 (地区、时间、销
售渠道、销售额 )。如果我们扩展一个维、产品
维,就得到一个四维的结构。
? 6.数据单元
? 多维数组的取值称为数据单元。当多
维数组的各个维选中一个维成员,这些
维成员的组合就惟一确定了一个变量的
值。那么数据单元就可以表示为,(维 1
成员,维 2成员,……,维 n成员,变量
的值 )。
(三 )OLAP的基本分析方法
?多维分析是指对以多维形式组织起来的
数据采取切片、切换、旋转等各种分析
方法,以求剖析数据,使最终用户能从
多个角度、多侧面地观察数据库中的数
据,从而深入地了解包含在数据中的信
息、内涵。
?多维分析方式符合了人的思维模式,使
分析人员能够迅速、一致、交互地从多
个角度、多个侧面来剖析反映企业维的
特性数据,使人们在观察数据时减少混
淆与错误,发现数据后面隐藏的有价值
并能被用户理解的信息、内涵,能更深
刻地反映企业的真实面目和企业所处的
环境,因此减少了混淆,降低了出现错
误解释的可能性。
?1.切片
? 定义 1:在多维数组的某一维上,选定
一维成员的方法称为切片,即在多维数
组 (维 1,维 2,……,维 n,变量 )中选一
维,即维 Vi,……,维 n,变量称为在维
I上的一个切片。
?定义 2:选定多维数组的一个二维子集的
方法叫做切片,即选定多维数组 (维 1,
维 2,……,维 n,变量 )中的两个维:维 I
和维 J,在这两个维上取某一区间或任意
维成员,而将其余的维都取定一个维成
员,则得到的就是多维数组在维 I和 j上一
个二维子集,称这个二维子集为多维数
在维 I和维 J上的一个切片,表示为,(维 I,
维 i,变量 )。
?2.切块
? 定义 l:在多维数组的某一维上,选定
某一区间的维成员的方法称为切块,即
限制多维数组的某一维的取值区间。显
然,当这一区间只取一个维成员时,好
得到一个切片 (切片的定义 1)。
?定义 2:选定多维数的一个三维子集的方法称
切块。即选定多维数组 (维 1,维 2,……,维 n,
变量 )中的三个维:维 I、维 i和维 r,在这三个维
上取某一区间或任意的维成员,而将其余的维
都取定一个维成员,则得到的就是多维数组在
维 I、维 i和维 r上一个三维子集,我们称这个三
维子集为多维数组在维 I、维 i和 r上的一个切块,
表示为,(维 I,维 i,维 r,变量 )。切块与切片
的作用与目的是相似的。
? 3.旋转
? 旋转即是改变一个报告或页面显示的维方向。
例如,旋转可能包含了交换行和列;或是把某
一个行维移到列维中去,或是把页面显示中的
一个维和页面的维进行交换 (令其成为新一行或
列中的一个 )把一个横向为时间、维向维产品的
报表旋转成为横向为产品、维向为时间的报表。
? (四 )OLAP的衡量标准
? 1993年,E,F,Codd在, Providing
OLAP(On—Line Analytical Pro—
cessing)to User Analysts,中提出了有关
OLAP的十二条准则,其多维数据分析、
客户/服务器结构、多用户支持及一致
的报表性能等得到了在多数人的认可。
?他所阐述的有关 OLAP产品及其所依赖的
数据分析模型的一系列概念及衡量标准
对 OLAP产品的识别及后来发展方向的确
立都有着重要的作用,尽管 Codd提出的
十二条准则也在不断的完善,但仍可以
?作为评价和购买 OLAP产品的参考标准。
?准则 1 OLAP模型必须提供多维概念视图
? 从用户分析员的角度来看,整个企业的
视图本质上是多维的,因此 OLAP的概念
模型也应是多维的。
?准则 2透明性准则
? 无论 OLAP是否是前端产品的一部分,
对用户来说,它都是透明的;如果在客
户/服务器结构中提供 OLAP产品,那么
对最终分析员来说,它同样也应透明。
?准则 3存取能力准则
? OLAP系统不仅能进行开放的存取,而且还提
供高效的存取策略。 OLAP用户分析员不仅能
在公共概念视图的基础上对关系数据库和外部
存储的数据进行分析。
?准则 4稳定的报表性能
? 当数据维数和数据综合层次增加时,提供给
最终分析员的报表能力和响应速度不应该有明
显的降低和减慢,这对维护 OLAP产品的易用
性和低复杂性至关重要。即便是企业模型改变
时,关键数据的计算方法也无需更改。也就是
说,OLAP系统模型对企业模型应该具有“鲁
棒”性。
?准则 5客户/服务器体系结构
? OLAP是建立在客户/服务器体系结构上的。
这要求它的多维数据服务器能够被不同的应用
工具访问到。
?准则 6维的等同性准则
? 每一数据维在数据结构和操作能力上都是等
同的。系统可以将附加的操作能力授给所选维,
但必须保证该操作能力可以授给任意的其他维,
即要求维上的操作是公共的。该准则实际上是
准 l的一个补充,是对维的基本结构和维上的操
作的要求。
?准则 7动态的稀疏矩阵处理准则
? OLAP工具的物理模型必须充分适应指
定的分析模型,提供“最优”的稀疏矩
阵处理,这是 OLAP工具的应遵循的最重
要的准则之一。
?准则 8多用户支持能力准则
? 多个用户分析员可以同时工作于同一分析模
型上或是可以在同一企业数据上建立不同的分
析模型。该准则可由准则 5推出。 OLAP工具必
须提供并发访问、数据完整性及安全性机制。
? 准则 9非受限的跨维操作
? 多维数据之间存在固有的层次关系,这就要
求 OLAP工具能自己推导出而不是最终用户明
确定义出相关的计算。对于无法从固有关系中
得出的计算,要求系统提供计算完备的语言来
定义各类计算公式。该准则是对准则 l的一个补
充,对操作能力和操作范围做出了要求。
?准则 10直观的数据操纵
? 这一准则要求数据操纵。这一准则要求
数据操纵直观易懂。综合路径重定位、
向上综合、向下挖掘和其他操作都可以
通过直观、方便的点击操作完成。
?准则 11灵活的报表生成
? 报表必须从各种可能的方面显示出从数
据模型中综合出的数据和信息,充分反
映数据分析模型的多维特征。
?准则 12不受限维与聚集层
? OLAP工具的维数应不小于 15维,用户
分析员可以在任意给定的综合路径上建
立任意多个聚集层次。
三、数据挖掘 (DM)
? (一 )概念
? 1.定义
? DM是一个 从大型数据库中抽取隐含的、从
前未知的、潜在有用的信息或关系的过程。
?它是从各种相关数据库的大量数据中提取出人
们感兴趣的知识和规则,这些知识和规则是可
信的、新颖的、有效的,并能容易被人理解的。
?2.作用
? 自动智能地分析数据库中的大量数据,
以获取信息,是推动数据挖掘型工具产
生并发展的强大动力。超级对象的经理
人员希望能从过去几年的销售记录中分
析出顾客的消费习惯和行为,以便及时
变换营销策略。
? 3.与知识发现的关系
? DM和知识发现 (KDD,Knowledge
Discovery in Database)有密切的联系。知
识发现是指从数据库中发现有用知识的
整个过程,DM则是这一过程中的一个特
定步骤。
4.特点
? DM的特点有:
? (1)处理的数据规模十分庞大;
? (2)由于用户不能形成精确的查询要求,因此需要靠
DM技术来寻找其可能感兴趣的东西;
? (3)DM对数据的迅速变化应作出快速响应,以提供
决策支持信息;
? (4)DM既要发现潜在规则,还要管理和维护规则,
随着新数据的不断加入,规则需要随之更新;
? (5)DM中规则的发现基于统计规律,发现的规则不
必适合于所有数据,而且当达到某一阈值时,便认为
有此规则。
(二 ) DM的技术
?DM涉及面相当广泛,从机器学习、模式识别、
统计学、智能数据库、知识获取直到数据可视
化、高性能计算、专家系统等各个领域。 DM
主要任务通常有分类、聚类、预测和关联等,
以便从浩瀚的数据海洋中采掘出有价值的求知
信息来支持决策,提高决策支持系统的正确性
和可行性。 DM技术应用诸如:神经网络、模
糊逻辑、遗传算法之类的统计分析工具。
?1.人工神经网络方法
? 人工神经网络方法是由大量的简单处
理单元 (即神经元 )所构成的一种能模仿延
伸人脑认知功能的新型信息处理系统,
它具有巨量并行处理信息和推理能力、
存储分布性、结构可变性、高度非线性、
自学习性和自组织性等特点,是 DM技术
中最重要的方法之一。
? 2.遗传算法
? 遗传算法 (Genetic Algorithms)可起到产
生优化后代的作用。这些后代需满足适
应值,经过若干代的遗传,将得到满足
要求的后代 (即问题的解 )。遗传算法已在
优化计算和分类机器学习方面发挥了显
著作用。
? 3.决策树方法
? 决策树方法 (Decision Trees)是利用信息
论中的互信息 (信息增益 )寻找数据库中具
有最大信息量的属性字段,建立决策树
的一个结点,再根据该属性字段的不同
取值建立树的分支;在每个分支子集中
重复建立树的下层结点和分支的过程。
(三 )DM的分析方法
?DM系统利用的技术越多,得出的结果精
确性就越高。原因很简单,对于某技术
不适用的问题,其他方法却可能奏效。
这主要取决于问题的类型以及数据的类
型和规模。无论采用哪几种技术来完成
任务,从功能上可以将 DM的分析方法划
分为以下四种 (根据 IBM的划分方法 ),关
联分析、序列模式分析、分类分析、聚
类分析。
? 1.关联分析
? 关联分析 (Associations)的目的就是为了
挖掘出隐藏在数据间的相互关系。
?2.序列模式分析
? 序列模式分析 (sequential Patterns)和关联
分析法相似,其目的也是为了挖掘出数
据之间的联系,但序列模式分析的侧重
点在于分析数据间的前后 (因果 )关系。
?3.分类分析
? 分类分析 (classifiers)。假定记录集合和一组
标记 (TAG),所谓标记是指一组具有不同特征
的类别。
? 4.聚类分析
? 聚类分析 (clustering)。与分类分析不同,聚
类分析法的输入集是一组未标定的记录,也就
是说此时输入的记录还没有被进行任何分类。
其目的是根据的这些规则是由聚类分析工具定
义的。由于聚类分析可以采用不同的算法,所
以对于相同的记录集合可能有不同的划分。可
以看出,许多在分类分析法中适用的算法同样
适用于聚类分析法。
(四 )DM系统的实施
?DM的核心技术是人工智能、机器学习、
统计等,但一个 DM系统不是多项技术的
简单组合,而是一个完整的整体,它还
需要其他辅助技术的支持,才能完成数
据采集、预处理、数据分析、结果表述
这一系列任务,最后将分析结果呈现在
用户面前。根据功能,整个 DM系统可以
大致划分为三级结构。
?DM的数据分析过程可以分成四个步骤:
? 1.数据准备
? 数据准备 (Data Preparation):本阶段又
可进一步细分两步数据集成、数据选择
和预分析。
?(1)集成 (Integration):
?(2)数据选择和预分析 (Data Selection and
Pre—Analysis):
?2.挖掘
? 挖掘 (Mining),DM处理器 (Data Mining
Processor)综合利用前面提到的四种 DM方法分
析数据中的数据。
? 3.表述
? 表述 (Presentation):与验证型工具一样,DM
将获取的信息以便于用户理解和观察的方式反
映给用户,这时可以利用可视化工具。
? 4.评价
? 评价 (Asess):如果分析人员对分析结果
不满意,可以递归地执行上述三个过程,
直到满意为止。
(五 )DM与 OLAP的区别和联系
?DM与 OLAP都属于分析型工具,但两者
之间有着明显的区别。
? DB工具 (包括查询工具、报表生成器等 )
都属于操作型工具,它们建立在操作型
数据之上,主要是为了满足日常信息提
取之需。
? DM是一种挖掘型工具,它能有效地从大量数
据中自动地发现隐藏在数据中的模式。 DM与
其他分析型工具最大的不同在于:它的分析过
程是自动的。 —个成熟的 DM系统除了具有良
好的核心的技术外,还应该具有开放性的结构,
友好的用户接口。 DM的用户不必提出确切的
问题,而只需 DM去挖掘隐藏的模式并预测未
来的趋势,这样更有利于发现未知的事实。
? OLAP是一种自上而下、不断深入的分析工具,用户
提出问题或假设,OLAP负责从上至下深入地提取出关
于该问题的详细信息,并以可视化的方式呈现给用户。
与 DM相比,OLAP更多地依靠用户输入问题和假设,
但用户先入为主的局限性可能会限制问题和假设的范
围,从而影响最终的结论。因此,作为验证型分析
OLAP更需要对用户需求有全面而深入的了解。显然,
从对数据分析的深度的角度来看,OLAP位于较浅的层
次,而 DM所处的位置则较深。如果按前面所介绍的
E,F,Codd的数据分析模型来区分这两者,那么应该
说 OLAP实现了解释模型和思考模型,而 DM则实现了
更深的第四层一解析模型。所处分析模型层次的不同
决定了这两者的分析能力和所能回答的问题种类也不
相同。
四、空间分析
?由于物流的主要目的之一是实现物品的
空间转移,因此空间分析对物流来说是
一类非常重要的分析内容。
?说是一类非常重要的分析内容。 由于
数字概念与方法的引入,并从统计方法
扩展到运筹学、拓扑学等方法的应用,
进一步促进了空间分析、定量分析的能
力。
(一 )空间分析层次
?GIS的空间分析可分为三个不同的层次。
?一是空间检索,包括从空间位置检索空间物体
及其属性和从属性条件集检索空间物体。
? 二是空间拓扑叠加分析,空间拓扑叠加实现了
输入特征的属性的合并以及特征属性在空间上
的连接。空间拓扑叠加本质是空间意义上的布
尔运算。
?三是空间模拟分析,空间模拟分析刚刚起步。
(二 )GIS与空间模型分析
?目前多数研究工作着重于如何将 GIS与空
间模型分析相结合,其研究可分三类:
?第一类是 GIS外部魄窝间模型分析,将
GIS当作一个通用的空间数据库,而空间
模型分析功能借助于其他软件;
?第二类是 GIS内部的空间模型分析,试图
利用 GIS软件来提供空间分析模拟以及发
展适用于问题解决模型的宏语言,这种
方法一般基于空间分析的复杂性与多样
性,易于理解和应用,但由于 GIS软件所
能提供空间分析功能极为有限,这种紧
密结合的空间模型分析方法在实际 GIS的
设计中较少使用;
?中较少使用;
? 第三类是混合型的空间模型分析,其
宗旨在于尽可能地利用 GIS所提供的功能,
同时也充分发挥 GIS使用者的能动性。
第四节物流系统模拟
?一、模拟的定义与特点
? (一 )模拟的定义
? 系统模拟被定义为:在建立数字逻辑模
型的基础上,通过计算机实验,对一个
系统按照一定的决策原则或作业规则由
一个状态变换为另一个状态的动态行为
进行描述和分析。
?(二 )模拟的特点
? 系统模拟具有一种数值技术;是一种
“人工”实验手段;是以计算机作为工
具;是对系统状态在时间序列中的动态
写照;大多属于随机性系统模拟等特点。
二、物流系统中模拟技术应用的方法
? (一 )系统动力学方法
? 系统动力学 (SD,Systems Dynamics)是
研究信息反馈系统动态行为的计算机模
拟方法。
1,SD的构造模型思路与理论依据
?SD是从系统的微观结构入手,根据系统的结构
与功能的相互关系构造系统模型,同时,必须
深入到实际系统中所包含的那些不完全可测量
的因果反馈关系中去,把可度量的描述系统动
态变化趋势的数据,与不可度量的系统内部的
非线性关系联系起来。信息反馈回路是动态系
统的基本结构,任何系统都存在着一个或几个
主要反馈回路,他们决定系统的主要结构和动
态趋势。
?2,SD模型结构
? SD模型结构一般包括绘制因果关系图、系统
流图和构造数学模型。
? (1)因果关系图是用来描述系统因果反馈结构
的一种关系图形,它的主要任务:确定系统的
边界,定义系统的主要变量;表明变量间的因
果关系,应用因果关系链表示各变量的作用方
向;标识主要反馈回路。
? (2)系统流图是 DYNAMO程序设计的基础。它
由四个基本要素组成:流位 (1evel,存于系统
内部流的积累,如库存量 )、流率 (rate,表示在
流位变量之间单位时间内通过的流量,它可控
制流入与流出流的大小,可称为决策函数,还
可以设置辅助变量于流位变量与速率变量之问
的信息通道中的变量,成为速率表达式的一个
组成部分,当速率表达式很复杂时,可以用辅
助变量简化速率表达式。信息流和物流的符号,
如图 8—2所示。
(3)SD数学模型:由流位方程 (L方程,实
体流在流位变量中的积累过程 )、速率方
程 (R方程 )、辅助方程 (A方程 )、初值方程
和常量方程 (C方程 )等组成。
?DYNAMO语言 (DYNAMIC Models)是一
种计算机模拟语言,它由描述语句、控
制语句和函数组成,用于 SD模型使用计
算机来模拟实现现实系统的动态行为,
如库存的控制。
?(二 )其他方法
? 物流系统是一个复杂的动态过程系统,
涉及的随机因素很多,许多新的应用数
学模型和算法的出现,使得能够在计算
机的模拟下,预测物流系统的运行情况,
提供系统最佳配置而达到最佳效果。下
面简单的列举一些方法,不作展开。
?1.蚁群算法
? 蚁群算法 (Ant colony system)的创始人 Marco
Dorigo等受自然界蚁群的社会性行为的启发,
在 20世纪九十年代提出了一种新型的分布式模
拟算法,其基本思想是模仿蚂蚁依赖信息素进
行通信而显示出的社会行为。由于大规模的并
行计算,使蚁群避开了局部最优,采用了正反
馈机制,收敛速度加快,使用构造性的贪婪算
法,能在搜索的早期阶段找到较好的可行解。
?2.进化计算方法
? 模拟生物 (包括人类 )和各种自然现象解
决高度非线性、内部一类问题不很清楚
的。包含遗传算法、进化策略和进化规
划。许多组合优化问题,如旅行商 (TSP)
问题和调度问题 (作业调度问题和时间表
问题 )都能得到较好的解决。
?三、物流系统中的配置问题模拟
? 服务系统由服务机构和顾客构成。要求服务
的“顾客”可以是人,也可以是物。物资中心
(或储运仓库,物资转运站等 )是一个综合物流
服务系统。在装卸、运输作业中,许多服务项
目具有随机性质,例如某客户送来一车货物,
要求卸货人人库储存,而装卸工人和设备可能
正忙于其他装卸任务。这样,装卸工人和设备
与待卸货物就构成一个服务系统。
朱春鹤
第八章 支持物流决策的模型及信息分析技术
?利用物流管理信息系统解决了物流数据处理的
基本问题,进一步 利用其数据与信息进行分析、
支持物流企业领导决策是物流信息系统进一步
发展的必然要求 。
?本章介绍决策以及决策支持的相关概念,以及
物流决策的一般方法、物流决策模型和预测技
术,然后介绍决策支持系统、物流信息分析技
术和物流系统模拟。其目的是使读者掌握基于
决策的支持方法。
第一节 概 述
?一、决策支持与模型
? 自 20世纪 70年代 DSS的概念提出以来,
随着决策理论、信息技术等相关技术的
发展,决策支持系统的研究与应用水平
不断提高,尤其是 人工智能,Internet、
DW,DM,OLAP等的发展,为 DSS提供
了强大的技术支持,DSS的应用取得了
显著的成效。
?(一 )典型决策支持系统的组成
? 一个典型的决策支持系统 (即“三库”
系统 )主要由 数据管理子系统、模型库管
理子系统、方法库管理子系统、用户界
面子系统和用户 组成,
?数据管理子系统由 数据库 (DB)和数据管
理库系统 (DBMS)组成,完成 对数据仓库
的维护、使用 等功能。
?数据仓库的数据通常 从内部和外部数据
源中抽取。
?模型库管理子系统由模型库 (MB,Model
Base)和模型库管理系统 (MBMS,Model
Base Management Systems)组成。模型库
中存储了包含描述决策问题的相对独立
的子模型。
? 方法库管理子系统由方法库 (M*B:
Method Base)和方法库管理系统 (M*BMS:
Method Base Management Systems)组成。
?方法库 存储了解决决策模型的各种方法,
例如各种寻优方法等。方法库管理系统
则是对方法库中方法进行管理 (包括描述、
增加、删除、修改、使用等 ),为决策模
型求解的需要提供方法的支持。
?用户界面子系统 (User Interface)是用
户与 DSS决策支持系统之间 交流的界
面,用户和系统进行交互式对话,
用户向系统完成问题的描述,而系
统将处理的结果报告给用户。
? DSS的用户主要是指企业各层次
的管理者和分析人员 。
?许多非结构化和半结构化的问题非常复
杂,以至于除了通常的 DSS能力外,它
们还需要特别的专业知识。因此 DSS也
由“三库”结构,发展为“四库”结构
(增加知识库,即 IDSS)、“五库”结构
(增加知识库、数据仓库 )。
(二 ) 模型
?所谓模型就是 对问题的要素以及
要素之间关系的一种抽象表示,
?例如简单的二元一次方程组就可
以用来描述具有两个要素,且要
素之间是线性关系的某问题。
? 模型集 (如财务风险分析模型集 )都有特定的职
能,灵敏度分析模型是其中应用最为广泛的模
型之一。它通过重复的“如果 …… 则”的方法
来确定一个或多个要素的变化对其他要素 (如支
出额 )的影响或影响程度。
?为了在标准变化的情况下更好地预测支出情况
“如 …… 则”问题,从已知条件或假设条件出
发,允许用户根据标准的不同检测结果,“如
果把售价提高 5%或把广告预算增加 100,000
美元将会怎样呢?”“如果保持价格和广告预算不
变则又如何呢?”后向型灵敏度分析软件应用于
目标搜索:如果想在明年售出一百万个产品单
位,那么产品的价格应降多少?
(三 )管理信息系统和 DSS的决策支持能力的比较
?由于高层管理具有非结构化和流动性因素的特
点,管理信息系统对高层的决策支持能力较弱 。
如高级管理人员对公司的关键成功因素法产生
分歧或者公司面临一场危机而急需战略变更,
而原有的关键成功因素法已不适宜进行决策。
在现存系统的基础上整合决策支持系统,即系
统的创建者确实知道决策支持系统的信息需求,
但想利用现有的管理信息系统来满足这些信息
需求也许是不可能的,这是因为管理信息系统
早已用不同方法定义了重要的数据。
? 管理信息系统集中于结构化的信息流,
而决策支持系统强调的是变化、灵活和
快速反应。决策支持系统较少涉及用户
联结结构化信息流和相应的较强调模式、
假设、随机访问、列示图表的需求。
? 决策支持系统和管理信息系统都依赖于
专业化的分析设计,然而不同之处在于
管理信息系统通常遵循传统系统开发的
方法论 (如:生命周期法 ),在设计前及其
整个生命周期中确定信息需求,而决策
支持系统则是自觉地反复地并且不会被
中断确定用户需求。
二 决策支持的方式
?(一)两种基本的决策支持方式
?当今存在两种基本的决策支持系统,模型驱动
型和数据驱动型
? 早期的决策支持系统从公司数据库抽取数据、
建立模型,是典型的模型驱动型的决策支持系
统。近来随着数据处理和数据库技术的发展决
策支持系统正向数据驱动型的系统发展。
?1.模型驱动型决策支持
? 模型驱动型决策支持系统是发现问题
的 影响要素 和 内在关联,利用模型和数
据,建立问题的模型,然后 求解模型,
以 达到找到决策问题的方法,或者按照
构造的模型指导行动。
? 2.数据驱动型决策支持
? 第二种决策支持系统是数据驱动型的。
这种系统的分析来自主要组织系统的大
量数据。它允许用户从原来隐藏的大量
信息中选取有用的信息。
?例如可以从 DW里得到,然后 利用在线分
析程序和 DM技术可用来分析这些数据,
回答用户关心的问题,如“编号为 403的
产品在 2002年 5月装运出多少?”“以季度
为单位比较编号为 403的相关产品的实际
销量与计划销量”。
? 根据决策支持层度和难度的分析,可
知 数据驱动型的 DSS比模型驱动型的 DSS
应用更广 。
? (二 )以数据驱动型的
决策支持系统的元素
数据驱动型的决策支
持系统包括一个应用
于查询和分析的数据
单元、一定模式的软
件、数据分析技术和
用户界面,如图 8—1
所示。
?1.数据单元
? 决策支持系统的数据单元是当前和历史资料的
汇总。它可能是存处于一台个人电脑上的公司数
据资料的一部分,它可能包括一部分外部信息。
?另外,决策支持系统也可能连接的是一个被组织
传输协议系统不断更新的超大数据库。决策支持
系统中的数据单元大多是产品数据单元的复本,
以便使用起来不会影响其他系统的运行。
? 2.分析软件系统
? 分析软件系统包含用于数据分析的软件
工具,它包括各种在线分析程序,DM工
具等分析模型,并且这些工具很容易为
用户所用。
?3.用户界面
? 用户界面具有简单易用的画面、灵活
的用户支持界面支持用户和系统间的对
话,使用户可以容易地使用这些软件工
具。
?三、决策支持系统应用实例
? 决策支持系统已经应用许多方面,表 8—1给
出了部分应用实例。沃尔马采用的是数据驱动
型的决策支持系统,加拿大卡普国际系统 (Carp
?Systems International of Kanata,Ontario)销售的
高级策划系统 (APS)能使用原有的 MRPⅡ 中的
数据并使其具备决策支持功能。
第二节 物流的决策模型与预测模型
?一、物流决策的种类
? 在第二章,通过对物流系统以及主要业
务和业务流程的分析可知,物流系统中
除了数据处理和结构化决策外,还有大
量的半结构化和非结构化决策 。
? 运输中的决策 主要包括选择较合理的运输方式和路线、
具体物品的运输物流计划。
? 储存中的决策信息 主要是物品出库规则、最低库存量、
安全库存量、最高库存量、订货策略等。
? 物流加工中的决策 主要有加工方式、加工周期、加工
报价以及相关的配套决策。
? 配送中的决策 主要是如何按用户的需求,在充分利用
资源的前提下,确定备货规模、物资来源、配送方式、
配送路线等。按配送商品的种类和数量分类:少品种
(或单品种 )、大批量配送;多种品种、少批量、多批次
配送;成套配套配送。按配送时间及数量分类:定时
配送;定量配送;定时定量定点配送;即时配送。按
配送的组织形式不同分类:集中配送;共同配送;分
散配送。不同的配送有不同的决策要求。
二、物流决策的相关模型
?每个模型有各自应用的假设或者前提,
因此模型有各自适应的应用范围。而不
同的决策问题有不同的特点和结构,不
同的决策者有不同要求,有自己的决策
偏好和决策风格,因此在采取模型驱动
型的决策支持时,应该根据上述因素,
选择合适的模型。
?表 8—2从决策问题、可采用的相关模型、
模型使用的效果、模型使用的条件、模
型使用需要的主要相关数据以及求解方
法等方面,对物流中的部分决策可用的
主要相关模型进行了描述。
三、预测模型
?决策离不开预测,预测能够在一定程度上反映
客观事物发展的趋势,因此能为正确的决策提
供一定信息。物流预测能为 科学地编制物流经
营计划和物流业务计划、调度提供参考 。只有
通过物流预测,才能了解宏观物流活动发展动
态,分析对象发展趋势从而避免盲目地编制物
流企业的作业计划和宏观计划,有利于提高现
代物流经营管理水平,为正确地经营决策打下
基础,有利于分析各种变化对物流企业的影响,
有利于为物流企业的管理现代化创造良好的条
件。
(一 )预测的概念
? 1.预测的概念
? 预测是一门掌握对象变化动态的科学,
它是对对象变动趋势的预见、分析和判
断,也是一种动态分析方法。
?2.预测的基本步骤
? (1)确定预测目标,包括预测对象、目的、
对象范围;
? (2)搜集分析内部和外部资料;
? (3)数据的处理及模型的选择;
? (4)预测模型的分析,修正;
? (5)确定预测值。
(二 )预测的方法
? 预测的准确程度不仅取决于对错综复杂的对象发展变
化情况掌握的程度,而且还在于采取怎样的 预测方法,
特别在占有资料的同时要选定适合的预测方法。预测
方法一般有 定性分析预测法和定量预测法,其中定性
预测包括集合意见、用户意见法 (对象调查法 )、员工意
见法、专家评估法、类推法、判断预测和目标分解法
等;定量预测方法包括:情景分析法、时间序列分析
法 (移动平均,指数平滑,季节系数,DOx—
TENKENS法 )、因果分析法 (线性,回归,非线性模型:
含生命周期法,经济计量模型,灰色系统模型,状态
转移分析法,模拟法,系统模型 )等。
? 1.定性预测
? 它是在对象调查的基础上,根据预测者个人经验,
阅历,学识和智慧,采用类比分析和综合的方法对对
象进行直观判断的方法。根据对象,可分为:
? (1)集合意见法 (三种估计加权预测法 ),它是一种加
权综合判断法;
? (2)用户意见调查法 (设计调查表 );
? (3)员工意见法;
? (4)专家意见法;
? (5)类推法。
? 2.定量 (分析预测 )
? (1)时间序列分析法。这种预测对时间序列的
原始数据要求:在时间上具有连续性 (如果 1~ 5
月中除 4月都有数据,可采用合适的平均值办
?法补足 );数据之间的可比性 (例如,每个月天
数是不同的,可化为相同的天数先求出某月每
天的平均销售量 );应可采用交叉预测如预测 9
月,可用 1月~ 9月也可用不同年份 9月数据 )。
?时间序列可划为四种变化特征:趋势性 (T)、季
节性 (s)、周期性 (c)、不规则性 (I),可以利用散
点图识别来变化特征。
? 时间序列分析法一般有方法:简单平均、移
动平均、加权移动平均、指数平滑、一元线性
回归、相关比例推算。例如:
? 一元线性回归 (趋势外推 )Y=a0+a1*x
? 系数用最小二乘法确定系数,a0 a1
? 相关比例推算 (首先找出影响产品销售量,主要因
素,再据各种比例关系,推出预测值 )。例如,某
第三方物流企业市场的需求预测 (如表 8—4所示 )。
?2)回归预测:
? 一元线性回归 (趋势外推 ),Y=ao+a1’x
? 多元回归 (因果关系 ), Y=ao+al。
X1+a2x2+…+anx 。
? 系数用最小二乘法确定系数,a0
a1..,aIl
?(3)非线性模型:
? Y=A+B*LOG(X)
? Y=1/ (A+B。 EXP(一 X)
? Y=1/ (A+B”X)
? Y=X/ (A+B’X)
? Y=A。 )(^B,(A>0)
? Y=A’EXP(B。 X),(A>0)
? Y=A’EXP(B/ X),(A>0)
? Y=A’ExP(B。 x“2),(A>0)
?将以上模型进行线性处理再转化为一元回归模
型。
? (4)灰色预测模型 GM(1,1)。
? (5)组合预测。采用不同合理的模型预测
后,再进行回归得出组合预测模型。
? (三 )预测模型选取的原则
? 据有关研究资料表明,以预测方法应用多少
为标准进行从大到小排序是,回归分析、指
数平滑、数量经济模型、专家会议、主观概率
法、多变量时间序列模型、趋势外推、抽样调
查、移动平均、投入产出、相关数、类推法等;
在高层次经济预测方面以国家统计为例,主要
应用数量经济模型、其他有投入产出模型、回
归分析、移动平均等;在低层次方面为专家会
议、类推法、移动平均、主观概率法、指数平
滑、回归分析等。
? 定量预测、定性预测和计算机相结合是
当今预测的主导方向。神经网络预测理
论、基于规则的预测系统、专家预测系
统、判断预测、组合预测是当今世界预
测科学发展的最新动向。
?模型选择的原则:要在数据识别上建模、
建立何种模型,并不取决于预测者意图;
应考虑适用、数据易采集和时效的原则;
定量与定性相结合的原则等。
? 对数据选取选用的原则:数据应该具
有代表性,有一定客观规律。对于异常
的数据可采用比例法、移动平均、指数
平滑等方法进行适当的修正。
第三节 支持物流决策的信息分析技术
? 一、数据仓库
? (一 )基本概念
? 1.数据仓库的定义
? 什么是数据仓库,有不同的看法:
?, DW是作为 DSS服务基础的分析型 DB,用来存放
大容量的只读数据,为制订决策提供所需的信息。”
?, DW是与操作型系统相分离的、基于标准企业模型
集成的、带有时间属性的 (即与企业定义的时间区段相
关 )、面向主题及不可更新的数据集合。”
? 综合对数据仓库多种理解以及其作用,
数据仓库可以定义为支持管理决策过程
的、面向主题的、集成的、稳定的、不
可更新的、随时间变化的、分层次的数
据集合。它是一个综合的、面向分析的
数据环境,利用现有的数据进行分析和
推理,从而为决策提供依据而建立的综
合体系。
? 2.数据仓库的作用
? 数据仓库具有两个主要作用:
?一是从各信息源提取决策需要的数据,
加工处理后,存储到数据仓库中;
?二是用户的查询和决策分析的基础。
?(二 )数据仓库的分析
? 1.主题与面向主题
? 数据库 面向应用 进行的数据组织,DW
中的数据是 面向主题 进行数据的组织。
? 主题是一个 抽象的概念,是在较高层
次上将企业信息系统中的数据综合、归
类并进行分析利用的抽象,每一个主题
是决策者关心的问题。
?面向应用进行数据组织方式的特点如下:
? 第一,面向应用进行数据组织,是指
对企业中相关的组织、部门等进行详细
调查,搜集数据库的基础数据以及其处
理的过程。调查的重点是“数据”和
“处理”,在进行数据组织时充分了解
企业的部门组织结构,考虑到企业各部
门的业务活动特点。
? 第二,面向应用进行数据组织应反映一
个企业内数据的动态特征,即要表达每
个部门的实际业务处理数据流程:即从
哪儿获取输人数据,在部门内进行什么
样的数据处理,以及向什么地方输出数
据。按照实际应用即业务处理流程来组
织数据,其主要目的是为了进行联机事
务处理,以提高日常业务处理的速度和
准确性等,提高服务质量。
?第三,这种数据组织方式生成的各项数
据库模式与企业中实际的业务处理流程
中所涉及的单据或文档有很好的对应关
系,这种对应关系使得数据库模式具有
很强的操作性,因而可以较好地在这些
数据库模式上建立起各项实际的应用处
理。
?第四,面向应用进行数据组织的方式并
没有体现数据库这一概念提出的原本意
图; 数据与数据处理的分离 ;要将数据
从数据处理或应用中抽象出来、解放出
来,组织成一个和具体的应用独立的数
据世界。
? 按照面向主题的方式数据的组织应该分
为两个步骤:抽取主题以及确定每个主
题所应包含的数据内容。主题是对应某
一分析领域的分析对象,所以主题的抽
取,应该是按照分析的要求来确定的。
这与按照数据处理或应用的要求来组织
数据的主要不同在于关心的数据内容不
同。
?面向主题的数据组织方式是根据分析要
求将数据组织成一个完备的分析领域,
即主题域。主题域应该具有:
? (1)独立性,如分析所要求的是“商品”
主题域,这一主题域可以和其他的主题
域有交叉,但它必须具有独立内涵,有
明确的界限,规定某项数据是否该属于
“商品”主题。
? (2)完备性,如,在“商品”这一主题内
找到该分析处理所要求的一切内容;如
果涉及现存“商品”主题之外的数据,
就应增加新数据到“商品”主题中来,
从而逐步完善“商品”主题。
?主题只是一个逻辑上的概念,实现时,主题的
数据项多了,可以采取化大为小。主题是一个
在较高层次上对数据的抽象,这使得面向主题
的数据组织可以独立于数据的处理逻辑,因而
可以在这种数据环境上方便地开发新的分析型
应用。同时,这种独立性也是建设企业全局数
据库所要求的,所以面向主题不仅是适用于分
析型数据环境的数据组织方式,且是适用于建
设企业全局数据库的数据组织方式。
?2,Dw数据的集成性
? Dw的数据 是从原有的 分散的数据库的数据 中
抽取来的。两者之间的差别:第一,Dw的每
一个主题所对应的源数据在原有的各自分散数
据库中有许多重复和不一致的地方,且来源于
不同的联机系统的数据都和相同的应用逻辑捆
绑在一起;第二,Dw中的综合数据不能从原
有的数据库系统直接得到。
?因此在数据进入 Dw之前,必然要经过统
一与综合,这是 DW建设中最关键、最复
杂的一步,所要完成的工作有:
? (1)要统一源数据中所有矛盾之处,如
字段的同名异义、异名同义、单位不统
一、字长不一致,等等。
? (2)进行数据综合和计算。 DW中的数
据综合工作可以从原有数据库抽取数据
时生成,但许多是在 DW内部生成的,即
进入 DW以后进行综合生成的。
? 3,DW数据的不可更新性
? DW的数据主要供企业决策分析之用,所涉及的数据
操作主要是数据查询,一般情况下并不进行修改操作。
DW的数据反映的是一段相当长的时间内历史数据的内
容,是不同时点的数据库快照的集合,以及基于这些
快照进行统计、综合和重组的导出数据,而不是联机
处理的数据。数据库中进行联机处理的数据经过集成
输入到 DW中,一旦 DW存放的数据已经超过 DW的数
据存储期限,这些数据将从当前的 DW中删去。因为
DW只进行数据查询操作,所以 DW管理系统 (DWMS)
相比 DBMS而言要简单得多。但是由于 DW的查询数据
量往往很大,所以就对数据查询提出了更高的要求,
它要求采用各种复杂的索引技术。
?4,DW数据的时态性
? DW中的数据不可更新是针对应用来说
的,即 DW的用户进行分析处理时不是进
行数据更新操作的。
?DW的数据是随时间的变化而不断变化的,这
是 DW数据的第四个特征。这一特征表现在以
下三个方面:
? (1)DW随时间变化不断增加新的数据内容,
要不断地生成数据库的快照,经统一集成后增
加到数据库中,但对于每次的数据库快照是不
再变化的,捕捉到新的变化数据,只不过又生
成一个数据库的快照增加进去,而不会对原来
的数据库快照进行修改。
?(2)DW的数据也有存储期限,一旦超过
了这一期限,过期数据就要被删除。只
是 DW内的数据时限要远远长于操作型环
境中的数据时限。
?在操作型环境中一般只保存有 60~ 90天
的数据,而在 DW中则需要保存较长的时
限的数据 (如 5~ 10年 ),以适应 DSS进行
趋势分析的要求。
?(3)DW中包含有大量的综合数据,这些
综合数据中很多跟时间有关,如数据经
常按照时间段进行综合,或每隔一定的
时间片进行抽样等等。这些数据要随着
时间的变化不断地进行重新综合。因此,
DW数据的码键都包含时间项,以标明数
据的历史时期。
二、联机分析处理
? (一 )联机分析处理的定义与特点
? 1.定义
?通过专门的数据综合引擎,辅之以更加
直观的数据方问界面,力图统一分散的
公共应用逻辑,在短时间内响应非数据
处理专业人员的复杂查询要求。 1993年,
E,F,Codd将这类技术定义为,OLAP"。
?2.特点
?一般数据库由于主要用于企业的日常事
务处理工作,存放在数据库中的数据也
就大体符合操作型数据的特点。而为适
应数据分析处理要求而产生的 Dw中所存
放的数据就应该是分析型的数据。
(二 ) OLAP的基本术语
?OLAP是针对特定问题的联机访问和分析
数据。通过对信息 (这些信息已经从原始
的数据进行了转换,以反映用户所能理
解的企业的真实的“维” )的很多种可能
的观察形式进行快速、稳定一致和交互
性的存取,允许管理决策人员对数据进
行深观察。
?1.变量
? 变量是数据的实际意义,描述数据“是什
么”。一般情况下,变量总是一个数值度量指
标。
? 2.维
? 维是人们观察数据的特定角度。
例如,企业常常关心服务收入随着服务水平提
高而产生的变化情况,这时该企业是从服务水
平的角度来观察产品的服务收入,所以服务水
平就是一个维 (服务维 )。
?3.维的层次
? 人们观察数据的特定角度 (即某个维 )还可以
存在细节程度不同的多个描述方面,我们称这
多个描述方面为维的层次。
?例如描述维时间,可以从日期、月份、季度、
年等不同层次来描述,那么日期、月份、季度、
年等就是时间维的层次;同样,城市、地区、
国家等构成了一个地理维的多个层次。
?4.维成员
? 维的一个取值称为该维的一个维成员。
如果一个维是多层次的,那么,该维的
维成员是在不同维层次的取值的组合。
?5.多维数组
? 一个多维数组可以表示为,(维 1,维 2,……,
维 n,变量 )。
?例如,日用品销售数据是按时间、地区和销售
渠道组织起来的三维立方体,加上变量“销售
额”,就组成了一个多维数组 (地区、时间、销
售渠道、销售额 )。如果我们扩展一个维、产品
维,就得到一个四维的结构。
? 6.数据单元
? 多维数组的取值称为数据单元。当多
维数组的各个维选中一个维成员,这些
维成员的组合就惟一确定了一个变量的
值。那么数据单元就可以表示为,(维 1
成员,维 2成员,……,维 n成员,变量
的值 )。
(三 )OLAP的基本分析方法
?多维分析是指对以多维形式组织起来的
数据采取切片、切换、旋转等各种分析
方法,以求剖析数据,使最终用户能从
多个角度、多侧面地观察数据库中的数
据,从而深入地了解包含在数据中的信
息、内涵。
?多维分析方式符合了人的思维模式,使
分析人员能够迅速、一致、交互地从多
个角度、多个侧面来剖析反映企业维的
特性数据,使人们在观察数据时减少混
淆与错误,发现数据后面隐藏的有价值
并能被用户理解的信息、内涵,能更深
刻地反映企业的真实面目和企业所处的
环境,因此减少了混淆,降低了出现错
误解释的可能性。
?1.切片
? 定义 1:在多维数组的某一维上,选定
一维成员的方法称为切片,即在多维数
组 (维 1,维 2,……,维 n,变量 )中选一
维,即维 Vi,……,维 n,变量称为在维
I上的一个切片。
?定义 2:选定多维数组的一个二维子集的
方法叫做切片,即选定多维数组 (维 1,
维 2,……,维 n,变量 )中的两个维:维 I
和维 J,在这两个维上取某一区间或任意
维成员,而将其余的维都取定一个维成
员,则得到的就是多维数组在维 I和 j上一
个二维子集,称这个二维子集为多维数
在维 I和维 J上的一个切片,表示为,(维 I,
维 i,变量 )。
?2.切块
? 定义 l:在多维数组的某一维上,选定
某一区间的维成员的方法称为切块,即
限制多维数组的某一维的取值区间。显
然,当这一区间只取一个维成员时,好
得到一个切片 (切片的定义 1)。
?定义 2:选定多维数的一个三维子集的方法称
切块。即选定多维数组 (维 1,维 2,……,维 n,
变量 )中的三个维:维 I、维 i和维 r,在这三个维
上取某一区间或任意的维成员,而将其余的维
都取定一个维成员,则得到的就是多维数组在
维 I、维 i和维 r上一个三维子集,我们称这个三
维子集为多维数组在维 I、维 i和 r上的一个切块,
表示为,(维 I,维 i,维 r,变量 )。切块与切片
的作用与目的是相似的。
? 3.旋转
? 旋转即是改变一个报告或页面显示的维方向。
例如,旋转可能包含了交换行和列;或是把某
一个行维移到列维中去,或是把页面显示中的
一个维和页面的维进行交换 (令其成为新一行或
列中的一个 )把一个横向为时间、维向维产品的
报表旋转成为横向为产品、维向为时间的报表。
? (四 )OLAP的衡量标准
? 1993年,E,F,Codd在, Providing
OLAP(On—Line Analytical Pro—
cessing)to User Analysts,中提出了有关
OLAP的十二条准则,其多维数据分析、
客户/服务器结构、多用户支持及一致
的报表性能等得到了在多数人的认可。
?他所阐述的有关 OLAP产品及其所依赖的
数据分析模型的一系列概念及衡量标准
对 OLAP产品的识别及后来发展方向的确
立都有着重要的作用,尽管 Codd提出的
十二条准则也在不断的完善,但仍可以
?作为评价和购买 OLAP产品的参考标准。
?准则 1 OLAP模型必须提供多维概念视图
? 从用户分析员的角度来看,整个企业的
视图本质上是多维的,因此 OLAP的概念
模型也应是多维的。
?准则 2透明性准则
? 无论 OLAP是否是前端产品的一部分,
对用户来说,它都是透明的;如果在客
户/服务器结构中提供 OLAP产品,那么
对最终分析员来说,它同样也应透明。
?准则 3存取能力准则
? OLAP系统不仅能进行开放的存取,而且还提
供高效的存取策略。 OLAP用户分析员不仅能
在公共概念视图的基础上对关系数据库和外部
存储的数据进行分析。
?准则 4稳定的报表性能
? 当数据维数和数据综合层次增加时,提供给
最终分析员的报表能力和响应速度不应该有明
显的降低和减慢,这对维护 OLAP产品的易用
性和低复杂性至关重要。即便是企业模型改变
时,关键数据的计算方法也无需更改。也就是
说,OLAP系统模型对企业模型应该具有“鲁
棒”性。
?准则 5客户/服务器体系结构
? OLAP是建立在客户/服务器体系结构上的。
这要求它的多维数据服务器能够被不同的应用
工具访问到。
?准则 6维的等同性准则
? 每一数据维在数据结构和操作能力上都是等
同的。系统可以将附加的操作能力授给所选维,
但必须保证该操作能力可以授给任意的其他维,
即要求维上的操作是公共的。该准则实际上是
准 l的一个补充,是对维的基本结构和维上的操
作的要求。
?准则 7动态的稀疏矩阵处理准则
? OLAP工具的物理模型必须充分适应指
定的分析模型,提供“最优”的稀疏矩
阵处理,这是 OLAP工具的应遵循的最重
要的准则之一。
?准则 8多用户支持能力准则
? 多个用户分析员可以同时工作于同一分析模
型上或是可以在同一企业数据上建立不同的分
析模型。该准则可由准则 5推出。 OLAP工具必
须提供并发访问、数据完整性及安全性机制。
? 准则 9非受限的跨维操作
? 多维数据之间存在固有的层次关系,这就要
求 OLAP工具能自己推导出而不是最终用户明
确定义出相关的计算。对于无法从固有关系中
得出的计算,要求系统提供计算完备的语言来
定义各类计算公式。该准则是对准则 l的一个补
充,对操作能力和操作范围做出了要求。
?准则 10直观的数据操纵
? 这一准则要求数据操纵。这一准则要求
数据操纵直观易懂。综合路径重定位、
向上综合、向下挖掘和其他操作都可以
通过直观、方便的点击操作完成。
?准则 11灵活的报表生成
? 报表必须从各种可能的方面显示出从数
据模型中综合出的数据和信息,充分反
映数据分析模型的多维特征。
?准则 12不受限维与聚集层
? OLAP工具的维数应不小于 15维,用户
分析员可以在任意给定的综合路径上建
立任意多个聚集层次。
三、数据挖掘 (DM)
? (一 )概念
? 1.定义
? DM是一个 从大型数据库中抽取隐含的、从
前未知的、潜在有用的信息或关系的过程。
?它是从各种相关数据库的大量数据中提取出人
们感兴趣的知识和规则,这些知识和规则是可
信的、新颖的、有效的,并能容易被人理解的。
?2.作用
? 自动智能地分析数据库中的大量数据,
以获取信息,是推动数据挖掘型工具产
生并发展的强大动力。超级对象的经理
人员希望能从过去几年的销售记录中分
析出顾客的消费习惯和行为,以便及时
变换营销策略。
? 3.与知识发现的关系
? DM和知识发现 (KDD,Knowledge
Discovery in Database)有密切的联系。知
识发现是指从数据库中发现有用知识的
整个过程,DM则是这一过程中的一个特
定步骤。
4.特点
? DM的特点有:
? (1)处理的数据规模十分庞大;
? (2)由于用户不能形成精确的查询要求,因此需要靠
DM技术来寻找其可能感兴趣的东西;
? (3)DM对数据的迅速变化应作出快速响应,以提供
决策支持信息;
? (4)DM既要发现潜在规则,还要管理和维护规则,
随着新数据的不断加入,规则需要随之更新;
? (5)DM中规则的发现基于统计规律,发现的规则不
必适合于所有数据,而且当达到某一阈值时,便认为
有此规则。
(二 ) DM的技术
?DM涉及面相当广泛,从机器学习、模式识别、
统计学、智能数据库、知识获取直到数据可视
化、高性能计算、专家系统等各个领域。 DM
主要任务通常有分类、聚类、预测和关联等,
以便从浩瀚的数据海洋中采掘出有价值的求知
信息来支持决策,提高决策支持系统的正确性
和可行性。 DM技术应用诸如:神经网络、模
糊逻辑、遗传算法之类的统计分析工具。
?1.人工神经网络方法
? 人工神经网络方法是由大量的简单处
理单元 (即神经元 )所构成的一种能模仿延
伸人脑认知功能的新型信息处理系统,
它具有巨量并行处理信息和推理能力、
存储分布性、结构可变性、高度非线性、
自学习性和自组织性等特点,是 DM技术
中最重要的方法之一。
? 2.遗传算法
? 遗传算法 (Genetic Algorithms)可起到产
生优化后代的作用。这些后代需满足适
应值,经过若干代的遗传,将得到满足
要求的后代 (即问题的解 )。遗传算法已在
优化计算和分类机器学习方面发挥了显
著作用。
? 3.决策树方法
? 决策树方法 (Decision Trees)是利用信息
论中的互信息 (信息增益 )寻找数据库中具
有最大信息量的属性字段,建立决策树
的一个结点,再根据该属性字段的不同
取值建立树的分支;在每个分支子集中
重复建立树的下层结点和分支的过程。
(三 )DM的分析方法
?DM系统利用的技术越多,得出的结果精
确性就越高。原因很简单,对于某技术
不适用的问题,其他方法却可能奏效。
这主要取决于问题的类型以及数据的类
型和规模。无论采用哪几种技术来完成
任务,从功能上可以将 DM的分析方法划
分为以下四种 (根据 IBM的划分方法 ),关
联分析、序列模式分析、分类分析、聚
类分析。
? 1.关联分析
? 关联分析 (Associations)的目的就是为了
挖掘出隐藏在数据间的相互关系。
?2.序列模式分析
? 序列模式分析 (sequential Patterns)和关联
分析法相似,其目的也是为了挖掘出数
据之间的联系,但序列模式分析的侧重
点在于分析数据间的前后 (因果 )关系。
?3.分类分析
? 分类分析 (classifiers)。假定记录集合和一组
标记 (TAG),所谓标记是指一组具有不同特征
的类别。
? 4.聚类分析
? 聚类分析 (clustering)。与分类分析不同,聚
类分析法的输入集是一组未标定的记录,也就
是说此时输入的记录还没有被进行任何分类。
其目的是根据的这些规则是由聚类分析工具定
义的。由于聚类分析可以采用不同的算法,所
以对于相同的记录集合可能有不同的划分。可
以看出,许多在分类分析法中适用的算法同样
适用于聚类分析法。
(四 )DM系统的实施
?DM的核心技术是人工智能、机器学习、
统计等,但一个 DM系统不是多项技术的
简单组合,而是一个完整的整体,它还
需要其他辅助技术的支持,才能完成数
据采集、预处理、数据分析、结果表述
这一系列任务,最后将分析结果呈现在
用户面前。根据功能,整个 DM系统可以
大致划分为三级结构。
?DM的数据分析过程可以分成四个步骤:
? 1.数据准备
? 数据准备 (Data Preparation):本阶段又
可进一步细分两步数据集成、数据选择
和预分析。
?(1)集成 (Integration):
?(2)数据选择和预分析 (Data Selection and
Pre—Analysis):
?2.挖掘
? 挖掘 (Mining),DM处理器 (Data Mining
Processor)综合利用前面提到的四种 DM方法分
析数据中的数据。
? 3.表述
? 表述 (Presentation):与验证型工具一样,DM
将获取的信息以便于用户理解和观察的方式反
映给用户,这时可以利用可视化工具。
? 4.评价
? 评价 (Asess):如果分析人员对分析结果
不满意,可以递归地执行上述三个过程,
直到满意为止。
(五 )DM与 OLAP的区别和联系
?DM与 OLAP都属于分析型工具,但两者
之间有着明显的区别。
? DB工具 (包括查询工具、报表生成器等 )
都属于操作型工具,它们建立在操作型
数据之上,主要是为了满足日常信息提
取之需。
? DM是一种挖掘型工具,它能有效地从大量数
据中自动地发现隐藏在数据中的模式。 DM与
其他分析型工具最大的不同在于:它的分析过
程是自动的。 —个成熟的 DM系统除了具有良
好的核心的技术外,还应该具有开放性的结构,
友好的用户接口。 DM的用户不必提出确切的
问题,而只需 DM去挖掘隐藏的模式并预测未
来的趋势,这样更有利于发现未知的事实。
? OLAP是一种自上而下、不断深入的分析工具,用户
提出问题或假设,OLAP负责从上至下深入地提取出关
于该问题的详细信息,并以可视化的方式呈现给用户。
与 DM相比,OLAP更多地依靠用户输入问题和假设,
但用户先入为主的局限性可能会限制问题和假设的范
围,从而影响最终的结论。因此,作为验证型分析
OLAP更需要对用户需求有全面而深入的了解。显然,
从对数据分析的深度的角度来看,OLAP位于较浅的层
次,而 DM所处的位置则较深。如果按前面所介绍的
E,F,Codd的数据分析模型来区分这两者,那么应该
说 OLAP实现了解释模型和思考模型,而 DM则实现了
更深的第四层一解析模型。所处分析模型层次的不同
决定了这两者的分析能力和所能回答的问题种类也不
相同。
四、空间分析
?由于物流的主要目的之一是实现物品的
空间转移,因此空间分析对物流来说是
一类非常重要的分析内容。
?说是一类非常重要的分析内容。 由于
数字概念与方法的引入,并从统计方法
扩展到运筹学、拓扑学等方法的应用,
进一步促进了空间分析、定量分析的能
力。
(一 )空间分析层次
?GIS的空间分析可分为三个不同的层次。
?一是空间检索,包括从空间位置检索空间物体
及其属性和从属性条件集检索空间物体。
? 二是空间拓扑叠加分析,空间拓扑叠加实现了
输入特征的属性的合并以及特征属性在空间上
的连接。空间拓扑叠加本质是空间意义上的布
尔运算。
?三是空间模拟分析,空间模拟分析刚刚起步。
(二 )GIS与空间模型分析
?目前多数研究工作着重于如何将 GIS与空
间模型分析相结合,其研究可分三类:
?第一类是 GIS外部魄窝间模型分析,将
GIS当作一个通用的空间数据库,而空间
模型分析功能借助于其他软件;
?第二类是 GIS内部的空间模型分析,试图
利用 GIS软件来提供空间分析模拟以及发
展适用于问题解决模型的宏语言,这种
方法一般基于空间分析的复杂性与多样
性,易于理解和应用,但由于 GIS软件所
能提供空间分析功能极为有限,这种紧
密结合的空间模型分析方法在实际 GIS的
设计中较少使用;
?中较少使用;
? 第三类是混合型的空间模型分析,其
宗旨在于尽可能地利用 GIS所提供的功能,
同时也充分发挥 GIS使用者的能动性。
第四节物流系统模拟
?一、模拟的定义与特点
? (一 )模拟的定义
? 系统模拟被定义为:在建立数字逻辑模
型的基础上,通过计算机实验,对一个
系统按照一定的决策原则或作业规则由
一个状态变换为另一个状态的动态行为
进行描述和分析。
?(二 )模拟的特点
? 系统模拟具有一种数值技术;是一种
“人工”实验手段;是以计算机作为工
具;是对系统状态在时间序列中的动态
写照;大多属于随机性系统模拟等特点。
二、物流系统中模拟技术应用的方法
? (一 )系统动力学方法
? 系统动力学 (SD,Systems Dynamics)是
研究信息反馈系统动态行为的计算机模
拟方法。
1,SD的构造模型思路与理论依据
?SD是从系统的微观结构入手,根据系统的结构
与功能的相互关系构造系统模型,同时,必须
深入到实际系统中所包含的那些不完全可测量
的因果反馈关系中去,把可度量的描述系统动
态变化趋势的数据,与不可度量的系统内部的
非线性关系联系起来。信息反馈回路是动态系
统的基本结构,任何系统都存在着一个或几个
主要反馈回路,他们决定系统的主要结构和动
态趋势。
?2,SD模型结构
? SD模型结构一般包括绘制因果关系图、系统
流图和构造数学模型。
? (1)因果关系图是用来描述系统因果反馈结构
的一种关系图形,它的主要任务:确定系统的
边界,定义系统的主要变量;表明变量间的因
果关系,应用因果关系链表示各变量的作用方
向;标识主要反馈回路。
? (2)系统流图是 DYNAMO程序设计的基础。它
由四个基本要素组成:流位 (1evel,存于系统
内部流的积累,如库存量 )、流率 (rate,表示在
流位变量之间单位时间内通过的流量,它可控
制流入与流出流的大小,可称为决策函数,还
可以设置辅助变量于流位变量与速率变量之问
的信息通道中的变量,成为速率表达式的一个
组成部分,当速率表达式很复杂时,可以用辅
助变量简化速率表达式。信息流和物流的符号,
如图 8—2所示。
(3)SD数学模型:由流位方程 (L方程,实
体流在流位变量中的积累过程 )、速率方
程 (R方程 )、辅助方程 (A方程 )、初值方程
和常量方程 (C方程 )等组成。
?DYNAMO语言 (DYNAMIC Models)是一
种计算机模拟语言,它由描述语句、控
制语句和函数组成,用于 SD模型使用计
算机来模拟实现现实系统的动态行为,
如库存的控制。
?(二 )其他方法
? 物流系统是一个复杂的动态过程系统,
涉及的随机因素很多,许多新的应用数
学模型和算法的出现,使得能够在计算
机的模拟下,预测物流系统的运行情况,
提供系统最佳配置而达到最佳效果。下
面简单的列举一些方法,不作展开。
?1.蚁群算法
? 蚁群算法 (Ant colony system)的创始人 Marco
Dorigo等受自然界蚁群的社会性行为的启发,
在 20世纪九十年代提出了一种新型的分布式模
拟算法,其基本思想是模仿蚂蚁依赖信息素进
行通信而显示出的社会行为。由于大规模的并
行计算,使蚁群避开了局部最优,采用了正反
馈机制,收敛速度加快,使用构造性的贪婪算
法,能在搜索的早期阶段找到较好的可行解。
?2.进化计算方法
? 模拟生物 (包括人类 )和各种自然现象解
决高度非线性、内部一类问题不很清楚
的。包含遗传算法、进化策略和进化规
划。许多组合优化问题,如旅行商 (TSP)
问题和调度问题 (作业调度问题和时间表
问题 )都能得到较好的解决。
?三、物流系统中的配置问题模拟
? 服务系统由服务机构和顾客构成。要求服务
的“顾客”可以是人,也可以是物。物资中心
(或储运仓库,物资转运站等 )是一个综合物流
服务系统。在装卸、运输作业中,许多服务项
目具有随机性质,例如某客户送来一车货物,
要求卸货人人库储存,而装卸工人和设备可能
正忙于其他装卸任务。这样,装卸工人和设备
与待卸货物就构成一个服务系统。