第二章 决策量化方法准备知识
商业电子表格制模( Excel)
概率与统计简介
基础运筹学
数据挖掘技术概率与概率分布
(1) 数权归纳:更易理解、直观、总体状态与趋势,比较结果,应用于量化方法。
(2) 平均数 mean =
中位数众 数变动幅度:最大数值 —最小数值绝对商差均值:
标准差 = 方差
∑ i=1
n
ABS[xi-μ]
xi
n = μ
i=1
n
∑
n
[xi-μ]2∑
n
i=1
n误差平均均值 =
数据 -原始数值数据 -有用形式信息处理数据解释概率与概率分布
(3) 概率:
事件 A发生概率 P(A)
独立事件概率,P(A∪ B)=P(A)+P(B)
(A,B独立事件) P(A∩ B)=P(A)?P(B)
条件概率(贝叶斯定律),P(A/B)=
P(A)=0
P(A)=1
0<P(A)<1
P(B/A) P(A)
P(B)
概率与概率分布实例:
购买的二手车,也许会好,也许会不好。如果买的车好,70%的会耗油量较低,
20%的会有中等的耗油量。如果买的车不好,50的会耗油量较高,30%的会有中等耗油量。对一辆二手车的实验表明该车耗油量较低。如果成交的二手车有 60%是好的,那么,这辆车属于好的概率为多少?
概率与概率分布
A B C D E F G H
1
2
3 HOC M O C L O C HOC M O C L O C
4 GB 0,1 0,2 0,7 0,6 0,06 0,12 0,42
5 BB 0,5 0,3 0,2 0,4 0,2 0,12 0,08
6 0,26 0,24 0,5
7 0,231 0,5 0,84
8 0,769 0,5 0,16
±′ ò1?¨àí
概率与概率分布
A B C D E F G H
1
2
3 HOC M O C L O C HOC M O C L O C
4 GB 0,1 0,2 0,7 0,6 0,06 0,12 0,42
5 BB 0,5 0,3 0,2 0,4 0,2 0,12 0,08
6 0,26 0,24 0,5
7 0,231 0,5 0,84
8 0,769 0,5 0,16
±′ ò1?¨àí
概率与概率分布概率树:
P(MOC)=0.24
P=0.06
P=0.20
P=0.12
P=0.12
P=0.42
P=0.08
概率分布二项分布:
特征:每次实验有两种可能的结果,可以称之为成功和失败;两种结果是互斥的;成功和失败的概率都是一个固定的常数,分别为 P和 q=1-P;连续实验的结果之间是独立的。
P(n次实验中有 r次成功 )=Crnprqn-r = prqn-r
均值 = μ = np
方差 = δ 2 = n.p.q
标准差 = δ = (n.p.q)1/2
n!
r!(n-r)!
柏松分布 (pocsson distribution)
柏松分布的特征:
试验次数 n较大 (大于 20);
成功的概率 P较小。
P(r次成功 ) =
其中 e = 2.7183,μ = 平均成功次数 = n.p
均值 = μ= n.p
方差 =δ 2 = n.p
标准差 =δ = ( n.p) 1/2
*只用到成功的概率
e-μ μr
r!
正态分布
特征:
连续的
是关于均值 μ对称的
均值、中位数及众数三者相等
曲线下总面积为 1
μ
f(x)
观察值 x
正态分布
f(x)= e-(x- μ)2/2δ 2= e-
其中 x-变量值,μ-均值,δ -标准差,π =3.14159 e=2.7183
Z= = 商开均值的标准差个数
P(x1< x < x2)=
z1 =
z2 =
1
δ ·2π
1
δ ·2π
Z2
2
1-P(x <x1)-P(x>x2),x1≤ μ
P(x>x1)-P(x>x2),x1>μ
X1-μ
δ
X2-μ
δ
μ x1 x2
X-μ
δ
概率分布实例一个中型超市日销售 500品脱牛奶,标准差为 50品脱。
(a)如果在一天的开门时,该超市有 600品脱的牛奶存货,这一天牛奶脱销的概率有多少?
(b)一天中牛奶需求在 450到 600品脱之间的概率有多大?
(c)如果要使脱销概率为 0.05,该超市应该准备多少品脱的牛奶存货?
(d)如果要使脱销概率为 0.01,应准备多少品脱的牛奶存货?
0.02280.1587
0.8185f(x)
x
450 500 600
统计抽样与检验方法系统可靠性分析可靠性,1-(1-R)2 可靠性,R2
R
R
RR
统计抽样与检验方法抽样,目的是通过收集式考察少数几个观察值 (样本 ),而不是全部可能的观察值 (总体 ),得出可靠的数据。
抽样分布,由随机样本得出的分布。
中心极限定理 (central limit theorem),无论原来总体的分布如何,总体中抽样取大量的随机样本,样本的均值符合正态分布。
假 设总体:个数 N,均值 μ,标准差 δ ;
样本:个数 n,均值 X,标准差 S;
则,X=μ,S=δ / n1/2 -(抽样标准误差 )
统计抽样与检验方法置信区间,总体均值在某一范围内的可信水平。
总体均值的 95%置信区间为,(X-1.96 S,X+1.96 S)
统计抽样与检验方法案例:全面质量管理传统上,有大量的抽样方法应用于质量控制。近年来,许多组织改变了他们对质量的认识。他们不再设定一个残次品水平,
出不再认为达到了这样一个水平就说明组织运转良好。相反,他们代之以“零残次品”为目标,其实施方法是全面质量管理
(Total Quality Management,TQM),这要求整个组织一起努力,系统改进产品质量。
爱德华 ·戴明 (Edward Deming)是开创了全面质量管理工作的专家之一,他将自己的实践经验总结为以下 14条。
1 将产品质量作为一贯性的目的。
2 杜绝即使是客户允许的差错、延误、残次和误差。
3 停止对于成批检验的依赖,从生产开始的第一步就树立严格的质量意识。
4 停止依据采购价格实施奖励的作法 -筛选供应商,坚持切实有效的质量检测。
5 开发成本、质量、生产率和服务的持续改进项目。
6 对全体职员进行正规培训。
7 监督工作的焦点在于帮助职员把工作做得更好。
8 通过倡导双向沟通,消除各种惧怕。
9 打破部门间的障碍,提倡通过跨部门的工作小组解决问题。
10 减少以至消除那些并不指明改进和实现目标方法的数字目标、标语和口号。
11 减少以至消除会影响质量的武断的定额。
12 消除有碍于职员工作自豪的各种障碍。
13 实现终身教育、培训和自我改进的正规的有活力的项目。
14 引导职员为实现上述各条而努力工作。
有许多应用 TQM后获得成功的实例。例如,在广岛的日本钢铁厂 (Japan Steel Works),实施 TQM后,在人员数量减少 20%的情况下,产量增长 50%,同时,残次品费用由占销售额的 1.57%下降到 0.4%。美国福特公司实施 TQM后,减少了保修期内实际修理次数 45%,根据用户调查,故障减少了 50%。惠普公司实施 TQM后,劳动生产率提高了 40%,同时,在集成电路环节减少质量差错 89%,在焊接环节减少质量差错 98%,在最后组装环节减少质量差错 93%。
统计抽样与检验方法假设检验,对总体的某种认识是否得到样本数据的支持。
检验的步骤:
定义一个关于实际情况的简明、准确的表述(假设)。
从总体中取出一个样本。
检验这个样本,看一看它是支持假设,还是证明假设不大可能。
如果证明假设情况是不大可能的,拒绝这一假设,否则,接受这一假设。
实例:
一种佐料装在包装盒中,名义重量为 400克。实际重量与这一名义重量可能略有出入,呈正态分布,标准差为 20克。通过在生产线上定期抽取样本的方法确保重量均值为 400克。一个作为样本抽出的盒子中佐料重量为 446克。这能说明现在佐料填装过量了吗?
统计抽样与检验方法假设检验的误差(增大样本,减少误差)
原假设实际上是对的 错的不拒绝 正确的决策 第二类错误拒 绝 第一类错误 正确的决策决 策统计抽样与检验方法实例:
据说,某行业从业人员平均工资为每周 300英镑,标准差为 60英镑。有人认为这一数据已经过时了,为检验实际情况究竟如何,一个 36份工资的随机样本从该行业中抽取出来。研究确定如果样本工资均值小于 270英镑或大于 330
英镑,就拒绝原假设。犯一类错误的概率有多大?
统计抽样与检验方法显著水平,是根据观察值证明样本是取自某一假设总体的最低可接受概率。( 5%)
μ
0.95
5%
0.025(拒绝 )(拒绝 ) 0.025 接受假设统计抽样与检验方法假设检验的步骤:
– 表述原假设和备选假设。
– 确定拟采用的显著性水平。
– 计算待检验变量的可接受范围。
– 取得待检验变量的样本值。
– 决定是否拒绝原假设。
– 说明结论。
统计抽样与检验方法实例:
某地区公布的人均收入为 15,000英镑。一个 45人的样本的平均收入是 14,300英镑,标准差为 2000英镑。按照 5%的显著性水平检验公布的数字。按 1%的显著性水平检验结果又如何?
统计抽样与检验方法
(a)双边检验 (b)单边检验
f(x)
x
f(x)
0.0250.025
--1.96δ --1.96δ --
μ μ
0.05
x
-1.64δ -
统计抽样与检验方法实例:
一个邮递公司对某客户按平均每份邮件 1.75公斤,标准差为 0.5公斤的情况确定每份邮件的收费水平。邮费现在很高,而有人提出该客户邮件重量均值不止 1.75公斤。随机抽取该客户 100份邮件的样本,平均重量为 1.86公斤。这是否说明重量均值确实已超过 1.75公斤?
f(x)
x1.75 1.83 1.86
1%
5%
5%显著性 1%显著性
2.33δ
1.64δ
基础运筹学 (OR Software)
线性规划 运输问题 存 贮 论整数规划 指派问题 决策分析
0 - 1 规划 非线性规划 对 策 论动态规划 目标规划 排 队 论预 测 模 拟 排 序 论基础运筹学 (OR Software)
运筹学软件
( 1) Excel 2000 (Optimization option);
( 2 ) Lindo or Lingo package;
( 3 ) Cplex;
( 4 ) CUTE,LANCLOT for research;
( 5 ) ERP;
( 6 ) 教学软件;
( 7) 其他 。
数据挖掘技术 (Data -mining)
数据挖掘,构造和使用数据仓库的过程。
数据仓库 达到不同层次用户可需的最详细的有用数据、信息
(1)使公司取得更大的市场
(2)更好的形象
(3)更强的竞争力等数据挖掘技术过程数据挖掘技术 (Data -mining)
数据挖掘过程业务数据提取、滤液、清除、聚集统计学、心理学、叠加数据数据库装入程序 数据仓库
RDBMS 数据提取用于数据挖掘数据挖掘技术 (Data -mining)
数据挖掘中的数据及信息流数据提取用于数据挖掘结合规则 生成简要表 其它数据挖掘供业务决策的信息数据挖掘技术 (Data -mining)
数据挖掘的有关技术
(1) 统计分析系统 (SAS,SPSS)
(2) DSS,EIS,ES
(3) 多维电子表格及数据库
(4) 神经网络
(5) 数据可视化数据挖掘技术 (Data -mining)
数据挖掘的应用
商品销售
制造
金融服务 /信用卡
远程通信
数据库