1
第十五章 决策分析
? 确 定 型 决 策 问 题
? 在决策环境完全确定的条件下进行
? 不 确 定 型 决 策 问 题
? 在决策环境不确定的条件下进行,对各自然状态发生的概
率一无所知
? 风 险 型 决 策 问 题
? 在决策环境不确定的条件下进行,各自然状态发生的概率
可以预测
2
? 特征,1、自然状态已知; 2、各方案在不同自然状
态下的收益值已知; 3、自然状态发生不确定。
? 例:某公司需要对某新产品生产批量作出决
策,各种批量在不同的自然状态下的收益情
况如下表(收益矩阵):
§ 1 不确定情况下的决策
自然状 态
行动方案
N
1
(需求量大)
N
2
(需求量小)
S
1
(大批量生产) 30 -6
S
2
(中批量生产) 20 -2
S
3
(小批量生产) 10 5
3
§ 1 不确定情况下的决策(续)
一、最大最小准则(悲观准则)
? 决策者从最不利的角度去考虑问题:
先选出每个方案在不同自然状态下的最小收益值
(最保险),然后从这些最小收益值中取最大的,
从而确定行动方案。 用 ?(Si,Nj)表示收益值
自然状 态
行动方案
N
1
(需求量大)
N
2
(需求量小)
M in [ ? ( S
i
,N
j
)]
1 ? j ? 2
S
1
(大批量生产) 30 -6 -6
S
2
(中批量生产) 20 -2 -2
S
3
(小批量生产) 10 5 5( m ax)
4
§ 1 不确定情况下的决策(续)
二、最大最大准则(乐观准则)
? 决策者从最有利的角度去考虑问题:
先选出每个方案在不同自然状态下的最大收益值
(最乐观),然后从这些最大收益值中取最大的,
从而确定行动方案。 用 ?(Si,Nj)表示收益值
自然状 态
行动方案
N
1
(需求量大)
N
2
(需求量小)
M ax [ ? ( S
i
,N
j
)]
1 ? j ? 2
S
1
(大批量生产) 30 -6 30( m ax)
S
2
(中批量生产) 20 -2 20
S
3
(小批量生产) 10 5 10
5
三、等可能性准则
? 决策者把各自然状态发生看成是等可能的:
设每个自然状态发生的概率为 1/事件数,然后
计算各行动方案的收益期望值。 用 E(Si)表示第 I
方案收益期望值
§ 1 不确定情况下的决策(续)
自然状 态
行动方案
N
1
(需求量大)
p = 1/ 2
N
2
(需求量小)
p = 1/ 2
收益期望值
E ( S
i
)
S
1
(大批量生产) 30 -6 12 ( m ax )
S
2
(中批量生产) 20 -2 9
S
3
(小批量生产) 10 5 7,5
6
四、乐观系数准则(折衷准则)
? 决策者取乐观准则和悲观准则的折衷:
先确定一个乐观系数 ?( 0???1),然后计算:
CVi = ? * max [?(Si,Nj)] + ( 1-?) * min [?(Si,Nj)]
从这些折衷标准收益值 CVi中选取最大的,从而
确定行动方案。 取 ? = 0.7
§ 1 不确定情况下的决策(续)
自然状 态
行动方案
N
1
(需求量大)
N
2
(需求量小)
CV
i
S
1
(大批量生产) 30 -6 19,2( m ax)
S
2
(中批量生产) 20 -2 13,4
S
3
(小批量生产) 10 5 8,5
7
五、后悔值准则( Savage 沙万奇准则)
? 决策者从后悔的角度去考虑问题:
把在不同自然状态下的最大收益值作为理想目标把各方
案的收益值与这个最大收益值的差称为未达到理想目标的后
悔值,然后从各方案最大后悔值中取最小者,从而确定行动
方案。 用 aij’表示后悔值,构造后悔值矩阵:
§ 1 不确定情况下的决策(续)
自然状 态
行动方案
N
1
(需求量大)
N
2
(需求量小)
M ax a
ij
'
1 ? j ? 2
S
1
(大批量生产) 0 ( 30,理想值 ) 11 [ 5- ( - 6) ] 11
S
2
(中批量生产) 10 ( 30- 20 ) 7 [ 5- ( - 2) ] 10 ( m i n)
S
3
(小批量生产) 20 ( 30- 10) 0 ( 5,理想值 ) 20
8
? 特征,1、自然状态已知; 2、各方案在不同自然状
态下的收益值已知; 3、自然状态发生的概率分布
已知。
一、最大可能准则
在一次或极少数几次的决策中,取概率最
大的自然状态,按照确定型问题进行讨论。
§ 2 风险型情况下的决策
自然状 态
行动方案
N
1
(需求量大)
p( N
1
) = 0,3
N
2
(需求量小)
p( N
2
) = 0,7
概率最大的自
然状态 N
2
S
1
(大批量生产) 30 -6 -6
S
2
(中批量生产) 20 -2 -2
S
3
(小批量生产) 10 5 5 ( m ax)
9
二、期望值准则
? 根据各自然状态发生的概率,求不同方案的
期望收益值,取其中最大者为选择的方案。
E(Si) = ? P(Nj)? ?(Si,Nj)
§ 2 风险型情况下的决策(续)
自然状 态
行动方案
N
1
(需求量大)
p( N
1
) = 0,3
N
2
(需求量小)
p( N
2
) = 0,7
E( S
i
)
S
1
(大批量生产) 30 -6 4,8
S
2
(中批量生产) 20 -2 4,6
S
3
(小批量生产) 10 5 6,5 (m ax)
10
三、决策树法
? 过程
(1) 绘制决策树;
(2) 自右到左计算各方案的期望值,将结
果标在方案节点处;
(3) 选收益期望值最大 (损失期望值最小 )
的方案为最优方案。
主要符号
决策点 方案节点 结果节点
§ 2 风险型情况下的决策(续)
11
? 前例 根据下图说明 S3是最优方案,收益期望
值为 6.5
§ 2 风险型情况下的决策(续)


S1
S2
S3
大批量生产
中批量生产
小批量生产
N1( 需求量大 ); P(N1) = 0.3
N1( 需求量大 ); P(N1) = 0.3
N1( 需求量大 ); P(N1) = 0.3
N2( 需求量小 ); P(N2) = 0.7
N2( 需求量小 ); P(N2) = 0.7
N2( 需求量小 ); P(N2) = 0.7
30
-6
20
10
-2
5
4.8
4.6
6.5
6.5
12
四、灵敏度分析
? 研究分析决策所用的数据在什么范围内变化时,原最优决策
方案仍然有效,
? 前例 取 P(N1) = p,P(N2) = 1-p, 那么
E(S1) = p?30 + (1-p)?(-6) = 36p - 6 p=0.35为转折概率
E(S2) = p?20 + (1-p)?(-2) = 22p - 2 实际的概率值距转
E(S3) = p?10 + (1-p)?(+5) = 5p + 5 折概率越远越稳定
§ 2 风险型情况下的决策(续)
E(S1)
E(S2)
E(S3)
0 10.35 p
取 S3 取 S1
13
五、全情报的价值( EVPI)
? 全情报:关于自然状况的确切消息。
前例,当我们不掌握全情报时得到 S3 是最优方案,数学期
望最大值为 0.3*10 + 0.7*5 = 6.5万 记 EVW0PI
若得到全情报:
当知道自然状态为 N1时,决策者比采取方案 S1,可获得收益 30万,概率 0.3
当知道自然状态为 N2时,决策者比采取方案 S3,可获得收益 5万,概率 0.7
于是,全情报的期望收益为
EVWPI = 0.3*30 + 0.7*5 = 12.5万
那么,EVPI = EVWPI - EVW0PI = 12.5 - 6.5 = 6万
即 这个全情报价值为 6万。
? 当获得这个全情报需要的成本小于 6万时,决策者应该对取
得全情报投资,否则不应投资。
? 注:一般“全”情报仍然存在可靠性问题。
§ 2 风险型情况下的决策(续)
14
六、具有样本情报的决策分析
? 先验概率,由过去经验或专家估计的将发生事件的概率;
? 后验概率,利用样本情报对先验概率修正后得到的概率;
? 前例,如果请咨询公司进行市场调查,可以根据样本情报来
修正先验概率,得到后验概率。如此用决策树方法,可得到
更高期望值的决策方案。
§ 2 风险型情况下的决策(续)
15
? 效用,衡量决策方案的总体指标,反映决策者对决策问
题各种因素的总体看法
? 使用效用值进行决策,首先把要考虑的因素折合成
效用值,然后用决策准则下选出效用值最大的方案,作为
最优方案。
? 例,求下表显示问题的最优方案(万元)
§ 3 效用理论在决策中的应用
自然状 态
行动方案
N
1
(需求量大)
p( N
1
) = 0,3
N
2
(需求量中)
p( N
2
) = 0,5
N
3
(需求量小)
p( N
3
) = 0,2
S
1
(作项目 A ) 60 40 -100
S
2
(作项目 B ) 100 -40 -60
S
3
(不作项目) 0 0 0
16
? 用收益期望值法:
E(S1) = 0.3?60 + 0.5?40 + 0.2?(-100) = 18万
E(S2) = 0.3?100 + 0.5?( -40) + 0.2?(-60) = -2万
E(S3) = 0.3?0 + 0.5?0 + 0.2?0 = 0万
得到 S1 是最优方案,最高期望收益 18万。
? 一种考虑:
– 由于财务情况不佳,公司无法承受 S1中亏损 100万的风险,也无法承受 S2中
亏损 50万以上的风险,结果公司选择 S3,即不作任何项目。
? 用效用函数解释:
– 把上表中的最大收益值 100万元的效用定为 10,U(100) = 10;最小
收益值 -100万元的效用定为 0,U(-100) = 0;
? 对收益 60万元确定其效用值:设经理认为使下两项等价的 p=0.95
(1)得到确定的收益 60万;
(2)以 p 的概率得到 100万,以 1- p 的概率损失 100万。
计算得,U( 60) = p*U(100)+(1-p)*U(-100) = 0.95*10+0.05*0
= 9.5
§ 3 效用理论在决策中的应用(续)
17
? 类似地,设收益值为 40,0,- 40,- 60相应等价的
概率分别为 0.90,0.75,0.55,0.40,可得到各效用
值:
U(40) = 9.0; U(0) = 7.5; U(-40) = 5.5; U(-60) = 4.0
我们用效用值计算最大期望,如下表:
§ 3 效用理论在决策中的应用(续)
自然状态
行动方案
N
1
(需求量大)
p ( N
1
) = 0.3
N
2
(需求量中)
p ( N
2
) = 0,5
N
3
(需求量小)
p ( N
3
) = 0,2
E [U (S
I
)]
S
1
(作项目 A ) 9,5 9,0 0 7,35
S
2
(作项目 B ) 10 5,5 4,0 6,55
S
3
(不作项目) 7,5 7,5 7,5 7,5( m ax )
18
? 一般,若收益期望值能合理地反
映决策者的看法和偏好,可以用
收益期望值进行决策。否则,需
进行效用分析。
? 其他思路的例:
见教科书 p364-365
? 作业,p373 -- 1,4,5,7
§ 3 效用理论在决策中的应用(续)