运筹学：运筹学决策论-信息06

分类：管理格式：ppt 日期：2008年11月23日

? 决策的定义：在一定的环境中,决策者在若干可以采取的方案中决定其中的一种并加以实施，使实施的结果对预定的目标最好。
决策的要素：
决策者：
单一决策者多个决策者（群决策）
决策环境：
确定性环境不确定性环境风险环境
决策目标：
单目标多目标决策论战略按内容、
层次策略执行定量按性质定性单阶段按阶段多阶段确定型按环境不确定型风险型
LP、非 LP
状态已知、概率未知状态已知、概率已知决策（ Decision）和对策（ Game）
“决策”是具有能动性的一方 ——决策者和变化的，
但没有能动性的另一方 ——决策环境之间的“较量”。
决策环境是变化的，但这些变化和决策者的决策无关。
“对策”是具有能动性的一方和同样具有能动性的另一方之间的“较量”。两方都会根据对方的决定，调整自己的行为，使结果对自己有利或使对方不利。研究对策的科学称为对策论或博弈论（ Game Theory）。
我国古代的“田忌赛马”就是一个对策的例子。对策最简单的例子是所谓“二人零和对策”。
乙方
A2 B2 C2
甲方
A1 6 -4 1 6
B1 -3 3 2 3
C1 1 5 -1 5
D1 -2 4 3 4
-3 -4 -1
极大－极大 /极小－极小准则：双方都以自己获利最大为准则。
甲,Max{max(6,-4,1),max(-3,3,2),max(1,5,-1),max(-2,4,3)}=Max{6,3,1,4}=6
乙,Min{min(6,-3,1,-2),min(-4,3,5,4),min(1,2,-1,3)}=Min{-3,-4,-1}=-4
A1→B 2→C 1→C 2 →D 1 →A 2 →A 1
不存在稳态解。
乙方
A2 B2 C2
甲方
A1 6 -4 1 -4
B1 -3 3 2 -3
C1 1 5 -1 -1
D1 -2 4 3 -2
6 5 3
极小－极大准则：双方都以自己可能遭遇的各种最坏情况下争取最好结果为准则。
甲,Max{min(6,-4,1),min(-3,3,2),min(1,5,-1),min(-2,4,3)}=Max{-4,-3,-1,-2}=-1
乙,Min{max(6,-3,1,-2),max(-4,3,5,4),max(1,2,-1,3)}=Min{6,5,3}=3
稳态解为 C1-C2。
不确定环境下的决策决策者面临的决策环境由一些自然状态组成，决策者可以采取若干决策方案，每一种决策方案在不同的自然状态下出现的结果是已知的，但决策者不能预先估计各种自然状态出现的概率。
不确定决策的几种准则：
悲观准则
乐观准则
等可能性准则
乐观系数准则
后悔值准则例 1,某工厂决定投产一种新产品。投产以后销售情况有好、中等、差三种可能，但厂家目前无法估计这三种情况出现的概率。产品的生产批量有大中小三种选择。不同的生产批量在不同的市场销售情况下企业的收益如下表：
收益（万元）需求大需求中需求小 Min Max(min)
大批量（ S1） 500 300 -250 -250
100中批量（ S2） 300 200 80 80
小批量（ S3） 200 150 100 100*
这个准则也称为极小－极大准则。按照这个准则，最优决策是小批量生产悲观准则：最坏的情况下争取最好的结果收益（万元）需求大需求中需求小 Max Max(max)
大批量（ S1） 500 300 － 250 500*
500中批量（ S
2） 300 200 80 300
小批量（ S3） 200 150 100 200
乐观准则：最好的情况下争取最好的结果这个准则也称为极大－极大准则。按照这个准则，
最优决策是大批量生产讨论：你认为悲观和乐观的决策准则在实际决策问题可行吗？有那些不足？
悲观准则和乐观准则都假定，决策环境是不确定的，而且，不确定的决策环境中可能出现的各种状态的可能性是不可预知的或不可度量的。如果这些状态出现的可能性是可以度量的，决策问题就转变成为风险型决策。
收益（万元）需求大需求中需求小期望值最大期望值概率（ pi） 1/3 1/3 1/3
大批量（ S1） 500 300 -250 183.33
193.33中批量（ S2） 300 200 80 193.33*
小批量（ S3） 200 150 100 150.00
假设等可能性条件下，期望值最大按照这个准则，最优决策是中批量生产等可能性准则乐观系数准则：乐观系数 α（ 0≤α≤1 ）
)N,S(m i n)1()N,S(m a xCV jijjiji
收益（万元）需求大 N
1
需求中
N2
需求小
N3 CVi
大批量（ S1） 500 300 － 250 275*
中批量（ S2） 300 200 80 234
小批量（ S3） 200 150 100 170
对于 α＝ 0.7 （ 1－ α ）＝ 0.3
最优决策为大批量生产
CV1＝ 0.7max(500,300,-250)+0.3min(500,300,-250)=350-75=275
CV2=0.7max(300,200,80)+0.3min(300,200,80)=210+24=234
CV3=0.7max(200,150,100)+0.3(200,150,100)=140+30=170
对于 α＝ 0.5 （ 1－ α ）＝ 0.5
收益（万元）
需求大
N1
需求中
N2
需求小
N3
CVi
大批量（ S1） 500 300 － 250 125
中批量（ S2） 300 200 80 190*
小批量（ S3） 200 150 100 150
最优决策为中批量生产
CV1＝ 0.5max(500,300,-250)+0.5min(500,300,-250)=250-125=125
CV2=0.5max(300,200,80)+0.5min(300,200,80)=150+40=190
CV3=0.5max(200,150,100)+0.5(200,150,100)=100+50=150
对于 α＝ 0.3 (1-α)＝ 0.7
收益（万元）需求大 N
1
需求中
N2
需求小
N3 CVi
大批量（ S1） 500 300 － 250 － 25
中批量（ S2） 300 200 80 146*
小批量（ S3） 200 150 100 130
最优决策为中批量生产
CV1＝ 0.3max(500,300,-250)+0.7min(500,300,-250)=150-175=-25
CV2=0.3max(300,200,80)+0.7min(300,200,80)=90+56=146
CV3=0.3max(200,150,100)+0.7(200,150,100)=60+70=130
后悔值准则：
以最大后悔值中的最小的为最优决策收益（万元）需求大 N
1
需求中
N2
需求小
N3
大批量（ S1） 500 300 － 250
中批量（ S2） 300 200 80
小批量（ S3） 200 150 100
Max(Si,Nj) 500 300 100
收益（万元）需求大 N
1
需求中
N2
需求小
N3 Max(Si,Nj)
大批量（ S1） 0 0 350 350
中批量（ S2） 200 100 20 200*
小批量（ S3） 300 150 0 300
后悔值矩阵风险型决策,决策者能预先估计决策环境中各种自然状态出现的概率。
最大可能决策收益（万元）需求大 N1 需求中 N2 需求小 N3
概率（ pi） 0.1 0.2 0.7
大批量（ S1） 500 300 － 250
中批量（ S2） 300 200 80
小批量（ S3） 200 150 100*
100
最大可能为需求小，按最大可能考虑，应采用小批量生产。最大可能决策用于一种状态的可能性明显大于其它状态时，如果几种状态发生的概率相差不大，则不适用。
收益期望值最大决策准则收益（万元）需求大 N1 需求中 N2 需求小 N3 期望值概率（ pi） 0.1 0.2 0.7
大批量（ S1） 500 300 － 250
中批量（ S2） 300 200 80
小批量（ S3） 200 150 100
选择收益期望值最大的决策为最优决策中批量的决策为最优决策。
E(大 )=500*0.1+300*0.2+(-250)*0.7=-65
-65
E(中 )=300*0.1+200*0.2+80*0.7=126
126
E(小 )=200*0.1+150*0.2+100*0.7=120
120
决策树确定批量大批量中批量小批量决策节点状态节点收益
S1
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
500
300
-250-65
S2
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
300
200
80126
S3
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
200
150
100120
126
∥
∥
确定批量大批量
S1
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
500
300
-250期望值＝ -65
中批量
S2
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
300
200
80
期望值＝ 126
小批量
S3
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
200
150
100期望值＝ 120
期望值
126
×
×
最优决策为中批量生产，期望值为 126万元。
期望值＝ 500*0.1+300*0.2+(-250)*0.7=-65
多层决策树
129.6
126
120
∥
∥
技术改造
S4
S5
局部改造彻底改造成功 P=0.8
失败 P=0.2
成功 P=0.6
失败
P=0.4
500
-600
1000
-900
280
240∥
确定批量
S3
S2
大批量中批量小批量
N1 P(N1)=0.1
N2 P(N1)=0.2
N3 P(N1)=0.7
N1 P(N1)=0.1
N2 P(N1)=0.2
N3 P(N1)=0.7
S1
N1 P(N1)=0.1
N2 P(N1)=0.2
N3 P(N1)=0.7
500
300
300
200
80
200
150
100
129.6
最优决策为：大批量生产。如果市场前景不好，采用局部技术改造。
280
如果有一个市场预测专家，他不能改变这种产品的市场销售状况的概率分布，但他能完全精确地预测这种产品的市场销售状况。这样的信息称为完备信息。这样的信息的期望收益称为完备信息的期望收益。完备信息的期望收益显然要高于不具有完备信息的期望收益。两者之差称为完备信息的价值。
完备信息的价值确定批量
S1
S3
S2
大批量中批量小批量
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
500
300
-250
300
200
80
200
150
100
-65
126
120
126
500
300
100
完备信息的期望值为,0.1× 500＋ 0.2× 300＋ 0.7× 100＝ 180万元完备信息的价值为,180－ 126＝ 54万元本内容不作要求
S1
确定批量确定批量确定批量需求量大（ 0.1）
需求量中（ 0.2）
需求量小（ 0.7）
大批量中批量小批量大批量中批量小批量大批量中批量小批量
500
300
200
300
200
150
-250
80
100
∥
∥
∥
∥
∥
∥
100
300
500
180
风险决策的效用理论以上的风险决策方法是建立在以方案的期望值大小作为决策准则的基础上的。但在实际生活中，经常发生实际的决策行为并不遵从期望值准则的情况。
例如，对于以下几种情况，要求决策者选择其中对自己最有利的一种：
抛一枚硬币，正面朝上得 1000元，
反面朝上反而要付出 600元
A
抛一枚硬币，正面朝上得 600元，
反面朝上反而要付出 200元
B
不投硬币，直接获取 200元
C
这三个方案的收益期望值都是 200，但决策者对它们的偏好显然是不同的。我们用“效用（ Utility）”来表示带有风险的收益对决策者的价值。
效用函数的确定由于不同的决策者对风险的态度不同，同样的决策方案，对不同的决策者效用值是不同的。
在各种方案中，收益的最大值的效用为 1，收益的最小值（损失的最大值）的效用为 0。
例如在上例中,u(1000)=1,u(-600)＝ 0。
如果决策者认为 C方案比 A方案好，说明
u(200)>0.5u(1000)+0.5u(-600)=0.5
如果将 C方案中的 200元降为 100元，仍有
u(100)>0.5u(1000)+0.5u(-600)=0.5
…..
u(0)>0.5u(1000)+0.5u(-600)=0.5
…..
u(-100)<0.5u(1000)+0.5u(-600)=0.5
…..
u(-50)<0.5u(1000)+0.5u(-600)=0.5
…..
u(-10)=0.5u(1000)+0.5u(-600)=0.5
x
10004002000-400
1
0.5
600 800-200-600
U(x)
0.75
厌恶风险的决策者的效用函数喜好风险的决策者的效用函数决策者 1,u(1000)=1,u(600)=0.85,u(200)=0.75,u(-200)=0.4,u(-
600)=0
决策者 2,u(1000)=1,u(600)=0.3,u(200)=0.15,u(-200)=0.1,u(-600)=0
抛一枚硬币，正面朝上得 1000元，
反面朝上反而要付出 600元
A
抛一枚硬币，正面朝上得 600元，
反面朝上反而要付出 200元
B
直接获取 200元
C
决策者 1,u(A)=0.5× u(1000)+0.5× u(-600)=0.5
u(B)=0.5× u(600)+0.5× u(-200)=0.625 u(C)>u(B)>u(A)
u(C)=u(200)=0.75
决策者 2,u(A)=0.5× u(1000)+0.5× u(-600)=0.5
u(B)=0.5× u(600)+0.5× u(-200)=0.2 u(A)>u(B)>u(C)
u(C)=u(200)=0.15
决策者 1,u(1000)=1,u(600)=0.85,u(200)=0.75,u(-200)=0.4,u(-
600)=0
决策者 2,u(1000)=1,u(600)=0.3,u(200)=0.15,u(-200)=0.1,u(-600)=0
应用期望效用准则的决策树方法确定批量
S1
S3
S2
大批量中批量小批量
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
500
300
-250
300
200
80
200
150
100
-65
126
120
126
∥
∥
5004003002001000-100-200-250
1
决策者 1 决策者 2
收益 500 300 200 150 100 80 － 250
效用 1 1.0 0.8 0.78 0.75 0.72 0.7 0.0
效用 2 1.0 0.5 0.4 0.35 0.32 0.3 0.0
确定批量
S1
S3
S2
大批量中批量小批量
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
N1(需求量大 ) P(N1)=0.1
N2(需求量中 ) P(N1)=0.2
N3(需求量小 ) P(N1)=0.7
500
300
-250
300
200
80
200
150
100
-65 0.26 0.20
126 0.72 0.34
120 0.73 0.33
126
1.0
0.8
0
0.8
0.78
0.7
0.78
0.75
0.72
1.0
0.5
0
0.5
0.4
0.3
0.4
0.35
0.32
期望值决策者 1的效用期望决策者 2的效用期望收益效用 1 效用 2
有一个风险投资的机会，成功和失败的概率都是 0.5。投资 1元，如果成功可以得到 1.6元的利润，即资本成为
2.6元。如果失败，则损失 1元，即资本成为 0。
开始的资本为 100万元。投资的次数和每次投资额不限。为了不至于把钱输光，投资者采取如下的策略：每次总是将资本的一半去投资。
问题：这项投资的结局如何，是一本万利，还是一贫如洗？
问题 1：风险决策的一个讨论题答案 1：设初始资本为 a元，资本增值率 K=1.6
第一次投资 a/2元如果成功，资本为 a1=a+K（ a/2） =(1+K/2)a
如果失败，资本为 a1=0.5a
第一次投资后的期望资本为：
E1=0.5× (1+K/2)a+0.5× 0.5a=(0.75+0.25K)a
第二次投资 (0.75+0.25K)a/2
如果成功，资本为
a2= (0.75+0.25K)a +K (0.75+0.25K)a/2
= (0.75+0.25K)a(1+K/2)
如果失败，资本为
a2= (0.75+0.25K)a/2
第二次投资后的期望资本为
E2= 0.5× (0.75+0.25K)a(1+K/2)＋ 0.5× (0.75+0.25K)a/2
＝ (0.75+0.25K)(0.75+0.25K)a= (0.75+0.25K)2 a
依次类推，第 n次投资以后的期望资本为
En= (0.75+0.25K)n a
用 K=1.6,代入
En= (1.15)n a
即随着投资次数的增加，期望资本会无限增大。是一项一本万利的生意。
答案 2：
设投资 2n次，其中成功和失败各占 n次第一次投资成功资本成为 a1=a+1.6× a/2=1.8a
第二次投资又成功，资本 a2=1.8a+1.6× 1.8a/2=1.82a
……..
第 n次成功，资本成为 an=(1.8)na
第 1次失败，资本成为 an＋ 1=0.5(1.8)na
……
第 n次失败，资本成为 a2n=(0.5)n(1.8)na=(0.9)na
随着投资次数的增加，资本将减少到 0。投资的结果将血本无归。
讨论题：当投资次数无限增大时，投资者的资本究竟是
“一本万利”还是“血本无归”？错的答案错在哪里？