1
决策论
1 基本概念
2 确定型和不确定型决策
3 风险型决策
4 马尔科夫决策
2
1 基本概念
决策,Decision或 Decision Making,是一种对已知目标和方案的选择过程,当人们已知确定需实现的目标是什么,根据一定的决策准则,在供选方案中做出决策的过程。
一门专门研究决策科学的学问形成,称之为 决策科学 。
决策科学 包括 决策心理学、决策的数量化方法、决策评价以及决策支持系统、决策自动化等。
3
通过一例分析决策问题的构成要素
计划用 6个鸡蛋煎饼,现已经向碗里打了 5个鸡蛋,在打第 6个鸡蛋前,
有三种不同 行动方案 可供选择,
a1:向盛有 5个好蛋的碗里打第 6个鸡蛋;
a2:向另一个碗里单独打第 6个鸡蛋,
以便检查好坏;
a3:放弃第 6个鸡蛋。
第 6个鸡蛋有两种 自然状态,
θ1:好蛋;
θ2,坏蛋。
各种行动方案在各种不同的自然状态下会产生不同的 结果 oij:
好蛋 θ1 坏蛋 θ2
打入碗里
a1
O11
6个蛋煎饼
O12
5个好蛋浪费,无蛋煎饼单独检查
a2
O21
6个蛋煎饼,
多洗一个碗
O22
5个蛋煎饼,多洗一个碗丢弃
a3
O31
5个蛋煎饼,
浪费一个好蛋
O32
5个蛋煎饼
4
决策问题构成要素一般为
决策者
决策目标
行动方案
自然状态
条件结果值
决策准则
5
决策目标 指决策者希望达到的状态,工作努力的目的。一般而言,在管理决策中决策者追求的当然是利益最大化。
决策准则 决策判断的标准,备选方案的有效性度量。
决策属性 决策方案的性能、质量参数、特征和约束,如技术指标、重量、年龄、声誉等,用于评价它达到目标的程度和水平。
科学决策过程 任何科学决策的形成都必须执行科学的决策程序。决策最忌讳的就是决策者拍脑袋决策,只有经历过,预决策 → 决策 → 决策后,
三个阶段,才有可能产生科学的决策。
6
调查研究 确定决策目标搜集有关的信息资料预测技术 预测未来的可能情况拟订各种可行方案可行性研究 方案评估决策准则 方案选择方案实施预决策决策实施情况反馈意见决策后科学决策过程
7
决策系统
( 1)状态空间 S
( 2)策略空间 U
( 3)损益函数 V
决策系统可以表示为三个主要素的函数:
D= D( S,U,V)
8
状态空间 是指不以人的意志为转移的客观因素,设一个状态为 Si,有 m种不同状态,
其集合记为:
S称状态空间; S的元素 Si称为状态变量。
miSSSSSS im,1}{},,,{ 321
9
策略空间 是指人们根据不同的客观情况,
可能做出主观的选择,记一种策略方案为
Ui,有 n种不同的策略,其集合
U称为策略空间; U的元素 Uj称为决策变量。
njuuuuU jn,,1}{},,,{ 21
10
损益函数 是指当状态处在 Si情况下,人们做出 Uj决策,从而产生的损益值 Vij,显然 Vij是 Si,Uj的函数,即
当状态变量是离散型变量时,损益值构成的矩阵叫 损益矩阵 。
njmiuSvV jiij,2,1;,2,1),(

),(),(),(
),(),(),(
),(),(),(
)(
21
22222
12111
nmmm
n
n
nmij
USVUSVUSV
USVUSVUSV
USVUSVUSV
VV

11
决策应遵从的 基本原则,
(1)最优化原则
(2)系统原则
(3)可行性原则
(4)信息对称原则
12
决策分类按影响范围 战略决策、战役决策、战术决策按状态空间 确定型决策、非确定型决策、
风险型决策按决策时间 程序化决策、半程序化决策、
非程序化决策按描述方法 定性化决策、定量化决策按目标数量 单目标决策、多目标决策按连续性 单级决策、序贯决策按决策者数量 个人决策、群决策按问题大小 宏观决策、微观决策
13
决策函数
收益函数,决策问题把收益作为决策目标,
最优行动方案就是收益最大方案,泛指收入、利益、产量等。 Q=( qij) m× n
损失函数,又称遗憾值。 R=( rij) m× n
效用函数,U=( uij) m× n
14

某企业拟定了三个发展生产的方案,方案 a1
是新建两条生产线生产两种新产品;方案 a2
是新建一条生产线生产一种新产品;方案 a3
是扩建原有生产线改进老产品。在销售预测的基础上,估计了个方案在不同的市场需求情况下的条件收益值。决策问题的 收益函数 用决策表给出。
条件 市场情况收益值决策
θ1
高需求
θ2
中需求
θ3
低需求
a1 1000 600 -200
a2 750 450 50
a3 300 300 80
15
Q=( qij) 3× 3
1000 600 -200
= 750 450 50
300 300 80
R=( rij) 3× 3
0 0 280
= 250 150 30
700 300 0
16
决策树
决策点和方案枝
机会点和状态枝
a1
a2
am

θ1
θ2
θn

θ1
θ2
θn

θ1
θ2
θn

θ1
θ2
θn

o11
o11
o1n
o21
o22
o2n
om1
om2
omn
a1
a2
am

17
2.1 确定型决策分析每一个行动方案只有一个确定的结果,
决策函数仅依赖于决策变量,使决策函数取得最优值的行动方案就是最优方案。
可以通过建立最优化数学模型的方法求解。
企业的决策环境总是变化的,绝对确定的问题是不存在的,许多情况下,确定性仅仅是对决策问题的一个简化处理。
18
例 最优生产规模决策某企业生产产品的固定成本 F=20
万元,单位变动成本 V=1.5元,销售单价 P=4元,目标利润 L=10万元。试确定企业的生产规模。
19
解盈亏平衡点
Q0=F/( P-V) =20/( 4-1.5) =8(万)
产品边际贡献
m=P-V=2.5(元)
Q-Q0=L/m=10/2.5=4(万)
所以企业生产规模为
Q=Q0+4=12(万)
20
例 产品价格决策某厂生产一种新产品,年生产能力为
12万件,固定成本为 250万元,单位变动成本为 60元。根据预测国内市场可销售量为 8
万件,单价为 100元。为开拓国外市场,经与外商谈判,若降低价格,外商承担运输及推销费,单位变动成本降为 50元,可订货 2
万件。该厂目标利润值为 130万元。试确定与外商谈判定价,并作出是否定货的决策。
21
解内销产品的边际贡献
m1=P1-V1=100-60=40(元)
内销 8万件补偿固定成本后可获利
L1=m1Q1-F=40*8-250=70(万元)
产品目标利润值为 130,外销目标利润值为
L2=L-L1=130-70=60(万元)
固定成本已摊入内销产品,外销产品定价
P2=V2+L2/Q2=50+60/2=80(元)
22
2.2 不确定型决策行动方案的未来结果不能确定,一般作为某种随机变量进行描述。方案的结果值是一种随机数值,其发生的概率取决于自然状态的概率分布。
不确定型,结果值的概率分布无法估算风险型,状态变量视为随机变量,并赋予一定的客观或主观的概率值。
23
例某公司为经营业务的需要,决定要在现有生产条件不变的情况下,生产一种新产品,现可供开发生产的产品有 I,II,III,IV四种不同产品,对应该的方案为 A1,A2,A3,A4。由于缺乏相关资料背景,对产品的市场需求只能估计为大中小三种状态,
而且对于每种状态出现的概率无法预测,每种方案在各种自然状态下的效益值表如表自然状态
100250400A4:生产产品 IV
50150300A3:生产产品 III
-200300600A2:生产产品 II
-250320800A1:生产产品 I
需求量小 S3需求量中 S2需求量大 S1效益 aij
供选方案 Ai
24
乐观准则( max-max)
取各种情况的收益最大值中的最大值。
因而选择方案 A1
800
600
m a x { } 8 0 0
300
400
i ij
j
Za






25
悲观准则( max-min)
首先求出在各种状态下的目标最小值,
再从这些决策的最小值中取一个最大值。
因而选择方案 A4。
250
200
m in { } 1 0 0
50
100
i ij
j
Za






26
遗憾准则( min-max)
先计算各方案在每种状态下的遗憾值
rij;确定每种方案的最大遗憾值;再从最大遗憾值中取最小者。
因此选择方案 A2
供选方案机会损失值 最大机会损失
ZiS1 S2 S3
A1 0 0 350 350
A2 200 20 300 300
A3 500 170 50 500
A4 400 70 0 400
300}{m in* iii ZZ
27
等可能法每种自然状态发生的概率相等,计算每种方案的期望收益值,并取其中最大者。
11
11() mm
i ij ijiiE A a amm
2 9 031)2 5 0(313 2 0318 0 0)( 1AE
370031)200(3132031600)( 2AE
350031503115031300)( 3AE
250311003125031400)( 4AE
2 9 0)}(m a x {)( * ii AEAE
因此对应的 A1方案为决策方案
28
折衷准则决策者给出乐观系数,则说明决策者越接近悲观; 则说明决策者越接近乐观。
请参照 P364
]1,0[, 0
1
}{m in)1(}m a x {)( ijjijj aaaH
)()(m a x *ljAa aHaH
j

29
练习
某企业拟定了三个发展生产的方案,方案 a1是新建两条生产线生产两种新产品;方案 a2是新建一条生产线生产一种新产品;方案 a3是扩建原有生产线改进老产品。在销售预测的基础上,估计了个方案在不同的市场需求情况下的条件收益值,但市场不同需求状态的概率却未能确定,试对此问题进行决策分析。
条件 市场情况收益值决策
θ1
高需求
θ2
中需求
θ3
低需求
a1 1000 600 -200
a2 750 450 50
a3 300 300 80
30
练习答案决策准则 乐观 悲观 折衷 遗憾 等可能最满意方案 a1 a3 a2 a2 a1
31
3 风险型决策风险型决策是指决策者在目标明确的前提下,对客观情况并不完全了解,存在着决策者无法控制的两种或两种以上的自然状态,但对于每种自然状态出现的概率大体可以估计,并可算出在不同状态下的效益值。
32
3.1 期望值准则评价模型
① 根据不同自然状态下的效益值 vij和各种自然状态 sj出现的概率 pj,求效益期望值 EMV。
效益期望值=条件效益值 × 概率,即
② 比较效益期望值的大小,选择最大效益期望值所对应的方案为决策方案。
i ij jE M V v p
}m a x {* iEM VEM V?
33

某工厂决定开发新产品,需要对产品品种做出决策,
但有三种产品 A1,A2,A3可供生产开发。未来市场对产品需求情况有三种,即较大、中等、较小,经估计各种方案在各种自然状态下的效益值见表。各种自然状态发生的概率分别为 0.3,0.4和 0.3。那么工厂应生产哪种产品,才能使其收益最大。
自然状态及概率
101010A3
- 102530A2
- 202050A1
需求量较小
p3=0.3
需求量中等
p2=0.4
需求量较大
p1=0.3
效益方案
34

max EMV=17(万元),因此选择相应方案,
即生产 A1产品。
101010
102530
202050
V

)3.0,4.0,3.0(?P

10
16
17
3.0
4.0
3.0
101010
102530
202050
* TPVE M V
35
练习我国某公司与一国外厂商签订明年的经销协议。若出口 A型机床,则明年可稳获利 800万元;若出口另一种
B型机车,根据国际市场需求情况有三种可能:当国际市场需求量高时,可获利 2500万元,当需求量一般时,
可获利 900万元,当市场不景气而滞销时,就会因积压而亏损 500万元。根据各方面获得的信息,预测明年国际市场需求量大的可能性为 0.3,需求量一般的可能性为
0.4。公司经理认为,亏损 500万元风险太大,打算放弃出口 B型机床。外商又提出另一种方案,出口 C型机床,
在国际市场畅销和一般情况下,可分别获利 1500万元和
850万元。在滞销的情况下,可以稍加改制作为其他加工机械销售,仍可获利 120万元。上述情况,除第一种方案外,其余二方案均有较大利润而又要承担一定风险。
试对此问题进行决策分析。
36
练习 重复型决策某报社编辑发行一种晚报,长期以来发行量为 15万份。近来实行改革,为提高报社经济效益,对晚报发行量进行决策分析。
经过销售调查,在过去 100天的统计资料中,售完 15万份仅 12天,其余销售情况是,有 20天销售约 14万份,30天销售约
13万份,25天销售约 12万份,13天销售约 11万份。晚报每份定价 0.03元,成本
0.025元。试分析该报社晚报的发行量为多少时,才能获得最佳经济效益。
37
3.2 决策树分析法利用决策树图进行决策分析的方法称为决策树分析法。
既可用于单阶段决策,也可用于多阶段决策。
基本步骤是:
画出决策树图;
计算各状态点的期望值;
修枝选定方案
38

例如,某公司决定扩大家用电器的生产,
方案有两个:一是新建车间,需投资 90万元,二是改造老车间,需投资 35万元。使用期为 8年。两个方案在各种自然状态下每年销售利润(或亏损)以及各种自然状态的概率如下表:
39
两种自然状态下的收益情况自然状态 概率方案新建车间年利润 改造老车间年利 润销路好 0.7 90 40
销路差 0.3 -40 30
40
新建 车间改造车间销路好 0.7
318
408
296
90
- 40
40
30
- 90
- 35
销路差 0.3
销路好 0.7
销路差 0.3
决策树决策图在上图中,
机会结点①的期望值=[ 90× 0.7+(- 40× 0.3] × 8=408
机会结点②的期望值=( 40× 0.7+30× 0.3) × 8= 296
408- 90= 318(新建车间 8年获利)
296- 35= 261(改造老车间 8年的获利)
由于新建车间获利较高( 318万元),因此可将改造老车间的方案舍去。
41
例某无线电厂改进主要产品 M型复读机的质量,
提高经济效益,经过认真研究,提出两个可供选择的方案。一是向国外购买专利,估计谈判成功的概率为 0.8;另一个办法是自行研制,成功的概率为 0.6。购买专利的费用比自行研制的费用要高出 10万元。两个方案试验成功,均可使产品产量增加一倍或二倍,试验失败仍按原产量生产,
只能保持原产量。近期市场对 M复读机需求状态及各种方案的统计利润值如表。
42
方案条件利润值(万元 )
销售状态原产量生产购买专利成功( 0.8)
自行研制成功( 0.6)
产量增加
1倍产量增加
2倍产量增加
1倍产量增加
2倍高需求( 0.3) 150 500 700 500 800
中需求( 0.5) 10 250 400 100 300
低需求( 0.2) -100 0 -200 0 -200
43
500
250
0
高需求 0.3
中需求 0.5
低需求 0.2
700
400
-200
高需求 0.3
中需求 0.5
低需求 0.2
150
10
-100
高需求 0.3
中需求 0.5
低需求 0.2
275
370
70
增产 1倍增产 2倍原产量成功
0.8
失败
0.2
购买专利
-10
自行研制
500
100
0
高需求 0.3
中需求 0.5
低需求 0.2
800
300
-200
高需求 0.3
中需求 0.5
低需求 0.2
150
10
-100
高需求 0.3
中需求 0.5
低需求 0.2
200
350
30
增产 1倍增产 2倍原产量成功
0.8
失败
0.2
370
70
302
350
30
222
44
请看教材 P368 例 5
45
练习某化肥厂用煤作原料生产化肥,设煤质好的概率为 0.3。有两种生产方案,不采取新技术:煤质好每周生产周期盈利
100万元,煤质差盈利 50万元;采用新技术:煤质好盈利 200万元,煤质差亏损 10
万元。如果对原煤进行预处理,可使煤质好的概率提高到 0.8,处理费为 20万元。
试用期望结果值评价方法,用决策树分析法进行决策。
46
效用与效用函数决策问题的各可行方案有多种可能的结果值 oij,依据决策者本身的主观意愿及价值观念,每个结果值对决策者均有不同的价值和作用,称这种反映其价值和作用大小的数值 pij为该结果值 oij对决策者的 效用值,
简称效用 utility,而称实值函数
pij=f(oij)=U(oij) (0<=pij<=1)为 效用函数 。
47

某企业欲投入生产一种新产品,根据市场预测,
畅销时可获利 10万元,滞销时仅能获利 1万元,
而若生产老产品,可以由把握的获利 5万元。摆在企业决策者面前是上述两种方案,那么如何作出决策?
设 o*=10,oo=1,o=5
假定效用值 U(o*)=U( 10) =1,U(oo)=U( 1)
=0
用标准测定法计算效用值 U( 5),效用值用无差异概率表示,即求出 无差异概率 p=U( 5),使得 o~( P,o*; 1-p,oo)
48
解决
1、通过反复提问,让企业决策者进行反复对比和权衡,确定无差异概率值 p。
假定新产品畅销的概率值为 0.8,问愿采用何种方案?企业决策者回答是生产新产品。
改变畅销的概率值,例如 0.5时,继续询问,回答是生产老产品。
在 0.5 上下再继续提问,直到企业决策者经过慎重权衡,认定当畅销的概率值比如为 0.6时,则对两种方案无所偏好为止。
2、确定无差异关系式 o~(0.6,o* ; 0.4,oo)
49
3、结论:根据预测,当产品的市场畅销率为 0.6时,两种生产方案无差异;当新产品畅销率超过 0.6时,则生产新产品的效用值增加,采取投入生产新产品的方案;
当新产品的畅销率低于 0.6时,则老产品的效用值提高,采取仍生产老产品。
效用值是一种主观价值,体现了决策者对各种结果值的偏好程度,而效用值正是反映这种偏好的一种特殊的量化标准。
效用值是线性的。
50
效用函数的构造
设决策问题 m个方案中均有 n个可能结果值,n个结果值对决策者提供的价值服从同一折算标准,记为 O=(o1,o2,…,on);
依照效用函数的定义,对于集合 O上的任一结果 oj,就是将结果值 o折算为关于集合 O上最优值 o*和最劣值 oo的无差异关系式 o~( U(o),o*; 1-U(o),oo)
51
1、确定任一个结果值的效用值;
2、以 1的效用值为基准,采用线性插值法案比例求出其他各结果的效用值。
在集合 O上,取最优结果 o*和最劣结果
oo,并以各取 0.5的概率构成 (0.5,o* ;
0.5,oo).
作归一化处理
Xξ=ξ =(o- oo)/(o* - oo)
52
X
X0.25 X0,5X0.751
1
0.75
0.5
0.25
0
U(x) 效用曲线
53
效用与风险的关系许多决策问题都含有随机的或不确定的因素,决策者几乎都要承担一定的风险,而不同的决策者对风险的态度是有区别的。
效用函数表征决策者对决策方案各结果值的偏好程度,因此,效用函数也可以说表征了决策者对风险的不同态度。
54
中间型效用曲线决策者对风险持中立态度,效用函数满足关系式
( U(x1)+U(x2))/2=U((x1+x2)/2)
X
U(X)
55
保守型效用曲线决策者对风险持厌恶态度,或持保守态度,效用函数满足关系式
( U(x1)+U(x2))/2<U((x1+x2)/2)
U(X)
X
56
冒险型效用曲线决策者对风险持追求态度,效用函数满足关系式
( U(x1)+U(x2))/2>U((x1+x2)/2)
X
U(X)
57
混合型效用曲线决策者对结果不大时,具有一定的冒险精神,而当结果值较大时,对风险的态度转为保守。
X
U(X)
58
例某企业欲投产一种新产品,有三种方案供决策,且每种方案依据市场畅销、一般和滞销状况,所获利润有三种可能结果,标为决策矩阵
9.5 6.2 2.0
O3*3= 20.0 7.5 -5.0
14.0 6.0 -2.5
由效用标准测定法测定,该企业的决策者认为某方案盈利 20万元和亏损 5万元的机会各占一半,且该方案等价于稳获利 4.5万元的方案。试求该企业决策者的效用函数。
59

Oξ~(0.5,o* ; 0.5,oo).
Oξ(确定当量) =4.5,o* =20,oo =-5
U( Oξ) =U( 4.5) =0.5
归一化处理,先求得权衡指标值
ε =( 4.5-( -5)) /( 20-( -5)) =0.38
将其余结果值 oij 换算为 x 值,
Xij = ( oij - oo ) /( o* - oo )
得决策矩阵 0.580 0.448 0.280
1.000 0.500 0.000
0.760 0.440 0.100
60
查效用函数表,在 ε=0.38列,x11=0.580不能直接计算,则取其邻近值 x1=0.5595和 x2=0.5808,对应的效用函数值 U(x1)=0.7188,U(x2)=0.7344,用线性内插值法求 U(0.580)=U(0.5808)-[(U(0.5808)-
U(0.5595))/(0.5808-0.5595)]*(0.5808-
0.580)=0.7338。类似可求得其余 xij 对应的效用函数值,
并画出相应的效用曲线为上凸,可见当 ε=0.38<0.5时,
决策者为保守型 ε=0.5时,中立。
xij 0.580 0.448 0.280 1.000 0.500 0.000 0.760 0.440 0.100
U(xij ) 0.7338 0.6094 0.4306 1.0000 0.6715 0.0000 0.8750 0.6010 0.2070
61
3.3 灵敏度分析
风险型决策分析的主要评价准则是期望值准则,分析过程所用的数据主要是条件结果值和状态概率值。
条件结果值取自于统计数据和原始记录,
一般比较可靠。
状态概率值是由预测和估算得到的,很难预测估算得十分准确。
所谓灵敏度分析问题是指:状态概率值允许有多大误差,决策分析的结论仍然有效。
62
例某电视机厂准备从 A,B两种型号的电视机中选择一种作为定型产品。根据市场预测,
两种型号电视机的市场需求状态及销售利润值情况如表。试分析状态概率变化对决策结果影响的情况。
A型畅销
P1=0.7
B型畅销
P2=0.3
A型电视机 50 -20
B型电视机 -15 100
销售状态条件利润
(万元)生产方案
63
EMV1=29 EMV2 =19.5
请分别计算 P1=0.8和 P1=0.6的结果。
概率的变化会对决策分析的结果产生直接影响,进行灵敏度分析就是测定状态概率值变化对方案选择影响的程度,度量决策分析可靠性程度的一种手段。
64
更具体的表示设有风险型决策问题,可行方案有 m个,即 ai,
i=1,…,m;自然状态有 n种,状态概率 pj,
j=1,…,n;条件结果值 oij。经过决策分析,最满意方案为 a*=ai,
若状态概率值 pj在可能的范围内变化,即
pj’<=pj<=pj’’(j=1,2,…,n)
方案 a* 仍为最满意方案,则称方案 a*为该问题的最满意的稳定方案。
对最满意方案稳定性进行分析,称为灵敏度分析。
65
转折概率原理设有一风险型决策问题,其可行方案为 ai,自然状态概率为 p,1-p,各方案合意度向量为 H=UP.若 a*=at 是最满意方案,即方案 at的合意度最大,则除了方案 a*外的其他方案,必存在概率值
pi’=[u(ot2)-u(oi2)]/[u(ot2)- u(oi2)+ u(oi1)- u(ot1)]使得
1、当状态概率值 p在允许范围内变化到 pi’时,ai ~a*
2、当状态概率 p变化到大于 pi’或小于 pi’时,方案 ai优越程度超过最满意方案 a*。 pi’称为最满意方案的 转折概率 。
(证明略)
最满意方案的稳定性条件是 α <=min| p- pi’|
66
例某建筑公司承包一工程,正值天气变化季节。若按时开工,当月天气好顺利完工,
可获利 12.5万元;当天气不好,工程进展不顺利,会造成损失 4.8万元。若不按时开工,天气好承建另一辅助工程,可获利
6.5万元,天气不好则造成损失 1.2万元。
据调查,当地气象预报天气好的概率为
0.65,不好为 0.35。试进行决策分析,
并作出灵敏度分析。
67
解公司反复敲定 Oξ(确定当量) =2.4,o* =15,
oo =-5
求得权衡指标值
ε =[2.4-( -5) ]/[15-( -5) ]=0.37
将其余结果值 oij 换算为 x 值,
Xij = ( oij - oo ) /( o* - oo )
得决策矩阵 0.875 0.010
0.575 0.190
查表得效用函数值
0.9580 0.0468
0.7380 0.3450
计算合意度 H=UP=( 0.6391,0.6005) T,
因而最优方案为按时开工。
68
根据转折概率,此时
p2’ =[u(o12)-u(o22)]/[u(o12)- u(o22)+ u(o21)-
u(o11)]=0.5755
最满意方案 a*=a1的稳定性条件是
α <=min| p- pi’|= | p- p2’|=0.65-0.5755=0.0745
即天气好的概率 p1变动范围在 0.0745之内时,方案 a1是稳定的,当超出此范围,有三种情况:
1,P > 0.5755时,方案 a1最满意;
2,P = 0.5755时,方案 a1和方案 a2无差异;
3,P < 0.5755时,方案 a2优于方案 a2。
69
3.4 贝叶斯决策为了提高决策质量,通过进一步调查,
收集有关状态变量的补充信息,对先验分布进行修正,使决策更加符合实际情况。
这个过程就称为 贝叶斯( Bayes)决策分析 。
70
贝叶斯决策分析的意义在实际决策过程中,常存在两种偏向,
一是对状态变量情况的掌握和分析还十分粗略,就匆忙进行决策;二是调研费用过大,收集的信息价值却不大。前者忽视了信息对决策的价值,后者没有考虑信息本身的经济性。
用补充信息的方法,改进状态变量的概率分布,又要注意信息自身的经济性。只有将两者结合起来,才能提高决策水平,
获得较高的经济效益。
71
利用补充信息修正先验分布是贝叶斯决策的关键。即利用全概率公式和贝叶斯公式修正状态变量的先验分布,使更符合实际情况。
72
例某沿海地区渔业公司所属船队出海作业。若遇晴天,可获利 1万 5千元;若遇阴雨天,则亏损 5千元。根据历年气象资料,
该海域在当前季节晴天的概率为 0.8,阴雨天的概率为 0.2,为准确预报海域天气,
公司成立一个气象站,该站对晴天预报的准确率为 0.95,对阴雨天预报准确率为
0.90。试根据该站的天气预报,公司船队出海或不出海作业应如何决策?
73
解先验分布天气有两种状态,分别是晴天( θ1)和雨天( θ2 ) 。
p( θ1) =0.8 p( θ2 ) =0.2
收益矩阵为 15000 -5000
0 0
E1=11000 E2=0
按照先验分布决策,最满意方案是出海作业。
74
现补充天气预报信息。
预报天气状态 H1和 H2,有条件概率
p( H1|θ1) =0.95 p( H1|θ2) =0.10
p( H2|θ1) =0.05 p( H2|θ2) =0.90
75
贝叶斯决策的步骤
1、验前分析:决策者根据自身的经验和判断,估计各自然状态的先验分布,计算各可行方案在不同自然状态下的条件值,并利用这些信息,
依据某准则,对各可行方案进行评价和选择
2、预验分析:通过一定方法和途径收集新信息对先验分布进行修正,并权衡分析收集新信息的代价及其效益的过程。
3、验后分析:利用补充信息对先验分布进行修正,
从而得到更符合实际情况的后验分布。
4、序贯分析:决策分析全过程一般分为若干阶段,
每一阶段都包括前面三步。
76
例为开发某种新产品,某企业需更新生产设备,共有三种投资方案可供选择:引进大型设备( a1)、引进中型设备( a2)、引进小型设备( a3)。另外,
市场对该新产品的需求状态也有三种:需求量大
( θ1)、需求量一般( θ2)、需求量小( θ3)。由市场预测,三种投资方案在三种不同的市场需求状态下,该企业的收益(万元)用收益矩阵 Q=( qij) 3*3
表示如下
θ1 θ2 θ3
a1 50 20 -20
a2 30 25 -10
a3 10 10 10
77
用以往的资料预测,各需求状态的概率分别为 p( θ1) =0.3 p( θ2 ) =0.4 p
( θ3) =0.3.为使新产品开发产销对路,
该企业还利用试销法作调查,在市场需求实际状态 θj条件下,其调查结果值 Hi条件概率如表
A型畅销
P1=0.7
B型畅销
P2=0.3
A型电视机 50 -20
B型电视机 -15 100
销售状态条件利润
(万元)生产方案