运筹学（ppt课件）：09对策论

分类：数学格式：ppt 日期：2008年10月05日

2009-7-26 1
运筹学 Operations Research
§ 9 对策论对策是有厉害冲突的各方所分别采取的决策,
对策论，亦称为博弈论，研究具有对抗、竞争、冲突性质的问题,
最早利用数学方法来研究对策论的是数学家 E,Zermelo,他于
1912年发表了论文《关于集合论在象棋对策中的应用,.1944
年,J,Von Neumann和 O,Morgenstern总结了前人关于对策论的研究成果，合著了《对策论与经济行为》（ Theory of
Games and Economic Behavior）一书，使得对策论的研究开始系统化和公理化，并具有了深刻的经济背景,1994年，在对策论研究中作出突出贡献的 Nash,Harsanyi和 Selten获得诺贝尔经济学奖,
2009-7-26 2
运筹学 Operations Research
对策问题的三个要素：
（ 1）局中人（ player）,参加对策的各方,
规定：局中人是聪明,理智的；将厉害关系一致的参加者视为一个局中人,
局中人集合：
（ 2）策略（ strategy）,局中人在一局对策中为争取尽量好的结果用来对付对手的行动方案,
策略集合：局中人的全部策略,
局中人的策略集合：
局势：在一局对策中,各局中人选定的策略构成的一个策略组 S.
局势决定本局对策的结果,
},,2,1{ nI
iS
2009-7-26 3
运筹学 Operations Research
（ 3）收益（ earning）,一局对策所得结果的数量表示,
收益或为赢得或为支付；收益由局势唯一确定，一但局势确定，即得收益，故收益和局势之间的此种对应在局势集合上构成了一个函数关系,
局中人 i的收益函数（ earning function）,
综上,建立对策模型：
对策过程：
)(SHH ii?
)}{,}{,( IiiIii HSI
.)(
).,,,( )()2()1(
)(
，本局对策结束中，即得收益的收益函数代入局中人将
，得到一个局势中选择一个策略从其策略集合每一个局中人
SHH
HiSSSSS
SSi
ii
i
n
i
i

2009-7-26 4
运筹学 Operations Research
例 1（猜硬币游戏）甲乙两人各抛掷一枚硬币，在落地以前，
以手覆之,双方约定：若两枚都是正面或反面，则甲得 1分，
乙得 -1分；若一个正面一个反面，则甲得 -1分，乙得 1分；最终得分最多者为胜,
这是一个对策问题,
局中人为甲（ 1），乙（ 2），局中人集合为局中人 1的策略可能有局中人 2的策略可能有局中人 1,2的策略集合分别为局势集合为局中人 1,2在各局势下的收益分别为
}2,1{?I
}{}{ 21 出反面，出正面
}{}{ 21 出反面，出正面
},,{ 211S },{ 212S
)},(),,(),,(),,{( 2212211121 SS
2009-7-26 5
运筹学 Operations Research
1),( 111H 1),( 211H 1),( 121H 1),( 221H
1),( 112H 1),( 212H 1),( 122H 1),( 222H
二人有限零和对策（ 2-player finite zero-sum game）,……
}2,1{?I
},,,{ 211 mS
},,,{ 212 nS
021 HH
nm,
.),(),( 21 ijjiijji aHaH －，则设
（局中人 1的）收益矩阵：,)(
nmijaA ).,(1 jiij Ha其中
2009-7-26 6
运筹学 Operations Research
二人有限零和对策和矩阵一一对应,故二人有限零和对策亦称为矩阵对策（ matrix game）,记作：
猜硬币游戏即为一个矩阵对策其中局中人集合为局中人 1,2的策略集合分别为收益矩阵为
),,( 21 ASS
),,( 21 ASS
}2,1{?I
},,{ 211S },{
212S

11
11A
例 2（田忌与齐王赛马）战国时期，齐王与大将田忌赛马，
分别挑选出上，中，下三个等级的马各一匹进行比赛,齐王的马比同一等级的田忌的马强壮，而田忌的高等级的马比齐王的低等级的马强壮,双方约定：每赛一局，胜者得千金,
2009-7-26 7
运筹学 Operations Research
此对策问题为一个矩阵对策其中局中人为田忌（ 1），齐王（ 2）
收益矩阵为
),,( 21 ASS
}{}{}{:},,{
}{}{}{:},,{
3213212
3213211
下，中，上下，中，上

S
S

111
111
111
A
2009-7-26 8
运筹学 Operations Research
【引例】给定矩阵对策其中收益矩阵为
),,,( 21 ASS },,,{
3211S
},,,{ 3212S

816
234
231
A
.,
21.2),(
),(21
......
32
23321
32

为的最优策略分别，故局中人最大收益下分别获得最终在局势，在“角逐”中，局中人
aH
2009-7-26 9
运筹学 Operations Research
分别利用悲观主义原则来求局中人 1,2的最优策略：
局中人 1：
232}8,2,2m a x {}}8,1,6m i n {},2,3,4m i n {},2,3,1m a x { m i n { a
.2),(1 233212 aH,最优收益为的最优策略为局中人局中人 2：

816
234
231
A
2}2,3,6m ax {}}8,2,2m i n {},1,3,3m i n {},6,4,1m ax { m i n {
.2),(1 233223 aH,最优收益为的最优策略为局中人
2009-7-26 10
运筹学 Operations Research
注：
(1)巧得很啊！当分别利用悲观主义原则求得的局中人 1,2的最优收益在某一个局势下达到一致时，即得局中人 1,2的最优策略，而此最优策略竟然与利用,角逐,式方法达到的最优策略是相同的,
(2)
23}{m a xm in}{m inm a x aaa ijijijji
.
),(}{m a xm in}{m inm a x( 2 )
}.{m a xm in}{m inm a x
),,(h ( 1 )
21
最优策略的即为时，当存在最优策略矩阵对策

jijiijijijji
ij
ij
ij
ji
aaa
aa
ASST

2009-7-26 11
运筹学 Operations Research
证：若两个局中人无侥幸心理，仅虑及对方会设法使自己的收益最小，则应当选取最小收益中的最大者对应的策略为自己的最优策略（悲观主义原则）,当二者的最优策略达到一致时，即为矩阵对策的最优策略,▍
，
，，其中求解矩阵对策例
},,{
},,{),,(3
3212
321121

S
SASS

013
403
214
A
,1}1,3,1m a x {}}0,1,3m in {},4,0,3m in {},2,1,4m a x { m in {
}}{m in},{m in},{m inm a x {}{m inm a x 321

j
jjjjjijji
aaaa?解：
,1}4,1,4m i n {}}0,4,2m a x {},1,0,1m a x {},3,3,4m i n { m a x {
}}{m a x},{m a x},{m a xm i n {}{m a xm i n 221

i
iiiiiijij
aaaa
2009-7-26 12
运筹学 Operations Research
,1}{m a xm in}{m inm a x 12aaa ijijijji
.,21 21的最优策略分别为，局中人? ▍
，
，，其中求解矩阵对策例
},,,{
},,,{),,(4
43212
4321121

S
SASS
2620
5758
1241
5656
A
),(),,(),,(),,( 43234121解,▍
2009-7-26 13
运筹学 Operations Research
，，，其中求解矩阵对策例 },{},{),,(5 21221121 SSASS

34
01A
.
}{m a xm in}{m inm a x
无最优策略解,ij
ijijji
aa?▍
例 6（剪子，包袱，锤）两个小孩玩,剪子，包袱，锤,游戏,剪子可裁包袱，包袱可包锤，锤可砸剪子,双方约定：胜者得 1分，输者失 1分，平局时各得 0分,问：此对策问题有无最优策略？
解：
011
101
110
A 无最优策略,▍
2009-7-26 14
运筹学 Operations Research
例 6（续）田忌与齐王赛马问题亦无最优策略,▍
愈率如下表所示：两种药对不同疾病的治两种药有三种疾病，医生可开的某病人可能患有例,,,,7 21321
问医生应开哪种药最为稳妥？
解：此为一个对策问题，其中局中人分别为医生（ 1），病人（ 2）,局中人集合为 }.2,1{?I
2009-7-26 15
运筹学 Operations Research
局中人 1,2的策略集合分别为 },,{
211S },,{ 3212S
支付矩阵为

8.01.07.0
6.04.05.0A
于是，矩阵对策 ),,(
21 ASS
,4.0}8.0,4.0,5.0m i n {
}}8.0,6.0m a x {},1.0,4.0m a x {},7.0,5.0m i n { m a x {}{m a xm i n
,4.0}1.0,4.0m a x {
}}8.0,1.0,7.0m i n {},4.0,6.0,5.0m a x { m i n {}{m i nm a x

ij
ij
ij
ji
a
a?
124.0}{m a xm in}{m inm a x aaa ijijijji
.),( 121 最为稳妥，医生给病人开药的最优策略为 ▍
2009-7-26 16
运筹学 Operations Research
§ 9 over

课件简介

课件名称：	运筹学（ppt课件）
课件分类：	数学
课件类型：	教学课件
文件大小：	4.86MB
下载次数：	168
评论次数：	33
用户评分：	6.8