2009-7-26 1
运 筹 学 Operations Research
§ 9 对策论对策是有厉害冲突的各方所分别采取的决策,
对策论,亦称为博弈论,研究具有对抗、竞争、冲突性质的问题,
最早利用数学方法来研究对策论的是数学家 E,Zermelo,他于
1912年发表了论文《关于集合论在象棋对策中的应用,.1944
年,J,Von Neumann和 O,Morgenstern总结了前人关于对策论的研究成果,合著了《对策论与经济行为》( Theory of
Games and Economic Behavior) 一书,使得对策论的研究开始系统化和公理化,并具有了深刻的经济背景,1994年,在对策论研究中作出突出贡献的 Nash,Harsanyi和 Selten获得诺贝尔经济学奖,
2009-7-26 2
运 筹 学 Operations Research
对策问题的三个要素:
( 1) 局中人 ( player),参加对策的各方,
规定:局中人是聪明,理智的;将厉害关系一致的参加者视为一个局中人,
局中人集合:
( 2) 策略 ( strategy),局中人在一局对策中为争取尽量好的结果用来对付对手的行动方案,
策略集合:局中人的全部策略,
局中人的策略集合:
局势:在一局对策中,各局中人选定的策略构成的一个策略组 S.
局势决定本局对策的结果,
},,2,1{ nI
iS
2009-7-26 3
运 筹 学 Operations Research
( 3) 收益 ( earning),一局对策所得结果的数量表示,
收益或为赢得或为支付;收益由局势唯一确定,一但局势确定,即得收益,故收益和局势之间的此种对应在局势集合上构成了一个函数关系,
局中人 i的收益函数 ( earning function),
综上,建立对策模型:
对策过程:
)(SHH ii?
)}{,}{,( IiiIii HSI
.)(
).,,,( )()2()1(
)(
,本局对策结束中,即得收益的收益函数代入局中人将
,得到一个局势中选择一个策略从其策略集合每一个局中人
SHH
HiSSSSS
SSi
ii
i
n
i
i
2009-7-26 4
运 筹 学 Operations Research
例 1(猜硬币游戏)甲乙两人各抛掷一枚硬币,在落地以前,
以手覆之,双方约定:若两枚都是正面或反面,则甲得 1分,
乙得 -1分;若一个正面一个反面,则甲得 -1分,乙得 1分;最终得分最多者为胜,
这是一个对策问题,
局中人为甲( 1),乙( 2),局中人集合为局中人 1的策略可能有局中人 2的策略可能有局中人 1,2的策略集合分别为局势集合为局中人 1,2在各局势下的收益分别为
}2,1{?I
}{}{ 21 出反面,出正面
}{}{ 21 出反面,出正面
},,{ 211S },{ 212S
)},(),,(),,(),,{( 2212211121 SS
2009-7-26 5
运 筹 学 Operations Research
1),( 111H 1),( 211H 1),( 121H 1),( 221H
1),( 112H 1),( 212H 1),( 122H 1),( 222H
二人有限零和对策( 2-player finite zero-sum game),……
}2,1{?I
},,,{ 211 mS
},,,{ 212 nS
021 HH
nm,
.),(),( 21 ijjiijji aHaH -,则设
(局中人 1的)收益矩阵:,)(
nmijaA ).,(1 jiij Ha其中
2009-7-26 6
运 筹 学 Operations Research
二人有限零和对策和矩阵一一对应,故二人有限零和对策亦称为矩阵对策( matrix game),记作:
猜硬币游戏即为一个矩阵对策其中局中人集合为局中人 1,2的策略集合分别为收益矩阵为
),,( 21 ASS
),,( 21 ASS
}2,1{?I
},,{ 211S },{
212S
11
11A
例 2(田忌与齐王赛马)战国时期,齐王与大将田忌赛马,
分别挑选出上,中,下三个等级的马各一匹进行比赛,齐王的马比同一等级的田忌的马强壮,而田忌的高等级的马比齐王的低等级的马强壮,双方约定:每赛一局,胜者得千金,
2009-7-26 7
运 筹 学 Operations Research
此对策问题为一个矩阵对策其中局中人为田忌( 1),齐王( 2)
收益矩阵为
),,( 21 ASS
}{}{}{:},,{
}{}{}{:},,{
3213212
3213211
下,中,上下,中,上
S
S
111
111
111
A
2009-7-26 8
运 筹 学 Operations Research
【引例】给定 矩阵对策 其 中收益矩阵为
),,,( 21 ASS },,,{
3211S
},,,{ 3212S
816
234
231
A
.,
21.2),(
),(21
......
32
23321
32
为的最优策略分别,故局中人最大收益下分别获得最终在局势,在“角逐”中,局中人
aH
2009-7-26 9
运 筹 学 Operations Research
分别利用悲观主义原则来求局中人 1,2的最优策略:
局中人 1:
232}8,2,2m a x {}}8,1,6m i n {},2,3,4m i n {},2,3,1m a x { m i n { a
.2),(1 233212 aH,最优收益为的最优策略为局中人局中人 2:
816
234
231
A
2}2,3,6m ax {}}8,2,2m i n {},1,3,3m i n {},6,4,1m ax { m i n {
.2),(1 233223 aH,最优收益为的最优策略为局中人
2009-7-26 10
运 筹 学 Operations Research
注:
(1)巧得很啊!当分别利用悲观主义原则求得的局中人 1,2的最优收益在某一个局势下达到一致时,即得局中人 1,2的最优策略,而此最优策略竟然与利用,角逐,式方法达到的最优策略是相同的,
(2)
23}{m a xm in}{m inm a x aaa ijijijji
.
),(}{m a xm in}{m inm a x( 2 )
}.{m a xm in}{m inm a x
),,(h ( 1 )
21
最优策略的即为时,当存在最优策略矩阵对策
jijiijijijji
ij
ij
ij
ji
aaa
aa
ASST
2009-7-26 11
运 筹 学 Operations Research
证:若两个局中人无侥幸心理,仅虑及对方会设法使自己的收益最小,则应当选取最小收益中的最大者对应的策略为自己的最优策略(悲观主义原则),当二者的最优策略达到一致时,即为矩阵对策的最优策略,▍
,
,,其中求解矩阵对策例
},,{
},,{),,(3
3212
321121
S
SASS
013
403
214
A
,1}1,3,1m a x {}}0,1,3m in {},4,0,3m in {},2,1,4m a x { m in {
}}{m in},{m in},{m inm a x {}{m inm a x 321
j
jjjjjijji
aaaa?解:
,1}4,1,4m i n {}}0,4,2m a x {},1,0,1m a x {},3,3,4m i n { m a x {
}}{m a x},{m a x},{m a xm i n {}{m a xm i n 221
i
iiiiiijij
aaaa
2009-7-26 12
运 筹 学 Operations Research
,1}{m a xm in}{m inm a x 12aaa ijijijji
.,21 21的最优策略分别为,局中人? ▍
,
,,其中求解矩阵对策例
},,,{
},,,{),,(4
43212
4321121
S
SASS
2620
5758
1241
5656
A
),(),,(),,(),,( 43234121解,▍
2009-7-26 13
运 筹 学 Operations Research
,,,其中求解矩阵对策例 },{},{),,(5 21221121 SSASS
34
01A
.
}{m a xm in}{m inm a x
无最优策略解,ij
ijijji
aa?▍
例 6(剪子,包袱,锤)两个小孩玩,剪子,包袱,锤,游戏,剪子可裁包袱,包袱可包锤,锤可砸剪子,双方约定:胜者得 1分,输者失 1分,平局时各得 0分,问:此对策问题有无最优策略?
解:
011
101
110
A 无最优策略,▍
2009-7-26 14
运 筹 学 Operations Research
例 6(续)田忌与齐王赛马问题亦无最优策略,▍
愈率如下表所示:两种药对不同疾病的治两种药有三种疾病,医生可开的某病人可能患有例,,,,7 21321
问医生应开哪种药最为稳妥?
解:此为一个对策问题,其中局中人分别为医生( 1),病人( 2),局中人集合为 }.2,1{?I
2009-7-26 15
运 筹 学 Operations Research
局中人 1,2的策略集合分别为 },,{
211S },,{ 3212S
支付矩阵为
8.01.07.0
6.04.05.0A
于是,矩阵对策 ),,(
21 ASS
,4.0}8.0,4.0,5.0m i n {
}}8.0,6.0m a x {},1.0,4.0m a x {},7.0,5.0m i n { m a x {}{m a xm i n
,4.0}1.0,4.0m a x {
}}8.0,1.0,7.0m i n {},4.0,6.0,5.0m a x { m i n {}{m i nm a x
ij
ij
ij
ji
a
a?
124.0}{m a xm in}{m inm a x aaa ijijijji
.),( 121 最为稳妥,医生给病人开药的最优策略为 ▍
2009-7-26 16
运 筹 学 Operations Research
§ 9 over
运 筹 学 Operations Research
§ 9 对策论对策是有厉害冲突的各方所分别采取的决策,
对策论,亦称为博弈论,研究具有对抗、竞争、冲突性质的问题,
最早利用数学方法来研究对策论的是数学家 E,Zermelo,他于
1912年发表了论文《关于集合论在象棋对策中的应用,.1944
年,J,Von Neumann和 O,Morgenstern总结了前人关于对策论的研究成果,合著了《对策论与经济行为》( Theory of
Games and Economic Behavior) 一书,使得对策论的研究开始系统化和公理化,并具有了深刻的经济背景,1994年,在对策论研究中作出突出贡献的 Nash,Harsanyi和 Selten获得诺贝尔经济学奖,
2009-7-26 2
运 筹 学 Operations Research
对策问题的三个要素:
( 1) 局中人 ( player),参加对策的各方,
规定:局中人是聪明,理智的;将厉害关系一致的参加者视为一个局中人,
局中人集合:
( 2) 策略 ( strategy),局中人在一局对策中为争取尽量好的结果用来对付对手的行动方案,
策略集合:局中人的全部策略,
局中人的策略集合:
局势:在一局对策中,各局中人选定的策略构成的一个策略组 S.
局势决定本局对策的结果,
},,2,1{ nI
iS
2009-7-26 3
运 筹 学 Operations Research
( 3) 收益 ( earning),一局对策所得结果的数量表示,
收益或为赢得或为支付;收益由局势唯一确定,一但局势确定,即得收益,故收益和局势之间的此种对应在局势集合上构成了一个函数关系,
局中人 i的收益函数 ( earning function),
综上,建立对策模型:
对策过程:
)(SHH ii?
)}{,}{,( IiiIii HSI
.)(
).,,,( )()2()1(
)(
,本局对策结束中,即得收益的收益函数代入局中人将
,得到一个局势中选择一个策略从其策略集合每一个局中人
SHH
HiSSSSS
SSi
ii
i
n
i
i
2009-7-26 4
运 筹 学 Operations Research
例 1(猜硬币游戏)甲乙两人各抛掷一枚硬币,在落地以前,
以手覆之,双方约定:若两枚都是正面或反面,则甲得 1分,
乙得 -1分;若一个正面一个反面,则甲得 -1分,乙得 1分;最终得分最多者为胜,
这是一个对策问题,
局中人为甲( 1),乙( 2),局中人集合为局中人 1的策略可能有局中人 2的策略可能有局中人 1,2的策略集合分别为局势集合为局中人 1,2在各局势下的收益分别为
}2,1{?I
}{}{ 21 出反面,出正面
}{}{ 21 出反面,出正面
},,{ 211S },{ 212S
)},(),,(),,(),,{( 2212211121 SS
2009-7-26 5
运 筹 学 Operations Research
1),( 111H 1),( 211H 1),( 121H 1),( 221H
1),( 112H 1),( 212H 1),( 122H 1),( 222H
二人有限零和对策( 2-player finite zero-sum game),……
}2,1{?I
},,,{ 211 mS
},,,{ 212 nS
021 HH
nm,
.),(),( 21 ijjiijji aHaH -,则设
(局中人 1的)收益矩阵:,)(
nmijaA ).,(1 jiij Ha其中
2009-7-26 6
运 筹 学 Operations Research
二人有限零和对策和矩阵一一对应,故二人有限零和对策亦称为矩阵对策( matrix game),记作:
猜硬币游戏即为一个矩阵对策其中局中人集合为局中人 1,2的策略集合分别为收益矩阵为
),,( 21 ASS
),,( 21 ASS
}2,1{?I
},,{ 211S },{
212S
11
11A
例 2(田忌与齐王赛马)战国时期,齐王与大将田忌赛马,
分别挑选出上,中,下三个等级的马各一匹进行比赛,齐王的马比同一等级的田忌的马强壮,而田忌的高等级的马比齐王的低等级的马强壮,双方约定:每赛一局,胜者得千金,
2009-7-26 7
运 筹 学 Operations Research
此对策问题为一个矩阵对策其中局中人为田忌( 1),齐王( 2)
收益矩阵为
),,( 21 ASS
}{}{}{:},,{
}{}{}{:},,{
3213212
3213211
下,中,上下,中,上
S
S
111
111
111
A
2009-7-26 8
运 筹 学 Operations Research
【引例】给定 矩阵对策 其 中收益矩阵为
),,,( 21 ASS },,,{
3211S
},,,{ 3212S
816
234
231
A
.,
21.2),(
),(21
......
32
23321
32
为的最优策略分别,故局中人最大收益下分别获得最终在局势,在“角逐”中,局中人
aH
2009-7-26 9
运 筹 学 Operations Research
分别利用悲观主义原则来求局中人 1,2的最优策略:
局中人 1:
232}8,2,2m a x {}}8,1,6m i n {},2,3,4m i n {},2,3,1m a x { m i n { a
.2),(1 233212 aH,最优收益为的最优策略为局中人局中人 2:
816
234
231
A
2}2,3,6m ax {}}8,2,2m i n {},1,3,3m i n {},6,4,1m ax { m i n {
.2),(1 233223 aH,最优收益为的最优策略为局中人
2009-7-26 10
运 筹 学 Operations Research
注:
(1)巧得很啊!当分别利用悲观主义原则求得的局中人 1,2的最优收益在某一个局势下达到一致时,即得局中人 1,2的最优策略,而此最优策略竟然与利用,角逐,式方法达到的最优策略是相同的,
(2)
23}{m a xm in}{m inm a x aaa ijijijji
.
),(}{m a xm in}{m inm a x( 2 )
}.{m a xm in}{m inm a x
),,(h ( 1 )
21
最优策略的即为时,当存在最优策略矩阵对策
jijiijijijji
ij
ij
ij
ji
aaa
aa
ASST
2009-7-26 11
运 筹 学 Operations Research
证:若两个局中人无侥幸心理,仅虑及对方会设法使自己的收益最小,则应当选取最小收益中的最大者对应的策略为自己的最优策略(悲观主义原则),当二者的最优策略达到一致时,即为矩阵对策的最优策略,▍
,
,,其中求解矩阵对策例
},,{
},,{),,(3
3212
321121
S
SASS
013
403
214
A
,1}1,3,1m a x {}}0,1,3m in {},4,0,3m in {},2,1,4m a x { m in {
}}{m in},{m in},{m inm a x {}{m inm a x 321
j
jjjjjijji
aaaa?解:
,1}4,1,4m i n {}}0,4,2m a x {},1,0,1m a x {},3,3,4m i n { m a x {
}}{m a x},{m a x},{m a xm i n {}{m a xm i n 221
i
iiiiiijij
aaaa
2009-7-26 12
运 筹 学 Operations Research
,1}{m a xm in}{m inm a x 12aaa ijijijji
.,21 21的最优策略分别为,局中人? ▍
,
,,其中求解矩阵对策例
},,,{
},,,{),,(4
43212
4321121
S
SASS
2620
5758
1241
5656
A
),(),,(),,(),,( 43234121解,▍
2009-7-26 13
运 筹 学 Operations Research
,,,其中求解矩阵对策例 },{},{),,(5 21221121 SSASS
34
01A
.
}{m a xm in}{m inm a x
无最优策略解,ij
ijijji
aa?▍
例 6(剪子,包袱,锤)两个小孩玩,剪子,包袱,锤,游戏,剪子可裁包袱,包袱可包锤,锤可砸剪子,双方约定:胜者得 1分,输者失 1分,平局时各得 0分,问:此对策问题有无最优策略?
解:
011
101
110
A 无最优策略,▍
2009-7-26 14
运 筹 学 Operations Research
例 6(续)田忌与齐王赛马问题亦无最优策略,▍
愈率如下表所示:两种药对不同疾病的治两种药有三种疾病,医生可开的某病人可能患有例,,,,7 21321
问医生应开哪种药最为稳妥?
解:此为一个对策问题,其中局中人分别为医生( 1),病人( 2),局中人集合为 }.2,1{?I
2009-7-26 15
运 筹 学 Operations Research
局中人 1,2的策略集合分别为 },,{
211S },,{ 3212S
支付矩阵为
8.01.07.0
6.04.05.0A
于是,矩阵对策 ),,(
21 ASS
,4.0}8.0,4.0,5.0m i n {
}}8.0,6.0m a x {},1.0,4.0m a x {},7.0,5.0m i n { m a x {}{m a xm i n
,4.0}1.0,4.0m a x {
}}8.0,1.0,7.0m i n {},4.0,6.0,5.0m a x { m i n {}{m i nm a x
ij
ij
ij
ji
a
a?
124.0}{m a xm in}{m inm a x aaa ijijijji
.),( 121 最为稳妥,医生给病人开药的最优策略为 ▍
2009-7-26 16
运 筹 学 Operations Research
§ 9 over