第七章 对策论
(Game Theory)
7.1 基本概念
7.2 矩阵对策的纯策略
7.3 矩阵对策的混合策略与混合扩充第七章 对策论二人有限零和对策是对策论最基本的内容。
Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。
第七章 对策论
7.1 基本概念一、对策现象与对策论
1,对策现象
①下棋,围棋源于我国殷代。
齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于田忌。孙膑给田忌出主意,
用下----上,上----中,中----下,
结果田忌胜出。
②
第七章 对策论
1
-1 0
1
0
-1
-110
A
石头剪子石头 剪子布布赢
B
猜手:小孩A与B猜手,若规定赢得1分,平得0分,输得 -1分,则 A的赢得可用右表来表示。
③
第七章 对策论
2,对策论的产生
1944年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事需要,抽象成数学模型。
50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的,核,的概念。同时,
非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了,囚徒困境,问题。
60年代,泽尔腾(1965)引入动态分析,提出,精练纳什均衡,概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。
第七章 对策论二,对策问题的组成
(1)局中人:对策中有决策权的参与者。
(2)策略与策略集,在一局对策中,把局中人的一个可行方案称为它的一个策略,把局中人的策略全体叫做策略集和。
(3)局势:当每个局中人从自己的策略集中选择了一个策略组成的策略组就称为一个局势。
(4)支付:局势出现后,对策的结果也就确定了,对任一局势,任一局中人都有一个支付值。显然,支付是局势的函数。
0
0
零和:各局中人的得失之和为分为非零和:各局中人的得失之和非第七章 对策论一、纯策略与混合策略纯策略是指确定的选择某策略;
混合策略则指以某一概率分布选择各策略。
7.2 矩阵对策的纯策略第七章 对策论二、纯策略对策的解
1,引例前提:
对策双方均理智结论:
最不利中选最有利
,
例 设一对策
,其赢得矩阵为:
{ },,ADSG =
,其中
{ },,
321
sssS =
{ },,
321
dddD =
3
2
1
s
s
s
321
ddd
4 1- 5-
3- 0 6
2 1 3
=A
问:双方局中人采用何策略最佳。
第七章 对策论解:可用下述表格表示上述寻找最优纯策略过程:
d
1
d
2
d
3
s
1
3 1 2 1
s
2
60-3 -3
s
3
-5 -1 4 -5
6 1 4
ij
j
amin
ij
i
amax
故 若双方都采取理智行为,局势
),(
21
ds
为最优纯策略.
第七章 对策论
2,
纯策略分析
(1)局中人甲对每个策略 s
i
的评价值为
i
s
ij
j
i
asf min)( =
评价故局中人甲选择策略模型为:
max
*
minmax)(max Vasfs
ij
ji
i
i
i
==←
(2)局中人乙对每个策略 d
j
的评价值为
j
d
ij
i
j
adg max)( =
评价故局中人乙选择策略模型为:
min
*
maxmin)(min Vadgd
ij
ij
j
j
j
==←
第七章 对策论
3,纯策略对策模型的解
(1) 鞍点与解对于一个对策
,如果有
{ },,ADSG =
*
maxminminmax
ijij
ij
ij
ji
aaa ==
则称局势为对策 G的一个鞍点,
),(
**
ji
ds
称为对策G 之 值。
*
ij
aV =
第七章 对策论例 1 上例中
{ },,ADSG =
=
4 1- 5-
3- 0 6
2 1 3
A
对策值 V=1
局势 ),(
21
ds
构成一个鞍点,
局中人甲的最优策略为s
1
,
局中人乙的最优策略为d
2
,
第七章 对策论
(2) 多鞍点与无鞍点对策例 2 设有一矩阵对策如下,求它的解。
=
2 6 2 0
5 7 5 8
1- 2 4 1
5 6 5 6
A
此对策有多个解。
局势
),(
21
ds
),(
41
ds
),(
23
ds
),(
43
ds
均构成鞍点,
第七章 对策论例 3,矩阵对策赢得矩阵如下,试求它的解。
=
4 5
6 3
A
解,{ }
{}56,5minmaxmin
44,3maxminmax
===
===
ij
ij
U
ij
ji
L
aV
aV
2=
i
1=
j
故:该对策无鞍点,即无解。
第七章 对策论例 4,齐王赛马为无鞍点对策田忌齐王
β
1
(上中下)
β
2
(上下中)
β
3
(中上下)
β
4
(中下上)
β
5
(下上中)
β
6
(下中上)
α
1
(上中下)
3111-11
α
2
(上下中)
13111-1
α
1
(中上下)
1-13111
α
1
(中下上)
-111311
α
1
(下上中)
11 1-131
α
1
(下中上)
11-1113
第七章 对策论
4、优超原理
,,1
,,1
ij kj i k
ik
ij il j l
jl
Aikaaj n
Alaaim
αα
αα
ββ
ββ
≥=
≤=
(Game Theory)
7.1 基本概念
7.2 矩阵对策的纯策略
7.3 矩阵对策的混合策略与混合扩充第七章 对策论二人有限零和对策是对策论最基本的内容。
Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。
第七章 对策论
7.1 基本概念一、对策现象与对策论
1,对策现象
①下棋,围棋源于我国殷代。
齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于田忌。孙膑给田忌出主意,
用下----上,上----中,中----下,
结果田忌胜出。
②
第七章 对策论
1
-1 0
1
0
-1
-110
A
石头剪子石头 剪子布布赢
B
猜手:小孩A与B猜手,若规定赢得1分,平得0分,输得 -1分,则 A的赢得可用右表来表示。
③
第七章 对策论
2,对策论的产生
1944年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事需要,抽象成数学模型。
50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的,核,的概念。同时,
非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了,囚徒困境,问题。
60年代,泽尔腾(1965)引入动态分析,提出,精练纳什均衡,概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。
第七章 对策论二,对策问题的组成
(1)局中人:对策中有决策权的参与者。
(2)策略与策略集,在一局对策中,把局中人的一个可行方案称为它的一个策略,把局中人的策略全体叫做策略集和。
(3)局势:当每个局中人从自己的策略集中选择了一个策略组成的策略组就称为一个局势。
(4)支付:局势出现后,对策的结果也就确定了,对任一局势,任一局中人都有一个支付值。显然,支付是局势的函数。
0
0
零和:各局中人的得失之和为分为非零和:各局中人的得失之和非第七章 对策论一、纯策略与混合策略纯策略是指确定的选择某策略;
混合策略则指以某一概率分布选择各策略。
7.2 矩阵对策的纯策略第七章 对策论二、纯策略对策的解
1,引例前提:
对策双方均理智结论:
最不利中选最有利
,
例 设一对策
,其赢得矩阵为:
{ },,ADSG =
,其中
{ },,
321
sssS =
{ },,
321
dddD =
3
2
1
s
s
s
321
ddd
4 1- 5-
3- 0 6
2 1 3
=A
问:双方局中人采用何策略最佳。
第七章 对策论解:可用下述表格表示上述寻找最优纯策略过程:
d
1
d
2
d
3
s
1
3 1 2 1
s
2
60-3 -3
s
3
-5 -1 4 -5
6 1 4
ij
j
amin
ij
i
amax
故 若双方都采取理智行为,局势
),(
21
ds
为最优纯策略.
第七章 对策论
2,
纯策略分析
(1)局中人甲对每个策略 s
i
的评价值为
i
s
ij
j
i
asf min)( =
评价故局中人甲选择策略模型为:
max
*
minmax)(max Vasfs
ij
ji
i
i
i
==←
(2)局中人乙对每个策略 d
j
的评价值为
j
d
ij
i
j
adg max)( =
评价故局中人乙选择策略模型为:
min
*
maxmin)(min Vadgd
ij
ij
j
j
j
==←
第七章 对策论
3,纯策略对策模型的解
(1) 鞍点与解对于一个对策
,如果有
{ },,ADSG =
*
maxminminmax
ijij
ij
ij
ji
aaa ==
则称局势为对策 G的一个鞍点,
),(
**
ji
ds
称为对策G 之 值。
*
ij
aV =
第七章 对策论例 1 上例中
{ },,ADSG =
=
4 1- 5-
3- 0 6
2 1 3
A
对策值 V=1
局势 ),(
21
ds
构成一个鞍点,
局中人甲的最优策略为s
1
,
局中人乙的最优策略为d
2
,
第七章 对策论
(2) 多鞍点与无鞍点对策例 2 设有一矩阵对策如下,求它的解。
=
2 6 2 0
5 7 5 8
1- 2 4 1
5 6 5 6
A
此对策有多个解。
局势
),(
21
ds
),(
41
ds
),(
23
ds
),(
43
ds
均构成鞍点,
第七章 对策论例 3,矩阵对策赢得矩阵如下,试求它的解。
=
4 5
6 3
A
解,{ }
{}56,5minmaxmin
44,3maxminmax
===
===
ij
ij
U
ij
ji
L
aV
aV
2=
i
1=
j
故:该对策无鞍点,即无解。
第七章 对策论例 4,齐王赛马为无鞍点对策田忌齐王
β
1
(上中下)
β
2
(上下中)
β
3
(中上下)
β
4
(中下上)
β
5
(下上中)
β
6
(下中上)
α
1
(上中下)
3111-11
α
2
(上下中)
13111-1
α
1
(中上下)
1-13111
α
1
(中下上)
-111311
α
1
(下上中)
11 1-131
α
1
(下中上)
11-1113
第七章 对策论
4、优超原理
,,1
,,1
ij kj i k
ik
ij il j l
jl
Aikaaj n
Alaaim
αα
αα
ββ
ββ
≥=
≤=