第七章 对策论
(Game Theory)
7.1 基本概念
7.2 矩阵对策的纯策略
7.3 矩阵对策的混合策略与混合扩充第七章 对策论二人有限零和对策是对策论最基本的内容。
Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。
第七章 对策论
7.1 基本概念一、对策现象与对策论
1,对策现象
①下棋,围棋源于我国殷代。
齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于田忌。孙膑给田忌出主意,
用下----上,上----中,中----下,
结果田忌胜出。

第七章 对策论
1
-1 0
1
0
-1
-110
A
石头剪子石头 剪子布布赢
B
猜手:小孩A与B猜手,若规定赢得1分,平得0分,输得 -1分,则 A的赢得可用右表来表示。

第七章 对策论
2,对策论的产生
1944年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事需要,抽象成数学模型。
50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的,核,的概念。同时,
非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了,囚徒困境,问题。
60年代,泽尔腾(1965)引入动态分析,提出,精练纳什均衡,概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。
第七章 对策论二,对策问题的组成
(1)局中人:对策中有决策权的参与者。
(2)策略与策略集,在一局对策中,把局中人的一个可行方案称为它的一个策略,把局中人的策略全体叫做策略集和。
(3)局势:当每个局中人从自己的策略集中选择了一个策略组成的策略组就称为一个局势。
(4)支付:局势出现后,对策的结果也就确定了,对任一局势,任一局中人都有一个支付值。显然,支付是局势的函数。
0
0
零和:各局中人的得失之和为分为非零和:各局中人的得失之和非第七章 对策论一、纯策略与混合策略纯策略是指确定的选择某策略;
混合策略则指以某一概率分布选择各策略。
7.2 矩阵对策的纯策略第七章 对策论二、纯策略对策的解
1,引例前提:
对策双方均理智结论:
最不利中选最有利

例 设一对策
,其赢得矩阵为:
{ },,ADSG =
,其中
{ },,
321
sssS =
{ },,
321
dddD =
3
2
1
s
s
s
321
ddd
4 1- 5-
3- 0 6
2 1 3
=A
问:双方局中人采用何策略最佳。
第七章 对策论解:可用下述表格表示上述寻找最优纯策略过程:
d
1
d
2
d
3
s
1
3 1 2 1
s
2
60-3 -3
s
3
-5 -1 4 -5
6 1 4
ij
j
amin
ij
i
amax
故 若双方都采取理智行为,局势
),(
21
ds
为最优纯策略.
第七章 对策论
2,
纯策略分析
(1)局中人甲对每个策略 s
i
的评价值为
i
s
ij
j
i
asf min)( =
评价故局中人甲选择策略模型为:
max
*
minmax)(max Vasfs
ij
ji
i
i
i
==←
(2)局中人乙对每个策略 d
j
的评价值为
j
d
ij
i
j
adg max)( =
评价故局中人乙选择策略模型为:
min
*
maxmin)(min Vadgd
ij
ij
j
j
j
==←
第七章 对策论
3,纯策略对策模型的解
(1) 鞍点与解对于一个对策
,如果有
{ },,ADSG =
*
maxminminmax
ijij
ij
ij
ji
aaa ==
则称局势为对策 G的一个鞍点,
),(
**
ji
ds
称为对策G 之 值。
*
ij
aV =
第七章 对策论例 1 上例中
{ },,ADSG =
=
4 1- 5-
3- 0 6
2 1 3
A
对策值 V=1
局势 ),(
21
ds
构成一个鞍点,
局中人甲的最优策略为s
1
,
局中人乙的最优策略为d
2

第七章 对策论
(2) 多鞍点与无鞍点对策例 2 设有一矩阵对策如下,求它的解。
=
2 6 2 0
5 7 5 8
1- 2 4 1
5 6 5 6
A
此对策有多个解。
局势
),(
21
ds
),(
41
ds
),(
23
ds
),(
43
ds
均构成鞍点,
第七章 对策论例 3,矩阵对策赢得矩阵如下,试求它的解。
=
4 5
6 3
A
解,{ }
{}56,5minmaxmin
44,3maxminmax
===
===
ij
ij
U
ij
ji
L
aV
aV
2=
i
1=
j
故:该对策无鞍点,即无解。
第七章 对策论例 4,齐王赛马为无鞍点对策田忌齐王
β
1
(上中下)
β
2
(上下中)
β
3
(中上下)
β
4
(中下上)
β
5
(下上中)
β
6
(下中上)
α
1
(上中下)
3111-11
α
2
(上下中)
13111-1
α
1
(中上下)
1-13111
α
1
(中下上)
-111311
α
1
(下上中)
11 1-131
α
1
(下中上)
11-1113
第七章 对策论
4、优超原理
,,1
,,1
ij kj i k
ik
ij il j l
jl
Aikaaj n
Alaaim
αα
αα
ββ
ββ
≥=
≤=
"
;
"
;
定义:
若 中第 行有 称 优超于 。
记若 中第j 列有 称 优超于 。
记第七章 对策论例 5:
321
3 3 1
3 1 2
2 2 0
3
2
1
βββ
α
α
α
=A
32
13
ββ
αα
;
;
第七章 对策论性质 1:
''''
12 12
'''
11 22
G(,,) (,,)
ik
k
SSA G SSA
SS SSAA k
αα
α
==;若 中,,构造新的其中 是 去掉,=,是 中去掉 行,则:
'
'
*' * * * * * *
111
*** * *
11 1
()
(0 )
G
G
kk m
kkm
VV
yyX xxx x
X xx x x
+
+
=
==
=
""
""
若,
则,,


第七章 对策论例 6,用优超原理求解下列对策
=
38806
5.57864
95937
95205
03023
A
=
38806
5.57864
95937
1
A
第七章 对策论第2列优于第3、4列,所以划去第3、4列,得到:
=
306
5.564
937
2
A
第 1行优于第3 行,划去第3 行得到:
=
5.564
937
3
A
=
64
37
4
A
第 1列优于第3 列第七章 对策论
7.3 混合策略对策一、混合策略对策的基本概念无鞍点对策的求解方法是采用混合策略,混合策略就是局中人考虑以某种概率分布来选择他的各个策略。
m维概率向量
1.混合策略
,0,1,),,,(
1
21
≥==

=
i
m
i
i
T
m
xxxxxx "
称为局中人甲的一个混合策略,即局中人甲选择策略 s
i
的概率为 x
i

同理可定义乙的混合策略。
第七章 对策论例7:,剪刀、石头、布” 游戏,若B的混合策略
(0.4,0.3,0.3)
(0.5)
(0.2)
(0.3)
B
石头
(0.4)
剪子 (0.3) 布 (0.3)
石头 0
-1
1
1-1
剪子 01
布 -1
A
0
第七章 对策论
3.混合局势当局中人甲选择混合策略 x;局中人乙选择混合策略 y,称( x,y)为一个混合局势。
2.混合策略集合称集合
≥===

=
m
i
iim
xxxxxxS
1
21
*
0,1),,,( "
为 甲的混合策略集合;
≥===

=
n
j
jjn
yyyyyyD
1
21
*
0,1),,,( "
为 乙的混合策略集合;
第七章 对策论对于一个混合局势( x,y),用
∑∑∑∑
====
===
m
i
m
i
n
j
T
jiij
n
j
jiji
AyxyxayaxyxE
1111
)(),(
表示局中人甲在混合局势 (x,y)时的收益期望值。
4.收益期望函数
5.混合策略对策模型对于一个纯策略对策 ),,( ADSG =
,我们用
),,(
***
EDSG = 表示一个混合策略矩阵对策及
G的一个混合扩充。
第七章 对策论二、混合策略对策的解
1.混合策略分析对于混合策略对策
),,(
***
EDSG =
局中人甲 的策略决策模型为:
∈∈∈
→== xyxEyxExf
x
DySxSx
),(),(minmax)(max
*
***
*
**
),(),(maxmin)(min
*
***
yyxEyxEyg
y
SxDyDy
→==
∈∈∈
局中人乙 的策略决策模型为:
2.混合策略矩阵对策的线性规划解法若所有 a
ij
>0(否则,可取一充分大M>0,使得 a
ij
+M>0),
则可用下述两规划 来求解混合策略:
,1,2,,0'
,1,2,,1'
s.t
''' min
1
21
=≥
=≥
+++=

=
mix
njxa
xxxw
i
m
i
iij
m
"
"
"
,1,2,,0'
,1,2,,1'
s.t.
''' max
1
21
=≥
=≤
+++=

=
njy
miya
yyyz
j
n
j
jij
n
"
"
"
'
1
,'
1
y
z
yx
w
x
==
(Ⅰ)
(Ⅱ)
归一化例 7:,剪刀、石头、布,游戏,
=
011
101
110
A
A+2
213
321
132
=≥
≥++
≥++
≥++
++=
)3,2,1(0
123
123
132
min
321
321
321
321
ix
xxx
xxx
xxx
st
xxxz
i
求解
T
)
6
1
,
6
1
,
6
1
(=X
归一化
T
)
3
1
,
3
1
,
3
1
(=
X
同理,
T
)
3
1
,
3
1
,
3
1
(=
Y