第十一章 二人有限零和对策二人有限零和对策是对策论 (Game
Theory)最基本的内容。
Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。
第一节 基本概念一、对策现象与对策论
1,对策现象
①下棋,围棋源于我国殷代。
1 -1 0
10-1
-110
A
石头剪子石头 剪子布布赢 B
猜手,小孩 A与 B猜手,若规定赢得 1分,平得 0分,输得 -1分,
则 A的赢得可用右表来表示。

齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于田忌。孙膑给田忌出主意,
用下 ----上,上 ----中,中 ----下,
结果田忌胜出。

2,对策论的产生
1944年,纽曼与曼彻斯特发表了题为,对策论和经济行为,。二次大战前后,由于军事需要,抽象成数学模型。
50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时
,非合作对策也开始创立。纳什于 1950和 1951年发表了两篇关于非合作对策的文章,图克于 1950年定义了“囚徒困境”问题。
60年代,泽尔腾( 1965)引入动态分析,提出“精练纳什均衡”概念。 海萨尼( 1967-1968)则把不完全信息引入对策论的研究。
二,对策问题的组成
1.局中人(参加者):一局对策的参加者。
2.策略:局中人在一局对策中对付对手的一个完整的方案。
策略集:局中人在一局对策中所有策略的全体。记为 S
(分为有限和无限)问,田忌和齐王的 S=?
3,局势:在一局对策中,每个局中人都选定一策略后的各策略总和。
0
0

零 和,各 局 中 人 的 得 失 之 和 为分 为非 零 和,各 局 中 人 的 得 失 之 和 非
4,支付:局势给定后,局中人的得失(是局势的函数)。
如在二人对策中,设
1 1 2 1,,,,,,
,1,,,1,,
mn
ij
SS
i m j n



则 局 势 为 (,)
M
第二节 矩阵对策的最优纯策略
12
11 1
1
12
S { },S { }
A
,,
mn
n
m m n
ij ij
aa
aa
aa
G S S A









1 2 1 2
设 二 人 有 限 零 和 对 策 问 题 的 局 中 人 为,
策 略 集 为,,,,,,
则 支 付 可 以 用 矩 阵 = 表 示,
其 中 为 的 得 ( 也 是 的 失 ),的 得 即 为 - 。
故 又 称 二 人 有 限 零 和 对 策 为 矩 阵 对 策,记 为 ( )
一、矩阵对策二,理智局中人的选择在矩阵对策中,局中人将如何选取自己的策略呢?
*
*
m a x m in
m in m a x
ij ij
i
ij jj
i
a
a




选即 理 智 局 中 人 的 选 择选
3
32
2
3 2 3
2 3 2 3
1 3 2
A 4 3 2
6 1 8
aa









举 例 说 明,若 =
,都 想 谋 取 最 大 的 赢 得,当 然 想 出,但 估 计 到的 心 理,便 出,使 反 而 输 掉 8 。 于 是 为 了 保 险 起 见 出,
因 为 肯 定 不 会 输 。 即 若 不 存 在 侥 幸 心 理 ( 理 智 的 ),必 出,
而 此 时 必 出,否 则 输 得 更 多 。 结 果,在 局 势 (,) 下,
的 得 是 =2,这 时 双 方 都 无 意 见,分 析 的 特 点,是 行 中 最 小的 最 大,列 中 最 大 的 最 小 。
1?
2?
3?
2?1? 3?
三、最优纯策略与鞍点
* * * * * *
* * * *
G
1,G,
G
GV
ij i j i j i j
i j i j
a a a
a




对策 的解和值:使得 的( ) 称为的解,与 分别是,的最优纯策略,
称为 的值,记为 。
**
**
**
2,
m a x m in m in m a x
ij
i j i jij
jjii
ij
a a a


鞍点:若局势(,)对应的
==
则称(,)为鞍点。
23 3 23 2ija a a a分析上例中的,它就满足定理 1:
* * * *,,i j i jG在纯策略中有解( ) ( ) 是鞍点
**
* * * * * *
* * * * * *
* * * *
**
,
m in m in m a x m a x m in m a x
m in,m a x
,1,,1,,
(,)
ij ij
i j ij
j j ji i i
i j i j ij i j
j i
ij i j i j i j
ij i j i j
ij
a a a a
a a a a
a a a a i m j n
a a a
G




证明记故即 是 的解
* * * *
* * * *
* * * *
**
**
1,,1,,
m a x m in
m in m a x m a x m in m a x m in
A,m a x m in m in m a x
m in m a x m a x m in
(,)
ij i j i j
ij i j i j
ji
ij ij
ij i j i j
j j ji i i
ij ij
jjii
ij ij
ij
jjii
ij
a a a i m j n
a a a
a a a a a
aa
a a a





但对于任意 有只有即 是鞍点证毕例 1
- 2 2 - 2 7
4 3 8 5
8 - 6 2 - 1




2?
6?
3
**
G
22
V3
(,) (,)
ij

例 2
0 2 2
5 4 3
2 3 4




2?4?3?
4 25
m in m a x 2
m a x m in 2
,
ij
j i
ij
ji
a
a

鞍点不存在即在纯策略意义下无解例 3
6 5 6 5
1 4 2 - 1
8 5 7 5
0 2 6 2






5 578
5
5
-1
0
**
G
1 2 1 4
3 2 3 4
V5
(,) (,),(,),
(,),(,)
ij


鞍点不唯一,但值唯一。
1 1 2 2
1 1 2 2
1 1 2 2
1 2 2 1
1,(,),(,),
2,(,),(,) G,
(,),(,) G
i j i j
i j i j
i j i j
i j i j
G
aa



例3 直观地证明了最优解的两个性质:
无差别性 是 的两个解则可交换性 是 的两个解则 也是 的解。
第三节矩阵对策的混合策略与混合扩充一、基本概念
T4,( X,Y),E ( X,Y) X A Y
对于一个混合局势 用表示 收益局中人 的 期望值 。
1,,局中人,。
*
11
1
*
21
1
2,S { ( ) | 1,0 }
S { ( ) | 1,0 }
m
m i i
i
n
m i i
i
X x x x x
Y y y y y


混合策略集混合的的 策略集
3,X Y X Y,
( X,Y)
为 的混合策略,为 的混合策略,选定 和则称 为一个 混合局势 。
**1 2 1 25,( S,S,E ) ( S,S,A )*用G 表示G 的 混合扩充 。
6.混合扩充的解与值
*
**
*
*
* * *
* * * (,) (,) (,) *
(,),
(,),
G
E X Y E X Y E X Y
V E X Y
X Y G

G的值 满足
G的解 也称 在混合策略意义下的解式分析 *式:
* * * *
* * * *
*
11 1 1
**
1
*
1
(,) (,) (,)
(,)
( )
T
n
m
m m n n
E X Y E X Y E X Y
E X Y X A Y
yaa
xx
aa y






分析左式:
*
11
**
1
*
*
1
1
*
(,) ( )
( )
T
m
m n
m
m
Ay
E X Y X AY x x
A y
AY
xx
AY











也可以写成:
11 1
1
n
m m n
aa
aa




*ny*1y
mx
1x
**
11
**
mm
x AY
x A Y
* XY? 已固定,将在中选,使得收益最大
*11 x A Y
* mmx A Y
进一步:
**
11
**
mm
x AY
x A Y
**i GA Y V?中必有每个
*0
*
*
0 <0i G i
G
i A V X
V
0而 且 若 有 某,使 Y,则 必 有 = 。 否 则,
可 能 得 到 比 更 小 的 损 失,矛 盾 。
*
* T
jGV X A?
对右半式也可作类似的分析,可得
*00
*0
*,0 1 0,
ii G
i G
A V X
VV

因为若有某个 Y,则 出 即取 =( )
此时 矛盾。 0
i
性质 1:
*
11
1
i
T
jG
mn
ij
ij
A Y V
V V V X A V
xy





二、性质性质 2:松紧定理
**
**
( ) 0
( ) 0
T
T
X V AY
V X A Y


V
V
V





其中例 4:猜手游戏
0 1 1
1 0 1
1 1 0
A




该对策问题无纯策略最优,
在混合策略下求解:
解,由性质 1
T
A Y V
X A V


可假设 X,Y的所有分量均为非零,则左式等号成立
2 3 2 3
1 3 1 3
1 2 1 2
11
ii
y y V x x V
y y V x x V
y y V x x V
yx








-

** 111( ) 0
333X Y V解得,
,,1
,,1
ij k j i k
ik
ij il j l
jl
A i k a a j n
A l a a i m






定义:
若 中第 行有 称 优超于 。
记若 中第j 列有 称 优超于 。
记性质 3:
' ' ' '
1 2 1 2
' ' '
1 1 2 2
G (,,) (,,)ik
k
S S A G S S A
S S S S A A k

若 中,,构 造 新 的其 中 是 去 掉,=,是 中 去 掉 行,则,
'
'* ' * * * * * *
1 1 1
* * * * *
1 1 1
( )
( 0 )
G G
k k m
k k m
VV
y y X x x x x
X x x x x



若,
则,,


例 5,用优超原理求解下列对策
1 0 3 4
- 1 4 0 1
2 2 2 3
0 4 1 1
A






1 0 3 4
- 1 4 0 1
2 2 2 3
0 4 1 1






13
14
1 0
-1 4
2 2
0 4






31
32
22
04


12
2
0


34
2() 'A?
*
'
31
*
A m in m a x m a x m in 2,,
( 0,0,1,0 ),( 1,0,0,0 ),2
ij ij G
jjii
G
a a V
YV

*
对于 即对策解是( ) 2 。
根据性质3,则X
性质 4:
21
1 1 2 1 2 1 2 2 1
2 1 2
(,,),(,,),( ),
( )
ij
ij G G
G S S A G S S A A a
A a d G G V V d

则:,同解,并且
21
1 1 2 1 2 1 2 2 1
2 1 2
(,,),(,,),( ),
( )
ij
ij G G
G S S A G S S A A a
A k a G G V k V

则:,同解,并且性质 5:
三、基本定理与 LP解法定理 2:
* * * *
**
(,) (,) m a x m in (,) m in m a x (,)
(,)
YYXX
G
X Y E X Y E X Y E X Y
XY

在混合策略下有解这里 也可称为混合意义下的鞍点。
1
1
m a x
( ),,
1,0
m
ij i
i
m
ii
i
V
a x V
P s t
xx


对于 它追求的是
1
1
m in
( ),,
1,0
n
ij j
j
n
jj
j
V
a y V
D s t
yy

对于 它追求的是
1
1
1
1
*
( P ) ( D ) L P ( 1,0,,0 ),m i n
P ( 1,0,,0 ) m a x D
L P ( P ) ( D )
T
j
jn
T
i
in
X V a
Y V a



是互为对偶的一对 。显然,
是( )的一个可行解。 =,是( )的一个可行解。由 的性质,均有最优解,且最优值V相等。
** * *12
T
ij GG A Y V X A由性质,,的解和值应满足证:
基本定理,G在混合扩充中一定有解。
LP解法:
基本定理的证明过程同时给出了矩阵对策的 LP解法 。
12( 1 ),,L PG S S A 由 =( )构造 和 的
1
1
m a x
,,
1,0
m
ij i
i
m
ii
i
V
a x V
st
xx



1
1
m in
1
..
0
m
i
i
m
ij i
i
i
X
aX
st
X


i
i
xX
V?令
1
1m
ii X V
1
1
max
1
..
0
n
j
j
n
ij j
j
j
Y
aY
st
Y

1
1
m in
..
1,0
n
ij j
j
n
ii
j
V
a y V
st
yy


j
j
yY
V?令
1
1n
jj Y V
**
* * * *
**
11
( 2) L P,
11
,,
ij
i i j jmn
ij
ij
XY
V x VX y VY
XY



求解两个 中的一个,可同时得,则
**
*
A
- - - -
,,,
- - - - - - - -
-
--
ab
cd
d c a b d b a c
XY
a b c d a b c d a b c d a b c d
a d b c
V
a b c d




注,对于矩阵A为2 2 阶的简单情形,记 = 则
( ) = ( )

例 6:
**
3 1 2
A 2 1 2,(,,)
1 3 1
S D A




*设,= 求解G 。
'03
40 A


先应用优超原理化简 A
' ' ' '12(,,)G S S A?现先求解
2 1 2
1 3 1


313 1 2
2 1 2
1 3 1



21
1 2
3 1


1ija?
解法一,
12
2
1
12
m a x ( )
3 1
.,4 1
,0
YY
Y
s t Y
YY



''
''1 1 1 1 1 1 1 7( ),,
4 3 3 4 4 3 1 2
TT
YX
YX
V

用单纯形法求解得到 及其对偶解,
()*
*
**
12 1 1 4 3
( 0 ) ( 0 )
7 3 4 7 7
12 1 1 3 4
( 0 ) ( 0 )
7 4 3 7 7
12 5
1
77
TT
TT
X
Y
GV



最优策略的值
*,Y?求 的最优策略 即求解线性规划问题:
解法二,2× 2矩阵可以直接按公式计算:
'
'
'
- - 4 3
,
- - - - 7 7
- - 3 4
,,
- - - - 7 7
- 12
- - 7
T
T
d c a b
X
a b c d a b c d
d b a c
Y
a b c d a b c d
ad bc
V
a b c d




( )( )
( )( )

' ' '12(,,)S S A对于
**12(,,)S S A所以对于
* * *4 3 3 4 1 2 50,0,1
7 7 7 7 7 7
TTX Y V( ) ( )
'03
40 A