第十二章 二人有限非零和(双矩阵)对策一、双矩阵对策及其特性
1 1 2 2 1 2
12
{,},{,}
[ ] [ ]
(,,( ) )
mn
ij m n ij m n
ij ij i j
SS
A a B b
ab
G S S A B







设 二 人 有 限 非 零 和 对 策 问 题 的 局 中 人 为 和,策 略集 分 别 为,,,,,
= 和 = 分 别 为 和 的 支 付 矩 阵,其 中
,分 别 为 和 相 应 于 和 的 赢 得 。 双 矩 阵 对 策记 为,。
*
11
1
*
21
1
{ ( ) | 1,0 }
{ ( ) | 1,0 }
m
m i i
i
n
n i i
i
S X x x x x
S Y y y y y


混 合 策 略 集混 合 策 略 集的的
0AB 时,双矩阵对策即化为矩阵对策。


在 矩 阵 对 策 中,由 于 的 得 就 是 的 失,二 人处 于 完 全 竞 争 的 非 合 作 状 态 。 而 在 双 矩 阵 对 策 中,
由 于 的 得 并 不 一 定 等 于 的 失,二 人 可 以 同 时 得,
故 二 人 之 间 可 能 合 作,从 而 得 到 更 多 的 利 益 。
二,非合作双矩阵对策
1.解的概念与存在性定理平衡局势:
* * * * * *
1 2 1 2
* * *
* * *
**
,,
(,)
T
TT
T
X S Y S X S Y S
X A Y X A Y
X B Y X B Y
X Y G

设 若 对 任 何 和 任 何,
有则 称 为 双 矩 阵 对 策 的 平 衡 局 势 。
**
* * * * * *
,
(,) (,)TT
XY
X A Y X B Y G U V
平衡局势( )对应的二局中人的期望收益就是 的值,记为 。
定理 1:任何双矩阵对策至少存在一个平衡局势。
**
* * * * * *
,
[]
m a x
,,
1
,0
,1
T
TT
n
T
m
TT
mn
mn
X Y G
p q X Y p q
X AY X BY p q
AY pE
X B qE
st
E X E Y
XY
EE




( )为双矩阵对策 的一个平衡局势的充要条件是存在数 和 使是下述问题的一个解:
()
其中 为分量为的向量。
定理 2:
2,2× 2双矩阵对策的解法当 A和 B均为 2× 2阶时,
相应的双矩阵对策可表示为,
1 1 1 1 1 2 1 2
2 1 2 1 2 2 2 2
(,) (,)
(,) (,)
a b a b
a b a b


1y 11 y?
11 x?
1xI
II
11( 0 1,0 1 )xy
* * * *
* * * *
12
(,)
TT
X Y X Y
X A Y S X B Y S
若 是 均 衡 局 势,由 平 衡 局 势 的 定 义,和 应分 别 是 在 上 和 在 上 的 极 大 点 。
1 1 1 2 1 1 1 2
2 1 2 2 2 1 2 2
,,a a b bAB
a a b b



*
1 1 1 2 1*
11 *
2 1 2 2 1
**
1 1 1 2 2 1 2 2 1 2 2 1 2 1 2 2 2 1 2 2 1
1
1
( ) ( ) ( )
T
a a y
X AY x x
aa y
a a a a y a a x a a a y






1 1 1 1 2 2 1 2 2
2 2 2 1 2
A a a a a
A a a



**
1
*
1 1 2
**
1 1 1 2
*
1 1 2
0,0
[ 0,1 ],0
1,0
T
X A Y x
A y A
x A y A
A y A



则 使 达 到 极 大 的 应 满 足当中 任 意 值 当当
( 1)
1 1 1 2 1* * *
11
2 1 2 2 1
**
1 1 1 2 2 1 2 2 1 2 2 2 1 1 2 2 1 2 2 2 1
b
1
b 1
( ) ( ) ( )
T by
X B Y x x
by
b b b b x b b y b b b x




1 1 1 1 2 2 1 2 2
2 2 2 2 1
B b b b b
B b b



**
1
*
1 1 2
**
1 1 1 2
*
1 1 2
0,0
[ 0,1 ],0
1,0
T
X B Y y
B x B
y B x B
B x B



则 使 达 到 极 大 的 应 满 足当中 任 意 值 当当
( 2)
11
*
11
* * *
1 1 1 1
12
12
( 1 ) ( 2 ) x y
()
( x,y ) (
) ( x,y ) ( x,y )
9 ( A A
B B 9 )
根 据 式 和 式,可 在 以 和 为 横,纵 轴 的 坐 标 系 中 确定 出 对 局 中 人 I 来 说 可 能 成 为 平 衡 局 势 的 点 不 妨 称 为 I 的 解的 轨 迹 和 对 于 局 中 人 II 来 说 可 能 成 为 平 衡 局 势 的 点 不 妨称 为 II 的 解 的 轨 迹 。 二 轨 迹 的 公 共 点 即,由 此 便可 得 到 平 衡 局 势 。 将 这 一 分 析 的 结 果 各 分 为 种 情 形 即 和,
和 取 各 种 符 号 时 的 种 条 件,如 下 表 所 示,
图示解条件条件序号
1x
1y
1
1
0
1x
1y
1
1
0
1x
1y
1
1
0
1x
1y
1
1
0
101x
101y
101y
1 0x?
101y
1 1x?
10 1,x 1 0y?
101y1 1,x?
1
4
2
3
1
2
0
0
A
A
1
2
0
0
A
A
1
2
0
0
A
A
1
2
0
0
A
A
1x1y01y01x1y010,x21A10111,x?
110,x?
697812A?120A?1
20A120A
5120A10?y10,x0,1?1,2
21Ay10,x21?11,x,21
,
图示解条件条件序号
1x
1y
1
1
0
1x
1y
1
1
0
1x
1y
1
1
0
1x
1y
1
1
0
101x
101y
101x
1 0y?
101x
1 1y?
101x1 1,y?
10 1,y 1 0x?
1
4
2
3
1
2
0
0
B
B
1
2
0
0
B
B
1
2
0
0
B
B
1
2
0
0
B
B
21B 1x1y10 1x1y10
1x1y10 1x1y10
10,y21 10Bx
101x11,y? 1x10,y?
6
9
78 120B?
120B
5 120B 10,y?10,y 10x?10,y? 21
1xB?11,y? 211By
21 10Bx10,y? 211x?11,y? 211 1Bx10,y
1x1y10
120B?1
20B 21B
101x
总结 2× 2双矩阵对策的求解步骤
( 1)由 计算1 1 1 2 1 1 1 2
2 1 2 2 2 1 2 2
,,a a b bAB
a a b b


1 1 1 1 2 2 1 2 2
2 2 2 1 2
A a a a a
A a a

1 1 1 1 2 2 1 2 2
2 2 2 2 1
B b b b b
B b b


( 2)根据 Ai和 Bi的符号,得到 I和 II的解,其公共点即对策的解。
例 1:( 夫妇之争 )夫妇俩商量晚上去哪里消遣。丈夫喜欢看足球比赛,而妻子喜欢去看芭蕾舞表演,夫妇都希望二人同往。
1 2 1 1
12
11
( ) ( ) ( 1 )
()
( 1 - ),
xx
yy


解 现 将 问 题 归 为 一 个 双 矩 阵 对 策 。 记 丈 夫 为 局 中 人 I,
其 策 略 为 看 芭 蕾,看 足 球,相 应 混 合 策 略 ;
妻 子 为 局 中 人 II,其 策 略 为 看 芭 蕾,( 看 足 球 ),相 应混 合 策 略 设 得 失 矩 阵 为,
(1,4 ) (0,0 )
(0,0 ) ( 4,1 )


I
II
(,)ij iji j a b矩 阵 中 位 于 第 行 列 的 括 号 即
1 0 4 0,
0 4 0 1AB


2
12
1
2
12
1
4
1 0 0 4 5,4 0 4,
5
1
4 0 0 1 5,1 0 1,
5
A
AA
A
B
BB
B


11
11
11
4
0,0
5
4
1,1
5
4
0 1,
5
xy
xy
xy



丈 夫 的 解,
11
11
11
1
0,0
5
1
0 1,
5
1
1,1
5
yx
yx
yx



妻 子 的 解,
1x
1y
1
1
0
45
1x
1y
1
1
0
15 15
1x
1y
1
1
45
A
C
B
**
* * * * * *
(,) ( [ 0 1 ],[ 0 1 ] ),
( 4,1(,) (,),)TT
TTXY
U V X Y B
A
A X Y

点 对 应 平 衡 局 势 即 两 人 同 去 看 球,相应 得 失 值 丈 夫 得 到 最 大 满 足 。
**
**
1 4 4 1
(,) ( [ ],[ ] ),
5 5 5
44
(,)
5
5
,),
5
(
TT
XY
UV
B?
点 对 应 平 衡 局 势 即 两 人 均 以 一 定的 概 率 选 择,相 应 得 失 值 满 意 度 得 到 均 衡,
但 却 都 降 低 了 。
**
* * * * * *
(,) ( [ 1 0 ],[ 1 0 ] ),
( 1,4(,) (,),)TT
TTXY
U V X Y B
C
A X Y

点 对 应 平 衡 局 势 即 两 人 去 看 芭 蕾,相应 得 失 值 妻 子 得 到 最 大 满 足 。
★与矩阵对策不同,双矩阵对策的不同的解对应不同的值 。
例 2:( 囚犯两难推理 )两名囚犯 I和 II因涉嫌抢劫被捕。警方 因证据不足先将二人分关二室,并宣布:若二人均不坦白,则只能因藏有枪支而被判刑 1年;若有一人坦白而另一个不坦白,则坦白者无罪释放,不坦白者被判刑 10年;若二人都坦白了,则同判 9年。此二人确系抢劫犯,请分析他们的抉择。
解 将 此 问 题 看 做 如 下 的 双 矩 阵 对 策 问 题,
II
( 9,9 ) (0,1 0 )
( 1 0,0 ) ( 1,1 )


I
坦白坦白不坦白不坦白
9 0 9 1 0,
1 0 1 0 1AB


129 0 ( 1 0 ) ( 1 ) 0,1 0 1
9 ( 1 0 ) 0 ( 1 ) 0,1 0 1
AA
BB


囚犯 I的解,;囚犯 II的解:
101y( )1 1x? 101x( )1 1y?
1x
1y
1
1
0 1x
1y
1
1
0
**
**
( 1,1 ) (,) ( ( 1,0 ),( 1,0 ) )
(,) ( 9,9 ),9
XY
UV

公 共 点 对 应 的 均 衡 局 势 为,
即 二 人 都 坦 白,即 二 人 均 被 判 年 。
若 允 许 二 人 通 话,那 么 结 果 会 怎 样?
三,合作的双矩阵对策
1.合作思路 ——采用联合随机策略在非合作的夫妇之争的例子中,若夫妇希望在得失值
( 4,1)和( 1,4)中权衡,即协商选择概率,及期望得失值:
( 1,4 ) ( 1 ) ( 4,1 )
( 实 际 可 看 作 是 每 次 行 动 中 采 用 的 几 率 ),
称 这 样 的 合 作 问 题 为 采 用 联 合 随 机 策 略 的 双 矩 阵 对 策 。
2.合作的可行收益区域
(,)UV设 局 中 人,的 期 望 收 益 为,以 夫 妇 之 争 为 例,在非 合 作 的 情 形,丈 夫 的
1
1 1 1 1 1 1
1
10(,1 ) 5 4 4 4
0 4 1
yU x x x y x y
y


妻 子 的
1
1 1 1 1 1 1
1
40(,1 ) 5 1
0 1 1
yV x x x y x y
y


1 1 1 1[0,1 ]
,”
x y U V x y
UV
当 和 在 上 变 动 时,相 应 的 - 平 面 上 的 点 ( 如 当 = = 1 时,
(,) = ( 1,4 ) ) 构 成 非 合 作 对 策 的 可 行 收 益 区 域,如 图,
11
11
22
11
,[ 0,1 ] 4 0
1
0 3 3 3,
4
( ) 6( ) 9 9( ) 0
x y V U
V U U V x y
U V U V x y



事 实 上,当 时,有,
,二 式 相 减 得即表 示 抛 物 线 的 外 侧 。
( 1,4) ( 1 ) ( 4,1 )
1 / 2,2.5,2.5
1 / 3,3,2
AB


而 在 合 作 时,表 示连 接,的 线 段,
当 相 应 于 ( )
当 相 应 于 ( )
说 明 合 作 时 的 可 行 收 益 域 大 于 非 合 作 时 的,且 可 使 双 方得 到 更 好 的 收 益 。
(1,4)A
(4,1)B
4
40 U
V
(1,4)A
(4,1)B
4
40 U
V
**(,)?UV如 何 在 域那 么,接 下 来 的 问 题,
内 找 最 优 的是直 观 上,哪 一 段 上 的 点,最 好,
— — AB线 段
' ' ' '(,),U V U U V V
AB
因 为,找 不 到 另 外 的,使 得 且 且 至少 有 一 严 格 成 立 。 而 上 的 点 之 间 不 可 比 较,和 多 目 标规 划 有 效 解 的 概 念 类 似 。
(1,4)A
(4,1)B
4
40 U
V
3.Pareto最优点与 Nash谈判集
(1) Pareto最优点
''
''
(,),) (,)
(,) P a r e t o
U V U V U V
U U V V U V

对 于 可 行 收 益 域 中 的 点,若 不 存 在 (
使 得 且,则 称 为 对 策 的 最 优 点 。
几何意义:可行收益域的“东北方”边界。
显然,双方感兴趣的点至少是 Pareto最优。此外,双方还自然要求收益不低于在不合作时自己保证能得到的水平,即
**
21
**
12
01
02
m a x m in (,)
m a x m in (,)
YSXS
XSYS
U U E X Y
V V E X Y




1
2
(,)
(,)
T
T
E X Y X A Y
E X Y X B Y
00(,)UV 称 为 安 全 点,表 示 收 益 的,下 限,。
(2) Nash谈判集
00 Pa r e to (,)U U V V U V满 足 且 的 点 的 全 体 。
显然,最优点应从 Nash谈判集中产生,称为 Nash谈判解。
A
B
0 U
00,UV( )
V
4.Nash谈判解的计算
⑴ Nash谈判公理
**
**
**
Na sh (,),
(,) ( Na sh )
Na sh (,) 6
UV
U V P
UV
为 了 从 谈 判 集 中 寻 找 使 双 方 可 达 成 协 议 的 解记 所 有 可 能 成 为 的 可 行 解 的 集 合 为 可 即 谈 判 集给 出 了 的 个 公 理,
** 001,U U V V( 下 限 要 求公 ),理 。
**( 2,)U V P?( 可 行 性,公 )理 。
**
**
3 P a r e t o (,),,
,
U V P U U V V
U U V V
( 最 优 性 ),若 有 使则 = =
公 理

'
''
**
00
* * '
00
,(,0)
(,) (,)
(,),)
5
(
PP
U a U b V c V d a c
P U V U V P
a U b c V d P a U b c V d


( 线 性 变 换 不 变 性 ),设 是 从 经 线 性 变 换后 得 出 的,若 有 安 全 点,是 中 的 解,则是 的 以 为公 理安 全 点 的 解 。
**
00
( (,) (,) )
,
6 P U V P V U P
U V U V


( 对 称 性 ),若 是 对 称 的 若,则且 则公 理

11
* * * *
11
,
(,) (,),
4 P P P P
U V P U V P P
( 无 关 方 案 可 去 性 ),若 有 与 有 相 同 的 安 全 点,
是 中 的 解,只公 理要 则 它 也 是 中 的 解 。
说明:公理 5表明局中人的得失值是用美元还是英镑记价不影响解;公理 6表明局中人实力旗鼓相当则收益等。
⑵ Nash谈判解的求取
00
* * * *
00
N a s h (,)
(,) ( (,),) (,)
P U V
U V U V P U V
规 定 了 上 述 定 理 后,证 明 了 存 在 唯 一 的 从 和到 的 映 射 ( 称 仲 裁 程 序 ) 。
定 理 考 虑 下 面 的 仲 裁 程 序,
00
**
00
**
00
(,) >,,(,)
(,) ( ) ( ),(,)
( (,),) (,) ;
P U V U U V V U V
f U V U U V V f U V
U V P U V?

若 中 有 点 满 足 则 对 所 有 这 样 的定 义 将 在 唯 一 的 点 上达 到 最 大 值,于 是 定 义

0 0 0
*
0 0 0 0
**
0 0 0 0
*
0 0 0
(,) >,,(,)
(,) m a x (,),
m a x (,),( (,),) (,)
( (,),) (,)
U
V
P U V U U V V P U V
U U P U V V V U U V
V U V U V P U V
U V P U V


若 中 没 有 点 满 足 则 或 者 中 有 点 满 足
,或 者 中 有 点 满 足,记于 是 对 前 者 定 义,对 后 者定 义 。

16?上 述 定 义 的 满 足 公 理 - 且 唯 一 。
N a s h该 定 理 称 为 定 理,其 直 观 意 义,
**00
(,)m a x ( ) ( ) (,)UV U U V V U V由
*00m a x (,) (,)
V U V U V?由
*00m a x (,) (,)
U U V U V?由P
求解合作双矩阵对策 Nash谈判解的步骤:
00
1 1 2 2 1 2 2 1 1 1 2 2 1 2 2 1
00
1 1 1 2 2 1 2 2 1 1 1 2 2 1 2 2
(,) 2 2
,
A B U V A B
a a a a b b b b
UV
a a a a b b b b



由 双 矩 阵 和 求 安 全 点,当,为 阶 时,可 由求 得 。

00(,)
**
m a x (,) m a x (,) m a x (,)
(,)
U V U V
f U V f U V f U V
UV
若 不 存 在,则 用 或求 。

**
00N a s h (,) ( ) ( ) (,)
N a s h S h a p l e y)
f U V U U V V U V在 谈 判 集 中,求 的 最 大 点即 谈 判 解 ( 也 称 最 大 最 小 解 或 沙 普 利 ( 解 ) 。

P a r e t o N a s h求 出 最 优 点 集 和 谈 判 集 。③
2 2 (,)ij ijab?求 出 可 行 收 益 域,对 阶,即 以 为 顶 点 的 四 边 形 。

例 3,合作的夫妇之争
( 1,4 ) (0,0 )(,)
(0,0 ) ( 4,1 )AB


解 可行收益域如图,安全点:
0
0
1 4 0 0 4
1 0 0 4 5
4 1 0 0 4
4 0 0 1 5
U
V






(4,1)A
(1,4)B
0 U
V
Nash谈判集为 AB。
过 AB的直线表达式为:
41
1 4 4 1
VU

5VU即
2
4 4 4 4
(,) ( ) ( ) ( ) ( 5 )
5 5 5 5
84
5
25
f U V U V U U
UU


' * * *552 5 0,,5
22Uf U U V U令
** 1(,) N a s h
2UV即 为 谈 判 解,相 应 于 的 合 作 随 机 策 略 。
(4,1)A
(1,4)B
0 U
V
·
( 1,2 ) ( 4,5 )(,)
(7,1 ) ( 3,0 )AB


例 4,求 的 Nash谈判解解 可行收益域如图,Pareto点集为 AD,安全点为
0
0
1 3 4 7 4
3
1 4 7 3 7
2 0 5 1 1
1
2 1 5 0 4
U
V






(1,2)B
0 U
V
(4,5)A
(3,0)C
(7,1)D
31( 6,1 )
16 4E
Nash谈判集为 AE。
过 AD的直线表达式为:
54
1 5 7 4
VU

4 3 1
33VU即
2
4 1 4 4 3 1 1
(,) ( 3 ) ( 1 ) ( 3 ) ( 1 )
7 4 7 3 3 4
4 3 4 8 9 2 7 2 5
3 2 5 2 8 4
f U V U V U U
UU


' * *0,5,2,3,4Uf U V令 解 得
(1,2)B
0 U
V
(4,5)A
(3,0)C
(7,1)D
31( 6,1 )
16 4E
附注 多人对策简介 ——多人不结盟对策
1.解的概念
*
1
*
* * * * * *
1 - 1 1 1
**
1
{ } (,,),
,
(,,,,,,) (,,),
(,,)
i i i n
ii
i i i i n i n
n
i S x E x x
xS
E x x x x x E x x
xx
设 局 中 人 的 混 合 策 略 集 为,得 失若 对 任 有则 称 为 对 策 的 最 优 局 势 或 平 衡 局 势 。
2.存在性定理定 理,任 何 多 人 不 结 盟 对 策 至 少 有 一 个 最 优 局 势 。