第二十一章
博弈论
? 版权所有:夏纪军 2003
保留所有权利
上海财经大学 经济学院
第二十一章 对策论 Slide 2
博弈论
? 博弈论的发展
?早期的探索
? Waldegrave (1713),Cournot (1838),Zermelo( 1913)、
Borel( 1921-27)等
? 基本框架的形成
? John von Neumann and Oskar Morgenstern (1944)
—— Theory of Games and Economic Behavior
第二十一章 对策论 Slide 3
博弈论
? 合作博弈与非合作博弈
?合作博弈:参与者之间可以达成一个 可信的
联盟,大家选择一个联合战略。
?非合作博弈:参与者之间不能达成可信的联
盟,各自根据自身效用最大化来行动。
第二十一章 对策论 Slide 4
博弈论
? 例:古诺竞争
合作解:合谋均衡
非合作竞争解:古诺均衡
第二十一章 对策论 Slide 5
博弈论
? 非合作博弈理论的发展
?Nash( 1950):纳什均衡
?Selton( 1960):子博弈精练均衡
?动态博弈与不可信威胁
?Harsanyi( 1967-68):贝叶斯纳什均衡
?不完全信息与信念的形成
—— 1994年若贝尔经济学奖
第二十一章 对策论 Slide 6
博弈论
? 非合作博弈分类
完全信息 不完全信息
静态
(同时行动)
完全信息静态博
弈 不完全信息静态博弈
动态
(序贯行动)
完全信息动态博

不完全信息动态博弈
信息
时间
第二十一章 对策论 Slide 7
纳什均衡
? 博弈的表述(博弈结构)
?参与者:有谁参与?
?行动顺序:按什么顺序行动?
?战略集:当 i行动时可以选择哪些行动?
?信息集:当 i行动时知道什么?
?支付函数:给定每个人的选择后,每个参与
者能够得到什么?
第二十一章 对策论 Slide 8
纳什均衡
? 标准式博弈
—— 完全信息静态博弈
?单个要素:参与者、纯战略集,支付函数

?支付矩阵
(-1,-1)
(-9,0)
(0,-9)
(-6,-6)
囚徒困境 沉默
招认
招认 沉默
囚徒 1
囚徒 2
},.,,1),,.,,(,{ 1 nissuSG nii ??
第二十一章 对策论 Slide 9
纳什均衡
? 如何预测博弈的结果?
第二十一章 对策论 Slide 10
纳什均衡
? 占优战略( Dominant Strategy)
?战略 是参与者 i的 占优战略,如果对于任
意其他可行的战略,对于其他参与
者的每一个战略组合,i选择 的收益都不
小于选择 的收益。
is?
ii Ss ???
is?
is?
—— 理性的参与者一定会选择占优战略
),(),( iii ssussu ii ?? ???? iiii SsSs ?? ?????,
第二十一章 对策论 Slide 11
纳什均衡
? 占优战略
(-1,-1)
(-9,0)
(0,-9)
(-6,-6)
囚徒困境
沉默
招认
招认 沉默
囚徒 1
囚徒 2
(招认,招认)
第二十一章 对策论 Slide 12
纳什均衡
? 不存在占优战略,性别博弈
音乐会 足球
音乐会
足球
( 0,0 )
( 0,0 )
( 1,2 )
( 2,1 )


第二十一章 对策论 Slide 13
纳什均衡
? 纳什均衡
?逻辑:从参与者的资源选择理论到处他们的
最优战略。
?均衡的性质:每个参与者选择的战略一定是
针对其他参与者战略选择的最优反应。
—— 具有 战略稳定性,即,没有一个参与者愿意独自偏离他所选择的战略。
第二十一章 对策论 Slide 14
纳什均衡
? 纳什均衡(定义)
?战略组合 是一个纳什均衡,如果
,对于每一个参与者都有,
)..,,..,( ***1 nsss i
),(),( *** iii ssussu ii ?? ?? ii Ss ???
第二十一章 对策论 Slide 15
纳什均衡
? 纳什均衡
(-1,-1)
(-9,0)
(0,-9)
(-6,-6)
囚徒困境
沉默
招认
招认 沉默
囚徒 1
囚徒 2
(招认,招认)
第二十一章 对策论 Slide 16
纳什均衡
? 基本假设
?参与者都知道博弈结构,而且知道其他参与
者也都知道博弈结构 ……
?参与者都知道其他参与者是理性的,知道别
人知道自己是理性的 ……
第二十一章 对策论 Slide 17
纳什均衡
? 共同知识( Common Knowledge)
?我们说知识 M是共同知识,如果每个参与者
知道 M,参与者知道, 每个参与者知道 M”,

第二十一章 对策论 Slide 18
纳什均衡
? 私人信息,
?在博弈结构中或在博弈开始前,参与者 i的
私人信息是指他知道,但不是所有参与者的
共同知识。
? 完全信息,没有私人信息的博弈结构
? 不完全信息,存在私人信息的博弈结构
第二十一章 对策论 Slide 19
纳什均衡
? 例:古诺竞争
?成本信息
第二十一章 对策论 Slide 20
纳什均衡
? 信息,
?决策相关信息 ?支付相关信息
? 不完全信息,
?有些参与者不知道其他参与者的支付函数
第二十一章 对策论 Slide 21
纳什均衡
? 纳什均衡,
—— 均衡的多重性
? 均衡的选择问题
?习惯、社会习俗等
性别博弈 音乐会 足球
音乐会
足球
( 0,0 )
( 0,0 )
( 1,2 )
( 2,1 )


第二十一章 对策论 Slide 22
纳什均衡
? 纳什均衡,
—— 均无穷个纳什均衡
分饼博弈,
有一单位财富在两个人之间分配,两人同时提出自己的份额 si
如果 s1+s2<=1,那么都得到索要的部分。
如果 s1+s2>1,那么两个人都一无所获 。
第二十一章 对策论 Slide 23
纳什均衡
? 纳什均衡,
?不存在纯战略纳什均衡
(-1,1)
(1,-1)
(1,-1)
(-1,1)
正面
背面
正面 背面
猜硬币
第二十一章 对策论 Slide 24
纳什均衡
? 混合战略
?参与者 i的一个混合战略是指在其纯战略空
间 中的一个概率分布。
iS
—— 确定选采取某一个纯战略的概率。
}{ 正面,背面?iS
)1,( ppi ???
混合战略,
]1,0[?p
纯战略空间,
第二十一章 对策论 Slide 25
纳什均衡
? 纳什均衡,
?混合战略
(-1,1)
(1,-1)
(1,-1)
(-1,1)
正面 (z)
背面 (f)
正面 (z) 背面 (f)
猜硬币
参与者 i 选择正面的概率为 P
参与者 j 选择正面的概率为 q
参与者 1
参与者 2
),z()1(),z(),( 111 fuqpzpquqpu ???
),()1)(1(),()1( 11 ffuqpzfqup ?????
参与者 1的期望收益,
第二十一章 对策论 Slide 26
纳什均衡
? 纳什均衡
?混合战略
)1)(1()1()1(),(1 qpqpqppqqpu ????????
1422 ???? pqqp
pMax
最优反应函数,
?
?
?
?
?
?
0
]1,0[
1
)( qp
5.0?q
5.0?q
5.0?q
第二十一章 对策论 Slide 27
纳什均衡
? 混合战略
1/2
1/2
p
q
)(qp
)( pq
猜硬币
)5.0,5.0(),( ** ?qp
第二十一章 对策论 Slide 28
纳什均衡
? 练习 2:监督博弈:求解纳什均衡
努力
偷懒
监督 不监督
(0,-h )
( W - g,V - W - h ) ( W - g,V - W )
( W,- W )
代理人
委托人W>g>h
W=10,g=5,h=3,v=15
第二十一章 对策论 Slide 29
完全信息动态博弈
? 例:敲诈博弈
?博弈分两步,1、参与者 1选择支付 1000¥给
参与者 2,好事一分不给。
2、参与者 2在看到 1的选择后,
选择是否引爆手雷把两人一块炸死。
? 参与者 2的威胁:不给就引爆 —— 是否可信?
第二十一章 对策论 Slide 30
完全信息动态博弈
? 例:敲诈博弈 给
不给
( R,R )
参与者 1
参与者 2
( 0,1 0 0 0 ) ( 0,1 0 0 0 )
( R,L ) ( L,R ) ( L,L )
),( ???? ( 1 0 0 0,0 ) ( 1 0 0 0,0 )
),( ???? ),( ????
),( ????
参与者 1的战略空间,{给,不给 }
参与者 2的战略空间,{(R,R),(R,L),(L,R),(L,L)} R:不拉; L:拉
第二十一章 对策论 Slide 31
完全信息动态博弈
? 扩展式博弈
?博弈树
博弈树
1、结点:决策结
终点结
2、枝:可行行动
3、信息集
第二十一章 对策论 Slide 32
完全信息动态博弈
? 敲诈博弈,
参与者1
给 不给
参与者 2
R RL L
0
1000
1000
0
??
??
??
??
敲诈博
完美信息,
—— 后动者能够观察到先动者的行为
第二十一章 对策论 Slide 33
完全信息动态博弈
? 囚徒困境
囚徒1
沉默 坦白
囚徒 2
沉默坦白 坦白
-1
-1
0
-9
沉默
-9
0
-6
-6
不完美信息,
—— 不能观察到他人的行为
第二十一章 对策论 Slide 34
完全信息动态博弈
? 逆向推理
A
B C
D E
5
10
7
2
8
1
2
10
7
2
2
5
1、求最后决策者在给定结点上
的最优选择
2、给定最后决策者的选择,分
析最后第二格决策者的最优选择
……
最后由初始结点上的决策者决定
最终结果
第二十一章 对策论 Slide 35
完全信息动态博弈
? 子博弈精练均衡(非正式定义)
?由逆向推理得到的均衡解为子博弈精练均衡
—— 不包含不可置信威胁的纳什均衡
第二十一章 对策论 Slide 36
完全信息动态博弈
? 子博弈精练均衡
参与者1
给 不给
参与者 2
R RL L
0
1000
1000
0
??
??
??
??
敲诈博弈
第二十一章 对策论 Slide 37
完全信息动态博弈
? 例:序贯谈判 I:最后通牒博弈
提议着1
I II
回应者 2
A AR R
9
1
5
5
0
0
0
0
1、先由提议者提议其中一种分配方案
2、回应者看到提议后,决定是否接受
该提议,如果接受则岸提议方案分配,
如果拒绝,双方都得到 0。
双方通过谈判决定 10单位财富的分配
第二十一章 对策论 Slide 38
重复博弈
? 重复博弈
?将, 阶段博弈, 重复进行
?一个, 阶段博弈, 构成一个完整的博弈
结构阶段博弈完成后得到相应的支付。
G
第二十一章 对策论 Slide 39
重复博弈
? 重复博弈
?考虑, 未来行动的威胁或承诺能否影响当前
行动?,
—— 关键在于未来行动的威胁或承诺是否可信
如:价格战威胁、合谋承诺
第二十一章 对策论 Slide 40
重复博弈
? 重复两次的囚徒困境
以什么来支持或激励对方合作? 背叛
合作
背叛 合作
囚徒 1
囚徒 2
(0,0 ) (1 5,-5 )
(-5,1 5 ) (1 0,1 0 )
第一期
背叛
合作
背叛 合作
囚徒 1
囚徒 2
( 0,0 ) ( 1 5,- 5 )
( - 5,1 5 ) ( 1 0,1 0 )
第二期
逆向推理:第二期合作是否可能?
第二十一章 对策论 Slide 41
重复博弈
? 有限次重复博弈
?如果阶段博弈 有 唯一的纳什均衡,那么
对于 有限次 重复博弈 由唯一的子博弈精
练均衡,即将阶段博弈的纳什均衡在每阶段
重复进行。
G
)(TG
第二十一章 对策论 Slide 42
重复博弈
? 在充重复博弈中实现合作的可能性
?无限重复
?阶段博弈存在多重均衡
第二十一章 对策论 Slide 43
重复博弈
? 无限重复博弈
?冷酷战略:只要对方不背叛就选择合作,如
果对方背叛,那么在随后各期博弈中将永远
选择背叛。
背叛支付
给定参与者 1采取冷酷战略,参与者 2,
150...015)(2 ?????背叛U
合作的支付,
???? ??????? 1
1010.,,101010)( 2
2
nU 合作
3/1??只要参与者 2的贴现因子:,那么参与者 2就有激励合作。
第二十一章 对策论 Slide 44
重复博弈
? 无名氏定理( Friedman,1971)
?设 为阶段博弈 的一个纳什均衡
下的支付组合,表
示 的其他可行的收益组合。如果参与者
的贴现因子足够高,那么无限重复博弈
存在一个子博弈精练均衡,期平均收益可以
达到
),...,,( 21 neee G
?),...,,( 21 nxxx ),...,,( 21 neee
),...,,( 21 nxxx
G
),( ??G
第二十一章 对策论 Slide 45
重复博弈
? 多重均衡
L N R
U
M
D
( 1,1 )
( 0,5 )
( 0,0 ) ( 0,0 )
( 0,0 )
( 0,0 )
( 4,4 )
( 3,3 )
( 5,0 )
参与者 2
参与者 1第一期,( D,R) 第二期,( M,N) 均衡战略,
如果第一期出现背叛,那么第二期选择( U,L)