2006-3-7 1
东北财经大学 数量经济系刘德海 ldhai2001@163.com
博弈论前沿专题
( Advances in Game Theory)
2006-3-7 2
第三章 传统博弈理论的简介复习,
第一章:第一节 博弈论学科的产生、发展和演变过程第二节 博弈论与? 理性? 概念;
第二章:第一节 博弈论的一些重要概念:经验主义,均衡,合作,信息第二节 博弈的基本要素,参与者,行动,策略,支付,规则,环境第三节 博弈模型的三种正规表述:策略式,扩展式,联盟式本章,传统博弈理论的简介,主要内容,
第一节 传统博弈理论的研究范式;
第二节 纳什均衡的定义和几种实现途径;
第三节 纳什均衡的无效率问题:重复博弈和无名氏定理;
第四节 纳什均衡的无效率问题:相关均衡和信号装臵;
第五节 纳什均衡的多重性问题:静态博弈和焦点均衡;
第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡;
第七节 不完全不完美信息下的纳什均衡存在性:贝叶斯均衡;
2006-3-7 3
博弈理论的研究对象,参与者互动过程中冲突与合作问题;
分析思路,
第三章 传统博弈理论的简介第一节 传统博弈理论的研究范式大量情绪、直觉、性格、感觉等 非理性 的主观心理行为知识的未知状态、
不可预测性和多样性等造成不同层次的 有限理性实际行为方式的无序化为了对人们的互动行为加以模型化分析,
必须进行合理的理论抽象产生了博弈论的
,完全理性,概念
2006-3-7 4
第三章 传统博弈理论的简介第一节 传统博弈理论的研究范式
传统博弈理论的研究思路,参与者? 完全理性? 假设下,通过推理演绎达到均衡化过程。均衡是瞬间实现的。
人们行为在完全理性假设下,其行为类比于按照既定程序运行的计算机(即给定博弈的环境和规则,人们的行为严格执行几种可行的策略方案),没有冲动、情绪、直觉等非理性的因素,也不会犯错误(有限理性)。
完全理性的内涵:
信念 采取相应策略 最大化目标相关环境 认知理性 工具理性 目标理性
2006-3-7 5
第三章 传统博弈理论的简介第一节 传统博弈理论的研究范式传统博弈理论的研究内容:
纳什均衡的 存在性( Nash,1950)
纳什均衡的无效率及其解决途径:
无名氏定理,Friedman,1971 ;
相关均衡,Aumann1974;
纳什均衡的多重性及其解决途径:
焦点均衡,Schelling,1960;
子博弈完美均衡,Selten,1965;
在不完全(或不完美)信息下,纳什均衡的存在性;
贝叶斯纳什均衡,Harsanyi,1967
2006-3-7 6
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
1。 纳什 均衡 ( NE) 的 定义
纳什均衡 ( Nash Equilibrium,简记 NE) 的理解,参与者可以直接交换信息并一致同意选择某一策略,虽然这些口头协议无法强制实施,但是每个参与者单独偏离却不会带来更大收益。
双人策略式博弈的纳什均衡描述,策略组合 ( x1*,x2*) 是一个 NE,
当且仅当 x1*是 x2*的最佳应对策略,x2*也是 x1*的最佳应对策略,
双方都没有兴趣偏离此最佳应对的预期,则该策略组合是自动实施的 ( self-enforcing) 。
举例:囚徒困境博弈中,策略组合( P,P)为一个 NE。
-8,-8 0,-10
-10,0 -1,-1
坦白 P
抵赖 NP
坦白 P 抵赖 NP囚徒 A
囚徒 B
2006-3-7 7
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
1。 纳什 均衡 ( NE) 的 定义
一般的定义,策略式博弈( X1,…,X n; u1,…,u n)的一个策略组合
( x1*,…,x n*)是纳什均衡,如果使得下式成立:
u ( xi*,x- i* )≥ u ( xi,x- i* ) 对所有 xi∈ Xi都成立如果上式取严格不等号,则为强 NE。
解释:策略是参与者面向对方选择策略的一个最佳反应,这一点对所有参与者都是如此。
分析方法,划线法 — 分别列出对方选择某一策略时,自己的最佳应对策略;然后找出双方都是最近应对策略的组合,即为 NE。
例如囚徒困境中,NE为( P,P)
坦白 P
抵赖 NP
坦白 P 抵赖 NP囚徒 A
囚徒 B -8,-8 0,-10
-10,0 -1,-1
2006-3-7 8
混合策略 (mixed strategy)的 定义,
策略式博弈( X1,…,X n; u1,…,u n)中,参与者 i的有 K个纯策略,
Xi= ( xi1,…,xi K ),则概率分布 pi= ( pi1,…,pi K )成为参与者 i的一个混合策略,其中 0≤ pi k ≤1,∑ K k=1 pi k =1,pi k表示参与者
i选择纯策略 x i k 的概率,k= 1,…,K 。此时参与者获得期望支付
( expected payoff),定义为以概率为权重的所有取值加权平均,
E(X)= p1 X1+ … + p n X n 。
举例:猜硬币游戏 —— 双方同时亮出硬币,当同一面时参与者 1赢,
否则 2赢。该博弈无纯策略 NE,混合策略均衡( 1/2,1/2)
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
1。 纳什 均衡 ( NE) 的 定义
c1 c2
1,-1-1,1
-1,11,-1r1
r2
2
1
2006-3-7 9
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
2。 纳什 均衡 ( NE) 的 几种实现途径
纳什均衡的存在性定理 ( Nash,1950):每一个有限博弈都至少有一个 NE,其中包括混合策略纳什均衡。
注:作为纯策略 NE存在性的一个推论,仍采用不动点定理证明。
实现途径分析,
( 1)通过改变博弈规则,采取事前的沟通,或者外部力量的协调。
( 2)在既有博弈规则内,理性主义和演化主义的均衡化过程分别提供了两种不同的 NE均衡形成途径。
2006-3-7 10
第一种实现途径,博弈前的串谋
过程:参与者在博弈前直接的沟通,达成一个没有约束力的协议,
然后开始单独行动 —— 如果一致同意达到某个结果,那么可以预期这个结果是可以自我实施的( self-enforcing),即 NE。
举例:参加齐心协力跑比赛
问题:现实条件可能不允许参与者事前进行直接沟通,怎么办?
(1) 物质条件不允许直接沟通(参与者人数众多);
(2) 双方进行对话的基本互信不足(朝鲜核问题六方会谈);
(3) 博弈规则不允许参与者会面(司马相如和卓文君私奔)。
—— 通过外部力量进行协调。
注:通过事前的串谋实现纳什均衡,改变了原博弈的信息集合。
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
2。 纳什 均衡 ( NE) 的 几种实现途径
卓文君,西汉临邛(今四川邛崃)人,卓王孙之女,善于鼓琴,貌美非常。,西京杂记,形容她容貌姣美,眉色深黛,犹如遥远的山峦;脸庞好比芙蓉花,肌肤柔滑得像是凝脂,但性情却风流浪漫,放浪不羁。十七岁时由父母包办嫁与董家,婚后不久丧夫,回到母家。有一天,文君闻得其父宴请贵客,不觉心动,便出来窃看。见司马相如人品清秀,举止闲雅,心中爱慕不已。一时看得忘情,不觉露出自己容貌,却被相如早已瞧见。相如见文君貌美非常
,十分倾慕,便将心事弹入琴中以挑引文君,曲名,凤求凰,。文君夜奔相如,同归成都。生活窘迫,回临邛老家
,文君当掉头饰开酒肆,相如涤器,文君当垆 。
[资料夹 ] 司马相如和卓文君
2006-3-7 12
第二种实现途径,引入外部实体进行协调
回忆:一般均衡理论中市场均衡价格的形成假定市场有一个? 瓦尔拉斯? 拍卖商
假定存在一个虚拟的? 纳什调节器? ( Nashian regulator),
博弈前其向每个参与者提供一个均衡的策略组合。
例如,朝鲜核问题中国外交穿梭第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
2。 纳什 均衡 ( NE) 的 几种实现途径
2006-3-7 13
[资料夹 ]朝核问题和六方会谈
朝鲜指控美国对其国家安全构成最大威胁,美国坚持朝鲜半岛无核化。
为解决问题,朝鲜一直要求与美国进行 直接对话,并多次提议与美国签订互不侵犯条约,以图获得外交承认;但美国坚持不直接与? 流氓国家?
接触,要求朝鲜先行放弃核计划,并坚持采取多边对话解决。
中国外交穿梭,先 2003年 4月 23日- 25日,中、朝、美三方在北京举行了三方会谈,中国作为中间人角色促成朝美双方进行直接沟通;然后 8月份进入六方会谈阶段。
07年 3月,美国首席谈判代表希尔与朝鲜代表团团长金桂冠在日内瓦就朝鲜核计划举行了为期两天的谈判。据美国首席谈判代表希尔称,朝鲜将全面公开其核计划,并在年底前关闭所有核设施。
朝一核反应堆施工现场 (02年 8月 7日 )
2006-3-7 14
第三种实现途径:理性主义
—— 参与者? 完全理性? 假设下,通过推理演绎达到均衡化的过程
根据博弈的完全理性假设,尤其是理性的共同知识假设,每个参与者都能利用全部的信息,并且能够正确理解参与者之间的相互作用,因此做出正确的预期。
点评:当博弈规则不允许参与者事先进行沟通,又没有外部力量进行行动协调时,如果参与者理性程度很高,仍可以实现 NE
均衡(此时等价于? 理性预期均衡? )。
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
2。 纳什 均衡 ( NE) 的 几种实现途径
2006-3-7 15
第四种实现途径:演化主义
—— 参与者? 有限理性? 假设下,在归纳学习过程中实现均衡化过程
参与者仅具有有限的认知能力和计算能力,但是时间的重复过程弥补了理性的不足。
( 1)长期机制,如生物学基于基因遗传和变异的自然选择过程;
( 2)中短期机制,如社会中模仿、经验、惯例、试错等学习过程。
群体参与者中,每个个体观察对方的行动后,根据各种复制原则进行复制。那些最有效率的策略将被大量复制,并淘汰那些表现不佳的策略,最终达成稳定的分布状态。
点评:当博弈规则不允许参与者事先进行沟通,又没有外部力量进行行动协调时,参与者理性程度又很低,只好在不断的犯错误中摸索尝试。
第三章 传统博弈理论的简介 第二节 纳什均衡的定义和几种实现途径
2。 纳什 均衡 ( NE) 的 几种实现途径
2006-3-7 16
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
1,纳什均衡无效率问题的提出博弈论揭示出新古典经济学基本命题存在的问题:
看不见手原理?(亚当 ·斯密,1776 ):
我们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之心,
而是因为他们对自己的利益特别关注。。。每个人都会尽其所能,
运用自己的资本争取最大的利益,。。。但如此一来,他就好象被一只无形的手引领,在不知不觉中对社会改进尽力而为。
结论:市场机制下个体理性(自利)达到社会理性。
博弈论最经典的?囚徒困境?例子( A,W,Tucker)
结论:个体理性与集体理性的深刻矛盾,在个体理性假设下,
可能无法实现资源配臵的帕累托状态。
2006-3-7 17
[资料夹 ]公地的悲剧:
过度放牧,草场退化,缺草,西部的羊互相啃食羊毛,牧民无奈只得给羊穿上衣服,但是裸露在外面的羊毛还是被别的羊啃秃了长江源地区的草场正在退化
1968年美国生物学教授哈丁( Garrett Hardin)在,公地的悲剧,
( The Tragedy of the Commons)中讨论 了公共草场的问题:如果草场是公共的,为了增加收入,每个牧民都希望增加自己的牲畜,这将带来过牧的问题,并导致草场退化,最终给所有的放牧人带来悲剧。
2006-3-7 18
[资料夹 ]来自格鲁吉亚的例子:
——,新大牌局:亚洲腹地大国角力内幕,
2006-3-7 19
[资料夹 ]来自格鲁吉亚的例子:
——,新大牌局:亚洲腹地大国角力内幕,
在该国大部分地区,每天供电时间为 4小时,入夜后村庄一片漆黑,只有几部私人的柴油发电机在供电,人们都点煤油灯照明 。
‘交上来的电费只有 1/3,人们向查电表的人行贿,后者会把部分贿金交给上司,上司再依样层层上交,如此等等。可是,日尽夜临时,人们花在煤油灯上的钱比交的电费还多。’由于总统的侄子控制着国家的煤油业,在这一行业实行改革根本不可能。
‘人们对此也只能耸耸肩膀而已,人人都知道老老实实地做事最终将一事无成 ’?
其他资料,独立 15年来,格鲁吉亚仍处于四分五裂的状态,腐败现象十分普遍,经济发展迟缓,生活水平下降。目前该国 54%的人生活在贫困线以下,20%的人在国外打工,大街上随处可见乞讨者。
2003年 11月 23日,格鲁吉亚爆发?天鹅绒革命?,反对派支持者在获悉谢氏辞职后欢庆胜利。 谢瓦尔德纳泽 (95-03任职 )
2006-3-7 20
纳什均衡的无效率问题:囚徒困境
描述:帕累托效率结果为(- 1,- 1),可是一次性博弈的纳什均衡却陷入了深深的? 囚徒困境? 中:(- 8,- 8)
在非合作博弈框架内的解决途径?
——博弈重复进行的过程中产生合作行为。
-8,-8 0,-10
-10,0 -1,-1
坦白 P
抵赖 NP
坦白 P 抵赖 NP
囚徒 A
囚徒 B
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
1,纳什均衡无效率问题的提出
2006-3-7 21
有限次重复博弈的分析方法,
由于参与者具有?共同知识?的预测、分析、推理能力,
因此在博弈开始前能够从最后阶段进行反向归纳,形成信念。
唯一纳什均衡下的有限次重复博弈的分析结论,如果原博弈 G存在唯一的纯策略 NE,通过博弈重复进行有限次的途径,仍然无法摆脱囚徒困境,唯一均衡路径为:各参与者在每阶段都采取的一次性博弈的纳什均衡 {(P,P),(P,P),…,(P,P)}。
解决途径?
P NP
-1,-1-8,0
0,-8-5,-5P
NP
2
1
P NP
-1,-1-8,0
0,-8-5,-5P
NP
2
1?
G1 GT
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
2,唯一纳什均衡下的有限次重复博弈
2006-3-7 22
无限次重复博弈的分析方法,
( 1)分析的难点:在无限次重复博弈中不存在终结点,无法进行反向归纳;对于阶段博弈中的正收益,无限次加总后的总收益都为无穷大,失去比较意义。
( 2)解决途径:考虑到时间价值,人们更为注重近期的收益,引入贴现系数 δ= 1/(1+ t),将未来阶段的收益折算到当期阶段,这样总收益将是一个有限数,可以加以比较。
( 3) 计算:给定贴现系数 δ,每阶段收益都为 ˉu时,无限次重复博弈总收益的贴现值为:
( 1 ) 1 1 / ( 1 )x t x t贴 现 率 的 理 解,
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
3,唯一纳什均衡下的无限次重复博弈
2 1l im
11
t
t
uU u u u u



2006-3-7 23
举例:无限次重复囚徒困境博弈
冷酷的触发策略,双方在第一阶段采取合作策略 R,如果前( t- 1)
都是合作,那么继续合作;否则,如果对方背叛,则在后续阶段一直采取背叛策略 L作为惩罚。
策略分析:如果一方背叛,那么 路径 (L,R),(L,L),(L,L)…,总收益:
如果一方一直采取合作策略,那么总收益为:
当 时,参与者采取合作策略,求得:
结论:在原博弈 具有唯一 NE的无限次重复博弈中,如果贴现因子足够大(即参与者对未来的收益有足够的耐心),采取触发策略可以摆脱囚徒困境。 直观上看,当参与者注重长期利益时,通过采取触发策略可以实现长期合作的圆满结局。
25 1 1 5 / ( 1 )
24 4 4 4 / ( 1 )
1/ 4
4,40,5
5,0 1,1
L R
L
R
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
3,唯一纳什均衡下的无限次重复博弈
2006-3-7 24
无限次重复博弈的无名氏定理,
在无限次重复博弈 G( ∞,δ)中,如果 δ足够接近于 1,那么一定存在一个均衡路径,实现博弈的可实现收益。
( 1)定理的条件为 δ足够接近于 1,即参与者都比较看重未来长期合作的收益,因此避免了短期行为。
( 2)可实现收益即为 阶段博弈各纯策略收益的加权平均,其中权数非负且总合为 1,记 (x 1,…,x n)。 图中的钻石图案。
( 3)即使原博弈具有唯一 NE时,也可以设计出具有可信威胁的触发策略,摆脱囚徒困境。
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
3,唯一纳什均衡下的无限次重复博弈
A B
0,04,1
1,43,3A
B
2
1
(3,3)
(1,4)
(1,1) (4,1)(0,0)
可实现收益
2006-3-7 25
[资料夹 ]农村延长土地承包期:
,中共中央办公厅、国务院办公厅关于进一步稳定和完善农村土地承包关系的通知,
( 1997-06-24)
(一)在第一轮土地承包到期后,土地承包期再延长3
0年,指的是家庭土地承包经营的期限。集体土地实行家庭联产承包制度,是一项长期不变的政策。
分析:通过延长期限,加大对未来长期收益的重视,有利于保持土地肥力。
2006-3-7 26
不完全信息下的声誉效应模型:
问题的提出:囚徒困境只能在无限次重复中才能达成合作吗?
—— 土地承包期延长 30年即可促成长期合作行为。
Axelrod(1981)实验博弈结果表明,有限内仍可达成合作结果;
Kreps,Milgrom,Roberts&Wilson(1982)引入不完全 信息解决了这个悖论,建立了 KMRW声誉效应模型。
声誉效应的思路:参与者的行为类型具有不确定性,一方试图通过采取非理性的行为,刺激对方采取同样的回应,从而获得更大的长期利益,完全可以弥补当前疯狂举动造成的短期损失。
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
4,不完全信息下考虑声誉的有限次重复博弈
2006-3-7 27
多重均衡下有限次重复博弈:无名氏定理
分析思路:当阶段 博弈具有多个 NE的有限次重复博弈,可以设计出具有可信威胁的触发策略:把低效率的均衡作为对方背叛行为的惩罚(威胁是可信的),从而达到帕累托最优的博弈结局。
举例:如图两阶段重复博弈纯策略均衡为( 2,4)和( 4,2),但( 5,5)为帕累托最优。
策略设计:参与者开始选 R策略,若对方不合作则改为 M策略进行惩罚;如果对方合作,则采取 L策略进行奖励。
分析:如果不合作,对方在结果 (6,0)中收益增加 1;但是在第二阶段的惩罚 (2,4)中收益减少 2。当 1<2δ时得不偿失。
点评,由于惩罚和奖励策略都是纳什均衡,因此是可信的。而囚徒困境博弈无法提供这种可信的奖惩。
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
5,多个纳什均衡下的有限次重复博弈
5,50,00,6
0,00,04,2
6,02,40,0L
M
R
L M R
1
2
2006-3-7 28
重复博弈可以改进效率的一个结论:无名氏定理
第一种情况:由于完全理性的博弈方可以运用后退归纳法,因此对于原博弈具有唯一 NE(如囚徒困境博弈)的有限次重复博弈,
重复博弈的结局尚无法摆脱囚徒困境;
第二种情况:在无限次重复博弈中,考虑到时间价值,引入贴现系数 δ,这样总收益将是一个有限数加以比较。对于原博弈具有唯一 NE(如囚徒困境)的无限次重复博弈,可以设计出具有可信威胁的触发策略,摆脱囚徒困境。
第三种情况:自己的行为类型不确定情况下,参与者考虑到建立起长期合作的声誉,在有限期内也可产生合作行为。
第四种情况:有限次重复博弈中原博弈具有多个 NE时,以低效率的均衡作为可信的威胁,设计相应的触发策略,达到帕累托最优的博弈结局。
第三章 第三节 纳什均衡的无效率问题:重复博弈和无名氏定理
6,小结
2006-3-7 29
纳什均衡的第二种无效率情况:协调博弈
问题的提出:如下广告博弈中,
纯策略 NE为( P,NP)和( NP,P);
混合策略 NE为 q= (1/2,1/2),p= (1/2,1/2),支付为 (3,3)。
但( 5,5)似乎更为折中,效果也更好,如何达到?
解决途径,相关均衡 ( correlated equilibrium) Aumann( 1974)提出,基本思想参与者通过一个大家都能观测到的信号选择行动,
由此确定最终结果。
关键是:如何建立这种?信号装臵?? P NP
0,06,1
1,65,5P
NP
2
1
第三章 第四节 纳什均衡的无效率问题:相关均衡和信号装臵
2006-3-7 30
举例:采取 抛硬币的 合作机制
两家 企业决策前会面,一致同意根据外部一个随机事件 E来决定。
其中,该事件的概率为 1/2,双方都可以观测到;
采取的策略为:如果事件 E发生,选择( P,NP)
如果事件 E不发生,选择( NP,P)
最终的结果:两个纯策略的凸组合,1/2(1,6)+ 1/2(6,1)= (3.5,3.5)
该结果优于混合策略。
为了提高博弈结局的效率,参与者在事前的串谋阶段,通过各种合作机制交换信息,从而在非合作博弈框架下实现合作结局。
注意,(1)如果想要提高收益,必须设计更为复杂的机制;
(2)如果可以重复进行,多重均衡下有限期内即可改善结果,
第三章 第四节 纳什均衡的无效率问题:相关均衡和信号装臵
P NP
0,06,1
1,65,5P
NP
2
1
2006-3-7 31
在 2005年国民党主席选举中,? 王金平靠组织,马英九靠人气? 。马英九的个人魅力对于妇女和年轻人的吸引力不可思议地大。国民党有着
党主席即总统候选人? 的传统。马英九向来被看成泛蓝 2008年赢得选举的唯一希望,大部分党员会把票投给他。
王马之争? 是否会导致国民党新的分裂?国民党已经没有再分裂的本钱。过去李登辉的行径导致国民党两次重大分裂,新党和亲民党先后另起炉灶,国民党受到重创,结果痛失执政地位。
国民党 08年大选的候选人鹿死谁手?
据台媒报道,国民党将在 2007年 8月前,敲定 08“总统? 大选候选人。按照国民党内有关规定,如果国民党的候选人有两人以上,将按照初选制度办理,其中民调占 70%、党员投票占 30%。 但如果只有一人成为国民党
总统候选人?,就不用办理党内初选。
民调相当于一个外部信号装臵,党员选举相当于一个内部信号装臵
[资料夹 ] 国民党 08年大选候选人产生办法
一个小渔村住着两户兄弟,经常一起出海打鱼,总要忙到深夜 12点才能回来。但两个妻子都不愿冒着寒风到海边去迎接,而希望由对方代劳。
老大家的渔船上点着红灯笼,老二家的渔船上点着绿灯笼。
妯娌俩约定好:没有看到绿灯笼时,就大媳妇出去迎接;
没有看到红灯笼时,则二媳妇出去迎接。
兄弟一般交替着先后归航。但是有一天哥俩动了一个心眼:头两天交替归航后,第三天晚上归航时都熄灯了:)
结果:第三天晚上,妯娌俩都着急的到海边张望(迎接)了。
[资料夹 ]信号机制:两个渔家女的小故事
P NP
0,06,1
1,65,5P
NP
2
1
2006-3-7 33
静态博弈中多重均衡的选择,焦点原则和社会惯例
Schelling在,冲突的策略,( 1960)提出,决策过程中考虑到对称、效率、公平、风险占优等原则,以及一些社会文化惯例。
例 1:考虑效率 —— 三个均衡中,选择帕累托效率的纯策略 (2,2)
例 2:考虑公平 —— 最后通谍博弈 ( Roth etc,1991),100¥在两个人中分摊,其中一人首先提出方案,对方不接受则双方为 0。
理论分析结果:首先提出的人选择 99¥。
实验结果:美国、南斯拉夫选 50:50,日本、以色列选 60:40。考虑了公平等社会文化规范。
T G
1,10,0
1/2,1/22,2T
G
A
B
第三章 第五节 纳什均衡的多重性问题:静态博弈和焦点均衡
2006-3-7 34
动态博弈的核心问题:
为了 影响对方下阶段的行动,作出一些威胁或承诺。但这些威胁或承诺是否可信?
举例:
( 1)威胁和承诺运用与外交中,20世纪初,美国总统西奥多 ·罗斯福提出? 胡萝卜加大棒? 政策,? 说话温和,但带根大棒,
就一定能成功。
( 2)威胁和承诺运用于内政中,? 宣帝作色曰,‘ 汉家自有制度,本以霸王道杂之,奈何纯任德教 ’?,汉书 ·元帝纪,,
即法家的刑治与儒家的德治并用。
第三章 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡
1,动态博弈的核心问题:威胁或承诺的可信性
2006-3-7 35
第三章 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡
1,动态博弈的核心问题:威胁或承诺的可信性动态博弈的一个例子:台海博弈
中国面临着本世纪初二三十年的战略机遇期,不希望有台海战争。
台独分子觉得这是推进台独的大好时机,要利用中国将在 2008年主办奥运会的时间窗口,通过修宪等方式来争取独立。
要是中国威胁动武,陈水扁相信美国众议院亲台反华势力能发挥影响力,台海发生冲突后美国必会拔刀相助。中国面对美日联合干涉将知难而退,从而在美日卵翼下实现和平独立的台独梦想。
台湾问题事关中国核心利益,中国决不会对此坐视不理。中国已表示它不会因为要办奥运而不捍卫自己的核心利益。当前中国快速整军备战,目标能够在美日联合干涉下仍能有效遏制台独。
2006-3-7 36
该博弈 有 2个纯策略纳什均衡(见下图),
大陆方有一个弱占优策略 k。但是在策略式博弈中无法预测哪一个更有可能实现。
现实中,陈水扁之流预期结局是 (推动台独,
口头抗议 )。台独分子为何如此张狂?
分析:只有当台独分子相信?推动台独 l”会导致?台海战争 h”时,维持现状的均衡 (2,2)
才能实现。但台独分子一厢情愿的认为,
大陆面对台独威胁选择发动台海战争的行动是非理性的,届时大陆只会在美日压力下虚张声势的抗议了事 (1>0) 。
纳什均衡 (维持现状 r,台海战争 h)作为一种威胁,台独分子认为是不可信的!
总结:动态博弈的纳什均衡存在不可信的,
大陆
(2,2) (3,1) (0,0)
台独分子
r维持现状 l推动台独
k口头抗议 h台海战争举例:陈水扁们的黄粱美梦
k h
0,03,1
2,22,2r
l
大陆台独第三章 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡
1,动态博弈的核心问题:威胁或承诺的可信性分析其自我实施过程
2006-3-7 37
动态博弈中纳什均衡的多重性问题:
在预测动态博弈的可能结局时,NE均衡 存在多重性现象,其中包含一些不可信的威胁或承诺 ——需要加以精练。
对于动态博弈,一种广泛认可的精练 (perfection)方法是子博弈完美均衡 (SPE,subgame perfection equilibrium; Selten,1965)
子博弈完美的基本思想,
动态博弈中,双方都具有理性的?共同知识?,在 NE的基础上
(可自我实施的稳定均衡),依据反向归纳法进一步剔除那些不可信的威胁和承诺。
由于动态博弈的核心问题是?可信性?,因此子博弈完美均衡是求解动态博弈问题的基本均衡概念。
第三章 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡
2,剔除不可信的威胁或承诺:子博弈完美均衡
2006-3-7 38
扩展式博弈的子博弈定义,
( 1)开始于博弈树的一个结点,该节点对应一个单独信息集;
( 2)包含从节点开始的博弈树整个部分;
( 3)从不分割一个信息集 (针对后续的节点 )
子博弈完美均衡的定义,一个 NE是 SPE,该策略的每一个子博弈都产生一个 NE,无论实际中是否能到达 。
SPE存在性定理 ( Selten,1965):每个扩展式、完美信息博弈至少有一个纯策略 SPE。
第三章 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡
2,剔除不可信的威胁或承诺:子博弈完美均衡大陆
(2,2) (3,1) (0,0)
台独分子
r维持现状 l推动台独
k口头抗议 h台海战争
举例:
( 1)根据共同知识假设,参与者能够预见最后一期的行动,因此采取后退归纳法分析(如曹操败走华容道);
( 2) SPE概念包含了后退归纳法的思想,即从最后一个子博弈的结点出发,分析最佳策略
(纳什均衡);
( 3)依此类推,直至博弈开始阶段,得 SPE
2006-3-7 39
台湾要求大陆取消福建导弹威胁,创造和谈氛围的承诺是否可信?注意:如果大陆撤销导弹后再被迫动武,将损失惨重 (-1,-1)。
该博弈有三个纯 NE,(R,H,D),(R,H,M),
(L,K,D)。前 2个含义?只要策划台独 H,则加强战备 R”,后一个含义为?大陆撤销导弹 L后坚持动武 D,对岸放弃台独实现和谈 K双赢?
大陆撤销导弹实现和谈 (2,2)是一个双赢的帕累托结局,但是台湾当局这种承诺是不可信的。一旦撤销导弹,自毁长城,台独分子的最佳选择是策划台独:此时大陆再被迫仓促动武将是非理性的。
反向归纳,该博弈唯一 SPE (R,H,M),即现状
提示:反向归纳法仅是剔除了不可信的威胁、
承诺,但是并没有提高效率举例:
台独分子
(2,2)
大陆
R加强战备 L撤销导弹
K和平统一 H策划台独
(-1,-1) (0,3)
D被迫动武 M默认
(1,1)
大陆第三章 第六节 纳什均衡的多重性问题:动态博弈和子博弈完美均衡
2,剔除不可信的威胁或承诺:子博弈完美均衡
2006-3-7 40
问题的提出,
当某一参与者具有私人信息,因此其他人对参与者的特征不完全了解时,如何处理?
思路:先对未知事件的各种可能性进行分类,判断每种类型发生的概率大小。
解决方法,
海萨尼 1969年提出不完全信息博弈的处理方法,海萨尼转换
( Harsanyi’s procedure):
——引入一个神秘的? 自然?,其事先决定了参与者的各种可能类型,以及每种类型发生的概率。注意:每个参与者的真实类型只是他本人的私人信息;但是各种可能的类型和相应概率,却是共同知识。由此,可将不完备信息转化为完备但不完美信息。
进而,通过贝叶斯决策,可以得到不完美信息下分析方法。
第三章 第七节 不完全不完美信息下的纳什均衡存在性:贝叶斯均衡
2006-3-7 41
小作业:
请将下述经济现象表述为博弈论模型,并分析求解:
苏联解体前,苏联东欧地区唯一的美国软饮料制造商是? 百事可乐? 。 可口可乐? 公司盘算是否进入该新兴的市场 (假设?百事可乐?独占的盈利为 5亿元),市场潜力令人垂涎。
如果?百事可乐?对潜在进入者采取?强硬?措施 —— 如发动广告大战、投入巨额资金改善服务设施、以排他性条款捆绑零售商等,双方两败俱伤,百事略损失 1亿元,可乐血本无归损失 2亿元;
如果?百事?默许进入,则双方瓜分市场,新老厂商分别获得 1
亿元,2亿元。
问题,1 该现象应该采用什么博弈模型加以表述?
2 请对其均衡求解分析。
2006-3-7 42
本章总结:
传统博弈理论的研究内容:
纳什均衡的 存在性( Nash,1950)和几种实现途径;
纳什均衡的无效率及解决:
无名氏定理,Friedman,1971 ;
相关均衡,Aumann1974;
纳什均衡的多重性及解决:
焦点均衡,Schelling,1960;
子博弈完美均衡,Selten,1965;
在不完全(或不完美)信息下,纳什均衡的存在性;
贝叶斯纳什均衡,Harsanyi,1967