第七章 博弈论初步博弈论 ( game theory)是由美国数学家冯 ·诺依曼 (Von,Neumann) 和 经 济 学 家 摩 根 斯 坦
(Morgenstern)于 1944年创立的带有方法论性质的学科,它被广泛应用于经济学,人工智能,
生物学,火箭工程技术,军事及政治科学等 。
1994年,三位博弈论专家即数学家纳什 (Nash,
他的故事被好莱坞拍成电影,美丽心灵,,该影片获得了 2002年奥斯卡金像奖的四项大奖 )、
经济学家海萨尼 ( Harsanyi) 和泽尔滕 ( Selten)
因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖 。
1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯
(Mirrlees)和维克里 (Vickrey),以及 2001
年三位经济学家阿克洛夫 (Akerlof),斯蒂格利茨 (Stiglitz)和斯宾塞 (Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主 。 专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖 。
为什么博弈论在经济学领域会产生如此大的影响呢? 这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订 。
博弈论是一门十分有趣但理论上又是十分艰深的学问,这里打算用一些大家能够凭直观或简单分析就能把握的例子为大家介绍博弈论的基本概念及应用,
以引起大家对这门目前已成为热门科学的兴趣和获得初步的了解 。 这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象,通过博弈论,我们能够更加深刻地理解它们 。
1,囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据 。 警方将两人分别臵于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱 10年;若二人都招则两人各判刑 8年 ;若两人都不招则未获证据但因私入民宅各拘留 1年 。
一、什么是博弈论:从,囚徒困境,谈起表 1 囚徒困境博弈乙招 不招招甲不招
( 问题 1:甲,乙如何选择? )
-8,-8 0,-10
-10,0 -1,-1
尽管甲不知乙是否招供,但他认为自己选,招,最好,因而甲会选择
,招,,乙也同样会选择,招,,结果各判 8年;但若两人都不招,结果是两人只被判 1年,但这种结果是不会出现的 。
我们可以运用,剔除劣战略,的方法来获得这样的结果 。
甲或乙可以作出的选择被称为,战略,,如,招,或
,不招,都是战略 。
对甲来说,尽管他不知道乙是选择了,招,还是,不招,,他发现他自己选择,招,
都是比选择,不招,为好的 。 因此,
,不招,是相对于,招,的劣战略,他不会选择劣战略 。 所以,甲会选择
,招,。
同样,根据对称性,乙也会选择
,招,,结果是甲乙两人都,招,。
甲和乙是参与博弈的人,称为,局中人,。
表 1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付 。 表 1中的双变量矩阵称为博弈支付矩阵 。
局中人所选择的战略构成的组合 ( 招,招 )
被称为博弈均衡 。 这个组合中前后两个战略分别表示甲和乙所选择的战略 。
甲和乙都不会选择劣战略,不招,,称为,剔除劣战略的占优战略均衡,。 其中,招,是占优于 (优于 )“不招,的占优战略 。
我们可以利用这个道理来分析日常生活中的许多不合作现象 。
2,生活中的“囚徒困境”例子例子 1 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱 。
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来 。
譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个,彩电厂家价格自律联盟,,并在深圳举行了由多家彩电厂商首脑参加的,彩电厂商自律联盟高峰会议,。 当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓,自律联盟,,国家在法律上暂时还是无能为力的 。 寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,
这在发达国家是不可思议的 。
但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨 。
这是因为,,彩电厂商自律联盟,只不过是一种,囚徒困境,,彩电价格不会上涨 。 在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌 。 这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的 。
例子 2 为什么政府要负责修建公共设施,因为私人没有积极性出资修建公共设施设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路 。 修一条路的成本为 4,每个农家从修好的好路上获得的好处为 3。 如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处 ( 支付 ) 为 3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为 3-4=-1
( 亏损 ),,搭便车,不出资但仍然可以使用修好的路的另一户人家获得支付 3-0=3,见表 2。
表 2 修路博弈乙修 不修修甲不修
1,1 -1,3
3,-1 0,0
我们看到,对甲和乙两家居民来说,
,修路,都是劣战略,因而他们都不会出资修路 。
这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税 2
单位,然后投入 4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善 。
这就是我们看到的为什么大多数路,
桥等公共设施都是由政府出资修建的原因 。
同样的道理,国防,教育,社会保障,环境卫生等都由政府承担资金投入,
私人一般没有积极性承担这方面服务的积极性和能力 。
例子 3 苏格兰的草地为什么消失了? 公共资源经常被过度利用的原因 。
在 18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧 。
草地属于,可再生资源,,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,
草场就会消失 。
由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,
我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益 。
如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,
但自己却获得了高额的收益 。 因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择,约束自己的放牧规模,都是劣战略,从而被剔除 。
大家最终都会选择过度放牧,结果导致草地消失,生态破坏 。
类似的例子还有:
渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,
为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。
例子 4 为什么在城市中心道路上禁止汽车鸣喇叭?
禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因 。 见表 3,当汽车司机可以鸣喇叭时,
可能为汽车超速抢行提供条件 。 但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付 ( 2,2)。
表 3 交通博弈司机 2
缓行 抢行缓行司机 1
抢行
8,8 1,9
9,1 2,2
但当对方缓行时,自己抢行会占便宜,获得支付 9。
这个博弈中,,缓行,是劣战略,
剔除后得到,剔除劣战略后的占优战略均衡,( 抢行,抢行 ),这不是一个好的均衡 。 当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果 ( 缓行,缓行 ) 。
例子 5 为什么要加入 WTO?
WTO是一个自愿性申请加入的自由贸易联盟,即 WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税,
另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。
1,智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有 10单位的猪食进槽,但每按一下按钮会耗去相当于 2单位猪食的成本 。 如果大猪先到食槽,则大猪吃到 9单位食物,小猪仅能吃到 1单位食物;如果两猪同时到食槽,则大猪吃 7单位,小猪吃 3单位食物;如果小猪先到,
大猪吃 6单位而小猪吃 4单位食物 。 表 4给出这个博弈的支付矩阵 。
二、智猪博弈:对诸多经济现象的解释表 4 智猪博弈小猪按 等待按大猪等待
5,1 4,4
9,-1 0,0
这个博弈没有,剔除劣战略均衡,,因为大猪没有劣战略 。
但是,小猪有一个劣战略,按,,因为无论大猪作何选择,小猪选择,等待,是比选择
,按,更好一些的战略 。
所以,小猪会剔除,按,,而选择,等待,;大猪知道小猪会选择,等待,,从而自己选择,按,,所以,可以预料博弈的结果是
(按,等待 ) 。 这称为,重复剔除劣战略的占优战略均衡,,其中小猪的战略,等待,占优于战略,按,,而给定小猪剔除了劣战略,按,
后,大猪的战略,按,又占优于战略,等待,。
2,例子在经济生活中,有许多,智猪博弈,的例子 。
例子 6 股市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息,预测股价走势,但大量散户就是小猪 。
他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓,散户跟大户,的现象 。
例子 7 为何股份公司中的大股东才有投票权?
在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,
不会直接花精力去监督经理,因而没有投票权 。
例子 8 为什么中小企业不会花钱去开发新产品?
在技术创新市场上,大企业是大猪,
它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。
例子 9 为什么只有大企业才会花巨额金钱打广告?
大企业是大猪,中小企业是小猪 。 大企业投入大量资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售 。
表 5给出的博弈中,甲和乙都没有劣战略,所以,不能通过重复剔除劣战略获得博弈结果。
三、纳什均衡与商业中心区的形成表 5 存在纳什均衡的博弈乙
L M R
U
甲
D
( 问题 2,甲和乙分别会选择什么战略? )
1,1 4,2 1,3
2,3 1,2 2,1
当甲选,U”时,乙会选,R”;
而当乙选,R”时,甲应该选,D”而不是,U”;但当甲选,D”时,乙会选,L”;给定乙选,L”,甲选,D”
是最好的选择,他不会改变选择
,D”;给定甲不改变选,D”,乙也不会改变其选择,L”。 所以,可以预期 ( D,L) 是甲乙最终完成的稳定的选择 。
称 ( D,L)为,纳什均衡,。 纳什均衡是局中人战略选择上构成的一种,僵局,,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择 。 剔除劣战略的占优战略均衡和重复剔除劣战略的占优战略均衡是纳什均衡,但相反的结论不成立 。
在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,
没什么商店 。 对于这种现象,我们可以运用纳什均衡的概念来加以解释 。
甲乙
1/2
图 1 商业位置博弈
·
见图 1,有一个长度为 1单位的街道,在街道两边均匀地分布着居民 。
现有两家商店决定在街道上确定经营位臵 。 如果甲在街道中间位臵 1/2
处设店,则乙的最好选择是紧靠甲的左边或右边设店 。
当乙在甲的右边紧靠甲设店时,其右边街道上的顾客都是乙的顾客;如果乙不是紧靠甲而是远离甲设店,则其顾客只是其右边街道的居民,不如它紧靠甲设店时多,因而在远离甲的位臵设店是劣战略 。 所以给定甲在 1/2处设店,乙在紧靠甲的左边或右边设店是最优的 。
反过来,给定乙在接近 1/2处设店,甲的最优选择也是在 1/2附近设店 。 这样,甲和乙挤在 1/2处设店就是纳什均衡,这就是商业中心区的形成原理 。
如果局中人在进行行动选择时有先后顺序之分,这种博弈就被称为,动态博弈,。
在图 2中,有两个房地产开发商 A和 B
分别决定在同一地段上开发一栋写字楼 。
由于市场需求有限,如果他们都开发,
则在同一地段会有两栋写字楼,超过了市场对写字楼的需求,难以完全出售,
空臵房太多导致各自亏损 1百万 。
四,动态博弈与承诺行动当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润 1百万 。 假定 A先决策,
B在看见 A的决策后再决策是否开发写字楼 。 在图 2中,
用,博弈树,表示博弈过程 。
图 2 房地产开发博弈
A 不开发开发
B B
开发 不开发开发 不开发
(-1,-1) (1,0) (0,1) (0,0)
在其中每一条,路径,的末端用向量给出 A和 B的支付,称为支付向量 。
下面用,逆向归纳法,可以求解这个博弈 。 在 B进行决策的 2个,决策结,
上,B在左边的决策结上选择,不开发,;而在右边的决策结上选择,开发,。 即给定 A开发,B就不开发;给定
A不开发,B就开发 。 B应避免同时与 A
都选择开发而蒙受损失 。
在这种情况下,A在自己的决策结上当然选择,开发,,因为他预计当自己选择,开发,
后,B会选择,不开发,,自己就净赚一百万 。
当 B威胁 A说:,不管你是否开发,我都会在这里开发写字楼 。,倘若 A将 B的话当了真,
A就不敢开发,让 B单独开发写字楼占便宜 。
但是,B的威胁是,不可臵信,的 。
当 A不理会 B的威胁而果断地开发出一栋写字楼时,B其实不会将事前的威胁付诸实施 。
因为,识时务者为俊杰,,在 A已开发的情况下,B的最优决策是,不开发,而不是,开发,。
但是,如果 B在向 A发出威胁的同时又当着 A的面与第三者 C打赌一定要在该地段上开发出一栋写字楼,
否则输给 C 2百万元 。 B与 C为此签定合同并加以公证有效 。
这时,博弈变成图 3所示的动态博弈 。
图 3 承诺行动后房地产开发博弈
A 不开发开发
B B
开发 不开发开发 不开发
(-1,-1) (1,-2) (0,1) (0,-2)
称 B的这种行动为,承诺行动,,
它使原来不可臵信的威胁变为可以臵信 。
这时,A就不得不相信 B一定要开发写字楼的威胁了,于是放弃开发写字楼的计划,让 B如愿以偿单独开发写字楼 。 B不仅未向 C支付 2百万元,反而净赚 1百万 。
我们可以运用,承诺行动,的原理来分析许多经济及军事现象 。
例子 10 项羽的,破釜沉舟,。
例子 11 韩信赵国之战,,置之死地而后生,。
例子 12 欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴 。
欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行补贴 。
当双方都未获得政府的补贴时,
两个公司都开发新型飞机会因市场饱和而亏损,但若一家公司开发而另一家公司不开发时,则开发的那家公司会获巨额利润,见表 6。
表 6 未补贴时的博弈空中客车开发 不开发开发波音不开发
-10,-10 100,0
0,100 0,0
此时有两个纳什均衡,即一家开发而另一家不开发 。
下面,考虑欧共体对空中客车进行补贴 20个单位的情况 。 此时,
当两家都开发时,空中客车仍然盈利 10单位而不是亏损,博弈矩阵见表 7。
表 7 有补贴时的博弈空中客车开发 不开发开发波音不开发
-10,10 100,0
0,120 0,0
这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡
( 不开发,开发 ),这有利于空中客车 。
在这里,欧共体对空中客车的补贴就是使空中客车一定要开发 ( 无论波音是否开发 ) 的威胁变得可臵信的一种
,承诺行动,。
例子 13 为什么大人物、大公司要聘请常年律师?
大人物,大公司对声誉十分看重,因而为一些不良人物或公司通过诽谤大人物,
大公司企图迫使大人物,大公司花钱,私了,而获利 。 这是因为,尽管对于一些无端的指控,大人物,大公司可望通过法律手段 ( 打官司 ) 而出清了结,但打官司请律师会增加他们额外的成本 。 如果能花稍少一些钱,私了,,则既使自己清白又省钱,同时诽谤者也获得收入 。
大人物、大公司为了避免这种无端的损失,干脆花钱请常年律师,律师费用已经一次性支付,打官司不会带来额外的花费。这是一个承诺行动,它告诉潜在的诽谤者,大人物、大公司一旦受到无端诽谤必定会让他们吃官司。这样,
大人物、大公司因此承诺行动而使自己得到保护,避免了许多无端指控的发生。
例子 14 如何以弱敌强在战争史上,以弱胜强的例子是很多的。在商业竞争中,以弱敌强也是经常会遇到的情形。在二战中的诺曼底登陆战的谋略策划中,盟军就面临以弱敌强的问题。
盟军有两个可以选择的登陆目标地,一是多佛,二是诺曼底。德国守军在人数上超过了盟军,并且就军事进攻而言,在人数相同的情况下,攻方与守方相比会处于不利的情形。
下面,将这种情形模型化。有一支军队准备进攻一座城市,它有军力两个师。
守城军队有三个师。通往城市有甲、乙两条道路或方向。两军相遇时,人数居多的一方取胜,当两方人数相等时,守方获胜。
假定军队只能整师调动。
攻方战略:
a=两个师集中沿甲方向进攻
b=兵分两路,一个师沿甲方向进攻,
另一个师沿乙方向进攻
c=两个师集中沿乙方向进攻守方战略:
A=三个师集中守甲方向
B=两个师守甲方向,一个师守乙方向
C=一个师守甲方向,两个师守乙方向
D=三个师集中守乙方向用,+”、“-”,分别表示胜和败,见下表守方
A B C D
a
进攻方 b
c
表 1 以弱敌强博弈
-,+ -,+ +,- +,-
+,- -,+ -,+ +,-
+,- +,- -,+ -,+
用,重复剔除劣战略,分析:
进攻方无劣战略,但守方有劣战略,A劣于 B,
D劣于 C,故守方不会采用战略 B和 C,剔除后的博弈变为,守方
B C
a
进攻方 b
c
表 2 守方剔除劣战略后的博弈
-,+ +,-
-,+ -,+
+,- -,+
攻方知道守方不会选 A和 D,他由此知道博弈变成上图所示。此时,攻方就有一个劣战略 b,他剔除 b后得到新的博弈,见下表:
守方
a
进攻方
b
表 3 攻方剔除劣战略后的博弈
-,+ +,-
+,- -,+
此时,两方的形势是相同的,
即攻方尽管开始在军力上劣于守方,
但实际上它只要运用计谋,其获胜的可能与守方是相同的 。
博弈论作为经济学研究的有力工具,
真正大行其道是在 70年代不对称信息下经济行为分析的兴起 。 不对称信息指一些局中人拥有别的局中人不拥有的,私人信息,,也就是说一些局中人知道别的局中人不知道的某些情况 。 下面用一些例子说明这种情形下的博弈行为 。
五、不对称信息下的博弈例子 15 二手车市场为什么难以建立?
在发达国家,二手车 ( 旧车 ) 的价格往往比新车差一大截,即使旧车本身没有什么质量问题,一旦旧车进入二手车市场,其价格就会与新车相比差得老远 。 在我国许多城市,二手车市场甚至难以建立起来,原因是进入市场的买车人太少 。 这是为什么呢? 二手车市场的博弈理论为我们解答了这个谜语 。
在二手车市场上,卖车人比买车人更多地知道车的质量情况,但卖车人不会将旧车的质量问题老老实实地告诉买车人 。 买车人也知道这种情形,因此,买车人在开出价格时会考虑到车的质量问题 。 假定没有问题的好车价值 20
万元,有问题的坏车只值 10万元,并且设买车人认为市场上出现好车和坏车的可能性各占一半 。 这时,买车 人开 出的 价格不 会高 于
1/2× 20+1/2× 10=15万元 。 这样,如果卖车人的车果真是好车,他就不会出售,好车退出市场,但当卖车人的车是坏车时,他会十分积极地将只值 10万元的车按 15万元卖给他 。
但买车人知道愿意按 15万元卖的车一定是坏车,从而认定市场上全是坏车 。 所以,除非他愿意买一辆坏车,否则他会退出市场 。 当他愿买坏车时,他只开出 10万元的价 。 于是,旧车市场或者建立不起来,没有买主,或者充斥着坏车,真正的好车退出市场,而坏车在不断成交,但价格很低 。
类似现象广泛存在如人才市场,信贷市场等 。 如一个公司往往流走的是能力强的人,因为公司不能正确评价一个能力强的员工的能力,
给予的薪水低于其市场价值 。
例子 16 维克里拍卖法如果有一件古董需要拍卖,有许多人参加竞争性拍卖 。 这件古董在每个买主心中有一个价值评价 。 但是,卖主不知道买主的评价,买主也不会老实将其对古董的评价告诉卖主 。 不同买主之间也不知道其他人的价值评价 。
如果采用,英式拍卖法,,买主们轮流出价,直到开出最高价的买主拿走古董并支付所开出的最高价格 。 按这种拍卖方法,古董并不能按买主心中的最高评价价值卖出 。 壁如,当买主中的最高评价为 100万元,第二高评价为
90万元时,当评价最高的买主开出 91万元时,
就可买走其评价为 100万元的古董但只支付了
91万元 。 由于这是公开竞价,会出现围标问题,
即买主们合谋压价 。
另一种方法是:,一级密封价格拍卖法,。
买主每人将其开出的价格写入一个信封,密封后交给卖主 。 卖主拆开所有信封,将古董卖给信封中出价最高的买主,并要求支付最高的价格 。 这种方法可避免 围标,但 不能将古董按买主中最高的评价价值卖出 。 因为买主不会按心中的评价老老实实地将价格写为其价值评价 。 如果该买主认为古董值 100万元,他不会写出价格为 100万元,
因为当他开出比 100万更低一些的价格时,有可能赢得古董但净赚一个价值与价格的差额 。 如当他开出 90万元时,有可能成交并净赚 10万元 。 相反,当他开出 100万元时,即使成交也无赚头 。
所以,大家都不会老老实实报出心中的价值 。
经济学家维克里发明的,二级密封价格拍卖法,( 又称维克里拍卖法或维克里招标法 ),既可 避免 围标,又可诱使买主们老老实实地开出心中的真实评价 。
维克里拍卖法要求每个买主写入信封一个出价,密封后交给卖主,卖主拆开信封后宣布将古董卖给出价最高的人,但只需支付开出的第二高的价格 。 譬如,
出价最高的为 100万元,第二高的为 90万元,古董就卖给开出 100万元的人,但他只需支付给卖主 90万元 。
对每个买主来说,他不知道其他买主的评价,但给定其他买主的评价 ( 尽管他不知道 ),他一旦获胜,支付的第二高的价格是固定的,不会随他开出的价格而变;但他开出的价格愈高,获胜的可能就愈大;但是,他不能开出比他的价值评价更高的价格 。 因为一旦存在别的人开出的价格比他的价值评价还要高,当他获胜时,就必须以高出他的价值评价的价格购买古董,对他来说是得不偿失的 。
所以,每个人都会老老实实在按心中的评价开出价格 。 如果所有人的评价是一样的,古董就以真实的最高价值卖出 。
维克里拍卖法可以诱使买主说出真话 。
70年代美国联邦政府运用维克里招标法进行公共工程招标,为联邦政府节省了大笔开支 。
例子 17 垄断厂商的低价销售:信号传递博弈有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品 。 譬如,发达国家的私营铁路,航空,海运码头等的价格都远低于按照其垄断定价方法定出的价格 。 这是什么原因呢?
记得有一个电视剧,其中有一个情节是一位武林豪杰在交通要道边开了一个酒馆 。 生产十分兴隆,引起另一位武林高手的垂涎 。 这位武林高手决定打败那位豪杰然后霸占酒馆 。 两强相遇,武林豪杰和武林高手相互之间不知对方底细,于是来一番比试 。 本来,他们俩可以通过打斗来解决问题,但打斗一场双方都会有所损伤,不如通过其他方式比较武功高低 。 豪杰拿来 5块砖,一掌将其击碎,高手也不示弱,
照样击碎 5块砖 。 于是,豪杰又拿来十块砖,
同样是一掌击个粉碎,高手见之,心中没底,
于是明白自己武功较豪杰还差一截 。 于是,这位武林高手甘拜下风,放弃了原来的计划,弃剑而去 。
这个电视剧情节在博弈论中被称为
,信号传递博弈,。 豪杰身怀绝技,天下无敌 。 但其他人不一定会相信他是武林第一高手,除非亲自与之交手并败于他 。 交战虽然可以决出高下,但对双方都会有损失,打个头破血流对谁都不是好事 。 当然,豪杰可以对外宣布他的武功非凡,其他人不是他的对手,但即使豪杰没有什么本事,也可以如此对外宣布 。 所以,仅凭口头宣布是难以令人信服的 。
俗话说,是骡子是马,拉出去 蹓蹓 。 豪杰用过人武功劈掉别人难以模仿的十块砖,就向别人发出一个信号 。 这个信号向外传递的信息是:我的武功高强,你们不可匹敌 。 这样,不用打斗就决出高下,避免了打斗带来的更大损失 。 现在,我们用这个,信号传递博弈,的原理,来解释为何一些垄断厂商长期在低价格水平上经营 。 如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营 。
由于垄断厂商有更低的生产成本,所以,
它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于成本,两种情形进入者都会亏损,最后不得不退出行业 。 但是,这种,打斗,行为尽管可以击退进入者,但由于一段时间的降价经营可能对垄断者带来较大损失 。 垄断者为了避免这种损失,可以向外宣布它是低成本的,别的厂商休想进来与它竞争 。 但仅凭口头宣布人家是不会相信的,因为即使垄断者不是低成本的厂商,它也会如此宣布 。
一种方法就是,正如电视剧中的故事那样,垄断者向外发送一个信号,向外界传递它真是低成本的信息 。 它可以长期在一个较低价格水平上经营 。 如果它的价格足够低,高成本厂商不敢模仿,
行内厂商会据此判定它确是低成本的 。
同时,它的价格也不能太低,以致于较之与进入者进行降价竞争,其损失为小一些 。 这样,垄断者才会采取如此策略 。
潜在的高成本进入者不敢进入,垄断者得以保持长期的垄断地位 。
例子 18 为什么有的商品广告既无商品的价格信息又无售货地点信息,只有明星的表演?
通常认为,商业广告的功能是向消费者提供必要的购货信息,如散布商品的价格,质量功能,出售地点等信息 。 再者,人们还认为有些广告可能是为了引导消费,特别是新产品出现时,消费者还不知道不熟悉它,商业广告中通过一些电影明星使用新产品的图象,利用公众的,追星,心理打造市场 。 这种关于新产品市场引导的广告在国外的电视广告中特别常见,
通常是一位当红明星在电视上用新产品表演一番,既无价格,也无售货地点的介绍,除了显示一下商标外,完全没有对产品性能的说明 。
不过,对于这类广告,博弈论还有一种,信号传递,的解释呢?
假设有一家企业 ( 记为企业 A) 开发出一种很有市场潜力的饮料,该产品饮后对人的健康确实有好处 。 但同时,另一家生产假冒伪劣产品的企业 (记为企业 B) 也准备向市场推出一种伪劣产品饮料 。 两个企业都会向公众宣布其产品是上乘的,如何如何的好 。 但公众是理性的,不会仅凭商业宣传就相信它们 。 但是,如果产品真的好,随着时间的推移,消费者能够识别出来 。 所以,生产好饮料的的企业 A对自己的市场有信心,它相信随着时间的推移,企业 B生产的伪劣产品终究会被消费者识破,
顾客会跑到自己这里来,从而自己的市场会不断扩大,销售收入及利润会不断增长,而企业 B开始可以蒙骗一部分消费者,但时间一长,产品的问题会暴露出来,市场会不断缩小,
收入及未来利润都不会有企业 A的大 。 这样一来,企业 A的未来预期收入远大于企业 B。 因此,
如果企业 A请一位当红明星打广告,由于是当红明星,他们打广告有很高的市场价格,就可以使企业 B不敢模仿 。 譬如,假定企业 A的预期收入为 3千万元,企业 B的预期收入为 1千万元 。
当红明星打广告的市场价格为 2千万元,那么,
企业 A可以请明星打广告但企业 B就请不起 。
消费者也明白这个道理,从而会在一开始就识别出不能请当红明星打广告的企业 B是生产伪劣产品的 。 这样,企业 B一开始就没有市场 。 当企业 A请了当红明星打广告时,企业 B
发现这位明星的市场价格太高,自己难以模仿企业 A,开始就会放弃生产伪劣产品的计划 。
所以,企业 A通过请当红明星打广告而清除掉了潜在的市场模仿者,它向公众传递自己是生产好产品的信号,这种信号的价值在于其所请来的当红明星有着较高的出场价格,而不在乎明星在广告节目中说了什么,表演了什么,当然更无所谓广告节目是否介绍产品价格等信息了 。 企业 A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号 。
例子 19 为什么许多实力雄厚的公司还要向银行借很多钱?
在国外,一些资金实力雄厚的公司通常也会向银行贷款 。 更加令人感到奇怪的是,一些好的公司,一方面自己借钱给别的公司,同时,另一方面又向银行借钱 。 博弈论运用,信号传递,原理可以对此现象作出解释 。
对于一家公司来说,负债增加会增大公司破产的可能性;但是,对于实力雄厚的公司,在同样负债比例下,其破产可能性要小一些 。 每个公司都会向社会吹嘘自己是好的公司,实力雄厚,但公众不会仅凭口头宣传就相信的 。 于是,
真正好的公司通过向银行借钱来增大自己破产的可能性,令其它实际上不好的公司难以模仿 。 这种负债比例的增加要做到恰到好处,它既可令其它实力稍弱的公司难以模仿,又使自己能够承受 。
这样,公众就能识别出谁是好的公司,从而竞相购买好的公司的股票,导致公司股票价格上涨,结果这家负债公司会因其股价上涨而获资本增值,破产的可能性反而下降了 。
当然,公司通过增加负债来向投资者传递公司信息的代价可能太高,因而有时公司十分乐意向投资者直接披露内部信息,只要这种信息足以使投资者相信其真实性,就会为公司减少信息传递成本 。
(问题 3:在中国是否负债比例高的公司就是好的公司? )
例子 20 飞机、轮船等设立头等舱、经济舱的道理是什么?
无论是买票乘飞机、火车还是轮船,不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些,或对花钱看得比较松一些,
就可以支付较高的价格,相反,收入低的人或对花钱看得比较紧一些的人,就只愿支付较低的价格。但是,如果你问他们愿意支付什么样的价格,他们都必定说愿支付较低的价格,因为既使有钱人有也会在同样服务下以低价购买划算一些。
飞机或轮船公司为了将这些在经济学中被称为具有不同支付意愿的人区分开来,让能支付较高价格的人支付较高价格,就设计了一种,信息甄别,的机制,这种机制就是设立头等舱,二等舱,
三等舱,……,等等 。 这种机制发挥作用的道理是这样的,我们可以用著名的
,所罗门王断案,的故事来说明 。 所罗门王是古代以色列国的一位以智慧著称的君主 。
一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主 。 所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半 。
这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半 。 听罢这位妇人的求诉,所罗门王立即作出最终裁决 ——婴儿是这位请求不杀婴儿的妇人的,应归于她 。
这个故事讲的道理是,尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的 。 所罗门王正是利用这一点,一下就识别出谁是婴儿的真正的母亲了 。 所罗门王的这种方法在博弈论中被称为,机制设计,,即设计一套博弈的规则,令不同类型的人作出不同的选择,尽管每个人的类型可能是隐藏的,
别人观察不到,但他们所作出的不同选择却是可以观察到的 。 观察者可以通过观察不同人的选择而反过来推演出他们的真实类型 。
当飞机或轮船的舱位条件和价格完全一样时,不同支付意愿的人都会以最低价格买票,不会有人愿支付比别人更多的钱去买相同的舱位的票 。 于是,航空公司或轮船公司将舱位分成头等舱,
二等舱,……,等等,价格稍有不同,
当然服务也不同,就将不同支付意愿的顾客区分开了 。
头等舱比其它较低等级舱位的价格高许多并不主要是因为它的服务要比其它舱位的服务好许多 ( 当然还是要好一些 ),而是因为那些坐头等舱的人的支付能力比其它舱位的旅客的支付能力要强许多,说白了,就是坐头等舱的人比坐其它舱位的人更有钱或更能花钱而已 !
但是,如果航空公司或轮船公司不对舱位作如此区分,即使是有钱人也不会愿意坐同样的舱位而支付比别人支付的更高的价格 。
这里,支付能力是旅客的类型,选择舱位等级是他们的选择 。 支付能力无法观察,但买什么舱位的票却能够观察,航空或轮船公司因此而识别出可以支付更高价格的顾客而赚取更多利润 。
譬如,有两位旅客甲和乙乘飞机 。 甲的最高支付能力为 1000元,乙的最高支付能力为
1500元 。 经济舱的服务成本为 800元,头等舱的服务成本为 1200元 。
经济舱带给甲和乙的消费满足感
( 经济学中称为效用 ) 为 1000元,头等舱带给甲和乙的效用为 1800元 。 如果没有头等舱,航空公司最多把票价定到
1000元,利润为 2× ( 1000-800) =400元 。
因为票价一旦高于 1000元,甲和乙就不会买票了 。 但当设立头等舱后,航空公司将经济舱票价定为 1000元,将头等舱票价定为 1500元 。 此时,甲以 1000
元买经济舱 。
乙如果买经济舱,则其净效用 ( 经济学称为消费者剩余 ) 为 1000-1000=0,
但当乙买头等舱票时的消费者剩余为
1800-1500=300元,所以乙会买头等舱 。
甲的支付能力只有 1000元,所以甲只有买经济舱 。 这时,航空公司的利润增大为 (1000-800)+(1500-1200)=500元 >400元 。
通过机制设计增大了公司利润 。
类似的还有,酒店的星级分类,
五星级、四星级、三星级,…… 酒店,冰棍的不同品种与价格,影剧院的不同座位价格表等等,都是实现信息甄别的机制设计。
例子 21 大智若愚中的智慧,聪明过头没好处美国 19世纪有一个颇有成就的政治家,
其幼年时是流浪街头的孤儿 。 他经常在大街上向行人讨钱,但当有人让他在一块钱和两块钱之间选择时,他选择了一块钱 。 于是,
许多人都为了亲眼验证关于他的,犯傻,行为的传闻,专门来找他并让他在一块钱和两块钱之间选择 。 他仍然依然故我地只选择一块钱,于是来找他的人愈来愈多 。
终于有一天,有一位女士问他:难道你不知道两块钱比一块钱更多一些钱吗? 他如此回答道:如果我有一次选择了两块钱,就不会有人来找我让我在一块钱与两块钱之间选择了,我也讨不到钱了 。
这个故事告诉我们有时候,扮傻,
也许是有好处的 。 下面再来看一个例子,
这是一个动态博弈,局中人 A有两次决策机会,一次在局中人 B决策之前,另一次在 B决策之后 。
图 4 一个动态博弈运用,逆向归纳法,,A在第二次决策时会选择
,B选择 L;给定这些结果,A在开始会选择
U,纳什均衡是 ((U,),L)。
(2,0)
(1,1)
(3,0) (0,2)
D B
R AU L
A
U?
U?
U?
D?
但是,如果局中人 A开始,装傻,,
选择 D而不是 U,当 B认为 A是傻子时,B
会以为当他选 R后 A会选,而这正是 B
所乐意看到的结果 。 于是,当 A开始装傻后,造成 B对 A的类型的误解,B以为
A是傻子,从而预期当他自己选 R后 A还会,犯傻,选 。 于是 B就选 R而不是均衡中的 L。 但是,当 B选了 R后,A不再,装傻,而一举选 达到最大支付 3。
这就是 A通过,装傻,骗过 B使 A获利 。
D?
D?
U?
第二种情形是,局中人 B“装傻,,
并使 A相信他是傻子 。 这样,A会认为当他选 D时 B会选 R。 于是,A开始就选 D,
但一旦 A选了 D,B就不再,装傻,,一举选 L。 这是 B骗过 A的情形 。
下面的一个例子是当所有局中人都
,装傻,时,所有人都受益的情形 。
图 5 所有人都“装傻”使所有人都受益的博弈由逆向归纳法,博弈均衡是所有人都选择 D,
即 ( D,…,D) 。 结果是博弈在一开始就结束了,每个局中人都获得支付 1。
A U B
D D
B
D
A U
D
B
D
A U
D
U (100,100)
(1,1) (0,3) (98,98) (97,100) (99,99)(98,101)
……
如果 A开始就装傻,选 U而不是 D,B
也装傻,选 U不选 D,则博弈到最后结束时每个局中人得到支付 100。
相反,下面用一个例子说明当所有人都,聪明过头,时,所有人都受损失的道理 。
有这样一个故事,称为,旅行者困境,,说的是有两个旅行者甲和乙从一个以出产花瓶的著名旅游胜地回来时,
他们都买了花瓶 。
提取行查时,发现花瓶被碰破了 。
他们向航空公司索赔 。 航空公司估计花瓶的价格在 80或 90元的价位左右,但不知道这两位旅客购买的准确价格 。 航空公司要求两位旅客在 100元以内自己写下花瓶价格 。 若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,
但是对讲真话的旅客奖励 2元钱,对讲假话的旅客罚款 2元 。
如果两人都写 100元,他们都会获得
100元 。 但是,给定乙写 100元,甲改写
99元,则他会获得 101元 。 乙又想,若甲写 99元,他自己写 98元,比写 100元好,
因为这样他获 100元,而写 100元当甲写
99元时自己却只获 97元 。 而给定乙写 98
元,甲又会写 97元,……,这样,最后落得每人都只写 1,2元的境地 。
所以,还是古人说得好,有时,大智若愚,可能还是上策呢?
小孩玩的游戏,石头,剪子,布,,
也是一种博弈 。 但是,这个博弈有一种有趣的特征,即给定一方的任何选择,
另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的 。 任何,纯战略,都不是最优的,纯战略是,石头,剪子,布,中的任何一个 。
六、混合战略博弈但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招 。 事实上,可以通过数学证明,当双方都以每个战略按 1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面 。
这被称为,混合战略纳什均衡,,而这种以随机方式选择纯战略的博弈被称为
,混合战略博弈,。
以混合战略博弈的概念,我们来看下面几个例子 。
例子 22 为什么一般人总是小错不断,大错不犯;偷税漏税的一般是中小企业,
大企业会老老实实地交税?
税务部门不会对所有企业的交税情况每一次都去检查,因为这样做的成本太高,得不偿失 。 所以,税务部门总是随机地对企业的交税情况进行检查 。
企业也是随机地在交税与偷漏税之间进行选择 。 税收部门与企业间进行的是混合战略博弈 。 因为如果企业总是交税,税务部门就最好不检查;但给定不检查,企业就会偷漏税 。 所以,两者只有在随机地检查与不检查,企业随机地在偷漏税与交税之间选择,才会达成均衡 。
对于大企业,因一旦偷税就数目巨大,所以,税务部门在随机检查时放在大企业上的可能性就大一些;而给定税务部门检查大企业的可能性较大,大企业偷漏税的行为就较少,否则就容易被逮个正着 。 所以,偷漏税较多的就是一些中小企业,大企业纳税的积极性较高 。
同样,大人物或有钱人纳税的积极性应较高,
至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致 。 同样的道理,在犯罪或对错误的监督惩罚博弈中,也是混合博弈,人们可能总是大错不犯小错不断 。
例子 23 田忌赛马新编春秋战国时期,齐威王常与旗下大将田忌赛马 。 规则是:每次赛三局,每一局齐威王与田忌各出一匹马比赛奔跑速度 。 每一局中的胜者赢败方一千斤铜 。 田忌有上,中,下三匹马,
而齐威王也有上,中,下三匹马 。 每次比赛,
第一局田忌出上马,齐威王也出上马;第二局田忌出中马,齐威王也出中马;第三局,田忌出下马,齐威王也出下马 。 齐威王的上马比田忌的上马好,齐威王的中马也比田忌的中马好,
齐威王的下马还是比田忌的下马好 。 于是,每次比赛的结果都是田忌连输三局 。
田忌的谋士孙膑了解了田忌的困境后,就打听到这样一个消息:尽管齐威王的上,中,下三匹马都要比田忌的对应上,中,下三匹马好,但碰巧的是田忌的上马可胜齐威王的中马,田忌的中马可胜齐威王的下马 。 于是,孙膑为田忌献计:下一次比赛中第一局时田忌出下马对齐威王的上马输一局,第二局田忌出上马对齐威王的中马,第三局田忌出中马对齐威王的下马,这样可连赢两局,最后净胜一千斤铜 。 田忌依计而行,
果真赢回一千斤铜 。
这个故事曾经被很多人当作博弈论的例子来演绎,但实际上这个故事与博弈论无关 。 博弈论会假定所有局中人都是理性的,不能假定一些局中人聪明而另一些局中人却是傻子 。 当田忌出下马时,齐威王最好的选择是出下马而不是上马 。 孙膑的计谋中假定齐威王是傻子,
当田忌出下,上,中马时,他仍然按上,中,
下马出,当然要输了 。 事实上,当田忌出下马时,齐威王应出下马,但齐威王出下马时,田忌不应出下马而是出中马,但此时齐威王又应出中马而不是下马了,…… 。 这样,博弈不会有纯战略的均衡 。
两人只能玩混合战略博弈,齐威王分别以 1/6随机的概率选择出上,中,下马的任一排列,田忌也如此 。 由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜 。
例子 24 如果曹操与诸葛亮一样聪明:
三国演义中的华容道博弈在,三国演义,中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜 。 诸葛亮命关羽率兵在途中阻截曹军 。 当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击 。 由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢劫一些军械马匹之类 。
待曹军冲过赵云,张飞两道关后,
进入关羽的伏击地带 。 但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条道 。 诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来 。
当时关羽不解,问诸葛亮,,如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?,诸荀亮叫关羽不要再问,
只如此照办即可 。
当曹操冲破赵云,张飞的阻截后,
来到华容道前,看见华容道上静悄悄的,
但有烟火萦绕 。 曹操大笑道:,孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢 ! 我偏不上他的当 !,
于是,曹操令大军径直上华容道上而去,
结果与关羽大军撞个正着 。
曹操为何进了孔明的圈套呢? 这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避开华容道而走另一条路 。 如果孔明令关羽在另一条路等着,曹操就被逮住了 。 但是,曹操不仅聪明,而且还聪明过人,他也知道孔明的如此盘算来诱他上钩,他偏不上当,知道点火的华容道上无人,孔明的队伍在另一条道上呢 ! 于是他选择走华容道 。
但是,依,三国演义,作者罗贯中的逻辑,孔明总是比曹操计高一筹,按博弈论的术语来说,就是孔明的理性程度要比曹操高上一阶 。 孔明也知道曹操知道孔明的打算,于是令关羽正好在点火的华容道上等着曹操 。,三国演义,
中的这个故事很可能是作者编造的,因为在,三国志,中并无这一情节 。 这里,
罗贯中假设了曹操在智力上比孔明差一些,才有华容道上被关羽抓住,要不是关羽旧情难忘,曹操就死无葬身之地了 。
但是,如果我们不假定曹操比孔明要笨一些,而是相反假定曹操与孔明一样聪明,则曹操又知道孔明知道曹操知道孔明的打算,曹操就会知道关羽在华容道上等着他呢? 此时曹操就避开华容道走另一条路 。 但是,这还没有完,因为若孔明知道曹操知道孔明知道 …… 。
显然,最终的结果是曹操与孔明玩混合战略博弈,曹操随机地以 1/2的概率选择走华容道和另一条路,孔明也以 1/2的概率令关羽守华容道或另一条路 。
于是,,三国演义,中的这一情节就应作如下改写:
诸葛亮抛出一枚硬币,决定关羽是守华容道呢还是另一条道 ……,而曹操也掷出一枚硬币,决定是走华容道呢还是走另一条路 。 平均看来,曹操有 1/2的概率逃脱,而关羽也只有
1/2的概率抓住曹操 。 如果说关羽在华容道上抓住了曹操,则纯属偶然,并非孔明比曹操计高一筹所致 !
如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一个商战中的真实例子。
七、机制设计:
如何走出囚徒困境例子 25 冻结价格战的博弈机制美国有两家销售音像商品的商店
,疯狂艾迪 ( Crazy Eddie) 和纽马克与露易斯 ( Newmark&Lewis),它们之间在市场上存在竞争 。 当它们进行合谋时,
如何保证对方不会背叛而降价的一个前提就是如何能迅速查出对方的背叛行为并给予惩罚 。
“疯狂艾迪,已作出了承诺,不可能有人卖得比我们更低,我们的价格最低廉,我们保证价格最低,而且是超级疯狂的低,。 而对手企业 Newmark&Lewis
也打出,只要买我们的东西,将得到终生低价保证,。 它承诺:假如你能在别处买到更低的价格,我们将加倍退钱,广告还承诺:
假如你在本店买了商品之后,在你一生中于任何本地的销售商 ( 本行销区内 ) 那里发现相同的广告款式而价格却较本店低的话 ( 以单据为凭 ),本店愿支付百分之百的差价,并额外付给差价的百分之二十五 ( 以支票支付 ) ;或是给你差价百分之二百的本店换货单 ( 除了原差价的百分之一百外,再额外加给百分之百,都是以换货单方式支付 ) 。
——Newmark&Lewis公司终身低价保证乍一看,这两家企业在玩命竞争,
根本不可能形成价格联盟,即使形成也难以维持,因而它们之间似乎是在打价格战 。 但是,一种潜在的侦察降低价格行为的机制阻止了价格战的发生 。
若每台录相机的批发价为 150美元,
此时两家企业正以每台 300美元的价格出售 。,疯狂艾迪,打算降为每台 275美元,
从而将对手的顾客拉过来,如那些家住在对手售货点附近或过去曾买过对手商品的顾客 。
但是,对手的战略锁定了,疯狂艾迪,的行为,因为,疯狂艾迪,的这一计划会有相反的效果 。 因为顾客会到对手那里先以 300美元买下录相机,然后再获退款 50美元 。 这样,对手自然将价格降到更低的价格 250美元一台,顾客反而是从,疯狂艾迪,那里流向对手而不是相反 。
如果对手不想以 250美元一台出售录相机,他也可以将价格降到 275美元一台,
只要它发现有顾客来要求退款,就会发现对手的背叛行为,从而将价格降到了
275美元一台 。 既不以太低价出售,又快速发现对手的背叛从而以降价予以报复,
使对手降价也不能增大顾客量,从而蒙受损失 。
这样,,疯狂艾迪,就没有进行价格战的意愿了,自然形成价格联盟 。 在美国,明目张胆的价格合盟是违法的,
但这两家企业却以不违法的方式形成了价格合盟,顾客成了背叛行为的侦察者,这一战略是十分巧妙的 。
博弈论中涉及到的生活中的各种经济学道理是十分多而有趣的。 这里因时间关系还有许多有趣的例子没有为大家介绍,各位听众有机会可以通过其它的著作了解到博弈论深遂的道理及其在经济分析中的应用,希望大家能通过这种学习能对博弈论有更深入的认识。
八、总结
(Morgenstern)于 1944年创立的带有方法论性质的学科,它被广泛应用于经济学,人工智能,
生物学,火箭工程技术,军事及政治科学等 。
1994年,三位博弈论专家即数学家纳什 (Nash,
他的故事被好莱坞拍成电影,美丽心灵,,该影片获得了 2002年奥斯卡金像奖的四项大奖 )、
经济学家海萨尼 ( Harsanyi) 和泽尔滕 ( Selten)
因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖 。
1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯
(Mirrlees)和维克里 (Vickrey),以及 2001
年三位经济学家阿克洛夫 (Akerlof),斯蒂格利茨 (Stiglitz)和斯宾塞 (Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主 。 专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖 。
为什么博弈论在经济学领域会产生如此大的影响呢? 这是因为博弈论从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订 。
博弈论是一门十分有趣但理论上又是十分艰深的学问,这里打算用一些大家能够凭直观或简单分析就能把握的例子为大家介绍博弈论的基本概念及应用,
以引起大家对这门目前已成为热门科学的兴趣和获得初步的了解 。 这些例子也是我们在日常生活中经常所遇到的问题或观察到的现象,通过博弈论,我们能够更加深刻地理解它们 。
1,囚徒困境两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据 。 警方将两人分别臵于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱 10年;若二人都招则两人各判刑 8年 ;若两人都不招则未获证据但因私入民宅各拘留 1年 。
一、什么是博弈论:从,囚徒困境,谈起表 1 囚徒困境博弈乙招 不招招甲不招
( 问题 1:甲,乙如何选择? )
-8,-8 0,-10
-10,0 -1,-1
尽管甲不知乙是否招供,但他认为自己选,招,最好,因而甲会选择
,招,,乙也同样会选择,招,,结果各判 8年;但若两人都不招,结果是两人只被判 1年,但这种结果是不会出现的 。
我们可以运用,剔除劣战略,的方法来获得这样的结果 。
甲或乙可以作出的选择被称为,战略,,如,招,或
,不招,都是战略 。
对甲来说,尽管他不知道乙是选择了,招,还是,不招,,他发现他自己选择,招,
都是比选择,不招,为好的 。 因此,
,不招,是相对于,招,的劣战略,他不会选择劣战略 。 所以,甲会选择
,招,。
同样,根据对称性,乙也会选择
,招,,结果是甲乙两人都,招,。
甲和乙是参与博弈的人,称为,局中人,。
表 1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付 。 表 1中的双变量矩阵称为博弈支付矩阵 。
局中人所选择的战略构成的组合 ( 招,招 )
被称为博弈均衡 。 这个组合中前后两个战略分别表示甲和乙所选择的战略 。
甲和乙都不会选择劣战略,不招,,称为,剔除劣战略的占优战略均衡,。 其中,招,是占优于 (优于 )“不招,的占优战略 。
我们可以利用这个道理来分析日常生活中的许多不合作现象 。
2,生活中的“囚徒困境”例子例子 1 商家价格战出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱 。
当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来 。
譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个,彩电厂家价格自律联盟,,并在深圳举行了由多家彩电厂商首脑参加的,彩电厂商自律联盟高峰会议,。 当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓,自律联盟,,国家在法律上暂时还是无能为力的 。 寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,
这在发达国家是不可思议的 。
但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨 。
这是因为,,彩电厂商自律联盟,只不过是一种,囚徒困境,,彩电价格不会上涨 。 在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌 。 这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的 。
例子 2 为什么政府要负责修建公共设施,因为私人没有积极性出资修建公共设施设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路 。 修一条路的成本为 4,每个农家从修好的好路上获得的好处为 3。 如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处 ( 支付 ) 为 3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为 3-4=-1
( 亏损 ),,搭便车,不出资但仍然可以使用修好的路的另一户人家获得支付 3-0=3,见表 2。
表 2 修路博弈乙修 不修修甲不修
1,1 -1,3
3,-1 0,0
我们看到,对甲和乙两家居民来说,
,修路,都是劣战略,因而他们都不会出资修路 。
这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税 2
单位,然后投入 4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善 。
这就是我们看到的为什么大多数路,
桥等公共设施都是由政府出资修建的原因 。
同样的道理,国防,教育,社会保障,环境卫生等都由政府承担资金投入,
私人一般没有积极性承担这方面服务的积极性和能力 。
例子 3 苏格兰的草地为什么消失了? 公共资源经常被过度利用的原因 。
在 18世纪以前,英国苏格兰地区有大量的草地,其产权没有界定,属公共资源,大家都可以自由地在那里放牧 。
草地属于,可再生资源,,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,
草场就会消失 。
由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民都会如此盘算:如果其他牧民不约束自己的放牧规模,让自己的牛羊过多地到草地上吃草,那么,我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的,不会使草场免于破坏;相反,
我也加入过度放牧的行列,至少在草场消失之前还会获得一部分短期的收益 。
如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧场,
但自己却获得了高额的收益 。 因此,任何一位牧民的结论都会是:无论其他牧民是否过度放牧,我选择,约束自己的放牧规模,都是劣战略,从而被剔除 。
大家最终都会选择过度放牧,结果导致草地消失,生态破坏 。
类似的例子还有:
渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,
为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。
例子 4 为什么在城市中心道路上禁止汽车鸣喇叭?
禁鸣喇叭一方面是为了控制城市噪声污染,另一方面是基于以下的博弈论原因 。 见表 3,当汽车司机可以鸣喇叭时,
可能为汽车超速抢行提供条件 。 但当大家都抢行时,城市交通拥挤加重,反而都难以顺利通行,获得低支付 ( 2,2)。
表 3 交通博弈司机 2
缓行 抢行缓行司机 1
抢行
8,8 1,9
9,1 2,2
但当对方缓行时,自己抢行会占便宜,获得支付 9。
这个博弈中,,缓行,是劣战略,
剔除后得到,剔除劣战略后的占优战略均衡,( 抢行,抢行 ),这不是一个好的均衡 。 当禁止鸣喇叭时,司机为了避免造成交通事故,只得缓行,从而得到好的结果 ( 缓行,缓行 ) 。
例子 5 为什么要加入 WTO?
WTO是一个自愿性申请加入的自由贸易联盟,即 WTO成员国之间实现低关税或零关税的相互间自由贸易。为什么需要一个组织来协调国家之间的自由贸易呢?这是因为,如果没有一个协调组织,国与国之间的贸易就不会呈现低关税或零关税的自由贸易局面,因为这时国与国之间的贸易是一个“囚徒困境”。给定一个国家对另一个国家的货物实行低关税,
另一个国家反过来对这个国家的货物实行高关税是占优于实行低关税的战略的。
1,智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有 10单位的猪食进槽,但每按一下按钮会耗去相当于 2单位猪食的成本 。 如果大猪先到食槽,则大猪吃到 9单位食物,小猪仅能吃到 1单位食物;如果两猪同时到食槽,则大猪吃 7单位,小猪吃 3单位食物;如果小猪先到,
大猪吃 6单位而小猪吃 4单位食物 。 表 4给出这个博弈的支付矩阵 。
二、智猪博弈:对诸多经济现象的解释表 4 智猪博弈小猪按 等待按大猪等待
5,1 4,4
9,-1 0,0
这个博弈没有,剔除劣战略均衡,,因为大猪没有劣战略 。
但是,小猪有一个劣战略,按,,因为无论大猪作何选择,小猪选择,等待,是比选择
,按,更好一些的战略 。
所以,小猪会剔除,按,,而选择,等待,;大猪知道小猪会选择,等待,,从而自己选择,按,,所以,可以预料博弈的结果是
(按,等待 ) 。 这称为,重复剔除劣战略的占优战略均衡,,其中小猪的战略,等待,占优于战略,按,,而给定小猪剔除了劣战略,按,
后,大猪的战略,按,又占优于战略,等待,。
2,例子在经济生活中,有许多,智猪博弈,的例子 。
例子 6 股市博弈在股票市场上,大户是大猪,他们要进行技术分析,收集信息,预测股价走势,但大量散户就是小猪 。
他们不会花成本去进行技术分析,而是跟着大户的投资战略进行股票买卖,即所谓,散户跟大户,的现象 。
例子 7 为何股份公司中的大股东才有投票权?
在股份公司中,大股东是大猪,他们要收集信息监督经理,因而拥有决定经理任免的投票权,而小股东是小猪,
不会直接花精力去监督经理,因而没有投票权 。
例子 8 为什么中小企业不会花钱去开发新产品?
在技术创新市场上,大企业是大猪,
它们投入大量资金进行技术创新,开发新产品,而中小企业是小猪,不会进行大规模技术创新,而是等待大企业的新产品形成新的市场后生产模仿大企业的新产品的产品去销售。
例子 9 为什么只有大企业才会花巨额金钱打广告?
大企业是大猪,中小企业是小猪 。 大企业投入大量资金为产品打广告,中小企业等大企业的广告为产品打开销路形成市场后才生产类似产品进行销售 。
表 5给出的博弈中,甲和乙都没有劣战略,所以,不能通过重复剔除劣战略获得博弈结果。
三、纳什均衡与商业中心区的形成表 5 存在纳什均衡的博弈乙
L M R
U
甲
D
( 问题 2,甲和乙分别会选择什么战略? )
1,1 4,2 1,3
2,3 1,2 2,1
当甲选,U”时,乙会选,R”;
而当乙选,R”时,甲应该选,D”而不是,U”;但当甲选,D”时,乙会选,L”;给定乙选,L”,甲选,D”
是最好的选择,他不会改变选择
,D”;给定甲不改变选,D”,乙也不会改变其选择,L”。 所以,可以预期 ( D,L) 是甲乙最终完成的稳定的选择 。
称 ( D,L)为,纳什均衡,。 纳什均衡是局中人战略选择上构成的一种,僵局,,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选择 。 剔除劣战略的占优战略均衡和重复剔除劣战略的占优战略均衡是纳什均衡,但相反的结论不成立 。
在城市街道上,我们常见到一些地段上的商店十分拥挤,构成一个繁荣的商业中心区,但另一些地段却十分冷僻,
没什么商店 。 对于这种现象,我们可以运用纳什均衡的概念来加以解释 。
甲乙
1/2
图 1 商业位置博弈
·
见图 1,有一个长度为 1单位的街道,在街道两边均匀地分布着居民 。
现有两家商店决定在街道上确定经营位臵 。 如果甲在街道中间位臵 1/2
处设店,则乙的最好选择是紧靠甲的左边或右边设店 。
当乙在甲的右边紧靠甲设店时,其右边街道上的顾客都是乙的顾客;如果乙不是紧靠甲而是远离甲设店,则其顾客只是其右边街道的居民,不如它紧靠甲设店时多,因而在远离甲的位臵设店是劣战略 。 所以给定甲在 1/2处设店,乙在紧靠甲的左边或右边设店是最优的 。
反过来,给定乙在接近 1/2处设店,甲的最优选择也是在 1/2附近设店 。 这样,甲和乙挤在 1/2处设店就是纳什均衡,这就是商业中心区的形成原理 。
如果局中人在进行行动选择时有先后顺序之分,这种博弈就被称为,动态博弈,。
在图 2中,有两个房地产开发商 A和 B
分别决定在同一地段上开发一栋写字楼 。
由于市场需求有限,如果他们都开发,
则在同一地段会有两栋写字楼,超过了市场对写字楼的需求,难以完全出售,
空臵房太多导致各自亏损 1百万 。
四,动态博弈与承诺行动当只有一家开发商在这个地段开发一栋写字楼时,它可以全部售出,赚得利润 1百万 。 假定 A先决策,
B在看见 A的决策后再决策是否开发写字楼 。 在图 2中,
用,博弈树,表示博弈过程 。
图 2 房地产开发博弈
A 不开发开发
B B
开发 不开发开发 不开发
(-1,-1) (1,0) (0,1) (0,0)
在其中每一条,路径,的末端用向量给出 A和 B的支付,称为支付向量 。
下面用,逆向归纳法,可以求解这个博弈 。 在 B进行决策的 2个,决策结,
上,B在左边的决策结上选择,不开发,;而在右边的决策结上选择,开发,。 即给定 A开发,B就不开发;给定
A不开发,B就开发 。 B应避免同时与 A
都选择开发而蒙受损失 。
在这种情况下,A在自己的决策结上当然选择,开发,,因为他预计当自己选择,开发,
后,B会选择,不开发,,自己就净赚一百万 。
当 B威胁 A说:,不管你是否开发,我都会在这里开发写字楼 。,倘若 A将 B的话当了真,
A就不敢开发,让 B单独开发写字楼占便宜 。
但是,B的威胁是,不可臵信,的 。
当 A不理会 B的威胁而果断地开发出一栋写字楼时,B其实不会将事前的威胁付诸实施 。
因为,识时务者为俊杰,,在 A已开发的情况下,B的最优决策是,不开发,而不是,开发,。
但是,如果 B在向 A发出威胁的同时又当着 A的面与第三者 C打赌一定要在该地段上开发出一栋写字楼,
否则输给 C 2百万元 。 B与 C为此签定合同并加以公证有效 。
这时,博弈变成图 3所示的动态博弈 。
图 3 承诺行动后房地产开发博弈
A 不开发开发
B B
开发 不开发开发 不开发
(-1,-1) (1,-2) (0,1) (0,-2)
称 B的这种行动为,承诺行动,,
它使原来不可臵信的威胁变为可以臵信 。
这时,A就不得不相信 B一定要开发写字楼的威胁了,于是放弃开发写字楼的计划,让 B如愿以偿单独开发写字楼 。 B不仅未向 C支付 2百万元,反而净赚 1百万 。
我们可以运用,承诺行动,的原理来分析许多经济及军事现象 。
例子 10 项羽的,破釜沉舟,。
例子 11 韩信赵国之战,,置之死地而后生,。
例子 12 欧共体在空中客车与波音公司的竞争中对空中客车公司的战略性补贴 。
欧共体为了打破美国波音公司对全球民航业的垄断,曾放弃欧洲传统的自由竞争精神而对与波音公司进行竞争的空中客车公司进行补贴 。
当双方都未获得政府的补贴时,
两个公司都开发新型飞机会因市场饱和而亏损,但若一家公司开发而另一家公司不开发时,则开发的那家公司会获巨额利润,见表 6。
表 6 未补贴时的博弈空中客车开发 不开发开发波音不开发
-10,-10 100,0
0,100 0,0
此时有两个纳什均衡,即一家开发而另一家不开发 。
下面,考虑欧共体对空中客车进行补贴 20个单位的情况 。 此时,
当两家都开发时,空中客车仍然盈利 10单位而不是亏损,博弈矩阵见表 7。
表 7 有补贴时的博弈空中客车开发 不开发开发波音不开发
-10,10 100,0
0,120 0,0
这时只有一个纳什均衡,即波音公司不开发和空中客车公司开发的均衡
( 不开发,开发 ),这有利于空中客车 。
在这里,欧共体对空中客车的补贴就是使空中客车一定要开发 ( 无论波音是否开发 ) 的威胁变得可臵信的一种
,承诺行动,。
例子 13 为什么大人物、大公司要聘请常年律师?
大人物,大公司对声誉十分看重,因而为一些不良人物或公司通过诽谤大人物,
大公司企图迫使大人物,大公司花钱,私了,而获利 。 这是因为,尽管对于一些无端的指控,大人物,大公司可望通过法律手段 ( 打官司 ) 而出清了结,但打官司请律师会增加他们额外的成本 。 如果能花稍少一些钱,私了,,则既使自己清白又省钱,同时诽谤者也获得收入 。
大人物、大公司为了避免这种无端的损失,干脆花钱请常年律师,律师费用已经一次性支付,打官司不会带来额外的花费。这是一个承诺行动,它告诉潜在的诽谤者,大人物、大公司一旦受到无端诽谤必定会让他们吃官司。这样,
大人物、大公司因此承诺行动而使自己得到保护,避免了许多无端指控的发生。
例子 14 如何以弱敌强在战争史上,以弱胜强的例子是很多的。在商业竞争中,以弱敌强也是经常会遇到的情形。在二战中的诺曼底登陆战的谋略策划中,盟军就面临以弱敌强的问题。
盟军有两个可以选择的登陆目标地,一是多佛,二是诺曼底。德国守军在人数上超过了盟军,并且就军事进攻而言,在人数相同的情况下,攻方与守方相比会处于不利的情形。
下面,将这种情形模型化。有一支军队准备进攻一座城市,它有军力两个师。
守城军队有三个师。通往城市有甲、乙两条道路或方向。两军相遇时,人数居多的一方取胜,当两方人数相等时,守方获胜。
假定军队只能整师调动。
攻方战略:
a=两个师集中沿甲方向进攻
b=兵分两路,一个师沿甲方向进攻,
另一个师沿乙方向进攻
c=两个师集中沿乙方向进攻守方战略:
A=三个师集中守甲方向
B=两个师守甲方向,一个师守乙方向
C=一个师守甲方向,两个师守乙方向
D=三个师集中守乙方向用,+”、“-”,分别表示胜和败,见下表守方
A B C D
a
进攻方 b
c
表 1 以弱敌强博弈
-,+ -,+ +,- +,-
+,- -,+ -,+ +,-
+,- +,- -,+ -,+
用,重复剔除劣战略,分析:
进攻方无劣战略,但守方有劣战略,A劣于 B,
D劣于 C,故守方不会采用战略 B和 C,剔除后的博弈变为,守方
B C
a
进攻方 b
c
表 2 守方剔除劣战略后的博弈
-,+ +,-
-,+ -,+
+,- -,+
攻方知道守方不会选 A和 D,他由此知道博弈变成上图所示。此时,攻方就有一个劣战略 b,他剔除 b后得到新的博弈,见下表:
守方
a
进攻方
b
表 3 攻方剔除劣战略后的博弈
-,+ +,-
+,- -,+
此时,两方的形势是相同的,
即攻方尽管开始在军力上劣于守方,
但实际上它只要运用计谋,其获胜的可能与守方是相同的 。
博弈论作为经济学研究的有力工具,
真正大行其道是在 70年代不对称信息下经济行为分析的兴起 。 不对称信息指一些局中人拥有别的局中人不拥有的,私人信息,,也就是说一些局中人知道别的局中人不知道的某些情况 。 下面用一些例子说明这种情形下的博弈行为 。
五、不对称信息下的博弈例子 15 二手车市场为什么难以建立?
在发达国家,二手车 ( 旧车 ) 的价格往往比新车差一大截,即使旧车本身没有什么质量问题,一旦旧车进入二手车市场,其价格就会与新车相比差得老远 。 在我国许多城市,二手车市场甚至难以建立起来,原因是进入市场的买车人太少 。 这是为什么呢? 二手车市场的博弈理论为我们解答了这个谜语 。
在二手车市场上,卖车人比买车人更多地知道车的质量情况,但卖车人不会将旧车的质量问题老老实实地告诉买车人 。 买车人也知道这种情形,因此,买车人在开出价格时会考虑到车的质量问题 。 假定没有问题的好车价值 20
万元,有问题的坏车只值 10万元,并且设买车人认为市场上出现好车和坏车的可能性各占一半 。 这时,买车 人开 出的 价格不 会高 于
1/2× 20+1/2× 10=15万元 。 这样,如果卖车人的车果真是好车,他就不会出售,好车退出市场,但当卖车人的车是坏车时,他会十分积极地将只值 10万元的车按 15万元卖给他 。
但买车人知道愿意按 15万元卖的车一定是坏车,从而认定市场上全是坏车 。 所以,除非他愿意买一辆坏车,否则他会退出市场 。 当他愿买坏车时,他只开出 10万元的价 。 于是,旧车市场或者建立不起来,没有买主,或者充斥着坏车,真正的好车退出市场,而坏车在不断成交,但价格很低 。
类似现象广泛存在如人才市场,信贷市场等 。 如一个公司往往流走的是能力强的人,因为公司不能正确评价一个能力强的员工的能力,
给予的薪水低于其市场价值 。
例子 16 维克里拍卖法如果有一件古董需要拍卖,有许多人参加竞争性拍卖 。 这件古董在每个买主心中有一个价值评价 。 但是,卖主不知道买主的评价,买主也不会老实将其对古董的评价告诉卖主 。 不同买主之间也不知道其他人的价值评价 。
如果采用,英式拍卖法,,买主们轮流出价,直到开出最高价的买主拿走古董并支付所开出的最高价格 。 按这种拍卖方法,古董并不能按买主心中的最高评价价值卖出 。 壁如,当买主中的最高评价为 100万元,第二高评价为
90万元时,当评价最高的买主开出 91万元时,
就可买走其评价为 100万元的古董但只支付了
91万元 。 由于这是公开竞价,会出现围标问题,
即买主们合谋压价 。
另一种方法是:,一级密封价格拍卖法,。
买主每人将其开出的价格写入一个信封,密封后交给卖主 。 卖主拆开所有信封,将古董卖给信封中出价最高的买主,并要求支付最高的价格 。 这种方法可避免 围标,但 不能将古董按买主中最高的评价价值卖出 。 因为买主不会按心中的评价老老实实地将价格写为其价值评价 。 如果该买主认为古董值 100万元,他不会写出价格为 100万元,
因为当他开出比 100万更低一些的价格时,有可能赢得古董但净赚一个价值与价格的差额 。 如当他开出 90万元时,有可能成交并净赚 10万元 。 相反,当他开出 100万元时,即使成交也无赚头 。
所以,大家都不会老老实实报出心中的价值 。
经济学家维克里发明的,二级密封价格拍卖法,( 又称维克里拍卖法或维克里招标法 ),既可 避免 围标,又可诱使买主们老老实实地开出心中的真实评价 。
维克里拍卖法要求每个买主写入信封一个出价,密封后交给卖主,卖主拆开信封后宣布将古董卖给出价最高的人,但只需支付开出的第二高的价格 。 譬如,
出价最高的为 100万元,第二高的为 90万元,古董就卖给开出 100万元的人,但他只需支付给卖主 90万元 。
对每个买主来说,他不知道其他买主的评价,但给定其他买主的评价 ( 尽管他不知道 ),他一旦获胜,支付的第二高的价格是固定的,不会随他开出的价格而变;但他开出的价格愈高,获胜的可能就愈大;但是,他不能开出比他的价值评价更高的价格 。 因为一旦存在别的人开出的价格比他的价值评价还要高,当他获胜时,就必须以高出他的价值评价的价格购买古董,对他来说是得不偿失的 。
所以,每个人都会老老实实在按心中的评价开出价格 。 如果所有人的评价是一样的,古董就以真实的最高价值卖出 。
维克里拍卖法可以诱使买主说出真话 。
70年代美国联邦政府运用维克里招标法进行公共工程招标,为联邦政府节省了大笔开支 。
例子 17 垄断厂商的低价销售:信号传递博弈有许多垄断厂商并未如人们所料想的那样给商品定出一个很高的价格,而是以较低的价格长期销售某种产品 。 譬如,发达国家的私营铁路,航空,海运码头等的价格都远低于按照其垄断定价方法定出的价格 。 这是什么原因呢?
记得有一个电视剧,其中有一个情节是一位武林豪杰在交通要道边开了一个酒馆 。 生产十分兴隆,引起另一位武林高手的垂涎 。 这位武林高手决定打败那位豪杰然后霸占酒馆 。 两强相遇,武林豪杰和武林高手相互之间不知对方底细,于是来一番比试 。 本来,他们俩可以通过打斗来解决问题,但打斗一场双方都会有所损伤,不如通过其他方式比较武功高低 。 豪杰拿来 5块砖,一掌将其击碎,高手也不示弱,
照样击碎 5块砖 。 于是,豪杰又拿来十块砖,
同样是一掌击个粉碎,高手见之,心中没底,
于是明白自己武功较豪杰还差一截 。 于是,这位武林高手甘拜下风,放弃了原来的计划,弃剑而去 。
这个电视剧情节在博弈论中被称为
,信号传递博弈,。 豪杰身怀绝技,天下无敌 。 但其他人不一定会相信他是武林第一高手,除非亲自与之交手并败于他 。 交战虽然可以决出高下,但对双方都会有损失,打个头破血流对谁都不是好事 。 当然,豪杰可以对外宣布他的武功非凡,其他人不是他的对手,但即使豪杰没有什么本事,也可以如此对外宣布 。 所以,仅凭口头宣布是难以令人信服的 。
俗话说,是骡子是马,拉出去 蹓蹓 。 豪杰用过人武功劈掉别人难以模仿的十块砖,就向别人发出一个信号 。 这个信号向外传递的信息是:我的武功高强,你们不可匹敌 。 这样,不用打斗就决出高下,避免了打斗带来的更大损失 。 现在,我们用这个,信号传递博弈,的原理,来解释为何一些垄断厂商长期在低价格水平上经营 。 如果这个垄断厂商是一个低生产成本的厂商,当其它较高生产成本厂商也进入这个厂商所经营的行业与之进行竞争时,原先的那个垄断厂商可以通过降价将进入者赶出这个行业,从而继续维持垄断经营 。
由于垄断厂商有更低的生产成本,所以,
它能够将产品价格降到比进入厂商的生产成本还要低的水平上,这就造成进入者或者高价格经营导致顾客流失,或者同样也降价但价格低于成本,两种情形进入者都会亏损,最后不得不退出行业 。 但是,这种,打斗,行为尽管可以击退进入者,但由于一段时间的降价经营可能对垄断者带来较大损失 。 垄断者为了避免这种损失,可以向外宣布它是低成本的,别的厂商休想进来与它竞争 。 但仅凭口头宣布人家是不会相信的,因为即使垄断者不是低成本的厂商,它也会如此宣布 。
一种方法就是,正如电视剧中的故事那样,垄断者向外发送一个信号,向外界传递它真是低成本的信息 。 它可以长期在一个较低价格水平上经营 。 如果它的价格足够低,高成本厂商不敢模仿,
行内厂商会据此判定它确是低成本的 。
同时,它的价格也不能太低,以致于较之与进入者进行降价竞争,其损失为小一些 。 这样,垄断者才会采取如此策略 。
潜在的高成本进入者不敢进入,垄断者得以保持长期的垄断地位 。
例子 18 为什么有的商品广告既无商品的价格信息又无售货地点信息,只有明星的表演?
通常认为,商业广告的功能是向消费者提供必要的购货信息,如散布商品的价格,质量功能,出售地点等信息 。 再者,人们还认为有些广告可能是为了引导消费,特别是新产品出现时,消费者还不知道不熟悉它,商业广告中通过一些电影明星使用新产品的图象,利用公众的,追星,心理打造市场 。 这种关于新产品市场引导的广告在国外的电视广告中特别常见,
通常是一位当红明星在电视上用新产品表演一番,既无价格,也无售货地点的介绍,除了显示一下商标外,完全没有对产品性能的说明 。
不过,对于这类广告,博弈论还有一种,信号传递,的解释呢?
假设有一家企业 ( 记为企业 A) 开发出一种很有市场潜力的饮料,该产品饮后对人的健康确实有好处 。 但同时,另一家生产假冒伪劣产品的企业 (记为企业 B) 也准备向市场推出一种伪劣产品饮料 。 两个企业都会向公众宣布其产品是上乘的,如何如何的好 。 但公众是理性的,不会仅凭商业宣传就相信它们 。 但是,如果产品真的好,随着时间的推移,消费者能够识别出来 。 所以,生产好饮料的的企业 A对自己的市场有信心,它相信随着时间的推移,企业 B生产的伪劣产品终究会被消费者识破,
顾客会跑到自己这里来,从而自己的市场会不断扩大,销售收入及利润会不断增长,而企业 B开始可以蒙骗一部分消费者,但时间一长,产品的问题会暴露出来,市场会不断缩小,
收入及未来利润都不会有企业 A的大 。 这样一来,企业 A的未来预期收入远大于企业 B。 因此,
如果企业 A请一位当红明星打广告,由于是当红明星,他们打广告有很高的市场价格,就可以使企业 B不敢模仿 。 譬如,假定企业 A的预期收入为 3千万元,企业 B的预期收入为 1千万元 。
当红明星打广告的市场价格为 2千万元,那么,
企业 A可以请明星打广告但企业 B就请不起 。
消费者也明白这个道理,从而会在一开始就识别出不能请当红明星打广告的企业 B是生产伪劣产品的 。 这样,企业 B一开始就没有市场 。 当企业 A请了当红明星打广告时,企业 B
发现这位明星的市场价格太高,自己难以模仿企业 A,开始就会放弃生产伪劣产品的计划 。
所以,企业 A通过请当红明星打广告而清除掉了潜在的市场模仿者,它向公众传递自己是生产好产品的信号,这种信号的价值在于其所请来的当红明星有着较高的出场价格,而不在乎明星在广告节目中说了什么,表演了什么,当然更无所谓广告节目是否介绍产品价格等信息了 。 企业 A请当红明星打广告就为公众传递了它是生产好产品的企业的一个信号 。
例子 19 为什么许多实力雄厚的公司还要向银行借很多钱?
在国外,一些资金实力雄厚的公司通常也会向银行贷款 。 更加令人感到奇怪的是,一些好的公司,一方面自己借钱给别的公司,同时,另一方面又向银行借钱 。 博弈论运用,信号传递,原理可以对此现象作出解释 。
对于一家公司来说,负债增加会增大公司破产的可能性;但是,对于实力雄厚的公司,在同样负债比例下,其破产可能性要小一些 。 每个公司都会向社会吹嘘自己是好的公司,实力雄厚,但公众不会仅凭口头宣传就相信的 。 于是,
真正好的公司通过向银行借钱来增大自己破产的可能性,令其它实际上不好的公司难以模仿 。 这种负债比例的增加要做到恰到好处,它既可令其它实力稍弱的公司难以模仿,又使自己能够承受 。
这样,公众就能识别出谁是好的公司,从而竞相购买好的公司的股票,导致公司股票价格上涨,结果这家负债公司会因其股价上涨而获资本增值,破产的可能性反而下降了 。
当然,公司通过增加负债来向投资者传递公司信息的代价可能太高,因而有时公司十分乐意向投资者直接披露内部信息,只要这种信息足以使投资者相信其真实性,就会为公司减少信息传递成本 。
(问题 3:在中国是否负债比例高的公司就是好的公司? )
例子 20 飞机、轮船等设立头等舱、经济舱的道理是什么?
无论是买票乘飞机、火车还是轮船,不同的人所愿意支付的价格实际上是不一样的。有的人收入高一些,或对花钱看得比较松一些,
就可以支付较高的价格,相反,收入低的人或对花钱看得比较紧一些的人,就只愿支付较低的价格。但是,如果你问他们愿意支付什么样的价格,他们都必定说愿支付较低的价格,因为既使有钱人有也会在同样服务下以低价购买划算一些。
飞机或轮船公司为了将这些在经济学中被称为具有不同支付意愿的人区分开来,让能支付较高价格的人支付较高价格,就设计了一种,信息甄别,的机制,这种机制就是设立头等舱,二等舱,
三等舱,……,等等 。 这种机制发挥作用的道理是这样的,我们可以用著名的
,所罗门王断案,的故事来说明 。 所罗门王是古代以色列国的一位以智慧著称的君主 。
一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主 。 所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半 。
这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半 。 听罢这位妇人的求诉,所罗门王立即作出最终裁决 ——婴儿是这位请求不杀婴儿的妇人的,应归于她 。
这个故事讲的道理是,尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的 。 所罗门王正是利用这一点,一下就识别出谁是婴儿的真正的母亲了 。 所罗门王的这种方法在博弈论中被称为,机制设计,,即设计一套博弈的规则,令不同类型的人作出不同的选择,尽管每个人的类型可能是隐藏的,
别人观察不到,但他们所作出的不同选择却是可以观察到的 。 观察者可以通过观察不同人的选择而反过来推演出他们的真实类型 。
当飞机或轮船的舱位条件和价格完全一样时,不同支付意愿的人都会以最低价格买票,不会有人愿支付比别人更多的钱去买相同的舱位的票 。 于是,航空公司或轮船公司将舱位分成头等舱,
二等舱,……,等等,价格稍有不同,
当然服务也不同,就将不同支付意愿的顾客区分开了 。
头等舱比其它较低等级舱位的价格高许多并不主要是因为它的服务要比其它舱位的服务好许多 ( 当然还是要好一些 ),而是因为那些坐头等舱的人的支付能力比其它舱位的旅客的支付能力要强许多,说白了,就是坐头等舱的人比坐其它舱位的人更有钱或更能花钱而已 !
但是,如果航空公司或轮船公司不对舱位作如此区分,即使是有钱人也不会愿意坐同样的舱位而支付比别人支付的更高的价格 。
这里,支付能力是旅客的类型,选择舱位等级是他们的选择 。 支付能力无法观察,但买什么舱位的票却能够观察,航空或轮船公司因此而识别出可以支付更高价格的顾客而赚取更多利润 。
譬如,有两位旅客甲和乙乘飞机 。 甲的最高支付能力为 1000元,乙的最高支付能力为
1500元 。 经济舱的服务成本为 800元,头等舱的服务成本为 1200元 。
经济舱带给甲和乙的消费满足感
( 经济学中称为效用 ) 为 1000元,头等舱带给甲和乙的效用为 1800元 。 如果没有头等舱,航空公司最多把票价定到
1000元,利润为 2× ( 1000-800) =400元 。
因为票价一旦高于 1000元,甲和乙就不会买票了 。 但当设立头等舱后,航空公司将经济舱票价定为 1000元,将头等舱票价定为 1500元 。 此时,甲以 1000
元买经济舱 。
乙如果买经济舱,则其净效用 ( 经济学称为消费者剩余 ) 为 1000-1000=0,
但当乙买头等舱票时的消费者剩余为
1800-1500=300元,所以乙会买头等舱 。
甲的支付能力只有 1000元,所以甲只有买经济舱 。 这时,航空公司的利润增大为 (1000-800)+(1500-1200)=500元 >400元 。
通过机制设计增大了公司利润 。
类似的还有,酒店的星级分类,
五星级、四星级、三星级,…… 酒店,冰棍的不同品种与价格,影剧院的不同座位价格表等等,都是实现信息甄别的机制设计。
例子 21 大智若愚中的智慧,聪明过头没好处美国 19世纪有一个颇有成就的政治家,
其幼年时是流浪街头的孤儿 。 他经常在大街上向行人讨钱,但当有人让他在一块钱和两块钱之间选择时,他选择了一块钱 。 于是,
许多人都为了亲眼验证关于他的,犯傻,行为的传闻,专门来找他并让他在一块钱和两块钱之间选择 。 他仍然依然故我地只选择一块钱,于是来找他的人愈来愈多 。
终于有一天,有一位女士问他:难道你不知道两块钱比一块钱更多一些钱吗? 他如此回答道:如果我有一次选择了两块钱,就不会有人来找我让我在一块钱与两块钱之间选择了,我也讨不到钱了 。
这个故事告诉我们有时候,扮傻,
也许是有好处的 。 下面再来看一个例子,
这是一个动态博弈,局中人 A有两次决策机会,一次在局中人 B决策之前,另一次在 B决策之后 。
图 4 一个动态博弈运用,逆向归纳法,,A在第二次决策时会选择
,B选择 L;给定这些结果,A在开始会选择
U,纳什均衡是 ((U,),L)。
(2,0)
(1,1)
(3,0) (0,2)
D B
R AU L
A
U?
U?
U?
D?
但是,如果局中人 A开始,装傻,,
选择 D而不是 U,当 B认为 A是傻子时,B
会以为当他选 R后 A会选,而这正是 B
所乐意看到的结果 。 于是,当 A开始装傻后,造成 B对 A的类型的误解,B以为
A是傻子,从而预期当他自己选 R后 A还会,犯傻,选 。 于是 B就选 R而不是均衡中的 L。 但是,当 B选了 R后,A不再,装傻,而一举选 达到最大支付 3。
这就是 A通过,装傻,骗过 B使 A获利 。
D?
D?
U?
第二种情形是,局中人 B“装傻,,
并使 A相信他是傻子 。 这样,A会认为当他选 D时 B会选 R。 于是,A开始就选 D,
但一旦 A选了 D,B就不再,装傻,,一举选 L。 这是 B骗过 A的情形 。
下面的一个例子是当所有局中人都
,装傻,时,所有人都受益的情形 。
图 5 所有人都“装傻”使所有人都受益的博弈由逆向归纳法,博弈均衡是所有人都选择 D,
即 ( D,…,D) 。 结果是博弈在一开始就结束了,每个局中人都获得支付 1。
A U B
D D
B
D
A U
D
B
D
A U
D
U (100,100)
(1,1) (0,3) (98,98) (97,100) (99,99)(98,101)
……
如果 A开始就装傻,选 U而不是 D,B
也装傻,选 U不选 D,则博弈到最后结束时每个局中人得到支付 100。
相反,下面用一个例子说明当所有人都,聪明过头,时,所有人都受损失的道理 。
有这样一个故事,称为,旅行者困境,,说的是有两个旅行者甲和乙从一个以出产花瓶的著名旅游胜地回来时,
他们都买了花瓶 。
提取行查时,发现花瓶被碰破了 。
他们向航空公司索赔 。 航空公司估计花瓶的价格在 80或 90元的价位左右,但不知道这两位旅客购买的准确价格 。 航空公司要求两位旅客在 100元以内自己写下花瓶价格 。 若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,
但是对讲真话的旅客奖励 2元钱,对讲假话的旅客罚款 2元 。
如果两人都写 100元,他们都会获得
100元 。 但是,给定乙写 100元,甲改写
99元,则他会获得 101元 。 乙又想,若甲写 99元,他自己写 98元,比写 100元好,
因为这样他获 100元,而写 100元当甲写
99元时自己却只获 97元 。 而给定乙写 98
元,甲又会写 97元,……,这样,最后落得每人都只写 1,2元的境地 。
所以,还是古人说得好,有时,大智若愚,可能还是上策呢?
小孩玩的游戏,石头,剪子,布,,
也是一种博弈 。 但是,这个博弈有一种有趣的特征,即给定一方的任何选择,
另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的 。 任何,纯战略,都不是最优的,纯战略是,石头,剪子,布,中的任何一个 。
六、混合战略博弈但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招 。 事实上,可以通过数学证明,当双方都以每个战略按 1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面 。
这被称为,混合战略纳什均衡,,而这种以随机方式选择纯战略的博弈被称为
,混合战略博弈,。
以混合战略博弈的概念,我们来看下面几个例子 。
例子 22 为什么一般人总是小错不断,大错不犯;偷税漏税的一般是中小企业,
大企业会老老实实地交税?
税务部门不会对所有企业的交税情况每一次都去检查,因为这样做的成本太高,得不偿失 。 所以,税务部门总是随机地对企业的交税情况进行检查 。
企业也是随机地在交税与偷漏税之间进行选择 。 税收部门与企业间进行的是混合战略博弈 。 因为如果企业总是交税,税务部门就最好不检查;但给定不检查,企业就会偷漏税 。 所以,两者只有在随机地检查与不检查,企业随机地在偷漏税与交税之间选择,才会达成均衡 。
对于大企业,因一旦偷税就数目巨大,所以,税务部门在随机检查时放在大企业上的可能性就大一些;而给定税务部门检查大企业的可能性较大,大企业偷漏税的行为就较少,否则就容易被逮个正着 。 所以,偷漏税较多的就是一些中小企业,大企业纳税的积极性较高 。
同样,大人物或有钱人纳税的积极性应较高,
至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致 。 同样的道理,在犯罪或对错误的监督惩罚博弈中,也是混合博弈,人们可能总是大错不犯小错不断 。
例子 23 田忌赛马新编春秋战国时期,齐威王常与旗下大将田忌赛马 。 规则是:每次赛三局,每一局齐威王与田忌各出一匹马比赛奔跑速度 。 每一局中的胜者赢败方一千斤铜 。 田忌有上,中,下三匹马,
而齐威王也有上,中,下三匹马 。 每次比赛,
第一局田忌出上马,齐威王也出上马;第二局田忌出中马,齐威王也出中马;第三局,田忌出下马,齐威王也出下马 。 齐威王的上马比田忌的上马好,齐威王的中马也比田忌的中马好,
齐威王的下马还是比田忌的下马好 。 于是,每次比赛的结果都是田忌连输三局 。
田忌的谋士孙膑了解了田忌的困境后,就打听到这样一个消息:尽管齐威王的上,中,下三匹马都要比田忌的对应上,中,下三匹马好,但碰巧的是田忌的上马可胜齐威王的中马,田忌的中马可胜齐威王的下马 。 于是,孙膑为田忌献计:下一次比赛中第一局时田忌出下马对齐威王的上马输一局,第二局田忌出上马对齐威王的中马,第三局田忌出中马对齐威王的下马,这样可连赢两局,最后净胜一千斤铜 。 田忌依计而行,
果真赢回一千斤铜 。
这个故事曾经被很多人当作博弈论的例子来演绎,但实际上这个故事与博弈论无关 。 博弈论会假定所有局中人都是理性的,不能假定一些局中人聪明而另一些局中人却是傻子 。 当田忌出下马时,齐威王最好的选择是出下马而不是上马 。 孙膑的计谋中假定齐威王是傻子,
当田忌出下,上,中马时,他仍然按上,中,
下马出,当然要输了 。 事实上,当田忌出下马时,齐威王应出下马,但齐威王出下马时,田忌不应出下马而是出中马,但此时齐威王又应出中马而不是下马了,…… 。 这样,博弈不会有纯战略的均衡 。
两人只能玩混合战略博弈,齐威王分别以 1/6随机的概率选择出上,中,下马的任一排列,田忌也如此 。 由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜 。
例子 24 如果曹操与诸葛亮一样聪明:
三国演义中的华容道博弈在,三国演义,中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜 。 诸葛亮命关羽率兵在途中阻截曹军 。 当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击 。 由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢劫一些军械马匹之类 。
待曹军冲过赵云,张飞两道关后,
进入关羽的伏击地带 。 但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条道 。 诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来 。
当时关羽不解,问诸葛亮,,如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?,诸荀亮叫关羽不要再问,
只如此照办即可 。
当曹操冲破赵云,张飞的阻截后,
来到华容道前,看见华容道上静悄悄的,
但有烟火萦绕 。 曹操大笑道:,孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢 ! 我偏不上他的当 !,
于是,曹操令大军径直上华容道上而去,
结果与关羽大军撞个正着 。
曹操为何进了孔明的圈套呢? 这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避开华容道而走另一条路 。 如果孔明令关羽在另一条路等着,曹操就被逮住了 。 但是,曹操不仅聪明,而且还聪明过人,他也知道孔明的如此盘算来诱他上钩,他偏不上当,知道点火的华容道上无人,孔明的队伍在另一条道上呢 ! 于是他选择走华容道 。
但是,依,三国演义,作者罗贯中的逻辑,孔明总是比曹操计高一筹,按博弈论的术语来说,就是孔明的理性程度要比曹操高上一阶 。 孔明也知道曹操知道孔明的打算,于是令关羽正好在点火的华容道上等着曹操 。,三国演义,
中的这个故事很可能是作者编造的,因为在,三国志,中并无这一情节 。 这里,
罗贯中假设了曹操在智力上比孔明差一些,才有华容道上被关羽抓住,要不是关羽旧情难忘,曹操就死无葬身之地了 。
但是,如果我们不假定曹操比孔明要笨一些,而是相反假定曹操与孔明一样聪明,则曹操又知道孔明知道曹操知道孔明的打算,曹操就会知道关羽在华容道上等着他呢? 此时曹操就避开华容道走另一条路 。 但是,这还没有完,因为若孔明知道曹操知道孔明知道 …… 。
显然,最终的结果是曹操与孔明玩混合战略博弈,曹操随机地以 1/2的概率选择走华容道和另一条路,孔明也以 1/2的概率令关羽守华容道或另一条路 。
于是,,三国演义,中的这一情节就应作如下改写:
诸葛亮抛出一枚硬币,决定关羽是守华容道呢还是另一条道 ……,而曹操也掷出一枚硬币,决定是走华容道呢还是走另一条路 。 平均看来,曹操有 1/2的概率逃脱,而关羽也只有
1/2的概率抓住曹操 。 如果说关羽在华容道上抓住了曹操,则纯属偶然,并非孔明比曹操计高一筹所致 !
如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一个商战中的真实例子。
七、机制设计:
如何走出囚徒困境例子 25 冻结价格战的博弈机制美国有两家销售音像商品的商店
,疯狂艾迪 ( Crazy Eddie) 和纽马克与露易斯 ( Newmark&Lewis),它们之间在市场上存在竞争 。 当它们进行合谋时,
如何保证对方不会背叛而降价的一个前提就是如何能迅速查出对方的背叛行为并给予惩罚 。
“疯狂艾迪,已作出了承诺,不可能有人卖得比我们更低,我们的价格最低廉,我们保证价格最低,而且是超级疯狂的低,。 而对手企业 Newmark&Lewis
也打出,只要买我们的东西,将得到终生低价保证,。 它承诺:假如你能在别处买到更低的价格,我们将加倍退钱,广告还承诺:
假如你在本店买了商品之后,在你一生中于任何本地的销售商 ( 本行销区内 ) 那里发现相同的广告款式而价格却较本店低的话 ( 以单据为凭 ),本店愿支付百分之百的差价,并额外付给差价的百分之二十五 ( 以支票支付 ) ;或是给你差价百分之二百的本店换货单 ( 除了原差价的百分之一百外,再额外加给百分之百,都是以换货单方式支付 ) 。
——Newmark&Lewis公司终身低价保证乍一看,这两家企业在玩命竞争,
根本不可能形成价格联盟,即使形成也难以维持,因而它们之间似乎是在打价格战 。 但是,一种潜在的侦察降低价格行为的机制阻止了价格战的发生 。
若每台录相机的批发价为 150美元,
此时两家企业正以每台 300美元的价格出售 。,疯狂艾迪,打算降为每台 275美元,
从而将对手的顾客拉过来,如那些家住在对手售货点附近或过去曾买过对手商品的顾客 。
但是,对手的战略锁定了,疯狂艾迪,的行为,因为,疯狂艾迪,的这一计划会有相反的效果 。 因为顾客会到对手那里先以 300美元买下录相机,然后再获退款 50美元 。 这样,对手自然将价格降到更低的价格 250美元一台,顾客反而是从,疯狂艾迪,那里流向对手而不是相反 。
如果对手不想以 250美元一台出售录相机,他也可以将价格降到 275美元一台,
只要它发现有顾客来要求退款,就会发现对手的背叛行为,从而将价格降到了
275美元一台 。 既不以太低价出售,又快速发现对手的背叛从而以降价予以报复,
使对手降价也不能增大顾客量,从而蒙受损失 。
这样,,疯狂艾迪,就没有进行价格战的意愿了,自然形成价格联盟 。 在美国,明目张胆的价格合盟是违法的,
但这两家企业却以不违法的方式形成了价格合盟,顾客成了背叛行为的侦察者,这一战略是十分巧妙的 。
博弈论中涉及到的生活中的各种经济学道理是十分多而有趣的。 这里因时间关系还有许多有趣的例子没有为大家介绍,各位听众有机会可以通过其它的著作了解到博弈论深遂的道理及其在经济分析中的应用,希望大家能通过这种学习能对博弈论有更深入的认识。
八、总结