第三章
多重均衡与制度和文化
张维迎
北京大学光华管理学院
实验:选数博弈
? 规则:有两个人,1~10十个数字,每个
人可以选择其中的任意五个;如果两个
人的选择没有重复,每人得到 50元;否
则,各为 0。
多重纳什均衡:产品标准
? 许多博弈可能有多个纳什均衡
3.5,
5.5,
3.5,5.5,
8,8 3,2
2,3 6,6
这个博弈被称为
“协调博弈”:有
两个纯战略纳什均衡,
一个混合战略均衡。
哪一个将出现呢?
交通博弈
靠左行 靠右行
靠左行
靠右行
1,1
1,1
-1,-1
-1,-1
约会博弈
芭蕾舞 足球场
芭蕾舞
足球场
1,2 0,0
0,0 2,1
进门博弈
先进 后进
先进
后进
-1,-1
-1,-1
2,1
1,2
分蛋糕博弈
x1
x2
1
1 任何满足 x1+x2=1的点都是
纳什均衡。
资源争夺博弈( chicken)
Hawk Dove
Hawk
Dove
-1,-1
5,5
10,0
0,10
如何协调?
? 仅仅“理性”是不够的;
? FOCAL POINT( PROMINENCE):
Schelling( 1960);
? 帕累托最优均衡:可以通过协商选择一
个纳什均衡; cheap talking;
? 文化与制度
? 行业组织;
帕累托最优均衡
3.5,
5.5,
3.5,5.5,
8,8 3,2
2,3 6,6
( 3.5“,3.5”) 帕累托优于 (5.5“,5.5”)
Cheap talk 可以
帮助协调到一个
帕累托最优均衡
为什么要相信?
C1 C2
R1
R2
9,9 0,8
8,0 7,7
不论 C选择什么,他都有积极性告诉 R他将选择 C1;
所以没有理由认为 R应该相信 C的话。
R
C
锁定效应与路径依赖
? 如果博弈参与人很多,达成协议的成本很高,最初的
非帕累托均衡可以被锁定( lock-in),导致路径依赖
( path dependence):每个人多偏好于新产品(或标
准),如果其他人都选择新产品的话;但由于每个人
都预期其他人不会选择新产品,所以每个人的最优选
择是不转向新产品,结果是整个社会被锁定在现有的
产品(标准)(非帕累托最优);
? 这常被用来作为市场失灵的理论证据;
? 经验证据,QWERT vs Dvorak键盘; Beta vs VHS录象
机; MAC与 IBM计算机软件;
? 但最新的研究似乎正在推翻这些广泛流行的结论。
键盘的寓言
? 1868年 Christopher L,Stoles发明 QWERT键盘;由 Remington公司生
产;
? 1936年 Dvorak发明简化键盘( DSK,Dvorak Simplified Keyboard):
认为这一键盘通过平衡双手和更有力的手指之间的工作量,极大
地减少了打字产生的手指运动,其优势在于提高速度、减少疲劳,
以及更容易的学习。
? 为什么没有被采用?最初的打字员不选择学习 Dvorak,因为
Dvorak机器很难找到;办公室不原配置 Dvorak,因为找不到打字
员;
? 但这些说服并不成立:( 1)支持 Dvorak更好的论点证据不足,许
多是猜测;( 2)人体过程学方面的研究发现,它没有任何在科学
上可靠、重要的优势;( 3)打字机市场上的竞争要比通常报告的
要激烈的多;( 4)其他许多比赛证明其他键盘的优越性。
VHS 与 Betamax
? Sony公司 1975年开始销售 Betamax,并把一再把该技术提供给松下、
JVC;
? 1976年 4月三家公司最终同意召开一次会议来比较 Betamax,VHS
和 VX;但由于 JVC的侵权,SONY和松下 -JVC分道扬镳;
? SONY相信“小”,松下相信“长”;
? SONY吸引东芝和三洋支持 Beta,松下则把日立、夏普和三菱拉
入阵营;一种制式的任何改进都伴随着另一阵营的相同改进;一
方降价,另一方也跟进。两中制式在几乎所有方面都被证明是完
全相同的,除了一方面,VHS播放时间更长,Beta两小时,VHS
4小时; Beta5小时,VHS 8小时。
? 市场在播放时间和磁带压缩之间的投票是决定性的,1979年前,
VHS在美国的销售是 Beta的三倍,1983年前,Beta的在世界市场
份额的份额下降到 12%; 1984年,只有 SONY在生产 Beta。
MAC与 IBM
? 据称,Macitosh要比命令行 DOS好得多,甚至比基于
DOS的 Windows好,但为什么消亡了?通常的解释:
DOS成功了是因为它成功了:有更多的软件,更多的
用户;
? 事实是:( 1)成本优势;( 2)速度优势;( 3)商业
环境中,一台机器只用于一种软件,一旦操作员学会,
Macitosh的界面优势就没有了;( 4)为 DOS写软件要
容易的多。
? Stan Liebowitz,and Stephen Margolis,“The Fable of the
Keys”,JLE (1990); Beta,Macitosh and other Fabulous
Tales”,1999 (Winner,Losers and Microsoft),
大学改革:教师招聘
只留本校生 不留本校生
只留本校生
不留本校生
2,2 2,0
0,2 10,10
交通博弈与交通规则
靠左行 靠右行
靠左行
靠右行
1,1
1,1
-1,-1
-1,-1
法律和社会规范如何协调预期
? 法律和社会规范就是这种协调预期的规则,帮
助人们在多个纳什均衡中筛选一个特定的纳什
均衡。社会规范是通过习惯、长期的交互博弈
产生的行为规则,法律是立法机关制定的行为
规则,但不论是法律还是社会规范,它们的功
能都是协调预期。
交通规则的演变
? 在多个纳什均衡之间不存在优劣之分时,偶然
事件对选择具有重要意义;
? 从历史上来考察,许多交通规则一开始并不体现为法律,而是长
期演化而来的。在欧洲大陆的早期,道路行走规范是非常地方化
的,有些地方采用靠左走的习惯,有些地方采用靠右走的习惯,
是不统一的。只是随着道路的增加和地区间交往的扩大,地方性
的习惯才逐步演变为区域性的规范,然后有演变为全国性的规范。
但直到19世纪前,道路规则也仅仅是作为规范而得到遵守,而
不是作为交通法律而得到执行。现在欧洲大陆的靠右走的规则是
在法国兴起的。
交通规则的演变
? 在法国大革命以前,贵族的马车习惯上是靠左行的,
穷人在路上看到富人的马车来了,要站在马路的右边。
因此,靠左行与“特权阶级”相联系,而靠右行被认
为更为“民主”。随着法国大革命,作为一个革命的
象征,规定所有的车都要靠右走。随着拿破仑对欧洲
大陆的征服,拿破仑将法国的规则带给了欧洲,也包
括靠右行驶的规则。当然,在地域上这个规则的转变
也是从西到东逐步完成的。比如说,与靠右行的西班
牙接壤的葡萄牙是在一战之后才转为靠右行,奥地利
是从西到东一个省一个省逐步转变的,匈牙利、捷克
和德国是在二战前才由左行转向右行的。瑞典,一直
到 1967年,才通过法律宣布从靠左行改为靠右行。
文化的冲突与协调
? 为什么欧洲大陆的交通规则收敛于一致?
? 英国将如何办?
? 文化冲突,无论是组织和组织之间的,
还是国家和国家之间的,大部分不过是
游戏规则 ――社会规范和法律的冲突,用
博弈论的话来说,是一个均衡的选择问
题;
? 全球化意味着资源的重新分配。
解决规则冲突的三个方式
? 一是一个规则取代其他的规则,让一部分人改变行为
规范适应另一部分人,也就是所谓的“接轨”,如前
面讲的欧洲大陆交通规则的演变所显示的。
? 二是建立全新的规则,如中国人和德国人在一起交流
时都用英语,而不是中文,也不是德文;
? 三是建立协调规则的规则。如“入乡随俗”,“客随
主便”。
? 究竟哪一种,与规则要解决的问题有关,也与其他因
素有关。
一致与冲突
先走 后走 先
走
后
走
-1,-1 2,1
1,2 -1,-1
进门博弈
文化既解决冲突又协调预期
? 尊老爱幼;
? 妇幼保护;
? 遵师重教;
? 先来后到;
? 社会分层与非对称权力(排位问题;黑社会组
织);
? 公平观念(如分蛋糕博弈);
? 抓阄;
分蛋糕问题与公平观念
x1
x2
0.5
0.5
信息与身份( identity)
? 信息对预期的协调很重要:如果不知道
谁是谁,协调就很困难;
? 身份是传递信息的重要工具;
? 身份的外在化:服饰,车座,秘书;
? 学界的官本位问题;
资源争夺博弈( chicken)
Hawk Dove
Hawk
Dove
-1,-1
5,5
10,0
0,10
产权的先占规则
? 人们为什么遵守这个规则?
? 人们希望得到别人认可的愿望,
? 一旦规则建立,每个人都预期其他人会遵守规则;给定这个预期,
每个人发现遵守规则是自己的利益所在,也希望别人能遵守这个
规则。任何不守规则的行为都会使守规则的人受到损害或者感到
威胁,从而引起后者的愤怒;任何其他人也因此会觉得自己未来
的利益受到威胁,对此种行为表示不满,对受害人表示同情;
? 少数人不守规则并不会导致规则的消失;
? 但如果规则总是偏向于某一组特定的人群,受到不公正对待的人
并不会蔑视不守规则的人,规则就容易被违反。
? 罗尔斯( Rawls)的正义论
关于论资排辈问题
? 容易被个人操纵的信息是没有价值的;
? 当缺乏其他有效的信息时,资历可以成
为协调博弈的信息;
? 孙丕扬于万历 22年( 1595年)出任吏部
尚书,创建了“掣签法”:官员们无论
贤愚清浊,一律抽签上岗。(吴思, 潜
规则, )
为什么制度要有稳定性?
? 制度是为了稳定预期,频繁的变化会打
乱人们的预期;
? 希思罗机场的 Meeting Point;
多重均衡与制度和文化
张维迎
北京大学光华管理学院
实验:选数博弈
? 规则:有两个人,1~10十个数字,每个
人可以选择其中的任意五个;如果两个
人的选择没有重复,每人得到 50元;否
则,各为 0。
多重纳什均衡:产品标准
? 许多博弈可能有多个纳什均衡
3.5,
5.5,
3.5,5.5,
8,8 3,2
2,3 6,6
这个博弈被称为
“协调博弈”:有
两个纯战略纳什均衡,
一个混合战略均衡。
哪一个将出现呢?
交通博弈
靠左行 靠右行
靠左行
靠右行
1,1
1,1
-1,-1
-1,-1
约会博弈
芭蕾舞 足球场
芭蕾舞
足球场
1,2 0,0
0,0 2,1
进门博弈
先进 后进
先进
后进
-1,-1
-1,-1
2,1
1,2
分蛋糕博弈
x1
x2
1
1 任何满足 x1+x2=1的点都是
纳什均衡。
资源争夺博弈( chicken)
Hawk Dove
Hawk
Dove
-1,-1
5,5
10,0
0,10
如何协调?
? 仅仅“理性”是不够的;
? FOCAL POINT( PROMINENCE):
Schelling( 1960);
? 帕累托最优均衡:可以通过协商选择一
个纳什均衡; cheap talking;
? 文化与制度
? 行业组织;
帕累托最优均衡
3.5,
5.5,
3.5,5.5,
8,8 3,2
2,3 6,6
( 3.5“,3.5”) 帕累托优于 (5.5“,5.5”)
Cheap talk 可以
帮助协调到一个
帕累托最优均衡
为什么要相信?
C1 C2
R1
R2
9,9 0,8
8,0 7,7
不论 C选择什么,他都有积极性告诉 R他将选择 C1;
所以没有理由认为 R应该相信 C的话。
R
C
锁定效应与路径依赖
? 如果博弈参与人很多,达成协议的成本很高,最初的
非帕累托均衡可以被锁定( lock-in),导致路径依赖
( path dependence):每个人多偏好于新产品(或标
准),如果其他人都选择新产品的话;但由于每个人
都预期其他人不会选择新产品,所以每个人的最优选
择是不转向新产品,结果是整个社会被锁定在现有的
产品(标准)(非帕累托最优);
? 这常被用来作为市场失灵的理论证据;
? 经验证据,QWERT vs Dvorak键盘; Beta vs VHS录象
机; MAC与 IBM计算机软件;
? 但最新的研究似乎正在推翻这些广泛流行的结论。
键盘的寓言
? 1868年 Christopher L,Stoles发明 QWERT键盘;由 Remington公司生
产;
? 1936年 Dvorak发明简化键盘( DSK,Dvorak Simplified Keyboard):
认为这一键盘通过平衡双手和更有力的手指之间的工作量,极大
地减少了打字产生的手指运动,其优势在于提高速度、减少疲劳,
以及更容易的学习。
? 为什么没有被采用?最初的打字员不选择学习 Dvorak,因为
Dvorak机器很难找到;办公室不原配置 Dvorak,因为找不到打字
员;
? 但这些说服并不成立:( 1)支持 Dvorak更好的论点证据不足,许
多是猜测;( 2)人体过程学方面的研究发现,它没有任何在科学
上可靠、重要的优势;( 3)打字机市场上的竞争要比通常报告的
要激烈的多;( 4)其他许多比赛证明其他键盘的优越性。
VHS 与 Betamax
? Sony公司 1975年开始销售 Betamax,并把一再把该技术提供给松下、
JVC;
? 1976年 4月三家公司最终同意召开一次会议来比较 Betamax,VHS
和 VX;但由于 JVC的侵权,SONY和松下 -JVC分道扬镳;
? SONY相信“小”,松下相信“长”;
? SONY吸引东芝和三洋支持 Beta,松下则把日立、夏普和三菱拉
入阵营;一种制式的任何改进都伴随着另一阵营的相同改进;一
方降价,另一方也跟进。两中制式在几乎所有方面都被证明是完
全相同的,除了一方面,VHS播放时间更长,Beta两小时,VHS
4小时; Beta5小时,VHS 8小时。
? 市场在播放时间和磁带压缩之间的投票是决定性的,1979年前,
VHS在美国的销售是 Beta的三倍,1983年前,Beta的在世界市场
份额的份额下降到 12%; 1984年,只有 SONY在生产 Beta。
MAC与 IBM
? 据称,Macitosh要比命令行 DOS好得多,甚至比基于
DOS的 Windows好,但为什么消亡了?通常的解释:
DOS成功了是因为它成功了:有更多的软件,更多的
用户;
? 事实是:( 1)成本优势;( 2)速度优势;( 3)商业
环境中,一台机器只用于一种软件,一旦操作员学会,
Macitosh的界面优势就没有了;( 4)为 DOS写软件要
容易的多。
? Stan Liebowitz,and Stephen Margolis,“The Fable of the
Keys”,JLE (1990); Beta,Macitosh and other Fabulous
Tales”,1999 (Winner,Losers and Microsoft),
大学改革:教师招聘
只留本校生 不留本校生
只留本校生
不留本校生
2,2 2,0
0,2 10,10
交通博弈与交通规则
靠左行 靠右行
靠左行
靠右行
1,1
1,1
-1,-1
-1,-1
法律和社会规范如何协调预期
? 法律和社会规范就是这种协调预期的规则,帮
助人们在多个纳什均衡中筛选一个特定的纳什
均衡。社会规范是通过习惯、长期的交互博弈
产生的行为规则,法律是立法机关制定的行为
规则,但不论是法律还是社会规范,它们的功
能都是协调预期。
交通规则的演变
? 在多个纳什均衡之间不存在优劣之分时,偶然
事件对选择具有重要意义;
? 从历史上来考察,许多交通规则一开始并不体现为法律,而是长
期演化而来的。在欧洲大陆的早期,道路行走规范是非常地方化
的,有些地方采用靠左走的习惯,有些地方采用靠右走的习惯,
是不统一的。只是随着道路的增加和地区间交往的扩大,地方性
的习惯才逐步演变为区域性的规范,然后有演变为全国性的规范。
但直到19世纪前,道路规则也仅仅是作为规范而得到遵守,而
不是作为交通法律而得到执行。现在欧洲大陆的靠右走的规则是
在法国兴起的。
交通规则的演变
? 在法国大革命以前,贵族的马车习惯上是靠左行的,
穷人在路上看到富人的马车来了,要站在马路的右边。
因此,靠左行与“特权阶级”相联系,而靠右行被认
为更为“民主”。随着法国大革命,作为一个革命的
象征,规定所有的车都要靠右走。随着拿破仑对欧洲
大陆的征服,拿破仑将法国的规则带给了欧洲,也包
括靠右行驶的规则。当然,在地域上这个规则的转变
也是从西到东逐步完成的。比如说,与靠右行的西班
牙接壤的葡萄牙是在一战之后才转为靠右行,奥地利
是从西到东一个省一个省逐步转变的,匈牙利、捷克
和德国是在二战前才由左行转向右行的。瑞典,一直
到 1967年,才通过法律宣布从靠左行改为靠右行。
文化的冲突与协调
? 为什么欧洲大陆的交通规则收敛于一致?
? 英国将如何办?
? 文化冲突,无论是组织和组织之间的,
还是国家和国家之间的,大部分不过是
游戏规则 ――社会规范和法律的冲突,用
博弈论的话来说,是一个均衡的选择问
题;
? 全球化意味着资源的重新分配。
解决规则冲突的三个方式
? 一是一个规则取代其他的规则,让一部分人改变行为
规范适应另一部分人,也就是所谓的“接轨”,如前
面讲的欧洲大陆交通规则的演变所显示的。
? 二是建立全新的规则,如中国人和德国人在一起交流
时都用英语,而不是中文,也不是德文;
? 三是建立协调规则的规则。如“入乡随俗”,“客随
主便”。
? 究竟哪一种,与规则要解决的问题有关,也与其他因
素有关。
一致与冲突
先走 后走 先
走
后
走
-1,-1 2,1
1,2 -1,-1
进门博弈
文化既解决冲突又协调预期
? 尊老爱幼;
? 妇幼保护;
? 遵师重教;
? 先来后到;
? 社会分层与非对称权力(排位问题;黑社会组
织);
? 公平观念(如分蛋糕博弈);
? 抓阄;
分蛋糕问题与公平观念
x1
x2
0.5
0.5
信息与身份( identity)
? 信息对预期的协调很重要:如果不知道
谁是谁,协调就很困难;
? 身份是传递信息的重要工具;
? 身份的外在化:服饰,车座,秘书;
? 学界的官本位问题;
资源争夺博弈( chicken)
Hawk Dove
Hawk
Dove
-1,-1
5,5
10,0
0,10
产权的先占规则
? 人们为什么遵守这个规则?
? 人们希望得到别人认可的愿望,
? 一旦规则建立,每个人都预期其他人会遵守规则;给定这个预期,
每个人发现遵守规则是自己的利益所在,也希望别人能遵守这个
规则。任何不守规则的行为都会使守规则的人受到损害或者感到
威胁,从而引起后者的愤怒;任何其他人也因此会觉得自己未来
的利益受到威胁,对此种行为表示不满,对受害人表示同情;
? 少数人不守规则并不会导致规则的消失;
? 但如果规则总是偏向于某一组特定的人群,受到不公正对待的人
并不会蔑视不守规则的人,规则就容易被违反。
? 罗尔斯( Rawls)的正义论
关于论资排辈问题
? 容易被个人操纵的信息是没有价值的;
? 当缺乏其他有效的信息时,资历可以成
为协调博弈的信息;
? 孙丕扬于万历 22年( 1595年)出任吏部
尚书,创建了“掣签法”:官员们无论
贤愚清浊,一律抽签上岗。(吴思, 潜
规则, )
为什么制度要有稳定性?
? 制度是为了稳定预期,频繁的变化会打
乱人们的预期;
? 希思罗机场的 Meeting Point;