博弈游戏
本书的部分章节会以有趣的谜题作为开端,由简单到复杂,由理论到现实,并通过在不同情形下的决策和竞争等实例,来了解已知事实的个人决策:并在此基础上,通过组织、国家博弈的案例,来解释多人、多重标准的决策过程。在这个过程中,我们不但可以了解人类理性决策的原则,也可以发现人类理性中的某些难以解决的问题。
 博弈是一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。人生是永不停息的博弈过程。著名经济学家保罗·萨谬尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”
游戏是人生的抽象。人就是在游戏中学会怎样生活、怎样与他人相处、怎样适应并利用世界上的种种规则,并在这个过程中确立自己的人格。通过“囚徒困境”“约会游戏”“枪手决斗”“美女老虎”等一次次令人兴奋、充满乐趣的游戏历险,你会发现生活的真实逻辑,以及可以应用于方方面面的具有普遍意义的策略原则。
 白波:36岁,笔名余白,做过电台、杂志编辑,专栏作家。自1985年开始,在大陆、港台地区发表各类作品二百余万字,出版专著多部,较有影响的著作有《世界是个寓言》、《马太效应》、《完美圈套》和《博弈游戏》等。
序章人生处处皆博弈
人生是永不停息的博弈过程,博弈意味着通过选择合适策略达到合意结果。作为博弈者,最佳策略是最大程度地利用游戏规则;作为社会的最佳策略,是通过规则引导社会整体福利的增加。
永不停息的博弈
游戏是人生的抽象
从游戏到人生
多人博弈不可避免的矛盾
公平来自博弈
游戏需有规则
好规则与坏规则
博弈论不是“策略大全”
第1章囚徒困境
人类的自私天性,使他们陷入“囚徒困境”难以自拔。社会生活和商业竞争中的许多逻辑都与这一困境密切相关。
合作是可能的吗
,囚徒困境”的故事
选1还是选2
学生与囚犯
烟草商为何不反对禁止烟草广告
一定是坏事吗
第2章优势、劣势与均衡
当你身处类似“囚徒困境”这样的同时行动的博弈中,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择往往是有迹可循的,并形成某种“定式”——即均衡。
新闻大战与博弈策略
同时行动的优势策略
当对手有优势策略时
优势策略与对手策略无关
追求最佳,避免最差
博弈的均衡——纳什均衡
纳什均衡有什么用
警察与小偷
斗鸡博弈的难局
左边还是右边
谁打电话
第3章打破“囚徒困境”
在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。
囚犯的救赎
,一报还一报”的伟大胜利
你不必每次都赢
未来影响现在
,笼中猪”博弈
增大未来的影响
为什么出租比出售好
改变收益值
教育人们相互关心
教育人们要回报
改进辨别能力
第4章战争法则:庙算在先
有“谈笑间,强虏灰飞烟灭”的指挥大师,但也同样有“纸上谈兵”的“艺术家”,有没有什么东西可以更可靠地告诉我们,在什么情况下运用某种原则有效,以及为什么有效?其实,在“艺术”和“技术”之间,我们可以找到清晰的规律。
战争是艺术还是技术
蓝彻斯特定律
分散敌军,各个击破
合则两利,分则两害
防守还是进攻
属于拿破仑的1/4世纪
司令,下命令吧
公平还是不公平
,攻防博弈”——诺曼底登陆
如何提高胜利几率
第5章皮洛斯的胜利
人们都追求胜利,但不是所有胜利都值得追求。所谓“皮洛斯的胜利”指的就是“得不偿失的胜利”。在投入一场战争之前,你必须计算成本与收益的比例。
昂贵的战争
,每个人都有自己的价钱”
皮洛斯的胜利
斜坡上的均衡
,骑虎难下”与“协和谬误”
贸然发动的第一次中东战争
,焦土政策”与“破釜沉舟”
威胁与许诺
许诺与威胁的适度原则
,冤冤相报”到“两败俱伤”
不能取胜,就该谋和
第6章应对危机的策略
人类最理智的时候,往往就是别无选择的时候。“边缘策略”是一场危险的游戏,每一步都蕴藏着巨大的希望与危机。
肯尼迪的边缘策略
悬崖还是斜坡
为什么选择不确定性
说还是不说
毫无用处的核武器
越“无能”,越成功
逃离边缘
第7章信息与不确定性
未来的不确定性源于信息,以及处理信息能力的缺乏。对个人来说,拥有信息越多,越有可能作出正确决策。对社会来说,信息越透明,越有助于降低人们的交易成本,提高社会效率。
无法避免的不确定性
掌握信息,破解难局
,虚张声势”
关于信息博弈的故事会
所罗门王断案
破解“柠檬市场”
,信用印章”
信息就是权力
要不要相信权威
怀疑是权利的保证
第8章约会游戏
拥有信息可以帮助你作出正确决策,但不能保证你作出正确决策。要实现这一点,你必须有合适的策略。
别无选择与选择的烦恼
众里寻他千百度
别选第一个碰到的人
牺牲者与实验品
哲学大师的训诫
明确你的动机
规避风险的决策
女王选夫与最优策略
不要指望最好结果
第9章美女还是老虎
概率是生活的真正指南,但是我们对这一指南有着太多的似是而非的误解。在听任命运摆布之外,我们是否还有更好的选择?
美女还是老虎
概率改变了吗
要不要改变选择
我对,你也对
换,绝不会吃亏
老虎在哪个门
三张卡片
概率——生活的真正指南
概率与机会
先有鸡,还是先有蛋
绝对对称
概率的独立和互斥性原则
第10章赌场:醉鬼漫游
反对赌博不只是一种道德立场,也是一种明智的策略选择。当你参加一场赌博时,你赢的机会是负的期望。当你使用一种赌博系统时,你总要赌很多次,而每一次都是负的期望,绝无办法把这种负期望变成正的。
为什么赌博是坏事
,赌徒谬误”
,开天眼的人”与不存在的规律
为什么买彩票
把巧合神秘化的“惊奇陷阱”
你有多侥幸
预期是几率乘以价值
选银行还是选赌场
加大赌注,挑战几率
何时应选择“孤注一掷”
不懂概率,当定冤大头
第11章股市:冤大头游戏
一个繁荣的市场自然交易活跃,当然也就不可避免一些投机现象,但是如果投机盛行,成为市场的“规律”,那么这个市场一定要出问题。
股市是什么
,大家发财”究竟发谁的财
,啤酒”与“泡沫”
,冤大头理论”与“郁金香狂热”
伤兵的两个瓶子
,选美”与选股
,效率市场”,谁主沉浮
又见随机漫步
巴菲特为什么能赚钱
你也可以是“大师”
第12章悖论“交换信封”
我们的知识体系、我们对世界的认识也许并不是建立在“惟一正确”的基础上,而在这个基础上建立起的认识世界的方式,既是一条道路,也是一个囚笼。
悖论——逻辑的套索
艾毕曼德悖论
别人的钱包总是更诱人
信息与理性
换还是不换
逻辑中隐藏陷阱
,奖惩分明”
,破窗理论”1
藏羚羊与毒品
第13章理性与非理性
经济学建立在两个假设前提上:其一,人是自私的,都在追求利益的最大化;其二,人是理性的,其所有行为都是为了实现追求利益最大化这个目的。换言之,人不但知道自己的利益所在,而且知道该如何去追求。
理性的困境
要买一张彩票吗
,旅行者困境”
强盗分赃
出乎意料的答案
,先发优势”和“后发优势”
都是理性惹的祸
非理性还是理性
不要目光短浅
此一时,彼一时
要冒险还是要成功
理性假设有用吗
第14章阿罗“不可能”定理
简单地说,政治就是人的组织艺术。完美的政治是可能的吗?阿罗“不可能”定理给了我们一个答案。你可能对此感到失望,但是,宁可知道不存在答案的问题,也决不要假装不存在任何问题。
阿罗“不可能”定理
民主是一种妄想或自相矛盾
既不一定正确,也不一定公平
团体决策的困境
,三个快枪手”
暂时同盟
三国博弈
杂货铺与政党
效能与民意
各种投票制度的利弊
,英雄”为何成了失败者
绝对正确的决策是可能的吗
完美政治如何实现
第15章决策的艺术与科学
在人们的观念中,“零和”正在被“双赢”取代,但是“双赢”的背后却蕴藏着更大的危机。对此,我们还没有找到满意的应对策略。既然不知道该往何处去,所以要常怀谦逊谨慎之心。
,零和游戏”与“双赢结局”
猎人博弈的帕累托优势
,大家好,才是真的好”
再分配的局限性
为什么“重农抑商”
哈丁公用地悲剧
,看不见的手”有多长
公共品供给的“囚徒困境”
,好人好报”
用什么减少垃圾
沙尘暴的警示
丧钟为谁而鸣
目光短浅或在劫难逃
世界政府
尾声什么是最佳策略
序章人生是永不停息的博弈过程,博弈意味着通过选择合适策略达到合意结果。作为博弈者,最佳策略是最大程度地利用游戏规则;作为社会的最佳策略,是通过规则引导社会整体福利的增加。
永不停息的博弈
人们的工作和生活,可以看做是永不停息的博弈决策过程。人们每天从一早醒来就必须不断地作决定,我们日复一日决定早餐要吃什么,直到养成固定的饮食习惯;要不要到超市疯狂采购一番;要不要看场电影、散散步、买部车、把菜吃完、在转盘赌局里下红或是下黑,甚至读一本书……不管有意无意,深思熟虑或一时冲动,你已经开始读这本书了——这就是一个决定。
还有更重大的:报考什么学校、选择什么专业、从事什么样的工作、怎样开展一项研究、如何打理生意、该和谁合作、做不做兼职、要不要辞掉工作、要不要竞争总裁的职位。甚至是要不要结婚、什么时候结婚、该和谁结婚、要不要孩子、怎样将孩子抚养成人等,这只不过是人生重大决策的几个例子。
在这些决策中,存在一个共同的因素,那就是你并不是一个人在作决定,在一个毫无干扰的真空世界里作决定。相反,你的身边充斥着和你一样的决策者,他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响,而且别人的选择和决策直接影响着你的决策结果。鲁滨孙一个人沦落荒岛,做什么都是他自己说了算;可是等来了个“星期五”,他就要面对博弈问题了。
博弈论是由两位杰出的学者——冯·诺曼和摩根斯坦在上世纪中期创立的。用专业术语说,博弈论是“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”。
为了解释和理解博弈决策的相互影响,我们不妨设想一个石匠的决策和一个拳击手的决策会有什么区别。当石匠考虑怎样开凿石头的时候,他的“对象”原则上是被动的和中立的,不会对他表现策略对抗。然而,当一名拳击手打算攻击对方要害的时候,不仅他的每一步计划都会招致抵抗,而且他还面临对方主动的攻击。他必须设法克服这些抵抗和攻击。
在人与人的博弈中,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人,是关心自己利益的活生生的人,而不是被动的和中立的角色。一方面,他们的目标常常与你的目标发生冲突;另一方面,他们当中包含着潜在的合作因素。在你作决定的时候,必须将这些冲突考虑在内,同时注意发挥合作因素的作用。
为了自己,也为了与他人更好地合作,你需要学习一点博弈论的策略思维。正是因此,著名经济学家保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”
贴士:
博弈论说来有点绕嘴,但是内容还是很好理解的,那就是每个对弈者在决定采取何种行动时不但要根据自身的利益和目的行事,也要考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动计划,来寻求收益或效用的最大化。
游戏是人生的抽象
,博弈”这个词听起来高深莫测,其实它就是“游戏”的意思。更准确点说,是可以分出胜负的游戏。博弈论如果直译就是“游戏理论”。不妨说,博弈论是通过“玩游戏”获得人生竞争知识的。
游戏是什么?简单地说,游戏是人生的抽象。
比如国际象棋,有这样几种角色:国王、皇后、骑士、主教和小兵,俨然是一个政教兼具的小王国。当然,比照人生,这个模型是太简略了,但是一样可以反映人生的某些道理。而且,惟其简略,这些原本被生活的复杂表象所掩盖的道理才更清晰可见。
面对复杂事物时,人们常落入见树不见林的陷阱,被细节压得喘不过气来,找不到重点。而在游戏中,可以反映出一些现实世界的问题,并将干扰因素减至最低,是一种很适当的决策入门方法。
围棋可能是最简单也是最复杂的游戏,它源于4000年前的中国,但直到现在,我们也未必真弄懂了它。最简化的棋盘——纵横各19条线(最初是17条)编织成的一张网;最简化的棋子(只分黑白两色);最简单的规则(轮流下子,两气活棋,空多者胜,再加上一些“劫争”之类的补充规定),一个对围棋一无所知的人也能在几分钟内学会,可是它的玄妙深奥却又超过了任何一种棋类游戏。如果你对围棋下过一些工夫,你就一定能从中领悟某些哲理,例如“不输就是赢”、“流水不争先”、“乱中求胜”、“过犹不及”等等。在这一点上,游戏有些像我们从小阅读的寓言故事,我们不正是从这些“小中见大”的故事中学会生活的道理吗?
不要小看游戏,它的确是人生的模型。从小我们就是从游戏里学习怎样生活、怎样与他人相处、怎样适应并利用这世界上的种种规则,并在这个过程中确立自己的人格。因此,千万不要低估游戏,它确实能反映真正的人生。
贴士:
零和游戏:游戏者有输有赢,但整个游戏的总成绩永远为零。整个博弈的过程就是一个零和游戏。
从游戏到人生
一个参加了海湾战争的美国飞行员回国后,有人问他对战争的感想,他回答道:就像在玩电脑游戏。事实上,现在很多电脑游戏已经被应用于军事训练。“9·11”之后,微软的一款飞行游戏受到了关注,因为在游戏中,玩家可以体验驾驶飞机在纽约等大城市上空飞行的感觉,甚至可以从世贸大楼中间穿过。人们担心:恐怖分子可以借助这个游戏获得练习机会,或许他们已经这样做了。
游戏是学习的好方法。击败了拿破仑的威灵顿公爵曾说过:“滑铁卢之役的胜负是在伊顿中学操场上决定的。”平时勤于练习技巧和战术,在危急时才不致慌了手脚,这个原则适用于大多数的比赛或游戏。
最妙的是:在游戏过程中,你不会损失任何东西当然除了部分自尊外,即使是输了也不会有什么损失。在大富翁的游戏中,你可以从一眨眼输掉几百万元的经验里,学会如何精明地买卖房地产,事后又不必付出任何代价。
当然,游戏各不相同,对游戏者的要求也不同。有些人长于思考性的游戏,但不同的运动项目对决策智慧有不同程度的要求,例如在拳击或相扑这样按“重量级”来划分比赛等级的游戏中,聪明才智就不那么重要了。
玩游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力、在法律界工作不能缺少的案例积累、玩围棋游戏的时候还需要记住大量的“定式”(双方可以接受的变化,可称为围棋盘上的“均衡”)等。这些技巧一旦脱离了游戏,可能就没有多大用处了。但博弈论的策略思维则是另外一种技巧。策略思维从你的基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来,这是具有普遍意义的原则,可以应用于生活的方方面面。
战略的筹划和博弈论的道理其实是相通的:你的决策必须赢过对手,个人、家庭、部族或国家才有活命的机会。
贴士:
法国著名女高音歌唱家玛·迪梅普莱有一个很大的私人园林。每逢周末,总是会有人到她的园林里采花、拾蘑菇,更有甚者还在那里搭起了帐篷露营野餐。虽然管理人员多次在园林四周围上篱笆,还竖起了“私人园林,禁止入内”的木牌,可所有这些努力都无济于事。迪梅普莱知道了这种情况后,就吩咐管理人员制作了很多醒目的大牌子,上面写着“如果有人在园林中被毒蛇咬伤后,最近的医院距此15公里”的字样,并把它们立在园林四周。从此以后,再也没有人私自闯入她的园林了。——如果习惯的方法不能解决问题,就要调整自己的视角和观念。
多人博弈不可避免的矛盾
游戏不只限于两个对手,有很多游戏是多人参加的。如果后果要由许多人共同承担,那么整个决策过程将会更加困难;因为你将面临不同成员与不同目标的排列组合。而关于多人决策,可以通过小组对抗的模式来了解,在这类竞赛中,好的决策可以创造胜利。
真正的多人决策有许多不同的形态:有时候虽然参与决策人数众多,却只要一种意见,这是理想委员制;有些是两人共同参与决策,但却处于对立的状态,如角力、下棋、击剑、网球单打等;另外还有多人多意见的决策形态,如国会、联合国、扑克牌局、政治党派等。姑且不论生活品质高低,这些决策的终极目标都是为了追求人类在地球上的永续生存。然而,虽有许多极重要的决策有待确定并付诸实施,但我们却没有一套理性的做法完全避免“三个和尚没水喝”之类的困境。每个决策者与选择方案的组合都自成一个系统,成就的决策好坏不一,也有些组合则完全无法运作。在某些情况下,根本不可能作出不自相矛盾的决策。
博弈是一种策略的相互依存状况:你的选择即策略将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。
不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。在实践当中,博弈可能包含一些相继行动过程,也可能包含一些同步行动过程,因此须将技巧综合起来,灵活运用,思考和决定自己最佳行动应该是什么。
贴士:
如果你离开双方相互适应的简单原则,那么你的聪明是不会有好结果的。
公平来自博弈
博弈不一定是坏事,也未必不能取得好的结果。我们今天享受的丰富的物质生活,都是来源于自由市场的竞争——同样也是博弈的结果。亚当斯密在1776年所发表的经典之作《原富》,其中关于自私行为与市场运作的两段,是经济学上被引用得最多的名言:
,很多时候,一个人会需要兄弟朋友的帮助,但假如他真的要依靠他们的仁慈之心,他将会失望。倘若在需求中他能引起对方的利己之心,从而证明帮助他人是对自己有益的事,那么这个人的成功机会较大。任何人向他人提出任何形式的交易建议,都是这样想:给我所需要的,我就会给你所需要的——这是每一个交易建议的含义;而我们从这种互利的办法中,所获的会比我们所需的更多。我们的晚餐不是得自屠夫、酿酒商人,或面包师傅的仁慈之心,而是因为他们对自己的利益特别关注。我们认为他们给我们供应,并非行善,而是为了他们的自利。”
,所以,每个人都会尽其所能,运用自己的资本来争取最大的利益。一般而言,他不会有意图为公众服务,也不自知对社会有什么贡献。他关心的仅是自己的安全、自己的利益。但如此一来,他就好像被一只无形之手引领,在不自觉中对社会的改进尽力而为。在一般的情形下,一个人为求私利而无心对社会作出贡献,其对社会的贡献远比有意图作出的大。”
政治领域同样如此。尽管美国的民主政治并非像某些人鼓吹的那样完美,但立国200多年的实践,还是可以说明这个体制有很多可取之处。美国的民主制度最为关键的基础是1787年的制宪会议。参与该会议的55位代表都是当时的有识之士,但是他们并不是圣人,这是一个集体博弈的例子。一方面,他们富有远见,希望创造新的政府形态以避免两件事的发生,一是独裁,他们早就受够了英国王室的专制;二是混乱,大伙儿一致认为这比独裁还要糟。他们建立复杂的制衡制,目的就是试图在两个极端中寻找平衡点,消弭大小州之间的差异。但是同时每个人又代表着各自的集团利益,在政治、经济利益分配方面各有立场,争吵不休。最终形成的美国宪法可说是“远见”和“妥协”的综合成果。事实上,很难说究竟是前者的远见卓识,还是后者的争权夺利对美国的政治体制贡献更大。
游戏需有规则
任何游戏都有自己的规则。生活这个博弈游戏自然也是如此,这就是法律、道德和各种成文或不成文的规章制度和惯例等等。当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断修修补补,但是只要规则存在,你就必须服从它,否则就要大吃苦头。
其实,也可以说,那些企图通过非法手段获取利益的人具有某种“创新”精神——他们试图在社会通行的规则之外另搞一套。社会的游戏规则固然是稳定的、安全的,可是来得太慢了。如果我能一下子弄到一大笔钱,为什么还要一分一分地挣?应该说,这种不劳而获的心理是普遍的,可是为什么它没有成为社会的普遍行为呢?
银行大盗总有某些传奇色彩,可是研究人类行为的社会学家告诉我们:抢劫银行可能是最不划算的人类行为之一。其成功率之低、风险之大(包括漫长的法律追溯期)、潜在的不确定因素之多,简直令人怀疑还要做这事的人是否具备正常的理智。
据一项统计:每1000起这类案件中,真正得手的只有110,而且抢到的钱也少得可怜:平均不到2000元。按照一位长期研究银行抢劫案的犯罪学专家的想法,银行大盗们不该被送进监狱,而是该被送进疯人院。
贴士:
犯罪为什么不是好买卖?风险太大算一个,不利于财富积累算一个,缺乏必要的约束机制(这就是为什么罪犯不会适时收手的原因)也算一个。这些原因都可以归结为一点:作为个人,试图挑战规则总是要付出代价的。
好规则与坏规则
规则定得过死,游戏不好玩;可是如果规则宽松得形同虚设,游戏又玩不下去。制定规则的分寸,着实不好把握。好的规则是既能保证不出乱子,又能最大程度地给游戏者选择的空间。就如我们前面谈到的围棋,最简单的规则却创造了最复杂的艺术,即使在这个电脑时代,技术专家还是无法制造一台“围棋深蓝”打败人类,给我们的智慧保留了一些面子,为此不能不感谢这个“完美的制度”。
在人类社会中影响最深远的问题是“效率”与“公平”的矛盾,也就是找到一种稳定且公正的方法来管理并分配各社会团体的所有成员,其利益、责任、义务、权利的方法。这些都是在政府出现之前就需要处理的。
古老的政府形态都要确立一个领导人,他拥有绝对的权威,借用武力、共识、年龄、家世,或是宣称拥有神权以主导重大决策。在危急的情况下,一个受认可的领导者不论多么无能,都比完全没有领导人要来得好,所有的军队都明白这个道理。绝对权威也许并不公正,却可以发挥效用,特别当危机来临时更是如此。
权威体制的另一种形态就是交由法律管理,在这样的制度下会产生一套严格而概括性的规范,这套规范可能自古老传统衍生而来,像各种宗教经典及汉谟拉比法典都是很好的例子,十诫则可算是一种精简版。
至于其他规范来自于普遍共识,在这种情况下,所有的决策都只能达到最低标准,对置身其中的人可不一定是件好事。
此外,还有一些规范是来自多数人的约束。这方式可能产生所谓的多数暴力,使得少数人的权益被牺牲掉。这个问题会因时间而变得微不足道,但在民主制度中是无法避免的。邱吉尔曾经表示,民主是无法避免的恶,这句话正说明了上述的两难。
博弈论不是“策略大全”
一本关于决策的书首先必须说服读者,理性地作决策是办得到的,而且也确实能改善决策品质。其次要告诉读者如何理性地作决策。我们常强调自己作重大决策都要经过深思熟虑,可是事实未必如此。如果再继续逼问下去,就只好承认,偶尔还是得碰碰运气,其实有时候并没有太多选择,因为命运这类因果的因素时常会影响决定,所以也只好见招拆招。不过,当情况危急,或者直线式思考也能发挥作用的时候,没有选择的决策还是很重要的,也会带来好结果。
当然,游戏不能直接拿来作为生活教材,只能片面反映现实状况。歌德有一句名言,大意是抽象的理论是苍白的,而生命之树常绿。同样,抽象的人生模型也许可以反映理性的决策,但是未必能完全照搬于现实。
就个体而言,由于决策人可自行决定并承担后果,因此,理论上应该有所谓的“最佳决策模式”,但仍无法保证每次都能作出最好的选择。在人生的奋斗过程中,人们经常因一时冲动而作出决定,结果有好有坏,但事后却很少记得自己的选择是对还是错。至于那些相当重要的决策,我们要么庆幸自己做对了,要么就幻想着不然的话会如何如何。
一样米养百样人,有些轻率、大胆、可爱的人会尝试各种不同的事物,成为畅销小说与电视剧中的英雄人物。而这些鲁莽的英雄在作者的保护下,不必为其胆大妄为付出应有的代价所谓鲁莽也就是做事不经大脑。他们可以从很高的地方跳下来却毫发无伤,现实生活并非如此另一种人则因优柔寡断、垂头丧气、害怕犯错,一辈子也成就不了任何值得留念的事迹。“好花堪摘须及时”,就是告诉我们,要把握机会。还有些人只作极端保守的决策,竭尽所能避免错误,他们也一样无法完成任何值得回忆的事,而在这两种极端之间更存在着许多空间。
本书的部分章节会以有趣的谜题作为开端,由简单到复杂,由理论到现实,并通过在不同情形下的决策和竞赛等实例,来了解已知事实的个人决策;并在此基础上,通过组织、国家博弈的案例,来解释多人、多重标准的决策过程。在这个过程中,我们不但可以了解人类理性决策的原则,也可以发现人类理性中的某些难以解决的问题,这就是某些让人头痛的“困境”。从个人到群体,乃至国家和人类社会,都不得不面临这些困境,而我们能否解决它们,还有待时间考验。
值得注意的是,任何书本都无法向读者提供一本类似“策略大全”这样的东西。本书只能帮助读者建立博弈策略思维的意识,了解一些基本概念和原理。假如你想将它们运用于你自己面临的某一个具体情况,并且作出正确的决策和选择,那么你还得再做一些体现你自己创造性的工作。
贴士:
生活就是如此。我们常常自以为已经踏上了一条所谓“完美”的坦途,并准备心安理得地走下去,不经意间,却发现当我们试图以一种逻辑、一套方法、一条道路、一劳永逸地解决一切问题时,总难免会碰得头破血流。
囚徒困境人类的自私天性,使他们陷入“囚徒困境”难以自拔。社会生活和商业竞争中的许多逻辑都与这一困境密切相关。
合作是可能的吗
在什么条件下才能从没有集权的利己主义者中产生合作?这个问题已经困惑人们很长时间。大家都知道人不是天使,他们往往首先关心自己的利益。然而,合作现象到处可见,它是文明的基础。那么,在每一个人都有自私动机的情况下,怎样才能产生合作呢?我们对这个问题的回答极大地影响了我们在与他人的社会、政治、经济交往时的思维和行为。
最著名的回答是由托马斯·霍布斯给出的。他悲观地认为,在有政府存在之前,自然王国充满着由自私的个体的残酷竞争引发的矛盾,生活显得“孤独、贫穷、肮脏、野蛮和浅薄”。按照他的观点,没有集权的合作是不可能产生的。因此,一个有力的政府是必要的。
曾经有一位人类学家写了一个关于伊克人的故事:伊克人从前是在乌干达北方山谷里采集、打猎的游牧民族,政府决定在那里开辟一个国家公园,于是,他们为法律所迫,不再在山谷间打猎,而成了耕种于山岭薄地的农民。
生活环境和生活方式的变化,摧毁了他们原有的社会规范,伊克人因此把自己变成了一群不可救药的、让人讨厌的人,他们六亲不认、极端自私、毫无爱心。
这些人似乎生活在一起,聚集在密集的小村子里,但他们实际上是孤寂的、互不联系的个人,没有明显的互相利用。他们也说话,但说出的只是些粗暴的强求和冰冷的回绝。他们什么东西都不共享,从来不歌唱。孩子一旦能走路了,就把他们赶出家门去抢劫。只要可能,随时都会把老年人抛弃,让他们饿死。行劫的孩子从无能为力的老人嘴边抢走食物。
他们生儿育女时毫无爱心,甚至连粗疏的照顾都没有。他们在彼此的大门口排便。他们对邻居幸灾乐祸,只是见到别人不幸时他们才笑。他们常常笑,也就是常常有人倒霉。
伊克人因此成为文学上的一个象征,用来代表整个人类失去信心、失去人情味后的命运将是什么。
今天,世界各个国家在没有统一领导(联合国只是个协调机构)的情况下交往。因此,产生合作的必要条件就与国际政治的许多中心问题有关。最重要的就是安全困境:国家往往通过那些威胁到其他国家安全的手段来寻求自身的安全。这个问题体现在区域冲突和军备竞赛上。
在日常生活中,我们会问自己还要请多少次那些从来不回请我们的客人来就餐。一个机构中的管理者为了得到一些回报而给另一位管理者提供帮助。一个得到绝密消息的新闻记者为了得到进一步的消息而对来源保密。如果只有两个公司同时生产一个产品,一个公司定较高的价格是为了期望另一个公司也能保持高价,因为这样,双方都能得到好处(当然消费者吃亏了)。
合作中存在着一个根本问题,两个工业国家之间相互设置贸易壁垒便是一个很好的例子。由于自由贸易能给双方带来好处,因此,如果两个国家消除这些贸易壁垒都能受益。问题是,无论谁单方面采取行动消除自己一方的贸易壁垒,它都会发现自己处于不利于本国经济的贸易状态下。事实上,不论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每一个国家都有利益动机来保持贸易壁垒,尽管由此带来的结果比双方都合作差得多。
这个根本问题就是:个体对自身利益的追求会损害整体的利益。为进一步了解大量的具有这类性质的情况,需要有一个方法来表示这些情况的共同点,同时避免陷于每个情况的具体细节,即著名的“囚徒困境”游戏。
启示:一只河蚌正张开壳晒太阳,不料,飞来了一只鹬鸟,张嘴去啄它的肉,河蚌急忙合起两张壳,紧紧地钳住鹬鸟的嘴巴。鹬鸟说:“今天不下雨,明天不下雨,就会有死蚌肉。”河蚌说:“今天不放你,明天不放你,就会有死鹬鸟。”谁也不肯松口。有一个渔夫看见了,便走过来把它们一起捉走了——在对手的背后,往往还有更大的、共同的敌人。
,囚徒困境”的故事
1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后类似的博弈问题便有了一个专门名称——“囚徒困境”。
借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。
所谓的“囚徒困境”,大意是这个样子的。
甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):
如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;
如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;
如果两人都招供,则两人都会因罪名各判10年。
这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了,甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。
甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。
自然,乙也同样精明,也会如此推理。
于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是本问题的惟一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点,比如两人都拒认的场合,都有一人可以通过单方面改变选择,来减少自己的刑期。
也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。
为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。
,囚徒困境”这个问题为我们探讨合作是怎样形成的,提供了极为形象的解说方式,产生不良结局的原因是因为囚犯二人都基于自私的角度开始考虑,这最终导致合作没有产生。
在这个游戏中,你将如何做呢?设想你认为对方将合作,你可以选合作,那么你将得到“对双方合作的奖励”。当然,你也可以选背叛,得到“对双方背叛的惩罚”。
换言之,如果你认为对方合作,那么你背叛将能得到更多的好处。反过来,如果你认为对方将背叛,那么你也有两个选择,你选择合作,那么你就是“笨蛋”;你选择背叛,就会得到“对双方背叛的惩罚”。因此,对方背叛,你也背叛将会更好些。这就是说,无论对方如何行动,你背叛总是好的。到现在为止,你似乎知道该怎样做;但是,要知道相同的逻辑对另一个人也同样适用。
因此,另一个人也将背叛而不管你如何做。这样,你们将是双方背叛,只能一起坐牢很久,这比你们双方合作所能得到的“奖励”(只需短期服刑)差很多。个体的理性导致双方得到的比可能得到的少,这就是“困境”。
启示1:在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方所用策略之外的最好决策规则是不存在的。
启示2:“囚徒困境”是一些非常普遍而有趣的情形的简单抽象。在这些情形中,从个人的角度来说,背叛是最好的选择,但双方背叛会导致不甚理想的结果出现。
选1还是选2
这个问题不仅让商人们苦恼不堪,也同样折磨着商学院的学生们。一位教授让自己班上的27名学生进行一个博弈,而这个博弈会把他们带入“囚徒困境”。
假设每一个学生都拥有一家企业,现在他必须决定自己应该1,生产高质量商品来帮助维持较高价格,还是2,生产假货来通过别人所失换取自己所得。根据愿意选择1的学生总数,将收入分给每个学生。
这是一个“事先设计好”的博弈,目的是确保每个选择2的学生总比选择1的学生多得50美分,这个设定当然有现实意义,生产假货成本要比高质量商品低。不过,选择2的人越多,他们的总收益就会越少,这个假设也有道理:假货太多,就会使市场混乱,产品信誉降低。
假设全体27名学生一开始都打算选择1,那么他们各得1.08美元。假设有一个人打算偷偷改变决定,选择2,那么,选择1的学生就有26名,各得1.04美元比原来少了4美分,但那个改变主意的学生就能得到1.54美元比原来多了46美分。
实际上,不管最初选择1的学生总数是多少,结果都是一样,选择2是一个优势策略。每一个改选2的学生都会多得46美分,同时会使他的26个同学分别少得4美分,结果全班收入会少得58美分。等到全体学生一致选择自私的策略,尽可能使自己的收益达到最大,他们将各得50美分。反过来,假如他们联合起来,协同行动,不惜将个人的收益减至最小,他们将各得1.08美元。你会怎么抉择?
演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成“合谋”,结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择1的学生总数是4,全体学生的总收益是15.82美元,比全体学生成功合作可以得到的收益少了13.34美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么,他自己又是怎么选择的呢?“噢,我选了2。”他答道。
政治家们也会变成同样的困境中的囚徒。1984年,大多数人都很明白,美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行,因此,大幅增税应该是不可避免的。不过,谁愿意担当政治领导角色带头主张这么做呢?民主党总统候选人沃尔特·蒙代尔想要在自己的竞选活动当中为这么一个政策转变制造声势,却被罗纳德·里根打得落花流水,因为里根许诺绝不加税。里根当选之后,这个议题陷入僵局,无论你怎么划分政治派别,民主党对共和党,众议院对参议院,还是政府对国会,各方都希望把提出加税的主动权推给对方。
双方都知道,联合起来共同倡议加税和削减开支,可以共同分享荣誉,分担谴责。这么做与同时坚守被动,眼看巨额赤字上升而无所作为相比,显然会对整个国家更有利,即便对他们自己的政治生涯从长期而言也会有好处。反过来,假如自己提出这样的政策,而对方坚守被动局面,并不附和,自己就会落得最糟糕的下场。从各方的角度看,最好的结果在于,对方有人提出加税和削减开支,并因此不得不付出政治代价。
我们可以将这个情况变成一个博弈。双方分别是民主党和共和党。为了表示谁更加倾向于怎么做,显而易见,对每一方而言,保持被动是一个优势策略。而这正是真实发生的情况:这一届国会根本没有作出任何加税决定。这就是为什么美国是世界上最富有的国家,却同时又是最大的债务国的原因。
启示:这些情景使我们回想起尤塞里安在约瑟夫·海勒的小说《第22条军规》当中的境遇。故事的背景是:第二次世界大战胜利在望,可是为了给自己捞取功劳,一个飞行大队的指挥官没完没了地提高下属的任务定额,弄得所有人都人心惶惶。投弹手尤塞里安不想成为胜利前夕最后一批牺牲者,千方百计逃避执行任务。他的上级军官问:“可是,假如我方士兵都这么想呢(意思是“你不扛枪,我不扛枪,谁来保卫家”)?”可尤塞里安答道:“那我若是不这么想,岂不就成了一个大傻瓜?”
学生与囚犯
,囚徒困境”不仅可以解释政治、经济领域的竞争,在广阔的社会生活中,这一困境的影响也随处可见。例如,我国目前的基础教育,可以说就是一个“囚徒困境”。
最近10多年来,应试教育的弊端已经为社会公认,目前要求“减负”的不仅是中小学生和学生家长,也是教育专家和教育管理部门,也可以说是全社会的呼声。教育管理部门这几年做了一系列的工作,但收效甚微,并没有从根本上解决问题。
很少有人否认,学校不断给学生增加负担是目前教育的实际状况。同样,大家普遍认为呆板僵化的应试教育扼杀了学生的创造性。无论是专家还是家长,都在呼吁改变应试教育的模式。但是无论你是否意识到教育有问题,你的小孩都必须接受这个教育。如果没有改变整体性的教育体制,个别人、个别学校、个别地方单独改变都可能使其付出代价。每个家长都会这样想:尽管这种教育不好,但是其他小孩采取的是这种教育,衡量标准(如中考、高考)也是依据这种教育,我的小孩如不这样做,在竞争方面就会吃亏。因此,每个孩子和家长已经不知不觉地进入了一个囚徒困境。
如果我国现有的考试制度没有改变,“减负”就是空谈。现在假设国家严格规定:所有的学生都“减负”,少留作业,不补课、不做其他的练习题,是否能解决问题?可以肯定的是,规定即使一时有效,但效果会很快消失,最终极可能的结果是规定成了一纸空文,学生还是要背大书包、拼命做课外作业和各种练习题。
可以说,减负的状态是不稳定的,而“增负”的状态是稳定的均衡。原因就是,目前教育的博弈结构规定了各种行动或行为的收益或好处:获得高分的会进入好的初中、高中,进入好的初中、高中的学生可以考高分进入好的大学。而对于老师和学校来说,学生的升学率高意味着名利双收、饭碗牢靠;如果整个规则都倾向“增负”,“负”又如何减得下来?
从理论上说,摆脱“增负”的囚徒困境的惟一办法是改变教育的博弈结构,即改变博弈规则或游戏规则,让“全面发展”的学生获得更多的机会。可是要在实践中达到这个效果,却又困难重重,除了教育投入不足、师资水平不高等现实问题,最大的难点,是如何找到一个更科学、合理,同时又能保证公平的新的“游戏规则”。
至少在现在,这还是个没有答案的问题。
启示:管理的目的不是让每个人做到最好,而是避免内耗过多。
烟草商为何不反对禁止烟草广告
从上面的例子来看,一旦陷入“囚徒困境”,其中任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。那么,有什么办法可以使我们逃脱“困境”?稍后将详细讨论这个问题,这里只说一个外力干预打破困境的例子,它具有一些背谬甚至滑稽的色彩。
1971年,在“禁烟运动”的声势下,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,这一回财大气粗的烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。而且,后来的统计资料表明:尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。
你是否知道烟草公司为什么不反对、甚至可能还欢迎这项法律?因为这个禁令使他们从“囚徒困境”中解放了出来。
烟草行业同样竞争激烈,为了争夺市场,各大烟草公司都必须大做广告。为此,它们每年都要花费巨额广告费用,这无疑降低了它们的利润水平。也就是说,如果烟草公司都不做广告,它们的利润要更高。可是,如果其中一家公司不做广告,它的市场份额就会被其他公司抢走。这正是一个囚徒困境:你合作,对方不合作,你就吃亏了。在这种情况下,做广告就是优势策略。那么,烟草公司能否达成都不做广告的协议呢?不能,因为谁遵守协议,就很可能被对手耍弄。
现在好了,烟草公司做不到的,国家为它做了:法律起到了协议的作用,而政府承担了监督的成本,借用过去的一句话说,是“起到了阶级敌人想起而起不到的作用”,烟草公司又何乐不为呢?
你可能会说:广告不但有竞争的作用,也有开拓市场的作用,在这方面,烟草公司不是也有损失吗?当然如此。但是注意这个法律是有限的,被禁止的只是电视广告,而不包括其他媒体;而且只禁止在美国做电视广告,而不包括其他国家。(几年前,我们不是都看过气势不凡的“这里就是万宝路的世界”这个电视广告吗?)对于已经比较成熟的市场,像香烟这样的商品,广告的开拓作用是有限的。现在,美国烟草公司已经把开拓的目标放在了广大的国外市场。
一定是坏事吗
,囚徒困境”确实揭示了自私对合作的破坏作用,但是正如“有一利必有一弊”这句话,“囚徒困境”给我们带来的也并不全是坏消息。
作为一个比喻,我们会为囚犯不能合作而遗憾;可是如果它发生在现实中,我们就巴不得他们不能合作。如果两个危险的罪犯通过合作逃脱了法律制裁,一定会给社会造成更大的危害。
同样,如果商家通过合谋控制物价,我们就不能享受合理的价格,这也会大大增加人们的消费成本,降低人们的生活水平。
从经济的角度来看,如果几个大企业联手或勾结起来形成对行业的垄断,谋求最大利润,那么它们结成的联盟称为“卡特尔”。卡特尔因为由自主的企业组成,所以很不稳定。以产量竞争来说,组成卡特尔,就要讨价还价,达成限制产量的协定,总产量因为协定的限制降低了,价格也就会上去,可能比结成卡特尔以前高出很多。这时候,谁要是偷偷地扩大产量,他可能占到很大的便宜。卡特尔联盟和组成联盟的成员之间的关系,不是上下级的关系,不是谁服从谁的关系。卡特尔的成员都是独立的经济主体,只不过为了利益关系走到一起来了。偷偷违反协议增加产量或提供优惠会捞到很大的便宜,这就促使一些成员违反协议。所以说,卡特尔本身就提供了瓦解卡特尔的激励。
在人类经济活动中,除了石油输出国组织欧佩克一度比较成功以外,卡特尔成功的例子实在很少。
欧佩克之所以比较成功,很大的原因在于它的最大的成员国沙特阿拉伯“自律”较严。石油产量最大的沙特阿拉伯自律严了,在一段时间内就可以避免其他成员违反协议,造成危害卡特尔的结果。沙特阿拉伯为什么自律较严,我们在后面将会谈到。
从政府管制的角度来看,卡特尔在许多情况下是非法行为。例如近年来的“家电”大战,电视、空调等价格一路下跌,残酷的价格战让家电企业吃不消,几年前,9家企业曾经一起协议制定最低价格,规定什么类型的家电至少要卖多少钱,不许把价格降到比协议规定的价格还低的水平,其目的无非是不要竞相降价,以免大家的利润都下降。这就是卡特尔行为。很快,国家计委就发出文件,指出该决议非法。这主要是不许企业联手抬高商品价格损害消费者的利益。发达国家对垄断现象和卡特尔现象的限制往往更加严厉。最典型的例子是20世纪80年代,经过多年的辩论和漫长的立法程序,美国把原来垄断电话通讯市场的AT&T公司强行分割为几个公司。分割以后,由于公司之间的竞争,电话服务的价格很快就下降了一半,再加上竞争激励出来的技术进步,现在用电话卡从美国往中国打电话一分钟只要几美分。
从原则上说,政府鼓励企业之间的竞争,因为企业竞争会给广大消费者带来很大的好处。比如我国电话服务市场长期是垄断的,所以直到前几年,在我国许多地方,装一部电话不仅要花三四千元,而且还要排队等待不少时间才能装上。但是在许多发达国家,如果你要装电话,只需通知电话公司,马上就会给你装好,完全不用缴纳什么安装费。由于竞争,如果你把选择的电话服务从原来的公司撤出来转到另一家公司,新的公司还会给你奖励,比如说奖励你30分钟的国内长途电话费,再加一件T恤什么的。现在,我国电话服务市场开放竞争,消费者固然马上得到实惠,服务水平也在明显上升。再如过去我国移动电话市场原来基本上是一家垄断,当时购置、使用一部移动电话的费用高达一两万元,是典型的“奢侈品”。后来打破了这一垄断,允许几家企业共同经营,移动电话的费用很快就降到千元左右,几乎成了人手一部的“必需品”。
初看起来,鼓励竞争似乎对企业不利,使企业不容易赚钱。但是只有这样,才能激励企业改善管理,开发技术,努力以较低的成本生产质量较好的产品。提高企业的市场竞争力。竞争力不是天生就有的,它本身就是竞争的结果。若不首先让我们的企业在国内市场好好竞争,他们在国际市场就不可能有强大的竞争力。
启示:曾经有两个饥饿的人,他们从一位智者那里得到了一根鱼竿和一篓鲜鱼,得到那篓鲜鱼的人就在原地把鱼煮熟了一口气吃完,解决了饥饿问题,可是很快就又感到肚内空空,最终饿死在了空空的鱼篓旁。而另一个得到鱼竿的人则提着鱼竿向遥远的大海走去,当他终于来到了大海边的时候,他也用尽了自己的最后一点力气。不久之后,同样是两个饥饿的人,他们也从智者那里得到了同样的一根鱼竿和一篓鲜鱼。不同的是他们并没有分头行动,而是一起去寻找遥远的大海。每到饥饿的时候,他们就会从鱼篓中拿出一条鱼来吃。当他们终于来到了大海边的时候,这两个人就拿着那根鱼竿开始了靠捕鱼为生的日子。
第2章 优势、劣势与均衡
当你身处类似“囚徒困境”这样的同时行动的博弈中,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择往往是有迹可遁的,并形成某种“定式”——即均衡。
新闻大战与博弈策略
势者,因利而制权也。——《孙子兵法》
前面所引的这句话的意思就是:所谓(有利的)形势,即根据对我有利的情况采取措施和行动。
当你身处类似“囚徒困境”这样的同时行动的博弈(跟棋牌之类的交替行动博弈不同)你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择往往是有迹可循的,并形成某种“定式”——即均衡。
为了说明博弈如何达到“均衡”的结果,我们可以通过两份杂志(以美国的两大杂志《时代》和《新闻周刊》为例)来演示这一过程。
每个星期,《时代》和《新闻周刊》都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。
他们这么做的时候,很清楚在此时《新闻周刊》的编辑们也在关起门来开会,选择下一个封面故事。反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情,而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点……这两家新闻杂志投入了一场策略博弈。由于《时代》与《新闻周刊》的行动是同时进行的,双方不得不在毫不知晓对手决定的情况下采取行动。等到彼此发现对方做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期很可能竭力反扑,不过,等到那时,说不定已经出现了一个完全不同的新的故事模式,开始了一场完全不同的博弈。
要注意这种同时进行的博弈与相继(一先一后)行动的博弈所要用到的策略思维和行动是完全不同的。对于像下棋这样的一人一步的相继行动的博弈,每个参与者都必须向前展望,估计对手的意图,从而倒后推理,决定自己这一轮应该怎么走。这是一条线性的推理链:“假如我这么做,他就会那么做——若是那样,我会这么反击”,依此类推。也就是说,你怎么走,完全取决于对手的上一步行动。
而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”,诀窍在于怎样破解这个循环。
启示:有一个著名的寓言:两个人都在喝水,都喝了半杯水,一位说:“我已经喝了半杯。”另一位说:“我还有半杯水没有喝。”他们好像说的是一回事,然而聪明人都可以听出他们说的又不是一回事,就像有些人说:“我的钱已经用了一半。”而另一些人说:“我的钱还有一半没有用。”
同时行动的优势策略
你怎样才能看穿所有那些错综复杂而又看不见的策略呢?首先,你不要把其他参与者的未知行动视做像天气那样,具有与个人无关的不确定性。上班之前,你可能收听天气预报,知道今天是否下雨,你会利用这个信息去决定要不要带一把雨伞去上班。当然,你带不带伞,丝毫不能影响天下不下雨。但为封面故事而作决定的概率则完全是另外一回事。
区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟《时代》的编辑自己一样。即便一个编辑不可能真的观察到另一个杂志的决定,他也可以通过另一个杂志的视角思考这个问题,尝试确定它现在一定在做什么。
我们可以提供一个单一的、统一的原理,为相继行动(即有先有后)的博弈确定最佳策略。这就是向前展望,倒后推理。在这里,事情不会那么简单。不过,关于同时行动必不可少的思维方式的思考可以总结为指导行动的三个简单法则。反过来,这些法则又基于两个简单概念:优势策略与均衡。
举个简单的例子:你是一名足球前锋,你和队友形成了二打一的局面,你面对着对方的后卫,你可以选择带球突破,也可以选择传球给队友,一般情况下,传球过人的成功率更大,那么传球就是你的优势策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。一般而言,假如一个球员有某一做法,无论其他球员怎么做,这个做法都会高出一筹,那么这个球员就有一个优势策略。假如一个球员拥有这么一个策略,他的决策就会变得非常简单;他可以选择这个优势策略,完全不必担心其他对手怎样行事。因此,寻找优势策略是每一个人的首要任务。
回到《时代》对《新闻周刊》的例子,假定本周有两个大新闻:一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候,首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻封面故事都会买这本杂志)。在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面故事,那么感兴趣的买主就会平分两组,一组买《时代》,另一组买《新闻周刊》。
现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采用艾滋病新药做封面故事,那么,假如我采用预算问题,我就会得到整个‘预算问题市场’(即全体读者的30%);假如我采用艾滋病新药,我们两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),因此,艾滋病新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问题,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来更大的收入。因此,我有一个优势策略,就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我的其他策略更胜一筹。”
启示:一家尖端科技公司的某部经理,询问副总工程师新产品的市场成功率。他得到的答案是“大约50%”,这位经理回答说:“太高了,最好设定在30%,否则,我们会因太保守而不敢放手做。”
当对手有优势策略时
在这个博弈里,双方都有一个优势策略。
以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。
在囚徒困境中,两个参与者都有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题:参与者怎样合作才能取得一个更好的结果?
有时候,某参与者有一个优势策略,其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。
对于《时代》,艾滋病新药仍然是优势策略,但对于《新闻周刊》就不再是了,因为《时代》的优势策略是选择艾滋病新药这个主题,如果它也做同样选择,那么只能得到28%的读者,小于选择预算问题的30%。
换言之,《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择艾滋病新药,《新闻周刊》选择预算问题就能得到更好的销量,对于《新闻周刊》,预算问题市场总比新药市场要大。
,新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他们的选择。因此,《新闻周刊》的编辑们可以很有把握地假定《时代》已经选了艾滋病新药,并据此选择自己的最佳策略,即预算问题。
由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。
优势策略与对手策略无关
现在,既然我们已经介绍了优势策略的概念,就有必要强调可用来确定什么不是优势策略的两点特征。
人们很容易就会弄错,不知道优势策略的优势究竟是对什么而言的。“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是对你的对手的策略占有优势,无论对手采用什么策略。
某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。回顾封面大战的例子,《时代》和《新闻周刊》都有一个优势策略,但双方都不可能得到比对方更高的销量。
另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照最初设定的条件,《时代》假如采用艾滋病新药做封面故事,最坏的结果是得到35%的市场份额;他们若采用预算问题做封面故事,可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。
现在让我们想像一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是l美元,且售价只有两个可能的价位选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为l美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800万。这时,你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润,即如果你们都是3美元,利润都是500万;一方降价至2美元,独得800万,另一方分文不得;如果双方都降,每一方利润都是400万。
有点像“囚徒困境”是不是?的确,在囚徒困境中,双方的优势策略都是招供,在这里都是降价。
,时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如这时《时代》把价格降到2元,利润还会更高,达到800万美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。即:假如你有一个优势策略,请照办。
不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。
提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自己的优势策略。正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时作出自己的决定,因此你有机会影响他的行动。某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。
启示:马太效应:凡是少的,连他仅有的也夺过来;凡是多的,就加给他,让他更多。在各个领域,马太效应畅行无阻——你不在上面,就在下面。而一旦成功地利用它,就可以达到事半功倍的效果。
追求最佳,避免最差
不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。
一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。
假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。
在你没有优势策略的情况下,你要做的就是剔除所有劣势策略,不予考虑。如此一步一步做下去。
假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈的复杂程度。
利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧,最终走出这个循环。
博弈的均衡——纳什均衡
我们已经找到了一个策略组合,其中,各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。这个概念是由普林斯顿大学数学家约翰·纳什(也就是电影《美丽心灵》的主人公)提出的,因此被称为“纳什均衡”。
纳什均衡是博弈分析中的重要概念。1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,即纳什均衡。
那么,什么是纳什均衡呢?简单说就是,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。
在囚徒困境中存在惟一的纳什均衡点,即两个囚犯均选择“招认”,这是惟一稳定的结果。
有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”(或称性别之战)中有两个纳什均衡点。丈夫和妻子商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚。在这个“夫妻博弈”中有两个纳什均衡点:(歌剧,歌剧),(拳击,拳击)。在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。
纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。
诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义也同样重大。
启示:通俗地说,纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。
纳什均衡有什么用
纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。
我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢?我们可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起来,就能形成一个有力的答案。
首先,存在避免循环推理的必要,因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道……”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动,并且确定自己的最佳对策。
均衡策略的第二个好处出现在零和博弈中。在这种博弈里,参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。
第三个理由是,均衡方法注重实效。要想知道梨子的滋味,就要吃一吃。我们将会利用均衡方法讨论许多博弈。希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。相信这么做会使我们的分析更有意思,比抽象地讨论均衡方法的优点更有意义。
最后,可能存在一个对均衡概念的误解,希望各位可以避免。当我们说博弈的结果是均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不同。
在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之为均衡产量。均衡分析是经济学中的重要分析。
那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。
纳什均衡是一最常见的均衡。它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。
在上面的“买——卖”的博弈中,可以解释为什么在现实中讨价还价后买卖能做成的原因,因为这对双方来说都是最优选择。同时在“买——卖”博弈中,其均衡对双方来说是全局最优的。
警察与小偷
是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策略纳什均衡点——所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点——所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。我们下面将在“警察与小偷”的博弈中给出混合策略的说明。
在西部片里,我们常能看到这样的故事:某个小镇上只有一名警察,他要负责整个镇的治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。假定银行需要保护的财产价格为2万元,酒馆的财产价格为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,就会被警察抓住;若警察没有巡逻的地方而小偷去了,则小偷偷盗成功。警察怎么巡逻才能使效果最好?
一个明显的做法是,警察对银行进行巡逻,这样,警察可以保住2万元的财产不被偷窃。可是如此,假如小偷去了酒馆,偷窃一定成功。这种做法是警察的最好做法吗?有没有对这种策略改进的措施?
这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的最优(混合)策略选择。
对于这个例子,对于警察的一个最好的做法是,警察抽签决定去银行还是酒馆。因为银行的价值是酒馆的两倍,所以用两个签代表银行,比如如果抽到1、2号签去银行,抽到3号签去酒馆。这样警察有2/3的机会去银行进行巡逻,1/3的机会去酒馆。而小偷的最优选择是:以同样抽签的办法决定去银行还是去酒馆偷盗,只是抽到1、2号签去酒馆,抽到3号签去银行,那么,小偷有l/3的机会去银行,2/3的机会去酒馆。
警察与小偷之间的博弈,如同小孩子之间玩“剪刀石头布”的游戏,在这样一个游戏中,不存在纯策略均衡,对每个小孩来说,自己采取出“剪刀”、“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。如果对方知道你出其中一个策略的“可能性”大,那么你在游戏中输的可能性就大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略是参与者在各种备选策略中采取随机方式选取的。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略。
启示1:没有把真正的问题找出来就盲目采取行动,是最愚蠢的做法。能够找出问题,已经可以说是把问题解决一半了。
启示2:解决问题的公式:
(1)找出问题发生的原因;
(2)分辨情报的价值;
(3)彻底推行解决方案;
(4)观察事情进行得是否顺利。
任何事情都看似很难,实质不难;任何事情都比你预期的更令人满意;任何事情都能办好,而且是在最佳的时刻办好——麦可斯韦尔定律有助你走出阴霾。
斗鸡博弈的难局
试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公鸡来说,最好的结果是,对方退下来,而自己不退,但是此时面临着两败俱伤的结果。
两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进的公鸡获得1的支付,赢得了面子,而后退的公鸡获得-l的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子获得-1的支付。当然这些数字只是相对的值。
这个博弈有两个纳什均衡:一方前进,另一方后退。但关键是谁进、谁退?一个博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是一事先知道的惟一的博弈结果。但是如果一博弈有两个或两个以上的纳什均衡点,则无法预测出一个结果来。因此,我们无法预测斗鸡博弈的结果,即不能知道谁进谁退,谁输谁赢。
用这个博弈来解释美苏两个超级大国之间的古巴导弹危机,是最合适不过的了。
面对美国的反应,苏联面临着是将导弹撤回国还是坚持部署在古巴的选择?而对于美国,则面临着是挑起战争还是容忍苏联的挑衅行为的选择?也就是说,这两只大公鸡均在考虑采取进的策略还是退的策略?
战争的结果当然是两败俱伤,而任何一方退下来(而对方不退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来,做了丢面子的“撤退的鸡”。美国坚持了自己的策略,做了“不退的鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而发生美苏战争——这是美国不愿意看到的,美国象征性地从土耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间发生的最严重的一次危机。
这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的结果。
启示:任何事情都看似很难,实质不难;任何事情都比你预期的更令人满意;任何事情都能办好,而且是在最佳的时刻办好——麦可斯韦尔定律有助你走出阴霾。
左边还是右边
前面我们已知,在博弈中纳什均衡点如果有两个或两个以上,结果就难以预料。这对每个博弈方都是麻烦事,因为后果难料,行动也往往进退两难。一个小例子就是两个骑自行车的人对面碰头,很容易互相“向住”:因为不知道对方会不会躲、往哪边躲,自己也不知该如何反应,于是撞到一起。
自行车相撞一般不会造成什么大麻烦,可是如果换成马车、汽车,就可能出现伤亡。所以,应该有一个强制性的规定,来告诉人们该怎么做。
开车的时候你应该走哪一边?假如别人都靠右行驶,你也会留在右边。套用“假如我认为他认为”的框架进行分析,假如每个人都认为其他人认为每个人都会靠右行驶,那么每个人都会靠右行驶,而他们的预计也全都确切无误。靠右行驶将成为一个均衡。
不过,靠左行驶也是一个均衡,正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡,所有参与者必须就应选择哪一个达成共识,否则就会导致困惑。
海上航行也要面临同样的问题,尽管大海辽阔,但是航线却是比较固定的,因此船只交会的机会很多,这些船只属于不同的国家,如何调节谁进谁退的问题呢?先来看一个小笑话:
一艘军舰在夜航中,舰长发现前方航线上出现了灯光。
舰长马上呼叫:“对面船只,右转30度。”
对方回答:“请对面船只左转30度。”
,我是美国海军上校,右转30度。”
,我是加拿大海军二等兵,请左转30度。”
舰长生气了:“听着,我是‘列克星顿’号战列舰舰长,这是美国海军最强大的武装力量,右转30度!”
,我是灯塔管理员,请左转30度。”
即使你官阶、舰船再大,灯塔也不会给你让路。那么,如果是两条船相遇,又如何决定呢?
谁先让不能等待临时谈判,也不是由官阶说了算。海上避碰也有像许多国家规定车辆在马路上靠右走那样不容谈判的规矩。人们规定,迎面交会的船舶,各向右偏一点儿,问题就解决了。十字交叉交会的船舶,则规定看见对方左舷的那艘船要让,慢下来或者偏右一点儿都可以。这就从制度上规定了避让的方式。
这十字交叉交会时如何避免碰撞的规矩,就是上述博弈的两个纳什均衡中的一个。究竟哪一个纳什均衡真正发生,现在就看两船航行的相互位置。如果甲看见乙的左舷,甲要让乙原速直走,就是右上角那个纳什均衡;如果乙看见甲的左舷,乙要让甲原速直走。
谁打电话
上面的例子是通过规定解决了问题,不过,若是遇到电话打到一半突然断了的事,你该怎么办?
假如你正在和女友通话,电话断了,而话还没说完。这时有两个选择,马上打给对方,或等待对方打来。注意:如果你打过去,她就应该等在电话旁,好把自家电话的线路空出来,如果她也在打给你,你们只能听到忙音;另一方面,假如你等待对方打电话,而她也在等待,那么你们的聊天就没有机会继续下去。
一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡:一个是你打电话而她等在一边,另一个则是恰好相反。
一个解决方案是,原来打电话的一方再次负责打电话,而原来接电话的一方则继续等待电话铃响。这么做的好处是原来打电话的一方知道另一方的电话号码,反过来却未必是这样。
另一种可能性是,假如一方可以免费打电话,而另一方不可以(比如你是在办公室而她用的是住宅电话),那么,解决方案是拥有免费电话的一方应该负责第二次打电话。还有一种比较通常的解决方法是,由较热切的一方来打电话,如一个煲电话粥成瘾的家庭主妇对谈话的热情很高,而她的同伴就未必这样,这种情况下通常是她打过去。再如恋爱中的男女遇到这种情况,通常也是由主动追求者打电话。
假如不考虑以上因素,那么打这个电话又得用到这种“混合策略”了:设想双方都投硬币决定自己是不是应该给对方打电话,根据前面给出的条件,两人这种随机行动的组合成为第三个均衡。
假如我打算给你打电话,我有一半机会可以打通(因为这时你恰巧在等我打电话),还有一半机会发现电话占线;假如我等你打电话,那么,我同样会有一半机会接到你的电话,因为你有一半机会主动给我打电话。
每一个回合双方完全不知道对方将会采取什么行动,他们的做法实际上对彼此都最理想。因为我们只有一半机会重新开始被打断的电话聊天,我们知道我们(平均来说)要尝试两次才能成功接通。
需要再次强调的是:均衡不一定是博弈的最优结果。在“囚徒困境”中,惟一的均衡是一起招认,站在群体的角度,这是最坏的结果。均衡只是博弈的最“稳定”结果,或者说是最可能出现的结果。那么,这就需要我们思考一个问题:如果这个“稳定”结果效果不佳,我们能否找到合理的策略打破这个“均衡”?
启示:在同时行动的博弈中,有三个行动法则:一是寻找和运用优势策略;二是寻找和避免劣势策略,同时假定你的对手也在这么做;三是寻找和运用均衡。
  第3章 打破“囚徒困境”
在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。
囚犯的救赎
为了验证面对“囚徒困境”时人们可选择的策略以及这些策略的有效程度,美国的学者组织了一次以此为主题的计算机竞赛。竞赛要求参加者根据这一困境设计程序,并将程序输入计算机,通过各种程序的相互对局的最后得分评判优劣。
竞赛的游戏方法是:游戏双方都在不知对方将如何选择的情况下,选择合作或背叛。这些选择放在一起就产生了四个可能的结果,即:合作,合作;合作,背叛;背叛,合作;背叛,背叛。在这个游戏中,如果双方选择合作,双方都能得到较好的结果R,即“对双方合作的奖励”。在这个例子中R为3分,3也可以代表参赛者得到的奖金数。如果一方合作而另一方背叛,那么,背叛者得到“对背叛的诱惑”T=5。而合作者则得到“给笨蛋的报酬”S=0。如果双方都背叛那么双方都得到P=1,即“对双方背叛的惩罚”。
参赛者提出了各种程序,但是大致可分为“善良的”、“邪恶的”和“随意的”三类,竞赛的结果也许有些出人意料:“善良”即“以合作为主”的策略大获全胜,而“邪恶”即“以占便宜为主”的策略成绩不佳。
现在考虑一个双方对局的例子。一个对策者采用的策略是每一步都背叛,即“总是背叛”,另一个对策者采用的策略是“一报还一报”,即在第一步合作,然后就采用对方上一步的选择。“一报还一报”意味着在对方每一次背叛之后就背叛一次。当对方采用“一报还一报”时,采用“总是背叛”的对策者,将在第一局得到收益,在而后的对局中都得到相应的回击。这样,这个背叛者只是在第一局得到5分,而在以后的每局都只能得到1分,最终他可能会“战胜”对手,但由于总分仍然很低,而被淘汰出局。
你可能忍不住要问:“什么是最好的策略?”换句话说,什么策略能使对策者得到可能的最高分?这个问题问得很好。但是就像以后要说明的一样,独立于对方所用策略之外的最好决策规则是不存在的。从这个意义上说,“囚徒困境”完全不同于一般游戏,如国际象棋。一个象棋大师可以有把握地假定对手将走让他最头疼的一步,这种假定是这类游戏的基础。然而在这里,游戏者的利益并不是完全冲突的。双方可以通过合作而得到“对合作的奖励”R,也可以通过背叛而得到“对背叛的惩罚”P。如果你假定对方总是走你最担忧的一步,那么,你就会认为其他人总是不合作,这就会使你也不合作,最后招来无休止的惩罚。所以与下棋不同,在“囚徒困境”中假定对方一心要赢你是不可靠的。
事实上,在“囚徒困境”中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。总的来说,如果你认为今后将难以与对方相遇,如果你不太关心自己未来的利益,那么,你现在最好是背叛,而不用担心未来的后果。
这样,我们得到了第一个正式的结论,但却是一个令人伤心的结论,即:如果未来是重要的,就不存在最优策略。
启示:好莱坞大片《肖申克的救赎》是一部很好看的电影,主要内容是一个被冤屈的囚犯如何凭着坚定的信念和聪明才智逃出牢房。我们的“囚犯”也可以通过好的策略合作,摆脱“困境”的诅咒。
,一报还一报”的伟大胜利
区分善良规则好坏的一个特征是,看它们如何迅速地和可靠地对来自对方的挑战作出反应。一个规则可以被称为“报复性的”,如果它在对方的背叛之后立即以背叛报复。除非一个策略能迅速反应来自对方的挑战,否则,对方将简单地从这样一个好说话的策略身上获得越来越多的好处。
在比赛中,有好几个规则故意使用若干次背叛,试试看它们能否讨到便宜。因此,很大程度上决定善良规则的最后名次的是它们能否很好地应付这些挑战。
对付这类挑战性规则的最好办法是时刻准备报复来自对方“无缘无故”的背叛。因此,善良能得到好处,报复也能得到好处。“一报还一报”综合了这些优点,它是善良的、宽容的和具报复性的。它从不首先背叛,但是不管过去相处的关系如何好,它总能被一个背叛所激怒,而迅速作出反应。
生态分析的结果说明了“一报还一报”的又一个胜利。在最初的竞赛中“一报还一报”领先一点点,而且在整个生态模拟过程中一直保持领先。到了第1000代,它是最成功的规则,并且比任何一个其他规则都增长得快。
,一报还一报”的所有记录是令人难忘的。概括地说,“一报还一报”是62个参赛者中平均得分最高的规则。在竞赛的生态模拟中它一直保持领先。加上它在实验室的对策实验中的良好表现,“一报还一报”显然是一个非常成功的策略。
,一报还一报”的成功可以说明的是它是一个很具适应性的规则:即它在很大范围的环境中表现极佳。它的成功部分是由于其他规则预料到它的存在并且被设计得与它很好相处。要和“一报还一报”很好相处就要和它合作,这反过来就帮助了“一报还一报”。即使那些被设计成伺机占便宜而不被惩罚的规则,也很快向“一报还一报”道歉。任何想占“一报还一报”便宜的规则最终将伤害自己。“一报还一报”从自己的不可欺负性得到好处,是因为以下三个条件得到了满足:1.遇到“一报还一报”的可能性是显著的;2.一旦相遇,“一报还一报”很容易被识别出来;3.一旦被识别出来,其不可欺负性就显示出来。因此,“一报还一报”从它自己的清晰性中得到好处。
另一方面,“一报还一报”放弃了占他人便宜的可能性。这种机会有时是很有利可图的,但是试图占便宜而引来的问题也多种多样。首先,如果一个规则用背叛试探是否可以占便宜,它就得冒被那些可激怒的规则报复的风险。第二,双方的反击一旦开始,就很难自己解脱。
,一报还一报”的稳定成功的原因是它综合了善良性、报复性、宽容性和清晰性。它的善良性防止它陷入不必要的麻烦,它的报复性使对方试着背叛一次后就不敢再背叛,它的宽容性有助于重新恢复合作。它的清晰性使它容易被对方理解,从而引出长期的合作。
启示:一报还一报能够赢得竞赛不是靠打击对方,而是靠从对方引出使双方都有好处的行为。
你不必每次都赢
虽然预见对于合作的进化不是必要的,但它却对我们很有帮助。因此在这里将分别对参与者和改革者提供建议。
下面为那些处于“囚徒困境”的人提供建议。从个体的眼光看,目标是在与对手的一系列对局中尽可能地得高分。由于这个游戏是“囚徒困境”,参与者会受到背叛的短期诱惑,但是通过与对方建立双方合作的模式可以得到更多的长期好处。对计算机竞赛的分析和理论研究的结果,为我们提供了一些有用的信息,即在不同的条件下什么样的策略会起作用和为什么这些策略能表现得好。这一章就是把这些发现转化成对参与者的建议。
在持续的“重复囚徒困境”中应如何表现,下面是四个简单的建议:
1.不要嫉妒
人们习惯于考虑零和对局,在这种情况下,一个人赢,另一个就输。一个很好的例子就是下棋比赛。为了能赢,一个参赛者必须在大部分时间里比对手做得更好。白棋赢黑棋就输。
然而生活中的大多数情况都是非零和的。双方可以都做得很好,也可以都做得很差。双方的合作是可能的,但并不是总能实现。这就是为什么“囚徒困境”是各种各样的日常情形的有用模型。
人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功对立起来。这种标准导致了嫉妒,嫉妒导致企图抵消对方已经得到的优势。在“囚徒困境”的形式下,抵消对方优势只能通过背叛来实现。但是背叛导致更多的背叛和对双方的惩罚。因此嫉妒是自我毁灭。
要求自己比对方做得好不是一个很好的标准,除非你的目的是消灭对方。在大多数情况下,这个目的是不可能实现的。
,一报还一报”由于与其他多种多样策略相处得很好而赢得了竞赛。平均来说,它比竞赛中的其他任何策略都做得更好。但是“一报还一报”从来没有一次在游戏中比对方得更多的分!事实上,它不可能比对方多得分。它总是让对方先背叛,并且它的背叛次数决不比对方背叛的多。因此“一报还一报”不是得到和对方一样多的分,就是比对方略少。“一报还一报”赢得竞赛不是靠打击对方,而是靠从对方引出使双方有好处的行为。“一报还一报”如此坚持引出双方有利的结果,从而使它获得比其他任何策略更高的总分。
因此在一个非零和的世界里,你没有必要非得比对方做得更好。特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得好就没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困境”中,其他人的成功是你自己成功的前提。
在生意场中也是这样,一个从供应商那儿买来东西的公司期望供方和买方都有好处的成功的关系。妒忌供方的利润是完全没有意义的。任何通过不合作行为(如不按时付账)来减少这种利润的企图,都将激起供方的报复行动,报复行为可以采用多种形式,经常以不明显惩罚形式,诸如拖延发货,较低的质量保证,不愿意打折扣,或者不交换市场条件变化的信息。这种报复使得嫉妒代价很大。买者不要担心卖方的相对的利润,而可以考虑是否有其他更好的购买策略。
2.不要首先背叛
竞赛和理论分析的结果都表明,只要对方合作你也合作就会有好处。竞赛结果是很令人吃惊的。决定一个规则表现如何的惟一最好的特征是这个规则是否善良。也就是说这个规则是否不首先背叛。在第一轮竞赛中,前8名规则中都是善良的,在后7名规则中没有一个是善良的。在第二轮竞赛中,前15名规则中只有一个是非善良的(它名列第8),而后15名规则中只有一个是善良的。
有些不善良的规则,使用相当复杂的方法来试探它是否能逃脱惩罚。例如尝试在第一步背叛,如果对方报复的话,它就马上撤回。在另一个例子中,它在背叛前等待十几步,看看对方是否能被哄骗和被偶尔占便宜。如果是的话,就更频繁地增加背叛,直到对方反击而被迫撤回。但是这些尝试道德背叛的策略都表现得不怎么好。因为存在许多由于愿意报复而不被占便宜的策略,所以导致冲突的代价有时是很高的。
甚至许多专家也没有意识到善良性对避免不必要的冲突的价值。在第一轮竞赛中,由对策论专家送来的规则中几乎有一半是不善良的。参考了第一轮的明显结果,第二轮比赛中大约有1/3规则用不善良的策略,但是,它们都没有占到便宜。
前面的竞赛结果提供了另一个方式来说明为什么善良的规则能表现得如此好,由于善良的规则相互之间相处得很好,因而善良规则的群体是很难被侵入的。而且能够阻止单个变异个体侵入的善良规则的群体也能阻止这个变异规则的任何小群体的侵入。
当然,你可以尝试更保险的方式,即先背叛直到对方合作,才开始合作。然而,竞赛的结果表明,这实际上是一个很有风险的策略,因为你的最初的背叛就可能引起对方的报复,并使你处于要么被占便宜要么双方背叛的两难境地。如果你惩罚对方的报复,这种反应就会一直延续下去。如果你宽恕了对方,你就得冒被欺负的风险。即使你能避免这些长远问题,对你的最初背叛的当下报复会使你希望自己从一开始就应该是善良的。
对竞赛的生态分析揭示了另一个为什么首先背叛是很冒险的道理。第二轮竞赛中前15名规则中惟一的非善良策略是名列第8的“哈林顿”。因为它与竞赛中的名次较低的规则相遇的得分都很高。在假想的未来生态竞赛中,名次较低的规则在群体中的比例越来越小,最终能被这个最初挺成功的非善良策略占便宜的策略就越来越少,接着它自己也消亡了。因此,只会占“傻瓜”的便宜是没有用的,它只不过是一个自我毁灭的过程。这个教训说明,虽然不善良在最初看来似乎是很有希望的,但长期下去它将毁坏使自己成功所必需的环境。
3.对合作与背叛都要给以回报
,一报还一报”超常的成功给出了一个简单的但又是很有力量的建议:要回报。在第一步合作之后,“一报还一报”只是简单地回报对方在上一步的所为。这个简单的规则惊人地有效。它赢得了第一轮“囚徒困境”计算机竞赛,并取得比任何其他由对策论专家们送来的规则更高的平均得分。每一个第二轮竞赛的参加者知道这个结果,但“一报还一报”又赢了第二轮竞赛。这个胜利显然是令人惊讶的。因为每一个参赛者都是在考虑了“一报还一报”在第一轮竞赛中的胜利结果之后,才提交参赛规则的。显然人们都希望能干得更好,但是他们错了。
,一报还一报”不仅赢得竞赛本身,而且在假设的继续比赛中比其他任何规则表现得都好。这表明“一报还一报”不仅与最初的各种规则相处得很好,而且能与那些可能在未来群体中占较大份额的成功的规则相处得很好,它不毁坏自己成功的基础,相反它在与其他成功的规则相互交往中繁荣起来。
,一报还一报”所体现的回报在理论上也是很重要的。当未来相对于现在是足够重要的时候,“一报还一报”是稳定的。这就意味着,如果每个人都使用“一报还一报”策略,那么对一个特定的个体的最好建议就是也采用“一报还一报”策略。或者这么说,如果你能肯定对方是采用“一报还一报”,并且这种交道将持续足够长,那么,你最好也采用相同的策略。
事实上,“一报还一报”很善于区分哪些规则会回报它的最初合作,哪些不会。这就使得它能够以小群体形式侵入“小人”的世界。并且,它回报背叛也回报合作。这使得它是可激怒的。而善良的策略要阻止被侵入,就必须是可激怒的。
在反应对方的背叛时,“一报还一报”保持了惩罚和宽恕的平衡。“一报还一报”总是在对方每次背叛之后只背叛一次。那么,是否总是严格的一对一回报才是最有效的平衡?这就很难说了,但有一点是清楚的,即用多于一次背叛来回报对方的背叛将有可能使冲突升级。另一方面,少于一对一的回报将有被占便宜的危险。
以上分析的启示是,最优的宽恕水平与环境有关。特别是如果主要的危险是来自那些善于占“好说话”的规则的便宜的策略,那么,太多的宽恕就要付出代价。对一个给定的环境,准确的平衡是很难确定的,但是,竞赛的结果证明对背叛类似一对一的反应可能在大多数情况下都是相当有效的。因此,对参与者的一个很好的建议是对合作和背叛都要给予回报。
4.不要耍小聪明
竞赛结果表明在“囚徒困境”的情况下人们容易耍小聪明,然而复杂的规则并不比简单的规则做得更好。事实上,这些规则的共同问题是,使用一些复杂的方法来推断对方。而这些推断常常是错误的。一部分问题是对方经常用试探性的背叛来表明它不会被引诱而合作,但是问题的关键是这些规则没有考虑到它自己的行为会引起对方的变化。对方对你的行为是有反应的,对方将把你的行为看作你是否回报合作的信号。因此,你自己的行为将会反射到你的身上。
试图使得分最大化的规则把对方看作环境的一个不变的部分而忽略了相互的作用,不管他们在有限的假设下所做的计算是多么的聪明。如果你离开双方相互适应的简单原则,那么你的聪明是不会有好结果的。这是一条艰难的路,显然在两次竞赛中没有一个复杂的规则精于此道。
另一个过分聪明的方式是使用“永久报复”的策略。这个策略只要对方合作它就合作,但是一旦对方背叛一次,它就决不合作。由于这个策略是善良的,它与其他善良的策略相处得很好。并且它与那些完全随机的规则相遇时干得也不错。但它与许多其他规则相遇就干得很差,因为对于那些偶尔背叛但准备一旦受惩罚就撤回的规则来说,它太快放弃合作了。“永久报复”看起来似乎很聪明,因为它为避免背叛提供了最大的激励,但是它为了自己的利益显得太严厉了。
参加竞赛的规则中还有第三种太聪明的形式是,它们采用的策略是如此复杂,以至于其他策略不能把它们与纯粹的随机选择区分开来。用另一方式来说,就是太多的复杂性就显得是完全杂乱无章。如果你采用一个看起来是随机的策略,那么你也就显得对对方不反应,如果你是不反应的,对方就受不到与你合作的激励。因此复杂到不可理解是非常危险的。
当然,在许多人类事务中,一个使用复杂规则的人可以向对方解释每一个选择的理由。然而,问题出现了:对方可能怀疑所提供的这些理由,在这个情况下对方将认为不值得有任何反应,对方会把一个显得不可预测的规则看作不可改造的,结果自然是导致背叛。
,一报还一报”在竞赛中得到巨大成功的原因之一是它具有很大的清晰性,即它非常容易被对方理解。当你使用“一报还一报”策略时,对方有很好的机会去理解你在干什么。你对任何背叛的一对一的反应是一个很容易被意识到的模式。而且你的未来行为是能被预测的。一旦这些情况发生了,对方能容易地发现应付“一报还一报”的最好方式就是与他合作。假设这个游戏有足够的可能继续下去,至少还有下一步相遇。那么当你遇到“一报还一报”策略时只有马上和他合作是最好的,这样你将可以在下一步得到合作。
另外,在零和对策(如下棋)和非零和对策(如“重复囚徒困境”)之间有一个重要的不同。在下棋时,让你的对手猜疑你的企图是很有用的,你的对手越是怀疑,他(或她)的策略就越没效果。但是在非零和情况下,如此聪明不总是有好处的。在“重复囚徒困境”中,你要从对方的合作中得到好处。诀窍在于鼓励合作,一个好的方式就是清楚地表明你愿意回报,这就是“一报还一报”之所以如此有效的原因。
启示1:重复囚徒困境的几个建议:
(1)不要嫉妒;
(2)不要首先背叛;
(3)对合作与背叛都要给以回报;
(4)不要耍小聪明。
启示2:联翩而来的好运总是可疑的,只会占“傻瓜”的便宜是没有用的。
启示3:一报还一报从来没有一次在游戏中比对方得到更多的分!
未来影响现在
对未来的预期,是影响我们行为的重要因素。一种是预期收益:我这样做,将来有什么好处;一种是预期风险:这样做可能面临的问题。这些将影响个人的策略,如学生读书,为了将来考上好学校取得文凭,获得更高的地位和收入。如果文凭一钱不值,就会影响学生的热情。也影响与他人、社会的关系。
地摊、车站、旅游点,这些人群流动性大的地方,不但商品和服务质量最差,而且假货横行,因为在商家和顾客之间“没有明天”——一个旅客不大可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚。
在公共汽车上,两个陌生人会为一个坐位争吵,可如果他们认识,就会相互谦让。在相互社会联系紧密的人际关系中,人们普遍比较注意礼节、道德,因为都需要这个环境。
道德、法律、权力利益的划分,都与“还要见面”有关。从消极的层面看,我们互不侵犯,是为了避免没完没了、两败俱伤的循环报应。例子:两个原始人见面,一个拿着兽皮,一个拿着野果,他们都想把对方的东西据为己有。如果他们的见面是偶然的,可能相互抢劫;可是如果他们都生活在附近,考虑到对方家族的报复,抢劫的风险就大了。所以他们不去打对方的主意——所有权就这样产生了。如果他们确实想得到对方的东西,他们可以选择合作——以物易物,交易就这样产生了。
两个相邻的国家,如果相互敌对,是一件非常不幸的事。它们不可能“搬家”,又不可能消灭对方(这是现代国际关系准则所不允许的),这个死结就可能缠绕它们许多年。遗憾的是,这样关系的邻国还不少,如巴以、印巴、两伊以及伊拉克和科威特。希腊和土耳其也曾经是这样的世仇,现在关系虽已缓和,但是它们之间的不信任感还是长久不能消除。
长期敌对对双方来说,都是损失巨大的。不但随时有爆发战争的危险,经济建设也受到拖累。谁也不可能把钱花在朝不保夕的危险地区,一来风险太大,二来,如果在边界有许多建设,也更容易被对方讹诈——那无异于是把人质交给对方。一个例子就是韩朝关系,韩国比朝鲜更害怕发生战争,因为首都汉城就在对方的炮火射程之内。一个包袱更重的国家,维护和平的代价要比对方更大。
中苏交恶的年代,双方都在边境地区陈兵百万,巨大的军费开支和潜在的战争风险对两国都是重负。现在两国关系改善,互信增加,边境军事力量大大减弱,可以说是一个双赢。从这个意义上说,“面向未来”不仅仅是一句外交辞令。
,笼中猪”博弈
简单的例子如果能够说明方法,能够启迪思维,就有它的价值。今天再讲博弈论著作中常见的另一个简单的例子“笼中猪”博弈。
笼子里面有两只猪,一只比较大,一只比较小。笼子很长,一头有一个按钮,另一头是饲料的出口和食槽。按一下按钮,将有相当于10份的猪食进槽,但是按按钮以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。问题是按钮和食槽分置笼子的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。如果大猪先到,大猪呼啦啦吃到9份,小猪只能吃到1份;如果同时到达,大猪吃到7份,小猪吃到3份;如果小猪先到,小猪可以吃到4份,而大猪吃到6份。
,笼中猪”博弈的具体情况如下:
如果两只猪同时按钮,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪按按钮后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪按按钮,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
比较以上数字,我们知道“等待”是小猪的优势策略,“按按钮”是小猪的劣势策略。先把小猪的劣势策略消去。现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;按按钮得到4份。所以“等待”就变成了大猪的劣势策略(注意,是现在才变成劣势策略)。把它也删去,就得到“笼中猪”博弈的结局:小猪只是坐享其成地等待,每次都是大猪去按按钮,小猪先吃,大猪再赶来吃。
,笼中猪”博弈有许多应用,它可以解释为什么占有更多资源者必须承担更多的义务。
启示:这个例子描述了走出囚徒困境的另一个途径:找出一个大慈善家,让它遵守合作协议,并容忍其他人作弊。同样的事情见之于许多联盟。在许多国家,一个大政党和一个或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的一方,委曲求全,确保联盟不会瓦解,而小政党则坚持它们自己的特殊要求,而选择通常可能偏向极端的道路。又如在北约内部,美国承担了防务开支很大比例的份额,大大便宜了西欧和日本。美国经济学家曼库尔·奥尔森将这一现象非常简洁地称为“小国对大国的剥削”。
增大未来的影响
通常人们认为合作是件好事,毕竟双方合作在“囚徒困境”中对双方都有好处。然而如前面说过的,在一些情形中人们要做的却恰恰相反。
只要这种接触不是重复的,合作就非常困难,正是持续的接触,使基于回报的合作的稳定成为可能。促进双方合作可以从三个方面着手:使得未来相对于现在更重要些;改变对策者的四个可能的结果的收益值;教给对策者那些促进合作的准则、事实和技能。
如果未来相对于现在是足够重要的话,双方的合作是稳定的。因为每个对策者可以用隐含的报复来威胁对方,如果相互之间的接触能持续足够长使得这种威胁能够奏效的话。
这个结论强调了促进合作的第一方法的重要性,即增大未来的影响。有两个基本的方法来做到这一点:使相互作用更持久和使相互作用更频繁。
最直接促进合作的方法是使相互作用更持久。例如,婚礼就是一个用来庆祝和促进持续关系的公共行为。相互作用的持久性不仅对相爱的人有用,对敌人也有用。能证明这一点的最令人吃惊的例子就是在第一次世界大战的堑壕战期间发展起来的“你不打我,我也不打你”的系统。堑壕战与众不同的是敌对双方的部队要相互接触很长的时间。在更机动的战争中,一支部队在每次战斗中可能遭遇不同的敌人。因此,你希望对方的个体或小单位将会在以后回报你,而合作是没有好处的。但是在相对固定的战斗中,两支部队之间的接触要持续一个相当长的时间。这种持续的接触,使得基于回报的合作是值得一试的,并且使合作得以建立。
另一个增大未来影响的方法是使接触更加频繁。在下一步接触很快就会发生的情况下,下一步显然比通常更重要。
在商业上,专业化公司趋向于限制在与少数几个公司接触以便使这种接触更加频繁。这是为什么合作在小城镇比在大城市容易出现的一个原因。在某些行业中往往存在着限制竞争的默契,这也是为什么同类行业的公司都试图排斥那些可能扰乱这种默契的新公司。因此,原则总是一样的,经常接触有助于促进稳定的合作。
集中接触是使两个人更经常见面的一个方法。在协商谈判中,另一个使接触更加频繁的方法是把问题分解成若干的部分。例如,可以将军备控制和裁军条约分解成许多阶段,这样就允许双方有更多让步的机遇而不只是一两个让步。这样可以使回报更有效。如果双方都知道对方的一步不合适的策略可以通过下一步的回报来补偿,那么双方对整个过程可以按所期望的进行就更有信心。而且,如果双方对自己识别欺骗的能力缺乏信心,那么,有许多小的步骤比只有少数大的步骤更有助于促进合作。
分解是一个广泛使用的原则。在商业上,商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总账。使得当前步骤的背叛相对于整个未来的接触过程来说不是那么有诱惑力,这是促进合作的好方法。
启示:两只困倦的刺猬由于寒冷而拥在一起。可因为各自身上都长着刺,于是它们离开了一段距离,但又冷得受不了,于是凑到一起。几经折腾,两只刺猬终于找到一个合适的距离:既能互相获得对方的温暖而又不至于被扎。了解并关心对方,并巧妙地保护自己,会使合作更加长久。
为什么出租比出售好
1987年,纽约市长埃德·科克成功地增加了曼哈顿的持照出租车的数目。此前50年,曼哈顿人口增加了300万,但出租车只多了100辆。出租车短缺的一个迹象是,当时,合法经营一辆出租车的权利(俗称“大奖章”)在市场公开标价125000美元。与此同时,出租车按每天两班、每班12小时出租,每班价格约为60美元(每年约45000美元)。
假如市政府拍卖100个新的大奖章,就能轻松地赚到1250万美元。问题是,所有的获得者就会担心,市政府已经发现了一个好得难以置信的发财机会。既然如此,为什么明年不再拍卖100个新的大奖章呢?如果市政府不能承诺限制大奖章的颁发数量,以保证大奖章不会变得一文不值,那么第一个后果就是再也不会有人愿意为大奖章出高价了。
现在科克市长请你做顾问。他想知道怎样才能同时增加出租车的数目和库房收入。他正在寻找办法,使自己作出一个承诺,并以此约束自己(以及以后的政府)不要再源源不断地印制新的许可证,防止旧的大奖章大大贬值。当时,出租车与轿车委员会正左右为难,但谁也不会单单听信一个政客的话。你有什么建议?
诀窍在于出租而非出售大奖章。这么一来,没人要为以后的价值付钱。市长就会有一种限制大奖章出租数量的激励,因为假如他出租太多,总租金就会下降,并且很有可能随着大奖章变得一文不值而一直降到零。
注意,这实际上就是一步一步作出承诺的应用实例。这里的步骤不是大奖章的数目,而是大奖章的有效期。人们愿意在一周或一年之内相信这个市长,而新规定的通过是需要一段时间的。最具风险的是大奖章一年的价值。对市长而言与其将今年的大奖章、明年的大奖章以及未来的大奖章合并为一枚永久性的大奖章,然后再出售,还不如一次只出售一枚大奖章,从而恢复自己的可信度。要做到这一点,一个简单的方法就是出租,而不是出售。
改变收益值
那些碰到“囚徒困境”的人有一个共同的反应,即“应该有一个法律来防止这类事情的发生”。事实上,摆脱“囚徒困境”是政府的一个主要的功能:保证人们无论如何也得做那些对社会有用的事。法律使人们交税,不偷盗,忠实履行与陌生人的合同。这每一件事都可以看作是有许多人参加的大“囚徒困境”。没有人愿意纳税,因为它的好处很难看到而代价是直接的。但是如果每一个人都纳税,大家就能生活得更好,即分享学校、道路和其他公共设施的好处。这就是卢梭所说的政府的作用就是保证每一个公民“被强迫得到自由”。
政府所做的正是改变有效的收益值。如果你逃避交税,你就可能被送进监狱。这种前景使得背叛的选择不那么吸引人了。即使半官方也能通过改变对策者的收益值而实施他们的规矩。例如,在“囚徒困境”的原始故事中,两个同案犯被逮捕并被分别审讯。如果他们同属一个帮派组织,那么他们知道告密是要受到惩罚的。这将降低背叛同伙的收益值,使得他们都不坦白并由于他们双方保持沉默的合作而得到较轻的徒刑。
在收益结构上的大变化能够改变相互作用使得情况不再是一个“囚徒困境”。如果对背叛的惩罚是如此之大以至于不管对方如何选择,从短期来说合作都是最好的选择的话,那么就不再有困境。可是,收益值的改变没有必要如此激烈才能奏效,即使相当小的一点改变就可以有助于回报的合作的稳定,尽管这相互作用的情况仍然是“囚徒困境”。所以,通过改变收益值来促进合作没有必要去消除背叛的短期激励与合作的长期激励之间的紧张关系,而只要使对双方合作的长期激励大于对背叛的短期激励就行。
教育人们相互关心
在社会中,一个有效促进“双赢”的方法是教育人们关心他人的利益。家长和学校花了很大的努力去教育年轻人关心其他人的幸福。用对策论的术语来说,这意味着这些长辈试图使孩子们形成这样的价值观念,即这些新一代的公民的偏好中,不仅有他们自己个人的利益,还至少在某种程度上结合了他人的利益。毫无疑问,在这样一个关心他人的社会里,即使遇到“囚徒困境”,成员之间也容易达成合作。
利他主义就是描述这样一个现象,一个人的利益效用是与另一个人的福利相联系的。因此利他主义是一个人行为的动机。但是必须认识到,有一些看起来是宽宏大量的行为可能有其他各种原因而不是利他主义。
例如,慈善行为往往不是出于对不幸者的关心而是为了它所能带来的社会赞赏。在传统和现代社会中赠送礼物可能是交换过程的一部分。它的动机更多的是使受惠者承担某种义务而不在于改善受惠者的福利。
从生物进化的遗传学观点来看,利他主义能在亲属之间维持。冒着生命危险去抢救下一代的母亲能够增加她的基因拷贝的生存机会。这是遗传亲缘理论的基础。
人们之间的利他主义也可以通过社会化来维持。但是,这里有一个严重的问题。一个自私者可以从其他人的利他行为中得到好处而不给以任何回报。
我们都遇见过一些令人讨厌的人,他期望其他人宽宏大量,只考虑自己的需要而不考虑别人的利益。必须把这种人与关心他人的人区别对待,免得被他占便宜。这个道理告诉我们,利他主义的代价可以通过首先对每一个人采用利他行为,然后只对那些有相同的感情的人采取利他行为来控制。但是这很快就使你回到作为合作基础的回报上来。
教育人们要回报
,一报还一报”可能是个反击自私者占我们便宜的有效的策略。但是,它是一个人或国家要遵循的道德策略吗?当然,答案取决于什么是一个人的道德标准。也许最广泛接受的道德标准是这一金科玉律:己所不欲,勿施于人。在“囚徒困境”的情况下,这一金科玉律似乎意味着你应该总是合作,因为合作是你希望从对方得到的。
这个观点的问题在于:人家打你一巴掌,你还把另一边脸转过去,等于鼓励对方再占你便宜。无条件的合作不仅伤害你自己,而且伤害了这个成功的剥削者接着要遇到的无辜者。无条件合作将会宠坏对方,并为社会留下了改造被宠坏者的负担。这说明回报是比无条件合作更好的道德基础。
然而,基于回报的策略似乎没有达到道德的高度,至少按照我们的日常的直觉是没有。回报当然不是道德的一个好的基础,但它不只是自私自利者的道德。它确实不仅帮助自己,而且帮助了别人。它是通过使剥削性策略难以生存来帮助别人。一个基于回报的策略能让对方从双方合作中得到奖励,这也是当双方最好时它自己所能得到的同样报酬。
坚持公平是许多基于回报的规则的基本特征,这从“一报还一报”在“囚徒困境”竞赛中的表现可以清楚地看到。“一报还一报”赢得两轮的竞赛,但是在任何一局中它从来没有得到比对方多的分数它不可能在一局中比对方得分更多,因为它总是让对方先背叛,并且它从来不会比对方的背叛次数多。它的胜利,不是靠比对方做得好,而是靠引导出对方的合作。用这个方式,“一报还一报”靠促进双方的利益而不是靠剥削对方的弱点来取得胜利。一个有道德的人也就不过如此了。
使“一报还一报”有点令人不舒服的是它坚持“以牙还牙”。这确实只是大致公平的。而且,它的麻烦在于一旦结下仇恨,它就会无休止地继续下去。确实,许多仇恨似乎都有这种性质。例如,世界上很多宗族观念和民族矛盾强烈的地区,家族之间的仇恨有时持续了几十年。一个伤害由另一个伤害来偿还,并且每一次报复都引起了一轮新的报复。这种伤害来回反射直到最初的暴行消失在遥远的过去中。这是“一报还一报”的严重的问题。
一个更好的策略可能是一报还9/10报。这样既能够减弱冲突的振荡,又能提供一个激励使对方不敢尝试无缘无故的背叛。它是一个基于回报的但又比“一报还一报”多一点宽容的策略。它也是大致公平的。但是在一个自私自利的没有集权的世界里,它确实不仅促进它自己的福利,而且增加其他人的福利。
自我控制的特性给你一个额外的激励去把它传授给别人,即使这些人决不会与你打交道。自然,你想把回报教给那些你将打交道的人以便你能建立一个双方都有好处的关系。但你也可以从那些你决不会与他们相遇的采用回报策略的人那里得到你个人的好处,即其他人的回报惩罚了那些试图占人家便宜的人,这有助于控制整个社会。并且,它减少了你将来必须对付的不合作的人的数目。
启示:一个采用基于回报的策略的社会确实能够自我控制。由于确保了对试图不合作的惩罚,那些不合作的策略就得不到好处。
改进辨别能力
从过去的接触中识别对方,并从中发现对方是否可信的能力对合作的持续是必要的。例如,细菌几乎是进化阶梯底层的生物。只有很有限的识别其他生物的能力,所以它们必须通过捷径来识别,即在一个时间内只和一方(寄主)建立关系。在这种方式下,细菌环境的任何变化都可以归咎于对方。鸟类有更强的辨别力,它们可以通过鸣叫声识别邻居。这种识别力使得它们能够与其他若干的鸟建立合作关系或者至少避免过分的冲突。而人类的辨别能力已经发展到了在他们的大脑中有一个专门的部位来识别面孔的程度。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。
然而,即使在人类事务中,合作范围的限制往往是由于不能识别其他人的特征和行为而造成的,这里的困难在于核实,即是否有足够的信息确认对方所真正采取的步骤。并不是每个占便宜者都是光明正大的,这使我们在识别之时碰到了一些困难,但是我们也会承认,人的名声往往是和他的真实个性相符的,经过伪装的侵犯仍然是容易识别的,特别是当它一而再,再而三地施展时。
识别背叛什么时候发生的能力不是产生成功合作的惟一要求,但它肯定是一个重要的条件。因此,通过改善对策者的基于过去的接触而相互识别的能力和确定以前已经发生过的行为的能力,持续合作的范围可以得到扩展。
我们已经说明了人们之间的合作能够通过各种技巧来促进。它们包括:未来的影响,改变收益值,教育人们关心他人的福利和教人懂得回报的价值。促进好的结果不仅要告诉对策者:双方合作比双方背叛的所得更多,而且还是一个明确相互作用的特征从而得到一个长期的稳定的合作进化的问题。
启示:持续合作的范围取决于辨别能力。例如,鸟类可以通过鸣叫声识别邻居,这种识别力使得它们能够与其他鸟建立合作关系至少避免过分的冲突。而人类的辨别能力更强。这种识别曾经接触过的个体的能力使得人类可以发展比鸟类更丰富的合作关系。
第4章 战争法则:庙算在先有“谈笑间,强虏灰飞烟灭”的指挥大师,但也同样有“纸上谈兵”的“艺术家”,有没有什么东西可以更可靠地告诉我们,在什么情况下运用某种原则有效,以及为什么有效?其实,在“艺术”和“技术”之间,我们可以找到清晰的规律。
战争是艺术还是技术
翻开历史我们会发现,尽管战争在人类史上(甚至早至史前时代)占有重要地位,人类对战略、战术基本原则的注意力却远不及发明新式武器所投注的心力。的确,过去有2500多年前中国的《孙子兵法》,300多年前的拿破仑定理,直至近代的克劳塞维兹信条,以及口号式的句子如:“抢占高地”、“兵贵神速”、“分兵占领”、“合围聚歼”等等,这些在某些战争中的确有用,不过令人惊讶的是,即使是人们普遍信奉的这些原则,都似乎很少有人做过科学系统的分析,也极少公开发表过任何量化的研究。
我们常常听到“战争艺术”这个词,似乎战争也像艺术一样,难以言传,无法用数据衡量。的确,战争的进程离不开指挥官的直觉、灵感甚至运气(中途岛海战中,就是一批误打误撞的美军轰炸机打乱了日本人的计划),但是如果一味指望这些即兴发挥式的东西赢得胜利,恐怕只能是痴人说梦。我们有过“谈笑间,强虏灰飞烟灭”的指挥大师,但也同样有过“纸上谈兵”的“艺术家”,有没有什么东西可以更可靠地告诉我们,在什么情况下运用某种原则有效,以及为什么有效?
当然,技术的进步也是一个必须考虑的因素。因为一些聪明的指挥官引用了(有时甚至发明了)新式武器,使战略与战术不时会出现一些质的创新:从公元前1000年把马匹带进战斗,到近代火枪、大炮的使用,以及最近的核阻吓战略等。随着电脑时代的来临,许多软件公司致力于发展战地模拟、实战游戏,这些新产品已大量用来训练军事人员。尽管如此,有关战时的决策原则还是凤毛麟角,而通过在战场上尝试错误学会决策要领(“在战争中学习战争”)可是要付出可怕代价的。
其实,战术决策和其他决策一样,都会涉及心智修炼,这也是决策理论的核心所在。如果面对善于思考的对手,这就属于赛局理论的范畴,虽然并不那么明显易辨,但在对手的战略意图和战术动作十分明显的情况下,简单的策略就很有用。
身为航空、汽车史的先驱,英国工程师蓝彻斯特也是把正规学术训练用于战术研究的学者之一,其理论基础来自于研究第一次世界大战的空中战役。可惜他卓越深入的研究仅有少数现代军官知晓,因为虽然军事院校课程中都曾提到,不过却很少得到重视。
启示:美国影片《华尔街》中,迈克尔·道格拉斯扮演的黑心大亨告诉他的下属:看看《孙子兵法》吧,战争的胜负在开火之前就已经决定了。他指的是《孙子兵法》中“未战而庙算(事先评估局面)胜者,得算多也”以及“胜兵先胜,而后求战;败兵先战,而后求胜”的战略思想。
蓝彻斯特定律
蓝彻斯特定律提供了一个基本的战略思考原则。
他设想了一个战斗模式(当然已过度简化),敌对双方彼此互相射击,而且双方在准确性、人员、武器等各方面都势均力敌(第一次世界大战以及前期与近期的战斗,常出现这类无意义的战事)。蓝氏最重要的见地是指出在这类战斗中,我方军队、船只、战机的攻击火力和敌人的攻击目标都跟我方军队数量成正比。因此,军队数量决定了我方的攻击力:一方面增加自己的命中率,另一方面则分散对方的攻击火力。而蓝氏的基本假设就是双方互射的命中率虽然低但都不是零。军方用一个冗长拗口的名称来表达对这种练习的崇高敬意:“扰乱阻进式射击”。到最后,会出现两种重大结果,这不难用数学算出来。
第一种结果是以军队数量的平方来代表我方的军力,只要数量超过敌军,其中的好处肯定出乎众人意料之外。若我方军队数量多于敌军3倍(军队、飞机、船舰、坦克等),就可以产生9倍于对方的战力。当然你会说在电视电影中,英俊强壮的好人通常可以只手打败六七个坏蛋,不过现实生活中可没有这种事。平方定律是指所有人同时发动攻势,不像电影情景,坏人轮番上阵跟好人对打(肯定让自己后悔的战术),好让英雄可以各个击破,自己却毫发无伤。如此一来,蓝彻斯特定律当然不成立。
另一种蓝彻斯特定律不成立的情况是一方的武力强过另一方,比如拳击重量级冠军可以轻而易举、大气不喘地撂倒几个手无缚鸡之力的人,一个拿着一枝冲锋枪的士兵可以轻易制服一群手无寸铁的平民。军事专家喜欢称这类先进武器或技巧为“武力乘数”。不过如果所有条件都成立,平方定律就会产生极大功效。
启示:倚多为胜,人海战术等是古代的战略之一,然而在现代战场、商场、运动场上,又该如何有效运用手中资源,击败竞争对手?蓝彻斯特定律提供了一个基本的战略思考原则。
分散敌军,各个击破
你一定知道许多战争中“以少胜多”的例子,这些例子似乎是违反上述原则的。可是,如果你仔细分析一下这些战例,可能会发现:其中只有极少部分是通过以劣势兵力与对方的优势兵力正面决战而获胜的,这种胜利又往往取决于某些特殊情况,如天时、地利,或对手只是一群乌合之众,或者是自己一方战斗力超强。
更多的情况是:劣势一方的统帅善于高效率使用他的少数部队,他往往通过巧妙地设置假象使对手判断错误,分散兵力,然后各个击破。也就是说,虽然从双方总的实力对比来说,胜利一方处于劣势,但在每一场具体的战役中,却都是以优势兵力击败对方的劣势兵力。如果蓝彻斯特原则正确无误的话,那么又该如何把决策智慧用于战术呢?
如果你手下有15支军队,而敌方则有17支,两方士兵战斗力相当,两方的武器与地理位置并无优劣之分,而人数方面你则处于劣势。因此,你的军队会全军覆没,因为15的平方是225,17的平方是289,两者相减之后是64,也就是在战斗后,敌军还会残留8支队伍。当然对方的损失不可谓不小,因为他失去了一半以上的队伍;不过你会更惨,就此成为“历史”。如果敌军认为值得,他肯定会这么做。
然而,你有没有可能在蓝氏定律下仍取得胜利呢?如果能分散敌军,以全力先击败一部分,便可获全胜。假设你能成功地把对方的12支军队先引出来,然后用自己全部的15支队伍来攻击敌方,而另外5支敌军还在睡乡,或正苦于找不到战役所在。根据蓝氏定律,225减去144是81,因此你可以击败这12支敌军,还有9支队伍存活下来。虽然耗损掉40%的兵力,损失很惨重,不过你还是赢了。然后再去解决敌军剩下的5支军队,而这时候由于你仍保有9支军队,因此在数量上还是占了优势。等到所有战役结束,你可把原具优势的敌军全部歼灭,而仍保有近一半的军队。
因此,虽然你的军队比对方少,但若能成功地运用平方定理,将敌军以正确的方式分成两部分,即可获得最后的成功。所有军事人员都知道分散敌军战术的重要性,并称之为渗透或集中原则,但他们仍停留在概念层次上。
这对于我们来说是一个非常有用的原则。当可利用资源有限时,必须学会“集中优势兵力”这一战术原则,将你的时间、精力、才能、金钱等投入最有希望获胜的战场,确立自己在这一领域的优势地位。你的每一场胜利都使双方的实力对比发生变化,这样不断“积小胜为大胜”,直至取得全局性优势时,“最后的决战”也就胜券在握了。
在历史上,军队投降多半不是因为被击败,而是因为自以为被击败,因此,甚至有可能去说服强势的一方,让他们自以为已经失落。例如“淝水之战”中,正是东晋的内应朱序在前秦军中散布失败消息,使得这支百万之众的大军人心惶惶,在东晋的猛烈攻击下土崩瓦解。
启示:提到战争史,就不能不说拿破仑,只不过这一次我们要说的是他“走麦城”的例子:滑铁卢战役。本来“分散敌人,各个击破”战术是可能帮助他打赢这一仗的,可惜的是,最后他恰恰又输在这上面。他在英军到达之前打败了普鲁士军队,但未将对方消灭,为了把这支败军赶得远些,他分出部分军队追击。可是这支部队没能追上普军,也没能及时赶回,导致拿破仑在英、普联军的合击下失败。
合则两利,分则两害
蓝氏定律是应用于两军互射的战役上,那么同样的原则是否也能运用在三方军队彼此互相攻击的战役?这时出现两种极端的可能性:其一,大家彼此互射,没有朋友,都是敌人;其二,两军联合,共同对抗第三势力。
用个具体例子来说明,并稍微设计一下数字,以简化答案。假设敌对三方分别为A、B、C,各有45、40、35个单位的军队(坦克、军队、战机皆可),开始射击在蓝氏定律下,每位士兵都会向目所能及的陌生人开火,无论其属于哪一方。当尘埃落定,军队数少的一方定会被全面消灭,而A与B则各剩40与20个单位的军队。不仅军队最少的一方会成为历史,第二大势力B,比起A也是损失惨重。B约会丧失一半的军力,而A不过从45减少到40,所以A可以在少量损失的状况下,轻而易举除掉B。因此对多数的一方来说,采取随意射击是很有利的,而B和C互射的结果就是等于间接帮了A军队。
假设B和C两军将领都知道这种状况,于是决定以结盟的方式,联手对抗A,至于两军如何处理他们之间的歧见,容后再谈。于是联军共有75个单位,远远超过A军,仅需要耗损其中的15个单位即可击败A军,这当然比白白牺牲要强得多,也同时说明军事联盟这么受欢迎的主要原因。当然,未必每次联盟都能这么成功。因为结盟双方都很清楚,他们很快就必须摊牌,因此多会有所保留。同样的,第二次世界大战时,苏、美、英盟军类似此例。
还有一个有待解决的问题,在B和C共同与A对决时,彼此的相对损失如何,这会影响到下一次战斗时双方的情势。同样地,这个数学计算太过繁琐,不过结果是双方将分别损失20%,因此B的40个单位会剩下32个单位,而C的35个单位则剩下28个单位。在联盟的情形下,成为历史的就是A。B与C则在共同行动中,分别失去同比例的军力。而在接下来的战役中,B会获胜,不过损失惨重,原来45个单位,大约只会剩下15或是16个单位,所以他可能会因为损失过大而觉得不值得和C决战。
从三方竞赛中两方结合是有利的这个原则,可引申到多人参与的游戏当中,而过去的经验也证实了这一点。
防守还是进攻
从前面的讨论中,我们已经了解了优势兵力左右战局的巨大作用。但是仅仅拥有优势兵力还不够,你还必须学会使用它,否则,你就可能败在实力不如你的对手面前。为什么会这样?
,孙子兵法》中有一句“守则不足,攻则有余”,历来为人所歧解。一种意见认为:这句话的意思是,“(在战争中)采取守势,是因为实力不足;采取攻势,是因为实力有优势。”这一派的代表人物是三国时代最杰出的战略家之一曹操,他的注解是:“吾所以守者,力不足也;所以攻者,力有余也。”的确,从战略的角度看,进攻的一方通常是比较强大的。但是也有另外一种意见认为:这句话的意思是,“(一定的兵力)用来防守则不足,用来进攻则有余。”因为这样解释不仅更符合古代汉语的语法规律,而且更符合孙子强调“善战者,制人而不制于人”的积极战术原则。
孙子在《虚实》篇中的一段精彩论述可以作为这一战术思想的注解:“故形人而我无形,则我专而敌分。我专为一,敌分为十,是以十攻一也,则我众而敌寡……吾所与战之地不可知,不可知而敌所备者多,敌所备者多,则我所与战者寡也。故备前而后寡,备后则前寡……无所不备,则无所不寡。”大致意思是:使敌人兵力部署被固定,而我军机动;使敌人兵力被分散,而我军专一,就可以取得“以十攻一”的优势。敌人越弄不清我要进攻哪里,就越要到处设防,无论如何设防都难免顾此失彼,而一旦到处兼顾,则到处都是薄弱环节。
从古今中外战史看,以弱胜强的例子不少,但消极被动防御很少能坚持到最后胜利,弱小一方都是通过主动进攻扭转战局的。例如游击战的“十六字诀”,再如解放战争时期“三大兵团”大闹中原都是如此。“不列颠之战”中英国似乎是被动防御的成功例子,但正是英国空军对柏林的主动出击,打乱了希特勒的战略部署,希特勒一怒之下,将原定的“全力摧毁英国空军”的目标改为对英国城市的狂轰滥炸,才使英国摆脱了战败的命运。
启示:围棋中有一名言“宁输十子,不输一先”也是这个意思:宁可损失部分实力,也不能失去战争主动权。
属于拿破仑的1/4世纪
所谓主动权,就是可以决定在何时何地作战,有了这个主动权,就可以投入主要兵力战斗。而没有这个主动权的一方,由于不知道要在哪里作战,也就难以在战场上投入全部实力,这样即使总体实力强于对方,也难免被各个击破。
上面我们谈到了拿破仑“走麦城”,如果只谈这一点,可能对这位卓越的军事家不太公平。就整体表现而言,拿破仑干得相当不错——在整整1/4世纪的时间内(1791-1815年)横行欧洲大陆,所向披靡。在这个广阔的舞台上,拿破仑以其杰出的军事指挥才能导演了许许多多有声有色、威武雄壮的战役,其中多数战役都是以少击众,以劣势对优势而获胜。都是先以局部的优势和主动,向着敌人局部的劣势和被动,一战而胜,再及其余,各个击破,全局因而转成了优势,转成了主动。
拿破仑为什么能够在意大利战役以及马仑哥、奥斯特里茨、耶拿、弗里德兰、瓦格拉姆战役中取得辉煌的胜利?拿破仑在意大利战役中(1796年),以一支装备极差的3万人的军队,在一年时间内同反法联军进行了14次会战、70次战斗,全部获胜,而且歼灭敌军25万人。他为什么能成功?
首先,拿破仑认为作战行动的目标是消灭敌军兵力。他说:“在欧洲有很多好的将领。但是他们一下子期望的东西太多。我看见的只有一个——敌军的兵力,我全力去消灭它,因为我确信,随着敌军兵力的被歼灭,其他一切也随之而崩溃。”
其次,拿破仑为了消灭敌军兵力,夺取战役的胜利,坚持集中优势兵力的原则,确立军事上的优势。
再次,拿破仑为了保证在必要的时间和必要的地点集中比敌人在同一时间、同一地点优势的兵力,经常在及时准确掌握战场军事行动的基础上,利用敌人的失策,投入自己的作战部队。拿破仑拥有善于发现敌人失策的敏锐洞察力,并以闪电般的速度给敌人以毁灭性的打击,是他获取胜利的重要因素之一。
司令,下命令吧
美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案?
乍一看来,你可能要说:“为什么给敌人三个师的兵力而只给我两个师?这太不公平。兵力已经吃亏,居然还要规定兵力相等则敌胜我败,连规则都不公平,完全偏袒敌人。”
在这个游戏中,假设守方的兵力比进攻方多,而且同等兵力也较强是有道理的,因为防守方确实要占一些便宜,比如以逸待劳、依托工事等,另外,进攻方集结兵力、投入战场,都不如守方那样方便(比如空投、渡河作战,都要受制于交通工具的运载能力);而且面对坚固防御,至少在战斗开始的时候,攻方总要承受很大的牺牲。模拟作战中规定若攻守双方兵力相等则失败,就体现了这个意思。
其实,这次模拟“作战”,每一方取胜的概率都是50%,即谁胜谁负的可能性是一半对一半。能否指挥队伍克敌制胜,还得看双方的策略得失。
为什么说取胜的概率是一半对一半呢,让我们先学一点儿“纸上谈兵”。
敌军有三个师,它有四套作战方案:A.三个师均守在线路甲;B.两个师守甲线路,一个师守乙线路;C.一个师守甲线路,两个师守乙线路;D.三个师均驻守乙线路。同样,我军有两个师的攻击兵力,可以有三套作战方案:1.集中全部两个师的兵力从甲线路实施攻击行动;2.兵分两路,一个师从甲线路,一个师从乙线路进城;3.集中全部兵力从乙线路进城。战果如何?
启示:任何时候,只要可能,我们必须做最有成效的事情。
公平还是不公平
现在我们先把问题修改一下,既然你抱怨敌人比你多一个师很不公平,那么就先减掉敌人一个师,看看有什么不同。
敌人的选择由四个变成了三个:A.全力防守甲;B.全力防守乙;C.分兵把守甲、乙。你的选择未变,还是三个。
你一定发现,无论敌军怎样布防,你的胜利几率都达到了2/3。如果敌人采取A,全力防守甲,你全力进攻甲,失败;而全力进攻乙或分兵进攻都胜利。敌人采取B,你全力进攻乙,失败;而全力进攻甲或分兵进攻均胜利。敌人采取C,只要你不分兵,无论进攻甲、乙,都能获胜。由此你会明白,为什么同样的兵力“守则不足,攻则有余”的道理了,以及为什么要多给敌人一个师才公平了。
现在,让我们回到原来的问题,看看敌人在三个师的情况下会如何布防。注意:敌人不可能采取用三个师全力防守甲或乙的方案(即A和D),因为布置三个师和两个师的效果是完全一样的。所以敌军必取B或C那样的二一布防,一路两个师,另一路一个师。也就是说,敌军的选择其实只有两个。既然如此,你就不可能采取分兵进攻的策略,因为那样一定失败。所以,你的选择其实也只有两个:全力进攻甲或乙。
情况最终就是这样:我军必集中兵力于某一路出击。这样,你若攻在敌军的薄弱之处,你就获胜,你若攻在敌人兵力较多的地方,你就失败。总之,敌我双方获胜的可能性还是一样大。
这虽然是一个模拟的例子,却具有相当的现实意义。
从表面看来,防守一方似乎占了很大便宜,兵力比对方多,而且每一单位兵力也比对方强,为什么结果只是勉强和对方打成平手?进攻方又是拿什么抵消掉这些劣势的呢?很简单,就是那“一先”:战场主动权——可以决定何时何地开战。
启示:我们应该相信自己经常面对某种选择——而且大部分的主控权操控在自己手上——这是迈向均衡,步入再生的垫脚石。
,攻防博弈”——诺曼底登陆
二战期间,苏联与美英成为盟国,共同对抗纳粹德国。苏联方面一再要求美英同盟国及早在欧洲大陆开辟第二战场。1944年春天,英美联军在北非战场上彻底摧毁了德国隆美尔元帅的抵抗,德军已经完全收缩到欧洲大陆,盟军在欧洲西部开辟第二战场的时机终于成熟了。
当时可供盟军渡海登陆的地点有两个:一个是塞纳河东岸的布隆涅——加来——敦刻尔克一带,这里海峡最狭窄的地方只有几十公里,是一个理想的登陆地点;另一个是塞纳河岸的诺曼底半岛,但是这里海面较宽阔,渡海时间将比较长,比较容易被德军发现。
当时,德军在欧洲西线的总兵力近60个师,但是要布防的海岸线长达3千英里。显然,德军不可能把这些兵力沿海一字排开,只能把主要兵力放在它认为盟军最有可能渡海登陆的地方。同时,盟军在英国集结能够用于渡海作战的兵力,由于受登陆舰船容量的限制,数量也有限,只能考虑集中有限的兵力重点进攻一个地方。所以,无论是对于盟军还是对于德军,选择和判断盟军将在哪里登陆,已经成为这次跨海作战成败的关键。
守备欧洲大陆西海岸的德军西线有两个司令官,一个是出身贵族、有“德国最后一位战略家”美誉的伦德施泰特元帅,另一个是屡建奇功的新贵、“沙漠之狐”隆美尔元帅。他们都估计到盟军即将渡海进攻,但是在判断盟军的登陆地点上却各执一词。
伦德施泰特认为兵贵神速,盟军多半会取道海峡较窄的加来一带急速渡海登陆,这一带正是伦德施泰特驻防的地方。而曾经在北非沙漠跟英国蒙哥马利元帅和美国巴顿将军鏖战多时的隆美尔,凭直觉判断盟军将在他主布防的诺曼底一带登陆,主张在这一带集中兵力。在旁观者看来,两位元帅都认为应该重点加强自己的防区,虽然他们各有分析、各有理由,却还是难免有“屁股指挥脑袋”的成分:驻守在什么地段,就论证自己这个地段重要。
在具体战术上,伦德施泰特和隆美尔也有很大分歧。伦德施泰特主张“纵深防御”,即先把登陆盟军放进来,再发动强大反击,围歼盟军的有生力量。隆美尔则清楚战局已经逆转,认为围歼盟军有生力量的目标无法实现,觉得最好的办法只有在发现盟军即将抢滩登陆之际,即趁其立足未稳,迎头予以痛击。为此,隆美尔要求给诺曼底增派装甲师。这一请求没有被处在两个元帅之间态度模棱两可的希特勒接受。其实,盟军频频发出迷惑性的电报,制造即将发动在广阔海岸线上全面进攻的假象,使希特勒过高估计了盟军将用于渡海作战的兵力,认为即使是在诺曼底一带登陆,也不过是在从加来到诺曼底的广阔海岸线上全面进攻的前奏。这也是希特勒优柔寡断没有听取隆美尔的意见去全力加强诺曼底防御力量的一个原因。
由于德军分兵布防,而盟军攻其一点,诺曼底登陆获得胜利。从此德国陷入两线作战的困境,败局已经不可逆转了。
启示:诺曼底登陆是世界军事史上的空前壮举。盟军各路大军满怀信心顺利东进,苏联大举反攻而迅速西进,使德国腹背受敌,从而决定了其彻底失败的命运。至此,第二次世界大战进入了粉碎纳粹德国的最后决战阶段。
如何提高胜利几率
好了,现在我们已经知道,在“攻城战博弈”中,作为进攻方,你有50%的胜率,但是你不希望把胜利寄托给老天帮忙——你是个军事家,不是赌徒。你该怎么选择呢?
你当然希望进攻对手的弱点,但前提是你要知道对方的弱点在哪里。也就是说,你要掌握准确的情报。孙子说:知己知彼,百战不殆。了解自己的优势,同时洞悉对手的弱点,你就会获得胜利。
这也就是军事领域的“情报战”或“信息战”。信息战分两方面:一、了解对手信息;二、保证自己的信息不被对方了解。
还记得孙子所说的“形人而我无形”吗?说的正是这个道理。所谓“形人”就是使对手的机动兵力变成僵化的阵势,一举一动都在我掌握之内;而我“无形”就是兵力保持机动状态,使敌人无法做出正确判断。如何做到“形人而我无形”呢?孙子说:“兵者,诡道也。故能而示之不能,用而示之不用,近而示之远,远而示之近……攻其无备,出其不意。”
诺曼底登陆就是一个“形人而我无形”、“攻其无备,出其不意”的成功战例。尽管德军早就知道盟军一定会在法国沿岸登陆,并派出间谍刺探盟军作战计划,但一直未能获得准确情报。盟军的情报战更高一筹,不但保守住了机密,同时还通过利用双料间谍传递假消息、在加来对岸部署假军营、让当时被解职的巴顿抛头露面等手段,大放烟雾弹,使德军如堕五里雾中。
另一方面,盟军对德国军队的防御部署却比较了解。不但成功破译了德军的密码系统(二战时期,许多天才数学家参与了这一工作)、有法国抵抗组织和秘密特工源源不断传送情报,而且还通过早期的佯攻探明了敌军防御重点。在掌握战场气候、环境信息方面,盟军也走在了德军前面:登陆作战开始时,德军指挥官隆美尔元帅没在现场,因为他得到的情报是“天气恶劣,盟军无法进攻”。于是他决定趁此机会回国治病,并争取希特勒给他增派援军。然而,盟军的气象专家却更准确地预测到6月6日天气将好转。当隆美尔得知登陆战开始时,他叹息道:“我真蠢!”
启示:一只山猪在大树旁勤奋地磨獠牙。狐狸看到了,好奇地问它,既没有猎人来追赶,也没有任何危险,为什么要这般用心地磨牙。山猪答道:“你想想看,一旦危险来临,就没时间磨牙了,现在磨利,等到要用的时候就不会慌张了。”
第5章 皮洛斯的胜利人们都追求胜利,但不是所有胜利都值得追求。所谓“皮洛斯的胜利”指的就是“得不偿失的胜利”。在投入一场战争之前,你必须计算成本与收益的比例。
昂贵的战争
,孙子兵法》的《作战》篇中,一开始并未探讨战略或战术问题,而是算账——一次军事行动(无论胜败)的成本:“日费千金”的人力、物力投入。
宋代的沈括也算过一笔细账:动用10万军队到远方作战,运送辎重的兵员要占1/3,而后勤补给人员至少需要30万,这样一支部队,最多只能行军16天。三个民夫供应一个士兵,这已经是最大极限了。如果用牲畜运粮,固然负载多而费用少,但很容易生病死亡,这样连牲畜和驮负的物资都要白白丢弃,所以比起人力运输,利弊各半。
所以,“因粮于敌”(从敌人那里获取给养)就非常重要。通过长途运输一份军粮,可能在路上要消耗好几份。孙子说:“食敌一钟,当我二十钟。”正是这个原因。
现代战争由于交通的便利,可以节省某些成本(如粮食的运输消耗),但是其他方面(如弹药的大量消耗)的花费比古代要昂贵多了,海湾战争中美军发射的一颗导弹动辄价值数十万甚至上百万,这种高技术战争不是哪个国家都能承受的。
在古代兵法中,有“坚壁清野”,在现代军事史上,也有“焦土政策”,它们的共同点是尽可能减少对方从战争中获得补偿,也就是提高对方的战争成本。当然,实行这一战略,自己的损失也很大,不过也不失为一种有效的策略。而且,这一行动也是在向对方表明立场:我要和你干到底,为此我宁愿作出任何牺牲,不要指望从我的屈服中获得什么好处。
战争如此,市场竞争如此,甚至我们日常行为也都面临一个成本—效率问题。理想状态当然是以尽可能小的成本,换取尽可能大的效用,但是现实中大多数选择并非理想。
启示:打仗是一件花钱的事,所以古人有云:“兵闻速拙,未睹巧久。夫兵久而国利者,未之有也。故不尽知用兵之害者,则不能尽知用兵之利也。”
,每个人都有自己的价钱”
在英国作家威廉·萨克雷的名作《名利场》中,女主角贝姬曾经这样表白自己:“如果我一年有5000英镑的收入,我想我也会是一个好女人。”
赫胥雷弗教授在他的《价格理论与应用》中,就贝姬的上述表白,出过一个思考题:如果这个表白本身是真实的,即贝姬每年有5000英镑收入的话,在旁人看来她就真变成一个好女人,那么人们至少还可以有两种解释:一、贝姬是想做好女人的,但是她太穷,所以做不了好女人。如果贝姬每年有5000英镑的收入,她就会恢复好的本性。二、贝姬本来并不愿意做一个好女人,就像不想辛勤劳动一样,但是如果有人每年给她5000英镑作为补偿,为了这些钱,看在这些钱的份上,她也就勉为其难,愿意做一个好女人。
怎样知道这两种可能中哪一种符合实际呢?怎样才能知道贝姬的本性究竟是“好”的还是“坏”的呢?
为了不干扰你的思路,可以先撇开道德判断。例如,不妨把“做好女人”理解为某种行为举止规范或者必须遵守的限制。避免好恶,有助于得出比较客观的结果。
以上面的“成本”定义来看贝姬的选择就很容易得到答案。5000英镑,就是她为“做好女人”开出的价钱,如果5000英镑是一笔小钱,说明她认为“做好女人”的成本不高,换言之,就是她喜欢做个好女人,只要能维持生活下去就可以;如果5000英镑是一笔大钱,说明她认为“做好女人”的成本(即必须放弃的某种东西)很高,非用一大笔钱补偿不可。
那么5000英镑是不是大钱呢?不要忘了,那是100多年前,英镑比现在要值钱得多,稍晚的作品《福尔摩斯》中,说一个女人只要“有60镑的年金”,就可以过得去了。用这个标准看,贝姬开的价不能算低。
启示:我们常常谈到成本,那么究竟什么是成本?经济学家的定义是:成本就是为了得到某种东西而必须放弃的东西。
皮洛斯的胜利
现在我们已经有了成本观念,下面就是应用问题了。在作决策之前,必须经过“成本估算”:如果得大于失,就值得做;如果得失相抵、甚至得不偿失,就不要干这种“吃力不讨好”的事了。
西方有一个成语“皮洛斯的胜利”,意思就是:代价惨重、得不偿失的胜利。
赢得战争(或避免战争)的一个有效策略就是增加对方的战争成本,使其难以坚持,或因为得不偿失而放弃发动战争的愿望。
,田忌赛马”就是一个通过让对手多付代价而获得胜利的例子。田忌的上、中、下三等赛马都比齐王的同等级赛马差,可是在著名军事家孙膑的帮助下,田忌以“下驷对上驷、上驷对中驷、中驷对下驷”的策略,在平均劣势下赢得了对国王的赛马胜利。
为什么能获胜?关键在第一场——也就是输掉的那一场。齐王虽然胜了,但是却付出了巨大的成本——上驷与下驷的实力差距被白白浪费掉了,因此他输掉了后面两场。这是一个重要的原则:你支付的成本越大,局面就越不利。
,田忌赛马”的故事,用现代术语来说就是一个典型的博弈问题。实际上,它是通过增加对方的成本改变双方的实力对比,并最终取得胜利的。
围棋上也有类似技巧,任何好的棋手都不希望把棋“走重”,因为这样不但效率低,而且包袱沉重,一块重棋在遭到攻击时是很难办的:苦苦求活吧,难免受到对手的百般盘剥;可干脆放弃又损失太大,所以这种棋往往被称为“愚形”。
启示:皮洛斯是古罗马时期的一位国王。在一场血腥的战斗中,他获得了胜利,却损失了大半精锐部队。望着尸横遍野的战场,他感慨道:再来这样一场胜利,我就完蛋了。
斜坡上的均衡
拿出一张1元钞票,请大家给这张钞票开价;每次叫价以5分为单位;出价最高者得到这张1元钞票,但出价最高和次高者都要向拍卖人支付相当于出价数目的费用。你打算怎么玩这个游戏?
如果你没想得更远,就很容易上当。你可能这样想:不就是一元钱吗?只要我的出价低于面值,我就赚了,我所能出的最高价是95分,再往上就没有利润空间了,谁还会继续出价呢?
美国耶鲁大学的教授们在课堂实验上,跟毫无疑心的本科生们玩这个游戏,很是赚了一点钱,至少足够在教工俱乐部吃一两次午饭。圈套是这样:开始你参加竞价是为了获得利润,可是后来就变成了避免损失。假定目前的最高叫价是60美分,你叫价55美分,排在第二位。出价最高者铁定赚进40美分,而你却铁定要丢掉55美分。如果你追加竞价,叫出65美分,你就可以和他掉换位置。哪怕领先的叫价达到3.60美元而你的叫价3.55美元排在第二位,这一思路仍然适用。如果你不肯追加10美分,“胜者”就会亏掉2.60美元,而你则要亏掉3.55美元。
这是光滑斜坡的又一个例子。一旦你开始向下滑,你就很难回头。最好不要迈出第一步,除非你知道自己会去到哪里。
假如不幸,已经迈出了第一步,还有没有什么方法让我们避免更大的损失?
这个游戏或博弈有一个均衡,即从1美元起拍,且没有人再追加叫价。不过,假如起拍价低于1美元又如何?这样的层层加价可是没完没了,惟一的上限就是你钱包里的数目。至少在你掏空钱包之后竞争不得不停止。这正是我们需要用到这个法则——向前展望、倒后推理的地方。
假定伊莱和约翰是两个学生,现在参加1美元拍卖。每人各揣着2.50美元,而且都知道对方兜里有多少钱。为了简化叙述,我们改以10美分为叫价单位。
从结尾倒推回来,如果伊莱叫了2.50美元,他将赢得这张1美元钞票(同时却亏了1.50美元)。如果他叫了2.40美元,那么约翰只有叫2.50美元才能取胜。因为多花1美元去赢1美元并不划算,如果约翰现在的价位是1.50美元或1.50美元以下,伊莱只要叫2.40美元就能取胜。
如果伊莱叫2.30美元,上述论证照样行得通。约翰不可能指望叫2.40美元就可以取胜,因为伊莱一定会叫2.50美元进行反击。要想击败2.30美元的叫价,约翰必须一直叫到2.50美元。因此,2.30美元的叫价足以击败1.50美元或1.50美元以下的叫价。同样,我们可以证明2.20美元、2.10美元一直到1.60美元的叫价可以取胜。如果伊莱叫了1.60美元,约翰应该预见到伊莱不会放弃,非等到价位升到2.50美元不可。伊莱固然已经铁定损失l美元60美分,不过,再花90美分赢得那张1美元钞票还是合算的。
第一个叫1.60美元的人胜出,因为这一叫价建立了一个承诺,即他一定会坚持到2.50美元。我们在思考的时候,应该将1.60美元和2.50美元的叫价等同起来,视为制胜的叫价。要想击败1.50美元的叫价,只要追叫1.60美元就够了,但任何低于这一数目的叫价都无济于事。这意味着1.50美元可以击败60美分或60美分以下的叫价。其实只要70美分就能做到这一点。为什么?一旦有人叫70美分,对他而言,一路坚持到1.60美元而确保取胜是合算的。有了这个承诺,叫价60美分或60美分以下的对手就会觉得继续跟进得不偿失。
我们可以预计,约翰或伊莱一定会有人叫到70美分,然后拍卖就会结束。虽然数目可以改变,结果却并非取决于只有两个叫价者。哪怕预算不同,倒后推理仍然可以得出答案。不过,关键一点是谁都知道别人的预算是多少。如果不知道别人的预算,可以猜到的结果是,均衡只存在于混合策略之中。
当然,还有一个更简单也更有好处的解决方案:联合起来。如果叫价者事先达成一致,选出一名代表叫10美分,谁也不再追加叫价,全班同学就可以分享90美分的利润。
你当然可以把这个例子当成耶鲁本科生都是傻瓜的证明。不过,超级大国之间的核装备升级过程难道与此有什么分别吗?双方都付出了亿万美元的代价,为的是博取区区“1美元”的胜利。联合起来,意味着和平共处,它是一个更有好处的解决方案。
启示1:有一群动物在讨论如何使自己成为更好的通才,展现自己多才多艺的本事,于是兔子开始学习鱼儿游泳,当然,鱼儿也要学兔子跳跃,同样,飞鸟必须学习跑,松鼠也得学习飞……一段时日之后,兔子不但学不会游泳,连自己最拿手的“跑”也变慢了;鱼儿忘了如何力争上游;鸟儿也失去了在空中自由自在飞翔的乐趣——认识自己,正确选择,这是最重要的。
启示2:通过不断地修正想法、物体或过程,你就会逐渐把任务缩小为核心的部分。例如,如果你去掉一辆坦克作战的那些部分,你就会创造出一辆履带拖拉机。
,骑虎难下”与“协和谬误”
一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常会碰到的。20世纪60年代,美国介入越南就是一个骑虎难下的博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑虎难下的博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是肯定赢的。
股票市场也经常出现“骑虎难下”的情况:你买进一只股票,股价下跌;于是你又在这个价位买进(股民称此为“摊平”),可是它又下跌……你再次购买的本意是减少损失,可是却越陷越深。
博弈论专家经常将这种“骑虎难下”的博弈称之为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。
开发一种新型商用飞机简直可以说是一场豪赌。单是设计一个新引擎的成本就可能高达数亿美元。想开发更新更好的飞机,实际上等于把公司作为赌注押上去。难怪政府会被牵涉进去,竭力要为本国企业谋求更大的市场。
该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),成本太高,不适合市场竞争,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。
不久前,英国和法国航空公司宣布协和飞机退出民航市场,才算是从这个无底洞中脱身。这也是“壮士断腕”的无奈之举。
贸然发动的第一次中东战争
在解决国际争端方面,为什么谈判比战争要好?一方面谈判的成本比战争的要低;另一方面,战争会打开冲突、伤害和仇恨的魔瓶,正如神话中说的那样:魔鬼一旦被放出瓶子,就很难再把它关进去了。
和平比战争可取的另一个重要原因是战争后果的不可预见性。也许在今天看来战争是有利的,但是明天的局面可能让你悔不当初。在这方面,第一次中东战争就是一个例子。
中东地区衔接亚、非、欧三大洲,并拥有丰富的石油资源,战略位置十分重要。巴勒斯坦则位于中东的中心地带,长期以来,一直是强邻和大国争夺的主要目标。
犹太人古时称为希伯来人,他们和阿拉伯人都是西亚古代闪族的后裔。公元前1000年,犹太人在巴勒斯坦建立了统一的希伯来王国,可是后来历经亚述帝国、巴比伦王国、波斯、希腊、罗马等外族轮番占领,犹太人从此也逐渐疏散。特别是在史称“犹太战争”的反抗罗马人入侵的三次武装起义失败后,犹太人几乎全部逃离和被驱逐出巴勒斯坦,结束了犹太民族主体在巴勒斯坦生存的历史。
犹太人在离开巴勒斯坦之后,流散到世界各地,受到种族歧视、迫害甚至屠杀。几百年间,欧洲出现了一次又一次的“排犹运动”,被屠杀的犹太人不计其数。特别是纳粹德国的“种族灭绝”使600万犹太人遭到屠杀。战后,在国际社会的同情下,犹太复国主义运动达到高潮。
1947年11月29日,“联大”通过了巴勒斯坦分治决议。规定英国对巴勒斯坦的委任统治结束后在巴勒斯坦建立阿拉伯国和犹太国;耶路撒冷成为一个在国际政权下的独立主体,由联合国管理。分治决议一通过,巴勒斯坦阿拉伯人和阿拉伯国家纷纷反对。在耶路撒冷和一些阿犹混合的城镇,爆发了犹太人和阿拉伯人之间的激烈武装冲突。
战争一开始,阿拉伯国家军队在数量和装备上比以色列部队略占优势,处于十分有利的地位,以色列军队节节败退,已处于崩溃边缘。但以色列最大限度地利用停火,扩充兵员,采购武器,进行军事改组,为尔后的战争作准备。
7月9日,经过充分准备的以色列军队向阿拉伯军队发动攻击,夺取了阿拉伯约1000平方公里的土地,改善了自己的战略地位。在第二次停火期间,以色列大力推行移民计划,不断扩充军队和武器装备。相反,阿拉伯国家在第二次停火期间内部矛盾进一步激化,战局每况愈下,到了不可扭转的地步。此后,以色列军队又破坏停火令,向阿拉伯军队主动进攻,首先逼迫埃及要求停战,并同样使约旦、黎巴嫩和叙利亚签订停战协定。
巴勒斯坦战争共历时15个月,以阿拉伯国家的失败,以色列获胜而告终。除加沙和约旦河西岸部分地区外,以色列占领了巴勒斯坦4/5的土地,比联合国分治决议规定的面积多了6700多平方公里。战争中近百万巴勒斯坦人沦为难民。联合国决议所规定的阿拉伯国家始终未能建立。战争激化了阿拉伯国家和以色列、美、英的矛盾。
这次战争的另一后果是开了这两个民族武力解决争端的先河,在接下来的30年间,阿以之间又爆发了四次大规模战争,以色列占据了大片原属阿拉伯国家的领土,并在这些领土上建造了大批定居点。造成了占有这些领土的既成事实。如果第一次中东战争没有爆发,阿拉伯国家不可能蒙受如此巨大的损失。
启示:1948年5月14日,“以色列国”宣告建立,本·古里安任总理兼陆军总司令。他上任伊始就疯狂叫嚣,犹太国的命运“只能在战场上决定”。阿拉伯国家坚决反对这个人为制造出来的“国家”。5月15日,阿拉伯联盟五个成员国——埃及、伊拉克、叙利亚、黎巴嫩和约旦,向以色列宣战,于是第一次中东战争爆发。
,焦土政策”与“破釜沉舟”
前面我们已经谈过“焦土政策”的两个作用:显示自己决不妥协的立场和增大对手的成本。不过,这里倒不是有意暗示说,这么一个策略无论成功或失败,其本身或结果都是可取的。不难想像社会希望避免这么一种意味着巨大浪费的破坏行动的出现。我们的目的在于解释这些策略的本质,这样你就可以更好地运用它们,或者避免使用它们。
焦土防御只不过是被博弈论者称为策略行动的做法的一个例子。你大约已经觉得,保留选择余地总归是有好处的。不过,在博弈论的王国里,这一点却不成立。你虽然少了自由,却在策略上得了益。因为这么做改变了其他参与者对你以后可能采取什么反应的预期,而你可以充分利用这一点,为自己谋利。其他人知道,只要你有行动的自由,你就有让步的自由。“破釜沉舟”、“背水一战”、“置之死地而后生”等成语,说明的都是这个道理:只有把退路堵死,你才能奋勇向前。
为了使一个策略行动可信,你必须采取其他附加行动,使扭转这一行动变得代价高昂乃至完全没有可能。可信度要求对这个策略行动作出一个承诺。当战争中的一方威胁要饿死他的敌人,烧毁田野的行动就使他的威胁变得非常可信。而在其他情况下,可信度是一个程度问题。(大多数时候)法律体系中的先例使强制判刑条例显得可信;至于政治家的承诺,例外情况反而更加常见。
启示:策略行动包含两个要素:计划好的行动路线以及使这一路线显得可信的承诺。
威胁与许诺
一个无条件的行动(不计代价、只要胜利)可以使这个参与者获得策略上的优势,抢占先机,率先出招。即便你并未真的先行,仍然可以通过对一个回应规则提出一个承诺,获得相仿的策略优势。虽然你是跟在别人后面行动,但这个回应规则必须在别人开始行动之前就实施。父母对孩子说:“除非你做完作业,否则不许出去玩。”实际上就是在确立一个回应规则。毫无疑问,这个规则必须在这个孩子跑出去之前就开始实施,并且明确宣布。
威胁是对不肯与你合作的对手进行惩罚的一种回应规则。既有强迫性的威胁,比如恐怖分子劫持一架客机。其确立的回应规则是假如他的要求不能得到满足,全体乘客都将死于非命。也有阻吓性的威胁,比如美国威胁说,假如苏联出兵攻击任何一个北约国家,它就会以武力回敬。强迫性威胁的用意在于促使某人采取行动,而阻吓性威胁的目的在于阻止某人采取某种行动。两种威胁面临同样的结局:假如不得不实施威胁,双方都要大吃苦头。
第二大类的回应规则是许诺。这是对愿意与你合作的人提供回报的方式。检察官会向一个被告许诺说,只要他愿意成为公诉方的证人,检举同案中的其他被告,他就会得到宽大处理。许诺同样可以分为强迫性的和阻吓性的两种。强迫性许诺的用意是促使某人采取对你有利的行动,比如让被告摇身一变成为公诉方的证人;阻吓性许诺的目的在于阻止某人采取对你不利的行动,比如黑帮分子许诺好好照顾证人,只要他答应保守秘密。相仿地,两种许诺也面临同样的结局:一旦采取(或者不采取)行动,总会出现说话不算数的动机。
有时候,威胁与许诺的界限非常模糊。威胁与许诺的界限只取决于你怎样称呼当前的情形。老派的歹徒会威胁说,假如你不给他一点银子,他就要加害你。假如你没有给,他就会动手“修理”你,从而造成一种新的情形,而在这种新的形势下,他又会许诺说只要你给他一点银子,他就会住手。随着形势转变,一个强迫性的威胁会变得和一个阻吓性的承诺差不多;同样,一个阻吓性的威胁与一个强迫性的许诺的区别也只限于当时的情况。
如果实践一个“威胁”对你有利,我们称之为警告。比如,一位总统告诉他的国会议员们,如果国会不能通过他提出的法案,他就要解散国会,重新举行大选。这就是一种威胁。警告的用意在于告知其他人,他们的行动将会产生什么影响。
如果实践一个“许诺”对你有利,我们称之为保证。孩子不理会关于炉子顶部很热的警告,结果烫伤了,这使父母得到某种保证,知道孩子以后再也不会这么干了。
我们强调这两对概念的区别是有理由的。威胁与许诺是真正的策略行动,而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。实际上,你只不过告知他们,针对他们的行动,你打算采取怎样的措施作为回应。与此截然相反,威胁或者许诺一旦时机来临,就会改变你的回应规则,使之不再成为最佳选择。这么做不是为了告知,而是为了操纵。由于威胁和许诺表明你可能选择与自身利益冲突的行动,这就出现了一个可信度的问题。等到别人出招之后,你就有动机打破自己的威胁或者许诺。为确保可信度必须做出一个承诺。
无条件的行动是你先行且行动一成不变的回应规则。威胁与许诺则在你第二个出招时出现。两者都是有条件的行动,因为这个回应是由取决于对方怎样做的规则所确定的。一种策略行动总是抢占先机的行动。回应规则必须在对方行动之前实施,在博弈当中进行分析。如果你永不妥协,那么整个博弈都必须当做相继出招的过程,那么其他人就会针对你采取无条件的行动。
无条件行动若是打算用来影响对方,就一定要让对方看到,同样你打算通过威胁或许诺影响他的行动,那么他的行动也要让你看到。否则你不可能知道他是不是选择顺从,而他也明白这一点。
除了前面提到的三种基本的策略行动,还有更多更加复杂的选择。这些选择包括:你可以任由别人在你做出回应之前采取一个无条件行动;你可以等待别人发出一个威胁,然后再采取行动;你可以等待别人提出一个许诺,然后再采取行动。
有些时候,本来可以先行的一方放弃这一便利,让对方做出一个无条件的行动,反而能取得更好的结果,这样的例子我们已经探讨过了。若是在跟随比带头更好的关头,这么做当然是明智的选择。不过,虽然放弃先行之便可能更加有利,但这么做却并非一个基本规则。
有时候你的目的可能是阻止你的对手作出一个无条件的承诺。古代战略家孙子曾经给过这样的提示:“围师遗阙”。只要留下出口,敌人就会认定还有逃生机会。假如敌人看不到任何逃跑的出口,就会迸发破釜沉舟般的勇气,顽抗到底。孙子的目的就是不给敌人对自己作出一个拼死战斗的非常可信的承诺的机会。
让别人有机会对你发出一个威胁永远不是好事。你大可以选择按照对方的希望行动,却没有必要等到听见一个威胁。不错,你若不听话,但这一事实并不能作为你坐等对方发出一个威胁的借口。注意,这句格言只限于允许对方发出威胁而已。假如对方同时作出威胁和许诺,那么双方都会得到更好的结果。
启示:一切威胁与许诺的共同点在于:回应规则使你不会在没有回应规则的前提下采取行动。由于别人对你以后的行动的预期毫无变化,这个规则也就产生不了任何影响。不过,说明什么事情会在没有规则的情况下发生,仍然具有一种公告天下的作用,这些说明称为警告与保证。
许诺与威胁的适度原则
显而易见,在你作出一个许诺的时候,你不应让自己的许诺超过必要的范围。假如这个许诺成功地影响了对方的行为,你就要准备实践自己的诺言。这件事做起来应该是代价越小越好,因此也意味着许诺的时候只要达到必要的最低限度就行了。
不那么容易看到的是,适度原则其实同样适用于威胁。你不应让自己的威胁超过必要的范围。这么做的理由相当微妙。
为什么美国不会威胁日本说,假如日本不同意进口更多的美国大米、牛肉和柑橘,美国就要动武呢?虽然动武的想法有可能博得美国一些农场主和政治家的欢心,但同时却存在几个很好的理由,说明不能这么做。
1.没有人会相信这么一个威胁,因此这个威胁不会奏效。
2.哪怕这个威胁真的管用,日本也不傻,一定会重新揣摩美国究竟是不是它的盟友。
3.假如日本不肯进口更多柑橘,美国说到做到,当真实施自己的威胁,其他国家就会谴责美国选择了一个很不恰当的惩罚方式,日本更会怒不可遏。不过,假如美国不实施自己的威胁,又会让自己日后的信誉大打折扣。无论是不是实施自己的威胁,美国都将遭到失败。
4.这个威胁由于引入了一个本来毫不相干的因素——武力——而使原来的问题变得模糊不清。
上述各点的核心在于,这个威胁大而不当,对方难以置信,而自己又不能说到做到,更别说进一步确立自己的信誉了。
博弈的参与者发出威胁的时候,首先考虑的问题可能恰恰相反,认为威胁必须足够大,大到足以阻吓或者强迫对方的地步。接下来要考虑的则是可信度,即能不能让对方相信,假如他不肯从命,一定逃脱不了已经明说的下场。若是在理想状况下,再没有别的需要考虑的相关因素了。假如受到威胁的参与者知道反抗的下场,并且感到害怕,他就会乖乖就范。那么,我们为什么还要担心若实施这个威胁,会有多么可怕的情况发生呢?
问题在于,在这个方面,我们永远不会遇到理想状况。只要我们仔细考察美国不能威胁动武的理由,我们就会看得更清楚,现实与理想状况究竟有什么区别。
首先,发出威胁的行动本身就可能代价不菲。国家、企业乃至个人都参加着许多不同的博弈,他们在一个博弈中的行动会对所有其他博弈产生影响。比如美国若是威胁对日本动武,就会影响到美国日后与日本的关系、目前和日后与其他国家的关系,而美国用过这么一个大而不当威胁的事情也会留在别人的记忆里。别人在和美国打交道时就会犹豫不决,美国则会失去许多其他贸易和伙伴关系带来的好处。
其次,一个大而不当的威胁即便当真实施了,也可能产生相反的作用。日本会惊慌失措地高举双手投降,请求世界舆论声援,谴责美国,从而将大大推迟有关谈判的进度;美国本来希望迫使它尽快开放国内市场,结果却适得其反。
再次,所谓一个成功的威胁完全不必实施的理论,只在我们绝对有把握不会发生不可预见的错误的前提下成立。假设美国错误地判断了日本农场主的势力,而他们宁可让国家投入战争也不愿失去自己受到保护的市场。又或者,假设日本同意美国的条件,可是美军某指挥官想起自己当年不幸沦为战俘的惨痛经历,就会抓住这个机会报仇雪恨……面对发生诸如此类错误的可能性,美国应该三思而后行,在考虑作出一个很大的威胁的时候更应如此。
最后,在讨论过以上几点后,我们可以看到,一个威胁可能由于太过而丧失可信度。假如日本不相信美国当真愿意实施这个威胁,这个威胁就不可能影响它的行动。
结论是,能奏效的最小而又最恰当的威胁应该成为美国的首要选择,务必使惩罚与罪行相适应。如果美国希望刺激日本多买柑橘,就应该选择一个更具互惠性质的威胁,使惩罚与不肯多买柑橘的做法更加匹配。比如,美国可以威胁说要削减日本汽车或者电器的进口配额。
启示1:实际上,这种威胁曾在1853年使用过。美国海军上将佩里的庞大战舰编队成功地慑服日本幕府时代的将军,使后者同意向美国商界开放日本市场。今天,日本把美国由于要求开放日本市场而施加的过分压力称为“黑色舰队”。
启示2:有些时候,一个合适的威胁简直得来全不费工夫。而在其他时候,我们眼前只存在大而不当的威胁,必须缩小其范围才能考虑加以采纳。
,冤冤相报”到“两败俱伤”
在“囚徒困境”中,我们已经了解这样一个道理:如果你总是想赢对方,结果可能得不偿失。因为对方也会全力反击,造成“两败俱伤”的局面。
而且,敌对一旦形成,双方都难以全身而退。这个时候,即使双方都没有继续对抗下去的意愿,可还是只能咬牙坚持,这真是对人类理性的一大嘲弄。
即使是“一报还一报”这种有效破解“囚徒困境”的理想策略,也难免陷入“两败俱伤”的危险。
当“一报还一报”策略纠缠在一起时,将陷入“循环报复”的局面,难以脱身。
由于“一报还一报”的核心就是对任何行为都要给予及时有效的回报,当遭遇他人侵犯时一定会以牙还牙;当然,这种策略的前提是“不主动侵犯他人”,这大大降低了它们相互伤害的机会。但是,这种前提是理论性的。
在一个规则明确的游戏里它也许可以得到完美的遵循,但在现实生活中,各种社会关系、各种欲望和利益冲突的复杂性,使“不主动侵犯他人”这一限定条件变得模糊不清了。也许你认为自己只是在以正当手段谋求个人的利益,或者只是奉命行事,可是有人会认为你已经侵犯到了他的权益,他有权作出报复。而受到报复的你会认为对方是无端挑衅,同样也作出反击。由此,就很容易形成双方相互惩罚对方的“侵犯”、冤冤相报的局面,而可悲的是,这场也许会使双方毁灭的争斗并没有一个清晰的理由。
这样的悲剧在人类历史中可以说层出不穷。过去的家族间世代血仇有的可以持续上百年,双方的每次冲突都会激发新的仇恨,而两家最初的仇恨缘由也许根本无人知晓。国家和民族间也有同样的问题,甚至到了今天仍可以表现出来。如巴以冲突中,为了抗议“以色列的侵略行为”,“哈马斯”等激进组织利用“人体炸弹”袭击以色列平民;而为反击这种“恐怖行为”,以色列出动军队“定点清除”,每一次攻击的报复都给双方心中增添了一份仇视和不信任,也给问题的和平解决增加了难度。
人们都同意,为了从上述那种冤冤相报的麻烦中解放出来,人们应该“抛弃过去,面向未来”。可是这一原则在现实中应用却困难重重,因为放弃武力威慑不但意味着情感和利益上的损失,而且在互不信任的境况里,也很难保证得到对方的善意回应。
人们之所以相互仇视和伤害,仅仅是因为他们无力摆脱“威慑与反威慑”的怪圈。为了解决它易被挑起报复的缺点,学者们建立了一些改良方法。这些改良方法更多一点宽容,要么容忍对方偶尔的侵犯行为,直到这种行为屡次出现,并且超出预定的次数或比例之后,才采取报复行动。要么降低报复强度,如对10次背叛只报复9次。并根据对方的一贯表现决定宽容程度。
启示:有一个人和朋友在住家附近的商店买东西,他礼貌地对店员说了声:“谢谢!”但店员却臭着一张脸,没有理会。他们走出商店时,朋友说:“那家伙服务态度很差。”这个人对朋友说:“他每天都是这样。”朋友说:“既然他每天都是这样,那你为什么还对他那么客气呢?”这个人回答说:“为什么我要让他的态度来决定我的行为呢?”
不能取胜,就该谋和
许多比赛结局都是“零和”的:有人赢,就有人输。但是在社会关系中,并不总是这样。当然,人们都希望取胜,可是当取胜无望时,那么争取到“平局”也不错,至少比输要好。
在现代社会,多数竞争已不再是“你死我活”的,从“地球上抹掉敌人”的情况少之又少。博弈论告诉我们:当人们必须长期共处时,合作和妥协往往是明智的选择。既然难以“毕其功于一役”,我们就该把目光放长远一些。“妥协”是双方或多方在某种条件下达成的共识,在解决问题上,它不是最好的办法,但在没有更好的方法出现之前,它却是最好的方法,因为它有不少的好处。
首先,它可以避免时间、精力等“资源”的继续投入。在胜利不可得,而“资源”消耗殆尽时,妥协可以立即停止消耗,使自己有喘息、整补的机会。也许你会认为,“强者”不需要妥协,因为他“资源”丰富,不怕消耗。问题是,当弱者以飞蛾扑火之势咬住你时,强者纵然得胜,也是损失不少的“惨胜”,所以强者在某种状况下需要妥协。
其次,可以借妥协的和平时期,来扭转对你不利的劣势。对方提出妥协,表示他有力不从心之处,他也需要喘息,说不定他根本要放弃这场“战争”;如果是你提出,而他也愿意接受,并且同意你所提的条件,表示他也无心或无力继续这场“战争”,否则他是不大可能放弃胜利的果实的。因此“妥协”可创造“和平”的时间和空间,而你便可以利用这段时间来引导“敌我”态势的转变。
再次,可以维持自己最起码的“存在”。妥协常有附带条件,如果你是弱者,并且主动提出妥协,那么可能要付出相当的代价,但却换得了“存在”;“存在”是一切的根本,没有存在就没有未来。也许这种附带条件的妥协对你不公平,让人感到屈辱,但用屈辱换得存在,换得希望,也是值得的。
,妥协”有时候会被认为是屈服、软弱的“投降”动作,但若从上面所提几点来看,“妥协”其实是非常务实、通权达变的智慧,智者都懂得在恰当时机接受别人的妥协,或向别人提出妥协,毕竟人要生存,靠的是理性,而不是意气。
何时“妥协”?怎样妥协?要看状况:
第一,要看你的大目标何在,也就是说,你不必把资源浪费在无益的争斗上,能妥协就妥协,不能妥协,放弃战斗也无不可。但若你争的本就是大目标,那么绝不可轻易妥协。
第二,要看“妥协”的条件,如果你占据优势,当然可以提出要求,但不必把对方弄得无路可退,这不是为了道德正义,而为了避免逼虎伤人,是有利害权衡的。如果你是提出妥协的弱势者,且有不惜玉石俱焚的决心,相信对方会接受你的条件。
总之,“妥协”可改变现状,转危为安,是战术,也是战略。
启示1:妥协:用让步的方法避免冲突或争执。
启示2:妥协是现代社会关系中的重要谋略。在商场竞争中,一个经营者如果不懂得适当妥协,就会在盲目前进中碰壁。同样,一个不知进退的人早晚也会尝到失败的苦果。
第6章 应对危机的策略人类最理智的时候,往往就是别无选择的时候。“边缘策略”是一场危险的游戏,每一步都蕴藏着巨大的希望与危机。 肯尼迪的边缘策略 从前面的分析中,我们似乎得出这样的结论:立场坚定、不留余地是一个高明的策略。那么它是不是永远有效?下面我们将讨论与之不无矛盾的情况。 1962年10月,古巴导弹危机将整个世界拖到了爆发核战争的边缘。苏联在赫鲁晓夫的领导下,开始在古巴装备核导弹,那儿距离美国本土只有90英里。美国总统肯尼迪随即宣布要对古巴实施海上封锁。假如苏联当时接受这一挑战,此次危机很有可能升级为超级大国之间一场倾巢而出的核战争。肯尼迪本人估计,发生这种情况的可能性“介于13到一半之间”。不过,经过几天的公开表态和秘密谈判,赫鲁晓夫最后还是决定避免正面冲突。为挽回赫鲁晓夫的面子,美国做了一些妥协,包括最终从土耳其撤走美国导弹。作为回报,赫鲁晓夫则下令拆除苏联在古巴装备的导弹,并且装运回国。 你可以说赫鲁晓夫贸然在古巴部署导弹是鲁莽的,但不能不说他的妥协是明智的(据说那些日子,肯尼迪紧张得几乎崩溃,如果赫鲁晓夫不肯退让,一场核战争似乎不可避免);但是反过来说,既然赫鲁晓夫最终只有退让这一个明智选择,那么他最初的冒进就是卤莽的。 我们普通人也会运用边缘政策,只不过不会产生那么深远的国际影响罢了。比如买卖双方的讨价还价最终变成一场争吵;固执己见而不能达成妥协的夫妻可能离婚;意见不一的合作者如果不能相互协作,合作关系就会破裂。这些案例的双方其实都会用到边缘政策。他们故意创造和操纵着一个有着在双方看来同样糟糕的结局的风险,引诱对方妥协。 边缘政策是一个充满危险的微妙策略,假如你想成功地运用这个策略,你必须首先彻底弄明白它究竟是怎么一回事。 启示:“边缘政策”一词看来就是为这么一种策略设计的,这种策略将你的对手带到灾难的边缘,迫使他撤退。肯尼迪在古巴导弹危机中采取的行动,被普遍视为成功运用边缘政策的典范。 悬崖还是斜坡 这里还是以古巴导弹危机作为案例,帮助你把握边缘政策中的微妙之处。 肯尼迪政府发现苏联偷偷在古巴装备导弹,立即详细考虑了一系列可能的行动:什么也不做;向联合国投诉(这一行动的实际效果几乎就等于什么也不做);实施封锁或隔离(这是实际选择的方案);向古巴的导弹基地发动空中打击;要么就是走极端,抢先向苏联发动一场全面的核打击。 而在美国实施海上封锁后,苏联也有很多可能的回应方式。它可以退让,并拆除导弹;停止通过大西洋运输导弹(这是实际选择的方案);挑战美国的封锁线;或者走极端,抢先向美国发动一场全面的核打击。 在这一系列的行动与反行动里,一些可能的行动很显然是安全的(比如美国什么也不做或者苏联撤走导弹),而另外一些行动则带有明显的危险性(比如向古巴发动一场空中打击)。不过,在这么大的范围里,我们怎么知道安全在哪儿终结,而危险又从哪儿开始呢?换言之,古巴导弹危机的边缘在哪里?是不是存在一条边界线,世界在这一边是安全的,一旦落到另一边就要遭受灭顶之灾? 答案当然是并不存在这么一个精确的临界点,人们只是看见风险以无法控制的速度逐渐增长。举个例子:假如苏联企图挑战美国的封锁,美国不大可能立即发射自己的战略导弹。但整个事件的紧张程度无疑会上升到一个新的水平,而人们的情绪也会变得越来越激动,可以预见,世界遭受灭顶之灾的风险也加大了。要想透彻地理解边缘政策,关键在于,必须意识到这里所说的边缘不是一座陡峭的悬崖,而是一道光滑的斜坡,它是慢慢变得越来越陡峭的。 实际上,边缘政策是一种威胁,只不过属于非常特殊的类型。要想成功运用边缘政策,你首先必须了解其独特之处。 我们通过三个问题分析这些独特之处:第一,为什么不直接用一种表示可怕结果一定会出现的确定性来威胁你的对手,而只是借助一个单纯的风险来暗示可怕的结果可能出现?第二,确定风险是不是已经过去的机制又是什么?第三,这个风险的恰当程度应该如何把握?我们将依次回答这些问题。 启示:边缘政策的本质在于故意创造风险。这个风险应该大到让你的对手难以承受的地步,从而迫使他按照你的意愿行事,以化解这个风险。这么一来,边缘政策变成一个策略行动,目的是通过改变对方的期望来影响他的行动。 为什么选择不确定性 在美国希望苏联从古巴撤出导弹的前提下,肯尼迪为什么不直接威胁说,假如赫鲁晓夫不拆除那些导弹,他就会将莫斯科夷为平地?按照我们前面介绍的术语,这将是一个令人信服的威胁;它必须具体说明对方退让的确切条件(将导弹撤回俄罗斯,还是装箱后搬上哈瓦那港的一条船)以及退让的最后期限。 问题在于,在实践当中,这么一个威胁不会有人相信,赫鲁晓夫不相信,其他什么人也不会相信。不错,这个威胁中提到的行动将会引发一场全球性的核战争,但这个危险本身实在太夸张了,以至于让人难以置信。假如导弹没有在最后期限之前撤离,肯尼迪一定不愿意将整个世界夷为平地,而更加愿意考虑延长留给苏联的最后期限,推后一天,再推后一天,如此下去。 我们讨论过提高威胁的可信度的几个办法。在目前这个案例的具体情况下,动用一个自动装置看来就是最有把握的一个办法。安装一个“末日毁灭机”,专门监测对方有没有越界,并由一套稳定的电脑程序确定了一系列具体条件,一旦满足这些条件,这个装置就会自动实施报复行动。 从理论上说,在理想的情况下,一切都会按照计划发生。一台自动装置的存在可以使这个威胁更加可信。结果赫鲁晓夫退让了,这个威胁不必付诸实施,世界就免遭了灭顶之灾。假如某个威胁一定会奏效,那么它永远不必付诸实施,其规模大小并不重要,当真实施起来会让你遭受多大伤害也没关系。不过,在实施中,这个威胁能不能按计划奏效你不可能有绝对把握。 实际上,可能出现两种错误。第一,这个威胁可能失败。假设肯尼迪对赫鲁晓夫的心思的判断是完全错误的。赫鲁晓夫不肯退让,于是那台可怕的“末日毁灭机”就会自动启动,毁灭全世界,肯尼迪则会后悔当初居然安装了这么一个东西。第二,这个威胁即便在不应该付诸实施的时候也会实施。假设苏联退让,但这个消息传到“末日毁灭机”那里的时候偏偏晚了那么一点点。 由于这样的错误永远可能出现,肯尼迪一定不肯依赖于任何一个实施起来代价惊人的威胁。赫鲁晓夫若是知道这一点,根本不会相信这样的威胁,从而这些威胁也就不能阻吓他或迫使他就范。肯尼迪可以宣称有这么一台自动发射机,这台机器已经得到授权,假如苏联直到星期一还没有将导弹撤出古巴,它就要自行向莫斯科发射导弹;不过,赫鲁晓夫可以肯定,肯尼迪一定还有一个象征更高授权的按钮,这个按钮可以撤销这台机器发出的发射命令。 虽然表明战争必然爆发的确定性的威胁并不能让人信服,但表明战争可能爆发的风险或概率却可以变得可信。假如赫鲁晓夫不肯退让,就会出现一种风险,而不是一种确定性,表明导弹可能发射。这种不确定性降低了这个威胁的程度,从而使美国觉得这个威胁比较容易承受,因此在苏联看来也更加可信。 这跟我们在前面所提到的另一个提高可信度的办法相似,即小步前进。当时我们认为应该把一个大的承诺分解为一系列小的承诺。如果一个内部人员打算卖给报界一条很有价值的重要消息,他可能不愿意仅凭报界的承诺就和盘托出,而是一点一点地透露,相应地,报界也会一笔一笔地付钱。同样的原则也适用于威胁。在这里,每一步都包含一定程度的风险。美国或苏联方面的每一次不让步都会加大爆发世界大战的风险;而他们的每一个小的让步则都会减少这个风险。假如肯尼迪愿意走得比赫鲁晓夫更远,那么肯尼迪的边缘政策就会取胜。 肯尼迪不能令人信服地威胁说他马上就要发动一场全面的核打击,但他可以通过某些正面交锋令人信服地将这种风险提高到一个新水平。于是,赫鲁晓夫再也不能认为肯尼迪的威胁只不过是说说而已;假如肯尼迪使自己面临这样的风险有助于促使苏联撤走导弹,那么这么做其实符合他的利益。假如赫鲁晓夫认为这种水平的风险难以忍受,那么边缘政策就完满地达到了目的:它使肯尼迪可以选择一个大小更恰当的威胁,一个大到足以奏效而又小到足以令人信服的威胁。 我们还要考虑肯尼迪怎样才能以爆发战争的风险而不是爆发战争的确定性威胁对方。这里我们看到了前面提过的那道光滑的斜坡。 在与理性的对手较量时,没人愿意越过核战争的边缘,却有可能由于一个错误而滑下那道光滑的斜坡。 最常见的是采取超出你的控制的行动。这不是“假如你不服从我,就会出现我会这么做的风险”的问题。相反,这是“假如你不服从我,就会出现不管到时候你我会不会感到后悔不迭都会发生这样的事情的风险”的问题。 古巴导弹危机本身就提供了这么一个例子:比如,即便是总统也可能发现,一旦实施海上封锁,要想牢牢控制这一行动并不容易。 按照常规,封锁是一种战争行为,不过,肯尼迪的目的是用某种方式劝说赫鲁晓夫撤走,而不是刺激他采取报复行动。 海上封锁的标准操作程序可能会施加超出肯尼迪计划范围的风险。因此,很重要的一点在于,认识到这种风险并非一个二人博弈,而苏联或美国也不能被看做是其中的一个个体参与者。肯尼迪的决策必须由自有一套程序的各方负责实施,这一事实使肯尼迪可以令人信服地表明确实会有一些事情超出他的控制。官僚机构自有一套行事方式,行动一旦发生就难以停止,以及组织内部存在相互冲突的目标,这些事实都是对肯尼迪有利的,他可以借此威胁说他要启动一个程序,而这个程序他自己也不能保证可以停止。 启示1:肯尼迪上台后,在对苏关系上灵活地使用了他的“两手策略”。在1961年8月的第三次柏林危机中,他采取了强硬立场,向西柏林增派武装部队,迫使苏联让步。在1962年10月的古巴导弹危机中,他采取了果断而慎重的对策,终于迫使赫鲁晓夫再次屈服。1963年8月,美苏之间达成协议,在白宫和克里姆林宫之间建立热线电话,避免由于误会而爆发核战争。 启示2:士兵和军事专家常常谈到“战争迷雾”,说的是双方在沟通中断、带有恐惧或勇敢的心理以及存在很大程度的普遍不确定性的情况下采取行动。同一时间发生的事情太多,因而没办法一直将每一件事都牢牢置于自己的掌握之中。这对创造风险有一定帮助。 说还是不说,哈姆雷特》有一句经典台词:活还是不活?同样,生于五、六十年代的人也几乎从小都曾经历过灵魂的拷问:说还是不说?它来自那个时代的老电影——在那些电影里,常有坏蛋把好人抓起来严刑逼供的情节。在那个时代,每个小孩都知道很多折磨人的玩意:辣椒水、竹签子、老虎凳什么的,也都思考过“说还是不说”这个问题(对于一个孩子来说,这种思考未免过于沉重了)。从小我们就懂得了什么叫“生不如死”:在我们看来,与其挨揍,还不如马上被枪毙好些。 尽管非常遗憾,但是在这里必须承认严刑拷打比枪毙更有效:假如你想从某人嘴里套出一些重要情报,你若威胁说他要是不招供你就会杀了他,你的威胁一定没人相信。他知道,一旦杀了他,你想要的秘密会跟他一起埋葬,从而你就会失去兑现威胁的动机。 有一个海盗船长,想要他的俘虏说出财宝藏在哪里,于是他拿出一把刀搁在这个俘虏的喉咙上,以为这样就可以使他招供。可俘虏还是默不作声,船长的同伙反而笑起来,说:“假如你割断他的喉咙,他就没法向你招供。他知道这一点,他也知道你知道这一点。” 假如这个海盗船长看过“硬汉派”侦探小说《马耳他之鹰》,他本来也许可以扔掉那把刀子,转而尝试边缘政策。在这本书里有这样的情节:侦探藏起了那只价值连城的鸟,而歹徒则绞尽脑汁要找出鸟藏在哪里。 侦探说:“你想要那只鸟吧,它在我的手里……假如你现在杀了我,你又怎能找到那只鸟?假如我知道你在得到那只鸟之前杀不了我,你又怎能指望吓唬我交出来?” 歹徒的回应是解释他打算怎样使自己的威胁变得令人信服。,我明白你的意思。这需要双方拿出最明智的判断,因为你也知道,先生,男人若是急了,很快就会忘掉自己的最大利益究竟是什么,那就什么事都做得出来了。” 歹徒承认他不能以处死的办法威胁侦探。不过,他可以让侦探面对一种风险,即局势可能在僵持到极点的时候超出控制,结果会是什么就说不准了。也就是说,“我不是存心要杀你,可是你要找死我就没办法了。”歹徒不能承诺假如侦探不肯招供,他就一定大开杀戒。但他可以威胁说要让侦探处于一种境地,在这种境地下歹徒自己也不能保证是不是可以防止侦探遇害。这种让某人了解自己遭受惩罚的概率的本事应该足以使这个威胁奏效,假如惩罚足够吓人的话。 这么一来,侦探丧命的风险越大,这个威胁就越管用。不过,与此同时,这个风险也会让歹徒感到越来越难以承受,从而变得越来越难以置信。歹徒的边缘政策在并且只在一个条件下奏效:存在一个中等程度的风险概率,它使这个风险大到足以迫使侦探说出那只鸟的藏身之处,却又小到让歹徒觉得可以接受。这么一个范围只在侦探重视自己的生命胜过于歹徒重视那只鸟的时候存在。 边缘政策不仅在于创造风险,还在于小心控制这个风险的程度。 启示:边缘政策通常会是一个很管用的办法,却同样可能变成某种冒险经历。对于这个两难问题,我们没有任何完美的或普遍有效的答案。 毫无用处的核武器 许多人认为核武器存在一种悖论,因为核武器象征的威胁太大(同归于尽),以至于完全用不上。假如核武器的使用不是合理的,那么所谓“核威慑”也不可能是合理的。这就跟放大了的歹徒与侦探的交易差不多。一旦失去了威胁的价值,核武器对阻吓小型冲突也就毫无用处。 这就是欧洲人担心北约的核保护伞可能抵挡不住苏联常规军队的原因。即便美国决心保卫欧洲,人们还是会继续争辩说,核武器根本就不可信。苏联可以运用每次切一小片的“意大利香肠”战术,钻核武器威胁的这个空子。 上世纪80年代,英国有一个很受欢迎的电视剧《是,大臣》,上至达官贵人,下至贩夫走卒,都喜欢看这个拿政界人物开玩笑的节目,连当时的首相撒切尔夫人也乐于在其中客串角色。这个戏的主要内容是政客和官僚机构如何在扯皮中作出糟糕的决策。下面一段出自它的续集《是,首相》,正是一个“最后界限”为何失去作用的说明。 这一情节的背景是:首相正在犹豫是否要花费巨资装备英国的核武库,为此他找来了首席科学顾问,征求他的意见。以下是这位首相的叙述。 他第一句话便问我是否相信有核威慑这回事。 是。我说。,为什么?”他问道。 我不知道该说什么。我的意思是,人人都相信核威慑。我请他把问题再说一遍。,为什么?”他又问。,因为……它发生威慑作用。”我软弱无力地回答道。,威慑谁?” 在我看来,这似乎很明显。“俄国人。不能让他们进攻我们。”,为什么?”他又来了,再次使用那个恼人的小小的词“为什么”。 为什么威慑力量能威慑俄国人,不让他们进攻我们——这是他的问题所在,他问的是这个问题。我坚定地回答道。“因为他们知道,如果他们发动进攻,我会按钮。”,您会吗?”他听来有些惊奇。,哎……”我犹豫了一下,“我会不会?”,唔……您会吗?”,作为最后一招,我会。肯定会。”我又想了一下说,“至少我认为我肯定会。” 他继续无情地问下去。我不得不谨慎地想一想。,那么最后一招是什么呢?”,如果俄国人侵犯西欧。”这一点至少看来也是很明显的。 罗森布拉姆教授微微一笑“可是您只有12个小时来作出决定,所以最后一招也是首先的反应,您所说的就是这个意思吗?” 我所说的就是这个意思?看来疯了。 那位首席科学顾问以挑剔的眼光盯着我看。“好吧,您不用担忧。俄国人为什么要吞并整个欧洲?他们甚至连阿富汗都控制不了。”他一边说一边摇头,“不过,如果他们要干什么,那将是萨拉米香肠战术。” 罗森布拉姆站起身来。他兴奋地踱来踱去,手里拿着一杯橘汁,阐述各种各样的防卫方案。首先,他假设在西柏林发生暴乱,建筑物处在火海之中,东德消防队越过边境来救火。他突然停止踱步,瞪着我,并问我在这样的情况下我会不会按钮。 很显然,答复是“不”。罗森布拉姆点点头。他看来表示同意。然后他问我如果东德警察与消防队一起进来,我会不会按钮。我又摇摇头。我怎么可以由于这样一个小小的领土侵犯行动而发动一次核战争昵? 罗森布拉姆又踱起步来。在他的嘴角上露出一丝微笑。“假定东德人派遣部队,随后再增加部队——他们说不过是为了控制暴乱。接着俄国部队来替代东德部队。您会按钮吗?” 俄国部队在西柏林替代东德部队?我会不会发动一次核战争?我看不出我怎么会这样做。我又摇摇头。 那位首席科学顾问又微微一笑,并高兴地提出下一个俄国部队拒不撤走的策略。部队被“邀请”留下来支援民政管理。接着,民政管理署也许下令封锁道路和滕珀尔霍夫机场。于是西柏林被切断。他问道,现在我会不会按钮呢? 我不知道。我对他说我需要时间来加以考虑。,您只有12个小时!”他厉声说。 我感到非常惶恐。然后我提醒自己和提醒他,这一切都出自他的虚构,说完了我感到轻松了一些。 罗森布拉姆教授转身向我。他又开始说话了:“行。现在讲设想二。俄国军队的策略是‘出于偶然’,使士兵故意越过西德边界……这是不是你所说的最后一招呢?”,不,”我回答。看来还不是。,好吧,”他很兴奋地继续说下去,“设想三:假设俄国人已经入侵和占领了西德、比利时、荷兰和法国;再假设他们的坦克和部队已经到达英吉利海峡;再假设他们已布置就绪,准备入侵,这是不是最后一招?” 我设置障碍,说:“不。”,为什么不?”他问,“为什么不?” 我脑子昏沉。我想从这一切中悟出道理来。“因为,”我支支吾吾地说,“因为……我们只能为了自卫而打仗。用自杀的办法,我们又怎能自卫呢?”,那么,什么才是最后一招呢?”瘦小的老教授微微一笑,他耸耸肩,靠在沙发里,“皮卡迪利?西沃特福德峡谷维修加油站?革新俱乐部?” 我凝视着他,想把我的思想整理一下。“如果你这么说,”我对他说,“那么,核威慑就没有意义了。你是不是在说这个?” 整个入侵过程,攻方每次只增加那么一点点分量,幅度那么小,以至于守方根本没有理由发动一场大的报复行动。北约就这样一点一点重新确定自己的忍耐底线。最后,苏联人可能已经抵达伦敦特拉法尔加广场,被迫逃亡的北约总部还在琢磨自己究竟在什么时候错过了反击的机会。 启示:“意大利香肠”战术:对手为避开直接威胁,他会每次只切下一小片“香肠”,这样他将不断面对一个很小的遭遇灭顶之灾的概率,但无论这一片有多小,都有可能成为引发万劫不复灾难的最后一片。 越“无能”,越成功 这个结论其实完全错了。美国就苏联在欧洲的常规入侵发动核报复的威胁是边缘政策之一。有两个办法可以绕过被迫重新确定忍耐底线的问题。这两个办法边缘政策都会用到。 首先,你要设法让惩罚措施的控制权超出你自己的控制,从而断绝你自己重新确定忍耐底线的后路。其次,你要将悬崖转化为一道光滑的斜坡。每向下滑一步都会面临失去控制而跌入深渊的风险。 要使这种威胁变得可信,一个必不可少的要素在于:无论是你还是你的对手都不知道转折点究竟在哪里。美国通过创造一个风险,即哪怕政府本身竭尽全力防止,导弹还是可能发射出去的风险,成功地运用了边缘政策。美国的威胁能不能付诸实践与它本身的意愿无关。核武器的威胁在于可能出现意外事故。当存在任何常规冲突都有可能使局势激化到失去控制的可能性时,核阻吓就变得可信了。这一威胁不是一定发生,而是一种同归于尽的可能性。 赫鲁晓夫在他的回忆录中说:“古巴危机”期间,肯尼迪曾派秘使向他透露:肯尼迪并不想为难苏联,但是他很可能控制不了局面。赫鲁晓夫的口气似乎是说,他的退让,是宅心仁厚地给了后者一个好大的面子。尽管这里面可能有自我吹嘘的成分,但是由此也能看出美国人的策略:他们声称自己也不愿看到最坏的结果,但是却无能为力。 随着一场冲突升级,引发一场核战争的一系列事件发生的可能性也在增加。最后,战争的可能性变得那么大,以至于终于有一方决定撤退。不过,战争的车轮一旦启动就不是那么容易控制的了。出人意料的、意外发生的、可能是偶然的也可能是疯狂的、超出领导人控制的行动,将为局势激化直至动用核武器铺设道路。 麻省理工学院政治科学教授巴里·波森有过这样精辟的描述:“一般认为,激化要么属于合理的政治选择,因为领导层决定先发制人或要避免在一场常规冲突中败下阵来;要么就是一个事故,可能是机械故障、越权指挥或陷入疯狂。不过,从紧张的常规冲突的一般做法产生的激化并不属于上述两种类型:它既不是一个刻意的政策措施,也不是一个事故。可被称为‘意外激化’的事情,其实更接近于要打一场常规战争的决策之外的一个完全没有料到的后果。” 核阻吓包含一个基本的得失结果。有能力发出同归于尽的威胁,本身就存在一种价值。毕竟,在人类进入核时代之后,我们享受了半个世纪没有爆发世界大战的和平。不过,把我们的命运交给概率去控制是要付出代价的。核阻吓要求我们接受某种同归于尽的风险。关于核阻吓的争论大部分集中在这种风险上。我们有什么办法可以降低爆发核战争的可能性,同时又不会削弱核阻吓的力量呢? 诀窍同样在于确保这样的普遍化的风险控制在有效的与可接受的界限内。我们已就怎样做到这一点给出了一些提示,不过,完全成功的边缘政策仍是一门艺术和一种冒险。 启示:从古至今,秃鹰就很喜欢战争,而且这种战争经常发生在同类之间。不知道它们为什么那么喜欢战争,它们也从来不过多地解释这些,只会互相攻讦,极力地主张自己的正当性,声明作恶的都是对方,战争就是这样发生的。秃鹰虽然长着一张可怕的脸,但受伤还是会流血,悲伤的时候还是会流泪。那么为什么秃鹰还是要交战呢?血和泪水究竟还要流多久?我们询问秃鹰时,也在询问人类。 逃离边缘 麻省理工学院政治科学教授波森认为,美国海军在大西洋的政策很危险,也很容易使局势激化。一旦与苏联方面发生任何常规冲突,美国海军就想击沉苏联在大西洋的全部潜艇。这一策略的问题在于,目前美国尚不能分辨出核潜艇与常规潜艇。因此存在一个风险,即美国可能由于意外击沉苏联一艘载有核武器的潜艇而在毫不知情的前提下越过了核阻吓的藩篱。到了这个时候,苏联一定觉得自己有理由向美国的核武器发动攻击,全面核战争一触即发,要不了多久双方就会开始互投核武器了。 海军部长约翰·莱曼为这个策略辩护,其说法就跟波森反对这个策略一样尖锐有力。他认识到一场常规战争可能升级为一场核战争。但他争辩说苏联也会认识到这一点!局势激化的可能性不断增加是合理的,因为这可以首先降低爆发一场常规战争的可能性。 一个比喻也许有助于说明问题。假设我们打算降低手枪的精确度,从而使决斗变得安全一点。可能出现的结果是决斗双方开枪前可能会走得更近。假设决斗双方都有同样的好枪法,那么,决斗双方的最优策略是不断接近对方,在击中对方的可能性达到1/2的时候开枪。一枪致命的可能性与手枪的精确度无关。可见,改变规则不会改变结果,因为所有参与者都会调整自己的策略,设法抵消这一变化带来的影响。 要想阻止苏联人发动一场常规进攻,美国必须设法使他们面临这一进攻将会激化为核战争的风险。如果这一风险沿着某个方向变得越来越大,那么,苏联人在这个方向的前进就会变得越来越慢。美国(和苏联一样)也就更有可能提出和解,因为它们都清楚双方正面临越来越大的风险。 美国和苏联在评估自己的策略时,必须以策略的结果而不是行动为依据。另一个有助于思考这一问题的方法是,假设双方参加前面我们说过的那场拍卖,只不过拍卖用的不是美元,而是发生灭顶之灾的概率。到了某一时刻,出价的数字变得越来越高。一方决定就此罢休,而不是进一步使局势激化最终走向同归于尽的结局。不过,这一方也可能晚了一步,导致会给双方带来损失的概率变成了真实的恶果。 在美国和苏联的冲突中,出价就是这个冲突激化的概率。双方出价的时候怎么沟通取决于这个博弈的规则。不过,单纯改变这些规则并不能使边缘政策变成一个更加安全的博弈。假如美国改变它的政策,苏联也会改变它的策略,并使它对美国的压力保持在同一水平。在一个更加安全的世界里,各国可以采取更加容易使局势激化的措施。只要威胁是一个概率,苏联总是可以调整自己的行动,使这个概率保持不变。 这一结论并不意味着你应该就此放弃,听任可能爆发核战争的风险的存在。要想降低这个风险,你不得不从一个更加根本性的层次着手解决这个问题:必须改变这个博弈。哪怕当年的贵族改用精确度较低的手枪,也不能保证他们多活几年。相反,他们不得不修改扔下一只手套就决斗的荣誉守则。假如美国和苏联抱有同样的目的,那就修改这个博弈,而不是单单修改这个博弈的法则。 还有最后一个方面的控制,是使边缘政策发挥效力所不可缺少的因素。受到威胁的一方通过同意边缘政策者的条件,必须有能力充分减小这一风险,通常是一路减小为零。侦探必须得到保证,只要歹徒知道那个秘密,他的命就可以保住,而赫鲁晓夫也必须得到确认,只要他一退让,美军就会马上撤退。否则,如果无论你做或不做,你都会遭到惩罚,也就不存在什么退让的激励了。 启示:无论怎样运用边缘政策,总有一种跌落边缘的风险。虽然策略论回顾古巴导弹危机的时候会把它当做边缘政策的一个成功应用,但假如超级大国之间爆发一场战争的风险变成现实,我们对这一案例的评价就会完全不同。若是真的爆发了战争,幸存者一定会责怪肯尼迪完全没有考虑后果,毫无必要地就把一场危机升级为一场灾难。
第7章 信息与不确定性
未来的不确定性源于信息,以及处理信息能力的缺乏。对个人来说,拥有信息越多,越有可能作出正确决策。对社会来说,信息越透明,越有助于降低人们的交易成本,提高社会效率。 无法避免的不确定性 如果有一颗料事如神的水晶球,作决策就不再是一件难事了:不但可以逢赌必赢,还可以把赢来的钱再做无风险且高利润的投资;拥有完美的另一半,还能在完美的环境里成功培育出完美的子女;更棒的是,绝不会搭乘可能出事的飞机或汽车。如此一来,不但生活有保障,更能活得充实又美妙。可惜,实际上我们无法掌握所有变因,更无力预测未来,甚至连自己将来想要什么都不知道,所以使得作决策变得困难重重;更别说多人决策、各持己见的状况了。 不管是对未来、过去、生命的意义,抑或是内心的渴望,只要是我们不知道的部分,都称之为“不确定性”。不确定性就像死亡、缴税这等事一样,是无法避免的。一般人提到不确定性就会联想到迟缓、笨拙、优柔寡断这一点可能就是不确定性本身所造成的,以及懦弱等等字眼,但是这么多的词汇,说穿了只是表示“我们有所不知”罢了。不过,话说回来,有些事例如某人的电话号码可以很容易找到答案,但有些事就像“未来”一样,本来就是不可知,所以不必因为不知道而觉得丢脸。因此,不管别人知不知道,只要有你不知道的事情存在,就有可能陷入不确定的情境之中。如果有人宣称他无所不知,这种人你最好对他敬而远之。本章的目的是要探讨如何在不确定的情况下作出理性、一致的决策,换句话说,首先必须承认自己虽然没办法做到无所不知,但也不至于一无所知,而且应该或尽可能有效运用自己所知的一切。 如果让我们选出最好看的古典小说,可能很多人都会说:《三国演义》。的确,《三国演义》不但故事精彩,人物鲜活,而且是一部记载着许多博弈案例的著作。,三国演义》中到处都充满着“计”,什么是“计”?也就是策略;用计,即用策略赢对方。 现在让我们看《三国演义》中一个著名的“空城计”:街亭失守,司马懿引大军蜂拥而来。当时孔明身边只有一班文官,5000军士已分一半运粮草去了,只剩2500军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城上敌楼前凭栏而坐,焚香操琴。司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌,犹豫再三,难下决断。又接到远山中可能埋伏敌军的情报,于是叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。” 孔明见魏军退去,抚掌而笑。众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之,若弃城而去,必为之所擒”。这就是为后人广为传诵的空城计。 当然,“空城计”不过是小说家言,就如博弈论中的游戏一样,未必会在现实中出现。但是作为一个博弈模型,这个故事还是很有启发性的。 在“空城计”博弈中,司马懿兵多将广,几乎所有“好牌”都抓在手里,而诸葛亮的“好牌”只有一张:那就是“信息”。问题的关键在于:司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮是知道的,他们对博弈结构的了解是不对称的。诸葛亮拥有比司马懿更多的信息,他知道自己兵力微薄,但是司马懿并不知道。而且,为了让司马懿无从了解、判断,诸葛亮还偃旗息鼓,大开城门,打起了心理战。因此这是一个信息不对称的博弈。在这里,孔明可以选择的策略是,“弃城”或“守城”。无论是“弃”还是“守”,只要司马懿明确知道他自己的支付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。他的空城计是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。 在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的“期望支付或效用”最大。比如:如果让你在“有50%的可能获得l00元”与在“有10%的可能获得200元”两者之间进行选择,你当然选前者,因为前者的“期望所得”为:50%×100元=50元,而后者为:10%×200元=20元。理性的人是选择前者的。 在“空城计”博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用,即:司马懿认为进攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。 司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可能如此镇定自若,焚香操琴。此时,司马懿觉得“退”比“进攻”更合理,或者说期望效用更大。于是后军变前军,前军变后军,后退而去。结果是诸葛亮得以逃脱。 司马懿对局势的判断不是没有道理的,他对诸葛亮的判断是基于以前的认识,这就是归纳法。归纳法是人们认识和总结客观事物规律的一种方法。 严格来说,归纳法不很科学,例如,过去人们通过观察,得出“所有哺乳动物都是胎生的”这个结论,可是后来发现了鸭嘴兽,这个理论就破产了。所以一位哲人曾说:我们并不知道明天太阳还会不会升起。司马懿因为孔明“生平谨慎”,就料定他“不肯弄险”,也是一例。 但是同样不可否认,归纳法很有效,我们的所有生活经验,其实都是“归纳法”,经验当然不可能代替知识,但是没有经验帮忙,我们是很难活得下去的。 司马懿错失了活捉孔明的机会,固然是个遗憾,但并不是致命错误。作为优势一方,他知道自己可以通过旷日持久的消耗战拖垮对方,而后来他也正是这么做的。相反,如果他真的在局面不明的情况下冒险,中了对方的埋伏,这才是真正的致命错误。从这个意义上说,退兵不但不是错误,反而可能是司马懿的“优势策略”。 启示1:有一次,主人派伊索进城。半路上,他遇见一位法官。法官严厉地盘问他:“你要去哪儿?”“不知道。”伊索回答说。法官起了疑心,派人把伊索关进了监狱,严加审问。“法官先生,要知道,我讲的全是实话。”伊索说,“我确实不知道会进监狱。” 启示2:博弈论还有一个译名就是“对策论”,我们也可以说是“计论”。用计算敌,不仅要自己选择恰当的计策,而且要算准对方用什么计策,这不就是博弈吗? 启示3:归纳法是一种推理方法,即由一系列具体的事实概括出一般原理(跟“演绎”相对)。简单说来,归纳法就是通过个别了解一般。例如,在人们发现天体运行规律之前,是通过“太阳每天东升西落”这个现象,知道“太阳不会从西边出来”这个道理的。 掌握信息,破解难局 我们已经说过,“空城计”只是虚构的故事,不太可能在现实里发生。你可能会想:如果换了我,尽管可能没有司马懿那么聪明,可还是能够活捉孔明。 我们可以设想,其实司马懿完全可以派出一个小分队搞火力侦察,探明虚实再作决断。这样即使孔明真的设下了埋伏,他的损失也不大;如果没有埋伏,就可以进攻活捉孔明。姑且把中计的概率看成1/2,在一个对等赌局中,所得大于所失,这个风险是值得冒的。 成语“黔驴技穷”说的也是这个道理。老虎没见过驴这个“庞然大物”(其实毛驴并不比老虎大多少),换句话说,就是不知道对抗下的“支付”,开始有点怕这个家伙。可是长期共处,又不得不明确双方的地位,于是就进行试探,每次进一小步,直到摸到对方底牌“技止此耳”,老虎就吃掉了毛驴。这就是一个逐渐掌握信息,并在此基础上作出判断的过程。,孙子兵法》说:“兵者,诡道也。故能而示之不能,用而示之不用,近而示之远,远而示之近,利而诱之,乱而取之,实而备之,强而避之,怒而挠之,卑而骄之,佚而劳之,亲而离之。攻其无备,出其不意。” 大意是说:用兵打仗,离不开运用诡计。要让对方错误估计我方的实力,错误判断局势。用利益诱惑敌人,用扰乱削弱敌人;敌人有实力,我方要作好准备;敌人过于强大,我要避免作战;在作战中要使其激怒,使其骄傲,使其疲惫,使其分裂,这些都能削弱对方的判断力和战斗力。这样,我方的行动才能出乎对方意料,打击对方的薄弱之处。 显然,要实现“攻其无备,出其不意”的目的,一方面要掌握对方的真实信息,同时要防止对方掌握我方的真实信息。 启示:美军攻陷巴格达就是采用了这一战术。萨达姆的共和国卫队已经溃不成军,无法组织有效防御,可以说也是一个不得已的“空城计”。美军也不知道这里面有什么文章,于是就连续派出坦克分队试探进攻,几次以后,发现对方确实无力抵抗,于是将巴格达一举占领。,虚张声势” 在桥牌中,“叫约”是实力的体现,你有多大的牌,就可以叫多大的约。但这又带来一个问题:你的叫牌会给对手提供你这手牌的情报,比如你叫梅花三,对方就知道你的梅花很多,至少是个七张套,而且其中有大牌点。其反面的意思就是:你其他的牌可能不怎么样。如果他的牌也不错,就可能叫更高的约,占据主动打击你的弱点。由此可见,打牌其实从叫牌就开始了。双方都要通过叫牌争取定约,同时要尽可能地迷惑对手,使之错误判断。 我们已经知道,“博弈论”是由著名数学家诺曼创立的,而这个理论正是由一个典型的关于信息的游戏开始:那就是一个玩家在面对无懈可击的玩牌对手之时,是否要夸大其辞,并且次数又该多频繁。 诺曼的发现非常令人感到意外,他认为即使对手明知道你喜欢这样,有时候你还是应该这样。他研究了各类的牌戏战术,发现“虚张”的频率一到某个程度,胜数最多,打老实牌和“虚张”次数太多的胜数机会较少。另外他也发现,玩牌虚张的频率在某种标准可以赢钱,低于或高于某个标准,输钱的成分就比较大。 这不难理解,一个人如果适当地“吹牛”,别人就会信以为真,如果他玩得过了火,人们就会识破,而且,一旦获得了“吹牛者”的名声,那么他就成了那个大叫“狼来了”的孩子,再说什么也没用了。那么什么是“适度”呢?自然是不能过分夸张,如果一个小个子非要给人留下“斗士”的印象,结果只能是自取其辱。 虚张声势归根结底就是要藏好自己的底牌,并因此获得利益。这有两种情况:一是还有一定实力,通过迷惑对手,使之出现破绽,一击致命;二是没有什么实力,只靠大张旗鼓换取对方让步。总之,你要知道自己的目标,一切策略都是为此服务的。 还要注意:“虚张”也是双刃剑,弄得不好反会弄巧成拙。比如出虚张迷惑对手,却使同伴被误导。在生活中也是如此,吹牛使诈,是为了获得人们的拥戴,可是做过了头,反会使人反感,无端树敌。所以古人说:诈巧不如拙诚。这类手段不得不用,但是也不可常用。 关于信息博弈的故事会 一个古董商发现一个人用珍贵的茶碟做猫食碗,于是假装对这只猫十分喜爱,要从主人手里买下。猫主人不卖,为此古董商出了大价钱。成交之后,古董商装做不在意地说:“这个碟子它已经用惯了,就一块送给我吧。”猫主人不干了:“你知道用这个碟子,我已经卖出多少只猫了?” 这就是一个“信息博弈”的例子。古董商掌握“碟子是古董”这个信息,他认为猫主人不知道,这种“信息不对称”对他有利;可他万万没想到,猫主人不但知道,而且利用了他“认为对方不知道”的错误大赚了一笔。这才是真正的“信息不对称”。 信息不对称造成的劣势,几乎是每个人都要面临的困境。谁都不是全知全觉,那么怎么办? 首先,为了避免这样的困境,我们应该在行动之前,尽可能掌握有关信息。人类的知识、经验等,都是这样的“信息库”。当然,我们并不一定知道未来将会面对什么问题,但是你掌握的信息越多,正确决策的可能就越大。 再来看一个故事:有一个卖草帽的人,有一天,他叫卖归来,到路边的一棵大树旁打起瞌睡。等他醒来的时候,发现身边的帽子都不见了。抬头一看,树上有很多猴子,而且每一个猴子的头上都有顶草帽。他想到猴子喜欢模仿人的动作,于是就把自己头上的帽子拿下来,扔到地上;猴子也学着他,将帽子纷纷扔到地上。于是卖帽子的人捡起地上的帽子,回家去了。后来,他将此事告诉了他儿子和孙子。很多年之后,他的孙子继承了卖帽子的家业。有一天,他也在大树旁睡着了,而帽子也同样被猴子拿走了。孙子想到爷爷告诉自己的办法,他拿下帽子扔到地上。可是猴子非但没照着做,还把他扔下的帽子也捡走了,临走时还说:我爷爷早告诉我了,你这个老骗子会玩什么把戏。 有些信息可以在决策之前掌握,还有一些信息出现在决策的过程中,这就需要某些特殊素质了,比较聪明、敏锐的人可能在这个环节占据先机。 一个商人贴出告示,要招一个伙计。来了两个应征者,他们同样勤快,商人决定不下要哪一个,他希望店里的伙计要精明一些,于是就想了一个主意。 他把两人叫到里面,取出五顶帽子,两顶红的,三顶黑的,他要求他们蒙上眼睛后,三个人各取了一顶帽子戴上,他告诉他们:摘下眼罩后,谁先说出自己帽子的颜色,他就留下谁。 眼罩摘下,这两个人发现商人戴着一顶红帽子,两个人互相看了一眼,其中一个抢先说:“我的帽子是黑的。” 商人很满意,问他怎么知道的,他说:“你戴着一顶红的,如果我的也是红的,他一定知道自己是黑的,可他没有说,所以我知道,自己戴的也是黑色的。” 这是一个在决策中掌握信息并作出判断的例子,颇有博弈色彩。其实是对手的反应帮了他的忙。如果对手很聪明,就可能采取以下战术:不肯摘下眼罩,或根本不看对方,这么做似乎吃亏,其实正好相反。因为如果自己戴的是红帽子,无论知不知道对方帽子的颜色,他都会输;可是对方如果不能做出判断,那他就可以判断出自己戴的是黑帽子。 还有许多情况是,我们根本不能从他人或外界得到有用的信息,那么该怎么办呢? 有一个很著名的BF实验(所谓BF就是Bee和Fly,即蜜蜂和苍蝇):把几只蜜蜂和几只苍蝇装进一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗户,结果会怎样呢?你会看到,蜜蜂会不停地在瓶子底部寻找出口,直到累死为止,而苍蝇却在不到两分钟内全部逃出。蜜蜂为什么会灭亡呢?因为蜜蜂喜欢光亮而且有智力,于是它们坚定地认为,出口一定是在光线最亮的地方,于是它们不停地重复这一合乎逻辑的行动。而苍蝇呢?它们对于事物的逻辑并不在意,而是到处乱飞,探索任何可能出现的机会,于是它们成功了。 这件事说明,实验、试错、冒险、即兴发挥、迂回前进、混乱、随机应变,所有这些都有助于应付变化。人的理性和逻辑性容易使人在经济活动中陷于一个固定的认知模式中,从而一条道跑到底。经济活动要善于从已有的认知模式中跳出来。要有足够的学习能力——即探索未知领域的能力。 即使这些方法都不奏效,你至少还可以权衡利弊,作出合乎理性的决策——你仍有可能犯错,但不至于错得一塌糊涂。就如司马懿在“空城计”中的选择那样,放走了孔明固然遗憾,但是总比自己做了俘虏要好。 启示:在生活中,我们也会遇到这样的问题。比如一个乞丐向你乞讨,你愿意帮助别人,但你不知道他是真的需要帮助还是骗子,该如何决定呢?如果你喜欢与人为善,你可能就愿意冒一点上当的风险。这不等于你愚蠢,而是你认为,帮助一个困境中的人比回绝一个骗子更重要。 所罗门王断案 在社会经济活动中,人们常常隐蔽真实的信息。最典型的例子,是在市场里老是听到买东西的人埋怨东西太贵,较少听到买东西的人称赞东西便宜。同时,厂商又老是埋怨东西卖不出好价钱。在经济学家看来,对价钱的抱怨是自相矛盾的。如果嫌贵,你可以不买;如果嫌贱,你可以不卖。因为在市场上,人们不是用言词,而是用行动表示出他们的爱好。如果你自愿地同意做一笔交易,这说明你认为,虽说不是很理想,但是做这笔交易至少比不做这笔交易要好。虽然两块钱买一把菜你嫌贵,但是你还是认为用你那两块钱换回这一把菜是值得的,不然的话你可以不买,因为没有人强迫你。 至于谈判当中隐蔽自己的真实信息,常常还受到法律保护,不然怎么会有泄露经济情报罪和盗窃经济情报罪呢? 提取和甄别信息,是博弈论面对的大问题。引用很多的一个例子,是所罗门王断案的故事。两个女人为争夺一个孩子吵到所罗门王那里。一个女人说:“陛下,我和这妇人同住一个房间。我生了一个孩子,三天以后这妇人也生了一个孩子,房间里再没有别的人。夜里这妇人睡觉的时候,把自己的孩子压死了。她半夜醒来,趁我睡着,把我的孩子抱去,把她已经死了的孩子放在我的怀里。天亮要喂奶的时候,我才发现怀里的孩子是死的,仔细察看,并不是我生的孩子。”另一个女人赶紧说:“不对,活孩子是我的,死孩子才是她的。”吵得不可开交。 所罗门王喝令她们别吵,吩咐下人拿刀来,“如果她们还吵,就把孩子劈成两半,一半给这个妇人,一半给那个妇人”。一个女人赶紧说:“大王把孩子给那个妇人算了,万不可杀他。”另一个女人说:“这孩子既不归我,也不归她,劈了算了。”所罗门王知道心痛孩子的女人一定是孩子的亲生母亲,便吩咐下人把孩子给她。 这是获取和甄别信息的范例,直到现在,博弈论专家还在继续讨论和发掘所罗门王断案的故事。例如,以色列一位教授和美国一位教授最近合写的一篇论文,就把竞标一项工程的两个企业,看做是两个“妇人”,其中一个企业实力可靠,另一个企业只是想夺标以后赚取转包的利益。问题是如何设计规则和机制来获取和甄别信息。 破解“柠檬市场” 在美国的俚语中,“柠檬”是“次品”或者“不中用产品”的意思。20世纪60年代,经济学家阿克洛夫正是从旧车市场这一他眼中典型的“柠檬市场”分析和提炼出“信息不对称”的概念。 中国有“买的不如卖的精”的古训,足见中国人老早就洞悉了信息经济学的天机。可惜,没有一个中国人接着往下想这意味着什么,尤其是对于市场经济来说意味着什么。 阿克洛夫则不同,他把这问题继续往深里琢磨。这一琢磨不得了,他发现问题大了:由于买主卖主对于所要交易的“旧车”存在着信息不对称,买主通常不愿出高价,这样持有好车的卖主只好选择退出,市场上剩下的将都是坏车,买主则越来越不愿光顾,旧车市场最终将萎缩乃至完蛋。阿克洛夫的这一发现尤其是他提出的“信息不对称”的概念后来影响了一大批经济学家,大家又相继发现了许多个“柠檬市场”。比如,经济学家斯宾斯发现人才市场其实也是个“柠檬市场”:由于信息不对称,雇主愿意开出的是较低的工资,除了平庸的“柠檬”之外根本不能满足精英人才的需要,结果出现了劣币驱逐良币的现象。斯蒂格利茨发现信贷市场也是个“柠檬市场”:因为信息不对称,贷款人只好确定一个较高的利率,结果好的本份的企业退避三舍,而坏的压根就不想还贷的企业却像苍蝇逐臭一样蜂拥而至。这两位教授因此同阿克洛夫一同分享了诺贝尔经济学奖。 经济学家提炼出信息不对称的概念,挖出一批“柠檬市场”并解剖之是一大贡献;而提出改造世界的方案,设计出各种在信息不对称情况下保障市场有效运转的机制是另一大贡献,甚至可以认为是更大的贡献。 对于拍卖市场,我们通常想到的是,谁出价高交易物即给谁。可是你是否想到,拍卖人可能说“假话”。好比我本来愿意出10000元的,但只要第二名出8000元,我出8001元就能拿下来的话,我就不会报价10000元。如何让竞买者显示出真实的信息呢?维克瑞教授小试牛刀,运用信息经济学原理设计了一个新的拍卖机制。 让每个人把愿意出的价格写在纸上装入信封交给你,所有信封打开后,出价最高的人得到那件古董,但实际付的价格是第二位出价最高者的出价。在这个制度下,每个人都会如实地报告自己对古董的评价,因为出价多少只影响自己是否得到古董,而不影响在得到古董的情况下付多少钱。 比如说,设想有一个人的实际评价是10000元,如果他出价10000元,第二个最高出价是9900元,他得到100元的净剩余;相反,如果他出价9800元,他的净剩余是零,因为他什么也得不到。在维克瑞教授设计的机制下,说实话比不说实话好。这里,真实评价与实际支付的价格之间的差额变成了对说实话的奖励。 这样的拍卖机制不仅可以保证把被拍卖物卖给评价最高的人因而是最有效率的,同时也是在所有拍卖机制中卖者能得到最高收入的拍卖机制,这真是经济学梦寐以求的帕累托改进,是一种难得的皆大欢喜的制度安排。 启示:两只手表并不能告诉你更准确的时间,只会让你在两种不同的时间面前茫然无措。你要做的就是选择其中较可信赖的一只,尽力校准它,并以此作为你的标准,听从它的指导行事。记住尼采的话:如果你想过得幸运一些,你必须只采用一种判断准则而不要贪多,这样你会活得更容易些。,信用印章” 尽管我们可能在交易或博弈的过程中学习新的知识,但是如果只能这样“经一事,长一智”,那么交易的风险成本就太高了。一个缺乏互信的社会,任何事业的发展都是困难重重的。那么,能否通过某种制度安排,降低“信息不对称”的成本呢? 现在,“诚信”已经成为人们经常谈论的一个词,大家公认,信任的缺乏已经成了一个困扰中国市场经济发展的大问题。 为什么人们普遍认为“信任”与“被信任”很难呢?在此我们不必弹什么“人心不古”的老调,关键问题不是人的道德水平,而是制度安排。现在中国的市场经济刚刚起步,制度上有许多不完善之处,一些混乱难以避免。问题是如何尽快建立一套信用机制,规范人们的各种商业行为。 近代欧洲最伟大的思想家之一韦伯曾谈到过这样一件事:在他到美国北卡罗莱纳州访问期间,恰巧遇到位男子正在接受基督教的洗礼。有人告诉韦伯,这个人之所以要接受洗礼,是因为出于商业动机,他想在这个社区开银行。一旦接受了洗礼,他就会得到整个社区所有人的信任,而不论这些人是否真是基督徒。 韦伯进一步发现,想成为一个本地基督教会的成员,要经过非常严格的考察,要接受极为严密和细致的对自己过去行为的调查。因此,加入教会就会成为他道德水准的一个绝对保证。也就是说,一旦被洗礼了。此人的道德品质特别是与经商有关的品质,是经得起考验的,是完全可以信得过的。此人即使转移到其他地方,只要有教会的证明,就拥有了自身诚信的证明,无论走到哪里,人们都会相信你。 韦伯认为,加入一个社会团体就等于获得了一个社会印章。这枚印章是制度化的“印信”。它是以利益、合作、信用为基础的。应该说,一个人取得这枚印章是要付出足够努力的。而一旦有了这枚印章,就可以获得很多相关的利益。 这个例子告诉我们,一套有效的信用机制,可以大大降低人们的商业风险和成本,对社会、个人都大有好处。 信息就是权力 大家知道,知情权是人们重要的社会权利之一,即人民发布和接受信息的权利得到尊重和保护(当然要在法律的规范内)。为什么知情权如此重要?就是因为信息的传播有利于人们在掌握信息之后,通过理性选择,作出正确决定。这对社会和个人都有好处。 培根曾说:知识就是力量。的确如此,因此我们也可以说:信息就是权力。在专制时代,统治者维护自身权力的一个重要手段就是垄断信息。孔子说:民可使由之,不可使知之。大意是:你要引导人民该怎么做,但不要让他们知道为什么该这么做。 民众的知情权不是什么人赐予的,而是争取来的。不管怎样,现在我们接受信息的渠道更多了,信息也更多了。 可同样是现在,我们太轻易地放弃了这个来之不易的权利。我们一股脑接受来自各方面的片面信息,我们对事物的态度取决于电视上怎么说,至于它说的对不对,有什么根据,我们并不知道,或不感兴趣,“快告诉我谁是好人,谁是坏人。”我们就像孩子那样要求一个简单快捷的答案。 勒庞《乌合之众》中说:结论越是专断,语气越是肯定,对公众的影响力越大。因为公众不善推理,却很易受感染。他说:“群体因为夸大自己的感情因此他只会被极端的感情打动。希望感动群体的演说家,必须出言不逊,信誓旦旦。”根据他的观察,夸大其辞、言之凿凿、不断重复、绝对不以说理的方式证明任何事情,是说服群众的不二法门。他甚至尖锐地指出:“群众从来就没有渴望过真理,面对那些不合口味的证据,他们会充耳不闻……凡是能向他们提供幻觉的,都可以很容易地成为他们的主人;凡是让他们幻灭的,都会成为他们的牺牲品。” 对各种信息,我们需要选择:“拿来”还是“接受”?不同在于:“拿来”的才是你的,而“接受”的不是。即使是好东西,也不会为你所有。信邪教的官员、学者、大学生,他们的知识、信仰为什么不能保护他?就因为这些东西是别人“塞”给他的,他也习惯了被塞,既然你能塞给他知识,别人也能塞给他邪说。 启示:在渴望理想的心灵里,科学是有所欠缺的,因为它不敢作出过于慷慨的承诺,因为它不能撒谎。 要不要相信权威 当你无所适从时,你希望得到正确的指导。从人生设计、该不该和那个女孩结婚到填写足球彩票,都是如此。关于专家,有一句俏皮话:所谓专家,就是周旋于三宫六院间的太监,无所不知,却无能为力。大意是说专家的理论可以解释一切,却没有多少实用价值。 权威也会犯错,但是还是对的时候多(否则他就不是权威了)。权威因为拥有更多信息、更强的处理信息的能力,所以他们的意见可能比普通人更有价值。但是并不一定正确,因为即使权威也不可能全知全觉。这里有一个概率问题:好比某人获胜的概率较大,并不等于胜利已经属于他。 权威只是某一方面的,一旦超出了他所擅长的范围,他的意见并不一定比别人高明,可是我们时常忘了这一点。好多大人物就是因为在自己并不擅长的领域轻率发言而蒙受羞辱。“大跃进”时代,一位权威科学家撰文证明“亩产万斤”是完全可能的。即使是出于真诚,这位科学家的发言也是极不负责任的,他在自己并不了解的领域发言,可其他人并不知道在这方面,他懂得并不比别人多。 在决定要不要听专家意见时,你还要弄明白:这个问题有标准答案吗?如果你问怎样造一架飞机,一个技术权威会给你最有用的忠告;可是如果你的问题是哪个队能获得世界杯,你在专家那里得到的就只是一个参考意见。上次世界杯,一半专家看好法国队,可是这个上届冠军在小组赛就被淘汰了。 权威不是神,他只是比我们有更多知识或更深的理解。但他也必须依靠足够的信息、条件来作判断,如果条件是不充分的,也就可能出错。即使条件充分,如果我们对事物的理解不充分,他一样可能犯错。权威明智吗?他是否知道自己的限制?这正是自信和武断的区别所在。 爱因斯坦曾说过一句名言:他不相信上帝在掷色子。他认为在无序运动背后,一定有某种规律。他用后半生寻找这个规律,却一无所获。当时很多顶级科学家都很为他惋惜,但都保持了对他的尊敬。因为爱因斯坦是以严谨的科学精神进行研究的。试想:如果他利用自己的名望,提出某种大而无当的理论,又会让多少人迷惑? 启示:权威:使人信服的力量和威望;在某种范围里最有威望、地位的人或事物。 怀疑是权利的保证 在一个充满了轻信的社会(可以想像甚至包括名牌大学的教授)中,如何让这种批判性思维方法更广泛更深刻地传播? 买二手电脑时,你当然想相信经销商说的“价廉物美”,但你会对此持怀疑态度。你必须了解一些电脑方面的知识,可能弄得经销商对你有意见,这很有点令人不快。除了这些你可能会发现经销商有隐瞒真相的动机,也曾听到别人的一些类似情况,因此你检查一下外观,打开电脑试着操作一下,问一些刨根问底的问题。你甚至带一个内行的朋友去。你懂得一定的怀疑是必要的,也知道为什么。买旧货时总会有一点不友好的冲突,没人会宣称这是一种特别愉快的经历,如果你不提出一点点怀疑,如果你绝对地无限度地轻信,日后必然付出惨重代价。那时你会希望早些时候要是多些怀疑就好了。 怀疑主义的原则不需要必须用高深的知识水平去掌握。对任何事物持怀疑主义态度的完整的思想是,每个人都应该具备能够对任何“科学成果”进行有效的和有益的评价所必不可少的工具。完整全面的科学提出的要求是,所有的公民在日常生活中都能运用普遍水平的怀疑主义精神。当我们购买二手电脑时,当我们根据电视商业广告判断产品的质量时,我们要采取怀疑的态度。 但是,怀疑的工具对我们社会的公民来说,经常普遍丧失其效力。尽管在日常生活中各种令人失望的事情使人们随即不断萌发出怀疑主义的精神,但是,在学校中根本就没有提起过有关内容,甚至科学在展现其成果(最令人失望的表现者)时也没有这种精神的体现。我们的政治、经济、宣传都被淹没在轻易相信、盲目服从的汪洋大海之中。那些有东西要卖的人、希望影响公众舆论的人、大权在握的人,将会在阻止怀疑精神的发展中获得好处。 从前面的讨论中,我们已经了解:获得信息、并正确利用信息,是做出合理决策的保证之一。作为个人,要学会思考;作为社会,要鼓励(至少是允许)人民思考。这样才是双赢。 一个富于创新精神的高中社会科学课教师是这样让学生们理解美国宪法的:他不是照本宣科地给学生读宪法,也不是塞给他们一些“价值”、“意义”、“地位”之类的概念,而是安排了一场“制宪会议”:学生两人一组代表一个州,参加制宪会议。并事先向这13个小组就他们所代表的州或地区的特殊利益作简要的指点。比如南卡罗莱那的代表将被告知棉花的重要性,奴隶贸易的必要性和合理性,工业化的北方所造成的威胁,等等诸如此类。 13个代表团聚集在一起,教员给予些指点,但主要是依靠他们自己,经过几个星期写下了一部宪法。然后他们读真正的宪法,并对两部宪法的相同和不同之处进行讨论。这样做需要教师做更多的准备,学生做更多的工作,但这次经历是令人难以忘怀的。 试想:如果每个公民都经历过这样的训练,一定有助于加深对政治的理解,并能够更理性地行使自己的政治权利。 启示:群兽之王狮子生病了,它传令它的“臣民”们都应该派遣使者来探病,否则就要给予严厉的制裁。动物们虽然都觉得有点不安,却没有违抗狮子命令的勇气,也没有去确认其他动物在探望之后的下落,轮到自己时都理所当然似的前往探视。狐狸发现了其中的秘密。它来到狮子洞外,很恭敬地问狮子身体如何。狮子说:“我没什么事,请进来和我聊一聊吧。”狐狸回答说:“不,我有些害怕,我发现这里有许多进洞的足迹,却没有一个出洞的。”这个故事是说,根据迹象预见到危险的人,能够避开危险。
第8章 约会游戏拥有信息可以帮助你作出正确决策,但不能保证你作出正确决策。要实现这一点,你必须有合适的策略。 别无选择与选择的烦恼 有这样一个笑话,夏娃对亚当说:“亲爱的,你是全心全意爱我的吗?” 亚当叹了口气:“当然了。除了你,我还能有什么选择呢?” 经济学中有一个名词“霍布斯的选择”,据说这个名词来自中世纪英国一位叫霍布斯的马场老板。无论谁来买马,他都答应,但是每次他只卖最靠近门口的那匹马,不允许挑三拣四。于是“霍布斯的选择”其实就是“没有选择”的好听一点的说法。 在商业竞争不发达的社会,“霍布斯的选择”很多见,比如多年前中国人单调的服装样式,或几年前昂贵的电话初装费。这种烦恼叫每个人头疼,又没什么办法,这毕竟不是我们个人所能改变的。 随着竞争的发展,这种烦恼较过去大大减少了。可是另外的烦恼又找上来:太多的选择叫人眼花缭乱。当然,这总比没有选择要好多了,可是要从诸多选择中找到最优结果也并非易事。 如果选择只是限于买什么样的衣服,或选择吃牛肉面还是麦当劳之类的小问题倒也无关紧要,可是小至人生道路的选择,企业经营战略的设定,大至国家的大政方针,都有一个最佳策略的问题。这也正是为什么人们对此如此关注的原因。如果别无选择,你也只能这样走下去,正如亚当只能爱夏娃一样。这个结果也许并不理想,但至少你知道自己没做错什么。一旦你有了选择的权利,责任也就随之而来:如果结果不好,只能说你做得不对。 每个人都希望有选择,而且希望作出正确选择——即使不是最好的,至少也是比较好的,那么有没有一些方法帮助我们呢? 启示:不要坐失机会,当时机把有头发的头伸出来而没有人去抓时,回头它便会伸出一个秃头来。——沙士比亚 众里寻他千百度 现在来看“约会游戏”:假定你是个女性,决定要结婚,你身边社交圈里有100个合适的单身男子都有意追求你,你的任务就是,从他们当中挑选最好的一位作为结婚对象。但要从这100个里面选出最好的一个并非易事,你该怎么做才能争取到这个结果? 首先你想到的是和这100个人都接触一遍,了解每个人的情况,将各项素质分别打分,说不定还要列出图表,经过对比筛选,找出那个最优秀的人。 可惜在这个游戏中,条件是严格限定的:每个人你只能约会一次,而且只能当场决定选择还是放弃,不能把他们“冷冻”起来作为后备,一旦你选择了其中一个,你就没有机会再约会别人了。这些条件似乎有点苛刻,其实在生活中,大多数情况下机会是不等人的,等你左挑右选,把一切都规划好了,人家可能早就成了别人的如意郎君。所以说,这样限制是有道理的。 要从一篮苹果当中挑出一颗最好的,一个个比较是最佳法则,因为每一个都可能是最好的,也可能是最差的。所以你得开始约会——还有什么更好的方式可以用来检验这些人吗?但是约会和选苹果是不一样的,挑选苹果可以把两颗拿起来比一比,可是正如我们已经说明的,在这个游戏当中一次只能跟一个候选人约会,每次约会后就必须立刻决定这个人有没有可能是最好的一个,虽然有很多人你还没约会过。一旦某位幸运的男士中选,你就不再约会(当然这只是游戏,现实生活中并不一定如此)。 还有一个游戏规则必须遵守,约会之后一旦你决定淘汰这个人,他就永远出局了。你可以假设他娶了别人、或者心灰意冷出家当了和尚、甚至跳下断崖一死了之。重点就是你不能和每个候选者约会后,再把他们贴上排名的标签,收藏在仓库的架子上,最后才从里面挑最好的一个,也就是你不可以把所有的候选人当货物一般存起来。统计学家称这种一边搜集资料一边做决定的决策过程为运次决策。 这类情况在临床实验上屡见不鲜,例如给这群病患极有潜力的新药,给另外一群病患无伤害性也无治疗效果的安慰剂。实验人员必须随时在发现药物有效时立即提供给对照组;当药物出现伤害时,立刻让实验组停止服药。一有结果实验就必须立刻停止。同样地,除非约会的快乐对你而言高过对婚姻的憧憬(那可就另当别论了),否则你也必须停止不断的约会。 问题其实很简单,你希望选到最佳伴侣,但是又该如何在既定的规则下,将找到理想对象的几率极大化呢?如果太早结束约会生涯,就等于放弃了在那群还没约会的对象中,找到一个比现在更好伴侣的机会,仓促的婚姻将使你终生悔恨。匆匆结婚后的漫长悔恨,这种事在现实生活中并不少见。不过,话说回来,如果你等得太久,最好的那个又可能已经从指间溜走,要补救也来不及了,这种事在现实生活中也是经常发生的。这两种悲剧都是歌曲、诗词和小说常见的主题。 启示:两个贫苦的樵夫在山上发现了两大包棉花,两人各背了一包赶路回家。途中,一名樵夫看到山路上有一大捆上等麻布,便和同伴商量,改背麻布回家,同伴怕枉费辛劳,不愿换麻布。发现麻布的樵夫只得一个人背麻布了。走着走着,背麻布的樵夫竟然发现林中散落着数罐黄金,便赶忙邀同伴来挑黄金。他的同伴仍是那套以免枉费辛苦的论调,并且怀疑那些黄金不是真的,发现黄金的樵夫只好自己挑了。快到山下时,天无缘无故地下了一场大雨,背棉花的樵夫肩上的大包棉花吸饱了雨水,重得无法再背,那樵夫只好空着手和挑金的同伴回家去。面对机会的来临,人们有许多不同的选择方式,每次正确无误的选择都将指引你走在通往成功的坦途上。 别选第一个碰到的人 那么到底什么是赢的策略呢?赢的策略就是能够给你最大成功机会的策略。纵使无法100%肯定,但是你知道自己要的就是最大的成功机会。那么这个游戏就变得很简单了,因为你知道你要的是什么,一切透明化,只要靠自己就可以独立完成命运攸关的决定,也就是把选择的过程最适化即可。 说了这么多,到底最好的选择方式存不存在呢? 当然是存在。虽然这种方式不能给你最肯定的答案,但是绝对可以增加达成目标的机会,这和买彩票不一样,无论你花费多少心思买彩票,结果都取决于运气。而在这个游戏中,只要你策略对头,就能取得不错的成果。现在就来场沙盘推演吧。 显然,你不应该选择第一个遇到的人,因为他在100个当中名列第一的机会只有1%。这个几率可以说是非常的渺茫,直接把筹码放在第一个人身上,也是最糟的赌注。同样地,第二个人、第三个人,甚至后面的人,情况都一样,每个人都只有1%的机会可以成为100个人当中的第一名。如果你真心想要找到最好的,就不应该随机选择。 但是这里有一个问题:假如你约会的头一个碰巧是最好的那个呢?你把他淘汰掉了,以后约会的对象“一蟹不如一蟹”,岂不是遗恨终生吗?在我们身边,确实有些夫妻是初恋情人,而且似乎过得也不错。但是这里我们谈的是策略,而不是命运或缘分,只要你不是十分迷信,就一定会承认,与其把自己的未来交给或然率,还不如自己掌握更好些。 刚刚说过,你不应该选择第一个出现的对象,因为第一次约会就碰到最佳伴侣的机会微乎其微,只有1%。即使这个人真的很优秀,你也要忍痛割爱,因为你不知道在这100人里,他到底排在什么位置。 再次声明:这只是个游戏,如果你在现实生活里找对象不必如此。因为在游戏中,这位女性对这100人原来一无所知,而在生活中,即使没谈过恋爱,你对异性也有很多了解,例如你的父兄、亲属、朋友、同学等等,在很大程度上,你已经知道什么样的男人可以交往,什么样的不能。也就是说,你心中早已有了一个标准,这和游戏中假设的不同。所以如果你在现实里遇到一个好男人,你应该把他留下,而且你们只要还没结婚,“骑马找马”也不能算不道德。 牺牲者与实验品 好了,现在切入正题,讨论选择策略。一个最有效的方法是:将第一组人(比如说先取10名)作为试验品,就好像在糖果店或面包店里的试吃品一样,之后如果遇到比这组人更好的对象,就可以考虑嫁给他了。这个方法既可以在候选人之间作比较,同时也不会与现实太过脱节。你可以在日记里给每个约会对象评分,以10分为满分,当分数高于前10人的对象出现时,他就是最后的赢家。你要做的就是从前10个人当中获取一些经验,作为评估他人的基础,所谓约会其实就是这么一回事。 值得注意的是,运用上述策略时,有两种情况会使你损失惨重。第一,如果前10名刚好是全部里面最糟的,碰巧下一个又是倒数第11名,那就算你倒霉了,你将面临一个相当坏的选择,虽然不是最坏,不过也够糟的了,并错失选择最好的机会。因为既然这个倒数第11名已经比前10个都要来得好,依照上面的决策模式,选择他是不会错的,可是其实首选对象仍在苦苦地等待着你,只不过你还处于约会初期,绝不会知道这点。这就像是成天在一群奇怪的人周围打转,和这些人相处的经验将扭曲你对正常人的印象。 第二种状况正好相反,就是最好的选择恰好已经在前10个当中,导致你设了一个永远无法达到的高标准,在未来的约会中不可能再遇到和他们一样好的,最后只好在所有机会都出现后选择第100个。而这第100名顶多只是中等标准。那么,终其一生,你将幻想着,要不是放弃了那一个人,结果就会如何如何。采行这个策略有大输、大赢的机会。我们不难解释在运用此一策略的情况下,你将有1/4赢的机会,也就是与最优秀的人结婚的几率达25%。这当然比随机选择好得多,但还没有十足的把握。因此,接下来,你得决定排名第l、第3,或第5的次佳选择。 那么是不是还有更好的决策呢?当然,在这个案例中,由于你只从100个候选人当中取了10个样本,而最佳选择刚好在样本中的机会只有1/10,因此第二种错误(也就是让最佳选择从手中溜走)的发生机会相当小。所以,在此类错误风险不高的情况下,也许你会愿意提高抽样的数目,这样就有更多的经验来增加自己的判断能力。因此如果运用相同的策略,但是将样本数改为20,那又会如何?如此一来,虽然最佳选择从手中溜走的机会将会从1/10增加到1/5,但也会大大降低设立过低标准的可能。这是一种交换条件,如果有一边更好,另一边就会更糟。那么如果抽样数目是30,甚至40,又会如何? 说了这么多,你可能已经明白了一点:这是一个两难选择,如果你抽取的“样本”太少,你得出的结论可能并不准确;可是如果你取样太多,结论倒是准确了,可是又很有可能错失最佳选择(他正好在取样里,被牺牲掉了)。那么,在这样的选择中,有没有个最佳样本数的存在?如果有,那么该是多少? 启示:有四样东西一去不复返:说过的话、泼出去的水、虚度的年华和错过的机会。永远没有绝对完美的事,最大的问题在于:你是否能够对你的冒险衷心说“是”! 哲学大师的训诫 有趣的是,古希腊哲学大师苏格拉底也遇到过这样的问题,而他的答案与现代的策略专家不谋而合。 苏格拉底的三个弟子曾向老师求教:怎样才能找到理想的伴侣?苏格拉底没有直接回答,而是把他们带到一块麦田,要求他们沿着田埂直线前进,不许后退,而且仅给一次机会选摘一枝最大的麦穗。 第一个弟子走几步看见一枝又大又漂亮的麦穗,高兴地摘下了。但是他继续前进时,发现前面有许多比他摘的那枝大,只得遗憾地走完了全程。第二个弟子吸取了教训,每当他要摘时,总是提醒自己,后面还有更好的。当他快到终点时才发现,机会全错过了,只好将就着摘了一个。第三个弟子吸取了前两位教训,当他走到1/3时,即分出大、中、小三类,再走1/3时验证是否正确,等到最后1/3时,他选择了属于大类中的一枝美丽的麦穗。虽说,这不一定是最大最美的那一枝,但他满意地走完了全程——因为他知道,自己已经尽可能争取到最好的结果了。 注意那个结果最好的弟子的策略:1/3。为什么这是一个比较理想的比例呢? 事实证明,选择最佳对象的最好搜寻策略,就是在冷静地比较若干样本后,选择下一个高于他们全体的那一个,称为约会比率与等待流程。失去最佳选择的风险约有1/3,但是你已经竭尽所能了,而且你还有大约1/3的机会在100个当中挑中最想要的那一个。其实当你在100个人当中挑选时,1/3的机会已经算是不错的了(坦白说,1/3其实并不怎么准确,不过在现实生活的决策里,要精准到小数点以下第6位似乎不太有意义)。所以相同的逻辑也可以套用到选择上。 明确你的动机 但稍等一下,先回顾那些已经确认的因素。你到底是不是确定你的动机和企图?你是不是真的一定要从那100个对象中挑出最好的下一个? 但是追求最好选择也是有缺点的。如果最好的候选人就在你抽取的样本之中,你就必须嫁给100个里面最后和你约会的人(尽管是压箱货,却未必是最差的)。在这个游戏中他可能选平均水准,但是在现实生活中,由于别人也在追逐之中,因此这家伙可能就没这么好了。所以,你有1/3的机会挑中最好的对象,至于挑到平庸之才,甚至水准以下对象的机会也一样约各1/3。这种情况就好像是在网球比赛中尝试发球得分一样。 所以,再回到那个仅容许约会10次的方式,并作进一步的讨论。由于最佳人选在第一群人里面的几率只有1/10,因此他还有90%的机会留在尚未和你约会的那90个人当中。惟一不能保证你和他结合的因素,就是当2号人选刚好也在那10个人之外,使你在和最佳人选相遇前,就选了第2号。这是因为既然他们两人都比前面10个人来得理想,那么根据游戏规则,不管你先跟谁约会,你都会选择先出现的那一位。事实上,第3、第4人选在那10个人之外的几率也是一样的。因此,婚前约会次数太少将会降低你和最佳人选擦身而过的机会,却也会增加你跳过最佳人选而选择次佳者的机会。但是这种结果真的这么差吗?这就要看你在100人当中若只选中次佳人选时会不会自怨自艾了好像有一点儿自负,是不是? 现在,我们知道为什么要明确动机了。如果你的动机就是找到最好的那个人,你就不得不承认现实:没有一个策略可以保证实现这个目标。 规避风险的决策 也许我们应该保守一点来玩这个游戏,运用同样的规则,但追求不同的目标。换句话说,不把追求最佳人选作为最大目标,而是设法避免挑到最差的人选,这就称为规避风险。也就是说,在赌博的时候(你的确是在赌博,只不过不是用一般的筹码),你应该设法减少损失而不是一味追求高利润的报酬。就像赌马挑品种比较好的马,就是为了规避风险。在这样的前提下,你的策略又会有什么转变呢? 确定这个前提后,就算你认为挑中次佳人选并不可悲,你也不必为了简化约会过程,而将约会人数从36个人降到10个人。比较好的做法是,把前30个人当做样本,然后跟前面的做法一样,挑选下一个比他们更好的对象。这样虽然挑到最佳人选的机会稍微降低,但是仍有高于50%的机会挑到最佳或是次佳人选。更不必到约会终了,甚至在咽下最后一口气时选。这样做是比较合理的,依此类推,如果你认为这100个人里面的前5名都可以接受,那你只需要20个样本,这样你就有70%的机会可以找到前5名的对象,也就是说,只要动动脑筋,就有将近3:1的几率可以遇到100个人当中的前5名。 这种比较保守的策略并不会降低挑中最佳人选的机会,只是把比率从37%降到33%,下降的幅度甚至很难察觉得出来。你只要放弃一点点获得最大奖的机会,就能大大提高平均成果,也把找不到合适对象的几率降低了50%。 这个游戏有许多不同的可行策略,最适合你的策略(应该作为个人决策的指导原则),就看你的目标订得有多清楚。你可以说我只要最佳人选,这是第一种策略,但也必须接受可能会败得很惨的事实。或者,你可以稍微降低一下标准来减少损失。总之,你必须事先搞清楚自己到底要找什么样的对象。因为对于每一组清楚确认的目标而言,其相对应的策略都有不同的约会比率与等待过程。这一点应该并不意外,因为每个人在日常生活中都是这么做的。 很抱歉,鱼与熊掌就是不能兼得,所以对自己的目标就要订得实际一点(肥皂剧和电视广告都教你要追求最好的,但对于重要的事情来说,这是很差的决策原则。说起来,追求卓越的心态是许多已经不错的人的头号敌人)。实际上边学可以边调整目标,根据经验和资源来调高或降低你的标准。多数人都可以靠直觉来调整目标,这就是所谓的动态策略,只要能够明确说出想要什么,就一定有办法达成愿望。当然没有事情是100%肯定的,《圣经》上有“跑在前头的未必赢”的话,但是可能你也会同意戴门·朗尼思所说的:跑在前头的人未必赢,但是他还是你该下注的对象。 启示:坚信自己和自己的力量,这是件大好事,尤其是建立在牢固的知识和经验基础上的自信。但如果没有这一点,它就有变为高傲自大和无根据过分自恃的危险。——伏龙芝 女王选夫与最优策略 现在再来看一个“女王选夫”的故事:话说有一个女人当政的国家,女王想要选择一个丈夫。于是她找来两个大臣,让他们去各地寻找。 大臣们各找回一个候选者,分别是A和B,为了衡量这两人的实力,他们还为候选者的各项素质(健康、智慧、容貌、口才、才能、门第、声誉)分别打分,假定打分十分公平,是否能够选出最佳的一个呢? 现在假设,A的总分比B高,似乎选他是正确的。可是B也有优势,在7项素质中,他有4项超过了A,1项打成平手,只有两项落后,就综合实力来说,他似乎更为合适。 谁更合适?其实,问题应该是哪种策略(总分决胜还是“素质比较”)更合适。由此我们也可以看出,要找出“最佳人选”多么难(如果不是不可能)。 当然,还可以有别的办法,比如女王亲自体验一下,根据自己的感觉决定。但是这个办法也有风险,有些人就是中看不中用,刚一接触使人如沐春风,可是时间一长就觉得面目可憎。感觉总是不太可靠的。 还有一个办法就是看女王究竟最看重哪个素质,比如女王只希望那个丈夫生龙活虎,那么智慧云云就不那么重要了。这倒让我们想起一个笑话:老板要招聘一位女秘书,人事经理对几位候选人做了细致缜密的测试,并对每个人的素质作出评价,拿给老板请他定夺。老板说:“要那个金发美腿的!” 比较合理的策略可能是将各种策略综合起来,比如先画定一个及格线,在这个及格线上选择某种素质最突出的;或者掉过来,选择总分高,同时某个素质也不太差的。这样结果虽然不一定最好,但一定很不错。 在我们面对选择时,决策的核心并不在于结果的最优,而是决策过程的最优化,只要你的策略合理,结果当然也不会差。 不要指望最好结果 我们都希望找到最好的那一个,但是如果你把这作为惟一目标,你可能得不偿失。 一个最重要的理由是:你很难找到一种方法来保证实现这一理想。人不是机器,不能用“型号”、“运算速度”、“行业标准”之类的东西衡量,人比任何机器都复杂得多。你也许会想到考试这种方式,其实你的考题出得很不错,也只能反映某些素质,更不必说还有纸上谈兵和口是心非之类的不确定因素。 按图索骥也是人们常犯的毛病,好多少男少女正是以心目中的偶像(通常是浪漫影视和大众媒体营造出的不真实的形象)作为择偶标准。这种标准至少有两个问题:其一是似乎认为人也像某种高档商品,是可以批量生产的;其二就更糟糕:如果真的享受不到,就弄个假货自欺欺人。当然,我们都希望得到高标准的,但如果你不学会降格以求,恐怕只能孤独下去。 时间不会倒流,机会往往也是如此。如果你的标准过于苛刻,就会丧失许多本来可以抓住的机会。你一定听过这个故事:女儿年龄渐大,还是不肯结婚,父亲很是着急。女儿不以为然,说:“没关系,海里的鱼还多着呢。”父亲回答:“可是鱼饵放得太久,就没有味道了。” 在爱情问题上有许多神话,人们炮制这些神话的初衷是好的,但是如果你信以为真,结果可能就不是好的了。最典型的一个神话就是所谓“另一半”:这世界上的男男女女都只是半身人,每个人都有属于自己的另一半,而我们恋爱的目的就是要找到那个“另一半”。这说法挺叫人感动,但于事无补。它的意思是:有(而且只有)一个最佳答案。姑且先承认这一点,可是世界上和你年龄相仿的女人或男人有好几亿,而你所能接触到的不过一二百人,指望从这个小的范围找到那个“正确答案”,可能性约等于买一张彩票即中大奖的概率。如果某人把改善命运的希望完全寄托在中彩票上,我们会认为此人精神出了问题,在爱情上,道理也是一样。 其实,无论是选择爱情也好,工作也好,人生道路也好,“正确答案”只在理论上存在。与其在这上面纠缠不清,不如通过理性的态度,选择合理的策略,争取一个较好的结果。 启示:爱情不是用眼睛,而是用心灵看的,所以长翅膀的爱神被画成瞎子。一旦爱情丧失,我们就能察见所有的缺点了。
  第9章 美女还是才虎
概率是生活的真正指南,但是我们对这一指南有着太多的似是而非的误解。在听任命运摆布之外,我们是否还有更好的选择?
美女还是老虎
在许多决策的问题里,决策者必须单凭些片面的信息,甚至没有任何信息的情况下,从好几个选择方案中挑选其中之一,这个时候,就不得不乞灵于运气了——或更准确地说,听命于概率的拨弄。那么在这种情况下,还有没有什么更可取的策略?
先来看一个著名的故事《美女还是老虎》。
从前有个国王,在惩罚罪犯时有个古怪的习惯:把罪犯送进竞技场,竞技场的一端有两扇一模一样的门,门后分别关着一只凶猛的老虎和一位美女。国王惩罚犯人的方式就是让他自己挑一扇门,如果他选中老虎,那么后果可想而知;如果选中少女,他不但可以马上获释,还可以抱得美人归。
一天,他发现有位英俊潇洒的臣子与公主私通,一怒之下,也把这个青年送到竞技场,处以传统的惩罚。事前,公主已经知道哪扇门背后藏的是什么,于是相当苦恼,不知该把爱人送入虎口,还是送到另一个女人的怀抱?
当命运攸关的这一天到临时,在别无选择的情况下,这位臣子在竞技场上望了公主一眼,公主示意他选择右边那扇门,他打开门……故事就到此为止。只把一个悬念留给我们:他遇到的是美女还是老虎?
如果你对佛理有一点兴趣,你可以说“美女就是老虎,老虎就是美女”之类的漂亮话;如果你对动物学有一点兴趣,你可能说“大多数老虎并不吃人”。可是假如你自己陷入了那个境地,可就没有开玩笑的心情了。两种选择的结果好坏是明摆着的,可是指导我们选择的信息却很少,而且不可靠。除了碰运气,我们还有没有更好的机会呢?
概率改变了吗
有一名囚犯得到一个消息:目前被囚禁的三名犯人中,有两位将在隔天获释。这名囚犯非常高兴,同时一位和他相处不错的狱卒也证实了这项消息,而且狱卒甚至连释放名单都知道,只是由于纪律所限,他不方便告诉囚犯他是否在名单里。
这名囚犯(暂时称呼他为甲,另外两名则分别为乙与丙)很清楚他获释的机会是2/3,也可以理解他想知道更多消息的那份急切,他想着该用什么方法来得到进一步信息。当然最简单的方法就是直接询问狱卒,他想:既然乙与丙其中有一人会获释,不管自己是否有机会出去,他还是可以向狱卒打听另一个获释人的名字。
不过他也担心这么直接会降低获释的机会。他想:如果狱卒说乙将获释,那就会占去其中一个名额,换句话说另一个不是自己就是丙,那么对他来说,这就是个对等赌局,他与丙谁也占不到便宜。这么一问,就把获释的几率从2/3降到了1/2,于是他决定不问。试问这个决定合理吗?
著名的统计学家莫斯得勒把这个问题收录在他的畅销书《50个具有挑战性的概率问题与解答》中,并在书中表示:“在读者写给我的信当中,这个问题引起最多的回响。”莫斯得勒的回答是:没有,甲并没有因为问了狱卒而降低获释机率,不论询问前,或是询问后,获释的概率都维持在2/3。
在此暂不重述他的论证,先来看看最近一个类似且熟悉的问题,然后再回过头来,处理论证的部分,这个问题是杂志专栏作家赛凡特女士创出来的,问题里的逻辑困境和前面的囚犯问题完全相同。
要不要改变选择
这个问题可称之为“选择的转换”:你出现在一个游戏节目里,主持人指出标有l、2、3的三道门给你,而且明确告诉你,其中两扇门背后是山羊,另一扇门后则有名牌轿车,你要从三个门里选择一个,并可以获得所选门后的奖品。当然你希望自己选中的是汽车而非山羊。既然是三选一,很清楚,你选中汽车的机会就是1/3。
在没有任何信息帮助的情况下,你选了一个(比如1号门),这没有什么对与不对,完全是运气问题。但主持人并没有立刻打开1号门,而是打开了3号,门后出现的是一只羊。然后主持人问你:是否要改变主意选2号门?现在这就是个决策问题了:改还是不改。想一想吧!
赛氏的想法大致如下:如果你选了l号门,你就有1/3的机会获得一辆轿车,但也有2/3的机会,车子是在另外两扇门后。接着好心的主持人让你确定车子确实不在3号门后,不过l号门有车子的几率还是维持不变,而2号门后有车子的几率变成2/3。实际上,3号门的几率转移到了2号门上,所以你当然应该改选。
跟莫斯得勒的读者对囚犯问题的热烈反应一样,赛凡特的游戏也引来数以千计的读者来信,读者多半是认为她的推论是错的,主张1、2号门应该有相同的几率,采用的也多半是囚犯的算法,因为你已经把选择变成2选1,也不知道哪扇门背后有车,因此几率应该跟丢掷铜板一样。有趣的是,赛凡特又提供一项有用的资讯:一般大众的来信里,有90%认为她是错的,而从大学寄来的信里,只有60%反对她的意见,在后续的发展里,一些统计博士加入自己的意见与信念,且多半认为几率应该是1/2。赛凡特显然很惊讶这个问题所引发的热潮及反对声浪,不过她仍坚持己见。
统计学家从过去到今天都一直在寻求上述问题的答案,其实再简单不过,每个人都可以理解,也可以亲自验证,在此可以来模拟一下:用3张盖起来的牌当作门,一张A,两张鬼牌,分别当作车子和山羊,连玩个十几次看看。很快就可以发现换牌是比较有利的,就和赛凡特说的一样。那为什么这些专家还争吵不休,究竟在3号门出现山羊后,l、2号门的几率变成相等又有什么问题?或者是不是所有游戏者都有某些未言明的假设,即使用扑克牌模拟也是如此?
启示:做出和你的需要相反的选择,将使你打个根本没必要去打的仗。
我对,你也对
令人惊奇的是,尽管双方结论完全相反,却都是对的,这也有个小故事。所罗门王有则趣事,两位邻人在国王面前争论,每一位述说完毕,国王就说:“你对!”刚好一位路过的律师听到了,就质问国王:“怎么可能两个人都对?”于是国王回答:“嗯,你说得也对!”
在上述的谜题里确实藏有一个未知资讯,所有的参与者,包括赛凡特,都对该资讯做了不自觉的假设,多数人甚至不知道有这个未知资讯,由于两派都认为自己的假设清楚明白,因此应该都没有意识它们只是假设而已。
现在也谈够谜题了,该来看看到底出了什么问题?究竟游戏者该不该换?任何决策问题的最佳解决之道就是先厘清有哪些决策方案,现在所面对的是1、2、3号门后有一辆车,游戏本身没有其他特殊限制,因此大可假设这是一个公平游戏,所以初始几率,一如前述,每个门都是1/3,到目前为止都没问题。
现在游戏者,就是你,选了l号门,到这儿也没有什么问题,因为你一无所知,所以猜对的几率是1/3。
好玩部分开始了,因为主持人打开了3号门,而没有人问他为什么要开3号门。这儿有几种可能性,主持人的选择所传达的讯息跟你对主持人心里那把尺的了解有关,这一点到目前还是未知。主持人可能只想玩玩票,只要游戏者选1号,他就一定开3号门,不管3号门后是不是车,如果刚好出现羊,那运气不错;如果是车,那么游戏就告一段落,你就输了。如果主持人真是这么想,那么3号门后不是车,对你来说确实是一项新资讯,这时车子出现的可能就是l号或2号门其中之一,两者间没有特别偏好,主持人并没有给你换门的好理由,也没有提供让你维持原案的原因。多数赛凡特的反对者都相信在这样的情形下,几率是均等的,却全然不知他们已经对主持人的策略做了假设。甚至也根本不知道自己已经做了假设,不过他们都很肯定自己是对的。
不过,如果主持人并没有玩票,而自有另一套规则,他心里知道绝不能打开有车子的那扇门,因为这会破坏游戏者作决策的悬疑气氛,提早结束游戏,使观众失去兴趣,服务于娱乐事业的主持人,想吸引观众应该是很合理的猜测。因此,如果主持人的策略是绝对不去开有车的那扇门,那么如果你一开始就选对了,他就可以随他高兴开2号门或3号门;如果你一开始就选错了,那么他就会开没有车子的那扇门。因此无论如何,他开的那扇门后一定是头山羊,所以不会有任何新信息。
因此不管车子在哪里,他的举动都不会影响最初的选择,也就是l号门的几率。如果车子不在l号门后,那么他开的门等于是告诉你大奖的所在,因此有2/3的机会。所以第一次选1号门就选错了,他等于已经告诉你应该选哪一扇门。如果这是主持人的策略,那赛凡特就对的,有机会就赶快换,荣耀将属于你。虽然换选未必保证你一定会获胜,因为你仍有l/3的概率在第一次选择时就选对了,不过换选还是把获胜机会加倍。
这种情况其实是因为两方对主持人心理所做的假设不同,因此双方都有可能是对的。如果主持人开门是随机的,车子又不在他开启的那扇门的后面,那么几率就真的各有50%。如果他早就决定好,在这个阶段,绝不去开有车的那扇门,那么他让你先看3号门后是什么的同时,你就应该利用这项信息而换选。
启示:珀西·斯潘塞1943年在美国雷森公司工作,他发现站在微波射线前面他口袋里的一块糖果很快会融化掉。他通过进一步实验发现微波能够制作“爆玉米花”。当他发现这一切时,他就为美国人的餐桌又增添了一种食品——在某些人眼里太阳不过是一个黄色圆圈,而有的人却能够通过芥末大的微粒看见明亮的太阳。
换,绝不会吃亏
但最困难、最有趣的问题是:如果一切如前述,你实在不知道主持人的策略,也不可能去问。如果细想就知道正确决策跟主持人的心态大大有关,他也不会说出来。于是就只能猜测,愈能猜中主持人的心理就愈能作出换与不换的正确决策,生活不也是这样的吗?
理性的决策不应建立在对人心的揣度上。玩心理战术有时有用(存在即合理嘛!),但也可能弄巧成拙。你当然可以猜测主持人这样做是为了再给你一次机会;但是同样可能的是,此人是个为了提高收视率而不择手段的人,甚至是个心理阴暗的人,他这样做完全是为了误导你作出错误选择。
事实上,大多数认为“不应换”的人,可能都有这样的戒备心理。他们可能这样想:我已经作出了选择,对不对都只不过是运气好不好,而一旦我改换了选择,而又错了,我就成了被耍弄的傻瓜。
不过有一点很明白,如果不考虑任何心理因素,决定换绝不会吃亏,概率至少是一半一半,根本没有损失。这也正是许多对策专家倾向换选的原因。
这里有一个问题:“概率”并不一定等于“结果”,这就好比买彩票,买100张彩票的中奖概率肯定要大于只买一张,但这并不排除相反的结果:那个买100张彩票的什么也没中,倒是让那个只买一张的捡了便宜。
关键不在于概率,而是概率背后的思想和情感:如公主的爱与嫉妒孰轻孰重、主持人是否掌握信息和他的目的等。说到这里,我们不得不得出一个无奈的结论:在这个问题上,确实没有一个保证你正确决策的方法。
绕了一大圈再回到“美女或老虎”的决策,在竞技场上命运诡舛的情人由公主指示了右边的门,他也照做了。毫无疑问的,这个倒霉的臣子会想到公主内心的挣扎,判断公主应该会作出有利她自己的决定,再据此作出自己的决策,使自己有最大的机会获得幸福的未来。
那个年轻人如果有一点洞察力,他该知道公主(他的情人)的性格倾向,他们的爱情是建立在相互关怀上还是占有欲上,但是这种事又是不能打保票的。在这种情况下,年轻人听从公主的指引,其实就是把希望寄托在他们的爱情上,这是有道理的。即使结局并不一定好。事实上,我们所作的多数选择都冒一些风险,都有失败的可能,我们所能做的,不过是尽心尽力而已。正如那句老话:岂能尽如人意?但求无愧我心。
启示:如果坏事有可能发生,不管这种可能性多么小,它总会发生,并引起最大可能的损失。换言之,解决问题的手段越高明,我们将要面临的麻烦就越严重。
老虎在哪个门
再来看一个“美女或老虎”的故事,它与前面的有些类似,但反映的内容不同。
一位国王发现他的女儿和一个青年私定终身,非常生气,打算杀掉那个青年。但他经不住女儿的苦苦哀求,就说:“好吧,我给他一次机会,看看他是否配做我的驸马:这里有5个门,其中有一个门里有一只老虎,他必须按照顺序打开这些门。当然,他有一次机会选择老虎在哪个门里,除了这个门,剩下的门都必须打开。如果他猜错了,就得和老虎打一架了。我以国王的尊严保证,老虎会在他意料之外出现。”
这个青年当然不知道老虎在哪个门里,也就是说,他只有20%的机会猜对。但是他想:如果我打开前4个门,里面都没有老虎,那么我就知道老虎一定在第5个门,这就不是意料之外了,所以国王不会这样做,也就是说,5号门里一定没有老虎。
现在,他的机会上升到25%,但他还不满足,继续想:5号门排除了,接下来同样的逻辑对四号门也有效:如果打开前3个,都没有老虎,而5号又肯定没有,那么一定在4号,这又在我意料之中,所以,国王也不会把老虎放进4号。接着,同样的逻辑也可以应用在3号、2号和1号,所以,国王不会把老虎放进任何一个门,因为它们都在我意料之中。
青年肯定国王只是想考验一下他的智慧,其实并没有什么老虎,于是他高兴地打开1号门,果然没有老虎;他又自信地打开2号,可这次老虎跳了出来……
我们不必为这个青年的性命担忧,这只是个故事,况且,他也许还是个武松式的英雄呢。我们的问题是:青年的逻辑为什么错了,又错在哪儿了。
大多数学者都同意青年的第一次判断:老虎肯定不在5号门。可问题是,你一旦同意了这一步,就很难否定后面的推理也是正确的,也就是说,国王如果是金口玉言,说话算数的话(保证老虎会在意料之外出现),就不能把老虎放进任何一个门,因为每个门都在意料之中。可是悖论恰恰出现在这里:一旦你得到了这个结论,那么老虎出现在哪个门里,又都成了“出乎意料”的。国王还是说话算数的!
然而,我们也可以很容易证明青年的推理从一开始就错了,即使他打开了前4个门,都没有老虎,那么,他真的能肯定老虎一定不在5号门里(因为它在意料之中)吗?不能!因为他一旦这样确定,那么老虎就成了“出人意料”的了!
不要以为这些只是文字游戏,它说明了一个道理:我们作为判断依据的某些“已知条件”,会随着事件的进程而改变。
围棋是一个复杂的游戏,复杂之处就在于:没有一种情况是绝对好或绝对坏的,在进程中,局面不断变化,坏棋也可能变成好棋。比如你的一个子被对方包围,已经跑不掉了,你就只好放着它不管,在别的地方下子;而对方一般也不会再花一手棋吃掉你这个子,因为你已经脱先了一次,如果他再吃,你又可以在别的地方走一手,那么他为了吃这个子要多花两步棋,这并不划算,于是他也放着不走,在别的地方下子。这当然没有错,因为那个子也跑不掉。但是这又不是绝对的,一旦他的棋形出现漏洞,或者你有了接应,这个子就有可能死而复生。
回到前面的例子,5号门也像这个棋子,理论上“死”了,但并没被从“棋盘”上拿掉,这样它就有“活”的可能,并对整个局面造成影响。
三张卡片
在很多赌博游戏中,如果你一味相信自己概率的直觉,就可能输得很惨。例如,有人请你玩以下游戏:在一个帽子里有三张卡片,一张两面都是黑的,一张两面都是白的,还有一张两面一黑一白,他从里面摸出一张(如果你怕他做手脚,也可以由你来摸),摊到桌面上,当然,朝上这一面可能是黑的,也可能是白的,现在他和你打赌背面的颜色与上面一致,你打不打这个赌?
看起来,这是个对等赌局,如果这一面是黑的,那就一定排除了两面都是白的那一张,因此,这张牌要么是两面黑,要么是一黑一白,所以你的机会是一半,对不对?
如果它真是公平的,对方怎么会那么容易赢了你的钱呢?其实这个赌局是2∶1对他有利。
关键在于:可能的情况是三种,而不像你以为的那样是两种:它可能是:黑(A面朝上)-黑、黑(B面朝上)-黑、黑-白,也就是说:对方有2/3的机会赢你。
再来看一个相似的例子:
甲:“我向空中扔三枚硬币。如果它们落地后全是正面朝上,我就给你10分。如果它们全是反面朝上,我也给你10分。但是,如果它们落地时是其他情况,你得给我5分。”
乙:“让我想想:至少有两枚硬币必定情况相同,因为如果有两枚硬币情况不同,则第三枚一定会与这两枚硬币之一情况相同。而如果两枚情况相同,则第三枚不是与这两枚情况相同,就是与它们情况不同。第三枚与其他两枚情况相同或情况不同的可能性是一样的。因此,三枚硬币情况完全相同或情况不完全相同的可能性是一样的。但是甲是以10分对我的5分来赌它们的不完全相同,这分明对我有利。好吧,我打这个赌!”
乙接受这样的打赌是明智的吗?不,他的上述推理是完全错误的。
为了弄清三枚硬币落地时情况完全相同或不完全相同的几率,我们必须首先列出三枚硬币落地时的所有可能性。简单说,一共有八种情况,而只有两种情况是三枚硬币完全相同。这意味着三枚硬币情况完全相同的可能性是1/4,三枚硬币落地时情况不完全相同的式样有六种。因此其可能性是3/4。
换句话说,甲的打算是,从长远的观点看,他每扔四次硬币就会赢三次。他赢的三次,乙总共要付给他15分。乙赢的那一次,他付给乙10分。这样每扔四次硬币,甲就获利5分——如果他们反复打这个赌,甲就有相当可观的赢利。
启示:有时候我们的命运像冬日果树。谁会想到哪些枝条会转绿开花,可是我们希望,我们知道它会如此。
概率——生活的真正指南
前面谈到的每个问题,都与一个概念密切相关,那就是概率。
明天会不会下雨?丢铜板会出现正面还是反面?想拿到一手好牌吗?这些问题都涉及概率
按照巴特勒的说法,概率是“生活的真正指南”。概率论已经广泛运用于科学、技术、经济和生活的各方面。要打好作决策的基础,就得在概率方面多下点工夫。
很少有一个学科像概率论这样说明我们的直觉是多么不可靠。我们的经验甚至常识往往和概率论所揭示的答案相悖。
很多人相信某一独立事件的概率要受到过去的影响。比如在战争中,士兵们相信,躲在新弹坑里比较安全,因为炮弹两次打中同一地点不大可能。这也许有一点道理:大炮每次射击,都可能会因反作用力使炮位稍稍移动,弹着点也可能略有偏差。但是这也只是空谈,因为毕竟不止是一门炮在射击。
有一个故事,讲的是一个谨小慎微的人坐飞机,他很害怕会遇上一个带着炸弹的恐怖分子,于是他就自己带了一个炸弹(当然,炸药已经卸掉了)。他的理由是:一架飞机上有一个带炸弹的恐怖分子的概率很小,一架飞机上有两个带炸弹的恐怖分子的概率就更小了。他认为自己的行为减低了遇到危险事件的可能性,可事实上,他带或不带炸弹不会影响其他旅客带不带炸弹。
当发现我们以为“天经地义”的东西竟是错的,第一反应是不相信,第二反应是想弄明白到底怎么回事。自然,如果没有一点概率学知识,想弄明白也不容易。
决策的形成共有五个步骤,每个步骤都极其简单:一、列出所有可以采取的行动,包括不采用的行动也要列出来,而决策就是从各种可能的行动方案中选出一个来:二、尽可能列出每个行动的可见后果;三、尽量评估每种结果可能发生的机会(可能性,几率),这一点常被忽略,因此应仔细加以讨论;四、试着表达你对每种结果的渴望或恐惧程度;五、最后把列出来的所有因素全部放在一起考量,做出合理的决策。
我们会逐项探讨后面三个步骤(前两项步骤会随着决策而有所不同,故在此暂不讨论)。如果根本没办法列出选择方案或可能的结果,那么你一定得先解决这两个问题,绝没有第二条路可走。毕竟决策的本质就是从众多选择中,挑出一个最好的,其目的就是要达到最佳结果:如果你连选择方案都说不出来,更别想作出任何决策。当然,也不讳言人生的确存在着未知的选择,也会有出乎意料的结果,可惜这些实际生活中的悲剧或惊喜并非本书的主题。本章的目的是为上述的第三个步骤打好基础,也就是讨论概率方面的问题。
启示:某种事件在同一条件下可能发生也可能不发生,表示发生的可能性大小的量叫做概率。例如,在一般情况下,一个鸡蛋孵出的小鸡是雌性或雄性的概率都是1/2。概率,也叫几率,旧称或然率。
概率与机会
一般人一听到概率就害怕,因为这个词太莫测高深,听来就很“数学”,而大多数人在数学方面又极不自信(这并不全怪我们,也要怪那些把数学变成苦役的教师们)。其实,概率与机会其实是相同的概念,不能因为数学家给它起了个拗口的名字,就把这个有用的概念丢弃。
但是,这并不表示概率的深层意义也是粗糙的概念,也不表示数学家或气象局在算概率时,不会用到深奥难解的数学,只能说一般决策用到的概率并不需要那么高深的技巧。生活中有许多情况,即使不了解事物的运作过程,仍可顺利进行。许多人在工作或休闲时都会用到电脑,他们虽然不太知道程序是怎么写出来的,也不知道电脑是怎么制造出来的,对中央处理器、电脑内部零件等如何运作的认知,更是少得可怜。但多数时候,他们还是可以有效操作电脑。汽车驾驶员、电视观众、飞行员,以及众多利用现代科技的人,都是如此。换句话说,就算不知道事物的运作方式,也能使用自如。
这绝不是为自己的无知辩护,相反地,愈了解这个世界,生活就愈丰富、愈美满,也愈能顺利完成每件工作。有人曾说他犯过很多错误,但没有一次是因为知道得太多。其实你不必在开始之前就知道一切,如果你觉得那是必要的,就注定会瘫痪、茫然,以致一事无成。概率不过是0与1之间一个普通的分数结构,也是用来测量事物发生可能性的工具。概率值为0表示绝对不会发生,概率值为1表示定会发生,至于其他数值则表示介于两个极端之间的情形。听起来似乎有点儿循环论证的味道……其实就是!有谁为几率下过定义?再想想,还真有点儿深奥。
先有鸡,还是先有蛋
这里有个问题:究竟是概率(比如我们说的硬币哪一面朝上的可能都是50%)决定了个别事件(某一次掷硬币)的结果,还是个别事件结果的积累决定了概率?比如,你可能会说:“好吧,我承认,硬币哪一面朝上的概率都是50%,可是如果我连扔5次都是正面,那么下一次还是正面的概率就应该小于平均值,否则,整个的概率不是就偏向正面了吗?”
反驳当然容易,比如一个美国人可能不相信全世界每五个人中就有一个中国人,只因为他认识的所有人中没有一个是中国人。原因是他的取样太少了,范围又太窄了。
概率本身就是有趣又重要的课题,我们说投掷一个铜板正面朝上的机会是五五波,50%或是概率0.5,指的是同一件事吗?乍看之下好像是典型的循环论证,因为如果出现正面的次数多了,就说明那个铜板是假的。西方电影里头戴黑帽的赌徒一碰到自己手中的牌不符合概率原则,就气急败坏地拂袖而去,显然这些电影里的角色对所谓公平赛局早已了然于心。
简单地说,一个理性的人对赌局的预期,就是概率,信不信由你。要把这个人的想法换成数字,只要看他在赌局下注的比例,再把这个比例换算成概率就行了。拿掷铜板来说,他可能会说正反面机会各半,这时你就知道:哈,那就是0.5的概率了,下一块钱就赢一块。再譬如掷两粒骰子,你想知道掷中7的机会有多少,受过教育的赌徒会告诉你是l∶5,那么你就可以算出掷出7的概率是l/6或0.1667。这个比例也许是经过计算,也许是长期经验累积而来,不过都不打紧。
有些守旧的统计学家或数学家会急切地告诉你,这根本是胡说八道。他们说,概率是一种测量铜板在多次的投掷后,正面出现次数所占的比率。如果发生比率刚好是一半,那么机率就是0.5。
但是,究竟是先有鸡,还是先有蛋?《何为先?》一书的作者山谬尔·巴特勒说过,鸡不过是蛋生新蛋的一种方法而已。只要掷的次数够多,铜板就有一半的机会出现正面,这究竟是因为出现正面的概率0.5所造成的,或者不过是概率的定义罢了。再说,又有谁会这么不厌其烦地掷这么多次铜板?如果今天就得下注,你还会在乎长期结果如何吗?从口袋里拿出一个铜板,或是足球裁判丢铜板决定哪一队先开球,这第一次掷的铜板又会如何?所谓长期或次数够多又有何用?长期或次数够多是古老而过时的概率定义,高学历的统计专家已逐渐摒弃这种定义,原因很多,其中至少包括一点:基本上,在第一次掷铜板之前,就可以有相当的把握说出概率多寡,根本不需要掷上亿上兆次,更何况法则是无法由实验结果来定义的。
绝对对称
但如果这个原则用得过于浮滥,就会出问题,因为这个推理只能用于每个可能出现的结果是完全对称的情况下。如果告诉你,一个硬币在平滑桌面上旋转之后,一面向上的次数多于另一面,也许很多人会大吃一惊。其实硬币的正反面重量分配确实不同,正面背面图案的差别,对钱币旋转会造成一定的影响。所以,严格来说,在桌面上旋转硬币猜正反面,并不是一个完全对等的游戏。
在某些无法确定是非的问题上,人们常犯的一个错误是滥用“中立原理”。例如有人问你:火星上存在生命的可能性有多大?你并不知道,但是你想:只有两种可能,有或没有,所以,有生命存在的概率是50%。如果你是这么想的,你就犯了滥用“中立原理”的错误了。
在漫长的历史中,这个原理曾被应用于科学、哲学、经济学和心理学等很多领域,因而声名狼藉。例如法国天文学家、数学家拉普拉斯有一次以这个原理为基础计算太阳明天升起的概率,答案是将近1/2000000!
为什么会有这么离谱的答案?拉普拉斯是如何论证的,我们并不了解,但是可以推想。就拿“火星生命”的问题来说吧:火星上存在生命吗?“中立原理”的回答是:有1/2可能性;那么,火星上存在最简单的细胞生命吗?同样,可能性是1/2;存在植物生命吗?还是1/2;存在低级动物生命吗?1/2;存在哺乳动物吗?1/2……好了,现在看看火星上不存在以上形式生命的概率:1/2乘1/2乘1/2乘1/2……结果是1/16,也就是说,至少存在一种生命的可能性达到了1/16,这和原来我们估计的1/2相矛盾了。
,中立原理”只能应用于客观情况是对称的这一前提。不能因为答案是二选一,就认定两种答案的可能性都是1/2。同样的,如果你买彩票或竞选总统,可能的结果不是赢就是输,可惜这两个结果并非几率各半。
启示:所谓“中立原理”,是由经济学家凯恩斯在他的《概率论》一书中总结的,大致内容是:如果我们没有理由说明某事的真假,我们就选对等的概率来表明它的真实程度。
概率的独立和互斥性原则
决策几乎都是处理单一事件,掷铜板就是单一事件,在只能掷一次的情况下也很难看出这个铜板是不是一枚真铜板,也许会出现正面,也许会出现反面。或许是太过天真,但我们也只能假设铜板是公正的,依此来估计可能的几率。
在约会游戏里,假设每一次约会都是一个新的追求者,其实这就是一种赌注(真实生活也是如此),但是你不能在开始决策前,每次都跟100个人约会来决定几率的大小。
因此,所谓的决策几率是指0到1之间,用来测量某件事发生可能性的数字,而这个数字可以利用各种方便的技巧来推测。即使必须去问专家或数学家也无妨,只要记得找个好的就是了。如果要用猜的也可以,但千万别高估自己的技巧,可惜这也是很多人常犯的错误。也许有人比你更了解情况,对几率的预测也比较准确,如果能找得到这样的人来帮你,尽管去吧。但是千万记得对只会唬人的预言家敬而远之,譬如观天象、读掌纹、看水晶球的各种算命大仙,都应该列在谢绝往来的名单上。话虽如此,很多人还是蛮信这一套的。
当然,概率也不是完全随机的,在计算概率时,还是有规则可循,内容并不多,但很明确,主要是避免掉入自相矛盾或无稽之谈的泥沼。譬如要计算两个独立事件都发生的概率就是将个别概率相乘,如果一个5分钱的硬币,每两次有一次出现正面的机会(概率为0,5),那么两个硬币同时掷出正面的机会就是l/4,也就是概率值为0,25。同理,两个硬币至少有一个出现正面的概率为0.75。两个硬币同时出现反面的概率也是0.25。因此无论如何,只要给定概率值,就必须严格遵守结合两事件发生的概率原则,否则会出现不一致的现象,阻碍整个决策过程。
以下就是三项基本的概率原则:
1.两个完全独立事件,同时发生的概率是个别发生概率相乘的结果,两事件以上的情形亦同。
2.两事件互斥,至少一件事发生(或说两者不能同时发生)的概率是个别概率的总和。若不是彼此互斥,情况就稍微复杂一点。
3.如果某种情况注定要发生,这些个别独立事件的发生概率总和等于一。例如足球联赛中一定有一队会获得冠军,则所有球队获胜的概率加总起来定会等于一,而且各队获胜也是互斥事件。
虽然这些原则看起来并不难懂,只要用到分数和小数相加就可以了,这些常识每一个高中生都该学过。但概率问题的复杂性还是会造成一些困难,并使很多人作出不利于自己的错误决策。
启示:在日本有一种邦赛树,当它的树苗刚长出地面,日本人就把它拉出泥土,扎住树干,结果它就成了一种美丽但高不过几寸的树。在美国加州有一种将军莎门树,它在加州肥沃的土地上自由地疯长,长成后竟然可足够建造35间房子。然而,当这两种树还是种子的时候,重量都小于三千分之一盎司。树不能选择命运,但上苍赋予人类的许多宝贵礼物中,“选择的权利”就是其中的一个。
第10章 赌场:醉鬼漫游
 反对赌博不只是一种道德立场,也是一种明智的策略选择。当你参加一场赌博时,你赢的机会是负的期望。当你使用一种赌博系统时,你总要赌很多次,而每一次都是负的期望,绝无办法把这种负期望变成正的。
为什么赌博是坏事
萨缪尔森的《经济学》被认为是最好的经济学入门读本,半个多世纪以来已经发行到第17版。萨缪尔森《经济学》在讲了“投机”以后,有一节的标题就是“赌博和边际效用的递减”。
萨缪尔森说:“为什么赌博被认为是很坏的事情呢?最重要的原因可能是在道德、伦理和宗教方面,但是从经济学上看,反对赌博的理由也相当大。
,首先,即使庄家不取抽头,不搞别的花样,赌博也只是毫无益处地把金钱从一个人手里转到另一人手里。赌博并不创造新的价值,却要耗费时间和资源。所以,除了小金额赌博还有某些娱乐功能外,赌博危害社会并减少国民收入。
,赌博的第二个坏处是,它趋于扩大收入的不平等和不稳定。不平等和不稳定为什么不好?众所周知,增加100元收入带来的效用小于减少100元收入而损失的效用。所以,即使在机会均等的‘最公平的’赌博中,输家效用的损失比较大,赢家效用的增加比较小。可见,从整体上说,即使是‘最公平的’赌博,对社会也没有好处。”
萨缪尔森所说的第二个原因涉及经济学的重要原理——边际效用递减原理。
边际效用递减原理说的是:消费者在消费物品时,每一单位物品对消费者的效用是不同的,它们呈递减关系。举个简单的例子:对一个饿着肚子的人来说,第一碗饭给他的效用最大,第二碗饭则没有那么大了,吃到一定程度后,再吃的话,饭给他的效用是负的,即不仅不能给他好处,反而是负担。对买车的人也一样,当他买了第一辆车时,他感到方便很多,同时有巨大的心理满足感。当他买第二辆车时,由于他不能同时用两辆车,这第二辆车给他的效用就没有第一辆车大。当然第二辆车还能起到备用的作用,而且会增加他的炫耀资本,此时总的效用是增加的,但增加的幅度没有他买第一辆车时增加的幅度大。如果他继续购车,买了车后,既要雇司机,又要准备停车的车库,同时要防范窃贼等等,这些成本反而可能高于第三辆车给他带来的效用,是得不偿失的。
想想看吧,两个月收入都是1000元的人赌博,赌到一方输光为止。一个人变成穷光蛋,另一个人收入加倍。这给社会带来的,将是什么前景?后者的收入增加,只可能会让他过得更舒服一点,可前者却陷入了无法生活的困境。这个结果既不利于社会公正,也不利于社会稳定。
启示:萨缪尔森曾经说过:“增加100元收入所带来的效用,小于失去100元所损失的效用。”这正是边际效用递减的表现。
,赌徒谬误”
既然是必输的游戏,为什么还有很多人乐此不疲呢?
赌徒和偶尔一赌的人不同。每个人在某些时刻都想赢一下——屏住气息,只求命运恩赐这一次!这是普遍的渴望。在各种彩票游戏中,只要有人赢大钱,别人就开始梦想。这是此类赌博的目标;真正的报酬是梦想。
赌徒又是另一回事,他真正等着赢钱。他投下的不是象征性的小钱,而是能毁掉他的大数目。他有一套制度——在对策论中,这被称为“赌徒谬误”。在轮盘赌中,最常见的行为模式是所谓“戴伦伯特系统”,它正是以“赌徒谬误”为基础的。比方说,赌轮盘的时候他押红的,失败的时候再加倍。根据数学的概率法则,不管前面出现过多少次黑的,每次你押红的,押中的机会仍是50∶50。但是赌徒认为,黑色若连续出现几次,下回红色出现的机会就随着轮子的连续性转动而比例增加。即使这不合数理原则,赌徒心中却愈来愈坚信红的该来了——就算这次不来,下回一定会出现,于是下次更加肯定。这使他更相信自己会赢,他知道他会的,虽然事实上机会永远一样50∶50。
我们可以说,常胜的赌徒就是靠运气而自以为通晓了某些奥妙的人。(当然,必须考虑技术因素:有些人打牌或作弊的技术高。)如果运气一直证明他的预感和先见之明——统计上一定会有几个这么幸运的人——他心里就产生“不会输”的感觉。事实上,他只是运气好,但是他的运气碰巧合乎他自觉幸运的信心,使他很容易相信自己的运气是特殊的神恩,专门赐给天之骄子。他相信自己注定要赢,他的胜利具有命中贡品的意义。这种人渴望,有时也获得的是“优异”的感觉。他要证明,命运偏爱他。否则富家老太太何必一夜一夜耗在俱乐部的赌台上?她们要用钱来算命。古代纸牌、数字、骰子在算命、魔术和占星仪式所扮演的角色就指出了其中的关系。
但是赌徒不只是接受纸牌的预言,他也想向不温厚的命运强讨胜利。当他的数目不出现,他就越战越勇,加倍下注,一直提高赌金。在他大胆或绝望的尝试中,他会一举赎回所有的损失。由这种行为看来,赌徒是一个幻想自己必赢、却表现出坚决失败典型的人。
启示:一对年轻的夫妇到拉斯维加斯度蜜月,刚到饭店,丈夫便冲进赌场豪赌一番。最后一天,丈夫将他们留作纪念的最后5块钱筹码押在了17上,竟然奇迹般地赢了。不到一个小时,他居然赢了2000万美元,而且都是押在17上。这位男子想乘胜追击,将所有的钱都押在17上,这次小球停时一偏,开出了18。他垂头丧气地回到房间,太太问他:“手气怎么样?”“还好,只输了5元钱。”
,开天眼的人”与不存在的规律
比起赌博,彩票更为人接受。因为它不像赌博那样,笼罩着欺诈和非法的色彩。尽管赢的概率更小,但输的损失也不大——如果你每次只买一两张,那不过是微不足道的小数目。但我们照样能得到同样的激动。
现在很多报刊开辟了与彩票有关的栏目,主要内容是各种“猜号”技术。它们都是“彩民”创造的。有用吗?概率专家说没用,但还是有很多人信这个,或者说,是相信一定有什么办法可以揭示彩票的奥秘。一定有个答案的!这些人在信仰的虔诚方面,和那些一心寻找人生意义或上帝旨意的求道者其实并无不同,而且逻辑也类似。
在赌博时,骰子在一轮中连续4次开出了7,下一把你是否应该在7上下重注?你的一位一贯有好运气的堂哥为你选了一注号码,这是否增加了你中奖的机会?
这类问题的答案都是“不”。
尽管人们总是渴望知道事物的发展趋势和方向,但随机现象就是随机的、任意的。骰子和彩票既没有记忆也没有良心——每一轮、每一个数字选择都是一次新的不同的事件,不受以前事件的影响。如果上一轮的结果能够按照可预期的方式影响下一轮的发展,赌场就要破产了。
如何对付随机猜测陷阱?要避免这种扭曲的思维,必须克制住自己在随机事件中预测事物发展趋势和方向的欲望。
缺乏模式(规律)是随机性的特征。聪明人能发现其他人看不到的规律,而“开天眼的人”能看到其实并不存在的规律。大数学家、博弈论的创始人诺曼说过:“任何一个考虑用数学方法制作随机数字的人当然是处于犯罪状态。”
好运气不是经常遇到的,即使是在并非特定的事情中也是不会经常出现的。运气会造成一些令人疑惑的事情。如果你将一个硬币连续用手弹10次,硬币正反面出现的可能顺序是:正正正反正反正正正正。10次中有8次正面,其中连续出现4个正面!难道你对硬币施加了某种心灵控制吗?是不是此时你的状态或运气特别好?似乎其中有一种不可能改变的规律性。
但是,当连续得到硬币的正面之前和之后,如果继续弹这枚硬币,在一个排列更长,而且稍微令人感到有些乏味的顺序中隐含了这样一种规律:正正反正反反正正正反正反正正正正反正反反正反正反反。如果允许你只注重某些结果,而不管其他结果,那么总是能够“证实”运气中有意外情况。这是谎言探测装置所探测出的一个错误结论,运气仅仅是你最喜欢的状态而已。
不要试图看透和预测纯随机事件,因为这是不可能的。如果你认为自己已经发现了将来的结果,那么仔细地检查你的理论。把你那套认为可以战胜庄家的理论拿出来,将过去的数据代进去,验证你的理论是否可行。这么做十分有效,因为可以避免损失实际的金钱。
启示:最重要的是要巧妙掌握进退,也就是要胆大心细并洞察先机,倘若无法做到这两点,那么就无法找到赚钱的正确途径。
为什么买彩票
我们强调过金钱的效用和总数不见得相等。因为在多数情况下,大部分人都会觉得输钱的痛苦此赢钱更深,所以,他们根本不应该玩对等赌局。但当需求十分迫切,就会让赢钱的几率比输钱的可能性具更高的价值(且不论道德问题),此时,他们“最正确”的决策就是去赌博,即使有预期损失也无所谓。适当的评估金钱效益或其他事物,都可以改变原决策。
这也是人们买彩票的原因,由此可以看出,彩票的收入比付出要多,也就是说买彩票的人多半是输钱。所有的数学家(注意,用到“所有”这个字眼的句子通常都有问题)都不建议买彩票,不过一般人还是照买不误,把10赌9输的教训完全抛到九霄云外。不过,他们也未必全然无知。
一位著名数学家在一场演讲中承认:他曾经在回家路上的迷你超市添购日用品时,用找的零钱买了彩票。他的辩解大概是这样:“赢100万可以完全改变我的生活型态,输几块钱却毫无影响。”他其实是在为钱的效益下定义,并强调赢的效益远大于输的效益。可惜他忘了考虑微乎其微的中奖几率,这点很可能会扭转决策方向。许多买乐透的人也有同样下意识的评估,并自我安慰:总有人会赢嘛。但在这种逆效用的情形下,即使将几率纳入考量,还是可能导致赌博的自卫决策。
把巧合神秘化的“惊奇陷阱”
一个人曾经两次赢得百万分之一的彩票大奖。这种事情发生的概率只有一万亿分之一。一些人将之归功于超人力量,另一些则认为有作弊的嫌疑。你如何看这个事件?
乍看起来一个人两次赢得百万分之一的彩票大奖是如此的不可能。好吧,我们假设有1000人曾经赢得了一次大奖,他们又都尝试了100次试图再次获得好运。那么就在百万分之一的大奖中占了10万次机会,即这些人中的任何一人的中奖的概率为1/10。这么看,你会发现其实它并不是奇迹,甚至不能称为很少发生的事情。
与随机猜测陷阱一样,惊奇陷阱源于不恰当地估计现实。现实中本来就有一些惊奇的成分,而人们或者没有意识到,或者不愿意承认。许多人因为赌博连连赢钱(或者投资非常得意),就以为自己运气特别好,或者水平特别高。我们不应该被这些戏剧性的事件所迷惑。从概率上来说,总有些人会走运。这个人恰好是你的概率可能极小,但是在某些情况下这个人是某人的概率可能就不那么小了。一些有钱人之所以胜出,可能不是因为他们的生意头脑,而只是走运罢了。一些不幸的人可能不是因为愚蠢或者无能——他们只是不那么走运罢了。
当巧合发生时,人们总是容易受到迷惑。他们不能接受随机事件的任意性,倾向于用神奇的、超自然的力量来解释事件,并且对自己也迷信起来,以为他们自己一定是有某种过人之处。
怎样对付惊奇陷阱?当一件看起来稀奇的事件发生的时候,不要吃惊到抛弃概率的法则和逻辑,而相信所有的稀奇事件都是注定的这种地步。
在古代,没有人有现代的概率知识,所以自然而然地认为有更高的神力在主宰这些不可预知的事物。而除了与这些神力沟通,请他们去改变人们看得见、摸得着的具体事务外,还有更好的方法吗?到目前为止,还是有许多人相信纸牌之类的东西可以算命,由此看来,这种想法的生命力还很强韧,而对常识实在是一大侮辱。
就最简单的游戏而言,决策惟一要考虑的问题就是决定要不要玩,及要下多少赌注。吃角子老虎,可说是最简单的,赌徒除了喂它们钱,企盼也许它们会仁慈点还一些回来以外,大概也不能怎么样。而玩吃角子老虎的人甚至对概率多没有半点概念,虽然他们很肯定一定会对自己不利,所以玩与不玩的决策可说是在完全无知的状况下作出的,正因为如此,才有无数的人在注定会输的情况下继续赌下去。
启示:通常你能够为自己的好运找到一个很好的解释。记住下面几点:
(1)世界上本来就有很多潜在的稀罕事,你肯定会经历其中的一些。
(2)有些事情看起来稀奇,实际上并不是。比如,在24个任意选择的人们中发现两个生日(月和日)一样的人的概率有多大?答案是超过50%!
你有多侥幸
在玩牌或下注时,一般人多半知道如何利用概率来判断拿不拿得到同花顺,或是哪一个球队有可能登上超级杯足球赛的冠军宝座。而所谓的决策,其实就是在教导我们如何更有效地应用同样的原则来处理生活问题。
个人决策之所以会有不确定性,通常是因为我们根本不知道想通过决策达到什么目的,而且一般人都有夸大潜在损失和获利的倾向。尽管大家都知道赌场老板与彩票发行者的经营目的绝对不是要送钱给别人,但是一般人还是照玩吃角子老虎、照买彩票。既然赌场老板、彩票发行者都要赚钱(不赚钱的,早就被淘汰了),一般赌徒终究要输钱(这被称为零和游戏,越赌到后来越是如此),但是赌徒还是幻想着赢钱。“下一个获奖者就是你!”这句彩票广告撰稿人老挂在嘴上的一句话,就是过度夸张潜在获利,总有人会赢并不表示你真有赢的机会。
尽管输钱的痛苦比赢钱的快乐更深,而且上面的道理人们也并非不知,但当需求十分迫切,就会让赢钱的几率比输钱的可能性更具高的价值,此时,他们的决策就是去赌博,即使有预期损失也无所谓。
所谓理性决策是希望能帮助你“平均而言”尽可能作出最佳决策。如果你是理性的,也不可能百战百胜。赌徒也很清楚,就算运气再好,也不可能整晚或整个礼拜一直赢下去。如果人们能谨记概率无所不及的影响力,就不会有人成天老抱怨倒霉,或走了点小运就沾沾自喜。话说回来,就算今日的世界比较文明,有些事情还真是只能碰运气。
许多关于概率的畅销书都会引用这个例子:把一些猴子放在打字机前,经过一段时间后,其中一只很可能会打出一篇莎翁的14行诗。事实上就算集合了全宇宙的分子数量也不足以构成这么多猴子和打字机来做实验,但又如何?那些作者不过想表达这并非完全不可能罢了。如果真的发生了,也不代表那只猴子是莎翁投胎,只是更证明了几率原则的正确性。即使不作弊,大烂队也有赢球的时候,明星球队一样会输球。赛马场中从头睡到尾的人也不是没赢过,就好像完美的决策也会产生坏结果,差劲的决策却产生好的结果一样,世事多变,谁能说得准呢?不过,强者赢的次数通常比弱者更频繁。
要作出理性的决策,首先必须仔细衡量所有可能的后果以及可以采取的行动,并诚实考虑潜在的利益与损失。由上述各点可以假设,所谓决策其目的是去采取或避免某种行为,或以不同的方式来达到目的。
资料的整合是通过预期效益或预期损失的方式来进行,即把可能结果的发生率加权给分:愈有可能发生的,加权分数愈高;愈不可能发生的愈低。也就是把各结果的加权值乘上它的几率,再加总即为某一决策的预期效益,这个数值可以让你知道该项决策会带来多少好处,所以当然愈高愈好。
启示:一只燕子为了筑巢,飞到羊身上去寻找少许的羊毛。羊愤怒地跳来跳去。“你允许牧人把你的毛通通剪光,却连一小撮毛都拒绝给我。这是为什么?”燕子说。羊愤怒地回答:“因为你不像牧人那样懂得用好的方法来取我的毛。”想挣钱和发财是现代人的基本愿望,可是许多人的挣钱方法太落后了。
预期是几率乘以价值
这里之所以强调“预期”,是因为任何事件所产生的真正损益都与其实际发生的概率有关。譬如可以赢得10元的对等赌局中,期待值就是5元,也就是此赌局的市场价值。比如,一张彩票百万分之一的机会赢得100万美金,则期待值为1美元,也就是它的卖价。一般人下单时的股价反映个人的期待值,即未来获利和再卖出的价格。而这个把几率乘以价值的概念也是大家所熟悉的,这是了解赌博策略的最佳途径,决策的期待值也适用相同原理。
就以风靡一时的办公室足球赌局为例谈起。这是种熟悉的简单案例(虽然老板们多半不高兴),它的赌法通常是把当天的足球赛都列出来,让人下注买某队会赢。赌局的全部收入就是各人买球队赢所付的赌金,最后由优胜者平分。这个游戏很单纯,你可能认为只要比对手多了解各球队情况即可,这当然没错,比别人聪明,知道得比别人多,绝对会有帮助,但这个游戏还有点小花样。
大部分的足球赌局都允许下注者选好几队,以“分散风险”,反正顶多是赌金总数增加,有利无害。不过这也表示每个人都必须做两个决策:要买多少支球队,以及买哪些球队赢。这也是一种零和游戏——所有投进赌局的钱全部由优胜者平分。分散下注绝对有利于乐透彩或赛马(这并不是真正的零和游戏——赞助商可大捞一票),买得愈多输得愈快。这跟之前的论点相同:若每项投资都赔钱,就算卖的量再多,也不可能赚钱。但赌足球则正好例外:多买几队,跟自己对赌是有利的。听起来有点违反常理,下面就来看看它是怎么运作的。
为了简化说明过程,我们假设这天刚好只有一场比赛:红蓝对抗。而且只有你和阿福两个人下注,你们在挑队伍方面都是能手。若这两队实力相当,这几乎是五五波的赌局。阿福用2元买红队赢。现在轮到你了,你可以挑红队,也可以选蓝队,或者作更明智的选择。如果你也买红队,那么谁也赢不了谁。红队赢了,两人就平分赌金,每人拿回自己的2元;如果蓝队胜了,还是可以拿回2元,因为没有获胜者。但若你赌蓝队,那么就可分出胜负,并拿到全部赌金。假设你真的比阿福更了解球队的状况,就可以这样赌,如果不是,再加上两队真的实力相当,则输赢的机会大概一半一半,最后还是势均力敌,所以绝非致富之道。
但如果两队都买,又会有什么结果?现在在全部赌金里你有4元,阿福有2元,而这4元中,一定有2元会赢,另外2元会输。但就算赢的部分一定有你,又该怎么创造净利呢?
因为这是个对等赌局,所以红队有一半赢的机会。若红队真的赢了,你们一起平分6元的赌金,所以在4元投资中可以拿回3元,另外1元则由阿福赚得。
但若蓝队获胜,这还会是个对等赌局吗?你可以收回所有的投资,并赚到阿福的2元,作为报酬。也就是有一半机会赚2元,一半机会赔1元,长时间看,你的赢面还是较大。每玩两次就可以净赚1元,以4元的投资来说,平均每玩一次,就有0.5元的净利。这当然是因为和自己对赌的结果。阿福如果要赢就必须看得很准,猜中的几率约要有2/3才行,至于你的准确度就无关紧要,反正两队都押了。如果每周都有一场赌局,而阿福只能猜对一半,那么你的每周平均报酬率就有12%强,这算是相当不错了。一年内,你的投资会增加到将近500元,这就是复利的魔力,而阿福当然早就追上来。如果下注者更多,或比赛队伍增加,赌局就会愈来愈复杂,利润也会下降,不过原则还是不变,分散下注绝对有利。
请注意,不要急着把这套“系统”用在足球赌局上浪费金钱,因为我们事前已经假设对手输赢机会各半。所以,能做的不过是丢铜板决定下注对象罢了。如果对方对球队真的很有研究,也经常挑对球队,那么这个系统就一无是处了。这个计算是以几率为基础,但若有人真的能猜中哪一队会赢,就可以轻易击败信息较少的对手。有一个职业骑师被问及是否曾赌过马,他坦率地答道:“除非有人事先告诉我内定谁赢。”我们学到宝贵的一课:如果对手知道得比你多,千万别赌。
启示:只要有百万分之一的机会,就有百分之百的赌徒存心要赢。
选银行还是选赌场
用一个简单的例子来分析这些原则:你该把储蓄投资在风险低的债券存在银行,还是干脆上赌城一赌?这就需要决策了。首先,你必须对几率略知一二,再评估各种后果,并决定个人目标,然后在立即满足或未来展望之间作取舍。
假设你手边有1000元,又刚好住在闹区,巷口有家银行,对街有一间赌场。银行的利率是5%,赌场里的轮盘游戏也蛮吸引你的。典型的轮盘有38个洞,其中18个是红色,18个是黑色。小球滚到红、黑洞的机会一样,不过并不完全是对等赌局,因为小球进每个红、黑洞的几率都是18/38,约相当于0.4737。所以不论赌红或黑,获胜的几率都很低,比赌骰子的0.4929还小。换句话说,赌骰子比轮盘更容易赢钱。
首先,你必须设定目标,这是决策的最高指导原则。如果打算赌到破产为止,那还有什么问题?因为赌场赢的几率就是比你高了那么一点点,长时间下来你必输无疑,结局只有一个:一穷二白、欲哭无泪。至于会不会因此学聪明,就得看你自己了。
如果你选银行,那就比较容易分析,你会立刻赔上全部投资,换到本小册子或一张存单,表示你的钱由银行保管,当然也可以随时领回,但纵使是银行也有破产的可能,同时钱只要在银行,对你就毫无用处。
这种说法当然是误导。利息会累积,也会忠实地记录下来,可能还是记在那本小册子里,同时自己也知道随时可以取回本金与累积的利息,但放弃立即使用金钱的报偿,比起必输的赌博似乎还是比较好的选择。许多劝世文章谈到,若每天以复利算(现在有电脑的银行都这么做),大约100年,投资1000美金加上累积的利息,便可增加到15万,但也许你会问,这又有什么好处?反正也没有机会享用。取得的时间愈久远,金钱效用愈低,这就是为什么银行要付你利息,才能拿到你的钱(暂时不论通货膨胀的问题,它就像浪潮起伏,改变了一切以货币衡量的事物其表面价值),事实上,除了收入固定或储蓄的人外,它不过是个幻觉。但通货膨胀的功能正是把钱从这些人身边拿走,抢走他们的积蓄来支付其他人的立即需求,反正除此之外,也没有其他合法渠道可以让人免费取得财物。若你对这个问题感兴趣,可以好好思索它的道德层面。
启示:心理经济学家曾经提出一个所谓的“划分心理帐目”的概念。这种概念反映了一种最常见的,也最浪费的财务错误——把某些钱看得不值钱,因此可以轻易挥霍掉。说得更明白一点儿,“划分心理帐目”意指人们根据钱的来源、存放的地方和花用的方式,将金钱加以归类,并赋予它们不同的价值。
加大赌注,挑战几率
即使如此,长久下来,选银行还是强过赌场,因为赌博的结果一定是破产。如果一定要赌,那么最好的策略是什么?
当然,我们说“赌博的结果一定是破产”,并不排除某一时段可能你的运气不错,但是如果你持续下去,好运不会伴随你多久的。这就是为什么事前必须定出明确目标,并在达到预定目标后立即收手。趁走运的时候停手你还有机会赢,如果坚持赌到最后,结果一定必输无疑。这也是这个问题如此引人入胜的原因。
假设你带着1000元进赌场,并决定赚1倍就收手。早期玩骰子有一句名言“我的孩子需要一双新鞋”,就是告诉别人你急需额外的1000元买件重要的东西,原先的1000元不够,一定要2000元才成。你当然很清楚自己极可能会输得一干二净,不过当需求如此殷切时,也就顾不了这么多;而银行对短期需求根本是死路一条,就算以5%复利计算,也得要14年才能让本金加倍,到时孩子早已不需要这双鞋了。那么又该如何在输光前赢到1000元,再赶紧收手,把筹码换回现金?人人都知道没有100%的胜算,但至少可以把机会极大化。
这是个定义明确的数学问题,所以就直接把答案说出来,另外,醉鬼在断崖边漫步的例子,也适用于此:他从一张板凳和断崖的中间点开始走,希望找出最佳机会,在跌落断崖前安稳地坐在椅子上。这张板凳好比那双新鞋或是其他急需的东西,而断崖呢?跟前面的讨论一样,代表破产。还记得游戏规则是一次得下20元,那么标准答案就是在输光前约有1/200的机会可以赚得一倍,胜算渺茫,几乎是肯定会输,也就是说为了满足需求而去赌博是很差劲的决策。
但即使在赌场,你也可以有更好的表现。如果一次赌50元,进行速度会快一点,也许少了些乐趣,不过将本金加倍的机会就增加到1/10,比原来高了近20倍。为什么?因为达成目标所需的运气不用那么多,而每赌一次,就是跟概率作一次挑战。偶尔概率法则会让你不致一路输下去或赢下去,这是运气。如果真的那么需要钱,你也愿意吸收所有损失(这个几率很大),那这样的概率算是可以接受的。
现在应该都很清楚了,如果并非因乐趣,而是急需用钱才赌,最好的就是一次就把1000元全押下去。那么胜负大概一分钟以内就可以底定,而赢的几率只稍稍低于l/2。这比一次赌20元的1/200好太多了。
当然如果赌博只是为了好玩,最好一次只押一点点,虽然到头来一样会输光,不过得等上好一阵子,而你一定会玩得很愉快(赌场的赌徒看起来似乎并不快乐,不过这是另一回事)。如果你赌博是想大发利市,而且也愿意承担损失,那么就干脆赌一把大的,孤注一掷,这样你获胜的概率还大一些。
何时应选择“孤注一掷”
绝大多数赌博游戏其实都是一样,背后逻辑很简单:长期来说,你几乎肯定会输,不过在游戏过程中,也许会有领先的机会,因此如果策略对头,也许可以在领先时收手。当然,如果对你而言游戏乐趣大于成本,那么只要很清楚要付出的代价,倒也无妨。
对轮盘游戏,还有两小点要附带一提,而它们也适用于掷铜板,及其他几率对等,或接近对等,且筹码也对等的情况。在轮盘游戏里,如果带着1000元进赌场,并希望在最后离开时口袋里会有2000元,那么最好的策略就是一次全部下注,如此一来,就有近一半的机会可以赢,如果你的需求不只这样,而是想把1000元变成1万元,那么会有多少获胜的机会?最佳的策略又是什么?
其实原则仍然不变:每次下注大点,仔细留意形势的变化,持续赌上一阵子即可,也许你会输光,但至少有赢的机会。但如果你把所有资金一次全部下注,运气又很好,连赢3次(几率大概是1.8或再低点),赌金可累积到8000元,那么下一局是不是还应该再这么干呢?错了!因为你可能会为了远远超过设定目标的l.6万元而输个精光。这时最好的策略应该是下注2000元,如果赢了,你大可以带着所需的1万元离开赌场,万一输了,也还有6000元可以翻本,下面赌局,就把注码改成4000元。
因此,这类赌局的最佳策略是,只要赢得的钱不超过目标,就全部押上,要不然就只下足够达到目标的赌注就好。从数学上也可证明,是有和这个策略不相上下的做法,但绝没有更好的。有个跟这个策略差不多的玩法是,在一开始,假装你的目标是5000元,运用前述的方式,希望能达到目标,如果机率是l/5,那么在你确实赚得5000元后,再全部押上,这个方式的获胜几率跟先前一样,不过前提还是输赢几率必须接近各半。
最后还有一个问题:如果采用最适策略的话,希望把1000元本金,连本带利翻成1万元,成功的几率究竟有多少?假如你想赚取10倍于本金的钱,即使采用最佳策略,成功机会也不会大于1/10,这是公平游戏的通则。在破产前达成目标的概率,正好是想赚得金额的倒数,若游戏不公平,概率还要比倒数小一点,这虽不是那么直观,但千真万确。同时,若游戏的公平性差了一点点,而你又小心翼翼地下注,肯定你会输。
在公平赛局中,有近1/2的几率,可把本金变成2倍,3倍则为1/3,以此类推。这个通则其实是很有根据的,在几率的世界里,恰巧也就是人们生存的世界。财产预期值等于几率和总数相互影响的结果,也就是说,拥有10元现金和拥有一张有机会把钱增加1倍的对等赌局彩票,就长期而言两者并无二致,几率都是1/2,但若是可把钱变成100元的彩票,几率就减小为1/10;虽然两者的预期值都是一样,没有改变,但心理上,却有很大的不同,因为若将时间拉长,结果正好打平,不赚不赔。
这个原则值得谨记于心,因为它是个通则。当然,这也表示如果幻想在赌场里致富,那么即使采用虽佳策略,机会也很渺茫。想像一夜致富的情景当然很有趣,但终究只是想像而已。
启示1:如果金钱和财富是可以互换的,不论是赌博赢来的彩金或辛苦赚到的薪水,使用起来都应该没什么两样。任何财务决定,都应该是根据一件事对我们的整体财富有何影响,来做理性的衡量。
启示2:很多入迷的赌徒不知不觉想要输。
不懂概率,当定冤大头
在较为复杂的赌局里,比较不容易计算概率,扑克牌就是一例,不过认真的玩家还是算得出来。扑克的复杂之处还在于,它是个竞赛性游戏,强手占有一定优势。而掷骰子就要简单多了,相信每位读者现在都算得出来掷出4或10点的几率是1/3。
有时概率会骗人,或未知,或被忽略。彩票游戏里,一般人若不是不了解中头奖的概率,就是他们只看到报纸上得奖人的故事,所以毫不在乎几率的问题。对这些人来说,“中奖的可能就是我”的幻想盖过一切,但若以钱的效益来看,这样想未必完全没有道理。
不过再怎么说也不能太离谱,有的赌场宣称:在自己的扑克机上拿到同花顺的概率是500∶1。听起来好像很高,不过在公平赌赛中,取得同花顺的概率就像连续拿到4张同花牌一样,熟手发牌,则接近1/1000000,更精确点是1/649740,如果是抽牌,则低于1/20000。这么看来,1/500根本是无耻的谎言,用来欺骗不懂的人。
其实,如果说在这些用适当策略达成目标的赌博小原则之上,还有共同决策原理的话,那就是如果你不懂概率,即使只纯粹想限定输钱的金额,也没有合适的策略可用。这个原则的惟一例外是,不赌就不会输,那么懂不懂概率就无关紧要了。
前面我们用了很多红黑轮盘作为简单游戏的例子,但必须记住,纵使赌注是l赔l,赢的几率也只有47.37%,因此有52.63%胜算的赌场,足足比你多了4%,就长期而言一定可以获利的。再强调一次,赌场老板不是在经营慈善事业,所以长期来说,你是不可能赢的。当然不论是轮盘还是骰子,都有很多未曾提到的赌法,每一种又各自有合适的策略,若要在这里谈会占去太多篇幅(这毕竟不是一本《赌经》),所以只要记得一件事,就是一定要懂得几率,千万不要盲目下注。
以上讨论的前提是假设所有游戏都是公平的,对这一点,我们必须保持怀疑,因为只要有利害关系,就有足够的动机让人丢开游戏规则,而在这种地方,你又不能指望警察来维护规则——因为这套“规则”本身就是不合法的。
说了这么多,中心意思其实很简单:如果你想利用概率,就必须先了解概率,清楚自己到底在做什么,并确定自己的目标。最重要的是,如果赢的几率小于1/2,就别以为长时间下来自己还会赢。
即使是全然理性的决策也可能是错的,因此,若结果出乎意外地糟,就没有必要自责或自暴自弃;同样地,如果运气好,结果也不错,也不必太沾沾自喜。要知道:概率就是概率,和老天是否眷顾毫无关系。
启示:谁也不满足于自己的财产,谁都满足于自己的聪明。——托尔斯泰第11章 股市:冤大头游戏一个繁荣的市场自然交易活跃,当然也就不可避免一些投机现象,但是如果投机盛行,成为市场的“规律”,那么这个市场一定要出问题。
股市是什么
要给股市下一个定义,并不十分容易。你当然可以花费一分钟查一查词典或百科全书上的解释,但是查完之后,你的疑惑可能并不比知道这个概念之前少一些。
正如很多人说的:股市是政策市、信息市、心理市,我们也可以说:是一个博弈市。
通过购买企业的股票,人们投资于企业;企业拿这些投资去发展业务,当取得利润的时候,要按照股份分红给投资者。这就是股市投资的基本原理。但是,由于股票是可买卖、转让的,这个简单的问题就变得复杂了。股票也成了一种特殊商品,有供给和需求矛盾造成的价格波动,股市又是一个完全竞争的效率市场,股价的活跃程度大大超过任何商品,这就使得很多人参与其中是为了博取差价,而“投资——分红”的原始意义反而被忽略了。当然,有许多的市场形态(如期货、外币)都有类似“股票市场”的逻辑,透过某种公开竞标的方式来购买替代性产品。所以,本章内容几乎可适用于各式各样的市场,不过一切都有个基本假设,就是这些市场都有公平的游戏规则,当然,也不排除个别违规或是作弊的现象,这难以避免,只要不导致游戏规则的破坏就没关系。
首先要探讨的问题是,究竟有没有可能根据决策理论找出最佳的投资策略。现在,已经有很多声称能为你带来高额回报的股市分析软件。不管对错,一般人都相信分析股市的电脑程式能够为他们带来财富。就好像迷信的老太太相信老黄历一样。
这种一窝蜂地把相同程式或运算方法一次又一次卖给个别投资人,很可能会抹煞掉市场的多样性,而无法维持原来的公平与稳定性。一旦每个人用相同程式,不论好坏,在同一时间都会显示相同买或卖的讯息:不管对错,长此以往,定会造成市场混乱。这种情况经常发生,但一般人还是很容易忘记写这些程式的人不比自己聪明多少,他们也只在销售这类产品的行业里打滚罢了。
在股市中,人们常常提到“庄家”——实际上,这类“庄家”是不合法的,但是几乎没有人否认他们的存在。有人认为,在股市赚钱的惟一办法就是“跟庄”,因为他们常有渠道获得内幕消息,这些信息是你我一般百姓所得不到的,而且,有时他们散布这类信息根本就是套散户的陷阱。
这里我们将一起观察股市的潮起潮落,并探究其背后的原因。当然,我们不是希望教会你如何炒股票(读者也不要这样指望),而是通过股市的一些现象,讨论其中的博弈原则,这可能会使你加深对股票市场的理解。换言之,这里不会告诉你该怎么做,而是讨论人们为什么会这么做。
启示:据说爱因斯坦死后进入天堂,上帝将他安排在一间4个人的房间里。爱因斯坦问第一个人智商是多少,那人回答为160。爱因斯坦喜出望外地说:“好!我正担心来到这里找不到探讨相对论的伙伴呢。”他又问第二个人,那人的智商是120。爱因斯坦显然有些失望,叹了口气说:“也好,我们还是能探讨些数学问题。”他最后问第三个人,那人说他的智商不到80。爱因斯坦皱起了眉头,良久之后说道:“看来我们只能侃侃股市了。”
,大家发财”究竟发谁的财
几年前,美国著名经济学家斯蒂格利茨教授曾在广州中山大学做了“公共政策与东亚奇迹”的演讲。斯蒂格利兹教授在演讲中特别谈到股票市场。
他告诫,股票市场当然重要,人们可以通过市场交易其股份和风险。但是在发达国家,股票市场并不是筹措资金用来投资的重要的场所。企业发行新股,应该是效益的负信号:效益最好的企业自有充足资金;次一等的企业,可以发行债券,按固定的利率付息。
好的和比较好的企业,何必发行新股让别人分享较高的利润呢?在发达国家,就整个股票市场的总体而言,在过去的20年里,新股的发行远远赶不上企业购回现股的规模,因此,资本在股票市场是净流出。在美国,新股减去回购对投资的比率是-9%。在其他发达国家,是-5%~-3%,筹资最多的日本也只有+2%。人们普遍认为,股票市场是一个重要的金融架构,但不是企业融资的主要来源。
他不明白为什么在中国人们对股票市场的期望那么高。因为在美国,人们常说股票市场只是有钱人游戏赌博的地方。
股市投机、赌博的成分很大。在美国,股票市场只是“有闲+有钱”的人游戏赌博的地方。至于广大工薪阶层、企业高层精英、大学专家教授,哪里有那么多时间紧跟股市行情的分秒变化呢?他们中的许多人也投资股票市场,都是我们这里所说的股民,但他们做的主要是长线投资和基金投资。
投机和长线投资不同,指的是频繁转手追求短期差价的股市行为。企业的股价变动,根本上应该是企业业绩的反映。在短期内,企业是不可能创造很多利润的。频繁转手追求短期差价,就像赌博一样,没有多少赚钱的机会,何况要负担因为频繁转手变得沉重的交易费用和交易税。所以发达国家成熟的股票市场,“长线投资多赚,投机短博多亏”是普遍的规律。
,啤酒”与“泡沫”
尽管我们很难把投资与投机截然分开,但是这两种行为是有很大的差异的。发达国家的股票市场发育早,容量大,股市投资的观念深入民心。股民在居民中的比例比我们高很多,但是却完全看不到那种人头涌动、盯住证券交易所股市行情屏幕的情况。因为他们做的主要是长线投资,而且绝大多数把资金交给共同基金的专业人员去投资,去管理,让他们分享一些利润,所以自己不必计较股票价格一时一刻的涨落。而中国股市还处于初创阶段,投机成分很大。
的确,在20世纪90年代初期,许多股民利用投机短博发了财,但那是因为我国股市还远未成熟,尚处于初创阶段,几次股市泡沫让他们沾了很大的光。但是随着市场经济的发展和股票市场的逐渐成熟,“长线多赚,短博多亏”终将成为规律。
一位经济学家曾打过一个有趣的比方,他说:股市就像一杯啤酒,如果没有一点泡沫,说明它不新鲜(没有活力);可是如果泡沫太多,啤酒就少了。事实上也是如此,一个繁荣的市场自然交易活跃,当然也就不可避免一些投机现象,但是如果投机盛行,成为市场的“规律”,那么这个市场一定要出问题。因为说到底,支撑市场的是“啤酒”,而不是“泡沫”。回顾历史我们也能看到,几乎每一次“股灾”前夕,都有一个“泡沫”沸反盈天的时期。无论是1929年席卷世界的经济危机、1997年的东南亚金融危机、2000年的网络股引发的股市大跌,都是投机过盛、泡沫破灭的结果。除了别的教训以外,它还使人们懂得,社会心理是金融市场的重要因素。对于为卖而买的股市投机行为,心理因素的影响就更大。在“行情好”的时候,人们都趋之若鹜;可是一旦行情转坏,人们又惟恐逃得不快,这正是股市大涨大跌的原因。
既然是股票市场,就不能排斥投机。但是短博多赚的阶段终将过去。过去很少人做长线投资,这也不能全怪股民。例如,中国股市开放以来,迄今企业大多只通过发行新股筹集资金,很少有企业把利润拿出去按股分红。人们看到的,要么只是配股,要么每股只分几分钱。中国股市这种相当长时间没有实质分红的局面,是许多弊病的根源。
启示:一位股市上的风云人物曾说过这样一番话:“许多人认为我在股票生意中很成功,可是仔细计算下来,我才知道如果把在投机生意中所用的资本、时间和精力用在更正当的生意上,那么我的财产可能会比现在更多。”
,冤大头理论”与“郁金香狂热”
股票的原始意义在于:筹集资金用于生产以获取利润。然而现在买卖股票本身却成了最可能赚钱的生意。拥有股权的人也许会身价百倍,所根据的不过是未来的期望。为卖而买的个别商品有一种奇怪的现象,就是如果大家都看好那种东西,一窝蜂你炒我炒,价钱可以炒到很高的位置,就会随着所谓“冤大头理论”继续涨价。
所谓“冤大头理论”(也被称做“博傻游戏”)简单说就是:如果某件商品的价格高于它的实际价值,你买下它,你就是“冤大头”;可是只要还会有更大的“冤大头”愿意花更多钱来买,你这个“冤大头”就值得当。
金钱魔术的基础就是“更大的冤大头理论”——只要有这种人存在,价格就会继续上升,大家都可以继续赚下去。他们的资本家信念甚至相信无止境的增值,数目字继续呈螺旋无限上升。为了让财富的大乘法继续下去,必须能增加无限的需要。
在“冤大头理论”盛行之时,股价可能被哄抬至荒谬的水平,然后重重地跌回现实当中。与历史上一些投机泡沫破裂导致的价格大跌相比,我们正在经历的股市低靡只不过是小意思。
,每个时代都有其特有的愚蠢的事情。当制订计划、方案或编织幻想时,在受到利益的贪欲和寻求刺激的需求,或仅仅是受到模仿力量的驱使的情况下,就会有愚蠢的事情发生。一旦陷入到这些贪欲和需求中,愚蠢的事情就具有了疯狂的野性……”
以上引言出自《异常流行的幻想与芸芸众生的疯狂》,这本书是查尔斯·麦基于1841年写的,然而至今仍在不断再版。此书为何常盛不衰?就因为这世界的骗局和我们的愚蠢常盛不衰。
在这本书中我们可以了解一些暴富者们传奇般的故事。其中包括密西西比河和南海的“暴富”们不顾一切地大肆买卖荷兰郁金香。
17世纪欧洲的郁金香热潮,就是个金融市场的群众心理典型范例,麦基的书中介绍了当时对郁金香的投资热潮,一般人愿意拿整年收入来购买一株花苞,每个人都有十足的把握,相信不管付出多少代价,一个月后就可用更高的价格卖出。在一个很短的时间里,荷兰的郁金香球茎价格上升了好几十倍,这股狂热终因承受不了重担而冰消瓦解,以更快的速度跌至原来的水平。这就像以空头支票骗钱或匿名的连锁信一样,迟早会垮掉。现在许多词典里都收录了“郁金香热”这个词,而现代的大众传播,人们更容易产生全面性的金融恐慌。
前些年日本经济泡沫现象严重,经济增长不大,房地产却在疯炒,一时间,炒得仅东京地区的地产价值,简直可以把整个美国买下。泡沫得太离谱了,一下子垮了下来,经济损失当然很大,那些最后被套住的人就要亏大本。
启示:20几年前中国北方也出现过类似事件——有位作家在他的作品中称之为“疯狂的君子兰”。在当时职工月薪普遍不足100元的时候,却可以炒到一株花标价十几万元人民币。一时种花养花倒花成为热潮,这股狂热没持续多长时间,却使很多人倾家荡产。
伤兵的两个瓶子
在黑色幽默小说《第22条军规》中,有一个“浑身缠满绷带的士兵”(谁也不知道他受了什么伤,谁也没见过绷带下面的人,甚至谁也不知道绷带下面到底有没有人),他所得到的全部治疗就是:上面挂一个瓶子输液,下面放一个瓶子引流——然后两个瓶子调换位置。
我们都能看出这个故事的荒谬性,可是一旦它被应用于生活,很多人就忘了。
任何金钱骗局的基本原理就是利诱:向某人借钱,许给他高额利息;再向其他人借,拿出一部分作为“利息”付给前一个人,以此类推,如果这种“生意”能持续下去,每个人都不吃亏。是不是?
但这是不可能的,你欠的越多,偿还的压力越大。这是规模解决不了的问题。因为你能借到钱的人数不是无限的。
这就是金融领域的“蓬齐”圈套,这一圈套的发明人是波士顿的蓬齐。1920年,他虚构了一家经济实体,其实只是一个金字塔网络,不生产任何产品,拿后来投资者的钱支付前面投资者的利润,在疯狂的一段时间,捞到了几百万。
,神秘链”的原理也差不多,它很简单:积土成山。假如有1万人参与这游戏,每个人拿出1元钱所失甚微,可是如果这些钱都给一个人,那么他就得到1万元,这就是个大数目了。问题是,随着参加游戏的人数增多,是不是每个参与者都能拿到这么一大笔钱呢?那是不可能的,部分不可能大于整体,无论参与者有多少,最终每个人的平均收入不可能大于支出。
传销也是这个原理,不同的是,由于金钱总量中有一大部分要被组织者拿走(当然,他会给你一些“商品”作为回报),可供参与者分配的钱要小于他们的总支出。也就是说,这是一个必输的游戏。可是,不是有些人就是靠这个发财了吗?没错,只是你要再想想:他的钱是谁的?是其他参与者的。一个人发财,意味着对无数人的盘剥。
说到此,你是否发现我们的股市与上面的例子有点相似呢?
几年前,经济界曾爆发了一场激烈争论,争论焦点是所谓“赌场论”,即中国股市是否已经成为了一个“赌场”?
股市的过度投机,吸引了大量资金进入,造成了虚假繁荣的景象,可问题是股市是一个靠输血维持的“中国病人”,自身造血机能很差——也就是说,发行股票的公司赢利状况普遍不佳,无法创造大量财富支持股价的持续攀升。于是,有限资金就成了伤兵的两个瓶子,掉来掉去,可并不增加。据估计,股市一路高涨是因为高达数千亿的银行资金悄悄流入股市,当政府开始调查时,这些资金匆忙撤出,于是股市一泻千里,至今也没恢复元气。
然而在公平市场,估算股票价值时应考量哪些要素?股票基本上只是一张纸,而且随着电脑时代的来临,股票已经成了看不见摸不着的“虚拟存在”,可能无数人都有过这样的疑惑:假如整个证券交易所的电脑系统出了故障,拿什么来证明自己持有哪些股票呢?
股票代表着对某物业的部分拥有权,且有可能转换成眼前或未来的所得,但随着投资人眼光放得愈远就愈不确定(当然还有适当的折现率),同时投资人还必须比较股权与其他投资工具的预期效益,如债券、银行存款,房地产、连锁速食店,或防盗工具等。
有时候未来的预期值与股票本身关系不大,而与国内或世界总体经济体制及前景有关,而这些考量会影响整体股票的受欢迎度、获取价值及价格等方面的涨跌,而非个股本身的好坏与否。因此股价就由一堆确定与不确定的因素共同决定,而决定价格与价值两者之间关系的这门学问就是所谓的“投资”。
启示:有这样一个关于经济学的笑话:在一个小岛上,只有两户人家。小岛资源匮乏,也没什么工作机会。可是这两家人是怎么活过来的呢?一家的女主人说:“我们是这么干的:我雇她给我洗衣服,她雇我给她洗衣服,这样我们就都能挣到钱了。”说它是关于经济学的,是因为它说明了一个道理:交易会带来利益。说它是笑话,是因为在一个封闭环境里,仅仅靠交易并不能带来利益的增加。
,选美”与选股
凯恩斯曾举过一个“读者选美”的例子说明人们选择股票的策略。在所谓读者选美比赛中,报纸刊登候选人的照片,而中选者要通过公众投票产生,因为评选者要顾及自己的利益(比如,如果你的评选结果和最后的结果相同,你会获得一笔奖金),他的投票就不可能以自己的爱好作为惟一标准,他还要考虑别人会如何投票。
凯恩斯说:“专业投资大约可以比做报纸举办的比赛,这些比赛由读者从100张照片当中选出6张最漂亮的面孔,谁的答案最接近全体读者作为一个整体得出的平均答案,谁就能获奖;因此,每个参加者必须挑选的并非他自己认为最漂亮的面孔,而是他认为最能吸引其他参加者注意力的面孔,这些其他参加者也正以同样的方式考虑这个问题。现在要选的不是根据个人最佳判断确定的真正最漂亮的面孔,甚至也不是一般人的意见认为的真正最漂亮的面孔。我们必须做出第三种选择,即运用我们的智慧预计一般人的意见,认为一般人的意见应该是什么……这与谁是最漂亮的女人无关。你关心的是怎样预测其他人认为谁最漂亮,又或是其他人认为其他人认为谁最漂亮……”
在报纸选美比赛中,读者必须同时设身处地从其他读者的角度思考。这时,他们选择胜者与其说取决于真正的或绝对的美丽的标准,不如说是努力找出大家的期待是不是落在某个焦点之上。假如某个参加选美的女子比其他女子漂亮很多倍,她就可以成为这么一个万众瞩目的焦点。不过,读者的工作就没那么简单。假定这100个决赛选手简直不相上下,最大的区别莫过于头发的颜色。在这100人当中,只1个红头发的姑娘。你会不会挑选这位红头发的姑娘?
读者的工作,是在缺乏沟通的情况下,确定人们究竟将会达成怎样的共识。“选出最漂亮的姑娘”可能是书面规则,但这可比选出最苗条、头发最红或两只门牙之间有一条有趣的缝隙的姑娘艰巨得多。任何可以将她们区别开来的东西,都可以成为一个焦点,使大家的意见得以会聚一处。出于这个理由,当我们发现当今世界最美丽的模特其实并不具备完美体态,我们就不会感到惊讶;实际上,她们只是近乎完美而已,却都有一些有趣的瑕疵,这些瑕疵使她们各具特色,成为一个焦点。
生活中有很多例子与这个模型是相同的。比如“十佳运动员”的评选,在这些投票过程中,对于每个投票者的激励是:他如果“正确地”选中某些人,不仅要选中10个人,而且顺序也要正确,那么投票者将获得某种奖励。但是如何才能选中“正确的”人选呢?有“正确的”人选吗?得票多的就是正确的吗?或者严格地说,得票最多的是第一名(比如“十佳运动员”中的第一),得票次之的是第二名(如“十佳”运动员的第二名),等等。因此,投票者能够选中的话,或者说被他提名的能够“当选”的话,关键是猜测别人的想法,猜测对了你就能获胜,猜测错了,你则不能获奖。在这里,我们可以看到没有正确与否,或者谁应该选上、谁不应该选上的问题,而是投票的人相互猜测的结果(当然,在这个过程中舆论的导向作用是很大的,它似乎告诉人们某某人是其他许多人所要选的)。
股市投资具有一些类似的特点。每个投资者都希望赚钱,可是能否赚钱,不完全取决于某个股份公司的赢利情况,更要取决于其他投资者是否看好它。一个对股市不熟悉的人可能会以为:分红最高的股票,其价格也最高。可是实际情况却并不是这样。凯恩斯的伟大之处,在于解释了策略行动如何能在股市和报纸选美比赛中压倒现情形,并确定谁是胜者。
在股市中,一支股票若是在原有价格上的需求超过供给,也就是说,在某个价格上,想买进的比想卖出的多,其价格就会上升。要想在股市赚钱,你的目标是确定其他人认为哪几支股票的价格就要上升。一直以来,他们都是通过同时设身处地从别人的角度考察这个问题得出自己的结论。只要他们确实这么做,一切就会如常运行。
这里我们要说明的问题是,均衡可能轻易借助莫名其妙的想法或一时兴起的狂热达成。没有什么基本原则可以保证最漂亮的参赛者会被选中,又或是最优秀的股票一定会最快升值。其中存在一些沿着正确方向移动的力量。预测的高回报就和选美比赛参赛者的肤色差不多,充其量并非充分的条件之一,这种条件可以用来制约局势陷入莫名其妙的想法或一时兴起的狂热之中。
启示:股票是安全性最高的赌博,不但要有输得起的气魄,还要有赖于思考力与忍耐力的结合。
,效率市场”,谁主沉浮
由于公平市场的竞争相当激烈,而买卖双方都得到相同的信息,因此双方所共同同意的价格,就代表某支股票的市场价格,它表示双方对该股票价值所展现的平均智慧,也代表个人根据手边最充分的信息仔细分析判断后,愿意接受的价格。严格来说,市场价格不是一个平均数,而是在任何一个时间点,最想买的买方愿意付给最想卖的卖方的价格。这就是专家所称的“效率市场”。个人要夺得先机,他的信息必须比别人多或分析得更正确。
简单地说,效率市场背后的理论就是,市场上有许多人进行分析,所以任何会影响某支股票价格的因素或讯息都会立即散布,广为人知,并化为众人意识,且立即反映在股价上。有人会根据市场讯息采取行动,甚至因此获益,有些实验也证实,在这类环境中,新闻与谣言传播得特别快。所以,在效率市场里,如果你的信息与竞争对手无异,分析工具也不见得特别高明,你就得比别人更聪明、更认真,才能表现得比别人更好。像股市中的传奇人士彼得·林奇等,这些个别投资人能够一年年地发达起来,就是因为他们比别人花更多的时间在阅读和了解各个企业的状况,所以的确能比其他人知道得更多,付出努力和技巧定会有回报,即使再投资也不例外。当然,在某些时候也会看到没有特别努力或技巧的人还是可以表现不错,不过,就像我们一直强调的,这只是运气好而已!尤其在投资这一行,正常来说,“大师”这个头衔只有一年的寿命,少有例外。
另一条致富之道就是分析整体股市的统计资料,借此找出未来趋势,而这类分析师也可以避免挑选个股的辛劳与痛苦。这种做法当然比较模糊也复杂,不过还是可以试一试。首先必须找出平均股价,而非特殊的股票,不过到了最后,还是会绕回两者之间。
又见随机漫步
首先要问的是,到底造成每天平均股价变动的因素为何?有时,各式各样的新闻会反映在股市上,并影响到未来投资景气。有人曾说:格林斯潘的脸色好坏,就会影响股市的涨跌。这类影响当然可好可坏,跟能否事先预测到利率的调整有关:如果已有预警,则市场变化会受下列两者的影响,即预期利率调高或调低,与投资人认为实际发生的可能性。如果一般人买卖股票或债券时已预期利率的变动,不管猜得对不对,都有助于市场效率。同样的,战争、维持和平、政治事件等新闻都会影响市场的平均价格,如果你能比竞争者猜得更准,就可以因此获利。每日市场平均的变动是由各种大大小小的因素所造成的,它们会影响到不同股票与投资,加起来就像赌场醉鬼随机漫步的情况一样。
然而,究竟这些变动有多随机?以纽约证交所一个普通交易日来看,大约有1000种个股红盘作收,1000种个股走软,另有700多种则维持平盘。如果这些涨跌变动真如习惯所称的随机,而个股变动也彼此独立,那么就可以采用平方根法则,以上涨与下跌个股支数的差约为1000,求其平方根,约等于30左右,与实际的40种相仿,属合理范围。因此,由这个粗略的案例,可看出个股涨跌就跟前面的那个醉鬼在断崖边漫步一样,总和平均就像身处在千百个醉鬼的正中心一样。
类似分析的研究结论是股市每日平均变化的确很接近随机漫步,皆几乎找不到可辨识的模式,这也跟效率市场概念相当一致,认为应能找出某种可加利用的规律,如果它真的存在;而这种规律也会对价格结构产生足够的影响力以自我补偿。如果可以接受这个概念,应该明白想利用平均值找出这个规律,就像要猜出一群醉鬼下一步想怎么走一样。尽管为了这些分析,投资人已花下大笔金钱,塞满了预言家的口袋,但因为证据仍是模棱两可,因此投资大众永远存有希望,大师们与其他赌博性企业家才能飞黄腾达。不过人们也不必全知全能,就可以利用所知的一切获得成功。
再进一步往下探究,到底股市平均值日复一日的变动中,有多少是由随机漫步的累积效果所造成的(别忘了,随机漫步者在一段时间后,会从起始点向其他方向移动)。同样也可以用平方根法则及同性质但较复杂的定理来加以分析,结果亦很具说服力,只是不够清楚明白,那就是每日、每周、每月平均值的变动多因市场上个股随机、互不协调的变动所造成,就像是醉鬼移动路线一样。人们在认知上常犯的谬误是无中生有,自以为可在无规律中看出规律、在无秩序中找到秩序。
启示:下面的一组试题可以测验你承担风险的能力:
(1)你有足够的收入应付家庭的基本需要吗?
(2)你有合适的人寿、健康保险吗?
(3)万一你的主要收入中断了,你是否有足够的积蓄应付?
(4)你是否摆脱得了繁重的财务负担?
(5)你若在股市中损失了部分钱,你承受得了吗?
巴菲特为什么能赚钱
根据最近的统计报告,世界首富依然是比尔·盖茨,排名第二的就是巴菲特,他是惟一只靠经营股票而跻身富翁排行榜前列的人。
他在谈他怎样选择理想股票时说:“我花了很多时间来研究沃特·迪斯尼公司。我最喜欢的公司是:美丽的城堡,周围是一圈又深又险的护城河,里面住着一位诚实而高贵的首领。最好有个神灵守护着这个城池。护城河就像一个强大的威慑,使得敌人不敢进攻。首领不断地创造财富,但不独占它。换句话说,我们喜欢那种具有市场统治地位,别人难以模仿,耐久可靠的大公司。”他还说:“当我买股票时,我就认为是买下了整个公司,就像在街边买了家商店。如果买下了商店,我就要了解它的一切。”
因此,在网络股沸反盈天的时候,有人嘲笑巴菲特老了,他的投资思想已经过时,投资人也向他施加压力,希望他也投入“淘金”热潮。可巴菲特一直不为所动,他承认这些股票可能给投资者带来巨大的利润,但是他同时表示“不理解这些网络公司的赢利方式”。事过境迁,随着网络泡沫的破灭,高高在上的网络股也土崩瓦解,“老了”的巴菲特再次笑到了最后。
巴菲特这种充满感情而又十分理智的炒股思想,使他在变幻莫测的股市始终把握着正确的方向,成为股市上一个著名的不倒翁。
,股神”巴菲特曾经在美国华盛顿大学发表了以下这番谈话:“我何以至此,不是智商问题,关键是理性。我一直视智商和天才如同发动机的马力,但是输出功率——发动机赖以运转的效能——依赖于理性。许多人驾驭400马力的发动机,但是只得到100马力的输出功率。更好的方式是用200马力的发动机并使之输出全部功率。”
你也可以是“大师”
好了,乱七八糟地谈了一通股经,该回到“博弈”的正题上来了。如果你希望在股市上赚钱,就该先明确你的目的。你要的是红利还是博取差价?如果是前者,你就该像巴菲特那样,选择合适的时机,找几支值得投资的股票(如业绩良好、安全可靠、市盈率低等)买下,然后就该干什么干什么;如果是后者,你就要明白,实际上你是要从别人腰包里掏钱,这可能与道德无关,但与策略大有关系。既然玩股票的大多输钱,你就必须跟大多数人反着来。
当然,这里不是要告诉你应该在大家狂抛股票时逆流而上,我们说过,股市是个心理市,兵败如山倒时企图做“中流砥柱”只能被踩成肉饼。你应该比他们反应更快而不是更慢,别人疯狂买进时你退出(一个在股市上赚了大钱的人是这样“分析行情”的:当他发现营业大厅外停放的自行车超过一定数量时就卖出),市场一片低靡时进入,既然你就是要赚大家的钱,你就一定要先知道他们的玩法错在什么地方。
,跑赢大市”(即自己的收益高于指数增长)其实并不如想像的那样容易,即使在所谓“牛市”中,个股还是有的会涨,有的会跌。如果能比别人早一步得到内幕消息,就可因此获利。
用决策方法在股市使获利极大化也非常复杂,且跟上述那些繁杂的统计脱离不了关系。所谓“快速上升通道”、“形态辨认”、“找出三上一下”等都不太管用,要从股价的过去走势里看出点端倪有如找出天上白云像什么,人人都办得到。另一方面,证据也显示股市运作并不完全随机,市场更非有绝对效率,所以投资就像本书提到的其他例子一样,对努力和拥有充分信息的人相当有利,同时也让懒惰与没有信息的人遭受损失。也许无知者真的有福,但绝不是在赚取财富方面。
有一位大主教曾呼吁信徒一定要永远行在善恶间那条又直又窄的道路上,他指的是宗教信仰,不过这也正是破解股市的最佳方法。其实,也许惟一“理性”的投资方法就是巴菲特式,除此以外,真的没有任何策略保证你只赚不赔。
启示:股票投资,没有世袭的技巧,只有利用活钱的智慧。
第12章 悖论:“交换信封”
我们的知识体系、我们对世界的认识也许并不是建立在“惟一正确”的基础上,而在这个基础上建立起的认识世界的方式,既是一条道路,也是一个囚笼。
悖论——逻辑的套索
逻辑是有用的,也是有趣的,但这并不能保证它时时刻刻都让你放心。逻辑是一切演绎推理的基础。也许最有趣的就是像福尔摩斯那样通过严密的推理,发现事情的真相。然而,有时你会发现,正是你似乎无懈可击的推理和论证把你送进了死胡同。到底什么错了?是你的推理过程出了问题,还是逻辑本身隐伏着某种致命的缺陷?
有个很有趣、很简单的概念——悖论(也被译作“吊诡”),简单说就是自相矛盾的说法。即如果承认这个说法正确,就能推出这个说法不正确,反之,如果承认这个说法不正确,却又能推出这个说法正确。至今仍令统计专家与决策理论学者争论不休。
你很聪明?很有逻辑头脑?当有人这样评价你时,你会感到高兴。事实怎么样呢?想不想试试看?看看下面的几个悖论吧!
1.鳄鱼和小孩的悖论
鳄鱼抓住了一个小孩,对他说:“我会不会吃掉你?你要答对了,我就放了你;答错了,就吃了你。”
小孩想了想,说:“你会吃掉我。”
鳄鱼懵了,它该怎么办呢?“我要是吃了你,你就说对了,我不该吃你;我要是不吃你,你又说错了,我该吃了你……我晕!”
小孩乘机跑了,鳄鱼十分沮丧:妈的,他要说我会放了他就好了!
2.《堂吉珂德》悖论
,堂吉珂德》里描写了一个国家,它有一条奇怪的法律:每个异乡人到此都要回答一个问题:你来做什么?你答对了,一切好说;你答错了,就要被绞死。(当然,对错是由人家说了算的)
一个人回答:“我来是为了被绞死。”士兵像鳄鱼一样懵了:如果绞死他,他就对了,不该死;可是放了呢?他又错了,该死。怎么办?
到了国王那里,他也想了好久,说:“无论怎么做都不对,还是我法外开恩,放了他吧。”
3.理发师悖论
理发师悖论是由罗素提出的,罗素不但是哲学家,也是一位数学家,他提出这个悖论是为了说明数学中的集合问题。其大意是:某城里有一个理发师,他只给不肯自己刮脸的人刮脸,那么,他给不给自己刮脸呢?
你可能要争辩:事实上,没有鳄鱼肯跟你讲道理,没有一个国家会通过这么古怪的法律,也不会有一个针对理发师的如此严格的规定……这些都是编造出来的。你是对的,在现实中,我们的确不大可能被这些难题困扰。但是对悖论的研究不是没有意义的,更不是所谓“吃饱了撑的”。
悖论不是存在于现实中,而是存在于我们对现实的认识和表述中,但这两者不可能分开。如果没有人类,世界仍然存在,但是却没有意义,意义正是人类认识的结果。
博尔赫斯曾写过一个令人着迷的小故事。在这个故事中,“我”得到了一把小石子,这些石子的特别之处在于:你每次数它们,数目都不同,这一次是3,下一次就可能是5或13。想想这个故事,想想故事中的疑问:如果毕达哥拉斯(古希腊数学家,在这里代表人类的数学传统)抓起的是这样一把石子……
这个故事暗示的是:我们的知识体系、我们对世界的认识也许并不是建立在“惟一正确”的基础上,而在这个基础上建立起的认知世界的方式,既是一条道路,也是一个囚笼。问题是,没有人可以离开惯常的知识结构,只要他活着,就必须找几条安身立命、为人处世的原则和方法,而他自己,也就被这些原则和方法规定起来。
启示:我们都不是生活在疯人院里,逻辑思考能力是必须具备的。可是逻辑就像牛仔手里的套索,弄不好也会把自己套住。
艾毕曼德悖论
理性的决策要靠逻辑,理性思考也不例外,悖论存在逻辑领域里,主要是挑战人类思考的协调一致性,以确定每个螺丝都配对了螺帽。如果两个论述互相矛盾,就不会同时为真,就像掷一枚铜板,不会同时出现正面,又出现反面。所谓逻辑的内部一致性,就是指不论用什么方法,都无法证明两个叙述处于绝对对立的情况。如果想长智慧,解决自己明显的内部不一致是不二法门。
伟大的科学家爱因斯坦曾协助发现了量子力学的理论,但又自觉不完善,故在中年花了很长的时间想找个悖论以证明其不具一致性。爱因斯坦失败了,量子力学到今天仍然存在,但当时悖论确实吸引许多物理界的精英投入研究。至今部分问题仍困扰着科学家们,而那些宣称不感困惑的绝非专家。
逻辑的悖论中有个最古老的、也不错的例子,即艾毕曼德悖论,它是2500年前由一个克里特人艾毕曼德提出的。他宣称:“所有的克里特人都是骗子。”这就是一个典型悖论。这句话究竟是真是假?如果是真的,那就不能相信说这句话的人,因为他自己就是克里特人,所以不可能为真。那么,难道它是谎言?这么一来,连这个人都是骗子,又怎么能相信他的谎言和对克里特人的批评?
再将这种想法延伸、扩展,大可在本书中插进一句话,请读者不要相信书中的每一句话,当然也包括这一句在内,这是艾毕曼德悖论的延伸。
著名的数学家哥德尔于1931年创造出革命性的定律。他指出,所有的数学体系都包含一些定律,无法证明,也无法推翻但这个定律并不是其中之一,因为他已做出了漂亮的证明。这个说法吓坏了许多数学家,因为长久以来他们一直相信所有的数学定律都可以被证明是真或假,因此绝没有任何问题。这种模棱两可的情况造成极大的震撼,哥德尔用一个明确的例子来说明,并指出数学的深层意义。
再回到艾毕曼德悖论。聪明的读者可能会想:啊哈,这个狡猾的家伙以为可以骗得到我,尽管这个理论已有2500年的历史,但其实它是不存在的。因为艾毕曼德悖论说所有的克里特人都是骗子,这只能证明说这句话的人本身是个骗子,却不代表没有诚实的克里特人存在,所以结论是这个人在说谎,是不是?
没错,这的确是跳出这个古典悖论的方法。可是如果我们将它修改一下,假使那个人说的是:“这句话是谎言。”或者说:“我这个克里特人是个骗子。”这么一来,就又绕回原来的困境,因为这两句话有自我包容的特性,这也是该悖论的核心。或者,你也可以更进一步试试这么两句话——第一句说:第二句是假的,第二句说:第一句是真的。所以,原来的悖论设计得有点粗糙,但不影响其内涵。
启示:一个具有天才的人,必具有超人的性格,绝不遵循常人的思想和途径。——司汤达
别人的钱包总是更诱人
还有一些悖论是关于人类心理的,比如中国有句俗话叫“这山望着那山高”,西方也有类似的话“邻居的草坪总是比较绿”。可是,你是否知道这种心理也与博弈论有关?
赌博必然存在的一个事实是:一人所得意味着另一人所失。因此,在参加一场赌博之前,非常重要的一点是从另一方的角度对这场赌博进行评估。理由在于,假如他们愿意参加这场赌博,他们一定认为自己可以取胜,这就意味着他们一定认为你会输。总有一个人说错了,不过,这个人究竟是谁呢?其实,赌徒(这里指的是诚实的赌徒)在一对一的赌博中对双方概率的评估都还是理性的,他们承认这是可能赢、也可能输的对等赌局(如果概率偏向一方,另一方一定不愿参加),只不过他们认为自己的运气一定比对方好罢了。
下面将探讨一个看起来对双方似乎都有利的赌博,这是可能的吗?如果不可能,那么,问题究竟出在哪儿呢?
一位教授和他的两个学生——我们称他们为“阿里”和“巴巴”——共进午餐,兴之所至,教授提议“阿里”和“巴巴”玩一个游戏:把他们的钱包交给他,他数了数,发现其中一个装的钱正好是另一个的两倍(但他没有告诉他们谁多谁少),然后他问他们:在这种情况下,他们是否愿意互换钱包?
阿里当然知道自己的钱包里有多少钱,但不知道巴巴的,他想:对方要么是我的1/2,要么是我的2倍,如果是前者,那么我损失了一半;如果是后者,那么我增加了一倍,一倍的收益大于一半的损失,所以这个赌是划算的。巴巴也是这样想,于是两个人都愿意打这个赌。
现在我们用数字更详细说明一下两人的判断:比如,阿里钱包里装的是10元(于是他估计他要么得到5元,要么得到20元,前者损失了5元,后者得到10元,也就是说,在对等情况下,他的收益比损失多5元)。我们知道,如果你和某人玩猜硬币,正面朝上输1元,背面朝上赢2元,这个赌应该打,因为哪一面朝上的几率相同,而收益大大多于损失,如果多玩几次,你的所得肯定大于所失。只是恐怕没有人愿意和你这样玩。
这里出了问题:既然没有人愿意打一个必输的赌,那么交换钱包为什么却是双方自愿的呢?双方交换钱包,不可能使他们的结果都有所改善,因为用来分配的钱不可能交换一下就变多了。推理过程在哪出了错呢?阿里和巴巴是否都应该提出交换呢?阿里或巴巴是否有一方应该提出交换呢?
启示:在密克罗尼西亚有这样一则笑话:十年前,一个有钱人乘快艇到太平洋的小岛上游玩,岛上的居民对他说:“你们有钱人真好,真羡慕你们!”而这位富翁却回答说:“别开玩笑了,我才羡慕你们呢!我努力工作有钱,好不容易放假才可以来岛上游玩,哪像你们就住在这里享受生活。”人们经常会陷入这种“这是理所当然”的错觉中,从而变得更贪得无厌,羡慕别人。
信息与理性
假如阿里和巴巴都是理性的,而且估计对方也是这样,那就永远不会发生交换的事情。这一推理过程的问题在于它假设对方交换钱包的意愿不会泄露任何信息。我们通过进一步考察一方对另一方思维过程的看法,就能解决这个问题。首先,我们从阿里的角度思考巴巴的思维过程。然后,我们从巴巴的角度想像阿里可能怎样看待他。最后,我们回到阿里的角度,考察他怎样看待巴巴怎样看待对自己的看法。其实,这听上去比实际情况复杂多了。可是从这个例子看,每一步都不难理解。
假定阿里知道自己的钱包里有160元,多于一般水平(比如他装这么多钱是为了到饭馆吃一顿大餐,或者要交纳某项费用),在这种情况下,他知道他的数目比较大,而对方钱包里装着320元的可能性很小,也就不愿加入交换。既然阿里在160元的时候不愿交换,巴巴应该在他80元的时候拒绝交换,因为阿里惟一愿意跟他交换的前提是阿里只有40元,若是这种情况,巴巴一定更想保住自己原来的80元。不过,如果巴巴在80元的时候不愿交换,那么阿里就不该在40元的时候交换钱包,因为交换只会在巴巴只有20元的前提下发生。
如果双方掌握了信息(一个人的钱包里一般情况下装多少钱),就会作出理性的决策。可是这是否意味着这个悖论就此破灭了呢?
换还是不换
看来,问题的答案在这两个人对“钱包里应该有多少钱”的常识性估计上,现在我们换一个故事,看看结果有什么不同。
现在有两个人,“酷毙”与“帅呆”,正在花园里一边喝着酒,一边讨论关于精灵的神话。正好有个精灵从此经过,被他们的对话吸引,精灵认为在这个时代,还有人这样仰慕和了解他们值得鼓励,于是便决定给这两个人一点奖赏。于是,他把一笔钱放入两个信封,将信封分给“酷毙”与“帅呆”,出于喜欢恶作剧的个性,精灵透露,这两个信封里金额不同,其中一个是另一个的两倍,但他没有说哪个多哪个少。然后精灵随着一缕轻烟消失无踪。
在精灵消失后,两个人拆开信封,偷看自己拿到的那笔钱,同时心里忖度着,自己到底拿到多的那份?还是少的?
,酷毙”心想:这是笔意外之财,我拿到的数额已经很不错了,如果这是多的那份,“帅呆”就只有我的一半;不过,他也可能很走运,拿到我的两倍。再回顾整个过程,精灵是先把钱装好,密封之后才随机发给我们,因此这是一个对等赌局,两人拿到大份的几率是一半一半。所以也许我应该跟“帅呆”谈个交易,互相交换。既然我赢得一倍金额和损失一半金额的几率都是50%,则仍有期待净利参照上面故事的逻辑。根据决策原则,“酷毙”认为这对他相当有利,便决定和“帅呆”交换。即使“酷毙”没有拆开信封也可以作出相同决定,因为支票的面额并不影响整个思考逻辑。
,帅呆”以同样的方式思考后,也认为与“酷毙”进行交易对自己较有利,于是当“酷毙”一提出交换的建议,“帅呆”马上欣然允诺。两人的情况完全一样,都认为自己能遵从一定的逻辑推理规范。那么,有没有可能两人同时都是对的呢?毕竟这是个零和游戏,“酷毙”赢就等于“帅呆”输,反之亦然,既然不能双赢,就一定有人是错的。但这两人不都是经过缜密逻辑思考了吗?
在竞赛中,双方都认为自己会赢,这在逻辑上当然站得住脚,在运动场上、恋爱或战争的情境里也都很常见。但在这个例子里,竞赛双方都很理性,这也就是悖论的所在。
逻辑中隐藏陷阱
你可能会问:这两个故事不是一样吗,何必要再讲一遍?
真的一样吗?想一想前面的例子是如何解决的?“救命稻草”是我们的生活经验,可是在这个例子里,没有这根“稻草”:别忘了,“酷毙”和“帅呆”对精灵的财富总量和慷慨程度完全没有概念,两人惟一的信息是自己手中信封的金额。这正是与前面的故事的不同之处。谁也不知道精灵到底有多少钱,以及到底有多慷慨。即使你拿到了1个亿,你也不知道到手的是不是多的那一份!
,酷毙”和“帅呆”两人都犯了一个首要的错误,以为中大奖的几率在拆开信封以前或之后完全没有两样。由于精灵在分信之前充分洗过牌,因此两人在拆开信封前得大奖的几率确实是一半一半,但当两人看过内容后,实在没有道理假设他们仍认为自己拿到小额支票的几率还是50%。
这么说吧,不论精灵的奖金是多少,l000元也好,10亿元也罢,他先把奖金分成不等的两份,再充分洗过,“酷毙”拿到任何一个信封的机会都是50%,到此都没有问题。不过在两人拆开信封查看后,情况就完全改观。
所以如果“酷毙”打开信封并发现自己拿到10万元,就可以推论总奖金只有两种可能:如果“帅呆”拿到5万,总数就是15万;如果“帅呆”拿到20万,总数就是30万,而他分到小包的。因此,“酷毙”要算的几率不是究竟自己拿到的是大包还是小包在信封发放前,机会应该是一半一半,而是究竟精灵给的是15万还是30万,这可就是完全不同的选择了。“酷毙”不应该还相信两者出现几率各是50%。如果他认为精灵的财力或慷慨程度有限,那么他应该设想最坏的状况:精灵给的是15万,自己已得到较大笔的奖金,所以不该交换,这个结论跟他一开始的想法正好相反。
当然,“酷毙”也可以假设精灵非常富有,送出个15万、30万根本不算什么。因此,两种情况都有可能,所以结论和先前想法一致,他应该交换。
重点是“酷毙”不能不顾手中拿的是百万还是更多,而做相同的假设,因为这里谈的是几率,它的基本原则为所有可能选择方案的几率值加起来一定要等于l,不论是“酷毙”、“帅呆”,还是精灵都不能改变这一点。所以不论金额多少,假设几率都一样,则其加总结果绝不会等于l。因此,“酷毙”和“帅呆”如果要作出理性决策,就必须估计精灵的财富到底有多少、奖金总额又有多高:而谁根据手中的金额把奖金总额估算得越精确,就越可能作出是否交换的最佳决策。至于手中拿到小额奖金的人会比较倾向交换,这本来就是很合理的。
这里要说明的是:谈概率时一定要弄清楚比较的选择方案究竟是什么。在“酷毙”、“帅呆”拿到信封前,他们拿到大额奖金的几率确实是各半,一旦信封发下来,原来的方案就消失,这时再谈既定事物的概率完全没有意义,也就是概率会随事件的发展、选择的改变或消失等而有所不同:在信封发下来后,应该考虑的方案就不再是谁拿到哪一个,而是精灵究竟给了多少。
一般人很容易把一组选择方案的事前概率误以为是其他方案的事后概率,两者根本风马牛不相及。就像赛马开闸后,马匹风驰电掣向终点进发,这时下注站绝对不会允许你加注。这实在太明显,但它却是本章的“悖论”根源所在。
启示:每个问题都隐藏着解决其自身问题的线索。如果对问题的探讨足够深入,就能够找到解决的方法。
,奖惩分明”
但其中一人是否能完全猜对呢?大概不能吧,因为他们对精灵的银行存款及慷慨程度了解有限。但有什么关系?就像现实生活里,猜得愈准的人,决策就做得愈好。如果你不想把希望寄托在老天开恩上面,智慧是救不了你的,你只有依靠情感这个朋友了。
现在,我们把问题修改一下:假如“酷毙”与“帅呆”正在说亵渎神灵的话,被精灵听到,于是勃然大怒,要给他们以惩罚。于是精灵写下两个数字,一个是另一个的两倍,谁抽到其中一个,就要挨上相同数目的鞭子。在这种情况下,两个人还要不要交换呢?
你会发现,这次两个人的选择完全不同了。“酷毙”发现自己抽到的是100,他当然巴不得换来一个50,可是他想:假如“帅呆”抽到的是200,这么一交换就要多挨100鞭,而最好的结果不过是少挨50鞭,权衡利弊,还是不要换了,老实挨这100鞭吧。“帅呆”也会这样想,所以谁也不愿交换,即使交换肯定对其中一人有利。
由此我们看到,在获得利益时,人们愿意承担某些风险;但是在付出代价时,人们就倾向于回避风险。“酷毙”可能想到“知足常乐”的古训,只要他相信自己不至于被打得没了命,他就不会去交换。
换到奖励的情况也是如此,理性的选择是:如果你对是否交换感到犹豫,你就不该交换。这个结论确实不令人满意,因为它不能从逻辑上告诉你怎样做才正确。在理智的尽头,能帮助我们的只有“知足常乐”之类的情感和直觉。
人往往是这样,到手的东西总不那么叫人满意。但是知道“适可而止”总不是坏事。
有句话说的是“孩子是自己的好,老婆是别人的好”,倒是对这一悖论的极好诠释。可是即使老婆真是别人的好,在“交换”之前,你也要三思,毕竟这个“不如别人”的老婆有个“别人不如”的孩子。
,破窗理论”
我们说过,悖论只存在于逻辑中,现实中不大会出现。但是有些社会现象还是很有悖论色彩的。
比如有这样一种经济学理论,一方面声名狼藉,另一方面却又常常被人这样那样地运用,这就是“破窗理论”。
法国19世纪著名经济学家巴斯夏提出了“破窗理论”(但他本人并不支持这个理论,相反,他总结它正是为了批判):一个小痞子砸碎了理发店玻璃窗,这一恶行对社会造成了破坏,但是理发师的不幸却是社会的福音,它将为玻璃生产商制造出商机,生产商拿到钱后又去购买其他生产商的产品……这样算来,他给社会造成的损害只是一次性的(只打碎那几块玻璃),可是他给社会带来的机会却是连锁性的(玻璃生产商、原料供应商、挖沙人、运输者……都得到了工作)。结论是:打碎一块玻璃,提供了无数金钱和就业机会,得大于失。用前面的例子说,这个交换很“划算”。因此,不良少年是社会的恩人,而不是罪犯。
大多数人都能指出其荒谬之处,如果破坏他人财物是好事,那么我们为什么还要惩治这类犯罪呢?倒是应该给他们奖励才是。如果那样,这个世界将乱成什么样子?而且,理发师的窗户被打碎了,他需要安装一扇新的窗户,他要动用一笔额外的费用。这笔费用本来可能是打算购买衣服的。但是新的窗户代替了衣服,也就是说玻璃生产商得到的正是裁缝所失去的。社会净福利依然没有什么增加,不良少年依然是危险分子。
但是,很多人(包括很多经济学家)却信奉经过变形的“破窗理论”,比如我们都听过关于“假日经济”(节日放长假可以拉动GDP上升百分之几)、“洪水经济”(发洪水有利于扩大内需)之类高论,就连美国出了“9·11”事件,也有人认为,这有可能成为拉动美国(甚至全球)经济复苏的机会。
,破窗理论”的谬误,根源在于不知道“资源是稀缺的”,在一个地方没有必要地消耗资源,在另一个地方就要闹资源短缺。你把全世界的窗户都砸掉,做玻璃的当然是发财了,可做衣服的却都饿死了。做玻璃的没有衣服穿,早晚也得冻死。况且,做衣服的不买粮食,食品店老板没有生意做,种地的农民也卖不出粮食,所以也没钱买别的……换言之,你不能计算收益时用“连锁性”,而计算成本时就忘了这一点。
启示:用一句话简单总结“破窗理论”的“精髓”,那就是“坏事变好事”。如曼德维尔在《蜜蜂的传说》中宣称的那样:个人的恶行对公众来说是一种美德。奢侈腐化的社会享受极大的繁荣,而勤俭的社会将饱受经济萧条的折磨,结论是“纯粹的美德不能为国家带来繁荣”。
藏羚羊与毒品
珍稀动物保护问题也遇到一个难解的矛盾。如藏羚羊被捕杀,是因为“怀璧其罪”:藏羚羊毛在法语中被称为“莎图什”,意为“戒指披肩”——因为一条藏羚羊毛披肩可以从指环中穿过,如此柔顺轻暖,是制作高档毛织物的理想材料。
如此珍稀的资源,当然禁不起物欲横流的消耗,藏羚羊的生存岌岌可危。政府禁止猎杀,严惩盗猎者,当然是正确之举。可是这又引起了一个新麻烦:抬高了藏羚羊毛价格(还记得《大腕》中的名言吗:“能出2000美金的主儿,就不在乎出4000美金。”而且,4000美金反而更能显示其身价),使盗猎成了“高风险、高收益”的生意,于是,更多的亡命之徒加入盗猎者的行列。
怎么办?允许随便捕杀肯定不是办法:没等价格下来,藏羚羊就被打光了。人工饲养理论上似乎可以,但是技术上未必可行,而且,一旦允许藏羚羊交易,野生饲养又很难分辨,可怜的野生藏羚羊还是要被捕杀。这真是一个难以解决的问题。
还有一个例子是麻醉品(毒品)问题。毒品之害,人所公认,可是在荷兰等国家,买卖轻度麻醉品却是合法的。很多学者,包括两位诺贝尔经济学奖得主弗里德曼和贝克尔,也都公开支持麻醉品合法化。
他们的理由如下:
第一,我们缺乏道德上的理由,去惩罚那些自杀的人。既然如此,对那些自愿用麻醉品慢性自杀的人,我们又有什么理由去惩罚他们呢?我们当然可以用言语来劝说,但我们没有权利阻止和惩罚他们。
第二,麻醉品合法化后,“自愿”食用麻醉品的人数可能会上升,也可能会下降,但“被迫”食用麻醉品的人数肯定会下降。要知道,现在很多瘾君子都是受害人,他们是因为上当受骗而成为瘾君子的,在麻醉品非法的情况下,瘾君子无法通过正当的途径获取麻醉品,犯罪分子于是产生强烈的动机,要诱骗别人上瘾,通过麻醉品盘剥别人的财富。当麻醉品非法时,只有社会上的恶棍才敢铤而走险去贩卖,并恶意地拉人下水;当它合法时,正当的商人也会去贩卖,但不会强加于人。
第三,由于麻醉品只能在地下买卖,所以品质得不到保证,瘾君子的身体会受到更严重的损害。
第四,管制之下,麻醉品的价格极高,这会诱使瘾君子从事其他犯罪活动。一旦放开管制,麻醉品的价格就会暴跌,原来靠贩卖麻醉品牟取暴利的黑社会分子,会一下子失去了赖以为生的温床,而瘾君子从事其他犯罪活动的机会也会减少。
这些论证的确有些“惊世骇俗”,也未必真正实行得了,但是想一想,你也会承认有一些道理。我们都知道“两害相权取其轻”,可问题是有时候我们真的弄不清孰轻孰重。
说到这里,我们就不得不对“人类理性”做一番思考了:理性当然是不可缺少的,但是它是否能够“包打天下”呢?在下一章,我们将讨论这个问题。
启示:许多年以前,美国重量级拳王吉姆在例行训练途中看见一个渔夫在打渔时总是将大鱼放回去,只留下小鱼。吉姆好奇地问那个渔夫原因。渔夫答道:“老天,我真不愿意这样做,但我实在别无选择,因为我只有一口小锅。”许多时候,我们每个人都会面临这样的两难境地。
第13章 理性与非理性经济学建立在两个假设前提上,其一,人是自私的,都在追求利益的最大化;其二,人是理性的,其所有行为都是为了实现追求利益最大化这个目的。换言之,人不但知道自己的利益所在,而且知道该如何去追求。
理性的困境
经济学建立在两个假设前提上:其一,人是自私的,都在追求利益的最大化;其二,人是理性的,其所有行为都是为了实现追求利益最大化这个目的。换言之,人不但知道自己的利益何在,而且知道该如何去追求。他可以“损人利己”,也可能“利人利己”,但并不会去“损己利人”、“损人损己”和“损人不利己”。
这里有两个疑问,一个涉及道德,即如何解释某些“毫不利己,专门利人”的高尚行为;另一个涉及理性,在现实中,我们都见到过“损人损己”和“损人不利己”的行为,又该如何解释?
道德问题我们会在稍后讨论,这里主要探讨人类的理性问题:人是否聪明到了知道自己利益所在,并知道追求利益的正确途径?
有这样一个博弈:
两人分一笔总数固定的钱,比如100元。方法是:一人提出方案,另外一人表决,如果表决的人同意,那么就按提出的方案来分,如果不同意的话,两人将一无所得。比如A提方案,B表决,假如A提的方案是70:30,如果B接受,则A得70元,B得30元;如果B不同意,则两人将什么都得不到。
你也许要怀疑这种情况完全是虚构出来的,没有什么现实意义,其实并不如此。在现实中,这种情况有可能出现。比如,一个宾馆服务员捡到了100元,他想据为己有;可是另一个服务员看到了,于是威胁如果不分给他一部分,他就要向领班报告,在那种情况下,这笔钱就要上缴,谁也得不到。你可能又要说,这两个人的境界太低。需要再次申明,这里探讨的是理性(即“合理自私”)问题,而不是道德问题。
A提方案时要猜测B的反应,A会这样想:根据“理性人”的假定,A无论提出什么方案给B——除了将所有100元留给自己而一点不给B这样极端的情况,B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99:0.01。B接受了还会有0.01元,而不接受将什么也没有。
这是根据理性人的假定的结果,而实际则不是这个结果。英国博弈论专家宾谟做了实验,发现提方案者倾向于提50:50,而接受者会倾向于:如果给他的少于30%他将拒绝,多于30%则不拒绝。这个博弈反映的是,“人是理性的”这样的假定在某些时候存在着与实际不符的情况。
启示:大多数道德实际上有利己成分,或者从长远说,是“利人利己”的。某些自我牺牲的行为虽然存在着,但并不普遍,且不足以动摇人类的行为趋向。
要买一张彩票吗
理论的假定与实际不符的另外一个例子是“彩票问题”。
我们说理性的人是力图使自己的效益最大,如果在信息不完全的情况下则是使自己的期望效益最大。但是这难以解释现实中人们购买彩票的现象。
人们愿意掏少量的钱去买彩票,如福利彩票、体育彩票等,以博取高额的回报。在这样的过程中,人们自己的选择理性发挥不出来,而惟有靠运气。在这个博弈中,人们要在决定购买彩票还是不买彩票之间进行选择。根据理性人的假定,选择不买彩票是理性的,而选择买彩票是不理性的。
因为彩票的命中率肯定低,并且命中率与命中所得相乘肯定低于购买的付出(如你花费2元买一张彩票,假定最高奖金是100万元,中奖概率是百万分之一,你其实已经亏了),因为彩票的发行者早已计算过了,他们通过发行彩票将获得高额回报,他们肯定赢。在这样的博弈中,彩票购买者是“不理性的”:他未使自己的期望效益最大。但在社会上有各种各样的彩票存在,也有大量的人来购买。可见,理性人的假定是不符合实际情况的。
当然我们可以给出这样一个解释:现实中人的理性的计算能力往往用在不符合实际情况的“高效用”同题上,而在“低效用”问题上,理性往往失去作用,对于人,存在着“低效用区的决策陷阱”。在购买彩票问题上,付出少量的金钱给购买者带来的损失不大,损失的效用几乎为零,而所能命中的期望也几乎是零,这时候,影响人抉择的是非理性的因素。比如,考虑到如果自己运气好的话,可以获得高回报,这样可以给自己带来更大的效用,等等。彩票发行者正是利用人存在着“低效用区的决策陷阱”而寻求保证赚钱的获利途径。
,旅行者困境”
即使是二人同时决策,博弈论也为我们提供了警示世人别太“聪明”的例子:两个旅行者从一个以出产细瓷花瓶著名的地方旅行回来,他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了。他们向航空公司索赔。航空公司知道花瓶的价格总在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲真话,于是按照他们写的数额赔偿;如果两人写的不一样,航空公司就论定写得低的旅客讲的是真话,并且原则上照这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
就为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。可是不,甲很聪明,他想:如果我少写l元变成99元,而乙会写100元,这样我将得到101元。何乐而不为?所以他准备写99元。可是乙更加聪明,他算计到甲要算计他写99元,“人不犯我,我不犯人,人若犯我,我必犯人”,他准备写98元。想不到甲还要更聪明一个层次,计算出乙要这样写98元来坑他,“来而不往非礼也”,他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的田地。事实上,在彻底理性的假设之下,这个博弈惟一的纳什均衡,是两人都写0。
这就是哈佛大学巴罗教授提出的著名的“旅行者困境”。一方面,它有启示人们在为私利考虑的时候不要太“精明”,告诫人们精明不等于高明,太精明往往会坏事;但是另一方面,它对于理性行为假设的适用性提出了警告。
有了这个假设,我们就可以按照这个明确的比较取舍标准来推理,但是推断出来的结论是否符合实际,依赖于应用“理性行为”假设的程度。如果你的论证像“旅行者困境”那样,假设当事人彻底理性,能够算计到十几步甚至几十步,那么你推论出的结果,未必符合现实。
大家知道,理性行为假设是讨论消费者和企业这些经济主体人的行为的基本假设。所以经济学在理性行为假设之下得到的结论是否符合实际,还要进行另外的分析。在这个意义上,“旅行者困境”是所有博弈论学者甚至所有经济学者必须面对的困境。
启示:一位富翁的狗在散步时跑丢了,于是他急匆匆地在电视台发了一则启事:有狗丢失,归还者付酬金1万元。并有小狗的一张彩照,充满大半个屏幕。一位乞丐看到广告后,第二天一大早就抱着狗准备去领酬金。当他经过一家大百货商场的墙体屏幕时,又看到了那则启事,不过赏金已变成3万元。乞丐又折回他的住处,把狗重新拴在那儿,在接下来的几天时间里,乞丐从没有离开过这只大屏幕,当酬金涨到使全城市民都感到惊讶时,乞丐返回他的住处,可是那只狗已经死了——在这个世界上,金钱一旦被作为某种筹码,就不会再买到任何东西。
强盗分赃
如果你对自己的头脑很有自信,来看看这个问题:有五个强盗抢得100枚金币,在如何分赃问题上争吵不休。于是他们决定:(1)抽签决定各人的号码(1,2,3,4,5);(2)由1号提出分配方案,然后5人表决,如果方案超过半数同意就被通过,否则他将被扔进大海喂鲨鱼;(3)1号死后,由2号提方案,4人表决,当且仅当超过半数同意时方案通过,否则2号同样被扔进大海;(4)依次类推,直到找到一个每个人都接受的方案(当然,如果只剩下5号,他当然接受一人独吞的结果)。
假定每个强盗都是经济学假设的“理性人”,都能很理智地判断得失,作出选择。为了避免不必要的争执,我们还假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化?
据说,凡在20分钟内答出此题的人有望在美国赚取8万美元以上的年薪,还有人干脆说这其实就是微软员工的入门测试题。
希望拿到年薪8万美元或者进入微软的大有人在,你可能也是其中之一,如果是这样,你不妨先停下来,花上20分钟,好好做做这道题。如果你没有这份耐心,就接着往下看。
出乎意料的答案
这道题十分复杂,很多人的答案都是错的。为了叙述方便,我们先公布答案,然后再做分析。
这个严酷的规定给人的第一印象是:如果自己抽到了1号,那将是一件不幸的事。因为作为头一个提出方案的人,仅仅能活下来的机会都微乎其微。即使他自己一分不要,把钱全部送给另外4人,那些人可能也不赞同他的分配方案,那么他只有死路一条。
如果你也这样想,那么答案会大大出乎你意料。许多人公认的标准答案是:1号强盗分给3号1枚金币,4号或5号强盗2枚,独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。
只要你没被吓坏,你就可能站在这四人的角度分析:显然,5号是最不合作的,因为他没有被扔下海的风险,从直觉上说,每扔下去一个,潜在的对手就少一个;4号正好相反,他生存的机会完全取决于前面还有人活着,因此此人似乎值得争取;3号对前两个的命运完全不同情,他只需要4号支持就可以了;2号则需要3票才能活,那么,你……
思路对头,但是太笼统了,不要忘了我们的假设前提:每个人都十足理性,都不可能犯逻辑错误。所以,你应该按照严格的逻辑思维去推想他们的决定。
从哪儿开始呢?前面我们提过“向前展望,倒后推理”,推理过程应该是从后向前,因为越往后策略越容易看清。5号不用说了,他的策略最简单:巴不得把所有人都送去喂鲨鱼(但要注意:这并不意味着他要对每个人投反对票,他也要考虑其他人方案通过的情况)。来看4号:如果1~3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。
3号知道这个策略,就会提(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为己有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票他的方案即可通过。
不过,2号推知到3号的方案,就会提出(98,0,l,1)的方案,即放弃3号,而给予4号和5号各1枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。不过,2号的方案会被l号所洞悉,l号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号1枚金币,同时给4号或5号2枚金币。由于l号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投l号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入腰包。这无疑是1号能够获取最大收益的方案了!
难以置信,是不是?难道上面的推理真是毫无破绽吗?
应该说,还真有一个模糊不清之处:其实,除了无条件支持3号之外,4号还有一个策略(这是许多专家都没有考虑到的):那就是提出(0,100)的方案,让5号独吞金币,换取自己的活命。如果这个可能成立的话(不要忘了“完全理性”的假定,既然可以得到所有钱,5号其实并不必杀死4号),那么3号前面的策略就显然失败了,4号如果一文不得,他就有可能投票反对3号,让他喂鲨鱼。
你可能要反对:作为理性人,4号干吗要做“损人不利己”的事呢?而且,这多少还要冒可能被扔下海的风险?
是呀,有道理。可是,如果大家都是理性人,5号在得钱后可以不杀死4号,那么对4号来说,投票赞成和投票反对3号都是一样的,也就是说,无论他怎么选择都可以。3号当然不应该把希望寄托在4号的随机选择上。
如果我们允许有一点点“非理性”存在,即5号还是可能在不必要的情况下杀死4号,那么4号是不该冒这个风险;可是同理,3号也不该冒没有必要的风险。无论是哪种情况,他都应该给4号1枚金币,使其得到甜头,支持自己。这样他的“保险方案”就是(99,1,0);相应地,2号的方案也要修改一点,比3号多给4号1枚,使其支持自己,也就是(97,0,2,1)。对于1号来说,倒是不必多掏钱,而是减少了两枚金币收买4号这一种可能性,也就是说,前面所说的“标准答案”只剩下了一种,即(97,0,1,0,2)。当然,他也可以选(96,0,1,3,0),但是由于收买4号要比收买5号多花1枚金币,所以也就算不上“最佳”方案了。
启示:人们心中总认为金钱是万能的,能获得安全感,能带来感情,甚至可以改造一切,所以,人们无所不用地追逐致富的公式。然而,这种贪念却常超过主观的需要与客观的供给。当然,结果总未必尽如人意。
,先发优势”和“后发优势”
在研究博弈理论的人看来,“强盗分金”其实是一个高度简化和抽象的模型(非数理模型),但无疑以现实为基础。在“强盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
想一想历朝历代的农民起义,想一想绵延不断的宫廷斗争,想一想今天生活中存在的结盟与背叛,想一想企业内部的明争暗斗,想一想办公室脚下使绊的政治,哪一个得胜者不是采用类似“强盗分金”的办法?
还可以举出许许多多的例证来。比如,在国际政治、经济中,各国的地位是不平等的,存在着“先发”和“后发”的区别,正如这个游戏中每个人的顺序。1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家先发优势吗?而5号看起来最安全,甚至还能坐收渔人之利。却因不得不看别人脸色行事而只能分得一小杯羹。这难道不是后发劣势的写照?可以预料,如果中国人总是处于5号位置,总是坐等别人制定规则,就无法避免“看人脸色”的不利处境。
启示:有两句似乎矛盾的成语:先发制人和后发制人。与此相对应的是所谓“先发优势”和“后发优势”。所谓“先发优势”是指一步领先,步步领先的“马太效应”;而“后发优势”是指可以在前人发展的基础上发展,而不必付出探索的成本和代价。
都是理性惹的祸
,强盗分金”模型虽然是一个有益的智力测验,但应用于现实仍显粗糙不堪,与现实世界的精致模型相比要远为复杂。
首先,现实中肯定不会是人人都绝顶聪明兼“绝对理性”。回到“强盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明兼绝顶理性的假设,强盗1号保不准就会被扔到海里去了。所以,1号首先要考虑的就是他的强盗兄弟们的聪明和理性究竟是不是靠得住,而断断不敢自取97颗金币,拼了性命去狂赌。
偏好和效用及其替代是另外的一个大问题。现实中人们是如此的复杂,某人的神经末稍微偏离一毫,就可能表现得对金币满不在乎而偏偏喜欢看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得计的方案岂不成了自掘坟墓?
再就是俗话所说的“人心隔肚皮”。这翻译成经济学语言则是信息不对称。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。譬如,2号完全可以对3、4、5号大放烟幕弹,假称基于l号所提出的任何分配方案,他一定会再多加上一个金币给他们。果真如此,结果又当如何?
还有比上述情形更复杂的。让我们试考虑分配规则变化的情形。
通常,在现实世界中,人人都有自认的公平标准,因而时常会嘟囔:“谁动了我的奶酪?”可以料想,一旦1号所提方案和其所想的不符合,就会有人大闹。当大家都闹将起来的时候,l号能拿着97枚金币毫发不损地、镇定自若地走出去吗?最大的可能就是,强盗们会要求修改规则,然后重新分配。
假如由一次博弈变成重复博弈呢,比如,大家讲清楚下次再得100枚金币时,先由2号强盗来分,然后是3号……“轮流坐庄”,这倒颇有点像西方国家的两党政治,当然,你也可以说,其实是民主制度下的分赃制。
可能还会有比这闹得更凶的。比如,四人会想:l号居然要独得97枚金币,这简直是赤裸裸的剥削嘛!于是,他们立即起来“造反”,组成一个反l号的大联盟并制定出新规则:四人平分金币,独将l号扔进大海……
无须更多讨论,我们或许能够同意:现实的确是太复杂了,“强盗分金”之类的题目尽管很聪明,而且不乏启发性,但也只能是“模型”而已。
启示:成功者最主要的工作,就是在最后如何做决定。当你做出高人一等的决策时,最好把它当做是侥幸,惟有如此,才能使你自己更谨慎,更成功。
非理性还是理性
,非理性”似乎是个贬义词,可事实上,正是许多所谓“非理性”的行为促进了人类的福利。就拿前面那个分钱的游戏来说吧,拒绝只得1分钱的分配方案真的不理智吗?如果同意,你得到1分,对方获得99.99元,对方从你身上占尽了便宜;可是如果你拒绝,那么你所损失的也就是这1分钱,而他损失99.99元,比你的损失要惨重得多。既然对于双方达成交易的收益如此不平衡,那么到底是你不“理性”,还是提出这么个自作聪明的分配方法的他不“理性”?
这类“非理性”行为正是依据人所推崇的“以直报怨”原则,我们的“公平”、“正义”等等观念都是建立在这一基础上的,如果这不叫理性,那么什么才叫理性?
回报伤害的确不能医治已有的伤害,正如惩罚一个杀人犯,被害者也不能复生一样,但是它能有效防止新的伤害。现在有人告诉你:反正人已经死了,属于“沉没成本”,再怎么也回不来了,何必再耗费社会资源惩罚罪犯呢?你一定会骂他“混账”而不会夸他“理性”。
而且,仅仅从策略的角度说,这种拒绝合作的“非理性”行为也是可取的,它其实有这样的意思:你受的伤害,远远大于我受的伤害。如果你要避免这种最坏结果,你就不要伤害我。事实上,聪明人都懂得不要把事情做得太过火,古代的“明君”轻徭薄赋,也正是这个道理。只有那些昏君、暴君才会横征暴敛,就是因为他们把老百姓看得太“理性”,以为只要人民能对付活下去,就不敢造反寻死。这倒也不算错。可往往是这样:你越“理性”,对方就越“不理性”,你已经受不住了,可他还认为有“利润空间”,继续压榨不休——正如我们在“剃刀边缘”一章中谈到的,人们很难知道“临界点”的确切位置——终于弄到官逼民反、玉石俱焚的地步,莫非这个结果该怪老百姓“理性”不够吗?
不要目光短浅
其实,理性与非理性的区分,往往要看人们关注的目标,或者说,是短期利益与长期利益的不同。
许多夫妻经常为了一些鸡毛蒜皮的琐事大吵大闹,这当然可以被认为是非理性的,事过境迁,当事人可能也觉得不值得。可是下一次还是要吵闹,为什么?除了顾及面子这类“人性弱点”外,吵闹还有一个争夺家庭控制权或维护自身“话语权”的微妙作用。我们都知道“小洞不补,大洞尺五”的道理,在一些小事上退让是理智的,可是谁能保证这不会助长对方的气焰,并最终导致自己权利的丧失?所谓“不值得”的感觉并不是因为打架伤害感情,而是人们发现不能“一战定乾坤”:吵了闹了,可是没什么用处,下次还是要再交锋。
把这个问题放大看,民主政治中各种利益集团的争吵都具有“夫妻吵架”的含义。我们时常可以看到某某国家政府、议会间僵持不下,导致效率低下、政府更迭或解散议会的事件,这些事件中当然有“非理性”的成分,但是比较合理的政治不正是在各利益集团的交锋中达成的吗?
有这样一个故事:一个男孩被视为傻瓜,因为每当别人拿一枚一角的硬币和一枚五分的硬币让他选择时,他总是选五分的硬币拿。有一个人觉得很奇怪,就问这个男孩:“为什么你不拿一角钱的?”小男孩小声回答:“假若我拿的是一角硬币,下一次他们就不会拿钱来给我选了。”
这是目光长远的最佳例子。这个男孩选五分的硬币拿,从短期效果看“非理性”,但他明白这样可以长期拿下去;选一角的硬币,只能有眼前的利益,实际上并不是好办法。
战术运用的目的是在“争取主要的策略性目标”。一旦一个人开始将战术目标想成最后目标,那他就看不见策略目标了。在谈判中,双方有时都会运用以进为退和以退为进的战术,你不能因此忘掉谈判的最后目的。你有时候也可以故作让步,把对手诱到不利位置。一位将军也许会假装败退,将敌人诱入不利的位置而加以歼灭。
启示:任何时候,只要可能,我们必须做最有成效的事情。
此一时,彼一时
我们已知要通过决策使可能的利益达到最大限度的原则,我们还知道,要完成这样的最优化决策需要对所有信息进行全面的合理的评估。然而,在实际的决策中,最优化很难实现,即使实现了,也是暂时的。原因就在于,我们并不知道此时此地我们是否已经掌握了所有的与抉择有关的信息,或者,我们不能确切地判断这些信息是否会随时间的推移而有所改变。实际上,我们每时每刻都在接受着各种信息,它们可能会对现实的问题及有关决策产生影响。如果不能对此有充分估计,如果在决策中只注重对现有信息的处理而忽视可能出现的变化,则很难使决策最优化,甚至每当你作出一个选择时,你会发现它已经过时了,不适用了。
我们来看这样一个事例。一个大学生打算买一部照相机,他积攒了足够的钱进城去。他来到甲商店,这里他看到了心目中所期望的那种型号的相机,标价是165元。他觉得这价钱可以接受,但他又想:货比三家不吃亏,最好还是再去别的地方多转转,或许还有更便宜的价格。他的这种想法无疑是正确的。从信息论看,多了解一些行情,才能作出最佳选择。于是他又来到了乙商店,也找到了那种型号的相机,可标价却185元,整多出了20元。显然在这里买太亏了。他毫不犹豫地退出了这家商店,决定再去找一家看看。他转了许久,又到了丙商店,也看到有那种型号的相机出售,标价是170元。这标价虽不能说太高,可毕竟比甲商店里的价格贵了5元。该怎么样办呢?这时天色已晚,学生觉得又累又饿。究竟是该忍着饥饿与疲劳到甲商店去买便宜的相机?还是干脆买这170元的相机,早点儿回去吃饭休息?他想来想去,觉得不值得为5元钱再跑那么多路,于是选择了后者。
第二天,他不再饥饿了,体力已完全恢复了,昨天的疲乏消失得无影无踪。他开始后悔了,觉得昨天还是应该坚持一下,省下那5元钱。
事隔一天,这学生的决策完全不同了。可我们能说出哪个决策是正确的、哪个又是错误的吗?几乎不能。也许这学生当初的选择是对的,只不过今天情境完全不同了,他才转了念头。完全有这样的可能性:他昨天坚持了下来,又跑到甲商店省5元钱买下了相机,结果他太疲劳,第二天早上起不来,误了课,甚至有可能饿过头,闹起胃疼。那样他就会同样后悔:昨天不该为那5元钱去奔命,何苦弄成今天这个样子,太划不来了。
这样说来,无论他当初怎样抉择,他都终将会后悔的。这真是所谓“此一时也,彼一时也”,其实我们许多的实际抉择都受所面临的情境的牵制,而并非我们本身决策能力的高低所致。我们几乎永远都不可能掌握进入情境的全部因素。每时每刻都会有一些新的因素进入情境,而某些旧的因素则变得完全不重要了。于是,常常会有这种情形出现;此时作出的一个看来明显是很愚蠢的抉择,由于情境的变换,在彼时却俨然是最合乎逻辑和最明智的了。
因此,在实际的决策过程中,应把最大限度增大功利的原则作为一个根本性的基础,不仅应全面地评估各个因素,而且应对可能的因素的变化作出尽可能的预测,从而使决策具有更普遍的意义和价值,实现功利效应的连续性。
启示:一位法官提出三种惩罚方式让犯人自己选择。第一种是罚100块钱;第二种是抽50鞭子;第三种是吃下5公斤洋葱。罪犯既怕花钱又怕挨打,就选择了第三种。当吃下2公斤洋葱之后,他流着眼泪喊道:“我不吃洋葱了,我宁愿挨50鞭子。”当鞭子落在他背上时,他疼得大叫起来。当打到第10下时,他终于受不了了。“可怜可怜我吧,别再打我了,就让我出100块钱吧!”这个罪犯,他不想挨打,又不想出钱,结果受到了三种惩罚。如果你支配金钱,那它就是一个好的仆人;如果金钱支配你,那它就是一个坏的主人。
要冒险还是要成功
有人说:没有冒险的成功和没有成功的冒险都是没有价值的。尽管我们已对有关决策的策略及有关问题做了不少探讨,可实际情形中的决策仍然要复杂得多。我们以往的讨论是假定我们已经掌握了相当充分的信息,而且它们都是很明确的。然而,在现实中,我们常常面对的是不确定的情境。对于一个结果,我们知道它可能会发生,也可能不发生。这样,我们在决策时就既要评价可能的结果的功利,又要对这可能性究竟有多大加以考察,并不得不对实际将发生什么进行冒险。比如,你今天出门带上一把伞,其价值要依赖于今天下雨的可能性有多大,你是否要对你的家庭财产保险不仅取决于你的财产有多少,也取决于它是否安全,有多大可能性会遭到打劫。
人们在对功利和机遇两个因素进行综合考察,以决定是否进行冒险及如何冒险时,表现出某些特点。我们来看看下面的这个例子。
现在有一组选择。你宁愿:
1.肯定得到0.10元,还是有1/10的机会得到1元?
2.肯定得到1元,还是有1/10的机会得到10元?
3.肯定得到10元,还是有1/10的机会得到100元?
4.肯定得到100元,还是有1/10的机会得到1 000元?
5.肯定得到1 000元,还是有1/10的机会得到10 000元?
6、肯定得到1 000 000元,还是有1/10的机会得到10 000 000元?
首先,对于这一组选择的两种可能,人们是不无偏好的。对于选择1,你一般认为是值得冒险的,即宁愿只有十分之一的机会去得1元,而不愿就此拿上0.10元罢手。同样,你也会对10元冒险,而不愿就此只拿到l元。你大概也会对100元冒险,而不愿稳当地拿到10元。看样子,你一直都倾向于冒险,表现出对大额金钱的偏好。
然而,当选择进行到一定时候,你的喜好模式肯定会颠倒,不会再对大额金钱去冒险,而宁愿稳当地得到虽相对较小可也仍然不算少的一笔钱。除非你对冒险的刺激赋予极高的功利,否则你是不会不愿意稳妥地拿到100万元,而甘愿去冒只有1/10的可能拿1000万元的风险的。
在选择时,人们对较小的数额似乎觉得冒险的意义或者随机取胜的可能性较大,于是甘愿冒险。但随着数额(即功利价值)的增大,人们对冒险变得越来越谨慎,似乎侥幸取胜的可能性变小了。其实,在这一系列选择中,冒险取胜的可能性是一样的,都是1/10。只是由于功利变大,其对人的重要性也增大,从而产生对机遇判断的错觉。
每一个人转变其选择的偏好模式即从冒险改为稳妥地获取有把握的东西的转折点是不同的。这依赖于人现有的财富和经济价值观。越是富有的人,越是敢于冒险下大赌注,因为无论是小输还是小赢,对他来说都没有什么意义。然而,对于街头的乞丐,对于极端贫困的人来说,他可能甚至宁愿选择有把握拿到的0.10分,而未必会为把握不大的1元而冒险。因此,一个特定对象的价值既与其功利、出现的可能性的大小有关,也还与评价者本人的特点、与他的经济状况和价值观有关。通过了解一个人在上述六项选择中的哪一个转换其偏好模式,我们可以大致了解他的经济状况和价值态度。
这样,我们在进行决策时,就应当在功利、机遇、个人条件三个方面上展开我们的思考,若有遗漏或不慎,就难免作出错误的决策。
当你要冒险时,务必“三思而后行”。
启示:有冒险而成功的将领,没有无备而胜利的军队。在不曾达到目的以前,尽可能保存好每一个铜板,尽可能不被眼前的事物牵绊,这是成功的必备条件,因为前面的路说不定很长。
理性假设有用吗
如果经济学建立在一个不可靠的理性假设上,那么它还有什么用呢?的确,不能说理性假设很完美,否则,经济学家们就可以跑到股市上大赚一把,而不会在几乎所有问题上都争论不休了。
但是我们不能否认,理性假设还是很有用,尽管有各种非理性行为存在,但是总体而言,人们还是懂得权衡利弊,并作出于己有利的选择。前面的例子之所以“不合情理”,是因为经济学家或博弈论专家为了说明道理,将理性“极端化”了。它们更像“守株待兔”、“郑人买履”之类的寓言,内容虽然荒诞,但内涵合理。 其实,我们不必把理性看得太理想化或者高深莫测,生活中有大量理性选择的例子。如普通百姓常说的“胳膊拧不过大腿”、“人在屋檐下,怎能不低头”、“吃亏是福”等等,都是理性的表现,也正是前面那些例子中想要说明的道理。
其实,人类的非理性并不集中体现在利益分配上,而是体现在对客观事物的错误认识上。但这并非理性的困境,而是由于知识的缺乏导致的“非理性困境”。
举个例子:“计划生育”在中国已经实行了20多年,但是“一对夫妻一个孩”只是在城市得到了比较严格的贯彻,在广大农村地区,很多家庭会生育几个小孩,至少在有一个男孩之前,人们不愿停止生育。这倒未必是农民兄弟观念落后的表现,而是家庭农业生产确实需要男丁。现在请考虑这个问题:假如每个家庭都要生一个男孩才肯停止生育,会不会导致人口比例失调?
答案是不会。很简单,每个家庭生育头胎的机率,男女比例是1∶1;生育第二胎的比例仍然是1∶1;第三胎还是一样,在每一轮生育中,女孩的数目总是趋向于与男孩的数目相等,因此男孩与女孩的比例是永远也不会改变的。既然在任何一轮的生育中,男孩对女孩的比例都是1∶1,那么当你把各轮生育的结果全部加起来以后,比例始终保持着1∶1。只要排除流产女婴的人为因素,男女比例就不会失调。
所以说,与其为人类理性的局限担忧(当然,这些局限确实存在,后面我们还要讨论),还不如通过不断发现和掌握新知,使我们摆脱非理性的困扰,决定我们的对策和选择。
第14章 阿罗“不可能”定理简单地说,政治就是人的组织艺术。完美的政治是可能的吗?阿罗“不可能”定理给了我们一个答案。你可能对此感到失望,但是,宁可知道不存在答案的问题,也决不要假装不存在任何问题。
阿罗“不可能”定理
我们有时会陷入因选择太多而无所适从的局面,在前面的“约会游戏”中,我们的规则是不允许把约会对象一个个比较,其实,即使允许这样做,也未必能找到“最理想”的一个。比如,A、B和C都很不错,但是各有特点:A很风趣,B很成熟,C很浪漫,让你决定不下。能不能给这三种特点排坐次呢?你可能觉得风趣不如成熟可靠,可成熟没有浪漫有情调,而浪漫呢,又不如风趣那样让你开心!所以有句俏皮话说:一个女人需要三个丈夫!
这还只是个人选择,如果要很多人在这些特点中作选择(比如你的父母、姨妈、兄弟姐妹都很关心你的终身大事,都来发表意见),那么想要得出一个大家满意的结论几乎就是不可能的。当然,这件事还是可以由你做主(毕竟是你自己的事嘛),可是如果换成全家商量要去三个地方旅游,或添置什么大件商品,又该如何决断呢?换成一个团体乃至一个国家,又会怎样?
对于社会的选择问题,斯坦福大学教授肯尼思·阿罗由这一类难题中,得出了著名的“不可能”定理。阿罗认为,在非独裁的情况下,任何一个体系,若要将人们对三个或三个以上的选择作出一项集体抉择,不存在任何加总社会个体成员偏好的方法。
所谓加总社会偏好,即找到一个社会偏好函数,它必须同时满足以下几个最基本的要求:(1)传递性,(2)全体一致性,(3)不相关选择的相互独立性,(4)非独裁性。传递性的要求是,假如人们在A和B之间选择A,在B和C之间选择B,那么人们在A和C之间必然选择A。全体一致性的要求是,假如在A和B之间一致倾向于A,那么,人们就会选择A而非B。不相关选择之间的相互独立性的要求是,人们在A和B之间作的选择并不取决于是不是存在另外一个选项C。非独裁性的要求是,没有任何人可以每次都得逞,因而不存在独裁的力量。
启示:有人问英国经济学家悉尼·韦布的妻子比阿特里,为什么对一些当代重大问题,韦布家的观点是如此的一致?这位跟丈夫合作写了许多有深远影响著作的妻子解释说,在结婚时我们就商量好了,在重大问题上要意见一致,“悉尼决定我们怎样投票,我则确定什么是重大问题。”
民主是一种妄想或自相矛盾
自从1951年肯尼思·阿罗令人信服地论证出了这个结论,即任何可以想得出的民主选举制度可能产生出不民主结果,这一论证使数学家和经济学家感到震惊。阿罗这种令人不安的对策论论证立即在全世界学术界中引起了评论。
1952年,后来在经济科学方面获诺贝尔奖的保罗·萨缪尔森这样写道:“这证明了探索完全民主的历史记录下的伟大思想也是探索一种妄想、一种逻辑上的自相矛盾。现在全世界的学者们——数学的,政治的,哲学的和经济学的——都在试图进行挽救,都试图挽救阿罗的毁灭性发现中能够挽救出的东西,对数学政治来说,这一发现就是1931年库尔特·哥德尔的数学逻辑的不可能证明一致性定理。”
阿罗的论证,称之为不可能性定理(因为它证明了完全民主在事实上是不可能的),该论证帮助他于1972年获得了诺贝尔经济科学奖。对策论中最早的和最惊人的成果之一,也就是阿罗的“毁灭性发现”所产生的影响使人们至今还能感觉到。
在民主投票中所固有的不民主悖论可以用一实例进行很好的解释。
假定有三个候选人——甲、乙、丙,民意测验表明:选民中有2/3愿意选甲而不选乙,2/3愿意选乙而不选丙,那么是否意味着,喜欢甲的选民一定超过喜欢丙的?
未必!如果选民的态度有三种,分别是:甲、乙、丙;乙、丙、甲;丙、甲、乙,持三种态度的人各占总数1/3,那么就会出现一个怪圈:2/3人喜欢甲超过乙,2/3人喜欢乙超过丙;2/3人喜欢丙超过甲!
这个例子反映的道理是深刻的,如果是社会对几个方案进行表决,如国家选举总统、某个城市让市民决定先修建哪个公共事业工程,等等,社会投票很可能得出矛盾的结果。
既不一定正确,也不一定公平
阿罗定理指的是,社会没有一种“客观的”反映群体的社会偏好的方法。如果某种偏好得以反映出来,如小布什而不是戈尔当选美国第53任总统,完全取决于所确定的“民主”的选举规则。另外一套规则得出的完全可能是另外一种结果。
戈尔比小布什多几十万张选票,然而美国实行的投票人制度是,谁获得了某一州的多数票,那么他就获得该州所分配的选举人的选票。小布什与戈尔之争的关键是佛罗里达州的选举结果,布什获胜就在于他以微弱优势获得了佛罗里达州的25张选举人票。最后,小布什与戈尔的选票之比为277:266。小布什获胜。
你会说,通过一次性投票来决定谁当选,这应该是合理的,即对候选人或候选方案进行一次性表决。但是,这很有可能让选民最不喜欢的人或方案当选。
举一个例子。假定有4个人,他们是A、B、C、D,假定有26%的人“最喜欢”A,各有25%的人“最喜欢”B和C,有24%的人“最喜欢”D。现在进行一次性投票,A当选。而很有可能的情况是“最喜欢”B、C、D的那些人“最不喜欢”A,即:“最不喜欢”A的人有74%!在这种规则下,最多人“最不喜欢”的人当选了!这样的规则合理吗?
如果有一种确定了的规则,并且候选人的竞选纲领在选民心里得到确定的定位,即每个选民针对不同的候选人确定了其偏好程度,那么结果是确定的。而为什么不同的候选人同意同样的规则呢?因为,每个候选人总会尽量以其竞选纲领及个人魅力赢得选民的偏好。这里有一个真理:假如你的竞选纲领及个人魅力赢得了所有的选民,即对所有选民进行偏好排序你都是在最前面的,那么在任何选举规则下你都会被选中。同样,如果你永远排在最后面,那么无论什么规则,你都不会被选中。这一点可以用数学证明。
同时,候选人接纳某种民主的选举规则而参与竞选,是因为他无法预先知道每个选民的偏好。民主的选举是人们以此来揭示选民的心理排序情形的方法。阿罗不可能性定理正说明了人的有限理性的悖论。
此外,阿罗定理说的是,社会的选择方法不可能既是有效率的,又是民主的。因为循环投票本身就是无效率的。而有效率的方式必须是独裁的。这就再次揭示了民主和效率的矛盾。
启示:美国南北战争结束后,一位叫马维尔的记者去采访林肯,他们之间有这么一段对话。马维尔:“据我所知,上两届总统都曾想过废除黑奴制,《解放黑奴宣言》也早在他们那个时期就已草就,可是他们都没拿起笔签署它。请问总统先生,他们是不是想把这一伟业留给你去成就英名?”林肯答:“可能有这个意思吧。不过,如果他们知道拿起笔需要的仅是一点勇气,我想他们一定非常懊丧。”其实,何谓能行,何谓不成,大多数人都无从明确把握。
团体决策的困境
和其他类型的多人博弈一样,投票当中也会出现策略问题。投票者常常不愿表达自己的真实倾向。
无论是少数服从多数的规则,或是任何其他投票机制,都不能解决这个问题,因为现在尚不存在一个完美无缺的体系,可以将个人的倾向会聚成人民的意愿。
比如,三位女郎结伴逛街,临近中午她们打算一起吃午饭。她们都喜欢洋快餐,正好这条街上有麦当劳、肯德基和必胜客,可是每个人的偏好不同:A喜欢麦当劳,其次是肯德基,最不喜欢必胜客;B的偏好依次是肯德基、麦当劳、必胜客;C的选择却又不同:必胜客、麦当劳、肯德基。假定这三人一定要一起吃饭,那么会出现什么结果呢?
因为三个人的喜好如此不同,难于达成一致,所以她们决定采取投票表决的方式,先在麦当劳与必胜客之间决出一个胜者,然后再与肯德基决胜。
如果是每个人都诚实投票,那么,麦当劳将战胜必胜客(因为B在两者之间倾向于前者),并在第二轮战胜肯德基。但是如果B不诚实投票,结果就会大不一样。
B知道其他人的偏好,而且她希望达到自己满意的结果,于是在第一轮故意投票给必胜客,于是必胜客获胜;在第二轮,肯德基又战胜必胜客,于是,B通过策略实现了自己的愿望。可是这个愿望并不是符合大家的最大利益的——理想的结果应该是麦当劳,因为在三个人的综合评价中,它的分数最高。
因此投票制的民主实是知易行难,由于排名内部的模棱两可,造成狡猾的候选人有极大的操弄空间,无论什么规则都会造成公平选举遭到扭曲。所有政治演说也常谈到尊重“人民意愿”,却不容易做到。事实上,也几乎不可能决定何者是人民的意愿。通常宣称实行民主制度,远比实际实施民主要容易得多。显然这种决策困境亟待深入探讨。
启示:民主政府的基石在于尊重人民通过投票箱表达的意愿。不幸的是,这些崇高伟大的想法实现起来并不那么容易。
,三个快枪手”
细致烦琐的推理过程也许让你有点疲惫了,下面我们来点刺激的,到充斥着野蛮暴力的西部世界(至少是西部片的世界)去走一遭。
在一个西部小镇上,三个枪手正在进行生死决斗,枪手甲枪法精准,十发八中;枪手乙枪法不错,十发六中;枪手丙枪法拙劣,十发四中。假如三人同时开枪,谁活下来的机会大一些?
假如你认为是枪手甲,结果可能会让你大吃一惊:最可能活下来的是丙——枪法最劣的那个家伙。
假如这三个人彼此痛恨,都不可能达成协议,那么作为枪手甲,他一定要对枪手乙开枪。这是他的最佳策略,因为此人威胁最大。这样他的第一枪不可能瞄准丙。
同样,枪手乙也会把甲作为第一目标,很明白,一旦把他干掉,下一轮(如果还有下一轮的话)和丙对决,他的胜算较大。相反,如果他先打丙,即使活到了下一轮,与甲对决也是凶多吉少。
丙呢?自然也要对甲开枪,因为不管怎么说,枪手乙到底比甲差一些(尽管还是比自己强),如果一定要和某个人对决下一场的话,选择枪手乙,自己获胜的机会要比对决甲多少大一点。
于是第一阵乱枪过后,甲还能活下来的机会少得可怜(将近10%),乙是20%,丙是100%。
通过概率分析,你会发现丙很可能在这一轮就成为胜利者,即使某个对手幸运地活下来,在下一轮的对决中,也并非十拿九稳,毕竟丙还有微弱的机会。
现在换一种玩法(我们知道,有时胜负是由规则决定的):三个人轮流开枪,谁的机会更大?
这里我们又要遇到琐碎的排序问题,但不管怎么排,丙的机会都好于他的实力。至少,他不会被第一枪打死。而且,他很可能有在第二轮首先开枪的便宜。
例如,顺序是甲、乙、丙,甲一枪干掉了乙,现在,就论到丙开枪了——尽管枪法不怎么样,但这个便宜还是很大的:那意味着他将近一半的机会赢得这次决斗(毕竟甲也不是百发百中)。如果乙幸运地躲过了甲的攻击呢?他一定要回击甲,这样即使他成功,下一轮还是轮到丙开枪,自然,他的成功概率就更大了。
问题来了:如果三人中首先开枪的是丙,他该怎么办?
他可以朝甲开枪,即使打不中,甲也不太可能回击,毕竟这家伙不是主要威胁,可是万一他打中了呢?下一轮可就是乙开枪了……
可能你会感到有点奇怪:丙的最佳策略是乱开一枪!只要他不打中任何人,不破坏这个局面,他就总是有利可图的。(当然,你可能会说,鉴于这家伙的没有准头,也许他乱开枪反而更可能打中什么人。但那就是另外的问题了。)
这个故事告诉我们:在多人博弈中,常常会发生一些奇奇怪怪的事情,并导致出人意料的结局。一方能否获胜,不仅仅取决于他的实力,更取决于实力对比造成的复杂关系。
启示:通过这个故事,你也可能会理解以下“定理”:才华出众者创造历史;碌碌无为者繁衍子孙。
暂时同盟
你可能已经发现:乙和丙似乎达成了某种默契:在甲被干掉之前,他们相互不是敌人。
这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。
但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。
在这个“同盟”里,最忠诚的是乙——只要甲不死,他就不会背叛;丙就要滑头多了,在前面轮流开枪的例子中,他不朝甲开枪,从同盟者的角度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。乙是甲的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而丙不同,他随时愿意牺牲乙换取下次自己的先手之利。
除了压力较小之外,而且还有一个动力驱使丙背叛,那就是一旦干掉甲后,乙的机会比他要大,他至少要保持先下手,才可能一争高下。
三国博弈
三国的曹、刘、孙三家关系,就是“枪手博弈”很典型、也很有趣的例子。
,赤壁之战”中,曹操实力最强,孙权次之,刘备最弱。孙、刘都无法单独对抗曹操。为了抵挡最强大的曹操,孙刘必须联合起来。孙权拥有六个郡的地盘和数万军队,而刘备没有地盘,只有不足两万人马。用前面的例子来比,孙权是乙,刘备是丙。
我们已经知道,乙是这个“暂时联盟”中较肯卖力的一方,所以孙权不但“火烧赤壁”打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。
于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀汉从此衰落,东吴也面临了两面作战的不利局面。
如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),而且他自己也险些在逍遥津送命。可是从收益上说,他与刘备是“牛打江山马坐殿”,感到不平衡是正常的。
可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手丙突然翻脸向乙开火。坐收渔利的当然是甲。虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。
那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到丙的地位,就该以丙的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。
这个问题是对策论中诸多问题中典型的一个。其基本前提是每位参赛者都是有理性的,而且都是力图为自身利益考虑。这个问题的一项教益在于,显而易见的策略——每位参赛者都试图除掉较强的对手——并不一定是好策略。这就是人们认为解法是反直觉的解释。当然,由于你更进一步地投身于对策论,那么你的直觉就会改变,而且如果它是完全意想不到的话,则意想不到的局面就会更加意想不到。枪战决斗的另一项教益是,在缺乏有关参赛者能否联络、共谋、进行威胁或达成有约束力并可以实施的协议等信息的情况下,对可能的解法是不能进行正确评估的。在对策论中,往往需要了解这样的社会学因素。
无须试图进行严格的论证,我们就能很容易地理解,枪战决斗可能类似于政治或经济的竞争。按照纽约大学政治学教授斯蒂温·布拉姆斯的看法:枪战决斗的知识可以扩展到多位候选人的政治竞选上,布拉姆斯说道:“看来这些候选人的最佳战略,莫过于在他的部分政治势力范围内追随最强的对手。如果你是一个自由主义者,而且另外还有两位自由主义者,那么你就要追随最强的一位。于是所发生的情况将是两位最强的对手就会彼此攻击,而且最弱者就会存留下来了。”这时,如果所发生的情况全面出现,那么最弱的候选人就会在其政治势力范围内幸存下来。
启示1:公元196年,曹操挟天子以令诸侯,东汉政权明存实亡;公元200元,官渡之战,曹操大败袁绍,羽翼渐丰;公元208年,曹操挥军南下,大治水军,想收取江东。但赤壁之战,曹军为孙权刘备联军所破。三分天下的形势从这时开始初步形成。
启示2:几千年来,人类始终把一条黄金法则当成行为的准则。这项法则是:种什么因,收什么果,你如何对待别人,你种的善因或恶因,最后都会报应到你自己的身上。
杂货铺与政党
那么,现代西方民主政治中的党派之争,是如何避免“三个快枪手”无休无止的厮杀呢?答案是“两个杂货铺”。
杂货铺定位问题最早是由美国经济学家霍特林提出来的(即霍特林模型)。这一模型常被运用来说明西方两党政治的若干现象。
西方一些大国,都有相似的两党政治。在英国是保守党和工党轮流执政,在美国则是共和党和民主党轮流坐庄。民主党和工党一般被认为是“左派”,倾向于标榜代表劳工阶层的利益,共和党和保守党则是“右派”,站在企业主一边。在竞选的时候,人们可以发现,两党互相攻击越来越厉害,可是实际政治纲领却越来越靠近。等到一个政党获胜取代对手上台以后,选民发现,新政府较老政府并没有多少实质性的改变。
为什么会这样呢?进一步,为什么这些西方大国都会出现两党政治呢?
实际情况就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以它是站在左边的,左边是它的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,它要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法就是使自己的竞选纲领向“右”的方向靠过去一点,即在竞选中宣布也要照顾中产阶级的利益,甚至兼顾企业主发财。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中也要往左边靠,以争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的攻击和谩骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。
为什么第三个政党难成气候?这是因为在上述假定条件之下,如果三个政党的位置不相同,不在同一个点上,那么至少有一个政党单独位于一端,它就有向内挤压的动机,道理和前面论述的一样,所以这时候不是稳定的局面。如果三个党都位于中点,那么谁单独跳开一点点,谁就会取胜,所以也是不稳定的局面,这是因为从中心跳开一点(无论向左向右)的时候,至少那一边的选民都会投他的票,例如,向左一点,左边的选民就会选他;而另一边的选民要由留在中点的两个政党来瓜分,这两个党各自的得票,就都比不上跳开的那个党。同样,如果三个政党位于同一点,但是这一点不是中点,那么谁单独向中点稍微移动一点点,它就会占便宜,这是因为从旁边向中点移动一点的时候,多数选民都会投他的票,而另外两个政党则只能平分不到总数一半的选民。
三个党不在一起不稳定,三个党全在中点也不稳定,三个党全在另外一点更不稳定,总起来一句话,就是三党政治不会稳定。或者换一个角度理解,即纲领变化无常的政党不会有较强的生命力。
这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性,竞选的时候,怎样有利于拉票就怎样讲,当选以后可以忘得一干二净。从这个意义上说,不要以为哪个政党上台这些西方国家的政治态度就会根本改变,确实很有道理。
当然,从另一个角度看,这种两党政治主张的趋同性其实也并不完全是坏事——甚或可以说是好事,因为所谓民主政治,就是要最大限度地照顾每个人的利益,尽管免不了有妥协和交易,但要把不同阶级、不同政治理想和利益要求的人组织成一个整体,这些代价也许是不得不付出的。
启示:所谓杂货铺定位问题,简单说就是:在一条街道上有两家杂货铺,为了争取更多顾客,两家杂货铺都趋向于把店铺设在街道中心点,最后的均衡是,两家杂货铺都开设在整条街的中点,紧紧挨在一起。
效能与民意
在信息畅达迅捷的媒体时代,政治家很仰赖民意调查来了解选民的需求,以避免招惹潜在选民的不满。而民众选择政府的同时,也就决定政府的决策品质。
社会学家发现:效率与民主或“社会公正”有时是矛盾的。比如像长城或金字塔那样的建筑,只能出现在专制的社会中。
现代社会中,不论是哪个国家,都有太多方法可以阻断事务的进行,却没有足够的方法来推动事务的发展。古代的法老王有绝对权威,花上数十年,甚至更长的时间来建造金字塔;罗马教会的权势,使它可以用好几代的光阴去盖一座天主教堂;而一位皇帝想修一座宫殿,也就不须多费唇舌解释。大众决策绝不会有任何冒险性,因为在这个大众传播与民调盛行的年代,政治人物若想要保住饭碗(这可是人人梦寐以求的),就不能冒险作出任何不受欢迎的决策。
民意有两个难题:首先,多数不一定正确,至少有时,真理是掌握在少数人手里的;其次,民意容易受到操纵和利用,不要忘了,希特勒正是通过鼓惑人心的本领被选举上台的。
下面一段也是引自《是,首相》,以一个文官之口,讲述他的上司向他解释操纵民意的诀窍。
我不懂选民怎么能同时赞成而又反对一件事。亲爱的汉弗莱告诉我怎么做。
诀窍是,向一个普通老百姓提出一系列的问题——去接近他的是一个有吸引力的女士,手里拿着一个写字板。自然,这个普通老百姓要给人一个好印象,不愿使自己干蠢事。因此,市场调查者就会问他旨在引出一贯式答复的问题。
汉弗莱在我身上作示范。“伍利先生,青少年犯罪率上升,你担心吗?”
,是。”我说。
,你是否认为在我们的学校里缺乏纪律和严格训练?”
,是。”
,你认为年青人欢迎在他们生活中搞一些组织和领导工作?“
,是。”
,对他们提出挑战性的要求,他们会有反响吗?”
,会。”
,也许你赞成重新恢复兵役?”
,是。”
嗯,我自然而然地说“是”。一个人为了不让别人看来缺乏一贯性,几乎不太可能回答其他的话。那么,所产生的事实是,民意调查光发表最后的一个问题及其答复。
汉弗莱建议我们委托别人举行一次新的调查,我们就这样干了。他当时当场炮制了一连串问题:
,伍利先生,你是不是担心爆发战争?”
,是。”我说,十分真诚。
,你对军备的增长很不高兴吧?”
,是。”
,你认为发给青年人枪支并教他们如何杀人,有危险吗?”
,是。”
,你认为违反人们的意志,强迫他们拿起武器是错误的吗?”
,是。”
,你会反对恢复兵役吗?”
我不知不觉、不由自主地答“是”。
汉弗莱成功了,他高兴得很。“你瞧,伯纳德,”他对我说,“你是一个完美的不偏不倚的样板。”
至少在某些情况下,民意是一团可以捏来捏去的面。因此在面对声称“代表民意”的宣传高调时,不必过于在意。但是总的说来,各个阶层的民众还是懂得维护自身的利益的,并为此争吵不休。所以在选择政府官员或议员时,所面临的冲突就是目标设定:究竟要一个有效能的政府?它除了领导、远见外,还包括了一些必然不受欢迎的决策;还是选一个能反映大众期望、欲求的体制,只剥夺少数人民权利,却又能表达一般选民的不同意见。
两个不同的目标,将会产生不同的选举制度。
各种投票制度的利弊
采用“多数为王”制的最大弊端,就是在选举后将使大部分民众不再具影响力,而少数人就像战败的军队般,只能为下次竞选作准备,影响力亦几乎为零,而他们扮演在野角色时,仍是以下次选举作为出发点。
与“多数为王”相反的选举制度就是以投票比例决定各党代表的席次,以确保政府或民主制度中的立法单位在运作过程中,不会忽视所有人的意见。如果在1992年美国大选中,佩罗阵营组成政党,且总统候选人的政党比例是由各候选人的实际得票率来计算,则比例代表制的结果会造成国会有43%民主党、38%共和党及19%的佩罗党。而赛局理论的技术准则为结合各少数党击垮最大党,但随着组合的改变,就会产生混乱。许多欧洲国家都采用这样的制度,美国部分地区也尝试过,但世界各地的经验显示,有效能的政府需要在不同方案间决策,而高度分散化的团体则很难在影响深远的选择间作出决定。那些大声疾呼多元化可强化社会结构的论调,实在很难从历史上找到佐证。比如代表制虽不会蹂躏少数人的权益,却也不易实施多数人的愿望。不论选择为何,最后都会回归到原来追求的目标。
即使所谈的是一个小范围选举,也没有不一致的现象发生,选举结果还是跟选举规则息息相关。举例来说,A、B、C3人竞选某一公职,而9位选民的偏好如下:有2位选民认为A是上选,B次佳,C为第三。4位首选C,A次之,B第三。3人首选B,A第二,C第三。
在多数决的制度下,只有第一选择的票数有效,因此C获得4票为胜利者,B、A则各得3票及2票。在这个例子中,很明显多数的人并不喜欢C,但他却拥有忠贞选民。这种现象在日常生活中很常见,虽然C没有赢得绝对多数,但仍然胜选,这和1992年克林顿当选总统的情况相同。
再看看其他的投票制度是怎么处理这个问题的。有一种常见的方法是加权计票,也就是名列二、三名的选择也予以加权计分。如第一名2分、第二名1分、第三名0分。这就是所谓的波达规则。在这样的规则之下,A得11分,反败为胜,而B与C皆得8分,打成平手。支持A优胜的原因是,有7个人将他排名在第二位,虽然认为A是最佳人选的人并不多,但他却比C得到更多的认同。
另一个常用的制度为偏好投票,就是要求选民如上表一样,标示出第一、第二的名次。只要候选人拥有绝对多数的第一名选票,即可获胜。如果没有优胜者,就把得到第一名票数最少的人剔除,再将其得票依照选票上的次序,重新分配给其余的候选人。因此,A将会最先被淘汰出局,这与前一种制度比,他因认同度高,故脱颖而出的结果有很大的不同。再回到偏好投票下,两张选票就会分给B,使B得票超过C而胜选,但在原制度下却只得第二名。这种制度的好处就是考虑A的支持者在A落选后,他们的第二选择仍有机会胜出。这样不也挺公平吗?
选民的选择不变,3种不同的投票制,产生3位不同的优胜者,这代表了3种选举制度目标的歧异。
当然还有其他的计票法。其中的认可投票制即相当受专家的肯定。在这种制度下,每位选民皆不限票数,可以投给每一个他所喜欢的候选人,但对每一个候选人限投一票。这种制度乍听之下好像不怎么公平,因为在没有限制投票数的情况下,有人可能会投很多票。其实这种想法是错误的。如果你投给每一个候选人,那和没投是一样的。用这种方式就不需要对候选人排序,只要把认可的名单挑出来即可,所以称之为认可投票制,而胜选者就是获得最多认可票的那一位。
这种制度应用到上述例子,因为资讯实在不多,故假设每个人都投给前二名候选人,也就是前二人当选都可以接受,但绝不可以让最后一名当选。如此一来,A将因没有人把他排在最后一位而以9票当选,另外两人则分获5票与4票。故在认可投票制下,其结果与加权投票制是一样的。不过,也不能将其过度的类化,毕竟在3位候选人、4种选举制度下,本来就有可能产生相同结果。
启示1:在美国这样主政者任期较短的国家,人们可以期待下一次的选举;但在任期较长的国家,一次失利则代表着会有很长一段时间失去影响力,而胜选阵营常在任期结束后仍继续掌权。
启示2:决策之思考应着眼于长远利益,着眼于未来。
,英雄”为何成了失败者
在这个例子里,多数决胜制选出了C;加权制由A胜选;偏好制在去掉了A后,B以高票当选;而认可投票制则仍是A获胜。那么,究竟谁才是“民众真正的期待”?
在美国许多州和城市,及其他国家的国会选举中,在多位角逐者的情况下,经常采用的选举方式就是复选制。就是每个选民只投一票,当没有人得票过半时,则在最高票的两人中再行复选。这种做法是希望留下较强的两个候选人,再请选民从中作出选择,看起来很公平,且被广泛采用。
但是这种制度也有暗藏的陷阱,现在就来看看其中一例。它也用类似前面提到的情况,共有17个投票人,但情况更混乱些。
假定在全部选民中,最喜欢A、B的分别有6人,首选B和C的5人,而在首选B和C的选民中,又分别有2和3人把A作为第二选择,如果是这样的话,首轮选举的结果是A与B同得6票平手,C惨遭淘汰。由于没有人过半数,故进行复选。3位C的支持者转而投给次选A,2位投给B,使A以这1票取得绝对多数,胜过B。在A与B的决战里,复选发挥了功能,A是“民众真正的期待”,应该担任这个职务。
如果到此为止,复选制似乎不失为比较理想的方法。但是其中也有悖论:假设第一次选举前,A展示了一件英雄行为,如救起一个溺水的小孩,或爬到树上救下一只猫,使B的部分支持者(即对A也有好感的那2人)在最后一分钟决定改投给A。如此一来,在第一次投票中,A得到8票,可惜因为未过半数无法立刻取得胜利;B则因少了2票遭到淘汰。在复选里,A仍维持8票,而C则因获得B选民的4票后来居上,赢得最后胜利。
这种情况确实令人讶异,也很难以接受,毕竟人们总是希望选举结果多少能反映选民的心声。而A如果没有那桩英雄事迹所多带来的几张选票,他早就赢了。
如果制度让原来可以选上的候选人,因为做了某件吸引更多选票的事而败选,那就荒谬透了。当然,这种情况也许不多见,也根本不应该发生,偏偏这种复选制度无处不在。当然,精明的政客早就学会如何利用这种制度的弱点,而在初选时先支持较弱的对手,等他进入复选再一举歼灭。
由此可知,不同选举制度满足的是不同的需求。“多数为王”制戕害少数人的意见,但有时亦可能戕害多数民意。在一些国家普遍实施的比例代表制对领先的候选人不利,且常产生无能、没有效率的政府。专制有利决策的进行,但制衡机制不足,特别是对可怕的决策缺乏防备功能。不过在碰到危机时,有效的领导可以处理攸关生死的决定,因为即使是无能的将领,都强过群龙无首的局面。
虽然现代社会极度强调最大的个人自由和民主规范,亦相当重视全球各地所遭受的资源短缺等问题,但和生存问题一比,就成为次要的考虑。不过,这些问题的重要性超越时空,影响大于投票制度,更不可能在这本简单的决策书中找到解决之道。即使真正解决了投票制的难题,这种想要透过它来汲取选民的想法,其本身就必须十分清楚明确,而目前的各种投票制度偏偏就欠缺了这个基本条件。
启示:加拿大雁有一种合作的本能,它们飞行时都呈V型。这些雁飞行时定期变换领导者,因为为首的雁在前面开路,能帮助后面的两支队伍形成局部的真空。科学家发现,雁以这种形式飞行,要比单独飞行多出12%的距离。合作,不仅是一种工作而已。事实上,合作是一切团体繁盛的根本,而要达成合作,惟有参与。
绝对正确的决策是可能的吗
我们不是因一贯正确而获得权威,而是因获得了权威而一贯正确。——美国联邦大法官杰克逊
现在,人们普遍相信民主政治比独裁政治更能保证决策的正确性,那么,民主是绝对正确的吗?
民主是什么?简单地说,就是少数服从多数。可为什么少数一定要服从多数?或者为什么这样就是好的?这问题其实并不好回答。
人们通常给出以下三个理由:
1.少数服从多数,因为胳膊反正拗不过大腿,真要打起来,少数势必打不过多数。以点人头的方式(即投票的方式)来确定何种意见得到了更大的支持,要比采取战斗的方式成本更低。民主乃是人类有史以来发现的惟一的和平变革的方法。(这有点像动物在求偶时比羽毛或块头的办法。)不服从,往轻了说是不明智;重了说,是敬酒不吃吃罚酒。
2.多数人的决定比少数人的明智。这建立在一个假设前提下:人们是知道自己利益所在的。这至少在有时候不是事实。毕竟,雅典人也是通过民主投票的方式决定处死他们最伟大的哲学家苏格拉底的。
3.多数人也可能犯错,可是不能剥夺他们表达意见的权利。而且,只有为自己做主,才能学会怎样为自己做主。
哪个理由都不那么叫人放心。第一个告诉我们:所谓民主,不过是强权的另一张面孔;第二个是说:如果你是那掌握了真理的少数,你只能看着大家裹着你往火坑里跳;第三个呢?是说你有权保持愚蠢,如果你放弃这个权利,别人也会代替你愚蠢。当然,如果你运气好,可能从中学到点什么,如果运气再好,学到的东西可能用得上——当然,如果还来得及的话。
既然民主并不能保证决策的正确性,为什么一定还要追求民主呢?
著名哲学家哈耶克说:最为重要的是,民主是一种形成意见的过程。民主的主要优点,并不在于它是一种选举统治人员的方法,而是在于这样一个事实:由于大部分人都积极参与了形成意见的活动,所以有相应数量的人员可供遴选。我们可以承认,民主并未将权力置于那些最为明智最为智慧的人士的手中,而且在任何时候,政府的决策若由精英做出,或许能对全体大众更有助益;但是,上述问题的存在,并不能阻碍我们继续信奉民主,因为民主的价值是在动态的过程中而非静态的状况中得到证明的。与自由相同,民主的利益也只能在长时段中表现出来,尽管在短期中,民主的即时性成就可能不及其他政制(如一个贤明的独裁者)的成就那么凸显。
启示:林肯曾说:“几乎没有什么事情是百分之百好或坏,特别是政府的每项决策都是好坏不可分割的结合,因此要求我们对哪方面占优势做出判断。”
完美政治如何实现
托马斯·潘恩写道:“社会产生于我们的欲望,政府产生于我们的邪恶。社会在各种情况下都是必需的,可政府即使在最好的情况下,也不过是一个无法避免的祸害;在最坏的情况下,就成了无法容忍的祸害。”他的意思是:人要生存,就必须组织一个社会;因为利益冲突导致邪恶行为,所以才不得不建立一个政府来规范。但是这个政府又可能成为产生邪恶的祸患,因此,政府不过是我们为自己无法克服的邪恶付出的代价。
如此说来,“完美政治”难道只是一句空话?有没有可能在未来实现呢?下面的文字是爱因斯坦给巴西一位记者的回信,可以推测,这位记者曾向他提出了关于建立一个美好世界的个人设想。
,你的主张我看在原则上是合理的。由少量的人来组织经济工作,这些人都已被证明有能力,热情而又无私地愿意投身改造生存环境。然而,我不相信你的通过‘测试’而选择的方法,这是一种典型的工程师式的主意,它同你的‘人不是机器’的主张不相吻合。”
,此外,我想你会考虑这样一件事:光靠找到十个能人是不够的——你必须让世界上的人都服从他们的决定和命令。至于怎样才能达到这种状态我拿不出办法。这个问题要比选出能人来困难得多。在今天的条件下以及在过去存在过的条件下,甚至平庸的人都有可能以某种普遍认可的方式受选。迄今为止,领袖们得到权力主要不是靠他们的思想能力和作决定的能力,而是哗众取宠的本领以及靠追随者们的弱点。”
,仍旧是老问题:怎样才能把权力交到有能力的人手中,交到善良人的手中。这个问题不能解决,一切都无从做起。不幸的是,在我看来,你也没找到能解决这个难题的途径。”
启示:“民之所欲,常在我心”只是句口号吗?你放心把自己的未来交付到不相干的人手上吗?这和“民主”这个字眼未曾出现在美国宪法与独立宣言之中,似乎是有异曲同工之妙。
第15章 决策的艺术与科学在人们的观念中,“零和”正在被“双赢”取代,但是“双赢”的北后却蕴藏着更大的危机。对此,我们还没有找到满意的应对策略。既然不知道该往何处去,所以要常怀谦逊谨慎之心。
,零和游戏”与“双赢结局”
当你看到两位对弈者时,你就可以说他们正在玩“零和游戏”。因为在大多数情况下,总会有一个赢,一个输,如果我们把获胜计算为得1分,而输棋为失1分,那么,这两人得分之和就是:1+(-1)=0
这正是“零和游戏”的基本内容:游戏者有输有赢,但整个游戏的总成绩永远为零。
,零和游戏”受到关注,是因为人们发现在社会的方方面面都存在与“零和游戏”类似的局面,胜利者的光荣背后隐藏着失败者的辛酸和苦涩。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏场”。这种理论认为,世界是一个封闭的系统,财富、资源、机遇都是有限的,个别人、个别地区和个别国家财富的增加必然意味着对其他人、其他地区和国家的掠夺,这是一个“邪恶进化论”式的弱肉强食的世界。
进入20世纪,人类经历了两次世界大战、经济的高速增长、科技的进步、全球一体化以及日益严重的环境污染之后,“零和”观念正逐渐被“双赢”所取代,人们认识到“利己”不一定要建立在“损人”的基础上,通过有效合作,皆大欢喜的结局是可能出现的。“你扒我的口袋,我扒你的口袋”远不如“你搔我的背,我搔你的背”更可取。然而,在为人类“合作时代”欢呼的同时,我们应注意到,“零和游戏”在人类生活的许多领域依然适用,而且,当它可能对我们自身有利时,我们也乐于接受它。(股市就是一个很好的例子。人们投资股市,很少是为了获得投资的回报,而是渴望在炒买炒卖中赚取差额,这样,当一个人在股市上赚到钱时,意味着别人因此受了损失。)而且,如何在合作中找到各方满意的方法,并不是一件容易的事。我们距离真正的“合作时代”,还有很长的一段路。
启示:请记住,人是为别人而生存的。人们的精神生活和物质生活都依赖着别人的劳动,人们必须以同样的分量来报偿所领受了的和正在领受的东西。
猎人博弈的帕累托优势
设想在古代的一个村庄有两个猎人。为了简化问题,假设主要的猎物只有两种:鹿和兔子。在古代,人类的狩猎手段比较落后,弓箭的威力也有限。在这样的条件下,我们可以假设,两个猎人一起去猎鹿,才能猎获1只鹿。如果一个猎人单兵作战,他只能打到4只兔子。从填饱肚子的角度来说,4只兔子算管4天吧,1只鹿却差不多能够解决一个月的问题。这样,两个人的行为决策就可以写成以下的博弈形式:要么分别打兔子,每人得4;要么合作,每人得10(平分鹿之后的所得)。
两个纳什均衡,就是两个可能的结局。那么,究竟哪一个会发生呢?是一起去猎鹿还是各自去打兔子呢?这就和情侣博弈一样,不能完全由纳什均衡本身来确定。
比较(10,10)和(4,4)两个纳什均衡,明显的事实是,两人一起去猎鹿的赢利比各自去打兔子的赢利要大得多。按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德国的泽尔腾教授的说法,甲乙一起去猎鹿得(10,10)的纳什均衡,比两人各自去打兔子得(4,4)的纳什均衡,具有帕累托优势。猎人博弈的结局,最大可能是具有帕累托优势的那个纳什均衡:甲乙一起去猎鹿得(10,10)。
比起(4,4)来,(10,10)不仅是总额的改善,而且每个人都得到很大改善。这就是(10,10)对于(4,4)具有帕累托优势的意思。关键是每个人都得到改善。
这里要解释一下何谓帕累托效率和帕累托优势。帕累托(意大利经济学家)效率准则是:经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或别的什么人,要想再改善你就必须损害另外某个人,一句话,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,就不能说已经达到帕累托效率。
,大家好,才是真的好”
在“猎人博弈”中,两人合作猎鹿的收益(10,l0)对于分别猎兔(4,4)具有帕累托优势。这是因为如果比较原来的境况(4,4),现在的(10,10)我们说境况得到了帕累托改善。作为定义,帕累托改善是各方的境况都不受损害的改善。
可是上面的情况是假设双方平均分配猎物,也就是说,两个猎人的能力和贡献差不多,但是实际上并不一定如此。
如果一个猎人能力强、贡献大,他就会要求得到较大的一份,这样分配的结果就可能是(14,6)或(15,5),但有一点是确定的,那就是能力较差的猎人的所得,至少要多于他独自打猎的收益,否则他就没有合作的动机。如果合作的结果是(17,3),相对于分别猎兔(4,4)就没有帕累托优势,这是因为3比4小,乙受到损害。这样,我们就不能说境况得到了帕累托改善。虽然17比4多,改善了很多,17+3也比4+4大很多,改善了很多,但是3比4小,乙没有改善反而恶化。所以站在乙的立场,(17,3)没有原来的(4,4)那么好(第一个数代表甲的满意程度或者得益,第二个数代表乙的满意程度或者得益)。如果合作的结果如此,那么,乙一定不愿合作。可见,帕累托改善是一种各方都认同的改善,不是要求任何一方作出牺牲的改善。
,帕累托效率”很有现实意义,也是目前经济学家比较关注的问题。著名经济学家吴敬琏几年前曾出过一本书,名为《改革正在过大关》,他指的是中国的改革开放到了一个关乎成败的紧要关头。改革开放的成就世人共睹,为什么还要这样说呢?
关于中国的成功有很多分析,有人认为中国的“渐进式”改革,避免了前苏联、东欧那样一步到位的“振荡疗法”或“休克疗法”,社会损失较小。深刻一点的分析,则说中国的改革是从体制外的改革开始,向体制内的改革发展等等。
人们比较一致的看法是,一直到前几年为止,中国的改革进程大致上是一种帕累托改善的过程。虽然有一小部分人发了大财,社会不平等程度在增加,但是广大人民的收人也多多少少在增加,生活基本上都在改善。可是这种改善总要被帕累托效率代替:有些人不可避免地要为社会的发展付出代价。
例如目前的国企改革问题。国企效益不好,既有责权不分、经营不善的原因,也是因为计划经济下国有经济一直承担着“企业办社会”的重任。企业办社会,就一定会损失效率。兼办社会的国有经济,担负着为改革开放提供安全网的作用。国有经济不仅承担了国家财政收入的绝大部分,而且是亿万职工生计的保证。当私有企业、外资企业等“体制外”经济轻装上阵蓬勃发展的时候,国有经济承担了国家和政府的许多社会责任。
现在,改革已经向纵深发展,突出的问题是国有经济如何适应市场竞争。当年,因为国有经济分担了国家和政府的重任,“摸着石头过河”的改革开放才得以进行下去。现在,很多“国企”已经在市场竞争中处于劣势,“办社会”更是难以为继。一方面是千万工人下岗失业,另一方面,社会保障制度又刚刚起步,无法承担大任。这就造成了尽管社会经济不断发展,同时有些人的生活水平却在下降的“帕累托效率”。显然,这对维护社会稳定和推动改革的深化是十分不利的。
在这种情况下,如何审时度势进行改革,多种渠道化解社会困难,把非帕累托进程的负面效应控制在最小的范围,是今后几年关系中国未来发展走向的关键,也正是吴先生所说的“过大关”。
启示:一个在金钱上富足的人,还有心关怀受困于窘境的穷人,才叫真正的富人。丰富的内心是惟一能够使我们获得供给的源泉,幸福存在于满足者的心中。
再分配的局限性
人们公认,平等是建设一个理想社会的目标之一。许多国家的政府都采用了某种形式的再分配税制,即富人多缴税,国家用税金提高社会福利,这是符合“边际效用”原则的。
,笼中猪”博弈中,大猪所以宁愿让小猪多得益,正是因为它的得益大于成本,而小猪不愿这样做,也是因为成本大于其所得。既然富人从经济发展中获益更多,那么让他们多承担一些促进社会福利的事,也很公平。
这表现在制度上,就是税率的差异,收入越高的人,税率也越高。比如20世纪60年代和70年代,美国所得税的最高税率超过70%,而瑞典等北欧“福利国家”就更高。不过,到了20世纪90年代,高税率的弊端逐渐显现,因此,许多国家将最高税率大幅度下调。
降低税率的主要动机,源于高税收对工作的激励的损害作用,即努力工作的人并不比游手好闲的人幸福多少。
现在,一方面存在更大的积累财富的激励,另一方面出现了更大的收入不平等。当然,不平等的背后有很多原因,所得税只是消除这种症状的一个生硬的工具,而不是原因。考虑一下,导致不平等的原因是什么,而这些原因对设计一个理想的税制又有什么影响?实施这一理想体系会有什么问题?这一体系与现有体系相比有什么区别?
我们从研究导致经济不平等的一些原因着手。首先是运气。有两种运气。有些人生来就比别人多了某种天才或优势。即便在这些方面起步平等的人,运气也会青睐某些人,而不是所有人。许多人以为,运气产生了某种不平等,这是不公平的,用于平衡这类优势的税制得到了广泛支持。
其次是努力。有些人就是比其他人工作更努力。当人们对税制损害工作的激励的说法表示同意的时候,他们通常是指提供努力的激励。假如政府决心抽取相当大一部分的劳动成果,谁还愿意努力工作呢?许多人还认为,人们应该有能力保留自己的劳动果实的说法在道义上也是正确的。
我们现在假设政府希望做到既能从每一名公民的劳动果实中至少抽取一部分,又不会损害工作的激励。如果收税者分辨得出每一个人付出了多大努力,做到这一点当然毫无问题。每个人应该上缴的税款数目可以直接与他付出的努力挂钩,变成一个真正意义上的惩罚性的税制,目标针对那些努力程度未能达到理想水平的人。
不过,实际上我们很难对成千上万工人的努力进行监控。他们可能每天按时上下班,但他们可能漫不经心,从而降低了他们的工作质量,哪怕是制定了非常严厉的惩罚措施。
人们还发现,要在毫无物质激励的前提下提高工作质量,简直难于登天。它使人们陷入一个恶性循环,在前苏联,工人中有这样一句话描述自己和政府:“我们假装工作;他们假装支付我们的工资。”
20世纪最重要的思想家之一哈耶克指出:绝对的平等是不可能的,一定程度的不平等,不但是应当的,而且是必须的。无论是科技进步、商品生产和生活提高,都不可能是齐头并进,而是由少数人向多数人的不断扩展。如果不允许少数人提前享受进步成果,多数人的共同进步也就无从谈起。
启示:一位富人曾经这样说过:即使现在把我全部的财产散尽,我相信过几年它们还会重新回来。黄金总是闪闪发光——即使在泥土中也是这样。
为什么“重农抑商”
经济学思想史上,人们对于一个经济如何才算是有效率的,一直有很不相同的看法。例如孔子的“不患寡,患不均”,就很有代表性,但是大家都知道,只讲求平均,很难作为效率的标准。可以说,效率是经济学中最富争议的一个概念。
古代中国人不知“帕累托效率”为何物,但却似乎早就将这一法则烂熟于心。一般认为,“重农抑商”思想是阻碍中国社会发展的重要原因之一,可是这一思想中居然也有“帕累托效率”的影子。古人认为:商业只是“五马换六羊”的交换,商业活动本身不创造任何价值,一些人因商业致富,必然有一些人因商业“致穷”,这也就是为什么商人在中国总是和“为富不仁”、“巧取豪夺”之类的负面形象联系在一起,中国人的“仇富”心理如此普遍的原因。
当然,我们现在知道商业活动是能够创造价值的:增加就业机会、促进生产和消费(如一个猎人在没有商业活动的情况下,他每天打猎的成果只要够果腹就行了,打得多了也只能白白烂掉,如果有一个市场,他就可以把多余的猎物卖掉,换成钱再买别的东西)、有助实现资源的优化配置等。但是这些只说明我们的社会还有发展空间,还没有达到“帕累托效率”。所以说,古人的担忧不是没有道理,只是担忧得早了一点。
启示:“杞人忧天”为人所笑,但是我们或许笑得也太早了一点。现代社会建立在不断发展上,是不是必需?是不是应该?是不是该在某个时候停下来?谁也不知道。
哈丁公用地悲剧
既然“公平”难免损害效率,为了避免帕累托效率的影响,似乎惟一的出路就是“开源”:通过经济发展、技术进步“把蛋糕做大”实现帕累托改善,可是一方面,这只是缓解了、而不是解决了帕累托效率问题,另一方面,它又把我们带进了一个更大的麻烦——公用地悲剧。
美国学者哈丁在一篇重要而具有影响力的文章里提到,不加限制的个人选择可能给社会带来灾难。哈丁举了这样一个具体事例:一群牧民面对向他们开放的草地,每一个牧民都想多养一头牛,因为多养一头牛增加的收益大于其购养成本,是合算的,尽管因平均草量下降,增加一头牛可能使整个牧区的牛的单位收益下降。每个牧民都可能多增加几头牛,草地将可能被过度放牧,从而不能满足牛的食量,致使所有牧民的牛均饿死。这就是公共资源的悲剧。
悲剧在于每一个人都陷入了一个体系而不能自拔,这个体系迫使他在一个有限的世界里无限地增加自己的牲畜。在一个信仰平民自由的社会,每一个人都在追求自己的最大利益,从而毁灭将成为大家不能逃脱的命运。
他按照这一思路讨论了人口爆炸、污染、过度捕捞和不可再生资源的消耗等问题。他的结论是,世界各地的人民必须意识到有必要限制个人作出这些选择的自由,接受某种“一致赞成的共同约束”。
对公共资源的悲剧有许多解决办法,哈丁说,我们可以将之卖掉,使之成为私有财产,可以作为公共财产保留,但准许进入,这种准许可以以多种方式来进行。
哈丁说,这些意见均合理,也均有可反驳的地方,“但是我们必须选择,否则我们就等于认同了公共地的毁灭,只能在国家公园里回忆它们了。”哈丁说,像公共草地、人口过度增长、武器竞赛这样的困境“没有技术的解决途径”,所谓技术的解决途径,指“仅在自然科学中的技术的变化,而很少要求或不要求人类价值或道德观念的转变”。
对公用地悲剧的防止有两种办法:一是制度上的,即建立中心化的权力机构,无论这种权力机构是公共的还是私人的——私人对公用地的拥有即处置便是在使用权力;第二种便是道德约束,道德约束与非中心化的奖惩联系在一起。
,看不见的手”有多长
现在,请你确定这个问题的本质。试试把这个问题跟我们在前面提到的一个或多个例子挂钩,然后你就能找出几个可供选择的解决方案,再对这些解决方案作一个评价。
不同情况下,公用地悲剧可能成为一个多人囚徒困境(每一个人都养了太多的牛)或一个超出负荷问题(太多人都想做畜牧者)。
经济学家最喜欢的解决方案是确立产权。这也是十五六世纪在英格兰真实出现的事情:公有土地被围起来,落入当地贵族或地主手里。一旦土地成为私有财产,那只“看不见的手”就会恰到好处地关上大门。
主人可以收取放牧费,使其租金收入最大化,而减少对土地的使用。此举改善了整体经济效率,却同时也改变了收入的分配:放牧费使主人更富有,使牧人更贫穷。
这一规定在其他场合并不适用。公海的产权很难在缺少一个国际政府的前提下确定和执行,控制携带污染物的空气从一个国家飘向另一个国家也是一个难题。基于同样的理由,捕鲸和酸雨问题都要借助更直接的控制才能处理,但建立一个必要的国际协议却很不容易。
有时候,假如集团规模足够小,自愿合作可以解决这个问题。若有两家石油或天然气生产商的油井钻到了同一片地下油田,两家都有提高自己的开采速度、抢先夺取更大份额的激励。假如两家都这么做,过度的开采实际上可能降低它们可以从这片油田收获的数量。钻探者意识到了这个问题,看上去也有办法达成分享产量的协议。但是,在一个规模较大的集团里,达成这样的协议不但非常困难,而且也很难得到完全的遵守。
启示:正如哈丁提到的那样,人口是一个甚至更加艰巨的难题。决定要几个孩子,似乎是做父母的个人自由,但是如果人们都倾向于多生小孩,就会造成人口爆炸的危机。现在很多人已经认识到:生育不是一种自由,而是有限的权利。
公共品供给的“囚徒困境”
公共品和私人品的性质很不一样。私人品是私有私用,除了像他穿得整齐你看着也舒坦那样十分间接的效应以外,别人很难沾什么光。公共品则不一样,一旦不管是谁提供出来,许多人都可以享用。比如路灯,只要有人装了,路人都将得到好处,哪怕他没有为此贡献过一分钱。
设想农村某地有一个只有两户人家的小居民点,由于道路情况不好,与外界的交通比较困难。如果修一条路出去,每家都能得到“3”那么多好处,但是修路的成本相当于“4”。要是没有人协调,张三、李四各自打是否修路的小算盘,那么两家博弈的形势如下:如果两家联合修路,每家分摊成本“2”,各得好处“3”,两家的纯“赢利”都是“l”;如果一家修另一家坐享其成,修路的一家付出“4”而得到“3”,“赢利”是“-1”,坐享其成的一家可以白白赢利“3”(假设修路的并没有路的地权,他总不能因为修了路就不让邻居走);如果两家都不修路,结果两家的赢利都是“0”。
在这个博弈中,修路是张三的严格劣势策略,我们应该把它消去;修路也是李四的严格劣势策略,所以也应该把它消去。这样运用严格劣势策略消去法,我们就得到这个博弈的严格优势策略均衡:两家都不动手,大家都得零。
一般来说,乡下地方如果张三只有李四一家邻居,李四只有张三一家邻居,他们多半会守望相助,关系比较好。这样的两家自然会好好商量修路的问题,一起把路修好,大家都得到好处。
相反,两家有仇也是可能的,那就麻烦了,不是什么修路不修路的问题,迟早要出事。但是,博弈论讨论所牵涉的局中人,都是经济学上所讲的“理性人”,他们只为己,但是并不刻意害人。现在城市公寓里面的不少居民在邻居关系上,有时候差不多就是这种理性人的关系。
对于他们来说,都市化进程的一个副产品,就是即使是近邻也形同陌路。如果没有公寓物业管理方面的制度安排的话,新公寓家家装修一流,可是楼道就杂乱无章,常常还阴暗得很。路灯坏了,往往长久没有人修理。修路灯也和修道路一样,是一个大家都袖手旁观才是“严格优势策略均衡”的博弈。
这就是公共品供给的囚徒困境:如果大家都只从自己得益多少考虑问题,大家都只打自己的小算盘,结果就谁也不作为,对局锁定在“三个和尚没水吃”的局面,排除了合作双赢的前景。
所以,公共品问题一定要有人协调和管理。就一个国家来说,最重要的公共品是国防、教育、基础设施和其他政府部门。
政府责无旁贷,要用好来自纳税人的钱,把文化教育、社会保障、基础设施和国防公安等事情做好。机关大院、居民小区要有专人协调管理,把身边看起来很琐碎但是弄不好有损工作条件和生活环境的事情做好。
启示:古人讲究“修身齐家治国平天下”,似乎是从小到大一样的逻辑。其实,人们对待“家事”和“国事”的逻辑并不一样,原因很简单:“修身齐家”的好处是可见的,而“治国平天下”的好处就不那么清晰可见了。
,好人好报”
前面我们讲过帕累托效率的概念:如果资源已经被充分利用,要想再改善某些人的处境就必须损害其他人了,就说这个经济已经实现了帕累托效率,或者说已经达到了帕累托最优。
博弈说明,非合作博弈的结局常常不是帕累托最优的。这种情况的博弈虽然只有两个局中人,但是它的结局其实就是“三个和尚没水喝”的结局。事实上,两人博弈也能说明不少“多人博弈”的前景。三个和尚没水喝的局面是可以作帕累托改善的:设想有人协调一下,安排一个轮流挑水或抬水的制度,三个和尚的处境都会得到改善。
如果用“帕累托改善”来看社会公德(这也是一种“公共资源”)建设,我们会发现一些值得深思的问题。
做好事该不该要报偿?在我们的印象里,传统文化是耻于谈钱的,一个行善的人,就是品德高尚的人,这样的人就应该是重义轻利的。
但是经济学家不这么看。他们认为:做好事就是促进人群福利的行为(经济学称之为“有效率的”行为),这种行为不但应该鼓励,而且必须鼓励。只有这样,才会不断促进社会福利的提高。怎么鼓励呢?人都是自私的,总要追求自身的利益,所以给予报偿是最有效的。
这听起来好像叫人不太舒服,其实,中国人的“道德宗师”孔子在两千年前,就提出过这一问题。
春秋时期,鲁国有这样一条法律:如果鲁国人在其他国家中遇见沦为奴隶的鲁国人,可以垫钱把这个奴隶赎出来,回国后再到国库去报销。孔子的弟子子贡曾花钱赎出一个已沦为奴隶的鲁国人,但事后并不到国库去报账,以显示自己追求仁义的决心与真诚。
孔子知道此事后,对子贡说:我知道你追求高尚,也不缺钱花,可是这个补偿你一定要去领。因为你自己掏钱救人,会受到社会的赞扬,但今后,当别人在国外再遇见沦为奴隶的鲁国人时,他就会想垫不垫钱去赎人?如果垫钱赎了人,回国后去不去报账?不去报账,岂不是白白丢掉一大笔钱;如果去报账,岂不是在行为上会遭旁人讥笑,显得自己的品格不高?于是就会装做没有看见,这样一来,你的高尚行为岂不是阻碍了对至今仍沦为奴隶的鲁国人的解救?
如果德行善举得不到报偿,那么它就只能是少数人的“专利”而不会成为社会公德。以职业道德为例:改革开放以前,尽管舆论大力宣传一些各行各业的劳模、先进人物的事迹,但整个社会的职业道德水平却很低,营业员申斥顾客、工人消极怠工之类的现象很普遍。随着市场经济的建立,尽管有人感叹拜金主义对传统道德造成了冲击,但不可否认,社会职业道德水平在不断提高,作为消费者,我们可以享受微笑服务而不必到处生气了。
不要小看这些,更不要因为这些微笑“只是为了赚钱”而斥之为虚伪,消费者和商家都能获益,这才是真实、稳定的“双赢”。相反,如果肯对你微笑的只有“毫不利己,专门利人”的圣贤才是值得忧虑的,天下攘攘,能有几个圣贤呢?
启示:传说孔子的另一位弟子有一次见到有人掉在水里,他跳下水去,把遇难者救上岸来,被救者酬谢这位弟子一头牛,他收下了。孔子对这个学生的行为大加赞赏。就是因为这会激励更多的人去救人,将会使今后有更多的溺水者受到营救。
用什么减少垃圾
垃圾已经成了令人头疼的问题。这世界上的大多数城市,都处于垃圾的包围中。这些垃圾都是城市制造的,要说自作自受,那是一点也不错。可是我们不是消极厌世者,不是愤世嫉俗者,我们希望找到一个对付垃圾的好办法。
这个问题可以分为两个方面:开源和节流。一是如何处理已有的垃圾,二是如何减少垃圾的生产。前者可以通过技术手段完成,后者呢?
容易想到的办法是:加强环保教育,使人民认识到垃圾的危害性;同时逐渐减少不可回收物品(如塑料袋、发泡餐盒等)的使用,代之以可回收和降解的产品。
可是这两个措施的收效并不理想。正如我们前面讨论过的,如果没有其他手段作为保证,思想教育很难改变人们的固有生活方式。而可回收和降解的产品因为成本较高,也难以替代不可回收的产品。
较为明智的固体废弃物减量方式,最好是通过简单的市场力量来运作:采用污染者付费的原则,让制造垃圾较多的民众付出较高的代价。
美国西雅图市在减少居民的固体废弃物丢弃量方面提供了成功的经验。在西雅图,居民可自行决定每星期使用的是19、32或60加仑容量的垃圾桶。每种垃圾桶的月费,以及增加任何一种垃圾桶的费用,都是随着容量呈几何级数增加,以便于杜绝随意浪费。同时,西雅图还另备有可再生物品专用容器,而且不收处理费用。
当西雅图在1981年刚启用这套系统之时,平均每户一星期的垃圾都会装满三个半32加仑的垃圾桶,目前则已降低到每星期平均只有稍多于一个32加仑垃圾桶的垃圾量。
西雅图的计划之所以能奏效,是因为这套计划不但简明扼要,而且借用了经济诱因的力量来推广垃圾减量及再生。他们并没有直接告诉民众该如何改变生活方式,换言之,他们并没试图去颠覆民众的生活方式,或是对他们采取一视同仁的平头处理方式;相反的,这项计划提供了改变生活方式的原因,允许民众自行决定该不该改变、该做多大改变。换言之,它等于是说:这是我们的规则,你们自己看着办吧。
启示:在这里要提醒大家:“可降解”可能只是一个理想,根据两个美国记者的调查,被埋在垃圾场里的多数物品实际上都“不可降解”:埋了十几年的报纸、衣物甚至热狗,大体上还是原来的模样。
沙尘暴的警示
我们有时在电视中看到沙尘暴,那种难分昼夜、日月无光的情景很让人心寒。特别是当这种景象发生在像北京这样重要的城市时,总能听到人们的惊呼:生态警钟敲响了!
河北境内的沙漠直逼北京,据说最近的沙漠离北京只有60公里。专家预测,如不想出有效办法对沙漠进行治理,几十年后,北京将像消失的楼兰古城一样,被沙漠掩盖。
土地荒漠化是中国重大的生态问题,而且荒漠化的速度还在呈上升趋势。上世纪50年代至70年代中期年均扩大1560平方公里,而在70年代中期到80年代中期年均扩大面积为2100平方公里,而目前的扩大速度为每年2460平方公里。这个速度还在增加。
中国土地的荒漠化集中在中国的西部和北部,即内蒙、新疆、黑龙江、宁夏等省份。在北方,雨水量小,土地上的生态系统脆弱,为了维持过度增长的人口对粮食等的需求,人们对土地的索取呈加速趋势。对土地的“滥垦”、“滥牧”、“滥伐”、“滥采”是土地沙漠化的原因。据调查,在牧区,草原上的牲畜严重超载已成普遍现象,牧区一般超载50%~120%,有的地区达到300%。
那么是不是这些地方的人民都愚昧无知或贪得无厌呢?我们可以看到,荒漠化最严重的地区,恰恰是中国最贫困的地区。人民脱贫致富的要求是合理的,同时他们所生产的原料(羊毛、牛奶等)大部分是供应东南部较富裕的地区的。所以说,土地荒漠化不是某个地区的问题,而是整个国家的问题。
在世界环境危机中也有同样的问题,由于环境破坏的情况主要集中在发展中国家,富国就把矛头指向穷国,要求它们保护环境,不要为了自己的私利而损害公共利益。可是发展中国家指出,环境破坏的最大收益者正是发达国家,它们理应为环境问题“埋单”。
启示:现在普遍同意的观点是,荒漠化的原因,是由于人类对土地资源的过度利用——对土地的利用超过了它的承受能力。
丧钟为谁而鸣
现在各国都在发展经济,GDP(国民收入)是一国富裕程度的指标,或者说是国力强弱的指标,各个国家都在制定促使GDP增长的政策。然而,某些国家的GDP的增长在一定程度上建立在对自然的破坏之上,可以这么说,在某些国家和地区,GDP是对自然破坏的指标。
当然,有很多人会问:为什么美国那么富裕,而对自然破坏得较少?的确,美国的环境是保护得最好的。其实,这有三个原因:第一,美国生产或消耗的原料有很大一部分来自于别国,如石油来自中东,美国GDP的增长建立在他国对自然的破坏之上;第二,美国的产品许多是高科技产品,高科技产品对自然的破坏较轻,但它会加大人类对自然的破坏力量;第三,美国生产的高科技产品往往难以被自然消解,自然对加工粗糙的产品的消解是容易的,而对用高科技制造出来的精巧的物品消解起来是缓慢的,所以这种对自然的破坏不是那样直观,因此常被我们忽略。
可以这么认为,人类文明的发展是不可拒绝的。当周边国家进入工业社会,发展机器工业,可以在较短的时间生产出比农业社会较多的物资,并且可以生产出以前没有的东西,有哪个国家看到这种情形还会无动于衷?即使你情愿做“小国寡民”,周边国家的强盛也必然会使你的安全受到威胁,因此,除了被动地跟进,你没有其他选择。17世纪工业革命首先发生在英国,西方国家相继进入工业社会。而远东的中国,在距离上离发生工业革命的西欧较远,因而在时间上也直到19世纪中叶才感受到工业革命的冲击——在列强枪炮的攻击下被动地接受工业化。20世纪的中国其实是被动地接受现代化。在社会发展史上人们在很大程度上是没有多少选择余地的。
我们这里要说的不是历史的发展规律问题,而是要表明:当前世界各国竞相发展经济、对自然进行破坏,是一个集体行动的悲剧。
发展经济对人类确实是好事,但问题是,经济的发展空间不可能是无限的,不妨说,市场经济是促进人类发展的火车头,但是这个车头却没有一个有效的刹车系统。
市场经济是竞争经济,在这样一个优胜劣汰的格局下,拼命地向自然索取或者说掠夺是现时代的特征。每个竞争者——可以小到个人,大到国家——都这样想:我不发展就有可能被淘汰出局。而经济的发展就是对自然的利用——无论这种利用是对自然中原始物的加工还是对中间产品的再加工,其结果都是自然被加速地破坏。这就是自然的生态状态愈来愈恶化的原因,其结果是人类的生存环境越来越恶劣。
这就是悲剧:大家都意识到问题所在,但大家都无能为力。
启示:许多人清楚人类目前的这种状况,但谁也没有良药,因为“破坏——发展”是优势策略,每个参与者采取“破坏——发展”成为集体行动的纳什均衡。
目光短浅,或在劫难逃
现在很多人已经承认:人类的发展不是无限的,越来越严重的环境问题就是证明。换言之,“帕累托改善”(所有人受益)总要达到“帕累托效率”(有些人受益,有些人吃亏)。
人们都希望生活改善,而没有人希望生活水平下降,这是人之常情。但这似乎是不可能的。发展中国家以发达国家为目标,发达国家也不希望停步不前(更不要说倒退了),有没有“发展的极限”?如果有,它在哪里?
美国人口将近3亿,占世界人口的5%,却消耗世界30%以上的资源。这当然不公平,但是如何实现公平,确实令人头疼。
每个国家、每个人都有权追求更快的发展、更高的生活品质,但是如果再增加几亿人达到美国人的生活水平,这个世界就无法承担。结果是环境遭到毁灭性破坏,资源枯竭,人类的生存都要面临问题,谈何发展?
看来,惟一的解决办法是富国降低生活水平,给穷国让出部分“蛋糕”。正如“笼中猪”博弈所演示的那样,富国一方面在环境保护和治理方面承担更多的义务,一方面遏制发展的欲望,给穷国让路。可是,即使真有政治家看到了这一点,他也无法赢得大选,实现这一理想。谁会选一个许诺“明天会更糟”的人呢?
,帕累托改善”不可能,“帕累托效率”又会遭到既得利益者的反对,人类的未来的确值得忧虑。莫非只有等到“天塌砸众人”?惟一的希望在于在危机到来之前,人们找到一个合理的、各方认可的妥协方法,可问题是:还有多少时间?还有多少机会?
启示:美国拒绝在《京都议定书》上签字,就是这个道理。尽管签署这一协定,长久而言对大家(包括美国自己)都有好处。这也是“囚徒困境”:每个人的最佳选择,导致最坏的结果。
世界政府
既然各自为政的国家无法就这类全球性问题达成一致,那么一个“世界政府”(联合国不是一个权力机构,只是一个协调机构)能否解决这个难题?
这里有两个问题,一是能不能,二是好不好。先看第一个:一个凌驾于国家之上的“世界政府”可能建立吗?
今日的世界着实叫人眼花缭乱,一方面,很多国家分崩离析,如前苏联、南斯拉夫等国家的分裂,在另外一些国家,分离主义也在抬头;另一方面却是全球经济、政治的一体化进程。欧洲议会已经成立,并将产生欧洲宪法,可以想像,未来欧洲将以一个类似国家的统一面目发挥作用。同时北美、东亚、南亚和非洲都开始成立或谋求成立自由贸易区,而经济的一体化肯定会对政治一体化起到推动作用。
不妨这样说,分裂是“清算过去”,而统一是“面向未来”,“过去”总有清算完结的一天,而未来的巨大利益,必将成为“天下一家”的推动力。即使各方文化、利益的冲突不可调和,一时无法成立一个天下一统的政体,至少出现几大国家集团的前景是可以预见的。
再看第二个问题:“世界政府”应该建立吗?
一个世界政府可能给人类带来诸多好处,如可以在整体上解决核威胁、资源调配和环境危机等全球性问题,大大降低交易成本,人们有更多的自由和选择。可是它也有很多问题:它对各国的领导权是建立在暴力手段上吗?如何调节各地区、国家间的矛盾?用什么手段保证这个集权政体避免独裁?
集权导致腐败,这是人类历史已经证明的“定理”。一个独立国家的独裁者要面对国际竞争的压力——如果他做得太过分,就可能导致国弱民穷,国家失去竞争力。可是假如没有外星人入侵之类的外部威胁,一个全球政府的外部压力又在哪里呢?如果希望通过“内部压力”——民主防止独裁,又如何解决内部权力斗争导致的效率低下?
也许比较可能的前景,还是若干“超级大国”并存,相互既合作又斗争的博弈局面,这当然不能从根本上解决问题,但有助于简化问题,找到比较可能为各方接受的办法。可是这会不会又导致新的问题出现?一个答案往往是下一个问题,也许我们只能走一步看一步。
你也许已经发现一个悖论:解决公用地悲剧的方法(通过私有化使人们从保护中获得利益)却是更大的公用地悲剧的根源(个人和国家追逐利益,破坏地球环境)。这其实也并不奇怪,“人类社会学三定律”其中有这样一条:一个系统内的解决之道,将成为更大系统的难题。
这不仅是对博弈论的考验,更是对人类智慧的考验。
启示:你也许已经发现一个悖论:解决公用地悲剧的方法(通过私有化使人们从保护中获得利益)却是更大的公用地悲剧的根源(个人和国家追逐利益,破坏地球环境)。这其实也并不奇怪,“人类社会学三定律”其中有这样一条:一个系统内的解决之道,将成为更大系统的难题。
尾声什么是最佳策略
故此,尔等须知晓自身宿命,故此,尔等须把稳船只……置欲求于动机之后,尔须奋力以搏。
故此,且容好奇心为尔等指南。追寻天上真理,如同在大地寻觅。
所不敢为者,为之;所不敢至者,往之。
道路千万条,宜选阳光道。聪明择路,正派为人,公平行事。
故此,尔须多有智识,勤于创造。
——《爱因斯坦的圣经》
很抱歉,这本谈策略的书要以布道告终。但是正如我们看到的:好多人失败,不是因为他们傻,而是太聪明。
一个聪明人的麻烦是他总希望比别人多得一些,或者说,他总面临这样做的诱惑。因为他比别人聪明,他是有能力这样做的,按照我们对人性的了解,人普遍追求利益的最大化,聪明人这样做,也是很自然的。
然而,这种自然的行为却引起了一系列无法控制的变化,其中最关键的就是:生活越来越复杂了。
比如,你要做成一件事情,希望达到某种目的,但是你不能仅仅考虑这件事本身,还要考虑它可能造成的各种影响。要不要与人合作?利益如何分配?它会不会得罪某些人?等等。你不得不考虑它们,因为这些问题确实存在。这样你就不得不花费大量的精力和智慧去处理它们,而这些花费对你本来想做的那件事并无多大益处。也就是说,它们大大提高了你做事的成本。这种多余的花费似乎是我们的宿命。
如果大家都考虑得少一点,都傻一点,不是对每个人都好吗?所有美好的东西都是傻子创造的:埋头苦干的是傻子,助人为乐的是傻子,推己及人的是傻子,满怀希望的还是傻子,傻子创造了世界,傻子享有世界。
很遗憾,我们已经懂得,世界不会因愿望(不管多么良好,多么合理)而改变,“傻子”在这个世界一定是无法生存的,因为在一个资源稀缺的世界,可以说“利他”的机会成本就是“损己”,而“损己”的极至便是让出你的生存空间给别人。但是,我们还是有可能改变一些东西的,只要你懂得:聪明可能并不像看起来那样聪明,傻也不像看起来那样傻。
,囚徒困境”中,人们越聪明,结果越糟糕。而打破这一困境的办法很简单:一报还一报。也就是所谓“人不犯我,我不犯人;人若犯我,我必犯人”。它能够清晰表明我们的立场,用最明了的方式告诉对方:为了自己的利益,他该怎样去做。
从“一报还一报”的胜利中,我们可以得到以下结论:你的策略越简单,越清晰,也就越有效。相反,如果你的策略无原则的复杂,将永远面临考验。
书店里有很多书指导你如何生活、如何与人相处、如何应付这样那样的问题,杂志上也连篇累牍地告诉你如何说话、如何察言观色、如何八面玲珑。不用说,这些人生指南常常是相互矛盾,甚至是自相矛盾的。你应该诚实,但又不能太老实;你应该友善,但也要偶尔发发脾气;你应该能干,但又不要弄到被别人嫉妒的地步;你应该聪明,但要装得傻一点;你要讨领导的欢心,但不要被认为是个马屁精;你要多交朋友,但未可全抛一片心……即使你没让这些东西弄糊涂,也不免感到,想好好活下来真是不容易,你得学会踩钢丝才行。
人生有无数答案,我们很难确知哪个最标准。如果你想把答案弄得很复杂,那是你的权利,但不是惟一的解决之道,其实你也完全可以用简单的方法对付它,那就是:不管周围如何,你为自己制定几条原则,并照此行事。
这很愚蠢吗?其实未必。环境是无法选择的,也是无法完全控制的,你在上面花费的心思,就不一定划算。
因此,我们再次重复强调一些通则,不过这么做有点儿冒险,因为人们倾向于过度简化生活,尤其是在这个头条标题取代新闻、记录片取代真实故事、书摘取代书籍的年代里更是如此。所以别忘了另外两句没有列入这些通则中的话:怀疑是权利的保证;要“拿来”,不要“接受”。
策略的优劣,取决于游戏规则。个人的最佳策略是尽可能利用规则,社会的最佳策略是通过规则引导人们的行为趋向群体福利的提高。
对合作或冒犯,都要给予回报。“以德报德,以直报怨”。如果你惩罚对方的报复,这种反应就会一直延续下去。如果你宽恕了对方,你就得冒被欺负的风险。
不要把赢作为惟一目标,也不要总是追求最好结果。在许多类似“囚徒困境”的博弈中,双方的关系并不是简单的“你赢我输”的对抗关系。双方可以都做得很好,也可能都做得很糟。制胜不是靠打击对方、压倒对方,而是靠引导对方采取对双方都有利的行为,即合作的行为。
如果有几种选择,选择最直的路。清晰、简单、有连续性、让合作方明白易懂的策略往往是最优的。公开声明自己所持的态度,并在任何时间、任何利益诱惑下都始终如一地坚持下去,才会使自己立于不败之地。朝令夕改会令对方无所适从。复杂的规则并不比简单的规则做得更好。
你不可能永远控制局面,也不必永远控制局面,人类最理智的时候,往往是别无选择的时候。
知识就是力量。至少在某些情况下,拥有一定程度的知识对理性决策助益匪浅,而且知道得越多,你的决策就越可能接近正确。在博弈中,你的地位常常取决于你是否拥有信息并在此基础上作出理性决策。各种层次、领域的决策都可以通过知识的增长而改善。
除非能在一开始就很清楚自己的既定目标,或想要避免的事,不然永远无法作出理性决策。这适用于个人与团体决策,只是对后者而言,显然困难得多。如果能同时设定可能后果的价值,不论正负,再加上发生的机率,就更能帮你做不理智的抉择。
即使是全然理性的决策也可能是错的,反之亦然。因此,若结果出乎意外地糟,也没有必要自责或自暴自弃;同样地,如果运气好,结果也不错,更不必沾沾自喜。如果是不确定的,那就是不确定,你只能与机运斗法,但若能以智慧来与机运抗衡,则获胜的机会就会比失败大出许多。
无论你想做什么,不管是赌博、运动、投资股市、择偶,甚或发动战争,之前你最好弄清楚自己在做什么。
合作与双赢并不意味着完全的公平。所有好的策略,都不过是在公平与效率之间找平衡。
注定会产生坏决策的一个方法,就是把决策者和受益者分离,决定人和被决定人分开;虽然一般人大谈对社会福利的关切,但这种关切只有在和个人利益没有切身关系时才看得到;一旦社会福利造成个人损失,利他主义就消失了。
团体决策基本上比个人决策更难保持理性,在团体决策过程中有很大的操弄和使诈的空间。目前已知的各种选举制度都无法避免这个现象,只不过有些制度的表现比较好而已。
至今仍找不到令人满意的方法,能在不产生不良结果的情形下,同时顺利地把各人偏好转换成团体偏好。阿罗不可能原理告诉我们:任何制度都有缺陷,而最好的制度就是造成损害最少的制度。内耗不可避免,明智的人把内耗控制在可接受的限度内。
据此推论,“若每个人的行为都以理性的自利为出发点,则其结果仍会对社会有利”,这个乐观想法仍旧是个误区。更不幸的是,它反而掩饰了无知自利的影响。
再以此推论,至今人类仍未发明出一种政府形态,完全令人满意、可以作出造福社会的团体决策。我们真的不知道该往何处去,所以要常怀谦逊之心。
评论博弈论”不是“大力丸”
 “博弈论”不是“大力丸”
作者:摸鱼儿
现在,“博弈论”正在成为一门“显学”,坊间这类著作颇多。对于普通读者来说,《博弈游戏》似乎是个不错的选择。
,博弈”这个词听起来高深莫测,其实它就是“游戏”的意思。如果直译就是“游戏理论”。更准确点说,是可以分出胜负的游戏。
我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾和冲突。所谓博弈论,简单说来就是研究在这种背景下,人们如何进行决策、以及这种决策的如何达到均衡问题。每个对弈者在决定采取何种行动时,都必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
可以说,只要你是一个“社会人”,你就离不开博弈论。
关于“生活智慧”的著作大致可分两种:一是“照方抓药”式的,告诉你在某种情况下应该怎么做;二是“思想教育”式,从林林总总的生活现象总结一般规律,并以此指导生活中的种种选择。前者之弊在于浅陋,后者之弊在于空泛。这本书比较好地避免了这两种陷阱:它介绍了许多特定情况下的决策原则,但并不是什么“策略大全”;它告诉读者:人们在进行选择时遵循的一般规律,但都言之有物。
,深入浅出”也是本书的一个特点:它摈弃了同类作品中常见的(同时也是令读者望而却步的)图表、公式等“专业”模式,而是通过一些有趣的例子和谜题(如“囚犯困境”、“约会游戏”、“枪手决斗”、“强盗分金”等)解释生活中的种种现象,告诉你为什么有时我们会在优势情况下输掉比赛;为什么群体理性决策如此困难;为什么社会公德难以提高,为什么“聪明人”不象他看起来那样聪明……这些揭示都不是流于表面的、情绪化的和止于道德判断的,而是通过清晰、客观的分析,让我们理解人们思想和行动的逻辑。
如同许多理性而诚实的著作一样,本书并没有给我们一个“包治一切”的现成的“答案”(尽管它提供了许多很有启发性的思考方式和选择原则),而是指出我们理性的并不完美。在这个问题成堆的世界上,单纯地“予智自雄”或“以力压人”都终非坦途,我们只有怀着谦逊、合作的态度,才可能取得比较理想的结果。
纳什与博弈论
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。然而,纳什天才的发现却遭到冯·诺依曼的断然否定,在此之前他还受到爱因斯坦的冷遇。但是骨子里挑战权威、藐视权威的本性,使纳什坚持了自己的观点,终成一代大师。要不是30多年的严重精神病折磨,恐怕他早已站在诺贝尔奖的领奖台上了,而且也绝不会与其他人分享这一殊荣。
纳什是一个非常天才的数学家,他的主要贡献是1950至1951年在普林斯顿读博士学位时做出的。然而,他的天才发现——非合作博弈的均衡,即“纳什均衡”并不是一帆顺的。
1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵,大师如云。爱因斯坦、冯·诺依曼、列夫谢茨(数学系主任)、阿尔伯特·塔克、阿伦佐·切奇、哈罗德·库恩、诺尔曼·斯蒂恩罗德、埃尔夫·福克斯……等全都在这里。博弈论主要是由冯·诺依曼(1903—1957)创所立的。他是一位出生于匈牙利的天才的数学家。他不仅创立了经济博弈论,而且发明了计算机。早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学
家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。
冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。正是在这个时候,非合作博弈——“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!
纳什不是一个按部就班的学生,他经常旷课。据他的同学们回忆,他们根本想不起来曾经什么时候和纳什一起完完整整地上过一门必修课,但纳什争辩说,至少上过斯蒂恩罗德的代数拓扑学。斯蒂恩罗德恰恰是这门学科的创立者,可是,没上几次课,纳什就认定这门课不符合他的口味。于是,又走人了。然而,纳什毕竟是一位英才天纵的非凡人物,他广泛涉猎数学王国的每一个分支,如拓扑学、代数几何学、逻辑学、博弈论等等,深深地为之着迷。纳什经常显示出他与众不同的自信和自负,充满咄咄逼人的学术野心。
1950年整个夏天纳什都忙于应付紧张的考试,他的博弈论研究工作被迫中断,他感到这是莫大的浪费。殊不知这种暂时的“放弃”,使原来模糊、杂乱和无绪的若干念头,在潜意识的持续思考下,逐步形成一条清晰的脉络,突然来了灵感!这一年的10月,他骤感才思潮涌,梦笔生花。其中一个最耀眼的亮点就是日后被称之为“纳什均衡”的非合作博弈均衡的概念。
纳什的主要学术贡献体现在1950年和1951年的两篇论文之中(包括一篇博士论文)。1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文,1950年11月刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低几天之后,他遇到盖尔,告诉他自己已经将冯·诺依曼的“最小最大原理”(minimax solution)推到非合作博弈领域,找到了普遍化的方法和均衡点。盖尔听得很认真,他终于意识到纳什的思路比冯·诺伊曼的合作博弈的理论更能反映现实的情况,而对其严密优美的数学证明极为赞叹。盖尔建议他马上整理出来发表,以免被别人捷足先登。
纳什这个初出茅庐的小子,根本不知道竞争的险恶,从未想过要这么做。结果还是盖尔充当了他的“经纪人”,代为起草致科学院的短信,系主任列夫谢茨则亲自将文稿递交给科学院。纳什写的文章不多,就那么几篇,但已经足够了,因为都是精品中的精品。这一点也是值得我们深思的。国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。
纳什在上大学时就开始从事纯数学的博弈论研究,1948年进入普林斯顿大学后更是如鱼得水。20岁出头已成为闻名世界的数学家。特别是在经济博弈论领域,他做出了划时代的贡献,是继冯·诺依曼之后最伟大的博弈论大师之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。后续的研究者对博弈论的贡献,都是建立在这一概念之上的。由于纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。
大原理的普遍应用
 大原理的普遍应用
孙健
从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境”这样的例子。如价格战、军奋竞赛、污染等等。一般的博弈问题由三个要素所构成:即局中人(players)又称当事人、参与者、策略等等的集合,策略(strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择,每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。
价格战博弈:
现在我们经常会遇到各种各样的家电价格大战,彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战,百姓都会“没事儿偷着乐”。在这里,我们可以解释厂家价格大战的结局也是一个“纳什均衡”,而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的,即是一个“纳什均衡”。这个结果可能对消费者是有利的,但对厂商而言是灾难性的。所以,价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题,一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战,作为一种敌对
博弈论(vivalry game)其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润。如果垄断可以形成,则博弈双方的共同利润最大。这种情况就是垄断经营所做的,通常会抬高价格。另一个极端的情况是厂商用正常的价格,双方都可以获得利润。从这一点,我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本。在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。
污染博弈:
假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。
贸易自由与壁垒:
这个问题对于加入WTO不久的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题,也是一个“纳什均衡”,这个均衡是贸易双方采取不合作博弈的策略,结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制,比如提高关税,则Y国必然会进行反击,也提高关税,结果谁也没有捞到好处。反之,如X和Y能达成合作性均衡,即从互惠互利的原则出发,双方都减少关税限制,结果大家都从贸易自由中获得了最大利益,而且全球贸易的总收益也增加了。
博弈论中的“囚徒困境”问题
分? 类:社科
 博弈论中的“囚徒困境”问题
莉香叶子
学习管理学或经济学的人一定都了解一些博弈论方面的知识。在博弈论中有一个经典案例——囚徒困境,非常耐人回味。
,囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
当然,在现实世界里,信任与合作很少达到如此两难的境地。谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。但囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。
促使生物体和人类相互合作的策略促使生物体和人类相互合作的策略
莉香叶子
尽管合作与信任是如此难得统一,但是,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。那么,问题就出现了:到底是何种机制促使生物体或者人类进行相互合作呢?
这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,对合作的问题久有研究兴趣。为了进行关于合作的研究,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。
但这里与“囚徒困境”案例中有个不同之处:他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”,它更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?
事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报(TIT FOR TAT)。这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。一报还一报的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。
当然,因为只有为数不多程序参与了竞赛,一报还一报策略的胜利也许只是一种侥幸。但是,在上交的14个程序中,有8个是“善意的”,它们永远不会首先背叛。而且这些善意的程序都轻易就赢了6个非善意的程序。为了决出一个结果来,爱克斯罗德又举行了第二轮竞赛,特别邀请了更多的人,看看能否从一报还一报策略那儿将桂冠夺过来。这次有62个程序参加了竞赛,结果是一报还一报又一次夺魁。竞赛的结论是无可争议的。好人,或更确切地说,具备以下特点的人,将总会是赢家。
1.善意的;
2.宽容的;
3.强硬的;
4.简单明了的。
一报还一报策略的胜利对人类和其他生物的合作行为的形成所具有的深刻含义是显而易见的。爱克斯罗德在《合作进化》一书中指出,一报还一报策略能导致社会各个领域的合作,包括在最无指望的环境中的合作。他最喜欢举的例子就是第一次世界大战中自发产生的“自己活,也让他人活”的原则。当时前线战壕里的军队约束自己不开枪杀伤人,只要对方也这么做。使这个原则能够实行的原因是,双方军队都已陷入困境数月,这给了他们相互适应的机会。
一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。这样的例子很多:真菌从地下的石头中汲取养分,为海藻提供了食物,而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁提供了食物,而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物,而黄蜂反过来又为无花果树传授花粉,将树种撒向四处。
更广泛地说,共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。那么,只要这些个体能互相遇见,足够在今后的相逢中形成利害关系,他们就会开始形成小型的合作关系。一旦发生了这种情况,他们就能远胜于他们周围的那些背后藏刀的类型。这样,参与合作的人数就会增多。很快,一报还一报式的合作就会最终占上风。而一旦建立了这种机制,相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意,一报还一报政策强硬的一面就会狠狠地惩罚他们,让他们无法扩散影响。
现在,对博弈论的研究是如此地广泛,以致于有些人说最新的经济学和管理科学都已经利用博弈论的理论和工具重写过了。博弈论中有很多有趣而富于哲理的案例,善意、宽容、强硬、简单明了的合作策略无论对个人还是对组织的行为方式都有很大的指导意义。