决策与逻辑
——探讨博弈论中的逻辑推理
博弈论是研究人们在各种战略情况下如何行事的理论,又被称为对策论或策略论,在近
来已成为经济学研究的一大热点。但是对于博弈论中的逻辑推理却很少有人加以注意。
先以一个为大家所熟知的例子来引出博弈,即田忌赛马的故事。齐王请田忌赛马,田忌
的马队不如齐王的马队,田忌用孙膑的计谋,用最差的马对齐王最好的马;用最好的马对齐
王中等的马,用中等
的马对齐王最差的马,结果以二比一胜了齐王。对于这个例子,我们采用逻辑推理过程
来得出最优的决策(假设事先知道齐王的出马顺序是先出好马,再出中马,最后出下马)。
我们先给出所有的可能性决策,由排列组合可知共有6种,罗列如下:
a. 用好马对齐王的好马,中马对齐王的中马,下马对齐王的下马;
b. 用好马对齐王的好马,下马对齐王的中马,中马对齐王的下马;
c. 用中马对齐王的好马,下马对齐王的中马,好马对齐王的下马;
d. 用中马对齐王的好马,好马对齐王的中马,下马对齐王的下马;
e. 用下马对齐王的好马,好马对齐王的中马,中马对齐王的下马;
f. 用下马对齐王的好马,中马对齐王的中马,好马对齐王的下马。
如果a,那么输(r);不输,所以不a;(a→r)∧﹁ r→﹁a(→否定后件式)
如果b,也输;不输,所以不b; (b→r)∧﹁ r→﹁b(→否定后件式)
如果c,也输;不输,所以不c; (c→r)∧﹁ r→﹁c(→否定后件式)
如果d,也输;不输,所以不d; (d→r)∧﹁ r→﹁d(→否定后件式)
如果e,则赢;
如果f,则输;不输,所以不f。 (a→r)∧﹁ r→﹁a(→否定后件式)
在这里我们用了六次充分条件假言推理得出了最优决策e,由于这例较为简单,所以在
我们日常生活中一眼就能看出结论,而不必经过上述如此复杂的罗列,但是事实上,我们的
推理程序还是按上述过程进行的。
下面我们来分析一个著名的博弈问题“囚犯难题”:
两嫌疑犯A、B有非法携带枪支的轻罪,因此每人都要在监狱中度过一年。警察怀疑两
人又曾合伙抢劫过银行,但缺乏足够的证据证明他们犯有严重罪行。警察在分开
..
的屋子里审
问了两人。如果两人都不坦白了,则两人都只能关一年;如果其中一人坦白,另一人未坦白,
则坦白者可以自由,而未坦白者将关押20年;但如果两人都坦白了,则两人都得监禁8年。
那么结果会是怎样呢?
我们来考虑A的决策。A的推理如下:“如果B保持沉默,那么最好的战略是坦白,
因为自己将得到自由而不是在狱中呆一年;如果B坦白,那么自己最好的战略仍然是坦白,
因为这样自己在狱中呆的是8年而不是20年。”所以无论B怎么做,A都会选择坦白。简
化一下即为如果P,那么R;如果Q,那么R;或者P或者Q,所以R(其中P代表B保持
沉默,Q代表B坦白,R代表A坦白),换成逻辑语言即:(p→r)∧((q→r)∧(p∨q) →r。
这是两难推理的其中一种:形式简单构成式。同样B也会有和A一样的考虑,所以结果是
两人都选择坦白,但是从表1我们可以清楚地看到这并不是最优的结果,这就是所谓的“囚
犯两难处境”。这是一个完全信息静态博弈的逻辑推理过程。
为了达到最优结果,A、B可以考虑合作,即在警察逮捕他们以前,双方作出不坦白的
1
承诺,但是维持合作却非常困难,一旦A、B被分开审理,利已的逻辑就会发生作用,如A
会这样推理,既然B不会坦白,那么如果自己坦白了,将得到自由,所以坦白是最优选择
方案,同样B也会这样推理,所以这并没给两者带来什么变化。
B的决策
坦白 保持沉默
每人8年
A自由;
B20年
B自由;
A20年
每人1年
坦白
A的决策
保持
沉默
表1
现在我们再来看一个必要条件假言联锁推理。给出的例子是一个完全信息动态博弈。设
甲、乙两人做游戏,每人每次可以取一张牌或是两张牌,共13张牌,谁拿到第13张牌谁就
赢,甲先拿,为了赢,甲第一次应该拿几张牌?为了解决这个问题,我们要进行逆向推理。
因为最后一次甲可以拿1张或2张牌,所以乙最后一次拿完后要剩1张或者2张牌,而乙最
后一次拿之前应该剩下3张牌,这样才能保证乙拿了1张或2张后还剩2张或1张,换句话
说,只有在最后一次乙拿之前还剩3张牌(p),才能保证甲拿到第10张牌(q);同样,只
有在最后第二次乙拿之前还剩7张牌(r),才能保证在最后一次乙拿之前还剩3张牌(p),依
此类推,可得甲第一次应拿一张牌(u)才能赢(s),即:(u←n)∧…∧(r←p) ∧ (p←q)←s(n为
第二次甲应拿牌数)。
由以上对三个简单博弈的逻辑推理的分析中,我们可以对博弈论中的逻辑推理的运用有
一个基本的了解,还有很多博弈论的例子可以通过逻辑推理的方法来得出决策结果,但并不
一定是最优结果,当然也有很多博弈尚且不能得到解答,所以本文只是我试着运用逻辑来分
析些博弈问题,希望能对大家有所帮助。
竺可桢学院文(一)
3013002028
王小萤
2