按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
。
这个策略不仅让a先生手中的股票多了起来,而且对方也因此阵脚大乱,没过几天,对方再也无心持有这小部分且不稳定的股票,于是把手中的股票抛售出去了,当然,这些股票大部分落入了a先生的手里,使a先生又大赚了一笔。
受益者的幸福是建立在失去者的痛苦之上的,因为二者所得或所失是相等的。
博弈智慧
零和博弈是与非零和博弈相对而言的,它是一种非合作性的博弈,参与博弈的双方在严格的竞争中,一方的损失往往是另一方的收益,博弈双方的损失和收益加起来总和为“零”,也就是说双方根本不存在严格意义上的合作。
囚徒困境是一种非合作博弈,它的主旨为,囚徒们虽然彼此合作,坚决不吐实情,可为全体带来最佳利益,但在资讯不明的情况下,出卖同伙可为自己带来利益,而被同伙招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
第24章 何谓囚徒困境()
囚徒困境是博弈论的非零和博弈中具有代表性的例子,反映个人的最佳选择并非是团体的最佳选择。
1950年,就职于兰德公司的梅里尔弗勒德和梅尔文德雷希尔拟定出相关困境的理论,后来由顾问艾伯特塔克以“囚徒”方式阐述,并命名为“囚徒困境”。那么,囚徒困境的案例究竟是怎样的呢?
警方破获了一起纵火案,抓住了两名嫌疑犯甲和乙,但是没有足够的直接证据来指控二人入罪。于是,警方分开囚禁两名嫌疑人,分别对他们进行了讯问。为了瓦解分化对方,警方分别对两名嫌疑人说:如果主动坦白,可以减轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。
如果两人都拒不坦白,那最后警方会以扰乱社会治安、破坏公共安全的罪名将二人各判刑1年;如果其中一人认罪并作证检控对方,此人将作为证人而免于起诉,而保持沉默的另一人将被重判15年;如果两人都招供,则两人都会因纵火罪被各判10年。
面对这样的情况,甲乙两名嫌疑犯在各自的心里打起了小算盘。甲经过权衡后发现,只有自己招供是最佳的选择,可以获得自由;乙也发现,无论甲招不招供,自己的最佳选择都是招供。所以,最后的结果是,甲乙二人都分别向警方坦白了自己的罪行,甲乙两个自认为聪明的人分别被判刑10年。
如同博弈论的其他例证,囚徒困境假定每个参与者(“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
从这个角度出发,上面故事中的两名嫌疑犯自然会选择刑期最短的策略。由于两名囚徒隔离监禁,并不知道对方的最终的决策;即使他们能交谈,也未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得的刑期,总比自己沉默要来得低。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛,结果二人同样获刑10年。
因为双方都认为选择背叛自己最得利,所以根本不会去顾及团体利益。而以全体利益而言,如果两个人都保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑10年的情况更好。但根据以上的假设,二人均为理性的个人,且只追求自己的个人利益。均衡状况会使两个囚徒都选择背叛,结果二人获刑均比合作要高,总体利益较合作为低。这就是“困境”所在。在日常生活中,有很多这样的“困境”存在。
有一则三个老鼠偷油的寓言故事:
三只老鼠一同去偷油喝。到了油缸边一看,油缸里的油只有那么一点点,并且缸身太高,谁也喝不到。
于是它们想出办法,一个咬着另一个的尾巴,吊下去喝。第一只喝饱了,上来,再吊第二只下去喝并且发誓,谁也不许存半点私心。
第一只老鼠最先吊下去喝,它在下面想:“油只有这么一点点,今天总算我幸运,可以喝一个饱。”
第二只老鼠在中间想:“下面的油是有限的,假如让它喝完了,我还有什么可喝的呢?还是放了它,自己跳下去喝吧!”
第三只老鼠在上面缸边想:“油很少,等它俩喝饱,还有我的份吗?不如早点放了它们,自己跳下去喝吧!”
于是,第二只老鼠放了第一只老鼠的尾巴,第三只老鼠放了第二只老鼠的尾巴,都只管自己抢先跳下去。
结果它们都落在油缸里,永远逃不出来了。
还有“鹬蚌相争,渔翁得利”的故事,也说明了这一点。
一只河蚌张开蚌壳,在河滩上晒太阳。有只鹬鸟,从河蚌身边走过,就伸嘴去啄河蚌的肉。河蚌急忙把两片壳合上,把鹬鸟的嘴紧紧地钳祝鹬鸟用尽力气,怎么也拔不出嘴来。河蚌也因此脱不了身,不能回到河里去了。河蚌和鹬鸟就争吵了起来。鹬鸟瓮声瓮气地说:“一天、两天不下雨,没有了水,回不了河里,你总是要死的!”河蚌也瓮声瓮气地说:“假如我不放你,一天、两天之后,你的嘴拔不出去,你也别想活,总要饿死!”河蚌和鹬鸟吵个不停,谁也不让谁。这时,恰好有个打鱼的人从那里走过,就把它们两个一起捉去了。
从“囚徒困境”模式中,我们可以看到,理性的人最后的选择都是“背叛”,不愿通过合作的方式和其他人共同摆脱困境。而在现实中,背叛和合作是共同存在的,而且各方之间的信息也并非都是完全闭塞的。
在博弈中,当你做决策的时候,你身边的人也在做着某种决策,而且是会相互影响的。这个时候,互相之间的利益就可能发生冲突,当然其中也包含着一定的合作因素。因此,你的决策就必须要将这些冲突考虑在内,同时要注意发挥合作因素的作用。
事实上,在现实中,合作还是背叛,处于弱势者的选择并不是固定的,不过尽可能减少损失,让自己得利,这是不变的原则。
博弈智慧
你的选择和决定将会影响到别人的决策结果,同样,别人的选择和决定也直接影响着你的决策结果。人们只希望自己的行为对自己无害,并不想是否对他人有利,这种心理是典型的“背叛策略”。
第25章 理性者的悲剧()
“囚徒困境”是博弈论中最有名的范例。1950年,就职于兰德公司的梅里尔弗勒德和梅尔文德雷希尔拟定出相关困境的理论,后来由顾问艾伯特塔克以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
警方逮捕了两名嫌疑犯,但是没有足够的证据证明他们两个有罪。警方现在面临的情况是:
(1)如果两个犯人都保持缄默,那么由于警方没有足够的证据,两人会在被监禁半年后获得自由。
(2)如果一人招供一人不招供,那么就会判处保持缄默的人10年有期徒刑,而招供的人会因为与警方合作而被无罪释放。
(3)如果两个人都招供,那么两人都会获得2年的有期徒刑。
警方把两个罪犯分别囚禁在两个牢房里,并分别告知他们自己面临的处境。可能你会认为他们两个都不会招供,但是,警方会运用博弈论引诱他们双方互相陷害。
警方会对其中的一个罪犯(罪犯甲)说:
如果另一个罪犯(罪犯乙)招供,那么他(犯罪甲)面临的处境是:如果招供,他会获得2年的有期徒刑;如果不招供,他会被判处10年的有期徒刑。所以,在对方招供的情况下,他选择招供会获得比较轻的惩罚(2年的有期徒刑总比10年好)。
如果罪犯乙选择不招供的话,那么罪犯甲面临的处境是:如果招供,那么他可以当庭无罪释放;如果不招供,那么他会获得半年的有期徒刑。所以,在对方不招供的情况下,他选择招供是对自己最有利的(当庭释放必然要比半年监禁更好)。
警方把上面的情况告诉罪犯甲之后,相信罪犯甲会明确地知道:不论对方选择招供还是保持缄默,选择招供对于他来说都是最好的。
既然这招对罪犯甲有效,警察就可以运用相同的手段,让罪犯乙也招供。警方巧妙地运用了博弈论,诱使双方都招供,从而把两名罪犯都判处了2年的有期徒刑。
如果两个人同时选择沉默,那么实际上两个人只要坐半年牢,就能获释。但是作为理性人,两人在都为自己的利益考虑之后,会同时招供,结果都要坐两年牢,才能获得自由。
如果我们把这个道理说给他们两个听,他们会改变自己的选择吗?肯定是不会的。在博弈论的领域中,大家都只会考虑到自己的利益。他们都不会冒险保持缄默。因为如果此时对方招供,那么自己面临的将是10年的有期徒刑,即使某个罪犯能说服对方保持缄默,招供对他来说依然是最好的选择。
我们再来换一个场景,如果两个罪犯事先讲好,就算是被警方逮捕了,也绝对不会招供,那么情况会有所改观么?答案是,如果这是一个一次性博弈,也就是说两人做完这个案件之后再也不会合作了,那么双方都不会选择缄默。恰恰与我们所想要的结果相反,两个人会更急切地想要招供。因为事先的约定会让对方保持缄默,只要自己选择招供,就一定能无罪释放,而不用承担获得2年有期徒刑的风险。当然,在这种情况下,他的同伴会被判处10年的有期徒刑,但是这又怎么样呢?反正这是一个一次性博弈,以后他也没有机会对自己施以报复。
但是,如果把两个罪犯放到同一个审讯室里审讯,结果又会怎样呢?这时,囚徒困境基本上就不会发生了。因为被分开审讯时,两人都会怀疑对方不会选择缄默,所以能得到对警方有利的结果。但是,在同一个审讯室里,两个人会受到对方的影响,选择就会发生改变。这也是为什么在现实中警察会把同一个案件中的犯罪分子分开审讯的原因。
我们的假设一直都建立在两个犯罪分子都为理性人的基础上,但如果他们两个都是非理性人呢?很可能最后的结果就是我们想要的:两人同时保持缄默,在被剥夺自由半年之后获释。这是不是说明了在现实中理性人反而会得到不好的结果?不是的,理性只对自己最有利,但是如果你的对手也是理性的,那么结果就会变成两败俱伤。最好的结果是,你是理性的,而你的对手是非理性的。
现在我们看到了两个解决囚徒困境的办法:把两个犯罪分子放到同一个审讯室审讯;两个犯罪分子中有非理性人。还有其他的方法吗?有的,我们至少还能再想到两种方法:一个是把一次性博弈变成重复性博弈,并在事先约定大家在被捕后都选择缄默。因为如果你们还会继续博弈的话,那这次就不能背叛约定,否则对方可能会在下次博弈时报复自己,这对自己也是不利的。第二个方法是,增加招供的代价。比如,在犯罪分子中建立一个组织,如果有人在被捕后招供,该组织负责将这个人暗杀。在这个博弈中,由于外部力量的介入,如果选择招供,反而会有更大的牺牲,因此两个罪犯都会选择缄默,从而得到在囚徒困境中不能得到的结果。从这个分析中得到的结论是:犯罪的时候,选择参加某个组织,而不是单干,是有好处的。这也是为什么犯罪团伙的犯罪分子会比独自行动的犯罪分子更加猖獗的原因。
博弈智慧
如果你的同伴是投机者,那他仅仅会考虑这次博弈中是否能得到比较好的结果,而不会预期将来还会与你合作。所以,在你们俩同时被抓起来时,他会毫不犹豫地选择招供,以期获得释放。因此,当你在选择同伴时,如果知道对方是投机者,就要格外小心才好。
第26章 囚徒的抉择()
1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家讲演时,他用两个囚犯的故事,为当时专家们正研究的一类博弈论问题,做了形象化的解释。从此以后,类似的博弈问题便有了一个专门名称——“囚徒困境”。
借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,得到了极为广泛的应用。
经济学的一个最基本假设就是:人是理性的。用英国哲学家霍布斯的话来说,“自然状态”中的人与人之间像狼与狼一样,是“每个人对每个人的战争”。在这种状态下,适用的是最大化个人自己利益的“丛林法则”。而“囚徒困境”恰恰准确地抓住了人性的真实这一面,聪明的警官采取适当的游戏规则使两名囚犯坦白罪行,认罪服法。
“坦白从宽,抗拒从严”的道理人人都懂。从博弈论的角度来看,这实际上就是一个囚徒困境的应用。“囚徒困境”被看成是博弈论的代表性案例,不仅因为其简单易懂,还在于这种现象在日常生活中广泛存在。
相信大家都有过这样的经验:当我们在公路上遇到塞车的时候,如果大家都规规矩矩地排在车道内,而有一个人违规驶入人行道,那么他就会占到便宜。但如果每个人都有这样的想法,并且付诸行动的话,则人人都要吃亏。这样的情况经常在我们的日常生活中出现,即每个人都守规矩,那么一个不守规矩的人就会获得好处;但若每个人都不守规矩,则人人都会吃亏。
冷战时期,美国和苏联大搞军备竞赛,双方都在军备支出方面投入了大量资金。如果双方都不增加军费支出,则双方的相对安全状况并没有变化,但却可以有更多的资金投入经济建设。因此,都不搞军备竞赛对双方都有好处,但实际情形却不是如此,两国都从自己的角度出发考虑问题:假定对方不搞军备竞赛,则自己搞军备竞赛将可以使自己相对安全并使对手陷入危险;如果对方搞军备竞赛,则自己更要搞军备竞赛才不至于使自己的处境相对危险。因此,最终博弈的结果是双方都在不断增加军费开支。
博弈智慧
“囚徒困境”之所以称为“困境”,也正是因为这个博弈的最终结局对囚犯来说恰恰是最坏的结果。这个结果源自人类的天性的自私。
第27章 因利益而起的“困境”()
囚徒困境结局的出现,都是源于对自己利益的考虑。生活中,人们之所以会做出背信弃义之事,也皆是源于这一机制。
在博弈论里,囚徒困境是最经典的入门范例。1950年,美国普林斯顿大学的数学家塔克为了向美国斯坦福大学的一群心理学家解释什么是博弈论,讲述了这样一个故事:
某日,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人——甲和乙,并从他们的住处搜出被害人家中丢失的财物。但是,他们都否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点东西。
警方虽怀疑他们作案,但却没有掌握确切的证据,于是警方将两人进行隔离审讯,由地方检察官分别与甲和乙单独谈话。检察官说:“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,根据控辩交易制度,如果你坦白并揭发同伙杀人的罪行