按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
、不正义的观念,就自动对其行为产生了调节作用。
博弈智慧
需要注意的是,在你的生活之中,仅仅凭借对手的道德观念来对其约束的话,这是具有一定风险的。针对这个问题,我们可以通过对道德因素的考虑,对博弈策略进行相应的调整,把博弈变成长期的、多边的,从而形成对遵守道德规范的动力与压力。
第154章 让法律为自己撑腰()
在每一个鼓励合作的方案里,通常都会包含某种惩罚作弊者的机制。
一个坦白且供出合作伙伴的囚徒可能遭到对方朋友的报复。若是知道外面会有什么报应等着自己,尽快逃脱牢狱之灾的前景也就不会显得那么诱人了。人人都知道,警察会威胁毒品贩子说如果不坦白就要释放他们。这种威胁的作用在于,一旦他们被释放,卖毒品给他们的人就会认定他们一定是招供了而加以报复。
在最初博弈之上增加惩罚机制的做法,其目的就是为了减少作弊的动机。在博弈的结构里还存在其他类型的惩罚。一般而言,这种机制生效的原因在于博弈反复进行,这一回合作弊所得将导致其他回合所失。
归纳起来,在一次性的博弈当中没有办法达成互惠合作。只有在一种持续的关系中才能够体现惩罚的力度,并因此成为督促合作的“木棒”。合作破裂自然就会付出代价,这一代价会以日后损失的形式出现。假如这个代价足够大,作弊就会受到遏制,合作就会继续。事实上,法国哲学家卢梭早就指出了这一点,他曾经有一本社会契约论,认为契约是整个人类社会存在的前提条件之一。
前面已经分析过,如果囚徒困境只是一次性的博弈,那么签订协议是毫无意义的,其纳什均衡点并不会改变。可以签订协议的一个最基本的条件,就是博弈需要重复若干次,至少大于一次。
重复博弈与一般性的动态博弈是不同的。多轮动态博弈中,参与者能够了解到博弈的每一步中其他参与者的在自己选择某种策略下的行动,而重复博弈的参与者无法了解到在任何一步中,其他参与者的策略选择。
在重复型的囚徒困境中,签订合作协议并不困难,困难的是协议对博弈各方是否具有很强的约束力。任何协议签订之后,博弈参与者都有作弊的动机,因为至少在作弊的这一轮博弈中,可以得到更大的收益。
霍布斯对合作协议的观点是:“不带剑的契约不过是一纸空文。它毫无力量去保障一个人的安全。”这就是说,没有权威的协议并不能导致民主,而是导致无政府状态。
囚徒困境扩展为多人博弈时,暴露了一个更广泛的问题——“社会悖论”,或“资源悖论”。人类共有的资源是有限的,当每个人都试图从有限的资源中多拿一点儿时,就产生了局部利益与整体利益的冲突。人口问题、资源危机、交通阻塞,都可以在社会悖论中得以解释。在这些问题中,关键是制定游戏规则来控制每个人的行为。
另外,学者爱克斯罗德所著的合作的进化一书暗含着一个重要的假定,即个体之间的博弈是完全无差异的。但对局者之间绝对的平等是不可能达到的,因而某些博弈对一方来说是典型的高成本、低回报:一方面,对局者在实际能力上存在不对称,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0分,这样,弱者的报复就毫无意义;另一方面,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,采取背叛的策略能占便宜。爱克斯罗德的分析忽视了这种情形,而这种事实或心理上的不平等恰恰在社会上引发了大量零和与负和博弈。
在这种情况下,应通过法制手段,以法律的惩罚代替个人之间的“一报还一报”,才能规范合作行为。
博弈智慧
从博弈论的角度看,法律就是通过第三方实施的行为规范,其功能是或者通过改变当事人的选择空间改变博弈的结果,或者不改变博弈本身而改变人们的信念或对他人的行为预期,从而改变博弈的结果。
第155章 博弈中合作的产生()
无论在自然界还是人类社会,合作或者背叛都是随处可见的现象。囚徒困境就是抓住了人们之间不信任和需要相互防范背叛的一面,使人们陷入了两难选择的境地。人们追求自我利益的心理导致人们在没有未来的一次性博弈中大多选择了不合作。
我们先来假设双方之间存在一个一次性的博弈,那么结果一定是各人自扫门前雪;如果博弈是连续多次发生的,那么彼此之间合作的可能系数就会增大。每一次人际交往其实都可以简化为两种基本选择:合作还是背叛。在人际交往中普遍存在囚徒困境:双方明知合作带来双赢,但理性的自私和信任的缺乏导致合作难以产生。而且,如果博弈是一次性的,那么这必然加剧双方进行坦白的决心,选择相互背叛。
在这样的博弈中,背叛是个人的理性选择,但是个体的理性却直接导致集体的非理性。基于这样的思路似乎没有任何方法能够让我们逃脱两败俱伤的局面。资深的博弈论专家罗伯特奥曼在1959年指出,人与人的长期交往是避免短期冲突、走向协作的重要机制。
在任何博弈中,表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步对于当前一步的影响足够大,即未来是重要的。总的来说,如果你认为今后将难以与对方相遇,或者你不太关心自己未来的利益,那么,你可以现在就选择背叛,而不用担心未来的后果。
而现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。奥曼通过自己的推导十分严密地证明,在较长的视野内,人与人交往关系的重复所造成的“低头不见抬头见”的关系,可以使自私的主体之间走向合作。
这可以解释许多商业行为。一次性的买卖往往发生在双方以后不再有买卖机会的时候,特点是尽量牟取暴利并且带欺骗性。而靠“熟客”“回头客”便是通过薄利行为使得双方能继续合作下去。
事实上,重复博弈也更逼真地反映了日常人际关系。在重复博弈中,合作契约的长期性能够纠正人们短期行为的冲动。这在日常生活里是具有普遍性的。
我们已经知道,由于一次性博弈的大量存在,引发了很多不合作的行为。而且,即便是在重复博弈中,合作的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。比如,商家之间的违约行为,国家之间的核威慑。在这些情况下,要使交易能够进行,并且防止不合作行为,必须设置严格的惩罚背叛行为的机制。
张老师是某班的班主任,他经常组织本班同学参加集体活动,比如外出旅游。但在组织的过程中,他遇到了一个棘手的问题。在一次集体活动中,张老师通知全班同学早上8∶00到校门口集合。结果有几个同学拖拖拉拉,导致大家8∶15才出发,从而白白耽误了一刻钟。
在此后的集体活动中,张老师改变了策略,虽然真实的集合时间仍是8∶00,但是他通知大家7∶45集合,结果最晚的几个同学也在8∶00赶到,从而准时出发。张老师对自己的策略感到很满意。
但是好景不长,大家又回来了有人迟到的困局,原来时间久了,同学们都发现了张老师通知的集合时间故意提前,甚至可以根据张老师的通知猜测出真实的集合时间。因此,每当张老师通知7∶45集合时,大家仍然按照真实的集合时间,也就是8∶00来做安排,从而导致几个同学在8∶00后才赶来。那些准时即7∶45到达集合地点的同学由于白白等待都开始抱怨,以后的集合中也变得不那么守时了。
张老师的目标是通知合适的集合时间。从而达到准时出发且避免同学因为等待而有所抱怨。那么应当制定怎样的策略,才能使活动准时开始并使大家都满意呢?
在迟到的问题中,存在着老师与学生、学生与学生之间的博弈。实际上也是一种多人的囚徒困境。因为每个学生都知道,其他学生的占优策略是选择到达集合地点的时间,既不能太早,以免白白浪费等待的时间;又不能太晚,以免承担耽误大家时间的责任。
要破解这个困境,老师有两个策略选择:一是只要过了集合的时间,就不再等下去,让迟到的同学独自承担责任。这种责任和相应的惩罚对同学会造成很大的损失,他们就不会再迟到了。二是如果迟到的学生比较多。老师就等某个数量的学生到齐以后马上出发,而让迟到时间过长的那些同学承担责任。
一般说来,博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。所以需要引入惩罚机制:谁违约,就要处罚他,使他不敢违约。一位玩家之所以会与另外一位合作,只是因为他知道,如果他今天被骗,明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无名氏定理”。
博弈智慧
只有对迟到的学生进行惩罚,迟到问题才能解决,一句话,也就是实行一份带剑的契约。由此我们可以悟出一条定律,合作是有利的“利己策略”。但它必须符合:按照你希望别人对待的方式来对别人,但他们必须也按同样方式行事才可以。
第156章 做一个讲信用的绑匪()
在一本书中,讲了这样一个故事:
“东厂”是明朝有名的特务组织,这个特务组织曾经有一个优秀的领导——尚铭。尚铭入宫很早,办事十分利落,性格极其谨慎(注意这个特点),东厂在他的手下搞得有声有色。为了扩大财源,他还干起了副业——绑票敲诈。
尚掌门有一个公认的闪光点——对待工作认真负责,他对副业也是如此。他一上任,就搞了一个花名册,上面一五一十地记载了京城各大富户的地址、家庭环境,并就财富多少列出了排行榜。
同时他还有着扎实的哲学功底,始终坚信世界上所有的事情都是有联系的,所以每当东厂有了案件,他都会把这些富户和案件联系起来,并且逐个上门抓人,关进大牢,让家人拿赎金来才放人。
这实在是一件十分缺德的事情,但出人意料的是,虽然他一直这样干,名声却还不错,许多人谈到他还时有夸奖。这是为什么呢?因为尚掌门还有一个很大的优点——讲究诚信。
他虽然绑票,却从不虐待人质,而且钱到放人,从不撕票。和他打过交道的人质家属也不禁如此感叹:收钱就办事,是个实诚人埃此外他虽然劫富不济贫,却也不害贫,从来都只在富户身上动手,不惹普通百姓,因此在中下层群众中间口碑很好。他资历很高,却从不欺负后辈,人缘很好,还经常给皇帝朱见深和贵妃万娘娘送礼,上下级关系也不错。
现在我们来看一下绑匪如果想要完成自己的事业——获得赎金——需要怎么做才好。作为绑匪,既然做出这么极端的事情,那么理性的人都可以推断他们是不会讲诚信的。但是对于绑匪来说,如果能树立起自己“诚实”的形象,那他的事业就会得到长足的发展。
如果绑匪只打算做一次的话,如果绑匪决定释放人质的话,家属最好不要缴纳赎金。但是,如果家属不缴纳赎金的话,绑匪最好撕票,而这正是被绑者家属不愿看到的。
为什么绑匪需要诚信呢?答案很简单,绑匪需要的是赎金,而不是被绑架者的性命。但是被绑架者的家属只有在相信付出赎金才可以增加被绑者获释的机会时,才会付钱。所以,假如绑匪有自己的“绑架档案”来供绑架者家属查询的话(其实,如果绑匪是惯犯的话,是可以从警察那里查到犯罪记录的),被绑者家属就可以知道以前这些绑匪是怎么做的。
而对于绑匪来说,却面临着一个很难处理的状况。假如你是刚拿到赎金的绑匪,那你该不该放掉被绑者?如果把人放走,你就要不到更多的钱,而且警方也可以从被绑者那里追查到你的身份和行踪。但是不撕票也有不撕票的好处,至少你现在所犯的只是绑架罪,而不是杀人罪,警方就不会追得那么紧;即使你不幸落网了,只要你没有杀过人,刑责也会比较轻。这样,不管你有没有拿到赎金,你都会享受到不撕票的好处。
绑匪的困惑不只是这些,你还要想想被绑者家属是怎么想的。如果你不幸让被绑者家属知道,你因为很怕被判谋杀罪,所以不管他们是否支付赎金,都会释放被绑者,那他们就会选择不支付。
所以对于绑匪来说,最好的处境就是让被绑者家属相信:支付赎金,就会释放被绑者;不支付赎金,虽然他们很害怕被判谋杀罪,但还是会选择杀害被绑者。
如果绑匪是第一次做这个事情,那他就会面临上面所说的困境,这时就需要通过高超的手段,让被绑者家属知道,支付赎金才是唯一的选择。如果绑匪打算将来重操旧业的话,那么树立起诚实守信的信誉对他来说会有很多的好处。这样,绑架惯犯就可以让被绑者家属明白,只要家属按照他的要求付钱,他就会放人,而且这也是唯一的选择。如此一来,被绑者家属必然会把钱给他们。通过这些分析,我们就可以知道东厂掌门人尚铭是一个多么聪明的绑匪!
在绑匪的博弈变成重复性博弈之后,这时,被绑者家属选择缴纳赎金而绑匪选择释放人质,是这个博弈的一个均衡点。双方能在这个均衡上长期的进行博弈。
从上面的分析我们可以知道,如果我们想要压制那些潜在的绑匪,有一个办法可以使用:通过媒体广泛地、大规模地报道曾经发生过的绑架撕票案件。当潜在的绑匪看到媒体这样大规模的宣传,就可能会想到民众会受到这些宣传的影响而相信绑匪都是不讲信誉的。因此,潜在的绑匪就会认为民众在以后遭遇亲人被绑架案时,不再会付赎金而会选择报警。这样,潜在的绑匪就可能会认为目前进行绑架的犯罪风险提高了,获得赎金的几率减小了。这可能会促使潜在的绑匪改而从事其他风险相对较小的犯罪活动。
博弈智慧
实际上,民众有没有真的受媒体报道的影响而认为绑匪都会撕票这一点并不重要,关键在于潜在的绑匪会认为民众会那样想,从而改变自己的选择。
第157章 前线士兵为何不逃跑()
在热播的电视剧潜伏中,有这样一段情节:余则成的上线秋掌柜被捕,审讯时,被用以重刑。当时余则成还担心他受不了这种酷刑暴露目标,但是秋掌柜大义凛然地表达了自己“打死也不说”的意思——自己咬断了舌头。
按照囚徒困境分析的话,我们可能会认为秋掌柜会选择背叛,但是为什么他宁可咬舌自尽也拒供呢?这里,是一种忠诚的文化在发挥作用。一个忠诚的战士,为了自己的信仰,在关键时刻可以举枪饮弹,可以咬舌自尽,可以义无反顾地走向刑场,“引刀成一快,不负少年头”,“为有牺牲多壮志,敢教日月换新天”。在革命时代,共产党人中,许多人为了自己的信仰,不惜牺牲一切,刘胡兰、江姐等英雄人物到现在仍为人们所颂扬。
建立忠诚的文化也是在长期重复博弈后,走出囚徒困境的另一种方式。有时我们会发现,有一些犯罪团队