博弈论经典案例解读(解读博弈论与生活6)
博弈论经典案例解读(解读博弈论与生活6)
2024-11-21 08:22:07  作者:蔚蓝苍穹  网址:https://m.xinb2b.cn/life/doc187240.html

晓书童将常年相伴在您左右,最近降温得厉害,同学们注意保暖,保重身体.,今天小编就来说说关于博弈论经典案例解读?下面更多详细答案一起来看看吧!


博弈论经典案例解读

晓书童将常年相伴在您左右,最近降温得厉害,同学们注意保暖,保重身体.

我们正在解读《博弈论与生活》,作者兰·费雪。

不可能的合作

这是我们聊博弈论的最后一期节目,从一个故事开始。

话说,1914年第一次世界大战爆发,因为有了机枪的出现,在西线战场双方陷入了持久的堑壕战。两边挖了战壕,把前方的树全部砍光,留下一片开阔地带。如果谁敢发起冲锋,面对架好的机枪,基本就是排着队去接受枪决,所以双方就这么僵持着。

奇怪的是,等到这一年圣诞节的时候,双方士兵不但不再交火,而且自发的一起搞上了联欢会。两边相互问候着新年好,走出战壕一起唱圣诞歌,甚至还组织起了一场足球比赛。这两国之间这可是在打仗啊,而士兵之间竟然手拉着手办起春节联欢晚会?

这一点都不合情,但在当时的情况下确实非常的合理。

两军都躲在深深的战壕里,无法消灭对方,长时间僵持不下,情况慢慢的出现了微妙的变化。一开始是到了开饭的时间,后勤人员要来送饭,对方是可以看到对面炊事班开车来送饭的。这个时候如果开炮攻击是可以将其消灭,但是如果你砸了对面的饭碗,那你自己还要不要吃饭?人家也可以开炮打翻你的外卖。这样一来大家可都要饿肚子,于是这就达成了默契,我不砸你的饭碗,你也别搞我的外卖。

我活也让你活”,一种特殊的合作策略出现了。

到了开饭时间就停火,炊事班的人也不用悄悄摸摸的,大摇大摆,有说有笑地来送饭。还有天气恶劣的时候,战壕里阴冷潮湿,双方士兵都遭罪,渐渐又约定俗成,天气恶劣不打。接下来就是节假日不打,周末也不打。于是就出现了刚才我们说的一幕,大过年的两边从战壕里跑出来搞联欢。

最后默契到什么程度,双方会只在固定时间朝着对方阵营开枪射击,每天射击的时间准确到可以用枪声来对表。

有一位英国士兵后来回忆说:一次自己正在和战友晒太阳喝茶,突然听到一阵枪炮声。大家都很愤怒,因为按照默契约定,这个时间点是不应该开火的,对面德国佬是怎么回事儿?这时候对面战壕里爬出来一个人对着这边高喊:“不好意思,走火啦!希望没伤到你们!”

在最不可能出现的合作的战争双方,竟然能够达成这样的合作。

阿克塞尔罗德游戏

这个案例来自一本博弈论的必读经典《合作的进化》,作者是罗伯特·阿克塞尔罗德。在书中,作者介绍了自己的一个实验,寻找在重复博弈当中,什么样的行动策略才能才是最优的。

他用囚徒困境的规则,模拟了一个电脑游戏。如果双方合作,各得三分,如果相互背叛,各得一分,如果一方合作,另一方背叛。那选择合作的0分,背叛者得5分。可见双方都背叛收益很少,双方都合作收益一般,而背叛遇到合作,背叛者收益最高。游戏参与者根据自己的利益计算决定是选择背叛还是选择合作。

阿克塞尔罗德邀请了15位精通博弈论的专家,这些人有数学家、心理学家、经济学家等等,据说还有美国的前国务卿基辛格。受邀者把自己的博弈策略编写成电脑程序,参与到游戏中来。

这些策略中有好人策略,也就是更愿意合作,不首先背叛。当然也有坏人策略,总是琢磨着通过背叛获得更多的利益。这15个策略在经过了5轮一对一的循环赛,也就是一共12万个回合的大混战之后,最后的结果,连阿克塞尔罗德自己都不敢相信。好人大获全胜,前八名清一色都是好人策略,这样的结果简直就如童话故事一样美好。

夺得冠军的策略叫做“一报还一报”,它的原则非常简单。第一次我都选择合作。然后就是以牙还牙,你合作我就合作,你背叛我就背叛,完全复制对手在上一轮的行动。

阿克塞尔罗德不敢相信这个结果,于是又组织了一次比赛,这次参赛策略扩大到了62个,而且参赛者是知道上一次比赛的结果的,可以根据之前的经验调整这一轮的参赛策略。经过了上百万回合的大混战,结果依然如此,好人策略压倒性的获得了优势。而且夺得第一名的仍然是“一报还一报”。

一报还一报

这个策略看起来简单粗暴,却有这么几点高明之处。

首先是善良,不作恶。虽然他不主动背叛,但他又不好欺负,如果你背叛了他,那么他下次就一定会背叛你。但同时,他又是宽容的,就算你之前背叛过,但只要改过自新选择合作,他也依然愿意友好合作。最后,很重要的一点就是他模式简单清晰, 别人一眼便知,明确地知道,在他身上占不到长期的便宜。

因此,善良、报复、宽容和清晰就是“一报还一报”策略能够连续胜出的原因。

而依据这四条,给我们的生活带来了启示。

首先,生活中的博弈并非是下棋打牌这样的零和博弈,获胜的关键不在于战胜对方,而是要在长期反复的合作中实现共赢,眼前的得失并不用太在意,因为并没有那么重要。

我们看“一报还一报”的策略就决定了他在游戏里的单个回合中,合作只能和对手拿一样多,或者遭遇背叛什么都得不到。但是反复博弈之后,它积累下来的分数却是最多的,真正的利益来自于长期的合作共赢。

在阿克塞尔罗德的游戏中,好人策略大获全胜,善良,不作恶很明显是一个优势策略。

其次,报复。别人合作我们就合作,如果别人背叛,我们当然也要用背叛予以反击。被别人当成一个软柿子,有事儿没事儿就来捏你一下,这肯定不行。

学生问孔子说:“以德报怨,何如?”孔子回答:“以德报怨,何以报德?”所以我们就是应该以德报德,以直报怨。

但以直报怨不是说你是恶人,我就要成为一个比你还恶的人,你背叛了我一次,我一辈子都不与你合作。以直报怨不是冤冤相报,我们还必须有足够的宽容,如果在背叛之后再次选择合作,那我们就选择原谅。

最后一点是清晰,简单。

在阿克塞尔罗德游戏的第一轮结束之后,不少人觉得“一报还一报”策略虽然胜出了,但不完美,因此在第二轮的时候做出了改进,用改进版的“一报还一报”策略参加游戏,但谁也没想到这些进化版都不如自己原始的老祖宗。这是为什么?

因为规则越复杂,漏洞就可能越多。更重要的是我们玩的不是零和博弈,在零和博弈中,自己的策略隐藏的越深,就越容易获胜。在阿克塞尔罗德游戏和真实世界中是正和博弈,策略越是简单,越是能让别人看明白,放心与我们建立起稳固的合作关系,我们才更有可能成功。

这就是一报还一报策略给我们带来的重要启示,善良、报复、宽容、清晰。

简单的好人

虽然好人大获全胜的大团圆结局是我们期望看到的,但这也只是对真实世界的一个好美揣测而已。

《合作的进化》作者认为,如果这个游戏不断的继续进行下去,并且引入淘汰机制,好人不断的赢,坏人不断的输,进而好人之间的合作越来越稳固,坏人越发的没有可趁之机。那么在游戏进行1000论,也就是进化1000代之后,坏人策略就将彻底灭绝。从这个游戏推演到人类社会,合作一旦建立起来,优胜劣汰的机制开始发挥作用,如果好人都可以在竞争当中胜出,那么人人都会争当好人,久而久之,坏人自然就消失了。这就是一个物竞天择,进化淘汰的不可逆过程。

但这个推论显然是与现实情况不符的,人类文明诞生至今,不仅坏人没有灭绝。甚至现在我们都没法说到底是好人多还是坏人多。

为什么?因为这个游戏存在一些与现世不符的地方,比方说远远低估了坏人的杀伤力,游戏中的背叛并不能让对方彻底出局,每个人都有东山再起的机会。这就等于是让好人自带主角光环,而现实中呢?有多少人经受了背叛的致命一击以后,就再也没有站起来过。

比方说游戏中的背叛与合作都是放在台边上,一目了然,可是现实中却有多少两面三刀伪君子。一报还一报,怎么报?我们甚至都完全不知道到底是被谁背叛了。当好人因背叛而出局,而坏人的劣迹没有被发现的时候,就会起到示范作用,让很多好人都转向坏人策略。

还有,回到文明伊始的自然状态,那是一个一切人对一切人战争的时代,人人都是坏人。彼此背叛其实占不到多大的便宜。这个时候有一些愿意合作的人出现,抱团取暖,获得稳定的收益,当然是比坏人策略更具优势。

可是当好人越来越多,坏人越来越少,那坏人遇到坏人的概率就变小了,遇到好人的概率很高,那么单方面背叛就很容易获利,因此就有越来越多的人转向坏人策略。所以社会合作的真实演化并非是坏人向好人的单向演化,而是一个双向演化,不断寻找动态平衡的过程。

在真实的世界中,永远都不存在一劳永逸的策略,这是我们应该看到,也必须接受的。采用什么样的行动策略,是我们每个人由心而生的选择,每一次的行动就决定了我最终将成为一个什么样的人。

每个人始终都是孤独的,一辈子始终都要和自己相处,所谓自由就是孤独的站立,不依恋,不惧怕。

我的选择就是做一个简单的好人,那你呢?

以上便是我们聊“博弈论”的全部内容。

总结

总结一下,这6期节目都说了一些什么。

关于博弈论的探讨,是从经典的囚徒困境开始的,两个囚徒当然都想做出最有利于自己的选择,但是当考虑到对方的行为之后,最终双方的行动结局却相当悲惨。而且这是一个必然的,稳定的,任何一方都不可能改变自己策略的结果。

在不伤害任何人利益的情况下,至少使得一个人的处境变得更好,如果已经到了改无可改的完美状态,这叫做帕累托最优。但是帕累托最优极其不稳定,因为参与者可以损害别人的利益,来让自己获利。

而任何一方都没有单方面改变自己策略的局面叫做纳什均衡,这是博弈论中非常重要的概念,之所以会陷入到困局,就是因为达成了纳什均衡。

想想各国之间的军备竞赛,想想我们在竞争领域常说的内卷,其实都是达成了纳什均衡,陷入了囚徒困境。

破除困境有这么几条出路:

1、将单次博弈变成多次博弈,让人们都在长期的合作中获利。乡土中国熟人社会的时候,周围都是亲戚朋友,每个人都注重名声。近代之后,人口流动了起来,重复博弈变成了单次博弈,尔虞我诈的事情就多了起来。而随着市场经济的发展,人们越来越依赖重复博弈,个人的名誉又慢慢变得透明。

2、引入惩罚机制,树立绝对的权威,引入第三方监管,迫使人们在博弈当中达成合作,比如说政府监管,交通法规等等。

3、改变游戏规则,秦就是用绝对的暴力一统六国之后,游戏规则才得以改变,天下人才能从军备竞赛中脱困。

4、改变博弈的报偿,调整个人的价值效用,有人追求庙堂之高功名利禄,有人想要江湖之远自在逍遥,同样一块蛋糕,有人钟爱奶油下的鸡蛋糕,有人偏爱那一朵奶油花。如果人人都能各得其所,也就没必要在一个狭小的空间内拼命“内卷”。

很多时候,问题需要在发展的过程中解决,着眼更大的面,才能解决之前局部范围内无法摆脱的困局。

5、想到达成长期稳定的合作关系,靠思想教育、严刑峻法都是远远不够的,只有找到博弈中的纳什均衡并且善加利用,让多方的合作自行运作起来。所以,理想主义者追求帕累托最优,而现实主义者能看到纳什均衡。

除了囚徒困境之外,我们还说到了公地的悲剧,搭便车,懦夫博弈,志愿者困境和两性战争。

公地悲剧似乎看起来是否定了亚当斯密“看不见的手”,但其实最后市场的力量也不会让灾难性的结果发生,但是在这个过程中确实造成了大量的公共资源的价值耗散,通过人为干预是可以避免的。

我们强调了第三方监管的力量,有一种困境叫自由,有一种解放叫禁止。人们最应该关注的是市场和政府之间的界限应该划在哪里,而不是对一边极力追捧,同时对另一边彻底的否定。

对于搭便车行为,一方面我们强调通过惩罚和奖励落实到个人的方式,来解决利益集体共享,而成本却难以均分的问题。另一方面我们也从智猪博弈的角度分析了,作为弱势的小猪,就应该采用跟随战略,懂得合理的搭便车,而作为大猪则必须约束小猪心态,时刻关注自己的核心竞争力。

关于懦夫博弈,拆下自己的方向盘扔出窗外,抛弃选项断绝后路,确实是很有效的博弈策略。但是这也很可能激发对方跟进,双方都使用边缘策略,会让整个局面越发的危险。勇士再往前一步不是成烈士就是成疯子。

在生活中遇到懦夫博弈,我说我愿意选择当一个懦夫,为什么?因为幸福感降低斗争性,拥有幸福就是我们懂得谦让的最好理由。

在懦夫博弈中,想要让对方给我们让路,除了破釜沉舟之外,更加符合中国人智慧的办法是示弱,展示艰辛,隐藏幸福。

关于志愿者困境,需要用到调整个人的价值效用的办法,不妨让自己效用涵盖的范围大一些,为别人做出一点牺牲,对自己而言并非是只有损失,为此我们还可以收获快乐,勇气和自信。求仁而得仁,又何怨?

关于两性战争,是如何在多个纳什均衡中选择其中一个。可以从以往惯例,同类平均,政府指导,甚至是抽签随机,找到一个聚焦点,就能够引发行动,达成合作。

进一步我们说了鹰鸽博弈,博弈是一个动态的过程,没有什么无往不利的终极策略,选择当老鹰还是鸽子,不是感性的偏好,而是理性的计算。

最后就是今天所说的,在众多的博弈策略中,一报还一报就是一个优秀的选择,善良、以直报怨、宽容、清晰,我选择做一个简单的、善良的人。

最后,借用一句余秀华的话:我从不指望吸引别人,因为我觉得这样很浅薄,我得吸引我自己,当对自己有了热爱,才能完成以后一个个孤单而漫长的日子。

希望通过这6期节目的分享,能让博弈论对你有所帮助。

  • 一根线绣鞋垫花样图案大全(46款年代感的鞋垫图案大全)
  • 2024-11-2246款年代感的鞋垫图案大全十字绣鞋垫,一直都是非常受少女们喜欢,前面刚刚发过十字绣的全面讲解文章标题:35款十字绣鞋垫图案,让你体验民间手工艺魅力,附针法讲解!有三种针法哦,有兴趣的可以回去看看,今天让我们一起来赏析60款年代。
  • 4s店用什么清洗三元催化(4s店清理三元催化器要300元)
  • 2024-11-224s店清理三元催化器要300元说起三元催化器的话,很多车友都非常迷茫都不知道是什么东西作为汽车尾部非常重要的零件,在很大程度上减少了汽车尾气的排放而且汽车尾气都是通过三元催化剂排出的,是汽车中非常重要的一个东西如果三元催化剂坏了或。
  • 在你心情低落的时候你喜欢做什么(你是怎么过的你)
  • 2024-11-22你是怎么过的你昨晚工作回来太晚,睡得晚,又早起学习,感觉精神透支了,我发现如果没有睡好觉,做啥都提不起神,情绪低落,不想说也不想动,早想闭眼睡觉,早课完,就想补觉……可是刚睡下朋友来话说,上次帮买的竹盐很好,吃完了。
  • 春秋战国时期金文(周代金文与先秦文学)
  • 2024-11-22周代金文与先秦文学作者:何景成(吉林大学考古学院教授)一有周一代,礼乐煌煌、文采纷郁孔子曾说:“周监于二代,郁郁乎文哉,吾从周”青铜器经过夏商两代发展,到周代达到鼎盛时期,其上铸刻的品类多样、内容丰富的铭文,是我们了解。
  • 考研政治都要背出来吗(有什么技巧)
  • 2024-11-22有什么技巧自然不是的虽然考研政治不可否认确实记忆背诵的东西有很多,单纯的背书并不能让你在考研政治中取得高分恰恰相反,不停地背诵而不去理解知识点只会适得其反,考的分数远比期望的低实际上,在整个考研政治学习的过程中。
  • 老公对自己没有占有欲(老公占有欲太强该怎么办)
  • 2024-11-22老公占有欲太强该怎么办我和老公结婚6年了,感觉日子过得好累,他有严重的占有欲举个例子:跟他结婚后,我不能跟异性联系,即使是以前的异性同学也不待见,老翻我通讯录,见到异性名字一定要问个水落石出,他看不顺眼的就要我删掉,我不能。
  • 中耳炎对耳朵有什么危害(中耳炎的危害有哪些)
  • 2024-11-22中耳炎的危害有哪些耳朵是人体一个开放的器官,在日常生活中稍微不注意很容易发生中耳炎的情况,但很多人不重视中耳炎的危害,素不知若不及时治疗中耳炎很有可能会导致听力下降,甚至还有可能出现耳聋的情况,中耳炎的危害这么大,我们。
  • 退费的规范流程(退费与交费的价值观)
  • 2024-11-22退费与交费的价值观缴费与退费是教育机构的一大难题大部分没坚持到底的机构,基本上都出在这个学费问题上为了让家长放心,景于行在这个问题上,持续推进,贯彻更好的原则教育培训类似理发,不同的孩子适合不同的理发师,不同的理发师能。
  • 井陉最美的一条街(一座城一条街井陉矿区太古青溪特色商业街)
  • 2024-11-22一座城一条街井陉矿区太古青溪特色商业街特别策划《一座城一条街》,今天带您走进井陉矿区贾庄古镇太古青溪特色商业街,一起赏井陉拉花,体验抛绣球招亲傍晚的太古青溪特色商业街灯光璀璨、人潮涌动,街上的井陉拉花、赶旱船等民俗表演喜庆热闹,吸引不少游。
  • 网购衣服口诀了解一下(男生网购服装关键词大全)
  • 2024-11-22男生网购服装关键词大全网上购物,“搜商”很重要,不少男生买衣服很随意,结果买回家发现版型、面料等并不满意,以后不妨试试这些关键词,品质感蹭蹭蹭就上来了T恤想要舒适度搜精梳棉、丝光棉、匹马棉,材质亲肤,触感光滑,穿起来很舒服。
  • 苹果手机来电没有声音(设置方法)
  • 2024-11-22设置方法尝试调节“音量键”调试大小如果调节音量还是没声音,可以看看是否打开了“勿扰模式”如果上述两种方法依然不行,可以尝试看一下是否打开了手机侧面的“静音键”如果上述方法依旧没声音,尝试“重启手机”即可。
  • 南京玩疯狂动物园(疯狂动物城惊现哈尔滨)
  • 2024-11-22疯狂动物城惊现哈尔滨“六一”马上到了想好带宝宝去哪玩了吗?动物园是很多人的首选不只是小孩子很多大人都沦陷在抖音的萌宠视频里不能自拔这个六一,远大购物中心群力店把热带雨林、神奇动物、网红萌宠都搬到了哈尔滨简直就是“疯狂动物。