纳什均衡:如何在个体最优决策与整体最大化利益之间找到平衡之道

分享至

现实中的博弈常常是多方参与,情况错综复杂,博弈的结局不止有一方获利另一方损失这一种,也会出现双方都赢利,或者双方都没有占到便宜的情况。

诺贝尔经济学奖获得者萨缪尔森曾经说过:“如果你想把一只鹦鹉训练成经济学家,只需要让它掌握两个词语:供给与需求。”后来博弈论专家坎多瑞又补充为:“想成为经济学家,只懂得的供给与需求还不够,你还需要多掌握一个词,那就是“纳什均衡”。”

一、什么是纳什均衡?

纳什均衡主要研究的是多人参与,解决如何找到多方之间的均衡点这个难题。纳什均衡是由纳什提出来的,他发表了一篇论文《n人博弈中的均衡点》,他将博弈论的应用领域也从经济领域拓展到几乎各个领域。可以说“纳什均衡”之后的博弈论变成了一种在各行业各领域通用的工具。

"纳什均衡"是指在多人参与的博弈中,每个人都根据他人的策略制定自己的最优策略。所有人的这些策略构成一个策略组合,在这个组合中,没有人会主动改变自己的策略,因为这样会降低他的收益。只要没有人调整策略,任何理性的参与者都不会主动改变自己的策略。在这种情况下,所有参与者的策略达到一种平衡状态,这就是所谓的“纳什均衡”。

有人将“纳什均衡”比喻成锅里的乒乓球。当你将几个乒乓球放入锅中时,它们会朝锅底滚动,并在锅底相互碰撞。最终,当它们停止不动时,形成了一种平衡状态。在这个比喻中,乒乓球代表各参与者的策略,而乒乓球最终停留在锅底形成的平衡即为“纳什均衡”。如果其中一个乒乓球被移动,其他的乒乓球也会受到影响。为了保持这种平衡,就不能随意改变其中任何一个乒乓球,必须始终保持不变。

根据“纳什均衡”的定义,我们可以了解到一场博弈中不一定只存在一个“纳什均衡”,这些均衡之间存在着好坏的区别。以“囚徒困境”为例,如果两名囚犯同时选择不坦白,那么产生的均衡对囚犯来说,是好的均衡。相反,如果双方都选择坦白,那么形成的均衡被视为较差的均衡。好均衡的结果是双方受益,而坏均衡的结果则是双方都会遭受损失,或者受益较好均衡少。

“纳什均衡”中各方策略的制定都是针对对方策略的最佳反应,以为自己争取最大利益为目的,好均衡与坏均衡都是如此,并且好均衡与坏均衡之间不是固定不变的,有时候可以互相转换。

现在我们举一个例子:

古时,楚国和魏国交界的一座小县城,其居民以种瓜为生。某年,天旱严重。魏国一侧的村民勤劳地白天挑水浇灌着他们的瓜苗,看起来绿意盎然。相反,楚国一侧的村民懒散,导致他们的瓜苗黄枯不振。楚国的村民眼见着魏国那边一片翠绿,而自己这边却黯然失色。因嫉妒之情发作,他们在夜幕降临时组织人员偷偷地前往魏国一侧,破坏了瓜苗,将其拔起并扔到一旁。
得知此事后,魏国的村民深感愤怒,决定以牙还牙,报复楚国的村民。然而,村长却反对采取这样的行动。他深知报复只会导致双方受伤,最终两个村庄都无法在秋季收获瓜果。村长提出了一个独特的主张——以德报怨。他建议在夜深人静的时候组织村民前往楚国一侧的村庄田地,偷偷为他们的瓜苗浇水。
村民们遵循村长的建议,夜间悄悄前往楚国一侧的田地,默默地为他们的瓜苗浇灌了水。楚国的村民见到自家田地的瓜苗变得翠绿有生气,同时得知是魏国的村民夜间前来帮忙浇水,深感羞愧。为了表达歉意,楚国的村民在夜深人静时也偷偷潜入魏国的田地,重新为他们种上了新的瓜苗。最终,两个村庄平安无事,实现了和谐相处。

我们看一下其中的均衡是如何转换的,我们将这个故事中双方的博弈制作成一个简单的博弈模型。假设选择去损毁对方瓜苗为A策略,而选择去以德报怨,相互帮助为B策略。瓜苗被损毁,所得利益为0,没有被损毁所得利益为10。这样我们就会得到一个简单的博弈矩阵图:

这场博弈中存在两个“纳什均衡”:如果一方选择损毁对方瓜苗,另一方的最优对应策略是选择报复,再一个便是双方同时选择相互帮助。两个均衡的结果也截然相反,第一个均衡的结局是(0,0),两败俱伤,第二个均衡的结果是(10,10),实现双赢。可见双方相互报复的平衡是坏平衡,相互帮助的平衡是好平衡。

很明显,(A,A)的策略组合是一种坏的策略组合,因为它会导致(0,0)的最坏结局。不过,这仍是一种“纳什均衡”。因为对方选择A策略的时候,你的最优选择也是A策略,这个时候形成的策略组合便是“纳什均衡”。同样,(B,B)的策略组合也是“纳什均衡”,(10,10)的结果是双方都想得到的。(A,B)和(B,A)的策略组合不是“纳什均衡”。这也说明一场博弈中可以有多个“纳什均衡”,并且有优劣之分。

故事中楚国最先选择了A策略,按照博弈论的分析,选择A策略是魏国的最好的回应,也就是以牙还牙。这种想法非常符合我们日常的行为习惯,你不让我好过,我也不让你好过。这样选择的结果将会达成一种平衡,不过是坏的平衡。但是魏国人没有选择报复,而是用行动来感化对方,选择了B策略。最终楚国人被感化,也选择了B策略,双方达成了一种新的均衡。这时候的均衡是一种好的“纳什均衡”。

这里存在一个问题,即博弈模型与实际情况之间存在差异。在理性的博弈分析中,选择报复被认为是最优的决策。然而,在实际情况中,我们需要考虑许多其他影响因素,比如今后的相互关系等。以德报怨并非博弈分析中的最优决策,但却可以解决实际问题。相互报复可能导致恶性循环,“冤冤相报何时了”,因此即使无法感化对方,也不应采取报复行为。

此外,魏国村民选择以德报怨的决策可能是因为他们对楚国村民的民风和风俗有深刻了解,知道他们可能会被感化。如果涉及到水火不容的敌对关系,就不太可能有这种宽容。这些考虑都是出于对实际情况的综合思考。

二、如何在个体最优决策与整体最大化利益之间找到平衡之道?

付费解锁全篇
购买本篇
《购买须知》  支付遇到问题 提交反馈
相关推荐
无障碍浏览 进入关怀版