纳什均衡(Nash Equilibrium)是博弈论中最重要的概念之一,是已知的一种解决非合作博弈模型的方法。它是由约翰·纳什在1951年提出的,也因此获得了1994年的诺贝尔经济学奖。
它的概念十分简单,就是在博弈论中,对于一个竞争或博弈的环境,在达成某个获胜结果的情况下,双方均无愿望偏离原策略。
以两个卖馅饼的摊贩为例:A摊贩可以卖1元和2元的馅饼,B摊贩也可以卖1元和2元的馅饼。他们之间的竞争既包括价钱也包括销售数量。如果A摊贩卖1元,B摊贩卖2元,那么A摊贩的收益将会更低,B摊贩的收益将会更高。每个人都会因为他们自己的利益而选择最佳策略,结果就是两个人都卖2元的馅饼。这是因为其他方案总会导致另一个更优的策略。因此2元的决策是两个人在“达成某个获胜结果的情况下,双方均无愿望偏离原策略”的结果。
纳什均衡通常用于解释人际关系问题和重大的商业策略概念。基于该概念,国际关系领域也可以通过推断其他国家对问题的反应来决定最佳策略。因此,纳什均衡是一种非常重要的思想工具。
纳什均衡:如何达到理性决策
纳什均衡是指当一组决策人针对某一问题做出一系列单独的决策时,每个人都假定其他人的策略已经确定好,且以此为参考点进行决策,最终的结果是一组策略互相稳定的均衡,其中任何一个人都不会改变自己的决策,以此达到理性的决策。
纳什均衡是博弈论中最为常见的分析模式之一。它用来刻画多个决策者互相影响、相互制约的情形。著名的囚徒困境问题是一个典型的例子。该问题中两个罪犯可以选择合作或背叛,如果一方背叛而另一方合作,则背叛者可以得到更多奖励,而合作者会得到更多惩罚。如果双方都背叛,则都会受到同样的惩罚,而如果双方都合作,则都可以得到较小的奖励。在这种情况下,纳什均衡即为双方都背叛。
从一个更广泛的视角来看,纳什均衡原理提示我们,在做出某种决策时,我们应该尽可能地考虑他人的反应。如果我们可以假设其他人是理性而富有信息的,那么我们可以根据这些假设推理出一个理性的结果。这个结果虽然不一定是最优解,但是应该是最为现实的和最稳定的。
以囚徒困境为例,该问题最初被用来描述两个囚犯是否应该供出对方。如果两个囚徒都互相沟通合作,则双方都能获得较轻的刑罚;但如果其中一个人背弃合作,而另一个人仍然合作,则背叛者可获得无罪释放而合作者则会被判重刑;如果两个人都背弃合作,则两个人都会被判处重刑。这个博弈的纳什均衡状态是两个人都背弃合作,因为在这种情况下,没有人会选择改变策略,以获得更好的结果。