纳什均衡
我们的编辑器将检查你提交并决定是否修改这篇文章。
纳什均衡,也叫纳什的解决方案,在博弈理论非合作的博弈的结果为两个或两个以上的玩家没有玩家的预期结果可以提高通过改变自己的策略。的纳什平衡是博弈论中的一个重要概念,它定义的解决方案N球员非合作的游戏。它是美国数学家命名的约翰纳什1994年,他被授予诺贝尔奖博弈论经济学奖为他的贡献。
博弈论使用数学模型和分析的情况决定是相互依存的。虽然它可以用于模型休闲游戏等垄断或扑克,它常被用来分析真实的感兴趣的话题,包括经济学和军事战略。在博弈论中,游戏可以是任何情况下,有相互依存的决定,和球员都是决策实体。
游戏非合作的只要不存在机制为球员约束力的协议。例如,在著名的囚徒困境,两个囚犯被指控的犯罪和被要求承认。如果一个承认,另一个没有,那么他就可以被无罪释放的人,值得让你这么做的人并不会收到严厉的判决。如果都承认,都将收到严重的,但不苛刻,句子。如果既不承认,都将收到一个很轻的句子。因为没有外部权威执行任何协议之间的囚犯,游戏非合作的;无论是囚犯遭受惩罚背叛。
一个回报矩阵常被用来帮助确定最优策略的玩家在游戏中。支付矩阵的每一行代表一个球员,一个可能的策略,每一列表示一个可能的策略。在上面的示例中,矩阵如下图。
每个玩家(囚犯或囚犯B)将尝试采用策略(承认或保持沉默),导致最少的牢狱之灾(0、1、5日或20年)。最好的结果的囚犯都保持沉默,这导致总句子只有2年(而不是20,如果只有一个选择保持沉默,或10,如果两人都选择坦白)。这组策略导致球员们集体最好的回报。然而,它不是纳什平衡,因为囚犯的收益可以通过选择不同的策略改进。
如果囚犯保持沉默,然后犯人B可以保持沉默和接收一年句子或承认,免费的。犯人B的回报因此可以提高了忏悔。然而,一个囚犯承认和其他保持沉默也不是一个纳什均衡,因为回报的囚犯保持沉默可以提高通过改变策略。如果囚犯坦白,然后犯人B可以保持沉默和面临20年徒刑或承认和面临5年刑期。因此,犯人B的回报可以提高通过切换从保持沉默到忏悔。
唯一的策略集合中没有玩家的收益可以提高通过切换策略是如果两个囚犯承认。在这种情况下,要么囚犯选择开关策略将导致较低的回报。尽管这是糟糕的球员(导致总共10年期句子)比两人都保持沉默,这是纳什均衡。
有可能有多个纳什平衡一个给定的问题。例如,假设两个朋友想一起看电影但不同意电影。如果两个宁愿看电影也比单独看电影,然后两个朋友看电影构成纳什均衡,既可以选择看其他电影没有痛苦更糟糕的结果。
也有可能一个纳什均衡是一个“混合”平衡,这意味着至少有一个球员应该使用特定的混合策略,而不是采用相同的策略一致(“纯”纳什均衡)。例如,在石头,剪刀和步这个游戏,纳什均衡是每个球员都应该选择每个选项完全三分之一的时间,因为如果一个玩家选择一个选择比其他人,其他玩家可以利用这一趋势赢得更大比例的匹配。
纳什均衡可能发现涉及许多球员的情况下(如个人使用公共资源)或不对称的情况下(如个人和企业之间的合同谈判)。纳什证明,如果允许混合策略,那么至少有一个对每一个非合作的博弈纳什均衡与有限数量的玩家从有限数目的策略选择。