介绍

应用博弈论,分支数学提供分析工具情况下,政党,叫做球员,做决定这是相互依存的。这种相互依赖导致每个玩家可能考虑其他球员的决定,或在制定策略策略。游戏描述的解决方案的最优决策的球员,他们可能也有类似的,反对,或混合利益,可能由于这些决策的结果。

虽然博弈论可以被用来分析室内游戏,其应用更加广泛。事实上,博弈理论最初是由美国数学家匈牙利出生的约翰·冯·诺依曼普林斯顿大学和他的同事奥斯卡·摩根德裔美国经济学家,经济学解决问题。在他们的书中博弈论与经济行为(1944),冯·诺依曼和Morgenstern断言,数学物理科学发达,它描述了大自然的无私,是一个可怜的经济学模型。他们观察到经济学是就像一个游戏,在球员预测对方的动向,因此需要一种新的数学,它们被称为博弈论。博弈论是进一步发展在1950年代由美国数学家约翰纳什建立了博弈论的数学原理,数学的一个分支,研究竞争对手之间的竞争和复杂的利益。这个分支的研究(这个名字可能有点misnomer-game理论一般不分享乐趣或轻浮与游戏相关。)

(Steven Pinker对理性的大英百科yabo亚博网站首页手机全书条目。)

博弈理论被应用到各种各样的情况下,玩家的选择交互影响的结果。在强调决策的战略方面,或方面由玩家控制的而不是纯粹的机会,理论补充和超越的经典理论概率。它已经被使用,例如,确定政治联盟或商业企业集团可能形式,最优的价格出售产品或服务的竞争,选民的力量或阵营的选民,他们选择陪审团,制造厂的最佳地点,某些动物和植物的行为在他们的生存斗争。它甚至被用来挑战某些投票系统的合法性。

奇怪如果任何一个理论能解决这样的一个巨大的范围的“游戏”,事实上没有单一的游戏理论。提出了许多理论,适用于不同的情况下,每个都有自己的概念,什么是一个解决方案。本文描述了一些简单的游戏,讨论了不同的理论,概述了潜在博弈理论原则。额外的概念和方法,可以用来分析和解决决策问题对待优化

游戏的分类

游戏可以根据某些重要特征分类,其中最明显的是球员的数量。因此,一个游戏可以指定一人,二人,或n人(n大于两个)的游戏,在游戏中每个类别都有自己的特色。此外,玩家不需要一个个体;它可能是一个国家,一个公司或者一个团队由很多人共同利益。

在游戏中完美的信息,例如国际象棋,每一个球员都知道游戏的每一个部分。扑克,另一方面,是一个不完全信息的游戏因为球员不知道他们所有的对手的卡片。

玩家的目标一致的程度或冲突是另一个游戏分类的依据。总冲突的恒定和游戏是游戏,也称为纯粹竞争的游戏。游戏扑克,例如,是一个常数,因为球员的综合财富保持不变,尽管其分布的变化过程中。

玩家在恒定和游戏完全反对利益,而在变量sum游戏他们所有可能的成功者或失败者。在劳资纠纷,例如,双方肯定有利益冲突,但都将受益是否避免了一场罢工。

变量sum游戏可以进一步区分为合作和非合作的。在合作游戏中玩家可以沟通,最重要的是,使约束力的协议;在非合作的游戏玩家可以交流,但是他们不能使约束力的协议,例如一个可执行的合同。一个汽车销售人员和一个潜在客户将从事合作博弈如果他们达成一致价格和签订合同。然而,明明白白的现实,他们将非合作的达到这一点。同样地,当人们独立投标拍卖他们玩一个非合作的游戏,尽管高投标人同意完成购买。

最后,一个游戏是有限时,每个球员都有一个有限数目的选择,游戏的玩家数量是有限的,不可能无限期延续下去。国际象棋,跳棋,扑克,大多数游戏是有限的。无限游戏是更微妙的,对在本文中只会感动。

一个游戏可以描述的三种方式之一:在广泛的、正常的,或特征函数形式。(有时,这些形式相结合,所描述的部分移动理论)。大多数游戏,这一步一步的进展,一个动作,可以建模为广泛的形式的游戏。粗放型的游戏可以被描述为一个“游戏”树,树的每一个又一个顶点,每个分支表示球员连续选择。

正常(战略)形式主要是用来描述两人游戏。在这个游戏由支付矩阵表示形式,其中每一行描述一个球员,每一列的战略描述了其他球员的策略。矩阵的条目在每行和每列的交集让每个玩家的结果选择相应的策略。每个球员的回报与这一结果是确定的基础策略是否处于平衡状态,或稳定。

特征函数的形式通常是用于分析游戏超过两名球员。它显示的最小值,每个联盟球员包括单人联盟可能保证自己在对阵联盟其他球员组成。

单人游戏

单人游戏也被称为游戏违背自然。没有对手,玩家只需要列出可用的选项,然后选择最优的结果。当机会参与这个游戏似乎更复杂,但原则上的决定仍然是相对简单的。例如,一个人决定是否带伞重携带携带它的成本和收益。虽然这个人可能做出错误的决定,并不存在一个有意识的对手。,自然是假定是完全不关心球员的决定,并可以根据简单的概率决定的人。单人游戏小利益博弈论者。

两人常和游戏

游戏完美的信息

最简单的游戏任何真正的理论关心的是一个二人常和完美的游戏信息。这类游戏的例子包括象棋、跳棋和日本的游戏。1912年,德国数学家恩斯特策梅洛证明,这种游戏是绝对确定的;利用所有可用的信息,玩家可以推导出最优的策略,这使得结果预定(严格确定)。象棋中,例如,三种结果必须发生如果球员做出最优的选择:(1)白赢了(有战略赢得反对任何黑);(2)黑赢了;或(3)黑白画。原则上,一个足够强大的超级计算机可以确定哪些将发生的三个结果。然而,考虑到有一些1043不同40-move下棋,似乎不可能,这样的电脑现在或在可预见的未来发展。因此,尽管国际象棋博弈理论是仅有的小兴趣,很可能保持持久的游戏知识的兴趣。

不完全信息的游戏

“saddlepoint”二人常和博弈的结果是理性的玩家会选择。(它的名字来源于它的最低一行,也是最大的收益矩阵的一列是说明shortly-which对应的形状鞍)。saddlepoint总是存在于游戏完美的信息,但不一定存在于不完全信息的游戏。通过选择策略与此相关的结果,每个玩家获得一笔至少等于他的回报结果,不管什么其他的球员。这种回报称为游戏的价值;在完全信息的游戏,它是由球员注定的选择与saddlepoint相关的策略,使这类游戏严格确定。

Encyclopædia大yabo亚博网站首页手机英百科全书公司。

标准形式游戏表1是用来说明saddlepoint的计算。两个政党,一个B,每个必须决定如何处理在一个特定的选举中一个有争议的问题。每一方可以支持这个问题,反对它,或者逃避被模糊。的决定一个B在这个问题上确定的百分比投票,每个党接收。支付矩阵的条目代表党一个的比例的选票(剩下的百分比B)。例如,当一个支持问题,B躲避它,一个得到80%和B20%的选票。

假设每一方想最大化其投票。一个起初的决定似乎很难,因为这取决于B的选择策略。一个最好的支持如果吗B躲避,反对B支持,和逃避B反对。一个因此必须考虑B做自己的之前的决定。注意,无论如何一个做的,B获得最大的百分比投票(最小的百分比一个)反对这个问题而不是支持或逃避。一次一个认识到这一点,其策略显然应该逃避,解决了30%的选票。因此,30 - 70%的选票,一个B分别是游戏的saddlepoint。

一个更系统化的方法来找到一个saddlepoint是确定所谓的极大极小和极大极小值。一个首先确定最低比例的选票可以获得它的策略;然后找到了最大这三个最小值,极大极小。最小的比例一个会如果它支持、反对或躲避,分别为20、25、30。30,其中最大的是极大极小值。同样的,对于每一个策略B选择,它决定了最大比例的选票一个会赢(因此最低能赢)。在这种情况下,如果B支持、反对或躲避,最大一个会是80,和80年,分别。B将获得通过最小化其最大百分比一个的最大比例的选票,极大极小。最小的一个的最大值是30,所以30B极大极小值。因为极大极小和极大极小值一致,30 saddlepoint。双方不妨提前宣布他们的策略,因为另一方无法获得这些知识。

混合策略和极大极小定理

Encyclopædia大yabo亚博网站首页手机英百科全书公司。

当saddlepoints存在时,最优策略和结果可以很容易地确定,只是就是明证。然而,当没有saddlepoint计算是更复杂的,如所示表2

雇用一个警卫保护两个保险箱在单独的位置:年代1包含10000美元年代2包含100000美元。卫兵只能保护一个安全的从一个窃贼。窃贼和警卫必须提前决定,不知道对方要做什么,安全试图抢劫和安全保护。当他们去同一个安全,窃贼什么也没得到;当他们去不同的保险箱,窃贼被保护的内容安全。

在这样一个游戏,游戏理论并不表明任何一个特定的策略是最好的。相反,它规定一个策略是选择依照一个概率分布,在这个简单的例子很容易计算。在更大、更复杂的游戏,找到这个策略就是在线性规划解决问题可困难得多。

计算相应的概率分布在这个例子中,每个玩家采取一种策略,使他对他的对手做什么。假设卫兵保护年代1的概率p年代2的概率1−p。因此,如果窃贼试图年代1、他会成功只要卫兵保护年代2。换句话说,他将获得10000美元的概率1−p和$ 0的概率p平均增加10000美元(1−p)。类似地,如果窃贼试图年代2,他将得到100000美元的概率p和$ 0的概率1−p平均增加100000美元p

卫兵将对安全撬保险柜的选择如果被骗金额平均是一样的在这两种情况是,如果10000美元(1−p)= 100000美元p。解p给了p= 1/11。如果警卫保护年代1概率为1/11年代2概率为10/11,他将失去,平均不超过约9091美元的窃贼。

使用相同的参数,它可以显示平均窃贼将得到至少9091美元,如果他试图偷年代1,从概率为10/11年代2概率为1/11。这个解决方案的混合策略,认为是随机概率表示,类似于游戏的解决方案与saddlepoint(纯粹的、最好的策略存在每个球员)。

窃贼和卫队放弃如果他们宣布他们将随机的概率选择各自的策略。另一方面,如果他们让自己表现出任何可预测的模式选择,此信息可以被其他玩家所利用。

冯·诺依曼的极小极大定理,证明早在1928年,美国每一个有限的,二人常和游戏解决方案在纯或混合策略。具体地说,它说,每一个球员之间的这种游戏一个B,都有一个值v和策略一个B这样,如果一个采用最优(极大极小)策略,将至少有利的结果一个作为v;如果B采用最优(极大极小)策略,结果将不再有利一个v。因此,一个B有动机和能力来执行一个结果,给出了一个(预期)的回报v

效用理论

在前面的示例中,它是默认为玩家最大化他们的平均利润,但在实践中玩家可以考虑其他因素。例如,很少有人会风险确定获得1000000美元的机会赢得3000000美元或美元0,即使从这个赌注是预期的(平均)获得1500000美元。事实上,许多人们做出的决定,比如购买保险,玩彩票,和在赌场赌博,表明它们不是最大化他们的平均利润。博弈论并不试图国家球员的目标应该是什么;相反,它显示了一个球员可以最好地实现他的目标,无论这个目标是什么。

冯·诺依曼和Morgenstern理解这种差别;适应所有的球员,不管他们的目标,他们构建了一个理论实用程序。他们开始通过列出某些公理,他们认为所有理性的决策者会(例如,如果一个人喜欢茶比咖啡和咖啡比牛奶更好,那么那个人应该像茶比牛奶)。然后证明可以定义这样的决策者的效用函数,反映他们的偏好。从本质上讲,一个效用函数分配一个号码每位玩家的替代品来传达他们的相对吸引力。某人的期望效用最大化自动决定一个球员最优先的选择。然而,近年来,一些疑问已提高了人们的行为是否符合这些公理和替代公理。

二人变量sum游戏

博弈理论的早期作品是在二人常和治疗数学游戏,因为他们是最简单的。此类游戏的玩家截然相反的利益,并有一个共识关于构成解决方案(如由极小极大定理)。然而,大多数游戏在实践中出现的变量sum游戏;球员们都有共同的和反对的利益。举个例子,一个买家和一个卖家从事一场变量sum(买方想要低价格和卖方高,但是都想做个交易),还有两个敌对的国家(他们可能对许多问题上存在分歧,但两个增益如果他们避免战争)。

一些“显而易见”属性变量sum二人常和游戏不是有效的游戏。在恒定和游戏中,例如,两位选手无法获得(他们可能会或可能不会失去,但他们无法获得)如果他们被剥夺了他们的一些策略。然而在变量sum游戏,玩家可以获得如果他们的一些策略不再可用。起初这似乎并不可能。有人会认为,如果一个玩家受益于不使用某些策略,玩家只会避免这些策略和选择更有利的,但这并非总是如此。例如,在一个地区高失业率的一个工人可能会愿意接受较低的工资获得或保持一份工作,但如果最低工资法律使这种选择非法的,工人可能会“被迫”接受更高的薪水。

沟通的效果尤其发人深省的常数和变量sum游戏的区别。在恒定和游戏永远不会帮助一个球员给对手的信息,它永远不会伤害一个球员学习对手的最优策略(纯或混合)。然而,这些属性不一定在变量sum游戏。事实上,一个球员可能希望对手是消息灵通的。劳资纠纷,例如,如果工会准备罢工,工会通知管理,从而有可能实现其目标没有罢工。在这个例子中,管理是没有伤害的推进信息(它也福利通过避免代价高昂的罢工)。在其他变量sum游戏,了解对手的策略有时是不利的。例如,敲诈者只能受益,如果他第一次告诉他的受害者,他会伤害他全身被披露一些敏感和秘密的细节受害者的生活他的条件不符合。对于这样一个威胁是可信的,受害者必须担心披露,相信勒索者能够执行的威胁。(威胁的可信性问题,博弈论的研究)。 Although a blackmailer may be able to harm a victim without any communication taking place, a blackmailer cannot extort a victim unless he first adequately informs the victim of his intent and its consequences. Thus, the victim’s knowledge of the blackmailer’s strategy, including his ability and will to carry out the threat, works to the blackmailer’s advantage.

合作与非合作的游戏

沟通是无意义的恒定和游戏,因为没有共同从合作中获益的可能性。在变量sum游戏中,另一方面,沟通的能力,沟通的程度,甚至球员交流的顺序可以产生深远影响的结果。

Encyclopædia大yabo亚博网站首页手机英百科全书公司。

在表3中所示的变量sum游戏,每个矩阵的条目包含两个数字。(因为球员的综合财富不是常数,是不可能推断出一个玩家的收益回报的;因此,必须给球员支付。)第一个数字在每个条目是偿付行玩家(玩家一个),第二个数字是列玩家(玩家回报B)。

在这个例子中它将是球员一个如果游戏的优点是合作和球员B如果游戏非合作的优势。没有沟通,假设每个玩家应用“没问题”原则:最大化它的最低回报通过确定最低将收到任何对手。因此,一个决定了它将无论如何做最好的选择策略B:如果B选择我,一个将得到3不管什么一个做的;如果B选择二,一个4比3。B同样决定了它无论如何要做最好的选择我一个所做的事。选择这两个策略,一个将3和B将得到4 (3、4)。

然而,在合作游戏,一个可能会打二,除非吗B同意打二世。如果B同意,其收益将减少到3一个的回报将上升到4 (4,3);如果B不同意,一个执行它的威胁,一个既不会增加,也不会失去在(2)和(3,4)相比,但B将得到的回报只有2。很明显,一个将不受影响,如果B不一致,因此得出了一个可信的威胁;B将受到影响,显然会做得更好在(4,3)比(3 2)和应遵守的威胁。

有时两个玩家可以获得沟通的能力。两名飞行员试图避免半空中碰撞显然有利于如果他们能交流,以及它们之间的通信允许程度甚至可能决定他们是否会崩溃。一般来说,越两个球员的利益一致,和有利的交流变得更为重要。

解决方案合作游戏,玩家有一个共同的目标涉及到球员决定有效地协调。这是相对简单的,因为是找到解决saddlepoint恒定和游戏。游戏的玩家都共同和冲突的利益,换句话说,在大多数变量sum游戏,不管是合作还是noncooperative-what构成解决方案是更难定义并作出有说服力的。

纳什的解决方案

尽管解决方案已定义变量sum游戏在许多不同的方面,它们有时似乎不公平或不执行。一个著名的合作提出了解决二人变量sum游戏由美国数学家约翰·f·纳什,收到了诺贝尔经济学奖1994年,相关工作做的游戏理论。

给定一个游戏,一组可能的结果和相关的实用程序为每个球员,纳什表明有一个独特的结果满足四个条件:(1)的结果是独立的选择效用函数(也就是说,如果一个玩家喜欢xy,如果一个函数分配解决方案不会改变x10的效用y1或第二次的效用函数分配的值20 - 2)。(2)这两名球员不能同时做得更好(一个条件称为帕累托最优)。(3)结果独立于无关紧要的替代品(换句话说,如果没有吸引力的选项被添加或删除列表的替代方案,解决方案不会改变)。(4)结果是对称的(也就是说,如果球员们改变他们的角色,该解决方案将保持不变,回报将逆转除外)。

在某些情况下,纳什的解决方案似乎是不公平的,因为它是基于平衡威胁。可能会达成任何协议,这样这两名球员将遭受亏损而不是一个“公平”的结果。,例如,当一个富人和一个穷人提供他们可以同意接受10000美元如何分配资金(如果他们不同意,他们什么也得不到),大多数人认为公平的解决方案是为每个人一半,甚至,穷人应该得到一半以上。根据纳什的解决方案,然而,有一个实用程序为每个球员与所有可能的结果。此外,效用函数的具体选择不应影响解决方案(条件1)只要他们反映每个人的偏好。在这个例子中,假定富人的效用等于一半的钱收到了,穷人的效用等于钱收到。这些不同的功能反应了一定的事实,额外收入是穷人更珍贵的人。在纳什的解决方案,达成任何协议的威胁导致穷人接受10000美元的三分之一,给富人三分之二。一般来说,纳什的解决方案发现的结果,每个玩家获得相同数量的效用。

囚徒困境

©开放大学
Encyclopædia大yabo亚博网站首页手机英百科全书公司。

说明的困难出现在二人非合作的变量sum游戏,考虑著名的囚徒困境(PD),最初由美国数学家阿尔伯特·w·塔克制定。两个囚犯,一个B一起涉嫌犯下抢劫,孤立,并敦促坦白。每只关心为自己获得最短刑期;每个人都必须决定是否承认不知道他的合伙人的决定。两个囚犯,然而,知道他们的决定的后果:(1)如果两个承认,坐牢五年;(2)如果不坦白,入狱一年(携带隐蔽武器);和(3)如果一个坦白而另一方没有,忏悔神父是免费的(把状态的证据)和沉默的人去监狱了20年。这个游戏的正常形式所示表4

从表面上看,PD的分析是非常简单的。虽然一个不能确定什么B会做,他知道他最好的承认在吗B坦白(他五年而不是20)也在B保持沉默(他是没有时间而不是一年);类似地,B将达到相同的结论。所以每个囚犯的解决方案似乎是最好的承认和去入狱五年。矛盾的是,然而,两个劫匪显然会做得更好,如果他们都采用了非理性的策略保持沉默;然后只能一年监禁。PD具有讽刺意味的是,当每一个两个(或更多)政党行为自私和不配合其他(也就是说,当他承认),他们所做的行为比当他们无私,一起合作(也就是说,当他们保持沉默)。

PD不仅仅是一个有趣的假设的问题;现实生活中具有类似特征经常被观察到。例如,两个店主从事价格战可能会陷入一个PD。每个店主知道,如果他比他的对手更低的价格,他将吸引竞争对手的客户,从而增加自己的利润。每个因此决定降低他的价格,结果既不获得任何客户和赚取小利润。同样,国家参加军备竞赛和农民增加粮食产量也可以被视为PD的表现。当两国继续购买更多的武器,以实现军事优势,无论是收益优势,比当他们开始都是贫穷的。一个农民可以增加他的利润增加的产量,但是当所有农民增加产量过剩随之而来的市场,利润较低。

似乎PD固有的矛盾可以解决如果游戏反复播放。球员知道他们会做最好的行为当无私和合作。事实上,如果一个球员未能配合在一场比赛中,其他玩家可以在下一场比赛报复不合作,都将失去,直到他们开始“见光”和再次合作。当游戏重复固定数量的时期,然而,这个论点失败。看到这,假设两个店主设置他们的展位在为期10天的县集市。此外,假设每一个维护完整的价格,如果他不知道,第二天他的竞争对手将报复。最后一天,然而,每个店主不再意识到他的竞争对手可以报复,所以没有理由不降低他们的价格。但是如果每个店主知道,他的对手会降低他的价格最后一天,他没有理由维持价格的第九天。持续这种推理,得出结论:理性店主每天将价格战。反复只有当游戏玩,和球员都不知道序列将结束时,合作策略能成功。

1980年,美国政治学家罗伯特•阿克塞尔罗德的博弈论者从事循环比赛。在每一个匹配的策略两个理论家,纳入计算机程序,在一系列PDs对彼此竞争,没有明确的结束。一个“好”策略被定义为一个球员总是与合作的对手合作。同样,如果一个球员的对手没有合作一把,大多数策略规定不合作在下一圈的时候,但是一个球员一次“宽容”战略合作迅速恢复其对手又开始合作。在这个实验中结果表明每一个不错的策略表现策略,并不好。此外,好的策略,宽容的表现最好。

移动理论

另一种方法诱导合作在PD和其他变量sum游戏理论的移动(汤姆)。提出的美国政治学家Steven j .位汤姆允许玩家,开始在任何结果支付矩阵,矩阵内移动和报复行动,从而捕捉变化的战略游戏,因为他们的性质随时间而变化。特别是,汤姆假设球员提前思考所有的参与者的后果将由此制定计划。因此,汤姆嵌入粗放型计算在正常形式,推导两种形式的优点:nonmyopic思维的扩展形式严谨的经济范式。

为了说明nonmyopic汤姆的观点,考虑会发生什么在PD的函数开始玩:

  1. 当玩非合作的开始,球员们,不管他们看的有多远,因为一旦一个球员离开,其他球员,不会享受着最好的结果,但他继续前进。结果:球员呆在非合作的结果。
  2. 当游戏开始合作,无论是球员将缺陷,因为如果他这样做,其他球员也将缺陷,他们都将会更糟。思考未来,因此,无论是球员将缺陷。结果:球员呆在合作的结果。
  3. 游戏开始时的一输一赢的结果(最好为一个球员,最差),玩家做的最好就知道,如果他不是宽宏大量的,因此不合作的结果,他的对手将非合作的结果,造成他年收入最高的球员而且结果。因此,在巴西最富裕的玩家的利益,以及他的对手,他高尚地行动,预计,如果他不,非合作的结果(而且对于),而不是合作的结果(最好的),将被选择。结果:巴西最富裕的玩家将合作的结果,在那里将继续玩。

这种理性的举措并不超出了大多数玩家的苍白。事实上,他们通常是由那些超越自己的选择的直接后果。这样有远见的玩家可以摆脱困境在PD-as可怜的结果在其他变量sum games-provided玩不非合作的开始。因此,汤姆不预测无条件的合作在PD,但相反,使它玩耍的起点的函数。

生物应用

一个有趣的和意想不到的应用博弈理论,尤其是PD,发生在生物学。当两个男性面对彼此,是否竞争配偶或者一些有争议的领土,他们可以表现得像“鹰派”喷射器火警,直到一个残废,死亡,或者flees-or像“鸽子”姿态有点但离开之前任何严重危害。(实际上,鸽子虽然老鹰不合作。)这两种行为,事实证明,是理想的生存:一种只包含鹰派伤亡率很高;一个物种只包含鸽派鹰派将容易受到入侵或突变,产生鹰派,因为竞争鹰派的人口增长率将比这更高的最初的鸽子。

因此,一个物种雄性组成专门的鹰派或鸽子是脆弱的。英国生物学家约翰·梅纳德·史密斯的男性显示,第三种类型的行为,他称之为“资产阶级”,将是更稳定的比纯鹰派或纯粹的鸽子。资产阶级可能像鹰或鸽子,这取决于一些外部线索;例如,它可能会开会时坚忍不拔的竞争对手在自己的领土但是开会时产生相同的竞争对手的地方。实际上,资产阶级动物外部仲裁提交他们的冲突避免长期和相互毁灭的斗争。

Encyclopædia大yabo亚博网站首页手机英百科全书公司。

所示表5,史密斯的支付矩阵构造各种可能的结果(例如,死亡、致残成功交配),以及与他们相关联的成本和收益(例如,失去的时间成本),加权的预期数量的基因传播。史密斯显示,资产阶级入侵成功对一个完全通过观察,当鹰鹰人口面临一个鹰失去5,而资产阶级失去了只有2.5。(因为人口主要被认为是鹰,入侵的成功可以通过比较预测的平均数量的后代鹰将产生时面临的另一个鹰的平均数量的后代资产阶级将产生当面对老鹰。)显然,资产阶级入侵完全鸽子人口能否成功,获得资产阶级6后代。另一方面,一个完全资产阶级人口不能入侵鹰派和鸽派,因为资产阶级得到5反对资产阶级,这比老鹰或鸽子当面对资产阶级。注意在这个应用程序中,问题不是什么战略理性的玩家选择动物并不认为会有意识的选择,尽管他们的类型可以通过变异却什么组合的变化是稳定的,因此可能会进化。

史密斯给了几个例子,说明资产阶级策略在实践中使用。例如,男性斑点木蝴蝶寻求阳光斑点在森林的地面上,女性经常被发现。缺乏这样的地方,然而,和一个陌生人和居民之间的对抗,陌生人收益率经过短暂的决斗的战士圆。对手的决斗技能对结果没有影响。当一个蝴蝶却强行放在另一个领土,以便每个认为另一个侵略者,两个蝴蝶决斗义愤填膺更长一段时间。

N人游戏

从理论上讲,n人游戏的玩家是不允许交流和约束力的协议并没有从根本上不同于二人非合作的游戏。在接下来的两个例子中,每个涉及三个球员,一个看起来对纳什均衡的,稳定的结果,没有球员通常会离开,因为这样做将是不利的。

顺序和并发truels

的一个例子n人非合作的游戏,想象三名球员,一个,B,C,位于角落的一个等边三角形。他们从事truel,或三人决斗,每个球员都有一颗子弹的枪。假设每个玩家是一个完美的拍摄,可以杀死另一个球员在任何时间。没有固定的顺序,但任何枪击事件发生顺序:没有火灾的同时,其他球员。因此,如果发射了一颗子弹,结果被所有玩家之前另一个子弹是解雇。

假设球员秩序目标如下:(1)独自生存,(2)生存与一个对手,(3)生存与对手,(4)无法生存,没有对手活着,(5)不生存,与一个对手活着,和(6)无法生存,与对手活着。因此,独自生存是最好的,垂死的单独是最差的。

如果一个玩家可以在另一个球员,火不火,如果有人,会拍谁?不难看到,(3),结果没有人拍摄,是惟一的纳什equilibrium-any球员离开不射击更糟。相反,假设一个B,希望一个的结果(2),他和C生存。然而,现在C可以拍一个解除武装一个,从而让自己是唯一的幸存者,或结果(1),因为这是一个倒数第二的结果(5),一个和一个对手(B)被杀而其他对手(C)的生活,一个不应消防第一枪;同样的逻辑也适用于其他两个球员。因此,没有人会开枪,导致结果(3),所有的三名球员生存。

现在考虑是否通过共谋的球员可以做得更好。具体来说,假设一个B同意不互相射击;如果拍摄另一个球员,他们同意C。然而,如果一个C(例如),B现在可以否定协议而不受惩罚和拍摄一个,从而成为唯一的幸存者。

因此,提前思考的不愉快后果射击第一或勾结与另一个球员这么做,没有人会拍摄或勾结。因此所有玩家将生存如果球员必须依次行动,(3)结果。因为没有球员可以做得更好的,或是说他们会这样做,这些策略纳什均衡。

接下来,假设球员同时行动;因此,他们必须决定彼此的无知的行为。这种情况在生活中是很常见的:人们常常必须采取行动前了解其他人在做什么。在同时truel有三种可能性,根据轮的数量,这个数字是否已知:

  1. 一组练习。现在每个人都将发现,理性射击对手的比赛。这是因为没有球员能影响自己的命运,但至少,有时更好,通过拍摄另一个player-whether枪手生命或死亡是因为幸存的反对者的数量减少。因此,纳什均衡是每个人都会开枪。每个玩家随机选择他的目标时,很容易看到,各有25%的机会存活。考虑的球员一个;他会死,如果B,C(3例),或者两者都向他开枪,相比之下,他的生存BC互相射击(1例)。总之,一个一个,B,或C将生存概率75%,没有人会存活概率25%(当每个球员拍摄不同的对手)。结果:总是会有枪击事件,导致一个或没有幸存者。
  2. N轮(n≥2和已知)。假设没有人射杀对手倒数第二,或(n−1)圣,圆的。然后,在倒数第二轮,至少两名球员将理性或没有开枪。首先,考虑对手的情况一个。很明显,一个永远做得比拍摄,因为一个会被杀死。此外,一个并更好的射击哪个对手(必须有至少一个)并不是一个目标BC。另一方面,假设没有人拍摄一个。如果BC互相射击一个没有理由拍摄(尽管吗一个不能这样做伤害)。然而,如果一个对手,说B,把他的火,CB,一个又不能比持有他的火也做得更好,因为他可以消除C下一轮。(注意,C,因为它已经解雇了他唯一的子弹,没有威胁一个)。最后,假设两个BC火。如果一个拍摄一个对手,说B,那么他的其他对手,C,将会消除一个最后,或nth,圆的。但是,如果一个持有他的火,游戏上nth轮,正如上面(1)中讨论的,一个有25%的几率幸存,假设随机选择。因此,如果没有其他人拍摄(n−1)圣轮,一个不能再在这一轮火比他做得更好。球员是否避免枪击事件(n−1)圣圆形或不是每个战略可能是一个最好的回应其他球员do-shooting将是合理的nth轮如果有多于一个的幸存者和至少一个球员已经剩下一颗子弹。此外,拍摄的预期(n−1)圣或nth轮可能会导致玩家火前,甚至回到第一和第二轮。结果:总是会有枪击事件,导致一个或没有幸存者。
  3. N轮(n无限的)。新皱纹是,它不可能是理性的球员在任何一轮射击,导致所有三名球员的生存。这是怎样发生的呢?上面的论点在(1),“如果你开枪,你不妨拍人”仍然适用。然而,即使你是,一个,BC,你就不能做得更好B,让自己唯一survivor-outcome(1),和之前一样,你做best-whether射击或,如果你拍摄的人不是别人的目标,从第一轮开始。然而,假设BC避免在第一轮射击,考虑一个的情况。射击敌人不是理性的一个在第一轮因为幸存的对手会开枪一个下一轮(总会有下一轮n是无限的)。另一方面,如果所有的球员,按兵不动,继续这样做,在随后的几轮,那么所有三名球员将继续活着。虽然没有“最好”的策略在所有情况下,生存的可能性将会增加n是无限的。结果:可能有0,(任何之一一个,B,或C),或三个幸存者,但从来没有两个。总结、射击顺序truel从来就不是理性的,而在同时truel总是理性的,只有一个圆。因此,“没人芽”和“每个人芽”是这两种truels的纳什均衡。在同时truels,不止一个圆的,相比之下,有多个纳什均衡。如果轮的数量是已知的,那么有一个纳什均衡的球员,和一个他不,起初,但最终只有一个或者没有幸存者。当轮的数量是无限的,但是,一个新的纳什均衡可能没有拍摄任何一轮。因此,喜欢和一个不确定的PD轮,轮的无限truel会导致更大的合作。

在投票:椅子的悖论的立场

许多应用程序的n人博弈理论关心的是投票,战略计算往往猖獗。令人惊讶的是,这些计算会导致表面上最强大的球员投票的身体受到伤害。例如,假设投票的椅子的身体,虽然没有比其他成员更多的选票,可以断绝这种关系。这似乎使椅子更强大,但事实证明,拥有平局决胜的投票可能会适得其反,把椅子处于劣势相对于其他成员。以这种方式更大的资源,一个球员可能不总是转化为更大的权力,这将意味着一个球员的能力获得优先的结果。

在投票三人非合作的博弈分析,球员们认为可能发生的可能的结果。找到解决办法的问题不是缺少纳什均衡,但是太多。那么问题就来了,如果有的话,有可能被选中的球员?具体地说,是一个比其他人更有吸引力?答案是“是的”,但它需要扩展的想法肯定的策略,其连续应用程序在不同的阶段。

为了说明椅子的问题,假设有三个选民(X,Y,Z)和三个投票选择(x,y,z)。假设选民X更喜欢xyyz表示,由xyz;选民Y的偏好yzx,和选民Z的是zxy。这些首选项产生所谓孔多塞投票悖论,因为社会次序,根据少数服从多数原则,是不及物动词:尽管大多数选民(XZ)喜欢xy和大多数(XY)喜欢yz,大多数(YZ)也喜欢zx。(法国启蒙运动哲学家Marie-Jean-Antoine-Nicolas孔多塞第一次检查后投票悖论法国大革命)。所以没有孔多塞得主,是另一种,在单独的两两比赛击败其他的选择。

假设一个简单多数决定获胜的替代。此外,在发生三系(永远不可能有一个双向领带如果有三票),假设的椅子上,X,可以打破领带,给椅子似乎会胜过其他两个选民,YZ,谁有相同的一票但是没有平局决胜。

在真诚的投票,每个人都投票选他的第一选择,而不考虑其他选民可能做什么。在这种情况下,选民X会得到他的第一选择(x),能够打破三大支持x。然而,X明显的优势将会消失如果投票是“复杂的”。

究其原因,首先注意X毫无疑问的事,或占主导地位,战略”投票x”;它不会更糟糕的是,有时比其他策略,无论其他两个选民。因此,如果其他两个选民投票支持相同的替代,x会赢;和X不能做的更好比投票真诚x投票,所以真诚永远不会变得更糟。另一方面,如果其他两个选民不同意,X的打破僵局的投票(连同他定期投票)将是决定性的x的选择,这是X最好的结果。

Encyclopædia大yabo亚博网站首页手机英百科全书公司。

的优势策略选择xX,然后YZ面对减少战略选择,如图所示表6第一减少。(因为这是一个减少X支持战略x作为一个给定的。)在减少,Y有一个,Z有两个主要策略(D),这从来都不是更好,有时比其他策略,无论其他两个选民。例如,观察到“投xY总是会导致坏的结果,x。这使得Y有两个undominated策略”,投票支持y”和“投票支持z”,这既不是主要也不是主导策略:“投票y投票给“比”z“如果Z选择y(导致y而不是x),而相反的情况Z选择z(导致z而不是x)。相比之下,Z优势策略的“投z”,这导致的结果至少一样好甚至比他的其他两个策略。

Encyclopædia大yabo亚博网站首页手机英百科全书公司。

当选民有完整的信息对彼此的喜好,他们会消除控制策略减少。消除这些策略减少给第二个矩阵,如图所示表7。然后Y,“投之间选择y”和“投票支持z“在这个矩阵,将消除现在主导”投票y“因为这个选择将导致x的成功由于椅子的平局的一票。相反,Y会选择“投z”,确保z的选举,这是最好的结果Y。以这种方式z的第一选择,这不是多数,实际上可以被y两两比赛冠军,成为复杂的结果,这是逐次消元产生的结果由选民(开始主导战略X真诚的选择x)。

复杂的投票结果在一个纳什均衡,因为没有一个球员离开他们的复杂的策略可以做得更好。这显然是真的X,因为x是他的主要策略;鉴于X的选择x,z是占主导地位的Z;鉴于这些选择XZ,z是占主导地位的Y。这些“偶然”优势关系,一般而言,使复杂的策略纳什均衡。

观察,然而,有四个其他的纳什平衡这个游戏。首先,每个人的选择x,y,或z通过这三个选民都是纳什均衡,因为没有一个选民的离开可以改变到一个不同的结果,更少更好的一种,球员。此外,选择x通过X,y通过Y,x通过Z结果在x是一个纳什均衡,因为没有选民的离开会导致他获得更好的结果。

在博弈论的术语中,复杂的投票产生不同的小游戏,一些以前undominated策略在更大的游戏成为主导的小游戏。在几个连续的去除strategies-sometimes阶段可以使每个选民可能会决定结果。特别是,复杂的选民可以取消抵押品赎回权的可能性,最糟糕的结果将由先后删除选择主导策略,考虑到假定其他选民也会做同样的事。

复杂的投票如何影响椅子的假定额外的投票权?观察到椅子的平局的一票是不仅不是帮助而是肯定有害:它保证X的坏的结果(z如果投票是复杂的)将被选中。当选民的偏好不是很矛盾(注意三个选民有不同的第一,第二,第三选择,在这里,有一个投票孔多塞悖论),椅子的位置不发生的矛盾,使这一悖论例外而不是规则。

冯Neumann-Morgenstern理论

冯·诺依曼和Morgenstern首先构建一个合作理论n人游戏。他们认为,不同群体的球员可能会连接在一起形成联盟,每个都有一个关联的值定义为最少,联盟可以通过自己的努力确保。(在实践中,这些组织可能是集团在立法机构或业务合作伙伴在一个企业集团)。他们描述了这些n人游戏特征函数,它是通过列出单独的球员(单人联盟),两个或两个以上的所有可能的联盟球员,这些联盟的值可以确保如果counter-coalition包括所有其他玩家的行动联盟可以获得的金额降到最低。他们还假定特征函数是超加性:两个以前独立联盟的联盟的价值至少是一样伟大的和单独的值的两个联盟。

支付给球员们在每个联盟的总和必须等于联盟的价值。此外,每个球员在联盟必须接受不少于他可以获得单独玩什么;否则,他不会加入联合政府。每组支付给球员们描述了一个可能的结果之一n人合作游戏,被称为一个归责。在一个联盟年代,一个归责X据说主宰另一个归责Y如果每个球员年代得到更多的与X而不是Y如果球员年代收到支付总额不超过联盟的价值年代。这意味着球员联盟喜欢回报X的回报Y并有能力实施这种偏好。

冯·诺依曼和Morgenstern定义一个解决方案n人游戏为一组归罪满足两个条件:(1)没有非难主宰另一个归责的解决方案的解决方案和解决方案(2)任何归责不被另一个解决方案。冯Neumann-Morgenstern解决方案不是一个单一的结果,但相反,一组结果,任何一个可能发生的。它是稳定的,因为对于联盟的成员之外的归责的解决方案是主导难过——而且因此吸引力比归罪在解决方案。解决方案内的罪名是可行的因为它们不是由任何其他罪名的解决方案。

在任何给定的合作博弈一般many-sometimes无限许多解决方案。一个简单的三人游戏,说明这一事实中,任意两个球员,以及这三个球员,获得一个单位,它们彼此之间的鸿沟或以任何方式,他们希望;个别球员收到没有。在这种情况下每两人联盟的价值,以及三人联盟,是1。

一个解决方案,这个游戏包括三个罪名,在每一个球员收到0和其他两名球员获得1/2。没有self-domination内的解决方案,因为如果一个归责代替另一个,一个球员得到更多,少一个人,一个有相同(统治,每个球员组建联合政府必须获得)。此外,任何归责以外的解决方案是由一个解决方案,因为最低的两名球员支付必须每个小于1/2;显然,这种污名是由一个归责的解决方案这两个球员每个get 1/2。根据这个方案,在任何给定时间的三个罪名将发生,但是冯·诺依曼和Morgenstern不预测哪一个。

第二个解决方案,这个游戏包含的所有球员的罪名一个收到1/4和球员BC分享剩下的3/4。尽管这个解决方案给出了一组不同的结果从第一个解决方案,它,也满足冯·诺依曼和朱莉的两个条件。解决方案中的任何归责,球员一个总是1/4,因此无法获得。此外,由于球员BC分享一个固定的金额,如果其中一个收益提出非难,其他必须输。因此,解决方案中没有非难主宰另一个归责的解决方案。

对于任何归责不是解决方案,球员一个必须或多或少比1/4。当一个会超过1/4,球员BC分享不到3/4,因此可以做得更好的归责在解决方案。当球员一个小于1/4,1/8,他总是更好的归责的解决方案。球员BC现在有更多的分享;但不管他们如何把新的7/8,总有一个归责的解决方案,其中一个会喜欢。当他们分享同样的,每一个7/16;但球员B例如,可以得到更多的归责(1/4、1/2、1/4),这是在解决方案。当玩家BC不要把7/8同样,球员谁归责的较小的数量总是可以做的更好的解决方案。因此,任何归责外内的解决方案是由一个解决方案。同样,它可以显示所有的球员的罪名B得到1/4和球员一个C分享3/4,以及所有球员的罪名C得到1/4和球员一个B分享3/4,也构成解决比赛。

尽管会有很多游戏解决方案(分别代表不同的“标准的行为”),这不是明显的起初,总会有至少一个在每一个合作博弈。冯·诺依曼和Morgenstern没有发现游戏没有一个解决方案,他们认为很重要,不存在类似的游戏。然而,在1967年一个相当复杂的10人游戏是由美国数学家威廉·f·卢卡斯,发现没有一个解决方案。这和后来的反例表明,冯Neumann-Morgenstern解决方案并不是普遍适用的,但它仍然是引人注目的,尤其是因为没有明确的理论n人合作游戏的存在。

投票的Banzhaf价值游戏

一节中在投票:椅子的悖论的立场,结果表明,功率定义为控制结果并不等同于控制资源,比如一把椅子的平局的一票。选民干预和面临的战略形势可能会导致他们评估策略的椅子上拥有更多的资源。这样做,他们可能会导致“帮派”要靠在椅子上。(注意,YZ这样做没有任何明确的沟通或约束力的协议;联盟形成要靠在椅子上X是一个隐式的游戏,因此,仍然是一个非合作的一个)。实际上,椅子的资源变成一种负担,不喜欢。

当玩家的偏好是事先不知道,它是有用的定义权力的能力改变通过改变他们的投票结果,由宪法、章程,或其他的游戏规则。提出了各种措施的投票权对于简单的游戏,每个联盟都有一个值为1(如果它有足够的票数赢得)或0(不)。的和所有的球员的权力是1。当一个球员0的力量,他的投票没有对结果的影响;当一个球员的力量1,结果只取决于他的投票。计算投票权的关键是确定的频率球员投下一个关键的投票。

美国律师约翰·f·Banzhaf三世提出,所有的组合,任何球员都是关键的选民,是衡量通过只有这个选民的帮助认为是等可能的。Banzhaf值为每个球员然后组合的选民的数量除以总数量的组合是至关重要的,每一个选民(包括这一个)是至关重要的。

这种观点是不符合定义的投票权的球员是他投下选票的数量成正比,因为投票本身可能有很少或没有影响的选择结果。例如,在一个三人投票的身体中一个有4票,B2票,C1票,BC如果简单多数获胜将无能为力。事实上,成员BC一起控制3/7的选票结果的选择无关,所以这些成员被称为假人。成员一个相比之下,是一个独裁者的独自拥有足够的票数来决定结果。投票的身体只能有一个独裁者的存在使所有其他成员假人,但是可能假人,没有独裁者(下面给出一个例子)。

最小获胜联盟(还)是一个减法的至少一个成员使它失去。为了说明Banzhaf值的计算,考虑一个身体两个2-vote成员投票(区分为2 a和2 b)和一个三日选举成员的简单多数获胜。有三个不同的发出邀请函(2),(3 2 b),和(2、2)或者组合一些选民是至关重要的;大联盟,包括所有三个成员(3 2 2 b),不是一个发出邀请函,因为没有任何一个成员的背叛会导致它失去。

每个成员的背叛是至关重要的两个最有可能,每个成员的投票权比例是2/6,或三分之一。因此,Banzhaf指数给出了Banzhaf每个成员的值向量形式,是(1/3,1/3,1/3)。显然,三日选举投票权的成员是一样的,每个两个2-vote的成员,虽然三日选举成员有50%体重(更多的选票)大于每个2-vote成员。

投票权重之间的差异和投票投票权更戏剧性的身体(50,49岁,1),再一次,简单多数获胜。50-vote成员在所有三个最有可能是至关重要的——(50,1),(50,49)和(50,49岁,1),给他否决,因为他的存在是必要的一个联盟winning-whereas 49-vote成员只有至关重要(50,49)和1票员只在(50,1)。因此,Banzhaf指数(50,49岁,1)(3/5,1/5,1/5),使49-vote成员的1票员;50-vote成员,只有一个比49-vote成员投票,有三倍的投票权。

1958年六个西欧国家形成了欧洲经济共同体(EEC)。三个大国(西德、法国和意大利)每个部长理事会有4票,这两个中型国家(比利时和荷兰)2票,和一个小国家(卢森堡)1票。安理会的决策规则是一个合格的多数12的17票,给大国Banzhaf值的5/21,中型国家1/7,and-amazingly-Luxembourg没有投票权。从1958年到1973年,当欧洲经济共同体承认三个额外的members-Luxembourg是假的。卢森堡也没有去理事会会议除了参与辩论,因为它一票不可能改变的结果。看到这没有计算Banzhaf所有成员的值,注意五个其他国家的选票都是偶数。因此,公司还以12票不可能包括卢森堡(奇数)1票;而13-vote发出邀请函,包括卢森堡可能形式,卢森堡背叛不会呈现这样一个最有可能失去。值得注意的是,委员会不断扩大的新国家和欧盟的形成,卢森堡从未恢复是假的,即使它的选票成为总数的比例更小。

班茨哈夫和其他权力指数,植根于合作博弈理论,已应用于许多投票的身体,有时不一定加权,以惊人的结果。例如,Banzhaf指数被用来计算5永久的力量和10的联合国安理会非常任理事国。(拥有否决权的常任理事国,所有有83%的权力。)它也被用来代表的力量相比,参议员,总统在美国联邦系统。

Banzhaf自己成功地挑战了合宪性的加权投票系统用于县,纽约,表明三县委员会的六个成员国的假人。同样,前纽约委员会估计,在这三个全市官员(市长,市议会主席和审计)两票每五区总统有一票,由美国最高法院宣布违宪;这是因为布鲁克林有大约6倍的人口史泰登岛,但同样的一票在黑板上,违反了美国宪法第14条修正案的平等保护条款,需要“一人一票。“最后,它一直认为美国选举团制度,实际上是一个加权投票的身体因为几乎所有州集团投下自己的选票,违反了一个人,一个在总统选举中投票,因为来自大州的选民有大约三倍的投票权,在人均基础上,来自小州的选民。

博弈论现在正在建立和广泛应用于不同的学科。经济学的基础,例如,越来越多的基于博弈理论;经济学博弈理论的许多应用程序的设计是联邦通信委员会电波的拍卖,这给美国政府数十亿美元的资金。博弈论被越来越多地用于政治科学研究战略等众多领域的活动和选举,国防政策,国际关系。在生物学、业务、管理科学、计算机科学、法律、博弈理论模型已被用于各种各样的战略情况。博弈论甚至已经渗透到哲学领域(例如,研究伦理规则)的平衡性质,宗教(如解释圣经故事),和纯粹的数学分析(例如,如何分配蛋糕相当中n人)。总之,博弈理论带来了巨大的希望不仅对推进战略互动的理解非常不同的设置,还提供处方的设计更好的拍卖,讨价还价,涉及战略选择的投票,和信息系统。

莫顿·d·戴维斯

Steven j .位

更多的阅读

博弈论是开创性的工作约翰·冯·诺依曼奥斯卡·摩根,博弈论与经济行为,3日。(1953年,1980年重印)。Avinash k .武断的话巴里·j·纳尔,思考战略:竞争优势在商业、政治和日常生活(1991),使用案例研究,没有正式的数学分析,引入博弈理论的原则。两个只需要高中代数的介绍Avinash k .武断的话苏珊Skeath,游戏的策略(1999);和菲利普·d·Straffin,博弈理论(1993)。

提出了应用博弈论Nesmith c Ankeny,扑克策略:赢得游戏理论(1981年,1982年重印);罗伯特•阿克塞尔罗德,合作的进化(1984);道格拉斯·g·贝尔德,罗伯特·h·特纳,兰德尔c选择器,博弈理论和法律(1994);Steven j .位,圣经的游戏:游戏理论和希伯来圣经,第二版。(2002);Steven j .位,移动理论(1994);丹·s . radarMoshe Machover,投票权的测量:理论与实践,问题和矛盾(1998);巴里•奥尼尔,荣誉、符号和战争(1999);和卡尔·西格蒙德,生命的游戏:探索在生态学、进化、和行为(1993)。

博弈理论的历史中可以找到威廉•庞德斯,囚徒困境:约翰·冯·诺依曼,博弈论,炸弹的难题(1992);和e·罗伊·温特劳布(主编),对博弈论的历史(1992)。

Steven j .位