两人变和博弈
博弈论的大部分早期工作都是关于两人常和博弈的,因为它们是最容易用数学方法处理的。在这样的游戏中,玩家有着截然相反的利益共识什么构成解(由极大极小定理给出)。然而,实践中出现的大多数博弈都是变和博弈;参与者既有共同的利益,也有对立的利益。例如,买方和卖方正在进行一场可变和博弈(买方想要低价,卖方想要高价,但双方都想达成交易),两个敌对国家也是如此(他们可能在许多问题上存在分歧,但如果避免开战,双方都能获益)。
二人常和博弈的一些“明显”性质在变和博弈中并不成立。例如,在常和博弈中,如果被剥夺了某些策略,双方都无法获得(他们可能会输,也可能不会输,但他们不可能都获得)。然而,在变和博弈中,如果玩家的某些策略不再可用,他们可能会获益。乍一看,这似乎不太可能。有人可能会认为,如果玩家从不使用某些策略中获益,那么他们就会简单地避免这些策略并选择更有利的策略,但情况并非总是如此。例如,在一个失业率高的地区,一个工人可能愿意接受较低的工资来获得或保住一份工作,但如果一个工人的工资较低最低工资法律规定这种选择是非法的,工人可能“被迫”接受更高的工资。
交流的影响特别揭示了常和博弈和变和博弈之间的区别。在常和博弈中,玩家向对手提供信息永远不会有帮助,提前了解对手的最佳策略(纯策略或混合策略)也不会对玩家造成伤害。然而,这些性质在变和博弈中并不一定成立。的确,玩家可能希望对手见多识广。例如,在劳资纠纷中,如果工会是准备出击了吗有必要工会通知资方,从而有可能在不罢工的情况下实现其目标。在这个例子中,管理层没有受到提前消息的损害(它也受益于避免代价高昂的罢工)。在其他可变和博弈中,了解对手的策略有时是不利的。例如,勒索者只有先告诉受害者,如果他的条件得不到满足,他就会伤害他——通常是披露受害者生活中的一些敏感和秘密细节。这样的威胁要可信,受害者必须害怕信息披露并相信勒索者有能力实施威胁。(威胁的可信度是博弈论研究的一个问题。)虽然勒索者可以在没有任何沟通的情况下伤害受害者,但除非勒索者首先充分告知受害者他的意图和后果,否则他不能敲诈受害者。因此,受害者对勒索者策略的了解,包括他实施威胁的能力和意愿,对勒索者有利。
合作与非合作博弈
在常和博弈中,交流是毫无意义的,因为不可能从合作中获得共同利益。另一方面,在变和游戏中,交流的能力、交流的程度,甚至是玩家交流的顺序都会对结果产生深远的影响。
在变和博弈中所示矩阵入口由两个数字组成。(因为结合球员的财富不是恒定的,不可能推断出一个球员的财富回报从对方的偿付中;因此,双方的收益都必须给出。)每一项的第一个数字是行玩家(玩家)的收益一个),第二个数字是列玩家(player .)的收益B).
,每个在这个例子中,它将是播放器一个如果比赛是合作对玩家来说B在博弈是非合作的情况下,它的优势。在没有交流的情况下,假设每个玩家都应用了“确定的原则”:通过确定对手所做的任何事情,它都会获得的最小收益最大化。因此,一个决定了无论如何选择策略I都是最好的选择B:如果B选择我,一个会得到3一个做的;如果B选择二,一个会得到4而不是3。B同样决定了无论如何选择I都是最好的选择一个所做的事。选择这两种策略,一个将得到3并且B在(3,4)处得到4。
然而,在合作博弈中,一个可以威胁下二除非B同意玩ii。如果B同意,它的收益将减少到3一个的收益会在(4,3)点上升到4;如果B不同意并且一个执行它的威胁,一个(3,2)相对于(3,4)不会有增益也不会有损失,但是B收益只有2。很明显,一个将不受影响B不同意,从而有一个可信的威胁;B会受到影响,显然在(4,3)上会比(3,2)做得更好,应该遵守威胁。
有时双方都能从交流能力中获益。两名试图避免空中相撞的飞行员如果能够沟通,显然会受益,他们之间的沟通程度甚至可能决定他们是否会坠毁。一般来说,双方的兴趣越一致,交流就越重要,越有利。
在玩家拥有共同目标的合作游戏中,解决方法包括有效地协调玩家的决策。这是相对的直截了当的就像找到带鞍点的常和博弈的解一样。对于玩家既有共同利益又有冲突利益的博弈——换句话说,在大多数变和博弈中,无论是合作的还是非合作的——解决方案的构成要更难定义和具有说服力。
的纳什的解决方案
虽然变和博弈的解决方案有许多不同的定义,但它们有时似乎不公平或不具有可执行性。一个著名的两人变和博弈的合作解是由美国数学家提出的约翰·f·纳什他在1994年获得了诺贝尔经济学奖,因为他在博弈论方面的相关工作。
给定一个具有一组可能结果和每个参与者的相关效用的游戏,纳什证明了存在一个唯一的结果,它满足四个条件:(1)结果独立于效用函数的选择(也就是说,如果一个参与者更喜欢x来y,如果有一个函数赋值,解不会改变x效用是10和y效用为1或第二个函数赋值为20和2)。(2)两个参与者不能同时做得更好(这种情况称为帕累托最优性)。(3)结果与无关无关选择(换句话说,如果在备选方案列表中添加或删除了不吸引人的选项,解决方案不会改变)。(4)结果是对称的(也就是说,如果参与者互换角色,解决方案将保持不变,除了收益将反转)。
在某些情况下,纳什解决方案似乎是不公平的,因为它是基于威胁的平衡——没有达成协议的可能性,这样双方都将遭受损失——而不是一个“公平”的结果。例如,如果一个富人和一个穷人能就如何分配这笔钱达成协议(如果他们不能达成协议,他们什么都得不到),那么他们将得到1万美元,大多数人认为公平的解决方案是每个人各得一半,甚至穷人应该得到一半以上。然而,根据纳什解决方案,每个参与者都有一个与所有可能结果相关的效用。此外,效用函数的具体选择不应影响解决方案(条件1),只要它们反映了每个人的偏好。在这个例子中,假设富人的效用等于收到的钱的一半,而穷人的效用等于收到的钱。这些不同的功能反映了额外收入更多的事实珍贵的给穷人。在纳什解决方案下,无法达成协议的威胁会诱使穷人接受1万美元的三分之一,而富人则接受三分之二。一般来说,纳什解的结果是每个参与者都能获得相同的效用。