游戏理论(十三)
Henrich等。 (2004年,2005年)进行了一系列实验游戏,其中包括来自南美,非洲和亚洲的15个小型人类社会的种群,其中包括三组觅食者,六组斜线和燃烧的园艺家,四组游牧民族和两组小型农业学家。在上一节中讨论的信任游戏中,游戏(最后通,独裁者,公共物品)在很大程度上实现了所有位置主题。也就是说,最后通at和公共物品游戏是社会福利和每个人的福利都得到优化的情况(达到的帕累托效率),并且只有至少某些玩家使用不是子游戏完美均衡策略的策略(请参阅第2.6节) 。在独裁者游戏中,一个自私自利的第一个搬家将捕获所有可用的利润。因此,在这三种游戏类型中的每一种中,SPE球员只关心自己的货币福利,将获得涉及高度差异的收益的结果。在Henrich等人研究的社会中。 (或其他任何此类游戏的社会)是观察到的结果。如果他们和他们的合作伙伴扮演的SPE总是为合作伙伴提供比Epsilon的大幅度提供的角色,以至于他们的角色如此之多,以至于他们将夺走所有货币利润的利润。此外,与实验经济学的传统学科(工业化国家的大学学生)不同,Henrich等人的主题甚至没有针对金钱收益进行NASH均衡策略。 (也就是说,具有战略上优势的参与者为战略性弱势群体提供了更大的利润分裂,而诱使他们的报价达成协议所必需的。)Henrich等。通过暗示所有实际人物(与“理性的经济人物”)在某种程度上重视平等成果不同,可以解释这些结果。但是,他们的实验还表明,这一程度与文化有很大不同,并且与两个特定文化变量的变化相关:合作的典型收益(社会中经济生活在多大程度上依赖于与非涉及亲属的合作)和聚集市场整合(一种由独立测量的社会复杂性,匿名性,隐私和和解规模建立的构造)。随着这两个变量的值增加,游戏行为在NASH平衡播放方向上(弱)。因此,研究人员得出的结论是,人们自然地赋予了对平等主义的偏好,但是这些偏好的相对权重可以通过以当地文化线索为条件的社会学习过程来编程。
在评估Henrich等人对这些数据的解释时,我们应该首先注意到,没有RPT的公理,或第8.1节中提到的各种决策模型,这些模型与游戏理论建模共同应用于人类选择数据,指定或指定需要狭窄的自私。 (请参阅Ross(2005a)第4章; Binmore(2005b)和(2009);以及任何能够使数学不言而喻的经济学或游戏理论文本。)正统的游戏理论因此并不预测人们会发挥SPE或NE策略通过将自己的货币收益视为相当于公用事业的来源。因此,Binmore(2005b)在批评Henrich等人的修辞方面是有道理的,这表明他们的经验工作使东正教理论感到尴尬。
这并不是说对经验结果的人类学解释应被视为无争议。 BINMORE(1994,1998,2005a,2005b)一直在许多年来,基于广泛的行为数据,当人们与非竞争游戏玩游戏时,他们倾向于学会在效用功能上玩NASH均衡,这些功能大致相对应收入功能。正如他在Binmore(2005b)中指出的那样,Henrich等人的数据没有为其小型社会检验这一假设,因为他们的主题没有暴露于测试游戏中(如果是很长的话)理论和计算模型建议的人融合NE需要的最后通读游戏)。当人们玩不熟悉的游戏时,他们倾向于通过参考日常体验中习惯的游戏来对其进行建模。特别是,他们倾向于玩一声实验室游戏,就好像他们是熟悉的重复游戏一样,因为在特殊机构环境之外,一声游戏在正常的社交生活中很少见。 Henrich等人的许多解释性言论。尽管他们明确拒绝假设本身,但与有关其主体的这一假设是一致的。这里有争议的是围绕“东正教”理论的旋转问题,而不是关于本实验中的特定主题所做的事情,而是他们的行为应该导致我们对人类进化的推断。
Gintis(2004),(2009a)认为,我们一直在讨论支持以下关于人类进化的猜想的那种数据。我们的祖先近似个体健身的最大化器。这些祖先在进化界的某个地方到达了足够的情况,他们通过行动来优化他们的个人健身,以优化群体的福利(Sober and Wilson,1998年),遗传修饰是在物种中固定的:我们开发了偏爱而不是就在我们自己的个人福利上,但是在我们社区的所有成员的相对福利上,通过文化学习在每个人中可以编程的社会规范索引。因此,建议使用游戏理论对社会状况进行建模的当代研究人员,建议通过(i)找出他们是哪些社区(或社区)是哪个社区(或社区),然后(ii)推断效用函数(ii)通过在一系列游戏中研究每个相关社区的代表,并假设结果是相关的平衡,将其编程到该社区(社区)的成员。由于实用程序功能是这里的因变量,因此必须独立确定游戏。我们通常可以至少拥有固定的相关游戏的战略形式,Gintis认为,由于(a)我们的信心,人们对人们更喜欢平等的成果,所有其他是平等的,而不是文化发展的“内部群体”中的非法主义成果他们认为自己是归属的,并且(b)要求游戏平衡是从该文化历史动力学的合理进化游戏理论模型中汲取的稳定吸引者。
要求(b)作为对一般人类战略处置的游戏理论建模的限制,不再是非常有争议的,或者至少,不再比进化人类学中的仿制化适应主义更具争议性。但是,许多评论员对Gintis的建议持怀疑态度,即人类社会的发展存在遗传不连续性。 (对于明确否认这种不连续性的认知进化人类学,请参见Sterelny2003。)部分基于此类怀疑主义(但更直接地基于行为数据)Binmore(2005a,2005b)抵制了模型的人,使人们建立了对高层主义的内置偏好的模型。根据Binmore(1994,1998,2005a)模型的说法,非社交社会动物面临的基本战略问题类别是协调游戏。
人类社区发展文化规范来选择这些游戏中的平衡,并且许多平衡将与某些(但不是全部)游戏中高水平的明显利他行为兼容。宾莫尔认为,人们会根据当地流行的均衡选择规则来调整他们的公平观念。然而,他坚持认为,从长远来看,此类规范的动态发展必须与自私的个人之间的讨价还价平衡相一致。事实上,他认为,随着社会的发展,鼓励 Henrich 等人的制度不断发展。称为总体市场一体化(如上所述),它们的效用函数和社会规范往往趋于于福利方面的自我关注的经济理性。这并不意味着宾莫尔对平等主义的前景感到悲观:他开发了一个模型,表明广泛自利的讨价还价者的社会可以自然地沿着动态稳定的均衡路径走向与罗尔斯正义相对应的分配规范(Rawls 1971)。宾莫尔认为,这种演变的主要障碍恰恰是保守派所推崇的那种关乎他人的偏好,以此来阻止对沿着社会均衡路径可以实现的更平等的讨价还价均衡进行检验。
幸运的是,金蒂斯和宾莫尔之间的这场争论的解决不需要等待我们可能永远不会发现的关于人类进化历史的深刻发现。这些模型对一些可测试的现象做出了相互竞争的经验预测。如果金蒂斯是对的,那么由于人类进化的不连续性,人们学会自利的程度就会受到限制。这是上面讨论的关于 Henrich 等人对其现场数据的解释的争议的主要意义。与金蒂斯的模型不同,宾莫尔的社会均衡选择模型还取决于人们对未能制裁违反社会规范者的社会成员实施二级惩罚的普遍倾向。 Gintis (2005) 使用博弈论模型表明,如果惩罚成本很大,这是难以置信的。然而,罗斯(Ross,2008a)认为,文献中普遍存在的假设,即对违反规范的惩罚必须付出昂贵的代价,这是由于未能充分区分社会性原始进化模型和维持和发展模型之间的差异。一旦最初的一套规范和制度稳定下来,它们就会随之而来。最后,罗斯还指出,宾莫尔的目标既是规范性的,又是描述性的:他的目标是向平等主义者展示如何诊断保守派对现状合理化的错误,而不呼吁进行使均衡路径稳定(从而稳定社会福利)的革命。构建改革建议的一个合理原则是,改革建议应该“防无赖”(正如休谟所说),也就是说,应该与人们普遍存在的利他主义相容性较低。
9. 展望未来:当前创新领域
2016 年,《经济展望杂志》发表了题为“博弈论中正在发生什么?”的研讨会。每个参与者都独立地指出,博弈论已经与一般的微观经济理论紧密地纠缠在一起,以至于这个问题很难与对整个子学科的移动前沿的探究区分开来,而这又是经济学作为经济学的最大组成部分。因此,博弈论哲学和微观经济学哲学之间的界限现在同样模糊了。当然,正如所强调的,博弈论的应用超出了传统的经济学领域,进入了所有的行为科学和社会科学。但随着博弈论方法与微观经济学方法的融合,评论家可能同样将这些扩展视为微观经济学的输出应用。
经过本文(不完全)概述的数十年发展之后,过去几年相对安静,涉及需要哲学家做出贡献的基础性创新。然而,原始基础的某些部分正在重新审视。
冯·诺依曼和摩根斯坦(1944)对博弈论的介绍将研究分为两个部分。非合作博弈论分析的案例建立在这样的假设之上:每个参与者最大化自己的效用函数,同时将其他参与者的预期战略反应视为约束。如上所述,冯·诺依曼和摩根斯特恩应用其模型的具体游戏是扑克,这是一种零和游戏。本文的大部分内容集中讨论了将非合作博弈论扩展到零和领域之外所带来的许多理论挑战和见解。但事实上,这仅发展了冯·诺依曼和摩根斯特恩经典的一半。另一半发展了合作博弈论,但到目前为止这里还没有提及。这种沉默的原因是,对于大多数博弈论学家来说,合作博弈论充其量是一种干扰,最坏的情况是,这种技术通过绕过游戏的方面来混淆博弈论的要点,而游戏的主要方面是使游戏在应用中具有潜在的有趣性和洞察力,即:要求在纳什(1950a)施加的限制下内生地选择均衡。毕竟,这就是均衡自我执行的原因,就像竞争市场中的价格一样,从而使它们保持稳定,除非受到外部冲击。 Nash(1953)认为,合作博弈的解决方案应该始终通过证明它们也是形式上等价的非合作博弈的解决方案来验证。纳什在论文中的成就是对相关等价性的分析识别。解释这一点的一种方法是证明合作博弈论的终极冗余。
合作博弈论始于这样的假设:参与者已经通过某种未指定的过程就策略向量达成一致,从而就结果达成一致。然后,分析师运用该理论来确定协议保持稳定的最小条件。这个想法通常通过议会联盟的例子来说明。假设有一个占主导地位的政党如果要在立法和信任方面获得议会多数票,就必须成为任何联盟的成员。然后可能会有一系列其他政党组成的替代可能团体来维持它。想象一下,为了使这个例子更加结构化和有趣,某些政党不会在包括某些特定其他政党的联盟中任职;因此,联盟组织者面临的问题不仅仅是对潜在选票进行求和的问题。合作博弈理论家确定了一组可能的联盟。除了占主导地位的政党之外,每个可能的联盟中可能还需要一些其他政党。在这个例子中,识别这些参与方将揭示游戏的核心,即所有均衡共享的元素。其核心是合作博弈论的关键解决概念,沙普利因此分享了诺贝尔奖。 (Shapley(1953)是一篇伟大的论文。)Nash(1953)将“纳什计划”定义为通过证明非合作参与者可以通过纳什(1950b)中指定的顺序讨价还价过程来达到特定的合作均衡,从而验证该均衡,并且这种讨价还价的所有结果都将包括核心内容。
鉴于这个例子,毫不奇怪,在非合作博弈论仍在充分发展的时期,政治科学家是合作理论的主要使用者。研究公司和工会之间和解谈判的劳动经济学家以及国际贸易谈判的分析师也有效地应用了它。我们可以通过参考第二个例子来说明这种应用程序的价值。假设,考虑到南非国内游说团体的影响力,南非政府永远不会同意任何不允许其保护其汽车装配行业的贸易协定。 (到目前为止,事实确实如此。)那么,允许这种保护是其他国家或集团可能与南非缔结的任何贸易条约核心的一部分。了解这一点可以帮助各方在谈判期间避免对任何谈判国家的其他游说团体发表言论或作出承诺,否则将导致核心问题遥不可及,从而注定谈判失败。这个例子也有助于我们说明合作博弈论的局限性。南非将不得不牺牲其他一些游说团体的利益来保护其汽车工业。其他人将被交易的将是非合作顺序提案和反提案的广泛形式发挥的函数,而南非讨价还价者,如果他们尽职尽责,必须注意穿过树的哪些路径将哪些特定的国内利益置于众所周知的公共汽车之下。因此,进行合作分析并不能免除他们还进行非合作分析的需要。他们的博弈论顾问也可以简单地将非合作参数编码到他们的 Gambit 软件中,如果需要,该软件将输出核心。
但合作博弈论并没有消亡,也没有仅限于政治科学应用。事实证明,存在一系列政策问题,涉及许多属性各不相同但序数效用函数是对称的参与者,对于这些问题,非合作建模虽然原则上是可能的,但非常繁琐且计算量要求高,但对于这些合作建模却很漂亮适合。我们处理序数效用函数很重要,因为在相关市场中通常没有价格。典型的例子(Gale and Shapley 1962)是婚姻市场。从个人浪漫戏剧和喜剧的规模中抽象出来,社会的特点是,有一大群人想要结成对,但又非常关心他们最终会和谁结成对。假设我们有一组有限的这样的人。想象一下,媒人或应用程序首先将集合分成两个适当的子集,并宣布一条规则,子集 A 中的每个人都会向子集 B 中的某个人求婚。B 中收到求婚的每个人都知道她是A 中某人的第一选择。她从收到的提案中选择她的第一选择,并将其余的扔回池中。 A 中那些最初提案未被接受的人现在每个人都向他们以前没有向过的人求婚,但可能包括持有上一轮提案的人——恩科西知道芭芭拉在第一轮中更喜欢阿玛莉亚,但恩科西并不参与其中的选择集,因此可能会在第 2 轮中取代阿玛利亚)。可以证明,存在一个最终回合,之后不会再提出进一步的建议,并且配对应用程序将找到合作游戏的核心,因为集合 B 中的任何人 i 都不会更愿意与集合 A 中的某人配对,而集合 A 中的某人更喜欢我而不是任何人拿着那条A-set Dreamboat的求婚。 B 组中的每个人现在都会接受他们所持有的提案,并且,如果这两个组具有相同的基数,并且每个人都宁愿与某人配对而不是与无人配对,那么没有人会单独离开。
这不是一个直接适用的婚恋市场模式,所以卖上面介绍的简单的婚介软件是赚不到钱的。问题是我们不能保证,在这个例子中,恩科西和阿玛利亚不是彼此的命运伴侣,但也不能配对,因为他们都从子集 A 开始。在博弈论教科书中,这个问题通常通过假设来巧妙解决: A 组包含男性,B 组包含女性,每个人都如此热衷于异性恋,以至于他们宁愿与异性配对,也不愿与同性配对。另一方面,如果我们不坚持过于字面地应用它,该模型就会以模型通常的方式提供一些见解。经过研究后,人们会看到设计真正的婚介应用程序的人更好地理解社会事实的逻辑:该应用程序必须记录正在考虑但尚未接受的提案,让持有正在考虑的提案的人留在市场上,并且记住谁曾经拒绝过谁(不要通过公开发布此信息来造成普遍的情感灾难)。真正的应用程序将无法可靠地找到合作游戏的核心,除非市场上的人群很小,受到限制,并且至少在某种程度上通过提供诸如“X-类型的人寻找 Y 类型的人”对于每个人都优先考虑的 X 和 Y 属性。 (是否存在这样的属性,至少作为近似值?)但真正的婚介应用程序似乎运行良好,足以改变大多数年轻人现在在互联网普遍可用的国家寻找伴侣的方式。 Chiappori (2017) 全面回顾了理论上理想化的婚姻市场与现实婚姻市场之间的关系。
合作博弈论之所以重新引起人们的兴趣,是因为遇到了政策问题,与使用直通婚姻市场的原始玩具插图不同,政策问题满足了模型的关键假设。主要例子是匹配大学申请者和大学,以及将需要器官移植的人与捐赠者匹配(参见 Roth 2015)。在这些市场中,划分要匹配的集合并不矛盾。顺序偏好是相关的:大学不会将名额拍卖给最高出价者(或至少一般不会),器官不得出售(或至少不合法)。这些模型得到了真正的应用,并且明显提高了效率并挽救了生命。
在科学中,对于原始问题的拟合效果不佳的模型很常见,但结果却为技术变革带来的新问题提供了高效的解决方案。互联网为匹配算法的应用创造了一个环境——旅行者和公寓租客、食客和餐馆、学生和导师,以及(遗憾的是)社会疏远的人和宣传和狂热的传播者——这些都可以由理论家随时设计自沙普利最初的创新以来,但以前几乎不可能实施。合作博弈论的这些应用通常与拍卖的非合作博弈论(Klemperer 2004)结合使用,以推动商品和服务的市场设计,如此高效,以至于甚至可以摧毁美国郊区曾经强大的购物中心。为什么酒店比 2007 年之前除最大城市以外的所有城市都更有利可图、更容易入住?答案是动态定价算法(Gershkov 和 Moldovanu 2014)将匹配理论和拍卖理论相结合,让酒店与在线旅行服务聚合商相结合,找到愿意为其理想地点和时间支付高价的客户,然后填补剩余的空间。喜欢讨价还价的人的房间,他们的偏好更加灵活。航空公司也采用类似的技术。因此,博弈论仍然是 20 世纪的发明之一,正在推动 21 世纪的社会革命,萨缪尔森(Samuelson,2016)预测,人们对合作博弈的更深层次数学及其与非合作博弈的关系的兴趣即将激增。
经典博弈论和进化博弈论的一系列进一步应用已经被开发出来,但我们希望现在已经提供了足够的内容来让读者相信这种分析工具的巨大且不断扩展的实用性。那些对更多内容感兴趣的读者应该会发现,她现在已经充分掌握了基础知识,能够阅读大量文献,下面列出了其中的一些亮点。