游戏理论（八）_数学联邦政治世界观()

在现代社会，狩猎是边缘活动，最有权势的人并不是那些最擅长投掷长矛的人。在很长一段时间里，大多数文化脉络都是如此，因此文化进化有足够的空间来消除传统的权力不平衡根源。乍一看，这使得顽固存在的性别不平等令人费解。它常常引发人们对男性可能天生的性格的猜测，认为男性可能天生就更有效，或者至少更无情，成为高管和总裁。或者，有时有人认为，权力不对称的最终根源可能是家庭中身体暴力威胁的不对称。（这当然是真实存在的，也是许多家庭伴侣关系中男性暴政的真正基础。但问题在于它是否足以解释普遍存在的模式。）博弈论学家 Cailin O'Connor (2019) 最近的工作提出了一种更深入、更深入的研究。更有力的解释。它在科学上更强大，部分原因是它比刚才提到的简化故事更符合一系列证据，而且还因为它解释了一般现象的更具体的副作用。特别是，它解释了文化中习得的性别特征的稳定性，这些特征有助于人们表达对与其生物性别相关的角色的认识和接受。当然，这种文化密码，因为它可以被战略性地操纵，也允许一些人发出拒绝这些角色的信号，并与其他寻求改革平衡的女性、男性或非二元人协调这种拒绝。

奥康纳的博弈论分析分为两部分。首先，她使用进化博弈论（下面第 7 节的主题）来展示角色有效性中功能上相对较小的不对称性如何能够促进对群体差异标记的极其有力的使用，从而巩固不平等的结果。正如我们在本节前面所看到的，在缺乏相关信号的情况下，为角色专业化选择平衡在逻辑上是困难的。一个社会往往会抓住任何频繁且可靠的信号，并且遵循基于这些信号的均衡策略符合每个游戏者在游戏之间的边际自身利益，即使，如在 PD 中，许多甚至所有游戏者如果整组智能体能够转向另一种均衡，情况可能会更好。然后，正如我们也讨论过的那样，所讨论的信号往往会在文化上演变成规范的基础，因此，正如我们所讨论的现象一样，“像男人一样走路”或“像男人一样说话”或表现出兴趣的女性“男性”活动或性伴侣会受到制裁，包括许多其他女性。因此，性产生了性别。（请注意，如果女性的领导能力确实不如男性，那么，考虑到领导力通常是通过职能环境中的竞争获得的，目前还不清楚为什么性别差异化的角色首先需要通过规范的性别来维持。）结果，奥康纳对博弈论的首次应用表明，女性被分配了与男性不同的社会角色，这导致了不平等，仅仅是因为“性别”是一种群体分配，我们通常（并不总是）在出生时就可以确定一个人，在我们开始让他们社交之前。（读者会注意到，基于相关均衡的类似逻辑也适用于种族的规范性构造，它根本没有预期功能能力的基础。这部分解释了为什么对“种族”一目了然的人的歧视，例如作为美国的黑人，比同一国家早期针对爱尔兰人的种族主义歧视更难克服。）

作为均衡选择效应而产生的性别不平等可能（而且应该）受到道德理由的批评，但至少我们可以认识到它的产生是由于（部分）补偿效率。与此标准相比，奥康纳分析的第二部分表明不存在这样的权衡。

在博弈论发展之初，纳什（Nash，1950b）模拟了两个代理人就他们可以共同获得的剩余分配进行讨价还价的一般情况。显然，这对经济学家来说是一个核心现象，就像他们的工作要考虑的其他任何事情一样，无论是在简单的物物交换社会中还是在资本主义社会中都同样重要。所谓“纳什讨价还价方案”的核心是，此类谈判的均衡取决于双方未能达成协议时后备立场的相对价值。如果你知道，如果我们不能达成协议，当我的船到达港口时，我将没有地方放我的家具，你可以让我为你的房子支付更多的钱。正如 Ken Binmore (1994, 1998, 2005a) 深入讨论的那样，讨价还价环境中的优势后备是社会中权力差异的基本根源。此外，正如宾莫尔还指出的那样，一个社会的具体规范往往会演变以适应这些不对称性，因为对讨价还价“公平”的期望不一致是每个社区冲突和投资失败的最常见原因。奥康纳将博弈论的这一要素应用于性别不平等。

她从分析第一部分结束的地方开始：规范根深蒂固的性别角色作为均衡选择装置而演变，但却产生了不平等。请注意，这是社会宏观结构的一个特征，也是进化博弈论的应用领域。然后，她从纳什讨价还价理论的角度研究了统计上典型家庭的微观动态（并使用战略网络理论的工具，如第 5 节所述）。来自富裕国家的证据表明，在男性和女性教育水平和收入趋同的家庭子集中，女性平均仍然承担不成比例的家庭维护工作，而且她们的休闲时间也有所减少。纳什讨价还价理论可以解释其中的原因。假设我们将婚姻中一般谈判破裂的含义解释为离婚。如果男性比女性在户外花费更多的时间和精力，他们就会建立更大的社交网络资产流量和存量，从而降低单身生活效率低下的成本，并且更有可能提高他们的赚钱能力。因此，在涉及家庭责任划分的讨价还价时，他们享有更强有力的后备地位。因此，随着时间的推移，不平等的均衡会自我放大，随着男性的网络逐渐加深，并在双方的职业生涯中变得相对更有价值。为了接受该模型的相关性，我们不需要想象丈夫和妻子会为了明确的时间份额而争论不休，并以对家庭收入的预期边际贡献的计算作为论据。我们只需想象一下，妇女们一再提前离开办公室去接孩子或接到家庭服务电话，因为她们的丈夫一直忙于开会或出差，而直接的风险更大。与奥康纳分析第一部分中的游戏不同，这种动态不平等并没有实现社会效率，因为没有理由认为女性本质上可能比受过类似教育的男性拥有更少的经济生产力。随着女性教育程度的提高，女性休闲时间的减少可能会加剧，因为更高要求的职业活动被堆积在固定水平的家庭责任之上。（家庭财富达到一定水平后，我们可能会预期这种效应会逆转，因为女性可以雇用家庭服务。但这仅适用于收入分配中的一小部分。）奥康纳模型的这一部分有直接影响政策影响。改善女性获得有价值的证书并鼓励公司增加女性在高管层的代表性的努力可能会对性别之间的福利平等产生轻微甚至负面影响。社会可能还需要投入更多的资源来补贴家庭外的儿童保育服务，以及为年迈父母提供生活援助，作为提高妇女在家庭内部讨价还价能力的措施。

奥康纳分析的第一部分对政策也有重要影响。正如她所强调的，如果可微群体之间的不平等是通过协调博弈中的均衡动态自然产生的，那么我们就不应该期望能够找到一劳永逸地消除它们的政策。奥康纳总结道，控制不平等需要平等主义者坚持不懈地采取政治努力。

一般来说，协调动力学构成了大多数人类社会模式的分析核心。这里考虑的例子仅仅是对此类现象的无限排列的说明，如果没有经验指导的博弈论模型的构建和应用，就无法完全理解这些现象。

5. 团队推理和条件游戏

在刘易斯（Lewis，1969）将协调博弈引入哲学文献之后，哲学家玛格丽特·吉尔伯特（Margaret Gilbert，1989）反对刘易斯，认为博弈论是一种错误的用于思考人类惯例的分析技术，因为除其他问题外，它是过于“个人主义”，而习俗本质上是社会现象。更直接地说，她的主张是，惯例不仅仅是许多个人决策的产物，正如一位理论家所暗示的那样，他将惯例建模为 n 人游戏的均衡，其中每个玩家都是一个人。另一位哲学家马丁·霍利斯（Martin Hollis，1998）、经济学家罗伯特·萨格登（Robert Sugden，1993、2000、2003）和迈克尔·巴卡拉赫（Michael Bacharach，2006）也表达了对博弈论所谓个人主义基础的类似担忧。特别是，它促使巴哈拉赫提出了团队推理理论，该理论在巴哈拉赫去世后由萨格登和娜塔莉·戈尔德共同完成。在本节中，我们将回顾团队推理的想法，以及将博弈论应用于社会学主题的另一种方法，即条件博弈理论（Stirling (2012)；Ross and Stirling 2021）。

再次考虑第 2.4 节中讨论的一次性囚徒困境，并使用倒矩阵以便于后续讨论，如下所示：

二、

宣传册

I C 2,2 0,3

D 3,0 1,1

（C 表示与对手合作的策略（即拒绝认罪），D 表示在与对手的交易中背叛的策略（即认罪）。）当博弈论学家告诉他们，玩家被指定为敬语“理性”的人必须在这场游戏中以产生结果（D，D）的方式进行选择。这种解释似乎需要诉诸非常强烈的描述性和规范性个人主义形式。毕竟，如果玩家对社会福利（对于他们的两人盗贼社会）给予更高的重视，而不是个人福利，那么他们个人也可以做得更好；有人反对说，顽固的个人主义会产生从个人优化的角度来看是反常的行为，因此显得不连贯。有人可能会说，玩家损害了自己的福利，因为他们顽固地拒绝关注他们选择的社会背景。 Sugden (1993) 似乎是第一个提出，即使是一次性 PD 中的非利他主义参与者也可能共同看到他们可以作为一个团队进行推理，即通过询问“什么是最好的”来得出他们的策略选择对我们来说？”而不是“什么对我来说是最好的？”

Binmore (1994) 有力地指出，这种批评将作为数学的博弈论与关于哪种博弈论模型最典型地适用于人们所处的情况的问题混淆了。如果玩家重视团队的效用，而不是更狭隘的个人利益，那么这应该体现在与他们选择的博弈论模型相关的回报中。在上面模拟为 PD 的情况下，如果两个玩家对“团队”的关注足够强烈，导致策略从 D 切换到 C，那么（主要解释的）左上单元格中的收益必须是提高到至少 3。（在 3 时，玩家对合作和叛逃无关紧要。）然后我们得到游戏的以下转换：

二、

宣传册

I C 4,4 0,3

D 3,0 1,1

这不再是PD；而是PD。它是一个保证博弈，有两个NE，分别为(C,C)和(D,D)，前者帕累托优于后者。因此，如果玩家找到了这种平衡，我们不应该说他们在PD中使用了非NE策略。相反，我们应该说，PD 对他们的情况的描述是错误的。

个人主义的批评家可以承认Binmore的逻辑观点，但要说改变游戏是人们在人们发现自己处于经济机构的相关解释是个人主义的情况下，就可以尝试做的，这是人们应该尝试做的。这正是巴卡拉赫的理论建议。与Hollis and Sugden（1993）不同，他的科学执行者Sugden and Gold，Bacharach（2006），第171-173页），使用了“回报解释”的标准惯例，只能根据该公约，只能在其中以一名 - 在一名合作中进行建模 - 如果至少一个玩家犯了错误，则射击PD。在这个假设下，Bacharach，Sugden和Gold辩称，人类游戏玩家经常或通常避免以一种单一PD是其环境的正确型号的方式进行构图。 “个人主义”代理商将以“团队推理”代理作为上述保证游戏转换而构成的“个人主义”代理商可能会构成“个人主义”代理商的情况。请注意，团队的福利可能会改变（红衣主教）的回报，而没有足够的影响来胜过单方面叛逃的诱惑。假设每个球员的最高可达2.5；然后，游戏将是PD。这一点很重要，因为在实验中，受试者播放一声PDS的序列（不是重复的PD，因为实验中的对手从一轮变化到一轮），大多数受试者开始合作，但随着实验的进行，学会了缺陷。根据巴卡拉赫（Bacharach）对这一现象的说法，这些主题最初是将游戏作为团队推理的框架。但是，少数受试者将其作为个人主义推理者和缺陷，以获取自由骑手的利润。然后，团队推理者重新构图以捍卫自己。这介绍了Bacharach帐户的关键方面。个人主义的推理者和团队推理者不被认为是不同类型的人。巴哈拉赫坚持认为，人们倾向于在个人主义机构和参与团队代理之间来回翻转。

现在考虑以下纯协调游戏：

二、

宣传册

我C 1,1 0,0

D 0,0 1,1

我们可以将其解释为代表一个球员是个人主义的情况，因此在（u，l）和（d，r）的两个NE之间或是团队推理者之间的情况，但没有认识到他们的团队更好如果他们稳定在一个NE而不是另一个稳定。如果他们确实得到了这种认可，也许是通过找到一个焦点，那么纯协调游戏就会转变为以下游戏，称为Hi-Lo：

二、

T1 T2

我S1 10,10 0,0

S2 0,0 1,1

至关重要的是，这里的转型不仅需要团队推理。玩家还需要焦点来知道两个纯协调平衡中的哪一个为社会稳定提供了较小的风险前景（Binmore 2008）。实际上，出于特殊原因，巴卡拉赫（Bacharach）和他的执行者对纯协调游戏和Hi-Lo游戏之间的关系感兴趣。它似乎并不意味着对NE作为解决方案概念的任何批评，它在纯粹的协调游戏中并不比另一个战略向量相比。但是，NE也不喜欢（u，l）在HI-LO游戏中的（d，r）的选择，因为（d，r）也是NE。在这一点上，巴卡拉赫和他的朋友们采用了改进计划的哲学推理。当然，他们抱怨“理性”建议（u，l）。因此，他们得出结论，应将团队推理的公理置于游戏理论的精致基础中。

我们不必认可这样的想法，即应该完善游戏理论解决方案概念，以适应理性的直觉一般概念，以激发人们对巴卡拉赫的贡献的兴趣。非心理游戏理论家可以提出重点的微妙转变：我们不必担心我们的模型是否应该尊重以团队为中心的理性规范，而是简单地指出，人们，也许是其他人，也许是其他代理人，似乎经常会使揭示偏好的选择是基于与之相关的群体的福利。在此范围内，他们的代理机构部分或全部（也许是随机）通过这些群体确定的，当我们使用公用事业功能对其代理进行建模时，这将需要反映。然后，我们可以更好地描述我们想要的理论是以团队为中心的选择理论，而不是作为团队推理的理论。请注意，这种哲学解释与我们的某些证据，甚至我们最好的证据，甚至是以团队为中心的选择是心理的，这是一致的。这也与以下建议相一致：在个性化机构和以团队为中心的机构之间将人们翻转的过程通常不经过审议或有意识地代表。关键是，我们不必在将游戏理论视为推理或合理性的模型中，以说服他已经确定了我们希望拥有正式资源来填补的差距。

那么，人们的选择似乎揭示了以团队为中心的偏好？包括Bacharach自己的标准示例来自团队运动。这些团队的成员正处于巨大的社会压力下，以选择最大程度地提高胜利的行动的行动，以增加其个人统计数据。这些示例的问题在于，它们在效用函数的估计方面嵌入了困难的识别问题。想要在球迷中受欢迎的自私球员可能对以团队为中心的球员行为相同。战斗条件下的士兵提供了更具说服力的例子。尽管试图说服士兵以其国家的利益而牺牲自己的生命通常是无效的，但大多数士兵可能会造成极大的风险来捍卫伙伴，或者当敌人直接威胁其家乡和家人时。很容易想到大多数人在某些情况下或大部分时间都可以识别的其他团队：项目团体，小公司，政治选区委员会，地方劳动工会，氏族和家庭。强烈的个人主义社会理论试图在个人人群中构建像游戏中的平衡团队，但游戏理论中没有任何假设（或者就此而言，主流经济理论）强迫这种观点（请参阅Guala（2016），以了解期权的批判性评论）我们可以假设，通过复杂的相互关联的心理和制度过程，团队通常会外源性地焊接到该团队。以团队动态的存在为条件。

Stirling（2012）正式将这种条件交互作用用于特殊应用程序上下文：具有分布式控制体系结构的AI系统。这样的系统通过将问题的各个方面转化为专门的子系统来实现处理效率。除非子系统运行自己的效用功能，否则所讨论的效率是无法实现的。否则，该系统实际上只是一台具有执行控制瓶颈的标准计算机，该计算机调用子仪。但是，如果子系系统是不同的经济因素，则在整个系统的水平上会出现不一致的风险。可能的是，它的行为就像一个典型的民主政治共同体，追求矛盾的政策或陷入僵局和瘫痪中。这种系统的工程师将包括在她的设计规范中避免此类问题。是否有一种方法可以使设计可以在子代理之间实现真正的分布式控制的优势，同时也确保在整个系统级别上保持一致性？这是Stirling解决的问题。如果我们构成斯特林的挑战如下：我们希望子代理商与一个人互动，那就是玩游戏，但我们只想允许将作为团队的产物允许解决方案，但与巴卡拉赫的构想相似：我们希望子代理商与另一个人进行互动，但我们只想允许解决方案推理。

斯特灵的两项基本创新之一是让玩家在彼此的动作概况上，而不是基于结果。这样做的动机是，尽管子代理商是作为个人选择的，但他们不能同时知道将在团队级别上分配什么公用事业。（如果他们这样做了，我们将再次承担使问题有趣的原因，而子代理将只是子仪。）在这里，斯特林考虑了人类社会心理学的类比，这将是概念上的概念的胚芽当我们将应用程序上下文从AI设计转移到社会科学时，创新。

（本章完）

游戏理论（八）

相关推荐

灵感故事短篇合集

穿越斗1我要开挂

穿书之女配她只想苟活

快穿之谁是我的心上人

异世界也是本尊的

斗龙战士之爆裂飞车美乐帝