辛普森的悖论
最后,人们可能对悖论产生的频率感兴趣。 Pavlides和Perlman(2009)的模拟表明,不应频繁发生:AR概率的置信区间是均匀的先前和(目标)杰弗雷斯的间隔[0; 0.03]的子集。 当然,这种诊断的实际值取决于采样假设是否是明智的,以及整个方法是否对实际数据集进行了意义,研究人员可以沿着众多维度将数据分组成群体。
3.辛普森的悖论和因果推断
在哲学文献中,辛普森的悖论由于其对因果关系的因果关系的影响而受到持续的关注,这是对因果关系与升高的概率之间的系统联系。 具体而言,悖论揭示了当一个将人口分配给亚步骤时,不一定保留关于概率的事实。 基于概率的概念,这对因果推断的哲学账户产生了许多重要挑战:
用于确定概率关系是因果的什么时候的适当背景因素是什么?
协会逆转意味着因因果推断是什么?
辛普森的悖论是否威胁到因果关系的客观性?
治疗悖论和回答这些问题的策略基本上促进了概率因果关系理论(Cartwright 1979; Eells 1991)的发展。 在图形因果模型框架中的悖论中更新的悖论(例如,Pearl 1988,2000 [2009]; Spirtes等,2000)提供了不同的答案。我们将依次讨论两个账户。 特别是,我们将解释Simpson的悖论如何通过混淆的概念和因果效应的可识别性分析。
3.1概率因果关系和辛普森的悖论
概率因果关系的早期陈述(例如,Reichenbach 1956; Supptes 1970)试图纯粹就概率和时间事实而纯粹的因果索赔。 在Suppes'(1970)账户中,事件C是E如果(i)c发生在e和(ii)之前才能提高E. [2]的概率的原因 正如我们在第2.1节中所见的那样,并非所有Prima面都是真正的原因。 如果我现在喝了一个强大的金发女郎啤酒,我将在白天幸福,但明天也有头疼。 然而,由于头痛的原因,不幸的是:常见原因 - 啤酒饮用的常见原因解释了相关性。 用于饮用啤酒的变量屏蔽其效果之间的概率关系,这意味着当一个条件上时,效果将不相关。 Suppes的帐户的关键是C和E之间的Prima面部因果关系是一个真正的因果关系IFF在C中没有任何因子f,从E中截取C. [3]
后来的理论主义者(如图案(1979)和EELLS(1991))通过对因果源性背景上下文进行因果索赔来开发这种情况,这由一组变量K指定。考虑由纸签呈现的关联反转示例。 假设吸烟是心脏病(h)的原因,人们可能希望吸烟会提高心脏病的可能性。 然而,这可能不是这种情况。 假设在人口中,吸烟和锻炼(X)之间存在强烈的相关性,并且这种运动将降低心脏病的可能性超过吸烟,提高了其概率。 在这种情况下,吸烟可能降低心脏病的概率,尽管在X或¬x上有条件,S提高了H的概率。
咖啡件解释这种情况如下:原因总是提高其效果的概率,但这可以通过原因与其他变量(这里,x)之间的相关性“隐藏”。 为了隔离C和E之间的真正概率关系,需要在不发生这种相关性的情况下考虑它:
概率的因果(纸签)Let K表示除C的e和e的所有原因和C的效果。然后C如果相对于K,C中的值变量的所有组合,则C会导致e:P(C | P,K)的概率提高>p(c | -e,k)。
虽然Suppes捍卫了概率因果关系的还原账户,而K的元素在没有吸引因果假设的情况下确定了一个非减少账户,其中K必须包括E的所有和仅导致e,不包括C本身以及任何变量在C和E之间是因果性中间的。目前的共识是,在没有依赖和因果概念的情况下,不可能给出可能对因果关系的概率陈述,因此没有不可续签的账户是可行的(尽管看看Spohn 2012进行异组)。
虽然未经还原账户不能用于解释对没有现有因果知识的人的因果关系,但他们可以澄清如何测试因果关系,并照亮因果关系与概率之间的关系(另见Woodward 2003:20-22)。 此外,Cartwright认为,她在K中包含背景因素的一般标准避免了因果解释的纯粹统计账户的参考课题问题(即,通过指定用于评估因果索赔的相关群体,从而消除了威胁因果解释的客观性。 关于概率因果关系的条目提供了更多细节。
3.2具体辩论:因果互动,平均效果,调解员
Cartwright对因果的概率账户的创新引发了与辛普森的悖论相关的各种辩论。 我们在这里突出三个:
辩论1:因果互动
Cartwright声称导致它们在所有背景上下文中提高它们的效果的概率,[4],但许多声称的原因只会在某些情况下提高其效果的概率。 在后一种情况下,导致与制作其效果的背景因素相互作用。 为了给予个人榜样(1979:428),摄取酸毒通常会导致死亡,除了一个人也摄取碱毒药(在这种情况下彼此取消)。 这种概率账户的这种互动原因的问题是,他们威胁到概率提出原因的效果是“隐藏”的效果,这是一个更强的负面原因,“占主导地位”。 这些隐喻表明,提高原因与其效果之间的概率关系反映了即使在不表现出的变量之间的内在关系,在(纸签1989)中进一步发展的想法。 相互作用意味着原因不在真空中运行,而是仅在存在后台因素(进行进一步讨论时,请参阅OTTE 1985; Eells 1986; Hardcastle 1991)。
然而,辛普森的悖论不应与因果相互作用混淆。 悖论的独特是什么不是概率关系在分区时逆转,而是在所有所得群体中逆转它。
辩论2:平均效果
纸签需要k包括e的所有原因,从而评估相对于均匀背景上下文的效果。 因此,该帐户不允许平均效果。 例如,假设特定的治疗(t)引起过早出生(p)但不是没有的个体的心脏病(h)的概率,而不是没有与t.在整个人口中,t降低或提高的金额H的概率将是P和¬P群体中的效果的平均值,其尺寸加权。 Dupré(1984)争辩说,为了放弃K包括E的所有原因,从而允许平均效果。
从我们的开放示例中抽取的诱人的课程是辛普森的悖论由于对男性和女性的种群进行平均而产生,并且消除它的唯一方法是通过裁定平均效果。 然而,因果异质性并不是其自身导致悖论。[5] 如果因因素与因子1中所示,则异构背景因素的案例仅产生关联反转 - 如第2.2节中的定理1所示。
辩论3:调解员
根据纸盒,SET k不应包括在C和E之间存在因果上中间的变量。这些变量称为调解器。 为了了解为什么,想象一种药物通过产生由血流中的可变Z表示的化学物质,并通过其他因素来降低心脏病的风险。 如果C和E没有常见的原因,它们将在Z.直观上是概率自由的条件,不应将血液化学品固定在评估效果中,因为它是所带来效果的方法。
当原因和效果之间存在多个路径时,问题变得更加复杂。 Hesslow(1976)提供了一种例子,其中服用避孕药通过血液中的化学品促进血栓形成的血液凝血病症,但通过预防妊娠抑制它,这本身就是血栓形成的原因。 因此,出生控制直观地影响血栓形成积极和消极。 如果一个人对C上的C的净效应感兴趣,而不是通过特定路径(Hitchcock 2001)的效果 - 然后一个人不应该在调解员身上致命。 然而,计算特定路径效应所需的调理(例如,Pearl 2001; Weinberger 2019)。
区分常见原因的调解员对于分析辛普森的悖论至关重要。 例如,因果模型C→z→e和c←z→e展示相同的条件独立性:c和e将无条件地相关联,而是在z上独立条件。只有因果知识使我们能够决定如何处理如何处理协会逆转,以及当我们在估计C对E上的因果效果时需要条件(我们在第二种模型中进行,但不是在第一个模型中)。 另见第3.4节。
3.3 DAG和因果标识性
近年来,通过开发代表性假设的图形方法以及在候选假设中选择了一个人的证据,特别是使用指示的非循环图(= DAG:Pearl 1988,2000 [2009]; Spirtes等人。2000)。 DAG包含一组由一组定向边的边缘或箭头连接的节点,使得没有循环(一个不能通过一组定向箭头从节点返回自身)。 在因果上下文中,DAG中的节点是随机变量,并且箭头对应于直接的因果关系。 通常假设DAG中的一组变量是因果关系的,这意味着它包括集合中变量的所有常见原因。
DAG启用一个系统地映射因果假设和联合概率分布之间的关系。 它们与文献中的技术重叠并在概率因果关系上重叠,并提供了显着更强大的工具和结果。 参见因果机型的因果模型,因果关系和原因的反事实理论的条目,详细介绍因果衰落的因果推断。
两图:首先有三个标记,性别,治疗和成功。 性别椭圆形有指向另外两个的箭头,并且治疗椭圆形有一个指向成功的箭头。 第二是除了从性别到治疗的箭头的第一份的副本是点缀,介入的第四个椭圆形,也指向治疗。
图2:变量处理,性别和成功之间的关系,在DAG中代表,没有和治疗干预。
图2(左部)为我们的跑步示例提出了一个合理的表现,包括变量治疗,性别和成功。 有两种方法,处理有关成功的信息。 一个是,由于服用它可能会更加(或更少)的人可能会恢复更多(或更少)。 另一种是,学习有人采取的治疗提供了有关他们是否可能是男性或女性的信息,而且这些信息与确定他们是否会恢复,无论他们是否采取治疗。
然而,图表可以因果上解释,在这里,理想干预的概念至关重要:
对于变量V的干预是理想的,是为了确定v的值,使得它不再取决于其其他原因。 以图形为本,我们可以通过添加额外的原因i表示“破坏”所有将进入V的箭头来表示干预。
因此,在图2中,干预是对治疗的理想干预。 干预治疗扰乱了与性别的证据关系 - 例如,通过控制每个样品中的雄性和女性患者的比例 - 因此只能通过采取治疗来解释治疗和恢复之间的任何剩余概率关系。 这种实验设计,治疗和性别在概率自由地进行,足以排除关联逆转(CF.第2.2节)。
利用理想干预的概念,可以如下阐述原因(Pearl 2000 [2009]; Woodward 2003)。 C如果可以通过对C的一些理想干预改变e的值或概率来引起e。这种干预通过消除可以追溯到影响的C或E之间的任何概率关系来区分因果关系和仅仅是概率的依赖关系常见的原因。 然而,这并不意味着,在可以通过实验干预的情况下,只能获得因果知识。 图形因果模型的关键贡献之一是,它们使一个能够系统地确定当一个人的先前因果知识许可证,以便因因果上解释特定的概率关系。
由调节和干预产生的概率分布之间的差异是通过补充与DO操作者的概率微积分(DO(x))的概率微积分而正式表示,其中操作者将操作员施加到变量正式代表其上。 服用T,S和M表示治疗,成功和性别,并给出图2中的图表,给定T的观察概率分布不等于S对T的干预的概率分布:
p(s|t)≠p(s|do(t))
这两种数量之间的差异是由于M对T的分布的影响,相反,给出了DAG的以下两个表达式:
p(s|t,是)= p(s|do(t),是)
这里可以通过在M的情况下推断T对S来自观测分布的影响。在这种情况下,我们说(4)识别T对S的因果效果。更一般地,可识别性是DAG G,概率分布P和因果量Q之间的关系,例如当Q且仅当它被P给定G唯一确定时是识别的。相反,当存在S和T的常见原因时,概率分布与P的任何可能分布相兼容(S | DO(T))。
3.4混淆和珍珠对悖论的分析
可识别性的概念对于了解混淆,以及通过图形因果模型对辛普森悖论的分析至关重要。 x和y之间的关系相对于可变集z在案例p(y |x,z)≠p(y | dibo(x),z)(即,未识别的关系)中,相对于可变集z混淆。 一个混杂的变量是一个偏置效果测量的变量。 例如,未测量的常见原因是一个混淆,因为它使得它不可能区分由常见原因产生的变量之间的概率依赖性,这是由它们之间的因果关系产生的常见原因。 由于第三种变量混淆,辛普森的悖论在这个帐户中出现。 这种混乱的概念可能因对混淆的共同的口语理解而分歧,作为除治疗之外的观察结果的替代解释。
有用的可识别性条件是后门标准(Pearl 1993,2000 [2009:79])。 首先,我们需要介绍一些图形术语。 x和y之间的路径是X和Y之间的一组连接的边缘,进入任何方向。 Y是X的后代,如果有来自X到Y的路径,其中所有箭头都处于相同方向。 当通过单个路径连接x和y,包括常用原因,例如x←z→y,x和y通常[6]是无条件的概率依赖,但在z的情况下是独立的条件,我们说z阻止x之间的路径相反,当x和y通过包括公共效果的路径连接,例如x→z←y,那么路径将被阻止,条件是一个在z或z的后代不调变。这反映了通常效果的独立原因的事实依赖条件对共同效果。 如果在x和y之间没有解开的“后门路径”:通过常见原因的所有路径都被阻止,并且所有其他路径都是可识别的,并且所有其他路径都是开放的。
在DAG G中给定可变对{x,y}的后门标准(珍珠1993),如果在g中存在满足以下条件的G中存在变量SET Z,则X对Y的效果是可识别的:
z中没有节点是x的后代,
z阻止将包含箭头的x和y之间的每一个路径划分为x。
在这种情况下,通过公式识别x对y的效果
p(y|do(x))=
σ
z
p(y|x,z)p(z)
等式(5)揭示了可以通过对由Z分区的亚群的效果进行平均来获得人口中的因果效应。这是我们在第2.2节中已经看到的协会在一般人口层面无法逆转。 然而,这种推导只能通过关于变量与变量之间的关系的因果假设来许可。 读者可以验证给定图2中的DAG,变量满足后门标准(z = {gender})。[7]
在我的原始示例中,治疗增加了每种亚贫困的恢复的可能性,但不是整体的人口。 应该批准药物吗? 因果方法使得很容易看到为什么应该是。 人口治疗与成功之间的概率关系是证明而不是因果关系。 学习有人拿药提供了关于他们性别的证据,这些信息与预测他们是否会恢复。 但这并没有告诉一个关于药物是否存在因果性。 为了学习这一点,需要知道人口中个人的恢复机会如何改变治疗的干预。 这可以通过对性别调节来确定,这使得一个人能够学习药物的性别特异性效果,并导出整个人口中的平均效果(使用后门标准)。
两图:首先有三个椭圆形,性别,治疗和成功。 性别椭圆形有指向另外两个的箭头,并且治疗椭圆形有一个指向成功的箭头。 第二有三个椭圆标记出生治疗,妊娠和血栓形成。 出生控制椭圆形箭头指向另外两个,怀孕椭圆形呈箭头指向血栓形成椭圆形。
图3:变量治疗的DAG,性别和成功(第三种变量=混淆因子),与变量分娩,妊娠和血栓形成(第三变量=介体)对比。
因此,是否应该基于一个因素分配人口,以识别特定的因果关系,而不是仅取决于统计分布,而是对一个人的因果背景假设是至关重要的。 假设一个人在考虑一个中间变量,例如怀孕在Hesslow(1976)的例子中。 回想一下,在实施例中,通过减少怀孕的机会,通过血液化学品和消极影响血栓形成血栓形成。 这种情况如图3所示,与我们的运行示例形成对比,其中第三变量是混杂因子。 为了识别出生对血栓形成的效果,这是一个关键的是,一个人不在怀孕期间。 如果没有未测量的常见的出生控制和血栓形成的原因,那么整个人口出生对照和血栓形成之间的概率关系将可靠地表明,服用避孕药促进血栓形成。
值得强调的是,没有单独使用统计数据区分图3中的两个因果结构的基础。 左侧模型生成的任何数据也可以由模型生成具有右侧的因果结构的模型。 因此,一个人应该在一个案例中分配人口但不是另一个案例的判断不能仅基于单独的概率,而是需要由因果模型提供的附加信息。
与定理1相干,珍珠证明了萨维奇(1954年)确定原则的因果版本(另见第5.3节):
因果肯定原则(Pearl 2016)增加每个亚居级事件e的概率的动作c还必须增加整体人口中的e的概率,只要该行动不改变亚群的分布。[8]
例如,如果假设性别不是治疗的影响,则不能这种情况表明药物在雄性和女性中提高恢复的可能性,但对一般人群的恢复没有影响。 这结果为什么人们经常找到辛普森的悖论是矛盾的原因的错误理论。 具体而言,珍珠(2000 [2009],2014,2014)声称人们混淆了观察理解,x x提出了与作出x(与¬x)提高Y的概率的y的概率。并且假设分区变量不是x的效果,它做到X是不可能提高所有群体中Y的概率,但不是整体人口。 因此,珍珠对悖论的解释是人们混淆因果和非因果表达,如果实施例中的条件概率被解释出来,辛普森的逆转是不可能的。
3.5含义
珍珠是否为辛普森的悖论提供了正确的因果解释,仍然是一个持续辩论的主题(Armistead 2014参见第4节)。 然而,不应该是有争议的,即最近的因果建模技术使得能够以比以前可以更普遍和更精确的方式来系统地区分因果关系和概率声称。 虽然Cartwright所要求的所有原因都包括在背景上下文中,但是为了消除混淆,只需要保持固定的共同原因(以及阻挡后门路径所需的其他变量)。 概率因果关系的理论是在某种程度上意识到一个人不需要固定固定效果的所有原因,以便消除混淆,但它们缺乏一个总体账户足以识别效果。 辛普森的悖论特别威胁,因为没有办法提供一般条件,在分区中,人口中的表观正面关系将完全消失。 使用珍珠框架,表明只要一个概率表达识别人口中X和Y之间的平均阳性效果,那么它就会逐渐表明,如果概率识别X和Y之间的平均效果,则X X必须在至少一些亚步骤中提高Y的效果(Weinberger 2015)。