莱辛巴赫的共同因果原则(三)
图表:下面的扩展描述链接
图 9:变量集 {U,V,W,X,Y,Z} 上的 DAG。PA(W)={U,V} 是 W 的父集,ND(W)={U,V,X} 是 W 的非后代集。[图 9 的扩展描述在补充中。]
因果马尔可夫条件将图 G 与变量生成的代数上的概率分布 p 联系起来。它表示 p 必须表现出图所暗示的条件概率独立性的特定关系。在 G 为 DAG 的特殊情况下,因果马尔可夫条件的以下三种表述是等价的:
因果马尔可夫条件:筛选版本。
对于 V 中的每个变量 X 和每个变量集 Y⊆ND(X):
p(X|PA(X)∩Y)=p(X|PA(X))
我们采用一种符号约定,其中涉及变量的语句被理解为涉及对这些变量的值(或可测量的值集)的全称量化。因果马尔可夫条件的这个版本表明,变量 X 的父变量将 X 与所有其他变量隔离开来,除了 X 本身和 X 的后代。给定作为 X 父变量的变量的值,Y 中变量的值不会对 X 取任何给定值的概率产生进一步的影响。因果马尔可夫条件的这个版本在形式上最接近莱辛巴赫的共同因果原理,尽管它是根据 X 的父变量而不是 X 和 Y 的共同因果来表述的。
因果马尔可夫条件:因式分解版本。
让 V={X1,X2,…,Xn}。然后:
p(X1∩X2∩⋯∩Xn)=
∏
i
p(Xi|PA(Xi))。
此版本告诉我们,一旦我们知道每个变量的条件概率分布(给定其父变量 p(Xi|PA(Xi)),我们就可以计算所有变量的完整联合分布。这体现了 Reichenbach 的想法,即事件之间的概率相关性最终可以从因果关系导致的概率相关性中得出。
因果马尔可夫条件:d 分离版本。
让 X、Y 和 Z 成为 V 的不相交子集。然后:
如果 Z 在 G 中将 X 和 Y d 分离,则 p(X∩Y|Z)=p(X|Z)×p(Y|Z)
此版本引入了 d 分离的图形概念。从 X 到 Y 的路径是一系列变量 (X=X1,…,Xk=Y),对于每个 Xi, Xi+1,在 G 中要么有一个从 Xi 到 Xi+1 的箭头,要么有一个从 Xi+1 到 Xi 的箭头。例如,在图 9 中,{U,Y,W,V,X} 形成一条路径。变量 Xi, 1<i<k 是路径上的碰撞器,只要存在从 Xi−1 到 Xi 和从 Xi+1 到 Xi 的箭头。换句话说,只要箭头在路径中汇聚在 Xi 上,Xi 就是碰撞器:
Xi−1→Xi←Xi+1。
在图 9 中,Y 是路径 {U,Y,W,V,X} 上的碰撞器。假设 X、Y 和 Z 是 V 的不相交子集。只要从 X 中的变量到 Y 中的变量的每条路径 (X1,…,Xk) 都包含至少一个变量 Xi,并且满足以下任一条件,则 Z 将 X 和 Y d 分离:(i) Xi 是碰撞器,并且 Xi 及其任何后代都不在 Z 中;或者 (ii) Xi 不是碰撞器,并且 Xi 在 Z 中。在图 9 中,{U,V} 将 {Y} 和 {X} d 分离。路径 {Y,W,Z,X} 在 Z 处包含碰撞器,并且从 Y 到 X 的所有其他路径都包括 U 或 V 作为非碰撞器。
因果马尔可夫条件意味着第 2 节中介绍的 RCCP 的广义版本。使用 d 分离版本最容易看到这一点。如果变量 X 和 Y 是相关的,则 {X} 和 {Y} 不会被空集 d 分离。这意味着 X 和 Y 之间至少有一条路径必须没有碰撞器。如果我们进一步假设两个变量都不是另一个变量的原因,那么它们之间就没有有向路径。因此,无碰撞器路径必须包含一个共同的原因:一个变量 Z,它有 X 和 Y 作为后代。此外,所有这些共同原因的集合将 {X} 和 {Y} d 分离。(证明有点繁琐,因为一条路径上的共同原因可能是另一条路径上的碰撞器。)因此,X 和 Y 的共同原因集会将它们彼此隔离开来。
请注意,因果马尔可夫条件告诉我们,某些因果结构会产生条件概率独立关系。因果马尔可夫条件从不涉及概率依赖性。出于因果推理的目的,因果马尔可夫条件通常会补充另一个原则,该原则决定何时会出现概率依赖性。其中一个原则是忠实条件 (Spirtes 等人,2000),它表示仅存在因果马尔可夫条件所包含的概率独立性。从另一个角度来看,忠实条件表示,当我们发现条件概率独立性关系时,我们应该推断出包含该独立关系的因果结构,而不是不包含该独立关系的因果结构。
假设因果马尔可夫条件的一个理由是 Pearl 和 Verma (1991) 提出的一个定理。假设我们有一个变量集 V,DAG G 表示 V 中变量之间的因果关系。此外,假设 V 中每个变量 X 的值是其在 V 中的父变量的确定性函数,以及一个误差变量 UX,它表示 V 中未包含的任何变量的影响。换句话说,X=fX(PA(X),UX)。然后,所有误差变量的值将唯一地确定 V 中所有变量的值,误差变量的概率分布 p∗ 将导致 V 中变量的概率分布 p。如果误差变量在 p∗ 中是独立的,则诱导的概率分布 p 将满足关于 G 的因果马尔可夫条件。这个想法是,如果我们在 V 中包含足够多的变量,使得任何剩余的因果影响在概率上彼此独立,那么 V 上的概率分布将满足因果马尔可夫条件。
如果 V 中没有省略变量 W,则变量集 V 是因果充分的,这样如果将其添加到 V,它将成为 V 中两个变量的直接原因。在图 9 中,{U,W,Y} 是因果充分的(假设原始 DAG 是),但 {U,W,Y,Z} 不是,因为 W 和 Z 有一个共同的原因 V,而这个原因 V 被排除在这个集合之外。
通常假设,如果一个变量集具有因果充分性,则误差变量将是概率独立的,并且 V 上的概率分布将满足关于真实因果图的因果马尔可夫条件。请注意,此假设与共同因果原则本身非常相似。如果 X 和 Y 是因果充分 DAG 中包含的变量,而 UX 和 UY 是它们对应的误差变量,则 UX 和 UY 都不是对方的原因,并且它们没有共同的原因。如果它们有共同的原因,这将是 X 和 Y 的共同原因;如果 UX 是 UY 的原因,那么 UX 就是 X 和 Y 的共同原因。因此,变量集的因果充分性意味着 UX 和 UY 是因果无关的。因此,共同因果原则将意味着它们在概率上是独立的。因此,说因果马尔可夫条件可用于证明共同因果原则是不准确的:两者都涉及关于因果关系和概率之间关系的类似假设。
检查因果马尔可夫条件的 d 分离版本,我们发现不是共同原因而是碰撞因素导致了不同的概率关系。假设我们有一个包含三个变量 {X,Y,Z} 的变量集,并且概率分布 p 满足因果马尔可夫条件,相对于真正的因果图。最后,假设 X 和 Z 是相关的,但被 Y 屏蔽。那么有三个不同的因果图,它们都意味着这组概率独立关系:
X →Y→Z
X ←Y←Z
X ←Y→Z
当然,最后一个是 Reichenbach 所描述的共同因果结构。 (然而,赖兴巴赫还假设中间原因会将远端原因与结果隔离开来,如前两张图所示。)另一方面,假设概率(不)依赖关系正好相反。即:X 和 Z 概率上独立,但依赖于 Y。在这种情况下,只有一个因果结构意味着这组概率独立关系:
X→Y←Z
事实上,从条件概率依赖和独立关系推断因果结构的算法,例如 Spirtes 等人 (2000) 的 PC 算法,是通过搜索这种类型的概率特征来进行的。因此,Reichenbach 错误地将合取分叉视为定义因果关系的方向(见上文第 6 节)。他最好将目光投向对撞机。
8. 与评估 RCCP 状态相关的常见原因技术结果
经典概率测度空间是三元组 (X,S,p),其中 X 是基本随机事件的集合,S 是 X 的一些子集的布尔代数,p 是从 S 到单位区间 [0,1] 的加性概率测度。如果在 S 中元素 A、B 的每个相关对 (A,B) 在 S 中都存在一个共同原因 C,则概率测度空间 (X,S,p) 被称为共同原因完全空间,否则共同原因不完全空间。可以证明,共同原因 (不) 完全空间可以用概率测度空间的测度论 (非) 原子性来表征:当且仅当 (X,S,p) 包含最多一个测度论原子时, (X,S,p) 才是共同原因完全空间 (Gyenis & Rédei 2011)。测度论原子是 S 中的元素 A0,满足 p(A0)≠0,并且如果 B⊂A0,则 p(B)=0。尤其是测度理论纯非原子概率测度空间(即不包含任何测度理论原子的概率空间)是共同原因完全的(Gyenis & Rédei 2011;Hofer-Szabó 等 2013;Marczyk & Wroński 2015)。测度理论纯非原子概率测度空间的一个例子是单位区间 [0,1],其在 [0,1] 的勒贝格可测子集上具有均匀概率(勒贝格测度);一类例子是实线(勒贝格可测子集)上的概率测度,其中概率由实线上勒贝格测度的密度函数给出。
如果共同原因不完全概率空间 (X,S,p) 可以嵌入到更大的共同原因完全概率空间 (X′,S′,p′) 中,则称其为共同原因完全的。 (X,S,p) 嵌入 (X′,S′,p′) 是一个从 S 到 S′ 的注入布尔代数同态 h,使得对于 S 中的所有 A,p′(h(A))=p(A)。可以证明每个概率空间 (X,S,p) 都可以嵌入到纯非原子概率空间中。这意味着每个共同原因不完全概率空间都是共同原因可完成的 (Gyenis & Rédei 2011;Hofer-Szabó 等人 2013;Marczyk & Wroński 2015)。
在量子理论中,人们使用非经典(量子)概率空间来描述量子物理系统。一般量子概率空间是一对 (P(N),ϕ),其中 P(N) 是非交换冯·诺依曼代数 N 的正交补正交模投影格,而 ϕ 是 P(N) 上的可数加性概率测度,它是 N 上正常状态对 P(N) 的限制。Rédei & Summers (2007a) 用冯·诺依曼代数简要描述了非交换概率论;Landsman (2017) 包含与量子理论相关的代数结构的百科全书式处理;SEP 条目量子理论和数学严谨性对冯·诺依曼代数的一些基本事实进行了非常简短的非正式介绍,包括它们的 Murray-von Neumann 分类,这与共同因果原理的角度来看是相关的——见下文)。量子概率空间的一个特殊例子是,将希尔伯特空间 H(可能是无限维)上所有有界算子的集合 B(H) 视为冯·诺依曼代数,并将 ϕ 视为由密度矩阵给出的量子态。由此产生的特定量子概率空间 (P(B(H)),ϕ) 被称为量子力学的“希尔伯特空间形式”;该空间描述了有限自由度的量子系统。正交模格 P(B(H)),通常表示为 P(H),是 H 上所有投影的集合,该格也称为“希尔伯特格”。
P(N) 中交换投影 A、B 之间的相关性概念以及此类相关性的共同原因概念(例如,投影 C 与 A 和 B 交换并满足四个莱辛巴赫条件 (2)-(5) 的(类似物))在量子概率空间中非常有意义。共同原因(不)完备性、共同原因完备性(具有适当定义的正交模格嵌入)、测度理论原子和测度理论非原子性等概念也是如此。
可以证明,这种量子概率空间的共同原因完备性可以用 (P(N),ϕ) 的测度理论原子性来表征,与经典情况完全类似:如果 (P(N),ϕ) 最多包含一个测度理论原子,则它是共同原因完备的(Kitajima 2008;Gyenis & Rédei 2014;Kitajima & Rédei 2015)。这意味着测度理论上纯非原子的量子概率空间是共同原因完备的。具体而言,具有 III 型或 II 型冯·诺依曼代数 N 的量子概率空间 (P(N),ϕ) 是共同原因完备的,因为由这些类型的冯·诺依曼代数定义的量子概率空间是纯测度理论上非原子的。量子概率空间 (P(H),ϕ) 并非纯粹的非原子空间,它包含大量测度论原子:所有秩一投影(等价地:H 中由向量构成的一维线性空间)都是希尔伯特格子 P(H) 的原子,因此所有由状态 ϕ 分配非零概率的秩一投影也是 (P(N),ϕ) 中的测度论原子。因此 (P(H),ϕ) 不是共同原因完全的。共同原因不完全量子概率空间是否是共同原因完全的尚不清楚;结果仅适用于量子概率空间的共同原因可扩展性:每个量子概率空间 (P(N),ϕ) 都可以嵌入到更大的量子概率空间 (P(N′),ϕ′) 中,这样 (P(N),ϕ) 中的每个相关性在 (P(N′),ϕ′) 中都有一个共同原因 (Hofer-Szabó、Rédei 和 Szabó 1999;2013:62,命题 6.3)。
(经典和量子) 概率空间的共同原因完备性和共同原因可扩展性的哲学意义在于,它们表明,原则上总是有可能解释任何相关性,因此也可以解释因果独立事件之间的任何相关性,用 (可能隐藏的) 共同原因来解释——隐藏的意思是共同原因不必在包含相关性的概率空间中:共同原因可以“隐藏”在更大的概率空间中。因此,这些共同原因可完备性和共同原因可扩展性结果限制了试图证伪共同原因原理的可能方式:任何证伪尝试都应在四个定义条件 (2)-(5) 之外对共同原因施加一些进一步的条件,否则可以通过引用隐藏的共同原因来避免证伪。表述方式不同:共同原因原理,无论是在经典概率论中还是在量子概率论中,都是完全根据赖兴巴赫共同原因的概念来表述的,是不可证伪的。这并不意味着共同原因可扩展性结果可以被视为共同原因原理是正确的证据:即使是较弱的问题,即共同原因可扩展性结果是否可以作为共同原因原理的确凿证据,也取决于扩展概率测度空间(其存在由数学共同原因可扩展性结果保证)是否是(一部分)经验证实的科学理论。
共同因果完全空间的意义在于它们非常符合共同因果原则:共同因果原则的一个等效表述是,描述世界的概率论在以下意义上是因果封闭的:如果 A 和 B 是相关且因果独立的,用符号表示为 Rind(A,B),则相关性必须有一个共同的原因来解释这种相关性。共同因果完全空间在极强的意义上是因果封闭的,因为因果独立关系 Rind(A,B) 可以被认为是最强的,包含所有相关事件。因此,如果描述现实某些方面的科学理论使用理论上纯粹非原子的概率空间来衡量,那么这种理论可以被视为支持共同因果原则的证据,因为该理论包含所有相关性的共同原因,包括理论可能认为因果不相关(独立)的事件之间的相关性。鉴于对共同原因完整性、共同原因可完成性和共同原因可扩展性的解释,我们已充分证实的科学理论是否具有因果封闭性或共同原因可扩展性是一个相关问题。量子场论和标准非相对论量子力学是两个理论,它们已对这一问题进行了广泛的分析。
9. 量子场论和共同原因原理
相对论量子场论(参见量子场论条目)预测了位于空间分离(因此因果独立)时空区域中的可观测量之间存在大量相关性。这是量子场论中纠缠普遍存在和违反贝尔不等式的结果,这比标准非相对论量子力学违反贝尔不等式更为引人注目(Summers 1997;Clifton & Halvorson 2001;Halvorson & Clifton 2000;贝尔定理条目)。如果相对论量子场论在提供这些相关性的共同原因的意义上是因果封闭的,那么该理论就是共同因果原理真实性的确凿证据。
描述相对论量子场论的量子概率空间基于 III 型冯·诺依曼代数(Haag 1992;Horuzhy 1986 [1990];Araki 1993 [1999];量子场论条目);因此,这些量子概率空间在理论上是纯非原子的。从这种量子概率空间的共同原因完整性可以得出,存在着类空间分离可观测量之间关联的共同原因。然而,人们不能由此得出结论说量子场论满足共同原因原理,原因如下:量子场论中的可观测量明确与特定的时空区域相关。因此,共同原因也应该被要求属于特定的时空区域。给定位于时空区域 V1 中的可观测量 A 与位于与 V1 类空间分离的时空区域 V2 中的可观测量 B 之间的关联,这种关联的共同原因应该位于区域 V 中,该区域位于类空间分离时空区域 V1 和 V2。但是,量子场论的量子概率空间的纯粹非原子性并不意味着描述量子场的量子概率空间的非原子性所导致的共同原因的任何局部性。当人们将这种额外的局部性约束强加到量子场论中的共同原因上时,根据该理论,这种适当局部化的共同原因是否存在,这个问题就变成了一个非常不平凡的问题(Rédei 1997)。这个问题如此不平凡,以至于答案仍然未知——量子场论的因果完备性状态问题是一个悬而未决的问题。
然而,众所周知,量子场论在较弱的意义上是因果完备的,即包含共同原因,这些共同原因位于包含相关可观测量的类空间分离时空区域 V1 和 V2 的后向光锥的并集(而不是交集)中(Rédei & Summers 2002, 2007b;Hofer-Szabó 等人 2013)。从逻辑上讲,共同原因原理在相对论量子场论中的地位也可能无法确定:已证明类空间分离可观测量之间存在大量相关性的量子场论由公理定义(Haag-Kastler 公理化)。这些公理可能太弱,无法回答类空间分离可观测量之间的所有相关性是否都具有正确局部化的共同原因的问题。证明这样的独立性结果将非常有趣。鉴于创建 Haag-Kastler 公理的任何模型都非常困难,尝试这样的证明似乎也极其困难,因为它需要展示两个模型,一个模型中共同因果原理成立(具有适当局部化的共同原因),另一个模型中不成立。
还可以考虑离散(晶格)量子场论中共同因果原理的地位问题。这是量子场论的简化模型,其中计算通常更容易进行。该理论的简化之一是局部可观测量的代数是有限维的。由此类可观测量确定的量子概率空间并非纯粹的非原子,这阻止了这些理论中存在共同原因(无论是否局部化)(Hofer-Szabó & Vecsernyés 2012a)。如果在量子背景下,人们允许共同原因与相关可观测量不交换,那么就可以证明“非交换”共同原因存在于格点量子场论中(Hofer-Szabó & Vecsernyés 2012b、2013、2018)。人们还可以提出共同原因原则在范畴量子场论中的地位问题(Brunetti、Fredenhagen 和 Verch 2003;Rédei 2014a)。这需要根据范畴量子场论中使用的范畴概念重新表述共同原因的概念,这在 Rédei (2014a) 中已经完成。这引出了关于适当重新表述的共同原因原则地位的许多具体问题。大多数这些问题都是开放的——这是一个活跃的研究领域。