遍历层次结构(四)
系统的属性可以与相空间的不同部分相关联。例如,在球的例子中,具有正动量的属性与相空间的右半部分相关;也就是说,它与集合{x∈X∣p>0}相关联。概括这个想法,我们说系统相空间的每个子集 A 都对应一个属性 PA,因此系统在时间 t 时拥有该属性,当且仅当系统状态 x 在 t 时处于 A 中。子集A可以是任意的,并且与A对应的属性可能不直观,这与例如具有正动量的属性不同。但接下来的分析中没有任何内容取决于属性是否“直观”。然后我们将事件 At 定义为在时间 t 获得 PA。
在每一个时刻 t 都存在 PA 是否获得的问题,这是由系统的动力学决定的。然而,我们可能不知道情况是否如此。因此,我们引入认知概率来表达我们对 PA 是否获得的不确定性:p(At) 反映了代理人对 PA 在时间 t 获得的信念程度。以同样的方式,我们可以引入条件概率:p(At∣Bt1) 是我们对系统在 t 处具有 PA 的置信度,因为它在较早的时间 t1 具有 PB,其中 B 也是系统相空间的子集根据条件概率的通常规则,我们有 p(At∣Bt1)=p(At&Bt1)/(p(Bt1)。这当然可以推广到多个事件: p(At∣B
t1
1
&...&B
t
r
) 是我们对系统在 t 处具有 PA 的置信度,因为它在 t1 处具有 PB1,在 t2 处具有 PB2,...,在 tr 处具有 PBr,其中 B1,...,Br 是系统相空间的子集(r 是自然数) ),t1,…,tr 是连续的时间点(即 t>t1>…>tr)。
直观地说,如果考虑过去的事件对我们的预测产生影响,或者更具体地说,如果它降低或提高了未来事件的概率,那么过去的事件与我们的预测相关。换句话说,p(At∣B
t1
1
)−p(At) 是 Bt1 与预测 At 的相关性的度量:如果 p(At∣B
t1
1
)−p(At)>0,负相关如果 p(At∣B
t1
1
)−p(At)<0,并且如果 p(At∣B
t1
1
)−p(At)=0。出于技术原因,事实证明使用稍微不同但等效的相关性概念更容易,该概念是通过将方程两边乘以 p(Bt1) 从上面获得的。因此我们采用以下定义。 Bt1 与 At 的相关性为
R(Bt1,At)=p(At&Bt1)−p(At)p(Bt1)。
将该定义推广到具有多个 B 集(如上所述)的情况非常简单。
相关性有助于解释不可预测性。直观上,过去的事件与 At 的相关性越低,系统的可预测性就越低。然后可以通过各种方式完善这个基本思想。首先,我们获得的不可预测性的类型取决于应用 (R) 的事件类型。例如,如果 At 的概率不仅独立于 Bt1 或其他“孤立”的过去事件,而且独立于整个过去,那么 At 的不可预测性程度就会增加。其次,如果事件 At 与过去事件 Bt1 的概率依赖性随着事件之间的时间距离的增加而迅速减小,则该事件 At 的不可预测性会增加。第三,At的概率可能更简单地独立于过去的事件,或者它可能仅在平均上独立于这些事件。这些想法构成了将 EH 分析为不可预测性的层次结构的基础。
在我们提供这样的分析之前,还需要两个步骤。首先,如果概率有助于理解动态系统中的随机性,则概率分配必须反映系统的属性。所以我们必须将上述概率与系统的特征联系起来。自然的选择是系统的测度 μ。[21]因此,我们假设事件 At 的概率等于所有 t 的集合 A 的测度:p(At)=μ(A)。这可以推广到联合概率,如下所示:
p(At&Bt1)=μ(A∩Tt1→tB),
对于时间 t>t1 的所有时刻以及系统相空间的所有子集 A 和 B。 Tt1→tB是集合B在t1到t的系统动力学下的图像。我们将此假设称为概率假设 (P),如图 8 所示。同样,此条件自然地推广到 At 与多个事件 Bti 的联合概率的情况。诚然(P)及其推广,(R)反映了系统的动态特性。
图8
图 8:条件 (P)。
在简要介绍分析的下一个要素之前,我们要提到一个问题,即概率与系统测度的关联是否合理。表面上看,相空间上的测量可以具有纯粹的几何解释,并且不一定与不确定性的量化有任何关系。例如,我们可以使用一个度量来确定表格的长度,但这个度量不需要与不确定性有任何关系。这种关联是否合法取决于当前的案例和措施的解释。然而,对于统计物理学感兴趣的系统,假设系统状态处于相空间 X 的特定子集的概率与 A 的度量成正比是很自然的,而且实际上是标准的。
最后要介绍的元素是系统相空间的两个子集 A 和 B 之间的相关性概念,其定义如下:
C(A,B)=μ(A∩B)−μ(A)μ(B)。
如果C(A,B)的值为正(负),则A和B之间存在正(负)相关性;如果为零,则 A 和 B 不相关。从上面可以看出
R(Bt1,At)=C(Tt1→tB,A)。
(RC) 构成了将 EH 解释为客观随机性层次结构的基础。考虑到这个方程,事件 Bt1 与事件 At 的主观概率相关性反映了系统的客观动态特性,因为对于不同的变换 T R(Bt1,At) 将指示 Bt1 与 At 的不同种类的概率相关性。
要使用 (RC),需要注意的是,定义上述 EH 各个级别的方程可以用相关性来编写。考虑到我们正在处理离散系统(因此我们有 Tt1→tB=TkB,其中 k 是从 t1 和 t 得到的时间步数),这些方程如下:
遍历性
林
n→无穷大
1
n
n−1
Σ
k=0
C(TkB,A)=0,对于所有 A,B⊆X
弱混合
林
n→无穷大
1
n
n−1
Σ
k=0
|C(TkB,A)|=0,对于所有 A,B⊆X
强力搅拌
林
n→无穷大
C(TnB,A)=0,对于所有 A,B⊆X
K-混合
林
n→无穷大
超级
B∈σ(n,r)
|C(B,A)|=0,对于所有 A,A1,…,Ar⊆X
伯努利
C(TnB,A)=0,对于伯努利分区的所有 B,A。
将(RC)应用于这些表达式,我们可以解释每个不同级别的 EH 所涉及的不可预测性的本质。
让我们从 EH 的顶部开始。在伯努利系统中,当前状态的概率完全独立于过去发生的事情,即使过去仅退一步。因此,了解系统的过去并不能提高我们的预测能力。过去与预测未来根本无关。这一事实经常被概括为“伯努利系统就像抛硬币一样随机”这一口号。然而,我们应该强调,这只适用于伯努利分区中的事件;伯努利系统的表征没有提及伯努利分区以外的分区具有哪些随机属性。
K-混合更难分析。我们现在必须解决如何理解 σ(n,r) 的问题,即由集合生成的最小 σ 代数
{TkAj∣k≥n;j=1,…,r}
我们之前回避了这一点。对于我们的分析来说重要的是以下类型的集合是以下类型的成员
σ(n,r):TkAj0∩Tk+1Aj1∩Tk+2Aj2∩…,
其中索引 ji 的范围超过 1,…,r。由于我们可以随意选择集合 A0、A1、…、Ar,因此我们始终可以选择它们,使它们成为系统的过去历史:系统处于 Aj0 k 时间步长,处于 Aj1 k+1称其为系统的(粗粒度)遥远的过去——“远程”,因为我们只考虑向后超过 k 个时间步的状态。 K 混合条件表明,随着时间趋于无穷大,系统的整个遥远的过去历史变得与预测未来发生的事情无关。通常,通过关注伯努利分区中的事件来将伯努利系统与 K 系统进行比较。就该划分而言,K 比伯努利弱。区别在于极限和遥远的历史。在伯努利系统中,未来独立于整个过去(不仅仅是遥远的过去),并且在没有限制的情况下也是如此(在 K 混合的情况下,独立性仅在限制中获得)。然而,这只适用于伯努利分区;它可能适用于其他分区,也可能不适用——伯努利系统的定义没有提及这种情况。 [22]
现在,强混合的解释就很简单了。它表示,对于任意两个集合 A 和 B,如果时间趋于无穷大(即当 n 趋于无穷大时),则已在 B 中的 k 个时间步长与未来某个时间在 A 中的概率无关。换句话说,随着 A 和 B 之间的时间距离变大,过去的事件 B 与 A 的概率变得越来越无关。这个条件比 K-mixing 弱,因为它只说明未来独立于遥远过去的孤立事件,而 K-mixing 意味着整个遥远过去历史的独立性。
在弱混合系统中,过去可能与预测未来相关,即使是在遥远的过去。弱混合条件只是说这种影响必须足够弱,以至于未来事件和过去事件之间的相关性的绝对值平均消失;但这并不意味着所有个体相关性都消失了。因此,在弱混合系统中,过去的事件仍然与未来相关。
最后,遍历性意味着相关性根本没有衰减。遍历性条件仅表示所有过去事件与未来事件的相关性的平均值(这次没有绝对值)为零。但这与过去和未来的每个时刻之间存在很强的相关性是兼容的,只要正相关性和负相关性达到平衡即可。因此,在遍历系统中,过去并不会变得无关紧要。因此,遍历系统根本不是随机的(在上面介绍的随机的意义上)。
6.“免申请”费用
这些见解与理解实际系统的行为有多大相关性?一个经常听到的反对意见(我们已经在第 4 节中遇到过)是 EH 和更一般的遍历理论是无关的,因为大多数系统(包括我们最终感兴趣的系统)根本不是遍历的。 [23]
这种指控并不像乍一看那么严重。首先,需要强调的是,使物理概念变得重要的并不是应用的绝对数量,而是是否存在一些遍历的重要系统。并且有这样的系统的例子。例如,所谓的“硬球系统”(以及它们的一些更复杂的变体)是气体分子动力学的有效理想化,并且这些系统似乎是遍历的;有关详细信息,请参阅 Berkovitz、Frigg 和 Kronz 2006,第 3.2 节,Vranas (1998) 以及 Frigg 和 Werndl (2011)。
此外,EH 可用于表征遍历和非遍历系统中的随机性和混沌性。即使系统作为一个整体不是遍历的(即,如果它不能相对于整个相空间 X 遍历),也可能(并且通常有)X 的子集系统是遍历的。这就是 Lichtenberg 和 Libermann (1992, p. 295) 当他们观察到“在某种意义上,遍历性是普遍的,核心问题是定义它存在的子空间”时所想到的。事实上,非遍历系统可能具有不仅遍历的子集,甚至是伯努利的子集!那么,询问这些子集是什么、它们的度量是什么以及它们具有哪些拓扑特征就变得很有趣。这些是动力系统理论(尤其是 KAM 理论)部分研究的问题。因此,KAM 理论并没有证明遍历理论在分析真实物理系统的动态行为时没有用处(正如人们经常声称的那样)。事实上,KAM 系统具有系统仅表现出遍历或伯努利行为的区域,因此 EH 对于表征此类系统的动力学特性非常有用(Berkovitz、Frigg 和 Kronz 2006,第 4 节)。此外,正如我们在 4.1 节中提到的,几乎所有哈密顿系统都是不可积的,因此它们具有大的相空间区域,其中它们的运动是遍历式的。因此,即使系统不能完全遍历,EH 也是研究系统动态特性的有用工具。
另一个经常听到的反对意见是 EH 在实践中是无关紧要的,因为大多数 EH 级别(事实上,除了伯努利之外的所有级别)都是根据无限时间限制来定义的,因此对有限时间内发生的事情保持沉默。但我们所观察到的都是有限时间,因此 EH 与实际科学家实践的物理学无关。
通过仔细研究极限的定义可以消除这种电荷,这表明无限极限实际上对系统在有限时间内的动态行为具有重要影响。极限的定义如下(其中 f 是时间的任意函数): limt→∞f(t)=c 当且仅当对于每个 ε>0 都存在 t′>0,因此对于所有 t>t′ 我们有|f(t)−c|<ε。换句话说,对于每个数字 ε,无论多小,都会有一个有限时间 t',在此之后 f 的值与 c 的差值将小于 ε。也就是说,一旦超过 t′,f 的值与 c 的距离就不会超过 ε。例如,考虑到这一点,强混合表示对于给定阈值 ε,存在有限时间 tn(当前时间之后的 n 个时间单位),在此之后 C(TnB,A) 始终小于 ε。我们可以自由选择 ε 作为经验相关裕度,因此我们知道,如果系统处于混合状态,我们应该预期 tn 之后系统状态与其当前状态之间的相关性低于 ε。结果是,在强混合系统中,随着 A 和 B 之间的时间距离变大,过去某个时间处于状态 B 与现在处于状态 A 的概率变得越来越无关。因此,系统强混合这一事实显然对其有限时间内的动态行为有影响。此外,通常(尽管并非总是)收敛证明提供了收敛率的有效界限,并且这些界限可用于告知给定时间的行为期望。
由于 EH 的不同水平对应于不同程度的随机性,每个随机性都用不同类型的不同时间系统状态之间的相关性渐近衰减来解释,因此人们可能会怀疑在衰减率中可以找到类似的模式。也就是说,人们可能会认为 EH 同样可以被表征为相关性衰减率递增的层次结构:例如,表现出轨迹指数发散的 K 系统将被表征为指数衰减率相关性,而 SM 系统会表现出多项式衰减率。
不幸的是,这不起作用。尽管 EH 看起来很自然,但它不能被解释为相关性衰减率递增的层次结构。这是一个数学事实,即 EH 的每个级别都没有特定的衰减率。例如,我们可以构建 K 系统,其中的衰减速度如人们所希望的那样慢。因此,衰减率是特定系统的特征,而不是 EH 水平的特征。
7.遍历层次结构和混沌
自从混沌理论诞生以来,如何表征混沌的问题就一直存在争议。有关调查,请参阅 Smith(1998 年,第 10 章)。一系列重要的方法使用 EH 来定义混沌。 Belot 和 Earman (1997, 155) 指出,强混合是系统混沌的必要条件,K 系统是系统混沌的充分条件。 K 系统是混沌的标志,任何较低程度的随机性都不是混沌,这种观点经常受到两个想法的推动。第一个观点是,混沌行为涉及附近轨迹指数发散形式的动态不稳定性。因此,由于系统仅当是 K 系统时才涉及附近轨迹的指数散度,因此得出的结论是(仅)遍历和混合系统不是混沌的,而 K 和 B 系统是混沌的。然而值得注意的是,SM 与附近轨迹的多项式散度兼容,并且这种散度有时在短期内超过指数散度。因此,如果混沌与附近轨迹的发散率密切相关,那么似乎没有充分的理由否认 SM 系统表现出混沌行为。
K 系统是混乱标志这一观点的第二个常见动机是,KS 熵从零到正的转变标志着从“常规”行为到“混乱”行为的转变。这可能表明正 KS 熵是混沌行为的充分必要条件。因此,由于 K 系统具有正 KS 熵,而 SM 系统没有,因此可以得出结论,K 系统是混沌的,而 SM 系统不是。为什么KS-熵是混沌的标志?共有三种动机,对应于 KS 熵的三种不同解释。首先,KS 熵可以被解释为在附近轨迹附近发散的意义上带来动态不稳定性(参见 Lichtenberg & Liebermann,1992,第 304 页)。其次,KS 熵可以与算法复杂性联系起来(Brudno 1978)。然而,虽然这种复杂性有时被认为是混沌的标志,但将其与关于混沌的物理直觉联系起来却更加困难。第三,KS 熵可以解释为香农信息论熵的广义版本(参见 Frigg 2004)。根据这种方法,正 KS 熵会带来一定程度的不可预测性,这种不可预测性足够高,足以配得上“混乱”的称号。 [24]
Werndl (2009b) 认为,对人们通常认为混沌的所有系统进行仔细审查表明,强混合是关键标准:一个系统只有在强混合的情况下才是混沌的。正如她小心翼翼地指出的那样,这种说法需要得到限定:系统很少在整个相空间上混合,但它们在整个相空间上也不是混乱的。关键的一步是将注意力限制在系统混沌的相空间区域,然后事实证明,在这些相同的区域中系统也是强混合的。因此,韦恩德尔得出结论,强烈的混合是混乱的标志。令人惊讶的是,耗散系统(即不保持测量的系统)也是如此。这些系统具有吸引子,并且它们在吸引子上而不是在整个相空间上是混乱的。那么关键的一点是,我们可以在吸引子上定义一个不变(保留)的度量,并表明系统相对于该度量是强烈混合的。如此强烈的混合可以定义保守系统和耗散系统中的混乱。
寻找混沌的充分必要条件的前提是混沌系统和非混沌系统之间存在明确的界限。 EH 可能会挑战这种观点,因为每次尝试在某个地方划出一条线来区分混沌系统和非混沌系统都必然是有些武断的。遍历系统相当规则,混合系统则不太规则,层次结构中的较高位置表现出更多的随意行为。但从“非混沌”到混沌的过渡是否存在一个特定的点?基于 EH 是随机性程度递增的层次结构,并且随机性程度对应于不同程度的不可预测性(参见第 5 节),Berkovitz、Frigg 和 Kronz(2006 年,第 5.3 节)建议,混沌很可能被视为一种程度问题而不是全有或全无的事情。伯努利系统非常混沌,K 系统的混沌程度稍低,SM 系统的混沌程度仍然较低,遍历系统是非混沌的。这一建议与混沌与不可预测性密切相关的观点紧密相连。
遍历层次结构也被用来理解量子混沌。 Castagnino 和 Lombardi (2007) 将量子混沌问题分析为量子力学经典极限的一个特例,并将经典极限中的混合确定为量子系统必须满足不可积的条件。 Gomez 和 Castagnino (2014, 2015) 将整个遍历层次结构推广到量子环境,并认为如此推广的 EH 是理解量子混沌的有用工具; Fortin 和 Lombardi (2018) 使用 EH 来理解退相干; Gomez (2018) 讨论了量子混合系统中的 KS 熵。
最后,混合也被用来理解结构模型误差的影响。 Frigg、Bradley、Du 和 Smith(2014)认为参数误差和结构模型误差之间的区别至关重要,后者对模型的预测能力具有显着且迄今为止未被认识到的影响。 Wilson-Mayo(2015)指出,为了将这一观察建立在坚实的基础上,我们需要结构混沌的概念。他通过诉诸拓扑混合提出了这样的概念。