统计力学哲学(四)
已经设计了许多方法来解决或规避这些问题。 Malament和Zabell(1980)提出了一种证明阶段平均合理的方法,该方法仍然可以唤起人们的态度,但避免了时间平均的吸引力。 Vranas(1998)对epsilon-ergodic系统的这一论点进行了重新制定(请参阅第4.4节)。这说明了“几乎” ergodic的系统,但对远非渴望的系统保持沉默。 Khinchin(1949)将注意力限制在具有大量自由度和所谓总和函数(即可以是一粒子功能上的总和)的系统,并表明对于此类系统f ∗ =⟨f⟩保留X的最大部分;有关这种方法的讨论,请参见Batterman(1998)和Badino(2006)。但是,正如Khinchin本人所指出的那样,对总和的关注太过限制了,无法覆盖现实的系统,并且该方法还必须恢复到令人难以置信的假设,即观察结果得出无限的时间平均。这导致了一个研究计划,现在被称为“热力学极限”,旨在在更现实的假设下证明“类似Khinchin的”结果。经典陈述是Ruelle(1969,2004);有关调查和进一步参考,请参见Uffink(2007:1020-8)。
解决问题的一种不同的方法坚持认为,人们应该认真对待ρ(x)的状态,并寻求按统计术语平均的理由。在这种情况下,华莱士(Wallace,2015)坚持认为,统计力学的定量内容被观察到的统计数据(他们的期望值,差异等)和McCoy(2020)提交了ρ(x)是完整的物理状态单个统计机械系统。
这种观点放弃了测量结果与相位平均值的关联,并坚持认为测量是“瞬时行为,就像拍快照一样”(O. Penrose 1970:17-18):如果对与 f 相关的量进行测量设t时刻的系统,t时刻系统的微观状态为x(t),则t时刻的测量结果为f(x(t))。这个定义的一个明显的结果是,不同时间的测量可能会产生不同的结果,并且宏观变量的值可能会随着时间的推移而变化。然后我们可以看看这些值如何随时间变化。做到这一点的一种方法是观察远离平均值的波动:
Δ(t)=f(x(t))−⟨f⟩,
其中 Δ(t) 是时间 t 时偏离平均值的波动。然后,如果波动很小且不频繁,则可以预期测量结果将为 ⟨f⟩。尽管这似乎不是公认的教科书立场,但在某些人中可以找到类似的观点,例如 Hill (1956 [1987]) 和 Schrödinger (1952 [1989])。精确的衔接必须使用ρ来计算一定大小波动的概率,这需要系统满足严格的动力学条件,即掩蔽条件或f独立条件(Frigg & Werndl 2021)。
6.3 GSM 和均衡方法
正如到目前为止所讨论的,GSM 是一种均衡理论,这也是它在应用中最常用的方式。然而,一个全面的 SM 理论也必须考虑均衡的方法。为了讨论平衡的方法,通常引入吉布斯熵
SG=−k∫Xρ(x)log[ρ(x)]dx。
吉布斯熵是一个以分布 ρ 为特征的系综的属性。然后,人们可能会尝试将平衡方法描述为 SG 单调增加以最终达到平衡最大值的过程。但这个想法立即被一个数学定理所削弱,该定理称 SG 是运动常数:
SG[ρt(x)]=SG[ρ0(x)]
对于所有时间 t。因此,SG 不仅无法单调递增,而且无法单调递增。它根本没有改变!这排除了用吉布斯熵增加来描述平衡方法的特征。因此,要么必须放弃这种表征,要么必须修改形式主义以允许SG增加。
第二个问题是吉布斯统计均衡定义的结果。正如我们在第 6.1 节中看到的,如果 ρ 是平稳的,则系统处于统计平衡。远离平衡的系统必须与非平稳分布相关联,并最终演化为平稳平衡分布。但这在数学上是不可能的。这是 GSM 理论形式主义的结果,在某个时间点上平稳的分布必须在所有时间(过去和未来)都是平稳的,并且在某个时间点上非平稳的分布将始终是平稳的。是非平稳的。因此,集成不能从非平稳分布演化为平稳分布。这需要改变均衡的定义,或者改变形式主义,从而允许分配以必要的方式发生变化。
下面我们讨论解决这些问题的主要尝试。对于我们无法在此介绍的替代方法,请参阅 Frigg (2008b: 166–68) 及其参考文献。
6.4 粗粒度
吉布斯意识到平衡方法存在的问题,并提出粗粒度作为解决方案(Gibbs 1902 [1981]:第 12 章)。此后,这一概念得到了许多实践者的认可(例如,参见 Farquhar 1964 和 O. Penrose 1970)。我们已经在第 4.2 节中遇到过粗粒度。不过,这里它的用法有所不同,因为我们现在将网格放在完整的状态空间 X 上,而不仅仅是单粒子空间上。然后可以定义粗粒度密度
ˉ
ρ
说在 X 中的每个点 x 的值
ˉ
ρ
是 x 所在网格单元上 ρ 的平均值。粗粒度的优点是粗粒度分布不会受到与原始分布相同的限制。具体来说,我们将利用粗粒度分布计算出的吉布斯熵称为粗粒度吉布斯熵。现在事实证明,粗粒度吉布斯熵不是运动常数,并且熵有可能增加。这重新开启了理解熵增加的平衡方法的途径。粗粒度分布也有可能演变,使其均匀分布在整个可用空间上,从而看起来像微规范平衡分布。这种分布也称为准平衡平衡分布(Blatt 1959;Ridderbos 2002)。
粗粒度提出了两个问题。首先,粗粒熵可以增加,系统可以接近粗粒平衡,但在什么情况下它实际上会这样做呢?其次,用准均衡代替标准均衡是否合理?
关于第一个问题,标准答案(也可以追溯到吉布斯)是系统必须是混合的。直观地说,如果从长远来看,X 的每个子集最终均匀分布在整个状态空间上,则系统正在混合(有关混合的更详细说明,请参阅遍历层次结构的条目)。问题是混合是一个非常苛刻的条件。事实上,混合意味着遍历(因为混合严格强于遍历)。正如我们已经注意到的,许多相关系统不是遍历的,因此更不用说混合了。即使系统正在混合,混合状态也只能在 t→∞ 的极限内实现,但实际物理系统会在有限时间内达到平衡(实际上,在大多数情况下相当快)。
关于第二个问题,首先要注意的是,一种无声的转变已经发生:吉布斯最初通过平稳性来定义均衡,而上述论点通过均匀性来定义均衡。这需要进一步的论证,但原则上似乎没有什么可以阻止我们以这种方式重新定义均衡。
采用准平衡的动机是
ˉ
ρ
和 ρ 在经验上是无法区分的。如果网格的大小低于测量精度,则任何测量都无法区分两者之间的差异,并且用两个分布计算出的相位平均值一致。因此,没有理由更喜欢 ρ
ˉ
ρ
。
这一前提受到了挑战。 Blatt (1959) 以及 Ridderbos 和 Redhead (1998) 认为这是错误的,因为自旋回波实验 (Hahn 1950) 使得凭经验辨别 ρ 和
ˉ
ρ
这个实验的权重仍然存在争议,一些作者坚持认为它使粗粒度增益方法无效(Ridderbos 2002),而另一些作者则坚持认为粗粒度仍然可以辩护(Ainsworth 2005;Lavis 2004;Robertson 2020)。如需进一步讨论,请参阅 Myrvold (2020b)。
6.5 干预主义
到目前为止我们讨论的方法假设系统是隔离的。这是一个理想化的假设,因为真实的物理系统并未与其环境完全隔离。这是干预主义计划的起点,它基于这样的想法:真实的系统不断受到外部扰动,而正是这些扰动促使系统达到平衡。换句话说,正是这些来自系统外部的干预导致了系统走向均衡,这也正是干预主义这一立场的由来。这一立场由 Blatt (1959) 提出,并由 Ridderbos 和 Redhead (1998) 进一步发展。该方法背后的关键见解是,一旦系统不被假设为孤立的,第 6.3 节中引入的两个挑战就会消失:熵会增加,并且非平稳分布可以被推向未来平稳的分布。
这种方法承认孤立的系统不会达到平衡,批评者想知道为什么会出现这种情况。如果将一种像我们在第 1 节中讨论的气体那样的气体放置在星际空间中的某个位置,使其免受外界影响,那么它真的会被限制在容器的左半部分而不扩散吗?即使是这种情况,添加任何环境就能解决问题吗?干预主义者有时似乎认为情况确实如此,但从无条件的形式来看,这种说法不可能是正确的。环境可以有非常不同的类型,并且没有通用定理表明任何环境都会驱动系统达到平衡。事实上,有理由假设不存在这样的定理,因为虽然环境确实驱动系统,但它们不需要驱动系统达到平衡。因此,在什么条件下环境驱动系统达到平衡仍然是一个悬而未决的问题。
干预主义的另一个挑战是,人们总是可以自由地考虑一个更大的系统,由我们原来的系统及其环境组成。例如,我们可以考虑“燃气+箱子”系统。然后这个系统也会因为外界的影响而接近平衡,然后我们可以再次形成一个更大的系统。因此,我们陷入了一种回归,只有当所研究的系统是整个宇宙时,这种回归才会结束。但宇宙中没有可以作为扰动源的环境,因此批评者认为,这表明该计划失败了。
人们是否认为这种批评是决定性的取决于人们对自然法则的看法。该论证依赖于这样一个前提:基础理论是一种普遍理论,即不受限制地适用于一切事物的理论。读者可以在自然法则条目中找到广泛的讨论。在这一点上,我们只是注意到,虽然普遍性被广泛持有,但有些人反对它,因为法律总是在高度人为的情况下进行检验。声称它们同样适用于这些环境之外涉及到归纳跳跃,这是有问题的;例如,参见 Cartwright (1999) 对这种观点的讨论。如果这是真的,这将成功地削弱上述反对干预主义的论点。
6.6 认知帐户
认知论主张对 SM 进行彻底的重新概念化。这个叙述可以追溯到托尔曼(Tolman,1938 [1979]),并由杰恩斯在 1955 年至 1980 年间的一系列出版物中引起重视,其中大部分集中在杰恩斯(Jaynes,1983)中。按照这种方法,SM 是关于我们对世界的了解,而不是关于世界本身,而 GSM 中的概率分布代表我们对系统的了解状态,而不是某些事实。这种解释的核心是这样一个事实,即吉布斯熵在形式上与信息论中的香农熵相同,香农熵是对系统信息缺乏的度量:熵越高,我们知道的越少(用于讨论)香农熵的计算请参见信息条目,§4.2)。因此,吉布斯熵可以被视为量化我们对系统信息的缺乏。这样做的优点是 GSM 的声明中不再需要集成。从认知角度来看,只有一个系统,即我们进行实验的系统,ρ 描述了我们对它的了解。这也为识别平衡分布提供了一个自然的标准:它们是与系统的外部约束一致的具有最高熵的分布,因为这种分布是最少承诺的分布。这解释了为什么我们期望平衡与最大熵相关。这就是所谓的杰恩斯最大熵原理(MEP)。
MEP 的讨论一直存在争议,迄今为止,对其重要性甚至说服力还没有达成共识。有关讨论,例如,请参见 Denbigh 和 Denbigh (1985)、Howson 和 Urbach (2006)、Lavis (1977)、Lavis 和 Milligan (1985)、Seidenfeld (1986)、Shimony (1985)、Uffink (1995, 1996a)、和威廉姆森(2010)。认知方法还假设实验结果对应于阶段平均值,但正如我们所见,这是一个有问题的假设(§6.1)。进一步的担忧是系统自身的动态在认知方法中不起任何作用。这是有问题的,因为如果动力学具有不变量,则即使 ρ 可以为其分配非零概率,系统也无法访问状态空间的某些部分(Sklar 1993:193-4)。
认知解释对平衡方法的解释依赖于重复测量并以每个测量结果为条件;有关讨论,请参见 Sklar (1993: 255–257)。这成功地解决了吉布斯熵恒定的问题,因为现在的值分配不仅取决于系统的内部动态,还取决于实验者的行为。该解决方案的问题在于,根据计算的精确程度,要么熵增加不是单调的(实际上熵减少是可能的),要么熵曲线将变得依赖于选择进行测量的时间瞬间序列(拉维斯和米利根,1985)。
然而,对认知方法最根本的担忧是,它无法实现 SM 的基本目标,即解释自然界中的过程如何以及为何发生,因为这些过程不可能依赖于我们对它们的了解。当然,正如争论所言,水壶的沸腾或气体的扩散与构成这些系统的分子的行为有关,而不是与我们碰巧(或未能)了解它们有关(Redhead 1995;Albert 2000;Loewer认知方法的进一步讨论参见 Anta (forthcoming-a,forthcoming-b), Shenker (2020), and Uffink (2011)。
6.7 GSM与BSM的关系
SM 哲学中一个紧迫但尚未得到充分研究的问题涉及 GSM 和 BSM 之间的关系。 GSM 提供了进行各种平衡计算的工具和方法,并且它是该领域从业者主要使用的方法。没有它,SM的纪律就无法运作(Wallace 2020)。 BSM 在概念上很简洁,并且在哲学家给出 SM 的基础解释时更受他们的青睐。因此,我们面临的是一种分裂,物理学家的日常工作在一个框架中进行,而基础说明和解释则在另一个框架中给出(Anta 2021a)。如果框架是等效的,或者至少可以以相对清晰的方式相互翻译,那么这并不令人担忧。正如前几节的讨论所表明的那样,事实并非如此。更重要的是,在某些情况下,形式主义甚至没有给出经验上等效的预测(Werndl & Frigg 2020b)。这就提出了这两种方法究竟如何相关的问题。 Lavis(2005)提出通过放弃系统处于平衡或不平衡的二元属性来调和这两个框架,而应该用公共性的连续属性来代替。 Wallace (2020) 认为 GSM 是一个更通用的框架,其中玻尔兹曼方法可以被理解为一个特例。 Frigg 和 Werndl 认为 BSM 是一种基本理论,而 GSM 是一种有效的理论,它提供了计算 BSM 中定义的值的方法(Frigg & Werndl 2019;Werndl & Frigg 2020a)。 Goldstein(2019)淡化了他们之间的差异,并认为他们之间的冲突并不像人们通常想象的那么严重。最后,Goldstein、Lebowitz、Tumulka 和 Zanghì(2020)比较了玻尔兹曼熵和吉布斯熵,并认为这两个概念对于热平衡宏观系统的熵产生相同的(主序)值。
7. 进一步问题
到目前为止,我们的重点是理论本身的阐述中出现的问题。在本节中,我们讨论与 SM 相关的一些进一步问题,明确排除对时间方向和其他时间不对称性的讨论,这些不对称性在本百科全书中有自己的条目(参见关于时间热力学不对称性的条目)。
7.1 SM概率的解释
如何解释概率是一个具有悠久哲学传统的问题(有关不同观点的调查,请参阅概率解释条目)。由于SM引入了概率,因此存在如何解释这些概率的问题。这个问题在 SM 中尤为紧迫,因为正如我们所见,基本的机械定律是确定性的。只要按照 Jaynes 的解释(第 6.6 节)中的认识论方式解释概率,这就不是问题。但是,正如我们所看到的,主观解释似乎与现实主义直觉相冲突,现实主义直觉认为 SM 是一种物理理论,它告诉我们事物如何独立于我们对它们的了解。这需要概率是客观的。
依赖于遍历理论的 SM 方法倾向于将概率解释为时间平均值,这是很自然的,因为遍历性提供了这样的平均值。然而,长期平均值并不是衡量系统行为的良好指标,因为正如我们所见,它们是恒定的,因此不能表明系统在不平衡时的行为如何。此外,将长期时间平均值解释为概率的动机是这些平均值似乎是长期相对频率的近亲。但由于多种原因,这种关联是有问题的(Emch 2005;Guttmann 1999;van Lith 2003;von Plato 1981、1982、1988、1994)。另一种方法是将 SM 概率解释为倾向,但许多人认为这是有问题的,因为倾向最终似乎与确定性的基础微观理论不相容(Clark 2001)。
Loewer (2001) 建议我们将 SM 概率解释为 Lewis 意义上的休谟客观机会 (1980),因为 Mentaculus(参见第 4.6 节)是 Lewis 意义上的最佳系统。 Frigg (2008a) 指出了这种解释的一些问题,Frigg 和 Hoefer (2015) 制定了另一种休谟账户,旨在克服这些问题。有关 SM 中休谟机会的进一步讨论,请参阅 Beisbart (2014)、Dardashti、Glynn、Thébault 和 Frisch (2014)、Hemmo 和 Shenker (2022)、Hoefer (2019) 和 Myrvold (2016、2021)。
7.2 麦克斯韦妖和计算的熵成本
考虑以下场景,它源自麦克斯韦在 1867 年写的一封信(参见 Knott 1911)。回想一下我们在第 1 节中遇到的带有隔断墙的容器,但稍微改变一下设置:容器的两侧充满了不同温度的气体,而不是一侧空着。此外,墙上现在有一个由恶魔操作的百叶窗。恶魔仔细观察所有的分子。每当较冷一侧的粒子向快门移动时,恶魔就会检查其速度,如果粒子的速度大于容器较热一侧粒子的平均速度,他就会打开快门并让粒子通过到较热的一侧。恶魔行为的最终效果是较热的气体变得更热,而较冷的气体变得更冷。这意味着热量从较冷的气体传递到较热的气体而不做任何功,因为热量传递完全取决于恶魔对分子进行分类的技巧和智慧。然而,根据热力学第二定律,这种热传递是不允许的。因此我们得出的结论是,恶魔的行为违反了热力学第二定律。