遍历层次结构(二)

图4a 图4b

(4a) (4b)

图 4:混合

混合可以通过下面的例子来直观地解释,该例子首先由吉布斯在介绍混合的概念时使用。首先喝一杯水,然后加入一杯苏格兰威士忌;这如图 4a 所示。鸡尾酒(苏格兰威士忌 + 水)的体积 C 为 μ(C),添加到水中的苏格兰威士忌体积为 μ(S),因此 C 中苏格兰威士忌的浓度为 μ(S)/μ(C) 。

现在搅拌。从数学上讲,搅拌由时间演变 T 表示,这意味着 T(S) 是经过一个单位的混合时间后苏格兰威士忌所占据的区域。直观上,如果苏格兰威士忌的浓度不仅相对于整个流体体积而且相对于该体积中的任何区域 V 都等于 μ(S)/μ(C),则我们说鸡尾酒已完全混合。因此,饮料在时间 n 处彻底混合,如果

μ(TnS∩V)

μ(V)

=

μ(S)

μ(C)

对于任何体积 V(非零测量)。现在假设鸡尾酒的体积为一个单位:μ(C)=1(我们可以这样做而不失一般性,因为总是存在一个单位系统,其中玻璃的体积为一)。然后将鸡尾酒彻底混合 iff

μ(TnS∩V)

μ(V)

=μ(S)

对于任何区域 V(非零测量)。但是,在搅拌结束并充分搅拌鸡尾酒之前,n 必须有多大呢?我们现在不要求饮料必须在任何有限的时间内充分混合,而只是要求随着时间趋于无限,它接近充分混合的状态:

n→无穷大

μ(TnS∩V)

μ(V)

=μ(S)

对于任何区域 V(非零测量)。如果我们现在将玻璃与相空间 X 相关联,并将苏格兰威士忌 S 和体积 V 替换为 X 的两个任意子集 A 和 B,那么我们就得到了所谓强混合的一般定义(通常也称为“ mix'): 系统是强混合当且仅当

n→无穷大

μ(TnB∩A)=μ(B)μ(A)

对于 X 的所有子集 A 和 B。通过允许波动,可以稍微放宽混合的要求。[9]也就是说,我们现在不再要求鸡尾酒达到均匀的混合状态,而是只要求平均混合。换句话说,我们允许苏格兰威士忌或水的气泡时不时地出现,但它们这样做的方式是,随着时间趋于无穷大,这些波动会趋于平均。这可以直接转化为数学。在某个时刻 n 与理想混合状态的偏差为 μ(TnB∩A)−μ(B)μ(A)。这些偏差的平均值消失的要求激发了弱混合的概念。系统是弱混合当且仅当

n→无穷大

1

n

n−1

Σ

k=0

|μ(TnB∩A)−μ(B)μ(A)|=0

对于X的所有子集A和B。竖线表示所谓的绝对值;例如:|5|=|−5|=5。可以证明,我们目前介绍的三个动力学性质之间存在严格的蕴涵关系:强混合意味着弱混合,反之则不然;弱混合意味着遍历性,但反之则不然。因此,强混合是比弱混合更强的条件,而弱混合是比遍历性更强的条件。

EH 的下一个更高级别是 K 系统。与遍历系统和混合系统的情况不同,不幸的是,没有直观的方法来解释此类系统的标准定义,并且该定义无法从中读出 K 系统的特征(我们在附录 C 部分)。呈现 K 系统最不直观的方式是通过 Cornfeld 等人 (1982, 283) 提出的定理,他们证明动力系统是 K 系统当且仅当它是 K 混合。系统是 K 混合当且仅当对于 X 的任何子集 A0,A1,…,Ar(其中 r 是您选择的自然数)满足以下条件:

n→无穷大

超级

B∈σ(n,r)

|μ(TnB∩A)−μ(B)μ(A)|=0

其中 σ(n,r) 是该集合生成的最小 σ 代数

{TkAj∣k≥n;j=1,…,r}。

这个所谓的西格玛代数到底是什么还很不明显,因此这个条件的内容并不是立即透明的。我们将在第 5 节中回到这个问题,我们将在其中提供对这种情况的直观解读。目前重要的是它与混合条件的相似性。简单地说,强烈混合相当于

n→无穷大

μ(TnB∩A)−μ(B)μ(A)=0

所以我们看到 K 混合为强混合添加了一些东西。

顺便提一下K系统的另一个重要性质:可以证明K系统具有正的Kolmogorov-Sinai熵(KS-entropy);详细信息请参见附录 C 部分。KS 熵本身没有直观的解释,但它以一种有趣的方式与动力系统理论的其他三个概念相关,而这些概念确实有直观的解释。首先,李雅普诺夫指数是衡量两个原本邻近的轨迹平均发散速度的指标,它们经常在混沌理论中用于表征系统动力学的混沌本质。在某些情况下(本质上,系统必须是可微的和遍历的),我们可以证明动力系统具有正的 KS 熵当且仅当它具有正的 Lyapounov 指数时 (Lichtenberg and Liebermann 1992, 304)。在这样的系统中,最初任意接近的轨迹呈指数级分散。这个结果被称为佩辛定理。其次,序列的算法复杂度是重现该序列所需的最短计算机程序的长度。有些序列很简单;有些则很简单。例如一百万个‘1’的字符串很简单:重现它所需的程序基本上是‘写‘1’一百万次”,这是非常短的。其他的则很复杂:序列 5%8£yu@*mS!}<74^F 中没有可以利用的模式,因此复制该序列的程序本质上是读取“写入 5%8£yu@*mS!” }<74^F',其长度与序列本身相似。在离散情况下,轨迹可以表示为对应于沿着该轨迹的系统状态的符号序列。那么情况就是,如果一个系统是 K 系统,那么它的 KS 熵等于几乎所有轨迹的算法复杂度(Brudno 1978)。这现在被称为布鲁德诺定理(Alekseev and Yakobson 1981)。第三,香农熵是衡量未来结果不确定性的常用指标:熵越高,我们对将要发生的事情就越不确定。人们可以证明,给定某些合理的假设,KS 熵相当于香农熵的广义版本,因此可以被视为对给定过去事件的未来事件的不确定性的度量(Frigg 2004)。

伯努利系统标志着 EH 的最高水平。为了定义伯努利系统,我们首先必须引入 X 划分的概念(有时也称为“X 的粗粒度”)。 X 的分区是将 X 划分为不同的部分(所谓的“分区的原子”),以便这些部分不重叠并共同覆盖 X(即,它们是互斥的且共同详尽的)。例如,在图 1 中,相空间的一个分区有两个原子(左侧和右侧部分)。更正式地说, α={α1,…,αn} 是 X(及其原子 αi)的一个划分,当且仅当 (i) 该划分的任意两个原子的交集是空集,并且 (ii) 所有元素的并集原子是X(最多为零)。此外,值得注意的是,分区在系统动态下仍然是分区。也就是说,如果 α 是一个分区,那么 Tnα={Tnα1,…,Tnαn} 也是所有 n 的一个分区。

当然,有许多不同的方法来划分相空间。接下来我们将研究不同分区如何相互关联。这方面的一个重要概念是独立性。令 α 和 β 为 X 的两个分区。根据定义,对于 α 的所有原子 αi 和 β 的所有原子 βj,当且仅当 μ(αi∩βj)=μ(αi)μ(βj) 时,这些分区是独立的。我们将在第 4 节中解释这个定义的直观含义(并证明称其为“独立”);目前我们只是将其作为正式定义。

有了这些概念,我们现在可以定义伯努利变换:变换 T 是伯努利变换,当且仅当存在 X 的分区 α,使得不同时刻 T 下的 α 的图像是独立的;也就是说,分区 …,T−1α,T0α,T1α,… 都是独立的。[10]换句话说,T 是伯努利变换 iff

μ(δi∩βj)=μ(δi)μ(βj)

对于 Tkα 的所有原子 δi 和 Tlα 的所有原子 βj 对于所有 k≠l。然后,我们将 α 称为伯努利分区,如果 T 是伯努利自同构,即,将 X 映射到自身的伯努利变换,则我们将动力系统 [X,μ,T] 称为伯努利系统。

让我们用一个众所周知的例子来说明这一点,即面包师的变换(因其与揉捏面团的相似性而得名)。这种变换将单位正方形映射到其自身上。使用标准笛卡尔坐标,变换可以写如下:

T(x,y) =(2x,

y

2

) 对于 0≤x<

1

2

, 和

T(x,y) =(2x−1,

y

2

+

1

2

) 为了

1

2

≤x≤1

换句话说,对于单位正方形中 x 坐标小于 1/2 的所有点 (x,y),变换 T 将 x 的值加倍并将 y 的值减半。对于所有 x 坐标大于或等于 1/2 的点 (x,y),T 将 x 变换为 2x−1,将 y 变换为 y/2+1/2。这如图 5a 所示。

图5a

图 5a:贝克的转变

现在将上图左侧部分所示的两个区域视为分区 α={α1,α2} 的两个原子。然后很容易看出 α 和 Tα 是独立的:μ(α1∩Tα2)=μ(α1)μ(Tα2),对于 α 和 Tα 的所有其他原子也是如此。图 5b 对此进行了说明。

图5b

图5b:α和Tα的独立性。

一个人也可以证明独立性也适用于α的所有其他迭代。因此,面包师的转换以及分区α是伯努利的变换。

在文献中,通常使用所谓的移位图(或Bernoulli Shifts)引入Bernoulli系统。我们在这里简要地指出了换班地图与Bernoulli系统如何相关的,以面包师的转换为例;有关更一般性的讨论,请参见附录。第D节。选择一个单元广场中的一个点,然后将其x和y坐标写入二进制数字:x = 0.A1A2A3…和y = 0.B1B2B3…,其中所有AI和BI是0或1。现在将两个字符串与中间的点背对背,形成一个无限字符串:S =…B3B2B1.A1A2A3…,这可能代表就像“标准”二维向量一样。然后,一些直接的代数表明

t(0.A1A2A3…,0.B1B2B3…)=(0.A2A3A4…,0.A1B1B2B3B4…)。

从中,我们可以看到,在我们的“一个字符串”表示中,t的操作相当于将点一个位置转移到右侧:ts =…b3b2b1a1.a2a3…因此,面包师的转换等于无限的移动零和一个。[11]

还有两个对Bernoulli系统理论至关重要的概念,即弱Bernoulli和非常弱的Bernoulli的特性。这些属性在表明某些转变实际上是伯努利(Bernoulli)方面起着至关重要的作用。面包师的转换是少数具有几何简单的Bernoulli分区的示例之一,因此通常无法直接证明系统是Bernoulli系统。然后,一个人表明,某个几何上的简单分区是弱的伯努利(Bernoulli),并且由于Ornstein而使用的定理是因为如果系统是弱的Bernoulli,则存在该系统的Bernoulli分区。这些概念的数学和相关的等价证明是复杂的,它们的介绍超出了本条目的范围。感兴趣的读者被称为Ornstein(1974)或Shields(1973)。

4。厄贡等级和统计力学

EH的概念,尤其是恐怖性本身,在统计力学(SM)的基础上起着重要作用。在本节中,我们回顾这些角色是什么。

对SM的讨论面临着直接的问题。在许多其他物理领域的基本辩论可以作为公认的形式主义的出发点。 SM的情况不同。与相对论的理论不同,SM尚未找到一个普遍接受的理论框架,更不用说规范的表述了。[12]我们在SM中发现的是很多不同的方法和学校,每个方法都有自己的程序和数学设备。[13]但是,所有这些学校使用的两个理论框架中的任何一个都使用(略有变体),其中一个可以与Boltzmann(1877)相关联,另一个可以与Gibbs(1902)相关联,因此可以将其分类为“ Boltzmannian”或“ Gibbsian” '。因此,我们将SM的介绍分为两个部分,其中一个用于这些方法家族。

在深入讨论这些理论之前,让我们通过一个常见的例子简要回顾SM的基本原则。考虑一个限制在盒子左半部分的气体。现在,卸下将盒子的两半分开的障碍。结果,气体迅速分散,并且继续这样做,直到均匀地填充整个盒子为止。气体已接近平衡。这提出了两个问题。首先,如何表征平衡?也就是说,系统需要什么?其次,我们如何表征平衡的方法?也就是说,平衡方法的显着特征是什么?这些问题在SM的两个子学科中解决:平衡SM和非平衡SM。

有两种不同的方法来描述诸如散布气体的过程。热力学用一些宏观变量(对于气体压力,体积和温度)描述了系统,同时无视气体的微观构成。就热力学而言,物质可能是连续体,而不是由颗粒组成,这不会有任何区别。因此,热力学称为“宏观理论”。

热力学的基石是所谓的热力学第二定律。该法律描述了上述过程的显着特征之一:其单向性。我们看到气体蔓延开来 - 即,我们看到它们朝着平衡发展,但我们从不观察到气体自发恢复到盒子的左半部分 - 即,我们从来没有看到它们在独自一人时离开平衡。这不是气体的特定特征。实际上,不仅气体,而且所有其他宏观系统都以这种方式行事,无论其具体构成如何。这一事实是在热力学的第二定律中构成的,该定律大致指出,从平衡到非平衡状态的过渡不能在孤立的系统中发生,这与说熵不能减小在孤立系统中(隔离系统是孤立的,如果它与环境没有相互作用:没有热量交换,没有人会压缩气体等)。

但是,有一种完全不同的方式来看相同的气体。也就是说,由大量分子组成(实验室表上的容器包含1023个分子)。这些分子在施加到容器的墙壁上并相互碰撞的力的力的影响下弹起。每个分子的运动以与弹跳球的运动相同的方式受经典力学定律的控制。因此,我们可以通过研究其微观成分的动力学来理解气体行为,而不是将某些宏变量归因于气体并将其集中在它们上。

这就提出了一个问题,即两种观察气体如何融合在一起的方法。由于热力学和机械方法都不具有任何特权,因此两者都必须得出相同的结论。统计力学是解决此任务的学科。因此,从更抽象的角度来看,我们还可以说SM是对微物理学和宏观物理学之间的联系的研究:它的目的是根据控制其显微镜成分的动态定律来考虑系统的宏观行为。 “统计”一词的名字归功于我们将看到的那样,只有在我们还将概率元素引入理论中时,才能给出机械解释。

4.1 Boltzmannian SM

我们首先介绍了Boltzmannian框架的主要元素,然后转向其在其中的使用。每个系统都可以拥有各种宏观的M1,…,Mk。在气压,温度和体积的情况下,这些宏观的特征是宏观变量的值。[14]在介绍性的示例中,一个宏观状态对应于限制在左半部分的气体,另一个宏观分布。实际上,这两个州具有特殊的地位:前者是气体的初始状态(也称为“过去状态”);后者是气体平衡状态。我们分别标记国家议员和MEQ。

它是玻尔兹曼方法的基本假设之一,它彻底使Supervene对微骨质进行了巨大验证,这意味着系统的宏观物质的变化必须伴随着其微晶体的变化(有关超级智慧的讨论,请参见McLaughlin和Bennett 2005,以及其中的参考文献),以及其中的参考文献) 。例如,不可能改变系统的压力,同时保持其微型状态恒定。因此,在每个给定的微晶格X上,那里完全对应一个宏观的。让我们将此宏观植物称为M(x)。这种确定关系不是一对一的。实际上,许多不同的X可以对应于相同的宏观盐。现在,我们将与相同宏观状态相对应的所有微晶体X分组在一起,该X型在非重叠区域中产生相位空间的分区,每个区域都与宏观状态相对应。因此,我们还使用相同的字母M1,…,MK来指代宏观状态和相位空间中的相应区域。这在图6a中说明了。

图6b图6b

(6a)(6b)

图6:X的宏观结构。

我们现在可以引入玻尔兹曼熵。为此,回想一下,我们对分配每个特定体积的相位空间有一个测量μ,因此也将Fortiori归为宏观物质。考虑到这一点,可以将宏观状态MJ的玻璃体熵定义为sb = kblog [μ(mj)],其中kb是玻尔兹曼常数。对数的重要特征是它是一个单调函数:越大的MJ,其对数越大。因此,最大的宏观状态也具有最高的熵!

人们可以表明,至少在稀释气体的情况下,玻尔兹曼熵与热力学熵一致(从某种意义上说,两者都对基本状态变量具有相同的功能依赖性),因此可以说平衡是合理的状态是鲍尔茨曼熵最大的宏观状态(因为热力学认为熵对于平衡状态而言是最大的)。通过假设系统以低熵状态开始,初始状态MP(被挤入盒子的左半)。然后,解释平衡方法的问题等于回答以下问题:为什么最初在MP中的系统最终进入MEQ然后呆在那里? (见图6b。)

在1870年代,鲍尔茨曼(Boltzmann)为这个问题提供了一个重要的答案。[15]他的回答的核心是将概率分配给宏观的想法。因此,Boltzmann采用了以下假设:对于所有J = 1,…,K,P(MJ)=Cμ(MJ),其中C是一个归一化的常数,确保概率加起来为一个。当然,这一假设立即遵循最有可能的状态是平衡状态(因为平衡状态占相位空间中最大的一部分)。从这个角度来看似乎很自然地理解平衡的方法是从不太可能的宏观物质到更可能的宏观染料,最后是最可能的宏观状态。鲍尔茨曼认为,这是对热力学第二定律的统计依据。

(本章完)

相关推荐