3. Liouville's Theorem and Ergodicity

发布时间 2023-06-04 22:57:33作者: SiranLee

为什么会涉及到刘维尔定理和遍历性

在前面的关于微正则系综的平衡态的博客里面,我们对于微正则系综做了一些假设,其中最重要的两个假设是:

  1. 微正则系综中各个系统出现的概率都是一样大的,没有哪一个处于某个状态的系统备受青睐
  2. 在微正则系综里面,我们在计算平衡态的某些宏观性质时,认为对于相空间中某个能量面上的所有可能状态的系统的平均等价于对于该系统在时间演化下的平均。即系综平均\(\leftrightarrow\)时间平均

而在这一章节中,我们将通过刘维尔定理和系统的遍历性来对上面的这两个解释做出严格的说明。更为具体一点来说就是,刘维尔定理告诉我们假设1是合理的,即刘维尔定理告诉我们微正则系综中的每个状态下的系统都是"生而平等"的; 而系统的遍历性则告诉我们假设2是合理的,即系统遍历性告诉我们系综平均确实等价于时间平均。

刘维尔定理

刘维尔定理的核心是

系统(某个能量下)的相空间的体积在时间演化下是保持不变的

我们后面会解释为什么这个核心会导致微正则系综中的各个系统“生而平等”。在此之前,因为刘维尔定理要涉及到多元函数的微积分,所以我们这里先从多元函数的方向导数介绍起,然后一路介绍到高斯散度定理(Gauss's Divergence Theorem)以及连续性方程(continuity equation).

方向导数(Directional Derivative)

多元函数\(f(x_1,x_2,\cdots,x_n)\)的方向导数\(\nabla_{\vec{v}}f\)描述了多元函数\(f\)在某个方向\(\vec{v}\)上的变化速度\(\frac{\partial f}{\partial \vec{v}}\),它可以如下计算:

\(\frac{\partial f}{\partial \vec{v}}= \nabla_{\vec{v}f} = \frac{\vec{v} \nabla f}{||\vec{v}||}\)

方向导数的上述定义完全可以通过全增量的定义推导出来,为了介绍这个过程,我们以二元函数\(f(x,y)\)为例,考虑二维平面中的一点\((x,y)\)以及它附近的在它\(\vec{v} = (a\Delta x,b\Delta y)\)方向上的另一点\((x+a\Delta x,y+b\Delta y)\)

directional_derivative

右边的图是它在值空间中的表示,我们假设多元函数\(f\)是可微的,那么函数\(f\)在这个方向上的全增量就可以写为

\(\lim_{\Delta x\rightarrow0,\Delta y\rightarrow0} \Delta_{\vec{v}} f(x,y) = a\frac{\partial f}{\partial x}\Delta x+b\frac{\partial f}{\partial y}\Delta y = \vec{v}\nabla f\)

这里为了能够提取出方向的因素而忽略掉指明方向的向量\(\vec{v}\)的大小,我们可以除以它的模长进行归一化,而左边的这个极限就定义为函数\(f\)在点\((x,y)\)处的在\(\vec{v}\)方向下的方向导数。需要说明的是方向导数是在一个射线方向的情况下定义的,这也是它和任意方向下定义的全微分的差别。

梯度(gradient)

首先需要知道的是梯度是一个算子(operator),它和微分,积分算子一样是一个线性算子。这个算子作用在一个多元函数上的结果是一个向量,这个过程可以表为:

\(\nabla f(x,y)|_{(x_0,y_0)} = (f'_x|_{x_0},f'_y|_{y_0})\)

多元函数在某一点的梯度表示了多元函数在该点变化最快的方向。在上面我们明确了多元函数在某点处的变化速度由方向导数确定,所以这就意味着梯度是最大的方向导数,通过下面的过程我们会看到确实如此。

方向导数的定义是\(\Delta_{\vec{v}}f = \frac{\vec{v} \nabla f}{||\vec{v}||}\), 假设梯度\(\nabla f\)的方向与\(\vec{v}\)的方向的夹角为\(\theta\), 那么方向导数可以写为\(\Delta_{\vec{v}}f = \frac{||\vec{v}||\times||\nabla f||\times \cos(\theta)}{||\vec{v}||} = ||\nabla f||\times \cos(\theta)\)

这样看来方向导数实际上是梯度模长的投影,而要使得这个值最大就有\(\cos(\theta) = 1\), 即此时梯度\(\nabla f\)的方向和\(\vec{v}\)的方向相同,此时有方向导数最大,也就是说函数沿着梯度的方向变化最快。

散度

散度首先定义在一个向量场\(\vec{F}\)上面,这个向量场可以是二维的也可以是三维的,这里我们以二维的为例,即向量场\(\vec{F} = F_1(x,y)\vec{i}+F_2(x,y)\vec{j}\). 散度也是一个线性算符,散度这个算符作用在向量场上面,它的定义如下:

\(div(\vec{F}) = \nabla \cdot \vec{F} = (\frac{\partial}{\partial x},\frac{\partial }{\partial y})\cdot (F_1,F_2) = \frac{\partial F_1}{\partial x}+\frac{\partial F_2}{\partial y}\quad(1)\)

散度的物理意义可以通过考虑一个源是在向外扩张还是在向内收缩来picture出来,这里我们只考虑散度的正负和零分别有着怎样的物理含义。我们通过以下的一些例子来说明。

首先考虑这样一个简单的向量场\(\vec{F} = x\vec{i}+y\vec{j}\), 它可以想象为在原点的一个向外扩张的源,它在平面中的每一个点向外扩张的方向如下图所示,而向外扩张的速度则通过箭头的大小来描述

62491134c28f1a4a8920a0bcbd2843e

我们可以计算得到这个向量场的散度\(div(\vec{F}) = \nabla \cdot\vec{F} = 2 > 0\), 现在考虑在接近原点处的一团油污A, 在这个场(水流)的作用下被冲散了,所以现在包含油污的区域变大了,这样我们就得到了关于一个向量场拥有正散度的intuition, 拥有正散度的向量场意味着一团流体在这个场中会被冲散而导致体积变大,即正散度的向量场意味着扩张。那么可以合理地猜想,拥有负散度的向量场意味着收缩。我们可以从\(\vec{F} = -x\vec{i}-y\vec{j}\)这个例子来考察负散度的向量场:

7137656b0fc0db9d48beed0d746c21c

我们可以计算得到这个向量场的散度\(div(\vec{F})=\nabla\cdot\vec{F} = -2 < 0\), 这个向量场的作用可以想象一个在原点的漩涡,它将原来在B点的一大团油污给拽到A点的一小团油污了,因此负散度的向量场意味着流过场中的流体的体积会被压缩,即负散度的向量场意味着收缩(compressible)。

那零散度的向量场呢?考虑\(\vec{F} = -y\vec{i}+x\vec{j}\), 容易计算出这个向量场的散度为0,我们画出这个向量场在平面坐标系中的模样

3fafe040782fa99c0f79e8af09e574e

我们可以看到这个零散度的向量场中的流仅仅是在打着旋儿而且是没有任何缩放作用的那种旋转(incompressible)。所以这个例子说明流过零散度的向量场中的流体的体积不变,而零散度的向量场也被称为divergence free的。需要说明的是,我们这里给出的这个零散度的例子是比较直观能够感受到“流体体积不变的”,可以构造许多其他的divergence free的场,但是个人认为都没有这个例子更能够让人感受到零散度的场没有对流体的缩放作用的这种性质了。

以上是从比较物理的角度来说的,从比较数学的角度(实际上也比较物理)上来说,散度是单位体积的通量(flux), 通量就可以理解为通过的量,而这个量就是我们关心的量。下面从一个简单的例子来说明通量,

4300850522882f5b060cad836ca105b

这是一个向量场\(\vec{F}\)通过某条曲线\(L\)时的示意图。其中\(\vec{n}\)\(L\)上任意一点的法向量,向量场\(\vec{F}\)携带的量通过这条曲线的量(通量)应该是每一点处的向量在\(\vec{n}\)上面的投影\(^1\) (通过曲线的有效部分)在整条曲线\(L\)上的求和,利用微积分的知识,我们认为在某一段很小的\(ds\)上面通过的向量都是相同的(大小方向都相同),它们有着一个共同的法向量\(\vec{n}\), 所以这一段\(ds\)上面的通量就是

\(\vec{F}\cdot\vec{n} ds\)

那么将这个部分在整个曲线上积分就得到了\(\vec{F}\)在曲线上通过的量

\(flux = \int_{L} \vec{F}\cdot\vec{n} ds\)

这就是通过\(L\)的通量。当曲线\(L\)闭合而围成一个闭合面\(\Sigma\)时,通量的意义就更加直观了,通量描述的是 从整体上来看向量是流入\(\Sigma\)还是流出\(\Sigma\)的,而散度是对这种性质的局部描述,即散度描述的是某一点附近向量场是流入\(\Sigma\)还是流出\(\Sigma\)的。在某一点的散度我们可以通过极限来求,即先求某个小范围内的体积(二维的就是面积),然后求这个小范围内的通量,接着求这个范围内的单位体积的分量,最后再让这个体积趋于0,即

\(div(\vec{F}) = \lim\limits_{\Delta v\rightarrow 0}\frac{\oint_L \vec{F}\cdot\vec{n}ds}{\Delta v}\)

至于如何通过通量得到散度的定义式(1),可以参见这篇博文

1: 这里向量在\(\vec{n}\)上投影的大小反映了在这一点处向量场\(\vec{F}\)所携带的量的大小,这是无量纲的,所以要具体到某一个量时,如质量,能量等,需要乘上一个与这个量有关的量,如密度等。

Gauss's Divergence Theorem

高斯散度定理的形式是

\(\oiint\limits_{A} \vec{F}\cdot\vec{n} dS = \iiint\limits_{V} (\nabla \vec{F})dv\)

它的意思是对于一个闭曲面\(A\)围成的体\(V\), 从闭曲面\(A\)中通过的通量等于在这个体\(V\)上对\(\vec{F}\)的散度\(div(\vec{F})\)进行积分。下面我们主要说明如何直观上来理解这个定理。

![aa1051abe6ec41a3bf4b598c2c6fe10](C:\Users\ADMINI~1\AppData\Local\Temp\WeChat Files\aa1051abe6ec41a3bf4b598c2c6fe10.jpg)

我们以这个简单的立方体来说明,整体上来看,通过这个立方体的通量可以通过如下计算得出

\(flux = \oiint\limits_{S}\vec{F}\cdot\vec{n}dS\)

其中\(S\)是这个立方体的表面,\(\vec{n}\)\(S\)上任意一点的指向外面的法向量。这是一种计算通量的方法,另一方面,我们可以对这个立方体进行一次分割,这样我们分别计算两个长方体的通量然后再相加也可以得到这个通量,这里相等的关键是上面那个长方体的向下的通量会和下面那个长方体的向上的通量抵消。根据这样的思想,我们对这个立方体进行无限的分割,然后将每个分割部分的通量相加也可以计算出整个立方体的通量,假设分割到很小很小的的一个小立方体长下面这样

3b09c57de35db2c4c470390b88023fb

根据散度是某一点极小体积下的通量,即下式

\(div(\vec{F}) = \lim\limits_{\Delta v\rightarrow 0}\frac{\oint_L \vec{F}\cdot\vec{n}ds}{\Delta v}\)

此时的小立方体已经是极小了,所以有

\(div(\vec{F})dv = \nabla\cdot \vec{F} dv= dflux\)

对所有的这样的小立方体进行求和

\(flux = \iiint\limits_{V} \nabla \cdot\vec{F}dv\)

于是就有高斯散度定理了

\(\iiint\limits_{V} \nabla \cdot\vec{F}dv=flux = \oiint\limits_{S}\vec{F}\cdot\vec{n}dS\)

实际上我们熟悉的高斯公式

\(\iint\limits_{C}(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y})dxdy = \oint\limits_{L}Pdy-Qdx\)

就是高斯散度定理在二维空间中的体现,右边的\(Pdy-Qdx\)实际上是\(\vec{F}\cdot\vec{n}\).

Continuity Equation

高斯散度定理可以用来尽力物理学中绝大多数以守恒为条件的方程,即我们研究的量是不能凭空产生或者凭空消失的,如质量,能量等。下面以质量守恒方程为例。

假设一个由封闭曲面\(S\)围成的体\(V\), 现在有一团流体会流经这个体,这团流体的运动由向量场\(\vec{F}\)描述,这团流体的密度为\(\rho = \rho(x,y,z,t)\), 那么在某个时刻\(t\), 体\(V\)中包含的流体的质量为

\(m = \iiint\limits_{V} \rho dv\)

现在考虑体\(V\)中包含的流体的质量随着时间的变化

\(\frac{d}{dt} \iiint\limits_{V}\rho dv\)

这个变化可以通过时间\(\Delta t\)流进这个体\(V\)的流体质量与流出这个体\(V\)的流体质量的差值。现在就该通量入场了,因为通量就是描述从整体上看向量是流入\(S\)还是流出\(S\)的,而这里“整体”两个字就说明通量的计算已经将上述所谓的流进与流出的差值的计算包含在内了。这样根据通量的计算公式,有

\(\frac{d}{dt} \iiint\limits_{V}\rho dv = -\oiint\limits_{S} \rho \vec{F}\cdot\vec{n}dS\)

右边就是最原始的计算通量的公式,这里取负号是因为如果\(\vec{F}\)\(\vec{n}\)的夹角为锐角,此时\(\vec{F}\)指向外,流体是流出体\(V\)的,也就是说体\(V\)中的质量减小,以此类推当夹角为钝角时的情况。

接着右边的式子可以通过高斯散度定理进行替换,从而得到

\(\frac{d}{dt} \iiint\limits_{V}\rho dv = -\iiint\limits_{V}\nabla(\rho \vec{F})dv\)

如果\(\rho\)以及\(\frac{\partial \rho}{\partial t}\)是连续的话,有

\(\frac{d}{dt} \iiint\limits_{V}\rho dv = \iiint\limits_{V}\frac{\partial \rho}{\partial t}dv\)

带入可得

\(\iiint\limits_{V}\frac{\partial \rho}{\partial t} +\nabla(\rho\vec{F})dv = 0\)

因为是抽象讨论,所以这个式子应该对任何形状的\(V\)都成立,那么就有

\(\frac{\partial \rho}{\partial t} +\nabla(\rho\vec{F}) = 0\)

这就是所谓的质量连续方程(mass continuity equation), 当然如果\(\rho\)不是质量密度,而是其他密度,质量连续方程就更名为其他的量的连续方程了。

在以上基础知识的储备下,现在我们可以考虑刘维尔定理了。我们主要用到连续性方程,所以我们应该对我们的问题进行识别,哪些部分相当于连续性方程中的哪些元素。

相空间中的Continuity Equation

对于处于某个能量面上的系综来说,在之前的微正则系综的博客中,我们是先验地认为这个系综中的各个系统的权重都是相同的(因为除了能量守恒,我们别无其他信息),那么在系统演化的过程中,会出现某些系统比其他系统更容易出现吗?为了考虑这个问题,现在我们更广义一些,即这个系统中处于不同状态下的系统服从某个概率分布,因为相空间中的位置和动量变化是连续的,所以我们进一步考虑这个分布的概率密度\(\rho\) ,它的定义如下

\(\rho(\mathbb{P},\mathbb{Q},t) = \rho(p_1,\cdots,p_{3N},q_1,\cdots,q_{3N},t)\)

它描述了 所有某个时刻\(t\)\(N\)个粒子在空间中某个位置范围内以某个动量范围运动 的这个系统出现的概率。因为概率的归一性,概率总是守恒的,这意味着我们可以用连续性方程来描述这种守恒。这样对比上面的连续性方程,我们还差的就是向量场\(\vec{F}\)了,在上面我们提到过向量场\(\vec{F}\)是用来描述场中流体的运动的,比如说质量守恒方程中,流体carries质量,它描述质量在三维空间中如何变化;而这里我们是在\(6N\)维的相空间中进行讨论,这里的流体是某个能量面上的所有系统的集合(系综),它carries了不同状态系统的概率,在时间演化下,这个能量面可能是高维球,也可能是超平面,现在我们需要一些理论来描述这样的相空间中这种"流体"的运动,哈密顿力学可以做到这一点。

在之前关于微正则系综的博客中,我们都是建立在理想气体的基础之上的,因为微正则系综是isolated的,所以对于这样的一个理想气体的系统,它是没有耗散的,进一步地我们可以采用哈密顿动力学系统来研究它,理想气体的哈密顿系统中粒子的运动由哈密顿方程来描述

\(\dot{q_a} = \frac{\partial H}{\partial p_a};\quad \dot{p_a} = -\frac{\partial H}{\partial q_a}\)

这里\(q_a\)\(p_a\)表示粒子的位置和动量,它们头上的一点表示是对时间的导数。\(H = H(\mathbb{P},\mathbb{Q})\)是哈密顿量(其中\(\mathbb{P},\mathbb{Q}\)分别表示动量空间和位型空间),可以理解为势能与动能之和,对于\(N\)个粒子的系统,它在这里的定义如下

\(H(\mathbb{P},\mathbb{Q}) = U(q_1,\cdots,q_{3N})+\sum\limits_{i=1}^{3N}\frac{p_i^2}{2m_i}\)

其中\(U\)\(N\)个粒子的势能。这样一来,哈密顿方程可以进一步写为

\(\dot{q_a} = \frac{p_a}{m_a};\quad \dot{p_a} = -\frac{\partial U}{\partial q_a}\quad (2)\)

现在向量场\(\vec{F}\)就可以通过描述相空间中动量随时间的变化\(\dot{p}\)以及位置随时间的变化\(\dot{q}\)来描述系综里面不同状态系统的变化了, 即

\(\vec{F} = \sum\limits_{i = 1}^{3N}\dot{p_i}\vec{x_i}+\sum\limits_{j = 1}^{3N} \dot{q}\vec{y_{j}}\)

现在因为概率是守恒的,所以我们可以直接带入连续性方程得到

\(\frac{\partial \rho(\mathbb{P},\mathbb{Q})}{\partial t} +\nabla(\rho(\mathbb{P},\mathbb{Q})\vec{F}) = 0\)

带入\(\vec{F}\)得到

\(\frac{\partial \rho}{\partial t} = -\sum\limits_{k = 1}^{3N}(\frac{\partial (\rho\dot{q_k})}{\partial q_k}+\frac{\partial (\rho\dot{p_k})}{\partial p_k})\)

然后带入(2)式就可以得到

\(\frac{\partial \rho}{\partial t}+\sum\limits_{k = 1}^{3N}(\frac{\partial \rho}{\partial q_k}\dot{q_k}+\frac{\partial \rho}{\partial p_k}\dot{p_k}) = \frac{d\rho}{dt} = 0\)

第一个等号是因为全微分。

\(\frac{d\rho}{dt} = 0\)可以告诉我们一些信息:

  • 该流体是incompressible的,incompressible的意思是说对于流体中的一小部分,可能在时间演变下这部分会变化成不同的形状,但是这部分体积是保持不变的。在这里就是说系统的相空间(能量面)在时间演化过程中可能会被扯成不同的形状,但是对于其中的某个部分来说,它的体积保持不变。这实际上就说明了不同状态的系统的概率密度在时间演化过程中保持不变。
  • 因为开始时,我们假设系综中每个系统的权重是相同的,而这里又表明系统的概率密度在时间演化下保持不变,这就说明系统在时间演化之下的权重都是相同的,在这个过程中并不会出现那个状态下的系统更受青睐。

因此刘维尔定理告诉我们微正则系综中的每个状态下的系统的权重都是相同的,这也说明了微正则系综的假设1是合理的。

遍历性

未完待更...