1. 随机热力学的基本设定
近年来,Sosuke Ito 等人逐步建立了热力学的几何表述。尽管理论还在发展初期,但已经显现出其新颖和强大之处。
考虑过阻尼 Langevin 方程
$$ \dot{\boldsymbol x}(t) = \mu \boldsymbol F_t(\boldsymbol x(t)) + \sqrt{2\mu T} \boldsymbol\xi(t), $$
及其对应的 Fokker-Planck 方程
$$ \frac{\partial}{\partial t} p_t(\boldsymbol x) = -\nabla\cdot (\boldsymbol v_t(\boldsymbol x) p_t(\boldsymbol x)), $$
其中$~\boldsymbol v~$为局域平均速度(local mean velocity)
$$ \boldsymbol v_t(\boldsymbol x) = \mu(\boldsymbol F_t(\boldsymbol x) - T\nabla\ln p_t(\boldsymbol x)). $$
从$~\boldsymbol x_\tau~$到$~\boldsymbol x_{\tau + \mathrm{d}t}~$的转移概率为
$$ \mathbb T(\boldsymbol x_{\tau + \mathrm{d}t} \mid \boldsymbol x_\tau) = \frac{1}{(4\pi\mu T\mathrm{d}t)^{3/2}}\exp\left[ -\frac{\Vert \boldsymbol x_{\tau+\mathrm{d}t} - \boldsymbol x_\tau - \mu\boldsymbol F_\tau(\boldsymbol x_\tau)\mathrm{d}t \Vert^2}{4\mu T\mathrm{d}t} \right]. $$
其中$~\Vert \cdot \Vert~$是$~L^2~$范数。$\boldsymbol x_\tau$与$\boldsymbol x_{\tau + \mathrm{d}t}~$的联合概率密度为
$$ \mathbb P(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) = \mathbb T(\boldsymbol x_{\tau + \mathrm{d}t} \mid \boldsymbol x_\tau) p_\tau (\boldsymbol x_\tau). $$
正逆向路径概率分布的 KL 散度给出熵产生速率
$$ \sigma_\tau = \lim_{\mathrm{d}t \to 0}\frac{1}{\mathrm{d}t}\mathscr D_{\text{KL}}[\mathbb P\Vert\mathbb P^\dagger]. $$
其中
$$ \mathscr D_{\text{KL}}[\mathbb P\Vert \mathbb P^\dagger] = \int\mathrm{d}\boldsymbol x_\tau\mathrm{d}\boldsymbol x_{\tau+\mathrm{d}t}~\mathbb P(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau)\ln\frac{\mathbb P(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau)}{\mathbb P^\dagger (\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau)}. $$
熵产生与信息几何中的“距离”有关。实际上熵产生可以理解为在后向流形上的投影。对于满足$~\mathbb Q(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) \ge 0~$且$~\int \mathrm{d}\boldsymbol x_{\tau+\mathrm{d}t}\mathrm{d}\boldsymbol x_{\tau}\mathbb Q(\boldsymbol x_{\tau+\mathrm{d}t, \boldsymbol x_\tau}) = 1~$的概率密度函数$~\mathbb Q(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau)$,定义流形
$$ \mathcal{M}_B(\mathbb P) = \left\{ \mathbb Q ~\left|~ \mathbb Q(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) = \mathbb T(\boldsymbol x_\tau \mid \boldsymbol x_{\tau+\mathrm{d}t})\int\mathrm{d}\boldsymbol x_\tau \mathbb Q(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) \right.\right\} $$
为后向流形(backward manifold)。
不难验证$~\mathbb P^\dagger \in \mathcal{M}_B(\mathbb P)$。由投影定理可知$~\mathbb P^\dagger~$是$~\mathbb P~$在$~\mathcal M_B(\mathbb P)~$上的投影,由此可得广义勾股定理
$$ \mathscr D_{\text{KL}}(\mathbb P\Vert\mathbb Q) = \mathscr D_{\text{KL}}(\mathbb P\Vert \mathbb P^\dagger) + \mathscr D_{\text{KL}}(\mathbb P^\dagger\Vert \mathbb Q). $$
因此熵产生速率可由投影最小化问题得到
$$ \sigma_\tau = \lim_{\mathrm{d}t \to 0}\inf_{\mathbb Q\in \mathcal{M}_B(\mathbb P)}\frac{1}{\mathrm{d}t}\mathscr D_{\text{KL}}(\mathbb P\Vert\mathbb Q). $$
2. 热力学不确定关系
热力学不确定关系是随机热力学的重要结论之一,它通过时间积分的流给出了定态系统熵产生的下界。这一不等式可以通过将 Cramér-Rao 不等式作用在统计流形上连接正逆轨线概率分布的指数测地线上得到。
考虑非平衡定态的插值动力学方程
$$ \frac{\partial}{\partial t}p_t(\boldsymbol x) = -\nabla\cdot(\boldsymbol v_t^\theta(\boldsymbol x)p_t(\boldsymbol x)), $$
其中
$$ \boldsymbol v_t^\theta(\boldsymbol x) = (1-\theta)\boldsymbol v_t(\boldsymbol x) + \theta \boldsymbol v_t'(\boldsymbol x), $$
参数$~\theta~$在$~[0, 1]~$上取值。
插值概率分布$~\mathbb P^\theta_{\boldsymbol v'_\tau}~$给出连接点$~\mathbb P^0_{\boldsymbol v'_\tau}~$和点$~\mathbb P^1_{\boldsymbol v'_\tau}~$的指数测地线
$$ \ln \mathbb P^\theta_{\boldsymbol v'_\tau}(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) = (1-\theta)\ln\mathbb P^0_{\boldsymbol v'_\tau}(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) + \theta\ln\mathbb P^1_{\boldsymbol v'_\tau}(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau). $$
取$~\boldsymbol v'_\tau = -\boldsymbol v_\tau$,则$~\theta = 1~$的端点即为$~\mathbb P^\dagger$
$$ \ln\mathbb P^\dagger(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) = \ln\mathbb P^1_{-\boldsymbol v_\tau}(\boldsymbol x_{\tau+\mathrm{d}t}, \boldsymbol x_\tau) + O(\mathrm{d}t). $$
以$~\theta~$为坐标的 Fisher 信息矩阵为
$$ g_{\theta(\boldsymbol v'_\tau)\theta(\boldsymbol v'_\tau)}(\mathbb P) = \lim_{\Delta\theta \to 0}\frac{2 \mathscr D_{\text{KL}}(\mathbb P\Vert \mathbb P^{\Delta\theta}_{\boldsymbol v'_\tau})}{(\Delta\theta)^2}. $$
这表明 Fisher 信息矩阵(一维情形是一个数)在定态时是二分之一的熵产生。再考虑此 Fisher 信息矩阵的 Cramér-Rao 不等式
$$ g_{\theta(\boldsymbol v'_\tau)\theta(\boldsymbol v'_\tau)}(\mathbb P) \ge \frac{\displaystyle{\left.\left(\frac{\partial}{\partial \theta}\mathbb E_{\mathbb P^\theta_{\boldsymbol v'_\tau}}[R]\right)^2\right|_{\theta=0}}}{\displaystyle{\mathbb E_{\mathbb P^0_{\boldsymbol v'_\tau}}\left[ \left( \Delta_{\mathbb P^0_{\boldsymbol v'_\tau}} R \right)^2 \right]}}. $$
令$~\theta = 0~$可得热力学不确定关系
$$ \frac{\langle \mathcal{J}_\tau \rangle^2}{\mathrm{Var}(\mathcal{J}_\tau)} \le \frac{1}{2}\Sigma. $$
其中$~\mathcal{J}_\tau~$为时间积分的流
$$ \mathcal{J_\tau} = \int_0^\tau \mathrm{d}t~\boldsymbol\omega_t(\boldsymbol x(t))\circ\dot{\boldsymbol x}(t), $$
$\boldsymbol\omega_t(\boldsymbol x(t))~$是可以任意选取的权函数,“$~\circ~$”为 Stratonovich 形式的随机积分。
3. 熵产生的分解
我们通常希望将熵产生分解为两部分,一部分称为管家熵产生(housekeeping entropy production),当系统受到保守势场力作用时,管家熵产生为零,剩下的一部分熵产生则称为逾熵产生(excess entropy production)。基于不同的理解,可以得到多种分解方式,例如 Hatano-Sasa 分解和 Maes-Netočnỳ 分解,每一种方式都对应于一个广义勾股定理。
改变概率分布所需的最小熵产生可以用 Wasserstein 距离来衡量。概率密度函数$~p~$,$~q~$之间的$~L^2~$-Wasserstein 距离为
$$ \mathcal{W}_2(p, q) = \sqrt{\inf_{(\boldsymbol v_t(\boldsymbol x))_{\tau \le t \le \tau+\Delta\tau}} \Delta\tau\int_{\tau}^{\tau+\Delta\tau}\mathrm{d}t\int\mathrm{d}\boldsymbol x \Vert\boldsymbol v_t(\boldsymbol x)\Vert^2 \mathcal{P}_t(x)}. $$
其中下确界取在所有满足方程
$$ \frac{\partial}{\partial t}\mathcal{P}_t(\boldsymbol x) = -\nabla\cdot(\boldsymbol v_t(\boldsymbol x) \mathcal{P}_t(\boldsymbol x)) $$
的局域平均速度$~(\boldsymbol v_t(\boldsymbol x))_{\tau \le t \le \tau+\Delta\tau}~$上。边界条件为$~\mathcal{P}_\tau(\boldsymbol x) = p(\boldsymbol x)$,$\mathcal{P}_{\tau+\Delta\tau}(\boldsymbol x) = q(\boldsymbol x)$.
$L^2~$-Wasserstein距离给出了最小值,因此很自然有熵产生的不等式
$$ \sigma_\tau \ge \frac{1}{\mu T}\lim_{\Delta t\to 0}\frac{[\mathcal{W}_2(p_\tau, p_{\tau + \Delta \tau})]^2}{(\Delta t)^2}. $$
考虑沿某一轨线的 Wasserstein 长度,它由无穷小的 Wasserstein 距离积分给出
$$ \mathcal{L}(\tau+\Delta\tau; \tau) = \int_\tau^{\tau+\Delta\tau}\mathrm{d}s \left[ \lim_{\Delta t\to 0}\frac{\mathcal{W}_2(p_s, p_{s+\Delta t})}{\Delta t} \right]. $$
此时有更精确的熵产生不等式
$$ \sigma_\tau \ge \frac{1}{\mu T}\left.\left( \frac{\partial \mathcal{L}_s}{\partial s} \right)^2\right|_{s=\tau}. $$
不等号右边的量可以视为内禀的、改变概率分布所需的最小熵产生。
由此做熵产生的分解,定义逾熵产生为
$$ \sigma^{\text{ex}}_\tau = \frac{1}{\mu T}\left.\left( \frac{\partial \mathcal{L}_s}{\partial s} \right)^2\right|_{s=\tau}, $$
管家熵产生为
$$ \sigma^{\text{hk}}_\tau = \sigma_\tau - \sigma^{\text{ex}}_\tau. $$
这一分解与 Maes-Netočnỳ 分解一致。保守势场构成逾熵产生所在的超平面,而非保守的贡献均在管家熵产生中。
4. 速度极限
将时间考虑为参数,此时 Fisher 信息为
$$ \frac{\mathrm{d}s^2}{\mathrm{d}t^2} = \int\mathrm{d}\boldsymbol x p_t(\boldsymbol x)\left( \frac{\partial \ln p_t(\boldsymbol x)}{\partial t} \right)^2 = 4\int \mathrm{d}\boldsymbol x\left( \frac{\partial \sqrt{p_t(\boldsymbol x)}}{\partial t} \right). $$
它的算术平方根$~v_{\text{info}}(t) = \sqrt{\mathrm{d}s^2/\mathrm{d}t^2}~$称为系统的内禀速度。
用$~\eta_{p_t}(\boldsymbol x) = p_t(\boldsymbol x) - p^{\text{st}}(\boldsymbol x)~$表示系统对非平衡定态的偏离,那么在非平衡定态时,内禀速度给出逾熵产生的变化率
$$ (v_{\text{info}}(t))^2 = -\frac{1}{2}\frac{\partial \sigma_t^{\text{ex}}}{\partial t} + O(\eta_{p_t}^3). $$
定义系统任意观测量$~r(\boldsymbol x)~$的演化速率为
$$ v_r(t) = \sqrt{\frac{(\partial_t\mathbb E_{p_t}[r])^2}{\text{Var}_{p_t}[r]}} = \frac{|\partial_t\mathbb E_{p_t}[r]|}{\sqrt{\text{Var}_{p_t}[r]}}. $$
则有速度极限
$$ v_{\text{info}}(t) \ge v_r(t). $$
若观测量选为系统的熵产生$~\sigma~$,则上式取等号。
速度极限表明系统任意观测量的演化速度一定不会超过系统的内禀速度。熵产生是包含系统演化信息最多的观测量。观测得到的信息越少,观测出的演化速度就越慢。
5. 参考文献
[1]Ito, S. (2023). Geometric thermodynamics for the Fokker–Planck equation: stochastic thermodynamic links between information geometry and optimal transport. Information Geometry, 1-42.
[2]Ito, S., & Dechant, A. (2020). Stochastic time evolution, information geometry, and the Cramér-Rao bound. Physical Review X, 10(2), 021056.