(一)陌生的熵,普遍的误解
熵既是一个抽象的物理概念,又是一个可以实际测量的物理量,和热量能量、有序无序密切相关。不像能量和热量,无论中文的“熵”,还是英文“entropy”,都给人相当陌生之感。当初克劳修斯(Rudolf Clausius)命名这个物理量时,采用了一个古老而生僻的希腊词语,意思是进入转变(into-transformation)。虽然entropy 的字母拼写和 energy (能量)比较类似,但诺贝尔物理奖获得者利昂 · 库珀(Leon Cooper)却说,克劳修斯成功地制造了一个词汇 entropy,让所有人包括物理学家,都对这个至关重要的物理概念一头雾水。据说二十世纪最杰出的数学家之一冯 · 诺依曼(John von Neumann),建议信息论之父香农(Claude Shannon),为信息平均量这个概念取名为 “(信息)熵”,理由是这个热力学名词很多人搞不懂,容易被唬住。
的确,熵这个物理概念和物理量,经常被大众乃至物理研究者所误解。比如有些科普文章比较沙滩上一座精心堆垒的沙堡,和其被海浪击打之后的“废墟”,来说明前者的有序度高,因而熵值低;而后者的有序度低,熵值高。然后得出结论:人类有意识地做功,可以降低一个系统的熵,让无序(废墟)变成有序(沙堡);而大自然的狂风巨浪,则让有序变成无序,增加一个系统的熵。
这些是对熵、对有序性(ordering)非常普遍、非常典型的误解。实际上无论是雕塑沙堡的人还是摧毁沙堡的海浪,都丝毫也没有改变那堆沙子的熵和有序度。
先把这个问题简化一下。现在只有三粒沙,你摆成什么样才是更有序?一条直线?等边三角形?还是任意三角形?无论你怎样摆这三粒沙(或是一百万粒沙),每次都形成一个具体的 configuration。哪个configuration 的有序度(不是对称性)更高?这是观测者主观认定的,缺乏客观性,采用不同的“有序性”标准,同一个 configuration 的有序度就会不同。
比如由八个数字构成的 configuration1: 12345678(类比沙堡),而cofiguration2: 36821457(类比废墟)。configuration1 看上去非常有序,而configuration2 看上去相当无序。不少科普读物(甚至有些教科书)用这样的例子,来阐述何为熵增加:一个系统从开始的 configuration1 (高度有序的沙堡)变成了configuration2 (高度无序的废墟)。而12345678 只是我们人为认定的有序排列;如果换成八种颜色,configuration1: 黄蓝黑橙红绿靛紫,configuration2: 黑绿紫蓝黄橙红靛,现在你还认为 configuration1 的有序度比configuration2 的有序度更高吗?
同样道理,一座沙堡看上去有序度高,那只是我们的人为认定。而被风浪击打之后的废墟,失去了很多人认定的那种具有某种审美乐趣的“有序度”。但有些现代、后现代的艺术家,却认为自然之力制造的废墟,比人为制造的沙堡审美乐趣更高,因为貌似无序的废墟里隐藏着一种更为深邃幽微的有序。而一个统计物理学家则认为,二者都是一个沙堆的某个特定的 configuration,二者的有序度没有区别,就像先前提到的configuration1 (黄蓝黑橙红绿靛紫)和 configuration2(黑绿紫蓝黄橙红靛)那样。
(二)玻尔兹曼公式
物理学中的熵,不是度量一个微观系统处在哪一个 configuration 时的有序度的高低,而是由这个系统所有可能处于的 configurations 的概率分布决定的。假设一个微观系统可以处于 N 个 configurations,其概率分布分别为 p(i), with i = 1, 2, …, N, and p(1) + p(2) + … + p(N) = 1, 那么这个体系的熵 (S) 可以表达为:
S = –k*(p(1)*log[p(1)] + p(2)*log[p(2)] + … + p(N)*log[p(N)]). (1)
在上面的玻尔兹曼公式中, k 是玻尔兹曼常数,log 是自然对数。考虑最简单的情形:一个微观系统处于任何一个 configuration 的几率一样,也就是说,p(i) = 1/N,那么这个微观体系的熵就是
S = k*log(N). (2)
表达式(2)和表达式(1)一样,适用于所有的微观系统,如果我们使用微正则系综。系综(ensemble)是一种数学方法,假设大量完全一样的微观系统按照概率 p(i) 处于不同的 configurations。而使用在数学上等价的其他系综时,则需要使用表达式(1),得到的熵值完全一样。后面的讨论仅限于使用微正则系综,因为物理概念最简单;而在实际理论计算和分析时,微正则系综最困难,几乎无人使用。
玻尔兹曼公式,就像经典力学中的牛顿三定律,是统计力学的基本假设(The fundamental postulate of statistical mechanics)。在统计力学中,其他的公式、方程都可以从这个 postulate (以及微观粒子运动方程)推导出来,而玻尔兹曼公式不是由更基本的 postulate 得出的,而是十九世纪伟大的物理学家玻尔兹曼(Ludwig Boltzmann),根据分子运动论猜出来的。
玻尔兹曼晚年投入了大量精力来捍卫他的理论。在与他同时代的物理学家、哲学家的旷日持久的论战中,玻尔兹曼身心疲惫,深受躁郁症、抑郁症的困扰,一次情绪失控,自缢身亡。这个简洁优美、物理图像清晰明了的表达式(2),铭刻在玻尔兹曼的墓碑上。
小结一下:统计物理学中的熵,决定于一个微观系统所有可能占据的configurations 的数量。如果一个系统只有一个 configuration 可以占据,那么无论占据哪个 configuration,其熵都是0,最小可能的熵值,有序度最高。如果可以占据的 configurations 的数目极大,那么其熵值就大,有序度就低。一个系统的熵值高(无序度高),指的是这个系统可以占据的 configurations 的数量多,而不是某个具体的 configuration 的无序度高。
实际上每个 configuration 都是等价的,无法区分哪个的有序度更高。所以一个微观系统占据每个 configuration 的几率完全一致。这个表述和玻尔兹曼公式所表达的物理规律一模一样,二者都可以作为统计力学的基本假设。
回到原来的问题。无论三粒沙,还是一百万粒沙,无论摆成什么样子,一条直线,一个三角形,还是一个沙堡,一片沙墟,这些宏观的沙堆都只是占据了一个特定的 configuration;除非有外力介入,这些沙堆一旦摆好,就只能占据这个特定的 configuration。因为只能占据一个 configuration,这些沙堆的“宏观熵”都是0.
而每一粒沙由数量极其巨大的原子组成。这些原子每时每刻的随机热运动,导致了一粒沙子中的原子可以占据的 configurations数量极大,远远大于原子的数量。我们可以用玻尔兹曼公式算出每粒沙子(在室温下)的熵值,然后相加,得到这个沙堆的总熵值。无论你怎样摆布这个沙堆,其熵值都等于每一粒沙子的熵值之和,都是相同的,也就是说,其有序度是相同的。
(三)熵和相变
熵在热力学中被定义和测量,早于玻尔兹曼写出这个数学表达式。热力学熵不像能量、热量,解释起来有点麻烦,涉及到热机和卡诺循环,而熵的测量更为复杂,有兴趣的读者可以查看wiki或者教材。本文不赘述这些上网就可查到的精确表述,仅用液态水结成固态冰的相变过程,来简单阐述一下。
我们都知道,在摄氏零度时(T = 273.16 K),液态水可以转变成固态冰。这个相变过程释放的热量 Q = 333.55 J/g (焦耳/克),而熵的减少量为 dS = Q/T,也就是说,每克液态水变成固态冰,熵减少 1.221 J/K。这个熵的减少量,可以根据玻尔兹曼公式计算出来,由此可以检验统计力学基本假设的正确性。
在摄氏零度时,对于同样分子数的水和冰,水可以占据的 configurations 的数量 ,大于冰可以占据的 configurations 的数量。水的无序度比冰高,熵值更高。而水的能量(E)比冰高,其能量之差就是这个相变过程释放(或者吸收,由冰变成水)的热量。这是能量守恒定律。由于
E(water) – E(ice) = Q = dS*T = S(water)*T – S(ice)*T, (3)
我们可以得出,在冰水转变温度 T = 273.16 K,
E(water) – S(water)*T = E(ice) – S(ice)*T. (4)
吉布斯定义的自由能 G = E – TS,可以用来判断在某个温度下,一种物质的哪个相最稳定(G值最低)。而在两种相的转变温度,自由能G值相等。由 G = E – TS 可见,高温下熵高(无序度高)的相更为稳定;而在低温下,能量低的相更稳定。
而在固体到固体的相变中,高温下熵值高的固体相,往往具有更高的对称性,比如立方体结构;而低温下熵值低的固体相,往往具有相对更低的对称性,比如单斜(monoclinic)结构。仅举一例:形状记忆合金(shape memory alloy)NiTi (nickel titanium),在高温下的晶体结构是立方体,被称作 Austenite (A)相,而低温下的晶体结构是单斜体,被称作 Martensite (M)相。从A相到M相的转变(转变温度大约是 360 K)过程中,每克 NiTi 释放 35 J 热量,熵减少0.097 J/K。
从玻尔兹曼公式出发,可以计算出 NiTi 的A相和B相的熵值随温度的变化,但这在技术上存在着巨大的困难,直到最近几年才被解决,计算结果达到了所需的精度。这是笔者正从事的科研项目之一。而能量的计算相对简单。由这两个物理量,可以得出吉布斯自由能 G 随温度的变化,然后得到形状记忆合金(不仅仅是NiTi)的转变温度和释放/吸收的热能。
那么如何理解 NiTi 在高温下,熵值高的A 相,却比其在低温下熵值低的 M 相,对称性更高,因而看上去显得更加“有序”呢?高温、熵值高的相,不应该是更为无序、对称性更低吗?物理学中度量秩序的客观标准,不是哪个 configuration 的对称性或有序性的高低,而是可以占据的 configurations 的数量多少。处于高温下的A相,NiTi 可以占据的configurations 的数量远远大于处在低温下的M相,而实验测量到的(如上图所显示)晶体结构,是大量 configurations 作平均后得到的结构。
一般而言,一个固体相可以占据的 configurations 的数量越大,其平均下来的结构的对称性就越高,因为对所有可能结构的平均,保持了所有可能的对称性。而在低温下,由于势垒的限制,某些在高温下可以抵达的 configurations,现在不能占据了,那就失去了一些对称性,导致低温固体相的对称性相对较低。这是自发对称性破缺(spontaneous symmetry breaking)最简单的一个例子。
(四)熵增加与不可逆
热力学第二定律说一个孤立系统的熵值不会减少,只会趋向于极大值,当达到了平衡态。这个熵增加原理,只对一个和外界没有物质和能量交换的系统有效,而人类社会、地球都不是孤立系统,熵增加原理并不适用。宇宙是不是一个孤立系统?目前并无定论,很多物理学家现在认为不是。
设想一个与外界完全隔离的密封舱,刚开始的时候,气体被中间的一块隔板隔在左侧。打开隔板上的孔,气体就会从左侧扩散到右侧。在起始状态(左图,状态1),这个气体分子系统所能占据的 configurations ,都是分子只能在左侧。在最终状态(右图,状态2),这个系统能占据的 configurations,不仅包括原来分子全在左侧的,还包括有些或全部分子在右侧的configurations。因此在状态2,这个系统能占据的 configurations 的数量急剧增加,导致熵增加。
这个孤立系统的熵,会不会自动减少呢?比如这些气体分子达到右图的状态2之后,又自动回到状态1?这个概率实在是太小了,如果气体分子的数量足够多(>100;而一个宏观气体系统的分子数是10的23次方量级),那么即使在超过现今宇宙年龄的时间里,也不会发生一次。
因此,这个在密封舱中的气体系统,只可能从状态1 (气体都在隔板左侧) 到状态2(扩散到整个密封舱),却不可能从状态2返回状态1,因为从状态1到状态2的过程熵增加,而从状态2到状态1的过程熵减少,违反了热力学第二定律。这就是热力学的不可逆过程,尽管每个分子的运动都是可逆的。
这种不可逆过程,乃是世间一切不可逆过程(比如衰老,比如死亡,比如错过,比如一切让你追悔莫及的事情)之源,也是时间因单向流逝而存在的原因。
设想把密封舱里的隔板,换成可以自由运动、和舱壁的摩擦力可以忽略的活塞。气体系统如果开始处于熵值低的状态1,便可以推着活塞向右运动,也就是对活塞做功,直到抵达熵值最高的状态2,然后就不能再做功了。一个孤立系统只有处在熵值低的状态,才能做功;一旦抵达熵值最高的状态(平衡态),就无法做功,也无法改变其状态——除了完全随机的微观热运动,宏观状态再也不会有任何改变。
这就是所谓的“热寂”。改变一个系统的热寂状态的唯一办法,是与外界有物质或者能量的交换。
(五)麦克斯韦的小妖怪
且慢!十九世纪另外一位伟大的物理学家麦克斯韦(James Clerk Maxwell)对此并不买账,就像二十世纪的爱因斯坦对量子力学不买账一样。
麦克斯韦设想一个与外界隔绝的密封舱里的气体达到平衡态以后,一个小妖怪能迅速地控制隔板小孔上面那个没有质量(质量小到可以忽略)的门,以使左侧(A)速度高于平均值的分子能向右侧(B)通过,以及右侧速度低于平均值的分子能向左侧通过,如下图所示:
由于门没有质量,这个小妖怪就没有做功。更精确地说,相比气体热运动的动能,小妖怪做的功可以忽略不计。因此他的熵保持不变,而气体的熵则减少了,因为现在低速分子都在左侧、高速分子都在右侧的configurations,只是之前气体可以占据的 configurations 的一部分。
这个小妖怪在微观世界里的行为,可以和宏观世界里一个人用沙子堆累沙堡相类比。在宏观世界里,这个人做了很多功,累得满头大汗(体温升高,熵值增加),结果这个沙堆的熵值,一点也没有变化。而在微观世界里,这个妖怪没有做功,其熵值不变;而这个妖怪加上气体分子所构成的系统,在与外界隔绝的情况下,总的熵值却减小了,违背了熵增加原理,也就是热力学第二定律。
这就是著名的 Maxwell’s demon ,目前还没有彻底解决的物理悬疑之一,成为当代热力学、统计力学,以及信息论等交叉学科研究的一个热点。麦克斯韦的小妖怪关门开门,虽然引起增加的物理熵可以忽略不计,但其信息熵却不可忽略。有些物理学家因此认为,信息熵和物理熵,其实是一回事。
信息熵和信息论(information theory)是我不熟悉的研究领域,这篇科普小文也就到此为止。而麦克斯韦的小妖怪,像薛定谔的小花猫那样,继续困扰一代又一代物理学家。有一天,如果某个物理学家让麦克斯韦的小妖怪得逞了,那么整个物理世界的秩序将随之而改变。
2022.9.5