量子力学的测量问题

(一)基本假设

量子力学和经典力学一样,都建立于几个基本假设(postulates)之上。这些基本假设不能从更基本的理论得到,而是来自猜测,或基于实验数据,或基于逻辑思辨,亦或二者兼而有之,然后物理学家必须建立相应的数学模型。没有严密的、体系化的数学模型,并且这个数学模型的数字结果可以和测量结果直接相比较,那就不是物理学,而是哲学。物理学通常无法解决哲学问题;只有将哲学问题转换成物理问题,也就是数学模型化,才有可能在物理学的框架内解决,得到客观的、能被一致认同的结论。

(非相对论)量子力学的4个基本假设,和经典力学的基本假设有着深刻的联系。下图来自 Principles of Quantum Mechanics (Shankar, 2nd ed., Springer 1994), Page 115-116: (本文只作科普层面的粗浅介绍,对数学不感兴趣的读者可以忽略下图)

这4个与经典力学有着对应关系的基本假设,加上泡利不相容原理,即第5假设,是量子力学的全部数学模型,一节课就可以学完。而量子物理研究者,一般要在本科学一学期《现代物理》(主要是狭义相对论和量子力学简介以及应用)、一学期《量子力学》,研究生阶段学两学期《量子力学》,从事理论工作的大都还要再学一学期《量子多体理论》以及《凝聚态物理》,这才对量子力学有基本了解,可以读懂一些专业论文和专业书籍,进入专门课题的研究。为何要花这么多时间?因为要学会如何建立各种量子体系的数学模型,将无法求解的复杂体系简化、近似到可以求解,并且能够大致估算出得到的数字结果的误差有多大。

具体科研中讨论的是物理问题,也是数学问题,而本文讨论的量子力学的测量问题,却不是一个典型的物理问题,因为迄今为止也还无法建立能与实验数据直接比较的精确数学模型。所以,尽管量子力学的测量问题位列物理学未解之谜的前列,经过一个多世纪的艰辛探索,很大程度上却还徘徊在哲学问题与物理问题之间,距离彻底解决尚且遥远,虽然近几十年来取得了一些突破。

(二)测量问题

量子力学的测量问题,就是第3假设和第4假设之间的矛盾。第4假设说任何量子体系随时间的状态由薛定谔方程决定。但有一个例外,就是在测量过程中,量子体系的状态忽然随机地改变了。比如大家熟悉的薛定谔猫,或者严密一点,一个自旋上(活猫)和自旋下(死猫)两种状态各占一半、并且按照确定的相位差(量子相干性,在实验中可以测量到干涉条纹)叠加在一起的一个电子,被测量是自旋上还是自旋下的那一瞬间,随机地变成了仅有自旋上或者仅有自旋下的状态,也就是说,经过测量,一个叠加态忽然随机地变成了一个单一态,或曰本征态。

由自旋上和自旋下组成的量子态是最简单的叠加态。一个微观体系的本征态可以非常多,多到无限多个、甚至是连续分布,所以其量子态可以是由无限多个本征态以各自确定的相位差叠加在一起;一经测量,就总是随机地忽然变成其中的一个本征态,其他无限多个本来叠加在一起的本征态,都立即消失得无影无踪。可是,一个微观体系的状态随时间的变化,是被薛定谔方程(第4假设)完全决定的,这随机性从何而来?更加奇怪的是,其他本征态又是如何根据薛定谔方程,恰到好处地全都忽然在测量的一瞬间消失了?

直到现在,所有物理学家都无法准确回答这个测量问题,更不要说一个世纪之前的量子力学创立者们。他们的策略是将量子体系的测量过程当作一个特例,单独提出一个假设,即第3假设。第3假设是对量子体系的测量结果的忠实总结:

如果一个量子体系处于叠加态:|ψ> = C1 |1> + C2 |2> + … + Cn |n>,那么对于这些本征态对应的物理量A的测量(比如 |1> 是自旋上,|2> 是自旋下,测量的物理量是自旋),就会得到一个随机的本征值ai (i = 1 or 2 or 3… or n)。(注:由于本征态 |i> 的本征值是 ai,于是经过测量后,这个量子体系处于本征态 |i>.)一次测量得到的结果完全随机,而对同样的量子体系多次测量,得到 ai (量子体系处于本征态 |i>)的几率是 |Ci|2,如果 |C1|2 + |C2|2 + |C3|2 + … + |Cn|2 = 1.

量子力学的第3假设,是其基本假设里最不抽象、最没有想象力、也最不需要数学构建的。而第1和第2假设,大概是所有物理学的基本假设里最抽象、最有想象力的——用想象出来的纯粹的数学空间(希尔伯特空间)里的一个矢量,即波函数,来描述实际空间里一个微观体系的状态,对比经典力学中的一个经典粒子的状态,由实际空间里的一组可观测的物理量(位置和动量)来描述。

(三)哥本哈根诠释

哥本哈根诠释就是简单重复了一遍第3假设:一个处于很多本征态(按照确定相位差)叠加在一起的量子体系,经过测量后,“坍缩”成了一个本征态。哥本哈根诠释仅仅只是增加了“坍缩“一词,但和没有坍缩一词的第3假设的内容一模一样,不多不少,完全等价。所以当今被物理学界最大程度(大概42%的物理学家)接受的量子力学解释——哥本哈根诠释,就是量子力学的第3假设,也就是对实验测量中看到的这个奇特现象的总结。因为量子力学的创立者们(大多属于哥本哈根学派,或与之有着深厚渊源)无法用更基本的理论来解释这个现象,只能把对这一现象的描述当作最基本的假设之一。

哥本哈根诠释对不对呢?当然是对的,没有一次对量子体系的测量违背了第3假设,也就没有违背哥本哈根诠释,因此它才会被主流物理学界接受。那么,哥本哈根诠释为什么饱受诟病?答案显而易见:这个“诠释”名不副实,以对一个现象的描述(波函数“坍缩”)来代替解释,并未回答需要回答的问题:一个叠加态在测量的一瞬间怎么会坍缩成了一个本征态?

可是物理学的基本假设需要解释吗?比如牛顿第二定律:一个物体的加速度和其所受的(合)力成正比,和其质量成反比。需要一个“剑桥诠释”来解释为什么加速度和力成正比、和质量成反比吗?极少有人认为有这个必要:实验结果就是如此,除非物体的速度高到和光速相比的程度。

那么为什么量子力学的第3假设需要一个解释,并且这是一个亟待解决的物理问题呢?原因有二。一是上面提到的第3假设和第4假设之间的矛盾。牛顿力学的几个基本假设,就没有这样的相互矛盾。二是第3假设中描述的量子力学测量难以准确定义。经典物理中的测量,测量仪器和被测量的物体,都是宏观的,用同样的经典物理来描述。而量子测量的体系是微观的,由量子力学描述;测量仪器则是宏观的,由经典物理描述。可是在多大的尺寸上测量仪器算是“宏观的”,纳米、微米还是毫米?量子力学的第3假设没有说明,也无法明说,因为这个界限,即微观和宏观的分界,确切地说,适用量子力学和适用经典力学的分界,可能并不存在;即使存在,目前也无法确定——所有的测量仪器都是由遵循量子力学的微观粒子构成的,数目多大的微观粒子体系变成了经典物体?

因此量子力学的第3假设,也就是哥本哈根诠释,存在着根本性的模糊,是一个实用性很强(量子力学中唯一连接数学理论与实验观测的假设)但在理论上一点也不严谨的基本假设。

更进一步说,这个严重的理论缺陷,源于量子力学不像狭义相对论那样可以无限趋近于经典力学:当物体的速度和光速相比很小时,或者光速趋向于无穷大,狭义相对论的结果会越来越趋近于经典力学的结果,直到最精密的仪器也无法区分。可是当普朗克常数趋向于零时,或者量子体系的质量趋向于宏观物体,一般而言,量子力学的计算结果,却不会和经典力学的计算结果越来越接近,直到没有能被测量到的差别。这是因为牛顿力学方程是非线性的,而薛定谔方程是线性的;除非特殊情形,一个线性系统不会因为改变某个参数而逐渐变成非线性。

这个难以克服的理论困难,导致波尔提出了数学上相当繁琐、概念上很不直观的“对应原理”,用以衔接量子力学和经典力学,在理论上给予第3假设和哥本哈根诠释以支撑,而狭义相对论不需要这样的对应原理。另外一个解决办法,是在线性的薛定谔方程中增加一个非线性项。可这类方程在理论上牵强,看上去丑陋,数字结果更是难以符合实验数据,需要拼凑、拟合一些额外参数。

(四)多世界理论和意识参与论

除了哥本哈根诠释,量子力学其它诠释还有几十种,包括著名的多世界理论、意识参与论、退相干理论。多世界理论有着严谨的数学模型,能够对量子测量作出完美的解释:在测量的一瞬间,世界按照被测量体系本征态的概率分布而分裂出相应比例的多个世界。最简单的例子,一个自旋上和自旋下各占一半的叠加态,在测量的一瞬间,世界按照1:1分裂开来,于是我们在一个世界里测量到了自旋上的本征态,而在另外一个世界里测量到了自旋下的本征态。

然而笔者认为,多世界理论比哥本哈根诠释更加不能令人满意,因为其依赖无法测量的平行宇宙,虽然这给科幻小说家提供了辽阔的想象空间,也为哲学家准备了沃土。可是为了解决量子测量的小小理论困难,无比庞大的整个宇宙必须自我分裂、自我复制?而测量导致整个宇宙自我分裂、自我复制的机制,难道不比波函数坍缩更加需要诠释吗?

意识参与论并非是个科学理论。提出者无法建立一个严密的数学模型加以描述,也无法测量到支持意识参与改变量子系统测量结果的实验证据。如果有一天,人类在认识意识的科学领域取得了巨大突破,能够以数学模型来描述意识,并且能够测量到这个数学模型预言的结果,意识参与论才能变成一个科学理论。在变成科学理论之前,探讨意识对量子测量的影响,很难得到客观结论以达成共识。

(五)量子退相干理论

上个世纪七、八十年代兴起的量子退相干(decoherence)理论,是目前的研究热点之一,笔者认为部分解决了量子测量问题,亦有不少理论物理学家认为,量子退相干和量子测量毫无关系。量子退相干理论,在数学上比较复杂,涉及到开放量子系统,即使科研型大学物理系博士生的量子力学课,通常也只教授封闭系统。简而言之,这个理论认为外界环境(比如空气分子、各种热辐射包括光子),与量子体系(比如测量仪器、被测量的物质)之间的相互作用,导致无序的外界环境与处于叠加态的量子体系发生量子纠缠,从而这个量子体系的相干性,即组成叠加态的各个本征态之间确定的相位差,就会逐步丧失,持续外泄到环境之中。于是,一个量子体系在环境中经过一定的退相干时间后,就会自发从量子体系变成经典体系——从有干涉条纹的量子叠加态,自动退化成没有干涉条纹的经典混合态。

这个理论的定量计算结果表明,量子体系越小、粒子数目越少、与外部环境作用越小越不频繁,其退相干时间越长。因此小分子容易保持量子相干性,而灰尘颗粒那样大小(10-3 厘米)的物体,在常温常压的空气中,其退相干时间的尺度是10-31 秒。这可以用来解释为什么宏观物体因处于叠加态上而特有的干涉条纹从未被观测到,从而宏观物体的叠加态从未在实验室里呈现。随着测量技术日新月异,以及真空技术高速发展,越来越大的量子体系的叠加态被观测到了,尽管远未达到宏观物体的尺度。

在量子测量中,测量仪器和被测量的量子体系发生相互作用形成量子纠缠后,测量仪器也会形成相应的叠加态;只是测量仪器的叠加态存在时间极短,就与外界环境发生纠缠而极其迅速地退相干,以致于测量仪器的叠加态不能被观测到。我们总是通过观测宏观测量仪器的状态,来推导出被测微观体系的状态。

量子退相干理论没有引入新的假设,有着严密的数学模型,其预言的现象和数值也被一些实验证实。然而目前的量子退相干理论,并不能完全解决量子测量问题,因为退相干发生之后,测量仪器的量子叠加态(相位差完全确定)迅速变成了经典体系的混合态(相位差完全随机),各个状态之间虽然失去了关联性,却还都是存在的,无法解释为什么测量之后只剩下一种状态。

(六)EPR佯谬和量子纠缠

量子退相干理论虽然不能从根本上解决量子测量问题,却对量子计算和量子通讯的研究至关重要。量子计算和量子通讯都依赖大量微观粒子维持量子纠缠态,尽量避免、延缓量子退相干造成的信息(保存于量子叠加态的相干中——组成叠加态的各个本征态之间确定的相位差)损失或信息失真。

量子纠缠源于EPR(Einstein–Podolsky–Rosen)佯谬,在此极为简略地介绍一下。爱因斯坦等人提出的 EPR 佯谬,借助两个距离较远但处于量子纠缠的粒子,以揭示量子力学的不完备性,却没找准地方。量子力学的不完备性,或者说,量子力学让物理学家感到不能满意的地方,在于量子测量,而不是非定域性,或是波尔与爱因斯坦在索尔维会议中争论的不确定原理(被误译为“测不准”)。

非定域性是波的属性,而定域性是粒子的属性。量子力学的“波”和“粒子”,都不是经典力学里的概念,而是在数学上具有波动性和粒子性。EPR 佯谬认为粒子的定域性是物理实在性不可或缺的部分,也就是说,EPR 佯谬的基本假设是粒子的定域性。EPR 认为,对处于纠缠态的总自旋为零的两个粒子中的一个进行测量的瞬间,如果距离足够远(大于光速乘以测量时间),就不会影响到另外一个粒子;然而根据量子力学,一个粒子从叠加态变成了本征态,比如自旋上,另外一个粒子也会在这一瞬间,由叠加态变成本征态,并且肯定是自旋下。

波尔在反驳中提出,两个粒子处于纠缠态时,是一个整体(波动性),粒子定域性的假设不成立,也没有必要。波尔和 EPR 说的,在理论上,都没有毛病,都能自圆其说。但这两个理论不相容,只能有一个正确,因为二者的基本假设不一样。

这就需要用实验来判定,这两个理论的基本假设的对错。爱因斯坦和波尔都未能提出用什么样的实验测量结果来判断,定域性在两个粒子的纠缠态中是不是依然成立。于是这个争论始终停留在思辨(哲学)层面,无法得到能被一致接受的结论,直到1964 年 Bell 提出著名的 Bell 不等式,科技人员终于能够通过实验定量测量来检验两个理论孰是孰非。1980年代之后来大量的、越来越精密的实验结果,否定了爱因斯坦的定域性假设。

这是否给量子力学的完备性提供了必要佐证?并非如此。EPR 佯谬没有触及量子力学的根本问题——量子测量。而 EPR 佯谬除了引出 Bell 不等式(六十年来量子力学基本理论方面最大的突破),以及物理实在性、量子力学完备性的讨论,还开创了当今物理学非常热门的一个分支:量子纠缠,为量子通讯、量子计算等技术奠定了理论基础。

(七)经典力学只是量子多体效应?

回到量子测量。笔者认为彻底解决量子力学的测量问题,需要理解被测量的量子体系与测量仪器发生的相互作用,如何改变了测量仪器的量子态。比如在测量电子自旋态的过程中,我们观测到的是电子经过磁场后与半导体探测器发生碰撞,半导体因此产生信号的位置,用来判断电子是自旋上还是自旋下。半导体产生信号的那一小片区域,看上去只是一个小点,但其尺寸远远大于电子的直径(严格来说是电子有效作用半径的两倍)。又比如威尔逊云室中观测到的自由电子的轨迹,其实是电子束和大量水分子或者酒精分子发生电离作用后形成的,看上去与云相仿的大量分子构成的凝结核雾气,其尺寸也比电子大出很多数量级。

量子测量的实质,是用宏观尺寸的测量仪器的量子态,来表征(一一对应)被测量的量子体系的量子态。迄今为止,这方面的理论研究,还停留在唯像阶段,即在数学符号的层面,对量子体系和测量体系的量子态的对应关系,进行形式上的描述。而核心问题:量子体系与测量体系的相互作用,如何改变测量体系的量子态,却还几乎无人问津。

这是因为这个问题过于复杂。测量体系一般由数量极其庞大(~1023)的粒子组成,因为和量子体系相互作用而导致其量子态的变化,在理论上来说,可以通过求解这个无比巨大的量子多体体系(测量仪器 + 被测体系)的薛定谔方程来得到。

这个解决途径的优势在于无需引入第3假设。第3假设可以从第4假设,薛定谔方程,直接得到。难点在于如何简化这个无比复杂的数学模型,才可以做定量计算,得到的数值依旧可以精确描述,微观量子体系与宏观测量体系相互作用的物理过程。当代计算物理可以近乎完美地处理小型量子体系,对无比巨大的大块材料也有行之有效的一套近似方法。可是要将二者结合起来,从最基本的量子力学方程开始,计算出宏观体系的量子态因为和微观体系相互作用而随时间的改变,目前还缺乏有效的数学手段。

最后,笔者认为,经典力学源于量子多体效应,数量极其庞大的量子体系,比如测量仪器,表现出来的经典行为,比如非线性,可以从量子多体薛定谔方程中得到,而在数量较小的量子体系中一般表现不明显,难以测量到。解决这个问题,等同于解决量子测量问题,但建立可求解的有效数学模型,看上去遥不可及。

2025.3.14-17

关于 吴西风

一个爱码字的科研工作者
此条目发表在 科普 分类目录。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已被标记为 *

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>