量子力学

第十一章 量子力学

第一节 紫外灾难(ultraviolet catastrophe)

20世纪初,原子物理蓬勃发展,科学家们尝试去了解原子中电子围绕原子核运动的规律。直到玻尔给出玻尔模型,结合德布罗意物质波的概念,才把原子里的运动情况解释了一小半。这里面最关键的是原子中电子能量的量子化。原子中电子的能量所取的固定值,叫作能级,电子只能处在这些特定的能量状态。但是玻尔模型并不能彻底描述原子中电子的运动,只有在原子核外只有一个电子的情况下,玻尔模型才运行得比较好;电子一多,玻尔模型就无能为力了。

我们也许需要从一个全新的角度看待原子物理,量子力学就应运而生了。此处要明确,量子力学中的量子(quantum)并非名词,而是一个形容词,指的是类似于能量量子化这样的物理规律。我认为量子准确的翻译应当是“量子化的力学”。

量子力学的核心信息之一是:这个世界的本质是量子化的,存在构成万物的最小单元。用一个类比来形容,我们的世界不是用橡皮泥捏出来的,而是用乐高玩具那样的积木搭出来的。用橡皮泥捏出来的东西,可以有极其细微的变化,任意创造出连续的曲线。而乐高积木的变化,最小就是一块积木的大小,不能任意变形,不是连续的。

20世纪初物理学大厦上空一朵乌云:黑体辐射(black body radiation)

早在玻尔之前,原子能量量子化就已经不是新鲜事了。19世纪末,当时的物理学家自信满满,认为物理学这门学科已经被研究得差不多了,经典物理学大厦即将建成,甚至有物理学家认为物理学将在6个月内结束。但20世纪初,出现了悬在经典物理学大厦顶上的两朵乌云。

(1)“极快篇”提到的迈克耳孙-莫雷干涉实验,证伪了以太的存在,这个问题后来被狭义相对论解决了。

(2)黑体辐射问题。黑体辐射问题的原问题相对比较复杂,此处我们挑选最核心的来讲。比如加热一块铁,随着温度的升高,铁会开始发红,温度再升高就会变得更加明亮。这种有温度的物体发出电磁波的现象,叫热辐射(对于电磁波吸收率是100%的物体叫作黑体,黑体是一种理想中的物体,现实中并不存在,黑体辐射就是黑体发出的热辐射)。

为什么会有这种现象呢?加热一个物体,本质上是让这个物体里的原子获得更快的运动速度,即增大原子的动能,这部分能量也会使原子内电子的能量增高。但是根据能量最低原理,高能量状态是不稳定的,它倾向于回到低能量的状态。因为能量守恒,原子在回低能量状态的同时会释放出电磁波,这就是热辐射的原理。如果去探测一个被加热的物体发出的光的频率,以及不同频率电磁波的能量强度,再把能量强度作为频率的函数,画出几条不同温度情况下物体热辐射的辐射强度相对于辐射频率变化的曲线,实验测得这是一组两头小、中间大的曲线。

图11-1 热辐射曲线

但在作图时,横坐标通常用的是波长,而非频率。考虑到频率和波长成反比,所以不论是用波长还是频率作为横坐标,图形的形状都是两头小,中间大。即在特定温度下,极高高频率和极低低频率的辐射强度都比较小,中等频率的辐射强度大,随着温度的升高,中等频率的峰值会往高频率移动。这就是在一定温度范围内,譬如说加热一块铁,温度越高铁块会显得越明亮的原因。随着温度增高,贡献主要能量的中心频率也在升高。但温度高到一定程度,物体反而不那么明亮了,因为它的中心频率开始往紫外线方向移动,而紫外线肉眼不可见。

经典物理理论失效

当时的理论物理学家们尝试用已有的科学理论去解释这条曲线,奇怪的是,竟没有一个理论可以就这条曲线给出正确的解释:当时的理论要么是在低频的地方符合得很好,到了高频就南辕北辙;要么就是在高频的地方确实符合得不错,但到了低频又无法解释;用经典理论给出的解释,要么是一条递增的曲线,要么是一条递减的曲线,没有任何理论可以解释这条两头小、中间大的曲线。

经典理论算出来,通常是在紫外线的区域,辐射能量趋向于无穷大,这与实验结果和常识都不符。由于这个计算问题在当时无法解决,可以说是经典物理的一场灾难,所以被称为紫外灾难。

普朗克的“量子化”

直到普朗克用他的新理论给出了正确的曲线,与实验结果精确符合,才让紫外灾难问题得到了解决。经典理论在研究热辐射问题时,会将辐射的光当成波。这种情况下,电磁波的能量被假设为连续的。

普朗克的操作,是人为加入量子化条件,他把电磁波看成光子,其能量是一份份射出的。也就是说,普朗克强行假设在热辐射过程中,电磁波是像子弹那样一颗颗地飞出,而不是像水流一样连续地流淌出来。普朗克计算电磁波能量时,并非对电磁波的频率做数学上的积分(integration),而是将 n(n为整数)倍的单个光子的能量做加法。没想到这样一通计算后,得出的热辐射能量强度随频率变化的规律,跟实验符合得非常好。这个操作,就是最早的量子化体现。普朗克假设了黑体辐射的电磁波能量量子化,尽管他本人无法理解,甚至不认同这种对于光子能量的认知,但他却还是获得了1918年的诺贝尔物理学奖,并被人誉为“量子力学之父”,玻尔模型实际上也建立在普朗克理论的基础之上。

原子轨道量子化

之后对原子光谱的研究,证实了普朗克的假设从实验角度看是正确的,因为单个原子内的能量是量子化的,电子的能量只能取特定的值,而后的玻尔模型以及物质波的学说,也解释了这一点。但毕竟玻尔模型是个解释力有限的理论,里面有太多模糊不清和无法解释的问题,所以,真正的量子力学,是以薛定谔(Erwinschrödinger)和海森堡(Werner Heisenberg)的研究为基础,完全抛弃了玻尔模型,彻底地解决原子内部电子运动的问题。

第二节 波函数(wave function)

玻尔模型描述原子里电子围绕原子核运动的轨道依然是一个圆,只是加上了角动量量子化的条件。结合德布罗意物质波的理论,电子可以被看作一束围绕着原子核运动的首尾相连的波。既然是一束波,就要满足周期性边界条件,于是就能得出玻尔模型角动量量子化的条件。

这个理论看似美妙,不管把电子看成波还是粒子,它的运动状态都应当是一个环。但人们真的去测量电子位置的时候,会发现电子几乎可以出现在原子核周围的任何位置,这些位置组合起来,完全不像是一个 环。

电子根本无轨迹

这说明电子在原子核周围的运动,压根儿没有轨道可言。从实验的角度来说,玻尔模型从根本上就是有谬误,它描述的图景和电子运动的实际情况完全不符,只是在单电子的情况下,从实验结果上解释了氢原子光谱。可以想象,真正描述电子运动的应该是一个更加高级的理论,只不过这个理论在单个电子的情况下,给出的氢原子光谱跟玻尔模型的计算结果是一致的。

如果电子根本没有轨道,运动也毫无规律,为什么会有电子的能量量子化这一现象呢?运动既然毫无规律,能量分布又怎么会有如此精确的规律呢?因此,科学家们开始思考,也许想要让电子的运动轨迹有规律的想法本就是一种妄念,应该用另外一种全新的语言来描述电子的运动。

概率的语言

这种新的语言,就是概率的语言。用概率的语言去描述量子力学系统的行为,是由德国物理学家波恩(Max Born)提出的。前面提到,如果去测量电子在原子中的位置,电子在原子核周围任何位置都可能会出现。但如果再多测几次,比方测一万次,其实是可以看出一些规律的。这个规律是统计学上的规律,如果我们真的把一万个位置的图像拼在一起,就能看到一张全部是点的图,这些点形成了“电子云”。

通过电子云的形状能看出一些规律,不同能量等级的电子,对应的电子云会有特定的形状,有球形的、哑铃形的,不同的形状对应的电子能量不同。不同形状的电子云,对应的是电子出现位置的不同概率分布。比如,通过某个球形的电子云,我们可以发现在离原子核近的地方找到电子的概率,总比在离原子核远的地方找到电子的概率大。

虽然我们无法精确地预言每个时刻电子会出现在什么位置,但我们可以在多次测量电子的位置后,预测在某些位置出现电子的概率大约是多少。这就是概率的语言,在微观世界描述物体运动状态的标准语言。

在宏观世界,我们可以确定地描述物体的运动状态。比如,有个逃犯开车逃逸,警察抓逃犯的过程中要不断地汇报逃犯的位置。例如,逃犯在15:10,处在某市A路和B路的路口,以80km/h的速度向东逃窜。在15:10这个时间点,逃犯的运动状态被确定了;有了这个信息,下一秒逃犯的位置就可以被精确预测。一旦有了运动的物体每个时刻的位置和速度信息,就能精确知道目标对象的运动轨迹。

电子的运动就完全不是如此了,我们只能用概率的语言来描述电子的运动状态:这个电子在15:10,处在原子核正下方1 nm处,并以10000m/s 的速度向上运动的概率是X%。在微观世界,我们只有一定的把握知道这个电子在什么地方,并以多大的速度运动,但是我们无法精确预言它会出现在哪里。

概率波的描述

图11-2 不同能量等级的波函数

随着时间的变化,概率的分布也会变化,于是我们就借用了波的物理学语言去描述电子运动的概率。这里不再将电子的运动规律称作电子云,而叫它概率波。简单作张图,就能明白为什么要叫它概率波了。以电子离原子核的距离为横坐标,以电子的概率波φ为纵坐标,在数学上,φ是一个复数(complex number)*[注:复数分为实部与虚部,可以写成a+bi,其中a和b都实数,i是虚数(imaginary number),定义为i2=-1],其中φ的平方正比于在某个位置附近发现一个粒子的概率。你会发现这张图看上去像一个波的波包,并且随着时间的变化,这张图是会变的。这样一来,概率的分布就会随着时间的变化而变化,和我们看到的一般的波动情况很像,比如电磁波的波动,水波的波动皆是如此。

概率波φ平方的图像的总面积必须等于1。因为如果你在全空间范围内去找这个电子,你一定会找到它,全空间找到电子的概率是100%,因为电子存在。

既然只能用概率波来描述电子的运动,那下一个问题就是,电子概率波的变化规律是什么样的呢?

随着时间的推演,电子运动的概率本身会不会出现变化?比如在第一秒,它处在某个位置的概率是多少,一秒后,它在这个位置出现的概率是否还跟原来一样?是什么因素决定了概率的分布随时间变化的规律?这就是薛定谔方程要回答的问题,薛定谔方程告诉我们,一旦给定了能量,那么概率波随时间的变化率就确定下来了。

第三节 薛定谔方程

为何波函数随时间变化的规律重要?

电子在原子中的运动,只能用概率波来描述,我们无法描述电子在特定的时间具体会出现在什么地方,我们只能描述它出现的概率。那么随着时间的推演,电子出现概率的分布,也就是概率波的形状将如何变化。

为什么我们如此执着于一个物体的性质随时间的变化规律?这其实就是物理学的任务。我们在绪论中提过,物理学的研究方法是先归纳,再演绎,后验证。通过归纳法得出一些自然界运行的规律,将其作为推理的起点进行演绎推理,并用实验来验证推理得到的结论。其中,验证用来检验归纳和推理的正确性,只有当验证的结果与推理相符合,才能说这个理论在给定边界内是正确的。如果没有验证这个环节,只通过推理解释已有的现象并不难,很多理论都能解释同一现象。比如用万有引力定律解释小尺度范围内的天体运动现象完全没有任何问题,用玻尔模型解释单电子的光谱也能得到很漂亮的结果。

用现有的理论回过头去解释已有现象,其实不困难,可能对于一个现象,几百个理论都能解释。但是科学具有可证伪性,为验证其正确性,我们必须用理论对还未发生的现象进行预测,再用实验去检验这些预测的正确性。比如万有引力定律在预测水星进动的问题上就失效了,广义相对论却可以做很好的解释,它甚至预言了黑洞的存在。玻尔模型解释单电子的光谱没问题,但是预测电子轨迹时就失效了,对于多电子的原子光谱它也是失效的。

因此对于所有理论,要验证其正确性,就要先做预测,也就是预言随着时间的变化,系统会有什么样的规律。因为我们的世界是在时空尺度上展开的,所以这里所说的预测,就是找到系统随时空展开的变化规律。理论有了预测,才能用实验结果去验证是否与理论预测相符。

薛定谔方程——概率波随时间变化的规律

我们现在知道,电子在原子中运动的规律可以用概率波来预言。对于普通的波动,如声波、水波、电磁波,随时间变化的规律是很清晰的。比如我们可以用振幅、波长和波速来描述一个电磁波。电磁波的波速就是光速,振幅是它所处的电磁场的强度,波长则是它的时空尺度,也可以被认为是波的大小。这些波都满足经典波动方程,声波和水波满足建立在牛顿定律基础上的机械波方程,电磁波则满足麦克斯韦方程。

概率波随时间变化的规律,是不是也应当用一个方程式来描述呢?答案是肯定的。概率波随时间的变化规律是由薛定谔方程进行描述的,薛定谔方程的形式与传统的波动方程有类似的地方,据薛定谔本人描述,他当初写出这个方程也是受到了波动方程的启发。

概率波一开始只是一个类比,因其形状看上去像个波。薛定谔说,既然都叫概率波了,那不如真的把它当成一个波来表达,于是就得到了薛定谔方程。

薛定谔方程的物理意义,就是概率波随时间的变化率由它的能量唯一确定。比如,原子中随着时间流逝电子位置的概率分布是怎样变化的,就由它的能量状态唯一确定了。能量越高的电子,概率分布的变化越快,这已经充分说明了概率波的波动特性。

类比其他经典意义上的波,如声波和电磁波,频率越高的声波和电磁波,能量越高,相应的波长越短。这怎么理解呢?其实频率越高,单位长度内波的上下振动弯曲的次数就越多,波的每个位置弯曲的程度就越大。就像一根有弹性的橡皮筋,其弯曲的程度越大,越剧烈,它内部储藏的弹性势能就越大。

薛定谔方程告诉我们,能量越高的微观粒子,概率分布随时间变化越快,也就是概率分布图上下振动得越频繁。此外,概率波的具体形状也由微观粒子的能量唯一确定,也就是薛定谔方程可以彻底地描述微观粒子的量子规律[当然,薛定谔方程描述的量子系统是不用考虑狭义相对论的,适用于粒子能量较低的系统;如果粒子能量过高,则要考虑相对论效应,薛定谔方程是失效的,狄拉克方程(Dirac equation)才是正解]。根据薛定谔方程的数学形式,能够直接得出原子中电子所处的能量状态必然是量子化的,这是解原子中电子所满足的薛定谔方程这样一个微分方程的必然结果,不像玻尔模型需要人为引入角动量量子化的条件。

薛定谔方程是描述量子世界运动规律的方程,任何一个量子力学系统(能量过高、相对论效应极其显著的系统除外),原则上只要解出其薛定谔方程,就能从概率波的角度描述该系统的行为。这就是薛定谔方程的强大之处。

再看物质波与波粒二象性

有了概率波,再加上薛定谔方程对于概率波变化规律的描述,就会发现物质波和波粒二象性不过是我们在掌握概率波和薛定谔方程前,对薛定谔方程性质的特殊描述而已。也就是说,物质波和波粒二象性不过是薛定谔方程对量子力学描述的特殊情况,它们描述了现象,但并没有触及本质。

有了概率波和薛定谔方程,如何理解物质波和波粒二象性呢?

任何一个物体都可以用概率波来描述,并用薛定谔方程解出它的概率波形状:如果这个形状是非常集中的,在一个很小的区域里集中了它所有概率,那这个物体就表现得像一个粒子;如果解出来的形状非常分散,那么这个物体就表现得像一个波。

所以,物质波、波粒二象性对量子现象的描述都不够准确。根据概率波的说法,世界上不存在纯粹的波,也不存在纯粹的粒子。因为波和粒子的概念,都是人类抽象出来便于做物理研究的。纯粹的波的长度无限长,但世界上哪里存在无限长的波?纯粹的粒子,是没有大小、只有质量的质点,但质点也只是一个理想模型而已。

量子力学告诉我们,只存在纯粹的概率分布,不同的概率分布,对应了不同的物质形态——非常像波或者非常像粒子。最后物体到底具体呈现波动性还是粒子性,要看它的波函数的分布是什么样的。不同的情况下,薛定谔方程解出来的波函数的形态不同,光电效应下光会呈现粒子性,是因为光电效应对应的薛定谔方程解出来的波函数是集中的;双缝干涉实验下会呈现波动性,是因为双缝干涉实验对应的薛定谔方程解出来的波函数是分散的。

薛定谔方程可以说是量子物理的奠基性理论,一旦确定量子力学系统能用概率波描述,概率波随时间变化的规律便确定了。

第四节 隧道效应(quantum tunneling)

量子力学对于微观世界的描述,是一种充满了不确定性的描述,我们无法精确预测电子处在原子中的位置,只能预测电子出现位置的概率,这与描述宏观世界的方法截然不同。

一切皆有可能

宏观世界任何一个物体的运动,都是以在某时某地出现和并以多大的速度向什么方向运动来进行确定性的描述的。如果一定要用概率来描绘宏观世界,其概率只有两种,就是100%和0%,对应的语言描述是“必然”和“绝无可能”。但在微观世界,这个描述变成了“有可能”的可能性,薛定谔方程还能计算出这个“有可能”具体是百分之多少。微观世界在量子力学的描述下,变成了一个“一切皆有可能”的世界,这个世界会发生一些宏观世界绝无可能发生的事情,“隧道效应”便是其中的典型代表。

隧道效应:化不可能为可能

举一个宏观世界的例子,你现在要跳过一堵2m高的墙,假设你的跳跃能力只有1.9m,也就是跳起来的那一刹那,你双腿用力,让自己获得向上运动的速度并具备一定的动能,然后这个动能的大小最多能把你送到1.9m的高度对应的重力势能,而无法超越2m的高度对应的重力势能,因此你无法跳过这堵墙。但微观世界并非如此,薛定谔方程告诉我们,从数学角度来看,能量发生变化,波函数也会发生变化。它是一个连续的方程,如果能量变化是连续地从一个值慢慢变到另一个值,那么波函数也应该是从一个形状顺滑地变到另外一个形状。

假设现在在微观世界,让一个微观粒子跃过一道有限高度的墙。若粒子的动能高于这堵墙的势能(potential energy),毫无疑问,这个粒子肯定可以跃过去,这时粒子跃过墙后的能量等于动能减去墙的高度对应的重力势能。现在让粒子的动能逐渐减小,也就是把粒子跃墙时的能量从大于0逐渐变到小于0,其是否能跃过去的概率也应该是顺滑地慢慢减小。但如果真的去解薛定谔方程,就会发现即便能量变成小于0,也就是动能小于势能,解出来的波函数跃过墙的概率虽大大减小,但不为零。也就是说,微观量子世界的语言是波函数的语言,波函数是顺滑的,不是宏观世界里的100%和0%,所以即便是从宏观情况看跃不过去的粒子,仍有一定概率跃过一道势能比自己的动能要高的墙。

图11-3 隧道效应(振幅越大代表出现的概率越高)

一个微观粒子即便它的动能很小,但面对一堵比自己动能还高的墙,也不是完全没有可能跃过,只是这个可能性会变小。就好像它可以从墙上打一条隧道,有一定概率可以“钻”出去。这就是隧道效应。

摩尔定律(Moore's law)的极限

隧道效应,是量子力学特殊性的集中展现。它告诉我们,量子世界的规律与宏观世界的经验并不完全相符。因为有隧道效应,现实生活中的技术进步受到了很大的挑战。

相信你应该听过摩尔定律。摩尔定律说的是,计算机的计算能力每18个月就会翻一番。计算机的计算处理由CPU上的计算单元完成,单位面积的芯片上计算单元越多,计算机的处理速度就越快。计算单元由晶体管组成,即在硅板上进行光刻,计算单元做得越小,在单位面积上就可以安放越多的计算单元,计算机计算速度越快。

18个月就能翻一番的计算能力,是指每过18个月,计算单元的大小就变为原来的1/2,单位面积能放入原来2倍的晶体管,计算速度也变为原来的2倍。但摩尔定律有其局限性,因为计算单元不能做得无限小。电子计算机依靠0和1两个信号表示信息,具体是0是1非常重要,差一个数字就面目全非,因此计算机处理的0和1信号要非常精确。

如果计算单元太小,信息的准确性会受到威胁。0和1两个信号,非此即彼,具体是0还是1,由计算单元两端的电压决定。计算机中的电流,完全按照电学规律运动。如果计算单元做得过小,量子力学的效果便开始显现,仅靠电学规律便不再能够预测电子的运动。

量子力学现象的效果开始显现,就意味着会发生隧道效应,本来应该是1的信号,有可能会变成0,这样信息就发生了错误,会影响计算的进行。目前最小的计算单元在7 nm左右,已经到极限了,再往下会非常困难。7 nm相当于几个硅原子并排的大小,这时发生隧道效应就变得非常容易。这就是为什么说,摩尔定律在量子力学面前面临失效的原因。

至此,我们用量子力学的概率波表述以及薛定谔方程充分地描述了量子力学系统的运动规律。原则上,只要不纠结于电子的具体轨道是什么样的,原子中电子的运动规律就能被彻底解释清楚。但这样的解决方案并不能让人完全满意,我们还是希望能解出电子的具体运动轨道,也就是它的轨迹随着时间具体如何变化,是否能用确定性的语言进行描述。如果不可能,是否能证明这种不可能呢?

第五节 原子结构的最终解

有了薛定谔方程这个强大的理论工具,便能清晰地描述原子中电子围绕原子核运动的规律。由于原子核比电子重太多,可以认为原子核处在中心不动,一般只研究原子核周围的电子如何运动。

能级

即便没有薛定谔方程,根据原子光谱实验,也能知道原子中电子所具有的能量是离散化,分能级的。当然,通过薛定谔方程计算电子的能量,也能得出同样的结论。

拥有不同能量的电子所对应的波函数,也可以被称作电子不同的轨道。这里轨道的概念和传统意义上的天体运动的轨道概念不同,天体运动的轨道是一条曲线,但原子中电子的轨道是一团有着特定形状的电子云,或者说是有特定概率分布形态的波函数。此处还要明确,当讨论原子结构时,我们默认讨论的是其处在能量最低状态的情况下,电子在原子中的排布情况。根据能量最低原理,这是原子最稳定的状态。如果是非稳定状态,就有太多种情况要讨论了,而物理学更感兴趣的是最稳定的状态。

把不同能级和对应的轨道算出来以后,所谓原子结构,就是依照能量最低原理往轨道里安放电子。比如氢原子,只有一个电子,所以直接把它放到最低能级就可以了。但随着原子中的原子核越来越重,电子也越来越多,再往里安放电子的过程就不那么容易了,需要找出安放电子的规律。

自旋

先理解一个量子力学的概念——自旋。

每个微观粒子,都好像一个小磁铁,如果把粒子放在磁场里,会产生一定角度的偏转,并且自旋的方向倾向于和磁场的方向平行,就像指南针一样。自旋有大有小,但其数值是量子化的,自旋的大小只能取一些特定的值,统一是约化普朗克常数(reduced planck constant)的整数倍或半整数倍。

比如电子的自旋是1/2的约化普朗克常数,光子的自旋是1倍的约化普朗克常数。约化普朗克常数的数值非常小,约等于6.63×10-34J·s,它代表了量子力学的最小尺度。我们一直说存在构成万事万物的最小单元,普朗克尺度就标度了这个最小单元的尺度大概有多小。至于为什么微观粒子会有自旋,并且还是量子化的,原因尚不清楚,只能把它当成微观粒子的固有性质(intrinsic property)。

电流会产生磁场,自旋也有自己的固有磁场。因此有人假设,自旋是因为电子确实在旋转产生的,但这样的解释是有失偏颇的。如果真的让电子、质子这样的带电粒子旋转起来,会发现它们的旋转速度要超过光速才能测量到,并且很多不带电的粒子,如光子、中子、中微子(neutrino)等都是有自旋的。

玻色子(boson)与费米子

有了自旋的概念之后,可以将所有微观粒子按照自旋的性质做分类。所有满足量子力学规律的微观粒子都可以分为玻色子和费米子。

自旋大小是约化普朗克常数的整数(integer)倍的粒子叫作玻色子,如光子、胶子(gluon);自旋大小是约化普朗克常数的1/2、3/2、5/2这样的半整数(half integer)倍的粒子,叫作费米子,如质子、中子、电子。玻色(Satyendra Nath Bose)是一位印度物理学家,费米(Enrico Fermi)则是意大利裔美国物理学家,被称为“核物理之父”。

泡利不相容原理

玻色子和费米子的最大区别,体现在泡利不相容原理上。

泡利不相容原理说的是,一个系统内不能存在两个状态完全相同的费米子,玻色子则没有这个限制。状态不同是指两个费米子只要有一个性质不一样,就可以存在于同一个系统中,如果所有性质都完全一样,就无法存在于同一个系统中。

有了泡利不相容原理和自旋的概念,我们就可以把电子安放到原子的轨道中去。

电子分层结构

原子内的电子轨道能量是从低到高排列的,我们想要了解的是原子处在能量最低状态的结构。

不同元素的原子中电子的数量不同,其数量等于原子核的正电荷数。

假设某种元素的原子有N个质子,相应地就有N个电子,这N个电子要一个一个放到该原子的轨道里。第一个电子当然是放在能量最低的轨道,那第二个电子放在哪里呢?当然也是放在剩下所有可能的轨道中能量最低的轨道中。在同一个轨道,由于电子有自旋,其自旋可以有两种情况,分别是南极朝上和南极朝下,也就是说,两个电子的自旋虽然大小相同,但方向相反,所以一个轨道里最多可以放两个电子,而且这两个电子的能量相同。

第一层,能量最低的轨道最多放两个电子,再放就放不进来了。根据泡利不相容原理,第三个电子无法取到跟两个电子都不同的状态,只能往第二层的轨道放。第一层轨道电子的波函数的形态是个球形。

第二层轨道有很神奇的特点,它有四个分轨道,这四个分轨道的能量都一样,但是有不同的性质,叫轨道角动量(orbital angularmomentum)。对第二层轨道解薛定谔方程,会发现第二层轨道对应的波函数总体上相对于原子核呈哑铃状。既然是哑铃状,可能的方向就有三个,即空间的xyz轴三个方向。同时,第四个分轨道也是个球形波函数,这个球形波函数比第一层的球形波函数大一圈。

图11-4 不同能量等级的三维波函数

这四个分轨道有四个不同的状态,叫作它们的角动量量子数。根据泡利不相容原理,每个分轨道可以放两个电子,四个分轨道虽然能量一样,但多了角动量量子数这个新的性质,处在四个不同分轨道里的电子状态各不相同。每个分轨道两个电子,所以第二层可以放8个电子。

第二层轨道填满以后,已经有10个电子,第11个电子就要往第三层放了,第三层有更多分轨道,算起来可以放18个电子。

依此类推。天然元素到92号元素铀(uranium),最多92个电子,算上人造元素,也不过是至多118个。电子很难继续增加,因为原子核无法承载过多的质子,再多就不稳定,会发生核裂变(nuclear fission)。

能级变动

真正的原子内电子的排布,并非如泡利不相容原理安放电子那么简单,虽然大原则确实如此,但是实际情况中还受到其他因素影响。比如电子围绕原子核运动时,自身会等效产生电流,电流会产生磁场,磁场会跟电子的自旋发生作用,导致能量的变动;内层电子相对于外层电子抵消了一部分原子核的正电荷,因此外层轨道的能量也会发生变动。最终一个原子能量最低的结构,是综合考虑了所有因素的结果。这个计算和实验验证的过程相当复杂,但主要的决定因素是薛定谔方程、能量最低原理和泡利不相容原理。

至此,通过薛定谔方程、能量最低原理和泡利不相容原理,我们几乎把原子的内部结构研究明白了。但为什么波函数会是量子力学的表达形式?量子力学的第一性原理是什么?量子力学波函数表达背后的本质又是什么呢?

第六节 哥本哈根诠释

在微观世界,如果用概率的语言来描述系统的状态,只要有薛定谔方程,就能了解原子中的电子会以什么概率出现在不同位置,原则上就能将其状态描述清楚。

对于微观粒子的运动状态,除了测量它的位置以外,还有很多其他的物理量可以测量,比如速度、能量、自旋等各种物理量。既然微观粒子的位置无法精确预测,只能用概率波来表达,那么,可以推论它的其他性质,比如速度,也可能是无法精确预测的。速度的变化也可以对应于一个波函数,只是这个波函数的自变量不是位置,而是速度,纵坐标依然是概率密度(probability density)。

目前量子系统的运动规律,只能用概率的方式来描述。这背后的原因是什么?为什么会这样?玻尔以及他的学生——德国物理学家海森堡带头给出了关于如何理解量子系统这种特性的办法,这个办法叫哥本哈根诠释。哥本哈根诠释是对量子系统测量过程的物理学描述。玻尔是丹麦哥本哈根大学的学术带头人,以他和海森堡为核心的学派叫哥本哈根学派。

同时处在不同状态的系统

我们该如何理解量子系统的波函数表述呢?哥本哈根诠释的解答是:一个量子系统可以同时处在不同的状态,这个状态叫量子叠加态。当你去测量这个系统的状态时,你只能随机地获得其中一个状态;当你测量的时候,这个系统所处的量子叠加态的波函数就随机地、瞬间地坍缩(wave function collapse)成了其中一个状态所对应的波函数。

比如,一个粒子可以同时处在原子核周围的不同地方。如果真的去测量它的位置,你测量到的是它其中的一个位置,至于具体是哪个位置,则完全是随机的。比如,准备一万个完全相同的量子系统并测量它们的状态,你会得到一万个结果。但可能某些结果出现的频率高一些,某些结果出现的频率低一些,这个频率的分布就是概率分布,也就是概率波。

测量即瞬间“坍缩”

可以这样理解哥本哈根诠释:一个原子中的电子没有被测量时,它同时处在多个状态的叠加。但当测量时,你只能得到一个最终的状态。也就是它的波函数在测量前是分散的,但测量后立刻变为在一个位置是100%,其他位置都是0。这个电子的波函数在测量前后发生了瞬间的变化,从一个分散的函数变成了一个集中在一点的函数。根据哥本哈根诠释,这个由测量导致波函数骤变的过程,叫作坍缩。

测量之后,原本分散的波函数,随机坍缩成了其中一个集中的波函数。坍缩的过程是完全随机、不可预测的,它没有从大变小的中间态,是不连续的,像瞬间完成的一样。就像一根雪糕,你没看见它融化,也没看见有人吃了一口,就突然没了一截,是没有中间过程的,这就是哥本哈根诠释。

图11-5 坍缩的过程示意图

薛定谔的猫(Schrödinger's cat)

哥本哈根诠释对于量子力学的描述,不仅从概念上难以理解,而且也从根本上挑战了大部分人的基本哲学观——因果关系。你用相同的方法测量若干个处在同一状态的系统时,得到的结果却是随机的,只是在概率分布上有一定的特点,这在本质上从量子力学层面否认了因果律。

因果律的核心是:一个结果必然对应一个原因。相同的测量方式下,却得到不同的结果,较难理解,那就只能换一种方式来理解量子层面的因果律了:概率分布唯一确定,但具体的结果却不是唯一确定的。

这让当时的物理学家难以接受,比如薛定谔就反对这个观点。尽管他已经给出了薛定谔方程,但他本人并不认同这种否定因果律的诠释。于是,薛定谔做了一个思维实验,用以阐释哥本哈根诠释的不合理性,这就是著名的“薛定谔的猫”。

薛定谔假定,有一只猫被放在一个盒子里。盒子里有一个装着毒药的瓶子,瓶子与一个处在叠加态的量子开关相连。现在关上盒子,并规定打开盒子这个动作会对量子开关进行一次测量,测量最终会给出量子开关到底是开还是关的结论。如果是开的,瓶子便释放毒药,猫就死了;如果是关的,瓶子不会释放毒药,猫活着。

图11-6 薛定谔的猫

如果不打开盒子还要描述盒子中猫的状态,我们只能说这只猫是既死又活的,或者说是半死半活的。此处就与常识相违背了,现实中的猫要么是死的,要么是活的。即便是修辞手法中说的“半死不活”的猫,也是活的猫。这个思维实验的结果严重违反常识,因此可以说是对哥本哈根诠释的反讽。

薛定谔通过“薛定谔的猫”这个思维实验,试图用一个与常识相违背的描述方式来阐述哥本哈根诠释的不合理性。但转念一想,我们之所以会有生活常识,本质上都是因为在对生活中的一切事物做各种各样的感知,这种感知在物理学上的本质就是测量。

要判断一只猫的死活,你就必须用各种方式跟猫发生耦合。比如看它一眼,或者听它的叫声。哥本哈根诠释恰恰就揭示了:在量子力学中,一切皆测量,不测量就不存在描述。我们只能用测量的结果,反向对事物进行描述。当没有去测量猫时,我们说它处在半死半活的状态没有逻辑问题,半死半活只与测量后的经验不符,但并无法证伪违背测量前可能存在的状态的合理性。

什么是“真随机”?

到这里,量子力学中的两大阵营已经出现了。一个是以玻尔、海森堡师徒俩为首的哥本哈根学派主张的量子叠加态。他们主张量子系统的真随机性,也就是测量后会得到什么结果,完全是不可预测的,随机的。

真随机和我们生活中的普通随机不一样。比如,掷骰子时每个面朝上出现的概率都是1/6,其实是因为我们的眼睛无法在扔出的瞬间看到骰子的速度和角度。如果有个高速摄像机,在骰子掷出的瞬间就分析出它的角度、速度和高度,完全可以计算并预测骰子最后得出的数字是多少。这里存在一个隐含变量(hiddenvariable),也就是骰子被扔出时的运动情况。只是这个情况不明显,从肉眼看像是随机的,因此是伪随机。哥本哈根诠释认为量子系统中不存在这样的隐含变量,这个随机结果是真随机,真的无法预测。

另外一派则以薛定谔和爱因斯坦为首。他们认为,量子叠加态主要是因为我们的实验手段和理论不够先进。就像扔骰子一样,因果律其实是成立的,之所以用概率波的形式描述量子力学,不过是因为我们还不知道量子过程中的隐含变量是什么而已。

两派观点在历史上针锋相对,僵持不下,都有各自的研究进展。就目前的物理学研究来看,结果似乎更偏向哥本哈根诠释这一边。为什么会出现这种真随机?量子力学背后的这种真随机的原理是什么?答案就是海森堡的不确定性原理(uncertainty principle)。

第七节 不确定性原理

什么是不确定性原理

如果真如哥本哈根诠释所说,我们只能用叠加态的方式来描述量子力学系统,则量子系统从根本上无法精确预测。其背后的原理就是量子力学的基本原理——海森堡提出的不确定性原理。

不确定性原理说,我们无法同时精确测量一个满足量子力学描述的微观粒子的位置和速度。你若测得它的精确位置,就无法精确测量其速度,反之亦然。

之所以用概率波去描述量子系统,是因为量子系统具有不确定性,不可精确预测。概率波的描述和不确定性原理可以说互为充要条件。有不确定性原理则必有概率波描述,概率波描述必对应不确定性原理。

为了证明这一点,不妨让我们假设不确定性原理是错的,假设我们能够同时确定一个微观粒子的位置和速度,那你会发现概率波函数的描述就崩溃了,为什么?假设现在已经测量出一个微观粒子的位置,并且知道了它的速度,由于位移=速度×时间,因此我们可以精确地预言下一个时刻它会出现在哪里。如果没有不确定性原理,粒子的轨迹能够被唯一地确定,根本用不到概率波。所以,如果概率波是最根本的量子力学系统的描述方式,则必有不确定性原理之正确性。不确定性原理作为量子力学的基本原理,又必然可以导出概率波的表述。

电子是个“小球”吗?

即便如此,不确定性原理所表达的内容仍然令人十分费解。这些微观粒子不就是体积很小的小球吗?怎么会出现位置和速度无法同时确定的情况呢?任何一个宏观物体都可以同时确定其速度和位置,为什么微观粒子就无法确定了呢?

理解这个问题的关键在于对微观粒子的认知,我们认为:像质子、电子这样的微观粒子可能就是一个小到只有千分之一纳米的小球。问题就出在这个“是”字上,当我们说出“微观粒子就是个小球”时,我们对于这个“是”字是没有经过检验的。

我们通过实验,比如将电子打在铺满荧光粉的墙面上,发现墙面上电子的形象就是一个很小的点,于是默认电子必然是一个小球。但是将电子打在墙面上是一个测量过程,这个过程告诉我们小球的位置信息。当测量电子的位置时,它的空间属性是个小球。但测量速度时,我们无法确定在以一定速度运动的过程中,电子是否还是一个小球的形态。

如果抛开“电子是一个小球”的执念,我们就能更好地理解无法同时将两个性质测准这件事。在宏观世界,这样的情况很普遍。比如,体能测试里有两个指标是测心肺功能的:一个是肺活量,另一个是激烈运动后的心率。很显然,这两个指标是无法同时测准的,肺活量必须在平静的情况下测,激烈运动后的心率必然是在激烈运动后,比如跑两圈后再测量。因此,肺活量的测量和激烈运动后心率的测量是不兼容的,你不会觉得这有什么难以理解的。

为什么放在电子的测量上,就会觉得两个物理量不能同时测准如此难以理解呢?因为你已经主观预设微观粒子是个小球。但是只要放下“微观粒子是个小球”的执念,不预设它“是”什么,理解不确定性原理就会变得很简单。对于一个微观粒子,速度和位置这两种测量并不兼容,就像测量人体的肺活量和激烈运动后的心率不兼容一样。也就是说,微观粒子不是一个小球。

不确定性原理的哲学启示

那么微观粒子到底是什么?这是一个非常好的问题。首先回想一下,你如何描述一个东西是什么?本质上,人们描述任何一个物体,所描述的都是这个物体的性质。一个物体具体是什么,体现为它所表现的所有性质的集合。

人们会给宏观物体起各种各样的名字,比如一个苹果,一个球。但是如果要解释什么是苹果,什么是球,只能把苹果、手机的性质一条条地描述出来:苹果吃上去是酸酸甜甜的;形状是上面比较大,下面比较小;颜色是红的、绿的等。人们将有这种共性的水果,抽象成为一个概念,叫作苹果。我们说铅球是一个球时,无非是因为它的形状呈现为球形,我们命名这种形状,叫作球。我们之所以对球这个形状有认知,是因为我们用视觉对它进行了“测量”。也就是说,我们对于物体是什么的描述,本质上是对它在不同测量方式下得到的结果的集合的描述。

在微观世界,对于电子这么小的粒子来说,人们没有视觉这种知觉。宏观物体有确定的颜色、形状,能被肉眼看见,是因为它们的大小尺度比光波的波长尺度大很多,能反射光,但是像电子、原子这样的微观粒子,它们的大小比光波的波长还要小很多,无法反射光,因此无法被视觉感知。基于这种情况,我们无法用小球这样的视觉概念去形容它们。为了感知微观粒子的存在,人们只能通过各种各样的实验去测量它们,通过不同的实验测量得出不同的结果。对我们来说,这些微观粒子就是这些实验测量结果的集合。

这里我们得到启示:在量子力学中,不能说一个物体“是”什么,只能说这个物体或者系统在某种测量下呈现出某个结果。而且测量和测量之间,很有可能是不兼容的,也就是说,目标对象很有可能在同一状态下无法给出两个性质的确定结果,这就体现为针对同一量子系统的两种测量之间的不兼容性。

不确定性原理告诉我们:由于位置和速度是不兼容的测量,所以量子系统中不存在确定的微观粒子的运动轨迹。只要认为微观粒子的运动有轨迹,我们就等于已经预设它是一个小球,从根本上违背了描述量子系统的原则

不可对易性(non-commutability)*

通过解量子系统的薛定谔方程,我们可以解出系统以时空坐标为自变量的概率波函数,并且通过波函数,我们可以算出量子系统的各种可测量的物理量。譬如,我们通过解原子中电子满足的薛定谔方程,可以天然地从电子的波函数中算出电子在原子中的能量是量子化的,但这只是数学结论,解微分方程的时候,会发现量子化是数学推理的必然。如果抛开数学,量子系统的这种“量子化”特性,有什么更加本质的原因吗?不确定性原理刚好可以描述这种量子化特性的本质。

量子力学的量子化特性,本质上是说,万物存在最小单元,甚至不同系统的很多物理量存在数值上的最小间隔,不能如一条数学曲线一样连续发生变化,世界是用乐高积木拼出来的,不是橡皮泥捏出来的。普朗克常数的数量级大小就表示了这块最小的“乐高积木”的尺度。

不确定性原理说的是无法同时精确测量出一个微观粒子的速度和位置,但是这种不精确的精确度到底如何呢?就算不精确,至少也应当有一个数值吧?既然世界是由最小构成单元组成的,那么很明显,这种对于量子系统测量的精确度,最多就是精确到最小单元本身的尺度,因为如果比最小单元的尺度还要精确的话,就说明最小单元依然可分割,这个最小单元就不是最小单元了。因此,约化普朗克常数尺度就应当是不确定性原理所预言的最精确的精确度。不确定性原理的表达式:

这里的σx表示你去测量一个粒子位置的最小误差,即位置测量的精确度;σp则是你去测量一个粒子动量的最小误差,即动量的精确度。这两个精确度相乘,必须要大于约化普朗克常数的一半。如果位置测量无比精确,误差为0,即σx=0,为了让这个不等式成立,则σp必须要趋向于无穷大,因为0乘以任何一个有限的数都是0,即一旦对位置的测量极其精确,对于正比于速度的动量的测量就必须极其不精确。不论你如何改变测量方法,测量的总体误差一定不为0,一定存在一个间隔,这个间隔就是量子化的本质。

不确定性原理描述了对于粒子的位置和速度这两个测量的“不可对易”,即这两个测量的操作不可交换。这里的不可对易,应当理解为,一个微观粒子,你先测它的位置再测它的速度,把测到的速度和位置相乘,和先测它的速度再测它的位置,把测到的速度和位置相乘,这两组乘积并不相等。这和数学乘法交换律是不同的,也就是a×b≠b× a。如果你学过线性代数,就会知道,当a和b是两个矩阵(matrix)时,通常a×b≠b×a,而在海森堡发明的、用以描述量子力学系统的矩阵力学(matrixmechanics)中,每一种针对量子力学系统的物理测量,都可以用矩阵来表示,也就是说,矩阵力学的数学形式天然描述了不确定性原理。

这种不可对易,也可以用来理解为什么量子系统存在量子化,我们甚至可以用一个宏观世界的案例来解释。我们想象有一个球体,在球体里建立一个三维直角坐标系x-y-z,原点处在球心,z轴指向南北极。假设在球的北极点有一个指向北的箭头,这个时候我们考虑两个操作,分别是让球以x轴为转轴顺时针旋转90°,再让球以y轴为转轴逆时针旋转90°。那么这两个旋转操作是不可对易的,因为你会发现,北极点的指针方向在以不同顺序分别进行两种操作后,是不一样的,两种结果之间会有一个角度差。用这个例子类比不确定性原理,它恰恰表征了量子系统的量子化来源,正是这种对于量子系统测量的不可对易。

第八节 EPR悖论

不确定性原理与哥本哈根诠释

不确定性原理可以说是量子力学的根基性原理。它无法被证明,只能通过实验归纳总结出来。承认不确定性原理,就相当于承认了哥本哈根诠释。我们可以用不确定性原理来描述哥本哈根诠释。

哥本哈根诠释说的是:量子系统可以同时处在不同状态的叠加,一旦测量,量子系统会随机地坍缩成为其中一个状态。也就是测量前后,波函数会发生突变,而且这个过程是瞬时的,没有中间态。

海森堡的不确定性原理说的是:无法同时精确测量出一个微观粒子的速度和位置。或者对于微观粒子来说,速度和位置的测量不可交换,用量子力学的专业术语则是,一个满足量子力学规律的微观粒子,速度和位置的测量操作不可对易。此外,不光速度和位置的测量不可对易,还有很多物理量是不可对易的,比如能量和时间。

如何用不确定性原理来理解哥本哈根诠释呢?根据哥本哈根诠释,一个粒子的状态可以用量子叠加态来表示。比如,这个粒子有可能存在于若干个位置,并且每个位置的概率不同,但它们的概率相加必然是1。同时,这个粒子的速度也处在叠加态。以速度为自变量,可以写下它的概率波函数。

假设我们测量一个粒子的位置,得到一个精确的位置结果。根据不确定性原理,这时它的速度,必然是不确定的。根据哥本哈根诠释,以速度为自变量的波函数必然是多个速度状态波函数的叠加,如果我们立刻去测量它的速度,处在叠加态的波函数会随机地坍缩到其中一个波函数,让我们随机地获得一个速度。按理说,我们现在已经测过粒子的位置了,也随机获得了它在这一时刻的速度,是不是就能预测它下一秒的位置了呢?真实情况并非如此。当测量速度时,粒子的速度虽然确定了,但是根据不确定性原理,它的位置又将变得极其不确定,根据哥本哈根诠释,以位置为自变量的波函数又变成了若干个位置波函数的叠加态。这时再去测量粒子的位置,它会随机地给出一个位置结果,因此我们依然不知道它下一刻会出现在哪里。分析到这儿,我们会发现哥本哈根诠释和不确定性原理是等价的,它们能相互解释。

爱因斯坦的思维实验:量子纠缠(quantum entanglement)

爱因斯坦认为,不确定性原理从根本上否认了因果律。这样的哲学观爱因斯坦是不接受的。爱因斯坦认为,量子力学的随机不是真随机,一定存在隐变量在决定每次做测量时测得的结果。波函数即便有坍缩的过程,该过程也必定是连续的。为此,爱因斯坦设计了一个思维实验企图证明哥本哈根诠释和不确定性原理是错误的,这个思维实验叫EPR悖论。EPR分别是爱因斯坦(Albert Einstein)、波多尔斯基(Boris Podolsky)和罗森(Nathan Rosen)三位科学家的姓氏首字母缩写。

这个思维实验是这样的:我们想象一个只可能处在状态A或者状态B的量子系统,根据哥本哈根诠释,这个量子系统的状态可以写成一定概率的状态 A 和一定概率的状态 B 的叠加,这两个概率加起来要等于 100%。当测量系统状态时,得到的只是系统处在状态 A 或者状态 B的具体结果。同理,把两个量子系统放在一起时,可以通过调节系统状态,让二者之间产生关联。

为便于讨论,可以只看两个相互关联的电子,我们把状态A理解为电子自旋向上的状态,把状态B理解为电子自旋向下的状态,这种相关联的状态叫作纠缠态。有一种纠缠态可以是这样的:两个电子组成的系统的状态可以写成“一定概率的两个电子都处在状态 A 加上一定概率的两个电子都处在状态 B”。现在去测量其中一个电子,如果得到的结果是状态 A,这时甚至不用再对另外一个电子做测量,就可以判断出它也处在状态 A。反之,如果我测量其中一个系统得到状态 B,也可以不用测量另外一个系统就知道它也处在状态 B。

至此,爱因斯坦推导出了一个与狭义相对论矛盾的推论:在上面提到的两个纠缠住的系统中,这种纠缠态与两个系统之间的物理距离并没有必然联系。我们可以让两个系统的距离非常远,这时纠缠的状态依然存在,这里就出现了悖论。

举个例子,我跟你两个人一人手上拿着一个电子,我们让这两个电子处在量子纠缠的状态。你拿着电子坐宇宙飞船去了1光年以外,这时,只要测量一下我手中电子的状态,假设它此时处在状态 A,由于我们手上的电子是相互纠缠的,我就能立刻知道你手上的电子也处在状态 A,于是你那边的信息就瞬间被我知道了。这是一种超距作用。但是我们知道,任何信息的传播速度都无法超越光速,超距作用并不存在,它违背了相对论。问题出在了哪里呢?一路追溯上去,只能说量子纠缠这种状态不可能存在,哥本哈根诠释是错的。这就是 EPR 悖论。

图11-7 爱因斯坦和普朗克的信息传递游戏

量子纠缠超光速吗?

事实上,量子纠缠这种现象是存在的,我们甚至还能利用量子纠缠制造量子计算机(quantum computer)。爱因斯坦的悖论不仅没有推翻哥本哈根诠释,没有否定不确定性原理,反而提出了量子纠缠这种现象以验证其正确性。

爱因斯坦错在哪里呢?难道是相对论错了?可以存在超光速的信息传递吗?问题在于我们对信息的认知。量子纠缠的现象似乎可以让我们瞬间知道几光年以外的事情,但是这种“知道”并非信息,因为它不是确定的。

什么叫信息?对方给你传递的确定的内容才叫信息。比如,我们手上各拿一个纠缠在一起的电子,这时,你去外星寻找水源,我们约定,如果你找到了,就让你手里的粒子处在状态 A,没有找到,就让它处在状态 B。假设你真找到了水源,这时你希望让我也知道,你想让我探测一下我手中的电子,并测得电子处在状态 A。你能做到吗?你做不到。虽然我们手上的粒子处在同一个状态,但是你无法控制我测量时具体得到的是状态 A,还是状态 B。你可以先测量,但你也无法控制测量的结果是什么。如果你得出了状态 A 或者状态 B,我也必然得到同样的答案。正因为无法控制结果,所以,你没有办法“告诉”我确定的信息。

在这个测量过程中,没有确定的信息传递,因此它并不违背相对论。一旦测量之后,我们手上的两个粒子就确定落入了同一个状态,它们之间从此就不存在量子纠缠了。

波函数坍缩过程是连续的

经过爱因斯坦的这番论证,哥本哈根诠释和不确定性原理反而更加牢靠了。但是哥本哈根诠释关于波函数坍缩过程的描述,最近被证明并非完全正确。

2019年6月,耶鲁大学的一个实验团队用巧妙的实验办法,证明了波函数的坍缩过程不是瞬时的,而是有中间过程的(即便具体坍缩到哪个波函数是随机的)。但是,一旦决定好要坍缩到哪个状态后,波函数坍缩的过程却是连续的,确实有一个中间态存在。因此,爱因斯坦关于波函数连续性的直觉似乎是正确的。

就目前为止,量子力学的真随机性似乎牢不可破,但是从物理学的角度,应该如何理解它呢?其中,平行宇宙(parallel universe)理论是一种解释方式。

第九节 平行宇宙理论

平行宇宙理论是什么

对于平行宇宙,相信你一定不陌生,它已经被很多科幻小说和电影反复使用,是一个非常神奇的概念。与其说平行宇宙是一个物理学概念,不如说它更像一个哲学观念。它至今未被证实,并且似乎被证实的可能性很小,但它又确实是量子力学不确定性原理的一个合理解释。

平行宇宙理论的最早提出人是薛定谔。薛定谔除了拥有骄人的物理学研究成果以外,也是一位卓越的哲学家、思想家。薛定谔在1952年于爱尔兰首都都柏林召开的一次学术研讨会上,做出了关于平行宇宙理论的发言。他在发言前给与会者们打了预防针,请大家做好心理准备,他的发言会让人认为他疯了。

平行宇宙的理论是用来理解不确定性原理的,也可以说是用来解释哥本哈根诠释的。

哥本哈根诠释是说,一个系统在测量前处在多个状态的叠加态,一旦测量,只能随机地获得其中一个状态。

平行宇宙理论这样解释波函数的坍缩:并不是因为我们只能随机地获得其中一个状态,也不是因为波函数有坍缩的特性,而是当测量后,所有可能的结果都同时产生了,这些不同的结果对应于多个不同的平行宇宙。

举个例子,你正在参加高考,碰到一道不确定的选择题。这道题如果答对了,你的分数刚好可以过一本线。但是如果答错了,你最后的分数就只能上二本院校。你对这道题实在没有把握,于是拿出一个量子系统并按下开关,对这个量子系统做测量。这个量子系统有四个可能的状态,对应于 A、B、C、D 四个选项。根据哥本哈根诠释,你最终会随机获得四个答案中的一个,其中只有一个答案是正确的。平行宇宙对这个过程的解释是:并不是你注定上一本或二本,而是你做出选择的一瞬间,四个平行宇宙就产生了。四个平行宇宙中,只有一个平行宇宙中的你选对了正确答案上了一本,其余的三个平行宇宙中的你都去了二本。

这就是平行宇宙对于哥本哈根诠释的解释。平行宇宙理论认为:不存在随机的选择,所有的可能性都以新的平行宇宙的形式产生了。只不过作为人类,我们的精神只能与其中的一个结果耦合。因此在我们看来,我们是随机地获得了一个测量结果。

图11-8 平行宇宙幻想

第五维度

平行宇宙的理论打开了一个新的时空维度,叫可能性的维度,也可以被认为是第五维度。

人的感知是存在于四维时空中的,我们应该如何理解第五维度呢?可以把人的一生,或者宇宙的一生,从出生到死亡当作一条线。这是一条时间线,它是四维的,其中的每一个点都有四个坐标,也就是一维的时间坐标和三维的空间坐标。

我们可以通过类比,从几何学的角度定义从一维展开到二维是怎样做到的。在纸上画一条线,它定义了一维;如果要定义二维,办法是让这条一维的线分叉为两条线,这两条线在一起,就定义了二维的平面。定义五维也是一样的。一个宇宙的诞生到灭亡是一条完整的时间线,只要让这条时间线分叉,它就从四维升高到了五维。对于人类这样的四维生物来说,第五维度就是每做一次量子系统的测量分出来的不同的时间线,它是可能性的维度。

宇宙发展到今天,量子过程不计其数,每一次的测量,都对应于新的平行宇宙。这些平行宇宙在相近的时间尺度上是接近的,但是随着时间的推移,宇宙和宇宙之间的差异越来越大,就好像一棵树的树枝,在生长过程中不断地分叉,于是存在无限个你,生活在无限个平行宇宙中。这无限个你,可能人生轨迹完全不同,有不同的职业、不同的性格等。

平行宇宙理论目前还无法用实验证明。虽然也有这方面的研究,但并不是一个主流的研究方向,它更像对哥本哈根诠释和不确定性原理的哲学解释。

至此,我们已经从一般意义上回答了事物的基本构成:万事万物由原子构成。道尔顿和布朗运动证明了原子的存在。通过约翰·汤姆逊,我们知道了原子依然有内部结构,里面有电子。通过卢瑟福散射实验,我们知道原子由原子核和电子构成,电子带负电,原子核带正电。一个原子里,负电的数量(电子个数)等于原子核带正电的质子数。

我们知道了在原子内部,电子围绕原子核的运动是没有明确轨迹的,它的规律由概率波来描述。电子围绕原子核的运动满足薛定谔方程,通过薛定谔方程,我们能够解出电子的能量,得到电子波函数的数学形式。结合电子轨道的能级,以及泡利不相容原理,我们能够理解电子在原子内是如何进行排布的,原子的化学性质就由电子的排布结构决定。

由量子系统的波函数的表述,可以总结出量子力学最基本的原理——不确定性原理。不确定性原理和哥本哈根诠释等价,一个量子系统可以同时处在不同状态的叠加,一旦测量,量子系统随机地坍缩到其中一个状态。

这样一来,我们对于原子的理解已经可以说是比较通透了。这时就要追问,原子核有什么性质?它有没有更基本的结构?既然不同的原子之间性质不一样是因为原子核可以带不同量的电荷,且不同的原子里面的电子数是不一样的,那么原子核是否应该也有内部结构?原子核里有什么?原子核内部的物质,它们的运动规律是什么样的?我们要把研究极小的眼光,再缩小一层,把显微镜对准原子核内部,这就自然而然地引出了一个新的物理学分支——核物理。