| 本文为“身边的微分方程”系列第7篇。难度提示: 若想了解本系列及本专栏其他文章,请收藏目录: 或按下文方法关注本专栏: 0) 开篇语本文中,我们将迎来本系列的一位VIP,它是主宰微观世界运行规律的基本法典、更是开创二十世纪灿烂物质文明的第一推动。 即使不抬头看本文标题,我们也能猜到,本文要出场的这位VIP,就是薛定谔方程:
关于它如何为现代文明带来的一个个神迹,我们将在后续的几篇文章里慢慢体会。 在此之前,我们需要先来参悟一下方程本身的意义。 不然,等我们自虐般地解完一堆不同束缚态的薛定谔方程之后,可能仍然不知道自己在干啥。 而为了达到循序渐进的效果,我们将薛定谔方程的参悟的过程,由具象到抽象、拆成两个问题来回答:
1) 求解薛定谔方程能得到什么?在中学物理中,我们就知道,一个原子核的核外电子的能量往往不能连续取值,而只能处在一些分立的能量值上面,这些分立的能量值叫作电子的能级(Energy Level)。 当我们在化学课中讨论一个元素化学性质的第一性原理时,或者当我们在半导体物理中讨论导带、禁带等决定半导体材料性能的关键因素时,其实本质上就是在直接或间接讨论原子核外电子的能级分布。 而这些能级分布的信息,正是薛定谔方程给出来的。 换句话说,求解薛定谔方程能得到的最重要的信息,就是一个体系中允许存在的能级。 如果先放下整个方程的物理意义不谈,仅仅满足于“得到能级信息”这个实用主义的目的,那么这个求解过程理解起来并不难,我们马上就能体验一番。 先来瞥一眼薛定谔方程:
此处:
而为了方便讨论,我们不妨先将方程简化为一维情形,此时梯度算子退化为对 坐标的偏导数,方程简化为:
根据我们在前面几课中对线性偏微分方程的认识,我们知道,要求解这样一个方程,标准做法是先分离变量,得到关于坐标和关于时间的两个独立的函数,记为:
这样,方程就化为:
两边同时除以 ,得:
我们不妨令方程两边同时等于某个常数:
这样就能将两个独立的方程分别求解了。 而根据以前求解弦振动和热传导方程的经验,我们需要重点关注的,通常是坐标的方程:
为了方便后面的讨论,我们将两边同时乘以 ,这样方程化为:
这个方程叫作定态薛定谔方程(它也是我们讨论薛定谔方程意义的关键 )。 回顾本系列以前的文章中求解弦振动方程和热传导方程的经验,我们可以猜到: 如果限定了边界条件,那么我们通常会得到这个方程的一组特解序列 ,而每个特解会对应一个常数值 ,满足方程:
这里得到的常数序列 ,就是粒子能量允许出现的取值,也就是能级。 这里顺便说一句,一个体系里允许的能级 ,在量子力学中被称作能量的本征值(Eigen Value),请记住这个词,它是我们理解方程物理意义的关键。 到这里,用薛定谔方程寻找能级的过程就说完了。 看起来是不是很简单?我们仅仅调用一下已经在前面的课程中练过手的分离变量法,就能解出允许出现的能级取值,这完全体验不到烧脑的感觉啊…… 但是别忘了,我们在这里仅仅是对求解步骤做了一个简单介绍,而并没有真实地经历在具体的势能条件下求解 的过程。 相信我,等后面我们给出了具体的势能函数 ,真正动手求解的时候,就会发现岁月静好都是假象。真实情况是,哪怕面对的是所有元素中最简单的氢原子体系,求解过程都会让我们痛苦到怀疑人生。 但不管怎么样,如果我们不去纠结“为什么薛定谔方程解出来的 就是我们要找的能级”之类的深层次问题,仅仅就功利主义的目的而言,理解到这一步,就可以进入具体的物理场景中求解薛定谔方程(虽然很痛苦 )、去见识那些改变人类历史进程的神迹了。 不过,作者相信,本文的读者不会甘心就此打住,因为我们对于薛定谔方程的困惑实在太多: 比如波函数 以及特解序列 的物理意义是什么?又比如为什么体系允许的能级 必须通过求解薛定谔方程来得到? 这两个问题的背后,其实也就是我们将要回答的第二个问题:
如果要用两句话来回答这个问题,我们可以说: 定态薛定谔方程就是经典力学能量关系:
的量子版本。 而完整的薛定谔方程也可以看作牛顿第二定律的量子版本。 但是同学们要问了:这些方程的形式和经典力学看起来完全不像啊,怎么把它们联系起来呢? 在回答这个问题之前,我们还得追溯到一个更根本的问题: 进入量子力学世界的正确姿势是怎样的? 可能……是这样的? 2) 进入量子力学的正确姿势我们知道,在经典力学中,描述一个物理对象的状态时,我们用的是具体的、可以测量的力学量(如位置、速度、动量、能量等 )。 而在量子力学中,一个物理对象或体系的状态,只需要用一个抽象的东西来描述,它叫做“态矢量 (State Vector)”,也就是我们通常说的“量子态”。 (比如薛定谔的猫那种既生又死的状态就是态矢量的一个虚构的、但是很直观的版本…… ) 而这个抽象的态矢量有一种定量化的、可用于计算的表述方式,这正是波函数 当然,有同学会很好奇:一个函数怎么和一个被称作“矢量”的玩意儿联系起来? 这个我们后面再来体会。 现在我们来关注一个更重要的问题: 在量子力学中,我们熟悉的经典力学量信息被扔到哪里去了? 毕竟,宏观世界与微观世界不是割裂的,所以,经典力学中能得到的信息,量子力学中也必须包含。 这个问题的答案也不难猜到: 经典力学量的信息当然应该都包含在波函数当中。 不过,这种说法还不够准确,更准确的说法是: 经典力学量的信息都以概率形式被包含在波函数当中。 换句话说,波函数不是一个具体的物理量,但它包含了所有经典力学量的概率信息。 这样一来,从字面上来说,波函数 的物理意义就清楚了: 它是一个包含了所有经典力学量概率信息的抽象物理量“态矢量”的具体化身。 (更准确地说,是在“坐标表象”下的具体化身,但这里我们不用去关注什么是“坐标表象”,有兴趣知道的同学可以关注本专栏另一个深度科普系列:从线性代数到量子力学) 那么具体怎么包含这些概率信息呢? 相信本文的读者都听说过薛定谔的猫吧,我们先用它来做一个不严谨的说明。 我们知道,在这个思想实验中,有一个盒子里装了三样东西: 一颗可能发生衰变的粒子、一台可以被粒子的衰变触发的杀猫神器、和一只万年猫。 当我们不打开盒子时,对于盒子外面的观察者而言,粒子的衰变状况就是一个不确定的状态,相应地、猫就处于一种“既生又死”的叠加态。 这种叠加态,就是一个典型的(虽然是虚构的 )态矢量,事实上,我们可以像向量的线性组合一样,将它表示成向量叠加的形式:
这里我们采用的是一种叫做“狄拉克符号”的记法,其中 就是描述“既生又死叠加态”的态矢量,而 表示观察到活猫的“活猫态”, 表示观察到死猫的“死猫态”。 将它表示成几何直观,就是这个样子: 也就是说,当我们不去观察猫时,猫实际所处的状态,是“活猫态” 和“死猫态” 的线性叠加,这在经典物理中不可能存在的状态,恰恰是量子力学的最大特征。 现在我们来说说概率信息: 刚才我们看到,猫的态矢量的线性叠加关系中,有两个叠加系数 ,这两个系数就包含了概率信息。 具体说来,就是当我们打开盒子观察猫的死活时,猫的状态会随机坍缩到“活猫态”和“死猫态”当中的一个,坍缩到“活猫态”的概率是 ,而坍缩到“死猫态”的概率是 这就是态矢量包含概率信息的原理。 我们来看两个真实的例子。 3) 概率信息与本征态第一个例子,是我们在很多量子力学科普书上都看到过的,波函数的统计诠释: 一个粒子的波函数的模方 ,表示 时刻在 处找到这个粒子的概率密度。 这句话就描述了波函数如何包含粒子位置的概率信息,后面的课程中,我们会看到它给我们带来的好处。 不过,位置毕竟只是众多力学量中的一个,我们还要关注其他的力学量。 虽然其他力学量的概率信息不再像位置的概率信息那么明显,但我们仍然能找到它们。 比如我们接下来要说的第二个例子,也是我们最关注的能量。 在前面对薛定谔方程求解过程的描述中,我们知道,通过分离变量,求解关于坐标的那个定态薛定谔方程,我们能得到特解序列 以及相应的能级序列 。 而粒子处于某个能级的概率,就是通过特解序列 来计算的,我们马上来看。 类比弦振动方程和热传导方程,我们知道,如果给定了薛定谔方程的初始条件 ,那么 可以表示成 的级数和形式,即:
而这里的系数 的模方 就代表了能量的概率信息,说得具体一点,就是: 对于一个初始状态处于 的粒子,当我们去测量它的能量时,测得它处在能级 上的概率为 。 也就是说,在寻找能量的概率信息时,特解序列 扮演了一个非常关键的角色。 前面我们提到过,一个体系允许出现的能级 称作能量的本征值(Eigen Value)。 现在,我们也相应地将这个扮演关键角色的特解序列 称作能量的本征函数(Eigen Function)、或者叫做能量的本征态(Eigen State)。 这里对本征态的物理意义稍微多聊两句: 以能量本征态为例:一个粒子的波函数,通常是能量本征态的线性叠加(即前面给出的级数和 ),这也是所谓“叠加态”,此时能量是不确定的。但一旦我们去测量它的能量时,波函数就会随机坍缩到其中一个本征态上,此时能量就是确定的了。 所以,本征态的物理意义就是:对一个物理对象测量某个力学量,得到某个确定本征值的时候,粒子所处的量子态。 打个不恰当的比喻:在薛定谔的猫的例子中,如果将“猫的死活”看成一个“力学量”(虽然这是虚构的 ),那么“死猫”和“活猫”就是这个力学量的两个本征态。打开盒子观察猫的死活之前,猫的状态就是两个本征态的叠加,但一旦打开盒子看了猫之后,猫的状态就确定了,此时它必然随机坍缩到某个本征态上,不是死就是活,绝对不会又死又活。 不过需要注意的是,当粒子处于能量的某个本征态 、即具有确定的能量值 时,位置仍然是不确定的,此时位置的概率分布仍然由 计算。 而这个概率分布的一个直观的例子,就是原子核外各种形态的电子云,每一种电子云形态其实就对应了能量的一个本征态(准确说是三维情形下的 ),这个我们以后再解释: 而这个本征态的概念可以到任意力学量: 对于一个具体的物理对象,任意一个力学量 都会对应一组允许取值的本征值 (也就是经典力学中可以被测量到的值 )和相应的本征态 ,当我们将 表示成这些本征态的级数和 时,相应的系数的模方 就是测得该粒子 的概率。 由此,我们就看到了波函数如何包含经典力学量的概率信息。 而在量子力学中,某个力学量的本征值和本征态信息,其实也完整描述了这个力学量本身,从这个意义上说,本征值和本征态就是“一个力学量的ID”。 那么,怎样才能找到一个力学量的本征值和本征态呢? 这将通过求解所谓的“本征方程”来实现。 接下来的问题自然就是:本征方程长什么样? 前面我们提到“本征值”时,在括号里备注了它的英文: Eigen Value,而这个词的另一个中文翻译,是线性代数中的“特征值”,这不禁让我们浮想联翩: 也许本征方程和线性代数中的特征值理论有关? 我们这就回到线性代数中看看。 4) 叙旧:特征值与特征向量在线性代数中,一个矩阵与向量相乘的过程,可以看成是对向量的某种。 从结果上来说,一个“普通的”矩阵碰上一个“普通的”向量时,通常会对这个向量产生一些旋转加伸缩的合成效果,而且在不同的向量上会造成不同的旋转角度和伸缩系数。 不过,对于一个矩阵而言,我们总是能找到一组“不普通的”向量,使得这个矩阵作用在上面时,只产生伸缩的效果,而不会使其旋转。 这样的向量,就是这个矩阵的特征向量,而它伸缩的比例,就是相应的特征值。 写成矩阵相乘的形式,就是:
其中 是矩阵 的特征向量, 是相应的特征值。 现在我们回到量子力学,来看看这个关系式的一个失散多年的孪生兄弟。 5) 本征方程温馨提示:以下可能因为过于抽象而引起不适。 量子力学中,一个力学量也会对应一个类似于矩阵的东西,我们将它称作“算符”,通常是在该力学量的符号上加一个小尖帽 。 比如,一个粒子的 坐标有“ 坐标算符”,记作 ;动量有动量算符,记作 。 而我们最关注的能量,也有能量算符,又叫哈密顿算符(Hamiltonian Operator,这是因为经典力学中能量又被称作哈密顿量),记作 是不是很头疼?这好端端的,怎么又冒出一堆新玩意儿来。 但不管怎么样,来都来了,我们还是问问这堆算符的物理意义是什么吧。 单独讨论算符的物理意义是比较困难的,但我们可以像矩阵作用在特征向量上面一样,将一个算符、比如哈密顿算符 作用在它的某个本征态 上面,形式上写成: ,这个时候就可以讨论物理意义了。 不严格地说,这个式子的物理意义可以理解为,对一个处于状态 的粒子测量它的能量。 而根据前面提到的本征态的物理意义,我们知道,此时我们会百分之百得到一个确定的能量值 ,测量结束之后,粒子的状态仍然处于 。 将这个物理过程写成一个关系式,就是:
不严格地说,这个公式的左边可以理解为测量行为,右边可以理解为测量结果。 而能量算符与能量本征态的这个关系,对于一般的力学量也成立,任意一个力学量 与它的本征态 之间也满足:
(其中 是本征态 对应的本征值 ) 看,这个式子是不是和矩阵的特征向量关系式 形式上很像? 没错,这就是我们要找的本征方程的抽象形式。 (可以看到,力学量算符作用在波函数上,形式上和矩阵作用在向量上一样,这就是为什么我们将波函数又称作“态矢量”的原因 ) 不过,这个抽象形式看起来虽然很有道理的样子,但还是不能当饭吃。毕竟,我们拿着本征方程是要找出本征值和本征态的。 所以接下来,我们要来关注本征方程的具体计算。 实际上,如果知道了力学量算符的某种具体的、可以计算的形式,那么从理论上说,本征值和本征态就可以通过本征方程被解出来。 那么,这些算符的具体的形式长什么样呢? 在线性代数中,我们知道,它们就是一个个具体的矩阵。 而在量子力学中,算符的花样会比较多:它们有时候表现成一个(无穷维的 )矩阵,有时候又是一个函数,甚至有时候还会变成其他骨骼清奇的怪物…… 我们还是以我们最关注的能量算符、也就是哈密顿算符 为例来具体看一看。 6) 能量的本征方程我们先从形式上写出能量的本征方程:
由于能量本征值 即本征态 都已经有了具体的值或函数形式,因此接下来的任务,就是要找出哈密顿算符的具体形式(坐标表象下 )。 这需要我们从牛顿力学中寻找一些启示。 在牛顿力学中,我们知道,一个体系的总能量(单指机械能 )是动能与势能之和,即:
而动能: 于是: 这个关系式可以直接照搬到算符上面来,我们将动量算符记为 、势能算符记为 ,那么我们可以形式上写出哈密顿算符(能量算符 )与动量、势能算符之间的关系:
之所以要写成这样的形式,是因为动量和势能两个算符的具体形式(坐标表象下 )是我们可以直接给出来的。 先说简单的:势能算符 ,可以直接表示成势能关于坐标的函数 而动量算符 (只讨论一维情形 ),就是我们前面说的“骨骼清奇的怪物”的一个例子,它是一个微分算子:
(这个关系式的由来说来话长,这里不展开,还是在那个深度科普系列 从线性代数到量子力学 中,有一个不严谨但相对易于理解的说明 ) 将这两个式子代入哈密顿算符关系式中,得:
再将哈密顿算符代入能量本征方程中,我们就得到:
由于本征函数 只是 的函数,因此上式中对坐标的偏导可以写成 ,于是方程化为:
还认识它吗?它就是我们前面分离变量得到的定态薛定谔方程! 7) 薛定谔方程的含义到这里,我们终于可以来理一理薛定谔方程的含义了。 首先,刚才我们已经看到,分离变量后得到的定态薛定谔方程,本质上就是能量本征方程的一个具体形式,它描述的是能量的哈密顿算符与能量本征值、本征态之间的关系。 这样一来,“求解薛定谔方程可以得到能量的本征值”这个结论从逻辑上说就没有什么违和感了。 现在我们再简单说说薛定谔方程本尊,虽然它对我们这个系列来说其实并不那么重要。 根据我们前面给出的哈密顿算符的关系式,我们可以将薛定谔方程写成抽象形式:
从这个式子可以看出,它其实描述的是态矢量的时间演化规律与体系能量之间的关系,或者说得更通俗一点,描述的是量子态的动力学规律。 这也就是为什么我们常常将薛定谔方程比作“量子力学中的牛二定律”。 顺便提一句,这个演化规律背后,还涉及到一些更深层次的物理意义,不过这需要涉及到分析力学、李群等离我们这个系列有些遥远的,我们就不继续深究了。 毕竟,仅仅从实用主义的角度来说,我们其实只需要关注定态薛定谔方程就足够了。 8) 结语与预告能将这篇烧脑文坚持读到最后的同学,你们真的不容易。 说实话,其实文章写到最后,作者也不敢确定,是否真的能对零基础的同学讲清楚薛定谔方程的含义,毕竟篇幅那么短、信息量那么多、而量子力学又那么抽象。 如果没有完全读懂文中内容,又想了解更多,可以看看文中一直安利的另一个深度科普系列: 那个系列更侧重于讲述量子力学背后精妙的数学体系,节奏也比这篇文章慢得多,有兴趣的同学可以去瞧瞧。 但不管有没有完全理解薛定谔方程,对于理解它的应用而言,我们只需要知道一点就够了: 薛定谔方程能给出体系能量的本征态和本征值(也就是能级 )的信息,这是我们从第一性原理上理解化学元素的周期律和化学性质、理解材料的一些宏观物性、以及理解半导体原理的关键。 正是这个关键信息,带来了二十世纪灿烂的物质文明。 接下来的几篇中,我们将见识到这一点。 |
身边的微分方程(7):一文读懂薛定谔方程
本文为“身边的微分方程”系列第7篇。难度提示:★★★★★若想了解本系列及本专栏其他文章,请收藏目录:或按下文方法关注本专栏:0) 开篇语本文中,我们将迎来本系列的一位VIP,它是主宰微观世界运行规律的基本法 ......
这篇内容能帮你快速理解什么
通过更完整的主题说明和结构表达,帮助用户更快抓住重点,也让搜索系统更容易识别页面主题。
让访问者快速理解当前问题、可行方法以及下一步应该继续看案例、看服务还是直接沟通。
文章页不只是获取流量,也承担继续阅读、查看服务和发起咨询的承接作用。
继续了解这个主题前,你可能还关心这些问题
为什么这类主题适合写成文章?
因为很多用户会通过问题词、对比词和方案词进入网站,文章页越清楚,越容易覆盖更具体的需求。
为什么文章页不能只有正文?
仅有正文不利于继续浏览和转化,文章页还需要总结、问答、相关推荐与咨询入口来承接用户。
看完之后下一步可以做什么?
可以继续看同类文章、服务页与案例页,也可以直接沟通官网升级与搜索优化需求。
这篇文章能帮助我解决什么具体问题?
这篇文章围绕当前主题提供了详细的解决方案、操作步骤和注意事项,帮助你快速理解核心要点并应用到实际场景中。
如何判断这篇文章的内容是否权威可靠?
内容基于实际项目经验和技术实践编写,结合行业标准和最佳实践,同时提供案例数据和方法论支撑,确保专业性和可操作性。
这类内容对SEO和网站排名有什么帮助?
优质的长文内容和FAQ结构能够提升页面主题相关性、增加用户停留时间、降低跳出率,这些都有助于搜索引擎评估页面质量并提升排名表现。
AI搜索引擎会如何理解和引用这类内容?
AI搜索系统会提取文章的实体信息、观点结论和结构化问答,当用户提出相关问题时,可能会引用本文作为答案来源或参考依据。
如果我有更多相关问题可以咨询谁?
可以通过页面底部的联系方式直接咨询我们的专业团队,包括电话、QQ或在线表单,我们会根据你的具体情况提供针对性的建议和方案。
这篇文章和同类内容有什么不同之处?
本文不仅提供理论知识,还包含实战经验、避坑指南和可执行的行动建议,同时兼顾传统SEO和新兴的GEO生成式搜索优化视角。
多久需要更新一次这类内容以保持时效性?
建议每季度审查并更新一次关键数据和案例,如果涉及技术工具或算法变化则需要更频繁地维护,确保内容持续为用户提供准确价值。