对解微分方程分离变量法本质的思考
大二上学偏微分方程分离变量法的时候,老师直接给出了分离变量法的格式,也没有多讲原理。我也就当作是解常微分方程中时常使用指数形式的解进行试探一样,只是一种经验性的方法。我想对于大部分人而言也是如此。但是后来接着在数学分析三中详细学习傅里叶变换,以及函数空间的一些内容后,模模糊糊有一些感觉,但是一直没有搭上那根弦。今天正巧在学习偏微分方程数值解,研究差分格式耗散与色散性质的时候再次碰到了类似的问题,于是打算好好梳理梳理。简单梳理后发现其实本质非常简单。部分内容由Gemini 2.5 pro代笔(主要是我懒)。总共半个小时写完,恐怕难免笔误。
Overview
分离变量法的本质:寻找特殊的、可作为基的解。这一组解如果能够构成函数空间上一组完备的基,则分离变量法对于该方程适用。
其本质可以理解为:
-
寻找“基”解: 对于许多这类PDE(特别是那些描述波、热、扩散等物理过程的方程),存在一些非常特殊的解,它们可以写成各个自变量函数的乘积,即 u ( t , x , y , . . . ) = T ( t ) X ( x ) Y ( y ) . . . u(t, x, y, ...) = T(t) X(x) Y(y) ... u(t,x,y,...)=T(t)X(x)Y(y)...。这些解被称为分离变量解或 本征函数/模式。它们是方程和边界条件允许存在的“最简单”的非平凡模式。
-
线性叠加性(Superposition): 由于方程是线性且齐次的,如果 u 1 u1 u1 和 u 2 u2 u2 都是解,那么 c 1 u 1 + c 2 u 2 c1u1 + c2u2 c1u1+c2u2 也是解(其中 c1, c2 是常数)。这意味着这些“基”分离变量解可以通过线性组合(有限和、级数或积分)来构造出更复杂的、满足任意初始条件的通解。
-
运算符结构的匹配: 关键在于,当将一个乘积形式的解 u = T ( t ) X ( x ) u = T(t)X(x) u=T(t)X(x) 代入PDE时,如果PDE的结构是微分算符只作用在各自对应的变量上并以某种方式组合(例如 L t u + L x u = 0 L_t u + L_x u = 0 Ltu+Lxu=0),那么代入 T ( t ) X ( x ) T(t)X(x) T(t)X(x) 后,方程可以被整理成 ( L t T ) / T = − ( L x X ) / X (L_t T)/T = -(L_x X)/X (LtT)/T=−(LxX)/X 这样的形式。等号左边只依赖于 t t t,右边只依赖于 x x x。要使这个等式对定义域内的所有 t t t 和 x x x 都成立,唯一可能的情况是两边都等于同一个常数,这个常数就是分离常数 (separation constant)。这个步骤数学上实现了变量的解耦,将一个PDE分解为多个独立的ODE(常微分方程)。
所以,分离变量法的本质不是强行分开变量,而是识别出对于某些特定的线性齐次PDE,存在一套由乘积形式函数组成的“基”解。这些解是微分算符和边界条件所允许的特定模式(本征函数),它们满足独立的常微分方程,并且通过线性叠加可以构成方程的通解。这个方法之所以有效,是因为这些基解(通常是本征函数)构成了一个完备的函数集合,可以用来表示定义域内的任意函数(特别是初始条件)。
Example
以方程 u t + a u x = 0 u_t + au_x = 0 ut+aux=0 为例说明,我们来说明为什么它的解可以写成 u ^ e x p ( i ( w t + k x ) ) \hat{u}\, exp(i(wt+kx)) u^exp(i(wt+kx)) 的形式。
这里的 e x p ( i ( w t + k x ) ) exp(i(wt+kx)) exp(i(wt+kx)) 实际上是一个复指数函数,可以写成 e x p ( i w t ) e x p ( i k x ) exp(iwt) exp(ikx) exp(iwt)exp(ikx)。这就是一个分离变量的形式,其中时间相关的部分是 T ( t ) = e x p ( i w t ) T(t) = exp(iwt) T(t)=exp(iwt),空间相关的部分是 X ( x ) = e x p ( i k x ) X(x) = exp(ikx) X(x)=exp(ikx)。 u ^ \hat{u} u^ 是一个常数振幅(可以是复数)。
为什么这种形式是自然的解?
-
常系数线性PDE的特性: 对于任何常系数线性齐次的偏微分方程,指数函数 e x p ( λ t + μ x + ν y + . . . ) exp(λt + μx + νy + ...) exp(λt+μx+νy+...) (或其复数形式 e x p ( i ( ω t + k x + l y + . . . ) ) exp(i(ωt + kx + ly + ...)) exp(i(ωt+kx+ly+...)),即平面波)是其“天然”的基解。这是因为对指数函数进行微分运算,结果仍然是指数函数本身乘以一个常数(对应于指数中的系数)。
∂ / ∂ t [ e x p ( i ( w t + k x ) ) ] = i w e x p ( i ( w t + k x ) ) ∂/∂t [exp(i(wt+kx))] = iw exp(i(wt+kx)) ∂/∂t[exp(i(wt+kx))]=iwexp(i(wt+kx))
∂ / ∂ x [ e x p ( i ( w t + k x ) ) ] = i k e x p ( i ( w t + k x ) ) ∂/∂x [exp(i(wt+kx))] = ik exp(i(wt+kx)) ∂/∂x[exp(i(wt+kx))]=ikexp(i(wt+kx)) -
代入方程: 当我们将 u ( t , x ) = u ^ e x p ( i ( w t + k x ) ) u(t,x) = \hat{u} exp(i(wt+kx)) u(t,x)=u^exp(i(wt+kx)) 代入方程 u t + a u x = 0 u_t + au_x = 0 ut+aux=0 时:
i w u ^ e x p ( i ( w t + k x ) ) + a i k u ^ e x p ( i ( w t + k x ) ) = 0 iw \hat{u} exp(i(wt+kx)) + a ik \hat{u} exp(i(wt+kx)) = 0 iwu^exp(i(wt+kx))+aiku^exp(i(wt+kx))=0 -
简化为代数关系: 我们可以将 u ^ e x p ( i ( w t + k x ) ) \hat{u} exp(i(wt+kx)) u^exp(i(wt+kx)) 提出来(假设我们寻找非零解):
u ^ e x p ( i ( w t + k x ) ) ( i w + a i k ) = 0 \hat{u} exp(i(wt+kx)) (iw + aik) = 0 u^exp(i(wt+kx))(iw+aik)=0
由于 u ^ ≠ 0 \hat{u} \neq 0 u^=0 且 e x p ( i ( w t + k x ) ) ≠ 0 exp(i(wt+kx)) \neq 0 exp(i(wt+kx))=0,剩下的部分必须为零:
i w + a i k = 0 iw + aik = 0 iw+aik=0 -
得到色散关系: 这个代数方程给出了频率 w w w 和波数 k k k 之间的关系:
i w = − a i k iw = -aik iw=−aik
w = − a k w = -ak w=−ak
这说明,任何形如 u ^ e x p ( i ( w t + k x ) ) \hat{u} exp(i(wt+kx)) u^exp(i(wt+kx)) 的函数,只要满足 w = − a k w = -ak w=−ak 这个条件,就自动是方程 u t + a u x = 0 u_t + au_x = 0 ut+aux=0 的一个解。
总结为什么这种形式是自然的:
e x p ( i k x ) exp(ikx) exp(ikx) 是空间微分算符 ∂ / ∂ x ∂/∂x ∂/∂x 在无限域(或周期域)上的本征函数,其本征值是 i k ik ik。这意味着 ∂ / ∂ x ∂/∂x ∂/∂x 作用在 e x p ( i k x ) exp(ikx) exp(ikx) 上只是简单地将它乘以一个常数 i k ik ik。 e x p ( i w t ) exp(iwt) exp(iwt) 是时间微分算符 ∂ / ∂ t ∂/∂t ∂/∂t 的本征函数,其本征值是 i w iw iw。
对于常系数线性齐次PDE u t + a u x = 0 u_t + au_x = 0 ut+aux=0,将解写成 u ( t , x ) = T ( t ) X ( x ) = e x p ( i w t ) e x p ( i k x ) u(t,x) = T(t)X(x) = exp(iwt)exp(ikx) u(t,x)=T(t)X(x)=exp(iwt)exp(ikx) 的形式,使得微分方程直接转化为一个关于本征值( i w iw iw 和 i k ik ik)的代数方程 i w + a ( i k ) = 0 iw + a(ik) = 0 iw+a(ik)=0。 这种形式的解“对角化”了微分算符,将复杂的微分关系简化为简单的代数关系。因此, e x p ( i ( w t + k x ) ) exp(i(wt+kx)) exp(i(wt+kx))(满足 w = − a k w=-ak w=−ak)就是这个方程的基解或本征模式。
方程的通解可以通过对所有可能的 k k k(以及相应的 w = − a k w=-ak w=−ak)对应的 e x p ( i ( w t + k x ) ) exp(i(wt+kx)) exp(i(wt+kx)) 解进行线性叠加(积分)来构建,这就是傅里叶变换方法求解常系数线性PDE的核心思想,它与分离变量法在寻找基解的思路上是相通的。 u ^ \hat{u} u^ 在通解中实际上是 k k k 的函数 u ^ ( k ) \hat{u}(k) u^(k),由初始条件通过傅里叶逆变换确定。于是原函数可以写成:
u ( x , t ) = ∫ − ∞ ∞ u ^ ( k ) e i ( k x − a k t ) d k = ∫ − ∞ ∞ u ^ ( k ) e i k ( x − a t ) d k u(x,t) = \int_{-\infty}^\infty \hat{u}(k) e^{i(kx - a k t)} dk = \int_{-\infty}^\infty \hat{u}(k) e^{ik(x - a t)} dk u(x,t)=∫−∞∞u^(k)ei(kx−akt)dk=∫−∞∞u^(k)eik(x−at)dk
所以, e x p ( i ( w t + k x ) ) exp(i(wt+kx)) exp(i(wt+kx)) 形式的解之所以出现,是因为它是常系数线性微分算符的本征函数,能将PDE转化为简单的代数问题,并构成了描述该方程所有可能行为的基本单元。
Discusssion
傅里叶变换最有效和典型的应用场景是线性常系数的微分方程,这也正是分离变量法的适用范围。回忆一下傅里叶变换(我们在这里重复这个过程):
将 Euler 公式
cos θ = e i θ + e − i θ 2 , sin θ = e i θ − e − i θ 2 i \cos \theta = \frac{e^{i \theta} + e^{-i \theta}}{2}, \quad \sin \theta = \frac{e^{i \theta} - e^{-i \theta}}{2i} cosθ=2eiθ+e−iθ,sinθ=2ieiθ−e−iθ
代入周期为 2T 的函数 f T ( x ) f_T(x) fT(x) 的 Fourier 级数。记 π T \frac{\pi}{T} Tπ 为频率, ω n = n π T \omega_n = \frac{n \pi}{T} ωn=Tnπ,则有
f T ( x ) ∼ ∑ n = − ∞ ∞ c n e i ω n x , f_T(x) \sim \sum_{n=-\infty}^{\infty} c_n e^{i \omega_n x}, fT(x)∼n=−∞∑∞cneiωnx,
其中
c n = 1 2 T ∫ − T T f T ( t ) e i ω n t d t , ( n ∈ Z ) . c_n = \frac{1}{2T} \int_{-T}^{T} f_T(t) e^{i \omega_n t} \mathrm{d}t, \quad (n \in \mathbb{Z}). cn=2T1∫−TTfT(t)eiωntdt,(n∈Z).
记 Δ ω = ω n − ω n − 1 = π T \Delta \omega = \omega_n - \omega_{n-1} = \frac{\pi}{T} Δω=ωn−ωn−1=Tπ,于是当 T → ∞ T \to \infty T→∞ 时, Δ ω → 0 \Delta \omega \to 0 Δω→0,有
f ( x ) = lim T → ∞ f T ( x ) ∼ lim Δ ω → 0 1 2 π ∑ n = − ∞ ∞ [ ∫ − T T f T ( t ) e − i ω n t d t ] e i ω n x Δ ω . f(x) = \lim_{T \to \infty} f_T(x) \sim \lim_{\Delta \omega \to 0} \frac{1}{2\pi} \sum_{n=-\infty}^{\infty} \left[ \int_{-T}^{T} f_T(t) e^{-i \omega_n t} \mathrm{d}t \right] e^{i \omega_n x} \Delta \omega. f(x)=T→∞limfT(x)∼Δω→0lim2π1n=−∞∑∞[∫−TTfT(t)e−iωntdt]eiωnxΔω.
记 φ T ( ω ) = 1 2 π ∫ − T T f T ( t ) e − i ω t d t e i ω x \varphi_T(\omega) = \frac{1}{2\pi} \int_{-T}^{T} f_T(t) e^{-i \omega t} \mathrm{d}t e^{i \omega x} φT(ω)=2π1∫−TTfT(t)e−iωtdteiωx,则
f ( x ) ∼ lim Δ ω → 0 ∑ n = − ∞ ∞ φ T ( ω n ) Δ ω . f(x) \sim \lim_{\Delta \omega \to 0} \sum_{n=-\infty}^{\infty} \varphi_T(\omega_n) \Delta \omega. f(x)∼Δω→0limn=−∞∑∞φT(ωn)Δω.
当 Δ ω → 0 \Delta \omega \to 0 Δω→0 时,
φ T ( ω ) → φ ( ω ) = 1 2 π ∫ − ∞ ∞ f ( t ) e − i ω t d t e i ω x . \varphi_T(\omega) \to \varphi(\omega) = \frac{1}{2\pi} \int_{-\infty}^{\infty} f(t) e^{-i \omega t} \mathrm{d}t e^{i \omega x}. φT(ω)→φ(ω)=2π1∫−∞∞f(t)e−iωtdteiωx.
所以
f ( x ) ∼ ∫ − ∞ ∞ [ ∫ − ∞ ∞ f ( t ) e − i 2 π ω t d t ] e i 2 π ω x d ω . f(x) \sim \int_{-\infty}^{\infty} \left[ \int_{-\infty}^{\infty} f(t) e^{-i 2\pi \omega t} \mathrm{d}t \right] e^{i 2\pi \omega x} \mathrm{d}\omega. f(x)∼∫−∞∞[∫−∞∞f(t)e−i2πωtdt]ei2πωxdω.
其实傅里叶变换也是找了一组基函数对原函数进行展开,是傅里叶级数对于非周期函数的推广形式。从这个观点出发反观傅里叶变换方法求解PDE,其实就是分离变量法的特例。这听起来有点倒反天罡,因为在学习过程中,大家认为分离变量法是凑出来的,而傅里叶变换有着坚实的基础。其实两者都是在寻找基函数,只不过在傅里叶变换中,基函数具有 exp i w x \exp iwx expiwx 的结构,而分离变量法中可能还会有其他的基函数而已。