【AI】人工智能之PINN和贝叶斯
下面把 PINN(Physics-Informed Neural Network)和贝叶斯(Bayesian)的核心原理、算法公式、典型应用、优缺点一次性并列讲清。
一、核心思想一句话
- PINN:把物理方程(PDE/ODE)直接写进神经网络的损失函数,让网络既拟合数据又满足物理定律。
- 贝叶斯:用概率分布表示一切未知量,通过观测数据更新信念,天然给出不确定性估计。
二、原理与公式对照
| 项目 | PINN | 贝叶斯 |
|---|---|---|
| 未知对象 | 场函数 u(x,t) | 参数 θ |
| 先验信息 | 物理方程 ℱ[u]=0 | 先验分布 p(θ) |
| 观测数据 | 散点 {xᵢ,uᵢ} | 数据 𝒟={xᵢ,yᵢ} |
| 损失/似然 | ℒ = ℒdata + λℒpde + βℒbc | ℒ = −log p(𝒟 |
| 求解方式 | 反向传播同时最小化 ℒ | 贝叶斯定理 p(θ |
| 结果形式 | 单点预测 uθ(x,t) | 后验分布 p(θ |
| 不确定性 | 需额外加 Dropout/Deep Ensembles | 自带方差 Var[θ |
三、算法流程(伪代码级)
PINN
- 采样配点 Ωpde、Ωdata、∂Ωbc
- 前向:uθ(x), ∂u/∂x, ∂²u/∂x² 由 AD 自动微分
- 计算残差 r = ℱ[uθ];总损失 ℒ = MSE(u,uobs) + λMSE(r,0) + βMSE(BC,0)
- Adam/L-BFGS 优化 θ;直到残差 < ε
贝叶斯(MCMC 例)
- 选先验 p(θ)
- for i=1…N:
- 从提议分布 q(θ*|θⁱ) 采样
- 计算接受率 α = min(1, p(θ*)p(𝒟|θ*)/p(θⁱ)p(𝒟|θⁱ))
- 以概率 α 接受 θ* → 链样本 {θⁱ}
- 用样本集估计后验均值、方差、预测区间
四、典型应用场景
| 领域 | PINN 案例 | 贝叶斯案例 |
|---|---|---|
| 流体力学 | 求解 Navier-Stokes 逆问题(边界未知) | 湍流模型系数校准 + 不确定度 |
| 结构健康 | 板壳振动 PDE 参数识别 | 裂纹位置/深度概率推断 |
| 医疗成像 | 用 EIT 数据反演电导率分布 | 肿瘤刚度后验分布(UQ) |
| 能源 | 油藏两相流饱和度预测 | 渗透率场随机场 Bayes 更新 |
| 金融 | 无 | 期权定价参数随机波动率推断 |
五、优缺点 30 秒速记
PINN
✅ 无需网格,高维 PDE 友好;融合数据与物理,小样本也能训
❌ 训练慢,超参数 (λ,β) 敏感;对高频/强非线性方程收敛难;不确定性需外挂
贝叶斯
✅ 天然给出置信区间;可融入专家先验;适合小样本
❌ 高维 θ 后验难求 (维数诅咒);MCMC 计算量大;深度模型里采样昂贵
六、二者融合(前沿 2025)
Bayesian-PINN:把 PINN 的权重 θ 视为随机变量,用 VI 或 SGLD 采样,同时得到
- 均值预测 u(x,t|𝒟)
- 不确定性带 σ(x,t|𝒟)
实现“物理约束 + 不确定度量化”一次完成,已在湍流、医学反问题中 SOTA。
一句话
PINN = “把物理方程写进损失”,贝叶斯 = “用分布回答不确定”,一个定性地融合先验知识,一个定量地给出置信区间;两者正快速合流,成为小样本、高可信 AI 建模的核心工具。
