1.6 偏导数
(铺垫)全导数与偏导数看似相似,实则对应不同维度的变化观察。理解它们的差异需要从"变量自由度"切入:
(核心差异解剖)
维度 | 偏导数 | 全导数 |
---|---|---|
变量关系 | 其他变量被强制锁定 | 所有变量都通过中间变量关联变化 |
观察视角 | 显微镜下的局部切片 | 无人机航拍的整体运动轨迹 |
数学表达 | ∂z/∂x = lim(Δx→0) [f(x+Δx,y)-f(x,y)]/Δx | dz/dt = (∂z/∂x)(dx/dt) + (∂z/∂y)(dy/dt) |
物理实例 | 固定经度时的纬度温度变化率 | 飞机飞行时高度随时间的总变化率 |
(链式法则破局)
假设z=f(x,y),而x=g(t), y=h(t):
- 偏导数∂z/∂x:固定时间t,单独改变x引起z的变化
- 全导数dz/dt:当时间t流逝时,x和y都随时间变化,导致z的总变化率
- 关键公式:dz/dt = (∂z/∂x)(dx/dt) + (∂z/∂y)(dy/dt) → 像多股绳子同时拉扯物体
(机器学习中的具象化)
在RNN时间序列预测中:
- 偏导数:计算t时刻权重对损失的影响时,冻结其他时刻的权重
- 全导数:BPTT算法中,考虑权重在时间维度上的连锁影响(需要沿时间链展开)
(经典案例演示)
设z = x²y + sin(y),其中x = e^t,y = t³:
- 偏导数计算:
- ∂z/∂x = 2xy → 固定y,仅看x的影响
- ∂z/∂y = x² + cos(y) → 固定x,仅看y的影响
- 全导数计算:
dz/dt = (2xy)(e^t) + (x² + cos(y))(3t²)
= 2et·t³·et + (e^{2t} + cos(t³))·3t²
(比喻)
想象开车时看导航:
- 偏导数:分别观察"踩油门对油耗的影响"(固定方向盘)和"开空调对油耗的影响"(固定油门)
- 全导数:实际驾驶中,边踩油门边开空调边转弯时的总油耗变化率
→ 前者是实验室条件下的单项测试,后者是真实路况的综合结果