当前位置：首页 > news >正文

机器学习：反向神经元传播公式推导

news 2025/11/8 23:05:08

首先，我们有正向传播的公式：
$q_{k+1,i}=\sum_{j=1}^{n_{k}} w_{k+1,i,j}\cdot r_{k,j}+b_{k+1,i}$

$\begin{aligned} \frac{\partial l}{\partial w_{k,i,j}}&= \frac{\partial l}{\partial q_{k,i}}\cdot\frac{\partial q_{k,i}}{\partial w_{k,i,j}}\\ &=\frac{\partial l}{\partial q_{k,i}}\cdot r_{k-1,j} \end{aligned}$

$\begin{aligned} \frac{\partial l}{\partial b_{k,i}} &=\frac{\partial l}{\partial q_{k,i}}\cdot\frac{\partial q_{k,i}}{\partial b_{k,i}}\\ &=\frac{\partial l}{\partial q_{k,i}} \end{aligned}$

观察这个式子：

$q_{k+1,i}=\sum_{j=1}^{n_{k}} w_{k+1,i,j}\cdot r_{k,j}+b_{k+1,i}$

我们考察 $r_{k,j}$ 对 $q_{k+1,i}$ 的影响，发现：
$\frac{\partial q_{k+1,i}}{\partial r_{k,j}} =w_{k+1,i,j}$

进而:

$\begin{aligned} \frac{\partial q_{k+1,i}}{\partial q_{k,j}} &= \frac{\partial q_{k+1,i}}{\partial r_{k,j}} \cdot \frac{\partial r_{k,j}}{\partial q_{k,j}} \\ &= w_{k+1,i,j} \cdot f_k^{'}(q_{k,j}) \end{aligned}$

因此：

$\begin{aligned} \delta_{k,j} = \frac{\partial l}{\partial q_{k,j}} &= \frac{\partial l}{\partial q_{k+1,i}} \cdot \frac{\partial q_{k+1,i}}{\partial q_{k,j}} \\ &= \delta_{k+1,i} \cdot \frac{\partial q_{k+1,i}}{\partial q_{k,j}} \\ \end{aligned}$

最后，由于每一个神经元对下一层有多条影响路径，所以对其求和，并带入
$∂qk+1,i∂qk,j\frac{\partial q_{k+1,i}}{\partial q_{k,j}}$
：

$\begin{aligned} \delta_{k,j}= \frac{\partial l}{\partial q_{k,j}} &= \sum_{i=1}^{n_{k+1}} \frac{\partial l}{\partial q_{k+1,i}} \cdot \frac{\partial q_{k+1,i}}{\partial q_{k,j}} \\ &= f_k^{'}(q_{k,j}) \cdot \sum_{i=1}^{n_{k+1}} \delta_{k+1,i} \cdot w_{k+1,i,j} \end{aligned}$

$l=L(r_{T1}, r_{T2}, ... r_{Tn_T}, y_1, y_2, ... y_{n_T})$

$\begin{aligned} \dfrac{\partial l}{\partial q_{Ti}}&=\dfrac{\partial l}{\partial r_{Ti}}\cdot\dfrac{\partial r_{Ti}}{\partial q_{Ti}}\\ &=\dfrac{\partial l}{\partial r_{Ti}}\cdot f_T^{'}(q_{Ti}) \end{aligned}$