当前位置：首页 > news >正文

DBLoss: Decomposition-based Loss Function for Time Series Forecasting 论文阅读

news 2025/11/13 5:45:41

基本信息

NeurIPS 2025

文章指出了现有基于距离的损失函数（如 MSE）在时间序列预测中存在的核心局限性。问题源于它们对时间序列的季节性和趋势成分缺乏针对性的优化：

它们通常只关注 预测值 和 真实值 在整体上的差异（即点对点的距离），而没有考虑到时间序列在预测范围内所固有的结构化信息（季节性、趋势）。

预测表现	核心问题
季节性预测不佳	模型未能准确捕捉时间序列的周期性变化。例如在气温数据中，模型可能正确预测了平均气温，但未能预测出每天的最高/最低气温的周期性波动。
趋势预测不佳	模型未能准确捕捉时间序列的长期增长或下降的走势。例如，在股票价格预测中，模型可能在短期内表现尚可，但无法预测出整体的上升或下降趋势。
季节性和趋势预测均不佳	这是最严重的情况，模型对时间序列的两种主要结构性变化都未能准确建模。

即使预测模型在前向传播（即模型内部的计算过程）中使用了分解技术来分别处理季节性和趋势，但是损失函数本身（如 MSE）仍然是一个整体性的、不区分成分的度量。

这导致一个关键问题：

归纳偏置（Inductive Bias）没有被有效地应用到最终的预测结果中。

模型虽然在内部努力学习了趋势和季节性，但由于损失函数只惩罚总误差，它无法强制模型将学习到的趋势和季节性信息体现在最终的预测值中。

DBLoss 正是为了在损失函数层面引入这种归纳偏置，从而直接优化分解后的季节性和趋势分量。

论文提出一个简单有效的基于分解的损失函数（Decomposition-Based Loss function）

DBLoss 的核心思想：

DBLoss 能够确保模型在训练过程中更加关注并准确地捕捉时间序列中的季节性和趋势信息，从而显著提高时间序列预测的性能。

DBLoss旨在通过在损失函数层面引入时间序列的分解结构，来直接优化季节性（Seasonality）和趋势（Trend）分量的预测。

DBLoss 首先将时间序列的真实值和预测值进行分解，以提取出它们的季节性分量和趋势分量。

计算趋势分量 ( $\text{Trend}$ ):

通过定义 指数移动平均 (EMA) 权重 $W$ 和相应的除数 $D_{div}$ （基于平滑因子 $\alpha$ ）。
计算加权数据的累积和 $C$ 。
将累积和除以除数，得到趋势分量：
$\text{Trend} \leftarrow \frac{C}{D_{div}}$
计算季节性分量 ( $\text{Seasonality}$ ):
- 季节性分量被定义为原始时间序列减去趋势分量的残差：
  $\text{Seasonality} \leftarrow X - \text{Trend}$

通过这个模块，可以得到：

DBLoss 定义了两个核心分量损失，并使用了不同的距离度量：

季节性损失 ( $L_S$ )：采用 $L_2$ 范数（即均方误差 MSE）来衡量季节性分量的差异。
$L_S := \lVert \hat{Y}_S - Y_S \rVert_2^2$
趋势损失 ($L_T$)：采用 $L_1$ 范数（即平均绝对误差 MAE）来衡量趋势分量的差异。
$L_T := \lVert \hat{Y}_T - Y_T \rVert_1$

为了防止季节性或趋势分量由于它们固有的尺度差异而在优化过程中产生支配性影响，论文引入了尺度对齐机制，对 $L_T$ 进行调整。

对齐后的趋势损失 ( $L_T^{\text{aligned}}$ )：

$L_T^{\text{aligned}} := L_T \times \text{stopgrad} \left( \frac{L_S}{L_T + \epsilon} \right)$

$\text{stopgrad}(\cdot)$ ：这是一个梯度分离操作。它确保了梯度不会通过对齐比例项（ $\frac{L_S}{L_T + \epsilon}$ ）反向传播，从而避免了 $L_S$ 和 $L_T$ 之间的优化干扰。
$\frac{L_S}{L_T + \epsilon}$ ：这个比例项用于自适应地调整 $L_T$ 的大小，使其与 $L_S$ 的相对幅度保持一致。