当前位置: 首页 > news >正文

DBLoss: Decomposition-based Loss Function for Time Series Forecasting 论文阅读

基本信息

发表刊物

NeurIPS 2025

作者信息

解决的问题

文章指出了现有基于距离的损失函数(如 MSE)在时间序列预测中存在的核心局限性。问题源于它们对时间序列的季节性趋势成分缺乏针对性的优化:

基于距离的损失函数的局限性

忽略预测范围内的固有结构

它们通常只关注 预测值 和 真实值 整体上的差异(即点对点的距离),而没有考虑到时间序列在预测范围内所固有的结构化信息(季节性、趋势)。

预测误差的局限性分析

预测表现核心问题

季节性预测不佳

模型未能准确捕捉时间序列的周期性变化。

例如在气温数据中,模型可能正确预测了平均气温,但未能预测出每天的最高/最低气温的周期性波动

趋势预测不佳

模型未能准确捕捉时间序列的长期增长或下降的走势。例如,在股票价格预测中,模型可能在短期内表现尚可,但无法预测出整体的上升或下降趋势。

季节性和趋势预测均不佳

这是最严重的情况,模型对时间序列的两种主要结构性变化都未能准确建模。

核心洞察:缺乏归纳偏置(Inductive Bias)

即使预测模型在前向传播(即模型内部的计算过程)中使用了分解技术来分别处理季节性和趋势,但是损失函数本身(如 MSE)仍然是一个整体性的、不区分成分的度量。

这导致一个关键问题:

归纳偏置(Inductive Bias)没有被有效地应用到最终的预测结果中。

模型虽然在内部努力学习了趋势和季节性,但由于损失函数只惩罚总误差,它无法强制模型将学习到的趋势季节性信息体现在最终的预测值中。

DBLoss 正是为了在损失函数层面引入这种归纳偏置,从而直接优化分解后的季节性和趋势分量。

论文解决的问题(核心创新点)

论文提出一个简单有效基于分解的损失函数(Decomposition-Based Loss function)

DBLoss 的核心思想:

  1. 在预测范围内,使用指数移动平均等方法将时间序列分解为季节性趋势分量。

  2. 然后,对每个分量分别计算损失。

  3. 最后,将这些分量损失加权组合起来,作为最终的损失函数来训练模型。

DBLoss  能够确保模型在训练过程中更加关注并准确地捕捉时间序列中的季节性和趋势信息,从而显著提高时间序列预测的性能。

论文的方法

DBLoss旨在通过在损失函数层面引入时间序列的分解结构,来直接优化季节性(Seasonality)和趋势(Trend)分量的预测。

EMA Decomposition Module

DBLoss 首先 将时间序列的真实值预测值进行分解,以提取出它们的季节性分量和趋势分量。

  • 分解选择: 论文选择了指数移动平均 (EMA) 进行分解。

  • 目标: 将时间序列 $X$  (可以是 $\hat{Y}$ 或 $Y$ ) 分解为 Trend Seasonality 

算法流程

计算趋势分量 (\text{Trend}):

  • 通过定义 指数移动平均 (EMA)  权重  W 和相应的除数 $D_{div}$(基于平滑因子 $\alpha$)。

  • 计算加权数据的累积和 $C$

  • 将累积和除以除数,得到趋势分量:

    $\text{Trend} \leftarrow \frac{C}{D_{div}}$

  • 计算季节性分量 ($\text{Seasonality}$):

    • 季节性分量被定义为原始时间序列减去趋势分量的残差:

      $\text{Seasonality} \leftarrow X - \text{Trend}$

通过这个模块,可以得到:

  • 真实值分量: $Y_S$ (真实季节性),   $Y_T$ (真实趋势)

  • 预测值分量: $\hat{Y}_S$ (预测季节性),   $\hat{Y}_T$ (预测趋势)

Weighted Loss Function

A. 分量损失定义

DBLoss 定义了两个核心分量损失,并使用了不同的距离度量:

  1. 季节性损失 ($L_S$): 采用 $L_2$范数(即均方误差 MSE)来衡量季节性分量的差异。

    $L_S := \lVert \hat{Y}_S - Y_S \rVert_2^2$

  2. 趋势损失 ($L_T$): 采用 $L_1$ 范数(即平均绝对误差 MAE)来衡量趋势分量的差异。

    $L_T := \lVert \hat{Y}_T - Y_T \rVert_1$

B. 尺度对齐机制

为了防止季节性或趋势分量由于它们固有的尺度差异而在优化过程中产生支配性影响,论文引入了尺度对齐机制,对  $L_T$ 进行调整。

对齐后的趋势损失 ($L_T^{\text{aligned}}$):

$L_T^{\text{aligned}} := L_T \times \text{stopgrad} \left( \frac{L_S}{L_T + \epsilon} \right)$

  • $\text{stopgrad}(\cdot)$ :这是一个梯度分离操作。它确保了梯度不会通过对齐比例项($\frac{L_S}{L_T + \epsilon}$)反向传播,从而避免了 $L_S$$L_T$ 之间的优化干扰。

  • $\frac{L_S}{L_T + \epsilon}$ :这个比例项用于自适应地调整 $L_T$ 的大小,使其与$L_S$的相对幅度保持一致。

C. 最终总损失 (Total Loss)

最终的 DBLoss ($L$ ) 是季节性损失 $L_S$  和对齐后的趋势损失 $L_T^{\text{aligned}}$ 的加权和

$L := \beta \cdot L_S + (1 - \beta) \cdot L_T^{\text{aligned}}$

  • $\beta$ 一个可调参数,用于平衡季节性损失和对齐后的趋势损失在总优化目标中的贡献。

实验

实验部分旨在证明 DBLoss 作为一个通用损失函数,能够显著提升现有最先进(State-of-the-Art, SOTA)时间序列预测模型的性能。

Setup

数据集

以八个著名的预测基准作为目标数据集进行实验:

ETT (ETTh1, ETTh2,  ETTm1,  ETTm2 ),  Solar,  Weather,  Electricity,  and Traffic

Backbones

选择八个最先进的(SOTA)时间序列预测模型作为基线:

  • 四个时间序列特定模型:iTransformer,Amplifier ,PatchTST、DLinear
  • 四个时间序列基础模型:CALF、UniTS 、TTM 和 GPT4TS 

Implementation Details

评价指标:MAE 和 MSE

预测区间:{ 96,192, 336, 720}

统一评估基准 (TFB): 利用 TFB (Time Series Forecasting Benchmark) 平台进行统一评估

使用 TFB 提供的最优基线脚本只将训练时的损失函数替换为 DBLoss,而没有对模型架构、超参数、优化器等做任何其他修改

Main Results

http://www.dtcms.com/a/600690.html

相关文章:

  • STM32F103学习笔记-16-RCC(第4节)-使用 HSI 配置系统时钟并用 MCO 监控系统时钟
  • Git 中新建学习分支 + 暂存修改 + VSCode 可视化查看改动(超详细教程)
  • Linux高效编程与实战:自动化构建工具“make/Makefile”和第一个系统程序——进度条
  • Docker 相关使用收录
  • 【详细步骤解析】爬虫小练习——爬取豆瓣Top250电影,最后以csv文件保存,附源码
  • Docker-存储
  • wap手机网站模板上饶网站建设3ao cc专业a
  • 【Nginx】Nginx 多协议负载均衡实战:StarRocks 与 MinIO 代理配置全解析
  • 域名注册和网站设计服务如何做贴吧类网站多钱
  • python+uniapp基于微信小程序的垃圾分类信息系统
  • C语言编译器安卓版 | 强大功能助力编程学习与实践
  • STM32使用金属探测传感器自制金属探测仪
  • vmware嵌套安装esxi7.0.3扩容vmfs
  • 使用 BR 备份 TiDB 到 AWS S3 存储
  • 【OpenCV + VS】OpenCV 绘图:绘制矩形、圆形、椭圆形、线条等
  • 易语言反编译工具 - 高效破解易语言程序的利器
  • 11年始终专注营销型网站提供网站建设小程序制作
  • AOSP Android13 Launcher3——TransformParams 类
  • 网站推广问题推广公司网站有哪些方式
  • 成都网站建设公司电话美食网站建设多少钱
  • 【把Linux“聊”明白】进程的概念与状态
  • GIT版本管理工具轻松入门 | TortoiseGit,本地 Git 仓库和 Git 概念,笔记02
  • 什么是美颜sdk?美型功能开发与用户体验优化实战
  • 在 React 项目中使用 Ky 与 TanStack Query 构建现代化数据请求层
  • 计算机网络---传输层安全 SSL与TLS
  • 【Linux篇】信号机制深度剖析:从信号捕捉到SIGCHLD信号处理
  • C语言编译软件选择及优化建议
  • Linux 之 【冯诺依曼体系结构与操作系统的简介】
  • 潍坊建设gc局网站windows优化软件
  • Java虚拟机(JVM)面试题(51道含答案)