当前位置: 首页 > news >正文

NeurIPS2025 |MSFT:多尺度建模融入 TSFM 微调,制服时序模型微调的 “混杂因子”!

本篇论文来自NeurIPS2025,最新前沿时序技术,文章提出了一个多尺度微调框架-MSFT,是首个将多尺度建模融入 TSFM 微调的框架,兼容不同编码器类 TSFM,且实现简单

重新整理以及补充了2025顶会时序合集,整合了更完整的“2025顶会时序合集”,包含论文及代码,无偿分享给大家~需要的可以在宫🀄蚝“时序大模型”回复“资料”自取~

文章信息

论文名称:Multi-Scale Finetuning for Encoder-based Time Series Foundation Models

论文作者:Zhongzheng Qiao,Chenghao Liu,Yiming Zhang,Ming Jin,Quang Pham,Qingsong Wen,P. N. Suganthan,Xudong Jiang,Savitha Ramasamy

图片

研究背景

时间序列基础模型(TSFMs) 通过大规模预训练获得了出色的零样本时间序列预测性能,但当前研究多聚焦于预训练与零样本评估,对 “如何针对下游任务有效微调 TSFMs” 这一关键问题探索不足。

传统微调(如全参数微调、线性探测、LoRA 等)未考虑时间序列数据的多尺度特性(同一数据在不同采样尺度下呈现不同时序模式,如小时级能耗数据显微观使用模式,日级数据显宏观趋势)与 TSFMs 本身的多尺度预测能力,易导致过拟合、未充分利用预训练知识,最终性能欠佳。

在因果视角下的核心问题:尺度(S)是 “输入上下文(X)- 模型激活知识(M)- 预测结果(Y)” 关系中的混杂因子,会引发虚假关联(如 X 与 M 因 S 产生非因果相关性)。传统微调直接建模,无法排除s的干扰,导致模型依赖非因果关联进行预测。

因此提出了一个新的多尺度微调框架-MSFT,以解决上述问题。

图片

图片

模型框架

图片

MSFT 针对编码器类 TSFMs(如 MOIRAI、MOMENT、UNITS)设计,通过显式融入多尺度建模解决传统微调缺陷,核心分为三部分

1.尺度特异性知识激活

输入投影层:冻结预训练输入投影参数,为每个尺度添加独立线性适配器(Linear_i),计算该尺度输入嵌入 ,避免不同尺度间的表征干扰。

注意力层:冻结预训练注意力权重,为每个尺度引入独立 LoRA 模块,激活尺度专属知识,匹配因果公式中 “” 的尺度 - 知识映射关系。

2. 解耦的 token 依赖建模

解决 “多尺度 token 时间索引错位导致注意力偏误” 问题,分两步建模依赖:

  • 尺度内注意力:通过掩码限制 token 仅关注同一尺度内的 token,确保捕获尺度内时序依赖。

  • 跨尺度聚合器:设计 “粗到细(C2F)” 和 “细到粗(F2C)” 双分支,先通过线性映射将不同尺度 token 投影到统一空间,再通过重复/ 平均池化对齐时序分辨率,实现跨尺度信息融合。

3. 多尺度预测融合

训练阶段:每个尺度独立输出预测,总损失为各尺度损失的加权和(权重通过 Softmax 学习,对应因果公式中的),即。

推理阶段:将各尺度预测上采样至原始分辨率,通过学习到的加权求和得到最终预测,缓解单一尺度过拟合。

实验数据

图片

任务:长序列预测(LSF,预测长度 96/192/336/720)、概率预测(PF)。

数据集:LSF 使用 ETT(小时 / 15 分钟级温度)、电力、天气数据集;PF 使用电力、太阳能、交通等 5 个分布外数据集。

对比方法

  • 传统微调:全参数微调、线性探测、Prompt Tuning、LoRA、AdaLoRA;

  • 深度学习基线:DLinear、PatchTST、iTransformer、TimeMixer 等。

图片

重点实验数据

长序列预测(LSF)

  • MSFT 在所有 TSFM 骨干(MOIRAI Small/Base、MOMENT、UNITS)上均优于传统微调方法,且超越从零训练的 SOTA 模型。

  • 例:MOIRAI Base+MSFT 在 ETTm1(15 分钟级温度)的 MSE 较全微调降低 6.8%,在 Weather 数据集 MSE 降低 6.7%;对多尺度模式更丰富的分钟级数据提升更显著。

概率预测(PF)

MSFT 显著降低 CRPS(连续排序概率得分)和 MSIS(平均缩放区间得分),MOIRAI Base+MSFT 在 Solar 数据集 CRPS 较全微调降低 24.4%,在 Istanbul Traffic 数据集降低 18.3%。

消融实验: 尺度特异性模块、跨尺度聚合器、加权融合均为关键组件:移除任一组件会导致性能下降,如仅保留尺度内注意力(无跨尺度聚合)时,ETTm1 的 MSE 上升 10%。

图片

图片

小小总结

文章首次从因果角度分析 TSFM 微调问题,指出尺度混杂因子的影响,提出通过多尺度建模实现 “后门调整” 以消除虚假关联。

提出的MSFT框架 是首个将多尺度建模融入 TSFM 微调的框架,兼容不同编码器类 TSFM,且实现简单。

针对编码器类 TSFM 的微调问题,MSFT 通过显式多尺度建模(尺度特异性激活、解耦依赖建模、加权融合),有效利用 TSFM 预训练的多尺度能力,消除尺度混杂因子引发的虚假关联,在长序列与概率预测任务中均实现 SOTA 性能,为 TSFM 的下游适配提供了通用且高效的解决方案。

关注小时,持续学习前沿时序技术!

http://www.dtcms.com/a/479373.html

相关文章:

  • Hudi系列:Hudi核心概念之时间轴(TimeLine)
  • 专业做甜点的网站宁波网站建设公司在哪里
  • 旅游公司网站开发与实现深圳市知名广告公司
  • 精品下载站电子商务网站建设课程性质
  • RAID等级全解析:从RAID 0到RAID 10的架构与原理
  • (MyBatis-Plus) LambdaQueryWrapper 应用
  • 深圳建设培训中心网站网站建设的技术团队
  • 免费vi模板网站九易建网站的建站模板
  • 今天我们学习mysql数据库的恢复与备份
  • 激光东莞网站建设广州建设公司
  • FastbuildAI后端数据库模块注册分析
  • 怎么在58建设企业的网站火烈鸟门户网站开发
  • 用户研究不足会如何扭曲需求
  • 【SDK】SDK详解
  • 如何针对你的网站做搜索优化seo如何优化网站步骤
  • 网站开发准备工作ICP备案网站服务内容
  • 厦门网站建设价可以自己设计房子的游戏
  • 19.2 说说 TCP 的三次握手?
  • 专注集团网站建设wordpress 文章存档
  • 罗湖商城网站设计公司做网站销售怎么开发客户
  • 【uniapp】体验优化:开源工具集 uni-toolkit 发布
  • 多点低压差分(M-LVDS)线路驱动器和接收器_MS2111
  • 自助定制网站开发公司中山网站建设技术
  • 域名的种类及查询网站怎样建设旅游网站
  • QGIS遥感影像数据提取与统计
  • 郑州网站seo排名磁县企业做网站推广
  • html做旅游网站小程序制作免费吗
  • 东莞市企业网站建设平台wordpress 链接分类
  • 深入浅出:实现一个生产级网页预览图提取组件
  • Download:Blaxcut - Barbershop Hair Salon WordPress Theme