CVPR 2025丨时间序列:动态多尺度机制登场,即插即用,预测稳准狠刷新SOTA
关注gongzhonghao【CVPR顶会精选】
时间序列分析作为统计与机器学习的重要分支,最早用于经济预测与气象监测,如今已扩展到金融、交通、医疗等众多领域。伴随深度学习与大数据的发展,时间序列建模正从传统线性方法迈向融合时域与频域、多尺度与多模态的智能预测,在复杂动态环境下展现出前所未有的精度与适应性。今天小图给大家精选3篇CVPR有时间序列方向的论文,请注意查收!
论文一:ViTs for SITS: Vision Transformers for Satellite Image Time Series
方法:
作者首先将SITS数据按时间和空间划分为不重叠patch,并保留空间结构,通过小patch提升细粒度信息保留率。随后采用时间编码器对每个空间位置的时序token进行建模,并注入基于实际采集日期的动态时间位置编码;接着利用空间编码器对时间编码后的类别特征进行全局空间建模,显式控制类别间交互以减少噪声干扰。最后根据任务类型分别使用分类头或分割头,将类别token映射为全局预测或像素级预测,从而实现对SITS的高精度分类与语义分割。
创新点:
提出时间优先的时空因子分解策略,显著优于传统的空间优先设计。
设计了获取时间特定的动态位置编码,有效应对采集时间不均匀的问题并提升时序特征建模能力。
引入多可学习类别token机制,在保持参数可控的同时增强了类别特征聚合与分离能力。
论文链接:
https://arxiv.org/pdf/2301.04944
图灵学术论文辅导
论文二:Exact: Exploring Space-Time Perceptive Clues for Weakly Supervised Satellite Image Time Series Semantic Segmentation
方法:
作者首先将长序列划分为固定长度的块,对块内数据进行局部自注意力计算以降低复杂度,并保留跨块信息的连接通路。随后通过频域变换捕捉全局的周期性与趋势性特征,并与时域表示进行互补融合。最后利用多尺度融合模块将局部细节与全局模式统一建模,通过轻量化预测头输出高精度的时序预测结果,实现了在计算效率与预测性能上的平衡。
创新点:
提出分块式局部注意力机制,在减少计算复杂度的同时保留关键时序依赖信息。
将频域变换引入Transformer结构,提升对长期趋势与周期模式的建模能力。
设计多尺度融合模块,实现局部细节与全局趋势的高效结合。
论文链接:
https://cvpr.thecvf.com/virtual/2025/poster/32710
图灵学术论文辅导
论文三:DejaVid: Encoder-Agnostic Learned Temporal Matching for Video Classification
方法:
作者首先将原始长序列通过时域分支建模短期依赖,同时利用频域分支提取周期性与趋势性特征,并在两个分支间保持信息互通。随后使用多尺度动态加权模块,根据任务与数据特性自适应调整不同尺度特征的权重分配,保证关键信息不被淹没。最后通过跨尺度特征交互模块实现短期与长期信息的深度融合,并接入预测头生成最终结果,从而在预测精度与稳健性上取得优异表现。
创新点:
团队提出频域-时域双分支结构,在保留局部时序细节的同时捕捉长期趋势模式。
设计了多尺度动态加权机制,自适应平衡不同时间尺度的信息贡献,抑制噪声影响。
实验引入跨尺度特征交互模块,增强短期与长期特征之间的融合与互补性。
论文链接:
https://cvpr.thecvf.com/virtual/2025/poster/33767
本文选自gongzhonghao【CVPR顶会精选】