ACMMM2025 |TGSI+SATL:不改模型架构也能提升预测性能,破解几何结构评估与建模难题!
本篇论文来自ACM MM2025,最新前沿时序技术~针对时间序列预测中的几何结构,提出了两大方案,在长序列预测中表现突出,为时间序列的 “结构感知建模” 提供新范式。
重新整理以及补充了2025顶会时序合集,整合了更完整的“2025顶会时序合集”,包含论文及代码,无偿分享给大家~需要的可以在宫🀄蚝“时序大模型”回复“资料”自取就行~
文章信息
论文名称:Towards Measuring and Modeling Geometric Structures in Time Series Forecasting via Image Modality
论文作者:Mingyang Yu、Xiahui Guo、Peng Chen、Zhenkai Li、Yang Shu

研究背景
时间序列预测在天气、金融、交通等领域至关重要,但其核心挑战在于传统评估指标(如 MSE、MAE)仅关注数值准确性,无法捕捉时间序列的几何结构(如趋势、周期性、形状相似性)。例如,两个 MSE 相同的序列可能存在完全不同的几何特征。此外,动态时间规整(DTW)等方法虽尝试考虑结构,但仍依赖时间维度,难以充分捕捉几何信息;而图像域的结构相似性指标(如 SSIM)无法直接适配时间序列数据,形成研究缺口。
因此,文章提出了两大方案,以解决上述问题。


模型框架


针对上述问题,文章提出了 “评估指标 + 损失函数” 的双解决方案,实现几何结构的量化与建模。
时间序列几何结构指数(TGSI):几何结构评估指标
TGSI 通过将时间序列转化为图像,量化其几何结构相似性,弥补传统指标的不足。
时间序列 - 图像转换:
归一化时间序列数据,确保强度一致性;
图像横轴为时间、纵轴为序列可能取值,每个时间点的数值对应图像中 “激活像素” 的垂直位置;
垂直扩展激活像素(形成梯度效果,亮度随距离原像素增加而降低),既提升对微小数值 / 时间偏差的鲁棒性,又避免稀疏表示导致的结构信息丢失。
TGSI 计算:取值范围为 - 1~1(值越高,结构相似度越高),由亮度分量和协方差分量乘积构成(舍弃 SSIM 的对比度分量,因垂直扩展已固定纵轴方差,且时间维度方差与亮度强耦合):
亮度分量(l (x,y)):通过像素均值衡量图像亮度一致性,反映时间序列数值的概率分布;
协方差分量(s (x,y)):通过像素协方差和标准差衡量结构相关性,计算前先下采样以聚焦几何结构而非强度梯度。
效果验证:当TGSI (y,x₁)=0.5212,TGSI (y,x₂)=0.2080,可有效区分几何结构差异,而 MSE 无法区分。
形状感知时间损失(SATL):几何结构建模损失函数
由于 TGSI 依赖非可微的图像转换,无法直接用于训练,因此设计 SATL,在时间序列模态下捕捉几何结构,且可 “即插即用” 于现有模型(无需修改架构)。SATL 包含三个互补组件,结合 MSE 形成最终训练损失:
一阶差异损失(ℒ_diff):计算预测与真实序列的一阶差分 MSE,聚焦局部趋势与形状一致性(如垂直偏移的相似序列仍能被判定为结构相似);
频域损失(ℒ_freq):通过快速傅里叶变换(FFT)捕捉周期性:
保留真实序列的 Top-k 主导频率,最小化预测与真实的主导频率差异(ℒ_dom);
抑制非主导频率(视为噪声),最小化预测的非主导频率幅度(ℒ_noise);
整体通过序列长度平方根归一化,平衡不同长度序列的损失权重。
感知特征损失(ℒ_perceptual):通过两阶段训练,让时间序列特征对齐图像几何特征:
阶段 1:训练时间序列图像自编码器,冻结编码器(f_enc)以提取图像几何特征;
阶段 2:训练时间特征提取器(Transformer + 两层 MLP),最小化其输出与 f_enc 提取的图像特征差异,使时间特征包含几何信息;
训练时,计算预测与真实序列通过时间特征提取器后的 MSE,即为感知损失。
最终损失:ℒ_total = αℒ_diff + βℒ_freq + γℒ_perceptual + δMSE(α、β、γ、δ 为超参数,平衡结构与数值准确性)。
实验数据


基线模型:TimeMixer、PatchTST、TimesNet、Autoformer(覆盖不同架构,验证 SATL 通用性);
数据集:8 个公开时间序列数据集(ETTh1/2、ETTm1/2、Weather、Exchange、Electricity、ILI),涵盖不同场景与时间模式;
评估指标:MSE(数值准确性)、MAE(数值准确性)、TGSI(几何结构);
超参数:多数数据集固定 α=0.2、β=0.2、γ=0.1、δ=0.5,少数通过验证集调整;图像转换固定高度 200 像素,垂直扩展 d=100 像素。


重点实验数据
性能提升:所有数据集与模型中,SATL 训练的模型在 MSE、MAE、TGSI 上均优于 MSE 训练,且无额外推理成本。例如:
ETTh2 数据集 MSE 平均提升 5.20%;
Autoformer 模型 TGSI 平均提升 2.96%;
PatchTST 在 Exchange 数据集上超越原性能更优的 TimeMixer。
与其他损失对比:在 TimeMixer(ETTh2)和 PatchTST(Exchange)上,SATL 的 MSE 最低、TGSI 最高,优于 MSE、MAE、RMSE、TILDE-Q(仅考虑形状但无法提取图像几何特征)。
消融实验:移除 SATL 任一组件(或 MSE)均导致性能下降,尤其移除 MSE 后下降显著,说明数值准确性是结构建模的基础;且长期预测(如 720 步)中,SATL 组件的作用更突出,验证其在长序列预测中的优势。
TGSI 有效性验证:垂直扩展长度 d 越大,TGSI 与序列相似度的 Pearson 相关系数越高(d=100 时 r=0.95,d=0 时 r=-0.1),证明垂直扩展对 TGSI 捕捉几何结构的必要性。

小小总结
文章针对时间序列预测中传统指标(如 MSE)无法评估几何结构的问题,提出两大核心方案:一是 TGSI 指标,将时间序列转为图像后,通过亮度和协方差分量量化几何结构相似度,弥补传统指标缺陷;二是 SATL 损失函数,在时间序列模态下,以一阶差异损失保结构、频域损失抓周期、感知特征损失对齐图像几何特征,结合 MSE 平衡数值与结构准确性。为结构感知的时间序列预测提供新方法。
关注小时,前沿时序一手知!
