当前位置: 首页 > news >正文

【2024】Wavelet Mixture of Experts for Time Series Forecasting

1.方法

在这里插入图片描述

1.输入数据(X):
输入数据是一个时间序列信号,表示为波形信号。这个信号在处理之前首先通过 Reversible Instance Normalization (RevIN) 进行归一化,以确保其在后续的分析中保持一致的尺度和分布。

2.小波变换(DWT):
数据接着通过 离散小波变换(Discrete Wavelet Transform, DWT)进行处理。小波变换会将信号分解成两个部分:

  • 低频部分(Approximate Coefficient, XA):它捕捉信号的周期性和主要趋势。
  • 高频部分(Detail Coefficient, XD):它捕捉信号的噪声和细节。
    在此步骤中,高通滤波器(h[t])和 低通滤波器(g[t])用于从输入信号中提取这两个不同的成分。

3.低频部分(XA)的处理:
对于低频部分(XA),有两种处理方式,根据使用的模型不同:
WaveTS-B(基础模型):

  • MLP(多层感知机) 用来处理低频部分。MLP是一个简单的前馈神经网络,它将低频部分的输入(XA)传入并进行预测。
    WaveTS-M(高级模型):
  • 在WaveTS-M中,除了使用MLP外,还加入了 专家混合模型(MoE) 来对低频部分进行更加细致的处理。

4.专家混合模型(MoE)的工作原理:
1. 门控网络(Gating Network):
门控网络的任务是根据输入数据 XA 动态地计算每个通道的权重。这些权重用于决定不同 专家网络(Expert Networks) 的重要性。门控网络的输出是一个概率分布,表示每个专家网络在当前任务中的重要性(即每个专家的“权重”)。

2. 专家网络(Expert Networks):
每个专家网络是一个单独的神经网络,它专注于数据的不同特征。通过门控网络的引导,每个专家根据分配的权重专门处理特定部分的数据,进行独立的预测。每个专家有自己特定的擅长领域,可能适合不同的数据模式或者特征。多个专家的预测结果会通过门控网络的权重进行加权融合,得到最终的输出。

输出层(Y) 部分是你需要修改的地方。从 回归 输出(连续数值)改为 分类 输出(类别概率)。需要加一个 Softmax 层来生成类别概率,并使用 交叉熵损失 来训练模型。其他的部分,如 MoE 和 MLP 结构,依然适用,可以保持不变。

5.预测组合:
WaveTS-M模型最终的低频部分(XA)的预测是通过门控网络和专家网络的联合工作完成的。每个专家根据自己的擅长领域做出预测,然后门控网络根据不同专家的权重动态加权,最终产生低频部分的预测。
这个加权的预测会与 高频部分(XD) 进行融合。高频部分使用 线性变换(Linear) 来处理。最终,低频和高频部分的预测会合并,得到完整的时间序列预测。

6.逆归一化(iRevIN):
最后,预测结果会通过 逆归一化(iRevIN) 进行处理,以恢复到原始数据的尺度和分布,得到最终的预测值。

http://www.dtcms.com/a/20952.html

相关文章:

  • 【AI大模型】大模型基础论文全集
  • 【Rust中级教程】1.10. 引用及内部可变性(简单回顾):引用、内部可变性、`Cell`类型及相关操作
  • Cursor 小白入门
  • 轻量级的注意力网络(LANMSFF)模型详解及代码复现
  • springboot与Freemarker
  • DeepSeek专题:以专业角度详细讲讲Deepseek-R1的高质量数据合成过程⌛
  • PyCharm2024使用Python3.12在Debug时,F8步进时如同死机状态
  • Pytorch深度学习教程_3_初识pytorch
  • 美团商家版 验证码 分析
  • 视觉大模型VIT
  • 用Python构建Mad Libs经典文字游戏
  • Jvascript网页设计案例:通过js实现一款密码强度检测,适用于等保测评整改
  • 01:整型数据类型存储空间大小
  • Java语言在微服务架构中的应用研究
  • 大模型驱动的业务自动化
  • 代码随想录 第一章 数组 704.二分查找
  • LangChain大模型应用开发:提示词工程应用与实践
  • PHP 面向对象编程
  • win32汇编环境,对话框中使用月历控件示例一
  • vLLM专题(三)-快速开始
  • 二叉搜索树的实现(C++)
  • SSL 连接
  • 网剧《一念逍遥》正式启动筹备
  • 1. 对比 LVS 负载均衡群集的 NAT 模式和 DR 模式,比较其各自的优势 。2. 基于 openEuler 构建 LVS-DR 群集。
  • DeepSeek 教我 C++ (3) : Optional / Variant 使用的应该注意的细节
  • Java 中的 HashSet 和 HashMap 有什么区别?
  • [操作系统] 基础IO:系统文件I/O
  • 基于springboot的留学服务管理平台的设计与开发(源码+文档)
  • 【deepseek与chatGPT辩论】辩论题: “人工智能是否应当具备自主决策能力?”
  • BGP分解实验·18——BGP选路原则之权重