当前位置：首页 > news >正文

时间序列模型（1）：LSTNet

news 2025/10/31 16:38:01

LSTNet

LSTNet（Long- and Short-term Time-series Network）是一种专门用于时间序列预测的深度学习模型，结合了卷积神经网络（CNN）和循环神经网络（RNN）的优势，能够同时捕捉时间序列中的长期和短期依赖关系。

1. 模型背景

时间序列数据通常包含两种模式：

短期依赖：如季节性、周期性变化。

长期依赖：如趋势、突变点等。

传统模型（如ARIMA、RNN）往往难以同时捕捉这两种模式，而LSTNet通过多组件结构解决了这一问题。

2. 模型结构

LSTNet的核心结构包括以下几个模块：

在这里插入图片描述

(1) 卷积层（CNN）

作用：提取时间序列中的局部模式（短期依赖）。

实现：使用一维卷积核在时间维度上滑动，捕捉相邻时间点之间的关系。

优点：能够高效提取短期特征，适合处理高维时间序列。

(2) 循环层（RNN/GRU）

作用：捕捉时间序列中的长期依赖关系。

实现：通常使用GRU（门控循环单元）或LSTM（长短期记忆网络），以减少梯度消失问题。

优点：能够建模时间序列中的复杂时间依赖。

缺点：因为存在梯度消失和梯度爆炸，导致对长序列的处理能力有限。

(3) Skip-RNN

作用：专门捕捉时间序列中的周期性模式（如季节性）。

实现：跳跃连接（skip connection）将当前时间步与历史时间步直接关联，通过指定跳越时间步来周期性提取特征，适合处理周期性数据。

优点：显式建模周期性，提升对季节性数据的预测能力。

(4) 自回归组件（AR）

作用：捕捉线性依赖关系，增强模型的稳定性。

实现：使用传统的自回归模型（如ARIMA中的AR部分）对残差进行建模。

优点：防止深度学习模型过度依赖非线性特征，提升鲁棒性。

(5) 全连接层

作用：将CNN和RNN的输出进行整合，生成最终预测结果。

实现：通过全连接层将特征映射到目标输出维度。

3. 模型特点

多尺度建模：通过CNN和RNN的结合，同时捕捉短期和长期依赖。

周期性建模：Skip-RNN显式建模周期性模式，适合季节性数据。

4. 源码参数分析

import torch
import torch.nn as nn
import torch.nn.functional as F

# traffic数据集
class Model(nn.Module):
    def __init__(self, args, data):
        super(Model, self).__init__()
        self.use_cuda = args.cuda
        self.P = args.window; # 时间序列长度 default: 24 * 7
        self.m = data.m # 时间序列输入维度 default: 862
        # 输出维度
        self.hidR = args.hidRNN; # default: 100
        self.hidC = args.hidCNN; # default: 100
        self.hidS = args.hidSkip; # default: 10
        self.Ck = args.CNN_kernel; #kernel size, default: 6
        self.skip = args.skip; # 周期长度, default: 24
        self.pt = int((self.P - self.Ck)/self.skip) # # window在kernel作用下，以skip为周期的数据数量。周期数目。
        self.hw = args.highway_window  # highway通道的输出节点数目
        self.conv1 = nn.Conv2d(1, self.hidC, kernel_size = (self.Ck, self.m));
        self.GRU1 = nn.GRU(self.hidC, self.hidR);
        self.dropout = nn.Dropout(p = args.dropout);
        if (self.skip > 0):
            self.GRUskip = nn.GRU(self.hidC, self.hidS);
            self.linear1 = nn.Linear(self.hidR + self.skip * self.hidS, self.m);
        else:
            self.linear1 = nn.Linear(self.hidR, self.m);
        if (self.hw > 0):
            self.highway = nn.Linear(self.hw, 1);
        self.output = None;
        if (args.output_fun == 'sigmoid'):
            self.output = F.sigmoid;
        if (args.output_fun == 'tanh'):
            self.output = F.tanh;
 
    def forward(self, x):
        batch_size = x.size(0);
        #CNN
        c = x.view(-1, 1, self.P, self.m);
        c = F.relu(self.conv1(c)); # (32, 1, 168, 862) -> (32, 100, 163, 1)
        c = self.dropout(c);
        c = torch.squeeze(c, 3); # (32, 100, 163)， 提取连续时间步的局部特征
        # RNN 
        r = c.permute(2, 0, 1).contiguous(); # (163, 32, 100)
        _, r = self.GRU1(r);
        r = self.dropout(torch.squeeze(r,0)); # (32, 100)
        
        #skip-rnn
        
        if (self.skip > 0):
            s = c[:,:, int(-self.pt * self.skip):].contiguous(); # (32, 100, 144)
            s = s.view(batch_size, self.hidC, self.pt, self.skip); # (32, 100, 6, 24)，将144个时间步的数据，按照6个周期，每个周期24个时间步划分，捕捉周期性规律
            s = s.permute(2,0,3,1).contiguous(); # (6, 32, 24, 100)
            s = s.view(self.pt, batch_size * self.skip, self.hidC); # (6, 768, 100)
            _, s = self.GRUskip(s);
            s = s.view(batch_size, self.skip * self.hidS);
            s = self.dropout(s); # (32, 240)
            r = torch.cat((r,s),1); # (32, 340)
        
        res = self.linear1(r);
        
        # highway，模型线性AR
        if (self.hw > 0):
            z = x[:, -self.hw:, :];
            z = z.permute(0,2,1).contiguous().view(-1, self.hw);
            z = self.highway(z);
            z = z.view(-1,self.m);
            res = res + z;
            
        if (self.output):
            res = self.output(res); # (32, 862)
        return res;