当前位置：首页 > news >正文

使用Python和Transformer模型进行土壤水热模拟与预测的基本示例

news 2025/9/16 20:51:01

以下是一个使用Python和Transformer模型进行土壤水热模拟与预测的基本示例。在这个示例中，我们将使用PyTorch来构建和训练Transformer模型，同时使用一些模拟的土壤水热数据进行演示。

步骤概述

数据准备：生成或加载土壤水热数据，并进行预处理。
构建Transformer模型：使用PyTorch构建Transformer模型。
训练模型：使用训练数据对模型进行训练。
模型评估：使用测试数据评估模型的性能。
预测：使用训练好的模型进行预测。

代码实现

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt

# 1. 数据准备
# 生成模拟的土壤水热数据
def generate_data(num_samples, seq_length):
    # 这里简单生成一些随机数据作为示例
    data = np.random.randn(num_samples, seq_length, 2)  # 假设每个时间步有2个特征（水和热）
    return data

# 划分训练集和测试集
def split_data(data, train_ratio=0.8):
    train_size = int(len(data) * train_ratio)
    train_data = data[:train_size]
    test_data = data[train_size:]
    return train_data, test_data

# 准备数据加载器
def prepare_dataloader(data, batch_size):
    inputs = data[:, :-1, :]
    targets = data[:, 1:, :]
    dataset = torch.utils.data.TensorDataset(torch.tensor(inputs, dtype=torch.float32),
                                             torch.tensor(targets, dtype=torch.float32))
    dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size, shuffle=True)
    return dataloader

# 2. 构建Transformer模型
class TransformerModel(nn.Module):
    def __init__(self, input_dim, d_model, nhead, num_layers, dim_feedforward):
        super(TransformerModel, self).__init__()
        self.embedding = nn.Linear(input_dim, d_model)
        self.transformer_encoder = nn.TransformerEncoder(
            nn.TransformerEncoderLayer(d_model=d_model, nhead=nhead, dim_feedforward=dim_feedforward),
            num_layers=num_layers
        )
        self.decoder = nn.Linear(d_model, input_dim)

    def forward(self, src):
        src = self.embedding(src)
        src = src.permute(1, 0, 2)  # 调整维度以适应Transformer输入要求
        output = self.transformer_encoder(src)
        output = output.permute(1, 0, 2)  # 调整维度以适应输出要求
        output = self.decoder(output)
        return output

# 3. 训练模型
def train_model(model, train_dataloader, criterion, optimizer, epochs):
    model.train()
    for epoch in range(epochs):
        total_loss = 0
        for inputs, targets in train_dataloader:
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, targets)
            loss.backward()
            optimizer.step()
            total_loss += loss.item()
        print(f'Epoch {epoch + 1}/{epochs}, Loss: {total_loss / len(train_dataloader)}')

# 4. 模型评估
def evaluate_model(model, test_dataloader, criterion):
    model.eval()
    total_loss = 0
    with torch.no_grad():
        for inputs, targets in test_dataloader:
            outputs = model(inputs)
            loss = criterion(outputs, targets)
            total_loss += loss.item()
    print(f'Test Loss: {total_loss / len(test_dataloader)}')

# 5. 预测
def predict(model, input_sequence):
    model.eval()
    with torch.no_grad():
        input_tensor = torch.tensor(input_sequence, dtype=torch.float32).unsqueeze(0)
        output = model(input_tensor)
        return output.squeeze(0).numpy()

# 主程序
if __name__ == '__main__':
    # 数据参数
    num_samples = 1000
    seq_length = 20
    batch_size = 32
    train_ratio = 0.8

    # 模型参数
    input_dim = 2
    d_model = 64
    nhead = 4
    num_layers = 2
    dim_feedforward = 128
    epochs = 10
    learning_rate = 0.001

    # 数据准备
    data = generate_data(num_samples, seq_length)
    train_data, test_data = split_data(data, train_ratio)
    train_dataloader = prepare_dataloader(train_data, batch_size)
    test_dataloader = prepare_dataloader(test_data, batch_size)

    # 构建模型
    model = TransformerModel(input_dim, d_model, nhead, num_layers, dim_feedforward)

    # 定义损失函数和优化器
    criterion = nn.MSELoss()
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)

    # 训练模型
    train_model(model, train_dataloader, criterion, optimizer, epochs)

    # 评估模型
    evaluate_model(model, test_dataloader, criterion)

    # 预测
    sample_input = test_data[0, :-1, :]
    prediction = predict(model, sample_input)

    # 可视化预测结果
    plt.figure(figsize=(10, 6))
    plt.plot(prediction[:, 0], label='Predicted Water')
    plt.plot(prediction[:, 1], label='Predicted Heat')
    plt.legend()
    plt.show()

代码解释

数据准备：
- generate_data 函数生成模拟的土壤水热数据。
- split_data 函数将数据划分为训练集和测试集。
- prepare_dataloader 函数将数据转换为PyTorch的 DataLoader 对象，方便批量训练。
构建Transformer模型：
- TransformerModel 类定义了一个简单的Transformer模型，包括嵌入层、Transformer编码器和解码器。
训练模型：
- train_model 函数使用训练数据对模型进行训练，并打印每个epoch的损失。
模型评估：
- evaluate_model 函数使用测试数据评估模型的性能，并打印测试损失。
预测：
- predict 函数使用训练好的模型进行预测。