当前位置：首页 > news >正文

小土堆pytorch--神经网络搭建小实战Sequential的使用

news 2025/11/4 3:38:04

神经网络搭建小实战&Sequential的使用

一级目录
- 二级目录
- - 三级目录
神经网络搭建小实战&Sequential的使用
- 1. 搭建网络
- 2. 检查网络的正确性
- 3. Sequential的使用
- - 3.1 两种常见使用方式
  - - 3.1.1 直接传入模块
    - 3.1.2. 使用OrderedDict传入模块
  - 应用场景
  - 3.2 有关代码
  - 3.2 利用tensorboard来查看结果

一级目录

二级目录

三级目录

神经网络搭建小实战&Sequential的使用

1. 搭建网络

所要搭建的网络结构（利用数据集CIFAR10）
在这里插入图片描述

from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linearclass Test(nn.Module):def __init__(self):super(Test, self).__init__()self.conv1 = Conv2d(3,32,5, padding=2, stride=1)self.pool1 = MaxPool2d(2)self.conv2 = Conv2d(32,32,5, padding=2, stride=1)self.pool2 = MaxPool2d(2)self.conv3 = Conv2d(32,64,5, padding=2, stride=1)self.pool3 = MaxPool2d(2)self.flatten = Flatten()self.linear1 = Linear(1024,64)self.linear2 = Linear(64,10)def forward(self, x):x = self.conv1(x)x = self.pool1(x)x = self.conv2(x)x = self.pool2(x)x = self.conv3(x)x = self.pool3(x)x = self.flatten(x)x = self.linear1(x)x = self.linear2(x)return xtest = Test()print(test)

运行结果为
在这里插入图片描述

2. 检查网络的正确性

我们创建一个模拟输入张量，将其传入名为test的模型，来验证模型的输入输出格式是否符合预期，是模型开发和调试中的常见操作

# 检测网络结构
input = torch.ones((64,3,32,32))
output = test(input)
print(output.shape)

其中

input = torch.ones((64,3,32,32))

torch.ones()：创建一个全为 1 的张量
(64, 3, 32, 32)：指定张量的形状（shape），各维度含义：
64：批量大小（Batch Size），即一次处理 64 张图像
3：通道数（Channels），对应 RGB 三通道彩色图像
32x32：图像的高度和宽度（Height & Width），单位为像素
数据类型：默认是torch.float32
用途：模拟 64 张 32×32 像素的彩色图像输入

运行结果为
在这里插入图片描述
此时如果修改网络结构

则会报错，进一步验证了我们搭建的网络的正确性

3. Sequential的使用

在这里插入图片描述
在PyTorch中，torch.nn.Sequential 是一个非常有用的顺序容器，用于按顺序组合一系列神经网络模块，方便构建神经网络模型。以下是对其用法的详细讲解：

nn.Sequential 可以将多个神经网络层（如卷积层 Conv2d、全连接层 Linear、激活函数层 ReLU 等）按顺序封装起来，形成一个新的模块。在正向传播时，输入数据会按照添加层的顺序依次通过这些层。

3.1 两种常见使用方式

3.1.1 直接传入模块

通过在构造函数中直接传入一系列模块来创建 Sequential 容器，示例如下：

import torch
from torch import nn# 创建一个包含卷积层、ReLU激活函数层、再一个卷积层、ReLU激活函数层的Sequential模型
model = nn.Sequential(nn.Conv2d(1, 20, 5),  # 输入通道为1，输出通道为20，卷积核大小为5nn.ReLU(),  # ReLU激活函数nn.Conv2d(20, 64, 5),  # 输入通道为20，输出通道为64，卷积核大小为5nn.ReLU()  # ReLU激活函数
)

这里，输入数据首先会进入第一个 Conv2d 层进行卷积操作，然后经过 ReLU 激活函数处理，接着进入第二个 Conv2d 层，最后再经过一次 ReLU 激活函数处理，得到最终输出。

3.1.2. 使用OrderedDict传入模块

当需要为每个模块指定名称时，可以使用 OrderedDict 来传入模块，示例如下：

from collections import OrderedDictmodel = nn.Sequential(OrderedDict([('conv1', nn.Conv2d(1, 20, 5)),  # 模块名称为'conv1'('relu1', nn.ReLU()),  # 模块名称为'relu1'('conv2', nn.Conv2d(20, 64, 5)),  # 模块名称为'conv2'('relu2', nn.ReLU())  # 模块名称为'relu2'
]))

这种方式的好处是可以方便地通过名称来访问和操作特定的模块，比如后续可能需要获取某一层的权重、修改某一层的参数等。

应用场景

快速搭建简单模型：对于一些结构相对简单、层与层之间按顺序连接的神经网络，如小型的卷积神经网络用于图像分类任务的基础结构、简单的多层感知机（全连接神经网络）等，使用 nn.Sequential 可以快速搭建起来，减少代码量。
模型模块化：在构建大型复杂模型时，可以将模型的不同部分（如特征提取部分、分类部分等）分别用 nn.Sequential 封装，使代码结构更加清晰，便于管理和维护。

总之，torch.nn.Sequential 是PyTorch中构建神经网络模型时常用的工具，能帮助开发者高效、简洁地组织神经网络层。

3.2 有关代码

import torchfrom torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequentialclass Test(nn.Module):def __init__(self):super(Test, self).__init__()# self.conv1 = Conv2d(3,32,5, padding=2, stride=1)# self.pool1 = MaxPool2d(2)# self.conv2 = Conv2d(32,32,5, padding=2, stride=1)# self.pool2 = MaxPool2d(2)# self.conv3 = Conv2d(32,64,5, padding=2, stride=1)# self.pool3 = MaxPool2d(2)# self.flatten = Flatten()# self.linear1 = Linear(1024,64)# self.linear2 = Linear(64,10)self.model1 = Sequential(Conv2d(3, 32, 5, padding=2, stride=1),MaxPool2d(2),Conv2d(32, 32, 5, padding=2, stride=1),MaxPool2d(2),Conv2d(32, 64, 5, padding=2, stride=1),MaxPool2d(2),Flatten(),Linear(1024, 64),Linear(64, 10))def forward(self, x):# x = self.conv1(x)#         # x = self.pool1(x)#         # x = self.conv2(x)#         # x = self.pool2(x)#         # x = self.conv3(x)#         # x = self.pool3(x)#         # x = self.flatten(x)#         # x = self.linear1(x)#         # x = self.linear2(x)x = self.model1(x)return xtest = Test()print(test)
# 检测网络结构
input = torch.ones((64, 3, 32, 32))
output = test(input)
print(output.shape)

运行结果
在这里插入图片描述

3.2 利用tensorboard来查看结果

writer = SummaryWriter("logs_seq")
writer.add_graph(test, input)
writer.close()

在这里插入图片描述

查看全文

http://www.dtcms.com/a/212755.html

机器学习算法-一元线性回归（最小二乘拟合 and 梯度下降）

java三种常见设计模式，工厂、策略、责任链

OWASP Juice-Shop靶场(⭐⭐)

aws(学习笔记第四十二课) serverless-backend

2025年5月系分论文题（回忆版）

为什么size_t重要，size_t的大小

理论物理：为什么在极低温（接近绝对零度）时，经典理论失效？

并发编程艺术--AQS底层源码解析(二）

多线程的基础知识以及应用

计算机视觉---YOLOv2

2021年认证杯SPSSPRO杯数学建模B题(第二阶段)依巴谷星表中的毕星团求解全过程文档及程序

计算机网络学习（六）——UDP

Go语言Map的底层原理

mysql都有哪些锁？

Java并发编程：全面解析锁策略、CAS与synchronized优化机制

基于SpringBoot的校园电竞赛事系统

uni-app学习笔记十二-vue3中组件传值(属性传值）

Redis之金字塔模型分层架构

[医学影像 AI] 使用 PyTorch 和 MedicalZooPytorch 实现 3D 医学影像分割

Linux Kernel调试：强大的printk（二）

两个mysql的maven依赖要用哪个？

高级特性实战：死信队列、延迟队列与优先级队列（一）

基于MATLAB编程针对NCV检测数据去漂移任务的完整解决方案

[特殊字符] Function Calling 技术详解与 Qwen 模型实践指南

软考系统架构设计师系列知识点之杂项集萃（72）

Oracle控制文件损坏恢复方案

RabbitMQ 可靠性保障：消息确认与持久化机制（一）

Android应用中设置非系统默认语言（使用Kotlin）

ChatGPT+知网，AI如何辅助真实科研写作流程？

JavaEE 网络编程套接字详解与实战示例

神经网络搭建小实战&Sequential的使用

一级目录

二级目录

三级目录

神经网络搭建小实战&Sequential的使用

1. 搭建网络

2. 检查网络的正确性

3. Sequential的使用

3.1 两种常见使用方式

3.1.1 直接传入模块

3.1.2. 使用OrderedDict传入模块

应用场景

3.2 有关代码

3.2 利用tensorboard来查看结果

相关文章：