当前位置: 首页 > news >正文

Day40打卡 @浙大疏锦行

知识点回顾:

  1. 彩色和灰度图片测试和训练的规范写法:封装在函数中
  2. 展平操作:除第一个维度batchsize外全部展平
  3. dropout操作:训练阶段随机丢弃神经元,测试阶段eval模式关闭dropout
import torchdef flatten_tensor(x):"""保留batch维度,展平其余所有维度"""return x.view(x.size(0), -1)

class NeuralNetwork(torch.nn.Module):def __init__(self, input_dim, hidden_dim, dropout_prob=0.5):super().__init__()self.layer1 = torch.nn.Linear(input_dim, hidden_dim)self.dropout = torch.nn.Dropout(dropout_prob)self.layer2 = torch.nn.Linear(hidden_dim, 10)def forward(self, x):x = torch.relu(self.layer1(x))x = self.dropout(x)  # 训练时激活,测试时自动关闭return self.layer2(x)

model = NeuralNetwork(input_dim=784, hidden_dim=256)# 训练阶段
model.train()
output_train = model(flattened_grayscale)  # Dropout生效# 测试阶段
model.eval()
with torch.no_grad():output_test = model(flattened_grayscale)  # Dropout自动关闭

def train_epoch(model, dataloader, criterion, optimizer):model.train()for inputs, targets in dataloader:inputs = flatten_tensor(inputs)optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, targets)loss.backward()optimizer.step()def evaluate(model, dataloader):model.eval()total_correct = 0with torch.no_grad():for inputs, targets in dataloader:inputs = flatten_tensor(inputs)outputs = model(inputs)_, predicted = torch.max(outputs, 1)total_correct += (predicted == targets).sum().item()return total_correct / len(dataloader.dataset)

@浙大疏锦行​​​​​​​

http://www.dtcms.com/a/223644.html

相关文章:

  • CesiumInstancedMesh 实例
  • 数据库主键与索引详解
  • Nature:多模态大模型LLMs如何驱动多组学与生命科学研究新范式?
  • Hash 的工程优势: port range 匹配
  • embbeding 视频截图
  • 循序渐进PersistentVolumes与PersistentVolumeClaim
  • AI感知与行动:考拉悠然发布空间智能世界模型,让AI走进物理世界
  • 如何解决MySQL Workbench中的错误Error Code: 1175
  • ToolsSet之:十六进制及二进制编辑运算工具
  • SFINAE(替换并不是错误)机制详解详解
  • 【Java基础-环境搭建-创建项目】IntelliJ IDEA创建Java项目的详细步骤
  • C++ 之多线程和互斥锁原理和使用详解
  • TestHubo V1.1.0版本发布,新增用例评审功能,确保测试用例质量,提升测试用例覆盖率
  • shell管道笔记
  • 统计C盘各种扩展名文件大小总和及数量的PowerShell脚本
  • 集成测试 maestro-我的第一个flow以及第一次云端测试
  • 【递归、搜索与回溯算法】综合练习(二)
  • 免费高清多功能录屏软件推荐
  • Bootstrap:精通级教程(VIP10万字版)
  • (24)多租户 SaaS 平台设计
  • Microsoft.Extensions.AI 技术深度解析与实践指南
  • 特伦斯 S75:重塑钢琴体验的数码钢琴之选
  • 如何选择合适的培养基过滤器
  • Java大师成长计划之第35天:未来展望与个人总结
  • EDW2025|数据治理的神话破除——从误区到现实
  • 页面表格、模型、脚本这三者之间的数据是如何传输的?尤其是模型(Model)到底是怎样的运作原理与数据流转?
  • 2505软考高项第一、二批真题终极汇总
  • 彻底解决Win11文件资源管理器预览窗格无法预览问题
  • UHF RFID无源标签的芯片供电原理
  • File—IO流