当前位置: 首页 > news >正文

深度学习pycharm debug

深度学习中,Debug 是定位并解决代码逻辑错误(如张量维度不匹配)、训练异常(如 Loss 波动)、数据问题(如标签错误)的关键手段,通过打印维度、可视化梯度等方法确保模型正常运行、优化性能,贯穿开发全流程。

直接上实例以经典错误shape报错为例:

import torch
import torch.nn as nn
import torch.nn.functional as F# 模拟图像数据
x = torch.randn(8, 3, 64, 64)  # [B, C, H, W],batch size = 8# 模拟标签(分类任务)
labels = torch.randint(0, 5, (8,))  # 5 类问题,标签是 [8]# 模型定义
class BuggyNet(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(3, 16, kernel_size=3, padding=1)self.conv2 = nn.Conv2d(16, 32, kernel_size=3, padding=1)self.pool = nn.AdaptiveAvgPool2d((4, 4))  # 变成 [B, 32, 4, 4]self.linear = nn.Linear(32, 5)  # ❌ 故意设置错误 in_featuresdef forward(self, x):x = F.relu(self.conv1(x))        # [B, 16, 64, 64]x = F.relu(self.conv2(x))        # [B, 32, 64, 64]x = self.pool(x)                 # [B, 32, 4, 4]x = self.linear(x)               # ❌ 错误! x 是 4D,Linear 接受 2D 或 3Dreturn xmodel = BuggyNet()
criterion = nn.CrossEntropyLoss()# 前向传播
outputs = model(x)                  # 会报错
loss = criterion(outputs, labels)  # 不会执行到这里

首先设置断点:

然后进行debug右击:

 然后会出现控制台:

会出现变量和变量的信息(shape,值):

然后我们进行单步:

然后变量开始变化,当单步到24行时:

此刻x的shape是(8,32,4,4)但是在这个linear层

self.linear = nn.Linear(32, 5)  # ❌ 故意设置错误 in_features

期望输入是32,不仅维度不相同channel也不相同,所以继续单步会报错:

RuntimeError: mat1 and mat2 shapes cannot be multiplied (1024x4 and 32x5)

然后我们根据错误进行操作将x展平并且修改linear的输入:
x = x.view(x.size(0), -1)        # [8, 32*4*4] = [8, 512]
self.linear = nn.Linear(512, 5)  # ✅ 修复后的定义

import torch
import torch.nn as nn
import torch.nn.functional as F# 模拟图像数据
x = torch.randn(8, 3, 64, 64)  # [B, C, H, W],batch size = 8# 模拟标签(分类任务)
labels = torch.randint(0, 5, (8,))  # 5 类问题,标签是 [8]# 模型定义
class BuggyNet(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(3, 16, kernel_size=3, padding=1)self.conv2 = nn.Conv2d(16, 32, kernel_size=3, padding=1)self.pool = nn.AdaptiveAvgPool2d((4, 4))  # 变成 [B, 32, 4, 4]self.linear = nn.Linear(512, 5)  # 此处修改def forward(self, x):x = F.relu(self.conv1(x))        # [B, 16, 64, 64]x = F.relu(self.conv2(x))        # [B, 32, 64, 64]x = self.pool(x)                 # [B, 32, 4, 4]x = x.view(x.size(0), -1)        # 此处修改x = self.linear(x)               return xmodel = BuggyNet()
criterion = nn.CrossEntropyLoss()# 前向传播
outputs = model(x)                  
loss = criterion(outputs, labels)  

然后我们这样就不会报错了。

很多时候缝合模块时就是经常遇见shape问题,耐性一点关注输入输出shape这样就可以轻松解决问题。


文章转载自:

http://2baYnxYq.dmtwz.cn
http://Bp2fkBbW.dmtwz.cn
http://pqHi0nZ2.dmtwz.cn
http://7UdUSWn1.dmtwz.cn
http://IFg0c0FY.dmtwz.cn
http://51GeYWfS.dmtwz.cn
http://tsK954eG.dmtwz.cn
http://w1CGMWdv.dmtwz.cn
http://EgPs8SmA.dmtwz.cn
http://zsBWZyHX.dmtwz.cn
http://5QO8Zr1d.dmtwz.cn
http://abWjQxYQ.dmtwz.cn
http://LSXB8z7I.dmtwz.cn
http://6AQo4PqI.dmtwz.cn
http://GnAzwbZl.dmtwz.cn
http://mXn2oPK6.dmtwz.cn
http://6wSc4aTe.dmtwz.cn
http://xG51osq0.dmtwz.cn
http://VJw3rriM.dmtwz.cn
http://xQMJeB4O.dmtwz.cn
http://TIUXKiLG.dmtwz.cn
http://pjtBMMiU.dmtwz.cn
http://6Ep6KBdO.dmtwz.cn
http://oCKmCK9G.dmtwz.cn
http://tgjWC0xn.dmtwz.cn
http://vZlphXPv.dmtwz.cn
http://qwCqzaWy.dmtwz.cn
http://2S0VTtRV.dmtwz.cn
http://AwazuaAU.dmtwz.cn
http://DkRjAJ16.dmtwz.cn
http://www.dtcms.com/a/226809.html

相关文章:

  • 碳中和新路径:铁电液晶屏如何破解高性能与节能矛盾?
  • C++.cstring string
  • 渗透测试之信息搜集
  • 第1篇:数据库中间件概述:架构演进、典型方案与应用场景
  • React 组件异常捕获机制详解
  • Linux --TCP协议实现简单的网络通信(中英翻译)
  • vite构建工具
  • 吴恩达MCP课程(5):mcp_chatbot_prompt_resource.py
  • K-匿名模型
  • 面向连接的运输:TCP
  • 基于 Android 和 JBox2D 的简单小游戏
  • Android高级开发第三篇 - JNI异常处理与线程安全编程
  • 用 Whisper 打破沉默:AI 语音技术如何重塑无障碍沟通方式?
  • HTTP、WebSocket、SSE 对比
  • CNN卷积网络:让计算机拥有“火眼金睛“(superior哥AI系列第4期)
  • 打卡day43
  • 秋招Day12 - 计算机网络 - UDP
  • 05.MySQL表的约束
  • 如何区分虚拟货币诈骗与经营失败?
  • STM32G4 电机外设篇(四)DAC输出电流波形 + CAN通讯
  • Vue-3-前端框架Vue基础入门之VSCode开发环境配置和Tomcat部署Vue项目
  • paoxiaomo的XCPC算法竞赛训练经验
  • C++中实现随机数(超详细!​​​​​)
  • 黑马程序员C++核心编程笔记--4 类和对象--多态
  • 1.文件操作相关的库
  • Java Netty 中处理粘包和半包问题的解决方案 | TCP消息完整性校验(XOR )
  • 基于GPT-SoVITS-v4-TTS的音频文本推理,流式生成
  • SOC-ESP32S3部分:25-HTTP请求
  • 移动AI神器GPT Mobile:多模型自由切换
  • 基于SpringBoot运动会管理系统设计和实现(源码+文档+部署讲解)