当前位置: 首页 > news >正文

记一次pytorch训练loss异常的问题

记一次pytorch训练loss异常的问题

问题描述

使用mmdetection框架训练时,某项loss出现异常大的值,比如1781232349724294.000。这个问题只在多卡训练时才会出现。

解决方法

在确认target和predction没有问题后,发现是在dataset中的数据处理出现了问题。在dataset中的__getitem__函数中,对数据进行了处理,但是在处理时,将数据转换为了numpy格式,而没有将其他dtype转换为float32,导致了数据类型不匹配,从而导致了loss异常。将数据转换为float32后,问题解决。
numpy生成的数据默认为float64,而pytorch默认为float32,所以在处理数据时,需要注意数据类型的转换。

http://www.dtcms.com/a/39341.html

相关文章:

  • LinkedList与链表
  • (学习总结26)Linux工具:make/Makefile 自动化构建、Git 版本控制器 和 gdb/cgdb 调试器
  • 鸿蒙-状态管理V2其他方法
  • 评高级工程师职称的条件-三大硬性要求
  • 【时时三省】(C语言基础)数据类型
  • Linux通过设备名称如何定位故障硬盘
  • 应用的负载均衡
  • windbg-记一次应用程序崩溃的定位
  • 【综合项目】api系统——基于Node.js、express、mysql等技术
  • 穷举vs暴搜vs深搜vs回溯vs剪枝(典型算法思想)—— OJ例题算法解析思路
  • 【java进阶】java多态深入探讨
  • C# | GDI+图像测距辅助线的实现思路
  • 企业知识库搭建:14款开源与免费系统选择
  • OpenAI开放Deep Research权限,AI智能体大战升级,DeepSeek与Claude迎来新对决
  • 【质量管理】怎么评估职能部门当前质量管理成熟度
  • Innodb MVCC实现原理
  • 【Java学习】Object类与接口
  • qt-C++笔记之QtCreator新建项目即Create Project所提供模板的逐个尝试
  • deepseek 本地化部署(小白也可部署)
  • SQL------搭建sql靶场和打开sql靶场及报错解决
  • 清华deepseek文档下载地址,DeepSeek:如何赋能职场应(附下载包)64页全面详细介绍(二)
  • PCL源码分析:曲面法向量采样
  • 【Python网络爬虫笔记】14-使用代理绕过访问限制
  • [java基础-JVM篇]2_垃圾收集器与内存分配策略
  • Jmeter聚合报告导出log文档,Jmeter聚合报告导出到CSV
  • 量子计算可能改变世界的四种方式
  • 基于Spring Security 6的OAuth2 系列之二十四 -响应式编程之一
  • 图像处理之图像边缘检测算法
  • 数据结构之各类排序算法代码及其详解
  • 【合作-互信不需要到的做前提 关键字摘取】