当前位置: 首页 > wzjs >正文

wordpress mysql 密码seo怎么做最佳

wordpress mysql 密码,seo怎么做最佳,上海行业门户网站建设应用,公司网站首页设计文章目录 第1步检查loss出现nan的源头(排除输入数据问题)第2步 降低学习率查看能否解决(排除是学习率设置不当的问题)第3步 查看是不是数据溢出造成的(混精度运算->统一精度)第四步 确定gpu计算方式第五…

文章目录

  • 第1步检查loss出现nan的源头(排除输入数据问题)
  • 第2步 降低学习率查看能否解决(排除是学习率设置不当的问题)
  • 第3步 查看是不是数据溢出造成的(混精度运算->统一精度)
  • 第四步 确定gpu计算方式
  • 第五步 回到第3步骤,直接全部启用fp32精度参数训练
  • 教训:训练绝对别用fp16,不溢出算我的@@@

第1步检查loss出现nan的源头(排除输入数据问题)

遇到这个问题首先追踪打印loss看看究竟是啥导致了loss出现nan,结果发数据输入没啥问题,就是在训练过程中可训练参数出现inf和nan等:
在这里插入图片描述

第2步 降低学习率查看能否解决(排除是学习率设置不当的问题)

我将学习率从10-5降低十倍,一点点作用都没有
在这里插入图片描述

第3步 查看是不是数据溢出造成的(混精度运算->统一精度)

因为我这个情况比较特殊,我的输入数据是32位的,但是我的模型训练参数是16位的,loss计算是32位的,因为上面也发现我的问题是训练参数inf和nan了,所以我想会不会是精度不一样导致参数计算的时候溢出了。由于我的baseline是16位的,我计划将所有的转换成16位来训练。
结果还是一样,在训练的第一次更新完参数就inf和nan了。
在这里插入图片描述

第四步 确定gpu计算方式

可能你的gpu是半精度(fp16)训练,启用了tf32训练
加上:

torch.backends.cuda.matmul.allow_tf32 = False
torch.backends.cudnn.allow_tf32 = False
with autocast(dtype=torch.float16):

还是报错:
在这里插入图片描述

第五步 回到第3步骤,直接全部启用fp32精度参数训练

这里其实有一个问题:我最终需要的是fp16 的精度(因为怕溢出),但是参与训练是32。
解决:我将参数初始化为32,但是前向计算时候转换成16
在这里插入图片描述

解决了

教训:训练绝对别用fp16,不溢出算我的@@@

http://www.dtcms.com/wzjs/270590.html

相关文章:

  • 北京建机官网查询湖南有实力seo优化哪家好
  • 广州网站建设很棒 乐云践新关键词优化排名怎么做
  • 网站做app的软件珠海网络推广公司
  • 资源整合刷seo关键词排名软件
  • 网站开发用什么软件有哪些国家高新技术企业名单
  • 青岛哪家做网站的公司好爱站seo查询
  • 江西手机版建站系统开发开平网站设计
  • 吉林省电力建设总公司网站矿产网站建设价格
  • 网站建设里面链接打不开seo的方法有哪些
  • 代做效果图网站哪家好百度搜索次数统计
  • 20g虚拟主机建设网站seo引擎优化是做什么的
  • php做网站视频播放下载功能合肥关键词排名工具
  • 网站数据库怎么做同步软件排名优化
  • 广东网站建设公司排名优化seo深圳
  • 网络运维工程师薪酬厦门seo推广优化
  • 南昌网站建设公司在线排名优化
  • 北京外贸网站制作公司seo收录排名
  • 安丘住房建设局网站如何做好网站站内优化
  • 招远网站建设价格许昌网络推广外包
  • xps13适合网站开发吗近两年成功的网络营销案例及分析
  • 长沙seo优化方案yoast seo教程
  • wordpress超链接插件网站seo优化推广外包
  • 商业网站建设软件网购平台推广方案
  • 西安市建设局官方网站网络营销网站平台有哪些
  • 长沙市住房和城乡建设局网站芭蕉视频app无限次数
  • 做网站源码流程营销策划的概念
  • 南京网站建设包括哪些上海网站seo外包
  • 去什么网站找做电影的素材seo职业
  • 创建一个互联网媒体公司seo面试常见问题及答案
  • 网站开发攻略最新足球消息