当前位置: 首页 > wzjs >正文

海口h5公司广州seo优化效果

海口h5公司,广州seo优化效果,长春网站营销,wordpress 嵌套文章目录 第1步检查loss出现nan的源头(排除输入数据问题)第2步 降低学习率查看能否解决(排除是学习率设置不当的问题)第3步 查看是不是数据溢出造成的(混精度运算->统一精度)第四步 确定gpu计算方式第五…

文章目录

  • 第1步检查loss出现nan的源头(排除输入数据问题)
  • 第2步 降低学习率查看能否解决(排除是学习率设置不当的问题)
  • 第3步 查看是不是数据溢出造成的(混精度运算->统一精度)
  • 第四步 确定gpu计算方式
  • 第五步 回到第3步骤,直接全部启用fp32精度参数训练
  • 教训:训练绝对别用fp16,不溢出算我的@@@

第1步检查loss出现nan的源头(排除输入数据问题)

遇到这个问题首先追踪打印loss看看究竟是啥导致了loss出现nan,结果发数据输入没啥问题,就是在训练过程中可训练参数出现inf和nan等:
在这里插入图片描述

第2步 降低学习率查看能否解决(排除是学习率设置不当的问题)

我将学习率从10-5降低十倍,一点点作用都没有
在这里插入图片描述

第3步 查看是不是数据溢出造成的(混精度运算->统一精度)

因为我这个情况比较特殊,我的输入数据是32位的,但是我的模型训练参数是16位的,loss计算是32位的,因为上面也发现我的问题是训练参数inf和nan了,所以我想会不会是精度不一样导致参数计算的时候溢出了。由于我的baseline是16位的,我计划将所有的转换成16位来训练。
结果还是一样,在训练的第一次更新完参数就inf和nan了。
在这里插入图片描述

第四步 确定gpu计算方式

可能你的gpu是半精度(fp16)训练,启用了tf32训练
加上:

torch.backends.cuda.matmul.allow_tf32 = False
torch.backends.cudnn.allow_tf32 = False
with autocast(dtype=torch.float16):

还是报错:
在这里插入图片描述

第五步 回到第3步骤,直接全部启用fp32精度参数训练

这里其实有一个问题:我最终需要的是fp16 的精度(因为怕溢出),但是参与训练是32。
解决:我将参数初始化为32,但是前向计算时候转换成16
在这里插入图片描述

解决了

教训:训练绝对别用fp16,不溢出算我的@@@

http://www.dtcms.com/wzjs/69478.html

相关文章:

  • 北京建机官网查询合肥seo排名优化公司
  • wordpress qq音乐播放器关键词优化需要从哪些方面开展?
  • 焦作 做 网站如何在百度上建立网站
  • 登陆网站密码不保存怎么做seo建站平台哪家好
  • 中信建设有限责任公司临空经济区seo教育培训机构
  • 做网站需要哪些费用支出用手机制作自己的网站
  • WordPress火车头规则搜索引擎优化的方法有哪些?
  • seo整站如何优化产品推广文案范文
  • 成都企业网站优化服务搜索引擎调价工具哪个好
  • 苏州房地产网站建设什么是sem
  • 酷玛网站建设比较好的品牌策划公司有哪些
  • 德保县建设局的网站比百度强大的搜索引擎
  • 下列关于网站开发中网页在线网站seo优化
  • 苏州网站设计价格百度指数是啥
  • 比特币简易网站开发重庆网站网络推广
  • 快递网站怎么制作广告代运营
  • 网站首眉怎么做百度seo搜索
  • 小程序开发工具代理平台西安关键字优化哪家好
  • 张家口做网站便宜点的网络广告策划与制作
  • 福州成人报考网站百度官方网
  • 那个网站做图片比较赚钱seo百度首页排名业务
  • html什么意思短视频入口seo
  • 临沂专业网站建设公司百度seo优化网站
  • 现在哪个网站是视觉差滚动的全国疫情排名一览表
  • 做网站一般工资如何免费创建网站的平台
  • 哪里有培训网站开发手机搜索引擎
  • 做百度网站要多少钱产品网络营销分析
  • vip广告网站建设seo完整教程视频教程
  • 优化网站建设关键词免费下载
  • 亚马逊网站建设资料接广告推广的平台