当前位置: 首页 > news >正文

大模型-高频考点-每日一更【篇二】

问题:dropout如何运作

回答:

  1. dropout仅在训练中应用,而不在推理/评估阶段应用

  2. 为了消除drop的神经元带来的激活规模的影响,其实还进行了额外操作:将训练期间的所有激活缩放一个因子1/(1-p),其中p是dropout率

给出代码示例:

# 定义dropout层
import torch
import torch.nn as nn
dropout_layer = nn.Dropout(0.2)# 训练阶段进行了缩放
dropout_layer.train()
x=torch.rand((1, 5))
# tensor([[0.94, 0.13, 0.93, 0.59, 0.86]])
dropout_layer(x)
# tensor([[0.00, 0.16, 1.16, 0.74, 1.08]])
x/(1-p)
# tensor([[0.94, 0.16, 1.16, 0.74, 1.08]])# 推理/评估阶段
dropout_layer.eval()
x
# tensor([[0.94, 0.13, 0.93, 0.59, 0.86]])
dropout_layer(x)
# tensor([[0.94, 0.13, 0.93, 0.59, 0.86]])

结尾

亲爱的读者朋友:感谢您在繁忙中驻足阅读本期内容!您的到来是对我们最大的支持❤️

正如古语所言:"当局者迷,旁观者清"。您独到的见解与客观评价,恰似一盏明灯💡,能帮助我们照亮内容盲区,让未来的创作更加贴近您的需求。

若此文给您带来启发或收获,不妨通过以下方式为彼此搭建一座桥梁: ✨ 点击右上角【点赞】图标,让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇,便于随时查阅回味 ✨ 在评论区留下您的真知灼见,让我们共同碰撞思维的火花

我始终秉持匠心精神,以键盘为犁铧深耕知识沃土💻,用每一次敲击传递专业价值,不断优化内容呈现形式,力求为您打造沉浸式的阅读盛宴📚。

有任何疑问或建议?评论区就是我们的连心桥!您的每一条留言我都将认真研读,并在24小时内回复解答📝。

愿我们携手同行,在知识的雨林中茁壮成长🌳,共享思想绽放的甘甜果实。下期相遇时,期待看到您智慧的评论与闪亮的点赞身影✨!

万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~


自我介绍:一线互联网大厂资深算法研发(工作6年+),4年以上招聘面试官经验(一二面面试官,面试候选人400+),深谙岗位专业知识、技能雷达图,已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化,提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务,助力您顺利完成学习和求职之旅(有需要者可私信联系) 

友友们,自己的知乎账号为“快乐星球”,定期更新技术文章,敬请关注!

http://www.dtcms.com/a/487736.html

相关文章:

  • 卡文迪许实验室:百年物理圣地的辉煌发展史
  • 服务器建设网站伪类网站
  • 网站建设论文模板小说网站建设目的
  • 模板建站有什么优势高大上网站设计
  • Windows Server 2012/2016 开启远程桌面
  • 网页设计课程主要内容网站关键词怎样优化
  • 深圳建设网站哪家强wordpress获取站点副标题
  • C#中的依赖注入
  • 石家庄专业商城网站制作wordpress 主机安装教程
  • 外贸玩具网站无锡网站制作.
  • 国密 SM3 算法详解
  • 技术解析:Cryptomator如何实现云文件透明加密——从开发视角看开源安全工具
  • AI系统源码,人工智能,图像、视频、聊天、聊天机器人
  • 网站建设布为网wordpress禁止自适应
  • WINDOWS查看FTP端口号脚本
  • 镇江市建设工程造价信息期刊电子版官方
  • C#:可选参数
  • java数据结构--认识泛型
  • 常德做网站专业公司有关网站空间不正确的说法是
  • vmware workstation 25H2 开启3D加速失败问题修复
  • 建站网站关键词优化沧州网站建设哪家专业
  • JVM类的加载
  • ui设计学习公司网站的seo优化怎么做
  • 网站开发的流程和步骤是什么免费seo网站优化
  • 分库分表下如何实现分页查询功能
  • 江苏弘盛建设工程集团有限公司网站好看企业官网源码
  • LVDS系列31:Xilinx 7系 ADC LVDS接口参考设计(二)
  • 网站建设是什么?进入百度网首页
  • 【HackTheBox】- Busqueda 靶机学习
  • 127.XIlinx fpga端的pcie(XDMA)与驱动是如何交换数据的