当前位置：首页 > news >正文

大模型-高频考点-每日一更【篇二】

news 2025/10/16 12:18:00

问题：dropout如何运作

回答：

dropout仅在训练中应用，而不在推理/评估阶段应用
为了消除drop的神经元带来的激活规模的影响，其实还进行了额外操作：将训练期间的所有激活缩放一个因子1/(1-p)，其中p是dropout率

给出代码示例：

# 定义dropout层
import torch
import torch.nn as nn
dropout_layer = nn.Dropout(0.2)# 训练阶段进行了缩放
dropout_layer.train()
x=torch.rand((1, 5))
# tensor([[0.94, 0.13, 0.93, 0.59, 0.86]])
dropout_layer(x)
# tensor([[0.00, 0.16, 1.16, 0.74, 1.08]])
x/(1-p)
# tensor([[0.94, 0.16, 1.16, 0.74, 1.08]])# 推理/评估阶段
dropout_layer.eval()
x
# tensor([[0.94, 0.13, 0.93, 0.59, 0.86]])
dropout_layer(x)
# tensor([[0.94, 0.13, 0.93, 0.59, 0.86]])

结尾

亲爱的读者朋友：感谢您在繁忙中驻足阅读本期内容！您的到来是对我们最大的支持❤️

正如古语所言："当局者迷，旁观者清"。您独到的见解与客观评价，恰似一盏明灯💡，能帮助我们照亮内容盲区，让未来的创作更加贴近您的需求。

若此文给您带来启发或收获，不妨通过以下方式为彼此搭建一座桥梁： ✨ 点击右上角【点赞】图标，让好内容被更多人看见 ✨ 滑动屏幕【收藏】本篇，便于随时查阅回味 ✨ 在评论区留下您的真知灼见，让我们共同碰撞思维的火花

我始终秉持匠心精神，以键盘为犁铧深耕知识沃土💻，用每一次敲击传递专业价值，不断优化内容呈现形式，力求为您打造沉浸式的阅读盛宴📚。

有任何疑问或建议？评论区就是我们的连心桥！您的每一条留言我都将认真研读，并在24小时内回复解答📝。

愿我们携手同行，在知识的雨林中茁壮成长🌳，共享思想绽放的甘甜果实。下期相遇时，期待看到您智慧的评论与闪亮的点赞身影✨！

万分感谢🙏🙏您的点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚～

自我介绍：一线互联网大厂资深算法研发（工作6年+），4年以上招聘面试官经验（一二面面试官，面试候选人400+），深谙岗位专业知识、技能雷达图，已累计辅导15+求职者顺利入职大中型互联网公司。熟练掌握大模型、NLP、搜索、推荐、数据挖掘算法和优化，提供面试辅导、专业知识入门到进阶辅导等定制化需求等服务，助力您顺利完成学习和求职之旅（有需要者可私信联系）

友友们，自己的知乎账号为“快乐星球”，定期更新技术文章，敬请关注！

查看全文

http://www.dtcms.com/a/487736.html