当前位置: 首页 > news >正文

损失函数和调度器相关类代码回顾理解 |nn.CrossEntropyLoss\CosineAnnealingLR

目录

nn.CrossEntropyLoss

CosineAnnealingLR


nn.CrossEntropyLoss

loss_func = nn.CrossEntropyLoss(reduction="sum")

定义nn.CrossEntropyLoss交叉熵损失函数,reduction参数设置为"sum",表示将所有样本的损失相加。reduction 参数用于指定如何对损失进行归约,有三个可能的值:"none"、"mean" 和 "sum"。选择=“sum”,即输出损失将被求和。由于分批处理数据,因此将返回每批数据的损失值之和。

CosineAnnealingLR

lr_scheduler = CosineAnnealingLR(opt,T_max=2,eta_min=1e-5)

创建学习率调度器,T_max表示周期长度,eta_min表示最小学习率。该调度器基于cosine annealing schedule余弦退火方法来调整学习率。余弦退火学习率调整策略是一种常用的学习率调整策略,它会在训练过程中逐渐减小学习率,直到达到一个最小值。这里的学习率将从优化器设定值lr=1e-4开始,逐渐向最小值eta_min=1e-5减小,并在2*T_max=4次迭代中返回到原始设定值。

http://www.dtcms.com/a/310837.html

相关文章:

  • Codeforces Round 1040 (Div. 2) A - D题详细题解
  • DP-v2.1-mem-clean学习(3.6.8-3.6.8.1)
  • Java试题-选择题(3)
  • 风光储并离网切换仿真模型(下垂控制一次调频)
  • CORS模块:你的跨域快速通行证 [特殊字符]
  • 第七章 愿景13 CBS升级
  • Git 误删分支怎么恢复
  • 中国不同类型竹林分布数据
  • 一个强大的向量数据库——Milvus
  • 8.1.2 TiDB存储引擎的原理
  • 鹧鸪云:16步精控工商业光伏全流程
  • Au速成班-多轨编辑流程
  • C语言函数指针和结构体
  • 第13届蓝桥杯Python青少组中/高级组选拔赛(STEMA)2022年1月22日真题
  • socket编程-UDP(2)-设计翻译系统
  • 基于线性规划的储能充放电仿真系统
  • 读取数据集及数据集划分
  • 7.苹果ios逆向-目录结构
  • 【vue】Vue 项目创建工具对比:vue create 与 create-vue 的核心区别
  • 安卓开发--LinearLayout(线性布局)
  • 华锐矩阵世界平台与海外客户洽谈合作
  • 将 YOLOv11 的 .pt 模型转换为 YOLOv8 格式需要特定的处理流程 机器学习 计算机视觉cv
  • Spotlight on MySQL 300安装教程(附使用指南):实时监控MySQL性能的工具
  • 好未来披露2026财年Q1财报:净利润3128万美元,同比大增174%
  • 解决IDEA中MAVEN项目总是将LANGUAGE LEVEL重置的问题
  • InteriorGS 数据集
  • 力扣-字母异位词
  • gpu 优化
  • 从删库到跑路?MyBatis3逻辑删除实战:优雅规避数据灾难
  • 一致连续性背后的直觉是什么?