当前位置: 首页 > news >正文

python打卡day52@浙大疏锦行

知识点回顾:

  1. 随机种子
  2. 内参的初始化
  3. 神经网络调参指南
    1. 参数的分类
    2. 调参的顺序
    3. 各部分参数的调整心得

神经网络调参核心实践

一、全局随机种子设置(修改 src/models/train.py )

def set_seed(seed=42):torch.manual_seed(seed)torch.cuda.manual_seed_all(seed)np.random.seed(seed)random.seed(seed)torch.backends.cudnn.deterministic = Truetorch.backends.cudnn.benchmark = False# 在训练开始时调用
set_seed(config.SEED)

 二、智能参数初始化(新增 src/models/initialization.py )

def initialize_weights(m):if isinstance(m, nn.Conv2d):nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')if m.bias is not None:nn.init.constant_(m.bias, 0)elif isinstance(m, nn.Linear):nn.init.xavier_uniform_(m.weight)nn.init.normal_(m.bias, mean=0, std=0.01)# 在模型定义后调用
model.apply(initialize_weights)

三、系统化调参流程

# 参数优先级调优顺序
调参步骤 = [('基础学习率', {'lr': [1e-3, 3e-4]}),('优化器选择', {'optim': ['adam', 'sgd']}),('批量大小', {'batch_size': [32, 64]}),('正则化组合', {'weight_decay': [0, 1e-4],'dropout_rate': [0.2, 0.5]})
]# 自适应学习率配置示例
scheduler = torch.optim.lr_scheduler.OneCycleLR(optimizer, max_lr=config.MAX_LR,steps_per_epoch=len(train_loader),epochs=config.EPOCHS
)

调参心得
1. 参数分类 :
   
   - 架构参数:卷积核尺寸/通道数
   - 训练参数:学习率/批量大小
   - 正则参数:Dropout率/L2系数
2. 优化顺序 :

flowchart LRA[数据预处理] --> B[初始学习率]B --> C[优化器类型]C --> D[批量大小]D --> E[正则强度]

3.实战技巧 :
- 使用 torch.utils.tensorboard 记录超参数实验
- 对边界层(如第一个卷积层)使用更大学习率
- 采用贝叶斯优化进行自动化超参数搜索

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.dtcms.com/a/246460.html

相关文章:

  • 国产最高性能USRP SDR平台:国产USRP X440 PRO, 搭载UltraScale+ XCZU48DR芯片
  • 《TCP/IP协议卷1》第14章 DNS:域名系统
  • 让报表成为生产现场的“神经系统”,推动管理自动化升级
  • Vue.js 中 “require is not defined“
  • 使用AkShare获取大A列表
  • GCC编译/连接/优化等选项
  • JavaWeb期末速成 JSP
  • 网络编程之HTML语言基础
  • flatbuffer源码编译和使用方法
  • 短剧小程序开发:开启碎片化娱乐新视界
  • SpringCloud微服务:服务保护和分布式事务
  • 三次握手建立连接,四次挥手释放连接——TCP协议的核心机制
  • Linux 下的 PM2 完整指南
  • linux基于内存实现jar文件搜索
  • 如何有效监控JVM环境,保障应用性能
  • Elasticsearch:使用 ES|QL 进行地理空间距离搜索
  • 动态规划3——背包类动态规划详解
  • elasticSearch是什么,如何使用,有什么用
  • 考研系列—408真题操作系统篇(2015-2019)
  • Windows环境变量原理(用户变量与系统变量)(用户环境变量、系统环境变量)
  • centos6.5 老旧系统编译glib-2.58.3.tar.bz2
  • vue-property-decorator实践(一)
  • 如何通过插件系统打造个性化效率工作流
  • AUTOSAR图解==>AUTOSAR_TR_InteroperabilityOfAutosarTools
  • PEP 8: E302 expected 2 blank lines, found 0
  • [vela os_5] 中断系统 | 任务调度 | 日志系统
  • node.js连接mysql写接口(一)
  • jupyter notebook的相关知识及可能遇到的问题
  • spring-ai MCP Server运行一段时间后断联2
  • Spring Boot3批式访问Dify聊天助手接口