当前位置: 首页 > news >正文

调参——optuna

它基于贝叶斯优化(Bayesian Optimization)思想,通过构建一个概率模型来预测超参数组合的性能,从而高效地探索超参数空间。相比传统网格搜索(Grid Search)或随机搜索(Random Search),Optuna 更智能,能够在较少的试验次数内找到更优的超参数组合。

优化算法

  • Optuna 默认使用 TPE(Tree-structured Parzen Estimator) 算法,这是一种贝叶斯优化方法。
  • TPE 的核心思想是:
    • 维护一个概率模型,基于历史试验的超参数和性能(目标函数),估计哪些超参数组合更有可能产生更好的结果。
    • 将超参数空间分为“好”和“坏”两部分,优先在“好”的区域内采样新的超参数组合。
  • 随着试验次数增加,TPE 不断更新概率模型,逐步聚焦于表现更优的超参数区域。

剪枝机制(Pruning)

  • 如果某个试验的中间结果(例如某折交叉验证的 MAE)明显劣于之前试验的中位数,Optuna 会提前终止该试验。
  • 这大大减少了计算资源浪费,尤其是在试验次数较多或训练时间较长的情况下。

p.s.

  • 每次试验的结果(超参数和 MAE)存储在 SQLite 数据库中(study_storage),便于后续分析或恢复优化过程。
  • 优化完成后,Optuna 返回最佳超参数组合(study.best_params)和对应的最佳目标函数值(e.g.MAE)(study.best_value)。
http://www.dtcms.com/a/267750.html

相关文章:

  • Python 面向对象编程(OOP)全面详解:类、对象与 API
  • 【算法刷题记录(简单题)002】字符串字符匹配(java代码实现)
  • 线程池的七个参数设计源于对高并发场景下资源管理、系统稳定性与性能平衡的深刻洞察
  • Policy Gradient【强化学习的数学原理】
  • 【C语言刷题】第十一天:加量加餐继续,代码题训练,融会贯通IO模式
  • JMM--数据原子操作
  • Python asyncio库与GIL之间的关系,是否能够解决核心问题?
  • Spring--循环依赖以及三级缓存详解
  • Linux安装java后没法运行
  • 计算机组成原理《浮点数的存储》
  • Python基础之字典(Dictionary)全面指南
  • 南山科技园的步行
  • Qt项目锻炼——TODO清单(三)
  • 【论文笔记】OctoThinker:突破 Llama 推理瓶颈的中期训练范式
  • 乌邦图(20.04)添加中文拼音(中文输入法)
  • 实现电池储能装置的双向DCDC
  • Qt项目锻炼——TODO清单(二)
  • jmm--volatile
  • 前端面试专栏-算法篇:18. 查找算法(二分查找、哈希查找)
  • vue3 el-input el-select 非空校验
  • 大数据学习2:HIve
  • Linux进程管理:从基础到实战
  • Qt Ribbon效果界面
  • QT6 源(154)模型视图架构里的列表视图 QListView:先学习属性部分,
  • 认识Redis
  • Chat Model API
  • 60天python训练营打卡day52
  • 运算方法和运算器补充
  • 如何录制带备注的演示文稿(LaTex Beamer + Pympress)
  • Codeforces Round 919 (Div. 2) D. Array Repetition(分块,1900)