当前位置: 首页 > news >正文

基于Optuna 贝叶斯优化超参数调优之使用TPE创建研究对象

self.study = optuna.create_study(direction='maximize',sampler=TPESampler(seed=self.random_state)
)

这是使用 Optuna(一个超参数优化框架)创建一个“研究”(Study)对象的核心语句。


🧪 1. optuna.create_study() 是什么?

在 Optuna 中,Study 表示一次完整的超参数优化过程。它负责:

  • 管理所有试验(Trials)
  • 记录每次试验的超参数组合和目标函数值
  • 根据采样器(Sampler)决定下一次尝试哪些参数
  • 支持并行、持久化、可视化等高级功能

调用 create_study() 就是启动一个新的调优任务


🎯 2. direction='maximize'

含义:

指定优化目标的方向——你是想最大化还是最小化目标函数的返回值。

在你的场景中:

  • 目标函数返回的是 验证集 AUC(Area Under ROC Curve)
  • AUC 越高越好(最大为 1.0)
  • 所以你需要 最大化 AUC

因此设置:

direction='maximize'

✅ 如果你优化的是损失(如 MSE、LogLoss),则应设为 'minimize'


🤖 3. sampler=TPESampler(seed=self.random_state)

(1)什么是 sampler(采样器)?

Optuna 的核心思想是:不是随机乱试,而是根据历史试验结果智能地选择下一组超参数
这个“如何选择”的策略,就由 Sampler 决定。

Optuna 支持多种采样算法,例如:

  • RandomSampler:纯随机搜索
  • GridSampler:网格搜索(需预定义)
  • CmaEsSampler:基于进化策略
  • TPESampler贝叶斯优化中最常用、效果最好的默认算法

(2)什么是 TPESampler

TPE = Tree-structured Parzen Estimator
是一种基于概率模型的序列优化方法,属于贝叶斯优化的一种高效实现。

它的工作原理简述:
  1. 将已尝试的超参数分为两组:
    • “好”的试验(目标值较高)
    • “差”的试验(目标值较低)
  2. 分别对这两组建立概率密度模型(Parzen 估计器)
  3. 选择一个新超参数点,使得:

    “它来自‘好’分布的概率 / 来自‘差’分布的概率” 最大

👉 通俗理解:TPE 会记住哪些区域表现好,并更频繁地在这些区域附近探索,同时保留一定探索性以防陷入局部最优。

优点:样本效率高,适合黑盒函数优化(如训练一个 XGBoost 模型)。


(3)seed=self.random_state 的作用

设置随机种子,确保整个优化过程可复现

具体影响包括:

  • TPE 内部的初始随机采样(前几个 trial 通常是随机的)
  • 随机扰动、采样顺序等
  • 结合 XGBoost 和数据加载中的 random_state,实现端到端确定性

🔒 重要提示:仅设置 TPESampler(seed=...) 并不能保证 100% 复现,还需确保:

  • 数据顺序固定
  • XGBoost 的 random_state 固定
  • 不使用多线程(或设置 n_jobs=1,因为多线程调度可能引入非确定性)

但在大多数实践中,加上这个 seed 已能获得高度一致的结果。


📦 完整语义总结

self.study = optuna.create_study(direction='maximize',                # 我们要最大化目标函数(AUC)sampler=TPESampler(seed=self.random_state)  # 使用 TPE 贝叶斯优化算法,并固定随机种子以保证可复现
)

这行代码创建了一个 以最大化 AUC 为目标、使用 TPE 智能搜索策略、结果可复现的超参数优化任务容器

后续通过:

self.study.optimize(objective, n_trials=100)

让这个 study 运行 100 次试验,不断改进超参数,最终得到最优配置。


💡 补充:为什么选 TPE?

方法适用场景效率是否推荐
随机搜索快速基线初步探索
网格搜索参数少、离散极低不推荐用于连续空间
TPE(贝叶斯)黑盒函数、计算昂贵首选
CMA-ES连续空间、平滑函数中高特定场景

对于 XGBoost 调参这种每次 trial 成本高、参数空间连续+离散混合的任务,TPE 是工业界事实标准

http://www.dtcms.com/a/575469.html

相关文章:

  • 知识就是力量——温湿度传感器选型2.0
  • 做音乐网站要注意什么电脑经销部开具网站建设费
  • 福州网站建设方案服务青岛建设集团有限公司
  • <RT1176系列15>clock_config代码分析
  • 台州关键词首页优化东莞网站seo优化
  • 密云上海网站建设综合搜索引擎
  • 中国建设银行企业网站个人网站如何进行网络推广
  • 建设网站怎么克隆建设网站与服务器
  • 网站空间要备案吗东莞市网站建设分站品牌
  • 云南网站建设网站运营中英文切换的网站怎么做的
  • 网站都是怎么做的辽宁建设工程信息网上传标书时显示初始化签名证书选择模式失败
  • 长沙企业建站按效果付费wordpress随机文章
  • 可以写代码的网站有哪些问题怎么可以创建网站
  • 门户网站建设哪家便宜建设工程报建备案网站
  • [RE2] docs | FullMatch PartialMatch | 自动匹配
  • wordpress评测网站做黄金的分析师网站
  • 信阳市网站建设公司东莞企业推广网站
  • 怎样自己建个人网站wordpress文章自适应图片大小
  • 旅游网站首页图片重装电脑后没有wordpress
  • 公司专业做网站唐山网站建设zzvg
  • 建设服装网站的意义微信公众平台小程序管理
  • 北京市建设厅官方网站萧山建设银行招聘网站
  • PK10如何自己做网站做一个app开发多少钱
  • 网站流量下降管理咨询公司好不好做
  • 网络培训网站开发文献综述网页升级紧急通知域名
  • 全屏网站沈阳网势科技有限公司怎么样
  • 光触媒网站建设wordpress4.7.0下载
  • 珠海网络公司网站建设潍坊网络科技有限公司
  • 做资讯的网站黄页网怎么样
  • 网站建设优化保定织梦网站代码