当前位置: 首页 > news >正文

机器学习——GBDT、GBRT

相较于AdaBoost的经典算法模型而言,目前主流的是GBDT系列模型,与AdaBoost(其组合可以是任意单模型)不同的是,提升树(boosting tree)的弱分类器只能是决策树模型

利用损失函数的负梯度求解(为什么会采用这种方式进行求解呢?因为在损失函数为平方或者对数形式时,前向分布算法的求解比较容易,但是损失函数如果是一般的形式,那么其向前分布算法的求解迭代过程是不容易的,故此时可以采用负梯度求解的方式解决)提升树前向分布迭代过程的方法是梯度提升树(gradient boosting tree)

GBDT(梯度提升决策树,gradient boosting decision tree),其组成的模型为CART决策树。针对分类问题进行解决的,其分类的基本模型为二叉分类树,其对应的梯度提升决策树称为GBDT;针对回归问题进行解决的,其回归的基本模型为二叉回归树,其对应的梯度提升回归树称为GBRT(gradient boosting regression tree)

其实GBDT和GBRT很好理解,就是对决策树进行组合,一个决策树解决了一个任务80%,下一个决策树解决剩余损失的20%中70%,最终不断的进行决策树的迭代,得到最优的决策结果,这其中决策树组合就是提升决策树。使用梯度下降法对提升决策树进行优化的过程就是梯度提升树模型

GBDT的实现流程(其整体的构建过程总结为:点-》一个树-》多个树):树结点-》CART(分类树/回归树)-》GBDT(基本超参数-》拟合方法-》预测方法)-》损失函数(交叉熵损失-》均方损失-》一阶导数)-》辅助函数(数据标准化-》数据划分方法-》数据打乱方法)

其适用场景在对于一个数据集需要对其进行分类(GBDT需要对标签进行编码)或者回归预测(GBRT)的任务。GBDT和GBRT在sklearn中都封装好了,到时候直接进行调用即可快速实操

相关文章:

  • Vue下 Sortable 实现 table 列表字段可拖拽排序,显示隐藏组件开发
  • 食品计算—Nutrition5k: Towards Automatic Nutritional Understanding of Generic Food
  • 5、类的6个默认成员函数和特性--类的新功能
  • 高级java每日一道面试题-2025年3月14日-微服务篇[Eureka篇]-Eureka如何保证高可用性?
  • freecad手动装插件 add on
  • 最大数字(java)(DFS实现)
  • AMD机密计算虚拟机介绍
  • ubuntu系统安装docker
  • 天梯赛 L2-022 重排链表
  • 自顶向下学习K8S--部署Agones
  • Lua 数组
  • 平安证券 NoETL 指标平台实践:统一数据口径,驱动高效经营分析与智能决策
  • Ubuntu 使用终端手动连接无线网络(wlan0)完整流程 + 故障排查记录
  • Vue3.5 企业级管理系统实战(十一):全屏切换组件
  • 产生式系统的完整示例——医疗诊断系统(附python代码)
  • zookeeper部署教程
  • 如何自动化同义词并使用我们的 Synonyms API 进行上传
  • java项目之基于ssm的亚盛汽车配件销售业绩管理系统(源码+文档)
  • 【每日算法】Day 11-1:分治算法精讲——从归并排序到最近点对问题(C++实现)
  • [运维]Linux系统扩容磁盘空间-将未分配的空间进行整合分配
  • 广西壮族自治区党委常委会:坚决拥护党中央对蓝天立进行审查调查的决定
  • 俄乌代表团抵达谈判会场
  • 消息人士称俄方反对美国代表参加俄乌直接会谈
  • 媒体:“重病老人银行取款身亡”涉事家属称已和解,银行将支付十万
  • 泽连斯基已离开土耳其安卡拉
  • 奥运“四朝元老”华天回国参赛,伤势未愈谨慎出战全国锦标赛