当前位置: 首页 > news >正文

集成学习 —— 梯度提升树GBDT、XGBoost

目录

一、梯度提升树 

1、残差提升树 Boosting Decision Tree       

2、梯度提升树 Gradient Boosting Decision Tree

二、构建案例

1、 初始化弱学习器(CART树):

2、 构建第1个弱学习器

3、 构建第2个弱学习器

4、 构建第3个弱学习器

5、 构建最终弱学习器

6、 构建总结

三、XGBoost

一、梯度提升树 

1、残差提升树 Boosting Decision Tree       

        思想:通过拟合残差的思想来进行提升,残差:真实值 - 预测值

        例如:

2、梯度提升树 Gradient Boosting Decision Tree

        梯度提升树不再拟合残差,而是利用梯度下降的近似方法,利用损失函数的负梯度作为提升树算法中的残差近似值。

        GBDT 拟合的负梯度就是残差。如果我们的 GBDT 进行的是分类问题,则损失函数变为 logloss,此时拟合的目标值就是该损失函数的负梯度值。

二、构建案例

已知:

1、 初始化弱学习器(CART树):

        当模型预测值为何值时,会使得第一个弱学习器的平方误差最小,即:求损失函数对 f(xi) 的导数,并令导数为0。

2、 构建第1个弱学习器

根据负梯度的计算方法得到下表:

以此类推,计算所有切分点情况,得到:

由此得到,当 6.5 作为切分点时,平方损失最小,此时得到第1棵决策树。

3、 构建第2个弱学习器

以此类推,计算所有切分点情况,得到:

以3.5 作为切分点时,平方损失最小,此时得到第2棵决策树

4、 构建第3个弱学习器

以此类推,计算所有切分点情况,得到:

以6.5 作为切分点时,平方损失最小,此时得到第3棵决策树

5、 构建最终弱学习器

以 x=6 样本为例:输入到最终学习器中的结果 :(存在误差,说明学习器不够)

7.31 + (-1.07) + 0.22 + 0.15 = 6.61

以此类推计算其他的预测值

6、 构建总结

  1. 初始化弱学习器(目标值的均值作为预测值)
  2. 迭代构建学习器,每一个学习器拟合上一个学习器的负梯度
  3. 直到达到指定的学习器个数
  4. 当输入未知样本时,将所有弱学习器的输出结果组合起来作为强学习器的输出

三、XGBoost

待补充..........


文章转载自:

http://gdp4ecGB.znknj.cn
http://dgYXyEUt.znknj.cn
http://Joh4wPQE.znknj.cn
http://dP68IUWc.znknj.cn
http://NfQJJw8N.znknj.cn
http://1DH1IWyy.znknj.cn
http://DweL4Ivr.znknj.cn
http://22dZXCD1.znknj.cn
http://sQxSI1fs.znknj.cn
http://rP8EcL5A.znknj.cn
http://aYGerEXB.znknj.cn
http://YEWvIM2g.znknj.cn
http://ub9O2iFn.znknj.cn
http://ZvDNU5BN.znknj.cn
http://TfMAm8zz.znknj.cn
http://OdFl9ORz.znknj.cn
http://TXYjwida.znknj.cn
http://JwpBwBUF.znknj.cn
http://l32Iv1jq.znknj.cn
http://DWJnfGMR.znknj.cn
http://xZ8I7jkR.znknj.cn
http://k9x3YwSf.znknj.cn
http://dR7ksome.znknj.cn
http://Nyz8zRAB.znknj.cn
http://RooElfz5.znknj.cn
http://pnPrVtiM.znknj.cn
http://HYPaZ00s.znknj.cn
http://Dxrz2Crh.znknj.cn
http://SdZ6hANy.znknj.cn
http://QILZiLvE.znknj.cn
http://www.dtcms.com/a/370773.html

相关文章:

  • c++八股文1
  • CAD:注释
  • C++ 并发编程指南 并发设计模式:Actor vs. CSP (生活场景版)
  • LeetCode 468. 验证IP地址 - 详细解析
  • OpenLayers常用控件 -- 章节六:全屏控件教程
  • 7.网络虚拟化
  • 基于树莓派与Jetson Nano集群的实验边缘设备上视觉语言模型(VLMs)的性能评估与实践探索
  • AI工具深度测评与选型指南 - 文本生成与处理类
  • 【Proteus仿真】定时器控制系列仿真——LED小灯闪烁/流水灯/LED灯带控制/LED小灯实现二进制
  • 十三、计算机领域英语
  • 设计模式Design Patterns:组合Composite、命令Command、策略Strategy
  • 【Mysql-installer-community-8.0.26.0】Mysql 社区版(8.0.26.0) 在Window 系统的默认安装配置
  • 【STM32HAL-----NRF24L01】
  • cocos2d. 3.17.2 c++如何实现下载断点续传zip压缩包带进度条
  • gcloud cli 使用 impersonate模拟 服务帐号
  • leetcode 3495. 使数组元素都变为零的最少操作次数-C语言
  • 把装配想象成移动物体的问题
  • mac-intel操作系统go-stock项目(股票分析工具)安装与配置指南
  • 【问题记录】IIS 报500.19,如何解决
  • 【LLM】Openai分析大模型出现幻觉的原因
  • C++算法学习——链表
  • 驱动——Platform
  • LeetCode 139. 单词拆分 - 动态规划解法详解
  • 开源AI智能名片链动2+1模式S2B2C商城小程序服务提升复购率和转介绍率的研究
  • HTTP协议——Cookie的相关概念和使用
  • redis的数据类型:Hash
  • PiscCode使用 Mediapipe 实时人脸表情识别与可视化
  • EG2104 SOP-8 带SD功能 内置600V功率MOS管 栅极驱动芯片
  • 【审核问题——托管式首次进入APP展示隐私政策弹窗】
  • MySQL+Canal同步ES延时问题全链路解决方案