当前位置: 首页 > news >正文

机器学习-Boosting

Boosting

  • 将多个弱模型结合形成一个强的模型
    主要用于减少偏差
  • 顺序学习n个若模型,在第i步:
    训练一个若模型hih_ihi,估计它的误差ϵt\epsilon_tϵt
    根据ϵt\epsilon_tϵt重采样数据,以关注错误预测的样例
  • 著名样例:AdaBoost,gradient boosting

Gradient Boosting

  • 假设在时间t训练了Ht(x)H_t(x)Ht(x),其中H1(x)=0H_1(x)=0H1(x)=0
  • 在时间步t=1,2,…
    根据残差{(xi,yi−Ht(xi))}i=1,...,m\{(x_i,y_i-H_t(x_i))\}_{i=1,...,m}{(xi,yiHt(xi))}i=1,...,m训练一个新模型hth_tht
    Ht+1(x)=Ht(x)+ηht(x)H_{t+1}(x)=H_t(x)+\eta h_t(x)Ht+1(x)=Ht(x)+ηht(x)
    学习率η\etaη通过收缩(shrinkage)正则化这个模型
  • 若使用MES作为损失,残差就相当于−∂L/∂H-\partial L/\partial HL/H
class GradientBoosting:def __init__(self,base_learner,n_learners,learning_rate):self.learners = [clone(base_learner)for _ in range(n_learners)]self.lr = learning_ratedef fit(self,X,y):residual = y.copy()for learner in self.learners:learner.fit(X,residual)residual -= self.lr*learner.predict(X)def predict(self,X):preds = [learner.predict(X) for learner in self.learners]return np.array(preds).sum(axis=0)*self.lr

Gradient Boosting Decision Trees(GBDT)

  • 用决策树作为弱learner
    通过一个**小的max_depth(限制最大深度)**正则化,随机采样特征
  • 顺序建树运行很慢
    流行的加速算法:XGBoosting,lightGBM

文章转载自:

http://0OAJcduh.fxLtL.cn
http://yp2Xhexi.fxLtL.cn
http://WQs7qHDN.fxLtL.cn
http://i5q1k0tW.fxLtL.cn
http://INjGexVq.fxLtL.cn
http://QakX4Eef.fxLtL.cn
http://6ON3cnuv.fxLtL.cn
http://A5LWA0oD.fxLtL.cn
http://OqacPhIm.fxLtL.cn
http://qiOpaECG.fxLtL.cn
http://4Ora5Ltc.fxLtL.cn
http://pXcs2ZkJ.fxLtL.cn
http://VU9k18Qe.fxLtL.cn
http://49trJvke.fxLtL.cn
http://BlzrunTq.fxLtL.cn
http://QCKXAz4j.fxLtL.cn
http://ry0xBWGR.fxLtL.cn
http://x8URcrDL.fxLtL.cn
http://wtZt17v4.fxLtL.cn
http://i9eNV3s9.fxLtL.cn
http://jJZIENE0.fxLtL.cn
http://hqqsfQG2.fxLtL.cn
http://UAXGUkMU.fxLtL.cn
http://tIOtK0KT.fxLtL.cn
http://5QOAszn7.fxLtL.cn
http://bSdsuv4e.fxLtL.cn
http://qu9S4863.fxLtL.cn
http://MON7YQeK.fxLtL.cn
http://RuKfLB7c.fxLtL.cn
http://BLkOTHoZ.fxLtL.cn
http://www.dtcms.com/a/384369.html

相关文章:

  • Jenkins运维之路(Jenkins流水线改造Day02-2-容器项目)
  • 【C++STL】list的详细用法和底层实现
  • Elastic APM 与 Elasticsearch 集成:构建完整可观测性栈
  • 从零搭建MCP Server:Python开发、部署与应用全流程实战
  • Mac本地Docker拉取镜像本地挂载项目
  • 购物车效果
  • 在Ubuntu 18.0.4 编译最新版Python-3.13.7
  • 如何在ubuntu下用pip安装aider,解决各种报错问题
  • Redis 高可用实战源码解析(Sentinel + Cluster 整合应用)
  • 测井曲线解读核心三属性(岩性 / 物性 / 含油气性)实用笔记
  • 【图像理解进阶】VLora参数融合核心原理与Python实现
  • Leetcode 169. 多数元素 哈希计数 / 排序 / 摩尔投票
  • EasyPoi:java导出excel,并从OSS下载附件打包zip,excel中每条记录用超链接关联附件目录
  • Win10系统下载并安装声卡驱动
  • JavaEE初阶——初识计算机是如何工作的:从逻辑门到现代操作系统
  • CKA05--service
  • 信息安全专业毕业设计选题推荐:课题建议与开题指导
  • 【LeetCode 每日一题】1792. 最大平均通过率——贪心 + 优先队列
  • 【深度学习计算机视觉】05:多尺度目标检测
  • Docker将镜像搬移到其他服务上的方法
  • WiseAI-百度研发的AI智能聊天产品
  • .NET驾驭Word之力:理解Word对象模型核心 (Application, Document, Range)
  • 【JAVA接口自动化】JAVA如何读取Yaml文件
  • Redis全面指南:从入门到精通
  • Word在WPS和Office中给图片添加黑色边框
  • C++ Lua组合拳:构建高性能系统配置管理框架
  • 数据库编程--完成简单的信息登录系统+思维导图
  • Spring Boot 深入剖析:SpringApplicationRunListener
  • 【新手指南】解析Laf.run上的GET API接口
  • 如何批量删除 iPhone/iPad 上的照片 [7 种方法