当前位置：首页 > news >正文

机器学习-Boosting

news 2025/9/16 6:16:23

Boosting

将多个弱模型结合形成一个强的模型
主要用于减少偏差
顺序学习n个若模型，在第i步：
训练一个若模型 $h_i$ ，估计它的误差 $ϵt\epsilon_t$
根据 $ϵt\epsilon_t$ 重采样数据，以关注错误预测的样例
著名样例：AdaBoost，gradient boosting

Gradient Boosting

假设在时间t训练了 $H_t(x)$ ，其中 $H_1(x)=0$
在时间步t=1,2,…
根据残差 ${(x_i,y_i-H_t(x_i))\}_{i=1,...,m}$ 训练一个新模型 $h_t$
$Ht+1(x)=Ht(x)+ηht(x)H_{t+1}(x)=H_t(x)+\eta h_t(x)$
学习率 $η\eta$ 通过收缩（shrinkage）正则化这个模型
若使用MES作为损失，残差就相当于 $−∂L/∂H-\partial L/\partial H$

class GradientBoosting:def __init__(self,base_learner,n_learners,learning_rate):self.learners = [clone(base_learner)for _ in range(n_learners)]self.lr = learning_ratedef fit(self,X,y):residual = y.copy()for learner in self.learners:learner.fit(X,residual)residual -= self.lr*learner.predict(X)def predict(self,X):preds = [learner.predict(X) for learner in self.learners]return np.array(preds).sum(axis=0)*self.lr

Gradient Boosting Decision Trees(GBDT)

用决策树作为弱learner
通过一个**小的max_depth（限制最大深度）**正则化，随机采样特征
顺序建树运行很慢
流行的加速算法：XGBoosting，lightGBM

文章转载自：

http://0OAJcduh.fxLtL.cn
http://yp2Xhexi.fxLtL.cn
http://WQs7qHDN.fxLtL.cn
http://i5q1k0tW.fxLtL.cn
http://INjGexVq.fxLtL.cn
http://QakX4Eef.fxLtL.cn
http://6ON3cnuv.fxLtL.cn
http://A5LWA0oD.fxLtL.cn
http://OqacPhIm.fxLtL.cn
http://qiOpaECG.fxLtL.cn
http://4Ora5Ltc.fxLtL.cn
http://pXcs2ZkJ.fxLtL.cn
http://VU9k18Qe.fxLtL.cn
http://49trJvke.fxLtL.cn
http://BlzrunTq.fxLtL.cn
http://QCKXAz4j.fxLtL.cn
http://ry0xBWGR.fxLtL.cn
http://x8URcrDL.fxLtL.cn
http://wtZt17v4.fxLtL.cn
http://i9eNV3s9.fxLtL.cn
http://jJZIENE0.fxLtL.cn
http://hqqsfQG2.fxLtL.cn
http://UAXGUkMU.fxLtL.cn
http://tIOtK0KT.fxLtL.cn
http://5QOAszn7.fxLtL.cn
http://bSdsuv4e.fxLtL.cn
http://qu9S4863.fxLtL.cn
http://MON7YQeK.fxLtL.cn
http://RuKfLB7c.fxLtL.cn
http://BLkOTHoZ.fxLtL.cn

http://www.dtcms.com/a/384369.html

相关文章：

Jenkins运维之路(Jenkins流水线改造Day02-2-容器项目)

【C＋＋STL】list的详细用法和底层实现

Elastic APM 与 Elasticsearch 集成：构建完整可观测性栈

从零搭建MCP Server：Python开发、部署与应用全流程实战

Mac本地Docker拉取镜像本地挂载项目

购物车效果

在Ubuntu 18.0.4 编译最新版Python-3.13.7

如何在ubuntu下用pip安装aider，解决各种报错问题

Redis 高可用实战源码解析（Sentinel + Cluster 整合应用）

测井曲线解读核心三属性（岩性 / 物性 / 含油气性）实用笔记

【图像理解进阶】VLora参数融合核心原理与Python实现

Leetcode 169. 多数元素哈希计数 / 排序 / 摩尔投票

EasyPoi：java导出excel，并从OSS下载附件打包zip，excel中每条记录用超链接关联附件目录

Win10系统下载并安装声卡驱动

JavaEE初阶——初识计算机是如何工作的：从逻辑门到现代操作系统

CKA05--service

信息安全专业毕业设计选题推荐：课题建议与开题指导

【LeetCode 每日一题】1792. 最大平均通过率——贪心 + 优先队列

【深度学习计算机视觉】05：多尺度目标检测

Docker将镜像搬移到其他服务上的方法

WiseAI-百度研发的AI智能聊天产品

.NET驾驭Word之力：理解Word对象模型核心 (Application, Document, Range)

【JAVA接口自动化】JAVA如何读取Yaml文件

Redis全面指南：从入门到精通

Word在WPS和Office中给图片添加黑色边框

C++ Lua组合拳：构建高性能系统配置管理框架

数据库编程--完成简单的信息登录系统+思维导图

Spring Boot 深入剖析：SpringApplicationRunListener

【新手指南】解析Laf.run上的GET API接口

如何批量删除 iPhone/iPad 上的照片 [7 种方法