第十九讲延续 简单理解什么是XGboost模型
让我们一步一步地彻底搞懂 XGBoost,不只是“用”,而是“理解”。🌱
🧠 一、XGBoost 是什么?
XGBoost 是 “eXtreme Gradient Boosting” 的缩写,是一种 集成学习算法,属于**提升法(Boosting)**的一种。
它的核心思想:
用多个弱模型(通常是决策树)一个接一个地串联起来,前一个模型没学好的地方,后一个模型来补救!
它的特点:
-
比普通 GBDT 更快、更准
-
具备正则化功能(防止过拟合)
-
支持并行处理
-
可以处理缺失值
-
在 Kaggle、天池比赛中几乎是“上分神器”
⚙️ 二、XGBoost 工作流程图解(类比)
我们用一个「猜水果」的例子理解:
🎯 目标:猜一个水果是“苹果”还是“橙子”
-
第1棵树(弱模型):
-
看颜色,猜大多数绿色的是苹果 → 对了一半,但也错了很多。
-
-
第2棵树:
-
学习第一棵树
-