当前位置: 首页 > news >正文

机器学习笔记:集成学习/模型融合

1 介绍

  • 集成学习是指结合两个或多个模型的机器学习模型
  • 通常情况下,集成学习能比单个模型找到更好的性能。

2 Bagging

  • Bagging通过采样训练数据集的样本,训练得到多样的模型,进而得到多样的预测结果
  • 在结合模型的预测结果时,可以对单个模型预测结果进行投票或平均。

2.1 随机森林

随机森林是 Bagging与树模型的结合:

  • 随机森林集成在训练数据集的不同引导样本上拟合决策树。

  • 随机森林还将对每个数据集的特征(列)进行采样

  • 在构建每个决策树时,随机森林不是在选择分割点时考虑所有特征,而是将特征限制为特征的随机子集。

3 Boosting

  • Boosting在迭代过程中尝试纠先前模型所产生的错误,迭代次数越多集成产生的错误就越少

4 voting

Voting使用简单的统计数据来组合来自多个模型的预测。

  • 硬投票:对预测类别进行投票;

  • 软投票:对预测概率进行求均值;

5 Stacking

  • Stacking组合多种不同类型的基本模型的预测,和Voting类似。
  • Stacking可以根据验证集来调整每个模型的权重。

参考内容 机器学习模型融合大法!

http://www.dtcms.com/a/314444.html

相关文章:

  • usr/bin/ld链接报错undefined reference `av_frame_free(AVFrame**)‘等ffmpeg库报错
  • 【Spark征服之路-4.5-Spark-Streaming核心编程(三)】
  • debian 时间同步 设置ntp服务端 客户端
  • FastAPI入门:中间件、CORS跨域资源共享、SQL数据库
  • 【笔记】ROS1|4 Turtlebot3仿真Waffle循线跟踪【旧文转载】
  • Linux 磁盘管理与分区配置
  • open-webui pipelines报404, ‘Filter pipeline.exporter not found‘
  • 【测试工程思考】云平台测试可重用性和场景覆盖度的平衡术
  • 遮天(太古篇)
  • windows内核研究(软件调试-软件断点)
  • [QMT量化交易小白入门]-七十六、从tick数据中获取高频交易的量价背离信号
  • Java开发时出现的问题---语言特性与基础机制陷阱
  • 使用AI IDE编程,如Cursor
  • 小迪安全v2023学习笔记(五十一讲)—— 持续更新中
  • Ubuntu 下编译 SQLCipher 4.8.0
  • yolo实现基于深度学习的龋齿检测系统pyqt
  • Java 发送 HTTP POST请求教程
  • 回归预测 | MATLAB实现BP神经网络多输入单输出回归预测+SHAP可解释分析
  • 基于Matlab的聚类彩色图像分割系统
  • 基于MATLAB实现的心电图自动诊断系统
  • 各种信号分解、模态分解方法合集【MATLAB实现】
  • 链表问题解决分析框架
  • python与C++
  • 【RH124知识点问答题】第7章 控制对文件的访问
  • 【秋招笔试】2025.08.03虾皮秋招笔试-第一题
  • 芯片行业中的EDA(电子设计自动化)是什么?
  • 房屋租赁小程序租房小程序房产信息发布系统房屋租赁微信小程序源码
  • 用户管理——配置文件和命令
  • 探索机器学习在医疗领域的应用与挑战
  • Visual Studio 2022安装与快捷键全攻略