当前位置: 首页 > news >正文

机器学习——Bagging、随机森林

相比于Boosting的集成学习框架,Bagging(Bootstrap Sampling,自助聚集法,又称为自助采样)作为一种自助聚集且并行化的集成学习方法,其通过组合多个基学习器的预测结果来提高模型的稳定性和泛化能力其中随机森林是Bagging学习框架的一个经典算法

Bagging的核心思想是:从原始数据集中有放回随机抽取样本,生成多个子数据集(每个子数据集大小与原始数据集相同),比如原始数据集有500个,每个子数据集可能包含400个不重复的样本(加上重复的样本后,子数据集样本的总数就为500)

Boosting集成学习框架是序列(串行)迭代方式,而Bagging集成学习框架是并行方式。

随机森林的“随机”来源:样本随机获取和结点分裂时特征随机选择。

其将训练得到的大量决策树进行组合得到随机森林,由于决策树分为分类决策树和回归决策树。当使用的是分类决策树时,其大量分类决策树可以采用结果投票的方式得到综合后的分类结果;当使用的是回归决策树时,其大量回归决策树可以采用均值回归的方式得到综合后的回归结果。

其随机森林的实现思路:树结点-》决策树(分类/回归)-》自动抽样(行抽样(样本随机获取)-》列抽样(特征随机获取))-》随机森林构建(多棵树集成-》拟合方法-》预测方法)-》数据预测

其Bagging由于其并行和高精度的特点,使得随机森林在机器学习领域大受应用

http://www.dtcms.com/a/92397.html

相关文章:

  • leetcode day31 453+435
  • 代理服务器中的代理服务器与SSL协议有什么关系?
  • 元宇宙中的“数字护照“:代理IP如何重构虚拟世界的网络规则
  • 无序抓取系列(四)
  • linux的基础命令
  • 微信小程序登录和获取手机号
  • [学习笔记]NC工具安装及使用
  • 【AI News | 20250326】每日AI进展
  • 最大字段和问题 C++(穷举、分治法、动态规划)
  • h5运行在手机浏览器查看控制台信息
  • leetcode41.缺失的第一个正数
  • 数智读书笔记系列025《智能医疗:医学人工智能的未来》
  • Rust安装并配置配置vscode编译器
  • CPP从入门到入土之类和对象Ⅲ
  • UMI-OCR Docker 部署
  • Python:计算机二级:简单应用
  • g对象在flask中主要是用来实现什么
  • 【Linux】Linux_Ubuntu与Windows之间的文件传输
  • 3.26品优购
  • Linux之编辑器vim命令
  • 力扣HOT100之普通数组:53. 最大子数组和
  • Linux编译器gcc/g++使用完全指南:从编译原理到动静态链接
  • 【leetcode hot 100 215】数组中的第K个最大元素
  • kubeadm部署k8s-1.32版本集群(1个master,1个worker)
  • PX4飞控-接收MAVLINK消息(2)-生成MAVLINK_MSG_ID_***.h文件
  • QEMU源码全解析 —— 块设备虚拟化(10)
  • [笔记] 系统分析师 第二章 经济管理与应用数学 (未完待续)
  • Linux系统离线安装ollama【详细版】
  • <command-line>:0:1: error: macro names must be identifiers m
  • 2000-2019年各省地方财政行政事业性收费收入数据