当前位置: 首页 > news >正文

集成算法学习学习

Project Jupyter | Home

教程8-Adaboost决策边界效果_哔哩哔哩_bilibili

Bagging:取平均

随机森林是典型

随机:随机样本采样  随机特征采样  自己测试不同比例值

森林:并行训练一对分类器(树)  多个树加在一起去平均

多样性

二重:数据随机采样--

先取100个样本:  80的部分1  80的部分2

再取100个里面的10个:6个分到部分1   6个分到部分2 (不同特征值)

树不一样  根节点有什么特征  

全在用树模型:

什么特征上做了什么事

随机森林:可解释性强 自动的特征选择

神经网络:无法解释  输入输出可知  处理未知

对B进行改变:     B丿        B丿丿

A,B,C,D类参数:如身高/体重....

error1  error2

e1≈e2  B没用

e2>>e1  B有用

一些集成算法  除了树模型就不能再去集成了

Boosting:提升

随机森林:总和求均

从100-预估950     剩下50中预估30  剩下20中预估18

Adaboost:不断切切  让数据有权重

stacking:堆叠算法

LR:逻辑回归

DT:决策树

RF:random forest随机森林

stacking:堆叠算法  不常用

第一步多种    算法LR/DT/RTF得到多种输出

第二步  就选一种算法得到一种输出

集成:3种

1.随机森林式:并行

2.Boosting:提升  一点一点去做  234有关系  

3.stacking:

第一步多种    算法LR/DT/RTF得到多种输出
第二步  就选一种算法得到一种输出

集成算法思路:

软投票:对概率加权平均

不认为类别:<0.5      认为类别:>0.5

不想上课 

ABC:可能点名  D:非常可能会点名    soD  会点名,去上课了

硬投票:只用结果

C∈2类  2类太少  soC归入1类

导入数据集selectio   split切分

加了一个alpha:突出程度

选算法+选类别值

找分类任务的投票器

clf分类器

软投票:必须各个分类器都得到概率值

 

上面有bagging  下面是没有bagging

带bagging的更好些

OOB:代办数据

加权平均

http://www.dtcms.com/a/284358.html

相关文章:

  • Qt 监控串口设备热插拔的方法
  • javaweb学习开发代码_HTML-CSS-JS
  • [RAG] 文档格式化 | 知识库摄入 | VectorDB.faiss | BM25索引.pkl
  • 松材线虫检测仪在林业的作用
  • 【Lua】题目小练1
  • 九学王资源apk应用名称整理
  • 【机器学习实战【七】】机器学习特征选定与评估
  • ELN:生物医药科研的数字化引擎——衍因科技引领高效创新
  • 多线程(一) --- 线程的基础知识
  • 使用位运算优化 Vue.js 应用:高效状态管理技巧
  • Oracle 19.28 RU 升级最佳实践指南
  • 装饰器模式及优化
  • 大模型Agent应用开发实战:从框架选型到行业落地
  • 十六进制与嵌入式系统及通信系统
  • yolo8+ASR+NLP+TTS(视觉语音助手)
  • 基于Rust Softplus 函数实践方法
  • 【通识】网络的基础知识
  • 学习日志预告
  • 【测试100问】为什么要做接口测试?
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | GoodCheapFast(Good - Cheap - Fast三选二开关)
  • 区块链之Casper协议背景、演变发展、运作机制和潜在风险
  • 周志华《机器学习导论》第8章 集成学习 Ensemble Learning
  • 2025开源组件安全工具推荐OpenSCA
  • LVS(Linux virtual server)
  • AWS Lambda 最佳实践:构建高效无服务器应用的完整指南
  • 多维动态规划题解——最长公共子序列【LeetCode】记忆化搜索翻译成递推
  • CCS缺陷|冻干/灌装10大缺陷暴露无菌生产系统性漏洞:气流流型缺陷
  • 【android bluetooth 协议分析 03】【蓝牙扫描详解 3】【Bluetooth 中 EIR、IR、BLE 普通广播与扩展广播详解】
  • 数仓建设中,系统数据录入错误或者延迟,如何对历史数据修复或补入?
  • 安装物理机ubuntu系统