当前位置：首页 > news >正文

集成算法学习学习

news 2025/7/18 7:30:19

Project Jupyter | Home

教程8-Adaboost决策边界效果_哔哩哔哩_bilibili

Bagging:取平均

随机森林是典型

随机：随机样本采样随机特征采样自己测试不同比例值

森林：并行训练一对分类器（树）多个树加在一起去平均

多样性

二重：数据随机采样--

先取100个样本： 80的部分1 80的部分2

再取100个里面的10个：6个分到部分1 6个分到部分2 （不同特征值）

树不一样根节点有什么特征

全在用树模型：

什么特征上做了什么事

随机森林：可解释性强自动的特征选择

神经网络：无法解释输入输出可知处理未知

对B进行改变： B丿 B丿丿

A,B,C,D类参数：如身高/体重....

error1 error2

e1≈e2 B没用

e2>>e1 B有用

一些集成算法除了树模型就不能再去集成了

Boosting：提升

随机森林：总和求均

从100-预估950 剩下50中预估30 剩下20中预估18

Adaboost：不断切切让数据有权重

stacking:堆叠算法

LR:逻辑回归

DT：决策树

RF:random forest随机森林

stacking:堆叠算法不常用

第一步多种算法LR/DT/RTF得到多种输出

第二步就选一种算法得到一种输出

集成：3种

1.随机森林式：并行

2.Boosting:提升一点一点去做 234有关系

3.stacking:

第一步多种算法LR/DT/RTF得到多种输出
第二步就选一种算法得到一种输出

集成算法思路：

软投票:对概率加权平均

不认为类别：<0.5 认为类别：>0.5

不想上课

ABC：可能点名 D：非常可能会点名 soD 会点名，去上课了

硬投票：只用结果

C∈2类 2类太少 soC归入1类

导入数据集selectio split切分

加了一个alpha:突出程度

选算法+选类别值

找分类任务的投票器

clf分类器

软投票：必须各个分类器都得到概率值

上面有bagging 下面是没有bagging

带bagging的更好些

OOB：代办数据

加权平均

http://www.dtcms.com/a/284358.html

相关文章：

Qt 监控串口设备热插拔的方法

javaweb学习开发代码_HTML-CSS-JS

[RAG] 文档格式化 | 知识库摄入 | VectorDB.faiss | BM25索引.pkl

松材线虫检测仪在林业的作用

【Lua】题目小练1

九学王资源apk应用名称整理

【机器学习实战【七】】机器学习特征选定与评估

ELN：生物医药科研的数字化引擎——衍因科技引领高效创新

多线程(一) --- 线程的基础知识

使用位运算优化 Vue.js 应用：高效状态管理技巧

Oracle 19.28 RU 升级最佳实践指南

装饰器模式及优化

大模型Agent应用开发实战：从框架选型到行业落地

十六进制与嵌入式系统及通信系统

yolo8+ASR+NLP+TTS（视觉语音助手）

基于Rust Softplus 函数实践方法

【通识】网络的基础知识

学习日志预告

【测试100问】为什么要做接口测试？

50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | GoodCheapFast（Good - Cheap - Fast三选二开关）

区块链之Casper协议背景、演变发展、运作机制和潜在风险

周志华《机器学习导论》第8章集成学习 Ensemble Learning

2025开源组件安全工具推荐OpenSCA

LVS(Linux virtual server)

AWS Lambda 最佳实践：构建高效无服务器应用的完整指南

多维动态规划题解——最长公共子序列【LeetCode】记忆化搜索翻译成递推

CCS缺陷|冻干/灌装10大缺陷暴露无菌生产系统性漏洞：气流流型缺陷

【android bluetooth 协议分析 03】【蓝牙扫描详解 3】【Bluetooth 中 EIR、IR、BLE 普通广播与扩展广播详解】

数仓建设中，系统数据录入错误或者延迟，如何对历史数据修复或补入？

安装物理机ubuntu系统