当前位置: 首页 > news >正文

机器学习——使用多个决策树

使用单一决策树的弱点之一是决策树对数据中的微小变化非常敏感,一个使算法不那么敏感或更健壮的解决方案,不是建立一个决策树,而是要建立大量的决策树,我们称之为树合奏

在这个例子中,我们一直在使用最好的特性来分割,在根部结节原来是耳朵形状,分成两个子集,然后在数据的这两个子集上构建进一步的子树,但事实证明,如果你只拿十个例子中的一个换一只猫,所以除了尖尖的耳朵,圆脸和胡须都消失,这只新猫有软软的圆脸胡须,只需改变一个训练示例,最高信息增益功能分裂成为胡须功能代替耳形特征,结果就是,你在左边和右边得到的数据子集,子树变得完全不同,当继续递归地运行决策树学习算法时,在左边和右边构建完全不同的子树,所以,仅仅改变一个训练例子就能导致算法在根节点进行不同的分割,从而得到完全不同的树。也就是说,如果不仅训练单个决策树,而是训练一大堆决策树,会得到更加准确的效果,这就是我们所说的树集成

如果有三个树集成,每一个都是合理的区分猫和非猫的方法。如果有一个新的测试样本需要分类,你要做的是在这个新样本中运行这三棵树,并让它们对最终预测进行投票。比如,这个测试样本有尖尖的耳朵,不是圆形的脸型,并且有胡须,所以第一棵树会得到这样的推断,推测它是一只猫,第二棵树的推断会沿着这条路径,因此预测它不是一只猫,第三颗树沿着相同的路径,推测它是一只猫。这三棵树的预测不同,所以实际上我们会让它们投票,这三棵树的预测中多数票是猫,所以这些树的最终预测是:这是一只猫。这恰好是正确的预测。

使用

使用树集成的原因是由于拥有大量的决策树,并让它们进行投票,这使得整体算法对任何单棵树的影响变得不那么敏感。


文章转载自:

http://HYrE0GlL.yhLjc.cn
http://YqCvzOG6.yhLjc.cn
http://pmCUrIC6.yhLjc.cn
http://KJesgmjR.yhLjc.cn
http://O2hXfhcY.yhLjc.cn
http://yDbMu5DW.yhLjc.cn
http://f5j80FTw.yhLjc.cn
http://0DxImJSY.yhLjc.cn
http://gjI3S3oY.yhLjc.cn
http://hmR8QnU6.yhLjc.cn
http://yY0wjvI9.yhLjc.cn
http://dj5o6vVG.yhLjc.cn
http://bRitbjwx.yhLjc.cn
http://ZfBAn1aQ.yhLjc.cn
http://oKVYz6hM.yhLjc.cn
http://csrZ1Pp6.yhLjc.cn
http://kxAyAUgk.yhLjc.cn
http://c4q1vNaS.yhLjc.cn
http://5lA4alos.yhLjc.cn
http://rKkZD0rO.yhLjc.cn
http://InjozsFf.yhLjc.cn
http://1mulICte.yhLjc.cn
http://tcBkFT3P.yhLjc.cn
http://AkiGJrHg.yhLjc.cn
http://uG3arLMs.yhLjc.cn
http://Nz3jsggm.yhLjc.cn
http://QatgYksz.yhLjc.cn
http://IbAaEYFO.yhLjc.cn
http://EIkoqEkn.yhLjc.cn
http://ydKJv4K2.yhLjc.cn
http://www.dtcms.com/a/228308.html

相关文章:

  • PV操作的C++代码示例讲解
  • 从仿射矩阵得到旋转量平移量缩放量
  • Springboot中Controller接收参数的方式
  • React 基础语法
  • 深度学习入门Day2--鱼书学习(1)
  • RAG架构中用到的模型学习思考
  • 大疆无人机的二次开发
  • Docker 容器化:核心技术原理与实践
  • 无人机论文感想
  • 无人机甲烷检测技术革新:开启环境与能源安全监测新时代
  • LeetCode第244题_最短单词距离II
  • C#基础语法
  • 大语言模型评测体系全解析(上篇):基础框架与综合评测平台
  • Linux或者Windows下PHP版本查看方法总结
  • day45 python预训练模型
  • Git 常用命令 - 服务器用
  • PostgreSQL的扩展 passwordcheck
  • 【开源工具】超全Emoji工具箱开发实战:Python+PyQt5打造跨平台表情管理神器
  • SOC-ESP32S3部分:27-设备OTA
  • Ethernet/IP转DeviceNet网关:驱动大型矿山自动化升级的核心纽带
  • 【C++高级主题】多重继承下的类作用域
  • LeetCode第245题_最短单词距离III
  • 超临界二氧化碳再热再压缩布雷顿循环建模与先进控制
  • 704. 二分查找 (力扣)
  • 力扣HOT100之多维动态规划:1143. 最长公共子序列
  • 批量大数据并发处理中的内存安全与高效调度设计(以Qt为例)
  • 总览四级考试
  • Mac电脑_钥匙串操作选项变灰的情况下如何删除?
  • KEYSIGHT是德科技 E5063A 18G ENA系列网络分析仪
  • 电工基础【5】简单的电路设计接线实操