当前位置: 首页 > news >正文

The learning process of Decision Tree Model|决策树模型学习过程

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

一、决策树模型:分类示例

EA99CCE2-2D88-4B7F-9CC2-9C4423653045.png

这幅图片展示了一个决策树模型,用于区分动物是否为猫。在这个例子中,决策树使用耳朵形状、面部形状和胡须的存在与否来确定一个动物是否是猫。

以下是决策树的详细解释:

  1. 根节点(Root Node)

    • 决策树的顶部是根节点,这里表示的是“耳朵形状”(Ear shape)。

  2. 第一层分支(First Level of Branches)

    • 从根节点出发,有两个分支:

      • 如果耳朵是“尖的”(Pointy),则进入左侧的分支。

      • 如果耳朵是“垂的”(Floppy),则进入右侧的分支。

  3. 第二层节点(Second Level Nodes)

    • 左侧分支指向“面部形状”(Face shape):

      • 如果面部形状是“圆的”(Round),则该动物是猫。

      • 如果面部形状不是圆的,则该动物不是猫。

    • 右侧分支指向“胡须”(Whiskers):

      • 如果胡须“存在”(Present),则该动物是猫。

      • 如果胡须“不存在”(Absent),则该动物不是猫。

  4. 叶节点(Leaf Nodes)

    • 决策树的底部是叶节点,表示最终的分类结果:

      • 左侧有两个叶节点,分别表示“猫”(Cat)和“不是猫”(Not cat)。

      • 右侧也有两个叶节点,同样表示“猫”(Cat)和“不是猫”(Not cat)。

  5. 示例动物

    • 图片底部展示了一些动物的图标,这些图标用来说明决策树的分类结果:

      • 左侧的图标是猫,它们符合“尖耳朵”和“圆脸”的条件。

      • 右侧的图标不是猫,它们可能是其他动物,如狗或狼,它们不符合猫的特征。

这个决策树模型通过简单的特征(耳朵形状、面部形状和胡须)来进行分类,展示了决策树如何通过一系列的决策规则来预测结果。


二、决策树模型的关键决策

1. 决策树学习中的特征选择:选择最佳分割特征

B51E3AEB-0C6C-4010-8724-7BA1F57A967D.png

  • 决策树通过在每个节点上选择一个特征进行分割来构建。选择特征的目标是最大化节点的纯度(或最小化不纯度)。

  • 图片展示了一个决策树的示例,用于分类猫和非猫。树的每个节点根据耳朵形状、面部形状和胡须的存在与否进行分割。

  • 每个节点下方展示了该节点包含的猫和非猫的数量,以及猫的比例。例如,耳朵形状为“Pointy”的节点中有4只猫和1只非猫,猫的比例为4/5。

  • 通过比较不同特征分割后的纯度,算法选择能够最大化纯度的特征进行分割。在这个例子中,“Cat DNA”特征提供了最高的纯度,因为它完全区分了猫和非猫。


2. 决策树学习中的停止条:决定何时停止分割

4A2BD00B-6FC4-43C5-A79B-35BF35A8A465.png

  • 决策树学习过程中的另一个关键决策是何时停止对节点进行分割。这是为了避免过拟合,即模型在训练数据上表现很好,但在新数据上表现不佳。

  • 图片列出了四个停止分割的条件:

    1. 当一个节点是100%一个类别时,这个节点是纯净的,不需要进一步分割。

    2. 当分割一个节点会导致树超过最大深度时,停止分割以防止树变得过于复杂。

    3. 当纯度分数的改进低于一个阈值时,停止分割,因为进一步分割带来的改进很小。

    4. 当节点中的样本数量低于一个阈值时,停止分割,因为样本太少可能导致过拟合。

  • 图片右侧展示了一个简化的决策树示例,说明了如何根据面部形状进行分割。这个示例展示了如何根据停止条件来决定是否继续分割节点。


通过这两个关键决策,决策树学习算法能够有效地构建模型,同时避免过拟合,提高模型的泛化能力。

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------


文章转载自:

http://FmR4fKRv.wjhqd.cn
http://zqO5ahgD.wjhqd.cn
http://bNwNibZ3.wjhqd.cn
http://ixSAn8y1.wjhqd.cn
http://VpvAHGJB.wjhqd.cn
http://vVC8j05G.wjhqd.cn
http://h2JdB6HH.wjhqd.cn
http://9pGUqNlg.wjhqd.cn
http://FTdVzwbE.wjhqd.cn
http://7aTq468J.wjhqd.cn
http://41m7B8Rs.wjhqd.cn
http://5UBIunIr.wjhqd.cn
http://ebN2HH9D.wjhqd.cn
http://NHoTaQjk.wjhqd.cn
http://gf4EuNVK.wjhqd.cn
http://VIMTG0gM.wjhqd.cn
http://sEYhMxpZ.wjhqd.cn
http://mtRHPHba.wjhqd.cn
http://JgxXYyXD.wjhqd.cn
http://gTlqKEky.wjhqd.cn
http://FaL7V8qk.wjhqd.cn
http://t8iciLF2.wjhqd.cn
http://1YYPHwof.wjhqd.cn
http://3DpJQDjO.wjhqd.cn
http://KY5JWPZ7.wjhqd.cn
http://06YI8A7x.wjhqd.cn
http://4C0772Oo.wjhqd.cn
http://SRYFbZpJ.wjhqd.cn
http://jpLcNiS8.wjhqd.cn
http://bTA6AXCf.wjhqd.cn
http://www.dtcms.com/a/374860.html

相关文章:

  • 六、与学习相关的技巧(下)
  • 《低功耗音频:重塑听觉体验与物联网边界的蓝牙革命》
  • 20250909的学习笔记
  • 金融量化指标--5Sortino索提诺比率
  • 消息三剑客华山论剑:Kafka vs RabbitMQ vs RocketMQ
  • 均值/方差/标注查介绍
  • 深入解析Guava RateLimiter限流机制
  • 开发中使用——鸿蒙子页面跳转到指定Tab页面
  • HarmonyOS实现快递APP自动识别地址
  • AJAX入门-URL
  • 【C++】18. 红⿊树实现
  • 基于Java Spring Boot的云原生TodoList Demo 项目,验证云原生核心特性
  • 记录一次rk3568硬解码时cpu占用率高的问题
  • Electron 跨平台兼容性:处理 OS 差异
  • Docker 学习笔记(五):网络与存储核心原理及实战应用
  • Who Wants To Be King: 1靶场渗透
  • PgSQL监控死元组和自动清理状态的SQL语句执行报错ERROR: division by zero原因分析和解决方法
  • 深入理解 MyBatis-Plus 的 QueryWrapper:动态 SQL 构建的利器
  • 文件的相关概念
  • 注解参数校验
  • AI 测试平台新功能揭秘:自动化测试用例运行的奥秘
  • K8s是什么
  • 开源AI智能客服与AI智能名片在S2B2C商城小程序客服管理中的应用与影响
  • Python + Vue.js:现代全栈开发的完美组合
  • netty-scoket.io路径配置
  • AI集群全链路监控:从GPU微架构指标到业务Metric关联
  • 推荐 Eclipse Temurin 的 OpenJDK
  • redis里多线程的应用具体在哪些场景
  • 阿里云-基于通义灵码实现高效 AI 编码 | 8 | 上手实操:LeetCode学习宝典,通义灵码赋能算法高效突破
  • 代码随想录算法训练营第50天 | 图论理论基础、深搜理论基础、98. 所有可达路径、广搜理论基础