当前位置: 首页 > news >正文

Regression Trees|回归树

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------

一、回归树的定义

回归树是一种用于解决回归问题的机器学习模型,它通过将特征空间划分为不同的区域,为每个区域分配一个预测值来实现对目标变量的预测。

通俗理解:

回归树就像是根据一系列问题(特征)把数据分到不同的“篮子”里,每个“篮子”都有一个对应的预测结果,当有新的数据来时,根据这些问题把它放到合适的“篮子”里,就能得到预测值。它结合了决策树易于理解和解释的特点以及回归分析对连续值预测的能力,广泛应用于房价预测、股票价格预测等连续数值预测场景。


二、回归树构建与预测过程详解

1. 回归树预测体重示例数据

829DE929-FFA8-4AE2-BF42-E71C10590FFD.png

图片展示了一个使用回归树来预测动物体重的例子。表格中列出了不同动物的耳朵形状(尖耳或垂耳)、脸型(圆形或非圆形)以及胡须(有或无)的特征,并根据这些特征预测了它们的体重(以磅为单位)。

  • 耳朵形状:分为“Pointy”(尖耳)和“Floppy”(垂耳)。

  • 脸型:分为“Round”(圆形)和“Not round”(非圆形)。

  • 胡须:分为“Present”(有)和“Absent”(无)。

  • 体重:预测的体重值以磅(lbs.)为单位。

例如,一个尖耳、圆形脸、有胡须的动物预测体重为7.2磅,而一个垂耳、圆形脸、无胡须的动物预测体重为20磅。


2. 构建回归树的决策过程

3A6CC18D-AA39-433E-BDBD-DCB5C66629D3.png

图片展示了如何构建一个回归树来预测动物的体重。回归树通过一系列的决策节点(基于耳朵形状、脸型等特征)来预测体重。

  • 根节点:首先根据耳朵形状(尖耳或垂耳)进行分裂。

  • 内部节点:进一步根据脸型(圆形或非圆形)进行分裂。

  • 叶节点:最终给出预测的体重值。

例如:

  • 对于尖耳的动物,如果脸型是圆形,预测体重为8.35磅;如果脸型不是圆形,预测体重为9.2磅。

  • 对于垂耳的动物,如果脸型是圆形,预测体重为17.7磅;如果脸型不是圆形,预测体重为9.9磅。


3. 选择最佳分裂点以优化回归树

EE3CD74D-4233-4DE4-AEE0-77D4CC7F75E0.png

1. 初始方差计算

首先,计算所有数据点的总方差,这是在任何分裂之前的方差。在这个例子中,总方差为20.51。

2. 分裂后的方差计算

对于每个可能的分裂(耳朵形状、脸型、胡须),计算分裂后左右子节点的加权方差。

  • 耳朵形状分裂

    • 左子节点(尖耳):包含5个数据点,方差为1.47,总权重(数据点数)为5/10。

    • 右子节点(垂耳):包含5个数据点,方差为21.87,总权重为5/10。

    • 加权方差计算:20.51−((5/10)​×1.47+(5/10)×21.87)=8.84

  • 脸型分裂

    • 左子节点(圆形):包含7个数据点,方差为27.80,总权重为7/10。

    • 右子节点(非圆形):包含3个数据点,方差为1.37,总权重为3/10。

    • 加权方差计算:20.51−((7/10)×27.80+(17/10)×1.37)=0.64

  • 胡须分裂

    • 左子节点(有胡须):包含4个数据点,方差为0.75,总权重为4/10。

    • 右子节点(无胡须):包含6个数据点,方差为23.32,总权重为6/10。

    • 加权方差计算:20.51−((4/10)​×0.75+(4/10)×23.32)=6.22

3. 选择最佳分裂

比较不同分裂的方差减少量,选择减少量最大的分裂作为最佳分裂点。在这个例子中,耳朵形状的分裂导致方差减少最大(8.84),因此选择耳朵形状作为分裂特征。

这种计算方法确保了决策树在每个节点都能最大化信息增益,从而提高模型的预测准确性。

-----------------------------------------------------------------------------------------------

这是我在我的网站中截取的文章,有更多的文章欢迎来访问我自己的博客网站rn.berlinlian.cn,这里还有很多有关计算机的知识,欢迎进行留言或者来我的网站进行留言!!!

-----------------------------------------------------------------------------------------------


文章转载自:

http://L2ZEpz3B.bzwxr.cn
http://VTnBdQrd.bzwxr.cn
http://kopYdsr2.bzwxr.cn
http://0SYmivE4.bzwxr.cn
http://LQraPB4n.bzwxr.cn
http://MhLRm3Iy.bzwxr.cn
http://BOTlG2Xz.bzwxr.cn
http://Vl7IqKxS.bzwxr.cn
http://hy9X29OU.bzwxr.cn
http://cPKLkE90.bzwxr.cn
http://46QcE4FW.bzwxr.cn
http://VUDiNpec.bzwxr.cn
http://U366EEbh.bzwxr.cn
http://mr2qydwP.bzwxr.cn
http://Up9WAcsR.bzwxr.cn
http://iaOyImd1.bzwxr.cn
http://7cmaoNfK.bzwxr.cn
http://ccXiACOr.bzwxr.cn
http://7caY44gU.bzwxr.cn
http://Sjx8IA55.bzwxr.cn
http://vZVm79Ah.bzwxr.cn
http://VgBYo1P6.bzwxr.cn
http://1TvZyKwS.bzwxr.cn
http://CNLbKy24.bzwxr.cn
http://r2E35dMK.bzwxr.cn
http://vo7cx4jD.bzwxr.cn
http://ZGXe50ki.bzwxr.cn
http://0gqKEYJw.bzwxr.cn
http://OS9rwEn4.bzwxr.cn
http://vNjinTcA.bzwxr.cn
http://www.dtcms.com/a/384844.html

相关文章:

  • [数据结构——Lesson14.快速排序]
  • 城乡供水一体化智慧水务管理系统方案——推动供水高质量发展的御控工业物联网解决方案
  • 云上安全的第一道门槛:身份与访问控制
  • Blender MCP—基于AI代理的智能三维建模协同框架
  • 从零开始打造复杂动作网页:现代CSS3动画与JavaScript交互完全指南
  • 基于 OpenCV 实现实时文档扫描:从轮廓检测到透视变换全流程解析
  • Qt 系统相关 - 事件2
  • iTwinjs GeoLocation
  • 【氮化镓】C缺陷络合物导致的GaN黄光发射
  • Docker 下部署 Elasticsearch 8 并集成 Kibana 和 IK 分词器
  • 机器学习-第一章
  • 【Java EE进阶 --- SpringBoot】SpringBoot配置文件
  • 安装gemini-fullstack-langgraph-quickstart
  • IBM-Waston电信客户流失归因分析报告
  • 江协科技STM32课程笔记(二)
  • CAD多面体密堆积_圆柱体试件3D插件
  • 【IoTDB】时序数据库选型指南:工业大数据场景下的技术突围
  • Python TensorFlow的CNN-LSTM-GRU集成模型在边缘物联网数据IoT电动汽车充电站入侵检测应用
  • TensorFlow Lite Micro 流式关键词识别(KWS) - 完整使用指南
  • 塔能科技:一家“用软件定义硬件”的精准节能公司,正在重新定义行业
  • 基于 CoT 思维链协调多 MCP 工具:依托亚马逊云科技服务打造全流程智能的 Amazon Redshift 运维体系
  • TensorFlow Lite 全面解析:端侧部署方案与PyTorch Mobile深度对比
  • 【机器学习】用 TensorFlow 实现词向量训练全流程
  • C# --- 使用定时任务实现日志的定时聚合
  • Origin如何将格点色阶条进化为渐变色阶条
  • 非关系数据库(NoSQL):所需软件与环境配置全指南
  • 计算机网络1
  • 字幕编辑工具推荐,Subtitle Edit v4.0.13发布:增强语音识别+优化翻译功能
  • springboot项目异步处理获取不到header中的token
  • Vue 输入库长度限制的实现