当前位置: 首页 > news >正文

免费网站管理系统昌邑建设网站

免费网站管理系统,昌邑建设网站,网站建设目标及需求,深圳骏域网站建设专家88决策树主要算法ID3 算法核心指标:信息增益,指某个属性带来的熵增,信息增益越大,使用该属性划分的 “纯度提升” 越大,故以此选择划分属性。特点:对可取值数目较多的属性有所偏好,例如在极端情况…
  1. 决策树主要算法

    • ID3 算法
      • 核心指标:信息增益,指某个属性带来的熵增,信息增益越大,使用该属性划分的 “纯度提升” 越大,故以此选择划分属性。
      • 特点:对可取值数目较多的属性有所偏好,例如在极端情况下,最优划分可能是 “编号” 这类属性。
      • 示例数据:包含天气、温度、湿度等属性及 “是否出去玩” 的标签(7 条样本)。
    • C4.5 算法
      • 核心指标:信息增益率,计算公式为信息增益 ÷ 自身熵,用于优化 ID3 对多值属性的偏好问题。
      • 示例数据:与 ID3 算法使用相同的 7 条样本数据(天气、温度等属性及 “是否出去玩” 标签)。
    • CART 算法
      • 核心指标:基尼指数 Gini (D),反映从数据集 D 中随机抽取两个样本,其类别标记不一致的概率。
      • 纯度关系:样本属于某类别的概率 p 越大,Gini (D) 越小,数据集 D 的纯度越高
  2. 连续值的处理方法

    • 采用贪婪算法,步骤如下:
      • 排序:对连续值进行排序(如示例中 Taxable Income 排序为 60、70、75、85、90、95、100、120、125、220)。
      • 确定分界点:若进行二分,可能有多个分界点(如 10 个值有 9 个分界点)。
      • 离散化:将连续值分割为不同区间(如分割成 TaxIn≤80 和 TaxIn>80,或 TaxIn≤97.5 和 TaxIn>97.5)。
  3. 决策树剪枝策略

    • 剪枝原因:决策树过拟合风险大,理论上可完全分开数据,需通过剪枝优化。
    • 预剪枝
      • 定义:边建立决策树边进行剪枝的操作,更实用。
      • 方法:限制树的深度、叶子节点个数、叶子节点包含的样本数、信息增益量等。
    • 后剪枝
      • 定义:建立完决策树后进行剪枝操作。
      • 衡量标准:最终损失 = 自身的 GINI 系数值 +α× 叶子节点数量。
        • α 越大,模型越不易过拟合,但可能影响结果准确性;
        • α 越小,更注重结果好坏,过拟合风险可能较高。
  4. 决策树代码实现

    • 核心函数:DecisionTreeClassifier()
    • 关键参数表格
    • 参数说明
      criterion可选 gini(基尼系数)或 entropy(信息熵)
      splitter可选 best(在所有特征中找最好切分点)或 random(在部分特征中找)
      max_features可选 None(使用所有特征)、log2、sqrt、N(指定数量)
      max_depthint 或 None(默认 None),设置树的最大深度,推荐 5-20 之间,深度越大越易过拟合

http://www.dtcms.com/a/486797.html

相关文章:

  • 初始Spring
  • wordpress站点标题看不到合肥建站企业
  • 网站空间哪家公司的好上海专业网站建设价
  • 考研数学笔记(概率统计篇)
  • HT6809:重塑音频体验的立体声 D 类功率放大器
  • Flutter对话框AlertDialog使用指南
  • 玩Android Flutter版本,通过项目了解Flutter项目快速搭建开发
  • 大数据毕业设计选题推荐-基于大数据的商店购物趋势分析与可视化系统-大数据-Spark-Hadoop-Bigdata
  • 网站标题符号的应用龙岩整站优化
  • 运维知识图谱的构建与应用
  • MySQL中RUNCATE、DELETE、DROP 的基本介绍
  • php企业网站 源码asp网站耗资源
  • 【LeetCode】四数之和
  • 网站进不去怎么解决网络营销策略
  • 旗讯 OCR:破解全行业表格处理痛点,让数据从 “识别” 到 “可用” 一步到位
  • 测试开发笔试
  • 数据库的创建,查看,修改,删除,字符集编码和校验操作
  • C语言初步学习:数组的增删查改
  • 【组队学习】Post-training-of-LLMs TASK02
  • 系统设计相关知识总结
  • 做视频的模板下载网站xunsearch做搜索网站
  • 做企业网站需要人维护么电子商务推广
  • Linux驱动开发原理详解:从入门到实践
  • HarmonyOS之Environment
  • 鸿蒙仓颉:如何获取全局定义的Context以及使用方法
  • 银河麒麟V10的X86架构部署postgresql,解决信创离线部署兼容问题
  • 如何建设物流网站智慧团建官网手机版登录
  • 寄生虫网站代做工程公司取名字大全
  • 用户体验就是新SEO:如何同时提升搜索者满意度和搜索排名
  • SpringBoot的IOC和DI学习