当前位置: 首页 > news >正文

网站运营 开发上上海海网网站站建设

网站运营 开发,上上海海网网站站建设,大连企业网络推广哪家好,wordpress添加文章页不显示图片一、数据集长这样有 5 条样本,2 个特征(不浮出水面是否可以生存、是否有脚蹼 ),标签是 属于鱼类,数据如下:样本不浮出水面是否可以生存是否有脚蹼属于鱼类1是是是2是是是3是否否4否是否5否是否二、核心思路…

一、数据集长这样

有 5 条样本,2 个特征(不浮出水面是否可以生存、是否有脚蹼 ),标签是 属于鱼类,数据如下:

样本不浮出水面是否可以生存是否有脚蹼属于鱼类
1
2
3
4
5

二、核心思路:用 “熵” 找最佳分类特征

决策树靠熵(混乱度)选特征,熵越大数据越乱。我们要找 “分完类后,标签混乱度降最多” 的特征,这一步叫信息增益。

先算 “标签(属于鱼类)” 的熵

标签里  出现 2 次, 出现 3 次,总样本 5 条。
熵公式:H=−∑(pi​×log2​pi​),其中 pi​ 是类别占比。
计算得:属于鱼类(具体计算看之前的步骤,记住这是初始混乱度!)

算特征的 “条件熵”(分完类后的混乱度)

特征 1:不浮出水面是否可以生存

特征值 = :包含样本 1、2、3(共 3 条),标签里  占 2/3, 占 1/3,条件熵 H1​≈0.918。

特征值 = :包含样本 4、5(共 2 条),标签全是 ,条件熵 H2​=0(纯混乱度为 0 )。

条件熵整体:属于鱼类不浮出水面

特征 2:是否有脚蹼

特征值 = :包含样本 1、2、4、5(共 4 条),标签里  占 2/4, 占 2/4,条件熵 H1​=1。

特征值 = :包含样本 3(共 1 条),标签是 ,条件熵 H2​=0。

条件熵整体:属于鱼类是否有脚蹼

特征 “不浮出水面”:0.971−0.551=0.42

特征 “是否有脚蹼”:0.971−0.8=0.171

“不浮出水面是否可以生存” 信息增益更大。

三、总结

决策树靠 “熵” 选特征,一步步把混乱数据分类。核心逻辑就是“找大当家和各个小当家”

把复杂问题拆成简单判断!

下期再见!

http://www.dtcms.com/a/601800.html

相关文章:

  • 公司怎样制作网站织梦做双语网站
  • Spring 中的 @ExceptionHandler 注解详解与应用
  • 网站建设有哪些软件卖鞋做哪个网站好
  • linux课堂练习1112
  • OpenStack 在线扩容卷超时问题
  • MySQL 慢查询优化:从定位、分析到索引调优的完整流程
  • 企业门户网站开发公司wordpress 开启多用户
  • 高权重网站代做排名公司招商型网站建设
  • C++基于websocket的多用户网页五子棋 ---- 模块介绍1
  • Java-169 Neo4j CQL 实战速查:字符串/聚合/关系与多跳查询
  • STM32电机运动控制的设计
  • 安徽福凯建设集团网站南宁网站建设是什么意思
  • TCP/IP 协议栈
  • 今天我们开始学习Linux自动化运维Ansible基础
  • .mom域名可以做网站吗wordpress woo插件
  • Skywalking运维之路(exporter状态监控)
  • Java 8 Stream API 高级实战:从数据处理到性能优化的深度解析
  • 网站建设目标个人博客dwwordpress微信付费
  • 梯度提升树与随机森林对比详解以及python实现
  • C语言编译器推荐 | 选择适合你的开发工具
  • 网站域名和空间网站产品优化方案
  • java.net.http 包详解
  • K8s Service核心功能:稳定访问与负载均衡
  • 有向图的可达性分析
  • 网站开发西安网页设计基础项目考核
  • INT305 Machine Learning 机器学习 Pt.8 Bagging 和 Boosting
  • React+Ant design
  • C++四种类型转换cast,其在参数传递时的作用
  • 什么网站可以做图赚钱网站建设主体设计要求
  • 云手机的核心价值