当前位置: 首页 > news >正文

Sklearn 机器学习 数值指标 entropy熵函数

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习中的数值指标:Entropy 熵函数详解

在构建机器学习模型,特别是决策树(Decision Tree)时,我们经常会遇到一个关键性的数值指标:Entropy 熵。它是信息论中的核心概念,在评估模型中每个划分点的信息增益时起到了重要作用。

本文将带你深入理解熵函数的定义、数学推导、在 Sklearn 中的实际作用,并辅以代码示例帮助你快速掌握它的实际应用。


📘 一、什么是 Entropy(熵)?

在信息论中,熵(Entropy)表示系统的不确定性或信息的混乱程度。由香农(Claude Shannon)提出的熵公式被广泛应用于机器学习的特征划分。

设有一个离散随机变量 X X X,它有 n n n 个可能的取值 { x 1 , x 2 , . . . , x n } \{x_1, x_2, ..., x_n\} { x1,x2,...,xn},其概率分布为 P ( x i ) P(x_i) P(xi),则熵定义为:

H ( X ) = − ∑ i = 1 n P ( x i ) log ⁡ 2 P ( x i ) H(X) = - \sum_{i=1}^n P(x_i) \log_2 P(x_i) H(X)=i=1

http://www.dtcms.com/a/300172.html

相关文章:

  • Linux网络-------1.socket编程基础---(TCP-socket)
  • base64魔改算法 | jsvmp日志分析并还原
  • 在 Dell PowerEdge T440 上通过 iDRAC9 安装 Proxmox VE
  • Flutter开发实战之网络请求与数据处理
  • bmp280的压力数据采集(i2c设备驱动+设备树编写)
  • ACO-OFDM 的**频带利用率**(单位:bit/s/Hz)计算公式
  • 建筑施工场景下漏检率↓76%!陌讯多模态融合算法在工程安全监控的落地实践
  • OpHReda精准预测酶最佳PH
  • 进制间的映射关系
  • 2025牛客暑期多校第4场——G
  • Polyhedral Approaches in Combinatorial Optimization组合优化中的多面体方法(下)
  • Java实现大根堆与小根堆详解
  • 每日面试题15:如何解决堆溢出?
  • 如何检查服务器数据盘是否挂载成功?
  • Android-三种持久化方式详解
  • 【硬件-笔试面试题】硬件/电子工程师,笔试面试题-32,(知识点:模数转换器,信噪比,计算公式,)
  • 深入理解C语言快速排序与自省排序(Introsort)
  • 【每天一个知识点】GAN(生成对抗网络,Generative Adversarial Network)
  • Compose笔记(三十八)--CompositionLocal
  • 安卓学习记录1——持续更新ing
  • React组件中的this指向问题
  • 三防平板支持DMR对讲有什么用?实现高效集群调度
  • 如何理解“测试场景”与“测试要点”的区别和联系?
  • Linux系统架构核心全景详解
  • 从0到1学Pandas(六):Pandas 与数据库交互
  • KiCad 与 CircuitMaker 使用方法分享:从零开始学电子设计
  • JavaWeb(苍穹外卖)--学习笔记11(Filter(过滤器) 和 Interceptor(拦截器))
  • Windows开发,制作开发软件安装程序(一)
  • MySQL的底层原理--InnoDB数据页结构
  • 关于GateWay网关