熵的概念及其在机器学习中的应用
文章目录
-
- 1. 熵的概念解释
-
- 1.1 自上而下:熵解决什么问题?
- 1.2 第一性原理:熵的本质
- 1.3 具体案例演示:天气预测
- 2. 熵在机器学习中的位置
- 3. 逻辑链条总结与协同运作
-
- 3.1 完整的逻辑链条
- 3.2 协同运作机制
- 3.3 具体协同示例:决策树构建
- 4. 核心价值总结
1. 熵的概念解释
1.1 自上而下:熵解决什么问题?
核心问题:如何量化系统的不确定性或混乱程度?
熵解决的是不确定性度量问题:
- 在信息论中:衡量信息的不确定性,熵越高,信息越不可预测
- 在机器学习中:衡量数据的不纯度,帮助模型做出最优决策
- 在物理学中:衡量系统的无序程度
1.2 第一性原理:熵的本质
从最基本原理出发,熵的核心思想是:概率分布的分散程度
数学定义:
对于离散随机变量 X X X,取值概率为 p ( x i ) p(x_i) p(xi),熵定义为:
H ( X ) = − ∑ i = 1 n p ( x i ) log 2 p ( x i ) H(X) = -\sum_{i=1}^{n} p(x_i) \log_2 p(x_i) H(X)=−