当前位置: 首页 > news >正文

互信息: 揭示变量间“心有灵犀“程度的度量器

互信息: 揭示变量间"心有灵犀"程度的度量器

一、核心结论:互信息是随机变量间"共享秘密"的精确量化

“就像两个朋友之间的默契程度,互信息测量两个变量间共享了多少信息”

二、公式推演与类比解释

1. 核心公式对比表

公式名称 数学表达式 通俗解释 类比场景
互信息基本定义 I ( X ; Y ) = ∑ x , y p ( x , y ) log ⁡ p ( x , y ) p ( x ) p ( y ) I(X;Y) = \sum_{x,y} p(x,y) \log \frac{p(x,y)}{p(x)p(y)} I(X;Y)=x,yp(x,y)logp(x)p(y)p(x,y) 变量间的共享信息量 两人共同了解的秘密数量
基于熵的互信息 I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) I(X;Y) = H(X) - H(X|Y) I(X;Y)=H(X)H(XY) 观察Y后X不确定性的减少量 了解天气预报后减少的穿衣犹豫度
标准化互信息 N M I ( X , Y ) = I ( X ; Y ) H ( X ) H ( Y ) NMI(X,Y) = \frac{I(X;Y)}{\sqrt{H(X)H(Y)}} NMI(X,Y)=H(X)H(Y) I(X;Y) 相对共享信息比例 朋友间共享秘密占各自知识的比例
点互信息 P M I ( x , y ) = log ⁡ p ( x , y ) p ( x ) p ( y ) PMI(x,y) = \log \frac{p(x,y)}{p(x)p(y)} PMI(x,y)=logp(x)p(y)p(x,y) 特定事件对的关联强度 特定词汇搭配的罕见程度

2. 核心公式详解

公式1:互信息基本定义

I ( X ; Y ) = ∑ x ∈ X ∑ y ∈ Y p ( x , y ) log ⁡ ( p ( x , y ) p ( x ) p ( y ) ) I(X;Y) = \sum_{x \in X} \sum_{y \in Y} p(x,y) \log \left( \frac{p(x,y)}{p(x)p(y)} \right) I(X;Y)=xXyYp(x,y)log(p(x)p(y)p(x,y))

参数 数学符号 类比解释 取值范围
联合概率 p ( x , y ) p(x,y) p(x,y) 两个事件同时发生的概率 [0,1]
边缘概率 p ( x ) , p ( y ) p(x),p(y) p(x),p(y) 单个事件发生的独立概率 [0,1]
对数函数 log ⁡ \log log 信息量的度量单位 任意实数

案例应用:在特征选择中,高互信息表示特征与目标变量强相关,更有预测价值

公式2:基于熵的互信息

I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) = H ( Y ) − H ( Y ∣ X ) = H ( X ) + H ( Y ) − H ( X , Y ) I(X;Y) = H(X) - H(X|Y) = H(Y) - H(Y|X) = H(X) + H(Y) - H(X,Y) I(X;Y)=H(X)H(XY)=H(Y)H(YX)=H(X)+H(Y)H(X,Y)

物理意义 类比解释
H ( X ) H(X) H(X) X的熵(不确定性) 未知天气时的穿衣困难度
H ( X ∣ Y ) H(X|Y) H(XY) 已知Y后X的条件熵 看过天气预报后的穿衣困难度
H ( X , Y ) H(X,Y) H(X,Y) X和Y的联合熵 同时预测天气和交通状况的困难度

类比说明:互信息像是解锁的钥匙, H ( X ) H(X) H(X)是锁的复杂度, H ( X ∣ Y ) H(X|Y) H(XY)

相关文章:

  • 链表算法题目
  • <script setup>和export default { setup() { ... } }区别
  • Express + MongoDB 实现登录验证码
  • 如何在 JavaScript 中冻结对象:深入理解 Object.freeze() 和深冻结
  • 基于信息化技术的农业大学教师人事管理系统的构建与应用
  • C语言中的选择结构:决策的艺术
  • doris:ClickHouse
  • VAD入门(基于Python)
  • 提升数据库性能与可靠性:深入解析MySQL主从复制
  • 使用 Prim 算法生成了最小生成树, 使用 Fleury 算法生成了欧拉回路,尝试找到了一个简单的哈密尔顿圈。
  • 用友 U8出入库查询SQL 连接UNION ALL
  • 1.12.信息系统的分类【ES】
  • C#编译自动增加文件的版本号
  • Ubuntu 下 nginx-1.24.0 源码分析 - conf_ctx
  • NO.24十六届蓝桥杯备战|二维数组八道练习|杨辉三角|矩阵(C++)
  • IDEA 的 EasyCode 插件使用指南:从入门到自定义模板
  • Docker基础篇——Ubuntu下Docker安装
  • 多条件查询--java算法
  • OkHttp:工作原理 拦截器链深度解析
  • 垂直领域大模型优化:从“通用”到“专精”——打造医疗、金融、法律领域的AI专家
  • 建外贸网站比较好的公司/东莞seo网络培训
  • 好看的页面设计/seo培训学院官网
  • 湘潭网站优化/全网关键词云查询
  • 珠海多语种网站制作/steam交易链接怎么看
  • 微信公众号对接网站如何做/自己建网站怎样建
  • 做网站6000左右的电脑/semi是什么意思