当前位置: 首页 > news >正文

互信息的定义与公式

互信息

定义公式

  • 从条件熵中我们知道,当获取的信息和要研究的食物”有关系时“,这些信息才能帮助我们消除不确定性。如何衡量获取信息和要研究事物“有关系”呢?比如常识告诉我们,一个随机事件“今天深圳下雨”和另一个随机事件“过去24小时深圳空气湿度”相关性很大,但是相关性到底有多大?怎么衡量?再比如“过去24小时深圳空气湿度”似乎就和“北京天气”相关性不大。

  • 香农在信息论中提出”互信息“的概念作为两个随机事件“相关性”的量化度量

  • 假定有两个随机事件X和Y,他们的互信息定义如下:
    I ( X : Y ) = H ( X ) − H ( X ∣ Y ) = H ( Y ) − H ( Y ∣ X ) = H ( X ) + H ( Y ) − H ( X , Y ) = H ( X , Y ) − H ( X ∣ Y ) − H ( Y ∣ X ) = ∑ x ∈ X , y ∈ Y p ( x , y ) log ⁡ p ( x , y ) p ( x ) p ( y ) \begin{aligned} I(X:Y) &=H(X)-H(X|Y)\\ &=H(Y)-H(Y|X)\\ &=H(X)+H(Y)-H(X,Y)\\ &=H(X,Y)-H(X|Y)-H(Y|X)\\ &= \sum_{x\in X,y\in Y}p(x,y)\log\frac{p(x,y)}{p(x)p(y)} \end{aligned} I(X:Y)=H(X)H(XY)=H(Y)H(YX)=H(X)+H(Y)H(X,Y)=H(X,Y)H(XY)H(YX)=xX,yYp(x,y)logp(x)p(y)p(x,y)
    当X和Y完全相同时互信息的取值是H(X),同时H(X)=H(Y);当二者完全无关时互信息取值为0。

  • 所谓两个时间相关性的量化度量,就是在了解了其中一个Y的前提下,对消除另一个X不确定性所提供的信息量。

公式推导

  • 两种推导公式

  • I ( X : Y ) = H ( X ) − H ( X ∣ Y ) I(X:Y) = H(X)-H(X|Y) I(X:Y)=H(X)H(XY)
    I ( X : Y ) = H ( X ) − H ( X ∣ Y ) = − ∑ x p ( x ) log ⁡ p ( x ) − ( − ∑ x , y p ( x , y ) log ⁡ p ( x , y ) ) ∵    p ( x ) = ∑ y p ( x , y ) ∴ = ∑ x , y p ( x , y ) log ⁡ p ( x ∣ y ) − ∑ x , y p ( x , y ) log ⁡ p ( x ) = ∑ x , y p ( x , y ) log ⁡ p ( x ∣ y ) p ( x ) ∵    p ( x ∣ y ) = p ( x , y ) p ( y ) ∴ = ∑ x , y p ( x , y ) log ⁡ p ( x , y ) p ( x ) p ( y ) \begin{aligned} I(X:Y) &= H(X)-H(X|Y)\\ &=-\sum_{x}p(x)\log p(x)-\left(-\sum_{x,y}p(x,y)\log p(x,y) \right)\\ \because & ~~ p(x)=\sum_y p(x,y) \\ \therefore&=\sum_{x,y}p(x,y)\log p(x|y)-\sum{x,y}p(x,y)\log p(x)\\ &=\sum_{x,y}p(x,y)\log \frac{p(x|y)}{p(x)}\\ \because& ~~ p(x|y) = \frac{p(x,y)}{p(y)} \\ \therefore&=\sum_{x,y}p(x,y)\log \frac{p(x,y)}{p(x)p(y)} \end{aligned} I(X:Y)=H(X)H(XY)=xp(x)logp(x)(x,yp(x,y)logp(x,y))  p(x)=yp(x,y)=x,yp(x,y)logp(xy)x,yp(x,y)logp(x)=x,yp(x,y)logp(x)p(xy)  p(xy)=p(y)p(x,y)=x,yp(x,y)logp(x)p(y)p(x,y)

  • I ( X : Y ) = H ( X ) + H ( Y ) − H ( X , Y ) I(X:Y) = H(X)+H(Y)-H(X,Y) I(X:Y)=H(X)+H(Y)H(X,Y)
    I ( X : Y ) = H ( X ) + H ( Y ) − H ( X , Y ) = − ∑ x p ( x ) log ⁡ p ( x ) − ( − ∑ y p ( y ) log ⁡ p ( y ) ) − ( − ∑ x , y p ( x , y ) log ⁡ p ( x , y ) ) = ∑ x , y p ( x , y ) log ⁡ p ( x , y ) − ( ∑ x p ( x ) log ⁡ p ( x ) − ∑ y p ( y ) log ⁡ p ( y ) ) ∵    p ( x ) = ∑ y p ( x , y ) ∴ = ∑ x , y p ( x , y ) log ⁡ p ( x , y ) − ( ∑ x , y p ( x , y ) log ⁡ p ( x ) − ∑ x , y p ( x , y ) log ⁡ p ( y ) ) = ∑ x , y p ( x , y ) log ⁡ p ( x , y ) p ( x ) p ( y ) \begin{aligned} I(X:Y) &= H(X)+H(Y)-H(X,Y)\\ &=-\sum_{x}p(x)\log p(x)-\left(-\sum_{y}p(y)\log p(y)\right)-\left(-\sum_{x,y}p(x,y)\log p(x,y)\right)\\ &=\sum_{x,y}p(x,y)\log p(x,y)-\left(\sum_{x}p(x)\log p(x)-\sum_{y}p(y)\log p(y)\right)\\ \because & ~~ p(x)=\sum_y p(x,y) \\ \therefore&=\sum_{x,y}p(x,y)\log p(x,y)-\left(\sum_{x,y}p(x,y)\log p(x)-\sum_{x,y}p(x,y)\log p(y)\right)\\ &=\sum_{x,y}p(x,y)\log \frac{p(x,y)}{p(x)p(y)} \end{aligned} I(X:Y)=H(X)+H(Y)H(X,Y)=xp(x)logp(x)(yp(y)logp(y))(x,yp(x,y)logp(x,y))=x,yp(x,y)logp(x,y)(xp(x)logp(x)yp(y)logp(y))  p(x)=yp(x,y)=x,yp(x,y)logp(x,y)(x,yp(x,y)logp(x)x,yp(x,y)logp(y))=x,yp(x,y)logp(x)p(y)p(x,y)


相关文章:

  • SVN 创建版本库
  • MaxKB本地部署向量数据库出现HeaderTooLarge报错
  • dify实现分析-rag-文档内容提取
  • HTTP的“对话”逻辑:请求与响应如何构建数据桥梁?
  • DDD - 可能会用到的分布式事务
  • 深入浅出地讲解rvbacktrace原理
  • Ubuntu如何利用.ibd文件恢复MySQL数据?
  • 算法基础 -- Fenwick树的实现原理
  • python中使用数据库sqlite3
  • Spring Boot 集成 Kettle
  • QML 部件获得焦点触发的全局槽函数 onActiveFocusItemChanged
  • JavaScript 内置对象-字符串对象
  • Docker Remote API未授权访问漏洞复现
  • DeepSeek 助力 Vue 开发:打造丝滑的日期选择器(Date Picker),未使用第三方插件
  • 在conda虚拟环境中安装jupyter lab-----deepseek问答记录
  • lighten() 函数被弃用:替代方案color.scale()或者color.adjust()
  • C语言基础16:二维数组、字符数组
  • 《DeepSeek训练算法:开启高效学习的新大门》
  • 虚拟机如何添加硬盘
  • Java中CompletableFuture异步工具类
  • 山东网站建设报价/百度搜索风云榜小说总榜
  • b2b电子商务网站分类/网站不收录怎么解决
  • 漳州做网站匹配博大钱少a/站长工具综合查询2020
  • 网站建设测试结果/互联网广告怎么做
  • 图片制作动图/南昌seo全网营销
  • 广州网站备案方案/百度爱采购排名