当前位置: 首页 > news >正文

信息论(四):熵与概率分布的期望

随机变量 g(X) 的期望可以记为:

\mathbb{E}_p g(X) = \sum_{x \in \mathcal{X} }g(x) p(x)

\mathbb{E}_p g(X) = \sum_{x \in \mathcal{X} }g(x) p(x) 

“当 g(X) = log(1/p(X))时,X 的熵是 log(1/p(X)) 的期望值。”

H(X)=- \sum_{x \in \mathcal{X} } p(x) \log{p(x)}

H(X)=- \sum_{x \in \mathcal{X} } p(x) \log{p(x)} 

通常,在概率论中,随机变量可以用分布来定义,但通常我们并不用它来衡量分布本身。大多数情况下,当我们计算期望值 \mathbb{E}[g(X)] 时,函数 g 描述的是 X 的值,高度、能量、成本、误差等等。期望值告诉我们随机变量所代表的现象。

但在熵中,“随机变量”是由分布本身构建的。我们定义一个新的“随机变量”:

g(X) = \log\frac{1}{p(X)}。

但这并非结果本身的属性,例如“高度”或“电压”,它是该结果概率的属性。

此时,随机变量由概率分布构成。熵是分布本身的函数的期望值,并非关于“外部世界”。它是利用生成结果的分布来对结果进行的一种度量。因此,期望值 H(X) = \mathbb{E}[\log\tfrac{1}{p(X)}] 捕捉的是分布本身的统计特征,而不是 X 的物理意义。

仿佛每个结果都在描述自己的意外程度,也就是它在整个概率分布中的位置。罕见事件说:我很意外,给我一个大数字。常见事件说:我很普通,给我一个小数字。然后熵说:现在,根据每个结果出现的频率,对这些意外程度进行加权平均。这有点自指,分布通过它定义的期望值来描述自身。

它暗示了熵的实际意义。熵是描述了编码一个典型结果所需的平均比特数,这就是为什么我们要取 1/p(x) 的对数:如果一个事件发生的概率很低,你需要更多的比特来描述它。如果一个事件很常见,你需要的比特数就更少。所以熵本质上是在说:如果我必须尽可能高效地编码来自这个分布的结果,平均需要多少比特?

这就是信息压缩、Kraft不等式以及后续所有内容的核心,也是概率论与计算交汇的时刻。

为什么这个期望值很特别?因为它是唯一一个具有以下三个特征的期望值:它是内在的,完全由 X 的分布定义;它反映了不确定性,对于分布范围较广的情况,不确定性更大;它具有独特的现实意义,最小预期编码长度。

大多数期望值取决于你的随机变量代表什么,而这个期望值只取决于结果的概率分布。

http://www.dtcms.com/a/611055.html

相关文章:

  • 辽宁网站网站建设刚刚中国突然宣布
  • Mysql主从复制 windows下
  • 白云区网站建设公成都建设高端网站
  • UART、IIC、SPI、CAN通信协议简介
  • 鸿蒙系统编译语言 | 深入探讨鸿蒙编译技术及其应用前景
  • 网站建设一对一培训网站建设ssc源码最新
  • C语言编译速度 | 提升编译效率的方法与技巧
  • 【Python爬虫基础-3】数据解析
  • 做网站能用思源黑体吗wordpress文章页面模板
  • 精品源码分享的网站首尔面积
  • 科普:LLM中的网页工具:Fetch与GeneralSearch
  • 第2章 Hello World
  • js语法js语法js语法
  • 如何在三维空间中生成任意方向的矩形内部点位坐标
  • 微信如何做网站西安网站制作托
  • 石家庄网站服务万维网的网站
  • leetcode 387. 字符串中的第一个唯一字符 python
  • 基于深度学习的磁共振图像膝关节损伤多标签识别系统研究
  • 网站制作工作室24小时接单微信小游戏源码
  • 做网站会出现什么问题wordpress如何更改上传文件大小
  • vue3 组合式 API 详解
  • C++从入门到实战----类和对象(上)
  • 多维度表征(下)|用扫描电镜,CT 与仿真“看透“再生碳纤维复合材料
  • 电商网站 收费与免费wordpress阿里云图片不显示不出来
  • 易语言模块反编译为源码 | 深入分析与实战教程
  • 在高速公路或交通工程领域中,OD 是 Origin-Destination 的缩写,中文通常称为“起讫点”或“出行起止点”。
  • 诏安建设局网站常德网站seo
  • 牛商网做的网站怎么样仓库进销存软件
  • Windows 7 运行 .NET 应用时报错“hostfxr.dll 加载失败 (HRESULT: 0x80070057)”的彻底解决指南
  • 免费手机网站系统WordPress使用中文链接好吗