当前位置：首页 > news >正文

信息论（四）：熵与概率分布的期望

news 2025/11/15 12:26:07

随机变量 g(X) 的期望可以记为：

$\mathbb{E}_p g(X) = \sum_{x \in \mathcal{X} }g(x) p(x)$

\mathbb{E}_p g(X) = \sum_{x \in \mathcal{X} }g(x) p(x)

“当 g(X) = log(1/p(X))时，X 的熵是 log(1/p(X)) 的期望值。”

$H(X)=- \sum_{x \in \mathcal{X} } p(x) \log{p(x)}$

H(X)=- \sum_{x \in \mathcal{X} } p(x) \log{p(x)}

通常，在概率论中，随机变量可以用分布来定义，但通常我们并不用它来衡量分布本身。大多数情况下，当我们计算期望值 \mathbb{E}[g(X)] 时，函数 g 描述的是 X 的值，高度、能量、成本、误差等等。期望值告诉我们随机变量所代表的现象。

但在熵中，“随机变量”是由分布本身构建的。我们定义一个新的“随机变量”：

g(X) = \log\frac{1}{p(X)}。

但这并非结果本身的属性，例如“高度”或“电压”，它是该结果概率的属性。

此时，随机变量由概率分布构成。熵是分布本身的函数的期望值，并非关于“外部世界”。它是利用生成结果的分布来对结果进行的一种度量。因此，期望值 H(X) = \mathbb{E}[\log\tfrac{1}{p(X)}] 捕捉的是分布本身的统计特征，而不是 X 的物理意义。

仿佛每个结果都在描述自己的意外程度，也就是它在整个概率分布中的位置。罕见事件说：我很意外，给我一个大数字。常见事件说：我很普通，给我一个小数字。然后熵说：现在，根据每个结果出现的频率，对这些意外程度进行加权平均。这有点自指，分布通过它定义的期望值来描述自身。

它暗示了熵的实际意义。熵是描述了编码一个典型结果所需的平均比特数，这就是为什么我们要取 1/p(x) 的对数：如果一个事件发生的概率很低，你需要更多的比特来描述它。如果一个事件很常见，你需要的比特数就更少。所以熵本质上是在说：如果我必须尽可能高效地编码来自这个分布的结果，平均需要多少比特？

这就是信息压缩、Kraft不等式以及后续所有内容的核心，也是概率论与计算交汇的时刻。

为什么这个期望值很特别？因为它是唯一一个具有以下三个特征的期望值：它是内在的，完全由 X 的分布定义；它反映了不确定性，对于分布范围较广的情况，不确定性更大；它具有独特的现实意义，最小预期编码长度。

大多数期望值取决于你的随机变量代表什么，而这个期望值只取决于结果的概率分布。

查看全文

http://www.dtcms.com/a/611055.html

辽宁网站网站建设刚刚中国突然宣布

Mysql主从复制 windows下

白云区网站建设公成都建设高端网站

UART、IIC、SPI、CAN通信协议简介

鸿蒙系统编译语言 | 深入探讨鸿蒙编译技术及其应用前景

网站建设一对一培训网站建设ssc源码最新

C语言编译速度 | 提升编译效率的方法与技巧

【Python爬虫基础-3】数据解析

做网站能用思源黑体吗wordpress文章页面模板

精品源码分享的网站首尔面积

科普：LLM中的网页工具：Fetch与GeneralSearch

第2章 Hello World

js语法js语法js语法

如何在三维空间中生成任意方向的矩形内部点位坐标

微信如何做网站西安网站制作托

石家庄网站服务万维网的网站

leetcode 387. 字符串中的第一个唯一字符 python

基于深度学习的磁共振图像膝关节损伤多标签识别系统研究

网站制作工作室24小时接单微信小游戏源码

做网站会出现什么问题wordpress如何更改上传文件大小

vue3 组合式 API 详解

C++从入门到实战----类和对象（上）

多维度表征(下)|用扫描电镜,CT 与仿真“看透“再生碳纤维复合材料

电商网站收费与免费wordpress阿里云图片不显示不出来

易语言模块反编译为源码 | 深入分析与实战教程

在高速公路或交通工程领域中，OD 是 Origin-Destination 的缩写，中文通常称为“起讫点”或“出行起止点”。

诏安建设局网站常德网站seo

牛商网做的网站怎么样仓库进销存软件

Windows 7 运行 .NET 应用时报错“hostfxr.dll 加载失败 (HRESULT: 0x80070057)”的彻底解决指南

免费手机网站系统WordPress使用中文链接好吗

相关文章：