基于语义语言的语义通信(SemCom)理论:语义编码、语义解码、CSED 及语言利用
语义通信(Semantic Communication, SemCom)超越了传统 Shannon 通信范式,旨在通过语义信息的高效编码、解码及推理,实现更智能、高效的通信系统。在基于语义语言(Semantic Language)的 SemCom 设计中,核心问题包括:
- 语义编码问题(Semantic Encoding Problem)
- 语义解码问题(Semantic Decoding Problem)
- CSED(Common Semantic Error Distance)问题
- 语言利用 - 语义编码
- 语言利用 - 语义解码
- 语言利用 - CSED
1. 语义编码问题(Semantic Encoding Problem)
定义
语义编码问题关注如何将源信息(如文本、图像、传感数据)转换为具有最小语义损失的编码表示,以便高效传输。其目标是:
min E D s ( M , E ( M ) ) \min_{\mathcal{E}} D_s(M, \mathcal{E}(M)) minEDs(M,E(M))
其中:
- M M M 是原始语义信息;
- E ( M ) \mathcal{E}(M) E(M) 是编码后的信息;
- D s D_s Ds 是语义损失函数,衡量语义信息丢失程度。
挑战
- 背景知识差异:不同用户对相同语言的理解可能不同,导致编码信息的最优性因接收者背景知识而变化。
- 冗余信息压缩:语义信息通常包含大量冗余,如何有效去除非必要数据是关键。
- 多模态融合:许多场景需要同时编码文本、图像、语音等多种模态信息。
- 非结构化数据建模:语义信息往往是非结构化的,传统信息论方法难以建模。
解决方案
- 基于逻辑概率的编码:
- 采用贝叶斯推理:
P ( M ∣ K ) = P ( K ∣ M ) P ( M ) P ( K ) P(M | K) = \frac{P(K | M) P(M)}{P(K)} P(M∣K
- 采用贝叶斯推理: