当前位置：首页 > news >正文

语义熵怎么增强LLM自信心的

news 2025/11/12 6:27:05

语义熵怎么增强LLM自信心的

在这里插入图片描述

一、传统Token熵的问题（先理解“痛点”）

比如模型回答“阿司匹林是否治疗头痛？”→ 输出“是”

传统Token熵：只看“词的概率”，比如“是”这个词的概率特别高（Token熵0.2，数值低说明确定性强）。
但实际风险：医学场景里，“是”的字面肯定，不代表语义上绝对正确（比如阿司匹林能缓解头痛，但有禁忌症、不能随便用）。传统Token熵没考虑语义层面的“模糊性、风险”，可能输出看着确定，实际语义上漏洞大。

二、语义熵的核心逻辑（解决什么问题？）

语义熵想干的事：不只看“选了哪个词”，更看“语义是否严谨、有没有隐藏风险”。

怎么做？→ 用“核函数”算词之间的语义相似性（比如“缓解”“治疗”“止痛”在语义上是相关的），再构建一个“语义密度”的概率分布（类似：哪些语义是模型实际想表达的？有多集中？）。
公式简化理解：

http://www.dtcms.com/a/287714.html

相关文章：

react17更新哪些新特性

【I2C】01.I2C硬件连接I2C总线时序图讲解

疯狂星期四文案网第12天运营日报

提高CPU高速缓存cache命中率的主要设计方案

SpringBoot五分钟快速入门指南

锂电池生产过程图解

鼎捷T100程序开发（批次作业开发）

新手向:基于 Python 的简易视频剪辑工具

使用 go-redis-entraid 实现 Entra ID 无密钥认证

一动一静皆消耗——IC设计之低功耗技术(Low Power Design)

javaweb的几大常见漏洞

ChatGPT Agent深度解析：告别单纯问答，一个指令搞定复杂任务？

mac 配置svn

1Panel中的OpenResty使用alias

《计算机网络》实验报告一常用网络命令

从 Server.xml 到字节码：Tomcat 内核全景与请求旅程 10 000 字深剖

泛型机制详解

2.4 组件间通信Props（父传子）

Java SE 讨论String类

GATE：基于移动嵌入式设备的实时边缘构建图注意力神经网络用于鲁棒室内定位

C++命名空间深度解析：避免命名冲突的终极解决方案

HTTPHTTPSTLSDNSRSA

LVS四种工作模式深度解析

ENSP路由综合实验 + 思科（cisco)/华为（ensp)链路聚合实验

Vite的优缺点（精简版）

Java大视界：Java大数据在智能医疗电子健康档案数据挖掘与健康服务创新＞

lvs笔记

RabbitMQ面试精讲 Day 3：Exchange类型与路由策略详解

Arc虚拟细胞挑战入门指南

OpenCV 官翻5 - 机器学习