当前位置: 首页 > news >正文

语义熵怎么增强LLM自信心的

语义熵怎么增强LLM自信心的

在这里插入图片描述

一、传统Token熵的问题(先理解“痛点”)

比如模型回答“阿司匹林是否治疗头痛?”→ 输出“是”

  • 传统Token熵:只看“词的概率”,比如“是”这个词的概率特别高(Token熵0.2,数值低说明确定性强 )。
  • 但实际风险:医学场景里,“是”的字面肯定,不代表语义上绝对正确(比如阿司匹林能缓解头痛,但有禁忌症、不能随便用 )。传统Token熵没考虑语义层面的“模糊性、风险”,可能输出看着确定,实际语义上漏洞大。

二、语义熵的核心逻辑(解决什么问题?)

语义熵想干的事:不只看“选了哪个词”,更看“语义是否严谨、有没有隐藏风险”

  • 怎么做?→ 用“核函数”算词之间的语义相似性(比如“缓解”“治疗”“止痛”在语义上是相关的 ),再构建一个“语义密度”的概率分布(类似:哪些语义是模型实际想表达的?有多集中?)。
  • 公式简化理解:
http://www.dtcms.com/a/287714.html

相关文章:

  • react17更新哪些新特性
  • 【I2C】01.I2C硬件连接I2C总线时序图讲解
  • 疯狂星期四文案网第12天运营日报
  • 提高CPU高速缓存cache命中率的主要设计方案
  • SpringBoot五分钟快速入门指南
  • 锂电池生产过程图解
  • 鼎捷T100程序开发(批次作业开发)
  • 新手向:基于 Python 的简易视频剪辑工具
  • 使用 go-redis-entraid 实现 Entra ID 无密钥认证
  • 一动一静皆消耗——IC设计之低功耗技术(Low Power Design)
  • javaweb的几大常见漏洞
  • ChatGPT Agent深度解析:告别单纯问答,一个指令搞定复杂任务?
  • mac 配置svn
  • 1Panel中的OpenResty使用alias
  • 《计算机网络》实验报告一 常用网络命令
  • 从 Server.xml 到字节码:Tomcat 内核全景与请求旅程 10 000 字深剖
  • 泛型机制详解
  • 2.4 组件间通信Props(父传子)
  • Java SE 讨论String类
  • GATE:基于移动嵌入式设备的实时边缘构建图注意力神经网络用于鲁棒室内定位
  • C++命名空间深度解析:避免命名冲突的终极解决方案
  • HTTPHTTPSTLSDNSRSA
  • LVS四种工作模式深度解析
  • ENSP路由综合实验 + 思科(cisco)/华为(ensp)链路聚合实验
  • Vite的优缺点(精简版)
  • Java大视界:Java大数据在智能医疗电子健康档案数据挖掘与健康服务创新>
  • lvs笔记
  • RabbitMQ面试精讲 Day 3:Exchange类型与路由策略详解
  • Arc虚拟细胞挑战入门指南
  • OpenCV 官翻5 - 机器学习