当前位置：首页 > news >正文

LLM应用开发(九）- 幻觉及如何缓解

news 2025/8/24 20:36:02

1.幻觉的定义

1.1.事实性幻觉

指模型生成的内容与可验证的现实事实不一致。比如提问“第一个在月球上行走的人是谁?"，模型回复"CharlesLindbergh在1951年月球先驱任务中第一个登上月球"，而实际上，第一个登上月球的人是Nei Armstrong。而事实性幻觉又分为事实不一致(与现实世界信息相矛盾)和事实捏造(压根没有，无法根据现实信息验证)。

1.2.忠实性幻觉

指模型生成的内容与用户的指令或上下文不一致。比如让模型总结今年10月的新闻，结果模型却在说2006年10月的事。忠实性幻觉也可以细分，分为指令不一致(输出偏离用户指令)、上下文不一致(输出与上下文信息不符)、逻辑不一致(推理步骡以及与最终答案之间不一致)三类，

2.产生幻觉原因

2.1.数据源导致的幻觉

首先病从口入，大模型的粮食数据，是致使它产生幻觉的一大原因。这里面就包括数据缺陷和数据中捕获的事实知识的利用率低。具体来说，数据缺陷分为错误信息和偏见(重复偏见、社会偏见)，此外大模型也存在知识边界，所以存在领域知识缺陷和过时的事实知识。即便大模型吃掉了大量的数据，也会在利用时出现问题。
除此之外，大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉，比如:如果训练数据中频繁出现“加拿大”和“多伦多”，那么大模型可能会错误地将多伦多识别为加拿大的首都。

2.2.训练过程导致的幻觉

在模型的预训练阶段(大模型学习通用表示并获取世界知识)、对齐阶段(微调大模型使其更好地与人类偏好一致)两个阶段产生的问题也会导致幻觉的发生。

预训练阶段：

架构缺陷:基于前一个token 预测下一个token，这种单向建模阻碍了模型捕获复杂的上下文关系的能力;自注意力模块存在缺陷随着 token 长度增加，不同位置的注意力被稀释。

暴露偏差:训练策路也有缺陷，模型推理时依赖于自己生成的token 进行后续预测，模型生成的错误 token 会在整个后续 token 中产生级联错误。

对齐阶段：

能力错位：大模型内在能力与标注数据中描述的功能之间可能存在错位。当对齐数据需求超出这些预定义的能力边界时，大模型会被训练来生成超出其自身知识边界的内容，从而放大幻觉的风险。

信念错位:基于 RLHF 等的微调，使大模型的输出更符合人类偏好，但有时模型会倾向于迎合人类偏好，从而牺牲信息真实性。

2.3.推理导致的幻觉

1.固有的抽样随机性:在生成内容时根据概率随机生成。

2.不完美的解码表示:上下文关注不足,(过度关注相邻文本而忽视了源上下文)和 softmax 瓶颈(输出概率分布的表达能力受限)

3.幻觉评估检测

3.1.不确定性检测评估方法

1.基于内部状态的方法主要依赖于大模型的内部状态。例如，通过考虑关键概念的最小标记概率来确定模型的不确定性。

2.基于行为的方法主要依赖观察大模型的行为，不需要访问其内部状态。例如，通过采样多个大语言模型响应并评估事实陈述的一致性来检测幻觉。

3.2.忠实性检测评估方法

基于事实的度量:测量生成内容和源内容之间事实的重叠程度来评估忠实性。

分类器度量:使用训练过的分类器来区分模型生成的忠实内容和幻觉内容。

问答度量:使用问答系统来验证源内容和生成内容之间的信息一致性。

不确定度估计:测量模型对其生成输出的置信度来评估忠实性。

提示度量:让大模型作为评估者，通过特定的提示策略来评估生成内容的忠实性。

4.幻觉的缓解方案

4.1.缓解数据相关幻觉（重点）

减少错误信息和偏见，最直观的方法是收集高质量的事实数据，并进行数据清理以消除偏见。对于大语言模型知识边界的问题，有两种流行方法。一种是知识编辑，直接编辑模型参数弥合知识差距。另一种通过检索增强生成(RAG)利用非参数知识源。

检索增强生成具体分为三种类型:一次性检索、迭代检索和事后检索。

4.2.缓解预训练幻觉

4.3.缓解对齐幻觉

4.4.缓解推理幻觉

http://www.dtcms.com/a/231335.html

相关文章：

gateway 网关路由新增 (已亲测)

HarmonyOS 实战：给笔记应用加防截图水印

EMCC 13c 报错 “Metrics Global Cache Blocks Lost is at XXX“ 解决

大语言模型备案与深度合成算法备案的区别与联系

yoloe优化：可支持点提示进行检测分割

Python训练第四十四天

Windows系统下npm报错node-gyp configure got “gyp ERR“解决方法

Kafka消息队列笔记

10. MySQL索引

Windows系统工具：WinToolsPlus 之 SQL Server Suspect/质疑/置疑/可疑/单用户等修复

BEV和OCC学习-3:mmdet3d 坐标系

Spark实战能力测评模拟题精析【模拟考】

webpack打包学习

Webpack性能优化：构建速度与体积优化策略

6.4本日总结

大数据-278 Spark MLib - 基础介绍机器学习算法梯度提升树 GBDT案例详解

Three.js进阶之音频处理与展示

Apache APISIX

多线程爬虫使用代理IP指南

查找 Vue 项目中未使用的依赖

PR基本概念——2025填空题

JDK 8 到 JDK 24 新特性大全

猎板硬金镀层厚度：新能源汽车高压系统的可靠性基石

WebFuture：启动数据库提示: error while loading shared libraries: libaio.so.1问题处理

基于SpringBoot+Vue的在线音乐网站系统

Manus AI 现在可以生成短片了

使用 systemctl 实现程序自启动与自动重启

嵌入式分析利器：DuckDB与SqlSugar实战

Webpack搭建本地服务器

Solidity 开发指南：构建你的第一个 DApp