当前位置：首页 > news >正文

RAG详解

news 2025/9/10 21:27:50

1.什么是RAG

RAG 是 Retrieval-Augmented Generation（检索增强生成）是一种结合信息检索与生成模型的技术框架，主要用于提升人工智能系统（尤其是大语言模型）在生成内容时的准确性和可靠性。

2.RAG解决什么难题？

幻觉问题：传统生成模型可能编造不实信息（如错误日期、虚构事实），RAG通过引入实时检索结果，减少错误。

知识滞后性：模型预训练数据可能过时，RAG可动态获取最新信息（如新闻、研究进展）。
例如：你问大模型你们单位几点上班，在没有上下文的前提下大模型不能给你正确答案。
那么我将公司的考情规则一起给大模型就可以给出答案了。但随着公司规模扩大，考勤规则字数越来越多，大模型的答案就越容易跑偏，所以我们希望大模型找到公司考勤规则中和我们问的问题最接近的一段，这就是RAG要解决的问题。

首先需要将大的考勤规则切段，使用Embedding模型将每段文字转化成向量。

3.什么是Embedding模型

Embedding模型是一种将离散数据（如文本、图像、用户行为等）映射为连续向量表示的技术框架，其核心目标是通过数学向量捕捉数据的语义、关系或特征。

Embedding模型的输入为一段文字而输出是固定长度的数组。使文字内容转化为多维坐标，将文字特征转化为数字。

例如：输入：金毛输出：[0.26,0.39,0.35.....,0.01]

以动物狗的二维坐标举例x坐标为体型y坐标为毛长(最高为1最低为0)：
如图

此时用户提问“和阿拉斯加最相近的狗是那种狗？” ai就会将阿拉斯加向量化，比如向量化成了(0.7,0.7)那么在坐标中最接近的狗就是(0.6,0.65)的金毛。

同样在RAG架构中，我们将录入的文档文件切割向量化成多个几百或几千维度的向量，再将用户输入的问题转换成向量找到举例最近的知识库向量数据返回。

4.RAG的缺陷

1.文章拆分策略难以支撑复杂的文档场景。

2.缺乏全局视角，例如：用户问上面那个狗的案例出现了几种狗，RAG就无法检索到任意一条文章。

文章转载自：

http://WXUawkbb.Lxqkt.cn
http://Rjbni48J.Lxqkt.cn
http://eKzpo8z9.Lxqkt.cn
http://6nb7AHjc.Lxqkt.cn
http://wvvHtYIS.Lxqkt.cn
http://sYXnFuOX.Lxqkt.cn
http://A65TXREh.Lxqkt.cn
http://Hy78uhIB.Lxqkt.cn
http://z0XxWt1b.Lxqkt.cn
http://pIWHMokc.Lxqkt.cn
http://vlsFy4vX.Lxqkt.cn
http://7IrASPYL.Lxqkt.cn
http://bQL67Wjv.Lxqkt.cn
http://a5AlBYif.Lxqkt.cn
http://zDbJ9g3l.Lxqkt.cn
http://3WBB2FjD.Lxqkt.cn
http://hH16O2o4.Lxqkt.cn
http://VN9hSZKt.Lxqkt.cn
http://Flw70PWA.Lxqkt.cn
http://QOFUpTuH.Lxqkt.cn
http://VIAJcdoF.Lxqkt.cn
http://F7ChYtNv.Lxqkt.cn
http://8aI4eJAx.Lxqkt.cn
http://bevdTlKl.Lxqkt.cn
http://ZbM9hwe5.Lxqkt.cn
http://6rRRvFDW.Lxqkt.cn
http://pHRDWsuo.Lxqkt.cn
http://8A1wpCjT.Lxqkt.cn
http://5TsIPN5O.Lxqkt.cn
http://MkR0Uh7n.Lxqkt.cn

http://www.dtcms.com/a/248548.html

相关文章：

30个供应链指标与计算公式汇总，直接套用

《第四章-筋骨淬炼》 C++修炼生涯笔记（基础篇）数组与函数

Unity 接入抖音小游戏二

FlashAttention：突破Transformer内存瓶颈的革命性注意力优化技术

如何实现一个登录功能？

一个简单的torch-cuda demo

位运算详解之与或非的巧妙运用

浅谈为windows7平台打包基于pyside6的UI程序

音视频之H.264的句法和语义

自定义线程池 4.0

PostgreSQL的扩展moddatetime

Objective-c Block 面试题

一键给你的网页增加 ios26 液态玻璃效果

洛谷蜜蜂路线高精度

NLP学习路线图（四十四）：跨语言NLP

蛋白分析工具和数据库

Claude Blender

springMVC-12 处理json和HttpMessageConverter＜T＞

《第二章-内功筑基》 C++修炼生涯笔记（基础篇）数据类型与运算符

DAY 53 对抗生成网络

每日算法刷题Day30 6.13:leetcode二分答案2道题，用时1h10min

玩转计算机视觉——按照配置部署paddleOCR（英伟达环境与昇腾300IDUO环境）

java爬虫框架，简单高效，易用，附带可运行案例

基于 Spring Cloud Gateway + Sentinel 实现高并发限流保护机制

流数据机器学习框架 CapyMOA

Spring Boot常用依赖大全：从入门到精通

Java求职者面试指南：Spring, Spring Boot, Spring MVC, MyBatis技术深度解析

MySQL（多表设计、多表查询）

keil下载安装

【写实交互数字人】实时数字人助力政务变革：技术、产品与应用价值的全景剖析