当前位置：首页 > news >正文

大模型 rag 技术浅析（一）

news 2025/10/9 13:42:44

一、RAG技术概述

RAG技术的主要思想是通过检索模块从外部知识库中获取相关信息，然后将这些信息与用户输入一起传递给生成模块，从而生成更准确、更有针对性的回答。这种方法可以有效缓解大语言模型在知识更新和特定领域知识不足方面的问题。

二、RAG技术详细工作原理

1. 输入处理

用户输入首先经过预处理，包括：

分词（Tokenization）：将输入文本拆分为词语或子词。
去停用词（Stop Words Removal）：去除对语义理解无帮助的常用词，如“的”、“是”等。
词形还原（Lemmatization）：将词语还原为基本形式，如“running”还原为“run”。
词向量表示（Word Embedding）：将词语转换为向量表示，以便于后续的语义理解和检索。

2. 检索模块

检索模块的目标是从外部知识库中获取与用户输入相关的文档或片段。以下是具体步骤：

2.1 查询构建

关键词提取（Keyword Extraction）：

http://www.dtcms.com/a/100721.html

相关文章：

深入 OpenPDF：高级 PDF 生成与操作技巧

LinuxTCP/UDP基础概念

解压多个文件

解决【vite-plugin-top-level-await】插件导致的 Bindings Not Found 错误

【文献25/03/29】UPFormer：用于田间葡萄叶病害分割的U形感知轻量级Transformer

现代优雅杂志海报徽标设计手写英文字体安装包 Attomes – Brush Handwritten Font

JavaScript 中的异步编程：回调函数、Promise 和 async/await

redhat认证是永久的吗

Pinia 及其持久化插件的完整使用指南

食物链 POJ - 1182分析与解答

QtAdvancedStylesheets使用

论坛系统自动化测试报告

ARM向量表

Python使用“决策树”算法解决预测钻石成本的问题

Flink内存模型--flink1.19.1

自定义一些C语言的字符串函数

Go语言基础：数据类型

Redis-07.Redis常用命令-集合操作命令

Python爬虫-爬取大麦网演出详情页面数据

0330-YYYY-MM-DD格式日期比较大小

【JavaScript】十二、定时器

SpringBoot 配置⽂件

练习题：113

从零开始：用Python搭建你的第一个机器学习模型

划分型dp+倍率转换为后缀

VMware+Ubuntu+VScode+ROS一站式教学+常见问题解决

SpringBoot集成Log4j2终极指南：从基础配置到性能调优

线性回归算法

YOLOv11模型的常见处理

qml语法解释