当前位置: 首页 > news >正文

大模型笔记4:RAG检索增强生成

大模型的缺陷

大模型的知识不是实时的,不具知识更新。

大模型可能不知道你的私有领域内/业务知识。

大模型幻觉。也就是看似合理但其实是错误的内容。

RAG的概念

建立索引

将文本数据转换为向量存储,为后续检索提供基础。

1.数据清洗与提取:将PDF、Docx等文件中的内容转换为纯文本,去除无关信息。

2.切分文本:将文本切分为chunk,以便后续的向量化和检索。

3.向量化:使用嵌入模型将chunk向量化,并将chunk与向量以键值对的形式存储到向量数据库中,以便于后续的搜索。

检索生成

用户输入问题后,系统将问题转换为向量,与向量数据库中的文档块向量计算相似度。

检索相似度最高的k个文档块,作为回答当前问题的上下文。

提示词模板:请阅读{知识文档块},请问{问题指令}。

http://www.dtcms.com/a/251450.html

相关文章:

  • MobaXterm首次连接Ubuntu失败
  • 浏览器基础及缓存
  • 02-Timer0-Timer1-Timer2-Timer3-Timer4测试程序
  • O - 方差
  • 湖北理元理律师事务所:债务优化中如何保障债务人生存权益
  • 安装 WSL2 与设置​
  • 基于MSE-Nacos实现服务的动态发现和配置动态管理
  • mac如何使用tensorboardx?
  • Hive集成Paimon
  • 【Erdas实验教程】022:遥感图像辐射增强(直方图均衡化)
  • 【性能调优系列】如何分析火焰图
  • 计算机操作系统(计算题公式)
  • React组件通信——props
  • MyBatisPlus 全面学习路径
  • 【AI学习】【Ubuntu 22.04】【安装Ollama】两种方式
  • Spring-ai 1.0.0 学习(三)——流式调用及模型参数
  • JavaScript学习笔记
  • React-router实现原理剖析
  • OC-UI学习-Auto Layout使用
  • Hierarchical Vector Quantization for Unsupervised Action Segmentation
  • 如何实现自动标注
  • 文本预测和分类任务
  • 语言模型的泛化能力和训练数据依赖性
  • 【项目实训】【项目博客#09】HarmonySmartCodingSystem系统后端智能API检索与代码助手实现(6.2-6.15)
  • python 用正则在response.text中获取<title>标签的内容
  • springboot3-笔记总结
  • SpringBoot入门 springboot模版注入问题
  • 2025最新Nvm安装教程
  • 已知路由表和分组的目的地址求对应的下一跳地址
  • 【Create my OS】6 线程调度