当前位置: 首页 > news >正文

RAG架构(检索增强生成)与向量数据库

文章目录

  • RAG 架构
  • 向量数据库
  • RAG 工作流程

RAG 架构

如今传统LLM大模型有太多的缺点:

  1. 垂直领域知识不够:基于通用数据进行训练,无法应对垂直领域、特定公司业务的问题解答,这类垂直领域问题没办法在网络中得到答案,例如:i人事app的绩效考核任务如何创建发起?
  2. 知识时效性滞后:领域知识不足及数据安全问题的局限性,比如说公司需要打造一款公司产品业务的知识库,你公司的产品方面知识没办法使用通用AI大模型来解答,
  3. 幻觉:有些不懂的问题,他也会胡言乱语,答非所问。

所以才孕育出 RAG(Retrieval-Augmented Generation) 架构,所谓 RAG 指的是将 传统大模型 和 检索系统(这里指向量数据库)相结合,提供更精准的数据检索生成,传统 LLM 大模型不知道的问题,可以从数据库中进行检索查询,这样大大提高回答准确度!说白了:RAG是一种架构设计,简单说就是让大模型 LLM 再加了一个数据库,这样就能让大模型通过检索生成更精准的答案。
在这里插入图片描述

向量数据库

向量数据库中存储向量数据(好像一句废话),向量数据可以来自于文本、图片、音频…例如我想要把公司知识库的文本数据全部存储到向量数据库中,我就需要将文本通过向量模型(Embedding)进行向量化,数据会被清洗、分块(Chunk)后,存入向量数据库(Vector DB),向量数据的格式为浮点数组成的固定长度数组,向量之间的距离代表语义相似度。
在这里插入图片描述

所以我们需要事先将数据进行向量化处理,然后将检索数据不断存储到向量数据库里面,所以完全就解决上述提到的实时性、垂直性、准确性问题。随着不断收集数据进行词嵌入处理,LLM大模型的回答会越来越精准,专业。
在这里插入图片描述

RAG 工作流程

首先,要提前将检索数据进行分块(chunk),然后通过词嵌入模型进行向量化处理(例如将文本转换成浮点数组),然后将数据提前嵌入到向量数据库当中。当客户发起提问,首先也会讲问题进行向量化处理,然后才会在向量数据库中进行相似度检索,此时可能会检索出很多内容,还需要进行筛选、排名TopN,对数据进行召回发送给LLM大模型进行参考,最后大模型组织语言对客户问题进行回答。一个典型的RAG流程组成包含以下部分:

  1. 文本切片、分块
  2. Embedding 嵌入模型:例如 OpenAI text-embedding-3, BGE,
  3. 向量数据库:例如 FAISS(本地),Milvus(分布式)
  4. LLM大模型:例如 GPT-4 / Claude / Qwen2
  5. Rerank 重排模型:BERT / cross-encoder / bge-reranker
    在这里插入图片描述
http://www.dtcms.com/a/492930.html

相关文章:

  • 北京网站建设首选石榴汇网站验证码原理
  • 招聘网站开发方案doc哈巴河网站制作
  • 网站如何做交换链接微信运营商人工电话
  • 吴江区城乡建设管理局网站海南省住房和建设厅网站首页
  • asp sqlserver做网站网站怎么做分时
  • jEasyUI 创建分割按钮
  • 珠海网站建设网络推广wordpress占用内存
  • 【机器学习入门】8.2 主成分分析:一文吃透主成分分析(PCA)—— 从原理到核心逻辑
  • 如何做链接淘宝客的网站做3d同人的网站是什么
  • 旅游网站开发公司wordpress彩色标签固定宽度代码
  • 做网站搜索如何显示官网阿里巴巴网站建设规划
  • 大连模板网站制作哪家好响应式网站建设的好处
  • 门户网站建设的书籍wordpress 去掉顶部
  • 陕西省住房和城乡建设网站找别人做网站可以提供源码吗
  • 免费行情软件app网站大全下载有图片硬件定制
  • 汽车网站的建设方向一起做网店货源
  • 做网站怎么写预算怎么样做跨境电商
  • 做动效很好的网站网站建设有哪些软件有哪些方面
  • Day 1 R基础
  • 站长之家怎么用wordpress 论坛 整合
  • 网站建设费怎样摊销网站seo的优化怎么做
  • 广州海珠网站制嘉兴免费网站制作
  • 下载优化大师appseo专业培训技术
  • 青岛网站关键词it外包 源码
  • 做微信图文推送的网站动效网站怎么做
  • 南昌 网站制作广告推广词
  • 网站建设 猴王网络有实力h5海报是怎么做出来的
  • Windows 平台应用程序 QoS 高级策略配置
  • MySQL8.0 自动化脚本安装方案
  • 网站兼容问题百度超级链