当前位置: 首页 > news >正文

rag搭建,是如何进行向量匹配检索的?

RAG 里为什么要“向量检索”?

在 Retrieval-Augmented Generation (RAG) 中,我们的目标是让 LLM 能够“回答它本身不知道的内容”。做法是:

  1. 将知识(文本)进行向量化,存入向量数据库;
  2. 用户提问后,也将问题向量化;
  3. 去数据库里 找出与这个问题最相似的一批知识,返回喂给 LLM。

向量匹配检索:原理解析

第一步:构建向量数据库(也叫“知识库”)

比如你有一大段文档,做法是:

  1. 切分成 chunk(段落),如每 300 字为一个段;
  2. 每个 chunk 用 Embedding 模型(如 OpenAI 的 text-embedding-ada-002 或 BGE) 转成一个向量:
    "向量" = 文本的语义表示,一个高维空间中的点。
    
  3. 把每个向量连带元信息&#x
http://www.dtcms.com/a/145620.html

相关文章:

  • Transfomer的本质
  • 【Android】Wallpaper学习
  • 博客系统案例练习2-用户注册-redis
  • 数据库知识
  • 电解电容失效分析过程、失效分析报告
  • 450.删除二叉搜索树中的节点
  • 【Vulkan 入门系列】创建交换链、图像视图和渲染通道(四)
  • 【2025面试常问Java八股】AQS介绍(AbstractQueuedSynchronizer 抽象队列同步器)
  • PyCharm使用Anaconda 中的虚拟环境
  • PowerBi如何制作KPI的总览页?
  • 关于AI:记忆、身份和锁死
  • Function calling LLMs 的 MCP:AI开发的双剑合璧
  • [OpenGL]使用OpenGL实现基于物理的渲染模型PBR(下)
  • 大数据应用开发——大数据平台集群部署(四)
  • 【KWDB 创作者计划】_上位机知识篇---Arduino
  • 什么是 C++中的const?
  • SpringBoot Actuator指标收集:Micrometer与Prometheus集成
  • Matlab 基于模型参考自适应法和SVPWM的异步电机控制
  • `ImadcnIdentifierGenerator` 深度解析
  • Java学习笔记(数组,方法)
  • JavaWeb 课堂笔记 —— 16 MyBatis 动态SQL
  • Img2img-turbo 在2080Ti上的测试笔记
  • 双目视觉中的动态畸变矫正与跨视角信息融合
  • 4月19日记(补)算了和周日一块写了 4月20日日记
  • 前端工程化之自动化部署
  • 探秘STM32如何成为现代科技的隐形引擎
  • C++栈操作集合
  • SpringBoot编写单元测试
  • acwing--动态规划【线性dp】4/20、4/21
  • Lora 微调自定义device_map