当前位置: 首页 > news >正文

【大模型】RAG

大纲

  1. 用垂域数据,补充LLM的能力
  2. 构建垂域(向量)知识库
  3. 搭建RAG系统需要的模块
  4. 搭建RAG系统的技巧

一、什么是RAG(检索增强的生成模型)

LLM大模型(预训练模型)

目前的局限性:

  1. LLM的知识不是实时的
  2. 不知道私域知识

RAG - retrieval augmented generation

用检索的方法来增强生成模型的能力。

RAG系统的基本搭建流程

    二、向量检索

    2.1 文档的加载和切割

    openai_api_key

    2.2 LLM接口封装

    2.3 prompt模版

    三、向量检索

    向量:从一个点到另一个点到有向线段。

    向量的维度:用一组坐标,表示n维空间中的向量,N是向量的维度。

    文本向量:text embeddings 将文本转成一组N维浮点数。

    语义相似度:向量之间的距离,距离的远近。

    3.1 文本向量是怎么得到的

    3.2 计算向量间的相似度

    numpy 是数据科学中,pyprch的三剑客,

    http://www.dtcms.com/a/338188.html

    相关文章:

  • 明远智睿 RK3588:以技术突破解锁开发新维度
  • 【Python】源码安装python后报错:ModuleNotFoundError: No module named ‘_lzma‘
  • Jenkins持续集成系统
  • github 如何在 readme 显示Star History
  • NL2SQL:从自然语言到SQL查询的深度解析
  • PostgreSQL 从参数调优到 AI 诊断的实战指南
  • Unity开发中的浅拷贝与深拷贝
  • Java获取京东评论数据的实战指南
  • 06.文件权限管理
  • quic协议与应用开发
  • 视觉语言导航(12)——LLM-VLN 4.2
  • 如何部署 PHPWind 8.5 UTF8 论坛?从下载到安装全流程(附安装包下载)
  • GraphPad Prism10.1安装包免费下载中文版下载以及详细安装教程!!
  • Tomcat Wrapper源码解析:深入理解Servlet生命周期与请求分发机制
  • SQL Server 基本语法
  • NodeJs 桌面开发学习 electron.js (一)
  • 黑马java入门实战笔记
  • 【从0到1制作一块STM32开发板】8. PCB添加丝印
  • c++中的auto自动类型推导
  • JVM-类加载详情
  • Mysql——分库分表后id冲突解决方案(即分布式ID的生成方案)
  • 静态网站与动态网站的区别
  • MySQL分库分表实战指南
  • 电子电气架构 --- 软件开发数字化转型
  • Linux小白加油站,第三周周考
  • 永磁同步电机控制算法--转速环电流环超螺旋滑模控制器STASMC
  • 04 类型别名type + 检测数据类型(typeof+instanceof) + 空安全+剩余和展开(运算符 ...)简单类型和复杂类型 + 模块化
  • Maven依赖管理工具详细介绍
  • PowerShell定时检查日期执行Python脚本
  • 决策树的学习