当前位置: 首页 > news >正文

【大模型(LLMs)RAG 检索增强生成 面经】

1 RAG 基础面

1.1 为什么大模型需要外挂 (向量) 知识库?

如何将外部知识注入大模型,最直接的方法:利用外部知识对大模型进行微调。
思路: 构建几十万量级的数据,然后利用这些数据 对大模型进行微调,以将 额外知识注入大模型
优点: 简单粗暴
缺点:
这几十万量级的数据 并不能很好的将额外知识注入大模型;
训练成本昂贵。不仅需要 多卡并行,还需要 训练很多天;
既然大模型微调不是将外部知识注入大模型的最优方案,那是否有其它可行方案?

1.2. RAG 思路是怎么样?

⚫ 加载文件
⚫ 读取文本
⚫ 文本分割
⚫ 文本向量化
⚫ 问句向量化
⚫ 在文本向量中匹配出与问句向量最相似的 top k 个
⚫ 匹配出的文本作为上下文和问题一起添加到 prompt 中
⚫ 提交给 LLM 生成回答

在这里插入图片描述

相关文章:

  • 【HTML】二、列表、表格
  • 【JAVA】七、基础知识“if+switch+循环结构”详细讲解~简单易懂!
  • Trae:与AI结伴,开启编程新体验
  • springboot438-基于SpringBoot的数字化教学资源管理系统(源码+数据库+纯前后端分离+部署讲解等)
  • 王者荣耀道具页面爬虫(json格式数据)
  • 线程、多线程以及线程池的关系与用法
  • Xinference大模型配置介绍并通过git-lfs、hf-mirror安装
  • 【使用 Java 调用命令行工具:完整指南】
  • Vue 3 Diff 算法深度解析:与 Vue 2 双端比对对比
  • 【机器学习】基于t-SNE的MNIST数据集可视化探索
  • 【Vue3+Vite指南】全局引入SCSS文件后出现Undefined mixin?一招解决命名空间陷阱!
  • 高频面试题(含笔试高频算法整理)基本总结回顾27
  • 模型蒸馏系列——开源项目
  • 小测验——根据已有obj文件,自己写出网格投影至2d
  • 【Pycharm】Pycharm无法复制粘贴,提示系统剪贴板不可用
  • 二叉树的性质和实现
  • 【新能源汽车研发测试能力建设深度解析:设备、趋势与行业展望】
  • 4.1 Ref/TypedRef 类型推导原理剖析
  • 时间序列重采样与pandas的resample方法是如何实现的?
  • Canoe Panel常用控件
  • 取得金奖西瓜品种独家使用权的上海金山,为何要到异地“试种”?
  • 解读|战国子弹库帛书漂泊海外79年今归国,追索仍将继续
  • 台湾关闭最后的核电,岛内担忧“非核家园”缺电、涨电价困局难解
  • 墨西哥海军一载两百余人帆船撞上纽约布鲁克林大桥,多人落水
  • 全国林业院校校长论坛举行,聚焦林业教育的创新与突破
  • 著名心血管病学专家李国庆教授逝世,享年63岁