当前位置: 首页 > news >正文

AI_RAG

一.为什么需要RAG(AI幻觉)

大模型LLM在某些情况下给出的回答很可能错误的,涉及虚构甚至是故意欺骗的信息。

二.什么是RAG

RAG是一种结合“信息检索”和“文本生成”的技术,旨在提升生成式AI模型的准确性和可靠性。它通过以下两个核心步骤工作:

1. 信息检索(Retrieval)

当收到用户提问时,RAG首先从外部知识库(如数据库、文档或网页)中检索与问题相关的信息片段,而不是仅依赖模型训练时学到的知识。

2..文本生成(Generation)

将检索到的相关信息和用户问题一起输入生成模型,生成更精准、基于事实的答案。

三.RAG的分块策略

按照字符数来切分

按固定字符数 结合overlapping window

按照句子来切分

递归方法 RecursiveCharacterTextSplitter

四.RAG向量和向量检索

1.Embeddings向量化

(1)向量检索

        根据用户的输入,与向量数据库中存放的文本向量进行相似度计算匹配,并检索返回最为相似的内容

(2)数据内容转为向量(目前的向量模型可实现)

2.本地大模型

        Ollama向量模型本地部署:官方网址:https://ollama.com/

3.向量间的相似度计算

常用的向量相似度计算方法包括:

        -余弦相似度Cosine:基于两个向量夹角的余弦值来衡量相似度。

        -欧式距离L2:通过计算向量之间的欧几里得距离来衡量相似度。

        -点积:计算两个向量的点积,适合归一化后的向量

4.“top-k”语义检索

        在根据向量相似度检索向量时,能够找出的相似向量一般是多个,如果我们不需要这么多或者要控制相似度的大小,top-k 语义检索就派上了用场。

五.向量数据库

http://www.dtcms.com/a/323442.html

相关文章:

  • 复现论文关于3-RPRU并联机器人运动学建模与参数优化设计
  • 机器翻译实战:使用Gensim训练中英文词向量模型及可视化
  • Android之gradle和gradlew命令编译项目总结
  • 消息队列核心功能和消息队列做异步的优势
  • C++:继承[下篇]
  • Vue 使用element plus组件库提示doesn‘t work properly without JavaScript enabled
  • [ MySQL 数据库 ] 多表关联查询
  • STM32HAL库 -- 10.DMA外设实战(UART串口+DMA读取传感器数据)
  • Tangram官网教程
  • Qt Graphics View框架概述
  • 夺宝奇兵 古老之圈 送修改器(The Great Circle)免安装中文版
  • openvela之STM32开发板部署
  • 力扣(轮转数组)
  • 智慧水务漏检率↓75%:陌讯水下视觉监测方案实战解析
  • 北京天津唐山廊坊沧州打捞日记
  • Nvidia 开源 KO 驱动 开发入门
  • 车流高峰漏检率↓85%!陌讯时序建模方案在智慧交通的实时优化​
  • AtCoder Beginner Contest 418
  • LLVM编译器入门
  • 力扣面试150(51/100)
  • 【Python 工具人快餐 · 第 2 份】
  • 使用SPM进行核磁数据预处理
  • 【无标题】六边形结构在二维拓扑量子色动力学模型中确实具有独特优势,并构建完整的二维拓扑量子色动力学模型。
  • Redis三种特殊数据类型
  • 【深度学习2】logistic回归以及梯度下降
  • synchronized和RentrantLock用哪个?
  • Datawhale AI夏令营第三期,多模态RAG方向 Task2
  • 小白成长之路-Docker部署
  • 第二十八天(cookiesessiontokeny验证)
  • JVM性能调优的原则有哪些?