当前位置：首页 > news >正文

AI_RAG

news 2025/10/2 13:03:13

一.为什么需要RAG（AI幻觉）

大模型LLM在某些情况下给出的回答很可能错误的，涉及虚构甚至是故意欺骗的信息。

二.什么是RAG

RAG是一种结合“信息检索”和“文本生成”的技术，旨在提升生成式AI模型的准确性和可靠性。它通过以下两个核心步骤工作：

1. 信息检索（Retrieval）

当收到用户提问时，RAG首先从外部知识库（如数据库、文档或网页）中检索与问题相关的信息片段，而不是仅依赖模型训练时学到的知识。

2..文本生成（Generation）

将检索到的相关信息和用户问题一起输入生成模型，生成更精准、基于事实的答案。

三.RAG的分块策略

•按照字符数来切分

•按固定字符数结合overlapping window

•按照句子来切分

•递归方法 RecursiveCharacterTextSplitter

四.RAG向量和向量检索

1.Embeddings向量化

（1）向量检索

根据用户的输入，与向量数据库中存放的文本向量进行相似度计算匹配，并检索返回最为相似的内容

（2）数据内容转为向量（目前的向量模型可实现）

2.本地大模型

Ollama向量模型本地部署：官方网址：https://ollama.com/

3.向量间的相似度计算

常用的向量相似度计算方法包括：

-余弦相似度Cosine：基于两个向量夹角的余弦值来衡量相似度。

-欧式距离L2：通过计算向量之间的欧几里得距离来衡量相似度。

-点积：计算两个向量的点积，适合归一化后的向量

4.“top-k”语义检索

在根据向量相似度检索向量时，能够找出的相似向量一般是多个，如果我们不需要这么多或者要控制相似度的大小，top-k 语义检索就派上了用场。

五.向量数据库

查看全文

http://www.dtcms.com/a/323442.html

复现论文关于3-RPRU并联机器人运动学建模与参数优化设计

机器翻译实战：使用Gensim训练中英文词向量模型及可视化

Android之gradle和gradlew命令编译项目总结

消息队列核心功能和消息队列做异步的优势

C++：继承[下篇]

Vue 使用element plus组件库提示doesn‘t work properly without JavaScript enabled

[ MySQL 数据库 ] 多表关联查询

STM32HAL库 -- 10.DMA外设实战(UART串口+DMA读取传感器数据)

Tangram官网教程

Qt Graphics View框架概述

夺宝奇兵古老之圈送修改器（The Great Circle）免安装中文版

openvela之STM32开发板部署

力扣（轮转数组）

智慧水务漏检率↓75%：陌讯水下视觉监测方案实战解析

北京天津唐山廊坊沧州打捞日记

Nvidia 开源 KO 驱动开发入门

车流高峰漏检率↓85%！陌讯时序建模方案在智慧交通的实时优化

AtCoder Beginner Contest 418

LLVM编译器入门

力扣面试150(51/100)

【Python 工具人快餐 · 第 2 份】

使用SPM进行核磁数据预处理

【无标题】六边形结构在二维拓扑量子色动力学模型中确实具有独特优势，并构建完整的二维拓扑量子色动力学模型。

Redis三种特殊数据类型

【深度学习2】logistic回归以及梯度下降

synchronized和RentrantLock用哪个?

Datawhale AI夏令营第三期，多模态RAG方向 Task2

小白成长之路-Docker部署

第二十八天(cookiesessiontokeny验证)

JVM性能调优的原则有哪些？