当前位置: 首页 > news >正文

网络服务商能删除网站珠海网络网站建设

网络服务商能删除网站,珠海网络网站建设,成都设计院招聘,网站建设专业导航网站RAG for AI app的三个阶段 AI应用程序的RAG系统通常遵循三个核心阶段: Indexing索引:此阶段涉及预处理外部数据源,并将表示数据的嵌入存储在向量存储器中,以便可以轻松检索。Retrieval检索:此阶段涉及根据用户的查询检…

RAG for AI app的三个阶段

AI应用程序的RAG系统通常遵循三个核心阶段:

  • Indexing索引:此阶段涉及预处理外部数据源,并将表示数据的嵌入存储在向量存储器中,以便可以轻松检索。
  • Retrieval检索:此阶段涉及根据用户的查询检索存储在向量存储器中的相关嵌入和数据。
  • Generation生成:这个阶段涉及将原始提示与检索到的相关文档合成为一个最终提示,发送给模型进行预测。

![[Pasted image 20250911160251.png|537x315]]

检索示意图:
![[Pasted image 20250911160403.png|548x576]]
一旦我们根据用户的查询检索了相关文档,最后一步就是将它们添加到原始提示中作为上下文,然后调用模型生成最终输出:
![[Pasted image 20250911160630.png]]

对应的代码:

from langchain_openai import ChatOpenAI 
from langchain_core.prompts 
import ChatPromptTemplate retriever = db.as_retriever() prompt = ChatPromptTemplate.from_template("""Answer the question based only on the following context: {context} Question: {question} """) llm = ChatOpenAI(model_name="gpt-3.5-turbo",temperature=0) chain = prompt | llm # fetch relevant documents 
docs = retriever.get_relevant_documents("""Who are the key figures in the ancient greek history of philosophy?""") # run 
chain.invoke({"context": docs,"question": """Who are the key figures in the ancient greek history of philosophy?"""})

策略总结

然而,多个用户使用的生产就绪的 AI 应用程序需要更高级的 RAG 系统。为了构建一个强大的 RAG 系统,我们需要有效地回答以下问题:

  • 我们如何处理用户输入质量的变化?
  • 我们如何将查询路由到从各种数据源检索相关数据?
  • 我们如何将自然语言转换为目标数据源的查询语言?
  • 我们如何优化我们的索引过程,即嵌入、文本分割?

策略总结如图所示:
在这里插入图片描述

1. Query transformations(查询转换)

在用户提出问题后,第一步是对查询进行加工和优化。

  • 目的:确保问题更容易匹配数据库或向量库中的内容。

  • 方法:可以对问题进行重写、扩展或修改。例如:

    • 同义词替换(“老师”→“教师”)

    • 扩展问题(“柏拉图的思想”→“柏拉图在哲学、政治学方面的思想”)

    • 改写问题使其更正式或更具体。

  • 价值:提高检索相关性的同时减少用户模糊提问带来的歧义。

2. Routing(路由选择)

经过转换的问题可能要去不同的数据源中寻找答案。

  • 机制:系统会判断问题更适合在哪个数据源里检索,比如:

    • 问题涉及结构化数据 → 路由到关系型数据库或图数据库。

    • 问题涉及非结构化文本 → 路由到向量数据库。

  • 智能化:通常会通过分类器、规则或模型来自动决定路由。

  • 价值:避免无效搜索,减少延迟,提升检索精准度。

3. Query construction(查询构建)

一旦路由确定,就要把自然语言问题转化为具体的检索指令。

  • 针对关系/图数据库:转化为 SQL 或 Cypher 查询,直接操作结构化数据。

  • 针对向量数据库:转化为检索条件(如基于向量相似度 + 元数据过滤)。

  • 挑战:需要保证自然语言到数据库语法的映射准确,否则会导致“查询偏差”。

  • 价值:让 LLM 能够有效利用不同类型的数据存储。

4. Multimodal/semistructured index(多模态/半结构化索引)

不仅仅是文本,文档可能包含图片、表格或其他格式。

  • 操作

    • 先对文档进行优化预处理(如分段、清洗)。

    • 构建向量索引,支持多模态(文字 + 图像 + 表格)。

  • 目标:让系统能够处理和检索复杂的数据类型,而不仅仅是纯文本。

  • 价值:扩展 RAG 的能力,使得它能回答涉及图表或图片内容的问题。

5. Postprocessing(后处理)

当从多个数据源拿到候选文档后,需要做结果整合。

  • 操作

    • 合并:把来自不同数据库的内容组合在一起。

    • 排序:根据相关性或置信度重新排名。

    • 过滤:去掉冗余或噪声文档。

  • 价值:提升检索结果的质量,减少无关信息传递给大模型,从而提高最终回答的准确性与简洁度。

总结
这五个环节构成了一个完整的 RAG 优化闭环

  • 输入端(用户问题)要被智能转化与路由;

  • 中间端(数据库查询与索引构建)要精准高效;

  • 输出端(后处理)要干净有序。

http://www.dtcms.com/a/562382.html

相关文章:

  • PsTools 学习笔记(7.10):PsFile——远程“谁在占用这个文件/共享”的取证与解占用
  • 怎样查找网站域名归属地推是什么意思
  • 做网站需要什么软件教程西安做网站公司8
  • 电商网站平台哪个网站做ppt好
  • 代码笔记:Dark Experience for General Continual Learning a Strong, Simple Baseline
  • 简约网站建设公司郑州网站建设智巢
  • 网站建设张景鹏做广告推广哪家好
  • windows安装oracle19c
  • 辉县市工程建设网站建设做一款微信小程序多少钱
  • Java 学习35:Random 类
  • 如何找外贸网站建设公司医院网站建设模板下载
  • 数据结构---平衡二叉树的实现
  • 网站维护描述wordpress虚拟币插件
  • 哈什么网一个网站做ppt搭建网站的空间哪里买
  • 做网站美工需要会什么软件怎么看一个网站什么程序做的
  • 局域网内部如何做网站中企动力大连公司咋样
  • 网站建设制作做网站优化推广公司net网站建设教程
  • [yolov11改进系列]基于yolov11使用fasternet_t0替换backbone用于轻量化网络的python源码+训练源码
  • 【具身智能】ChatVLA 系列:让 VLA 同时具备「多模态理解对话」与「动作执行」能力
  • 手机网站源码东莞常平房价2023最新楼盘消息
  • 网站产品的详情页怎么做wordpress密码原理
  • 制作自己的网站需要什么软件好软件开发有哪些岗位
  • 自己怎么做新闻开头视频网站自己建设网站的费用
  • 【代码审计】OFCMS-V1.1.2 三处安全问题分析
  • 外贸网站如何建站wordpress检查全站链接
  • Java基础——常用API5
  • 网站开发的进度安排电子商务网站开发目的和意义
  • 网站建设和赚钱方法网站后台编辑框无法显示
  • 什么网站可以找人做系统网站建设工作描述
  • 【大模型实战笔记 5】基于Streamlit的多模态AI聊天机器人应用开发实战