当前位置: 首页 > news >正文

RAGFLOW~Enable RAPTOR

Enable RAPTOR

        一种递归抽象方法,用于长上下文知识检索和摘要,在广泛语义理解和细微细节之间取得平衡。

        RAPTOR(递归抽象处理用于树状组织检索)是一种在2024年论文中引入的增强文档预处理技术。它旨在解决多跳问答问题,通过递归聚类和对文档片段进行摘要化来构建层次树结构。这使得在长文档中的上下文感知检索更加有效。RAGFlow v0.6.0在数据提取和索引之间的数据预处理管道中集成了RAPTOR用于文档聚类,如下图所示。

        我们使用这种新方法进行的测试在需要复杂多步骤推理的问题回答任务中展示了最先进的(SOTA)结果。通过结合RAPTOR检索与我们内置的分块方法和其他检索增强生成(RAG)方法,您可以进一步提高问题回答的准确性。

        警告:启用RAPER需要大量的内存、计算资源和tokens。

Basic principles

        在原始文档被分割成块之后,这些块根据语义相似性进行聚类,而不是按照它们在文本中的原始顺序。然后,通过系统的默认聊天模型将这些簇总结为更高层次的块。这个过程递归地应用,形成一个从下到上具有不同层次摘要的树结构。如图所示,初始块形成叶节点(显示为蓝色),并递归地总结为根节点(显示为橙色)。

        

        递归聚类和总结能够捕捉到广泛的理解(由根节点实现)以及多跳问答所需的细微细节(由叶节点实现)。

Scenarios

        对于涉及复杂多步骤推理的多跳问答任务,问题和答案之间通常存在语义差距。因此,使用问题进行搜索往往无法检索到有助于正确答案的相关片段。RAPTOR通过为聊天模型提供更丰富、更具上下文关联性和相关性的片段来解决这一挑战,使其能够全面理解而不丢失细节。

        知识图谱也可以用于多跳问答任务。详见构建知识图谱的详细信息。你可以使用任一方法或两者结合,但要确保理解涉及的内存、计算和标记成本。

Prerequisites

        系统的默认聊天模型用于总结聚类内容。在继续之前,请确保已正确配置聊天模型。

Configurations​

        RAPTOR功能默认是禁用的。要启用它,请手动在知识库的配置页面上打开“使用RAPTOR增强检索”开关。

Prompt

        以下提示将递归应用于聚类摘要,{cluster_content}作为内部参数。我们建议您现在保持不变。设计将在适当时候更新。

Please summarize the following paragraphs... Paragraphs as following:{cluster_content}
The above is the content you need to summarize.

​Max token​

        每个生成摘要块的最大标记数。默认为256,最大限制为2048。

Threshold

        在RAPTOR中,块根据其语义相似性进行聚类。阈值参数设置块被分组在一起所需的最小相似度。默认值为0.1,最大限制为1。较高的阈值意味着每个簇中的块较少,较低的阈值则意味着更多。

Max cluster

        创建的最大聚类数量。默认为64,最大限制为1024。

Random seed

        一个随机种子。点击+以更改种子值。

相关资料:

      1、 Enable RAPTOR | RAGFlow

      2、  https://huggingface.co/papers/2401.18059

http://www.dtcms.com/a/309244.html

相关文章:

  • 【云计算】云主机的亲和性策略(二):集群节点组
  • [ java 网络 ] TPC与UDP协议
  • 微波(Microwave)与毫米波(Millimeter wave)简介
  • 动态域名解析(DDNS)到底有什么用?
  • OSPF综合大实验
  • 下次接好运~
  • Oracle EBS 缺少adcfgclone.pl文件
  • 一分钟了解IO-Link 系列集线器
  • LaTeX 复杂图形绘制教程:从基础到进阶
  • Deep Height Decoupling for Precise Vision-based 3D Occupancy Prediction
  • 数据结构前篇 - 深入解析数据结构之复杂度
  • Leetcode——53. 最大子数组和
  • 如何将消息转移到新 iPhone
  • 如何将联系人从三星手机转移到 iPhone
  • MySQL 高并发下如何保证事务提交的绝对顺序?
  • 转换图(State Transition Diagram)和时序图(Sequence Diagram)画图流程图工具
  • 新手向:国内外大模型体验与评测
  • 智能图书馆管理系统开发实战系列(四):后端C++ DLL开发与模块化设计
  • 一种新的分布式ID生成方案--ULID
  • ABP VNext + Dapr Workflows:轻量级分布式工作流
  • (AC)唐克的新游戏
  • Vue3中Markdown解析与渲染的完整解决方案:从安全到性能优化
  • PostgreSQL 中删除指定数据库下的所有表结构
  • 微服务的编程测评系统9-竞赛新增-竞赛编辑
  • 如何保护 Redis 实例的安全?
  • 快速排序算法详解与洛谷例题实战
  • 【PHP 构造函数与析构函数:从基础到高级的完整指南】
  • 直播平台中的美白滤镜实现:美颜SDK的核心架构与性能优化指南
  • Qt结合ffmpeg实现图片参数调节/明亮度对比度饱和度设置/滤镜的使用
  • Windows编译安装ffmpeg和sdl