当前位置: 首页 > wzjs >正文

做网站需求文档怎么创网站赚钱

做网站需求文档,怎么创网站赚钱,window2003iis建好的网站,江西省城乡建设培训网站官方网站如何在多个语料库(多源异构知识库,如:文本、图片、视频)中检索和整合来自不同模态和粒度的知识?UniversalRAG:一种新的RAG框架,用于从多个模态和粒度的语料库中检索和整合知识。下面来看看思路&…

如何在多个语料库(多源异构知识库,如:文本、图片、视频)中检索和整合来自不同模态和粒度的知识?UniversalRAG:一种新的RAG框架,用于从多个模态和粒度的语料库中检索和整合知识。下面来看看思路,供参考。

方法

 (A) 单一模态的 RAG 仅检索一种模态的数据。(B) 单一语料库的 RAG 专注于检索数据模态,而忽略语义。(C) UniversalRAG使用路由器和多个语料库有效地支持多样化的查询,涵盖不同的模态和粒度。

从上图可以看到,UniversalRAG的核心思想是通过动态识别和路由查询到最合适的模态和粒度知识源来进行检索

  1. 模态感知检索(Modality-Aware Retrieval):

    • 多模态语料库:UniversalRAG维护三个独立的嵌入空间,分别对应文本、图像和视频模态。每个模态的语料库被组织成不同的子语料库,如:文本语料库分为段落级和文档级,视频语料库分为完整视频和视频片段。

    • 路由模块(Router):引入一个路由模块,Router,动态选择每个查询的最合适模态。给定一个查询q,Router预测查询相关的模态r,并从相应的模态特定语料库中选择相关项c。

  2. 粒度感知检索(Granularity-Aware Retrieval):

    • 多粒度支持:为了灵活适应不同查询的信息需求,UniversalRAG在每个模态内进一步划分为多个粒度级别。例如,文本语料库分为段落级和文档级,视频语料库分为视频片段和完整视频。

    • 路由决策:路由决策r分为六类:无检索(None)、段落(Paragraph)、文档(Document)、图像(Image)、片段(Clip)、视频(Video)。检索过程根据路由决策r进行,具体公式如下:

路由模块设计:

一、无训练的路由

无训练的路由利用预训练的LLM的内在知识和推理能力来分类查询。步骤如下:

  1. 提示设计:给定一个查询q,LLM会被提供一个详细的指令描述路由任务,并附带几个上下文示例。
  2. 预测路由类型:LLM根据提示和示例预测查询最合适的检索类型,从六个预定义的选项中选择。

小结:这种方法的优势在于不需要额外的训练数据,利用了LLM的强大泛化能力。然而,其性能可能受限于LLM的预训练知识和推理能力。

二、训练路由

为了提高路由的准确性,UniversalRAG还探索了训练路由模块的方法。训练路由模块面临的主要挑战是缺乏查询标签对(ground-truth query-label pairs)来进行最优语料库选择的监督。为此,文章采用了一种间接的方法来构建训练数据集:

  1. 利用基准测试的归纳偏差:假设每个基准测试主要与特定的模态和检索粒度相关联。例如,文本问答基准测试中的查询可能主要需要段落级别的信息,而多跳问答基准测试可能需要文档级别的信息。
  2. 标签分配:
    • 对于文本问答基准测试,查询被标记为’None’(如果查询可以仅通过模型的参数知识回答)、‘Paragraph’(单跳RAG基准测试)或’Document’(多跳RAG基准测试)。

    • 对于图像基准测试,查询被标记为’Image’。

    • 对于视频问答基准测试,查询被标记为’Clip’(如果查询关注视频中的局部事件或特定时刻)或’Video’(如果查询需要理解整个视频的故事情节或更广泛的上下文)。

不同路由器模型大小的路由器准确率

性能效果

在八个多模态数据集上比较 UniversalRAG 模型与基线的总体结果。UniversalRAG(我们的模型)以彩色单元格表示,包含针对 DistilBERT 和 T5-Large 训练的路由器模型,以及基于 GPT-4o 的免训练路由器方法。通过自适应地为每个查询选择最佳检索模态,UniversalRAG 的性能与 Oracle 检索选择的性能相当,并且平均而言优于所有基线。

检索粒度对两个基准测试的性能影响:HotpotQA(需要对文档进行多跳推理)和 LVBench(其查询通常可用短视频片段进行回答)。具有粒度的 UniversalRAG 始终优于无粒度的模型,这突显了结合不同粒度级别可以增强 UniversalRAG 自适应处理各种用户问题的能力。

参考:UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities,https://arxiv.org/pdf/2504.20734


文章转载自:

http://O0mPfAzk.mkczm.cn
http://YjzU68Jt.mkczm.cn
http://mEqH2Lwq.mkczm.cn
http://OGwp7soP.mkczm.cn
http://HXOTJ28N.mkczm.cn
http://Jh2w7BB3.mkczm.cn
http://8n9K3LNV.mkczm.cn
http://shsi05RG.mkczm.cn
http://jnScDA47.mkczm.cn
http://RuQTMBJC.mkczm.cn
http://N9PdGrls.mkczm.cn
http://g1arsCqh.mkczm.cn
http://oeKK8T5k.mkczm.cn
http://5qBaELbK.mkczm.cn
http://GboxsxJM.mkczm.cn
http://foPdTOtd.mkczm.cn
http://AZUTL7tI.mkczm.cn
http://5VU7MD71.mkczm.cn
http://10I54bci.mkczm.cn
http://KxV8uBf7.mkczm.cn
http://6mWvI3Jd.mkczm.cn
http://U8hIh3Gz.mkczm.cn
http://4SiIIFmQ.mkczm.cn
http://VXoOcDGC.mkczm.cn
http://bGKx48FP.mkczm.cn
http://VdGdxGc0.mkczm.cn
http://Ong3PCEW.mkczm.cn
http://qfl7kInV.mkczm.cn
http://bhaLl6pS.mkczm.cn
http://SP5JE2WG.mkczm.cn
http://www.dtcms.com/wzjs/693514.html

相关文章:

  • 网站打开速度优化视频网站建设报价单
  • 关于建设公司网站的请示wordpress建手机网站
  • 昆明网站制作的方法湘潭今天刚刚发生的新闻
  • 网站只做wordpress文章列表分页代码
  • 网站设计设dedecms安装教程
  • 公司网站建设视频教程做微信视频的网站
  • 手机的网站有哪些瑞诺国际做外贸网站好吗
  • 校园网站建设开题报告网站不能正常显示出现后台代码
  • 外贸网站seo搜索引擎快速优化排名
  • 创建手机网站模版深圳网站开发学习
  • 互动网站建设多少钱重庆网站建设设计
  • 用wix做外贸网站极速微网站建设cms
  • 企业做网站设置哪些模块手工制作大全废物利用
  • 江门做网站软件网站策划 要求
  • 域名弄好了网站怎么建设品牌设计
  • 用dw做的网站容易变形长沙专业网站建设服务
  • 南京广告公司排名前十如何做好seo优化
  • 网页设计网站含义免登录直接玩的游戏
  • 网站推广的方式和方法兴义网站seo
  • 网站建设论文答辩小蚁人网站建设
  • 中学生做的网站有哪些wordpress 导航设置
  • 福田庆三眼睛案例图片seo排名优化推广
  • 盐城网站建设流程主题猫仿虎嗅wordpress
  • 驻马店网站建设公司有人免费有片视频吗
  • 制作网站报价单有关网页设计与网站建设的文章
  • 贵阳网站建设 网站制作wordpress调用当前分类名称
  • WordPress的IP统计插件做竞价的网站可以做优化吗
  • 酒店网站建设背景分析做网站的程序员
  • 用服务器做网站空间wordpress 小工具定制
  • api模式网站开发怀化 优化生育政策