当前位置: 首页 > news >正文

来看两篇RAG相关的优化工作:多跳查询的优化L-RAG以及利用记忆增强的查询重构MemQ框架

增强多跳文档检索的分层表示方法(Layer-wise Retrieval-Augmented Generation, L-RAG)

分层检索增强生成(L-RAG),旨在优化多跳文档检索,以解决现有检索增强生成(RAG)方法的局限性。标准RAG在处理复杂的多跳查询时表现不佳,并且由于迭代处理引入了显著的计算开销。L-RAG通过利用大语言模型(LLMs)的中间表示来提升检索效率,这些中间层的表示通常包含比最终层输出更细致的信息,从而使得有效的外部知识检索成为可能,而无需生成复杂的内部查询。在这里插入图片描述

主要贡献

1. 信息处理模式分析:SVD分析在这里插入图片描述

通过奇异值分解(SVD)分析权重矩阵,揭示LLMs中的三阶段信息处理模式,过程包括提取、处理和后续提取,从而验证中间层表示的信息含量更为丰富的信息。具体步骤如下:

  • 1.权重矩阵分解
    使用SVD将LLM的权重矩阵 W v W_{v} Wv 分解为三个矩阵 U U U Σ \Sigma Σ V V V,其中 Σ \Sigma Σ 是对角矩阵,包含奇异值 σ \sigma σ U U U V V V 是正交矩阵。
  • 2.变换方向
    定义变换方向 Direction ⁡ ( W v ) = [ u 1 v 1 T , … , u r v r T ] \operatorname{Direction}\left(W_{v}\right)=\left[u_{1} v_{1}^{T},\ldots, u_{r} v_{r}^{T}\right] Direction(Wv)=[u1v1T,

相关文章:

  • 大语言模型打卡学习DAY1
  • 【数据结构C语言】一、基本概念
  • java-正则表达式
  • 【Hadoop】Hadoop是什么?
  • 简单易懂Modbus Tcp和Rtu的异同点
  • AI重构私域增长:从流量收割到终身价值运营的三阶跃迁
  • UI自动化:poium测试库
  • 网络安全系统集成
  • 从Swish到SwiGLU:激活函数的进化与革命,qwen2.5应用的激活函数
  • pythonSTL---os
  • Spring Boot 启动失败:Failed to start bean ‘documentationPluginsBootstrapper’ 解决方案
  • 在 Linux 中,lsblk 命令输出内容解释
  • Linux网络编程——TCP网络通信多线程处理
  • 大白话JavaScript详细描述基于原型链实现对象继承的步骤,分析其在共享属性、内存占用等方面的优缺点
  • OpenHands:OpenDevin的升级版,由人工智能驱动的软件开发代理平台
  • stm32第四天控制蜂鸣器
  • mmdet3d.models.utils的clip_sigmoid理解
  • 【实战ES】实战 Elasticsearch:快速上手与深度实践-8.1.1基于ES的语义搜索(BERT嵌入向量)
  • Chainlit 实现SSO单点登录CAS授权完整代码图文教程
  • Python:被装饰的函数,多个装饰器的装饰过程
  • 司法部:民营经济促进法明确禁止违规异地执法、利用行政或者刑事手段违法干预经济纠纷
  • 上任后首访,德国总理与法国总统举行会晤
  • 现场|万里云端,遇见上博
  • 动物只有在被认为对人类有用时,它们的建筑才会被特别设计
  • 前瞻|中俄元首今年将首次面对面会晤,专家:国际变局中构建更坚韧的合作架构
  • 习近平致电祝贺默茨当选德国联邦总理