检索增强创新
- 多模态检索融合:RAG技术不再局限于传统的文本检索,而是将文本与图像、音频、视频等多模态数据相结合进行检索。例如腾讯2025年推出的多模态RAG技术,在处理复杂问题时,能同时理解和利用多种模态的信息,为用户提供额外的上下文和细节,使生成的回答更加丰富和准确。
- 深度检索策略优化:采用更先进的检索算法,如DeepRAG利用马尔可夫决策过程(MDP)建模检索过程,使系统能够动态决定何时检索外部知识、何时依赖模型自身推理,提升了检索的策略性和效率。此外,像Modular RAG采用混合检索策略,结合稀疏检索与密集检索的优势,针对不同类型查询优化检索效果。
知识组织与利用创新
- 知识图谱构建与利用深化:Fast GraphRAG作为GraphRAG的开源实现,将数据抽取后构建成知识图谱,让LLM能够像阅读地图一样理解和检索数据,提升了检索的深度和细致程度,并引入PageRank算法帮助系统更快速地找出知识图谱中最相关的信息。此外,KAG框架通过LLM友好的知识表示、知识图谱与文本块互索引等创新,将知识组织成层次结构,建立双向索引系统,显著提升了系统在多跳推理和复杂逻辑处理中的表现。
- 长上下文窗口技术发展:尽管长上下文窗口引发了一些争议,但在2025年相关技术得到了进一步发展和优化,更好地解决了大模型在处理长文本时的上下文理解和连贯性问题,为RAG技术在处理复杂的长文本任务时提供了更有力的支持。
架构与训练方法创新
- 自我反思型RAG:引入“自我反思”机制,采用检索器、评审器和生成器三个模型协同工作的“三位一体”架构,生成“反思token”,让语言模型在推理阶段根据不同任务要求调整行为。通过反馈循环不断强化自己的检索决策,提高整体性能,尤其适合处理开放领域问题或复杂推理任务。
- 多Agent协作的Agentic RAG:在这种架构下,多个Agent共同参与检索和生成过程。每个Agent负责不同的任务或知识领域,在检索和生成阶段相互协作、共享信息,从而提高整个系统的性能和鲁棒性。
- 轻量化与高效训练方法:出现了如基于张量的重排序等技术,随着更多相关模型的就绪,其在多模态RAG等场景中的应用将更加广泛,有助于提高RAG系统的检索效率和性能表现,同时降低计算资源消耗。
应用场景拓展创新
- 垂直领域深耕:RAG技术在医疗、法律、金融等垂直领域的应用不断深化。例如在医疗领域,RAG可以结合医学知识库和患者的病历等信息,为医生提供更准确的诊断建议和治疗方案;在法律领域,协助律师快速检索相关法律法规和案例,提高法律文书的撰写质量和效率。
- 动态知识管理:能够更好地应对动态变化的知识和数据,实时更新和调整知识库中的信息,使模型生成的回答始终基于最新的知识,对于需要及时准确信息的场景,如新闻报道、舆情分析等具有重要意义。