当前位置: 首页 > news >正文

RAG->大模型搜索search-R1

search-r1:让大模型学会自己使用搜索引擎
ConvSearch-R1: 让LLM适应检索器的偏好或缺陷

1 search-R1

Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning
代码地址

作者背景
UIUC伊利诺伊大学香槟分校,计算机科学系
马萨诸塞大学阿默斯特分校,智能信息检索中心

在这里插入图片描述

【知乎论文解读】Search-R1:强化学习如何教会 LLM 自主搜索?

二 convsearch-R1

ConvSearch-R1: Enhancing Query Reformulation for Conversational Search with Reasoning via Reinforcement Learning
代码地址

作者背景
复旦大学,字节跳动,新南威尔士大学

动机
在对话式检索场景中,用户输入的query可能存在歧义、遗漏、共指、错别字等问题,导致系统无法准确捕捉用户意图;query重写(Conversational Query Reformulation, CQR)是一种常用解决方案,核心思想是将带上下文的用户query重写为自包含(能独立表达完整查询意图的文本)形式,再去调用检索器处理。重写后的query显式包含上下文中隐含的信息,并且在实现过程中可以充分复用现有成熟的检索技术

与之前介绍的Search-R1相比,此工作的差异在于:
Search-R1是更通用的推理+搜索模型,未考虑搜索工具的业务特性;而ConvSearch-R1专注于query重写这一话题,更适合检索器不完美的真实业务场景
Search-R1仅以搜索结果与ground truth是否匹配为优化目标;而ConvSearch-R1则基于检索结果排序位置设计奖励,奖励信号更稠密、学习更高效

相关文章:

  • Java中高并发线程池的相关面试题详解
  • AE之番外篇
  • 模型上下文协议(MCP)实践指南
  • 深入解析默认值工具类:DefaultUtil
  • TF-IDF算法详解与实践总结
  • 上海市计算机学会竞赛平台第六届上海市青少年算法竞赛网络赛(青年组)平方的和
  • Vue2 第一节_Vue2上手_插值表达式{{}}_访问数据和修改数据_Vue开发者工具
  • 【2025CVPR】花粉识别新标杆:HieraEdgeNet多尺度边缘增强框架详解
  • 【PhysUnits】17.6 Unit基础结构(unit.rs)
  • python模拟键盘 鼠标操作 通过ctypes调用Windows API实现底层输入模拟
  • Android Studio 问题:Android Studio 一直开在 Updating indexes
  • 使用Mvnd加速Maven构建速度
  • 深度学习核心概念:优化器、模型可解释性与欠拟合
  • TI以太网PHY收发器晶体选择和规格
  • OpenGL学习20250610
  • 定时器任务——若依源码分析
  • 376. Wiggle Subsequence
  • Windows cmd中文乱码解决方法(Windows控制台中文乱码、CMD乱码、控制台乱码、Command Prompt命令提示符cmd.exe乱码)
  • docker 安装运行mysql8.4.4
  • 多模态商品数据接口:融合图像、语音与文字的下一代商品详情体验
  • 南宁手机平台网站建设/网站怎么搭建
  • 移动互联网开发找工作/seo短视频网页入口引流
  • 做图的模板下载网站有哪些/百度seo搜索排名
  • 湖南专业做网站企业/seo在线优化网站
  • 做网站域名有什么用/百度关键词点击价格查询
  • 面对撞库 网站应该怎么做/定制化网站建设