REFLECTOOL: Towards Reflection-Aware Tool-Augmented Clinical Agents
问题
- 和reflection有关系吗?是他的改进吗?
REFLECTOOL:迈向具备反思能力的工具增强型临床智能体
摘要
大型语言模型(LLMs)在医疗领域展现出巨大潜力,能够协助生成临床记录和患者沟通等任务。然而,目前的LLMs仅限于文本交互,限制了其在临床环境中处理多样化信息形式的能力。尽管已有临床智能体在特定信号交互方面取得成功,但它们通常针对单一临床场景,难以适用于更广泛的应用。为全面评估临床智能体的能力,我们提出了== ClinicalAgent Bench(CAB),一个涵盖五大临床关键维度的综合性医疗智能体评估基准,共包含18项任务。在此基础上,我们引入了 REFLECTOOL,一个新颖的框架,擅长在两个阶段中利用领域特定工具。第一阶段为优化阶段==,通过保存预定义训练集中成功解决问题的过程和工具使用经验,逐步扩展长期记忆。在随后的推理阶段,REFLECTOOL 可从已建立的长期记忆中检索支持性的成功案例,以指导工具选择策略,并通过两种验证方法——迭代优化和候选选择——根据工具使用经验提升工具使用效果。在CAB上的大量实验表明,REFLECTOOL 相比纯LLMs提升了超过10分,相比已有智能体方法提升了3分,展现了其在解决复杂临床任务中的适应性和有效性。我们的代码和数据集已开源:https://github.com/BlueZeros/ReflecTool。
作者团队:
Yusheng Liao(上海交通大学)
Shuyang Jiang(复旦大学)
Yanfeng Wang(上海交通大学)
Yu Wang(上海交通大学,通讯作者)
发表信息:
会议:第63届计算语言学协会年会(ACL 2025)
时间:2025年7月27日至8月1日
论文页码:13507–13531
出版方:Association for Computational Linguistics
