当前位置: 首页 > news >正文

Mass框架

在多智能体系统(MAS:multi-agent systems)中,设计有效的提示和拓扑结构面临挑战,因为单个智能体可能对提示敏感,且手动设计拓扑结构需要大量实验。

论文地址:https://arxiv.org/pdf/2502.02533

论文名称:Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

为了自动化整个设计过程,Google & 剑桥大学首先对设计空间进行了深入分析,旨在了解构建有效MAS的因素。发现:提示设计对下游性能有显著影响,而有效的拓扑结构只占整个搜索空间的一小部分。

核心问题:
让多个AI(智能体)合作干活(比如一起解决数学题、分析复杂问题)通常比单个AI更厉害。但怎么设计它们合作的方式(工作流拓扑,比如谁先发言、谁汇总信息)和给每个AI的指令(提示词Prompt)是个大难题!手动试来试去效率低,效果还不好。

研究发现了什么?

  1. 提示词是“命门”: 研究发现,给单个AI的提示词写得好不好,对最终团队的表现影响巨大。指令写得好,AI就更能理解任务和有效合作。
  2. 拓扑结构要“精炼”: 虽然合作方式(拓扑结构)也重要,但研究惊讶地发现,真正管用的合作方式其实只占所有可能方式的一小部分。很多花里胡哨的结构可能没啥用甚至拖后腿(看图:有些优化过的拓扑结构还不如基础智能体单独干活呢)。
  3. 计算资源要用在“刀刃上”: 给单个AI优化好提示词,然后让多个这样的AI合作(投入更多计算资源/标记数),比单纯用更多资源堆砌但提示词没优化过的AI合作,效果提升明显得多(看图:优化提示后的Agent准确率随资源投入增长更快)。
  4. 优化要“从局部到全局”: 优化整个多智能体系统不能一锅烩。应该先单独优化每个AI的提示词(块级提示优化),再找最适合它们合作的流程(拓扑优化),最后再整体微调一下整个系统的提示词(全局提示优化)。这样一步一步来效果最好。

解决方案:Mass框架

为了解决这个设计难题,研究者提出了 Mass框架(名字来源于 Multi-Agent System Search),它就像一个自动化多智能体团队设计师,分三步走:

  1. 精兵强将(块级提示优化): 针对任务,Mass会自动给团队里的每一个AI成员(智能体) 优化它的专属指令(提示词)。确保每个成员都是精兵强将。
  2. 排兵布阵(工作流拓扑优化): Mass在筛选过的高效合作方式库里(基于前面的发现,剔除了大部分无效结构),自动找出最适合这群精兵强将的合作流程(拓扑结构)。比如谁先发言,谁来汇总意见,谁来执行。
  3. 团队协同(全局提示优化): 找到最优阵型后,Mass再对整个团队进行整体协调优化,微调提示词让团队配合更默契。

Mass框架牛在哪?

  • 效果拔群: Mass设计出来的多AI团队,在多个任务(数学题、编码等)上吊打之前各种流行方法(比如CoT, Self-Refine, 多Agent辩论等),平均性能提升超过10%
  • 优化路线正确: 分三步(先单个优化成员,再定合作方式,最后整体优化)被证明是最优路径,每个阶段都能带来提升。
  • 双管齐下: Mass同时优化提示词和拓扑结构,效果比只优化其中一样要好。
  • 省钱高效: Mass在优化过程中表现稳定,用更少的尝试次数(样本效率高)就能找到好的设计,省时省钱

  1. 想让多个AI合作好,给每个AI的指令(提示词)最关键。
  2. 让它们合作的流程(拓扑)不需要太复杂,简洁高效最重要。
  3. Mass框架是一个强大的自动化工具,它能通过三步优化法(精兵 -> 布阵 -> 协同),自动设计出提示词写得好 + 合作流程排得好的超级AI团队,效果碾压以前的方法,还更省钱。

Google和剑桥大学找到了让多个AI高效协作的秘诀(提示词是关键),发明了一个自动化工具(Mass)来帮你设计出最强AI团队!

http://www.dtcms.com/a/251851.html

相关文章:

  • 面试题SpringCloud
  • GitHub又打不开了怎么办?git pull push失败怎么办?
  • Git开发流程
  • 自动驾驶系统研发系列—激光雷达干扰实战:自动驾驶安全的隐形陷阱
  • OpenHarmony 5.0 web组件输入法弹出导致闪现桌面或者多次操作卡主桌面现象
  • c++ 项目使用 prometheus + grafana 进行实时监控
  • 数据管道架构设计指南:5大模式与最佳实践
  • LG P4278 带插入区间K小值 Solution
  • Java的接口
  • 阿帕奇基金会软件授权与公司贡献者许可协议(中英双语版)
  • 基于CATIA轴系的最小边界曲面自动化生成技术深度解析
  • 力扣的SQL
  • 搭建基于 Prometheus、Grafana 和 Alertmanager 的监控告警系统
  • 「Linux文件及目录管理」文件内容的显示和处理类命令
  • 揭开MongoDB的神秘面纱:从陌生到初识
  • 如何修改PyCharm的界面颜色(超详细)
  • 手写简版React-router
  • 2025ICRA 最佳论文解读:麻省理工PolyTouch:一种多模态触觉传感器以及基于触觉扩散策略的接触丰富操作方法
  • 【学习笔记】深入理解Java虚拟机学习笔记——第9章 类加载及执行子系统的案例与实战
  • C语言进阶:深度解剖数据在内存中的存储(浮点型在内存中的存储)
  • Linux系统firewall-offline-cmd命令在企业网络安全防护中的应用案例分析
  • 2.RMII的时钟模式
  • Python训练营打卡 Day54
  • 【LangChain】5 评估
  • WebAssembly 2.0:超越浏览器的全栈计算革命
  • 修改Rocky Linux文件夹颜色
  • LLM对话框项目 EventSource封装和MessageServiceClass流式展示封装
  • Spring Boot的Security安全控制——应用SpringSecurity!
  • 关于脉冲功率技术的认识
  • 子集筛选(Select by Data Index)组件研究