大语言模型 14 - Manus 超强智能体 开源版本 OpenManus 上手指南
写在前面
Manus 是由中国初创公司 Monica.im 于 2025 年 3 月推出的全球首款通用型 AI 智能体(AI Agent),旨在实现“知行合一”,即不仅具备强大的语言理解和推理能力,还能自主执行复杂任务,直接交付完整成果。
什么是 Manus?
“Manus”一词源自拉丁语“Mens et Manus”,意为“心智与双手”,强调其不仅能思考,还能动手执行。与传统 AI 助手(如 ChatGPT)主要提供建议或回答问题不同,Manus 能够独立完成从任务规划到执行的全过程。例如,用户只需输入一句话,Manus 就能自动完成数据分析、代码编写、文档生成等任务,真正实现从想法到成果的闭环。
Manus AI
https://manus.im/
这里放几个用户的案例:
● https://manus.im/share/jr5CKBMJJZDxvU2S5VdZLw?replay=1
● https://manus.im/share/c3onakN6Iajcm1Vt1xAVG7?replay=1
● https://manus.im/share/xFgpHb15vKqfRPWIs3JJPJ?replay=1
应用场景
- 数据分析与可视化:处理上传的数据,生成图表、趋势分析或仪表盘。
- 市场调研:搜索网络信息,整合数据并输出结构化分析结果。
- 旅行规划:根据用户偏好生成详细行程和旅行手册。
- 代码编写与运行:生成代码并测试,提供可执行程序或脚本。
- 文件操作与整理:解压文件、对比文档并生成比较表格。
- 网页生成:根据需求设计并输出展示型网页。
- 多任务并行处理:支持同时处理多个任务,提升工作效率。
GAIA 基准
Manus 采用多智能体(Multiple Agent)架构,包含规划代理、执行代理和验证代理等模块,协同工作以提升任务处理效率。每个代理可能基于独立的语言模型或强化学习模型,彼此通过 API 或消息队列通信。此外,Manus 支持异步任务处理,用户在提交任务后无需持续监督,系统会在任务完成后通知用户。
GAIA 是一个用于评测通用AI助手的基准测试,衡量它们在不同难度等级(Level1、Level2、Level3)的表现。
- 图片来源:https://manus.im/
- GAIA:https://openreview.net/forum?id=fibxvahvs3
Agent
目前问题
如下图所示,解决问题的泛化能力方面,当前主要的Agent产品仍然距离通用的Agent有一定的差距:
● 任务规划方面:目前主要是基于成熟的任务流程进行复现,或基于训练数据对任务进行简单拆分
● 工具使用方面:Agent目前主要按照人类部署进行流程化操作,工具主要是通过API来进行(通过Function Calling 或 其他方式)
多Agent协同
主要是企业协同,从Agent落地方式看,可以分为:
● 单 Agent 部署
● 多 Agent 交互
● 人-Agent 交互
其中,多Agent交互 与 人-Agent交互 协同通过不同的方式给 Agent 反馈,有助于 Agent 不断强化解决问题的能力。更进一步的模拟Agent社会框架中,在个人层面Agent表现出计划、推理和反思等内在行为,以及涉及认知、情感和性格在内的个性特征。
AGENT AI: SURVEYING THE HORIZONS OF MULTIMODAL INTERACTION
论文地址:https://arxiv.org/abs/2401.03568
OpenManus
基本介绍
OpenManus 是一个开源的通用型 AI 智能体项目,旨在复刻并优化 Manus 的核心能力,为开发者和研究者提供无需邀请码、本地部署的智能体解决方案。该项目由 MetaGPT 团队开发,采用模块化设计,支持多种语言模型和工具链,能够执行代码、处理文件、搜索网络信息等复杂任务。
核心功能与架构
OpenManus 的架构包括多个协同工作的智能代理(Agents),如:
- 主代理(Manus 主体):协调各子代理的工作流程。
- 规划代理(PlanningAgent):将复杂任务拆解为可执行的子任务。
- 工具调用代理(ToolCallAgent):负责调用外部工具,如搜索引擎、代码执行器等。
项目地址
项目组:“Manus 非常棒,但 OpenManus 无需邀请码即可实现任何创意 🛫!”
所以有了这个开源项目:
● https://github.com/mannaandpoem/OpenManus
● https://openmanus.github.io/
准备环境
克隆项目
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
(注意官方要求的 Python 版本是 3.11 及以上)
虚拟环境
创建虚拟环境,防止干扰环境:
python3 -m venv env
source env/bin/activate
安装依赖
安装项目的依赖:
pip install -r requirements.txt
有些包安装不上,要注意观察:
额外补充一下 playwright,这个框架是用来启动浏览器的:
# 如果没有 playwright 的话,需要先 pip install playwright
playwright install
安装需要等待比较长的时间:
配置文件
cp config/config.example.toml config/config.toml
默认配置如下:
修改我们的配置如下,需要注意配置 [llm] 和 [llm.vision] 的部分。
启动程序
# 对话式的
python main.py
# 官方提供的新方式(但不稳定)
python run_flow.py
启动结果如下: