当前位置: 首页 > news >正文

AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴

【本周AI新闻: AI Agent 时代开幕-Manus AI与OpenAI Agent SDK掀起新风暴】 https://www.bilibili.com/video/BV1bkQyYCEvQ/?share_source=copy_web&vd_source=32ed33e1165d68429b2e2eb4749f3f26

最近AI圈子里最火的话题非Manus莫属!这款由中国武汉创业公司“蝴蝶效应”推出的通用AI代理自上周发布以来,在全球范围内掀起了一阵热潮。不仅在国内备受瞩目,在国际科技圈也频频刷屏。连推特联合创始人杰克·多西(Jack Dorsey)和Hugging Face产品负责人维克多·穆斯塔尔(Victor Mustar)都对其赞不绝口,甚至有人称其为“第二个DeepSeek”——毕竟,这款AI的实力和它的“出身”都让人意想不到。

Manus到底是什么?

官方介绍称,Manus是全球首个真正意义上的“通用AI代理”。它并不像传统AI聊天机器人那样仅依赖单一大模型,而是集成了多个AI模型(包括Anthropic的Claude 3.5 Sonnet和阿里巴巴的开源Qwen的微调版本),并通过多个独立运行的代理协作完成各种任务。换句话说,它不仅会聊天,更具备主动执行复杂任务的能力。

当然,虽然热度空前,但能亲自体验到Manus的用户少之又少。当前,仅有不到1%的候补名单用户收到了邀请码,而Manus的Discord频道成员却已超过18.6万,足见市场期待值之高。

MIT科技评论的实测

MIT科技评论最近拿到了Manus的测试权限。整体体验下来,这款AI确实像一个超高效的智能实习生。它有时候会误解指令,甚至偶尔偷懒,但逻辑清晰、适应力强,而且给出详细反馈后会显著改进。虽然目前并不完美,但确实充满潜力。

Manus的界面设计简洁,默认语言为英语。登陆后,用户会看到一个类似ChatGPT或DeepSeek的主页,左侧显示历史对话记录,中间是聊天输入框。此外,官方还提供了一系列示例任务,如商业策略制定、交互式学习以及定制化音频冥想等。

一个独特的功能是**“Manus’s Computer”**窗口,允许用户实时查看Manus执行任务的过程,甚至在关键时刻介入调整,这点比大多数AI助手都更透明。

为了评测Manus的能力,测试员设置了三个任务:

  1. 列出知名的中国科技记者
  2. 搜寻纽约市两居室房源
  3. 推荐“35岁以下创新者”候选人
任务1:寻找中国科技记者

初版名单仅包含5个记者,外加5个“荣誉提名”。部分记者的代表作被标注,部分却没有。问Manus原因,得到的答案令人哭笑不得——“偷懒了。”
它直言自己在“优化研究效率”的过程中,部分信息没补充完整。在要求统一标准后,它迅速调整,最终给出了30名记者的详细列表,并附上了他们目前所在的媒体和代表作。值得一提的是,Manus的输出可以直接下载为Word或Excel文件,方便后续整理和分享。

不过,它在处理付费墙内容时遇到了障碍,许多新闻网站识别其为“可疑行为”并拒绝访问。如果未来版本能在遇到此类问题时主动请求用户协助,体验会更进一步。

任务2:搜寻纽约房源

Manus起初误解了“某种户外空间”的概念,直接筛掉了所有没有私人阳台或露台的房源。但经过调整,它最终生成了一个分层推荐列表,类似Wirecutter风格,包括“最佳整体选择”、“性价比最高”和“豪华选项”等类别。这项任务花了不到半小时,比整理记者名单快得多,可能是因为房地产数据更公开、结构化程度更高。

任务3:“35岁以下创新者”候选人

这个任务的难度最大。Manus需要研究往年榜单、制定搜索策略、筛选候选人,并确保多元化。然而,由于无法访问学术论文和部分新闻网站,研究进展受限。三小时后,它仅找到3个完整背景资料的候选人。最终,在强制要求下,它凑出了50个名字,但部分领域和机构过度集中,反映出研究仍有漏洞。在进一步补充“中国候选人”后,它确实找到了一些合适的人选,但不少是国内媒体常见的“明星创新者”。

最终评测

从实测来看,Manus确实是一个直观、适合无代码背景用户的AI工具。在某些任务上,它比ChatGPT DeepResearch表现更好,尤其擅长在开放网络上进行深入研究。但它的处理速度较慢,特别是涉及大范围搜索时,效率还有提升空间。

然而,它的稳定性仍需优化。测试过程中,Manus偶尔崩溃,甚至因服务器负载过高拒绝创建新任务。相比ChatGPT DeepResearch,它的任务失败率更高。Manus的首席科学家Peak Ji表示,团队正努力改善这一问题。而根据中国媒体36Kr的报道,每次任务的成本仅约2美元,远低于DeepResearch的20美元,成本优势明显。

Manus的一大亮点是透明且可定制的工作流程。它会主动询问问题,并在“知识”记忆中保留用户的重要指令,以便未来任务中使用。每个任务的操作步骤也可以回放和分享,提高了可控性和协作体验。

虽然Manus当前仍存在一些短板,但它已经展示了中国AI公司在通用智能代理上的独特创新能力,不再只是跟随西方步伐,而是在自主塑造AI技术的发展方向。未来,如果服务器架构得到优化,它有望成为白领、独立开发者和小型团队的新宠

相关文章:

  • 4.2 Reactive 对象的深度类型约束方案
  • 婚恋之红娘相亲小程序开发功能与设计详解
  • 福特售后再添亮点,为烈马模块化车身改装提供专业支持
  • Qt运行xxx.so can not open shared object file
  • MacOS 上使用终端彻底格式化 U 盘
  • 介绍HTTP协议基本结构与Linux中基本实现HTTPServer
  • 如何取消GitHub Copilot订阅付费?
  • 非零初始条件系统的传递函数分析
  • Kafka的零拷贝
  • 推荐系统基础
  • 【2025】基于python+django的驾校招生培训管理系统(源码、万字文档、图文修改、调试答疑)
  • linux 命令 tree
  • 神经网络:定义与核心原理
  • 【Python】08、元组
  • 工程化与框架系列(35)--前端微服务架构实践
  • 递归时间复杂度(master),时间复杂度为O(NlogN)的排序
  • 使用spring data MongoDB对MongoDB进行简单CURD操作示例
  • 嵌入式人工智能应用- 第九章 物体识别
  • 织梦dedecmsV5.7提示信息提示框美化(带安装教程和效果展示)
  • 【NLP】 3. Distributional Similarity in NLP(分布式相似性)
  • 这个五月,有三部纪录电影值得一看
  • 科技赋能文化体验,“五一”假期“海昏侯”人气创新高
  • 农村青年寻路纪|劳动者的书信⑤
  • 2025五一档电影票房破6亿
  • 国铁集团:全国铁路旅客发送量连续3天同比增幅超10%
  • 魔都眼|咖啡节上上海小囡忍不住尝了咖啡香,母亲乐了