当前位置: 首页 > news >正文

当 Manus AI 遇上 OpenAI Operator,谁能更胜一筹?

自主智能体通过实现任务自动化,改变了我们与技术交互的方式,让我们的生活变得更加便捷。去年,OpenAI 为人工智能聊天机器人引入了定时任务和操作智能体,赋予了其代理功能,而 Anthropic 则在 Claude 上实现了类似的功能。如今,中国凭借 Manus AI 踏入了自主人工智能体的领域,与美国同行展开正面竞争。这款新型智能体聊天机器人可以根据简单的提示执行复杂任务,无需人类监督,它利用了实时数据检索、多步骤推理以及应用程序接口集成等技术。在这次 Manus AI 与操作智能体的比较中,我们将探究中国首款人工智能体的各项功能,并将其性能与 ChatGPT 上的 OpenAI 智能体进行对比。

🚀ALL IN ONE (AIO) 开放接口(API)平台

ChatGPT Operator? 是什么?

Operator智能体是 OpenAI 开发的一个人工智能代理,它通过 ChatGPT 界面,能自主地通过与网页浏览器交互来执行任务。它与诸如按钮、菜单和文本字段等网页元素进行交互,以执行像填写表格、在线下单和安排预约等任务。

这项功能目前可供美国和英国的 ChatGPT 专业版用户使用,其目标是实现重复性在线任务的自动化。虽然它可以独立运行,但在执行特定操作时,尤其是涉及到像登录凭证或支付信息等敏感信息的操作时,它会提示用户进行确认。

Manus AI 是什么?

Manus AI 是一款由中国开发的智能代理聊天机器人,它能够端到端地完成任务,并在云端异步运行。与 Grok 和 ChatGPT 等其他聊天机器人不同,Manus 所能做的远不止回答问题、生成内容和提供创意。它可以搜索网页、进行分析、编写完整的代码块,并且能够从头到尾独立运行任务。
它的工作方式类似于一个多智能体系统,包含计算机用户智能体、网络搜索智能体、数据分析智能体等等。借助这些智能代理工具,这款聊天机器人可以自行编写代码,在其自身的沙盒环境中执行代码,并在无需任何人为干预的情况下提供最终结果。这意味着,你可以给它分配一项任务,然后合上笔记本电脑,等待任务完成时的通知。

它一直在像 Upwork 和 Fiverr 这样的自由职业平台上自主完成任务,甚至还参与了 Kaggle 竞赛,展现出了其多样的能力。虽然有些用户称它为 “通用型开发人工智能”,但总体而言,Manus AI 就像是将深度研究、操作智能体、代码执行以及模型上下文协议(MCP)等功能集于一身!

Manus AI与现有的自主智能体

Manus AI 的界面与 OpenAI 的 ChatGPT 以及 Anthropic 的 Claude 3.7 类似,它会实时在屏幕上展示思考过程,并提供在分屏中打开回复内容的选项。它还像 Claude 的人工制品功能那样,可访问单独文件夹中所有相关文件。

话虽如此,Manus AI 似乎比其他现有的智能代理工具更智能。原因如下:

  • 避免冗余任务:它能够识别重复内容或先前已完成的任务,避免不必要的重复操作。

  • 适应新指令:在它工作时,用户可以修改指令,而 Manus AI 会立即根据新的指引进行调整。

  • 更快的响应时间:与其他人工智能模型相比,Manus AI 处理任务的速度更快。

对比Manus AI 与 OpenAI Operator

功能比较

性能比较

现在我们已经熟悉了 Manus AI 和 OpenAI Operator 的功能,让我们尝试一下这些功能,看看这两个模型的表现如何。在 Manus AI 与 OpenAI Operator 对比的这一部分中,我们将在两个模型上测试三个不同的提示,并比较它们的响应。以下是我们将在三个任务上进行测试:

  • 构建游戏

  • 设计房间

  • 创建网站

性能比较-构建游戏

在第一个任务中,我们将测试这些代理AI模型的游戏构建能力。我们将让它们以《我的世界》的风格创建一款超级马里奥游戏,看看哪个模型做得更好。

提示: “给我制作一个 Minecraft 风格的超级马里奥游戏。”

Manus AI 的回应:

M游戏

OpenAI Operator 的回应:

O游戏

比较分析:

Manus AI 首先以步骤清单的形式列出计划。它会搜索每项需求,并收集各种游戏元素(例如纹理、角色等)的相关数据。然后,该模型在其编码窗口中编写包含收集到的数据的游戏逻辑 js 代码,并在其自己的沙盒中运行。在整个过程中,它会展示每个构思步骤,并根据需要不时回溯并修改任务列表。

OpenAI 的 Operator 使用 CSS 和 JavaScript 创建了一款基于 HTML 的简单游戏。它首先设置了游戏的基本结构,然后在网络上搜索角色和其他需要添加的细节。每一步,它都会在动态浏览器界面上实时显示进度。在构建游戏的过程中,它会在浏览器上打开一个现有的超级马里奥游戏,然后将其用作模板。

性能比较-设计房间

下一个任务是让 Manus AI 和 OpenAI Operate 从零开始设计一个空间。我们会提供空间尺寸、所需家具清单以及预算。看看它们能否设计出合适的空间,并找到符合我们预算的合适产品。

提示: “设计一个14×16英尺(约4.2米)的房间,营造平静的流行文化氛围,包含工作区和睡眠区。使用植物和装饰品,从零开始,预算1.5万美元。列出要购买的产品及其摆放方式,打造时尚外观。”

Manus AI 的回应:

m房间

OpenAI Operator 的回应:

o房间

比较分析:

Manus AI 给出了出色的反馈,它根据房间的不同区域选择了合适的家具,并完成了整体布局。虽然最初的布局是二维的,但它还根据用户需求创建了三维布局和斯堪的纳维亚风格的设计。在整个过程中,大部分决策都由聊天机器人做出,只有在用户做出回应后才会征求反馈和修改意见。

OpenAI 的 Operator 首先搜索家具和装饰品,然后列出符合预算的物品清单,最后根据选择设计布局。虽然网络搜索是自主的,但它会在继续之前不断要求对每个物品进行确认,因此整个过程都需要人工监督。

性能比较-创建网站

在我们的最后一个任务中,我们将测试这两个代理工具在构建网站方面的表现。我们将要求这两个模型创建一个学习量子计算的教育网站。让我们看看它们能给我们带来什么。

提示: “创建一个量子计算的动态教学网页。”

Manus AI 的回应:

m教学

OpenAI Operator 的回应:

o教学

比较分析:

与之前的任务类似,Manus AI 能够快速理解提示并得出结果。它实时展示了整个思考过程,甚至随着进展不断修改初始计划。最终,这个代理聊天机器人创建了一个多页面、高度互动的量子计算学习中心。

OpenAI Operator 的步骤较少,但构建网站花费的时间更多。它进行了实时网络搜索,以了解如何完成任务,并展示了思考过程。最终,它确实编写了网站的 HTML 代码,然而,即使经过多次尝试,生成的网页仍然无法打开。

结论

在 Manus AI 与 OpenAI Operator 的对比中,两个模型都展现出了令人印象深刻的自主执行任务的能力。然而,Manus AI 似乎拥有更先进、更独立的方法,执行速度也更快。

它能够高效地规划和执行多步骤任务,最大限度地减少冗余,并动态适应新指令。此外,它还能以极少的用户干预生成完整、实用的输出,展现出卓越的执行力。

另一方面,OpenAI 的 Operator 擅长基于 Web 的结构化自动化,但仍然严重依赖用户确认,且缺乏 Manus AI 那样的自主性。因此,Manus AI 奠定了坚实的基础,并确立了其作为中国首个人工智能代理的地位。目前的表现有望成为 OpenAI Operator 等现有自主代理的替代方案,而未来的发展仍有待观察。

探索智能边界,发现无限可能!(AIOAGI.TECH)

相关文章:

  • 大模型应用中常说的Rerank是什么技术?
  • 大模型核心基础简介
  • GIF图像技术介绍
  • MacOS Python3安装
  • Java在人工智能中的应用:机器学习与深度学习技术探讨
  • 剪板机结构设计:关键技术分析与优化策略
  • python 实现文件批量重命名
  • 网络IP分片
  • JVM——Java字节码基础
  • Web 实时通信技术:WebSocket 与 Server-Sent Events (SSE) 深入解析
  • SpringCloud Gateway知识点整理和全局过滤器实现
  • 梯形路径规划详解
  • Linux共享内存深度解析:从内核机制到云原生应用
  • 接口继承与扩展的使用技巧
  • 泰勒展开式
  • C#游戏开发中的注意事项
  • 22.第二阶段x64游戏实战-分析周围对象类型
  • SpringBoot主入口类分析
  • PXE安装Ubuntu系统
  • 2025数维杯挑战赛A题【空中芭蕾——蹦床运动的力学行为分析】原创论文分享
  • 硅料收储挺价“小作文”发酵光伏板块罕见大涨,知情人士:确实在谈
  • 工人日报:“鼠标手”被纳入职业病,劳动保障网越织越密
  • 挖掘机4月销量同比增17.6%,出口增幅创近两年新高
  • 北美票房|昔日偶像风光不再,乔什·哈内特新片开画不佳
  • 泽连斯基:乌克兰已做好与俄罗斯举行会谈的准备
  • 上海下周最高气温在30℃附近徘徊,夏天越来越近