当前位置: 首页 > news >正文

OpenAI回归机器人:想把大模型推向物理世界

人形机器人并非 OpenAI 一家的竞赛。

在暂停数年后,OpenAI 正将研究与招聘资源重新投向“具身智能”,并把焦点进一步推向人形系统。多份权威报道、公开招聘信息与产业动向交叉印证:这家以大模型闻名的公司,正在搭建一个面向现实世界的机器人研发矩阵。 

WIRED 9 月 15 日的报道,OpenAI 近来密集招募具有人形机器人与物理控制算法背景的科研人才,并在训练路径上强调遥操作(teleoperation)与仿真(包括 Nvidia Isaac 等工具);公司是否自建硬件或与外部制造商合作仍未明朗,但“人形形态”的研究正在加速推进。 

这种动向在招聘信息上有“硬证据”。例如, Mechanical Product Engineer, Robotics  的岗位要求明确写到团队“专注于解锁通用机器人”,并强调 传感器、执行器、计算元件集成 与面向真实约束的形态探索;更醒目的,是其偏向量产的字样:“ 有为高产量(1M+)设计机械系统的经验 ”。这意味着 OpenAI 至少在 可规模化 的方向上进行前置设计与评估。 

此外, Simulation Environments Engineer, Robotics  的岗位直接点名 遥操作/硬件在环(HIL)与Nvidia Isaac  等仿真生态,强调将 大规模强化学习 与 GPU 管线优化 落地到机器人任务场景。这与  WIRED  的技术路径描述一致,构成相互印证。 

早在 2024 年 11 月,前 Meta AR 眼镜硬件负责人  Caitlin Kalinowski  加入 OpenAI,负责 机器人与消费硬件 方向。此举被多家媒体视为 OpenAI 重返机器人赛道的强烈信号,也提示其机器人战略并非“只做算法”。 

OpenAI 早年在机器人研究上曾颇有建树。2019 年,“ Dactyl ”五指机械手 单手复原魔方 ,展示了 仿真到现实(sim2real)的里程碑式成果(ADR 自动域随机化等方法)。不过在随后的资源权衡中,OpenAI 在 2021 年关闭机器人团队,将重心转向能更快取得可见进展的通用模型与产品。如今“回归”,是其技术路线回到与物理世界更深层耦合 的必经之路。 

从岗位与报道的交叉信息看,OpenAI 的核心假设是: 把通用模型的“理解与推理”延伸到“感知—控制”的完整闭环 。这需要三类能力: 

1.数据采集与评测:通过遥操作与大规模仿真 收集多样交互数据,构建更强的 动作生成/控制策略 ;相应地,OpenAI 设有 DAQ/数据采集软件工程 岗位以扩展数据采集与评测体系。 

2.模型与算力栈:在大规模强化学习、分布式训练 与 实时推理 上,承接 Isaac 等仿真环境与现实平台,优化感知-控制的时序与稳定性。 

3.形态与产线设计:通过传感/执行器/散热/材料 等硬件工程,探索“可被现实约束验证”的形态;“1M+ 量级”的可制造性要求,释放了对 规模化落地 的前瞻信号。 

换言之,OpenAI 想把“ 会说话的模型 ”升级为“ 会操作世界的系统 ”,并让两者在统一的评测、数据与训练循环中相互促动。这与多位学者的观点一致:要突破大模型在 高维感知与高频控制 方面的瓶颈,AI 必须真正进入物理世界。 

人形机器人并非 OpenAI 一家的竞赛。 特斯拉、谷歌、Agility  等均在推进原型验证与小规模商用; WIRED  统计称自 2024 年以来, 流入人形赛道的资本超过 50 亿美元 ,且机构对 2050 年万亿美元级市场的展望不断强化。对 OpenAI 而言,这既是 技术方向 的必答题,也是 资本市场 与 合作伙伴 看重的叙事。 

同时,OpenAI 过去两年围绕 算力、资金与治理 的诸多调整(包括与微软的协议重构、基础设施多元化等),也将反向影响其机器人推进节奏与外部合作形态。就近几日的公开报道,OpenAI 与微软 签署新的非约束性备忘 ,为组织与资本框架的后续调整留出空间。 

事实层面可以确认的是:OpenAI 正在重建并扩编机器人团队 、 面向人形系统招募关键岗位 、 采用遥操作与仿真驱动的数据与训练闭环 ;其是否自建整机、量产节奏与场景优先级仍未公开坐实。 

原文链接:OpenAI回归机器人:想把大模型推向物理世界-36氪

http://www.dtcms.com/a/392127.html

相关文章:

  • QML学习笔记(五)QML新手入门其三:通过Row和Colunm进行简单布局
  • 按键检测函数
  • CTFshow系列——PHP特性Web109-112
  • 字符函数与字符串函数
  • 酷9 1.7.3 | 支持自定义添加频道列表,适配VLC播放器内核,首次打开无内置内容,用户可完全自主配置
  • Slurm sbatch 全面指南:所有选项详解
  • 使用SCP命令在CentOS 7上向目标服务器传输文件
  • Kindle Oasis 刷安卓系统CrackDroid
  • 最新超强系统垃圾清理优化工具--Wise Care 365 PRO
  • JeecgBoot权限控制系统解析:以具体模块为例
  • 2025年职场人AI认证与学习路径深度解析
  • 硬件开发_基于STM32单片机的智能垃圾桶系统2
  • CSS Display Grid布局 grid-template-columns grid-template-rows
  • 在 Spring Boot 中,针对表单提交和请求体提交(如 JSON) 两种数据格式,服务器端有不同的接收和处理方式,
  • NL2SQL简单使用
  • 数据结构:二叉树OJ
  • 【Linux手册】生产消费者模型的多模式实践:阻塞队列、信号量与环形队列的并发设计
  • Python + Flask + API Gateway + Lambda + EKS 实战
  • 【OpenGL】openGL常见矩阵
  • DeepSeek大模型混合专家模型,DeepSeekMoE 重构 MoE 训练逻辑
  • 450. 删除二叉搜索树中的节点
  • 实用工具:基于Python的图片定位导出小程序
  • 滚珠螺杆在工业机器人关节与线性模组的智能控制
  • 【AI】coze的简单入门构建智能体
  • Python数据分析:函数定义时的装饰器,好甜的语法糖。
  • Java数据结构——包装类和泛型
  • 【C++进阶】C++11的新特性 | 列表初始化 | 可变模板参数 | 新的类功能
  • 广东省省考备考(第一百零三天9.20)——言语(强化训练)
  • 面试编程题(四)
  • OpenHarmony之充电振动定制