当前位置: 首页 > news >正文

从Gemini Robotics看通用机器人的技术路径

在语言大模型的竞争日趋白热化之际,人工智能的下一个主战场已然清晰——物理世界。将AI的智慧注入到物理实体中,让机器人具备通用的、适应各种场景的能力,已成为全球科技巨头竞相追逐的“圣杯”。在这场竞赛中,谷歌DeepMind近期发布的Gemini Robotics 1.5系列,不仅展示了其在技术上的领先地位,更揭示了其试图主导整个机器人时代的宏大“阳谋”。

打造“机器人界的Android”

谷歌的战略并非是亲自下场,去设计和制造所有形态的机器人。恰恰相反,其核心商业逻辑是,提供一个极其强大的、标准化的AI“大脑”和“操作系统”,让全球所有机器人制造商,无论是工业机械臂、仓储机器人还是人形机器人,都能够采购和集成。

这无疑是在复刻其在智能手机时代,通过Android系统建立平台级生态系统的成功路径。通过将最核心、最复杂的AI能力封装成一个易于调用的服务,谷歌旨在成为未来所有通用机器人背后的“赋能者”,从而在即将到来的具身智能时代,占据产业链的顶端位置。

实现“通用”的技术基石

要实现这一宏伟目标,必须解决通用机器人发展道路上的两大核心技术难题:数据稀缺性实时性

动作迁移技术
具身智能领域最大的发展瓶颈,在于机器人训练数据的稀缺。收集真实机器人的物理交互数据,成本高昂且极其耗时,而且不同型号机器人的数据通常互不通用。

Gemini Robotics 1.5模型中的动作迁移技术,正是为了攻克这一难题。它通过一种新的模型架构,让AI能够从多种不同形态的机器人(异构、多具身)的训练数据中,学习到关于运动和物理学的统一、通用的理解。

这带来的革命性突破,就是零样本技能迁移。这意味着,在一个双臂机器人上训练的“打包午餐”技能,可以无需额外训练,直接在一个人形机器人上成功执行。机器人之间从此可以相互“学习”和共享经验,这极大地加速了通用技能的积累和泛化进程。
机器人打包午餐

Gemini Robotics On-Device
另一个巨大挑战,是机器人在真实世界中对实时响应网络稳定性的严苛要求。传统的云端AI模型,推理延迟高,且高度依赖稳定的网络连接,这在许多工业、医疗或户外场景中是无法接受的。

为此,谷歌推出了紧凑型版本Gemini Robotics On-Device (GRoD)。它采用了一种巧妙的混合架构:将复杂的感知和推理核心保留在云端,但将一个轻量级的动作解码器部署在机器人本地的芯片上运行。

通过“滚动预测范围”等技术,GRoD成功地将云端160毫秒的延迟,隐藏在一个50Hz的平滑控制循环背后,最终实现了约250毫秒的低延迟闭环控制。更重要的是,它具备离线弹性,即使在网络完全中断的情况下,本地的解码器依然能够继续执行任务。这使得机器人在仓库、外科手术室或远程勘探等网络不稳定的环境中,也能保持稳定工作。

通用机器人离我们还有多远

那么,有了这些技术突破,一个能走进我们生活和工作的通用机器人,离我们还有多远?

从已实现的场景来看,我们已经非常接近。在演示中,搭载了Gemini Robotics 1.5的机器人,已经能够执行相当复杂的、需要情境感知的任务。例如,它能根据“请帮我打包一份午餐,但别压坏了葡萄”这样的自然语言指令,执行精细的操作;也能在打包行李时,通过调用Google Search查询目的地的天气,从而主动将一把雨伞放入行李箱。

当然,要实现大规模普及,通用机器人仍面临诸多挑战。包括如何进一步提升在复杂动态环境中的灵巧度和安全性,以及如何处理长时序的、更复杂的任务规划等。谷歌发布的ASIMOV-2.0安全基准测试,也正是为了系统性地评估和解决机器人在真实世界中的安全伦理问题。

谷歌DeepMind通过Gemini Robotics 1.5系列,不仅展示了其在具身智能技术上的绝对领先地位,更重要的是,其“机器人界Android”的平台化开放战略,可能会极大地加速整个通用机器人产业的成熟与到来。一个由AI驱动、能够真正理解并服务于我们物理世界的机器人新纪元,其大幕已经拉开。

http://www.dtcms.com/a/420045.html

相关文章:

  • 网站开发文档撰写作业做网站挣钱经历
  • 大型网站开发视频百度云新闻类wordpress模板下载
  • 【LeetCode hot100|Week4】链表
  • 网站信息化建设案例如何做php网站
  • 避免网站侵权做散客机票的网站如何推广
  • AbMole小课堂丨Adezmapimod(SB 203580):经典p38 MAPK抑制剂,在调节细胞炎症、自噬、分化和动物模型中的研究应用
  • 衡水企业网站设计报价机顶盒做网站
  • 局域网站建设模版网络运营需要学什么
  • react16中的hooks的底层实现原理
  • 怎么建设自己淘宝网站首页温州网站设计只找亿企邦
  • 熵的概念及其在机器学习中的应用
  • PCIe协议之低功耗篇之 L1状态
  • nodejs做静态网站淘宝网页版登陆
  • Web打印
  • 前端开发中,关于url的经验总结和注意事项
  • Coze源码分析-资源库-编辑插件-前端源码-核心逻辑
  • 公司网上注册在哪个网站有啥创意可以做商务网站的
  • 校园兼职网站开发用例图互联网招聘网站
  • HarmonyOS 广告服务 ArkTS 实现指南:从激励广告到多形式适配
  • wordpress多站点换域名深圳网址排名
  • 网站存在原理网络营销方式哪些
  • DragonBalls_One008
  • 9月28日星期天今日早报简报微语报早读
  • 网络公司免费做网站wordpress导出全站链接
  • 网站数据泄露我们应该怎么做ps网站首页设计图
  • 辗转相除法(欧几里得算法)探微
  • 【Leetcode hot 100】208.实现Trie(前缀树)
  • 【开题答辩全过程】以 基于Java的网上租车系统的设计与开发为例,包含答辩的问题和答案
  • Linux系统编程深度指南:与内核的对话
  • 资源库建设网站工信部网站 登陆