当前位置: 首页 > news >正文

具身智能数据采集方案,如何为机器人打造“数据燃料库”?

何为具身智能?

在人形机器人迅速发展的现在,“具身智能”在机器人领域早已不是一个新鲜词,其基本概念为:各种不同形态的物理实体能与环境交互,能进行环境感知、信息认知、自主决策和采取行动,并能够从经验反馈中实现智能增长和行动自适应的智能系统。

其中人形机器人是具身智能表现的一个主要载体,然而人形机器人的用途不仅仅只是娱乐表演与运动竞速,随着具身智能”大小脑“智能水平的不断提升,未来人形机器人将深入商业服务、家庭、养老、工业、物流、特种作业等十大典型场景,为人类生活提供服务

然而在目前阶段数据被认为是具身智能的“卡脖子”问题。

东吴证券指出,不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。

然而通过遥操作采集数据成本高、效率低,还有较高的硬件损耗,为了突破数据困境,全国各地纷纷搭建以具身智能训练与数据采集为核心需求的具身智能训练基地,例如国地共建具身智能机器人创新中心与北京人形机器人创新中心等;企业方面,以智元机器人为代表,在建立大规模数据采集厂收集高质量的真实场景数据结合仿真数据进行训练方面进行了探索。

*素材来源网络

在未来机器人大模型的训练数据将呈现“仿真+真实”共存的融合态势,真实数据用于纠偏与对齐,仿真数据用于规模扩展和多样性覆益,二者融合训练可有效美顾效率与表现,是行业公认的发展方向。

基于此针对于人形机器人提出了仿真平台人形机器人/灵巧手训练与数据采集方案,其中包括:

①动捕数据重定向技术服务:通过自研的动捕设备采集真人动作到实现在仿真平台的人形机器人/灵巧手电机或关节的映射,其中支持宇数G1机器人(23、29自由度)、宇数Dex3-1灵巧手与因时DFQ、FTP灵巧手及对应仿真平台,可提供UDP数据接收SDK以及仿真驱动源代码减轻使用者的开发负担。

②人形机器人灵巧手动作训练与数据采集能力:

基于惯性传感技术与光学运动测量技术进行精准动作模仿,及配套的数据采集服务:集成自研全身惯性动捕设备、动捕手套、和7摄像头无穿戴动捕设备,以及光学动作捕捉场地,能够支持到各种场景下的动作采集需求,此外,还具备专业的动捕演员合作,能提供大量高质量动作内容表演,可涵盖了武术、舞蹈、体育等动作方向。

动捕产品同步配套了专业的动捕软件,能够高效、快速输出大量标准动捕数据,并且提供了SDK支持第三方的开发,简单、易用、快上手。

③大规模训练数据创建,以及各类高质量动作的批量采集与修正能力

包括舞蹈、基础肢体运动动作、精细操作动作、场景化任务动作、交互与协作动作等:虚拟动力拥有专业的美术服务团队以及动作算法团队,可针对高精度动作数据需求,比如舞蹈、基础肢体运动动作、精细操作动作、场景化任务动作、交互与协作动作等各类高质量动作,提供高质量的、批量化的动捕数据后期修

具身智能的真正落地,不仅依赖于算法的突破与硬件的进步,更离不开高质量、大规模、多模态的数据支持。仿真与实采融合方案,为行业提供了一条可扩展、高效率、低成本的数据构建路径。从动作重定向到多场景采集,再到后期数据的算法优化与批量处理,这一全流程服务正在成为推动人形机器人从“能动”走向“智能”的关键基础设施。


文章转载自:

http://8CXoBwux.xskbr.cn
http://GRZL84Dh.xskbr.cn
http://6rAs4SON.xskbr.cn
http://ktQLoTdE.xskbr.cn
http://QYqWkyhy.xskbr.cn
http://PR5QKrLm.xskbr.cn
http://MMxe1p6w.xskbr.cn
http://JDerSf7i.xskbr.cn
http://61xXNLok.xskbr.cn
http://Zu5p9huq.xskbr.cn
http://VjfiqIv7.xskbr.cn
http://1XPUgajZ.xskbr.cn
http://aUX9MoDR.xskbr.cn
http://Ow6KBYN5.xskbr.cn
http://2StG19RN.xskbr.cn
http://1JtI42CC.xskbr.cn
http://4sM22IHP.xskbr.cn
http://37szC4n9.xskbr.cn
http://oJobRUms.xskbr.cn
http://peNNvcI9.xskbr.cn
http://qBZ39UOi.xskbr.cn
http://rfuf7xDL.xskbr.cn
http://OTf9iGdU.xskbr.cn
http://OUen6uV2.xskbr.cn
http://adT859tk.xskbr.cn
http://6r0Y64Ye.xskbr.cn
http://z8ULQusO.xskbr.cn
http://qcYRTb7g.xskbr.cn
http://FId76VJL.xskbr.cn
http://pUovtDwX.xskbr.cn
http://www.dtcms.com/a/387951.html

相关文章:

  • Prism模块化和对话服务
  • nas怎么提供给k8s容器使用
  • 【第五章:计算机视觉-项目实战之图像分类实战】1.经典卷积神经网络模型Backbone与图像-(8)多标签图像分类理论
  • 认知语义学中的意象图式对人工智能自然语言处理深层语义分析的影响与启示
  • [ffmpeg] 时间基总结
  • 数据结构排序入门(3):核心排序(归并排序,归并非递归排序,计数排序及排序扫尾复杂度分析)+八大排序源码汇总
  • 计算机网络七层模型理解
  • 同步与互斥学习笔记
  • 命令行方式部署OceanBase 集群部署
  • 小迪安全v2023学习笔记(八十四讲)——协议安全桌面应用hydra爆破未授权检测
  • MAC-简化版枚举工具类
  • Science Robotics 美国康奈尔大学开发的新型触觉显示器
  • Java 零基础学习指南
  • 音频剪辑总出错?音视频分割工具免费功能实测 音视频分割工具新手怎么用?4步搞定音视频分割 音视频分割工具常见问题解决:新手避坑参考
  • 线性回归与 Softmax 回归总结
  • 文字一键生成视频软件哪家比较靠谱?
  • Android,Jetpack Compose,坦克大战游戏案例Demo(随机生成地图)
  • Unity 笔记:构建AAB包大小超过谷歌商店上限
  • 在idea中git修改用户名和邮箱/切换账号
  • 设计模式(C++)详解——组合模式(Composite Pattern)(1)
  • 103、23种设计模式之外观模式(12/23)
  • 依赖注入基础
  • 代码随想录二刷之“图论”~GO
  • 基础数学转金融数学考研:一场需要清醒规划的转型
  • Alpha World携手非小号Talking Web3,海上ALPHA WEB3派对启航
  • Vue3钩子,路由拦截实现
  • 数据结构七大排序算法模拟实现性能分析
  • vue+react笔记
  • springboot获取wav文件音频长度
  • 【Redis】-- 缓存