具身智能数据采集方案,如何为机器人打造“数据燃料库”?
何为具身智能?
在人形机器人迅速发展的现在,“具身智能”在机器人领域早已不是一个新鲜词,其基本概念为:各种不同形态的物理实体能与环境交互,能进行环境感知、信息认知、自主决策和采取行动,并能够从经验反馈中实现智能增长和行动自适应的智能系统。
其中人形机器人是具身智能表现的一个主要载体,然而人形机器人的用途不仅仅只是娱乐表演与运动竞速,随着具身智能”大小脑“智能水平的不断提升,未来人形机器人将深入商业服务、家庭、养老、工业、物流、特种作业等十大典型场景,为人类生活提供服务
然而在目前阶段数据被认为是具身智能的“卡脖子”问题。
东吴证券指出,不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。
然而通过遥操作采集数据成本高、效率低,还有较高的硬件损耗,为了突破数据困境,全国各地纷纷搭建以具身智能训练与数据采集为核心需求的具身智能训练基地,例如国地共建具身智能机器人创新中心与北京人形机器人创新中心等;企业方面,以智元机器人为代表,在建立大规模数据采集厂收集高质量的真实场景数据结合仿真数据进行训练方面进行了探索。
*素材来源网络
在未来机器人大模型的训练数据将呈现“仿真+真实”共存的融合态势,真实数据用于纠偏与对齐,仿真数据用于规模扩展和多样性覆益,二者融合训练可有效美顾效率与表现,是行业公认的发展方向。
基于此针对于人形机器人提出了仿真平台人形机器人/灵巧手训练与数据采集方案,其中包括:
①动捕数据重定向技术服务:通过自研的动捕设备采集真人动作到实现在仿真平台的人形机器人/灵巧手电机或关节的映射,其中支持宇数G1机器人(23、29自由度)、宇数Dex3-1灵巧手与因时DFQ、FTP灵巧手及对应仿真平台,可提供UDP数据接收SDK以及仿真驱动源代码减轻使用者的开发负担。
②人形机器人灵巧手动作训练与数据采集能力:
基于惯性传感技术与光学运动测量技术进行精准动作模仿,及配套的数据采集服务:集成自研全身惯性动捕设备、动捕手套、和7摄像头无穿戴动捕设备,以及光学动作捕捉场地,能够支持到各种场景下的动作采集需求,此外,还具备专业的动捕演员合作,能提供大量高质量动作内容表演,可涵盖了武术、舞蹈、体育等动作方向。
动捕产品同步配套了专业的动捕软件,能够高效、快速输出大量标准动捕数据,并且提供了SDK支持第三方的开发,简单、易用、快上手。
③大规模训练数据创建,以及各类高质量动作的批量采集与修正能力
包括舞蹈、基础肢体运动动作、精细操作动作、场景化任务动作、交互与协作动作等:虚拟动力拥有专业的美术服务团队以及动作算法团队,可针对高精度动作数据需求,比如舞蹈、基础肢体运动动作、精细操作动作、场景化任务动作、交互与协作动作等各类高质量动作,提供高质量的、批量化的动捕数据后期修
具身智能的真正落地,不仅依赖于算法的突破与硬件的进步,更离不开高质量、大规模、多模态的数据支持。仿真与实采融合方案,为行业提供了一条可扩展、高效率、低成本的数据构建路径。从动作重定向到多场景采集,再到后期数据的算法优化与批量处理,这一全流程服务正在成为推动人形机器人从“能动”走向“智能”的关键基础设施。