当前位置：首页 > news >正文

Dexmal原力灵机发布Dexbotic，从此具身智能研发有了“加速器”

news 2025/10/23 13:54:01

【导读】为解决具身智能研发“重复造轮子”的困境，Dexmal原力灵机正式开源一站式VLA工具箱Dexbotic，致力于成为推动领域创新与协作的标准化基建。

作者 | 小葳

在具身智能浪潮奔涌的今天，视觉-语言-动作模型（VLA）已成为实现机器人感知、认知与行动一体化的关键技术。然而，该领域研究长期面临算法框架分散、流程不统一、实验复现困难等痛点，导致研发人员大量精力耗费在“重复造轮子”上，严重阻碍了技术迭代与产业落地。

为应对这一行业挑战，Dexmal原力灵机正式推出基于PyTorch的开源VLA模型工具箱Dexbotic。它以“代码库 + 预训练模型”为双引擎，构建起标准化的研发基座，通过“以实验为中心”的设计理念，推动具身智能研发从零散探索走向生态协作。

Dexbotic发布

直击具身智能研发四大痛点

根据《2025人形机器人与具身智能产业研究报告》数据，2025年，全球具身智能市场规模预计达195.25亿元，2030年预计达2326.3亿元，复合年增长率达64.18%。

然而行业繁荣的背后，是研发路径中的重重困境。具体而言，具身智能研发面临以下四大痛点：

1. 技术研发分散化，缺乏统一标准

研究人员基于不同的深度学习框架与模型结构各自为战，形成“碎片化”开发生态。硬件接口、通信协议、数据格式缺乏统一规范，很多开发者需要从零搭建基础设施，同时技术路线碎片化严重制约产业生态协同发展。

2. 实验流程繁琐，评测对比困难

由于算法依赖不同的环境配置与数据格式，研究人员在对比模型性能时，需反复搭建多套实验流程，耗费大量人力与算力。更严峻的是，数据格式不统一也导致跨数据集任务逻辑难以衔接，加剧了数据整合与实验复现的难度。

3. 算法复现公平性难以保证

在现有模式下，很难确保每一个对比算法都被调至最优状态，影响技术路线的客观判断与有效迭代。

4. VLA模型未能充分受益于前沿进展

不少VLA模型仍基于过时、不同期的视觉-语言模型（VLM）构建，难以吸收VLM在语义理解、多模态对齐等方面的最新突破。这导致VLA模型在开放世界的泛化能力和推理性能受限，无法与前沿技术同步。

此外，随着具身智能加速走进现实世界，研究者需要同步在主流仿真器+真机上测试从而实现巨大增益，这对现有研发模式提出更大挑战。

正是洞察到以上行业瓶颈，开源VLA工具箱Dexbotic应运而生。其核心设计理念在于通过“代码库+预训练模型”双引擎，通过模块化设计与实验为中心的工作流，致力于打造具身智能研究的“通用底座”。从而将开发者从繁琐的环境配置与算法复现中解放出来，使其更专注于模型调优与算法创新。

Dexbotic：重塑具身智能研发流程

在具身智能研发日益复杂、工具链分散的背景下，Dexbotic致力于打造一套标准化、模块化、高性能的一站式开发解决方案。

三大核心模块：构建统一研发基座

Dexbotic 的整体架构围绕三大层级展开，分别对应数据处理、模型构建与实验管理，形成闭环研发链路：

数据层定义Dexdata统一数据格式，整合多源异构数据，显著优化存储效率。数据层采用Dexdata统一格式来融合多源数据并优化存储；符合该格式的数据将自动进入处理流程，为模型训练提取出图像、文本及状态信息。

模型层以DexboticVLM基础模型为核心，支撑多样化VLA策略的开发。它既可直接用于离散VLA训练，也能作为现有策略的基座；当前已集成Pi0、OpenVLA-OFT等多种策略，并支持用户便捷地自定义新模型。

实验层是Dexbotic的核心，它基于模型层的VLA实现，通过创新的实验脚本机制，使用户仅需修改少量配置即可快速启动新实验，从而在保障系统稳定的前提下实现高效迭代。

Dexbotic整体架构

五大特征：从开发到部署的全链路支持

Dexbotic 具备五大核心优势，构建从开发到部署的完整机器人智能体支持体系。相比现有开源方案，其在框架设计、模型性能、实验效率、训练兼容性与落地能力方面表现突出：

1. 统一的模块化VLA框架

以视觉语言动作模型为核心，兼容主流大语言模型接口，集成具身操作与导航模块，并预留扩展能力，为未来实现全身控制等复杂任务场景奠定架构基础。

2. 高性能预训练基础模型

针对Pi0、CogACT等主流算法，提供多个在仿真与真实任务中表现更优的预训练模型。这些模型为用户提供了更高的起点与可靠的性能基准，有效降低训练成本。

3. 实验导向型开发框架

采用“分层配置 + 工厂注册 + 入口分发”的系统架构，符合软件开闭原则，在保障系统稳定的同时，赋予框架高度灵活性，支持用户快速切换任务、模型与参数，实现高效实验迭代。

4. 云端与本地一体化训练

全面适配多样化研发环境，既支持阿里云、火山引擎等云平台的大规模分布式训练，也能在搭载RTX 4090等消费级显卡的本地机器上高效运行，为用户提供灵活的资源选择。

5. 全链路训练与部署支持

针对UR5、Franka、ALOHA等主流机器人平台，提供标准化的数据接口与通用部署脚本，覆盖从仿真验证到真实机器人无缝落地的完整流程，打通研发测试“最后一公里”。

此外，相较于 LeRobot 基于 YAML 配置的传统方式，Dexbotic 进一步采用了基于 Python Exp 脚本的实验配置机制。这种方式不仅更贴近开发者的编程习惯，也使得参数调试、实验复现和版本管理更加直观高效。

为加速机器人技术在真实物理世界的落地与应用，Dexmal 原力灵机还发布其首款开源硬件产品——Dexbotic Open Source - W1 (DOS-W1)。

该产品秉承完全开源的理念，将公开所有技术文档、BOM清单、设计图纸、组装方案及相关代码。设计上大量采用快拆结构与可替换模块，大幅提升了改造与维护的便捷性。同时，其符合人体工学的抗疲劳设计，也有效改善了操作舒适度与数据采集效率。

从模拟到现实：Dexbotic 大幅提升预训练模型综合性能

Dexbotic 通过增强模型表征与优化训练流程，在多个主流模拟基准与真实场景中均展现出显著性能提升，验证了其出色的适应性与泛化能力。

在SimplerEnv、CALVIN、RoboTwin2.0、Libero、ManiSkill2等多项模拟基准测试中，Dexbotic 均展示出强大的表征能力。

以 SimplerEnv 为例，实验显示在使用 Dexbotic 工具集后，DB-CogACT 模型相较原版 CogACT 性能提升 18.2%；与官方 OpenVLA-OFT 相比，DB-OFT 性能提升达 46.2%，充分说明 Dexbotic 预训练模型具备更强的任务理解与完成表现。

SimplerEnv-Bridge 与 WidowX 机器人在最新策略和 Dexbotic 版本之间的性能比较

在涵盖50项双臂任务的 RoboTwin2.0 基准测试中，Dexbotic 同样表现优异。通过选取“调整瓶子”“抓取滚轮”“放置空杯”和“放置手机支架”四项任务进行对比，CogACT 的平均成功率为 43.75%，而 DB-CogACT 提升至 57.00%，绝对增益达 13%，进一步证明 Dexbotic 在复杂双臂操作中的有效性。

RoboTwin2.0 中四项任务中最新策略与其 Dexbotic 版本之间的性能比较

Libero基准包含四大任务套件，覆盖空间理解与目标导向行为等高阶能力。在该测试中，主流VLA策略性能已接近饱和。然而，引入 Dexbotic 预训练模型后，如 CogACT 与 MemoryVLA 等策略仍能实现性能突破，DB-CogACT 在四个任务套件上的平均成功率较基线提升 1.3%，体现出 Dexbotic 在成熟模型性能方面的优化潜力。

Libero 上最先进的策略与其 Dexbotic 版本之间的性能比较

为验证模型在真实环境中的表现，研究人员在 UR5e、ALOHA、ARX5 和 Franka 等多种机器人平台上，通过远程操作收集了涵盖日常任务的真实数据。每个任务根据难度收集 500–1000 条演示，并统一转换为 Dexdata 格式，用于基于预训练模型的微调。

实验结果表明，Dexbotic 能够稳定完成多种日常操作任务。例如，在“摆放盘子”和“搜索绿盒子”任务中，成功率分别达到 100% 与 80%；在“撕碎废纸”和“将薯条倒入盘子”等需要细粒度操作的任务中，也展现出良好的控制精度与鲁棒性。

ur5摆放盘子真机测试_4x

aloha_倒薯条真机测试_2x

综上，Dexbotic 不仅在模拟测试中显著提升多项基线模型的性能，在真机环境和复杂任务中也表现出优异的泛化能力与实操稳定性，充分证明其作为预训练增强框架的价值与广泛适用前景。

协同共赢：共建具身智能开放生态

Dexbotic的发布，标志着具身智能研发从“分散探索”走向“基础设施驱动”的关键转折。它致力于构建统一、开放、可复现的研发基座，重塑从学术创新到产业落地的全链路协作方式，推动领域实现规模化发展。

一、建立标准：从“各自为战”到“统一基建”

Dexbotic通过标准化框架与高性能预训练模型，为创业团队与中小厂商提供了可媲美大厂的研发起点，显著降低技术门槛与试错成本。在具身智能这一万亿级赛道中，此类开源基础设施的战略意义尤为凸显——它使创新重心从“重复造轮子”回归至算法突破与场景深化。

二、赋能产业：从“技术黑盒”到“可信评估”

在落地层面，Dexbotic为企业与投资机构提供了跨模型可比的评估体系，能够系统化衡量算法在鲁棒性、泛化能力与执行效率等方面的表现。这为技术选型、产品规划与投资决策提供了客观、透明的依据，有效降低因技术不透明所带来的风险，推动行业从“封闭优化”走向“开放竞争”。

三、生态闭环：从“工具开源”到“共同体共建”

Dexbotic不仅仅是开源工具，更构建了一个连接全球开发者与机构的协同网络。其开源机制将吸引顶尖团队共同参与，围绕具身智能的核心挑战展开协作，形成技术共研、成果共享的良性生态。

更具战略价值的是，Dexbotic与全球首个基于真机的具身智能评测平台RoboChallenge形成深度协同。研究者基于Dexbotic开发的模型，可在RoboChallenge这一全球性真实机器人测试平台上进行公平、透明的性能验证，从基础设施层面构建从“开发-训练-评测”的完整技术闭环。

结语：基础设施推动研发范式转移

Dexbotic的推出，是具身智能从技术探索走向规模化商业落地的关键节点。它通过构建标准、开放、高效的研发体系，让全球研究者站在同一起跑线，推动领域从“重复造轮子”走向“协同创新”。

当工具不再成为障碍，当评测有了共同标尺，创新才能真正跨越实验室，走向千行百业。Dexbotic正是这一场“协同革命”的基石，它不只是一个工具箱，更是推动领域协作、加速行业共进的关键引擎。

END

参考资料：

官网：https://dexbotic.com/

Paper：https://dexbotic.com/dexbotic_tech_report.pdf

GitHub：https://github.com/Dexmal/dexbotic

Hugging Face：https://huggingface.co/collections/Dexmal/dexbotic-68f20493f6808a776bfc9fc4

查看全文

http://www.dtcms.com/a/517246.html

电子商务网站建设步网页打不开验证码图片

怎样做自己的微商网站个人网站备案建设方案书

《用于触觉感知的电阻式传感器技术的最新进展》IEEE SENSORS 2022综述文章解读

Redis vs RabbitMQ 对比总结

初识C语言11.数据在内存中的存储

操作系统存储管理核心知识点与例题详解

人工智能风险与伦理（3）

the scientist and engineer‘s guide to DSP：5 Linear Systems

近一个月的技术问题总结

360网站推广官网怎么优化网站开发的项目内容

用多工具组合把 iOS 混淆做成可复用的工程能力（iOS混淆｜IPA加固｜无源码混淆｜Ipa Guard｜Swift Shield）

丽水网站建设企业wordpress空白页面模板下载

如何推广企业官方网站内容微信公众号推广链接

同一源代码再建设一个网站网站建设升级的必要性

Linux：开发工具

深浅复制

为什么做的网站要续费深圳seo网络公司

淄博网站建设公司羊肉片机互联网营销

书店商城网站设计小说网站推荐

辽宁建设厅查询网站首页客源通app下载

具身智能 Note 1 ——仿真软件简介篇

Redis主从、哨兵、集群

JavaScript 核心知识学习笔记：给Java开发者的实战指南

成都网站建设科资阳公司网站建设

网站建设伍金手指下拉2wordpress在文章里面加歌曲

网站设计书籍网站改备案信息吗

自己做网站系统首选平台无锡网站制作工具

南昌市建设网站建网站建网站的公司

合合信息亮相PRCV：多模态文本智能与内容安全双擎驱动的技术突破与实践解析

哪家网站做的比较好建设银行河北分行网站

直击具身智能研发四大痛点

Dexbotic：重塑具身智能研发流程

从模拟到现实：Dexbotic 大幅提升预训练模型综合性能

协同共赢：共建具身智能开放生态

结语：基础设施推动研发范式转移

相关文章：