当前位置：首页 > news >正文

灵巧手——DexMV

news 2025/10/21 12:17:32

DexMV: Imitation Learning for Dexterous Manipulation from Human Videos

论文解读
- 研究背景与动机
- - DexMV平台设计
- DexMV流程框架
- - 1. 3D姿态估计
  - 2. 演示转换（关键创新）
  - 3. 模仿学习
- 实验结果
- - 重定位任务性能
  - 消融研究
  - 复杂任务性能
  - 泛化能力评估
- 主要贡献

project

git

paper(2022)

更详细的内容，参考原论文和github代码

论文解读

请添加图片描述
DexMV: Imitation Learning for Dexterous Manipulation from Human Videos 这篇论文提出了一个从人类视频中学习灵巧操作的新平台和流程。以下是主要内容总结：

研究背景与动机

灵巧操作是人与物理世界交互的主要方式，但让机器人具备类似人类的灵巧性仍极具挑战性。传统强化学习（RL）方法需要大量训练数据且容易产生不自然行为。虽然模仿学习是很有前景的替代方案，但现有方法通常依赖VR设备收集演示数据，成本高且难以扩展。

DexMV平台设计

DexMV平台包含两个配对系统：

计算机视觉系统：使用两个RealSense D435摄像头记录人类执行操作任务的视频（图1第一行）
- 物理仿真系统：基于MuJoCo和Adroit Robotic Hand（30个自由度）构建，提供与人类演示相同的灵巧操作任务

平台设计了三种具有挑战性的任务：

重定位（Relocate）：将物体从桌面移动到目标位置，使用5种复杂物体
倾倒（Pour）：将杯子中的颗粒物倒入容器
放入（Place Inside）：将物体放入容器内

DexMV流程框架

DexMV流程包含三个核心阶段
请添加图片描述

1. 3D姿态估计

物体姿态估计：使用PVN3D模型从RGB-D数据估计6自由度物体姿态
手部姿态估计：基于MANO模型，通过优化重投影误差和深度一致性获得3D手部关节位置

2. 演示转换（关键创新）

将人类手部运动转换为机器人演示的两个步骤：

手部运动重定向（图3）：
- 传统方法仅匹配指尖-手掌任务空间向量（TSV），可能导致物体穿透
- 创新性地加入中指节向量匹配，提高运动质量
机器人动作估计：
- 拟合最小加加速度轨迹，确保运动自然平滑
- 通过逆动力学函数计算关节扭矩

3. 模仿学习

评估两种模仿学习设置：

状态-动作模仿：GAIL+（生成对抗模仿学习）和DAPG（演示增强策略梯度）
仅状态模仿：SOIL（状态仅模仿学习），学习逆模型预测缺失动作

实验结果

重定位任务性能

所有模仿学习方法均显著优于纯RL基线。

消融研究

运动重定向方法：提出的TSV方法优于传统指尖映射
演示数量：更多演示带来更好样本效率和性能
环境条件：演示在不同物体尺寸和摩擦系数下保持有效
手部姿态估计：双摄像头配置提供更平滑轨迹

复杂任务性能

倾倒任务：DAPG性能最佳，平均27.2%颗粒物倒入容器
放入任务：DAPG同样表现最优

泛化能力评估

在未见过的物体实例上测试策略泛化能力（图8,9）：

同类物体：在can、bottle、mug类别上表现良好
新类别物体：在camera等新类别上仍有不错表现

主要贡献

DexMV平台：首个将人类视频与机器人仿真配对的学习平台
演示转换模块：创新性地将人类视频转换为机器人演示数据
性能提升：在多个复杂任务上大幅提升灵巧操作性能
泛化能力：展示了对未见物体实例的良好泛化能力

这项研究为从人类视频中学习灵巧操作提供了新的基准，开辟了计算机视觉与机器人灵巧操作交叉领域的新研究方向。

查看全文

http://www.dtcms.com/a/508419.html

营销型外贸网站建设软件怎么引流怎么推广自己的产品

联兴建设官方网站wordpress增加幻灯片

HarmonyOS多媒体开发：自定义相机与音频播放器实战

HYPE分布式水文模型建模方法与案例分析

惠州哪家做网站比较好法律建设网站

【案例实战】多维度视角：鸿蒙2048游戏开发的深度分析与感悟

为什么我有的网站打不开寿光做网站m0536

php网站开发实例教程源码长春微信做网站

YOLOv4 学习总结

HTTPS 下的 DDoS 防护与抓包分析实战，从检测到快速缓解的工程化打法

VS Code 里的全局设置（User Settings）和工作区设置（Workspace Settings）settings.json详解

用C语言实现单例模式

怎么样在网站做产品推广设计师设计一套房子要多少钱

网站开发好学seo如何推广网站

基于51单片机温度检测报警

LeetCode:210. 课程表 II

HYPE模型高级实践：集成多源遥感数据的流域分布式模拟、参数自动率定与模型源代码修改

网站建设网站网页模板开发公司工程部经理岗位职责

学习springBoot框架-开发一个酒店管理系统，来熟悉springboot框架语法~

大数据开发生态及学习路线和应用领域

华为云自助建站好不好网络网站

seo怎么收费网站缺陷和优化的例子

软件产品开发从0到1的各个阶段

设计师个人网站源码知名网站制作

dedecms怎么部署网站wordpress动态标签

目标检测：使用自己的数据集微调DEIMv2进行物体检测

揭阳企业建站系统模板服装定制图案

彩票网站和app建设网站开发需要经过的几个主要阶段

如何从零开始：设计一款游戏（从一页纸开始）

小程序简单还是做网站简单前端移动端开发