当前位置: 首页 > news >正文

Hugging Face 中 LeRobot 使用的入门指南

请添加图片描述
相关源文件
.github/ISSUE_TEMPLATE/bug-report.yml
.github/PULL_REQUEST_TEMPLATE.md
README.md
examples/1_load_lerobot_dataset.py
examples/2_evaluate_pretrained_policy.py
examples/3_train_policy.py
lerobot/scripts/eval.py
lerobot/scripts/train.py

本页面提供 LeRobot 的快速入门指南,涵盖如何加载数据集、评估预训练策略以及训练您自己的模型。有关安装说明,请参阅“安装介绍”。

LeRobot 概述

LeRobot 是一个使用 PyTorch 构建的框架,为现实世界的机器人技术提供模型、数据集和工具。它专注于模仿学习(IL)和强化学习(RL)方法,这些方法可以迁移到现实世界的机器人身上。

添加图片注释,不超过 140 字(可选)

加载数据集

LeRobot 提供 LeRobot Dataset 类,可以从 Hugging Face Hub 无缝下载机器人数据集,并将其作为 PyTorch 张量提供。

添加图片注释,不超过 140 字(可选)

基本数据集加载

添加图片注释,不超过 140 字(可选)

探索数据集的元数据

无需下载完整数据集即可查看数据集的元数据:

添加图片注释,不超过 140 字(可选)

使用时间序列

LeRobotDataset 的一个关键特征,是能够根据时间戳加载帧序列:

添加图片注释,不超过 140 字(可选)

评估预训练策略

LeRobot 包含针对各种机器人任务的预训练策略,可以下载并运行:

添加图片注释,不超过 140 字(可选)

使用 Python API

以下是在 PushT 环境中评估预训练扩散策略(DP)的基本示例:

添加图片注释,不超过 140 字(可选)

使用命令行界面

LeRobot 提供一个命令行界面,用于在并行环境下进行高效的策略评估:
python lerobot/scripts/eval.py \ --policy.path=lerobot/diffusion_pusht \ --env.type=pusht \ --eval.batch_size=10 \ --eval.n_episodes=10 \ --policy.use_amp=false \ --policy.device=cuda
此命令使用 10 个并行环境在 10 episodes 上对策略进行评估,并将结果和视频保存在输出目录中。

训练策略

LeRobot 可以使用演示数据集来训练策略:

添加图片注释,不超过 140 字(可选)

使用 Python API

以下是一个简单示例,展示如何训练扩散策略:

添加图片注释,不超过 140 字(可选)
在这里插入图片描述

使用命令行界面

LeRobot 提供一个命令行界面,用于训练策略,并附带以下特征:
python lerobot/scripts/train.py \ --dataset.name=lerobot/pusht \ --policy.type=diffusion \ --steps=5000 \ --batch_size=64 \ --policy.device=cuda \ --save_freq=1000 \ --eval_freq=1000 \ --wandb.enable=true
此命令:
在 PushT 数据集上训练扩散策略 5000 步;
在环境中每 1000 步评估一次;
每 1000 步保存一次检查点;
将指标记录到 Weights & Biases(如果已配置过)。
还可以从 Hub 中复现特定训练好的模型:
python lerobot/scripts/train.py --config_path=lerobot/diffusion_pusht
这个使用与在 Hub 上训练模型时完全相同的配置。

后续步骤

现在已经了解 LeRobot 的基础知识,下一步可以:

  • 在 Hugging Face Hub 上探索更多与 LeRobot 兼容的数据集
  • 尝试不同的策略架构:
    ACT 策略(动作分块Transformer)
    Diffusion 策略(去噪扩散)
    TDMPC 策略(时间差分模型预测控制)
    VQBeT 策略(矢量量化行为Transformer)
    PI 0 策略(视觉-语言-动作 VLA)
    PI 0 FAST 策略(快速动作 token 化)
  • 在不同环境下进行实验:
    PushT:简单的推动任务
    ALOHA:双手操作
    XArm:机械臂操作
  • 在核心概念中了解 LeRobot 背后的核心概念:
  • 按照 README 中提到的 SO-100 教程构建自己的机器人

相关文章:

  • ultalytics代码中模型接收多层输入的处理
  • 《山东欧曼谛:美业梦想的启航港》
  • 面试 Linux 运维相关问题
  • 微信小程序van-dialog确认验证失败时阻止对话框的关闭
  • 嵌软面试每日一阅----FreeRTOS
  • CertiK荣获以太坊基金会两项资助,领跑zkEVM形式化验证
  • 【专栏启动】开篇:为什么是 Django + Vue3?测试平台的技术选型与架构蓝图
  • 基于微信小程序的在线聊天功能实现:WebSocket通信实战
  • C++从入门到实战(十五)String(上)介绍STL与String的关系,为什么有string类,String有什么用
  • 【深度学习之四】知识蒸馏综述提炼
  • Vue2在子组件上使用v-model实现数据的双向绑定、.sync修饰符
  • Windows软件插件-写mp3
  • 全链路压测实战指南:从理论到高可用架构的终极验证
  • 【Python】在vscode利用pyinstaller中的.spec文件把py项目打包为.exe实现非py环境下使用的操作步骤
  • 【实战教程】从零实现DeepSeek AI多专家协作系统 - Spring Boot+React打造AI专家团队协作平台
  • wps excel将表格输出pdf时所有列在一张纸上
  • 28、动画魔法圣典:Framer Motion 时空奥义全解——React 19 交互动效
  • 智能手表集成测试报告(Integration Test Report)
  • lesson02-PyTorch开发环境安装
  • 游戏行业DDoS攻击类型及防御分析
  • 百色一女子称家委会强制排班被迫抱婴儿校门口站岗?区教育局:自愿参与
  • 创同期历史新高!1至4月全国铁路发送旅客14.6亿人次
  • 娃哈哈:自4月起已终止与今麦郎的委托代工关系,未来将坚持自有生产模式
  • 30平米的无障碍酒吧里,我们将偏见折叠又摊开
  • 中国至越南河内国际道路运输线路正式开通
  • 讲一个香港儿童的故事,《劏房的天空》获“周庄杯”特等奖