当前位置: 首页 > news >正文

使用云端GPU训练Lerobot

#AutoDL #GPU #租显卡

  1. 租用AutoDL服务器

登陆https://www.autodl.com/,注册登陆后,选择左上方的“算力市场”,找到合适的GPU算力服务器,如选择“A100-PCIE-40G”

官网也提供了算力排行榜

然后根据实际需求选择是否需要扩容,服务器免费提供50G,后期也可动态添加扩容

镜像部分,我选择了基础镜像-Miniconda的22.04的版本,创建之后如下图,然后点击JupyterLab进入界面

镜像部分,我选择了基础镜像-Miniconda的22.04的版本,创建之后如下图,然后点击JupyterLab进入界面

点击终端启动后,我们开始部署lerobot的环境。

创建并激活一个新的 conda 环境用于 LeRobot,整体流程与在实体机上相同:

conda create -y -n lerobot python=3.10 && conda activate lerobot

  Conda 主要用于区分python环境以及环境中使用的库版本,如上为创建了一个python版本为3.10的环境

  • 克隆 LeRobot 仓库

    git clone https://github.com/Seeed-Projects/lerobot.git ~/lerobot

        看到在用户名前有LeRobot标志,说明当前的环境为LeRobot。

    • 使用 miniconda 时,在环境中安装 ffmpeg

      conda install ffmpeg -c conda-forge

    • 安装带有 feetech 电机依赖的 LeRobot

      cd ~/lerobot && pip install -e ".[feetech]"
      1. 使用filezilla传输文件

      filezilla使用ssh进行连接,可直接拖拽文件进行传输,在本地终端使用以下命令进行下载

      sudo apt install filezilla

      下载成功后运行filezilla即可启动

      点击左上角File-Site Manager-后,点击下方的New site创建新的连接

      选择Protocol部分为SFTP,HOST和Port部分由AutoDL获取

      回到AutoDL页面,查看服务器ip,复制登陆指令,其格式如ssh -p 45082 root@regxxxxx.autodl.pro,root@regxxxxx.autodl.pro即为HOST,45082即为Port

      User名为root,密码同样根据网络提示获取。

      将本地机器的数据集.cache/huggingface/lerobot-放置在云端相同的路径中中,注意路径位置。

      1. 训练模型

      python -m src.lerobot.scripts.train   --dataset.repo_id HoweXixi12/Pick_Sugar01   --policy.type act   --output_dir outputs/train/Pick_Sugar01   --job_name act_Aura_test   --policy.device cuda   --wandb.enable false   --policy.push_to_hub false  --steps 300000 
      • 数据集指定:我们通过 --dataset.repo_id=${HF_USER}/Pick_Sugar01 参数提供了数据集,这通常会检查。

      • 训练步数:我们通过 --steps=300000 修改训练步数,算法默认为800000,根据自己的任务难易程度,观察训练时候的loss来进行调整。

      • 策略类型:我们使用 policy.type=act 提供了策略,同样可以更换[act,diffusion,pi0,pi0fast,pi0fast,sac,smolvla]等策略,这将从 configuration_act.py 加载配置。重要的是,这个策略会自动适应机器人(例如 laptopphone)的电机状态、电机动作和摄像头数量,这些信息已保存在您的数据集中。

      • 设备选择:我们提供了 policy.device=cuda,因为我们正在 Nvidia GPU 上进行训练,但您可以使用 policy.device=mps 在 Apple Silicon 上进行训练。

      • 可视化工具:我们提供了 wandb.enable=true 来使用 Weights and Biases 可视化训练图表。这是可选的,但如果使用它,请确保已通过运行 wandb login 登录。

      如果使用本地的显卡,我训练2K步就要6,7个小时了,使用AutoDL的显卡,训练20K,直接压缩到1-2小时,起飞~~

      训练完,使用filezilla将output中的预训练模型下载会本地设备即可。

      http://www.dtcms.com/a/391959.html

      相关文章:

    • RNA-seq分析之基因ID转换
    • [视图功能9] 图表联动与多维度分析:打造协同动态的数据洞察仪表盘
    • Python基础 6》数据类型_列表(List)
    • 40、大模型工程平台全景对比 - 技术选型指南
    • BEVformer训练nusenes-mini数据集
    • 《Unity3D NavMeshAgent与Rigidbody移动同步问题的技术拆解》
    • Psy Protocol 技术核心解读
    • PS练习3:使用变形将图片放到实际场景中
    • 在排序数组中查找元素的第一个和最后一个位置
    • 一条命令在ubuntu安装vscode
    • 【开题答辩全过程】以 ASP.NET抗疫物资管理系统为例,包含答辩的问题和答案
    • 探饭 - 字节跳动推出的AI美食推荐助手
    • ZCC5515_耐压9.5V ,超低静态功耗5uA,完全替代CS5515
    • 端脑云AI生图体验:从提示词到精美肖像
    • 临界处有一条看不见的河
    • JavaWeb--day8-- Mybatis(正式)
    • 基于WSL BES2710编译环境搭建方法
    • 模块化设计逻辑:太阳镜气流单元 / 耳机可拆卸结构的装配精度与兼容性分析
    • 半监督学习实战:如何用少量标注数据获得媲美全监督学习的性能?
    • 作业3(初学CSS)
    • CSS基础(总结)
    • 【信创云架构 PACS系统】全网首发-基于JDK17+Vue3全新开发的信创国产化系统
    • 若依vue项目里面,使用到oss,这个 是什么
    • Linux中的Ubuntu系统安装配置 MATLAB 开发环境、离线安装非root安装vscode
    • 网站单页应用(SPA)和多页应用(MPA)的区别
    • 10cm钢板矫平机:一副“钢铁脊椎”的矫正日记
    • Nano Banana (Gemini 2.5 Flash Image) 完整体验教程:一键生成你的专属 3D AI 手办
    • Qt水平布局:深入解析与优化技巧
    • 【vLLM 学习】Multilora Inference
    • 【硬件-笔试面试题-102】硬件/电子工程师,笔试面试题(知识点:RC滤波器的参数怎么计算)