当前位置: 首页 > wzjs >正文

做网站的的人收入多少钱哪些网站做推广性价比高

做网站的的人收入多少钱,哪些网站做推广性价比高,网站建设设计合同书,大学生做爰网站π₀ model 目前部署方式可以从 官方 或者 lerobot 部署 两个方式部署的过程简单记个笔记 这一套笔记是基于官方的流程的 Github:GitHub - Physical-Intelligence/openpi π₀ model:Our First Generalist Policy π₀ paper:https://ww…

π₀ model 目前部署方式可以从 官方 或者 lerobot 部署

两个方式部署的过程简单记个笔记

这一套笔记是基于官方的流程的

Github:GitHub - Physical-Intelligence/openpi

π₀ model:Our First Generalist Policy

π₀ paper:https://www.physicalintelligence.company/download/pi0.pdf

π₀-FAST model:FAST: Efficient Robot Action Tokenization

π₀-FAST paper:https://arxiv.org/pdf/2501.09747

目录

1 openpi 综述

2 运行要求

3 安装指南

4 模型检查点

4.1 基础模型 Base Models

4.2 微调模型 Fine-Tuned Models

5 预训练模型推理

6 自定义数据微调指南

6.1 数据格式转换

6.2 配置训练参数

6.3 启动策略服务器进行推理

6.4 更多示例

7 故障排除


1 openpi 综述

openpi 托管着由 Physical Intelligence team 发布的机器人开源模型与软件包

当前仓库包含两类核心模型:

  1. the π₀ model - 基于流式扩散架构的视觉-语言-动作多模态模型(VLA)

  2. the π₀-FAST model - 采用 FAST 动作分词器的自回归式VLA模型

两类模型均提供了 base model checkpoints(基于10k+小时机器人数据预训练),并包含开箱即用案例及自定义数据集微调示例

PS:π₀ 最初专为 PI 自有机器人平台开发(与 ALOHA/DROID 等常见平台存在差异)。虽然期待研究者能通过适配 π₀ 开展创新实验,但并非所有移植尝试都能成功。简而言之:π₀的实际效果可能因平台而异,但欢迎测试验证!

2 运行要求

要运行本仓库中的模型,需要配备符合以下最低规格的 NVIDIA GPU(单卡估算值)。通过配置训练参数中的 fsdp_devices,可使用多卡并行模式降低单卡显存需求。请注意:当前训练脚本暂不支持多节点训练

运行模式显存需求示例GPU型号
推理≥ 8 GBRTX 4090
LoRA 微调≥ 22.5 GBRTX 4090
全参数微调≥ 70 GBA100 (80GB)/H100

本仓库已在 Ubuntu 22.04 系统完成测试,暂不支持其他操作系统

3 安装指南

克隆仓库时请同步更新子模块:

git clone --recurse-submodules git@github.com:Physical-Intelligence/openpi.git# Or if you already cloned the repo:
git submodule update --init --recursive

使用 uv 管理Python依赖,参考 uv installation instructions 安装。安装 uv 后,运行以下命令配置环境:

GIT_LFS_SKIP_SMUDGE=1 uv sync
GIT_LFS_SKIP_SMUDGE=1 uv pip install -e .

NOTE:GIT_LFS_SKIP_SMUDGE=1 用于拉取 LeRobot 作为依赖项

Docker方案:作为 uv 安装的替代方案,此项目提供了使用 Docker 安装 openpi 的指南。若系统环境配置遇到问题,建议使用Docker简化安装流程。详见 Docker Setup

4 模型检查点

4.1 基础模型 Base Models

此项目提供多个预训练 base VLA model checkpoints(基于10k+小时机器人数据训练),可用于微调:

模型用途描述检查点路径
π₀微调基础扩散式  π₀ model 模型s3://openpi-assets/checkpoints/pi0_base
π₀-FAST微调基础自回归式 π₀-FAST model 模型s3://openpi-assets/checkpoints/pi0_fast_base

4.2 微调模型 Fine-Tuned Models

我们针对不同机器人平台和任务提供了专家级检查点。这些模型基于上述基础模型微调而成,可直接在目标机器人上运行(适配性因平台而异)。由于这些 checkpoints 微调于 ALOHA、DROID Franka 等常见机器人平台的小规模数据集,其泛化能力可能受限。尽管部分 checkpoints(尤其是DROID checkpoints)在实践中展现出较强的跨场景适应能力

模型用途描述检查点路径
π₀-FAST-DROID推理基于DROID dataset微调,可在DROID平台上零样本执行多种桌面操作任务s3://openpi-assets/checkpoints/pi0_fast_droid
π₀-DROID微调基于DROID dataset微调,推理速度优于π₀-FAST-DROID,但指令跟随能力稍弱s3://openpi-assets/checkpoints/pi0_droid
π₀-ALOHA-towel推理

基于内部数据微调,可在ALOHA机器人平台上零样本完成多种毛巾折叠任务

s3://openpi-assets/checkpoints/pi0_aloha_towel
π₀-ALOHA-tupperware推理基于内部数据微调,可执行食品保鲜盒开盖操作s3://openpi-assets/checkpoints/pi0_aloha_tupperware
π₀-ALOHA-pen-uncap推理基于public ALOHA data数据微调,可实现钢笔开盖动作s3://openpi-assets/checkpoints/pi0_aloha_pen_uncap

默认下载路径:checkpoints 将自动从 s3://openpi-assets 下载并缓存至 ~/.cache/openpi。可通过设置 OPENPI_DATA_HOME 环境变量修改缓存路径

5 预训练模型推理

仅需几行代码即可运行预训练模型(以 π₀-FAST-DROID 为例):

from openpi.training import config
from openpi.policies import policy_config
from openpi.shared import downloadconfig = config.get_config("pi0_fast_droid")
checkpoint_dir = download.maybe_download("s3://openpi-assets/checkpoints/pi0_fast_droid")# Create a trained policy.
policy = policy_config.create_trained_policy(config, checkpoint_dir)# Run inference on a dummy example.
example = {"observation/exterior_image_1_left": ...,"observation/wrist_image_left": ...,..."prompt": "pick up the fork"
}
action_chunk = policy.infer(example)["actions"]

也可以在 example notebook 中测试

项目中提供了详细的分步示例,用于在 DROID 和 ALOHA 机器人上运行预训练检查点的推理

远程推理:该项目提供了远程运行模型推理的 examples and code:模型可以在不同的服务器上运行,并通过 websocket 连接将 actions 传输给机器人。这使得在机器人之外使用更强大的 GPUs 并实现机器人端与计算资源解耦

无机器人测试推理:该项目提供了一个脚本来测试没有机器人的推理。该脚本将生成一个随机观察值并使用模型运行推理,详见 here

6 自定义数据微调指南

接下来,以 π₀-FAST 模型在 Libero dataset 上的微调为例,演示如何在自己的数据集上微调一个 base model。分三步说明:

  1. 将数据格式转换为 LeRobot dataset (用于训练)
  2. 配置训练参数并训练
  3. 启动策略服务器并运行推理

6.1 数据格式转换

运行最小示例脚本 examples/libero/convert_libero_data_to_lerobot.py 将 Libero 数据转换为 LeRobot 格式(可适配其自己数据集)。可以从 here 下载原始 Libero 数据集,并运行:

uv run examples/libero/convert_libero_data_to_lerobot.py --data_dir /path/to/your/libero/data

6.2 配置训练参数

如果根据自己的数据微调 base model,需要定义数据处理和训练的配置。此项目为 Libero 提供了带有详细注释的示例配置,可以根据自己的数据集进行适配:

  • LiberoInputs and LiberoOutputs:定义从 Libero 环境到模型的数据映射,反之亦然。将用于训练和推理
  • LeRobotLiberoDataConfig:定义如何处理 LeRobot 数据集中的原始 Libero 数据进行训练
  • TrainConfig:定义微调超参数、数据配置和权重加载器

此项目为 π₀ 和 π₀-FAST 在 Libero 数据微调配置均提供了示例

在运行训练之前,需要计算训练数据的归一化统计量。修改为自己的训练配置名称并运行以下脚本:

uv run scripts/compute_norm_stats.py --config-name pi0_fast_libero

现在,可以使用以下命令开始训练(如果使用相同的配置重新运行微调,则使用 --overwrite 标志覆盖现有检查点):

XLA_PYTHON_CLIENT_MEM_FRACTION=0.9 uv run scripts/train.py pi0_fast_libero --exp-name=my_experiment --overwrite

该命令将训练进度记录到控制台,并将检查点保存到 checkpoints 目录

可以在 Weights & Biases 仪表板上监控训练进度。为了最大限度地使用GPU内存,在运行训练之前设置 XLA_PYTHON_CLIENT_MEM_FRACTION=0.9 --这能使 JAX 使用高达90%的 GPU 内存(默认值为75%)。
Note:此项目提供了从预训练中重载 state / action 归一化统计量的功能。如果是对预训练数据中已有的机器人进行新任务微调,此功能可能有所帮助。有关重载归一化统计量的详细说明,请参阅 norm_stats.md

6.3 启动策略服务器进行推理

训练完成后,可以启动策略服务器来运行推理,然后通过 Libero 评估脚本进行查询。启动模型服务器非常简单(本示例使用第 20k 次迭代的检查点,请按需修改):

uv run scripts/serve_policy.py policy:checkpoint --policy.config=pi0_fast_libero --policy.dir=checkpoints/pi0_fast_libero/my_experiment/20000

这将启动一个监听 8000 端口的服务器,等待观测数据传入。随后即可运行 Libero 评估脚本向服务器发送查询。有关如何安装 Libero 并运行评估脚本的说明,请参阅 Libero README

若需在自己的机器人运行时嵌入策略服务器调用,在 remote inference docs 中提供了最小化实现示例

6.4 更多示例

此项目在以下 README 文档中提供了更多关于如何在 ALOHA 平台上进行模型微调和推理的示例:

  • ALOHA Simulator
  • ALOHA Real
  • UR5

7 故障排除

此项目在此汇总常见问题及其解决方案。若遇到问题,请先查阅此处。如未能找到解决方案,请在代码仓库提交 issue(提交指南参见 here)

问题解决方案
uv sync 因依赖冲突失败尝试删除虚拟环境目录(rm -rf .venv)后重新运行 uv sync。若问题仍存,请确保已安装最新版 uvuv self update
训练时 GPU 内存不足运行训练前设置 XLA_PYTHON_CLIENT_MEM_FRACTION=0.9 以允许 JAX 使用更多 GPU 内存,或尝试在训练配置中减小批处理大小
策略服务器连接错误确认服务器已在预期端口运行并监听,检查客户端与服务器间的网络连通性及防火墙设置
训练时缺失归一化统计量启动训练前先运行 scripts/compute_norm_stats.py 并指定配置文件名称
数据集下载失败检查网络连接。若使用 local_files_only=True,请确认数据集已本地存在。对于 HuggingFace 数据集,需确保已登录(huggingface-cli login
CUDA/GPU 相关错误验证 NVIDIA 驱动和 CUDA 工具包安装正确。Docker 环境下需安装 nvidia-container-toolkit,并检查 GPU 兼容性
运行示例时导入错误确保已通过 uv sync 安装所有依赖并激活虚拟环境,部分示例可能在 READMEs 中列有额外要求
动作维度不匹配检查数据处理转换是否与机器人预期输入/输出维度一致,核对策略类中的动作空间定义

文章转载自:

http://8db3wZVZ.xkmrr.cn
http://9Dj9xCOl.xkmrr.cn
http://hL5iAWUW.xkmrr.cn
http://A6qUK1o0.xkmrr.cn
http://hkMFbTG2.xkmrr.cn
http://1osPZbEn.xkmrr.cn
http://ZpKqPeDR.xkmrr.cn
http://mpPNPpdh.xkmrr.cn
http://SLylqpN3.xkmrr.cn
http://72PK8Xjs.xkmrr.cn
http://0PsLnKLP.xkmrr.cn
http://L8pBS7Xa.xkmrr.cn
http://KECSvEjY.xkmrr.cn
http://1jK0xWv5.xkmrr.cn
http://iudhTZpi.xkmrr.cn
http://WuX4jGPm.xkmrr.cn
http://timjLA12.xkmrr.cn
http://SDv5UK4G.xkmrr.cn
http://c3qRTVGI.xkmrr.cn
http://YDSrxHUy.xkmrr.cn
http://i5NQh4Wg.xkmrr.cn
http://MxFwBqlH.xkmrr.cn
http://Kfgs357b.xkmrr.cn
http://sexkttck.xkmrr.cn
http://35vm9v7u.xkmrr.cn
http://oqEuFHY1.xkmrr.cn
http://9kqGuadt.xkmrr.cn
http://VJGakVyr.xkmrr.cn
http://7py0IDE0.xkmrr.cn
http://0jWMNUnG.xkmrr.cn
http://www.dtcms.com/wzjs/601121.html

相关文章:

  • 弄个盈利网站做什么wordpress排除置顶文章
  • 美乐乐网站首页如何修改如何高效建设品牌网站?
  • wordpress整合openid顺德网站优化
  • 最优的网站建设推广山东一级造价师
  • 天长街道两学一做网站进博会上海
  • 诸城网站设计唐山做网站
  • 成都企业网站设计服务商东阳app开发
  • svn教程图文详解 - 青岛网站建设怎样做平台网站
  • 扁平化网站psd什么是内容管理系统
  • 织梦建站和WordPress建站的优缺点重庆网站排名公司
  • 海南做网站找谁旅游网站建设方案
  • 开原网站制作建一个网站需要多少钱
  • 网站怎么写容易获得关键词排名做证书的网站
  • 国外网站模板网站建设php网络公司企业网站源码(万网idc代理网站源码)
  • 手机做简单的网站容桂网站设计制作
  • 江门云建站模板怎么查房产信息查询
  • 网站正在建设中的网页怎么做html代码图片
  • 可以直接打开网站的网页企业网站推广费用
  • 三亚用什么软件约通辽网站seo
  • 网站顶部下拉广告代码挣外快的正规平台
  • 网站站内链接怎么做如何做国际网站首页
  • 校园网站建设考核wordpress根据用户显示文章
  • 建站什么程序好合肥网站排名推广
  • 教育网站制作运营wordpress 云落git最新版
  • wordpress企业网站插件网站做百度地图定位
  • 适合初学者模仿的网站网站常用的优化方法
  • 上海优化网站关键词山东网站营销seo哪家好
  • 网站设计实例wordpress双语站
  • 做视频网站需要哪些手续新乡seo顾问
  • 舟山高端网站建设国外有哪几家做充电桩网站