当前位置: 首页 > wzjs >正文

足球教学网站论坛seo招聘

足球教学网站,论坛seo招聘,沈阳定制网站开发公司,佛山网站建设费用预算RDT-1B 论文 模型表达与泛化能力:由于双臂操作中动作空间维度是单臂空间的两倍,传统方法难以建模其多模态分布。 数据:双臂数据少且不同机器人的物理结构和动作空间差异(如关节数、运动范围)导致数据分布不一致&#x…

RDT-1B 论文
模型表达与泛化能力:由于双臂操作中动作空间维度是单臂空间的两倍,传统方法难以建模其多模态分布
数据:双臂数据少且不同机器人的物理结构和动作空间差异(如关节数、运动范围)导致数据分布不一致,直接合并训练可能引发负迁移(negative transfer)。

负迁移是迁移学习(Transfer Learning)中的一种现象,指在将一个领域(或任务)的知识迁移到另一个领域(或任务)时,由于源域(source domain)和目标域(target domain)之间的差异过大或不匹配,导致迁移后的模型性能反而比不迁移时更差
在这里插入图片描述
研究的是基于语言指令的双臂视觉操作。
给定一条语言指令 l \mathcal{l} l ,策略接受在时间 t ∈ N + t\in\mathbb{N}^+ tN+ 的观测 o t o_t ot,输出动作 a t a_t at。观测 o t : = X t − T i m g + 1 : t + 1 , z t , c o_t:={X_{t-T_{img}+1:t+1},z_t,c} ot:=XtTimg+1:t+1,zt,c 其中 X t − T i m g + 1 : t + 1 : = { X t − T i m g + 1 , … … , X t } X_{t-T_{img}+1:t+1}:=\{X_{t-T_{img}+1},……,X_t\} XtTimg+1:t+1:={XtTimg+1,……,Xt} 为 长度为 T i m g T_{img} Timg 的 RGB 视觉观测历史序列。 z t z_t zt 表示机器人在当前时刻的低维本体感知(如关节角度,末端位姿等),c 表示控制频率。(频率是为了让模型考虑数据集中不同控制频率带来的挑战)
在大规模多机器人数据集 D p r e \mathcal{D}_{pre} Dpre (主要为单臂数据)上预训练模型,然后在目标机器人数据集 D f t \mathcal{D}_{ft} Dft 上微调: D = { ( l ( i ) , o t ( i ) , a t ( i ) ) ∣ 0 ≤ t < T ( i ) , 1 ≤ i < N } \mathcal{D}=\{(\mathcal{l}^{(i)},o_t^{(i)},a_t^{(i)})|0≤t<T^{(i)},1≤i<N\} D={(l(i),ot(i),at(i))∣0t<T(i),1i<N} 其中 T ( i ) T^{(i)} T(i) 是第 i 条轨迹长度,N 是轨迹数量。

  • 如果将策略建模为确定性映射 ( l , o t ) − > a t (\mathcal{l},o_t)->a_t (l,ot)>at 并回归训练数据中的 ( l ( i ) , o t ( i ) , a t ( i ) ) (\mathcal{l}^{(i)},o_t^{(i)},a_t^{(i)}) (l(i),ot(i),at(i))。策略将学习动作的“平均值”,且由于机器人的物理量(动作和本体感受)是非线性动态不稳定。故而选择建模条件分布。
    通过如下公式,得到扩散建模:
    a t k − 1 = α ˉ k − 1 β k 1 − α ˉ k a t 0 + α k ( 1 − α ˉ k − 1 ) 1 − α ˉ k a t k + σ k z , k = K , … , 1 β k = 1 − α k α ˉ k − 1 : = ∏ i = 1 k − 1 α i \begin{aligned}a_t^{k-1}=\frac{\sqrt{\bar{\alpha}^{k-1}}\beta^k}{1-\bar{\alpha}^k}a_t^0+\frac{\sqrt{\alpha^k}(1-\bar{\alpha}^{k-1})}{1-\bar{\alpha}^k}a_t^k+\sigma^k\boldsymbol{z},\quad k=K,\ldots,1 \\\beta^k=1-\alpha^k\qquad \bar{\alpha}^{k-1}:=\prod^{k-1}_{i=1}\alpha^i\end{aligned} atk1=1αˉkαˉk1 βkat0+1αˉkαk (1αˉk1)atk+σkz,k=K,,1βk=1αkαˉk1:=i=1k1αi
    在这里插入图片描述

异构性数据输入,且兼容多模态:

  • 低维输入是表示机器人物理量的低维向量,采用带傅里叶特征的 MLP,捕捉高频变化。对于每个机器人,用单一的空间容纳 z t z_t zt a t a_t at a t a_t at 通常是 z t + 1 z_{t+1} zt+1 的一个子集)。设计一个统一的空间——根据其物理意义将原始动作向量的每个元素填充到统一动作空间向量的相应位置,将机器人的动作空间嵌入到这个统一空间中,剩余的位置则进行填充。在这里插入图片描述
  • 图像输入是高维的(1152)采用 SigLIP 编码,有三个视图——静态外部视图、右手腕视图和左手腕视图,选择两帧作为一个输入 X t − 1 : t + 1 : = ( { X t − 1 1 , X t − 1 2 , X t − 1 3 } , { X t 1 , X t 2 , X t 3 } ) X_{t-1:t+1}:=(\{X_{t-1}^1,X_{t-1}^2,X_{t-1}^3\},\{X_{t}^1,X_{t}^2,X_{t}^3\}) Xt1:t+1:=({Xt11,Xt12,Xt13},{Xt1,Xt2,Xt3})
  • 语言输入采取 T5-XXL 编码

修改网络 DiT(解决不稳定性和非线性特征):

  • 采取 QKNorm 解决计算注意力时的不稳定性问题,同时该任务可被视为时间序列预测任务,原始 DiT 的 LayerNorm 的中心化操作可能导致 token 偏移和注意力偏移,从而破坏时间序列的对称性,采取没有中心操作的 RMSNorm。(传感器失灵等导致机器人数据出现极端值,可能导致梯度不稳定和数值溢出等)。
  • 为提高机器人对非线性动作的逼近能力,用非线性 MLP 替换最终的线性解码器。
  • 在连续层的交叉注意力策略性交替注入文本和图像(图像的维度远高于文本维度,同时将两种模态注入主干网络,往往图像会淹没文本)。

实验结果

在这里插入图片描述

http://www.dtcms.com/wzjs/238913.html

相关文章:

  • 哈尔滨网站建设专卖西安网站建设推广优化
  • 南通外贸网站建设whois域名查询
  • 现代感网站收录是什么意思
  • 不做网站只做推广可以么刷seo关键词排名软件
  • 做网站编辑要有逻辑吗推广普通话手抄报内容怎么写
  • 美国一级a做爰片免费网站 视频播放常德seo招聘
  • 网站搬家 数据库企业邮箱申请
  • 晚上必看的正能量直播app上海网站seo快速排名
  • 北京南站地图315影视行业
  • 我要学做网站网盘搜索神器
  • 威海做网站的公司哪家好怎么找一手app推广代理
  • 怎么做网站代码查网站流量查询工具
  • 网站建设模板可用吗西安今天出大事
  • 柳州公积金网站友情链接翻译
  • 小网站模板seo网站推广方案策划书
  • 最新备案的网站云服务器免费
  • 大连网站维护地推网推平台
  • 英迈思做的网站怎么样自己开一个培训机构流程
  • 网站如何做excel预览安卓aso优化排名
  • 上海信息价查询造价信息网电脑系统优化软件哪个好用
  • 上海建站网站营销网站建设免费
  • 快速制作网页谷歌seo博客
  • 福州建站模板厂家北京百度快照推广公司
  • 营销型网站的基础建设seo排名
  • 荆门做网站推广渠道有哪些方式
  • 免费1级做爰网站新媒体营销策略
  • 个人做健康网站好吗刷赞网站推广免费链接
  • 网站做404是什么意思最近发生的重大新闻
  • 唐山网站制作沈阳seo按天计费
  • 网站备案信息怎么做seo短视频网页入口引流