当前位置: 首页 > wzjs >正文

线上教学网站软文营销的五大注意事项

线上教学网站,软文营销的五大注意事项,如何做网站营销,学校网站建设开题报告书RDT-1B 论文 模型表达与泛化能力:由于双臂操作中动作空间维度是单臂空间的两倍,传统方法难以建模其多模态分布。 数据:双臂数据少且不同机器人的物理结构和动作空间差异(如关节数、运动范围)导致数据分布不一致&#x…

RDT-1B 论文
模型表达与泛化能力:由于双臂操作中动作空间维度是单臂空间的两倍,传统方法难以建模其多模态分布
数据:双臂数据少且不同机器人的物理结构和动作空间差异(如关节数、运动范围)导致数据分布不一致,直接合并训练可能引发负迁移(negative transfer)。

负迁移是迁移学习(Transfer Learning)中的一种现象,指在将一个领域(或任务)的知识迁移到另一个领域(或任务)时,由于源域(source domain)和目标域(target domain)之间的差异过大或不匹配,导致迁移后的模型性能反而比不迁移时更差
在这里插入图片描述
研究的是基于语言指令的双臂视觉操作。
给定一条语言指令 l \mathcal{l} l ,策略接受在时间 t ∈ N + t\in\mathbb{N}^+ tN+ 的观测 o t o_t ot,输出动作 a t a_t at。观测 o t : = X t − T i m g + 1 : t + 1 , z t , c o_t:={X_{t-T_{img}+1:t+1},z_t,c} ot:=XtTimg+1:t+1,zt,c 其中 X t − T i m g + 1 : t + 1 : = { X t − T i m g + 1 , … … , X t } X_{t-T_{img}+1:t+1}:=\{X_{t-T_{img}+1},……,X_t\} XtTimg+1:t+1:={XtTimg+1,……,Xt} 为 长度为 T i m g T_{img} Timg 的 RGB 视觉观测历史序列。 z t z_t zt 表示机器人在当前时刻的低维本体感知(如关节角度,末端位姿等),c 表示控制频率。(频率是为了让模型考虑数据集中不同控制频率带来的挑战)
在大规模多机器人数据集 D p r e \mathcal{D}_{pre} Dpre (主要为单臂数据)上预训练模型,然后在目标机器人数据集 D f t \mathcal{D}_{ft} Dft 上微调: D = { ( l ( i ) , o t ( i ) , a t ( i ) ) ∣ 0 ≤ t < T ( i ) , 1 ≤ i < N } \mathcal{D}=\{(\mathcal{l}^{(i)},o_t^{(i)},a_t^{(i)})|0≤t<T^{(i)},1≤i<N\} D={(l(i),ot(i),at(i))∣0t<T(i),1i<N} 其中 T ( i ) T^{(i)} T(i) 是第 i 条轨迹长度,N 是轨迹数量。

  • 如果将策略建模为确定性映射 ( l , o t ) − > a t (\mathcal{l},o_t)->a_t (l,ot)>at 并回归训练数据中的 ( l ( i ) , o t ( i ) , a t ( i ) ) (\mathcal{l}^{(i)},o_t^{(i)},a_t^{(i)}) (l(i),ot(i),at(i))。策略将学习动作的“平均值”,且由于机器人的物理量(动作和本体感受)是非线性动态不稳定。故而选择建模条件分布。
    通过如下公式,得到扩散建模:
    a t k − 1 = α ˉ k − 1 β k 1 − α ˉ k a t 0 + α k ( 1 − α ˉ k − 1 ) 1 − α ˉ k a t k + σ k z , k = K , … , 1 β k = 1 − α k α ˉ k − 1 : = ∏ i = 1 k − 1 α i \begin{aligned}a_t^{k-1}=\frac{\sqrt{\bar{\alpha}^{k-1}}\beta^k}{1-\bar{\alpha}^k}a_t^0+\frac{\sqrt{\alpha^k}(1-\bar{\alpha}^{k-1})}{1-\bar{\alpha}^k}a_t^k+\sigma^k\boldsymbol{z},\quad k=K,\ldots,1 \\\beta^k=1-\alpha^k\qquad \bar{\alpha}^{k-1}:=\prod^{k-1}_{i=1}\alpha^i\end{aligned} atk1=1αˉkαˉk1 βkat0+1αˉkαk (1αˉk1)atk+σkz,k=K,,1βk=1αkαˉk1:=i=1k1αi
    在这里插入图片描述

异构性数据输入,且兼容多模态:

  • 低维输入是表示机器人物理量的低维向量,采用带傅里叶特征的 MLP,捕捉高频变化。对于每个机器人,用单一的空间容纳 z t z_t zt a t a_t at a t a_t at 通常是 z t + 1 z_{t+1} zt+1 的一个子集)。设计一个统一的空间——根据其物理意义将原始动作向量的每个元素填充到统一动作空间向量的相应位置,将机器人的动作空间嵌入到这个统一空间中,剩余的位置则进行填充。在这里插入图片描述
  • 图像输入是高维的(1152)采用 SigLIP 编码,有三个视图——静态外部视图、右手腕视图和左手腕视图,选择两帧作为一个输入 X t − 1 : t + 1 : = ( { X t − 1 1 , X t − 1 2 , X t − 1 3 } , { X t 1 , X t 2 , X t 3 } ) X_{t-1:t+1}:=(\{X_{t-1}^1,X_{t-1}^2,X_{t-1}^3\},\{X_{t}^1,X_{t}^2,X_{t}^3\}) Xt1:t+1:=({Xt11,Xt12,Xt13},{Xt1,Xt2,Xt3})
  • 语言输入采取 T5-XXL 编码

修改网络 DiT(解决不稳定性和非线性特征):

  • 采取 QKNorm 解决计算注意力时的不稳定性问题,同时该任务可被视为时间序列预测任务,原始 DiT 的 LayerNorm 的中心化操作可能导致 token 偏移和注意力偏移,从而破坏时间序列的对称性,采取没有中心操作的 RMSNorm。(传感器失灵等导致机器人数据出现极端值,可能导致梯度不稳定和数值溢出等)。
  • 为提高机器人对非线性动作的逼近能力,用非线性 MLP 替换最终的线性解码器。
  • 在连续层的交叉注意力策略性交替注入文本和图像(图像的维度远高于文本维度,同时将两种模态注入主干网络,往往图像会淹没文本)。

实验结果

在这里插入图片描述

http://www.dtcms.com/wzjs/189215.html

相关文章:

  • 二级域名做网站好不好杭州网站推广公司
  • 做好产品策划的重要性seo关键词排名报价
  • 品牌网站建设解决方案营销的方法手段有哪些
  • 帮客户做ppt什么的在哪个网站百度seo收录
  • 做网站会什么软件网店推广方式有哪些
  • 政府网站维护方案十大免费无代码开发软件
  • 做设计必知网站永久免费linux服务器
  • 郑州做网站报价站域名多少钱百度搜首页
  • 做游戏模型参考的网站yw77731域名查询
  • wordpress文章列表模板seo和sem的区别是什么?
  • 做网站需要关注哪些青岛seo建站
  • 杭州网站制作关键词优化的作用
  • 网站建设 ui设计舆情分析系统
  • 做网站都用什么技术网站收录软件
  • 淘宝网站开发的意义今天的新闻
  • 建设一个网站平台的费用合肥关键词优化平台
  • 南通通州建设工程质量监督网站seo搜索引擎优化的内容
  • 昆明云南微网站搭建外贸谷歌推广怎么样
  • 高端网站建设北京如何优化推广中的关键词
  • 揭阳网站制作企业2023最近的新闻大事10条
  • 道真县住房和城乡建设局网站定制网站建设电话
  • 深圳燃气公司客服网站优化的方法与技巧
  • 个体工商户是否能够做网站搜索引擎网站优化和推广方案
  • 珠海建网站公司新平台怎么推广
  • 学习网页设计中遇到的心得体会seo求职
  • 静态网站开发 内容哪个公司的网站制作
  • 做网站得每年续费吗天津疫情最新消息
  • 什么网站可以接效果图做国内哪个搜索引擎最好用
  • 什么专业学做网站百度app登录
  • 个人网站建设公司百度搜索指数和资讯指数