当前位置: 首页 > news >正文

项目商业网站建设方案长春市网站优化公司

项目商业网站建设方案,长春市网站优化公司,前端开发工程师需要具备哪些能力,我想建立个网站数据怎么办ALOHA 论文 ALOHA 解决了策略中的错误可能随时间累积,且人类演示可能是非平稳的,提出了 ACT(Action Chunking with Transformers) 方法。 Action Chunking 模仿学习中,compounding error 是致使任务失败的主要原因。具…

ALOHA 论文

ALOHA 解决了策略中的错误可能随时间累积,且人类演示可能是非平稳的,提出了 ACT(Action Chunking with Transformers) 方法。

Action Chunking

模仿学习中,compounding error 是致使任务失败的主要原因。具体来说,当智能体(agent)在测试时遇到训练集中未见过的情况时,可能会产生预测误差。这些误差会逐步累积,导致智能体进入未知状态,最终任务失败。ALOHA 通过引入 Action ChunkingCVAE(Conditional Variational Autoencoder)来解决这一问题,显著减少了错误累积的影响。

在传统的模仿学习中,策略模型通常预测单步动作 π θ ( a t ∣ s t ) \pi_\theta(a_t|s_t) πθ(atst),即根据当前状态 s t s_t st​ 预测下一个动作 a t a_t at。然而,这种单步预测的方式容易导致误差累积,尤其是在长时间任务中。
在这里插入图片描述
为了减小 compounding error,引入了 Action Chunking,具体来说,模型不再预测单步动作,而是预测一个动作序列。
具体步骤如下:

  • Chunk Size 设置:将动作序列划分为大小为 kk 的块(chunk),每 kk 步,智能体获取一次输入,并预测接下来的 k 步动作。
  • 轨迹长度缩减:轨迹长度被缩小到了 1 k \frac{1}{k} k1
  • 策略模型发生变化:由预测单步 π θ ( a t ∣ s t ) \pi_\theta(a_t|s_t) πθ(atst) 变为 π θ ( a t : t + k ∣ s i ) \pi_\theta(a_{t:t+k}|s_i) πθ(at:t+ksi)
    为使轨迹更平滑,ALOHA 提出 temporal ensemble,对 k 个对同一动作的预测,采取加权的方式求和,权重 w i = e x p − m ∗ i w_i = exp^{-m*i} wi=expmi 。这种方法可以有效减少动作序列中的抖动,使动作更加平滑。

CVAE

对于 Action Chunking 中的预测,采取 condition + VAE 的方式训练,并采用 encoder-decoder 架构(transformer)。

输入信息包括:(此处不使用图像输入时为了加速训练)

  • CLS 分类标签:表明类别,类似 BERT 的做法。
  • 关节角:机器人当前的关节状态
  • 动作序列:历史动作序列
  • 位置嵌入:表示时间步的位置信息
    不同之处这只是通过 encoder 来训练 decoder,在推理时丢弃 encoder 部分。

伪代码如下:

在这里插入图片描述

http://www.dtcms.com/a/488022.html

相关文章:

  • Oracle下载JDK无需登录
  • 模拟算法专题总结:直接按题意实现的艺术
  • 昭阳区住房和城乡建设管理局网站网站建设最低价
  • 济南市住房和城乡建设局网站wordpress多图主题
  • TOP TOY闯关港股上市:三大关键挑战亟待破局,品牌如何独立增长?
  • TDengine 数学函数 FLOOR 用户手册
  • 第三方课题验收测试机构:【API测试工具Apifox使用指南】
  • 前端-APIs-day2
  • 织梦个人网站模板西安旅游
  • 个人网站设计与实现源码在线做网站黄
  • Highcharts 绘制之道(1):用数据构建基础图形
  • 【机器学习02】梯度下降、多维特征线性回归、特征缩放
  • 一个网站每年维护费用品牌营销网站
  • 有哪些做的很漂亮的网站商城小程序介绍
  • Vue3+Three.js:第05期 时间控制,requestAnimationFrame vs Clock
  • 松江做微网站电子商务网站的优点有那些
  • 个体营业执照网站备案做网站都需要用到什么
  • Python CGI 编程
  • 网页传奇平台优化关键词的作用
  • 定制网站建设和运营网站开发合同履约
  • java枚举能继承接口吗
  • 三分钟学懂3D建模中的UV Position Map
  • 广州网站推广公司wordpress 教学
  • 做外贸的网站哪个好cent7.4安装wordpress
  • 网站建设电话销售网站app生成器下载
  • 网站seo关键词排名优化wordpress自动发文章工具
  • /etc/login.defs vs chage:什么时候用什么?
  • 10.15 作业
  • seo短视频网页入口引流在线观看网站网站友情链接美化代码
  • 机器视觉旋转标定算法+补偿角度计算讲解(现场应用版)