当前位置: 首页 > news >正文

Inverse Reinforcement Learning with Natural Language Goals论文阅读

标题:Inverse Reinforcement Learning with Natural Language Goals

作者:Li Zhou, Kevin Small

单位: 亚马逊Alexa

发表会议:AAAI

发表时间:2021年

论文研究主题归类:逆强化学习与自然语言

1.论文解决什么问题

机器人理解NL目标并将其映射到状态和操作序列比较难。目前学到的方法在推广到新的NL目标和环境方面时,会很困难。在本文中,作者提出了一种新的对抗性逆强化学习算法来学习语言条件策略和奖励函数。为了改进学习策略和奖励函数的泛化,作者使用一个可变目标生成器来重新标记轨迹,并在训练期间对不同的目标进行采样。在基于视觉的NL指令跟踪数据集上,算法大大优于多个基线,这表明在使用NL指令指定智能体目标方面取得了可喜的进步。

2.是否有公开的数据集及源代码

数据集:R2R Dataset | Papers With Code

源代码:未公开

3.论文的主要观点

机器人理解NL目标并将其映射到状态和操作序列比较难。目前学到的方法在推广到新的NL目标和环境方面时,会很困难。通过逆强化学习方法。来学习自然语言的奖励函数,从而让智能体能够更好的学习策略。对NL指令能够更好的解读和使用。

http://www.dtcms.com/a/124728.html

相关文章:

  • 隐藏源站IP与SD-WAN回源优化:高防架构的核心实践
  • Elasticsearch 全面解析
  • 数据结构——哈希技术及链地址法
  • 推荐一款Nginx图形化管理工具: NginxWebUI
  • 工业科学级天文相机:跨界融合的高精密成像解决方案
  • wsl2+ubuntu22.04安装blender教程(详细教程)
  • Deep Learning based Prediction Model for Adaptive Video Streaming论文简报
  • 从数据海洋中“淘金”——数据挖掘的魔法与实践
  • 深度解析 AutoGLM:智能时代的多面手
  • Android Input——查找并添加目标窗口(七)
  • 解决MYSQL不能远程登陆问题
  • ubuntu24.04 cmake 报错 libldap-2.5.so.0 解决办法
  • docker 容器正常启动但是连接不上
  • 2025年4月通信科技领域周报(3.31-4.06):6G技术加速落地与全连接生态构建
  • Redis——实现消息队列
  • 【langchain库名解析】
  • Vue环境搭建:vue+idea
  • 几款开源网盘的比较
  • windows 安装 pygame( pycharm)
  • 基于DNS的负载均衡和反向代理负载均衡
  • 川翔云电脑:D5 渲染摆脱硬件限制,云端高效创作
  • 2025年常见渗透测试面试题-sql(题目+回答)
  • oracle常见问题处理集锦
  • 深入解析以太坊虚拟机(EVM)架构与状态机特性
  • 【HarmonyOS 5】鸿蒙中@State的原理详解
  • ​​IPerf工具使用笔记(基于MobaXterm串口终端)​
  • 页面编辑器CodeMirror初始化不显示行号或文本内容
  • docker内安装达梦8数据库
  • PhotoShop学习09
  • 设计模式:单例模式