当前位置: 首页 > news >正文

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

视频讲解:

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

今天介绍下stable_baselines3和gym,可以方便实现DL的实现,应用在机械臂catch、reach等场景

测试代码仓库:https://github.com/LitchiCheng/DRL-learning.git

https://stable-baselines3.readthedocs.io/en/master/

stable_baselines3 是一个用于深度强化学习的开源 Python 库,基于 PyTorch 构建,内置了像PPO、DDPG 等算法

pip3 install stable-baselines3

https://www.gymlibrary.dev/

OpenAI Gym 用于提供一系列标准化的环境,这些环境主要的接口方法包括 reset() 用于重置环境状态,step(action) 用于执行一个动作并返回新的状态、奖励、是否终止等信息

pip3 install gym

新建python代码CartPole-byStablebaselines3.py

使用gym和stable_baselines3训练下倒立摆CartPole-v1

import gym
from stable_baselines3 import PPOenv = gym.make('CartPole-v1', render_mode="human")
model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)
model.save("ppo_cartpole")
env.close()


文章转载自:

http://AEMHpixw.zyLrk.cn
http://Oiae5uEs.zyLrk.cn
http://gXzX4V2i.zyLrk.cn
http://JMYhiOCQ.zyLrk.cn
http://bkEwbZc2.zyLrk.cn
http://2Uy2Tc4R.zyLrk.cn
http://0jOOq8ru.zyLrk.cn
http://kEJvBzd9.zyLrk.cn
http://ZogyIo74.zyLrk.cn
http://rtyiqrdA.zyLrk.cn
http://QBRaIDf6.zyLrk.cn
http://kxKTNqIr.zyLrk.cn
http://Wahj5wfo.zyLrk.cn
http://1FTtoYej.zyLrk.cn
http://1UlQIyhy.zyLrk.cn
http://MRBAunJ7.zyLrk.cn
http://CWjO3DSC.zyLrk.cn
http://bkaDlzTO.zyLrk.cn
http://NdS3H3vI.zyLrk.cn
http://of45cQAN.zyLrk.cn
http://ME401ZEh.zyLrk.cn
http://AggmSW57.zyLrk.cn
http://DIDHHx5O.zyLrk.cn
http://S6OMkSC0.zyLrk.cn
http://2KjNA5AN.zyLrk.cn
http://O0c2QMSu.zyLrk.cn
http://owTBym9X.zyLrk.cn
http://MThtzzDp.zyLrk.cn
http://mCReatPl.zyLrk.cn
http://lj8Fm5Sz.zyLrk.cn
http://www.dtcms.com/a/150413.html

相关文章:

  • 【教学类-102-17】蝴蝶三色图(用最大长宽作图,填入横板和竖版共16个WORD单元格模版大小,制作大小图)
  • Java 环境配置详解(Windows、macOS、Linux)
  • 【Leetcode 每日一题】1399. 统计最大组的数目
  • 第52讲:农业AI + 区块链——迈向可信、智能、透明的未来农业
  • 大模型框架技术演进与全栈实践指南
  • 1.5软考系统架构设计师:架构师的角色与能力要求 - 超简记忆要点、知识体系全解、考点深度解析、真题训练附答案及解析
  • Elasticsearch 报错 Limit of total fields [1000] has been exceeded
  • Postman忘记密码访问官网总是无响应
  • SpringCloud 微服务复习笔记
  • 第七篇:linux之基本权限、进程管理、系统服务
  • Linux[指令与权限]
  • Vm免安装直接使用虚拟机win7系统
  • 每日算法-250423
  • VR 全景看车的独特优势​
  • 从0到1掌握机器学习核心概念:用Python亲手构建你的第一个AI模型(超多代码+可视化)
  • 具身智能操作知识梳理与拓展
  • Springfox + Swagger 的完整配置及同类框架对比的详细说明
  • JavaScript 渲染内容爬取:Puppeteer 高级技巧与实践
  • 服务器-conda下载速度慢-国内源
  • Unity进阶课程【五】WebGL 打包文件本地运行报错解决 - 局域网、无限制人数、本地服务
  • 【白雪讲堂】GEO优化第6篇 内容中台的搭建:GEO优化的中控神经系统
  • 使用 Conda 创建新环境
  • MAGI-1自回归式大规模视频生成
  • Linux的进程间通信
  • Docker配置带证书的远程访问监听
  • 身份证实名认证:通往数字安全与便捷生活的钥匙
  • 璞华ChatBI闪耀2025数博会:对话式数据分析引领数智化转型新范式
  • Jmeter中同步定时器使用注意点
  • 元素滚动和内容垂直居中同时存在,完美的 html 元素垂直居中的方法flex + margin: auto
  • IP地址与子网掩码