当前位置: 首页 > news >正文

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

视频讲解:

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

今天介绍下stable_baselines3和gym,可以方便实现DL的实现,应用在机械臂catch、reach等场景

测试代码仓库:https://github.com/LitchiCheng/DRL-learning.git

https://stable-baselines3.readthedocs.io/en/master/

stable_baselines3 是一个用于深度强化学习的开源 Python 库,基于 PyTorch 构建,内置了像PPO、DDPG 等算法

pip3 install stable-baselines3

https://www.gymlibrary.dev/

OpenAI Gym 用于提供一系列标准化的环境,这些环境主要的接口方法包括 reset() 用于重置环境状态,step(action) 用于执行一个动作并返回新的状态、奖励、是否终止等信息

pip3 install gym

新建python代码CartPole-byStablebaselines3.py

使用gym和stable_baselines3训练下倒立摆CartPole-v1

import gym
from stable_baselines3 import PPOenv = gym.make('CartPole-v1', render_mode="human")
model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)
model.save("ppo_cartpole")
env.close()

相关文章:

  • 【教学类-102-17】蝴蝶三色图(用最大长宽作图,填入横板和竖版共16个WORD单元格模版大小,制作大小图)
  • Java 环境配置详解(Windows、macOS、Linux)
  • 【Leetcode 每日一题】1399. 统计最大组的数目
  • 第52讲:农业AI + 区块链——迈向可信、智能、透明的未来农业
  • 大模型框架技术演进与全栈实践指南
  • 1.5软考系统架构设计师:架构师的角色与能力要求 - 超简记忆要点、知识体系全解、考点深度解析、真题训练附答案及解析
  • Elasticsearch 报错 Limit of total fields [1000] has been exceeded
  • Postman忘记密码访问官网总是无响应
  • SpringCloud 微服务复习笔记
  • 第七篇:linux之基本权限、进程管理、系统服务
  • Linux[指令与权限]
  • Vm免安装直接使用虚拟机win7系统
  • 每日算法-250423
  • VR 全景看车的独特优势​
  • 从0到1掌握机器学习核心概念:用Python亲手构建你的第一个AI模型(超多代码+可视化)
  • 具身智能操作知识梳理与拓展
  • Springfox + Swagger 的完整配置及同类框架对比的详细说明
  • JavaScript 渲染内容爬取:Puppeteer 高级技巧与实践
  • 服务器-conda下载速度慢-国内源
  • Unity进阶课程【五】WebGL 打包文件本地运行报错解决 - 局域网、无限制人数、本地服务
  • AI智能体,是不是可以慢一点? | ToB产业观察
  • 哥伦比亚总统称将在访华期间签署“一带一路”倡议意向书,外交部回应
  • 李云泽:将尽快推出支持小微企业民营企业融资一揽子政策
  • 福特汽车撤回业绩指引,警告关税或造成15亿美元利润损失
  • 无人机穿越大理崇圣寺千年古塔时“炸机”,当地:肇事者已找到,将被追责
  • 美CIA发布视频“招募中国官员窃取机密”,外交部:赤裸裸的政治挑衅