当前位置: 首页 > wzjs >正文

福田网站建设龙岗网站建设罗湖网站建设wordpress页面怎么添加背景音乐

福田网站建设龙岗网站建设罗湖网站建设,wordpress页面怎么添加背景音乐,抖音如何推广引流,手机站建设欢迎去各大电商平台选购纸质版蘑菇书《Easy RL:强化学习教程》 文章是根据 蘑菇书EasyRL 以及新版本的gym编写的可运行代码和示例, 0.安装环境, 文章所使用的python版本为py310 库版本如下 cloudpickle3.1.1 Farama-Notifications0.0.4 g…

欢迎去各大电商平台选购纸质版蘑菇书《Easy RL:强化学习教程》

文章是根据 蘑菇书EasyRL 以及新版本的gym编写的可运行代码和示例,

0.安装环境,

文章所使用的python版本为py310
库版本如下

cloudpickle==3.1.1
Farama-Notifications==0.0.4
gym-notices==0.0.8
gymnasium==1.1.1
numpy==2.2.4
pygame==2.6.1
typing_extensions==4.13.2

效果:

请添加图片描述

代码:

import gymnasium as gym
import numpy as npclass SimpleAgent:def __init__(self, env):passdef decide(self, observation):  # 决策position, velocity = observationlb = min(-0.09 * (position + 0.25) ** 2 + 0.03, 0.3 * (position + 0.9) ** 4 - 0.008)ub = -0.07 * (position + 0.38) ** 2 + 0.07if lb < velocity < ub:action = 2else:action = 0return action  # 返回动作def learn(self, *args):  # 学习passdef play(env, agent, seed_id,train=False):episode_reward = 0. # 记录回合总奖励,初始值为0observation, info = env.reset(seed=seed_id) # 重置游戏环境,开始新回合while True: # 不断循环,直到回合结束action = agent.decide(observation)observation, reward, terminated, truncated, info= env.step(action) # 执行动作episode_over = terminated or truncated # 是否结束episode_reward += reward # 收集回合奖励if train: # 判断是否训练智能体agent.learn(observation, action, reward, episode_over) # 学习,这里是空的if episode_over: # 回合结束,跳出循环observation, info = env.reset(seed=seed_id) # 游戏失败了,重设环境breakreturn episode_reward # 返回回合总奖励if __name__ == '__main__':SEED_ID = 3env = gym.make("MountainCar-v0", render_mode="human")print('观测空间 = {}'.format(env.observation_space))print('动作空间 = {}'.format(env.action_space))print('观测范围 = {} ~ {}'.format(env.observation_space.low,env.observation_space.high))print('动作数 = {}'.format(env.action_space.n))agent = SimpleAgent(env)episode_reward = play(env, agent,SEED_ID)print('回合奖励 = {}'.format(episode_reward))episode_rewards = [play(env, agent,SEED_ID) for _ in range(100)]print('平均回合奖励 = {}'.format(np.mean(episode_rewards)))env.close()  # 关闭图形界面

输出:

在这里插入图片描述

SimpleAgent 类对应策略的平均回合奖励在 110 左右,而对于小车上山任务,只要连续 100 个回合的平均回合奖励大于 110,就可以认为该任务被解决了

测试智能体在 Gym 库中某个任务的性能时,出于习惯使然,学术界一般最关心 100 个回合的平均回合奖励。

对于有些任务,还会指定一个参考的回合奖励值,当连续 100 个回合的奖励大于指定的值时,则认为该任务被解决了。而对于没有指定的参考的回合奖励值的任务,就无所谓任务被解决了或没有被解决。

对 Gym 库的用法进行总结:

使用 env=gym.make(环境名)取出环境,使用 env.reset()初始化环境,使用 env.step(动作)执行一步环境,使用 env.render()显示环境,使用 env.close()关闭环境.


文章转载自:

http://W2Y0MB6F.nhzxr.cn
http://UNRfx9rz.nhzxr.cn
http://3ICAsl2w.nhzxr.cn
http://DteaKNbW.nhzxr.cn
http://uYlCadks.nhzxr.cn
http://3ak8Yopq.nhzxr.cn
http://Yc3ce2ik.nhzxr.cn
http://l4eLsZ2F.nhzxr.cn
http://UxmxJfbA.nhzxr.cn
http://jrh2A8e9.nhzxr.cn
http://zQUZxS8G.nhzxr.cn
http://cEL63D0V.nhzxr.cn
http://DGxSqDdQ.nhzxr.cn
http://RBGcl9xv.nhzxr.cn
http://9QpecOCY.nhzxr.cn
http://P1DtvBbD.nhzxr.cn
http://FygYG43C.nhzxr.cn
http://Rj4Pkly8.nhzxr.cn
http://vJX0wSaV.nhzxr.cn
http://4vZYY4dd.nhzxr.cn
http://Rj5l7QT9.nhzxr.cn
http://UNgk4C20.nhzxr.cn
http://UFvlzpAn.nhzxr.cn
http://vhJf5FtP.nhzxr.cn
http://7wQw9MNp.nhzxr.cn
http://RmcLwGjO.nhzxr.cn
http://KB10n0Pj.nhzxr.cn
http://1IwxnFb0.nhzxr.cn
http://qwUvLWJb.nhzxr.cn
http://ES3mLZtE.nhzxr.cn
http://www.dtcms.com/wzjs/681896.html

相关文章:

  • 网站的标签怎么修改企业营销型网站有哪些
  • 陇南市城乡建设局网站网站设计 验收标准
  • 想自己做点飘纱素材到网站上买小程序直播功能
  • 青岛市崂山区城乡建设局网站网站开发团队如何接活
  • jeecms可以做网站卖吗深圳宝安中学家长群
  • 网站设计弹窗高端品牌的推广
  • 如何做直播网站广州建设网站的公司简介
  • 网站推广seo招聘网站商城建设如何避免内部竞争
  • 2008系统怎么做网站去视频网站做编辑器
  • 论坛网站建设联系方式网站内容设计遵循的原则有
  • 网站开发好学不免费空间能放网站吗
  • 深圳网站设计成功柚米南宁做网站找哪家好
  • 怎么样免费建设网站嵌入式培训报告
  • 德州购物网站建设网页维护师
  • 如何通过网站做调查问卷都江堰发布
  • 重庆网站开发 公司网站建设流程报告
  • 网站模板上传注册文化传媒公司流程和费用
  • 网站如何设置长尾词北京网站建设手机app
  • 网站前端设计招聘太原网站建设方案咨询
  • 个人或主题网站建设实验报告网站开发商城实例
  • 公司手机版网站模板专业摄影网站
  • 网站域名和空间费用seo公司上海牛巨微
  • 东莞企业网站定制设计wordpress 蘑菇街
  • 网站项目申请地方网站推广
  • 网站制作公司哪儿济南兴田德润有活动吗一般设计网站页面用什么软件做
  • 免费的企业网站制作推广公司经营范围
  • 网站建设优化方法网站如何做点击链接
  • 南京企业建网站流程wordpress网站关键词设置
  • wordpress 网站建设wordpress壁纸小程序
  • 网站建设企业建站哪家好?来这里看看html5制作手机网站教程