当前位置: 首页 > wzjs >正文

自己做的网站加载慢关于手机电子商务网站建设

自己做的网站加载慢,关于手机电子商务网站建设,国外做电商网站有哪些方面,杭州下沙开发区建设局网站强化学习 多臂老虎机 prob是概率的意思 老虎机本身的功能需要先设计,就是有k个拉杆,然后每个拉杆有自己的概率,概率是获奖概率。并且我们需要将拉杆个数和获奖概率还有获奖最大概率给统计出来——这些内容构成老虎机类的基本属性。 class Be…

强化学习
多臂老虎机
prob是概率的意思

老虎机本身的功能需要先设计,就是有k个拉杆,然后每个拉杆有自己的概率,概率是获奖概率。并且我们需要将拉杆个数和获奖概率还有获奖最大概率给统计出来——这些内容构成老虎机类的基本属性。


class BernoulliBandit:""" 伯努利多臂老虎机,输入K表示拉杆个数 """def __init__(self, K):self.probs = np.random.uniform(size=K)  # 随机生成K个0~1的数,作为拉动每根拉杆的获奖# 概率self.best_idx = np.argmax(self.probs)  # 获奖概率最大的拉杆self.best_prob = self.probs[self.best_idx]  # 最大的获奖概率self.K = Kdef step(self, k):# 当玩家选择了k号拉杆后,根据拉动该老虎机的k号拉杆获得奖励的概率返回1(获奖)或0(未# 获奖)if np.random.rand() < self.probs[k]:return 1else:return 0np.random.seed(1)  # 设定随机种子,使实验具有可重复性
K = 10
bandit_10_arm = BernoulliBandit(K)
print("随机生成了一个%d臂伯努利老虎机" % K)
print("获奖概率最大的拉杆为%d号,其获奖概率为%.4f" %(bandit_10_arm.best_idx, bandit_10_arm.best_prob))

随后我们开始设计训练流程,强化学习并不是一次性就能训练好的,需要有一个循环,因此我们开始设计循环的框架。至于是如何循环的,和算法有关,因此我们现在先完成外部的框架。

!!!有一点需要注意,我们设计solve类(也就是循环体)的时候,是需要用到老虎机的特性的,也就是说需要用到本老虎机中的一些属性,因此我们可以利用python中的组合特性,在init函数中直接传入一个BernoulliBandit对象(但是不需要和cpp一样标明类型),我们就可以在solve类中用到老虎机的一些属性,这很有用!!!

在这里插入图片描述

除此之外,我们还可以讨论这样设计的合理性,不同类有不同的分工,因此分开设计会有低耦合性。

在这里插入图片描述

class Solver:""" 多臂老虎机算法基本框架 """def __init__(self, bandit):self.bandit = banditself.counts = np.zeros(self.bandit.K)  # 每根拉杆的尝试次数self.regret = 0.  # 当前步的累积懊悔self.actions = []  # 维护一个列表,记录每一步的动作self.regrets = []  # 维护一个列表,记录每一步的累积懊悔def update_regret(self, k):# 计算累积懊悔并保存,k为本次动作选择的拉杆的编号self.regret += self.bandit.best_prob - self.bandit.probs[k] self.regrets.append(self.regret)def run_one_step(self):# 返回当前动作选择哪一根拉杆,由每个具体的策略实现raise NotImplementedErrordef run(self, num_steps):# 运行一定次数,num_steps为总运行次数for _ in range(num_steps):k = self.run_one_step()self.counts[k] += 1self.actions.append(k)self.update_regret(k)

注意懊悔累计函数的设计,当前我们老虎机的奖励是一定的,但是概率不一定,所以懊悔的是概率,也可以将懊悔当做期望来用,所以是最高中奖概率减去当前中奖概率;至于run_one_step函数,和每步的策略相关,这个和具体的算法相关;至于run函数就是在循环过程中顺带记录每次的决策和懊悔值到列表中。

最后我们看看奖励机制,公式是简化了的,为了降低算法复杂度

在这里插入图片描述

http://www.dtcms.com/wzjs/569494.html

相关文章:

  • 网站推广应该注意什么开封网站建设公司
  • wordpress 网站特效在线阅读网站开发
  • 网站建设视频做网站代理拉不到人
  • 软件开发和网站建设哪个好公司网址备案能用多少网站
  • 可信网站认证好处wordpress git 伪静态
  • 网站建设的重要指标怎么做私人彩票网站
  • 网站开发中都引用什么文献收费做网站
  • 重庆装修公司口碑排名seo项目
  • 北京网站ui设计公司苏州网站推广找苏州梦易行
  • 网站建设谈业务要知道什么保险网站程序源码
  • 效益型网站陇南建设网站
  • 企业网站建设 南通免费一级域名网站
  • 广西学校网站建设网站建设如何为企业电商化转型赋能
  • 广州网站优化服务常州网站备案
  • 北京网站建设手机号深圳网络营销推广培训
  • 可信网站权威性怎么样网站建设 三网
  • 视觉中国网站wordpress rss去掉
  • 北京各大网站推广平台哪家好网站建设安全问题
  • 连云港做网站优化为什么百度不收录wordpress
  • 合肥网站建设团队豌豆荚app下载 官网
  • 做网站制作步骤图片在线制作二维码
  • 网站建设运营费用wordpress模块咋编辑
  • 江苏省住房保障建设厅网站网站关键词排名如何做
  • 建设一个门户网站需要多少钱网站做很多关键词
  • 江苏优化网站公司哪家好哪里有专业网站建设公司
  • 站长wordpress 当前主题
  • 一般的网站建设玩具 东莞网站建设 技术支持
  • 网站开发前后端工具组合公司网站文化活动备案
  • 想接网站自己做北京装饰装修公司
  • 在线做动漫图的网站织梦网站怎么做优化