当前位置: 首页 > news >正文

东营网站关键词外贸网站优化方案

东营网站关键词,外贸网站优化方案,wordpress 暖岛 主题,网络运营有前途吗Gumbel-Softmax函数 背景动机 在许多任务中,我们需要从一个离散分布中采样,例如从one-hot编码中选出某个类别: 但是离散采样操作是不可导的,这使得无法通过反向传播更新参数Gumbel-Softmax提供了一种近似采样的方法,它…

Gumbel-Softmax函数

背景动机

在许多任务中,我们需要从一个离散分布中采样,例如从one-hot编码中选出某个类别:

  • 但是离散采样操作是不可导的,这使得无法通过反向传播更新参数
  • Gumbel-Softmax提供了一种近似采样的方法,它是可微的,因此可以端到端训练神经网络

什么任务需要离散分布采样

  • 神经架构搜索:在给定多个可能的网络组件中选择一个子结构
  • 强化学习:代理在每一步需要从有限的动作空间中选择一个动作,如走上/下/走/右

Gumbel-Max Trick

如果我们希望从一个离散的概率分布z=[z1,z2....,zK]z=[z_1,z_2....,z_K]z=[z1,z2....,zK]中采样一个类别,可以通过以下方式实现:
y=argmax[log(zi)+gi] y = argmax[log(z_i)+g_i] y=argmax[log(zi)+gi]
其中gi=Gumbel(0,1)g_i=Gumbel(0,1)gi=Gumbel(0,1),这个过程称为Gumbel-Max trick,可以视为在logits上加上噪声后取最大值。
然而,argmax操作显然不可导
为了使Gumbel-Max变为可导,我们将argmax用softmax来近似
yi=exp((log(zi)+gi)/τ)∑j=1Kexp((log(zi)+gi)/τ) y_i = \frac{exp((log(z_i)+g_i)/\tau)}{\sum_{j=1}^Kexp((log(z_i)+g_i)/\tau)} yi=j=1Kexp((log(zi)+gi)/τ)exp((log(zi)+gi)/τ)

  • gi=Gumbel(0,1)是Gumbel噪声g_i = Gumbel(0,1)是Gumbel噪声gi=Gumbel(0,1)Gumbel噪声
  • τ>0\tau>0τ>0是温度参数
    τ→∞\tau\rightarrow\inftyτ, Gumbel-Softmax输出趋近于平均分布(更平滑)
    τ→0\tau\rightarrow0τ0,输出趋近于one-hot(更像真实采样,但梯度不稳定)
    因此,训练时通常采用:高温度开始,逐渐降低温度
    在这里插入图片描述

为什么说Gumbel-Softmax模拟了采样行为?

从一个离散概率分布z=[0.1,0.7,0.2]z=[0.1,0.7,0.2]z=[0.1,0.7,0.2]中采样,指的是:根据概率值,随机选择一个类别(one-hot)作为结果。
有70%概率选择第2类: [0,1,0]
有10%概率选择第1类:[1,0,0]
但是采样过程不可导。
Gumbel-Max Trick = 真实采样
y=argmax[log(zi)+gi] y = argmax[log(z_i)+g_i] y=argmax[log(zi)+gi]

举个例子:

  1. logits = [2.0, 1.0, 0.1]
    Softmax 后输出:
[0.57, 0.31, 0.12]  # 每次都一样,不是真采样
  1. Gumbel-Softmax(多次运行)
    每次加上 Gumbel 噪声再 softmax,例如:
Sample 1: [0.97, 0.02, 0.01]
Sample 2: [0.03, 0.91, 0.06]
Sample 3: [0.05, 0.10, 0.85]

这些近似 one-hot 输出,就模拟了多次“真实采样”的过程。
为什么要使用log函数?
压缩大值,使噪声占比大

Gumbel 分布 (耿贝尔分布)

Gumbel 分布是一种极值分布,用于建模“最大值”的概率分布。
📌 标准 Gumbel(0,1) 分布的定义:
一个随机变量 g 服从标准 Gumbel 分布,当其概率密度函数(PDF)为:
f(g)=exp(−(g+e−g)) f(g) = exp(-(g+e^{-g})) f(g)=exp((g+eg))
如何采样Gumbel噪声
g=−log(−log(U)) g = - log(-log(U)) g=log(log(U))

def sample_gumbel(shape, eps=1e-20):U = torch.rand(shape)return -torch.log(-torch.log(U + eps) + eps)

总结:Gumbel-Softmax在Softmax的基础上增加了噪声扰动性,从而达到离散分布采样的作用

http://www.dtcms.com/a/591600.html

相关文章:

  • 企业做网站优点成都解封公告
  • 公司微信网站开发平台装修公司装饰
  • 打开网站是空白页面长春网站建设58同城
  • dedecms网站搬家网站弹窗代码
  • 电商平台入驻条件优化网站界面的工具
  • 做网站需要的电脑配置2020站群seo系统
  • 专业的led网站建设关键词优化需要从哪些方面开展?
  • 郴州做网站公司手机网站整站下载
  • 网站 head关键字 密度 多少字做网站总结
  • 广州哪里有做网站推广商标分类表45类明细
  • 企业网站源码带后台管理如何做网站评估分析
  • 做网站需要代码吗dw软件怎么制作网页视频
  • 阿里巴巴网站怎么做推广方案爱企业查询
  • 湖南高端网站建设东莞规划局
  • 金堂网站建设wordpress关闭rss功能
  • 网站文字不能编辑器泰安建设工程招聘信息网站
  • 做外贸找工厂货源网站制作网站需要什么知识
  • php网站开发主要做什么中山市技术支持 中山网站建设
  • 域名转出过程网站能打开吗wordpress设置个人头像
  • 罗定网站建设台州高端网站建设
  • 想建网站如何制作企业内部网站
  • wordpress怎么给别人建站中国最好的旅游网站
  • 济南高端网站设计建设网络黄页推广大全4
  • 网站设计报价单网站seo快速排名软件
  • app门户网站wordpress固定连接nginx
  • 手机软件制作和做网站相同制作图片软件英文
  • 北京高端企业网站建设龙口网络推广公司
  • 2025年北京优质GEO公司有哪几家
  • 不通过第三方平台做微网站网站强制字体wordpress
  • 在线旅游网站建设方案山东网络推广