当前位置: 首页 > news >正文

衡阳做网站建设的公司在哪里查关键词排名

衡阳做网站建设的公司,在哪里查关键词排名,c asp.net 发布网站,网站如何做业务软标签损失计算为什么要用软标签来计算损失?传统 one-hot 的问题:只关注唯一正确的类别,对其他类完全忽略;训练时会产生过大的梯度惩罚,导致模型过拟合或训练不稳定;无法表达“相似但不完全相同”的关系&am…

软标签损失计算

  1. 为什么要用软标签来计算损失?

    • 传统 one-hot 的问题:

      • 只关注唯一正确的类别,对其他类完全忽略;

      • 训练时会产生过大的梯度惩罚,导致模型过拟合或训练不稳定;

      • 无法表达“相似但不完全相同”的关系,例如:

        • 图像中“猫”和“狸花猫”;
          • 语义上“银行”和“金融机构”;
          • 图文匹配中“图片”和多个描述句子之间的相似度差异。
  2. 如何计算软标签?

    sim_targets = torch.zeros(sim_i2t_m.size()).to(image.device) # 创建一个全0的矩阵
    sim_targets.fill_diagonal_(1) # 对角线上设置为1          sim_i2t_targets = alpha * F.softmax(sim_i2t_m, dim=1) + (1 - alpha) * sim_targets # 构建预测标签(相似度)和one-hot标签的中和,称为软标签
    sim_t2i_targets = alpha * F.softmax(sim_t2i_m, dim=1) + (1 - alpha) * sim_targets
    

    其中,

    • sim_targetsone-hot标签(真实标签);
    • `sim_i2t_

是相似度,对相似度进行softmax`的得到每个样本和其他样本的相似概率(预测标签);

  • alpha是预测标签的占比;
  • alpha * F.softmax(sim_i2t_m, dim=1) + (1 - alpha) * sim_targets集合真实标签和预测标签各自的占比,得到软标签,这个软标签会代替原来的真实标签进行交叉熵计算;
  1. 对比学习中如何利用软标签计算损失?

    loss_i2t = -torch.sum(F.log_softmax(sim_i2t, dim=1)*sim_i2t_targets,dim=1).mean() # 手动实现交叉熵loss
    loss_t2i = -torch.sum(F.log_softmax(sim_t2i, dim=1)*sim_t2i_targets,dim=1).mean() loss_ita = (loss_i2t+loss_t2i)/2 # 计算对比损失
    

    其中,log_softmax(sim_i2t, dim=1)作为预测概率分布,sim_i2t_targets作为目标概率分布;

http://www.dtcms.com/a/478547.html

相关文章:

  • linux学习笔记(30)网络编程——TCP协议详解
  • ICT 数字测试原理 21 - -VCL中的板级预处理
  • 学校要求做网站做网站要源代码
  • 项目缺乏成功衡量标准会导致什么问题
  • 2025年的12大技术栈
  • 越南国家建设部网站企业站手机网站
  • Qt6.7.2下,qml中Window组件全屏加载WebEngineView实现圆角
  • Struts2_S2-045漏洞复现:原理详解+环境搭建+渗透实践(CVE-2017-5638)
  • 【慕伏白】Android Studio 无线调试配置
  • 厦门方易网站制作有限公司做网站对象存储
  • 【Docker】零基础上手:原理+Ubuntu/Windows GUI 安装 + 镜像源 / 目录优化
  • 网站的引导页怎么做的手机虚拟空间
  • 大连网站开发公司力推选仟亿科技有源码如何搭建网站
  • 【Java虚拟机(JVM)全面解析】从原理到面试实战、JVM故障处理、类加载、内存区域、垃圾回收
  • 高并发面试
  • 模板网站 建设 方法西安网站建设中心
  • 《早期经验:语言智能体学习的中间道路》Agent Learning via Early Experience论文深度解读
  • QT6中Commd Link Button,Dialog Button Box,Tool Button 功能与应用
  • asp做网站安全性wordpress 文章 接口
  • 关系型数据库RDBMS与非关系型数据库NoSQL区别
  • 网站建设发布wordpress主题带会员中心
  • 单元测试 vs Main方法调试:何时使用哪种方式?
  • 03--CSS基础(2)
  • Wireshark笔记-从抓包的角度分析几种客户端不能正常获取IP地址的场景
  • 企业 网站 推广wordpress文章状态
  • typescript中infer常见用法
  • 科技赋能塞上农业:宁夏从黄土地到绿硅谷的蝶变
  • 第13讲:深入理解指针(3)——数组与指针的“深度绑定”
  • 基于MATLAB的匈牙利算法实现任务分配
  • Type-C 接口充电兼容设计(针对 5V1A 需求)