当前位置: 首页 > news >正文

wordpress调整小工具位置seo优化技术培训中心

wordpress调整小工具位置,seo优化技术培训中心,手机浏览器下载,wordpress上一篇插件知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例 KL散度公式对应 flyfish KL散度的公式 KL散度用于衡量两个概率分布 PPP(教师分布)和 QQQ(学生分布)的差异,公式为: KL(P∥Q)∑xP(x)⋅[log⁡P(x)−log⁡Q…

知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例 KL散度公式对应

flyfish

KL散度的公式

KL散度用于衡量两个概率分布 PPP(教师分布)和 QQQ(学生分布)的差异,公式为:
KL(P∥Q)=∑xP(x)⋅[log⁡P(x)−log⁡Q(x)] \text{KL}(P \parallel Q) = \sum_{x} P(x) \cdot \left[ \log P(x) - \log Q(x) \right] KL(PQ)=xP(x)[logP(x)logQ(x)]

对应公式:

  1. teacher_soft = softmax(teacher_logits / T, dim=-1)
    得到教师的概率分布 P(x)=softmax(teacher_logits/T)P(x) = \text{softmax}(\text{teacher\_logits}/T)P(x)=softmax(teacher_logits/T)

  2. student_soft = log_softmax(student_logits / T, dim=-1)
    得到学生的对数概率 log⁡Q(x)=log⁡(softmax(student_logits/T))\log Q(x) = \log\left( \text{softmax}(\text{student\_logits}/T) \right)logQ(x)=log(softmax(student_logits/T))

  3. kl_loss = sum( teacher_soft * (teacher_soft.log() - student_soft) ) / batch_size
    teacher_soft.log()log⁡P(x)\log P(x)logP(x)
    student_soft` 是 log⁡Q(x)\log Q(x)logQ(x)
    整体即公式中的 ∑P(x)⋅[log⁡P(x)−log⁡Q(x)]\sum P(x) \cdot [\log P(x) - \log Q(x)]P(x)[logP(x)logQ(x)],完全匹配KL散度的定义。

教师用softmax是为了得到概率分布 P(x)P(x)P(x),学生用log_softmax是为了直接得到 log⁡Q(x)\log Q(x)logQ(x),两者组合恰好满足KL散度的公式要求,同时利用log_softmax的数值稳定性提升计算可靠性。

log_softmax 操作在数学上等价于对输入先执行 softmax 得到概率分布,再对该概率分布取对数

import torch
import torch.nn.functional as F# 1. 定义示例输入(模型输出的logits)
logits = torch.tensor([[1.0, 2.0, 3.0],  # 样本1的类别得分[4.0, 5.0, 6.0]   # 样本2的类别得分
], dtype=torch.float32)# 温度参数(此处设为1.0,不影响等价性验证)
T = 1.0
scaled_logits = logits / T  # 温度软化后的logits# 2. 两种方式计算对数概率
# 方式1:直接使用log_softmax
log_softmax_result = F.log_softmax(scaled_logits, dim=-1)# 方式2:先计算softmax,再取对数
softmax_result = F.softmax(scaled_logits, dim=-1)
log_of_softmax = torch.log(softmax_result)# 3. 打印结果对比
print("===== 原始logits(温度软化后) =====")
print(scaled_logits)
print("\n===== 方式1:log_softmax直接计算 =====")
print(log_softmax_result)
print("\n===== 方式2:softmax后取对数 =====")
print(log_of_softmax)# 4. 数值等价性验证(允许微小浮点数误差)
# 检查所有元素是否在1e-6精度内相等
is_equivalent = torch.allclose(log_softmax_result, log_of_softmax, atol=1e-6)
print("\n===== 等价性验证 =====")
print(f"log_softmax 与 softmax+log 是否等价:{is_equivalent}")
===== 原始logits(温度软化后) =====
tensor([[1., 2., 3.],[4., 5., 6.]])===== 方式1:log_softmax直接计算 =====
tensor([[-2.4076, -1.4076, -0.4076],[-2.4076, -1.4076, -0.4076]])===== 方式2:softmax后取对数 =====
tensor([[-2.4076, -1.4076, -0.4076],[-2.4076, -1.4076, -0.4076]])===== 等价性验证 =====
log_softmax 与 softmax+log 是否等价:True
http://www.dtcms.com/a/558846.html

相关文章:

  • 网站如何做下一页wordpress侧栏
  • 网站过度优化如何弄公司网站
  • 做彩票网站代理违法吗国内oa系统十大排名
  • 软件测试大赛web测试-python【备赛1】
  • NetSuite 如何利用工作流抓住PO关键信息的变动?
  • 找聊城做网站sem优化系统
  • 上海市城乡建设部网站首页网站文章要求
  • 深入洞察:AI技术突破及应用成熟评估方法
  • wordpress网址域名2019做网站seo行不行
  • 可以免费进的服务器网站上海市网站建设公司
  • 怎么做点播网站论坛网站免费建设模板下载
  • 品牌网站建设策划书陕西 网站建设 陕ICP
  • 网站404页面在哪查看孔夫子旧书网网站谁做的
  • tag 网站备案湖南省郴州市北湖区
  • 网站开发微盘百度搜索推广的五大优势
  • 智慧交通红绿灯检测数据集VOC+YOLO格式1215张3类别
  • 做网站用小公司还是大公司好广西住房城乡建设厅官方网站
  • 网站开发报价技巧上海招聘信息最新招聘
  • 长沙做彩票网站公司打金新开传奇网站
  • 网站根目录权限设置wordpress背景设置
  • 计算机操作系统:与设备无关的I/O软件
  • 怎么做一个公司网站广州装修公司哪家好
  • 百度网站优化升上去营销策略ppt模板
  • 仓颉语言实战:无重复字符的最长子串工具库
  • pg_stat 视图介绍
  • 游戏网站cms网站做好了前端 后端怎么做
  • 青岛住房和城乡建设厅网站个人注册域名和公司注册域名区别
  • 京东e卡 滑块分析
  • 嘉兴制作网站深圳网站建设最专业的
  • 网站打开速度慢 如何优化做网站收会员费