当前位置: 首页 > news >正文

`FisherTrainer` 的自定义 `Trainer` 类:累积梯度的平方并求平均来近似计算 Fisher 信息矩阵

FisherTrainer 的自定义 Trainer 类:累积梯度的平方并求平均来近似计算 Fisher 信息矩阵

用于计算模型参数的 Fisher 信息矩阵的近似值

整体目标

Fisher 信息矩阵用于衡量模型参数的不确定性,其在优化问题中可以帮助我们更准确地更新模型参数,避免陷入局部最优。在代码中,我们通过累积梯度的平方并求平均来近似计算 Fisher 信息矩阵。

代码各部分数学原理分析

1. 初始化部分
self.gradient_squared_sum = {
   name: torch.zeros_like(param)

相关文章:

  • Java中的GC是什么?
  • OpenWebUI:一站式 AI 应用构建平台体验
  • 【Leetcode】234. 回文链表
  • 调和Django与Sql server2019的关系
  • 【工具】huggingface 模型下载过程
  • Redis主从集群和哨兵集群
  • Go语言的负载均衡
  • 电子病历系统如何设计?
  • MySQL 性能优化:索引优化 + 读写分离 + Redis 缓存,TPS 提升 175% 实战解析
  • 生成式人工智能爆发:未来“人工”会被取代吗?
  • 【ARM】MDK-STM32g0xx.h文件与Define规则记录
  • C语言中qsort函数的详解,以及模拟
  • 数据通信与计算机网络——绪论
  • Spring组件初始化扩展点:BeanPostProcessor
  • CMake学习笔记(二):变量设值,源文件/文件查找
  • 为什么在域名注册后还需要进行解析?
  • 大模型时代:主流训练、微调、推理与部署框架深度解析及对比
  • Spring设计模式 八股速记 高层模块底层模块 依赖倒置原则 开闭原则 接口隔离原则
  • 洛谷每日1题-------Day22__P1421 小玉买文具
  • 技术债务的隐患:何时重构,何时妥协?
  • 刘小涛任江苏省委副书记
  • 获派驻6年后,中国驻厄瓜多尔大使陈国友即将离任
  • Offer触手可及,2025上海社会组织联合招聘专场活动正寻找发光的你
  • 小耳朵等来了春天:公益义诊筛查专家走进安徽安庆
  • 陈吉宁龚正黄莉新胡文容等在警示教育基地参观学习,出席深入贯彻中央八项规定精神学习教育交流会
  • 前四个月人民币贷款增加10.06万亿元,4月末M2余额同比增长8%