当前位置: 首页 > news >正文

重要!!! 什么是梯度方差 ; AdaLoRA中的Fisher信息矩阵:核心作用与通俗举例

什么是梯度方差(Fisher信息近似)

AdaLoRA中的Fisher信息矩阵:核心作用与通俗举例

目录

    • 什么是梯度方差(Fisher信息近似)
    • AdaLoRA中的Fisher信息矩阵:核心作用与通俗举例
        • 一句话总结
        • 🍉 通俗例子:炒菜放盐的“重要性”
        • 🧠 具体原理与示例(文本分类任务)
        • 🔍 为什么有效?
        • 🌰 玩具数据演示
      • 通过梯度方差量化参数重要性:一个玩具级计算示例
        • 步骤1:定义数据与损失
        • 步骤2:计算每个样本的梯度(以 w 1 w_1 w1为例)
      • 1. **Z的含义与公式参数**
      • 2. **L(损失值)的含义与公式参数**
        • 步骤3:计算梯度方差(Fisher信息近似)
        • 步骤4:对比参数重要性
        • 步骤5:AdaLoRA如何利用方差?
      • 关键结论:为什么方差=重要性?
      • 真实场景类比:考试复习

在这里插入图片描述

在这里插入图片描述
Fisher矩阵的本质:通过参数梯度的方差,量化参数对任务的敏感程度(方差越大,参数越重要)。

一句话总结

Fisher信息矩阵是衡量模型参数对任务重要性的“温度计”,AdaLoRA用它识别哪些参数需要**“小心保护”(避免过度更新)**,哪些可以“大胆调整”。

🍉 通俗例子:炒菜放盐的“重要性”

假设你要炒一盘菜,盐的用量(对应模型参数)对味道影响极大(高Fisher值)&#x

相关文章:

  • RUOYI框架在实际项目中的应用二:Ruoyi前后端分离版本
  • 【MySQL】(5) 数据行的增删改查操作
  • Hexo主题配置and常用指令
  • mysql-8.0.25-winx64安装步骤
  • 中考英语之02高频词汇
  • React 常用 Hooks 详细解析
  • 责任链模式
  • 【leetcode hot 100 230】二叉搜索树中第K小的元素
  • Web前端开发——CSS入门
  • 前端web worker提升性能实战案例
  • zk-SNARKs 最简单的应用示例:密码验证
  • RAG的Rerank:从期待到现实的转变
  • Mysql第二次练习
  • Swift 中 associatedtype 的用法详解
  • IntelliJ IDEA 2023.3.1安装指南从下载到配置的完整教程(附资源下载)
  • 中考英语之09从句
  • 五大基础算法——模拟算法
  • C++特性——智能指针
  • 13. 分治
  • 97.HarmonyOS NEXT跑马灯组件教程:基础概念与架构设计
  • 运河网站制作/推广广告赚钱软件
  • 建设网站需要会什么/鱼头seo软件
  • 政府网站建设的意见/最新旅游热点
  • 做网站的心得/营销网站建设大概费用
  • 海林建设局网站/杭州优化seo公司
  • 做网站如何与网络公司沟通/百度人工客服电话24小时