当前位置: 首页 > news >正文

大模型参数高效微调学习笔记

大模型参数高效微调学习笔记

github地址
billbill链接

1.分类

在这里插入图片描述
图中有五个大类:

  1. selective(选择性微调):BitFit,Attention Tuning
  2. soft prompts(提示微调):Prompt-tuning,P-tuning,Prefix-Tuning
  3. reparametrization-based(重参数化微调):Lora
  4. additive(增量微调):IA3
  5. adapters(适配器微调):Adapters

2.代表性的方法介绍

1.BitFit
将模型的所有偏置bias设为可训练的参数,其他部分设置为不可训练的。

2.Attention Tuning
将模型的所有注意力层Attention设为可训练的参数,其他部分设置为不可训练的。

3.Prompt-tuning
在模型的输入的prompt前面加入一个可训练Prompt embedding向量,模型的整个部分全部冻结,如下图。
在这里插入图片描述
如果Prompt embedding向量参数是随机初始化的,则是soft prompt,如果使用一段文本初始化(例如,“下面是一个情感任务”),则是hard prompt。

4.P-tuning
在Prompt-tuning的基础上,使用一个LSTM/MLP(或其他一个小的神经网络)获得Prompt embedding向量。除了LSTM/MLP部分,其他部分均冻结,即原模型的整个部分全部冻结。
在这里插入图片描述
5.Prefix-Tuning
在Transformers模型的每一层网络的前面都加一个可训练的past_key_values向量,原模型的整个部分全部冻结。
在这里插入图片描述
5.Lora
原模型的整个部分全部冻结,新增一部分参数W_lora,W_lora之后可以与原模型的参数进行合并。
在这里插入图片描述
在这里插入图片描述
6.IA3

通过训练一个向量,修改网络的激活值实现。
在这里插入图片描述

相关文章:

  • 前端练习小项目——视觉冲击卡片
  • 单片机练习题4
  • 7 bool query组合查询
  • 基于SpringBoot+大数据城市景观画像可视化设计和实现
  • 程序员如何高效读代码?
  • A类IP介绍
  • 张宇1000题太难?这么刷只要30天就能吃透!
  • Lambda函数(箭头表达式)
  • 小鹏汽车2025冲刺类L4智驾,挑战与机遇并存
  • 百老开通知识星球啦,数据要素、数据治理等资料迅速扩散!
  • HTML(18)——浮动
  • Pycharm怎么默认终端连接远程服务器
  • 代码-功能-python-爬取博客网标题作者发布时间
  • 只有一个鸿蒙好?还是鸿蒙、安卓、IOS并存好?
  • 如何在Springboot中配置Druid连接池连接MySQL?
  • Spring-bean
  • 微信小程序-伪类选择器
  • 46、基于自组织映射神经网络的鸢尾花聚类(matlab)
  • 1.2 DataX 数据同步工具详细介绍
  • 微积分-导数1(导数与变化率)
  • 从上海首个到成片复制,闵行零工市场如何优化劳动就业服务?
  • 保证断电、碰撞等事故中车门系统能够开启!隐藏式门把手将迎来强制性国家标准
  • 巴基斯坦称约50名印度士兵在克什米尔实控线丧生
  • “80后”计算机专家唐金辉已任南京林业大学副校长
  • 港理大研究揭示:塑胶废物潜藏微生物群落或引发生态危机
  • 定位真核生物起源于约27.2亿年前,华东师大团队在《自然》发文