当前位置: 首页 > wzjs >正文

网站频道建设软文营销模板

网站频道建设,软文营销模板,怎么创建个人网站,仙游网站建设公司大模型参数高效微调学习笔记 github地址 billbill链接 1.分类 图中有五个大类: selective(选择性微调):BitFit,Attention Tuningsoft prompts(提示微调):Prompt-tuning&#xff0c…

大模型参数高效微调学习笔记

github地址
billbill链接

1.分类

在这里插入图片描述
图中有五个大类:

  1. selective(选择性微调):BitFit,Attention Tuning
  2. soft prompts(提示微调):Prompt-tuning,P-tuning,Prefix-Tuning
  3. reparametrization-based(重参数化微调):Lora
  4. additive(增量微调):IA3
  5. adapters(适配器微调):Adapters

2.代表性的方法介绍

1.BitFit
将模型的所有偏置bias设为可训练的参数,其他部分设置为不可训练的。

2.Attention Tuning
将模型的所有注意力层Attention设为可训练的参数,其他部分设置为不可训练的。

3.Prompt-tuning
在模型的输入的prompt前面加入一个可训练Prompt embedding向量,模型的整个部分全部冻结,如下图。
在这里插入图片描述
如果Prompt embedding向量参数是随机初始化的,则是soft prompt,如果使用一段文本初始化(例如,“下面是一个情感任务”),则是hard prompt。

4.P-tuning
在Prompt-tuning的基础上,使用一个LSTM/MLP(或其他一个小的神经网络)获得Prompt embedding向量。除了LSTM/MLP部分,其他部分均冻结,即原模型的整个部分全部冻结。
在这里插入图片描述
5.Prefix-Tuning
在Transformers模型的每一层网络的前面都加一个可训练的past_key_values向量,原模型的整个部分全部冻结。
在这里插入图片描述
5.Lora
原模型的整个部分全部冻结,新增一部分参数W_lora,W_lora之后可以与原模型的参数进行合并。
在这里插入图片描述
在这里插入图片描述
6.IA3

通过训练一个向量,修改网络的激活值实现。
在这里插入图片描述

http://www.dtcms.com/wzjs/10337.html

相关文章:

  • 网站开发英文翻译av手机在线精品
  • 动漫网站建设策划书关键词seo排名怎么选
  • 购物网站建设策划书淘宝seo培训
  • WordPress 整个网站导出做百度推广需要什么条件
  • 制作网站哪家便宜网络管理系统
  • 网站建设与运营收入预算注册百度推广账号
  • 网站建设项目策划书谷歌浏览器下载手机版app
  • 我国外贸企业网站建设百度怎么投广告
  • 有哪些可以免费做高数题的网站广州建网站的公司
  • 网站增加二级域名seo关键词排名软件流量词
  • 迪庆北京网站建设成都今天重大新闻事件
  • 做愛視頻网站网站制作维护
  • 新手建网站需要怎么做呢线上推广具体应该怎么做
  • 做网站软件图标是一个箭头的站长工具推荐
  • 前端怎么做电商网站网站关键词排名优化
  • php电子商务网站建设百度一下百度网页版主页
  • 网站建设一般要多大空间链接购买平台
  • 深圳福田网站建设网络营销策略案例
  • 济南商务网站建设免费域名注册查询
  • 啦啦啦在线视频免费观看播放日本百度优化师
  • 做外贸面料的网站百度网页推广
  • 辽宁网站建设fengyansemseo是什么意思
  • 网站带后台免费下载链网
  • 临城企业做网站2345网址大全浏览器
  • table做网站的好处怎样制作一个网站
  • php 网站开发缓存有那几种防晒霜营销软文
  • 长沙网站设计精选柚v米科技排名优化推广
  • 做查询网站有哪些常见的网络营销平台有哪些
  • php做直播网站bt鹦鹉磁力
  • 网站建设与运营的预算方案信息如何优化上百度首页公司