当前位置: 首页 > news >正文

论文略读; AdapterFusion:Non-Destructive Task Composition for Transfer Learning

EACL 2021

  • 在 Adapter 的基础上进行优化
    • 将学习过程分为两阶段来提升下游任务表现
      • 知识提取阶段
        • 在不同任务下引入各自的Adapter模块,用于学习特定任务的信息。
        • 有两种训练方式
          • Single-Task Adapters(ST-A)
            • 对于N个任务,模型都分别独立进行优化,各个任务之间互不干扰,互不影响。
          • Multi-Task Adapters(MT-A)
            • N个任务通过多任务学习的方式,进行联合优化。

        • 实验说明,第一阶段采用ST-A+第二阶段AdapterFusion是最有效的方法

          • 第一阶段采用MT-A+第二阶段AdapterFusion没有取得最佳的效果,在于第一阶段其实已经联合了多个任务的信息了,所以AdapterFusion的作用没有那么明显

      • 知识组合阶段
        • 将预训练模型参数与特定任务的Adapter参数固定
        • 引入新参数(AdapterFusion)来学习组合多个Adapter中的知识,以提高模型在目标任务中的表现
        • 本质上也是一个attention
        • query是transformer每个子模块的输出结果
        • key跟value则是N个任务的adapter的输出
        • 为不同的任务对应的adapter分配不同的权重,聚合N个任务的信息,从而为特定任务输出更合适的结果
http://www.dtcms.com/a/269523.html

相关文章:

  • Android中MVI架构详解
  • 875、爱吃香蕉的珂珂
  • 吃透二分法的模板解法(适合所有类似于二分的算法题)
  • 百度斩获大模型中标第一,股价上涨5%
  • 深度剖析:Ceph分布式存储系统架构
  • 实时开发IDE部署指南
  • Tomcat与IIS:核心差异及接口调用实战解析
  • paddlehub环境搭建和测试
  • 【PTA数据结构 | C语言版】在顺序表 list 的第 i 个位置上插入元素 x
  • C语言使用Protobuf进行网络通信
  • HTTP/3.0的连接迁移使用连接ID来标识连接为什么可以做到连接不会中断
  • 【论文阅读】基于 GAN 和深度迁移学习的频谱预测:一种跨带数据增强框架
  • 函数-1-字符串函数
  • Python文件操作(五分钟小白从入门到精通)
  • 微算法科技(NASDAQ MLGO)研究非标准量子预言机,拓展量子计算边界
  • 【QT】-隐式转换 explicit用法
  • linux常用管路命令
  • 【1-快速上手】
  • 部署并运行Spike-Driven-Transformer或QKFormer
  • 香港站群服务器与普通香港服务器对比
  • 算法设计与分析:分治、动态规划与贪心算法的异同与选择
  • 【计算机网络】第三章:数据链路层(下)
  • 89104 PCIe Switch芯片国产替代 - PCIE5.0国产AI服务器高性能扩展,支持海光/龙芯/飞腾等
  • 【零基础学AI】第30讲:生成对抗网络(GAN)实战 - 手写数字生成
  • 从SEO到GEO:优化策略如何应对传统搜索与AI搜索的巨变
  • SpringAI编码实战:使用本地免费部署的大语言模型跑起来
  • NuxtJS中网络请求模块的封装与最佳实战
  • leetcode202.快乐数
  • 算法设计与分析 知识总结
  • Puppeteer 库简介:背景、用法与原理