当前位置: 首页 > news >正文

【2025ICCV-持续学习方向】一种用于提示持续学习(Prompt-based Continual Learning, PCL)的新方法

1. 背景与问题 (Background & Problem):​

  • 持续学习 (CL):​​ 目标是在不遗忘旧任务知识的情况下,让模型持续学习一系列新任务。主要挑战是灾难性遗忘。
  • 基于提示的持续学习 (PCL):​​ 利用预训练视觉Transformer (ViT),冻结其权重,通过微调称为“提示”(prompts)的小型可学习参数集来适应新任务。提示充当任务特定指令。
  • 现有方法的局限 (Limitations of Existing Methods):​
    • 现有整合提示的方法(如输入条件加权求和[CODA-Prompt]或在任务共享空间中生成后合并[ConvPrompt])产生的提示表示多样性有限。
    • 原因:1) 固定表示无法适应新任务;2) 在易受任务干扰和主导的任务共享空间中生成的表示容易过拟合,泛化能力差。
    • 图2分析表明,这种多样性不足限制了模型在顺序学习中获得高精度和低遗忘的能力。更高的表示多样性有助于提高精度和减少遗忘。

2. 提出的方法:RainbowPrompt (Proposed Method: RainbowPrompt)​

  • 核心思想:​​ 提出一种“提示进化”(prompt-evolving)方法,动态地重组和调整累积的任务特定提示(称为“基础提示”)的表示,使其更适应新任务,同时保留旧知识并增强表示多样性。
  • 机制 (Mechanism):​
    • 维护一个累积的基础提示集合 P = {p¹, p², ..., pᵗ}(每个任务对应一个)。
    • 目标是整合这些提示为一个统一的“彩虹提示” pʳᵃⁱⁿᵇᵒʷ⁽ᵗ⁾
    • 仅更新当前任务的基础提示,冻结旧任务提示以保护其知识。
    • 通过引入可学习组件,对所有基础提示进行转换(transformation)​对齐(alignment)​,促进知识迁移到新任务。
  • 关键步骤 (Key Steps):​
    1. 基于注意力的转换 (Attention-based Transformation):​
      • 任务条件化 (Task Conditioning):​​ 使用可学习的任务嵌入向量 eᵗ 注入任务相关信息到基础提示集合 Pₗ
      • 任务级转换 (Task-level Transformation):​
http://www.dtcms.com/a/364363.html

相关文章:

  • 【CouponHub开发记录】SpringAop和分布式锁进行自定义注解实现防止重复提交
  • RAG|| LangChain || LlamaIndex || RAGflow
  • kafka概念之间关系梳理
  • mac idea 配置了Gitlab的远程地址,但是每次pull 或者push 都要输入密码,怎么办
  • 项目中常用的git命令
  • python基础案例-数据可视化
  • Streamlit 数据看板模板:非前端选手快速搭建 Python 数据可视化交互看板的实用工具
  • 【Linux】为什么死循环卡不死 Linux?3 个核心逻辑看懂进程优先级与 CPU 调度密码
  • Langchain4j 整合MongoDB 实现会话持久化存储详解
  • 电表连网不用跑现场!耐达讯自动化RS485转Profinet网关 远程配置+技术支持,真能做到!
  • 单元测试数据库回滚问题
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼?
  • 10 分钟掌握 Selenium 8 大元素定位法:从踩坑到精通
  • Python分布式任务队列:万级节点集群的弹性调度实践
  • 深入剖析Spring Boot中Spring MVC的请求处理流程
  • 电脑接入企业中的网线,为啥网卡上面显示AD域名
  • 智能电视小米电视浏览器兼容性踩坑电视黑屏或者电视白屏,Vue项目从Axios到Fetch的避坑指南
  • 【Pytest】解决Pytest中Teardown钩子的TypeError:实例方法与类方法的调用差异
  • 腾讯Hunyuan-MT-7B翻译模型完全指南:2025年开源AI翻译的新标杆
  • 线性代数第一讲—向量组
  • 强化学习中的模仿学习是什么?
  • HR不会告诉你的秘密:学术简历中,这个内容会被秒标“高光“
  • 亚马逊云代理商:配置安全组规则步骤
  • 日志分析与安全数据上传脚本
  • 迅为RK3568开发板体验OpenHarmony—烧写镜像-安装驱动
  • 技术框架之脚手架实现
  • Trae x Vizro:低代码构建专业数据可视化仪表板的高效方案
  • HTML `<datalist>`:原生下拉搜索框,无需 JS 也能实现联想功能
  • kvm 虚拟机如何安装 qemu-guest-agent
  • C++ 面试高频考点 力扣 162. 寻找峰值 二分查找 题解 每日一题