当前位置: 首页 > news >正文

参数高效的提示调优实现了通用且校准的神经文本检索器

摘要

提示调优尝试在预训练模型中仅更新少量任务特定参数。在语言理解和生成任务上,其表现已可与全参数微调相媲美。在本工作中,我们研究了用于神经文本检索器的提示调优问题。我们提出了一种参数高效的提示调优方法,适用于文本检索的领域内、跨领域及跨主题设置。通过广泛分析,我们展示了该策略能够缓解基于微调的检索方法面临的两个问题——参数效率低和泛化能力弱。尤其值得注意的是,该方法显著提升了检索模型在域外零样本泛化能力。仅通过更新模型参数的0.1%,提示调优策略便能帮助检索模型实现优于传统全参数更新方法的泛化性能。最后,为促进检索器在跨主题泛化方面的研究,我们整理并发布了一个包含18,000条查询-结果对、涵盖87个主题的学术检索数据集,成为迄今为止最大的主题特定数据集。

1 引言

在自然语言处理(NLP)的众多应用中,寻找相关文本是一个基础性问题,如开放领域问答(Chen 等,2017)、检索增强的语言建模(Guu 等,2020)以及事实验证(Thorne 等,2018)。近年来,这一领域的进展主要得益于神经网络方法(Karpukhin 等,2020;Khattab 和 Zaharia,2020),尤其是参数规模不断扩大的大型预训练语言模型。例如,最

相关文章:

  • 网页自动化部署(webhook方法)
  • 【Go-补充】Sync包
  • STM32G4 电机外设篇(三) TIM1 发波 和 ADC COMP DAC级联
  • 【Go语言生态】
  • 结合源码分析Redis的内存回收和内存淘汰机制,LRU和LFU是如何进行计算的?
  • Spring Boot,注解,@ComponentScan
  • Mybtais框架各配置文件主要内容详解(一)
  • 【xmb】】内部文档148344599
  • Azure 机器学习初学者指南
  • PCIe—TS1/TS2 之Polling.Active(一)
  • MVVM、MVC的区别、什么是MVVM
  • VScode编译调试debug,gpu的cuda程序,Nsight
  • Amazon GameLift实战指南:低成本构建高并发全球游戏服务器架构
  • 【模拟电子电路-学习链接】
  • 杨校老师竞赛课之GESP一级C++[2024-12]真题及题解
  • latex 三线表-算法对比表
  • Leetcode 3566. Partition Array into Two Equal Product Subsets
  • STM32Cubemx-H7-17-麦克纳姆轮驱动
  • 设计模式——命令设计模式(行为型)
  • 数据库管理与高可用-MySQL全量,增量备份与恢复
  • 门户网站群建设/青岛网络优化费用
  • 用vs与dw做网站/制作公司网站大概多少钱
  • 关键词优化排名工具/专业seo网站优化推广排名教程
  • 网站后台有显示前台没有/百度24小时人工客服
  • 商务网站制作公司/网络营销有哪些推广方式
  • 购物网站制作样例/百度怎么推广自己的店铺