当前位置: 首页 > news >正文

文献分享: 对ColBERT段落多向量的剪枝——基于学习的方法

原论文

1. 导论 & \textbf{\&} &方法

1️⃣要干啥:在 ColBERT \text{ColBERT} ColBERT方法中,限制每个段落要保留的 Token \text{Token} Token的数量,或者说对段落 Token \text{Token} Token进行剪枝

2️⃣怎么干:注意以下方法都是整合进 ColBERT \text{ColBERT} ColBERT训练的顶层池化层,而非在后期交互中进行改进

  1. k k k位置 Token \text{Token} Token:只保留每个段落的前 k k k Token \text{Token} Token
  2. k k k罕见 Token \text{Token} Token:选择段落中最罕见的 k k k Token \text{Token} Token,所谓罕见的 Token \text{Token} Token IDF \text{IDF} IDF高的 Token \text{Token} Token
  3. k k k闲置 Token \text{Token} Token:在段落前添加 k k k个特殊 Token \text{Token} Token,这些 Token \text{Token} Token BERT \text{BERT} BERT词汇表中标为闲置(unused),最终只保留这 k k k Token \text{Token} Token
  4. k k k得分 Token \text{Token} Token:用预训练模型的最后一层注意力机制给所有 Token \text{Token} Token一个注意力评分,选取注意力机制最高的 k k k Token \text{Token} Token
    • 注意力张量: P = { p 1 , p 2 , . . . , p m } P\text{=}\{p_1,p_2,...,p_m\} P={p1,p2,...,pm}的注意力为三维张量 A ( h , i , j ) A(h,i,j) A(h,i,j),表示在 h h h头注意力机制中 p i p_i pi p j p_j pj二者的注意力相关性
      image-20250312200743542
    • 注意力评分:以 p i p_i pi为例,其注意力评分为每个注意力头中与 p i p_i pi有关行的总和,即 a ( q i ) = ∑ h = 0 h max ⁡ ∑ j = 0 m A ( h , i , j ) a(q_i)\text{=}\displaystyle{}\sum_{h=0}^{h_{\max}}\sum_{j=0}^{m}A(h,i,j) a(qi)=h=0hmaxj=0mA(h,i,j)

2.   \textbf{2. } 2. 实验概要

1️⃣训练方法: ColBERT \text{ColBERT} ColBERT使用 Mini-LM \text{Mini-LM} Mini-LM时无需归一化和查询扩展,大幅降低计算成本​

2️⃣检索性能:当 k = 50 k\text{=}50 k=50时,剪枝可减少 30% \text{30\%} 30%的段落索引,并且性能减少极小( nDCG@10 \text{nDCG@10} nDCG@10减小 0.01 \text{0.01} 0.01)

3️⃣方法对比:当普通剪枝( k =50 k\text{=50} k=50)时方法 1&3 \text{1\&3} 1&3最佳,剧烈剪枝( k =10 k\text{=10} k=10)时方法 3 3 3显著优于其它方法

相关文章:

  • 设计模式Python版 模板方法模式(上)
  • Linux:基本指令与内涵理解
  • 初阶数据结构--复杂度
  • 前端发布缓存导致白屏解决方案
  • 解决webdriver和Chrome不匹配的办法
  • 请简述一下String、StringBuffer和“equals”与“==”、“hashCode”的区别和使用场景
  • 解锁数据结构分享图:高效知识传播的关键
  • Kubernetes教程(七)了解集群、标签、Pod和Deployment
  • linux docker 安装dify本地运行,及部署后运行出现502问题
  • Hot 3D 人体姿态估计 HPE Demo复现过程
  • [算法] 判断是否为字符串重排(simple, 面试)
  • 以 ArcGIS Pro 为笔,绘就水墨地图画卷
  • 【Go学习】04-1-Gin框架-路由请求响应参数
  • JVM内存结构笔记03-方法区
  • 计算机网络:计算机网络的分类
  • 重生之我在学Vue--第9天 Vue 3 项目整合
  • postgresql 数据库使用
  • SpringMVC (二)请求处理
  • 达梦主备集群部署
  • pycharm + anaconda + yolo11(ultralytics) 的视频流实时检测,保存推流简单实现
  • 以色列消防部门:已控制住耶路撒冷山火
  • 武汉大学新闻与传播学院已由“80后”副院长吴世文主持工作
  • 美国季度GDP时隔三年再现负增长,特朗普政府关税政策对美国经济负面影响或将持续
  • 证监会副主席王建军被查
  • 论法的精神︱张玉敏:知识产权保护要为社会经济文化发展服务
  • 北汽蓝谷一季度净亏损9.5亿元,拟定增募资不超60亿元