当前位置: 首页 > news >正文

SGM: Sequence Generation Model for Multi-Label Classification

为了建模多标签之间的依赖关系,本篇工作用序列生成的方式来解决该问题。

当前label的预测不仅依赖于输入上下文,也依赖于已输出的所有label。用seq2seq建模标签依赖是一种非常自然的思路,但存在如下两大问题:

  1. 序列建模强调标签的先后顺序,即位置关系,而多标签是一个集合,不存在位置约束,哪个标签在前在后没有关系,只要输出正确就行。这种情况下,ground truth该如何构造?
  2. 序列生成是自回归形式,当前label的生成依赖于上一个label,如果上一个label是错误的,那么将会严重影响后续所有label的预测。这种情况下,该减轻预测错误的label所导致的连锁反应?

SGM针对上述问题提出了如下建模思路:

模型结构

经典的序列生成范式:
p ( y ∣ x ) = ∏ i = 1 n p ( y i ∣ y 1 , y 2 , ⋯   , y i − 1 , x ) p(\boldsymbol{y} \mid \boldsymbol{x})=\prod_{i=1}^n p\left(y_i \mid y_1, y_2, \cdots, y_{i-1}, \boldsymbol{x}\right) p(yx)=i=1np(yiy1,y2,,yi1,x)

model

问题1的解法

作者根据训练集中标签出现的频次来构造标签序列:高频标签置前,低频标签置后。同时在序列头尾插入 boseos 表示序列的开始与结束。

问题2的解法

引入Global Embedding考虑所有可能label的信息,避免贪心依赖上一个label:
e ‾ = ∑ i = 1 L y t − 1 ( i ) e i g ( y t − 1 ) = ( 1 − H ) ⊙ e + H ⊙ e ‾ H = W 1 e + W 2 e ‾ \overline{\boldsymbol{e}}=\sum_{i=1}^L y_{t-1}^{(i)} \boldsymbol{e}_i \\ g\left(\boldsymbol{y}_{t-1}\right)=(\mathbf{1}-\boldsymbol{H}) \odot \boldsymbol{e}+\boldsymbol{H} \odot \overline{\boldsymbol{e}} \\ \boldsymbol{H}=\boldsymbol{W}_1 \boldsymbol{e}+\boldsymbol{W}_2 \overline{\boldsymbol{e}} e=i=1Lyt1(i)eig(yt1)=(1H)e+HeH=W1e+W2e

y t − 1 y_{t-1} yt1是在 t − 1 t-1 t1时间步预测的标签概率分布, e i e_i ei l i l_i li的embedding。本质上就是根据概率分布对所有可能标签做加权求和。 H H H则是门控机制,控制加权embedding的比例。

实验结果

exp

加上GE效果更加明显!


参考

  • SGM
  • 多标签文本分类-如何有效的利用标签之间的关系
  • 多标签分类新建模方法

相关文章:

  • C++【类和对象】
  • neo4j随笔-将csv文件导入知识图谱
  • 正则表达式(3)常见的正则表达式及语法明细
  • 物联网-IoTivity:开源的物联网框架
  • 【从0到1搞懂大模型】神经网络的实现:数据策略、模型调优与评估体系(3)
  • MySQL 表的字段数量和单行存储容量受存储引擎、数据类型、行结构等多因素限制
  • Vue使用jsts,将wkt转为geojson
  • 爬虫案例十一js逆向数位观察网
  • Pytorch 第九回:卷积神经网络——ResNet模型
  • 【leetcode100】组合总和Ⅱ
  • 清华大学08-使用DeepSeek赋能家庭教育【文末附下载地址】
  • Python绘制数据分析中经典的图形--列线图
  • 【接口负载】✈️整合 Resilience4j 指定接口负载,避免过载
  • 蓝牙4.0BLE协议栈中串口应用详解
  • [HTTP协议]应用层协议HTTP从入门到深刻理解并落地部署自己的云服务(1)知识基础
  • Ollama在AutoDL部署,CPU服务器做代理,实践中
  • 基于SpringBoot的智能问诊系统设计与隐私保护策略
  • ChatGPT使用经验分享
  • Android MVC、MVP、MVVM三种架构的介绍和使用。
  • 蓝桥杯 C++ b组 积木画深度解析
  • 央视起底“字画竞拍”网络传销案:涉案44亿元,受害者众多
  • 多地举办演唱会等吸引游客刺激消费,经济日报:引导粉丝经济理性健康发展
  • 陕西省安康市汉阴县县长陈永乐已任汉阴县委书记
  • 2025年中国网络文明大会将于6月10日在安徽合肥举办
  • 国台办:实现祖国完全统一是大势所趋、大义所在、民心所向
  • 中东睿评|特朗普中东三国行:喧嚣的形式与空洞的实质