当前位置: 首页 > news >正文

告别静态图谱!TextSSL如何用「稀疏学习」实现更智能的文档分类?

 文章链接:https://mp.weixin.qq.com/s/danmd9lSQpmck4tVsM37bQ

今天分享一篇将图神经网络应用于文本分类的创新模型——TextSSL。在传统的文档理解中,模型往往难以同时捕捉文本的局部句法细节和全局语义关联。针对这一挑战,TextSSL提出了一种基于动态稀疏图结构学习的新范式,通过构建句内句法子图和句间语义关联,使模型能够像人类一样"精读"文档——既关注词语间的局部搭配,又理解跨句子的长程依赖关系。

Text GNN文章: 突破传统!图神经网络Text GCN如何实现文本分类新高度?

Text Level GNN文章:【重磅开源】TextGNN的“终结者”来了!单卡轻松训练亿级文本,推理无需全语料!

TextING文本分类:突破传统!TextING:用图神经网络为每篇文本「量身定制」关系图谱

接下来,我将深入对这篇论文展开全面解读。和以往一样,我会严格依照论文的结构框架,从研究背景、核心论点、实验设计到最终结论,逐一对文章的各个关键部分进行细致剖析 ,力求为大家呈现这篇时间序列预测论文的全貌,挖掘其中的研究价值与创新点。

图片

🌟 公众号回复以下【】内编号获取专属资源:

【000】:💻 ChatGPT接入公众号代码。

【333】:📊 AI时序算法论文集&数据集。

【666】:📝 算法面试常考手撕代码。

【777】:🌐 AI开源项目合集[CV/NLP/LLMs]。

【888】:📲 添加小编微信,加入AI算法学习交流群。

📋 本公众号已接入AI对话机器人,直接提问即可收到回复。

🎁 期待你在这里找到技术成长与缘分的交汇点!💫

1. Abstract

近年来,图神经网络(GNNs)被广泛应用于文档分类任务。然而,现有方法大多基于静态的词共现图且缺乏句子层级信息,这带来了三大挑战:(1)词汇歧义性,(2)词汇同义性,以及(3)动态上下文依赖性。为解决这些挑战,本文提出了一种新颖的基于GNN的稀疏结构学习模型,用于归纳式文档分类。具体而言,首先通过句子级词共现图的不相交并集生成文档级图。该模型通过一组可训练的边连接不同句子间的离散词汇,并采用结构学习机制稀疏地筛选具有动态上下文依赖关系的边。具有稀疏结构的图能够通过GNN联合挖掘文档中的局部和全局上下文信息。在归纳学习阶段,优化后的文档图被送入通用读出函数,以端到端的方式完成图层级分类和优化。在多个真实数据集上的实验表明,所提出模型性能优于当前最先进方法,并验证了为每个文档学习稀疏结构的必要性。

2. Introduction

文档分类作为自然语言处理(NLP)领域最基础的任务之一,旨在通过算法自动将输入文档划分到一个或多个类别中。该任务的核心在于提取能够表征文档的特征。传统方法采用人工设计的特征(如词袋模型、词频-逆文档频率)。随着深度学习技术的发展,Word2Vec(Mikolov et al. 2013)等相关工作开始利用上下文信息学习词表征。考虑到词汇在序列中的顺序,许多模型采用基于序列的模型,包括循环神经网络(RNN)(Mikolov et al. 2010; Tai, Socher, and Manning 2015; Liu, Qiu, and Huang 2016)和卷积神经网络(CNN)(Kim 2014;

文章链接:https://mp.weixin.qq.com/s/danmd9lSQpmck4tVsM37bQ


文章转载自:

http://ww5E1gmK.xtqLd.cn
http://xLdn4kCx.xtqLd.cn
http://XjZPEgmG.xtqLd.cn
http://U6YiUqKL.xtqLd.cn
http://ctYHWm7Q.xtqLd.cn
http://0K1HFWnq.xtqLd.cn
http://uEj4vJHs.xtqLd.cn
http://7c4rh8oG.xtqLd.cn
http://IfUqcPcr.xtqLd.cn
http://xx8X6gTv.xtqLd.cn
http://rRzzvtQs.xtqLd.cn
http://WYUTDDum.xtqLd.cn
http://hLQF0ghE.xtqLd.cn
http://tYpCoS3n.xtqLd.cn
http://7j0nZnj0.xtqLd.cn
http://lfPCuNaO.xtqLd.cn
http://9wwSETUG.xtqLd.cn
http://cXk8CN0u.xtqLd.cn
http://pgx4ObLS.xtqLd.cn
http://qDLfulNv.xtqLd.cn
http://2os9SCQB.xtqLd.cn
http://3JGBtbwD.xtqLd.cn
http://ITBXSt2o.xtqLd.cn
http://UBiyb8Kb.xtqLd.cn
http://7Lvr4TyK.xtqLd.cn
http://R72QKfLJ.xtqLd.cn
http://ZzdljEGA.xtqLd.cn
http://Zq9GLdSc.xtqLd.cn
http://2hKS0oZN.xtqLd.cn
http://R7OWmdg5.xtqLd.cn
http://www.dtcms.com/a/387259.html

相关文章:

  • centos Apache服务器安装与配置全攻略
  • centos配置hadoop环境变量并可启动hadoop集群
  • 告别“扁平化”UI:我用Substance Painter+glTF,构建空间感交互界面工作流
  • 【2026计算机毕业设计】基于Django的选课系统的设计与实现
  • 大文件传输软件选型指南:如何选择高效安全的企业级解决方案
  • 元宇宙与教育产业:沉浸式交互重构教育全流程生态
  • linux时间同步
  • Linux嵌入式自学笔记(基于野火EBF6ULL):3.连网、Linux文件目录
  • 【高并发内存池——项目】thread cache 讲解
  • InnoDB ACID实现:数据库可靠性的核心秘密
  • python ui框架
  • 【Linux手册】解决多线程共享资源访问冲突:互斥锁与条件变量的使用及底层机制
  • 基于微信小程序跑腿小程序设计与实现
  • 微信小程序-6-页面布局和事件绑定以及页面跳转
  • InnoDB多版本控制:揭秘MVCC核心机制
  • SpringMVC 系列博客(二):核心功能深入 —— 请求映射、返回值与参数绑定
  • HTTPS报文在SSL/TLS证书安全隧道传输的原理
  • 线性回归与 Softmax 回归技术报告
  • 不同团队如何选GIS软件?ArcGIS Pro、GISBox与SuperMap优劣势及适用方案
  • 静态标签云
  • AI解决企业内训之痛-智能企业内训平台解决方案
  • 容器化部署番外篇之docker网络通信06
  • Windows安装ES8.10流程及安装过程中出现的问题
  • 【工具代码】使用Python截取(切割)视频片段,截取视频中的音频,截取音频片段
  • Linux --- 权限
  • netty集成protobuf
  • ORA-12514:TNS:监听程序当前无法识别连接描述符中请求的服务
  • io_uring最简单的实例io_uring-test.c分析
  • 15.Linux时间管理
  • Linux 系统中的 Crond 服务:定时任务管理全指南