当前位置: 首页 > news >正文

Stance Classification with Target-Specific Neural Attention Networks

(单目标立场检测)哈工大,深圳研究生院

International Joint Conferences on Artificial Intelligence Organization(26th IJCAI)

摘要:立场分类是情感分析领域的一个新兴问题,其目的是检测文本中对特定目标的立场。立场分类与传统的方面级情感分类(aspect-level)的一个主要区别在于立场的识别依赖于文本中可能没有明确提及的目标。这表明除了文本内容外,目标信息对立场检测也很重要。为此,该文提出一种基于神经网络的模型,通过一种新颖的注意力机制,将特定目标信息融入立场分类中。具体来说,注意力机制有望定位文本中与目标相关的关键部分。在英文和中文立场检测数据集上的实验结果表明,该模型取得了最好的性能。

特定目标立场检测:只想了解作者对特定目标或主题的立场而不是整个文本的极性。

1 Introduction

立场检测与情感分类的区别:立场检测依赖于在文本中发现的主观表达和可能没有明确提到的相关目标。由于后面这个原因,这可能会导致模型在预测立场时做出错误的决策。

  1. 文章提出的模型:一种基于神经网络的模型,即目标特定注意网络(TAN),以在立场检测中充分利用目标信息。模型思路:首先,我们将文本和目标的嵌入向量连接起来,学习用于文本和目标建模的目标特定的嵌入。然后,我们使用一个全连接的网络来学习注意信号,以驱动分类器来关注文本中的显著部分,并最终确定立场。在英文和中文数据集上的实验结果表明,所提出的模型优于许多竞争基线,并提供了我们所知的最先进的性能。
  2. 本文贡献:
    1. TAN,能够在涉及不同目标时,提取给定文本的核心部分。
    2. 提出了一种神经注意模型来提取目标
    3. 实验结果

2 Related Work

  1. stance detection
  2. Neural attentional model:
    1. (Kai Sheng Tai) Improved semantic representations from tree-structured long short-term memory networks 使用了一个具有长-短期记忆(LSTM)的树状结构的RNN来进行情绪分类RNN的优点是它能够更好地捕获上下文信息,特别是长文本的语义。然而,rnn不能注意到文本的突出部分。
    2. 然而,目前还没有用于立场检测任务的神经注意模型。

3 Model

模型结构:们的模型的总体架构如图1所示。它由两个主要组成部分组成:

  1. RNN作为文本的特征提取器
  2. 全连接网络作为目标特定注意选择器。

这两个组件通过分类层中的元素级乘法运算组合在一起。

3.1 RNN with LSTM

在本研究中,我们采用双向LSTM模型来更好地捕获文本中的信息。双向LSTM有一个正向LSTM和一个反向LSTM。每个单词的注释是通过连接前隐藏状态和后隐藏状态来获得的

3.2 Target-augmented Embedding

为了结合目标和文本信息,设置一个目标嵌入

3.3 Target-specifific Attention Extraction

传统的RNN模型不能捕捉到句子中的重要部分。为了解决这个问题,我们设计了一个注意机制,它驱动模型集中于文本中关于特定目标的突出部分。为了充分利用目标信息

Sigmood函数通常用于二分类问题,将输出映射到[0,1]区间内。Sigmood函数的数学表示为:

, 其中,x表示输入的数据。

softmax函数通常用于多分类问题,将输出映射到概率值。softmax函数的数学表示为:

,其中,

表示第i个输入,n表示总的输入个数。

总的来说,两种激活函数都有各自的用途和特点,需要根据具体的问题来选择合适的激活函数。

3.4

http://www.dtcms.com/a/276026.html

相关文章:

  • Linux解决vim中文乱码问题
  • SE机制深度解析:从原理到实现
  • tiktok 弹幕 逆向分析
  • 缺陷特征粘贴增强流程
  • 李宏毅(Deep Learning)--(三)
  • python内置函数 —— zip
  • MyBatis实现分页查询-苍穹外卖笔记
  • 在 Android 库模块(AAR)中,BuildConfig 默认不会自动生成 VERSION_CODE 和 VERSION_NAME 字段
  • docker基础与常用命令
  • 如何让AI更高效
  • 留学真相:凌晨两点被海关拦下时,我才明白人生没有退路
  • 如何用Python编程实现一个简单的Web爬虫?
  • Echarts学习方法分享:跳过新手期,光速成为图表仙人!
  • 【Lucene/Elasticsearch】 数据类型(ES 字段类型) | 底层索引结构
  • 易混淆英语单词对比解析与记忆表
  • 股票的k线
  • BKD 树(Block KD-Tree)Lucene
  • 以太坊重放攻击
  • 特辑:Ubuntu,前世今生
  • 关于学习docker中遇到的问题
  • AI领域的黄埔军校:OpenAI是新一代的PayPal Mafia,门生故吏遍天下
  • 可以用一台伺服电机控制多台丝杆升降机联动使用吗
  • 类和对象—多态
  • C语言:20250712笔记
  • SpringBoot集合Swagger2构建可视化API文档
  • P2619 [国家集训队] Tree I
  • 【Datawhale AI夏令营】Task2 笔记:MCP Server开发的重难点
  • 【LeetCode 热题 100】98. 验证二叉搜索树——(解法一)前序遍历
  • Python 三大高频标准库实战指南——json · datetime · random 深度解析
  • 【Java入门到精通】(二)Java基础语法(上)