Stance Classification with Target-Specific Neural Attention Networks
(单目标立场检测)哈工大,深圳研究生院
International Joint Conferences on Artificial Intelligence Organization(26th IJCAI)
摘要:立场分类是情感分析领域的一个新兴问题,其目的是检测文本中对特定目标的立场。立场分类与传统的方面级情感分类(aspect-level)的一个主要区别在于立场的识别依赖于文本中可能没有明确提及的目标。这表明除了文本内容外,目标信息对立场检测也很重要。为此,该文提出一种基于神经网络的模型,通过一种新颖的注意力机制,将特定目标信息融入立场分类中。具体来说,注意力机制有望定位文本中与目标相关的关键部分。在英文和中文立场检测数据集上的实验结果表明,该模型取得了最好的性能。
特定目标立场检测:只想了解作者对特定目标或主题的立场而不是整个文本的极性。
1 Introduction
立场检测与情感分类的区别:立场检测依赖于在文本中发现的主观表达和可能没有明确提到的相关目标。由于后面这个原因,这可能会导致模型在预测立场时做出错误的决策。
- 文章提出的模型:一种基于神经网络的模型,即目标特定注意网络(TAN),以在立场检测中充分利用目标信息。模型思路:首先,我们将文本和目标的嵌入向量连接起来,学习用于文本和目标建模的目标特定的嵌入。然后,我们使用一个全连接的网络来学习注意信号,以驱动分类器来关注文本中的显著部分,并最终确定立场。在英文和中文数据集上的实验结果表明,所提出的模型优于许多竞争基线,并提供了我们所知的最先进的性能。
- 本文贡献:
- TAN,能够在涉及不同目标时,提取给定文本的核心部分。
- 提出了一种神经注意模型来提取目标
- 实验结果
2 Related Work
- stance detection
- Neural attentional model:
- (Kai Sheng Tai) Improved semantic representations from tree-structured long short-term memory networks 使用了一个具有长-短期记忆(LSTM)的树状结构的RNN来进行情绪分类RNN的优点是它能够更好地捕获上下文信息,特别是长文本的语义。然而,rnn不能注意到文本的突出部分。
- 然而,目前还没有用于立场检测任务的神经注意模型。
3 Model
模型结构:们的模型的总体架构如图1所示。它由两个主要组成部分组成:
- RNN作为文本的特征提取器
- 全连接网络作为目标特定注意选择器。
这两个组件通过分类层中的元素级乘法运算组合在一起。
3.1 RNN with LSTM
在本研究中,我们采用双向LSTM模型来更好地捕获文本中的信息。双向LSTM有一个正向LSTM和一个反向LSTM。每个单词的注释是通过连接前隐藏状态和后隐藏状态来获得的
3.2 Target-augmented Embedding
为了结合目标和文本信息,设置一个目标嵌入
3.3 Target-specifific Attention Extraction
传统的RNN模型不能捕捉到句子中的重要部分。为了解决这个问题,我们设计了一个注意机制,它驱动模型集中于文本中关于特定目标的突出部分。为了充分利用目标信息
Sigmood函数通常用于二分类问题,将输出映射到[0,1]区间内。Sigmood函数的数学表示为:
, 其中,x表示输入的数据。
softmax函数通常用于多分类问题,将输出映射到概率值。softmax函数的数学表示为:
,其中,
表示第i个输入,n表示总的输入个数。
总的来说,两种激活函数都有各自的用途和特点,需要根据具体的问题来选择合适的激活函数。