当前位置: 首页 > news >正文

通过回答自然语言问题进行事件抽取(EMNLP2020)

1、写作动机:

以往的事件抽取方法都基于神经网络模型抽取的密集特征和预训练语言模型的上下文表示。但是,它们(1)严重依赖实体识别进行事件论元抽取,特别是通常需要采用多步骤方法来进行事件论元抽取。(2)忽略了不同论元角色间的语义相似性。

2、主要贡献:

1)针对事件抽取任务首次提出了一种新的范式——将其表述为问答(QA)/机器阅读理解(MRC)任务。

2)设计了用于触发检测的固定问题模板和用于抽取每个论元角色的各种问题模板。

3、优点:

(1)该方法不需要实体标注(黄金信息或预测的实体信息)。更具体地说,它是采用端到端模型进行事件论元抽取,不需要实体识别的任何预处理步骤。

(2)问答范式能够学习不同模型中语义相似的论元角色而进行事件论元抽取。

4、模型:

4.1提问策略:

4.2问答模型:

使用BERT(Devlin et al., 2019)作为基础模型,BERT_QA_Trigger预测句子中每个token的类型,而BERT_QA_Arg预测论元范围的开始和结束偏移量。

5、实验:

6、错误分析:

1)缺乏获取论元范围的精确边界的知识。例如,在“Negotiations between Washington and Pyongyang on their nuclear dispute have been set for April 23 in Beijing …”中,对于ENTITY角色,应抽取两个论点范围(“Washington”和“Pyongyang”)。

2)缺乏文档级上下文的推理。

3)数据和词汇稀疏性.

相关文章:

  • 服务器为什么大多用 Linux?
  • 云原生架构未来发展趋势,探索容器技术未来的发展趋势
  • PyTorch的Tensor(张量)
  • 阶段十-分布式-任务调度
  • 【hyperledger-fabric】部署和安装
  • openpose+smplx
  • 长虹智能电视ZLS59GiD机芯刷机方法及刷机固件,附进维修模式方法
  • 【HarmonyOS开发】共享包HAR和HSP的创建和使用以及三方库的发布
  • table表格中使用el-popover 无效问题解决
  • 双括号初始化
  • 体元法--体积计算
  • Java多线程<三>常见的多线程设计模式
  • Eureka工作原理超详细讲解介绍
  • 【Java期末】学生成绩管理系统
  • 构建健康游戏环境:DFA算法在敏感词过滤的应用
  • 阿里云30个公共云地域、89个可用区、5个金融云和政务云地域
  • Android 实现 Slots 游戏旋转效果
  • 大华主动注册协议介绍
  • MAC 中多显示器的设置(Parallels Desktop)
  • Spring Boot日志配置
  • 体育文化赋能国际交流,上海黄浦举办国际友人城市定向赛
  • 知名中医讲师邵学军逝世,终年51岁
  • 民间打拐志愿者上官正义遭人身安全威胁,杭州公安:已立案
  • 首次公布!我国空间站内发现微生物新物种
  • 外交部部长助理兼礼宾司司长洪磊接受美国新任驻华大使递交国书副本
  • 澎湃与七猫联合启动百万奖金征文,赋能非虚构与现实题材创作