当前位置: 首页 > news >正文

Named Entity Recognition with Bidirectional LSTM-CNNs(基于双向LSTM神经网络的命名实体识别)论文阅读

标题:Named Entity Recognition with Bidirectional LSTM-CNNs

(于双向LSTM神经网络的命名实体识别)

作者:Jason P .C. Chiu,Eric Nichols

单位: 哥伦比亚大学,本田研究所

发表期刊:CL

发表时间:2016年

论文研究主题归类:自然语言处理

1.论文解决什么问题

本文提出了提出了一种新的神经网络架构,这个架构可以通过使用双向LSTM和CNN的混合模型自动提取单词级和字符级的特征,避免了大量特征工程的工作。

提出了词汇表部分匹配算法,通过BIOES Annotation 去对词汇表中的单词前缀后缀进行匹配。通过引入使用公共资源构建的词汇表,本文的模型在CONLL-2003数据集上取得91.62的F1值,在OneNotes数据集上取得86.28的F1值。

2.是否有公开的数据集及源代码

数据集:CoNLL 2003 Dataset | Papers With Code

DBpedia Dataset | Papers With Code

https://paperswithcode.com/dataset/ontonotes-5-0

源代码:https://github.com/flairNLP/flair

3.论文的主要观点

作者认为命名实体识别是一项具有挑战性的任务,传统上需要特征工程和词典形式的大量知识才能实现高性能。为了处理变长序列,我们可以使用RNN模型,但是为了改变RNN无法提取长距离的依赖,衍生出了LSTM模型。一个双向的LSTM模型能够考虑单词两边的所有有用的信息。

相关文章:

  • buctoj_算法设计与分析(5)
  • Linux——Shell编程之循环语句(笔记)
  • 嵌入式系统的开发流程
  • 【AI论文】用于评估条件图像生成的统一代理框架
  • Spring 单元测试核心注解全解:@InjectMocks、@MockBean、@Mock、@Autowired 的区别与实战
  • 关于字节跳动旗下的豆包(DouBao)软件的详解、核心功能以及与同类产品的对比分析
  • 【C/C++】深入理解整型截断与提升:原理、应用与区别
  • 【Linux网络】Socket 编程TCP
  • 第十六届蓝桥杯大赛软件赛省赛 Python 大学 B 组 满分题解
  • echo命令,tail命令,反引号,重定向符
  • PythonFlask打造高效流式接口的实战
  • SPI接口DAC设备驱动与应用程序开发
  • 面试求助:在性能测试中发现CPU占用过高应该如何进行分析?
  • 科普:如何通过ROC曲线,确定二分类的“理论阈值”
  • Golang|锁相关
  • Python——Matplotlib库的练习
  • HarmonyOS:使用Refresh组件实现页面下拉刷新上拉加载更多
  • 【蓝桥云课】男女搭配 python
  • c语言坦克对战(前言)
  • Rust编程学习(一): 变量与数据类型
  • 港股持续拉升:恒生科技指数盘中涨幅扩大至6%,恒生指数涨3.3%
  • 牛市早报|中美经贸高层会谈达成重要共识,取得实质性进展
  • 广西百色通报:极端强对流天气致墙体倒塌,3人遇难7人受伤
  • 昆明一学校门外小吃摊占满人行道,城管:会在重点时段加强巡查处置
  • 乘客被地铁厕所门砸伤,南京地铁:突然坏的,已和乘客沟通处理
  • 巴西总统卢拉将访华