当前位置: 首页 > news >正文

Named Entity Recognition with Bidirectional LSTM-CNNs(于双向LSTM神经网络的命名实体识别)论文阅读

标题:Named Entity Recognition with Bidirectional LSTM-CNNs

(于双向LSTM神经网络的命名实体识别)

作者:Jason P .C. Chiu,Eric Nichols

单位: 哥伦比亚大学,本田研究所

发表期刊:CL

发表时间:2016年

论文研究主题归类:自然语言处理

1.论文解决什么问题

本文提出了提出了一种新的神经网络架构,这个架构可以通过使用双向LSTM和CNN的混合模型自动提取单词级和字符级的特征,避免了大量特征工程的工作。

提出了词汇表部分匹配算法,通过BIOES Annotation 去对词汇表中的单词前缀后缀进行匹配。通过引入使用公共资源构建的词汇表,本文的模型在CONLL-2003数据集上取得91.62的F1值,在OneNotes数据集上取得86.28的F1值。

2.是否有公开的数据集及源代码

数据集:CoNLL 2003 Dataset | Papers With Code

DBpedia Dataset | Papers With Code

https://paperswithcode.com/dataset/ontonotes-5-0

源代码:https://github.com/flairNLP/flair

3.论文的主要观点

作者认为命名实体识别是一项具有挑战性的任务,传统上需要特征工程和词典形式的大量知识才能实现高性能。为了处理变长序列,我们可以使用RNN模型,但是为了改变RNN无法提取长距离的依赖,衍生出了LSTM模型。一个双向的LSTM模型能够考虑单词两边的所有有用的信息。

http://www.dtcms.com/a/126972.html

相关文章:

  • JDBC驱动autosave缺陷的修复与配置指南
  • 移动端六大语言速记:第10部分 - 标准库与框架
  • c++知识点1
  • AI数据分析的正道是AI+BI,而不是ChatBI
  • 改善 Maven 的依赖性
  • SUNO-听你所想
  • Linux目录探秘:文件系统的核心架构
  • docker部署jar包并启动
  • PyTorch实现二维卷积与边缘检测:从原理到实战
  • idea光标变成白色方块的解决方法
  • AF3 ProteinDataset类的初始化方法解读
  • UWB定位算法详解(2025年更新版)
  • 电气隐患难察觉?安科瑞智慧用电方案实现风险实时可视化管理
  • 项目整合提问
  • LeetCode hot 100—最长回文子串
  • java HttpServletRequest 和 HttpServletResponse
  • 制作一款打飞机游戏教程1
  • 使用 Redis + Redisson 分布式锁来生成全局唯一、线程安全的带日期前缀的流水号的完整实现。
  • 【FPGA开发技巧】Modelsim仿真中,显示状态机的名称,而非编码数字
  • 水库大坝安全监测系统
  • 蓝桥杯--结束
  • 缓存不只是加速器:深入理解 Redis 的底层机制
  • Unity IL2CPP内存泄漏追踪方案(基于Memory Profiler)技术详解
  • Charles的安装和使用教程
  • 高支模自动化监测解决方案
  • MACOS15版本安装 python mysqlclient 以连接mysql 8.0
  • 小推桌面-一款全新的第三方电视桌面-全网通桌面
  • Python数据可视化-第8章-使用matplotlib绘制高级图表
  • 后端面试问题收集以及答案精简版
  • MySQL 事务的优先级