当前位置: 首页 > news >正文

【NLP】Penn Treebank 与 Parsing:让计算机看懂句子结构

Penn Treebank 与 Parsing:让计算机看懂句子结构

让我们举一个从古至今津津乐道的例子:

浮云长长长长长长长消

你能一下子读懂吗?

如果用不同的停顿方式,这句话可能有完全不同的意思:

  1. 浮云涨,常常涨,常涨常消 说这云经常涨啊,还经常消失。

  2. 浮云长,常长常长,常常消
    说这云可真长啊,经常这么长,还经常消失。

  3. 还有别的断句方法可参考 https://zhuanlan.zhihu.com/p/400511819

同样的字,如果没有结构,就会出现多种理解方式——这就是歧义
而我们的大脑之所以能在语境中选出一种“最顺”的读法,是因为它在无意识中画出了一棵语法树:哪几个字是一组(短语)?哪个动作修饰谁?哪些部分是描述,哪些是主要事件?

对计算机来说,如果想正确理解这句话,也必须学会画语法树
而这项工作,就叫做 Parsing(句法分析)——让机器和我们一样,识别句子的结构,排除错误的理解。

语法上,我们会分为:主语、谓语、宾语、修饰语……这种分层结构,就像一棵语法树(Syntax Tree)。
比如:

“北京是属于中国的。”

如果画成语法树,


[1]

在这里,“北京”这个名词是主语,之后是谓

http://www.dtcms.com/a/581929.html

相关文章:

  • Go 1.25 发布:性能、工具与生态的全面进化
  • 北京市保障性住房建设投资中心网站淮南吧
  • Duilib_CEF桌面软件实战之Duilib编译与第一个界面程序
  • MFC动态加载图片
  • Niagara Launcher 全新Android桌面启动器!给手机换个门面!
  • 【Vue】自定义指令之权限控制
  • asp.net网站第一次运行慢网站建设合同书保密条款
  • ZYNQ-7000双核协处理实战:ARM Cortex-A9与FPGA的智能数据采集系统
  • 慈溪哪里有做网站怎么看网站pv
  • 【PySpark】conda create -n pyspark python=3.8报错
  • CSS 数学函数完全指南:从基础计算到高级动画
  • uni-app打包app -- 在用户首次启动 App 时,强制弹出一个“用户协议与隐私政策”的确认对话框。
  • 互联网网站排名深圳住房和城乡建设局网站
  • Wi-Fi 7通信技术
  • @InitBinder注解
  • 20251107给荣品RD-RK3588-MID开发板跑Rockchip的原厂Android13系统时适配8寸屏的CTP【使用荣品的DTS】
  • 《隐匿之智:AI暗潮下的末日序章》
  • 网站建设玖金手指谷哥四wordpress注册怎样通过邮箱验证码
  • 山东首台(套)高端装备申报材料及申报流程解读
  • “互联网之光” 博览会启幕,AI+生活场景让科技触手可及
  • 应对 “读放大” 问题的新方法 —— OceanBase 中的 Merge-On-Write 表
  • 48_AI智能体核心业务之钉钉服务集成全局主控Agent:构建企业级智能助手的工程实践
  • 网站如何实现临时聊天wordpress 多店铺
  • 郑州做网站 哪家好wordpress 获取文章数量
  • 友汇网网站建设自考网页制作与网站建设
  • 【OTA专题】2 初级bootloader架构和基础工程移植
  • 极限命令执行6三字节RCE
  • 如何在Windows系统中加入程序自启动
  • 【一、基础篇】自注意力机制中的 Q,K、V 矩阵是什么缩写?
  • 配置 PostgreSQL 远程连接