深入理解常用依存关系标签
目录
7️⃣ 深入理解常用依存关系标签
7.1 主要标签讲解
7.2 典型结构示意图
7.3 常用组合模式
主谓宾(SVO)
主谓(SV)
状语(状词修饰动词)
介宾短语
7.4 应用建议
结语
上一篇 基于 SpaCy 框架的依存句法分析实战指南
7️⃣ 深入理解常用依存关系标签
在依存句法分析中,dep_
字段的值 就是所谓的“依存关系标签”。这些标签帮助我们理解词与词之间的语法关系。
虽然标签数量很多,但常用的掌握 10~15 个即可覆盖大多数场景。
7.1 主要标签讲解
标签 | 说明 | 示例 |
---|---|---|
ROOT | 句子的根(通常是谓语动词) | "我 喜欢 学习。" → "喜欢" 是 ROOT |
nsubj | 名词性主语 | "我 喜欢 学习。" → "我" 是 nsubj |
obj | 直接宾语 | "我喜欢 学习。" → "学习" 是 obj |
iobj | 间接宾语 | "他送给 我 一本书。" → "我" 是 iobj |
obl | 介词宾语/状语(Oblique nominal) | "他在 图书馆 学习。" → "图书馆" 是 obl |
advmod | 副词修饰语 | "他 认真地 学习。" → "认真地" 是 advmod |
amod | 形容词修饰名词 | "漂亮的 女孩" → "漂亮的" 是 amod |
compound | 复合词(前置修饰) | "人工 智能" → "人工" 是 compound |
det | 限定词(如冠词、数量词) | "一 本书" → "一" 是 det |
case | 介词 | "在 图书馆" → "在" 是 case |
mark | 从属连词(引导从句) | "我希望 如果 有时间 ..." → "如果" 是 mark |
conj | 并列关系 | "我喜欢 学习 和 运动。" → "运动" 是 conj |
cc | 并列连词 | "我喜欢学习 和 运动。" → "和" 是 cc |
punct | 标点符号 | "学习。" → "。" 是 punct |
7.2 典型结构示意图
假设句子:
小明在图书馆认真地读书。
依存树如下逻辑:
读书(ROOT)|┌─────────┼─────────────┐小明(nsubj) 图书馆(obl) 认真地(advmod)↑在(case)
解释:
-
"读书" 是句子的核心谓语,
ROOT
-
"小明" 是主语,
nsubj
-
"图书馆" 是介词宾语,
obl
,由 "在" (case
) 介词引导 -
"认真地" 是副词修饰语,
advmod
7.3 常用组合模式
主谓宾(SVO)
nsubj → ROOT → obj
主谓(SV)
nsubj → ROOT
状语(状词修饰动词)
advmod → ROOT
介宾短语
case → obl → ROOT
7.4 应用建议
-
信息抽取:重点关注
nsubj
、obj
、obl
,可提取三元组。 -
生成增强:通过
advmod
、amod
等找到修饰成分,增强生成语言风格。 -
事件抽取:通过
ROOT
、nsubj
、obj
组合确定事件结构。 -
QA 系统:根据依存树裁剪长句、理解疑问句结构。
结语
掌握依存句法分析是 NLP 开发中非常重要的一环。通过 SpaCy 这样高效易用的工具,可以帮助你轻松构建各种基于依存关系的 NLP 应用场景。
👉 建议实践:多分析常见文本,熟悉标签分布 + 自定义规则提取。