NLP学习路线图(三十八): 文本摘要
一、任务定义:从“长篇累牍”到“言简意赅”
文本摘要的核心目标是将源文本(Source Text)转换为一个显著更短的目标文本(Summary),同时满足以下关键要求:
-
信息性(Informativeness): 摘要必须准确、完整地传达原文的核心信息、关键事实、主要论点和结论。
-
简洁性(Conciseness): 摘要长度远小于原文,剔除冗余、次要细节和重复信息。
-
流畅性(Fluency): 生成的摘要文本应语法正确、语义连贯、易于人类阅读和理解。
-
忠实性(Faithfulness): 摘要必须忠实于原文信息,不能歪曲事实、添加原文不存在的信息或引入偏见(除非是指定风格的要求)。
核心分类维度:
-
根据摘要与原文的关系:
-
抽取式摘要(Extractive Summarization): 如
-