NLP学习路线图(三十六): 机器翻译
一、从幻想到现实:机器翻译的跌宕征程
机器翻译并非新生事物,其发展历程堪称一部交织着雄心、挫折与突破的史诗:
-
黎明与寒冬(1950s-1980s):规则驱动的探索
-
起点(1954): 标志性的乔治城-IBM实验,用仅6条语法规则和250个词汇,成功将60多个俄语句子翻译成英语,点燃了早期希望。
-
方法论: 基于规则。语言学家和计算机科学家合作,手工编写庞大的:
-
双语词典: 提供词与词之间的对应关系。
-
语法规则: 描述源语言和目标语言的句法结构(如主谓宾)及其转换规则。
-
转换规则: 如何将源语言的语法结构映射到目标语言。
-
-
挑战与局限:
-
规则爆炸: 语言的复杂性和例外情况无穷无尽,规则集变得极其庞大、
-
-