AI芯天下丨深度丨纪念刘倬先生:中国机器翻译开山鼻祖、NLP先行者-600学习网
600学习网终身会员188,所有资源无秘无压缩-购买会员
前言:
机器翻译本质上属于自然语言处理技术。技术进步需要工业界和学术界不断研究和解决。
然而,中国的先行者早就提出机器翻译问题是语言问题,而不是单独的算法问题。
作者方文
图像源网络
“机器翻译的问题是语言的问题”
机器翻译,也称为自动翻译,是通过计算机将一种自然语言(源语言)转换为另一种天然语言(目标语言)的过程。
尽管语音翻译和文本翻译有各自的技术困难,但共同的核心问题是自然语言理解。
这是一个很高的,甚至是最终的目标,所以许多研究人员喜欢用另一个词,自然语言处理(NLP)来描述这一学科,强调过程而不是目的。
在方法上,他们希望快速找到语言规则,就像找到密码的编码规则很容易破解密码一样。如果他们找到了语言规则,他们就能理解自然语言,机器翻译问题就会得到解决。
机器翻译问题是一个语言问题,而不是一个单一的算法问题。
这种独特的见解对当今的机器翻译仍然具有重要的参考作用。
尽管今天的计算技术.硬件水平.大数据.语料库和其他发展都非常先进,但机器翻译的根本问题是语言本身。
纪念国内机器翻译先驱刘卓先生
刘卓先生于2022年9月12日在北京去世,享年89岁。
1953年4月,他被调到中央高等教育部综合大学系。
1954年4月至1960年10月,他在北京俄罗斯学院担任讲师。
此后,他与中国科学院语言研究所刘永泉先生合作,在中国开展了第一项机器翻译研究。
1960年11月,刘卓先生被调到语言研究所,一直从事机器翻译的研究,直到1995年。
1956年,机器翻译被列入中国国家科学工作发展计划,标题为《机器翻译.自然语言翻译规则的建立和自然语言数学理论》。
根据国家计划,刘卓先生与刘永泉先生和高祖顺先生于1957年开始开发机器翻译系统;
1959年,俄汉机器翻译系统成功测试,这是世界上第一个以汉语为翻译目标语言的跨语言系统。
1964年,他出版了中国第一部机器翻译学术著作《机器翻译简介》,详细讨论了从国外到中国机器翻译系统的发展方法。
这一阶段后来被学术界认为是中国机器翻译研究的先驱时期。作为当时的学术领袖,刘卓先生是中国机器翻译的先驱者之一。
1975年,经过十年的停滞,科学研究全面恢复,刘卓先生开始负责JFY系列英汉翻译系统的开发。
他的创新方法使今天的发展
他的研究一直聚焦于国内外语言理论.语言工程实践,并结合汉语的特点,提出了多种语言分析和生成方法:
在Chomsky的单层语法分析的基础上,采用了多层策略;扩展了传统有限状态语法的边界;
提出了词典的正则表达式和规则的函数运算;句法分析中包含常识的本体知识的隐式替换;
特别是,他根据自然语言处理和机器翻译的需要,为符号计算语言学设计并实现了一套特殊的算法语言和平台。
它包括语法定义.特殊语言的解释和执行.作为符号模型的数据结构和多层解析的控制流程,并具有质量控制.错误跟踪和纠正功能。
基于谓词a的句元分析
600学习网 » AI芯天下丨深度丨纪念刘倬先生:中国机器翻译开山鼻祖、NLP先行者-600学习网