2.1.2 机器翻译规则系统的设计方案
在1990年以前,绝大部分的机器翻译系统都是基于规则的机器翻译系统。它们的设计方案可以归纳为三种基本的类型:直接翻译、中间语翻译和转换翻译(Hutchins,2009:505-509)。
(1)直接翻译。直接翻译属于第一代机器翻译系统(从1950年至70年代中期)。主要思路是直接将原文翻译为译文,相关的句法、语义分析非常有限。它的缺陷是不利于多语种互译。此外,由于分析、转换、综合等翻译阶段没有彼此清晰地区分开来,不便于根据情况灵活地调整系统的数据、程序或组成部分,否则就有可能损害整体的有效性。
Halliday对于直接翻译持批评态度。他提出了一个重要的观点:描写先于翻译,即在翻译之前需要对所涉及的两种语言进行充分的描写和比较。因此,他认为计算机所要执行的是一种比较描写语言学上的复杂操作,而翻译只是其中的一个实例而已(Halliday和Webster,2007:24)。
(2)中间语翻译。中间语翻译属于第二代机器翻译系统(从1970年至1980年)。它的特点是先将原文翻译为中间语,然后通过中间语翻译为目标语。
Halliday充分肯定了中间语在机器翻译研究中的重要作用。他认为中间语并非自然语言,也不是人工语言,而是一种数学建构。通过中间语,就可以极大地降低多语种互译中所需编写的程序。此外,开展中间语的研究有助于推动比较语言学的发展,从而为几种语言的对比分析提供一组普遍适用的描写范畴(ibid.:32-33)。
然而,很多学者对于中间语研究的可行性持怀疑态度。Patel Scheider指出:“如果一种元语言(中间语言)能够用来做机器翻译,这种中间语言必须把许多语言的一切可能特征都综合起来进行一体化的研究,这样的研究不仅是一个无休无止的任务,而且很可能是没有结果的。这样的系统会很快地变得难以管理,而且由于不堪重负而自行崩溃。”Makoto Nagao进一步认为中间语言是不可能存在的(冯志伟,2004:42-43)。因此,Halliday的上述观点值得进一步的商榷。
(3)转换翻译。转换翻译也属于第二代机器翻译系统。在转换翻译过程中,一般明确地划分了三个阶段:第一个阶段是将原文转换为抽象的面向原语的表示式,第二阶段是转换为对应的面向目标语的表示式,第三个阶段是生成最终的目标语文本。
从总体上说,Halliday的设计方案属于转换翻译。他所采用的描写语言学理论并非当时盛行的美国结构主义语言学,而是自己刚刚提出的阶与范畴语法。在这个语法体系中,他提出了语言描写的三个基本层次:实体、形式和语境,其中形式可以进一步分为语法和词汇两个子层次。此外,Halliday还提出了语言的五个基本单位:句、小句、词组/短语、词和词素(胡壮麟、朱永生、张德禄等,2005:29-38)。
从这个基本的理论框架出发,Halliday用实例演示了机器翻译的基本过程。在第一个阶段,需要对原文的句子进行切分,依次获得其小句、词组/短语、词和词素。第二阶段是逐层往上进行翻译,即先翻译词素,然后翻译词,以此类推。在每一级阶的翻译中,先在目标语中找到概率最大的等值翻译选项,然后在更高阶层的翻译中根据该词出现的上下文语境进行调整。在第三阶段,根据目标语的内在结构对译文在词汇和语法方面作进一步的调整。例如,“多”在词素层、词层可以暂时译为“many”。但是在小句层和句层,则应该基于英语的内部结构规律逐步调整为“there are more than...”(Halliday和Webster,2007:31-32)。
从机器翻译研究史的角度来看,Halliday在1962年就准确地预测了十年后的主流机器翻译规则系统设计方案,从而体现了他在这个研究领域所具有的前瞻性和洞察力。