2.2.4 同义词库法在统计机器翻译中的应用与展望
在统计机器翻译的研究中,人们已经明确地提出了一个“译后编辑”的阶段,即对机器翻译系统从源语到目标语处理后生成的译文所进行的后期编辑操作(魏长宏、张春柏,2007;Hutchins,2009:516-517)。近年来,随着全球翻译市场的迅猛发展,出现了对译后编辑的巨大需求。
通过研究Halliday的同义词库法,我们发现他较早地认识到了译后编辑的重要性:不但把它作为一个独立的阶段提出,而且认为它比前一个阶段,即从源语到目标语的处理更为重要。
表2.3 统计机器翻译与同义词库法的翻译过程划分比较
Halliday之所以得出这个结论,并非依赖于当时的科学技术,而是取决于他作为一个语言学家的优良素养:①任何一种语言在语法和词汇层次上都有其内在的规律。即使是从其他语言翻译过来的译文,也必须遵循这些规律(Halliday和Webster,2007:81);②在进行跨语言对比与翻译的时候,重点应该放在对目标语的描写上:无论源语是何种语言,对目标语的描写都无须随之发生变动(ibid.)。
有必要指出的是,Halliday的同义词库法在当时的机器翻译系统中已经得到了检验和推广。Masterman等人采用这种方法之后,在一定程度上提高了译文的质量,尤其是在成语、隐喻的翻译方面。然而,有时也会出现负面情况:在意-英翻译中,“particolarmente interressante”(特别令人感兴趣的是)在前一个阶段中已经被正确翻译为了“particularly interesting”,但是进行译后编辑之后,却错误地调整为了“What's the matter?”。因此,他和团队成员对这种方法进行了改进,并将其应用范围从机器翻译推广到了图书情报检索(Masterman et al.,1958)。直至今天,改进后的同义词库法仍然受到了计算语言学界的重视(Priss和John,2009;Yorik,1995)。
此外,同义词库法对于统计机器翻译中“双语对齐”的研究也具有一定的参考价值。目前,统计机器翻译专家已经认识到了单纯依赖词汇的对齐已很难提高译文的质量(郭红梅,2006;李康熙、杨勇,2009)。以常见的短语对齐为例,在进行对齐的时候需要进行重排,从而打乱短语的连续性。因此,一种重要的改进途径是在统计机器翻译系统中添加语法知识,例如词素学知识、语法上的一致关系等(Hutchins,2009:517-518;Koehn,2012:196-222)。
然而,Halliday在同义词库法的研究中已经明确提出了词汇系统与语法系统相互结合的必要性,有关“互补”的观点值得语言学界和计算机界的共同关注(柴同文,2013)。