5.4 术语一致性检查

5.4 术语一致性检查

术语作为译文中一类特殊的内容,不仅要求翻译得准确,而且要求符合一定的规范,并且在语篇上下文中、或者由多人共同完成的长篇译文中、或者产品介绍的不同版本中能够保持术语的译法前后一致。这一点在科技类等专业文献的翻译中尤为重要。

由于人工校对需要付出大量的人力,术语一致性检查目前是基于自然语言处理技术实现自动检查。术语一致性检查已经作为计算机辅助翻译(Computer Assistant Translation,CAT)的一个组成部分嵌入到系统中,用于控制和检查译文的质量。这方面已有较为成熟的工具软件,如:ApSIC Xbench、D.O.G Error Spy、SDL QA Checker、SDL Trados Studio等。

术语一致性检查有多种方式。一种是基于数据库的方法:通过构建较大规模、覆盖面较广的术语库,在译文中检索匹配术语并和术语库的标准译文进行比对。一般只有大型的翻译公司才建有这样的术语库。另一种为基于统计的方法,下面介绍基于统计的术语一致性检查。

基于统计的术语一致性检查包括三个步骤:原文术语自动识别、翻译术语的对齐、翻译一致性检查。第一步和第二步都是自然语言处理技术的研究内容,有很多相关文献介绍,这里不再展开赘述。术语一致性检查的原理是:在第一步和第二步后,统计出原文术语在译文的全部翻译结果,计算其概率分布,依据概率分布选择排序最前的译法,用于修订其他译法。当然排名最前的译法并不一定能替代所有其他译法,这与术语所在的上下文也有关。根据研究,大约70%左右的将频次最高的译法替代其他译法是正确的。

Itagaki et al.(2007)训练了一个分类器检查术语翻译一致性。分类器的特征用到了两个条件概率,即在原文术语s出现的条件下某个译法ti出现的条件概率pti|s),在某一个译法出现的条件下某个原文术语出现的概率ps|ti)。分类器采用高斯混合模型(Gaussian mixture model)得以实现。在英日翻译样本数据上的实验结果为:准确率0.8780、召回率0.9574、F值0.9160,实验结果达到实用的水平。

术语一致性检查作为CAT工具的一部分,用于发现术语翻译问题,自动检查系统还可以为用户提供术语的候选译法。一般,最终术语翻译是否修改还要交给人去完成。