第1章 绪论

第1章 绪论

翻译(translation)“很可能是宇宙进化过程中迄今为止人类最复杂的一项活动”(I. A. Richards,1953)。翻译是源语言(source,又称译出语)到目标语言(target,又称译入语)的语义等价变换过程,实现以目标语言传达源语言信息的功能。翻译中要转换的信息十分复杂,包括思想、意义、情感、修辞、文体风格、文化等诸多内容。翻译理论研究认为,翻译的等价包括四个方面:词汇及词汇以上等价、语法等价、文本等价和语用等价(Baker,1992)。然而要达到这些等价关系,一般要求译者通晓源语言和目标语言两种语言,还要了解相关的文化背景知识和专业领域的知识。

随着国际化和全球化趋势的加剧、跨语言和跨文化交流的增多,翻译的需求量也在急剧增加,要翻译的文本涉及政治、经济、科技、教育、社会等众多领域。目前译文的产出不仅包括了专业译员的译作,也有语言学习者的翻译习作,而且为满足不同层面的翻译需求,机器翻译也被广泛应用,机器翻译系统在研发过程中更是有不同质量水准的译文大量产生。

有翻译就有翻译评价和翻译批评,翻译评价和翻译批评与翻译研究同步产生。通过评价这一反馈过程来评估译文的质量,探讨翻译中存在的问题,促进翻译研究的发展。翻译评价的重要性不言而喻。

然而,评价译文也许比翻译本身的复杂度更高。众所周知,对应于同一原文的译文往往是多样的,各种各样的译法源自译者对原文的不同理解以及对目标语言的不同运用方式。翻译质量评估的任务在很多情况下并不是讨论译文中存在哪些可变性,而是对译文中可能有的问题进行质量检查,以信息等价为指导思想,评估译文在多大程度上转达了原文涵盖的信息。

从评估的粒度上划分,翻译质量评价可分为宏观评价和诊断性评价两大类。宏观评价通常是从整体上衡量译文和原文的等价程度,一般以一个得分的形式反映译文质量的优劣程度。分数可以是档次分或者百分制得分。宏观评价常用于学习者翻译练习、翻译考试、机器翻译系统评测等方面。诊断评价则从译文存在的问题或翻译错误层面对译文质量给予更详细的分析。诊断评价常用于学生翻译学习过程或者机器系统研发中某些具体问题的发现与处理。一般情况下,诊断评价需要付出更多的时间,复杂度和难度也较宏观评价要高出很多。

翻译质量评价传统上由语言专业人士完成。对于大量产出的各种译文,人工评价的做法已经远远不能满足需求,现代研究开始转向利用自然语言处理和人工智能相关技术来实现翻译质量的自动评价。顾名思义,自动评价是在计算机上通过运行软件来自动完成的评价。自动评价不仅能够大大节约人力成本,更能克服人工评价的主观性、不一致性、不确定性等不利因素,而且更及时、效率更高,具有可重复性。尤其在机器翻译研究中,翻译质量自动评价已经成为翻译系统研发中密不可分的组成部分,成为机器翻译研究中十分关键的甚至是瓶颈问题。在依托语言技术的教育培训机构及大规模翻译选拔考试中,翻译自动评价方法的优势也逐渐显现,并已经得到重视和一定范围的运用。

翻译质量评价主要围绕两个问题展开,一是评价标准的问题,也就是什么样的译文是好的或正确的译法,质量得分评定的依据和标准十分关键;二是评价方法的实现问题,也即如何评,怎样评更客观、更准确。这两个问题将是本书关注的核心问题,我们将结合长期以来在该领域的研究成果予以深入讨论。构建系统、客观和可操作性的质量评价体系是翻译评价的根本,设计准确、可靠的自动评测算法是最终要达到的目标。

本书的内容安排如下:

第2章讨论翻译质量的观点和标准问题:将从功能语言学角度展开对翻译质量的理论讨论;然后介绍人工翻译质量评价的两种方式:语言专家的评价和对语言水平没有特定要求的众包评价。人工评价的主要问题是评定的量纲问题和标准问题。本章对比了宏观评价和诊断评价两种不同粒度的评价,提出了我们研究的译文质量的层次化综合评价体系,可以适应不同的评价粒度需求。

第3章介绍译文质量自动评价的方法,为本书的重点章节。目前,自动评价译文质量的研究大致分三类做法:一种是以标准译文作为参考,其实现思路是借助于语言信息处理技术,将译文和参考答案进行比较,相似度越高的译文质量就越好。第二种做法不需要提供人工译文,只基于原文和其他语言资源对译文的翻译质量进行估计,预测在多大的信度上该译文的质量是好的。第三种做法是事先确定译文中的关键语言点,根据关键信息译出与否来进行加分或减分操作,进而评判译文质量。本章将分别讨论和比较这些做法的优势和存在的问题。

第4章介绍衡量自动评测方法的性能指标和自动评测开放研究平台。自动评测算法的性能指标用于衡量算法和人工评测结果的相似性,确定各种算法评估的可信度和准确率。国际机器翻译评测有一个公开的平台,每年和机器翻译研究一起举办,为自动评测方法的研究提供数据。

第5章介绍翻译错误自动检查的方法。错误检查是诊断性评价的一部分。介绍翻译错误的分类和自动语言错误识别的相关研究,主要开展的有语法错误检查、术语一致性检查、词汇和短语级的翻译问题检查等。

第6章为翻译语料库的建设情况。数据是机器学习的关键和根本。本章总结了机器翻译错误语料库和学习者翻译错误语料库两类语料库的研究状况。

第7章介绍与翻译质量评测相关的研究。在信息检索、自动文摘、图像处理中对机器生成的内容也有类似的质量评价问题。希望这些相关工作的介绍能对翻译质量评价的研究有所启迪。

第8章介绍自动翻译评价面临的挑战以及对未来发展和应用的展望。

本书各个章节内容既相互联系又相对独立。