2.4 层次化的翻译评价体系

2.4 层次化的翻译评价体系

宏观评价和诊断评价各有特点和优势,实际应用中,对译文评价的需求是多方面的,也是多变的。有时既需要从宏观评价中得到一个整体的质量区分度,又需要了解译文在哪些方面存在问题。为此,我们提出了构建层次化翻译评价体系的思想。层次化评价体系以功能语言学的思想为基础,从粗到细分为多个层次对译文的质量进行评估,以适用于多种应用需求。目前原文的句子是评价的基本单位,可以是独立的句子,也可以是篇章中的句子。

译文质量评价体系设计为四层:整体评价层(L0层)、质量分解层(L1层)、错误类型层(L2层)、具体错误层(L3层),如图2-3所示。L0和L1层采取等级评分法,将整体质量、质量分解划分为0-4级的得分。在错误类型层评价时,需要标注错误的种类,基于标注结果可统计某一类型翻译错误的发生频次。基于错误类型并结合错误的严重程度,利用减分法从满分中扣除错误分,可得到上一层质量分解层的得分。错误层评测可进一步明确错误的位置,根据该层的评测结果能够反映出机器对某些特定语言现象的处理能力。该层评测同样可累计得到具体错误的发生频次,并转换为更高层的得分。

alt

图2-3 层次化评价体系的架构

整体评价(L0)是评价员根据原文或参考译文从宏观上对机器译文的质量印象分,也就是前面提及的宏观评价。质量分解层(L1)将译文质量分解为忠实度和流利度两个角度来评价。忠实度从语义转换层面衡量译句的质量,评价时需要依据原文或参考译文;流利度评价仅从译文是否符合目标语言的语法和表达方式层面考查,评价时不需要参照原文和参考译文。是否需要参照原文或参考译文是区分忠实度评测和流利度评测两个指标的根本。实际上忠实度和流利度是高度相关的两个参数,也是相互影响的。在综合忠实度和流利度得到整体得分时,忠实度指标的权重一般要高于流利度。可将二者的比例定为6:4形成综合得分,即:

句子整体得分=忠实度得分*0.6+流利度得分*0.4

句子评测的L2层为错误类型层,该层包括了影响译句忠实度和流利度的多种翻译错误种类。该层评测用于分析译文某种类型的翻译错误的发生情况。不同翻译错误类型对译文质量影响的严重程度不同,可根据实际情况设置错误类型的错误严重程度。评价员结合错误数目及严重程度可计算得到上一层忠实度和流利度的得分。

句子评测的L3层深入到每一类错误的具体语言现象的分析。该层可统计译文具体错误点的数目,得到扣分点的详细情况,反映机器翻译系统对某种语言现象的处理能力。图2-4是汉译英层次评价标准体系,图2-5是英译汉层次评价标准体系。详细的错误观测点设置在第3章的关键点评测方法中将展开介绍。

alt

图2-4 汉译英层次评价标准体系

alt

图2-5 英译汉层次评价标准体系