6.2 学习者翻译错误语料库

6.2 学习者翻译错误语料库

各国研究者都注意到了学习者翻译语料库对翻译教学和研究的重要意义,从20世纪90年代开始,纷纷研究和构建了学习者翻译语料库。这些语料库有:Bowker and Bennison的学生翻译文集(Student Translation Archive,STA)(Bowker & Bennison,2003),PELCRA项目波兰语到英语的翻译语料(Uzar & Waliński,2001),Florén(2006)的ENTRAD(Enseñaza de la Traducciòn),Sosnina的俄语翻译学习者语料库(Russian Translation Learner Corpus,RuTLC)(Sosnina 2006),欧盟MeLLANGE(Multilingual eLearning in Language Engineering)项目1构建的翻译学习者语料库(Castagnoli,2011)等。这些语料库一般都标注了学生翻译中的问题和错误,用于研究学习者在翻译中遇到的困难,研究翻译教学的方法和内容。上述语料库的基本信息数据如表6-3:

表6-3 学习者语料库的基本信息

alt

其中,规模和影响较大的当属欧盟MeLLANGE。MeLLANGE学习者翻译语料库是2004-2007年由8个国家的学术和企业界共同开展的欧盟研究项目,涉及11种语言的翻译,收集了429篇的学习者(翻译实习生)译文,每篇译文350词左右,涉及法律、管理、技术和新闻四种类型的文本,所有译文都用自动处理工具进行了语言处理,包括词汇划分(tokenisation)、词形还原(lemmatisation)、词性标注(POS tagging)等,并和原文在文档级进行了对齐,进而对翻译错误进行了分类和多层次的标注。语料声称是可以免费获取的,并提供在线检索功能,可用于语料库语言学、交互翻译教学和研究。除了学习者的翻译之外,还有专家给出的标准译文供参考。语料库标注样例如表6-4所示,其中标注的含义表示为:TR-OM——缺失,TR-TI-TF——过度随意,TR-AD——添加。

表6-4 MeLLANGE语料库法英学生翻译标注样例

alt

alt

在线查询中可查看到原文、学生译文、参考译文,方便对照。学生译文中标注了翻译的错误及其类型。查询界面如图6-1:

alt

图6-1 MeLLANGE错误在线查询界面