6.4 小结

6.4 小结

构建翻译错误语料库是基于经验的方法研究翻译错误的基础。但是翻译错误语料库的标注和校对是一件极其费时费力的工作。首先要对翻译错误进行分类,并制定明确可行的划分和标注标准。由于翻译错误的多样性和复杂性,不同语言对的翻译又有特殊性,因此翻译错误的划分观点难以形成一致,实施过程中更有十分复杂的情形需要判定。尽管开发了相应的标注工具可以提高标注的准确性、效率和一致性,但是改变不了翻译错误标注的复杂性。

鉴于上述情况,目前的翻译错误语料库规模都不大,标注标准也不统一。数据的质量和规模是机器学习的两个关键要素,可见,要实现翻译错误的自动识别还有很多问题亟待解决。

注释

1 http://corpus.leeds.ac.uk/mellange/ltc.html

2 介绍:http://ufal.mff.cuni.cz/pbml/96/art-zeman-fishel-berka-bojar.pdf;下载地址:http://terra.cl.uzh.ch/addicter.html

3 www.dfki.de/~mapo02/hjerson/