2.2.3 同义词库的编纂原则与体例
2.2.3.1 词库的语境组织原则
那么,如何将一些词汇组织成为一个词库,以便于上述词汇层的决定性特征发挥作用呢?
Halliday对当时几种主要的编纂原则提出了批评。他指出正字法、音位法和语法原则对于同义词的区分与选择不起什么作用。他提出的方案是基于语境原则。此处,语境指的是:①搭配,即一个词与其他词共同出现的倾向或概率;②其余一些非搭配性特征,这些特征可以从文本中抽取出来,而不是完全依赖于情景语境本身。
这样一来,词库就可以在机器翻译中发挥如下两个方面的作用:一是可以为原文中的词语提供一一对等的翻译;二是在对等词缺失的情况下,可以提供一个与之对等的词语串(ibid.:9-10)。从阶与范畴语法的角度来看,前者是在词这个级阶上实现源语和目标语的等值翻译,而后者是在更高的级阶中进行实现。
2.2.3.2 词库的编纂体例
Halliday对同义词词库(Thesaurus)下了一个明确的定义:在这类词典中,单词按语境原则组织成为一个序列,每一个单词是一个或几个序列中的项目(ibid.:11)。
同义词词库的编纂包括两个基本阶段:①为原文中的某个单词提供对等的译文;②以这组单词为关键词,建立同义词词库。此时,目标语中一般只有一个单词与之对应。在某些情况下,存在多个同义词。
在一个同义词词库中,相应的词条包括三个主要的组成部分:被释义词、释义词以及所出现的情景语境或语言语境。编纂体系如表2.2所示:
表2.2 英汉铁路术语的翻译与释义(节略自ibid.:14)
在词典学中,英语中的“station”“track”“line”和“railway”称为被释义词,而“huochezhan”(火车站)、“guidao”(轨道)、“tielu”(铁路)等则为相应的释义词。显然,一个被释义词有多个释义词。例如,“station”的释义词就有“huochezhan”(火车站)、“chezhan”(车站)和“zhan”(站)。
左边的例句是被释义词、释义词共同出现的语言语境,而括号内的指示语则表示话语的情景语境。正是在这样一个语境中,被释义词和释义词才能相互替代而不改变意义,即释义词就是被释义词的对等词。
2.2.3.3 词语的选择
同义词词库编纂的目的是为了服务于机器翻译的需要。因此,它的一个关键任务是提出并运用目标语中一些特殊的、起决定性作用的特征,尽可能地对同义词候选集进行“压缩”,从而达到理想的原文和译文在词汇层的一一对应。换言之,需要针对一个给定的被释义词,结合其所出现的语境在一组同义词中找到最佳释义词。例如,表2.2中句2的最佳释义词是“huochezhan”(火车站),而不是其他的同义词“chezhan”(车站)或“zhan”(站)。
这个词语的选择一方面需要考虑语境因素,尤其是搭配关系的制约,另一方面需要考虑该词与其他候选同义词所构成的纵聚合关系。Halliday进一步将同义词的聚合关系分为两大类:①明确化(specification),句2、句3和句4中的释义词“huochezhan”“chezhan”和“zhan”相互替换后并不产生意义的差别,而只是使得语义更加精确;②分类(classification),句12、句14和句16中的“track”(轨道)、“line”(路)和“railway”(铁路)虽然指称的是相同的实体,但是各词具有不同的内涵。因此,相应的释义词之间就不是一种明确化关系,而是分类关系(ibid.:13-14)。沿着这两个维度,就可以在一定程度上对具有聚合关系的同义词进行区分与选择。