3.1 对比语言材料的类型

3.1 对比语言材料的类型

在语言中,意义总要借助形式来表达。这一形式包括语素、词语、短语、句子、段落、篇章等各个层级的语言单位,也包括各种语法结构,而形式总是体现在具体的语言运用实例即语言材料中。因此,用什么样的语言材料来进行语言分析,是语言对比研究和一般语言研究都要回答的问题。

根据许余龙(2010a:34-37)的讨论,可以作为语言分析依据的语言材料,按其性质可以分为两大类:一类是从语言实际使用中搜集来的实例语料(corpus-based data),另一类是通过诱导本族语使用者运用自己的语感而得来的内省语料(intuition-based data)。内省语料又可细分为自我内省语料和实验内省语料两小类。其中实验内省语料是指通过实验的方法,由其他本族语使用者即通常所谓“不谙语言学的”(linguistically naïve)本族语使用者所提供的内省语料。具体到语言对比研究,对比语言材料还有其本身的一些特点。根据许余龙的讨论,用于语言对比目的的语言材料类型可以用表10来概括。

表10 对比语言材料的类型

对照表10,出于本研究的目的,同时由于研究者本人并非双语使用者,本研究拟倚重实例语料,采用双向翻译对等语料库。用于语言对比研究的翻译对等语料库又称平行语料库(parallel corpus),因此双向翻译对等语料库可被称为双向平行语料库。下面简述理由。

采用语料库而非内省语料,一个朴素的理由是,语言研究者的语言直觉和内省很多时候并不可靠,穷尽性的实例语料统计结果常常会揭示与我们的直觉有差异的语言事实。

我们采用双向平行语料库,是因为一般来说它更能反映两种语言的实际使用情况,可以提高语料反映语言事实的可靠程度。平行,是指采用翻译对等的语料,这可以在相当大的程度上保证表达意念的对等性,增强语义内容的对应性。双向,则在一定程度上弥补了把翻译语言当作原创语言的不足。原因在于,平行语料库是建立在语用翻译对等基础上的,而语用翻译对等或多或少要受形式翻译对等和语义翻译对等的约束,因此如果语料库中只包括一种语言的译文,那么这种译文语言并不能充分反映该语言本身的实际使用情况(许余龙,2010a:36)。

一般说来,语料库都是为服务于某种研究目的而建设的。语料库的语料选择、库容大小、标注方法等方面都要受到研究目的的影响和限制。要满足我们特定的研究目的,似乎没有现成的语料库可以利用,充其量只有一些也许可资利用的生语料。因此,我们决定自行建设能满足自己研究需要的英汉双向平行语料库。我们的语料库建设总体思路是分三步走,先建设英汉双向平行语料库,然后在此基础上建成析取关系英汉平行句对库,最后在语料库中检索并扩展检索。