数据差异对比法
现在进行研究可以利用不少语料库,不必像从前那样一本一本书地去寻找需要的语料,更为可喜的是还可以进行数据的比较。不过,在利用这些数据时,我们需要特别注意三点:
1.高频组合,这往往可以解释这类词的核心意义,而且显示它们匹配的主要对象范围。
比如“快速/飞速/急速/全速”属于近义词群,都是表示前进的速度很快,有时确实可以替换。比如:
(1)开着车(快速/飞速/急速/全速)前进。
尽管如此,它们还是有差别的,呈现出速度程度的不同。我们可以利用不同语素的对比看出它们的差异:
“快速”泛指速度很快,跟“慢速”“中速”相对,搭配范围普遍。
“飞速”比喻速度像飞一样快,形象生动,程度上比“快速”似乎更胜一筹,因此使用频率比较高。
“急速”强调快而且猛,侧重于急忙,多跟表人名词组合,但在速度上很难跟“快速”比出高低来。
“全速”强调能够达到的最快速度,只是相对的“快”,而非绝对的“快”。而且关键是有限制,即必须在某个固定速度范围之内才可以“全速”,多跟机械移动物组合,如飞机、火车、轮船、汽车等。
我们来观察这四个词语的数据:
表2 “快速/飞速/急速/全速”的使用情况 (单位:例)
其中,“快速”使用概率最高,大大超过其他近义词使用的总和,而且修饰的动作动词比较普遍,组合对象可以指人,也可以指动物或机器等。剩下的依次为“飞速”“急速”“全速”,“全速”使用概率最低,而且不能跟“增长”“提升”“膨胀”等非移动动词组合。
2.数据差异,如果使用例句的类型差别很大,就说明它们不同的功能取向。
比如“不仅/不但/不光/不单/不独”:
a.“不仅”等前项都强调这不是唯一的情况,隐含后项还有其他类似情况。
b.“不仅”“不但”使用频率最高,兼用于书面语与口语;“不独”多用于书面语。“不仅”“不光”与“不单”口语性更强,而且还有口语强调形式“不仅仅”“不光光”“不单单”,然而无“不但但”“不独独”。
c.“不仅”“不但”与“反而”照应可构成反递进,另外三个没有反递进。
d.“不光”“不单”“不独”多与“也/都/连”照应,递进意味比较淡,强调还有类似情况。
e.“不但”“不仅”只能做连词,“不单”“不光”“不独”还有其他动词性用法。
根据北京大学与北京语言大学两个语料库的有关数据统计:“不但”;如果强调“兼有”,则多选用“不单”,而且它还有口语化的重叠形式“不单单”。例如:
表3 “不仅/不但/不光/不单/不独”的使用情况 (单位:例)
从使用的概率来看,“不仅”“不但”依次是最高频的,其次是“不光”与“不单”,最少的是“不独”。语音相同的“不但”与“不单”,显然“不单”的使用频率远远低于“不但”。在语义方面,如果就总体情况显示递进,往往选择
(2)他不但(不单/不单单)是个童星,也当过许多广告的模特儿。
(3)他不单(不但)是个歌手,更是在整个华语界都非常有影响力的艺人。
如果反递进,则一般选用“不但”:
(4)人多势众,不但于事无补,反倒引起县委更大的反感。
3.同一词语在古代汉语与现代汉语里使用数据的比较,可以看出某些变化的历史线索。
比如“索性”与“干脆”,语义相近,两者常常可以互换。根据北京大学CCL语料库,古代汉语里,索性1 451条,干脆93条;现代汉语里,索性1683条,干脆4589条。可见“干脆”比较晚起,更加口语化,现在的应用比“索性”更广泛。