什么是“语体词汇”

2025年10月14日

版权

一、什么是“语体词汇”

按照上述冯胜利先生对“语体语法”的定义，我们可以说，所谓“语体词汇”就是“为表达某一语体的需要而产生或使用的词汇”。语体与词汇的关系是：不同的语体有不同的词汇，不同的词汇反映了不同语体的需要。换言之，词汇是有语体属性的，语体不同用词不同，不同的词用于不同的语体。

词汇的语体属性并不是一个新课题，而是词汇学研究中一直受到关注的老问题，一般表述为“语体色彩”或“语体风格”，最常见的是“口语”和“书面语”^[2]两分法。《现代汉语词典》对一些词就标注了“〈口〉〈书〉〈古〉〈方〉”的语体特征。

不过冯胜利先生对语体的分类有不同的看法，他主要从“调距”的角度把语体分为“俗常体、正式体、庄典体”^[3]三大类，请看他给出的两个示意图（图1、图2）。

pagenumber_ebook=57,pagenumber_book=52

图1“语体结构示意图” （冯2010：404）

pagenumber_ebook=57,pagenumber_book=52

图2“语体要素交叉匹配模式图” （冯2013：8）

根据图2，冯先生（2013：8—9）把“三体交叉匹配类型”细分为八种，我们可以将它概括为五体，每一体都有属于该体的词汇，这就是现代汉语的“语体词汇”：

A.俗常体。用于非正式的日常口语的词汇，其典型成员是“俚语”词汇（即图2中的8）^[4]。

B.正式体。用于正式的书面语的词汇（下面第三部分将详细讨论）。

C.庄典体。用于典雅的书面语的词汇，也就是古语词。

D.兼用体。二体兼用的词汇，包括俗常体与正式体兼用、俗常体与庄典体兼用和正式体与庄典体兼用，如图2中的4、5、6部分。

E.通用体。各体通用的词汇，如图2中的2部分。

A—C体都是原型范畴，各体内部存在典型成员与非典型成员的差异：有的词语非此即彼，绝不用于其他的体，即图2中的三个角（1、3、7），是典型成员^[5]；有的则主要用于此体但并非绝对不用于彼体，就是非典型成员。

但这只是根据冯胜利先生的看法对词汇的语体属性做出的分类，事实上词汇的语体分类是一个十分复杂的问题，要给词（义项）标上语体属性会碰到两个绕不开的难题：一是词汇的语体属性究竟应该怎样分类？二是词的语体属性并不总是清晰的，而且也不是一成不变的。

下面先说第一个问题。

语体分类是个棘手的问题，各家看法很分歧，还牵涉到语体和文体的关系等等问题。上述冯胜利的分类是一家之说，主要从“交际距离远近”的角度考虑问题；而张伯江（2012）则认为，“远和近其实也难有客观标准”，他提出了“说话人对听话人的熟知程度”这个维度。陶红印（1999）则着重介绍了英国应用语言学家McCarthy and Carter（1994）提出的两个分类角度：传媒（medium）和表达方式（mode）。可见语体的分类涉及很多因素^[6]，各家的视角不同，就会有不同的分法，不大容易统一；而且从理论上说，语体的类型是无穷多的（陶红印1999），所以如何全面、科学地给语体分类，仍是一个有待探索的基本问题，关键是分类的角度和标准如何确立。^[7]

综观迄今为止的相关研究，各家公认的最基本的语体区分还是口语体和书面语体两分法。唐松波（1961：15）指出：^[8]

现代汉语的语体总的可以分为两大类：谈话语体和文章语体。前者可以简称为谈话体，后者简称为文章体。不少人曾经混淆了谈话体和口语，文章体和书面语的区别。口语和书面语应该指的是使用语音或文字来表达思想的两种形式；而谈话体和文章体却指的是运用语言时一系列的差异。

唐松波的看法无疑是正确的，分为“谈话体”和“文章体”，显然比“口语”和“书面语”更科学。因为假如“口语”是指用语音说出来的话，那么“口语”也可以很不口语化，比如陈建民（1984：1—2）把“口头形式出现的话”分成七种类型：（1）日常会话（包括问答、对话）；（2）在动作或事件中做出反应的偶发的话；（3）夹杂动作的话；（4）毫无准备地说一段连贯的话；（5）有提纲的即兴发言；（6）离不开讲稿的讲话；（7）念稿子。其中（6）（7）两种就跟一般理解的“书面语”没什么差别。反之，如果“书面语”是指用文字写下来的话，“书面语”也可以很不书面语化，比如文学作品中的人物对话、相声脚本和俞敏先生的学术论文^[9]等等。有时甚至根本无法归类，比如赵元任先生的《语言问题》，除了“删除重复跟整理句法以外”，基本上是演讲录音的如实转写（参看该书序），在演讲现场，它当然是“口语”，可是印成书，却变成“书面语”了。这种情况并非个例。

虽然“口语”和“书面语”是两个内涵模糊的术语，有其不够科学的地方，但是，只要我们不纠缠于字面，这两个术语的所指大致上还是清楚的，所以大多数语言学家都用“口语”和“书面语”的二极对立来指称最重要的两种语体区分。我们主张仍然采用“口语”和“书面语”这两个已经约定俗成的名称，而把它的内涵界定为相当于唐松波（1961）的“谈话语体”和“文章语体”。

正如很多学者已经指出的那样，口语体和书面语体内部都可以再分类，^[10]但是具体怎么分，各家的意见也很分歧，有待进一步研究。吕叔湘先生（1944）曾经有过这样的论述：

所以，每个时代的笔语都可以有多种，有和口语大体符合的，有和口语距离很近的，也有和口语相去甚远的。这些形形色色的笔语虽然一种挨一种，构成一个不断的系列，但是当中也未尝不可划出一道界限：听得懂和听不懂。虽不完全相符而仍然听得懂，只是“走样”而已，听不懂则是“脱节”了。我们可以用这个标准把一个时代的笔语（文字）分成两类，凡是读了出来其中所含的非口语成分不妨害当代的人听懂它的意思的，可以称为“语体文”，越出这个界限的为“超语体文”。

吕先生关于笔语是一个连续不断的“系列”的论述很给我们以启发。其实口语和书面语都是原型范畴，内部都有典型成员、非典型成员和边缘成员之别，口语和书面语也是一个“连续统”，中间没有截然的界限，而是存在灰色的过渡地带。

再说第二个问题。

现代汉语的口语词汇系统和书面语词汇系统是两个不同的系统，两者有交集，但是也有重要的区别，^[11]应该分别进行研究。^[12]比如人们常说“现代汉语词汇以双音词为主”，这话对书面语大致是适用的，但用于日常口语就不一定符合实际了。

口语词汇和书面语词汇，有的分得很清楚，学者们举过很多例子，^[13]这里补充一个实例：

这次演讲开始的时候，总题里头的“跟跟”两个字曾经引起了不少的兴趣跟疑问^[14]。当晚就有报馆打电话来问，题目里有没有错字？我说没有。等会儿又来电话问，要是没有错字，那么那两个“跟”字怎么讲？我说第一个是大“跟”字，是全题两部分的总连词；第二个是小“跟”字，是“跟语言学有关系”修饰语里头所需的介词。能不能省一个？我说不能，省了就念不通了。可是啊，夜里编辑部换了班儿了，他们拿稿一看：也？怎么两个“跟”字？又来了个电话，问是要两个“跟”字吗？我说要。您不是懂德文吗？这题目用德文讲也可以说“die Sprachwissenchaft mit mit der Sprachwissenchaft verwandten Fragen”，不是有两个“mit”吗？结果第二天登出来居然登对了。可是有些报没打三次电话的，还是登错了。

我引这个例，表示这一系列的演讲是讲语言的，不是讲文字的。尽管通行的文字里不用“跟跟”，甚至连一个“跟”都少见，可是北京口语里最常用的是“跟”，所以就让它去“跟”去了。（赵元任《语言问题·序》）

这真是一个有趣的例子！现代汉语的连—介词^[15]，北京口语里最常用的是“跟”，而书面语却是“和，与，同”。在2013年的政府工作报告中，这样的“跟”一个也没有，连词主要用“和”，而“与”和“同”则主要用作介词，这可以代表当代汉语正规书面语的用词情况。估计其他年份的政府工作报告和党的全国代表大会报告之类的正规文体情况也差不多。^[16]

类似的例子有表示被动的介词“被”和“让、叫、给”，胡明扬（1993）指出：

书面语有不少“被”字句，甚至有“他这次被选为市长”这一类句子。但是口语中根本没有“被”字句。口语中和“被”字句的表达功能差不多的“让”字句、“叫”字句、“给”字句在用法上也和“被”字句不完全一样。^[17]

又如口语中的合音词一般不用于正式书面语体，如“别”“甭”等。香港地铁广播“请勿靠近车门”（粤语），转换成普通话得说成“请不要靠近车门”^[18]，而不是“别”。

但是大部分情况下口语词汇和书面语词汇却是分不太清楚的，而且经常会发生变动，例子不胜枚举。所以要在词典里给一个个词标上语体属性，困难是很多很大的，往往吃力不讨好，很容易让人挑毛病。^[19]说到底，在多数情况下，我们标注的语体属性至多只是一种倾向性而已。