一、实词使用情况
本书采用张斌主编《新编现代汉语》中词汇的分类方法,将名词、动词、形容词、区别词、代词、副词、数词、量词等8类词类归为实词,将介词、连词、助词、语气词等归为虚词。表5-1是数据库中实词使用基本情况,实词共出现38380次,该语料库词汇总量为47902个,占该语料库词汇总量的80.12%。根据语料库中的语料,统计了实词的不同类别词的词种数,出现频率、该类词使用占比。其中“词种数”为在该词类中出现不同的词语数量,如下表中的名词词种数为2269,即出现了不同的名词2269种。“出现频率”为名词出现在该语料库中的总次数,如名词的使用次数为12224,即在该语料库中名词出现12224次。“使用占比”为该类词在该语料库中所有词汇中的占比,是该词类出现频率除以总词次(47902)所得,如名词使用占比为25.12%,是由名词出现频率(12224次)除以总词次(47902次)计算所得。各个词类占比计算数据保留小数点后两位,采用四舍五入方式。
表5-1 各类实词占比表
从表5-1中可以看到名词和动词在实词中使用占比最大,该两类词占据了实词的一半使用量。代词虽然词类不多,但是使用占比在动词和名词之后。区别词是该语料库实词中使用最少的一类。以下按照名词、动词、形容词、区别词、数词、量词、副词、代词的分类对语料库中的实词展开描述和分析。
(一)名词使用情况
儿童词类研究表明,在实词中最先掌握和大量掌握的是名词,名词在儿童词汇中所占的比例最大,3—6岁儿童词汇中名词占主导地位,大约占51%左右,绝对量有所增加,但在词汇总量中的比例有递减的趋势。[1]在笔者建立的语料库中名词总计12224个,包括普通名词、方位名词、处所名词、人名、地名、时间名词等,该语料库共有47902个词,名词占25.52%。具体各类名词比例见下表,此处的占比为各类名词在名词大类中的占比。
表5-2 各类名词占比表
由5-2可见,普通名词在名词中占比是最大的,其他名词的使用,方位名词占比较大。以下将对语料库中的亲属称谓名词、时间名词、方位名词、处所名词这四类名词展开分析。
1.亲属称谓名词
在该语料库中通过检索查找发现,出现的亲属称谓词有“妈妈”“爸爸”“爷爷”“奶奶”“姨妈”“阿姨”“哥哥”“姐姐”“弟弟”“妹妹”,但是没有出现“外公”“外婆”这几个亲属称谓。结合儿童语言习得的现实情况,“妈妈”“爸爸”一般是儿童最先习得的亲属称谓词,这也与儿童的生活环境有关,父母是儿童生活最亲密的人。其余亲属称谓出现早晚要结合家长的教授、儿童使用的交际性和功能性,并且也与该词的发音难易度有关。3岁儿童基本已掌握这些基础的亲属称谓,能够正确发音。所以在儿童有声故事中可以适当增加这一类亲属称谓名词,有利于儿童对称谓的理解和人物关系的辨认。
2.时间名词
根据张廷香对3—6岁的儿童语言的调查,3岁儿童会使用“春天、春、夏天、夏、秋、冬天、上午、下午、晚上、10点半”这一些时间名词,但他们还没有“早上、早晨、中午”这样的具体时间概念,在4岁他们才开始使用这几个具体概念的时间名词。[2]在4岁他们增加使用了“星期六、星期天”这样的时间名词。儿童5岁时开始使用“星期一、星期三、星期四”这些名词,并且开始出现使用一些点时间的名词,如“1点、3点、7点、8点、11点、12点、几点”,还开始了使用月份时间。到了6岁,儿童会使用年份时间,并且在点时间上不仅仅使用准点时间名词,还使用半点的概念,如“1点半、6点半”。可以说随着儿童年龄的增长,使用的时间名词也逐渐丰富,从他们时间的使用上可以看出,是由模糊到具体、整体到部分,这也说明儿童对时间认知越来越准确,认知在不断成熟。在该语料库中出现频率最高的时间名词是“现在”,共有53次,占时间名词的10.35%。而这恰恰也符合3—6岁儿童对时间名词的掌握程度,他们最常用的时间名词就是“现在”。而其余出现频率较高的时间名词有“天”(40次)、“一会儿”(30次)、“今天”(25次)、“晚上”(24次)、“之后”(19次)、“这时候”(17次)、“时”(15次)、“年”(13次)。3-6岁儿童使用“晚上”“今天”“明天”“刚才”等时间名词的频率是居于“现在”之后的,但对于“年”“时”这样的名词理解尚不准确。可能在儿童阅读到时间名词“年”和“时”时,需要家长的陪伴阅读,帮助理解。
3.方位名词
方位名词是用于表示方向和位置的,包括单纯方位名词和合成方位名词。单纯方位名词有:上、下、前、后、东、西、南、北、中、间、旁、里、外、左、右、内。合成方位名词有两类:一类是单纯方位词与“边”“面”“头”“以”“之”语素构成的,如“上边、下边、后面、前面、里头、外头、以前、以后、之东、之西”等;另一类是单纯方位词相互之间组合或者单纯方位词与其他语素组合构成的,如“上下、前后、东北、西南、东方、当中、跟前、背后、中间、底下、开外、里外、内外”等。[3]
根据张廷香[4]研究,儿童习得方位名词具有先后顺序,3岁儿童主要掌握的是“里”类(里、里面、里头、里边)、“上”类(上、上面、上头、上边),然后是“下”类(下、底下、下面、下边、下头)、“后”类(后、后面、后边)。在4岁,儿童开始使用“前”类(前、前面、前边)。到5岁儿童才出现使用“中”类(中、中间)。下表是语料库中方位名词高频词的统计情况。
表5-3 方位名词高频词表
从5-3中可以看到该语料库中方位名词的使用涵盖了“里”“上”“中”“下”“后”等。方位词“中”在该语料中有不少的使用,如“行星中”“小碗中”“太阳系中”“海洋中”。根据张廷香研究的儿童方位名词习得顺序,5岁以下的儿童应该还不能准确理解该词类的使用,家长要给予一定的阅读指导。
此外,“左、右”类方位名词在儿童6岁时才会出现使用,结合语言习得的现实情况,对“左”和“右”的名称认知一直要到很晚才能真正掌握。在该语料中方位名词“左”和“右”各自仅出现了两次,所以总体来说对儿童的阅读不会造成理解困难。另外“东、西、南、北”这类方位名词辨认是比较困难的,3—6岁儿童也不使用这一类名词来表达方位。如果出现使用也是复述大人的话语,重复表达。在该语料库中没有出现单独的方位名词“东、西、南、北”,只出现“东南西北”的合用在一个句子中:“但可怕的是,海岸线消失了!根本分辨不出东南西北!家在哪儿呀?”在听到这个句子时,儿童可以根据语境句意理解,不影响儿童的整体阅读。
4.处所名词
本书语料库系统中的处所名词是指表示处所的名词,一般表示相对位置,处所名词本身不能表示确切的位置信息,不包括地名(专名)。处所名词和方位名词都能表示位置,但两者还是有区别的。方位名词表示的是相对位置,需要参照,尽管我们说语料中的处所名词一般表示相对位置但是事实上它可以不需要参照,如“隔壁”“路口”“墙脚”等。另外,方位名词可以表示空间和时间,处所名词只表示空间;方位名词可以表示方向,但处所名词不能表示方向。
语料库中高频处所名词见下表中的统计。
表5-4 处所名词高频词表
以上几个处所名词使用是很频繁的,在该语料中出现次数较多,多数都是由表示方位的语素“上、下、里、边、前、后、底、旁、中”构成的词。儿童在理解这些词时需要有一定的位置概念。
(二)动词使用情况
3—6岁儿童词汇中名词占主导地位,其次是动词,大约占20%—25%。儿童语言最先习得的是名词和动词,但是针对这两类词究竟是习得哪一个词类先,尚且存在争议,国内有学者支持儿童优先习得名词,吴天敏、许政援认为儿童最先掌握的是名词,然后是动词。但也有支持儿童优先习得动词的说法,一些研究发现,儿童早期习得的动词比例要高于名词。[5]
在该语料库中动词占词汇总量26.75%,略高于名词的使用,该比例符合儿童词类研究的数据统计。在该语料库中将动词划分为普通动词和特殊类动词(趋向动词、判断动词、能愿动词)。三类特殊类的动词使用比例有一定的差别,趋向动词大于能愿动词(助动词)、判断动词(系动词或关系动词)使用的比例。
表5-5 各类动词占动词总量比例表
1.趋向动词
趋向动词有两个小类:单纯趋向动词和复合趋向动词。单纯趋向动词主要有以下10个:“来、去”以及“上、下、进、出、回、过、起、开”。复合趋向动词由“来、去”分别与其他8个单纯趋向动词组合而成。趋向动词作为补语的语法意义可以分为趋向意义、状态意义和结果意义。当然全部趋向补语都有趋向义,大多数趋向补语有结果意义,少数的趋向补语有状态意义,但是这三个意义之间存在联系。动词“拿”能结合的趋向补语是最多的。程莉维[6]指出儿童习得趋向动词的顺序先趋向义然后结果义再是状态义。并且对趋向动词使用频率递减趋势也做了分析和研究,她发现大多数趋向动词的使用频率是趋向义递减大于结果义和状态义的使用频率,当然这之中也有例外的情况,那就是“上、过、开”这三个词的结果使用频率要大于趋向义的使用。研究发现[7],儿童趋向动词习得在认知发展上反映出“路径—结果—时间”的过程。
根据表5-6中的统计结果,在趋向动词一类中,“来”“去”“出”“开”“进”“起来”是出现频率最高的。总的看来,语料中单纯趋向动词使用频率要高于复合趋向动词。
表5-6 语料库单纯趋向动词统计表
表5-7 语料库复合趋向动词表
2.判断动词
判断动词只有一个“是”,有人称“是”为关系动词,也有人称“是”为判断动词。其作用是放在主语和宾语之间,表示两者之间具有某种关系。在该语料库中统计了判断动词“是”出现375次,否定式出现了44次,还出现了“也是”“又是”“才是”“而是”“正是”“更是”“当是”“满是”“算是”等判断形式。动词“是”也是现代汉语中使用频率很高的动词,儿童在三岁开始已经大量使用动词“是”,在3—6岁儿童动词使用统计中,动词“是”使用频率最高。
3.能愿动词
能愿动词是表示可能、意愿的动词。能愿动词可以分为三个小类:可能类如“能”“可能”“能够”“可”“可以”“会”;意愿类如“情愿”“愿意”“愿”“要”“肯”“敢”;必要类如“该”“应该”“应当”“应”“得”“必须”等。能愿动词中,“要”“会”“可”“可以”频率较高,分别出现207次、169次、80次、66次。
表5-8 语料库可能类动词统计表
表5-9 语料库意愿类动词统计表
表5-10 语料库必要类动词统计表
(三)形容词使用情况
表5-11 语料库形容词高频词表
据研究,形容词在儿童词类中居于名词、动词之后,占比约10%以上,在该语料库中形容词出现了3586个,占7.49%,略低于该比例。
儿童习得形容词的顺序是先习得表示外部特征的形容词,然后是表示性质评价、机体感觉的形容词,接着是表示品行行为、事件情景的形容词最后习得表达情绪情感的形容词。[8]研究发现,3-6岁的儿童还是以习得单音节形容词为主,而且表示外部特征的形容词“大”“小”是他们使用频率最多的形容词。在该语料库中,形容词相对丰富,有656种不同的形容词出现。在上表中可看到该语料中出现频率最高的四个形容词分别是“小”“大”“好”“多”。“小”在形容词中占比很大,因为“小”在语义具有可爱、娇小之意,用于儿童故事中也多用来表达喜爱、怜惜之情,符合儿童文学的情景,所以出现频率最高。这也恰好和3—6岁儿童的使用频率一致,儿童能够充分地理解这一类词语的运用。
儿童使用形容词的数量是随着年龄的增长而增长的,且在4岁以后出现迅速增长的趋势。形容词的迅速发展,是儿童句子复杂化的一个标志,也是儿童对事物的性质认识迅速发展的一个标志。[9]
儿童在3岁时开始使用描述动作和人体外形的形容词,在该语料高频词汇中可以看到“胖”“快”“漂亮”“美丽”“可爱”这样的词汇,符合该年龄的词汇使用。另外研究发现颜色类形容词没有在低于5岁年龄的儿童语言表达中出现,这说明儿童掌握颜色形容词相对较晚。在该语料库高频词表中只出现了一个颜色形容词“黑”,这说明语料总体对颜色形容词的使用频率不高,也不会对3—6岁儿童阅读造成障碍。
另外,在统计结果中看到积极的、正面的形容词词汇要多于消极、负面的形容词词汇,这符合儿童文学的特点。此外,还出现了“AABB”“ABB”等形式的形容词,如“干干净净”“清清楚楚”“平平整整”“漂漂亮亮”“忙忙碌碌”“香喷喷”“圆滚滚”“笑眯眯”“绿油油”等词,这类词虽然词频不高,但是丰富了文本,保证了词汇的多样性、韵律性,也从听感上增加了儿童有声故事的趣味性。
(四)区别词使用情况
区别词是表示事物的特征和分类,只能修饰名词或名词短语作定语,不能作谓语的词。
从词的构造来看,首先可以根据音节构造把区别词分为单音节区别词和多音节区别词。单音节区别词如“男、女、单、双、正、副、公、母”等,多音节区别词如“彩色、超级、活期、慢性、多用途、非法”等。由于区别词表示事物的属性,属性往往是对立的,所以区别词往往也是成对或成组的,例如:“男:女,公:母,金:银,正:副,中式:西式,阴性:阳性,彩色:黑白”,等。[10]在该语料库中出现了单音节区别词10种,出现次数为137次,多音节区别词16种,出现91次。多音节区别词出现种类要多于单音节区别词的种类数,这与现代汉语中多音节区别词数量较多是对应的。
在该语料库中使用最多的单音节区别词是“男”和“女”,分别出现了38次和36次。这两个区别词基本是以“男孩”和“女孩”的形式出现。这与张廷香18对3—6岁儿童使用的区别词情况研究结果一致。她对3—6岁儿童语料的研究发现,“女”和“男”是3—6岁儿童使用最多的两个区别词,并且在儿童的语料中发现3岁已经开始使用,且随着年龄的增长而增多。其次在语料中出现频率较高的单音节区别词是“公”和“母”,这也是3—6岁儿童所用的高频区别词。
根据统计,语料库中出现频率最高的多音节区别词是“超级”,出现了28次。其他出现频率较高的多音节区别词还有“整个”“真正”“彩色”,出现五六次,其余出现多音节区别词“小型”“木质”“丝质”“野生”等等,只出现一次。对区别词的语料统计情况恰好和3—6岁儿童所用区别词的情况契合,3—6岁儿童整体使用频率较高的多音节区别词为“正式”“整个”“超级”“彩色”“真正”。
但是这几个区别词开始使用时间有早晚差异,例如语料库中出现的区别词“超级”和“正式”,这在3—5岁儿童实际语料中几乎没有出现,在6岁时才开始使用。
而“彩色”在3岁就开始使用,但是“整个”在4岁开始使用。基于儿童现实中使用的区别词情况,家长可以考虑儿童实际年龄,在阅读有声故事时,如遇到“正式”“超级”这样的词汇,可以做出一定的解释,帮助儿童的理解。
(五)数词使用情况
表5-12 语料库数词高频词表
数词出现了975次,占实词的2.54%,有67种不同的数词。数词包括系数词、位数词和概数词。出现频率最高的是“一”“两”“三”“四”“七”这几个数词,系数词出现了“一”到“十”的个体数目,符合3-6岁儿童认知,有利于儿童在数词上的学习。位数词出现频率不高,但也有涉及“十”“百”“千”“万”。概数词出现了“好多”“好几”“一些”“有些”等。
(六)量词使用情况
量词是表示计量单位的词,根据量词的性质可以分为物量词、动量词和时量词,语料库中共出现454次量词,出现了42种不同的量词,物量词“个”占了37.89%,其余量词出现频率都较低。相对来说物量词和动量词出现较多,时量词较单一,只出现了“秒”和“分钟”。藤茜根据语料库研究发现儿童习得量词的顺序是生命性量词然后是形状量词、功能量词、集合量词、部分量词最后临时量词、容器量词。[11]儿童量词习得的整体规律在学界已有明确的总结:一是儿童对量词的掌握水平和他们的认知水平是分不开的,二是儿童一般最先掌握的是一般性量词“个”,其次是概括性较差,应用面很窄的特殊性量词,如“本”“双”,最难掌握的是概括性高,应用面较宽,能修饰事物空间知觉特征的特殊性量词,三是方言的影响是明显的。[12]表5-13显示的是语料库中的量词高频词,可以看到一般性量词“个”的出现频率远远高于其他高频量词,这利于儿童阅读理解。
表5-13 语料库量词高频词表
续 表
文丽萍对3—7岁儿童量词习得研究中发现早期阅读数量多的儿童量词使用总数几乎是早期阅读数量少的儿童量词使用总数的三倍,不仅如此,早期阅读数量多的儿童量词使用正确率也明显高于早期阅读数量少的儿童。[13]表5-14是儿童有声故事中的量词使用情况。
表5-14 语料库量词使用情况表
表5-14是语料库中播放量最大的五个故事量词使用情况统计,从上表可以看出这些故事的量词种类十分丰富,而且量词在读物中出现的次数也不少,儿童可以在阅读有趣的有声故事同时学习量词的使用。
(七)副词使用情况
副词是表示程度、范围、时间。情态等意义的词,用于修饰和限制动词或形容词性成分。副词的性质、划分、归类在语言学界也是个很有争议的问题,参考张谊生《现代汉语副词研究》将副词分为三大类:限制性副词如“不、没有、好、还、又、也、再”,描摹性副词(表示方式与比况、状态与情状)如“赶快、一下子、悄悄”,评注性副词(表示传信与情态、语气与口气)如“就、才、反正、也许”。
傅满义[14]对儿童习得副词研究发现:1岁6个月—3岁6个月这个阶段是儿童习得常用副词的发展阶段。在3岁6个月之后会出现一些新的副词,但是使用频率不高。孔令达和傅满义研究了2—5岁儿童语言,发现儿童在1岁6个月开始使用限制性副词“不”“没”“还”,1岁8个月时开始使用“没有”“再”“又”然后是“一起”“在”“好”,而描摹性副词、评注性副词出现则较晚。在5岁前,描摹性副词只出现了7个。当然“还、也、都、就、才、又”这几个副词既可以表示限制,又可以表示评注,但是还是先出现了限制性的用法,再出现其评注性的用法。
语料库中出现了3545个副词,副词占实词的9.24%,占总词汇的7.40%。其中不同的副词有220种,下表是高频词的统计。从表中可以看到副词“就”的使用频率最高,出现了340次,“不、都、也、只、很”这几个副词出现频率也较高。
表5-15 语料库副词高频词表
(八)代词使用情况
表5-16 语料库代词高频词表
续 表
代词是具有替代和指示作用的词。根据代词的替代和指示对象的不同,可以分为人称代词、指示代词和疑问代词三大类。在该语料库中代词有4553个,占实词总量的11.93%,占词汇总量的9.50%。其中人称代词使用较丰富,出现了“我”“你”“您”“他”“她”“我们”“你们”“他们”“自己”“咱们”“人家”“他人”“别人”等,占代词总量的62.97%。人称代词在儿童语言中使用频率很高,研究认为儿童人称代词的习得主要集中在电报句阶段。[15]孔令达研究得出儿童人称代词的习得顺序是先习得“我”然后是“你”再到“他”。复数人称代词出现相对要晚于单数人称代词,在个案调查中,他们是出现在另外两个复数人称代词之前。
典型的指示代词如“这”“那”“这些”“那些”“这里”“那里”等也都出现在语料中。马杰颖[16]研究了儿童对指示代词的使用,发现儿童在使用指示代词时会出现指称对象固定化的问题。而指示代词“这、那、这边、那边”的指称对象是相对不固定的,但是儿童理解能力尚且欠缺,还不具备这样的抽象思考能力。他通过实验研究认为可以通过启发的方式来帮助儿童改变以自我为中心的思考方式,提升他们对指示代词的理解。
疑问代词主要出现了“什么”“哪”“谁”“怎么”“什么样”“哪里”“哪儿”这几个词。儿童在3—6岁属于好奇心很强的年龄阶段,想要探索外界的事物,这个时候他们很爱向大人问一些问题,这个时候就会用到疑问代词,“什么”是他们经常会用到的疑问代词。