3.2.3 信息认知状态对应话题表现形式

3.2.3 信息认知状态对应话题表现形式

已知性等级理论参考的是话语的语言表达形式。上文图3.2给出了Gundel et al.(1993)认为已知性等级各不同信息认知状态在现代汉语中对应的形式。其实这一观点不够全面。例如,同样的指称形式很有可能表达不同的信息状态。此外,笔者在实际语料的整理与统计过程中还将语境因素也考虑在内,所以预测本研究中整理出的各类别话题信息认知状态,其对应的表现形式会比图3.2中列出的要丰富得多。因此,笔者也对话题在各不同状态下的形式进行了归类与整理。

笔者统计的对象与3.2.1小节统计话题信息认知状态分布的对象相同,共640个小句与话题链句子。笔者参考了陈平(1987a)的研究,他将现代汉语中名词性成分的形式归并为以下七组:“人称代词”“专有名词”“‘这/那’+(量词)+名词”“光杆普通名词”“数词+(量词)+名词”“‘一’+(量词)+名词”“量词+名词”。在梳理了本研究会话语料中的话题之后,笔者发现语料中话题的表现形式似乎更为丰富,因此做了一些修改与补充。在陈平(1987a)提出的七组形式的基础上,笔者添加了几组表现形式,而对于“‘这/那’+(量词)+名词”这一组表现形式,则将其拆开分为两组,理由是Gundel et al.(1993)提出的已知性等级理论中,“this”“that”以及现代汉语中的“这”“那”是做分开考虑的。为了尽量忠实于理论,笔者也对其做分开处理,并做了些许改动。因此,笔者对话题的表现形式总体上归为以下十六组:

将各不同类型的信息认知状态分别加以统计,笔者发现在真实话语中,话题的表现形式非常丰富,有的话题是上述的十六组形式中的某一种,而有的则是上述形式的两组甚至几组组合而成的。笔者都将其一一记录,然后统计出各信息状态类别中各种话题表现形式所占的比例。

表3.1所列的是语料中在话题位置出现频率排在前十的表现形式,按照频率从高到低依次自上而下排列,频率百分比之总和达到了87.1%。在表3.2中,按频率从高到低,列出了对应各信息认知状态排位前五的表现形式。对应各信息状态排在前五位的表现形式所占的比例之和都达到了70%以上,而之后往往会有几组形式出现频率相同且频率都较低,因而表3.2只呈现了排位前五的形式。而对应“类指的”状态则呈现了排名前四位的形式,原因与上相同。

表3.1 话题表现形式总况

表3.2 信息认知状态对应高频话题表现形式

续表

表3.2中所列各信息状态对应的话题形式显然要比图3.2丰富得多,同时也证实了我们之前的观点,同一表现形式可以对应不同的信息认知状态。如光杆名词几乎在有的信息认知状态中都列在前五,这与LaPolla(1995:305)的观点是一致的。本书语料中“光杆名词”以及“这+(数词)+(量词)+名词”这两组形式显得最为活跃,任何信息状态的话题都可以由这两组形式来表示,且这两组形式与各种信息状态对应时出现的频率都较高。

但是,这只反映了话题形式与信息状态对应的一个方面。如表3.1所示,“这+(数词)+(量词)+名词”这一形式是语料中话题位置出现频率最高的形式,共有117个话题是以此形式出现的,而以“‘的’字结构”出现的话题则只有14个。因为各组名词短语表现形式间基数的差别很大,很难根据表3.2判断各组语言表现形式的分布趋势。以“这+(数词)+(量词)+名词”与“人称代词”为例,假如只关注表3.2中“激活的”信息一览的情况,“这+(数词)+(量词)+名词”比“人称代词”出现频率更高,那么是否可以得出结论“这+(数词)+(量词)+名词”比“人称代词”更倾向于成为“激活的”话题信息的表现形式呢?不是这样的,因为“这+(数词)+(量词)+名词”在这一栏排位最高,只是因为它的总体基数更大,而它同时还出现在对应其他信息状态的栏目中。反观“人称代词”,虽然因为它基数小,在对应“激活的”话题信息表现形式中仅排位第四,但如果观察它的整体表现,会发现所有的“人称代词”表达的都是“激活的”话题信息,在其他信息状态对应的表现形式中,它的出现频率全部为零。这说明,当“人称代词”出现在话题位置时,它表达的都是“激活的”信息,而“这+(数词)+(量词)+名词”则没有呈现出这样的倾向。有鉴于此,笔者对表3.1中的各组话题表现形式分别做了分布统计,但稍稍做了调整,因为“‘一’+(量词)+名词”“数词+(量词)+名词”“‘的’字结构”三组形式的话题总数过少,都不到30个,所以在表中将其略去。统计结果如表3.3所示。

表3.3 话题表现形式对应信息认知状态分布情况

注:因百分比精确到小数点后一位进行四舍五入,所以有几行百分比相加之和并非100%

根据表3.3中的数据来观察各组表现形式的分布态势。假如将信息的已知性程度视为一个连续统,这十组表现形式中最具特点的是之前已经提到的“人称代词”,与“激活的”信息状态表现出了绝对的对应,凡是“人称代词”形式的话题全部都是“激活的”信息,已知性等级最高。“专有名词”的分布态势也特点鲜明,绝大多数对应“激活的”和“熟悉的”信息状态,只有个别对应的是“可唯一识别的”信息状态,说明“专有名词”做话题时信息的已知性程度也很高。

“光杆名词”的分布特点则是在已知性等级两端高,中间低,既可以表达“激活的”信息,也可以表达“有指的”以及“类指的”信息。这与其他学者的研究发现是十分吻合的。例如,LaPolla(1995:305)认为现代汉语光杆名词可表达任何状态信息;王秀卿和王广成(2008)认为光杆名词可以有指个体与指非个体(即类指)两种解释;董秀芳(2010)从历时的角度研究认为,表达类指与定指是光杆名词的本质功能。在本研究的语料中,光杆名词也的确在类指的一端与已知程度最高的另一端都有分布。

“这+(数词)+(量词)+名词”以及“那+(数词)+(量词)+名词”这两组形式在对应信息认知状态的分布态势上的确有着不同表现。首先,两者在语料中担当话题的频率差别较大,前者共有117例,为所有形式中出现频率最高的,后者只有44例,出现频率为6.9%。其次,“这+(数词)+(量词)+名词”对应各信息状态的分布态势表现出了已知性程度较高的倾向,有71.8%这一形式的话题对应“激活的”信息,而“那+(数词)+(量词)+名词”的分布则较为平均,与各信息状态都有所对应。

虽然“‘一’+(量词)+名词”因总数不到30个而未列入表3.3,但因为它的分布态势比较出乎意料,笔者希望在此有所提及。大多数前人的研究都认为这一形式是类指的标记,语料中也的确有表类指的“‘一’+(量词)+名词”,但事实上这一形式却在各种信息状态下都有分布。笔者分析原因如下:首先,如3.2.1小节中所论述的,类指的形式做话题时,在具体语境中的解读带有较强的有定倾向。其次,在重新梳理语料中这一形式的话题时,笔者发现这一形式的话题之后常常会有补充说明,而这类补充说明会消除其类指的意义,使话题得以处于已知性程度较高的信息认知状态。因为本研究的语料中“‘一’+(量词)+名词”形式的话题数量过少,在此基础上观察其对应的信息状态分布恐怕无法对其特征做完整的呈现,还需要后续研究对更多语料进行观察。但是这一形式在话题位置上的低频次表达,也从另一个侧面反映了话题的强烈有定倾向。

根据以上的分析,将表3.2与表3.3结合起来考虑,笔者认为将已知性程度表达为连续统比严格对应的方式更符合实际。因此,笔者基于上述表格中各组话题表现形式的信息状态统计,概括了一个已知性程度连续统,具体可见图3.8。这可以视为是对已知性等级在现代汉语中应用的调整与丰富。笔者在图3.8中将已知性程度大致分为高、中、低三个版块,然后按照语料统计情况将表3.1中的十组话题表现形式置入相应版块。

图3.8 话题表现形式对应已知性程度连续统

需要说明的是,图3.8中的排列并不是绝对的,只是按照本书的语料情况而估计的倾向性的观点,各组表现形式在具体小句中会表现出不同的状态。此外,笔者推测的基础本身具有局限性,只是对话题位置的名词性成分各不同表现形式的估计,假如这些不同形式处于小句中的其他位置,它们体现出的已知性程度可能也会有所不同。