3.4.4 Teich的解决方案
3.4.4.1“组合沟”的逻辑功能分析
在系统功能语言学理论体系中,系统网络中的选择与语言的基本功能,即元功能存在对应关系。在系统功能语言学理论框架中划分了几个层次:语境层、语义层、音系学层等。这些层次均按照元功能的原则进行组织。例如,语境层根据概念功能、人际功能和语篇功能分为了语场、语旨和语式。在语法层的小句级阶上,根据上述三个元功能相应地区分为及物性系统、语气系统和主位系统。
从上述思路出发,Teich试图从元功能的角度来解决“组合沟”现象。她认为问题的症结在于词汇-语法层面的概念功能,更准确地说是逻辑功能的分析。系统功能语言理论框架中划分了5个级阶,从小到大依次为:词素、词、词组/短语、小句和句。在NIGEL语法中,词素和词合为了一个级阶。它们的一个共同特点是对于句法结构及其内部组成关系的描写缺乏统一性和概括性。
下面,我们在词、词组和小句三个主要级阶上对系统功能语言学和生成语法的句法分析方法进行对比分析。
1)生成语法的句法分析方法
在生成语法理论体系中,X-bar理论采用如下图式对于各种句法结构的内部结构和共有的结构特征进行了统一的处理(温宾利,2002:68-101)。
图3.14 X-bar图式
(1)当X代表N、V、A、Adv或P的时候,所生成的短语结构分别为名词词组(NP)、动词词组(VP)、形容词词组(AP)、副词词组(AdvP)或介词词组/短语(PP)。此时,词和词组/短语之间的关系为投射关系。所生成的结构均为向心结构,它们都有一个中心。
(2)当X代表I或C的时候,分别生成屈折词短语(IP)和标句词分句(CP),即限定性小句和由if、whether、for、that等词引导的非限定性小句。这些结构与上述词组具有相同的句法结构和特征。
从系统功能语言学的角度来说,X-bar理论中的所有结构类型均为单变结构,并且这个单变结构具有一个中心即X。通过投射关系,清晰地揭示了词、词组和小句等不同层次单位之间的区别和联系。从计算语言学的角度来说,这种统一的处理模式有助于后续的程序编写和执行。
2)系统功能语言学的句法分析方法
在小句层,出现了切分性、韵律性和突出性三种不同的结构形式。在这些结构形式中,所揭示的是功能成分之间的功能关系,而不是组成成分之间的句法结构关系。在生成句子的时候,需要通过预选操作将功能成分用句法范畴表示出来。此外还需要进行相应的插入(insertion)和合并(conflation)操作,才能将功能成分插入句子成分结构之中并与其他成分进行语序的调整。
以英语中某情态系统的实现为例:
图3.15 英语情态系统及其实现命题节略图(Teich,1999:17)
在该系统中,具有相应的实现命题。特征[indicative]的实现命题是+Subject,意为插入主语。特征[declarative]的实现命题是Subject∧Finite,表示“主语在先,谓语在后”。因此,所体现的局部句法结构为:。
与X-bar理论中的结构相比,系统功能语言学中的大部分结构类型及其所体现的句法结构缺乏一个共同的中心,因此不是向心结构,而是离心结构。尤为棘手的是,在小句和词组两个级阶之间,功能成分的实现主要依靠各种预选操作,因此在语言学理论体系的一致性方面显得不是很连贯。在计算语言学中,这种处理方式的一个严重后果就是在程序编写的过程中会出现大量的bug。
3.4.4.2 依存系统功能语言学的核心思想及其形式化表征
1)“依存”与“配价”概念的引入
在自然语言处理的发展中,最先得到广泛采用的是基于Chomsky句法理论的短语结构模型。然而,这种模型具有许多局限性,尤其是语法的生成能力太强,区分歧义结构的能力很差。因此,在自然语言生成的时候会产生大量的歧义句。此后,人们提出了一些新的语法理论,例如:①基于合一运算的形式模型,包括Kaplan的词汇功能语法(Lexical Functional Grammar,LFG)、Martin Kay的功能合一语法(Functional Unification Grammar,FUG)、Gazdar的广义短语结构语法(Generalized Phrase Structure Grammar,GPSG)、中心词驱动的短语结构语法(Head-Driven Phrase Structure Grammar,HPSG)等;②基于依存和配价的形式模型,包括Tesniere的依存语法和Herbig等人的配价语法;③基于格语法的形式模型;④基于词汇主义的形式模型等(冯志伟,2010:173-354)。
在上述几种形式模型中,Teich借鉴的是基于依存和配价的形式模型。她试图提出一种新的语法模型即依存系统功能语法,目的是对句法结构及其内部组成进行统一的描写与表征。
与短语结构语法相比,依存语法中没有词组这个层次。这样一来,每一个节点都与句子中的单词相对应,因此能够直接处理词与词之间的关系,大大减少了节点的数目(ibid.:266)。在相应的依存系统功能语言学中,Teich对传统的级阶理论进行了重新表述:
图3.16 依存系统功能语法级阶示意图(Teich,1999:192)
在上图中,首先在精密度上提出了两大类级阶——词汇类和非词汇类。然后,进一步将词汇类分为词汇中心和词汇非中心;将非词汇类区分为小句、名词词组和介词短语等不同子类。在其理论体系中,同样没有设定词组这个中间层次,保留了依存语法简洁明了的特点。
值得特别关注的是,Teich试图将所有的依存结构处理为一个具有中心词的向心结构。在词汇中心子类中,包含了动词、名词和介词三种代表性词类。在更大的句法结构中,它们分别构成了小句、名词词组和介词短语的中心词。与配价语法结合起来,可以更加精确地揭示依存成分与中心词之间的支配关系。以德语中的名词词组为例,可以更加充分地揭示依存成分与中心词之间存在性、数、格的一致性。
2)“类型特征结构”表征方法的采用
在现代语言学的研究中,特征是一个重要的分析方法和表征手段。它首先在结构主义音位学的研究中得到应用,此后进一步应用于其他学派的句法和语义分析。
特征分析法在系统功能语言学的研究中也得到了广泛的应用。在系统网络中,不同的选择通过特征来进行表征(Matthiessen和Bateman,1991:77)。然而,系统功能语言学中特征的性质及其组织与广义短语结构语法、中心词驱动的短语结构语法等其他一些当代语法理论存在较大差异。首先,系统功能语言学中的特征主要是功能驱动的,而其他语法中的特征主要是形式驱动的,从而便于后续的句法结构生成。其次,系统功能语言学中的特征是基元(primitive),因此不便于进一步分解。而在其他语法体系中往往采用特征结构,包括特征和不同的值(Teich,1999:172-174)。
在系统功能语言学形式化研究中,一个重要的动态是借鉴其他语法理论中的特征结构对原来的理论体系进行重新表征。最先开展这方面研究工作的是Kasper(1988:177)。他借鉴的是特征合一语法中的功能描写框架,其理由是系统功能语言学和特征合一语法都强调语言结构中的聚合关系。此后,Bateman等人首次提出采用类型特征结构对系统功能语言学进行计算表征,即具有可计算性的表征。
Teich沿用了Bateman等人的研究思路。然而,她的一个创新之处是采用类型特征结构有效地表征了句法结构的依存关系。例如,采用类型特征结构可以将图3.16中的信息表征如下:
图3.17 类型特征结构示意图(Teich,1999:192)
3)实验反馈结果
Teich(1999:204)在计算机上对所提出的依存系统功能语言学进行了实验。具体做法是:某人对计算机提出一个具体的“生成询问”,则计算机自动生成下列某个英语、德语句子的依存特征结构:
①Kim devours a cookie.—Kim verschlingt einen Keks.
② Kim sings.—Kim singt.
③ Kim gives Jodie a cookie.—Kim gibt Jodie einen Keks.
④ Kim gives a cookie to John.—Kim verschenkt eninen Keks an John.
与NIGEL语法相比,依存系统功能语言学在某些方面展示了优越性。首先,采用“依存关系”对于不同的句法结构和句法特征进行了一定程度的概括,从而对于大量的预选操作中的共性部分能够进行统一的处理。在对德语句法结构进行分析的时候,这种方法更加能够显示其合理性。其次,采用了计算语言学中主流的类型特征结构表征方法对系统功能语法体系进行了重新表征,有利于后续的计算机上的执行与操作。
毋庸讳言,Teich的理论研究和实验中存在较大的局限性:
(1)在句法结构研究方面,她只是初步考虑了小句、名词词组和介词短语。
(2)在聚合关系研究方面,她主要涉及了概念功能中的及物性系统,并且将语气系统预设为陈述。对于语篇功能及其主位系统则缺乏相应的研究。
(3)在实验方面,她主要是对一些片语的生成进行了考察。能够投入使用进行真实语篇的生成还有待进一步考察。