3.5 小 结
通过考察上述三个典型的语篇生成系统,我们发现系统功能语言学在自然语言生成应用中采用了多种知识表示方法。例如,PROTEUS采用的是一阶谓词,而CSRS采用的是AVS特征结构。
然而,应用最为广泛的是系统网络。与前一时期相比,这种知识表示方法已经有了很大的进展。主要表现在如下三个方面:
(1)从理论上,阐述了系统网络表示法与语言描写之间的密切关系。系统功能语言学的一个核心思想是认为语言是系统的系统。在语言这个总系统之下,包含了众多的子系统。这些大小系统联结在一起,构成了“系统网络”。
(2)明确规定了系统网络的标写体系。在任何一个系统中,都包含了两个或两个以上的选项。这些选项之间存在析取和合取两种基本的选择关系,它们分别采用直脚括弧“[”和花括弧“{”来进行表示。
(3)通过析取选择和合取选择的不同组合,可以产生五个基本网络型式即基本式。其中,基本式(a)和基本式(b)图示如下:
图3.18 基本式(a):析取系统
图3.19 基本式(b):合取系统
基本式(a)是一个满足入列条件a的x/y析取系统,即只能在x或y两个选项中择一。而基本式(b)是一个合取系统。它由两个平行的x/y系统和m/n系统构成,因此共有四种不同的组合:xm、xn、ym、yn。
基本式(c)与基本式(a)的不同之处在于选项x充当了另外一个m/n析取系统的入列条件。如果选择了x,则需要进一步选择m或n。
而基本式(d)和基本式(e)的入列条件有两个,例如a和b。在基本式(d)中,两个入列条件都需要得到满足;而基本式(e)只需要满足其中任意一个。
图3.20 基本式(c)
图3.21 基本式(d)
图3.22 基本式(e)
通过这五个基本式,构成了各种错综复杂的系统网络。例如,在图3.3中[限定,非限定]和[单数,复数]是两个平行的系统,因此也相应地具有四种基本组合,即[单数,限定]、[复数,限定]、[单数,非限定]和[复数,非限定]。由于指示和限定均包含了两种不同的选择,前两种基本组合还可以进一步细分。例如,[单数,限定]包含[单数,限定,非指示]、[单数,限定,指示,近指]和[单数,限定,指示,远指]三种情况。
有必要指出的是,系统功能语言学及其系统网络表示法在应用于自然语言生成的过程中出现了一个“组合沟”现象。在后续章节中,我们将进一步从人工智能的角度研究这种知识表示方法所存在的一些缺陷,并思考系统功能语言学界提出的改进方案及其所面临的问题。
【注释】
[1]“三连棋”相当于一种简化的五子连,其游戏规则是:在一个九方格的棋盘上(从左到右、先上后下,依次为1、2……9),双方轮流画十字或圆圈;谁先把三个同一记号排成横线、直线、斜线,即是胜者。
[2]这个片段也为PENMAN所采用。
[3]在当时,计算语言学家已经关注到了语篇中的回指。近年来,马文(2011)从语言学理论的角度研究了篇章中回指的修正,有关成果经过形式化处理后有可能应用于自然语言对话系统之中。
[4]在CSRS中,词组、短语统称为短语。此外,单句和复句分别相当于系统功能语言学中的小句和小句复合体。