§2.1. 范畴化
(2ⅰ)中的说明关涉到把序列(1)划分成若干连续的次序列,每个次序列又划归某一范畴。这类说明可以用(1)的括号加标示的形式来表示,或者用有如(3)那样的树形图表示,效果等同。对这样一个图形的解释是很清楚的,其他论著中经常讨论到。如果现在假设(1)是一个基本语符列,象(3)所表示的结构可以大致看作它的(基础)词组标记。
一部能生成有如(3)那样的简单词组标记的语法可以以一套既包括语符列元素(the,boy等)又包括范畴符号(S,NP,V等)的符号词汇为基础。语符列元素可以进而划分为词汇项(sincerity,boy)和语法项(完成体,所有格等;也许除了the,这些在给出的简单例子中一项也没有表示出来)。
随即产生的一个问题是关于词组标记中符号的选择。也就是说,我们必须问一问,词组标记中使用的语符列元素和范畴符号是具有某种独立于语言的特性呢,还是仅仅专为某一特定语法而选用的有助于记忆的标签呢?
就语符列词汇元素而言,语音区别性特征的理论以及施加于音位表现上的一整套条件实际上意味着符号的选择是独立于语言的,虽然确立这一事实(或者选择一套恰当的普遍适用的实体语音特征)绝不是一个无足轻重的问题。从现在起我将假设已经建立起这样一种音位理论,因而语符列词汇元素是以明确规定的方式从一套固定的普遍词汇中选取的。
就语符列语法元素和范畴符号而言,实体的表现问题实际上是个普遍语法的传统问题。我将假设这些成分也是从一套固定的普遍词汇中选取的,虽然这个假设对任何将要提出的描述材料没有什么重大影响。对探讨这个问题的重要性和合理性是没有理由表示怀疑的。一般认为,这个问题涉及超越句法范围的一些考虑,这类考虑在目前只是朦胧地被感觉到。情况很可能确实是这样,不过我在后面将提出几个看来适用于英语和我所了解的其他例子的一般定义。2
生成有如(3)那样的词组标记的自然机制是一套重写规则系统。一条重写规则的形式是
(4)A→Z/X—Y
其中X和Y(两者都可能是零)代表任何一个语符列,A是一个单一的范畴符号,Z是一个不等于零的语符列。这条规则解释为:当范畴A处在左边为X右边为Y的环境中时,A重写为语符列Z。将重写规则(4)运用于一个语符列…XAY…,就将这个语符列变换成语符列…XZY…。给定一部语法,我们把语符列的系列定义为“V的W-派生过程”,其中W和V分别为该系列的第一个和最后一个语符列,而且系列中的每一个语符列都是运用全部重写规则(后面将谈到按次序运用这个条件)中的一条规则从列于前面的一个语符列派生而来的。当V为一个由语符列元素组成的语符列时,我们就说V的W-派生过程已告终结。如果有一个#V#的#S#-派生过程,其中S是这部语法所指定的初始符号(代表范畴“句子”),#是界限符号(被视作语符列语法元素),那么我们把V称之为终端语符列。这样,通过连续运用这部语法的重写规则,从语符列#S#开始,一直到派生过程的最后一个语符列只包括语符列元素、因而不可能再继续运用重写规则为止,我们就构造出一个终端语符列的派生过程。如果对重写规则系统施加若干其他条件,3只要已知终端语符列的派生过程,就很容易提供一种简单的方法给一个终端语符列指派一个唯一的、合适的词组标记。因而一套重写规则系统接受适当的制约后,可以作为一部生成语法的一部分。
按刚才描述得不很严密的(而在别处是精确的)方式加以运用的一套无次序重写规则被称为成分结构语法(或词组结构语法)。另外,如果每一条象(4)这种形式的规则中X和Y等于零,因而规则的运用不受上下文的约束,这部语法就被称为不受上下文制约的(或简单的)语法。如前所述(见原书第60页以次和208页),成分结构语法的形式特性在过去几年内已经作了相当深入的研究;已经表明,在现代语言学领域内业已产生的各种非转换句法理论,不管是纯理论的还是应用的,几乎都纳入这个框架之内。事实上,这样一个系统显然跟各种现代分类语法(“结构主义”语法)的内含是一样的,只要把这些语法重新用公式表达成作出语法说明的明确系统(但参阅第一章注30)。在我看来,这类系统作为自然语言的语法的不充分性已肯定是没有疑问的(虽然这种疑问是合理的),4在这里将不讨论这个问题。
看来很清楚,某些种类的语法说明用一套重写规则的方式来表达最为自然,因此我们可以得出结论,重写规则构成句法部分底下基础部分的一部分。此外,我们将假设这些规则以线性顺序排列,并且把顺序派生定义为始终按照这种顺序运用一系列规则而形成的派生过程。这样,如果假定这部语法由规则系列R1…,Rn组成,而系列#S#,#X1#,…,#Xm#是终端语符列Xm的派生过程,那么要使这个派生过程成为顺序派生,情况必须是:如果对#Xi#前面的那个语符列运用规则Ri从而得出语符列#Xi#,那么在这之前,不可能已经运用规则Rk(k>i)从而使#Xl-1#派生为语符列#Xl#(l<j)。我们现在规定,基础部分中的规则系列这一组成部分只生成顺序派生过程。6
要得到一个象(3)那样的词组标记,基础部分可能包含如下的重写规则系列:
应当注意到,(5)中的规则虽然足以生成(3),但也会生成诸如boy may frighten the sincerity(男孩可能使真诚害怕)的异常语符列。我们将在§2.3里讨论这个问题。
(5)中引出语符列词汇元素的规则(第Ⅱ类)和其他规则之间有一种自然区分。事实上,我们将在§2.3中看到,有必要区分这两组规则,并把词汇规则划归句法部分底下基础部分的一个独特的分部。
关于(2ⅰ)中的说明,我们很清楚地看出这些说明应如何得到形式上的体现,以及生成这些体现形式需要哪些种类的规则。