6.2 局限与展望
本书在研究过程中,存在如下一些局限性:
(1)系统功能语言学在发展的过程中,演化出了不同的理论模式。除了Halliday的悉尼语法,具有较大影响力的还有Fawcett的“加的夫语法”(黄国文、何伟、廖楚燕,2008;张德禄,2011)。此外,Martin近一二十年来也提出了很多理论观点,尤其在语篇语义研究(Martin,2010a)和语类研究(Martin,2010b)两个方面取得了比较重大的突破。他们均在一定程度上修正和发展了Halliday的系统功能语言学理论框架。
本书主要考察了Halliday的理论模式。至于其他理论模式在自然语言处理中的应用及其知识表示方法,将留待以后作进一步的研究。只有完成这些工作之后,才能全面、深刻地把握系统功能语言学在自然语言处理中的应用情况。
(2)知识表示方法的评价是一个十分复杂的过程。它涉及一系列的指标,例如表示能力、可利用性、可组织性和可维护性、可实现性、自然性与可理解性等。
本书主要考察了PENMAN/NIGE中的系统网络,有关评价也局限于表示能力和可实现性两个主要方面。此外,还没有细致地考察系统网络表示法在其他语篇生成系统,尤其是其他自然语言处理分支领域中的应用情况。因此,有关结论还显得比较粗疏。
(3)对于本书所提出的复杂系统网络模式,也主要是从理论上阐述了它的优越性。尽管明确了实现的技术路线,但是却缺少一个十分理想的可比对象(这种困境在CSRS的研制中也存在),从而尚未通过实验证明是由于系统网络模型的差异才导致不同语篇生成系统存在比较明显的差距。
这有多方面的原因:一方面,PROTEUS、PENMAN/NIGEL等西方经典语篇生成系统的源代码难以获取;另一方面,国内自然语言生成方面研究相对薄弱。为数有限的几个相关语篇生成系统往往输出的是汉语,而不是英语。
我们也曾尝试另辟蹊径,为复杂系统网络模式找到一个具体的应用领域,例如图书馆资料:①邵军力等(2000:253)基于概念功能设计了一个图书馆资料查询系统(参见图6.1),我们试图在此基础上进行改进,目的是在“搜索”“借阅”和“浏览”三个选择项之间建立起更加复杂的关系。②我们在此基础上进行了改进,试图在“搜索”、“借阅”和“浏览”三个选择项之间建立起更加复杂的关系。如图6.2所示。
图6.1 概念功能选择网络
虽然这个试验在计算机上取得了成功,但是邵军力等人所设计的图书馆资料查询系统与PROTEUS、PENMAN/NIGEL具有较大的差别。因此,这个试验说服力有限,不能充分展示新模型的优越性。
(4)系统功能语言学发展阶段的划分是一个十分复杂和精细的工作。以阶与范畴语法阶段的界定为例,Halliday在1956年开展的机器词典研究是否可以完全纳入到这个阶段?Halliday此后在1961年开展机器翻译研究时,其学术思想发生了哪些较大的变化?这些问题还有待作进一步的考证和说明。
图6.2 改进的图书馆资料查询系统
从总体上来说,本项研究还有待深入:
(1)在研究方法上,有必要加强系统功能语言学与语料库语言学的关联。
目前,系统功能语言学的一个重要研究动态是应用于(多模态)语料库。与此同时,语料库语言学也开始关注语料库中所发现的语言事实背后的语言学理论问题。鉴于这两种理论之间存在一种协同的关系,冯志伟认为探索系统功能语言学与语料库语言学之间的这种关系,对两者来说都是大有裨益的(Thompson和Hunston,2010:D19-D20)。
(2)在研究对象上,有必要重点突破语境的形式化研究。
在Halliday的理论框架中,一个重要的概念是语境(包括文化语境和情景语境)。如何对其进行形式化表示,直接牵涉到后续的系统和项目的设置。
此外,语境的形式化在自然语言处理中也具有重要的实用价值。以“北大2014年上海市重点本科分数线”的检索为例,就有必要将“北大”替换为“北京大学”。这个同义词替换对于我们来说是非常简单的,但是对于机器来说是相当复杂的,因此会出现一些意想不到的情况。例如“北大街发生了抢劫”这句话中的“北大”就不能简单地替换为“北京大学”。因此,机器需要能实时计算“北大”在什么情况下能替换成“北京大学”,这就需要对“北大→北京大学”这个替换来做语境的“建模”。
总之,系统功能语言学是一种面向消费的语言学理论。在电子时代,互联网推动了数字化生活的开展。例如,蓬勃兴起的电子商务活动,推动了商品分类的需求。这种分类不能仅局限于概念分类,还必须考虑人际、语篇方面的因素。因此,这有望成为一个新兴的系统功能语言学应用领域。与此同时,它势必反过来对系统功能语言学的知识表示提出新的要求。