序
今悉李学宁教授的《系统功能语言学在自然语言处理中的知识表示研究》一书即将付梓,十分高兴。我和李学宁教授早在2001年就认识了。当时我们正在计划写作《功能语言学与外语教学》一书,其中一个部分需要找人合作完成,那就是如何把系统功能语言学用于测试。当时,既懂系统功能语言学又做测试的人不多,李学宁教授正好写了一篇这样的论文让我看,我想这正是我要找的人,就和他讨论合作一事,他欣然接受。后来,他到上海交通大学攻读计算机专业的博士学位,并有意继续深造,做博士后研究。我当时可以在山东大学带博士后,所以,他就毅然辞去了系主任的职务,转而做博士后研究。
在这种情况下,他就具备了跨学科的优势,既懂系统功能语言学,又是计算机专业的博士生,所以,就和他协商是否他还愿意继续做计算机研究,探讨如何把系统功能语言学理论应用于计算机科学,发展系统功能计算语言学。他说他的想法和我的是一致的,所以,就开始做这方面的研究,经过两年多的辛勤刻苦的研究,他按规定完成了各项学习和研究任务,顺利完成了博士后研究出站。本书是该博士后研究项目的主要成果。
作为一门适用语言学,系统功能语言学自诞生之日起就开始探索如何应用于计算语言学,并在应用的过程中不断发展自己的理论。系统功能语言学开始于阶与范畴语法的研究(Halliday,1961)。Halliday在此之前就应用“阶”与“范畴”的基本观点对机器翻译和机器词典的语言学原理进行了初步的探索。并且,他针对机器翻译中对等翻译缺失的情况提出了“同义词词库法”(Halliday和Webster,2007:6-41)。在20世纪60年代,Henrici基于Halliday的系统思想开发了一个计算机程序,它能够对一个系统网络中的不同选项进行自动选择(Matthiessen&Bateman,1991:18)。1972年,Winograd研制了一个自然语言处理系统——SHRDULE。在这个系统中,他首次采用了Halliday的系统语法来建立一个比较全面的英语语法。在其后20年中,一系列基于系统功能语言学的语篇生成系统应运而生,比较著名的有PROTEUS、PENMAN、SLANG、COMMUNAL等。迄今为止,系统功能语言学已经成为语篇生成系统中应用最为广泛的语言学理论之一。进入20世纪90年代以后,系统功能语言学开始积极地应用于语料库语言学的研究以及各类语料库的建构,其最终目的仍然是服务于自然语言处理的需要。与此同时,Halliday(Halliday&Webster,2007:157-189)还开展了对口语语料库的研究。Bateman(2008)、Baldry(2010)等进一步研究了多模态语料库的建构,并成为系统功能语言学在当代自然语言处理应用研究中的一个重要动态与发展趋势。针对人工神经网络研究与遗传算法、模糊逻辑结合起来发展智能计算(Intelligent Computing)的趋势,Halliday从系统功能语言学的角度探讨了语言的模糊性,并初步论述了系统功能语言学在智能计算中的应用前景(Halliday&Webster,2007:193-267;杨才英,2007)。
总之,系统功能语言学在人类计算机发展的每个关键时期都做出了积极的贡献,主要应用于机器翻译和机器词典、自然语言生成和(多模态)语料库;而这些应用领域与计算语言学本身的发展趋势基本一致。由此可以说:计算语言学是系统功能语言学的一个重要应用领域;而在计算语言学中的应用反过来深刻地影响了系统功能语言学的发展轨迹,并推动了其自身的理论建设,尤其是相关的形式化研究的开展。
本书聚焦于如何用系统功能语言学理论在自然语言处理中进行知识表示,即采用一些形式化方法将其重新表示出来,为计算机识别和处理提供工具。本书按照跨学科的思路,采用历史文献法和形式化方法。通过文献法,全面梳理系统功能语言学在一些自然语言处理主要领域的应用情况。而形式化方法就是知识表示方法,它是系统功能语言学与计算语言学发生关联的“玄关”。通过研究发现:系统功能语言学在本质上是一种面向自然语言处理且在该领域中具有广泛应用价值的语言学理论。在应用过程中,系统功能语言学者提出并发展了系统网络,从而丰富了计算语言学和人工智能中的知识表示方法。
本书在国内首次全面、系统地研究了系统功能语言学在自然语言处理中的应用情况及相关的知识表示方法,使大家初步认识系统功能语言学的计算语言学的理论、方法和特点。它能够在一定程度上纠正人们对于系统功能语言学的一种误读,即该语法不重视甚至反对形式化研究;也有助于从一个更加全面和客观的角度来审视系统功能语言学的发展轨迹——它的发展基本与计算语言学的发展同步,可以使大家更好地理解Halliday等人在众多的语言学理论观点中进行选择的技术动因。希望本书得到广大读者的喜爱。
张德禄
同济大学教授、博士生导师
2018年3月7日
于上海文化花园香榭丽苑