1.3.3 研究方法

1.3.3 研究方法

在本书中,主要采用如下两种研究方法:

1)文献法(历史文献法)

笔者收集了一二十本有关系统功能语言学应用于自然语言处理方面的专著和论文集,其中部分专著在国内系统功能语言学界和计算语言学界均为首次提及;另收集了近百篇论文(含博、硕论文),覆盖的主题包括系统功能语言学发展史、计算语言学和人工智能发展史、知识表示方法等。此外,笔者收集的文献资料还包括多篇计算机试验报告,其中一篇为PENMAN语篇生成系统局部运行报告。

开展文献法研究的目的是梳理系统功能语言学在自然语言处理中的应用历程,同时关注其在应用中所采用的知识表示方法。

2)形式化方法

本书主要采用如下三种研究方法:

(1)数理逻辑的方法,尤其是概率逻辑和模糊逻辑(J.D.Mc Cawley,1998)。Halliday本人曾采用这两种方法研究了概率语法和自然语言中的模糊性(Halliday和Webster,2007:63-75,213-238)。

(2)系统网络。这是一种图论的方法(王海英、黄强、李传涛等,2010),与树形图具有一定的类似性。我们将进一步研究系统网络这种表示方法中存在的一些局限性。

(3)特征分析法。包括特征分析、特征结构分析和类型特征结构分析三种子方法。它们均应用于系统功能语言学的形式化研究(参见3.4)。

开展形式化和可计算性研究的意义是进一步甄别系统功能语言学所采用过的知识表示方法。根据研究范式的转变以及计算机技术的发展,试图改进传统的知识表示方法,从而促进系统功能语言学与计算语言学的交叉与融合。