第4章 系统功能语言学在多模态语料库中的知识表示方法

第4章 系统功能语言学在多模态语料库中的知识表示方法

进入20世纪90年代之后,计算语言学的一个总体发展趋势是重视各种语料库的建设,并基于语料库开展相关的自然语言处理研究工作(Biber,D.、S.Conrad和R.Reppen,2000;Teubert,W.和A.Cermakova,2009;梁茂成,2010)。与之相适应,系统功能语言学也愈发重视与语料库语言学的联姻,并将应用的重点转向口笔语语料库的建设以及相关语料的标注与检索(Thompson,G.和S.Hunston,2010)。在这方面,Halliday于1991年初步论述了语料库研究与概率语法之间的紧密关系,并进一步提出了将语言视为系统和实例之间存在连续统关系(Halliday和Webster,2007:63-75)。

随着多模态语篇分析的兴起,系统功能语言学开始与之结合起来并应用于多模态语料库的建设与研究。在这方面具有较大影响力的有O'Halloran、Baldry、Bateman等人。他们研究如何对多模态语篇进行标注,并陆续建立了相关的多模态语料库,甚至进一步开发了或正在研发相应的多模态语料库检索软件(Kress和Leeuwen,2001;O'Halloran,2004;LeVine和Scollon,2004;Baldry和Thibault,2005)。

在本章中,我们将对Baldry的“MCA”和Bateman的“GeM模型”进行研究。这是两种新兴的、具有较大影响力的多模态语篇分析与标注方法。通过这种研究,有助于进一步归纳出系统功能语言学在多模态语料库中的知识表示方法。