4.2.2 基础层、版面层、语义内容层的工作原理
我们将结合图4.8,进一步研究GeM模型中各层次的工作原理:
4.2.2.1 基础层
基础层的核心任务是确定页面的基础单位。首先,Bateman对基础单位进行了界定,指出它们具有以下两个主要的特征:
(1)最小性:它们充当其他层次中分析单位的“公分母”(Common Denominator),即是其他基本单位的基础。
图4.8 Gannet页面(Bateman,2008:112)
(2)独立性:它们的识别不依赖于版面和语义内容的分析,而仅仅是基于它们在页面上具有可见的物理表现形式。
Bateman进一步介绍了确定基础单位的两条原则:
(1)客观性原则:以图4.8中页眉的分析为例,有必要确定5个基础单位,即“1 Gannet”“2 Sula Basana”“3 Family Sulidae”“4 Gannets”“5 No.27”(参见表4.1)。在此阶段,不宜将这些基础单位合并为居左(包括“1 Gannet”和“3 Family Sulidae”)、居中(“4 Gannets”)和居右(包括“2 Sula Basana”和“5 No.27”)3个大块,因为左、中、右的划分是基于版面层中的分析。
(2)简化原则:对于图片的分析,往往将其视为一个整体。对图片下方文字的分析,也主要是分析句子、句子片段,而不是对每一个单词甚至字母进行分析。因此,我们进一步获得了第6至24一共19个基础单位:
表4.1 基础单位(Bateman,2008:113)
然而,Bateman也充分认识到了确定基础单位的复杂性。例如,一个句子如果分处两个不同的页面,则需要将其处理为两个不同的单位。此外,句子或片段中的序号、页码或图标等往往有必要将其处理为一个基础单位,以便对它们在后续层次,尤其是在浏览元素部分中作进一步的分析。这样一来,就出现了一个基础单位嵌套于另外一个基础单位的复杂情况。
4.2.2.2 版面层
这个层次的任务是对基础单位进行视觉聚类(Visual Clustering),包括如下三个部分的主要内容。
(1)版面分割。这个部分的核心是确定版面单位。Bateman区分了两类主要的版面元素:排字(Typographical)和图画(Graphic)。其中,排字的基本单位为“段落”(Paragraph),而图画的基本单位为“图画元素”(Graphic Element),即图画本身。
有必要指出的是,GeM模型是从一个更加宏观的角度出发来考察版面效果。因此,它在排字方面一般不再细化到句子甚至字符。在图画方面也不深入到其内部结构。
(2)体现信息。在这个部分,需要研究版面单位的形式。Bateman将版面单位分为两大类——文本元素(Textual Element)和图画元素(Graphical Element),并进一步提出了它们的分析特征。
在GeM模型中,对文本元素主要采用如下一些特征来进行分析:
表4.2 文本元素的分析特征(Bateman,2008:120)
其中,“定位”指待分析的版面单位所在的位置(参见图4.9)。
目前,对于图画元素的分析还存在不一致的意见。Bateman的做法是先把它们分为四大类——照片、自然主义绘画、素描、图表。此后,根据不同的文类作进一步的分析。例如,图画中有箭头、连线,等等。
图4.9 版面结构(左)与区域模型(右)(Bateman,2008:123)
(3)版面结构。版面结构指版面单位之间的一种层级关系(Hierarchy)。一般采用决策树的形式将已确定的版面单位一层一层地组织起来,从而揭示页面的整体布局。通过一个区域模型(Area Model),进一步确定版面单位在页面中的实际位置。
在版面结构中,L1表示页面的整体结构,包括四个主要的组成部分:
(1)L1.1为页眉,位于页面的顶部。它由L1.1.1(1 Gannet、3 Family Sulidae)、L1.1.2(4 Gannets)和L1.1.3(2 Sula Basana、5 No.27)组成。
(2)L1.2为图片,位于页眉之下。
(3)L1.1.3为图片之下的一段文本。
(4)L1.1.4为该段文本之下的7个句子或句子片段,即L1.4.1至L1.4.7。其中,L1.4.1至L1.4.3均包含了2~3个基础单位(从略)。
4.2.2.3 语义内容层
1)第一子层次
修辞部分与浏览元素。在修辞部分,需要研究页面、文档中元素之间的修辞关系及其所体现的交际功能。Bateman采用的分析框架是W.C.Mann和S.A.Thompson的修辞结构理论(Rhetorical Structure Theory,以下简称为RST理论)。但是,在如下几个方面进行了一定的修正:
(1)首先,对分析的基本单位即结构段进行了重新界定。它既可以指文本中的小句、句子或整个段落,也可以是图像或其组成部分。
(2)其次,修辞结构关系的分析不再局限于文本中线性相邻的结构段,而是页面上任何角度相邻的两个结构段之间。
(3)最后,对经典的RST结构关系进行了拓展,并提出了一种新的“多核心重述关系”(Multinuclear Restatement Relations)。RST理论认为两个结构段在语义上是核心与辅助的关系。然而,这种观点并不适合于页面中图文关系的分析,因为往往难以确定图像和文字在表意方面的主次之分。因此,在必要时将文字和图像结构段均看作是核心,两者之间是一种重述关系。
至于浏览元素,指的是页码、章节序号、某些图标等一些起到引导读者浏览页面的元素。在此不一一赘述。
2)第二子层次
文类部分。文类部分的作用是基于修辞部分和浏览元素,进一步判断出页面、文档的文类类型。Bateman制定了一个宏伟的目标:详尽细致、切实可行地描写出历史发展中所增加的多模态语篇类型。具体做法如下:
(1)在研究方法上,认为有必要借鉴以往纯文本语篇分析中的文类概念及其严密的分类方法。
(2)在具体研究过程中,认为有必要进行大量的实证分析,弄清楚各类多模态语篇在GeM模型的各层次中的特征和组成部分。
这样一来,就能够将语篇文类的变化置于一个更加宏大的“文类空间”之中,从而有利于开展一系列多模态语篇的对比分析,并进一步预测多模态语篇的功能和发展。