3.1.2 语言变异研究方法

3.1.2 语言变异研究方法

变异语言学研究主要从语言变项、社会变项、数据搜集和分析等几个方面对社会生活中的语言使用进行研究(Cheshire 1982;Labov 1966;Shuy et al. 1968;Trudgill 1974)。下文将结合言语共同体这一概念,从语言变项、社会变项、数据搜集和分析等方面对研究方法进行阐述。

3.1.2.1 语言变项

语言变项是关于可辨认的语言变式的语言学单位(Wardhaugh 2002),而语言变式则是语言变项的实际使用情况。例如,在Labov的纽约百货商店研究中,(r)这一语言变项就具有全部使用卷舌音([r-1]),部分使用卷舌音([r])和不使用卷舌音([r-0])这三个语言变式。语言变项的确立通常是从语言学的角度分析社会中的语言的第一步。对于变异语言学家而言,语言变项往往是从特定的社会群体出发,选择在该群体成员的语言使用上存在分歧的细微的语言特点。例如,在马萨葡萄园岛的研究中,Labov选取了元音央化作为语言变项。它在语言学家看来是很明显的语音特征,但是在当地的说话人眼中却不是那么明显:双元音(ay)和(aw)的标准发音为/aI/和/au/,但在马萨葡萄园岛则分别具有两个实际读音。根据Labov对言语共同体的定义,言语共同体内部的成员都使用同一种语言,并且语言变式的使用往往不影响成员之间的语言理解。

语言变项和语言变式的选择往往与传统的语言学分析息息相关。最早的变异语言学研究多从音系分析(Labov 1963;1966)和句法分析(Trudgill 1974)入手。Labov(1963)的马萨葡萄园的研究和1966年的纽约百货商店研究分别关注了元音央化和(r)音变的语音现象;Trudgill(1974)对英国诺里奇地区的英语研究则从句法角度和语音角度探讨了省略第三人称单数标记现象和(ng)、(a)等言语特征。

与传统语言学不同的是,无论是在语言变项的选择层面还是在具体研究操作的层面,都不能离开社会群体和言语共同体。这一特点可以从Labov对变异语言学方法论的贡献上得到证实。Labov(1972)认为,作为语言变项的语言形式首先需要具有以下两个重要属性:一是高频性,即高频率地出现在自然语言环境中;二是对语言变项的结构意义的考虑,它要从属于更大的功能性语言单位,并且与年龄分布和社会分层上的各种社会因素相关,该变项的使用具有不对称性,也就是变异性。这两个属性既明确考虑了语言变项在社会群体中所起的作用,也是对Labov早前提出的具体确认语言变项的方法所进行的抽象的概括。Labov(1966)指出,要明确定义一个语言变项,我们必须做好下面三步。第一,阐述清楚该语言变项会出现的所有的语言学环境。第二,详尽地定义出我们可以分辨的语音变式(phonetic variant)。第三,建立量化指标(quantitative index)来衡量该语音变式的值。例如,用具体的数值来代表各个语音变式,并根据职业、收入、生活条件等确定每名受调查人的社会指数。这就涉及变异语言学的一个基本原则“可说明性原则”(principle of accountability),即在既定语境中,我们需要对各个变式出现的情况进行阐述说明。

此外,语言变异研究往往会考虑社会变项和语境风格。Trudgill(1974)指出,语言和社会的共同变异主要表现在两个维度,一个是体现在社会层面的分层维度,包括社会阶级、年龄以及个人的性别等因素,也就是社会变项(本章的下一部分会对此展开描述);而另一个则是社交语境(social context)维度,即在不同的语境风格下,同一个言语共同体内部的成员在语言使用上所表现出来的差异性。根据Labov对言语共同体的定义,共同体成员之间往往会遵循一套共有的语言规范(linguistic norms)。Trudgill认为考虑语境风格跟语言变项的对应关系主要有三个目的:一是准确地描述语言随着社交语境变化而变化的具体方式,二是发现言语共同体内部的语言规范,三是在风格变异和社会阶级、年龄等社会因素的相互作用下,去探索发现语言变化的机制,特别是风格变异对语言变化的作用。对言语活动产生影响的语境风格通常是正式风格(formal)或非正式风格(causal),即在正式的场合和非正式的社交场合采用不同的言语风格。Labov(1966)的纽约城市调查以及Shuy et al.(1968)的底特律调查都考虑到了不同语境风格对言语行为的影响。

最后,根据不同语言要素受到的社会评价的结果,Labov(1972)把语言变项分为三类。第一类是指标(indicator)。指标类变项嵌入到社会母体(social matrix)中,表现出一定的社会差异性,但是既不明显,也不具有系统性。第二类是标记(marker),表现为语言使用者的社会分层。尽管它们可能仍然没有被语言使用者明显感知,但这类语言变项会在主观反应测试中得到有规律的回应。第三类是刻板印象(stereotype)。它是社会中有明显标记的语言形式,代表着特定群体的言语活动的特点。人们会在语言评价中把使用该语言变式的说话人跟特定群体联系起来,并且施加给说话人该特定群体的既定印象。

3.1.2.2 社会变项

变异社会语言学从社会层面解释和分析语言变异,并揭示语言变异的规律。因此通常在确定语言变项之后,语言学家需要搜集语料,并且解释这些语言变项在不同人群之间的使用和分布情况。恰当地对社会群体进行有效分类,研究者需要考虑性别、年龄、宗教、民族、社会阶级、社会地位等在内的社会变项。性别和年龄往往是最容易确定的。其中,年龄因素的研究方法往往跟显像时间(apparent time)的概念相关。显像时间的研究方法不是从实际时间间隔出发,而是从调查发生的时间出发,在言语共同体内部对比不同的年龄层的成员在语言使用上的差异,从而发现正在进行中的语言变化(language change in progress)。这就是Labov所开创的均变论(uniformitarian doctrine)。均变论是一个来源于地质学的概念,强调在过去带来大规模变化的机制也以同样方式对现在正发生的变化产生重大作用。

除年龄以外,比较容易定义的社会变项因素还有性别、宗教和民族,而社会阶级这一变项是最复杂、最难以定义的。社会阶级这一概念有着深刻社会学理论基础。马克思从社会经济的角度理解社会分层,认为私有制会在社会变革中逐渐被废除,最终出现无阶级差别的社会。而韦伯则提出了社会层级性这一概念,认为权利(power)和地位(status)也在社会中相互作用,并且构成了人在社会中的等级差别。因此他认为社会结构是复杂和多角度的,社会的阶级性会一直存在。Ash(2002)认为,马克思和韦伯关于社会阶级、层级性的观点分别是从客观经济性的角度和主观威望和社会地位的角度提出的;而在变异语言学研究中,来自社会学的社会阶级概念并没有被广泛接受,更多的社会语言学家选择从言语共同体本身的特点入手并选择最适合该研究群体的社会分级标准。很多研究从职业、教育、收入、居住位置、房产价值、生活方式(Wolfram & Fasold 1974)等方面来衡量社会阶级。例如,Labov(1966)使用教育、职业和收入三要素确立了十个社会阶层;Trudgill(1974)的研究区分了五个社会阶层,包括中层中产阶级(MMC)、低层中产阶级(LMC)、上层工人阶级(UWC)、中层工人阶级(MWC)和低层工人阶级(LWC)。

除了从职业、收入、受教育程度等角度来衡量群体内部成员的社会阶级和阶层,Sankoff等变异语言学家运用了Bourdieu的语言市场(linguistic market)理论,发展出了一种根据语言使用来划分说话者的社会地位的方法。以蒙特利尔数据库中的120名说话人为研究对象,Sankoff & Laberge(1978)通过统计八名社会语言学家在充分考虑了社会经济以及家庭背景等因素的基础上对说话人在生活场景中需要使用标准语言的程度进行的打分,为每名说话人创建了语言市场指数(linguistic market index)。Ash(2002)认为,尽管这种以语言使用为依据的划分方法与社会阶级不同,但却可以探求社会地位(social position)存在差异的说话人在语言表现的差别。这也符合语言变异与变化研究的研究目的。

另外,还有学者关注到大的言语共同体内部存在的若干个紧密相连的亚言语共同体(sub-speech community),并且强调这些小的言语共同体对成员内部言语活动具有解释作用。与通过搜集说话人的社会背景信息来确定社会群体的方式不同,Milroy(1980)采用从说话人自己认同的社会身份的角度来研究言语活动的方法,认为在大的言语共同体内部存在着多个小的、关系紧密的、以地缘位置为基础的共同体和亚共同体。Milroy &Milroy的贝尔法斯特研究和Eckert的底特律研究都是从这一角度出发的语言变异研究。

3.1.2.3 数据收集

Labov从方法论的角度讨论“观察者悖论”(observer’s paradox)。在言语共同体中进行语言学研究的目的是去搜集和分析人们在自然状态下的说话方式;但是这些研究所依赖的语料又只能在系统性的观察(非自然状态)下才能获得(Labov 1972:61-62)。他认为收集社会语言学数据的核心在于克服这一悖论,从而收集到真正的自然条件下人们所使用的语言。为此,他提出了解决此问题的两个大致方向:其一,找到替代正式访谈的其他数据;其二,改变访谈的形式和结构。实验可以通过多种策略将访谈对象的注意力转移到言语活动之外,从而冲破访谈的限制而尽可能地收集到自然语料。这一部分将首先讨论样本的选择,然后探讨访谈的形式和结构。

首先,调查样本的选择与研究对象及其所处的共同体特点分不开。样本主要分为评价型样本(judgment sample)和随机性样本(random sample)。评价型样本指的是在既定的社会变项之下,选取受调查者参与访谈。比如Cheshire(1982)的研究对象是由工人阶级组成的言语共同体,那么在选择调查样本时作者最先对“阶级”这一变项进行划分,一般不会选择中产阶级参与访谈。而随机性样本指的是随机抽取言语活动的主体进行语言学访谈,所有共同体成员被选中参与调查的概率是一样的。它最能反映整体人口中最具有代表性的样本。通常随机取样的样本容量比评价型样本要大。例如,为了研究底特律地区整体的言语活动特点,Shuy et al.(1968)的底特律方言研究一共选取了702人参与调查。虽然随机性样本有很好的代表性,但是如果做到完全随机取样是非常困难的。因此人们通常采取准随机样本(quasi-random sample),在这种抽样方法下,并不是所有的共同体成员都具有相同的参与调查几率,而更多的是由第一个被选中的参与者决定的。例如,若共同体内一共有80个人,而样本容量是8,那么跳行区间(样本总量除以样本容量)则是10;若第一个被选中的参与者编号是5,那么剩下7个参与者则分别是15、25、35、55、65、75。用这种取样方法开展变异语言学研究的优点是可以把握特定区域内与地理位置相关的变异,Trudgill的诺里奇研究就是从四个代表区域中选择的准随机调查样本。

其次,根据参与调查的言语共同体特点,访谈方式也是大不相同。其中,最经典的被Labov称为“社会语言学访谈”(sociolinguistic interview),如Labov的纽约百货商店研究中快速匿名的访谈方式。Labov采取的访谈方式还包括研究者与研究对象以一对一的形式进行访谈(Labov 1972;1989;Wolfram & Fasold 1974);两个或者两个以上的研究对象共同参与(Feagin 1979),或者以成组的方式进行访谈,例如Labov在纽约哈林黑人区的采访(Labov et al. 1968;Labov 1972)。录音访谈的优点是可以对完整的语料进行记录,并且能够满足“可说明性原则”(详见3.1.2.1),为后续研究提供充足的语料。但是录音访谈本身也存在一些缺点。其一,访谈本身就是一种特殊的言语活动(Wolfson 1976),这种特殊的言语活动会影响访谈对象的言语行为。其二,访谈对象需要适应录音设备,录音设备有可能使访谈对象产生不舒适感。不过研究者也不必低估访谈对象的适应能力,他们可能根据调查语境来调整自己的言语活动,有的访谈对象在研究者面前能够像在平时参与其他言语活动时一样,自然地适应对话式的社会语言学访谈(Eckert 2000)。

3.1.2.4 量化分析

量化分析是变异语言学研究最经常采用的数据分析方法。Labov的研究表明,与研究个体的言语行为相对,量化分析更能从总体上把握共同体的音系结构(phonological structure)。具体而言,Labov提出来几个重要的量化指标。社会经济指标(socioeconomic index)是由职业、教育和收入这三个占有相同权重的指示符决定的。语言不安全性指标(index of linguistic insecurity)的计算方式是通过对比受调查人对某一语音变项的正确性判断和其自身对该语言变项的实际使用情况,这两个数据之间所有情况的差值则为语言不安全性指数。

在研究语言变项与社会变项的相关性方面,变异语言学研究通常要明确区分自变量和他变量。一般而言,社会变项是自变量(independent variable),而语言变项是他变量(dependent variable)。语言学家可以从社会变项,例如社会阶级、年龄、性别、民族等的角度来研究语言的变化。这种类型的社会语言学研究通常被称作量化社会语言学。在对变项进行分类以后,语言学家关注变式出现的言语环境,并且各个变式在不同言语环境下的显著性进行研究。

语言变异研究最经常采用的分析方法为变式规则分析法(VARBRUL)和逻辑回归分析(logistic regression test),其中包括t检验(t-test),回归分析(regression test),二元回归分析(binary regression test)等分析项。一般可以使用数据分析软件例如SPSS、SAS/STAT对数据进行分析,变式规则分析研究则一般使用Sankoff开发的Goldvard和VARBRUL软件。关于这些量化分析方法的具体操作也可参见徐大明(2006)的《语言变异与变化》一书。