5.3.2 测量模型

5.3.2 测量模型

SEM由测量模型和结构模型构成。其中,测量模型是基础,用于构建观察变量及其误差变量与其所对应的潜在变量之间的关系。在本研究中,形态意识、阅读流利性和理解准确性分别有四个、三个和两个观察指标,因此需要首先构建它们的测量模型。至于单词识别、词汇广度、词汇深度和语法知识,因为它们只有一个观察变量,属于单指标的潜在变量,观察指标与它们的关系简单明确,即因子负荷为1,测量误差为0,所以无需构建测量模型。三个多指标潜在变量的假设测量模型如图5-1所示。

在AMOS中进行SEM分析时,有一套固定的图形标识:椭圆形表示潜在变量,长方形表示观察变量,圆形表示观察变量的误差或者内衍潜在变量的残差(residual),双向箭头表示共变关系,单向箭头在结构模型中表示因果关系。在测量模型中,例如在图5-1中,单向箭头从潜在变量指向观察变量,例如从“关系”指向“关系I”和“关系II”,或者从高阶的潜在变量指向低阶的潜在变量,例如从“形态意识”指向“关系”,表示前者对后者的解释作用[4];此外,误差或者残差与其所对应变量的关系也用单向箭头表示,箭头从前者指向后者。

图5-1 假设的测量模型

如图5-1所示,根据已有形态意识与阅读能力关系研究(Kieffer et al.,2013;Zhang & Koda,2012)和阅读流利性与理解准确性关系研究(Denton et al.,2011;Silberglitt et al.,2006)的研究结果,形态意识、阅读流利性和理解准确性被设定为两两相关。2.2.2节和4.3.2节,在文献综述的基础上提出,与接受性任务发生关系的形态意识涉及三个维度:关系、意义和句法,其中在测量关系维度时,笔者考察了受试对孤立词缀的辨识和对多语素单词的切分(或者说对词缀在单词环境中的辨识)。因此,在图5-1中,“形态意识”是一个二阶因子,“关系”是下属于它的一阶因子,有“关系Ⅰ”和“关系Ⅱ”两个观察变量。受图形空间的限制,在图5-1至图5-13中,“关系Ⅰ”和“关系Ⅱ”分别代表“孤立词缀的辨识”和“单词中词缀的辨识”。至于阅读流利性,由于相关研究较少,如何才能高效度、高信度地加以量化尚需更多的理论和实证探索,因此为了尽可能有效地测量阅读流利性,本研究采用了三种任务形式(参见4.3.2.6节),在假设模型中被设定为“阅读流利性”的三个观察指标。与此相似,在图5-1中,“理解准确性”的观察指标是两次难度不同的测试,“较易的阅读”对应PETS-2和PETS-3难度的测试,“较难的阅读”对应PETS-3和PETS-4难度的测试。

假设模型绘制完成后,AMOS对其进行了辨识,为进行下一步的模型评估提供了依据。全面的模型评估需要考虑四个方面:

首先,需要检验观察变量的正态性,包括单变量的正态性和多变量的正态性,因为这是SEM分析的基本前提。通常,如果单变量都呈正态分布,多变量也是正态分布,但不是百分之百这样。在5.1节中笔者已经检验了单变量的正态性,表5-1显示本研究中的所有观察变量都呈正态分布。多变量的正态性检验需要查看AMOS输出报表中的多变量峰值和临界比(critical ratio)。Kline(1998)提出,峰值小于8,临界比小于1.96,即可认为多变量满足正态分布的要求。

然后,需要检验模型的基本适配度,即查看参数的估计值是否在合理的、可接受的范围之内。Hair等(1998)提出,基本适配度的指标主要是误差方差和测量模型中的因子负荷,前者不能为负,后者最好介于0.5和0.95之间。

接下来是检验模型的内在结构适配度,即模型的内在质量,方法是通过计算潜在变量的组合信度(composite reliability)和平均提取方差(average variance extracted)等指标的数值,对潜在变量的效度和信度进行评估。组合信度也称构念信度(construct validity),用于反映构念的内在一致性,即从属于一个潜在变量的观察变量之间的相互关联程度,最好大于0.6。平均提取方差通常应该在0.5以上,表示观察变量被潜在变量所解释的变异大于其被测量误差所解释的变异,也就是说,观察变量能够有效地反映其所代表的构念。

最后一步也是最复杂的一步是通过整体适配度指标检验模型的外在质量。整体适配度指标数量众多,包括绝对适配度指标、增值适配度指标和简约适配度指标三类。绝对适配度指标反映假设模型与样本数据在只考虑假设模型、不和其他模型比较时的拟合程度。增值适配度指标也称相对适配度指标,说明假设模型相对虚无模型(null model)[5]的改善程度。简约适配度指标代表模型的精简程度。根据专家的论述(Hair et al.,1998;温忠麟等,2012),结合本研究的实际情况,笔者选用了下列比较常用和重要的指标(见表5-4):

表5-4 常用的SEM整体适配度指标

AMOS评估结果显示,图5-1的假设模型能够通过上述前三个方面的检验,但是在整体适配度的检验中,x2/df、AGFI和RMSEA三项指标距离适配标准稍有差距,具体数值分别是2.408、0.899和0.081。这说明假设模型需要修正,修正的力度应该不大。

模型修正实际上是修正、评估、再修正、再评估,直至最终构建一个合理模型的过程。这个过程的第一步是查看AMOS输出报表中的修正指数。这些修正指数从统计的角度提供了具体的修正建议。然后,根据这些修正建议是否能够在理论和实践上得到解释,笔者最终决定如何修正模型。也就是说,模型修正不能唯数据论,修正后的模型必须有意义,讲得通,否则拟合再好也不可取。

根据上述模型修正的方法和要求,对假设模型的修正是设定“关系I”的测量误差和“意义”的测量误差具有共变关系,即在e1与e3之间建立相关。在2.2.2节中已经指出,在形态意识的构成成分中,关系维度是其他维度的基础,对派生词进行其他维度的分析通常要以一定程度的关系分析为前提。在本研究中,对意义维度的量化是通过孤立的词缀而非单词实现的,因此对词缀意义的正确作答暗含对孤立的词缀形式的正确辨识。并且,就EFL学习的实际情况而言,词缀形式和意义的学习通常是同步进行的,不会被人为地割裂开来,因此词缀形式掌握得好,同时词缀意义也就掌握得好,反之亦然。在表5-2中,“关系I”与“意义”的相关系数为0.632。这也为增加e1与e3相关这条路径提供了支持。

模型修正后,再次进行模型辨识,结果如图5-2所示:

图5-2 修正后的测量模型

***:p≤0.001

对修正后的测量模型进行评估,结果显示拟合度良好,表5-5列出了各项指标的具体数值。这为下一步结构模型的构建打下了较好的基础。

表5-5 修正后测量模型的评估结果

图5-2中的数值表示观察变量在所属潜在变量上的因子负荷、潜在变量两两之间的相关系数以及测量误差的相关系数。它们都在0.001水平上具有显著意义。其中因子负荷的最小值是0.663,最大值是0.879;也就是说,观察变量能被潜在变量解释43.9%至77.3%的方差。结合表5-5中列出的潜在变量的组合信度和平均提取方差,可以认定本研究中的三个潜在变量具有良好的效度和信度。

比较因子负荷的大小,能够了解观察变量在其所属潜在变量中的相对重要性。在形态意识的三个构成成分中,关系维度的因子负荷最高,这是因为一般说来,正确辨识派生词的形态结构是对派生词意义和句法功能进行推测的基础和前提。在阅读流利性的三项测试任务中,阅读流利性对TOSCRF的解释力最强。笔者认为这是因为三项测试任务虽然都需要受试理解语篇的意义,但是TOSCRF更多地涉及语篇局部意义的理解,而迷宫和速读则更多地涉及语篇全局意义的理解。换而言之,TOSCRF能够被阅读流利性所解释的方差较大,是因为它被其他因素(例如对语篇连贯的把握)所解释的方差较小。在理解准确性的两个观察变量中,“较难的阅读”的因子负荷大于“较易的阅读”。笔者认为这是因为对于大一新生而言,较难的PETS-3和PETS-4阅读测试相对于较易的PETS-2和PETS-3阅读测试,能够更加有效地反映受试的阅读理解水平。

5.1节使用SPSS对测试成绩即观察变量进行了相关分析(见表5-2)。现在测量模型已经构建出来,根据模型可以推算所有变量(包括观察变量和潜在变量)之间的相关系数。因为观察变量在所属潜在变量上的因子负荷,在图5-2中已经显示,所以表5-6集中报告潜在变量(包括形态意识、阅读流利性和理解准确性三个多指标潜在变量以及单词识别、词汇广度、词汇深度和语法知识四个以观察变量形式出现的单指标潜在变量)之间的零阶相关系数。

表5-6 潜在变量的相关分析

如表5-6所示,七个潜在变量之间两两相关,并且除了单词识别与词汇深度和语法知识低度相关,其他的相关系数都在0.4以上。这说明要探究形态意识与阅读流利性和理解准确性的关系,不仅需要考虑与它们相关的单词识别、词汇广度、词汇深度和语法知识这些变量是否起中介作用,而且需要把所有的变量放在一个整体的框架内考察,以解决共线性(collinearity)的问题。