5.3.1 结构方程模型简介

5.3.1 结构方程模型简介

SEM是一种基于协方差矩阵、用于探究多个变量之间关系的统计方法。它的核心概念出现于20世纪70年代,在80年代末得以快速发展,逐渐成为经济学、社会学和心理学等领域中多元数据分析的重要方法。但是就国内的语言学研究而言,SEM的使用历史只有十来年,并且此类研究的数量不多。

SEM由测量模型(measurement model)和结构模型(structure model)两部分构成。在测量模型中,潜在变量(latent variable)、观察变量(observed variable)和误差变量(error variable)是三个基本的概念。潜在变量指不能被直接观察和测量的构念,例如英语阅读能力。观察变量,又称测量变量(measurement variable)和外显变量(manifest variable),是能够被直接观察和测量、用于作为潜在变量外显指标的变量,例如用一次或多次阅读考试的成绩作为阅读能力的操作性定义。误差变量,又称干扰变量(disturbance variable),指观察变量的测量误差。观察变量及其误差变量合称为潜在变量的指标变量(indicator variable)。测量模型探究的就是潜在变量与它的一个或多个观察变量及其误差变量之间的关系。至于潜在变量之间的关系,则由结构模型负责处理。其中,外衍变量(exogenous variable)指自变量,内衍变量(endogenous variable)指因变量,既受到外衍变量的影响同时又对其他变量产生影响的变量是中介变量(mediator)。

SEM是较为复杂的高级统计方法,主要用于验证性因子分析(包括高阶因子分析)、路径分析和多群组分析。与传统的统计方法相比,SEM的优势主要体现在以下几个方面:首先,SEM可以在一个框架内同时考察多个自变量、多个因变量以及多个中介变量之间的关系,而在传统的以回归为方法的路径分析中,因变量只能有一个。根据自变量的数目是一个还是多个,回归分析有一元和多元之分。在多元回归分析中,如果自变量出现严重的多重共线性,分析结果很有可能会难以解释。传统的路径分析通过多次进行多元回归分析处理中介变量,但是这种方式不仅麻烦,而且无法一窥全貌。其次,SEM中的自变量和因变量都可以存在测量误差,而传统的回归分析以自变量不存在测量误差为假设,只容许因变量存在测量误差。再次,SEM区分潜在变量和观察变量,能够同时处理潜在变量与其指标变量之间的关系(即测量模型)和潜在变量之间的关系(即结构模型),而传统的因子分析需要两个独立的步骤才能完成因子内结构和因子间关系的计算。最后,SEM的测量模型更具弹性,容许传统因子分析难以解决的高阶因子和一个指标从属于多个因子的复杂情况。

就形态意识与阅读能力关系的研究而言,常用的统计方法是相关分析和回归分析。相关分析关注的是两个变量之间是否相互关联以及相关的程度。因为其中的两个变量地位平等,没有自变量和因变量之分,所以相关分析不能反映因果关系。回归分析比相关分析复杂,它通过在模型中定义自变量和因变量,能够确定因果关系,并且它可以计算多个自变量对因变量的影响。但是如上段所述,回归分析在处理中介变量和多个因变量时捉襟见肘,并且其中的自变量不能存在测量误差。目前形态意识与阅读能力关系研究的核心问题是前者对后者的影响机制,即形态意识通过哪些中介变量间接地影响阅读能力,在控制这些中介变量后,形态意识是否仍然能够直接地、独立地影响阅读能力。作为因子分析和路径分析的有机融合,SEM是探究这一问题的最佳工具。

能够进行SEM分析的软件很多,包括AMOS、LISREL、EQS和Mplus等。其中AMOS由于采用绘图的方式构建模型,无需编程,易学易用易懂,并且与SPSS兼容[3],因此逐渐成为首选。

SEM分析主要包括四个步骤:模型设定(specification)、模型辨识(identification)、模型评估(assessment)和模型修正(modification)。模型设定是指以一定的理论、假设或者实证发现为基础构建概念模型(也称理论模型、假设模型和初始模型)。然后,分析软件自动对模型进行辨识,计算假设模型与收集的样本数据之间相互适配的程度,即适配度(goodness-of-fit,也称拟合度)指标的数值,为我们评估模型提供依据。如果初始模型与实际数据的一致性程度较低,就需要进行一次或多次的修正,直至达到可以接受的拟合度。接下来,笔者将按照这四个步骤构建本研究的测量模型和结构模型。