用SPSS做效度检验:因子分析

二、用SPSS做效度检验:因子分析

在SPSS中,主要通过因子分析(也称因素分析)来测量量表的建构效度,其中主成分分析法(Principal Component Analysis)是最常用的计算因子负荷的方法。要注意的是,进行因子分析需要满足一系列条件,如下文提到的KMO值必须大于0.06,样本数最好能达到题项数的5倍以上,等等。

因子分析的具体操作流程如下:

点击工具栏[分析(A)]→点击[降维(D)]→点击[因子(F)],开启“因子分析”对话框→将左边变量清单中的量表题项全部选中,将其放入右边[项变量(V)]下的方框中(见图7-4)→点击右边[描述(D)]按钮,启动“因子分析:描述”对话框(见图7-5)→在[相关性矩阵]部分的方框中勾选[KMO和巴特利特球形度检验]选项,点击[继续],返回“因子分析”对话框窗口→点击[提取(E)]按钮,开启“因子分析:提取”对话框窗口(见图7-6)→系统默认的因子分析[方法(M)]即为主成分分析法,且默认为保留特征值大于1的因子,可以在[输出]部分的方框中勾选[碎石图]选项→点击[继续],返回[因子分析]对话框→点击[选项(O)]按钮,开启“因子分析:选项”对话框窗口(见图7-7),勾选[系数显示格式]下的[按大小排序(S)]和[排除小系数(U)]选项→点击[继续],返回“因子分析”对话框→点击[确定]即可。

图7-4 “因子分析”对话框

图7-5 “因子分析:描述”对话框

图7-6 “因子分析:提取”对话框

图7-7 “因子分析:选项”对话框

完成上述操作后,SPSS的输出结果如下:

表7-5显示的KMO和巴特利特球形度检验的结果,直接决定了这些题项是否适合做因子分析,即是否满足做因子分析的条件。KMO值是一个介于0和1之间的值,KMO值越大,说明变量间的共同因素越多,越适合进行因子分析。根据KMO值的提出者Kaiser的观点,如果KMO值小于0.5,则不适合进行因子分析;进行因子分析的KMO值的普通标准应该达到0.6;如果KMO值达到0.8以上,则说明很适合做因子分析。从表7-5中可以看到,量表的KMO值达到了0.928,可以进行因子分析。

表7-5 KMO和巴特利特球形度检验

巴特利特球形度检验的结果同样可以作为量表能否进行因子分析的标准。表7-5显示,球形度检验的近似卡方值为2031.489,自由度为120,达到0.05显著水平。按照巴特利特球形度检验的标准,如果显著性概率值p<0.05,则可以认为变量适合进行因子分析。

表7-6为公因子方差表,在采用主成分分析法提取共同因素时,初始的共同性估计值都为1。第三列为主成分分析法提取主成分后的共同性,共同性的高低可以作为筛选题项是否合适的标准之一。较为普遍的标准是,如果该题项的共同性(最后一列的数值)小于0.2,那么应该考虑将该题项删除。

表7-6 公因子方差

注:提取方法为主成分分析法。

表7-7为总方差解释表,第一部分为“成分”,第二部分是“初始特征值”,“初始特征值”中的“总计”显示的是每一个主要成分的特征值,特征值越大表示该主成分在解释16个题项(变量)的变异量时越重要,可以看到第一个成分的特征值达到了10.318。从第三部分“提取载荷平方和”可以看到,通过主成分分析法,最终提取出两个主成分,这两个主成分已经能够解释变异量的72.103%。

表7-7 总方差解释

注:提取方法为主成分分析法。

我们同样可以通过碎石图来判断可以提取的因子(成分)数量,判断标准为图中的坡线从陡忽然走向平缓时的因子编号(横坐标)。在图7-8中,当因子数量为2时,陡坡线忽然变得平滑,由此可以判断提取两个公因子最合适。在此需要特别说明因子(即成分)的意义,简单来说,可以将因子的数量看作维度,即对于一个量表来说,量表中的所有题项可以被分为几个维度(方面)。如果因子数量为2,则说明量表中题项是在测量概念的两个方面;如果是3,则说明量表测量了该概念的3个方面。如前文所提的“歧视量表”,如果该量表提取的因子数量为3,则可以认为这个量表测量了“歧视”的3个维度。

图7-8 碎石图

表7-8为成分矩阵表,显示了每个题项的因子负荷(因子负荷小于0.1的数据已经删除)。因子负荷类似于回归分析中的回归系数,因子负荷数值越大说明该题项与公因子之间的关联就越强,越应该被归入这个公因子之下。这个步骤非常关键,因为通过成分矩阵表可以知道每个公因子(维度)包含了哪些题目,然后根据这些题项总结归纳这个公因子测量的是某个概念的哪个维度,并据此对这个维度进行命名。

表7-8 成分矩阵a

注:提取方法为主成分分析法,a指提取了两个成分。

由于表7-8是来自现实中问卷调查的真实数据,其因子分析的结果并不算特别完美,虽然通过主成分分析法提取出了两个公因子,但是从表中可以看到,16个题项都是在第一个公因子下的因子负荷值最大,而在第二个公因子下的因子负荷值显得较为混乱。此时,研究者可以通过其他因子分析方法,如经过转轴后获得新的成分矩阵,看是否能得到更清晰的维度分布。[5]

由于上面的数据分析来自现实中真实的调查结果,虽然在结果的呈现上较为真实,但却不是最理想的状态,这可能和问卷设计得不够完善有关。

下面我们直接来看一个较为完美的因子分析结果(见实例7-1)。

实例7-1:“××大学思想政治课教学效果感知量表”(见表7-9)

表7-9 ××大学思想政治课教学效果感知量表

对上思想政治课程的300名学生进行问卷调查后,对收回的数据进行因子分析,然后获得了如表7-10所示的成分矩阵。

从表7-10中的结果可以清晰看到,总共提取出了3个公因子,其中Q1和Q4在第一个公因子下的因子负荷值最大,而在其他两个公因子下的因子负荷值明显很小。Q3,Q5,Q6在第二个公因子下的因子负荷值最大,Q2在第三个公因子下的因子负荷值最大。因此,我们可以据此将6个题分为3个维度,认为这6个题项实际上测量了学生对思想政治课教学效果感知的3个方面。这时我们可以仔细阅读这6个题项,找到这些题项之间的共性,并将其进行归纳,给每一个维度取一个合适的名称。如将Q1和Q4测量的维度命名为“课堂效果感知”,将Q3,Q5,Q6测量的维度命名为“课后内容感知”,将Q2测量的维度命名为“教学难度感知”。

表7-10 成分矩阵