二、聚类分析
2025年09月10日
二、聚类分析
研究在选取个案之前,如果收集到的样本比较多,而我们又要选取其中的例子,则需要对这些样本进行聚类分析。使用聚类分析,可以对单词的相似性、编码相似性或属性值相似性进行分组。如使用单词相似性进行聚类分析,NVivo系统会将各材料中受访者使用的短语或单词进行对比,如若这些短语或单词有很高的相似性,系统就会将它们归为同一组。
由图8-3可知,S2和S1使用的单词相似性程度较高,我们可以将这两个文本归为一组,S11和S12以及S10可以归为一组。不同的是,S14的材料与图中其他材料交集相对较少,这说明该受访者在访谈过程中使用的词汇与其他受访者使用的词汇具有较低的相似性。
图8-3 按单词相似性聚类的材料来源分析
分析软件NVivo11.0还可以对收集的访谈文本的可信度(稳定性)进行分析,由此可以求出本次所有的访谈材料按照单词相似性聚类分析得出的皮尔逊相关系数。相关系数在-1至+1之间取值,一般而言,相关系数绝对值的大小与相关性的强弱成正比,相关系数越接近-1或1,相关度越高,相关系数越接近0,相关度越低。相关系数取值在0.8与1.0之间表示极强相关,0.6与0.8之间为强相关,0.4与0.6之间表示中等程度相关,0.2与0.4之间为弱相关,0.0与0.2之间表示极弱相关或无相关。此次访谈资料相关性程度最高的是S1和S2的访谈,其次是S11和S12的访谈,相关程度最低的两组分别是S14和S1以及S14和S2。所有访谈材料之间的相关系数均在0.6以上,说明个案之间具有较强的相关性,访谈语料具有较好的稳定性和信度。