5.1　初步统计和分析

2025年09月26日

版权

5.1　初步统计和分析

本研究有效受试216人。在原始数据收集完成后，笔者对数据的集中趋势、离散趋势和分布形态以及测试的信度进行了描述性统计（见表5-1）。结果显示，数据的质量较高，能够满足下一步各种推断性统计的要求。就内在信度而言，各项测试的Cronbachα系数在0.711至0.873之间，说明测试的内在一致性较强，测试结果的可靠性较高。从平均分上看，测试的难度适中；从标准差上看，测试能够较为有效地区分受试在各个变量上的水平高低。在本研究中，因为数据的正态性是进行更高层次统计的前提，所以笔者从两个方面对其进行了检验。一方面，偏态值和峰值越接近0^[1]，分布越接近正态，当偏态值和峰值的绝对值不大于1时，即可认为数据呈正态分布；另一方面，单样本K-S（Kolmogorov-Smirnov）检验Z值的显著水平如果大于0.05，则说明数据的形态与正态分布无显著差异。在表5-1中，测试成绩的偏态值和峰值都在-1和＋1之间，单样本K-S检验Z值的显著水平都大于0.05，因此可以判定各项测试的分数基本呈正态分布。

接下来，笔者进行了零阶相关分析（zero-order correlation analysis）^[2]，结果见表5-2。相关分析的目的有两个：一个是观察各项测试成绩及其所代表的构念之间的相互关系，另一个是为下一步的因子分析和路径分析做准备。

如表5-2所示，所有测试成绩两两之间显著正相关。这个结果可以从两个方面解读。一方面这个结果说明，虽然语言学习在理论上可以分解为多个语言项目或技能的学习，但是这些语言项目或技能并不是完全独立的，而是相互关联的。在语言学习的实践中，我们不是也不能按照某种顺序学好一个语言项目或技能然后再学习另一个，而是同时学习（虽然会有所侧重），使其相互促进。另一方面，表中的相关系数高低不等，有0.7以上的高度相关，有0.4至0.7之间的中度相关，也有0.2至0.4之间的低度相关。因为本研究的216名受试对于相关分析来说属于一个较大的样本，所以这些相关系数都在0.001水平上具有显著意义。但是必须注意，测试成绩两两之间的相关程度存在较大差异，这说明有些构念有着比较密切的联系，而有些构念之间则相对疏远，虽然在统计上通过了显著性检验，但是其理论和现实意义需要斟酌。

表5-1　测试成绩的描述性统计

pagenumber_ebook=98,pagenumber_book=87

①因为单词识别测试和阅读流利性的三项测试以限定时间或单位时间内的正确完成量为指标，所以没有“满分”一说，在本表中以“—”表示。

（续表）

pagenumber_ebook=99,pagenumber_book=88

样本数：216

此外，在表5-2中，派生词比例较高的理解准确性测试二（即PETS-3 & PETS-4阅读）和派生词比例较低的测试一（即PETS-2 & PETS-3阅读）相比，前者与形态意识四项测试的相关系数均高于后者。这在一定程度上表明，当篇章中派生词的比例较高时，形态意识与阅读理解的关系更为密切。今后我们可以通过更具针对性的实验，对此进行验证。

5.1 初步统计和分析

5.1　初步统计和分析