9.4 总结

9.4 总结

本章系统介绍了量化数据研究分析的基本流程。在数据准备阶段包含了数据验证、数据编码和数据录入三部分,这是数据分析的基础。然后进入数据清洗阶段,将录入数据中的“脏”数据剔除,在实际操作中这一步骤将花费大量时间与精力。在这一步骤中我们引入了Open Refine这一开源工具帮助我们有效地进行数据清洗。对于清洗干净的数据,接下来我们又结合SPSS介绍了如何对单变量、双变量和多变量进行统计分析。

其中,对单变量的统计分析指标有频数、百分数、均值、众数、中位数、极差、四分位差、方差与标准差。这些指标有的被用来测量集中趋势,有的被用来测量离散趋势。针对单一变量,我们还介绍了实践中常用的另一个重要方法——假设检验。针对两个变量间的相互关系研究,我们介绍了交叉表格法、卡方检验等。着重介绍了回归分析以帮助大家了解在只有一个自变量变化时因变量的变化量,以及变量间差异的比较:t检验和方差检验。最后我们还提及了当存在三个或三个以上变量时可以通过多变量方差分析、因子分析等方法进行相关性检验。需要注意的是,本章内容均基于线性相关,更为复杂的非线性相关并未进行介绍。

SPSS提供了相应的功能,可以帮助我们实现对这些指标的计算,我们也对相关操作步骤做了介绍。