数据收集与整理
在调查前,作者首先选取了调查地点并进行抽样,调查研究选取的地点为西安交通大学,研究对象选择本科生。为了使样本能基本代表该学校本科生的人口特征,以性别和年级为类别依据进行配额抽样,计划每个年级抽样400人,其中男生300人,女生100人,总计1600个样本。
数据的收集采用问卷调查的形式。2004年12月~2005年1月,作者在学生调查员的配合下完成了问卷的发放和回收工作。在调查前,作者从自己教授过的学生和其他老师介绍的学生中精心挑选了分布在四个年级和不同学院的43名学生调查员,在对调查的方式和要求进行了详细的讲解后,根据学生自愿,每位调查员分配20~50份问卷的调查任务,调查问卷由学生在自己所属学院的同学中发放,并在3~7天后收回。调查中实际发放问卷1580份,回收问卷1424份,回收率90.1%。从调查的实际情况来看,调查得到了调查对象的配合和支持,绝大多数的学生都毫无顾忌地填写了姓名和学号,还有部分学生在调查结束部分写下了自己的想法和评论,例如一位学生写道:“谢谢您们的调查,让我在答题时也对自己的锻炼情况有了思考与了解,我喜欢体育(尤其是足球),我会加强锻炼的,最后祝您们的课题取得成功。”
在调查进行的同时,作者采用Access设计了数据库和数据录入界面,录入界面含有对数据进行逻辑检验的程序,检查录入数据是否在合理的范围。调查完成后,由作者和一位硕士生完成了调查问卷的数据录入,录入过程中对录入的每份问卷回答的认真程度进行评级,学生回答的问卷根据卷面、问题的遗漏和逻辑分析(问卷含义相近的题目回答是否存在矛盾)被分为5级,0为认真,1为较认真,2为部分答案是可疑的,3为第四、五大题的答案不可用,4为废卷。数据录入完成后,作者随机抽查了50份问卷,发现仅存在7处错误,根据问卷的217个问题,录入错误率0.0065%,且都发生在需要学生填写具体数字的开放性问题。经上述处理后,删除认真度大于2的样本,剔除无效问卷145份,无效问卷的产生主要是由于问卷较长,第四、五大题遗漏值较多。对于剔出无效问卷后还少量存在的遗漏值,对于采用里克特量表的题目,用度量的中值(第三大题的5点量表,用3;第四题是7点量表用4;第五题用5)填充,对于需要填写具体数据值的开放性问题没有做处理。
数据清洗完毕后,转化为SPSS数据格式,并根据量表题目设计对反向计分项目进行了反向计分处理,其中第一大题7和13题;第二大题的3题做了反向计分。第三大题,反向计分题目包括6、26、42、55、61、63、81、84、85、92。但由于第三大题的答案取向与其他大题相反,在反转操作中反向计分题目不操作,而其他项目进行反向计分操作。
经过上述处理,实际调查后获得的有效样本总数为1179。在性别和年级上的分布情况见表6-1,通过与样本总体对比(见表6-2),基本上符合样本总体上的分布。
表6-1 样本在性别和年级上的分布(https://www.daowen.com)

表6-2 总体和整体样本的基本人口信息

资料来源:西安交通大学大学生体育合格标准数据库和“大学生体育锻炼调查”调查。
为评估每个测量项目的特征,考察了各题目回答的均值、标准差、偏度、峰度(数据见附录5)。结果显示所有题目的偏度和峰度绝对值远小于2,量表题目的回答数据分布满足正态分布假设。使用5点量表的绝大多数题目的标准差大于1,锻炼动机测量题目的标准差最小为1.77,测量锻炼坚持自我效能的题目的标准差最小为2.469,表示学生在这些题目上的答案有较好的分散,这些题目对学生相关问题具有较好的鉴别度。