一、选题的背景
世界上,许多国家对于初、高中学生的学业水平测试已形成完整的体系,对于命题的研究也较为系统。对于小学生学业水平考试,许多国家也在一定范围内(如国家或州)采用统一的试题、统一评卷的标准进行学业水平考试。
在英国,从19世纪末就开始实行11岁测试,目的是通过考试来实现教育标准的统一并将考试结果作为学生进入初中的选拔标准。20世纪80年代后,推行教育改革引入了国家课程,其中一项重要内容就是相关的测试与评价,这既是加强国家对学校教育的中央化控制,又是提高中小学教育质量的重要手段和途径。
在美国,20世纪60年代实施全国学力考试,这一项目被称为国家教育进展评估(NAEP)。在此基础上逐渐发展了州评估体系。美国的中小学学业水平考试有联邦考试、州考试和学区考试之分。联邦考试(NAEP)是目前美国国内唯一连续、长期的中小学学业成绩测量体系,首要目标是向美国公众报告学生的教育状况。州考试的规则由各州自行决定。考什么科目、哪几个年级都以立法形式确定的。有的学区也自己组织考试,了解本区的学生成绩。通过联邦考试和州考试可以对教育教学质量进行监控,促使学生努力学也促使老师用心教从而整体提高教育质量。同时考试也促使教学内容更规范。
在日本,从1956年起,开展了抽样学力调查考试,自1961年起开始实施针对若干年级的全国学历统考。然而,却导致了各地区和学校间的激烈竞争,遭致批判和反对,1965年被终止。1976年逐渐恢复并开始在全国开展“教育课程实施状况调查”。2007年,恢复了全国学历统考,同时还对学生和学校进行了背景状况调查。这项全国性的学历调查被制度化,每年举行。
新加坡的国家教育部每年组织在三年级和六年级进行两次全国性的考试,一方面来甄别低段学生的学业能力,另一方面作为小学毕业生资格认定。小学生离校考试成绩直接决定小学毕业生的分流,成绩最好的10%进入特快课程学习,处于中间的45%进入快捷课程,最后的45%进入普通课程。(https://www.daowen.com)
从前面列举的这些国家在小学生学业水平考试方面的发展状况来看,它们的突出特点是都有较为全面系统的统一考试制度,管理机制、考试内容、评估维度等,学业水平考试或者学力考试都在教育评价中起到了积极作用。
同时,国外标准化的学历考试或者学业水平考试也存在着问题和不足,例如,由于考试的命题存在着效度、信度等方面的局限性,因此单纯的学力测试未必能够准确地反映学生的真实学业水平和学习成就;对考试结果排名的攀比和竞争,可能导致学校和教师将较多时间和精力用于训练学生的考试技巧以应付考试上,从而影响正常的教学,同时考试排名还给学生、教师和学校带来过重的负担和压力,比如,日本和韩国的小学生的课业负担很重,被喻为“考试地狱”。
我国在考试研究方面的历史源远流长,自推行素质教育以来,对于考试命题的研究也逐渐升温。由于多元评价理论的介入,我们的考试命题也逐渐向多元评价发展。各地区根据自身的实际状况,出现了一些区域性的学业水平考试命题研究,从小学到高中的学业水平考试命题都取得了一些实质性的进展和创新,从对学生学业成就的评价到注重学生的全面发展,进而扩展到对教师和学校等的评价,初步建立起了我国教育评价的理论和方法体系,基本上形成了适合我国国情的教育评价的实践模式。近十年,在津沪等城市,已经在小学信息技术和小学英语两个学科形成了科学严谨的学业水平等级考试。
目前,我国初、高中学业水平考试命题的研究已经取得了一定成效。但小学六年级学业水平考试命题的研究仍是一个重要课题,社会、家长和任课教师也异常关注。我区六年级学业水平考试的命题工作仍停留在传统的、经验型层面,对于命题的科学性的研究还不深入,而且没有形成一个相对理性而又完整的系统。依然是偏重知识技能的考查,还有相当一部分内容属于死记硬背的东西,而对学生的情感、态度、价值观、联系生活实际解决问题的能力等考察不足。