编制题目及确定测试成绩的解释标准

三、编制题目及确定测试成绩的解释标准

1.编制题目

有了命题计划表,编制各类试题、确定各类试题的实例就有了依据,接着就可以编制试题了。最简便直接的方法是把具体教学目标附加上“条件”或“标准”即可。好的教学目标已经蕴涵了学习结果的检测方法和评价标准,略加改动把条件或标准具体化就变成了试题。

例:教学目标:学生会画垂线和平行线

改为试题:过直线外一点画直线的平行线。

在编制试题时,应注意以下几点:

(1)应将试题中考查的学生行为与目标中规定的条件相匹配。

(2)多少题目量才能确切地反映出掌握了目标。

为了充分证明学生是否掌握了教学目标,标准参照测验必须有足够的题量,测验所包含的试题总数应多到足以在所有内容范围和能力层次方面都有一些试题,这样才能保证测验是教学目标的最理想样本,试卷有较强的代表性。但实际上课堂教学测验还要受其他因素制约,不能完全做到这一点。影响题量的因素还有以下几种:

(1)课堂测验的时间。应有充分的时间让至少80%的学生能够做完所有试题。

(2)测验所采用的题型。采用客观性试题,题量可大一些;采用主观性试题,题量只能小一些。

(3)智力的多元性。由于学生的智力是多元性的,反映能力的试题就应考虑对不同智力方面测验的有效性。这类试题应是带有情境的,是全新的问题,以便检测出学生在不同智力领域研究和解决问题的能力。

(4)学生的年龄和教育水平。低年级的学生阅读计算较慢,题量要少一些;高年级学生反应迅速,题量可大一些。(中学的学生答题时间为老师的3倍,小学低年级更大。)

(5)学生的能力水平。学习能力高的学生分析能力强,掌握教学目标熟练程度高,答题速度快一些;学习能力低的同学分析熟练程度低,思维较慢,答题速度会慢一些。

(6)试题的复杂性。如果试题是阅读材料或编制图表的题,比较费时,题量需少一些。

(7)所测量的目标类型。目标能力层次较低的题,只需学生回忆,所需时间较少,题量可大一些;能力层次较高的题,需要学生将知识运用到新情境中去的题,题量只能少一些。

总之,在上述情况允许条件下,应尽量扩大测验覆盖面。各考核目标层次要求在整体测验中的比例一般说来,考查最低、最高层次试题的比例略小一些,也就是说记忆类题、考查创造性运用或评价的试题比例要小一些,考查理解、应用的试题比例应大一些,是测验的主要部分。

主观性试题的编制技术较容易掌握,客观性试题的编制技术较难掌握,教师还应该根据自己的编题技术实际情况决定采用何种题型。

编制的试题数量应多于测验所需的数量,以便筛选质量合格的用于测试。拼配试卷时,应将各试题的比例再与命题计划表中的比例相对照,以便确定各类试题的科学比例。

2.确定测试成绩的解释标准

一般传统做法是100分为满分的试卷以60分作为判断标准,60分以上为及格。在教育测量学中我们将这一过程叫做设置标准。在标准参照测试中,我们需在施测前设置一个切点分数,以此分数为参照对学生的测验分数作出解释。设置标准就是指建立切点分数的过程。

设置标准的方法有多种,这里列出三种:

(1)由了解测验内容的专家和有经验的教师来判断标准。

判断学生正确回答百分比应是多少,才表明学生达到了最低能力水准。(https://www.daowen.com)

(2)根据试题内容分析设置标准。

考虑到试题内容和难度都会影响标准的设置,所以此法采用两维表格,从试题的内容和难度两方面对试题进行分类:

一维是试题与教学标准的关联性,分三类:实质性的、重要的、一般的;另一维是试题的难度,分三类:难、中、易。见表9-3。

表9-3 试题关联水平难度与数量统计

图示

注:题数指统计出的一个测验属于各类试题的题目数;百分比表示专家判断出的该题学生答对百分之几十才算达标。

具体分析方法:

①将试题逐一归类到方格中,计算出属于各方格的试题数量;

②判断每个方格中的试题,达标的学生至少应答对百分之几十;

③计算切点分数,即达标学生的最低分,计算公式如下:

    X=∑PM X为切点分数

    P为各方格中达标学生至少应答对的百分比

    M为各方格中试题的规定的得分总和

    ∑为P与M的积的连加和

  例如假定上表中的每题为1分,则切点分数为:

  X=∑PM=0.9×6+0.6×10+……+0.1×3=34.8(分)

④如果由多位专家判断切点分数,则要计算各位专家判断的切点分数的平均数,以平均数为达标的标准。

3.根据学生的成绩设置标准

将学生分成较好的(前27%)、中等的、不达标的(后27%)三组,分别统计较好组和不达标组两组该测验的分数,在同一直角坐标系中绘制两组的次数分布多边图,以图中两个次数分布多边形交点的横坐标为切点分数。若交点的横坐标为70(分),则70分为这次达标的分数线。