语言评价目的——促学为本
Fulcher(2010:93)认为,评价的出发点是评价的目的。因为没有明确的评价目的,测试内容和形式的选择将失去理据。Hamp-Lyons(2016:13)认为现代语言测试与评价的方向之一是关注测试的目的,也就是确保一项测试或评价要适合其目的。当前从测试文化向评价文化的转向,就意味着评价更加以学习者为中心、以学习为中心,在此过程中还应该考虑评价对学生是否带来积极的反拨作用。Hamp-Lyons(2016:20—23)将二十一世纪语言评价的目的取向总结为以下三个方面:(1)以诊断为目的的评价。(2)在诊断基础上的形成性评价或学习性评价。(3)动态评价和学本评价。教师在设计课堂评价时,应该从评价的目的出发,充分考虑评价的诊断功能和促学功能。
参考点二 能明确考虑并说明特定情境中语言评价的目的,最大限度地发挥评价的诊断和促学功能。
4.1 “语言评价目的”条目呈现
☑ 能在开始某项测试或评价设计前就考虑评价的目的。
☑ 知道根据不同的测评目的,语言测试可以分为学业考试(achievement test)、诊断测试(diagnostic test)、水平测试(proficiency test)和学能测试(aptitude test)。
☑ 能意识到语言测评的首要目的是用来收集信息,帮助教师做出决策,改进教学。
☑ 能理解学习段评价(Assessment of learning)、学习性评价(Assessment for learning)和学习化评价(Assessment as learning)的内涵和作用。
☑ 能充分认识到课堂评价有促学作用。
☑ 知道形成性评价不仅仅是评价手段,而且是能够促进学生学习的课堂活动。
☑ 能认识到形成性评价中的“形成性”指的是使用所收集的信息调整教学和学习。
☑ 知道如何创造条件使形成性评价的效果最大化。
☑ 能意识到终结性评价同样具备形成性的潜力。
☑ 能根据目的,设计课堂中语言的诊断性评价。
4.2 “语言评价目的”部分条目解读
在对“语言评价目的”条目进行解读之前,笔者认为有必要对课堂内外的语言评价方式做一个简要的概述。Turner和Purpura(2016)的框架对此作了全面的讨论。课堂外的评价有分级考试、标准化的学业考试、水平考试和学能考试。课堂内的评价则可以分为学习前、学习中和学习后的评价。有的是计划性的评价,如小测验、单元测验等或者教师设计的提问等。此外还有教师在课堂中即时的评价。这些多种多样的评价方式为学生的学习提供了多种可能性,教师经常要思考的问题是:这些评价方式在多大程度上能够为学生提供促学的机会,并根据不同的评价目的积极地利用好这些评价方式。

图4.1 课堂内外的语言评价(改编自Turner & Purpura,2016:264)

❑ 能在开始某项测试或评价设计前就考虑评价的目的。
表4.1 语言测试的分类
测试目的
Alan Davies根据语言测试的不同用途,对语言测试的类别做过这样的论述,“we speak of Proficiency (Aptitude) for or in something to do something else; we speak of Achievement (Attainment) in something by itself; and we speak of Diagnosis of something. Thus in this usage Proficiency (Aptitude) tests the student's present ability for future learning. Achievement (Attainment) tests his present knowledge as indicative of past learning, and Diagnosis is the teacher's concern of what has gone wrong”(1968:6—7)。他从测试的时间点和内容角度,将测试分为四种类型(上文中水平考试和学能考试为两种不同类型的考试),如果用X代替测试,箭头表示时间,四种类型的测试如下图所示:
学业考试(Achievement):←X
水平考试(Proficiency):⇠X→Y
学能考试(Aptitude):(X)→X
诊断考试(Diagnosis):←X→
需要说明的是,水平考试因为不与特定的课程大纲衔接,所以采用虚箭头,而它常用于预测超出语言本身目的的语言技能,所以用了Y。学能考试中的(X)则代表通过一语技能来预测其他语言技能中的不确定性。
Bachman认为语言测试可以根据最终的决策来进行分类。他的论述是“we can speak of selection, entrance, and readiness tests with regard to admission decisions, placement and diagnostic tests with regard to identifying the appropriate instructional level or specific areas in which instruction is needed, and progress, achievement, attainment, or mastery tests with respect to decisions about how individuals should proceed through the program, or how well they are attaining the program's objectives”(1990:70)。

❑ 能理解学习段评价(Assessment of learning)、学习性评价(Assessment for learning)和学习化评价(Assessment as learning)的内涵和作用。
表4.2 Assessment of learning, Assessment for learning, Assessment as learning
学习段评价(Assessment of learning)长期在学校评价中占据主导地位。它的目的是终结性的,旨在证明学习成果,向家长及学生汇报在校取得的进步,通常会提示学生成绩在同伴中的相对位置。学习段评价的时间节点通常在单元、课程、年级、学段、项目的结尾。通常采用考试的方式,试题基于学段内所学的内容。学习段评价的结果通常以分数和字母等级来表示。(Earl,2013:29)
学习性评价(Assessment for learning)是针对学习段评价提出的。它从终结性评价转向形成性评价,从做出判断转向描述学习以服务于下一个阶段的学习。它给教师信息,让他们调整教学和学习活动,让学生个性化地参与学习。虽然它认为学习有可以预测的类型和路径,但是更加注重每位学生个性化的学习。从细心设计的评价中获取的信息以及针对评价过程的反思能用于决定学生知道了什么,还能用于了解学生如何、什么时候以及是否运用所知内容,以便让教师能够更好地进行针对性教学。在学习性评价中,教师为不同的目的收集一系列数据,设计的评价任务如一扇窗户,可以洞察学生学习,并为下一步教学提供依据。选用的评价手段可以包含课堂观察、作业、课堂提问、教师学生会谈等。教师收集的信息不是为了评分或者比较学生,而是为了强调每位学生的优点与缺点,并给予反馈,以便后续学习。在学习性评价中,教师运用他们对学生的了解、对评价环境的了解和课程目标来确定特定的学习需求。学习性评价发生在学习的过程中,并多次发生,它是互动性的,教师会在评价中给予学生协助。它帮助教师提供反馈来支撑学生下一步的学习,也依靠教师的诊断技能来实现其促学效果。(Earl,2013:27)
学习化评价(Assessment as learning)是学习性评价的次类。它强调将评价看作是培养和支持学生提高元认知的过程。学习化评价的重点在于强调学生的角色,把他们看作是评价和学习过程的重要联结者。在学习化评价中,学生作为积极的思考者,理解评价信息,将之与先有知识进行联系,用之建构新的学习。这就是元认知中调控式的过程。它发生在学生自己监控学习内容,并使用监控获得的反馈来做出调整、修正,甚至带来所知的重大变化中。当教师采用学习化评价时,他们运用课堂评价这个工具帮助学生培养和训练必要的技能来成为批判思维者,习惯于反思和评判性地分析学生自己的学习。在学习化评价中,评价产生的结果记录是个性化的事情。学生和教师共同决定重要的学习证据,如何组织这些证据,并把它作为协助学生学习的工具。学生习惯性地反思他们的作品,判断他们如何可以基于所学推进下一步的学习。与他们比较不是他们的关注点,相反,关键的参考点是学生先有的作品和所带来的学习灵感,以及持续学习的目标。(Earl,2013:28—29)

图4.2 评价范式的转变方向
表4.3 学习段评价、学习性评价和学习化评价的特征

(改编自McMillan,2014:19)
表4.4 学习性评价的七大策略
我去向哪里?
策略1:为学生提供清晰和可理解的学习目标。
策略2:使用优秀作品和较差作品的例子和模板。
我在哪里?
策略3:在学习过程中提供持续的描述性反馈。
策略4:教学生自评,并为下一步或下几步学习设定目标。
我能如何缩小这个差距?
策略5:使用学生学习需求的证据来确定教学的下面步骤。
策略6:设计聚焦型教学,提供练习和相应的反馈。
策略7:为学生提供机会来跟踪、反思和分享他们的学习进步情况。
(改编自Chappuis,2015:11)
表4.5 学本评价或学习取向型评价(learning-oriented assessment)
学本评价或学习取向型评价(learning-oriented assessment)由David Carless提出。它的核心观点是将学习放在首要位置,聚焦评价的学习性特征并倡导此类评价的开发。(Carless,2007)学本评价能够发现和决定教师和学习者可以运用评价以及评价收集到的信息来指导和支持学习过程。学本评价的理论框架如图4.3。评价从目的开始,主要包含认证目的和学习目的。两个交叉的圆圈则代表两种评价之间存在重叠部分,一项好的认证目的的评价也应该有促学功能。下方的三个要素则体现了学本评价的三个重要原则:(1)评价任务的设计要能刺激学生展开更好的学习实践,也就是评价任务即学习任务;(2)让学生积极地参与到评价中,对评价标准、高质量作品、自己的表现和他人的表现均有深刻的理解;(3)反馈应该是及时的、前瞻性的,能够支持学生目前的学习和将来的学习。这三个原则是统一的整体,受学生和教师对评价理解和体验的影响。

图4.3 Carless学本评价的理论框架
学本评价由Purpura等(2004)引入二语评价领域。它指的是将二语加工和二语学习结果置于首要位置的评价方法。这种评价可以是规划性的也可以是非规划性的,它存在于不同的学习和评价环境中(Purpura & Turner,2013,2014)。学本评价通常指嵌入于教学和学习情境的评价。从学本评价中获得的评价结果可用于如下推断:(1)学习者在教学或评价情境中表现出来的二语知识、技能和能力;(2)评价结果如何被学习者、教师、同伴、评价者用于评估学习目标,并推进二语处理的目标;(3)从长远看,学习者如何培养出接近目标的二语表现能力。学本评价一方面认为二语学习是个性化的、认知的过程,另一方面,从合作学习和评价这个视角看,它又是社会认知和社会文化过程。学本评价强调了外部标准、课程、教学、学习和评价之间的共生关系,关注这种共生关系对于理解学习者表现、参与、学习过程和学习成果起到的作用。
Turner和Purpura(2016:261)提出了学本评价的工作框架,如图4.4。情境维度包含宏观层面的社会政治和社会文化因素,也包含微观层面的因素,如教师的个人经验和喜好、课堂决策、课堂文化以及学生的特征和参与热情等。测试维度包含不同人员收集学生表现样本,并做出反馈的过程。其中有规划性的(如小测验),更多的是即时性的(如教师课堂提问)。上文图4.1展示了课堂内外的评价方式。水平维度指的是二语能力模型,它要求教师对语言要素(如形式、意义、使用)和语言技能有深刻的认识,还要求教师对语言习得的过程有深刻了解,并掌握学科教学知识,懂得如何将对语言的理解呈现给学生。此外,教师还应该对二语评价所涉及的话题内容知识有所了解。学习维度指的是对学习者如何处理信息而后实现学习的过程的理解。这会影响到学习与评价是如何被看待和实施、表现是如何被解读、推断是如何被用于提供反馈进而帮助学习的。此维度还包含对反馈的作用的理解以及如何让学习者实现自我调控、管理自己的学习。教学维度指的是教师的二语内容知识(对语言的理解)、话题内容知识和学科教学知识。互动维度聚焦课堂中的互动交谈,它多为非计划性的评价活动,考查不同程度的介入(如简单评判、暗示或详细的讨论沟通)对学生意识到与学习目标的差距有怎样的辅助作用。情感维度考查学生在参与评价过程中所体现出来的社会心理情感。

图4.4 Turner和Purpura的学本评价工作框架
表4.6 动态评价(Dynamic Assessment,DA)
动态评价,又称学习潜能评价(Learning potential assessment),它扎根于Vygotsky的社会文化理论,特别是以该理论的最近发展区(Zone of Proximal Development,简称ZPD)为核心思想,强调中介(mediation)和干预。在动态评价中,评价者与学生互动,探索和发现学生独立解决问题的能力与干预下潜在能力的差距就是最近发展区,学习就发生在最近发展区中。Lantolf & Poehner(2004)将动态评价分为互动式(interactionist)和干预式(interventionist)两类,韩宝成(2009)总结如下:在干预模式中,帮助的形式是标准化的。它关注评价的“量化”指标:学习的速度指数和学习者迅速有效地达到事前规定的学习目标所需要的帮助的量。在互动模式中,帮助出现在评价者和学习者的互动过程中。干预式动态评价有两种:“三明治式”和“蛋糕式”,前者接近传统的实验流程,先有前测设定基准,然后干预,再由后测验证有效性;后者中的干预贯穿整个流程,如同在蛋糕上涂奶油,提示逐步出现,越来越明示,评价者根据评价对象所需要的提示数量和类型确定学习潜能分。韩宝成(2009)认为,动态评价强调互动和干预,强调评价与教学相结合,将传统评价所关注的“结果取向”转变为“过程取向”,侧重于个人认知策略的培训和潜能的开发,通过中介互动探索学生的最近发展区,使得评价本身最大程度地接近了个体的认知发展过程。这种评价模式能有效塑造学生的认知结构。

❑ 能充分认识到课堂评价有促学作用。
表4.7 课堂评价的促学作用
· 课程中改进后的形成性评价实践通常能够让学生的学习成果提升一到两个等级水平。(Assessment Reform Group,1999)
· 与其他影响学习的因素相比,教师使用的反馈是在统计意义上最显著性地提升学生学习成果的因素。(Hattie,2009)
· 教师如何看待和使用课堂中的评价直接影响学生的参与和学习。(McMillan,2013)

❑ 知道形成性评价不仅仅是评价手段,而且是能够促进学生学习的课堂活动。
❑ 能认识到形成性评价中的“形成性”指的是使用所收集的信息调整教学和学习。
表4.8 形成性评价定义
形成性评价定义列举
◇ 形成性评价从根本上说就是将学生当前认识和技能发展反馈给教师和学生,以便决定如何进行下一步学习。(Harlen & James,1997:369)
◇ 形成性评价指的是意在提供关于学生表现的反馈,以促进和加快学习。(Sadler,1998:77)
◇ 形成性评价可以被界定为在教学过程中开展的评价,意在提高教学……形成性评价中的形成性重点在于它可以迅速用于调整,以便促成新的学习。(Shepard,2008:281)
◇ 评价是形成性的,体现在:教师、学习者和同伴收集、解释和使用学生学习成果并做出下一步教学决策的质量要比没有收集这些学习证据时做出的教学决策高,要更有理据。(Black & Wiliam,2009:6)
◇ 广义上说,形成性评价指的是教师和学生集体参与的课堂事件,目的在于了解学生学习、概念组织、长处发现、弱点诊断、改进空间,从而为教师提供教学规划根据,为学生深化认识和提高学习成果服务。(Cizek,2010:6—7)
◇ 形成性评价是收集学生学习证据、为学生提供反馈、调整教学策略以促进学生学习成果的过程。(McMillan,2014:93)
◇ 形成性评价是规划的程序,在这个程序中通过评价收集学生学习情况的证据,这些证据被教师用来调整他们的教学程序或被学生用于调整他们目前的学习策略。(Popham,2017:408)
◇ 形成性评价指的是教师和学生运用正式或非正式的程序收集证据,用于指导下一步的学习。(Chappuis,2015:3)

❑ 知道如何创造条件使形成性评价的效果最大化。
表4.9 形成性评价效果的最大化条件
◇ 与教学关联。评价工具或事件与课程内容紧密关联。所有的题目或任务均与教过或即将要教的内容匹配。
◇ 为教师提供诊断信息。评价工具或事件能提供有关细节的准确信息,以便让教师能够知道如何采取行动,对谁采取行动。
◇ 为学生提供诊断信息。评价工具或事件能为学生提供详细的信息,告知学生哪些学习目标已经达到,哪些还需努力。
◇ 反馈要及时。
◇ 行动及时。师生均有时间切实基于结果采取行动。
(Chappuis,2015:5—6)

❑ 能意识到终结性评价同样具备形成性的潜力。
表4.10 终结性评价的形成性潜力
◇ 备考可以帮助学生巩固和组织知识、练习程序和策略,将知识更加紧密地联系到实际,发展自动性的运用能力,从而对知识有更深的理解。
◇ 参加考试可以让学生长时地在脑中保留学过的内容。
◇ 考试结果可以帮助教师发现学生不足,及时或者在下一轮教学中调整。
(Bennett,2011)

❑ 能根据目的,设计课堂中语言的诊断性评价。
表4.11 诊断性语言评价
定义:
诊断性语言评价就是发现被试或学习者在语言学习中的特定方面或语言交际能力的某些方面的弱点以及优点,并提供准确的诊断性反馈和学习补救措施的过程。(Lee,2015)
特征:
· 更有可能是分立式测试,而不是综合式测试;更可能聚焦特定的元素,而不是整体能力。
· 真实性不如水平测试。
· 通常是低利害或无利害的。
· 焦虑和其他影响表现的因素被严格控制,从而获得最充分的表现。
· 提供即刻的反馈,或尽可能在最短的时间内给出反馈。
· 能用计算机技术改进其实施。
· 可以提供非常详细的分析,汇报题目的具体作答情况。
· 提供详细的反馈,能够被学习者运用。
· 在后续的教学中能够得以补救。
· 更可能聚焦语言知识而不是语言技能。
· 更可能聚焦“低阶”语言技能,而不是更加综合的高阶技能。
· 得到二语习得的启发,甚或是应用语言学的启发,以及研究的启发。
· 基于刚刚教过的或即将要教的内容,或者基于特定的语言发展理论,尤其是细致的理论,而不是宏观的理论。
(Alderson & Huhta,2011)
典型例子:
DIALANG(https://dialangweb.lancaster.ac.uk/)(Alderson,2005)是一项免费的多语种在线语言诊断测试系统,它能帮助语言学习者了解自己在阅读、听力、写作、词汇及语法方面的水平,提供提高的方法,也能帮助学习者评估和了解自身的语言能力。测试可以分为五个阶段:首先学习者可以选择一项测试,自由组合测试的语种和技能。其次是分级测试,通过真假词的判断为学习者的语言水平粗略定级。再次是自我评估,学习者可以就与其所使用或理解所测语言的能力相关的一些描述做出判断,接着是语言测试。该测试有多种不同形式的题型:有的需要输入答案,有的需要选择一个正确的答案。完成测试后可以迅速得到测试结果。最后是反馈。学习者可以获得语言测试结果、分级测试结果、专家建议和其他有用的信息。也可以根据正确答案查看作答情况,可以了解测试结果的含义并得到有关如何继续提高语言技能方面的建议,还可以查看自我评估的结果及相关信息。下面的例子是笔者抓取的写作诊断测试的一个例子。

该题要求考生从所给的简短的电子邮件中查找语法错误。是从语法的角度来间接考查写作能力,采用的是分立式测试的形式,考查学生在写作中的语法意识。如果学生没有选出C为正确答案,说明他们不知道bus stop前面的介词应该为at,应该采用相应的教学措施来补救这个知识点的缺失。