测试评价

评价量规

2019-02-11  本文已影响9人  静_静_

评价量规(rubric)是一个真实性评价工具,它是对学生的作品、成果、成长记录袋或者表现进行评价或者等级评定的一套标准。同时也是一个有效的教学工具,是连接教学与评价之间的一个重要桥梁。

表现性评价

作为教育评价的专业术语,由于考察的视角不同,不同的人对量规的界定并不一致:Asmus(1999)认为,评分量规是由教师或评价者开发的一种描述性的评分量表,其目的是为了分析学生学习结果,包括学习作品和学习过程。Arter和McTigh(2000)把评分规则界定为准则的一种特定形式——是成文的准则,它对所有的评分点都做了说明和规定。最好的评分规则往往能体现出我们教师公认的课堂评价的实质,而且能对合格表现的组成要素提供很好的建议。评分规则一般会伴有成果或表现的具体例子,以阐明量表上不同评分点。(2001)指出,评分规则是相对核查表而言的,这种评分量表正式地规定了评分指南,它由事先建立的表现准则组成,常常在表现性评价中评估学生的作品。Heidi Goodrich(1996)则将它定义为为一项工作列出标准的评分工具,它包含评价作品的标准或所需的期望,它详细地为各等级(从优到差)质量描述出其标准。

由此看来,评分量规作为表现性评价的评价工具,主要由教师或评价专业人员开发,事先详细地规定了学生所要达到的学习目标的标准,用来评价学生的复杂表现或作品。

量规类型

核查表

最简单的量规类型是核查表,它是一个包含了学生表现的各种特征的简单列表。它们通常用“是”或“否”来判断,或提供一个地方给评价者做记号以表明某种特征的出现。它没有制订关于表现质量水平的判断,这些特征或特性可能呈现出来,也可能不出现。当评价简单的表现时,如同伴观察或学生自我观察,核查表是很有用的。它们也可以用于评价学生日志,因为日志不要求教师对日志内容的质量作出判断,而是要看学生是否按照教师提供的写作提示,表达了真情实感。

核查表相对比较容易编制,也比较容易管理。它们很容易被理解(表上呈现了评价内容的几个特征),因为核查表常用于及时评价,所以也要求简洁紧凑。它们对过程或表现质量(如关键要素)的评价是非常有用的。

运用核查表时,注意的第一个问题是,核查表上的所有元素都是同等重要的,因为它没有用某种方法表明所评价的内容的这个特征比另一个特征更重要。运用核查表时注意的第二个问题是,在最初的学习阶段,没有一种方法能表明哪一个特征会最早出现,除非在表现性评价标准中规定了要有某一个特征的呈现,否则哪个特征最先被检查核实,我们一般无从知晓。最后,核查表几乎不可能用来评定分数等级,因为对于教师来说,只有有了能够严格区分不同能力的每一条评分标准,才能判断学生的分数等级。

分值系统

第二种量规类型是分值系统。它很像一个核查表,但一一个重要的区别是,描述的每一条评分指标都分配了具体的分值,评价者能通过给予更多的分值来表明哪一条评分指标更重要。

如果和核查表相结合,分值系统量规是很容易编制的。因为每条评价细目都指定有分值,所以分值系统量规能用来评定分数等级。描述的每一条评分指标哪一条更重要,能通过赋予更多的分值而得到强调。

当教师运用分值量规评定其中某个特征每条指标的得分时,如果没有描述依据怎样的表现得到某一具体的分值的话,分值系统量规的运用就会出现问题。当试图开发一个更清晰的评价时,教师可能会凭着经验列出几个包含在被赋予分值的表现特征之下的组成部分,如果漏掉某一特征之下的某些要素,教师在标示那个特征的分值时,就已经出现了问题。避免这一问题的方法是采用教师团队的形式,集体开发评分量规。

分析性量规

分析性量规与核查表和分值系统量规不同。它要求评价者对描述的每一条评分指标的质量作出判断。以前,只有当某个特征完全展示出来才给予评分,但现在,只要一个特征和特性的基本面貌呈现出来就可以给予评分了。因为对所描述的每一条评分指标的呈现程度作出判断太费时间,所以一些特征通常采用分析性量规。分析性量规有两种类型:定量的分析性量规和定性的分析性量规。定量的分析性量规用数量表示所描述的每一条评分指标的呈现程度,这个数量应当用词和短语来界定,这样,这个数量就更有意义,关于这个数量表示什么能给评价的人一些暗示,这样也就能提高可靠性。定性的分析性量规用言语描述不同的水平,虽然任何水平都能用数字描述,但通常这只是一个数字。而运用定性的分析性量规,评价者被迫对表现质量的水平作出决定,而不是简单地判定中间分数。

分析性量规在形成性评价中是非常有价值的,学生能看到它们的表现是怎样被当作所描述的每一条评分指标评定的。这种描述和定性的分析性量规结合,能提供给学生提高学习水平的机会,让他们看到进入下一个水平必须做什么。因为学生知道评分的标准,他们能进行自我评价,这样通常能激励学生努力学习,进入高一级水平。

但分析性量规很难用于评定分数等级。例如,在一个分析性量规中确定有四个特征,如果一个学生在两条评分指标上得到2,在一条评分指标上得到3,在最后一条评分指标上得到l,它是很难转换成分数等级的。分数等级不应基于所有得分平均数,因为这四个特征并不是同等重要。

整体性量规

整体性量规也是用言语描述表现特征的评价标准。相对于分析每一个特征并单独地给予评分,整体性量规把学生的表现看作一个整体,给表现和结果(作品)判定一个单一的得分。整体性量规为量规的每个水平编写了一段包含有不同特征的描述,所有的表现特征都达到某一质量水平,才能得到该水平的得分。如果一条或两条评分指标没有达到该水平,只能给予低一级水平的得分。

整体性量规典型地用于总结性(终结性)评价,评价后学生没有机会返回并改进自己的表现。它们通常适用于学期结束时的期末评价,或只需给予单个得分的分数等级评定。正因为只需作出单一的判断,所以,它们比分析性量规使用起来更加快捷。

使用整体性量规的不足之处在于学生很少处在每个特征或所描述的评价细目的单一的水平之上。对教师来说,当他们知道学生的部分表现实际上已处于高一级水平时,很难给予学生低一级水平的得分,这不太真实、也不太公平。整体性量规对学生解释起来也较困难,当学生得到一个分数时,他们不知道自己的部分表现是否已高于所给予的得分,这就是整体性量规通常不用于形成性评价的原因。

量规建议

开发学生学业评价不是一项单独完成的简单的任务,在一个小组中工作,能得到更多的观点和意见,小组中出现的不同意见的争论,当通过妥协而解决时,有利于形成更完美的评价。下面的建议有利于帮助教师设计学生学业评价。

开发适用于同类内容的概括化程度高的评价

与任务具体的评价相比,使用概括化程度高的评价只需要编写少量的几个评价即可,并且,这意味着只要编写少量的量规。教师可以选择某一种类中的内容、活动来教重要的概念,这样可以避免教每项内容或活动(因为学科内容多而课时少)。当学生聚焦于某类内容或活动的关键组成部分时,教授并强调概念,少教而多学。通过这种评价,学生能看到知识内容分类间的联系,能帮助学生理解同类知识、技能的基本特征,产生迁移,学生会学得更有效。

用一种评价达成多条课程标准

开发学生学业评价时,不需要为每条课程标准开发不同的评价,开发的评价任务和量规应尽可能多地包含多条标准。例如,当呈现一个作品时,学生能展示动作技能方面的能力、认知性知识、与他人的关系、以及对这项内容和活动的乐趣。一个户外教育中的颠峰活动能从不同行为现场提供评价多条标准的相同机会。使用少量具有深度的评价意味着教师只要管理少量的评价,完成少量的文书工作,节省用于评价的时间。

在教学过程开始之前开发评价

在过去,教师等到教学活动完成以后才开发评价,评价往往基于所教授的内容、活动、练习的时间来开发。而在基于标准的课程中,评价基于标准来设计,然后基于评价选择内容和活动,所选的内容和活动将允许学生展示在某条标准上的能力,而不是在某个内容或活动上的能力。这对教师来说代表了一个巨大的范式转型,但当课程使用这种方式评价时,学生的学习会更好地与课程标准保持一致。

采用适用于学习过程的评价

评价可以从两方面来审视:为了学习而评价和对学习结果的评价。为了学习的评价通常与形成性评价联系在一起,它的意图是促进学生的学习。教师可以用形成性评价来判断学生已经学会了多少,然后规划下面的课程和教学。在基于标准的课程中,学习是很难与评价区分开来的。安排一个特定的表现性任务或练习,它既是要学习的课程内容、学习活动,也是一种评价。为了学习,学生要积极地投入这项学习活动,同时他们也展示了知识、技能、体能、态度、方法以及与他人的关系。在这里,评价是学习经验,而学习经验因为相伴的评价量规而成为评价。

确信学生知道你将怎样评价

没有理由把学生蒙在鼓里,不让他们知道你要评价什么、你将依照什么标准来评价。提前给予学生评价内容和评价标准,他们可以为此早作准备。许多教师担心,这又将成为考什么教什么学什么,wiggins(1989)指出,如果这个考试是有价值的、值得学生去花时间的,这不成什么问题,关键是你考些什么,是否能达成标准。

上一篇下一篇

猜你喜欢

热点阅读