对学生的学习成绩进行评价需要用许多学绩测量手段,评价不仅仅是这些手段的集合,它是一个系统的过程,对于有效的教学有着重要的作用。评价始于对教学目标的确认,止于对目标达成程度的判断。
测验和评价在学校的教学体系中起着重要的作用,它们所提供的信息可用于多种教学决策中。从教学的角度看,评价可定义为确定学生达到教学目标(期望的学习成果)程度的一个系统过程。评价是为了描述学生表现的变化,并对这些变化作出价值判断。评价、测验和测量这三个术语是不同含义的概念,但往往容易混淆,因为它们可能被包含在同一个过程中。为了叙述的方便,在此我们就三者的区别分别描述这三个概念的内涵。评价是一个宽泛的术语,它包括获取与学生学业有关的信息的所有方法(观察、表现或项目评价、纸笔测验),也包括对学生学业进步的价值判断过程。测验是评价的一种特定方式,通常是由一组要求在限定时间内完成的题目组成,并在相同的条件下对所有学生施测。不过尽管测验只是评价的一种形式,我们有时还会同时使用这两个词。这个时候“评价”这个词所强调的,其实是那些不会由“测验”一词所联想到的表现或项目评价。测量是指依据特定的规则对测验或其他评价方式的结果进行量化的方法和过程(如计算正确回答的数目,给一篇文章的特定方面打分)。
与测量和测验相比,评价是一个更全面、涵盖面更广的术语。测量限于对学生的定量描述,即测量结果总是用数字来体现(如李军答对了40道数学题中的35道)。它既不包括定性的描述(如王丽的作业整洁),也不会有对所得结果的价值判断。评价则不同,它可以包括对学生的定量描述(测量)和定性描述(非测量)两个方面。此外,评价还总是包括对结果的价值判断。用图6-1表示如下:
图6-1
该图体现出评价的全面性以及测量和非测量手段在评价过程中的作用,可以看出,评价不一定要依据测量的结果;当以测量为基础时,它也超越了单纯的定量描述的范围。下面给三个术语的特定含义作一小结:
·评价:在获取关于学生表现的信息时所使用的各种方法的总称。它包括传统的纸笔测验,开放性问题(如论述题)以及对真实性任务的操作(如实验室实验)。评价所要回答的问题是:“个人的表现如何?”
·测验:在相同的条件下,通过施测同一套问题来测量一个行为样本的工具或系统的方法。因为测验是评价的一种特定形式,测验也回答“在与其他人比较时,个人的表现如何”这一问题。
·测量:对个体具有某一特征的程度进行量化描述的方法。测量所回答的是“程度”问题。
一、评价的信息和原则
在实际教学过程中,教师是观察者和决策者。面对数十名学生,教师随时随地在观察着他们:王小明在写作上需要帮助,赵亮应该增加数学练习题量,孙英的外语口音应当矫正等。同时教师要不断地作出决策:一些学生的口头回答情况,某些实验操作的问题,一些通过学生困惑的表情、语调或身体动作反映出的问题等。这些观察和决策都是属于非正式的,它们在有效教学中具有不可或缺的作用。针对学生学业的测量和其他评价方法是为了补充和扩展教师的这些非正式手段,为教学决策提供更加系统、客观的依据。下面列出一些教师在教学中会经常遇到的教学决策问题,括号中还列出了这些问题的最佳测量和评价方法:
·教学计划是否适合学生?(学习能力倾向测验,从前的成绩记录)
·怎样分组才能促使学生更有效地学习?(教师自编测验、从前的成绩记录)
·学生是否做好了接受下一阶段学习任务的准备?(对所需技能的预测、从前的成绩记录)
·学生在多大程度上达到了教学目标?(教师自编测验、课堂作业、提问、观察)
·在满足基本要求后,学生的进步达到何种程度?(综合成就测验、课堂作业、提问、观察)
·什么时候(对哪个知识点)进行复习最为有效?(阶段考试、提问、观察)
·学生有哪类学习困难?(诊断测验、观察、提问、学生成长记录袋、学生咨询)
·哪些学生可以参加咨询、特殊班级或治疗项目?(学习能力倾向测验、成就测验、诊断测验、观察)
·哪些学生缺乏自我了解?(自我评定、学生会议)
·怎样给学生评定适当的分数?(综合所有的评价信息)
·学生的哪些进步是应该告知家长的?(回顾所有的评价信息)
·我的教学效率如何?(成就测验、学生的评定、上级的评价)
这些问题表明了教师在教学过程中需要多种类型的信息。在教学过程中需要回答大量的问题,而且在不同决策间存在一定交叉。对于一个特定的评价情景,会用到多种多样的评价信息。教与学的过程中包含一连串关联的、以促进学生的学习为目的的教学决策。我们认为,在很大程度上,教学的有效性取决于那些作为决策基础的信息的性质和质量。
评价是评定学生学习及发展的质与量的全过程,要想使这一过程取得最佳效果,须遵循以下原则:
1.明确界定教学目标。
有效的评价不仅取决于所用的评价方法的技术含量,也取决于对所要评价的东西的仔细描述,这两方面同等重要,缺一不可。因此,在选择或形成评价方法之前,应该具体说明测量自标的特性。在对学生学业进行评价时,就意味着在选择评价方法前明确界定预期的学习目标。作为一个切入点,可以对内容标准或课程目标作总体描述,但为使评价有效,我们必须将这种描述尽量具体化。例如,历史课的内容标准应当是学生“在历史背景下理解思想和文献”。为了给这个标准确定一个适当的评价顺序,教师需要具体回答“思想指什么?”“文献指什么?”“历史背景指的是什么?”“评价学生理解程度的可靠指标是什么?”这些问题,否则无法取得有效评价的效果。
2.评价的方法选取应依其是否适用于所测量的特性或表现而定。
通常选择方法时会考虑客观性、精确性及便利性这几个因素,虽说这些标准也很重要,但与这一主要标准相比仍然是次要的:所选用的方法能否有效测得想要考查的学习或发展目标?在评价学生的成绩时,我们必须使评价任务类型与既定的学习目标间达到良好的匹配。如果学习目标是训练观点的组织和写一篇完整作文的能力,那么就得对不同条件下完成的习作(如随堂作文测试、写作作业和学期论文)进行分析,而这是关于写作方法的选择题所无法代替的。
3.使用多种方法进行综合评价。
对于学校的教育目的中强调的所有学习和发展目标而言,还没有一种工具或方法能够单独挑起评价的重任。选择和简答测验适于测量知识的理解和应用,而论述测验和其他写作任务适合评价学生组织和表达观点的能力。一些需要学生提出问题、从图书馆和网上查找资料或收集数据(如通过访谈或实验室观察)的任务,适于测量学生提出并解决问题的特定技能。观察技术适合评价学生的操作能力及表现的诸多方面,而自我报告技术适用于评价兴趣和态度。因此,要想完整地描述学生的学习及其发展情况,就需要使用多种不同的评价方法。
4.要充分认识到各种评价方法所具有的局限性。
从十分完善的测量工具(如标准化的态度和成就测验)到粗略的评价手段(如观察和自我报告技术),已有的评价方法效果各异。即便是采用现在最好的教育和心理测量工具,其结果也易受多种测量误差的影响。
5.评价本身并不是目的,它只是达到目标的一种手段。
某种评价方法被采用就意味着它一定服务于某种目的。盲目地收集有关学生的信息,是时间和精力的浪费,正确的态度是将评价看成是为教学决策收集信息提供依据的过程。
二、评价的类型与方法
课堂教学的主要目的是帮助学生达到一系列既定的学习目标。一般而言,评价与教学过程的关系体现在以下几个方面。
1.确定教学目标。
不论是教学还是评价,它们的第一个步骤都是确定课堂教学目标即所要达成的学习成果。在一段学习经历结束以后,学生该如何思考和行为?他们应具备怎样的知识和理解能力?他们应该展示出哪些技能?他们发展了怎样的兴趣和态度?他们的思维、感受和行为习惯应该发生怎样的变化?简而言之,我们正在力图达到怎样的特定变化?如果教学成功地引发了这些变化时,学生应有什么样的表现?这些问题都是为了更具体地界定学生的学习目标,并正确引导特定评价的具体过程必须思考的内容。
2.预先评价学生的需要。
一旦确定了教学目标,就应该对学生与预期的学习成果相关的需要进行一些评价。学生具备了进入下一步教学所必需的能力和技能了吗?学生是否已经具备了目标技能或达到了期望的理解程度?在教学开始之前对学生的知识和技能进行评估,以解决这类问题。这些信息能告诉我们怎样帮助那些缺少必要准备技能的学生,为适应学生情况怎样来修改教学计划等。
3.进行恰当的教学活动。
恰当的教学活动指把课程内容及教学方法整合进而在有计划的教学活动中帮助学生获得预期的学习结果。在这个过程中,测量与评价是监测学习进步与诊断学习困难的手段。教学中的定期评价可以提供一种反馈——改正的方式,有助于不断地对教学进行调整以适应学生不同的学习需要。教学过程中的评价可以帮助教师监控和调整教学,例如,教学活动正以解决问题的合作方式进行,教师可能会观察到大部分时间都是某一个学生在发言并操纵着仪器,小组里的其他人只是被动的旁观者,这时教师可出面作些调整。
4.评价期望的学习结果。
教学过程的最后一步是确定学生达到学习目标的程度。根据内容标准和教学目标指明的学生应有的变化,使用适合度量和描述这些变化的评价工具,选择适当的时机施测。对所得数据要尽量作出正确合理的解释,不能扩大或误解。
5.结果的运用。
也许人们会以为学生评价是服务于教师和管理者的需要,事实上评价也会给学生带来直接利益的。正确使用评价手段,能在以下几方面直接促进学生的学习:①告之明晰的学习结果。②树立短期可达到的目标。③提供学习进程的反馈。④为帮助学生克服学习困难并选择今后的学习内容提供有用的信息。
从精心编制的测验和其他评价方式中所获得的信息也可以促进教学。这些信息有助于教师的判断:①教学目标的恰当性及可行性。②教学资源是否运用得当。③教学方法是否有效。由此可见,评价的方法无论是对教师还是对学生都是有帮助的。
评价过程肯定会涉及许多不同的方法,这里我们将提供一个关于评价方法的基本框架,介绍一些基本术语,以利于读者理解。学校使用的许多评价方法可用多种方法进行分类和描述,下面的基本术语尤为常见:[1]
评价性质:最佳表现(一个人能做什么)
典型表现(一个人要做什么)
评价的形式:客观题测验(学生从备选项中选择答案)
复杂表现评价(学生建构出扩展性答案或执行复杂任务)
在课堂教学中的用途:安置性评价(测量准备状态)
形成性评价(监测学业进展)
诊断性评价(查明学习问题的成因)
总结性评价(测量课程的最终效果)
解释结果的方法
·常模参照(用学生在某个给定群体中的相对位置描述其表现)
·标准参照(在界定清楚的有限的学习任务范围内描述学生的表现)
现在我们按照这四种分类详细描述每种方法的作用和功能。
(一)最佳表现与典型表现
根据测量的性质,测验和评价方式可分为两类:对最佳表现的测量和对典型表现的测量(Cronbach,1990)。前者用于确定一个人发展的能力或成就,即在鼓励学生尽可能取得最好的成绩时,个体所能作出的最佳表现。此类测验结果表示出当作出最大努力时个体的水平,能力倾向测验和成就测验就属于这一类。这两者的区别主要指测验结果的使用,而不是就测验本身的性质而言。能力倾向测验主要用于预测个体在将来的学习活动中的成功,成就测验则用于度量个体在过去的学习活动中成功的程度。虽然成就测验的目的是测量“最佳表现”,但只有当学生确实尽到最大努力时,这一目的才能真正实现。如果学生没有这样的动机,此类测验的结果显然会低估了其最佳表现水平。因此最佳表现这一概念只是评价意图而已,不是指能够从学生的分数中得出的可靠结论。
后者由那些测量一个人典型表现的方法组成。这一类方法关心的是个人“将做什么”,而不是“能做什么”。用于评价兴趣、态度、适应性和各种人格特征的方法都属于此类。虽然对典型表现的评价是学生评价的一个非常重要的领域,但实际使用中存在颇多困难,因测量工具有局限性,必须在同时使用其他手段(面试、问卷、自我报告和观察技术等)的情况下,教师才能对学生在这些方面所取得的进步和变化作出较为准确的评价。
(二)客观题测验和表现性评价
近十多年来,选择题已逐渐成为我国标准化考试中最普遍的形式,因为选择题和各种客观题(如判断题、匹配题)能够使学生在短时间内对较多题目作答而具有高效率。同时这些题型可由电子计算机统分,评分客观,一定时期内的高信度以及低成本高效率是这类题型的主要优点。然而这类题型的缺陷也引起了广泛的批评。首先,选择题测验过于倾向强调事实性的知识和低水平的技能,而忽略了较高层次的解决问题能力和思维能力;其次,这种测验对教学的导向是错误的,它使教学倾向于对零散事实的机械记忆及低水平技能的积累,而不是鼓励学生自己去建构知识,重视自己的理解。
20世纪90年代以来,西方兴起了表现性评价的改革潮流。这种评价方法以扩展性任务和对学生的复杂行为表现的分析为基础,努力反映长期的教学目标。要求学生解决课堂之外的一些重要问题,或者让学生按照自己认为正确的方法来操作。这类题型包括短文写作,扩展性回答的数学题目、在实验室进行科学实验,一件艺术品的创作、口头表达、设计和作业展示。与选择测验相比,显然表现性评价的施测和评分都要费时费力得多,它要求教师具有高度的专业知识并接受过专业训练。所以,评价学生的成就,客观题测验和表现性评价都是有用的,可以综合使用。
(三)安置性、形成性、诊断性和总结性评价
这种分类是依据测验和评价方法在课堂教学中的用途进行的,这种用途是以在课堂中使用的时间顺序而确定的(Airasian&Madaus,1972):安置性评价(在教学开始时确定学生的表现)→形成性评价(在教学过程中检测学生的进步)→诊断性评价(在教学过程中诊断学习困难)→总结性评价(在教学结束时评价成就)。
1.安置性评价。
与学生开始时的表现有关,主要关注以下问题:①学生是否具备了进行下一步学习所需的知识和技能?具体如学生的阅读理解能力是否已达到了能够独立阅读一个历史课单元的水平?或者,刚刚开始学习代数的学生是否熟练地掌握了关键的几个数学概念?②对于下一步教学目标中的理解能力和技能,学生已经发展到了何种水平?如果学生的理解能力和熟练程度已经很高,就表明可以跳过某些单元或以更高级的课程代替。③学生的兴趣、学习习惯及个性特征是否表明一种教学模式比另一种更适合(如小组教学与个别学习相比)?回答这些问题需要运用各种评价手段,如以往成绩的纪录、对课程目标的预测、自陈量表、观察技术等。安置性评价的目的就是确定每个学生在教学进程中的位置,以及最有效的教学模式。
2.形成性评价。
用以监测教学过程中的学习进展,其目的是为学生和教师提供是否学会了、学得怎样的反馈。学生获得反馈可以强化其正确地学习,发现具体的学习错误以及需要改正的错误观念。教师得到反馈可以调整教学,更好地指导小组和个人的学习过程。形成性评价主要由每个教学部分(如单元、章节)准备的测验和评价。由于形成性评价直接用于改善教学,其结果不用分数表示。
3.诊断性评价。(www.daowen.com)
这种评价专业性很强,主要针对反复出错的学习困难的问题展开,而这些学习困难是形成性评价所不能解决的。打个比方,形成性评价为简单的学习问题提供急救性治疗,诊断性评价则寻求急救性治疗不能奏效的根本原因。因此,诊断性评价更加全面和细致,它不仅要使用特殊的诊断测验,还需要运用多种观察技术。诊断测验的目的就是查明那些持久的学习问题的成因,并制定矫正计划。
4.总结性评价。
通常在教学课程(或单元)结束时进行,用以确定教学目标达成的程度。主要是给学生的表现打分,或证明学生对预期的学习目标的掌握情况。
三、期里学习成果的教学目标
我们在教学中期望得到什么样的学习结果呢?知识、理解、应用、思维能力、操作技能还是态度?显然,确定期望的学习成果是迈向高质量教学的第一步,而且对评价学生的学业也具有很重要的意义。合理的评价需要尽可能直接地将评价方法与期望学习成果联系在一起。作为学习成果的教学目标是什么样的?下面我们以一实例为据叙之。
中学生物课程中有学会使用显微镜的内容,当教学目标被表述为所要做的活动时,往往陈述为“向学生示范如何使用显微镜”。虽然这样的陈述清楚地指出了教学活动,但没有说明预期的学习成果,而且也没有明确指出最适合的评价类型。从字面上看,当教师做示范后,目标就已经达成了,而不管学生是否学会。如果我们能说明期望学生在教学结束时能够做些什么,则是确定教学目标的更好方式。例如,我们期望在示范了如何使用显微镜后,学生学会使用显微镜识别细胞特征的技能。这样的陈述直接关注学生以及期望学生表现出的学习成果。因此,注意的焦点由教师转向了学生,由学习过程转向了学习结果。这一焦点的转换使教学的意图更加明晰,并且为评价学生的学业作了准备。界定清楚的学习成果指明了能够作为教学成功证据的学生的表现类型。
从学习成果的角度看待教学目标时,关注的是结果而不是过程。这并非意味着学习过程不重要,相反,在写论文时,如写标题、列提纲、打草稿、修改等过程都是十分重要的。但长期的教学目标责任制关注学习结果,即完成后的论文写得怎样。仍以生物学习为例,见图6-2:[2]
图6-2 学习经历与学习成果的关系
该图显示了教学目标在教学情景中的作用的三个要点。
第一,目标确定方向明,使用学习成果表述教学目标时,能明确具体课程内容的知识范围。注意图中“学习细胞的结构”与掌握了“细胞结构的知识”两种表述之间的区别。内容(学习细胞结构)列在过程一栏里更合适,因为它是实现目标(掌握细胞各组成部分的知识等)的手段。
第二,考虑到成果(知识、技能和能力)对课程内容不同的依赖程度。“细胞各组成部分的知识”与一节生物课的内容联系最紧密。“使用显微镜的技能”和“撰写科学观察报告的能力”与更加丰富的课程内容相联系,这些内容都可用于实现这两个目标。
第三,目标的复杂程度可以有不同。如图中第一项学习成果“细胞各组成部分的知识”是具体的、易于实现的,通过简答题或选择题很容易就能测到。最后一项学习成果“撰写科学观察报告的能力”就更一般了,不可能在一堂课中完全实现,而且对这一成果的评估比较复杂,需要对学生的表现进行分析判断。
(一)学习成果的类型
在学校教育实践中,学习成果是多样的,因此需要考虑将其进行分类,从而将教师的注意力转向在许多领域内学生行为是如何变化的。分类可以有不同的方法,下面提供一种供大家参考的分类范围。
·知识:术语、具体事实、概念与原理、方法与程序。
·理解:概念与原理、方法与程序、书面材料、图表、地图及数据、问题情境。
·应用:实际的信息、概念与原理、方法与程序、解决问题的技能。
·思维能力:批判性思维、科学思维。
·一般能力:实验能力、操作能力、沟通能力、计算能力、社交能力。
·态度:社会态度、科学态度。
·兴趣:个人兴趣、教育兴趣、职业兴趣。
·审美:文学、艺术及音乐、社会与科学成就。
·适应:社会适应、情感适应。
以上每一大类中的更具体的划分不是绝对的,可以根据不同学科和需要而确定。还有一种分类方法是依据认知学习心理学的理论首先建立认知范畴(知识成果、智能与认知技巧)、情感范畴(态度、兴趣、审美和适应模式)和运动技能范畴(知觉和运动技能),其次在每一大类下划分出亚类:知识、理解、应用。先从相对简单的知识成果开始,所需的智能的复杂水平逐级上升,列单如下:
(K=知识 U=理解 A=应用)
阅读
K:认识生词
U:阅读并理解
A:阅读以获取信息解决问题
写作
K:理解写作的方法
U:理解写作中的语法规则
A:通过写作表达自己的想法
科学
K:适应术语和事实
U:理解科学原理
A:将原理应用于新的情境
社会研究
K:了解关于社会问题的有关信息
U:理解社会问题的成因
A:运用批判性思维看待社会问题
(二)表达学习成果的教学目标
用学习结果而非学习过程来表达目标,说来容易,做起来就难了。通常教师过分关注课程内容和不断进行的教学过程,导致难以把注意力集中到学习成果上来,这是教学习惯使然。如果我们真的能够做到总是从知识、理解、技能、态度等方面来思考“在课程或学习单元结束时,学生能够做哪些在学习开始时他们不会做的事情”这一问题时,我们毫无疑问地已经学会了使学生的表现成为教学关注的中心。那么如何才能更好地用学习成果来陈述教学目标呢?
具体说有两个步骤:
·将总的教学目标表述为期望的学习结果。
·在每一个目标下,列出具体的表现行为。例如:
1.理解科学原理。
1.1用自己的语言叙述该原理
1.2识别出该原理的实例
1.3陈述由该原理推论出的合理假设
1.4运用该原理解决新问题
1.5在两个原理间作出区分
1.6阐明两个原理之间的关系
假如期望的学习成果与理解有关,那么总的目标就由“理解”一词开头,因为由动词开头有助于将注意集中于所期望的成果。在陈述中不要加入任何不必要的词,诸如“学生应当能够表现出他们的理解”这样的冗余说明。对于列在总的目标之下的具体学习成果,则要牢记以下几点:
第一,每个陈述由动词开头。该动词是具体的并且代表着明确的可观察的反应,即那些可被外在观察者看到并评价的反应。描述、识别、陈述、使用、区别、理解,这些动词都代表了可观察的学生表现,可用于表述具体的学习成果,而像意识到、明白、相信等比较含糊的词要少用。
第二,对科学原理的理解可以有许多具体的表现方式,这种具体学习成果的表述建议不要从以下角度陈述:
·教师行为(如“教学生学习关键概念”)
·学习过程(如“学生学习概念的含义)
·课程内容(如“学习几何图形”)
·两个目标(如“学生知道并理解概念”)
而要使用学生表现或教学结果进行陈述:
1.知道概念的含义
1.1识别概念的定义
1.2识别符合特定描述的概念
1.3将概念与图片相匹配(如几何图形)
1.4将一个概念与另一个进行区分
1.5将该概念运用于一个日常情境中
第三,注意陈述具体的学习成果时不要夹杂具体的课程内容。目标系列不是列出需要理解的科学原理,而是要说明可作为理解证据的学生的表现类型。在陈述中除去具体的课程内容,这样在不同的学习单元中就可以使用相同的学习成果系列。例如,学习的是“力和运动”这一单元,那么将上述学习成果系列套用在这一具体的学科内容上,就写为:理解力和运动的原理:用自己的话陈述力与运动的原理,识别该原理的应用实例⋯⋯
(三)解释学习成果的陈述
在陈述具体的学习成果时,如果每项陈述都由一个动词开头,且该动词代表的是确定的、可观察的反应(如识别、解决、沟通),那么表述起来就会更容易,更能清楚地传达教学意图。每个具体学习成果都与它所定义的一般目标直接相关。比如“写出课本中对一个原理的定义”这样的陈述,就适合列在“了解原理”而不是“理解原理”之下。对于后一个目标,我们需要高于回忆水平的陈述,因为理解意味着在反应时融入新的内容。因此,像“用自己的语言解释该原理”或“运用该原理解决一个实际问题”这样的陈述就更加合适。教学的目的与目标为教学和评价学生提供了基础。它们既不能过于具体,以至肢解了学习活动、只强调了相对简单的知识和技能成果;同时也不能像国家的教学大纲或课程标准那样宽泛概括。出于教学和评价的双重考虑,我们应把期望从教学中获得的学习成果即通过学生教学后的表现类型来界定教学目标。这些学习成果除了外显的知识成果外,还要考虑那些在理解应用、思维能力、操作技能、态度、兴趣、审美和适应性范围内的成果。还应强调的一点是,不论教学目标准备得多么完善,总会有一些预料之外的教学结果出现。因此,教师应在评价课程的学习成果时,将这些预料外的学习成果考虑在内。
[1][美]Robert.Linn等;《教学中的测验与评价》,国家课改项目组译,47页,北京,轻工业出版社,2003。
[2][美]Robert L.L.等著:《教学中的测验与评价》,国家课改项目组译,44页,北京,中国轻工业出版社,2003。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。