目的
帮助教育工作者从以学习为目的的评估角度,重新思考自己的评分、反馈和评价方法。
我们需要以学习为目的而设计的评估,而不是用来进行指责、排名和发证的评估。这反过来要求家长们、教育工作者们和学生们自己,都在对测试与学习的态度上,做出深层转变。有些地方,这样的态度转变已经发生——在那里,我们看到了令人振奋的根本性转变和新能力的成长。下面是让这样的转变成为可能的一些原则和修习。
在进行之前,先反思一下:在你过去的生活中,评估(分数、反馈,或者是评价)确实对你的学习产生作用的一次经历。这样的经历具有什么共同特征?
我在不同的修习营中,多次问过这个问题(事实上,这是一个非常好的问题,可以启发一组教师和管理人员展开深入讨论)。最好的评估,很可能并非发生在学校里。我个人最喜欢的经历发生在一个剧团里。一位大导演特别给我和其他一些演员安排辅导,对我们表演中的一些细微之处给予深入、持续的反馈。
在这些修习营中我们发现,有一些相同的特征多次出现,是大家记住的这些评估的特点。
及时
在当下这个沉溺于即时满足的时代里,及时反馈的重要性尤其显著。如果学生们在测试过去相当长时间之后,才收到对自己功课的反馈,他们恐怕已经在做新的功课了,不会再关注已经完成的功课。无论是标准测试,还是根据课堂表现进行的评估、反馈,时间越近,也就越有意义。当老师们不得不在某一门高中课程中教120名学生的时候,及时反馈非常困难。学校的时间安排,需要进行相应的设计,使得老师们可以有固定的时间,与学生们坐下来面对面讨论,对学生进行评估,并对他们的功课给出反馈。
坦诚
评价对于学习者的挑战是,他们要根据自己提供的数据,做出改变。面对这些数据信息,有时相当困难,说到底,如果大家不认真对待这些数据,他们也就不需要做出改变。然而,一次坦诚的评估,往往可以创造出一种认知上的差异状态,或者是非平衡状态,这就会让人们去面对变革的要求。
我知道加利福尼亚的一个学校系统,在推行“更高的学术标准”的过程中遇到了障碍。他们提高了学习达标的门槛,要求学生迎接这个挑战。考试成绩总体上提高了,但是也有一组学生总是不达标。为了解决这个“最后的遗留问题”,一个小组的老师申请了“改进授课”的项目资助。出资机构问这些老师,为什么需要这笔钱——“大多数学生不是都做得不错吗?哪些学生做得不够好呢?”
最初,这些老师无法回答这个问题。这个问题的答案让他们感到极不舒服,他们也就从来不去讨论,即便到了现在,他们也还是不愿意正视这个问题。这些评估把男性非洲裔美国学生筛选了出来,成为成绩表现最糟糕的单一群体。由于这些教师不得不面对这些数据,于是他们决定,要做一点儿以前从未考虑过的事情——对这些学生进行访谈,了解他们的建议。
结果出乎这些老师的意料,因为这些学生也非常懊恼。他们明白学校希望有更高的标准,而且他们也热切期望达到这些标准,但他们不知道怎样做。这所学校安排功课,一直是将“任务教学”作为基本的假设:如果你把一项挑战性的任务分配给学生,他们自然就会去面对挑战。这些孩子明白自己需要什么,他们希望从较容易的材料读起,他们希望在阅读的过程中有成年人陪伴,他们希望有自己的“阅读讨论”时间。在这段时间里,他们可以讨论自己正在阅读的内容,而且没有那些学习成绩更好的同学给他们带来压力。他们觉得,自己的家长并不理解学校的新要求,而他们又希望家长参与进来,更紧密地与老师配合。他们还希望看到更多成年人的榜样,让他们看到如何在要求高、压力大的工作负担下,找到出路、获得成功。从本质上说,他们希望有人指点迷津,帮他们指出其他学生似乎已经了解的学习途径。
这些学生和老师坐下来,一起重新思考他们要采用的方法。他们首先为那个资助项目撰写建议书,但是这一次他们建议对教育中的长期做法进行变革——如果他们不是出于那些“令人不快”的数据信息而相互学习的话,无论如何也想不到这些变革。
反思
教育工作者往往把“反馈”看作一个循环过程,如下图所示。
但是,如果把这个过程画成是螺旋上升的进程则更为准确,因为这个过程不会把学习者持续带回到同一个起点。
当我把这样一个螺旋上升的图在一个研习营中展示出来的时候,一位教师说:“我们喜欢这个图,因为它支撑了我们相信的一个道理:‘任何值得去做的事,即便出师不利,也值得去做。’”
我回答说:“这的确不错——但是,什么时候你们会拿出时间,了解自己从出师不利中学到了什么呢?”老师们大都没有安排时间,让自己的学生(或者自己)反思自己的评价。这就意味着,他们都没有机会进行元认知的工作——大家一起退后一步说:“好了,在过去两周里,我们从这门课程里学到了什么?”
每一位教师都可以建立一个系统,让学生们评估自己——同时仍旧满足在教育系统中获得进步的社会要求。但是,每一门课程都需要一个全然不同的设计。教师们可以从思考以下三个主要问题开始:
·自我管理(Self-management):学生们怎样计划和组织自己的学习?他们如何设定自己的目标,如何确定在学习过程中他们期望达到的阶段目标?
·自我评价(Self-evaluation):学生们怎样评价和评判自己的功课?他们如何评判同学的功课,并对视角的差异进行反思?
·自我适应(Self-adaptation):学生怎样根据自己获得的反馈调整做功课的方法?他们如何才能为学习做最好的准备?
这样的反思大多是在教师们组织的会议上进行的——与学生一对一进行,与学生小组共同进行,以及和家长一起进行。确定时间相对容易,比较困难的是要认真关注学生们要说什么,并且在教师设计教案的过程中加以思考。
在此之前,分数是一种以教师的权威为依据的判决。学生们也学会了如何通过取悦教师,获得高分。实际上,教师已经用分数告诉了学生,他们是否在学习。
但是,当学生自己评估自己的时候,分数成了一种评价过程。学生们对于自己的进步,做出自己的判断。最终,这种状态会大幅减轻教师的压力,但是这也需要很大的努力,才能适应。
一个孩子到了17岁的时候,就可以承担起责任,并且具备了相关技能,向家长展示自己获得的评价:成绩单、作业以及各种目标。这向每一个人——教师、家长和学生,传递了一个信息:这所学校认为,评估的过程是为了开展学习,而不仅仅是为了问责。
发展了这些技能的学生,也不需要因为一个教师没有公开对他们进行评估而不知所措。比如,你是一位16岁的高一学生,在写一篇有关浪漫派诗歌的文章时,大胆表达了一些独创性观点。在发回的作业上只得到了两个评语:一个B+的成绩,以及在页边上标注的“减12分”,没有任何其他解释。由于你已经对自己进行评估多年,你可以去问你的老师:“您能告诉我,这12分扣在哪里了吗?”如果教师也说不清楚,你仍然有能力自己对这篇文章进行分析,找到扣12分的原因——就像你是自己的老师一样。与此同时,你的老师恐怕也会意识到,你不是为了得“A”来找麻烦——你是真心想了解减分的原因。[7]
类似的过程,也可以帮助教师反思自己的教学。在与教师一起工作的时候,我会在三个问题上花很多时间,其中的每一个都是为了展示教师对自己领域不同类型知识的掌握,以及他们对于教学的把握。这个过程也可以被看作一个螺旋上升的过程。首先,教师对自己的授课过程进行计划,其中包括评估学生表现的方式。其次,在实际教学过程完成之后,教师对评估进行研究和反思。比如,教师可能使用了一种评分规则(或者其他的多维度方法),对学生的具体问题进行分析。某个具体分析表明,有一位学生的数学测验答案不准确,是由于推理的一个问题。这种情况就可以引发出教学上的一个新计划,比如,教授某些学生如何“简化问题”,以帮助他们应对自己在推理方面的困难。教师越能够准确地分析出每一个学生的问题,下一次在教学上进行调整的时候,也就越有效。这也就是为什么,在这个“螺旋上升”的过程中,不仅要评估教学,也要对评估本身进行评估——重新考虑正在使用的评分规则和其他评分方法,以及这些方法是否揭示了教师需要了解的信息。(www.daowen.com)
建设性指导
有时候,我会把各年级的老师召集到一起——从托儿所一直到12年级的老师,请他们看一看一大摞小学生的作文:书写潦草、拼法错误、没有区分大小写、忘记用标点符号等问题,比比皆是。许多高中教师立刻就会说:“我读不了这种东西。”我请他们不要去注意“缺了什么”(比如,逗号或者空格),而只是去读一读有什么。一般要用三到四轮,他们才能把自己重新训练到可以读懂这些孩子的作文。突然间,他们看到(或者听到)孩子的声音,从这些纸张中流淌出来。他们意识到了这些作文背后的作者。
这对于任何一位教师都是很有价值的练习,它显示了,如何从寻找缺陷的思维框架,转向寻找优势的思维框架。了解了这个道理的教师,在给学生的作文判分的时候,往往会有很大的不同。他们不再用红圈圈一个一个地标出“你没有做‘对’的地方”,而是清楚地说明“你做到了什么”,并且把他们评语的重点放到“下一步你要发展的方面”。孩子们会明白其中的信息,因为他们总是不断地在寻求对一个问题的回答:“下一步我要做什么?”
此外,接受了这种评分方式的学生,学会了如何谈论他们能做什么,而不是他们不能做什么。在他们老师的帮助之下,他们形成了一系列的“我能”的表达,例如:
“我能轻松地大声阅读。”
“在回答与我正在读的一个故事有关的问题时,我能够做出答复,也能说出细节。”
需要注意的是,每一个“我能做什么”的表述,都涉及相关的标准。因此,学生们不仅是在留心自己能力的发展进程,也是在学习如何达到他们的课堂标准的要求。
聚焦
几年前,在马里兰州的一所高中里,学校的管理人员建议,要求所有学生都穿校服。老师们纷纷表示拥护:“那些帽子和吊到腰下面的裤子,实在让人受不了。”而后,他们说出了最关键的理由:“有许多证据表明,校服对于校风和考试成绩有很大的影响。”
由于有人要求他们拿出事实根据来,他们就找到了其他学校的评估结果。毫无疑问,凡是校服成为规定的地方,行为表现分数(比如,旷课率)都有所改善。不幸的是,在这其中并没有定性分析信息,因此不清楚这些改善究竟只是来自校服,还是另一个原因:更高的一致性和统一性——校服只是其中的一个现象。
为了证实这一点,我们请他们考虑另一组学校类似的测评——这些学校采用的是阿特·科斯塔(Art Costa)和我在心智习惯方面的研究工作。在这些学校里,行为表现分数的特征是公布于众的,在教师们、孩子们甚至家长的小组中,都可以进行讨论,而且整个学校都一起努力做到这些要求。在这种情况下,行为表现分数有了更大的飞跃,另外学科测验成绩在全州最高。
那些规定必须穿校服的学校,重视的是更好的纪律。而那些关注16个行为特征的学校,则注重于改善学习。他们都获得了自己所衡量的结果。在选择你的评估方式上,要小心谨慎:种瓜得瓜,种豆得豆。
家长的角色
饶有讽刺意味的是,改变评估孩子功课的方式,家长们极力反对。我相信,大多数家长都明白,成绩与考试分数并不直接反映孩子的学习表现。但是,家长们从自己的学校经历出发,已经完全习惯了现有的评分系统,也就因此对分数尤为重视。他们对于自己的孩子与邻居的孩子之间的比较,感到忧心忡忡,也担心如何向上一辈的老人汇报,以及自己的孩子是否能进入一所有竞争力的大学。他们还担心自己的孩子的感受,并且往往试图以分数为中心进行干预。
这样的干预可能会导致相反的结果。如果家长进行干预,老师就会认为,家长只对改善评估结果感兴趣。老师在心里抱怨(“沃尔克太太又来了。我可没时间应付她”),却又要安抚家长(“是的,我理解您的意思”),于是就主要去关注如何对付“问题”家长。在这个过程中,教师对于学生无从了解。学生的功课(以及评估)也毫无起色。而家长在回家的路上会想:“又是如此,什么都没改变。”
在这个过程中,教师可以起到很大的作用——只要先让家长说,而自己做一个真正的倾听者,然后再说明自己的道理。但最有效的方式是让学生主导这场会面。学生不仅要参加,还要主持讨论,并且提出关键问题。当一个学生直接请老师解释,为什么会在一篇作文上扣分,或者是如何在下次作业中改善提升时,这显示出,这个学生真的对学习感兴趣。
最终,家长作为自己孩子的支持者,其所拥有的最强大的工具,是教育孩子向老师提出必要的问题。教师会听得更为耐心谨慎,而学生也学会了长大成人之后最有价值的技能:管理自己的学习。孩子们早已了解,成年人的世界对于他们的学习并不比他们自己了解得更多。教会他们自我管理,使他们能够以此学会更严格地评价自己的功课,能够根据反馈进行调整,并且能够对他们的所作所为负责任,孩子们就创设了一种关心自己努力的质量的环境条件。
对学校进行评估
在学校层面,一个真正有用的评估系统,应该是相当综合与完备的,能够使学校的领导人与家长、教师以及社区成员之间展开坦诚对话:“这是根据各种评估数据分析的我们学校的现状,这是这些数据分析的含义,而这是我们的项目现状。”教育委员会也会变得更成熟,他们会鼓励各个学校确保所进行的评估内容,一定是真正有价值的。
目前,具有这种品质的评估寥寥无几。在大多数学校系统中,在学区层面上,考试成绩不足以产生有效分析,让学校的领导者获得持续改进所需的信息。
此外,学校的成绩会公布在报纸上。这就让家长、地产开发商,以及政治家们得到了一个大致印象(无论是否准确):这些学校的工作成效如何,以及它们与其附近其他学校的差异。如果学校的分数低,人们很自然地就会认为学校的工作有问题;而当学校的分数高的时候,大家则会认为学校的工作做得不错。根据分数,人们对学校予以指责,或者给予赞赏。教育工作者试图为自己辩解,要求采用“判定性”不那么强的评估形式,或者干脆质疑评估这种想法本身。但是,从定义上看,评估的目的就是判定——“评估”这个词的意思是“确定结果的价值”。我们不需要“更少的”判定,而是需要更多明智的判定。我们需要更及时的判定,以一种可以引领更有效的变化的方式,同时又不会让人们对自己的能力产生反感。
《学习型组织中的评估:转变思维》[8]
希望应对改善评估挑战的教育工作者——无论涉及的是对自己学生的评估,对教学实践的评估,还是对学校变革行动的评估,恐怕都不会让这本书躺在书架上,落满灰尘。来自不同专业、各个年级的老师,提供了基于自己个人经历的案例,也提供了重新思考传统评估形式的策略方法。不同学校管理人员则分享了他们得到的感悟,以及实用的技术实例。这本书的章节以实践总结的方式呈现,涉及具体的技巧和工具——技能组合、反馈螺旋曲线、学生的自我评估、成绩单的新形式、共同愿景的练习等。有关戴明和圣吉所主张的理论和实践如何用到学校与评估领域中的透彻讨论,则与这些内容交织在一起。虽然这本书在写作时并没有考虑将家长作为读者,但编者为基于五项学习修炼的每一个单元所撰写的导言,内容翔实,也相当有说服力,任何对学校如何成为学习型组织感兴趣的人,都值得一读。
——贾尼斯·达顿
《奖励的惩罚:金牌明星、绩效激励方案、A类、奖励以及其他贿赂的困扰》[9]
我们作为家长和教育工作者所持的、与学习中的激励和评分作用有关的每一个常见假设,本书都以十足的耐心一一做了剖析。科恩的观点十分明确,指出以分数作为真正的激励不仅是糟糕的替代品,而且分数对于真正的学习会起反作用。这似乎与我们的直觉完全相反,这本身就表明了,我们在重新构建自己的思考方式上,要深化到何种程度。在我所在的机构中,不同小组也在质疑,问题究竟是在于“分数膨胀”(grade inflation),还是在于分数本身。科恩明确地区分了评分与评估的不同,同时指出,虽然所有的学习者都需要反馈方能成长,但评分的效果是破坏性的。本书是以一种平易近人的非学术风格写就的。科恩整合了大量的研究成果,用来支持自己的观点,对此我感到十分惊奇。
——托马斯·达顿
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。