新民招聘:第三章 评价方法举例

来源:百度文库 编辑:中财网 时间:2024/05/09 11:58:54

第三章 评价方法举例

  新课程评价改革要求评价多元化性、主体性、开放性。新课程评价方法既有量化的测验法,又有质的评价的档案袋法、苏格拉底式研讨评定法、观察法等,也有综合运用质的评价法和量化评价法的学生成长手册。

  一、测验法:关键问题是编制量表

  测验法是针对评价对象,运用教育测量的理论和方法编制高质量的量表,并施测于评价对象,以获取评价信息的一种方法。测验法的关键是编制量表。要编制一份高质量的量表不是一件易事。在设计量表时,应注意以下几个主要指标:

  ( 一 ) 测验的信度

  信度是反映测验可靠性程度的指标。大体包括内部一致性信度和稳定性信度。前者测验内部部分之间相关程度,求其等同相关。后者是同一测验先后两次在同一被测总体中实施,两次测验结果的相关程度,这就是稳定相关系数。

  求测验的内部一致性信度的具体步骤是:

  (1) 按题号的奇、偶性或采用随机挑选的办法,把测验分成两组;

  (2) 求这两组项目每人得分的相关系数。其公式为:

  式中: X 1 , X 2 分别为被测者的两组项目得分; n 为被测总人数; S 1 , S 2 为被测者的两组项目得分的标准差。

  (3) 信度 r n ( 即整体测验的信度 ) 的求法,由于 r p 是对半相关系数,而整体测验是其两倍。用斯皮尔曼一布朗估计公式求出其信度。

  ( 二 ) 测验的效度

  一个测验必须能测出它所要测定的功能或达到其测量实用的目的才算有效,这种有效的程度称为“效度”。到目前为止,估计测验的效度还没有十分有效的方法,一般常用的有内容效度和效标关联效度。

  1.内容效度

  它是指测验内容与预定要测量的内容间的一致性程度。提高测验的内容效度的方法一般采用双向细目表,来保证测验取样的合适性。以测验学生学业成绩的试卷为例。编制双向细目表的步骤如下:

  (1) 根据教学大纲、教学内容和所预期的教学目标的要求,分别列出考试内容的各项要点和所要测量的教学目标。

  (2) 考试内容的各项要点和所要测量的教学目标要以其相对的重要性来加权。相对权数一般可根据教学时各项要点的教学时数及学科专家意见等来决定。

  (3) 编制双向细目表 ( 下表 ) 表中左侧列出考试内容的各项要点,顶行列出所要测量的教学目标,表中的数字代表各考试内容和各层次的相对权数。

  高中物理“磁场”考试双向细目表

  根据双向细目表编制试题,所编制的试题越是符合双向细目表各细格所占的比重,则内容效度越高。

  2.效标关联效度

  这是从测验分数与效标间的一致性来评价的,即测验分数与效标间的一致性程度。所谓效标,即衡量测验有效性的参照标准,它是指测验所要测量或所要预测的行为特质,这一行为特质,通常以另一种测验分数或活动来表示。

  (三 ) 测验的难度

  难度是指测验的难易程度,是评价测验质量的一个数量指标。测验的难度可分为客观性测验难度和主观性测验难度两种。

  1.客观性测验难度

  客观性测验项目的答案,只有两种结果,即不是完全对,就是完全错。对得满分,错得零分。其难度的计算方法通常有以下几种:

  (1) 基本公式法

  客观测验难度通常用答对某项目人数的百分比来表示,其计算公式为:

  P=R / N

  式中: P 为难度值;

  R 为某项目答对人数;

  N 为总人数。

  这里需要注意两个问题:一个是要分清难度值与难度的关系。测验的难度值越大,则测验的难度越小;测验难度值越小,测验的难度越大。另外,还要分清测验项目的难度与测验的难度。项目的难度是指某一项目的难度,测验的难度是指测验中所有项目的平均难度。

  (2) 极端分组法

  如果被试的人数较多,可以用下列公式计算项目的难度值:

  式中:

  P=(H+L)/N

  P 为项目的难度值;

  H 为高分组答对人数;

  L 为低分组答对人数;

  N 为两组被试的人数总和。

  计算步骤如下:

  (1) 从被试中随机抽取一个样本,把他们的总成绩按从高分到低分排列

  (2) 把处于前 27 %的被试列为高分组,把处于后 27 %的被试列为低分组

  (3) 求出高分组和低分组被试对某项目的答对人数,即得出 H 与 L

  (4) 代人公式便得到某项目难度值的估计值

  这里会涉及样本大小问题。样本太大,失去抽样的意义;样本太小,代表性差。根据测量学专家的意见,可以把 370 人的成绩作为样本,用这样大小的样本和以 27 %作为分组标准,进入高分组和低分组的人数正好各 100 人,这样对计算项目的难度值比较方便。

  2.主观题测验的难度

  主观题项目的难度可采用下面公式计算

  P=X/W

  式中: P 为项目的难度值;

  X 为被试在某项目得分的平均值;

  W 为某项目的满分值。

  在设计测验时,项目的难度多大合适,可视测验的目的而定。在常模参照性测验中,项目的平均难度值在 0. 5 左右比较合适,也就是说全部项目中应有 2 / 3 的项目难度值在 0.30 — 0.70 之间,各项目的难度值大部分分布在乎均难度值附近,这样项目产生的分数会参差不齐,表现出差异性,有较高的信度,有利于鉴别被试水平的高低。

  在目标参照性考试中,项目的难度可不受限制,如果学习的内容比较简单,则项目可以容易一些;如果学习的内容比较难,则项目可以难一些。

  ( 四 ) 区分度

  这是指某项目对于不同水平的被试加以区分的能力。如果在某项目上得高分的被试实际水平也高,得低分的被试实际能力水平也低,那么该项目就具有较高的区分度。

  1.客观题测验的项目区分度

  如果将高分组与低分组通过某一项目的人数,以百分比来表示,则两个百分比的差数即为区分度指数。

  求项目区分度指数的方法是:先把测验总分依次排列,然后选出得分最高的 27 %列为高分组,得分最低的 27 %列为低分组,并计算高分组及低分组通过每一项目的百分比 ( 通过率 ) ,最后再以高分组的百分比减去低分组的百分比,即得区分度指数,用公式表示为:

  D=PH—PL

  式中: D 为区分度指数;

  PH 为高分组通过某项目的百分比;

  PL 为低分组通过某项目的百分比。

  依据区分度指数的大小,一般对项目有如下评价:

  项目区分度的评价标准表

 

  2.主观题测验的项目区分度

  这种区分度可用下面公式求得:

  D=(SH — SL) / n( 最高分一最低分 )

  式中: D 为区分度指数;

  SH 为高分组得分总数;

  SL 为低分组得分总数;

  N 为高分组人数 ( 或者低分组,人数 ) 。

  确定高分组与低分组,方法同前。

  以上这些方法,对于科学地编制学绩测验是较有效的,对于编制人格测验、智力测验等,则要用到其他一些方法,读者可参考教育与心理测量方法的专著。

  使用测量法搜集信息,为使其不失真,应注意以下几个方面:

  (1) 深化对被测对象本质属性的认识。测量技术、方法只能是对事物定性与定量的描述,它是建立在对被测对象本质属性认识基础上的,错误的认识或未抓住本质的认识,测量算度再高也没有意义,得到的信息必然失真。

  (2) 选择测量方法要与被测对象的属性相协调。运用测量方法,关键是要把量表设计好。若量表的内容和设计技术与被测对象属性配备不好,获取的信息就会失真。

  (3) 分类准确是提高测量品质的基础条件。测量的本质是直接比较或间接比较。没有可比性,测量失去意义。类内差异要尽可能缩小,增加类间差异,就可能使教育事件可比性增大,但分类过细,又将造成浪费。

  (4) 增加测量人数,减少结果的不确定性。按照统计原理,偶然误差和“报值”将在统计处理中被中和,测量品质将有所提高。但增加人数要注意量力而行,也不是越多越好。

  二、档案袋评定法:应该重视的评价方法

  ( 一 ) 什么是档案袋评定

  作为一种从实践中涌现出的评定方法,尽管档案袋评定的出现已经有十年左右的历史了,但从教师们对档案袋评定的使用情况来看,很难给它一个确切的定义,正如对此有详细研究的美国课程评价专家约翰逊所说:如果要求 5 个不同的教师给档案袋评定下定义,你很可能会收到 5 个不同的答案——其中每一个都没有错。这是由档案袋评定的性质决定的。它们通常是与特定情景或发现这种方法的学校联系在一起的。

  从语义分析来看,档案袋,有“代表作选辑”的意思,最初使用这种形式的是画家及后来的摄影家,他们把自己有代表性的作品汇集起来,向预期的委托人展示。它所选择或提交的东西,是由出示档案袋的人自己创作的。把这种做法应用到教育上,档案袋评定也是汇集学生作品的样本,但它们的目的和内容,是为了展示学生的学习和进步状况。

  通常,档案袋内容的选择或提交,是由被展示作品的作者与档案袋提交的对象,即由学生和教师共同决定的。档案袋制作的进程,涵盖了一项任务从起始阶段到完成阶段的整个跨度。例如,从事写作教学任务的教师,要求学生提交头脑风暴记录、第一份提纲、早期的草稿、修改过或再次修改的草稿,以及最终的作品。但必须说明的是,档案袋中究竟选择哪些内容,并没有硬性的标准。关键是,必须清楚建立档案袋的目的是什么,档案袋要适应的观众是谁,档案袋将如何使用,它对学生有什么帮助,这些都会影响到档案袋内容的选择。

  ( 二 ) 档案袋评定的思想基础和意义

  档案袋评定是在教育评价改革的大背景中出现的,其思想基础与改革的思想基础是一致的。以标准化为特征的测验在传统评价中占有主导性地位,其思想背景是 20 世纪初的提高工业效率运动以及作为时代精神的科技理性。在这种理念下,课程与教学要求教师按图索骥地把预先选定的知识教给学生,其效果如何要由测验来确定。这样,在课程、教学与测验之间形成了一种由此及彼的线性关系:由课程计划开始,经过教学,最后以测验结束。而测验,由于受科技理性的支配,追求的是试题的客观性和成绩的量化。正如人们经常批评的,这种测验完全脱离了知识应用的具体情境,师生的主体性、创造性由此被湮灭。始于上世纪 80 年代的这次评价改革就是针对这些弊端而兴起的。

  改革者们首先从教育的目的人手,重新审视了“学校究竟要学生知道什么和学会做什么”这一根本问题,真实地指出学校教育的任务是要让学生学会在具体的情境中解决具体问题,而不是向社会、委托人提供一些抽象的数字成绩,由这一结果回溯到课程、教学计划,那么课程、教学、评定之间应该改变过去的线性关系,而代之以一种新的动态关系 ( 如下图所示 ) 。

  随着上述变化,还带来了由教师中心、内容驱动的课程向学生中心、探究驱动的课程的转化。这些变化,要求一种新的评定方式,这种评定的基础就是学生运用所学知识而获得的成就,这就是这次评定改革、也是档案袋评定的实质。对教师而言,一个主要的变化是,要把课程与教学同评定整合起来,贯彻到日常的课堂生活中去。这种评定被人们称为“嵌入课程”的评价,意即运用当前的课程活动达到对成绩进行估价的目的。具体说来,就是学生在学校生活中进行某种范围的活动,其结果产品如作文、读书报告、问题设计或解决等,能够反映有关他们学习的情况,从而也就有了评价的意义。

  档案袋评定的主要意义,在于它们为学生提供了一个学习机会,使学生能够学会自己判断自己的进步。在传统的评价中,测验或考试对学生而言具有相当的神秘性,从标准的制定、试题的选择直到分数的评判,学生完全被隔绝在外,这是传统测验对客观性的追求所决定的。档案袋评定与此迥然不同。由于要考查的是学生运用所学知识取得的成就,学生就成为选择档案袋内容的一个决策者甚至主要决策者,从而他们也就拥有了判断自己学习质量和进步的机会。特别是在使用某些档案袋类型,如精选性档案袋或过程性档案袋时,学生成了所提交作品之质量和价值的最终仲裁者。因而,在考虑档案袋体系的开发时,其中允许学生反省和自我评定的可能性,是最为重要的,当然,这一切都要基于一种评定观念的转变,即对学生成就的评定,是对其进步的连续考查,而不是对学生掌握内容范围的阶段性审计。

  ( 三 ) 档案袋评定的类型和构成

  如上所述,档案袋评定依据使用目的、提交对象以及对学生的帮助等的不同,可以有各种不同的种类。对档案袋评定的分类,从不同的角度人手也可以有不同。的分类方法。美国南卡罗来纳大学教育学院教育心理学教授格莱德勒以档案袋的不同功能为标准,把档案袋评定分为:理想型、展示型、文件型、评价型以及课堂型 ( 见下表 ) ,其中最有代表性的是理想型。

  档案袋评价的类型

  理想型档案袋之所以被这样命名,一是因为这种档案袋设计的意图在于帮助学习者成为对自己的学习历史具有思考能力和进行非正式评价能力的人。因而,它常常被作为提高学习质量的工具而使用。二是它的构成内容在档案袋评定中也具有典型意义。

  理想型档案袋主要有三个部分构成,分别是作品产生过程的说明、系列作品以及学生的反思。作品产生过程的说明,主要是学习计划产生和编制的文件记录,通过这部分档案袋内容,学生选择计划时的理想就能展现出来。它的形式可以有各种不同类型,既可以是伴有说明的一系列略图,也可以是进行特别困难的选择时录下的几盒录音带。

  系列作品是学生在完成某一学习计划的过程中创作的各种类型的作品集。如果说,对一项作品产生过程的记录表明了学生在某一学科领域中成就的深度,那么档案袋的第二个组成部分即学生的系列作品,则表明了学生取得成就的广度和范围。例如,在语言艺术中,一个档案袋也许包含了被杂志录用的文章、论文、诗歌,以及课堂表现录音等。

  第三部分是学生的反思记录,它对于学生在学习上的成长尤其重要。在学期的不同时间里,教师要求学生充当专门批评家或传记作家的角色,让学生描述自己作品的特征、自己在成长过程中所发生的进步、已经实现的目标等,这些都可作为反思记录的内容。通过这种反思,一方面为学生的成长提供了重要契机,另一方面也培养了学生自我反思和自我教育的习惯。

  从档案袋的上述组成可以看出,在班级里,理想型档案袋可以作为不断发展的信息来源为教师和学生双方提供服务,让他们及时准确地掌握学习进展的实际情况,以便调整下一步的学习。此外,档案袋的建立,促使教师和学生经常讨论关于创造有价值的作品的过程、有效批评的组成,以及对尚在发展的作品进行评论的方式等。这一切的重要性在于,它们可以帮助学生把讨论评定作为学习的机会,评定由此实现了与课程、教学的整合。当学年终结时,最后一份作品产生的过程记录、反思,以及完成的作品,就成为学生成长过程永久记录的一个部分。

  约翰逊则把档案袋评定分为最佳成果型、精选型和过程型,以最佳成果型为例,各学科选人档案袋的内容可以包括以下内容:

  (1) 语言艺术:一系列写作类型的最佳作品,如说明的、创作的 ( 诗歌、戏剧、短篇故事 ) 、报刊的 ( 报告、专栏作品、评论 ) 、广告副本、讽刺作品或幽默作品等等。

  (2) 科学:学生做的最佳实验室成果;开发的最佳原创假设;对教师提出的科学问题的最佳解决;对科学问题阐明自己主张的最佳论文 ( 用那些能在科学家的讨论会上展示的风格写成 ) ;对科学杂志或期刊上的文章做的最佳评论;在学生长时间的实验中所做的最佳记录或日记。

  (3) 社会研究:学生写的最佳历史研究论文;学生参与的一定量的最佳争议和讨论;学生提出的最佳原创历史理论;关于历史问题的最佳议论短文;关于当前事件的最佳评论;对学生所读历史传记的最佳评论。

  (4) 数学:对教师所提问题的最佳解答;学生开发出的最佳原创数学理论;对数学期刊的最佳评论或学生写的数学家传记;对问题解决的最佳描写 ( 描写问题解决的过程 ) ;学生探究过的数学理念的一张照片、图解或概念图。

  精选型档案袋要求了解更广泛的学生成果。它要求学生提交他们感到最困难的成果例证,其时间往往要持续一年以上,使之成为深刻反映学生成长的概要和高度揭示学生一般成绩的证据。

  过程型档案袋则寻求发展性成果证据。它要求学生一步一步地检查他们在一定领域中取得进步的成果。同样地,提交内容的类目也许由教师确定,但学生仍负责收集必要的成果。更为重要的是,学生成为他们自己成果和进步的积极评定者。

  由上可见,档案袋评定具有极大的灵活性。它的具体构成,可因不同的使用目的、档案袋要提交的对象以及学生的具体情况而不同。但无论如何,档案袋的使用都要有一定的目的和精心设计。最为重要的是,档案袋的使用要伴随着一系列课程和教学观念、评定观念,乃至学生观的变革。否则,仅仅是把学生的一些作业收集起来放在一起,哪怕这样做时经过了精心的设计,其结果也未必符合档案袋评定的精神实质。

  ( 四 ) 档案袋评定的标准及效度、信度问题

  档案袋评定的标准与传统评价有很大不同。从实质上看,档案袋评定是为了更好地改善课程和教学,使之更符合学生发展的需要,从而促进学生的发展。因此,凡是能表明或促进学生进步的指标往往都被列为评定标准。此外,标准往往交由教学活动的直接参与者——教师和学生共同制定。这种做法,最大限度地保证了师生特别是学生对标准的了解和把握,让学生清楚地知道对他们在各方面的要求究竟达到何种程度。从一些档案袋评定发展较早的国家和学校看,目前档案袋评定的标准一般有三种类型:一种是集中关注作业的关键特征,如目标、组织、文章的技巧等,并给不同特征打出一定范围的等级,如 1 到 4 级;第二种类型运用一般的等级,如 1 到 4 级或到 5 级,反映不同的能力水平,某一组特征都与一个分数相关联;第三种类型是确认主要的维度,如流畅性或精致性,以此来确定成就水平。

  至于档案袋评定的效度和信度,至今仍是存在相当争议和分歧的问题。众所周知,效度和信度是来自以客观性为宗旨的量化评价的两个概念,其目的是为了保证评价获得具有普适性和推广性的规则。因此,从根本上说,这两个概念并不适用于充分尊重学生的个别差异、并力图对这种个别差异进行充分理解和阐释的质性评定范式,这当然也包括档案袋评定。一些研究者对档案袋评定所得分数与在同一领域中所做的其他评价所得分数进行了相关性研究,充分表明了这点。金泰尔发现,学生的学校档案袋分数与国家教育计划评定分数之间,基本上是一种或然关系;在数学和写作课上,相关系数的变化是从 0 . 13 到 0 . 38 。同样,赫曼等人发现,在整体的档案袋集与标准化的写作评定之间,不存在任何相关;而档案袋集的个别部分与标准化评定之间的相关是 0.13 到 0.31 。

  但为了与量化评价进行沟通,也有许多研究者结合质性评定的特点,重新检讨了这两个概念,如对这两个概念予以重新界定,或针对不同评价范式对效度和信度进行重新分类等,并采用一些新的方法和概念给出质性评价的效度和信度。格莱德勒把档案袋评定的基本效度定义为学生的作品对其能力或思维结构的表征程度,而把信度定义为评价者内部对于档案袋分数的一致程度。艾斯纳在他的教育鉴赏与教育评论中,为了达到他所推出的约定性效度,则提出了“结构的确证性”和“参照的适切性”两种途径。

  ( 五 ) 有关案例

  1.“收获袋”、激励卡记录学生成长点滴

  北京青年报 10 月 31 讯 ( 实习记者汪燕辉报道 ) 近日,记者在朝阳区劲松四小采访中发现,这里的学生每人都有一个属于自己的“收获袋”。收获袋里放着各种各样的奖励卡,记录了学生取得的点滴进步。

  据教导主任李景艳介绍,该校正在进行“实施质性评价,促进学生差异发展”的研究课题。主要的做法就是根据不同年级、不同学生的特点制定一些要求,让同学制作卡片,由老师或小组填写奖励内容,发给学生。例如,“创新思路卡”、“精彩发言卡”等。每个学生都可以把反映自己学习情况的信息收集到自己的收获袋中,包括得到的卡片、自己认为优秀的作业、班级或小组向家长发的喜报、家长的评价等等。这些成果,老师组织学生每月分析一次,还不定期地与家长进行交流。

  六年级 (1) 班班里得卡片最多的高茜同学,从开学到现在已经得了 17 张奖励卡了,他能够把学过的每篇语文课文都背下来,老师答应他每背下来一篇都会给他一张奖励卡。

  据了解,该项目正面向西城、海淀、宣武、朝阳等地小学推广。陈丽华老师说:“同学能从自己收获的卡片或作业感受到学习的乐趣,同时收获袋成了沟通老师、家长、学生的工具,孩子能得到多方的了解与鼓励,学习的劲头更足了。”

  北京工业大学心理咨询中心赵丽琴老师认为,激励孩子一定要把握好一个度,否则有可能造成孩子们的攀比心理或者成为流于形式的激励。

  2.建立个人学习档案

  对学生的考评应是经常性的,应反映出学生学习过程的轨迹。教师用此法进行形成性及终结性评价,能积极促进学生参与学习,对自己的学习负责。各门学科均可建立个人学习档案。由于这些作品全部都是学生平时学习活动的成果,因而也最真实,最能代表学生学力水平,一览可知学生发展轨道上的强项与弱项,从而引导学生今后努力方向。另外,让学生和家长自行参与评价,可极大地调动家长资源,端正学生学习态度,让学生享受到学习的乐趣,成功的喜悦。

  操作方法:

  (1) 期初把建档意向与学生及家长说明,明确目标,提高主体学习活动的主动性。

  明确

  (2) 各科教师认真细致地思考和计划建档问题,选择不同的建档形式。

  (3) 一般按一个单元或一个学习主题收集材料,师生协商确定后,保留在档案袋中。这些材料应是学生平时最好的作业、最好的作文、优秀的美术作业、摄影照片、录音磁带、社会实践调查报告、研究报告,乃至各项竞赛获奖证书……

  (4) 学生自己管理档案。评价方法:期中、期末各开展一次学业成果展览会,展示档案内容,邀请家长、学生参加,让学生、家长自行评价打上等级,写上评语,并提出建议。

  上学期,五 (5) 班在期末的家长会上展示了学生的作品档案袋。档案袋里包括学生的各科作业,特长作品,荣誉证书和一些富有个性的作品 ( 如:日记、调查报告、摄影、书法、剪纸…… ) 。家长们通过档案袋清楚地看到了自己孩子的成长足迹,并根据自己的标准给自己孩子的作品打上等级。学生们也和家长们一起观看了自己的、同学的作品,找到了榜样,明确了目标,进一步提高了学习的自觉性和主动性,形成了“勤学、进取、和谐”的学风。

  [ 评析 ] :本案例为什么会取得如此明显的效果呢 ? 心理学研究告诉我们,只有调动学生的内部动力,个体才能真正得到发展,只有各种外部环境形成合力,对孩子个体发展的影响作用才能收到最佳效果。本案例,通过展示学生档案,一方面,学生通过自己参与对自己学习过程、结果的评价和对同学学习活动进行评价,既是对自己学习活动的回顾、总结,也是自己发现问题、自己解决问题的过程,在这一过程中,充分发挥了学生主体作用,调动了学生学习的主动性和积极性。另一方面,家长参与评价,进一步协调了学校的教育一致性,为学生个体的发展创设了良好的环境。

  三、苏格拉底式研讨评定:教学和评价的统整

  这种评定方法,是把学生在“班级参与”和“课堂讨论”中的表现作为学生学业成绩评定的一个部分。但对于班级参与和课堂讨论形式和实质,它都有一些特别的要求,其中最根本的,就是要让学生学会更有成效地思考并为自己的见解提出证据。显然,它与古希腊那位伟大的哲人所创造的“产婆术”有着共同的见地和追求。

  就传统的课堂讨论来说,大多数都是以教师为中心进行的,教师既是讨论主题的提出者,也是讨论方向的引导者,甚至由谁发言如何发言都是由教师来掌握的。正如人们比喻的,课堂讨论类似于以教师为轴的自行车轮在运转,而所谓“讨论”,实质上成为老师一直让其他人作出解释说明的系列对话。在利用讨论对学生进行评价时,一是由于这种形式并未给学生提供真正的表现机会,二是由于对讨论过程缺乏客观的记录,因此教师往往是根据自己的主观感受和记忆来进行的。这种“课堂讨论”是不符合苏格拉底式研讨评定的要求的。苏式评定法所关注的问题是:在问题讨论中,我们如何才能更多地促进学生间的互动 ? 对于学生在批判性思维和公众演说技能方面取得的进步,讨论要怎样做才能成为对其进行可靠评定的依据 ?

  苏格拉底式研讨是芝加哥哲学研究所所长阿德勒的工作成果。他提出了一个“教育宣言”,试图重构如何把学校呈现给学生。基于对杜威进步主义教肓信条的坚定信念,阿德勒认为,应将同一的学习过程提供给所有学生,自 4 岁始直至中学毕业。此外,这一教育起码必须坚持三个目标: “知识的获取'、“智力技能 ( 学习技能 ) 的发展”和“思想与价值理解的扩展”。在阿德勒看来,第一个目标可通过说教性教学、教科书的使用以及具有“覆盖性”的内容领域来实现;第二个目标通过阅读、写作、演说、听、计算、问题解决等技能方面的“训练、练习和指导下的练习”来达到;最后一个目标则要通过“苏格拉底式提问法和积极的参与”,要使用书本 ( 而非教科书 ) 和一些其他的艺术作品,以及通过“从事艺术活动”来完成。阿德勒的建议认为,学校教学的终极目标,是教会所有学生在第三个目标领域内有所成就。由此,他提出要围绕重要的教育结果重构教学。他所提倡的苏格拉底式研讨即是为此作出的一种努力。

  阿德勒提出的苏格拉底式问题研讨也是始于教师的某一问题,但学习的整个环境却是变化了的。

  通过讨论进行教学还需具备一些其他的必要条件:对年长点的儿童来说需要长于 50 分钟的课时;还需要一间使讨论参与者围圈而坐而非并排而坐的教室;教师是参与讨论的一分子而不是站在讨论小组前面的操纵者。

  教师在讨论中的作用是使讨论沿着有成效的路线进行下去——这主要利用稳定情势、指导、领引和像一名学生那样进行争论等手段。教师首先是讨论的平等主体,所有人必须感觉到就像在真正的交谈中一样,都是作为平等主体参与其中。

  苏式研讨法的具体步骤如下:

  第一,明确教育结果。在这点上,苏式研讨法与传统评价的做法相同。但传统评价只是把目标作为评价的标准,而苏式研讨法则注重评价如何才能真正实现这些结果,因此,它并不像传统评价那样对目标进行过细的裁剪。这些结果可以是批判性思维,阅读理解技能、听说技能、多样的写作能力等。

  第二,选定研讨采用的文本。课程知识的广泛性和课堂教学容量的有限性之间的矛盾,是传统教学疲于应付却又终难解决的。苏式研讨法试图把教学从这种困境中解脱出来。这种方法允许所有学科的老师去满足“有效听说”这一目标的实现,并达到一些其他高级思维技能教育结果。为了能使研讨深入细致,所选文本通常是从较长作品中摘录或节选的一小部分——也许选自一本小说或一部电影,也许是乐谱的一部分或一幅画的局部,实验的某一步骤,数学定理的一行。只要能最佳地促进学生学习,教师可以对文本进行自由选择,包括学科内和跨学科的文本。

  第三,教师提出一个起始问题。这一步被认为是非常重要的,它会直接影响研讨的质量。苏式研讨法开始于一个起始问题,这个问题不应只有一种单一的预期反应。一个好的起始问题会在问题研讨过程中引发对话。格雷关于起始问题的建议如下:它们确实起因于领引者 ( 教师 ) 的好奇心;它们没有单一或“最合适”的答案;它们可以产生对话,从而引起对文本中思想观念更深广的理解;它们可由文本的参考资料作出最好的回答。

  第四,选择记录研讨过程的方式或设计简明的记录表。记录应当完全客观地反映研讨进程,它是进行评定的客观依据,通过一系列研讨记录的分析、对比,就可以对学生在各种教育结果上的成绩作出判断。

  第五,以多种方式完成评价。正如研讨法可用来实现不同教育结果一样,其本身也能以不同方式来完成。例如,有些学校把它作为毕业学业展示的一部分;而有些学校把它作为课堂评价的工具;还有些学校把它当作“离校”学业展示,以接受高一级水平的学校教育。在各个有关学科中,苏格拉底式研讨法及其附属练习都是评价学生技能和进步的有力反馈工具。此外,它们还为学生的自我评价提供了良好、积极的媒介,特别是通过观看问题研讨的录像带,学生可以对自己的表现进行评价。研讨法不仅可以使学生与教师明晰课程、教学和评价的关系,而且还可作为学生学习和学校课程计划进展的标志。

  可见,苏格拉底式研讨法不仅是一种评定的有效方法,更提供了一种课程和教学改革的思路。把课程、教学和评价进行统整,使它们融合为一个有机整体,这种思路,也是当前各种质性评定方式的一种共同趋势。

  四、专题作业:孩子独立研究、独立动手的空间

  所谓专题作业,不是以学习和掌握系统的学科知识为目的,而是以解决实际问题为目的。专题作业包括调查报告、研究论文。用专题作业来培养、考查学生的创新精神与实践能力,这种方法在美国已广泛采用。我们应该相信孩子具有同成人一样的独立研究、独立动手的能力。专题作业为孩子独立研究、独立动手能力的发展提供了时间与空间。孩子们将他们调查、研究所得以报告、论文形式显示出来,这本身就是一项复杂的探索、学习过程:收集资料、阅读、寻找信息、确立观点、组织文章……创新精神与实践能力,需要在具有创新特点的实践活动中加以培养。

  操作方法:

  (1) 选题:学校列出专题作业菜单,学生凭个人兴趣爱好自由选择,也可自己另立题目。学生一旦确立“课题”,便不许更改。

  (2) 调查研究:为时一个月,学校可提供一些资料,鼓励学生去市图书馆查询资料。学生可以独立完成,也可成立小组进行调查研究。

  (3) 书面总结:学生必须撰写调查报告或研究论文。文章形式可事先提供作业要求,应视不同年级而有层次差异。

  评价方法:

  (1) 学生能完成作业,一律得优。因为从决定题目,到阅读找寻资料到着手写文章,孩子始终处在一个独立工作的状态下,他必须学着思考、筛选,组织研究材料……能完成者便已达到要求。

  (2) 可请评委对专题作业一一评价,最后评出一、二、三等奖。

  (3) 建立激励机制。组织优秀专题作业在板报、班刊、校刊上发表,集体评议。

  一个案例:专题作业“编故事”

  我校三年级增设了课外阅读课,一开学,就向学生明确提出该课程的学习目标: 1 .综合你读的故事,讲给大家听,要求完整、生动、叙述流利,可事先录入磁带也可当场表演; 2 .与小组同学合作,演一个童话剧或故事剧,期末向全班同学汇演; 3. 把你最喜欢的文章或句段或词语抄下来,期末展出,并把这些优美词句用到你平时的作文、说话中去。有了明确的学习目标,学生阅读的劲头更足了,讲一讲、演一演、用一用的意识强了,并逐步养成了讲演时不看讲稿的好习惯。

  评价现场:

  (1) 大部分学生编的故事“像”故事,能综合多种文学形象,塑造新人物,说明他们已明白怎样去记叙一件事;一部分学生编的故事不合逻辑,交代不清楚。

  (2) 童话剧或故事剧的表演,效果当然不能与电视剧相比,个别小组的表演,你甚至看不懂,但是演员们特认真,角色分配也很恰当,有些小组还准备了几种剧表演。整个评价过程,学生是在轻松愉快中度过,其激情欢悦不亚于欢度“六一”,真正的评价者其实是学生本人。

  (3) 期末,每位学生都拿出了读书摘录本,学生看到了自己的学习成果,也发现了和同学的距离,明确了以后努力的目标。

  [ 评析 ] 本案例中,学生在完成专题作业“编故事”的过程中,充分发挥了其主体能动性,把自己喜爱的文学形象经过再塑造,并通过讲讲,演演,

  交流了学习结果。在这一学习过程中,学生通过“摄取信息一加工整合一外化行为”这一心理过程,不但他们的实践能力获得了锻炼,更重要的是学生的创造性精神得到了发展。学生参与评价活动,充分发挥了学生的积极性。

  五、观察法:简便可行

  在教育教学过程中,观察法是一种常用的考评方法。新课程的教学大纲的许多要求,如学生使用仪器的技能及在小组中成功的活动的技能都有赖于教师的观察来考评。教师和学生都可以利用观察表格来记录整个学习过程中学生特别的技能、行为和进步。这些被观察的技能、行为和进步,应该和教育教学目标及课程标准要求紧密相联,应该具有可观察性。常用的观察表格包括学生个体使用的自我检查表和整个班级使用的记录表。

  对学生行为日常观察所得信息的效用和质量可以通过以下措施来改进:第一,对于一些重要学习结果的集中观察;第二,系统地记载观察结果。

  根据观察所采用的技术方法,可将观察分为一般观察和集中观察两类。

  (1) 一般观察:这种观察将学生的成就和进步记录在包括整个班级成员名单的表格上。表格可以与学生档案放在一起,也可以贴在教室里的墙上,让学生了解自己的进步和需要考评的内容。当一周结束后,可将观察表格裁剪下来,归入学生个人档案。最便利的方法是运用粘贴纸记录观察结果,一段时期后将其粘贴于学生的个人档案。

  (2) 集中观察:这种观察集中于学生行为和结果的一些特别方面或集中于一组特别的学生,观察时让学生集中于一些特别的活动。例如让学生分组讨论一个数字问题的解答,在活动中观察学生的数学技能、说话和倾听表现的交流沟通技能。教师也可以采取在一定时间内集中系统地观察五到六个学生组成的小组,还可以通过向学生提问来获取更多的信息,据此了解学生是否掌握概念。

  一个案例:人教版第六册语文《惊弓之鸟》第二课时

  师:会读《惊弓之鸟》这篇课文了吗 ? 请各组推选一位代表,我们来进行一次朗读比赛好吗 ?( 一位读叙述部分,一位读更羸的话,一位读魏王的话,一位作总裁判 ) 我们来评一评,谁读得最好 ?

  生: ( 各组都为本组代表说好,并提出修改建议 )

  师:请你和你们一组的代表一起读好吗 ?[ 不对学生的评价作再评价 ]( 感悟过程 )

  师:现在,金老师就是魏王,你呢,就是更羸,请大家各自作好准备,就近找一人合作,练一练,过会儿上台与老师合演一出“惊弓之鸟”,看一看,谁表演得最好 ?

  生: ( 边复述有关句子边加上动作表情练习 )[ 观察学生的学习表现 ]

  师:谁第一个接受挑战 ?[ 观察学生的反应 ]

  师:有没有认为自己表演得更好的 ? [ 叫上几位:自告奋勇者,作壁上观者,欲试而缺乏信心与勇气者 ] 表演完后,先让“小更羸们”自我评价,再让其它同学评议,评出最佳演员……课后,单独找几个表现较突出的同学作激励性评价,使其扬长补短,或培植自信心,或提出努力方向。然后在各自的观察记录本上作必要的记录。

  六、学生成长手册:值得关注学生成长手册,全面记录学生的素质发展,已经是学校教育评价方法中,被最为关注的方法之一。为了全面展示这一方法,我们选择了 X X 实验小学的学生成长手册。

  ( 一 ) 学生成长手册介绍

  ( 二 ) 学生成长手册——操作向导

  为了综合评价学生在小学期间的身心全面发展;为了给学生、家长和教师的教、学工作提供方向;为了对“发展性教育研究”的历程进行总结,特制定本手册。

  1.事前准备

  ·学校须成立领导小组专门负责本项目之实施,并给予充分的人力、物力支持。

  ·本手册须于实施前一学期即印发所有参与测评人员 ( 教师、家长、学生 ) 。

  ·所有测评人员须在评价实施前充分理解手册各部分之内容与实质含义。

  ·教师、家长根据学生身心特点帮助其确定该学期之主要发展方向,同时,依据本手册各部分之具体内容设立学生发展成果记录工具,以保证学生主要发展成果均有资料见证。

  2.评价人员

  ·本手册适用于小学 1 年级至 6 年级学生。

  ·评价小学生于该学期之身心发展与进步情况。以学生自评、教师评价为主,家长寄语、学生互评为辅,从多角度对学生构成立体评价。

  3.评分方法

  ·本手册之评分方法采用定量与定性评价相结合的方式进行。

  ·学生自评按班分组进行,学生在自评的基础上进行相互评价。每个学生的互评分数为全组成员对其评价之平均分数和综合意见。教师监控指导。

  ·在定量评价部分采用 4 点计分, “ A ”计 4 分;“ B ”计 3 分;“ C ”计 2 分;“ D ”计 1 分。

  .为实现每个学生自身发展的纵向对比、学生与学生之间的横向对比、评价手册内部的各项目对比,可将每个学生各表总分标准化,全部折算为可比的标准分。公式如下:

  ·学生各表之标准分的总和,即为该生此次测评之总分。

  4.特长项计分

  ·为鼓励学生形成专长和突出个别特色,特长项单独计分,并享有更高的权重。

  ·特长项目的填写以学生自评、互评为主,家长、教师次之。

  ·凡提交获奖证书原件、各种作品原件及其复印件的学生,每项国家级奖计 10 分;省级奖计 8 分;市级奖计 5 分;区级奖计 3 分;校级奖计 2 分;班级奖计 0 . 5 分。

  ·虽未获任何级别奖励,但经由教师、家长或学生自身填写,且得到评价小组 2 / 3 以上学生认同,认为该生确实具有或正在形成某种特长者,每项特长计 0 . 5 分。

  ·所有特长分之总和的标准分为该生的特长分,计分公式如前所述。

  5.实施时间

  ·本评价每学期实施一次。于每学期开学初第三周始,对上学期学生之发展进行评价,评价活动不宜超过一个月。

  ·教师每学期至少两次督促家长和学生对最近时段之发展进行短暂总结,并在与家长和学生的交流中给予必要反馈。

  6.其他

  ·每学期评价工作完成之后,手册和相关材料由学校资料中心统一收藏、归类、汇总。

  阅读书目

  1.比尔·约翰逊:《学生表现评定手册》,华东师范大学出版社, 2001 年版。

  2.吴钢:《现代教育评价基础》,学林出版社, 1996 年版。

  思考题

  1.档案袋法的优缺点 ?

  2.根据所学的评价方法,反思自己如何更好地做好学生评价工作 ?