第六章 化学教学测量和评价 [教学重点] 化学教学测量和评价化学教学中的作用; 化学教学测量的程序; 化学教学测量的方式及类型; 化学试题的编制及试题质量分析; 化学教学评价的原则和方法。 [难点] 试题质量指标的计算、分析与标准分数 [日期] [教学过程] [引言] 化学教学系统由化学教学目标系统、化学教学行为系统和化学教学控制系统三部分组成。化学教学测量和评价是化学教学控制系统的主要因素。在化学教学中应重视化学教学测量和评价的研究,全面充分地发挥其功能,促进化学教学质量的提高。 第一节 化学教学测量和评价概述 一、化学教学测量和评价的概念 1、化学教学测量 是运用一定的工具和方式对教师的化学教学和学生的化学学习的效果、质量和水平等属性进行定性或定量的描述。这种描述结果是对这些属性分配数值,例如用考试分数定量地反映学生化学学习的效果和水平。 2、化学教学评价 化学教学评价是在化学教学测量的基础上,对所测得的数量化指标予以解释和价值判断。例如在某中学进行的一次初三化学期末考试中,一学生得了80分,这是对该生化学学习效果的测量。如果这次考试题目较容易,该生的80分成绩在其所在班级可能排在倒数几名;如果这次考试题目较难,该生的80分成绩在其所在班级可能排在前几名。这就是说,在不同情况下,80分意义也不相同。通过化学教学评价,才能对考试分数等测量结果给予恰当的判断和解释。 3、化学教学测量和评价是两个密切联系又相互区别的概念。如果没有化学教学评价,例如,判断教师化学教学和学生化学学习的好与差、优与劣、高与低等,化学教学测量便失去了意义;而没有化学教学测量,化学教学评价便也失去了依据及可行性。 二、化学教学测量和评价的作用 现代教育观认为教学测量和评价是教学系统不可缺少的组成 部分,只要有教学过程存在,就必然伴随着教学测量和评价;同时还认为教学测量和评价不只是发生在教学过程的终端,而是发生在教学过程的始终。 根据上述观点我们可以较全面地认识化学教学测量和评价的作用。 1、保证化学教学过程和化学教学目标的一致性。 化学教学过程是以实现教学目标为宗旨的,而化学教学测量和评价则是以教学目标为依据,判断教学过程是否有效地实现教学目标的。化学教学过程一旦偏离教学目标,便会在教学测量和评价中反映出来,这就促使教师按教学目标教学,学生按教学目标学习,保证了化学教学过程和教学目标的一致性。 2、调节化学教学过程使之优化 化学教学测量和评价提供的反馈信息对化学教学过程起调节作用。根据所得的反馈信息教师可调整教学内容;方法、节奏和程序,学生可调整自己的学习方式,教学行政管理部门可调整计划和管理措施等。通过教师、学生和管理部门的共同努力,使教学过程更加优化,从而提高化学教学质量。 3、鉴定师生教与学的水平 化学教学测量和评价能够对学生的化学学习质量做出鉴定与评价,为学生确定今后的努力方向和社会选拔人才提供依据。化学教学测量和评价也能够对教师教学水平做出鉴定,为教师改进教学工作和进修学习指明方向。化学教学测量和评价的结果还可以鞭策和激励师生进一步努力,提高教师教化学和学生学化学的热情。 三、化学教学测量和评价的特点 化学教学测量和评价具有教学测量和评价的一般特点,如测 量和评价目的的明确性,测量和评价过程的科学性、可行性,测量和评价结果的可靠性、可信性等等,又具有与化学教学目标内容吻合的一些特点。 1、化学基础知识的测量和评价 2、化学基本技能的测量和评价 化学基本技能包括化学计算技能和实验操作技能。化学计算基本技能测量和评价时应根据化学教学目标及学生数学基础和思维水平,注意测量的深度,使之对化学计算的测量和评价更为有效。学生操作技能属于动作技能领域,所以必然有不同于理论知识和计算技能的测量和评价方式。忽视这种差别,以纸笔测验代替实验操作技能的培养将导致化学教学质量的下降。所以,我们应该认真研究并运用切实可行的有效的方法测量和评价学生化学实验操作技能。 3、情感领域的测量和评价 培养学生学习化学的兴趣和态度,培养学生科学精神和科学方法同样是化学教学目标的重要组成部分。因此,情感领域的化学教学测量应以学生对化学学习的兴趣和态度,学生的科学精神和科学方法为主要的考评内容。教师怎样才能行之有效地测量和评价这项内容,需要在教学实践中加以认真研究和大胆探索。 第二节 化学教学测量和评价的标准 教学测量和评价的标准是人们在测量和评价活动中应用于测量和评价对象的评价尺度和界限,化学教学目标是制定化学教学测量和评价标准的依据。 一、化学教学目标的分类 化学教学目的是对整个化学教学活动所作的规定和要求。由于教学活动是分层次具体化进行的,因此有必要对各个层次具体化的教学活动水平作出具体规定。这种对某一种具体的化学教学活动所作出的具体规定和要求,就是化学教学目标。我们可以从不同角度将教学目标分类。 1、按目标内容分类 认知目标:对化学知识的了解、掌握、应用及分析和解决化学问题的能力等。 情感领域目标:兴趣、思想品德、科学态度和方法等。 动作技能目标:化学实验观察和操作技能等。 2、按目标层次水平分类 到达目标:每个学生都应达到的,对教育成果的最低限度的要求。 方向目标:对学生发展的期待和基本方向,是一种理想的,对教育成果的最大期待。 显然,到达目标是实在的、确定的。根据到达目标组织的教学内容是明确的,而方向目标给出的只是学生努力的方向,根据方向目标组织的教学内容不十分确定。 3、以实现目标的方式分类 完成目标:要求完全掌握特定的具体知识和能力的目标。 提高目标:要求朝着某一方向提高或加深的目标。 体验目标:不是要求学生有某种行为改变而是有特定的内在体验的目标。 由于目标分类方法不同,各类目标可相互交叉。例如认知领域的化学教学目标中可以有完成目标也可以有提高目标等等。 二、认知领域化学教学目标的学习水平分类 认知领域的化学教学目标既有知识要求又有能力要求,是同一学习活动的两种不同指向,当学习指向学习者内部时表现为知 识的掌握,当学习指向外部时,则表现为学习问题的解决,即知识的运用或能力的高低。 知识掌握水平越高,运用知识的可能性越大,能力发展越快。因此对知识水平进行分类不仅反映了知识本身的难易程度,而且反映了学习者的智力和能力水平。 关于认知领域教学目标学习水平分类有不同的理论。国外以布卢姆(B·S·Bloom,l913—— )的理论影响较大、应用较广。他将学习目标分为由低级到高级的六个层次,各个层次又有若干个小层次(见图)。    刘知新教授提出的中学化学教育目标的学习水平分类: 中学化学教育目标的学习水平分类说明  1·知道:查阅教材或其他资料,对知识形成大致印象 (1)查找:找出知识在教材或资料中的位置 (2)概述:说出学习材料的大意 2·记忆:记住学习材料的基本内容。注重知识"是什么" (1)辨别:辨别事实材料、概念、化学用语、实验现象及有关数据的正误 (2)回亿:记住概念的完整定义,准确描述化学事实,正确书写化学用语 3·理解:记住学习材料的要点,明确所学知识和其他知识的联系,了解知识的来龙去脉,不仅知其然,并且知其所以然 (1)转换:当知识"改头换面"后,能抓住其实质;或把握同一类知识的不同方面及其内在的一致性 (2)解释:说明事物的原因,回答"为什么" 4·简单应用:掌握知识的应用范围和适用条件,能够举一反三,学会运用某些知识解决一些简单的化学问题 (1)直接应用:模仿知识的应用方法。在判明问题情境适合于知识的应用条件后,直接代入有关规则解决问题 (2)间接应用:问题情境并不直接适合于知识的应用条件,而需要经过简单的分析、推理,对原有的知识、情境进行适当转换,然后解决问题 5·综合应用:掌握知识之间的区别和内在联系,使知识系统化。在此基础上,综合运用多种知识,解决一些较为复杂的化学问题 (1)归纳:根据问题的要求,对所学知识进行分析、比较、归纳,使之系统化 (2)推理:根据自己的观点,综合所学知识得出新的知识,然后以新知识为依据解决问题   我国中学化学教学大纲对认知领域的化学教学目标的学习水平也是分层次要求的。初中化学知识的学习要求分四个层次:常识性介绍、了解、理解和掌握。高中化学知识的学习要求分为A、B、C、D四个层次,含义分别为"对所学知识有大致印象"、"知道是什么"、"懂得为什么"、"能够应用"。由于化学知识的学习和相关能力的培养是中学化学教学的主要内容,因此,认知领域化学教学目标是中学化学教学目标的主体,其学习水平的分类既有利于教学也有利于化学教学测量和评价标准的确定。 第三节 化学教学测量 化学教学测量是化学教学过程中不可缺少的环节,也是化学教学评价的依据。化学教学测量通常采用命题测验或考试方法进行,而测验与考试又可采取多种形式。 一、化学教学测量的一般步骤   1、明确测量目的和内容 在进行化学教学测量之前必须明确测量目的,即为什么测量,例如是测量学生对化学基本概念掌握的程度还是测量学生的化学计算技能的熟练程度?测量目的确定了,测量内容就容易确定了。   2、确定测量工具和实施测量 在化学教学中,常用通过精心设计的试题作为化学教学测量的工具。用试题刺激学生,使学生运用已学过的化学知识,通过思维操作对试题作出反应(给出答案),这就是实施测量的过程。 3、对测量结果赋值 对测量结果赋值是测量的第二个步骤,如用直尺测量桌子的长度后,要以多少尺或多少米报出结果。对化学教学测量结果赋值通常用分数(如百分制分数,标准分数,T分数等)或等级(如"甲、乙、丙、丁","A、B、C、D","优、良、中、差"等)。 二、化学教学测量的方式 1、口头方式 化学教学过程中的提问及某一阶段化学教学结束时的口试或是谈话均为口头测量方式。 2、书面方式 化学教学中书面测量方式有课堂内外的书面作业、实验报告、调查报告、小论文以及书面测验或考试。我国现行化学教学中,以书面测量方式为主。 3、实验方式 实验测量方式就是通过学生按要求完成某些内容或某个阶段的实验过程,包括仪器配置、实验操作、现象观察及解释、数据记录和处理等环节,测量学生化学知识和技能的掌握水平。这种测量方式在化学教学中使用的范围将逐渐扩大。   三、考试的类型 由于考试的目的、方式、时间、对象等的差异,考试有不同的类型。   1、按教学进程分类 (1)诊断性考试 诊断性考试是在化学教学过程开始前进行的考试;目的在于摸清学生对即将学习的新内容具有的基础知识状况和能力状况。 (2)形成性考试 形式性考试是在教学过程中进行的考试,目的在于检查所进行教学的效果如何,即学生对所学的内容掌握情况及教学目标达到的情况。 (3)终结性考试 终结性考试是在某一阶段教学过程结束时进行的考试,目的是总结这一阶段的教学情况,反映学生的学习成绩及教师的教学水平。 2、以考试参照点的差异进行分类 (l)目标参照考试 目标参照考试是以达到教学目标为参照点的考试。这类考试的目的在于检查学生的学习状况与教学目标之间的差异,而不比较学生个体之间学习状况的差异。例如,某学生化学考了60分,说明该生达到所考内容的化学教学目标程度为60%。 (2)常模参照考试 常模参照考试是以参照群体(又称常模团体)的成绩作为评价学生成绩的依据,进而指出学生成绩在某一群体中的相对位置的考试。这种考试注重学生个体之间学习状况的差异。一个学生的 成绩只有与所属考生群体平均成绩相比较才有意义。 除了以上几种考试类型外,还可从不同侧面将考试分为:选拔性考试、水平考试、成就考试、常规考试及标准化考试等。 四、化学试题的编制 为保证化学试题的质量,应重视化学试题的编制工作。一般有如下步骤: 1、设计命题计划 命题计划是编制试题的指导和依据。如果命题计划订得合理、准确,则可避免测试的盲目性和主观随意性,为达到测试目的提供了保证。 首先要决定测试的目的,测试目的不同,题目内容的选择、编排均不同; 其次要解决试题的容量,使答题所需时间和给定时间相一致; 再者要解决各类题目的比例。 明确上述问题后,便可根据化学教学目标、教学内容、参加测试的对象的水平以及测试的目的要求设计命题计划。通常命题计划以命题双向细目表的形式呈现。 命题双向细目表是考试目标和考试内容以及学习水平分类的列联表。表7-2、表7-3分别是高一化学第一学期期末考试命题双向细目表及化学高考命题双向细目表。 命题时,原则上根据表中各项要求和比例确定试题的内容和份量(数量和学习水平);命题完成后,再根据命题双向细目表检查其对所教学的化学知识的覆盖面和要求层次是否符合测试目的。 2、不同类型题目的编制 不同类型题目有不同的性质特点,在考试(测验)中的作用也不完全一样。编制试题时应对不同类型题目的特点和编制要求有所了解。化学考试测验中常见的几种题目类型如下:  不同类型的题目有不同的性质特点。桑代克等人总结了各类题目的应用范围,见下表:  在化学教学测量中,上述各类题目都被使用,但化学试卷中选择题、填空题、问答题使用得最多。近年来客观性试题在化学试卷中的比例有增大的趋势。 编制不同类型的题目有不同的要求和技巧。例如编制选择题时应注意题干中应包含尽可能多的内容,备选答案要尽可能简短,同时注意备选答案既要有较大的迷惑性,作为正确答案的选项又要明确而不易引起争议;编制填空题时应注意一道题中空格不宜过多也不宜出现在句首,以便于学生了解题意,空格处应是那些带关键性的词,同时要注意避免一空多答;编制简答题时应注意选择"简单应用“以上的学习水平作为命题依据,对题目的答案范围有明确、具体的限制等。不论编制何种类型的题目都要注意文字简明、题意清楚,而且题目的答案要有可靠的依据。 五、化学试题的质量分析 只有化学试题质量符合要求,对化学教学测量的结果给予评价才有意义。通过化学试题质量分析,能为进一步修改试题提供依据,有助于提高化学命题的技能技巧,也有助于化学试题库的建立。 试题质量的高低,可以从以下几个方面考虑: 考试结果是否可靠?评分是否客观准确?评出的分数是否反映了学生的水平?考试是否有效?是否考了应考的内容?是否达到了考试目的?考试试题的难易程度如何?是否有鉴别作用?能否把不同水平的学生区别开来了 对试题质量的高低可以通过若干指标加以评价。 1、试题的信度 试题的信度是指试题质量的稳定性、可靠性程度。信度指标表示同样试题几次测验后所得结果的一致性或可以再现的程度。信度值最高为1,表示试题可靠稳定,所得成绩结果反映学生学习 的实际情况,完全不受偶然因素的影响。信度值最低为0,表示试题不可靠,所得考试结果完全是随机的,受偶然因素影响极大,与学生学习的实际情况毫不相关。对于较大型的考试,例如考生在500人以上,信度要求在0·80以上,对于年级考试,信度在0·60 以上就可以了,信度低于0·50的试题或试卷需重新调整或修改。2、试题的效度 效度是表示试题或试卷正确性、有效性的指标,反映考试是否考了应考的内容,是否达到了考试目的。按化学教学要求来说,主要考虑内容效度和效标相关效度。 (1)内容效度 内容效度是指根据考试目的确定的测量内容引起的预期反应达到考试目的的程度。考试内容越能代表教学大纲所规定的教学内容,则试卷的内容效度就越高,反之则低。对试卷内容效度的评价,可将试题按教学内容特点分类,做出内容效度统计表(见下表 广东省化学高考试题内容效度统计)。  如果试卷内容分布与命题双向细目表分布一致,内容效度就高,反之则低。 (2)效标相关效度 效标是指考试有效性的参考标准。如从高考分数与模拟分数的相关性,可以知道模拟试卷的效标相关效度。效标效度系数最高为1,表示考试完全反映了要考的内容。效标效度系数最低为0,表示考试完全与要考的内容无关。一般要求试题或试卷的效标效度系数大于0.3,校标效度系数大于0.5为质量好的试卷。 3、试题的难度 表示试题的难易程度的指标为试题难度。难度值以P表示。通常,人们使用"得分率"作为试题的难度指标,其计算公式如下: P = X / W 式中X为该试题平均得分,W为该试题满分分值。如某试题满分为10分,平均得分为6分,则 P = 6/10 = 0.60 P值越小,试题难度越大。一般考试试卷中多数试题P值在0.3——0.8之间,试题p值大于0.8或小于0.3,即试卷中试题总的难度适中。如果一次考试希望既要选拔最高水平的学生又要确定需要个别辅导的差学生,则试卷难度分别为0.10、0.50、0.90的试题应各占至三分之一。 4、试题的区分度 区分度是衡量试题区分不同水平学生的指标。区分度高,表 示试题或试卷能较好地区分不同水平的学生,即高水平学生得高分,低水平学生得低分。区分度以D表示。D值的计算常用相关系数法和得分率求差法。 (1)相关系数法 参加考试学生个体其总分的高低是由每一道试题得分的高低决定的。总分高的学生,其相应每一题都应得到较高的分数,反之亦然。这就是说,当考生在每道试题上的得分与其总分是正相关时,考试成绩好的学生,在该试题应得高分,说明该试题区分度好。若正相关性越强,则表示试题区分度越高。由积差相关公式可得D值的计算公式:  式中D为试题的区分度,n为考生总人数,Xi为该试题各个考生的得分,Yi为对应于Xi考生的总分。应用相关系数法求得的D值具有普遍意义:若D <O.2,则认为该试题的区分度较差,一般予以删除;若0.2< D <0.4,则认为该试题的区分度一般,应加以改进;若D> 0.4,则认为该试题有较好的区分度。 (2) 得分率求差法 得分率求差法又称约翰逊法。其具体方法是将占参考总人数27%的总分高的学生作为高分组,将27%总分较低的学生作为低分组,该试题高分组学生平均得分率与低分组的平均得分率之差,就是该试题的区分度。 区分度与难度有关系。一般难度值为0.3一0.8的试题区分度较高。试题难度值接近0.5时,试题的区分度值接近最大。区分度相同的题目其难度值可能不一样,在这种情况下P值小的试题所能区分的是高分组的学生,p值大的试题所能区分的是低分组的学生。为了对全部参加考试的学生都能够有所区分,需要试卷中全部试题都有必要的区分度,且难度不同的题目比例也要适当。 5、差异量数(标准差) 一组数据有围绕一中心位置的分布范围,规定这一分布范围的统计量数称为差异量数。差异量数表明了众多数据的离散程度。标准差就是描述这一数据离散程度的最常用的统计量数。标准差符号为S,其计算公式如下:  利用标准差可以对试题质量作初步评价。如果一个班学习成绩比较整齐,考试结果分数分布相对集中,标准差较小,符合学生实际情况,说明试题质量合格;如果一个班学习成绩参差不齐,考试结果分数分布离散,标准差大,且符合学生实际情况,则试题质量也合格。 六、标准化考试 1、什么是标准化考试 为保证考试的准确性、可靠性和可比性,在现代教育测量中,常以常模作参照标准,按系统科学的程序严格控制考试进度和误差来评价学生的学习成绩。这种客观测量学生成绩的方法就叫标准化考试。 标准化考试的特点 是教育测量全过程的标准化,具体包括命题过程标准化,施测过程标准化,评分计分方法标准化以及分数解释标准化。 2、标准化考试的基本程序 (1)编制双向细目表 经过调查研究,依据学科教学大纲和教材以及考试目的,编制双向细目表。 (2)制定考试大纲 考试大纲的基本内容包括:考试的目的和要求,考试的内容和 范围,考试的方法和形式,样题,评分及分数解释方法等。 (3)命题 借助双向细目表编写试题,然后对所编制的试题进行预测。预测的目的是为了检查试题的难度和区分度,了解完成试题所需要的时间,决定试题长度,提出修改方案。对预测后符合要求的试题,按考试大纲中规定的考试目的和要求拼接试题合成试卷。 (4)实施考试 标准化考试强调实施过程各环节标准化,包括试卷印刷、保管、分发以及考场管理的标准化。 (5)给出原始分数 考试结束后,制定评分细则及评分标准,进行阅卷及给出原始分数,这一过程也要求达到标准化,以减少主观因素的影响。 (6)考试结果的解释 这一过程包括建立代表性好的常模,以此为参照点,将卷面的原始分数转化为导出分数加以比较,使考试结果的解释更为客观、明确、合理。 教材197页图6-1给出了我国高考招生的标准化考试的程序。 3、标准化考试的优点及局限 标准化考试与一般的考试相比有如下优点: (1)减少无关因素对考试目的的影响,最大限度地减少考试 误差,使考试结果比较准确、可靠;(2)使不同的考试分数具有可比性;(3)同一套考试有多个复本可反复使用,比较经济;(4)可用来校准其他考试。 标准化考试的局限性。 如标准化考试只是减少了考试误差并不能排除所有的考试误差,对试题或试卷的信度、效度、区分度等指标的检验是建立在一种理想化假设之上的,与考试实际难免存在偏差;同时,标准化考试并不适用于所有学科,如语文学科的标准化考试对语文教学,特别是学生的作文水平已产生了不良影响。在化学教学测量中,应吸取标准化考试长处,结合化学教学目标和化学学科特点,在可能条件下尽量减少考试误差,提高测量的科学化水平。 第四节 化学教学评价 一、化学教学评价是指通过对化学测量结果的评定和解释,对学生学化学和教师教化学的效果、质量和水平进行定性、定量、客观科学的比较和判定的过程。 二、化学教学评价的类型 化学教学评价由于评价对象、目的和实施时间不同而有不同 的类型。 1、按评价对象分类,化学教学评价可分为:(1)学生化学学业成绩 评价;(2)教师化学教学质量水平评价。 2、按评价内容分类,化学教学评价可分为:(1)对学生化学知识学习成绩的评价;(2)对学生化学动作技能的评价;(3)对学生情感领域达成情况的评价。 3、按评价目的不同,化学教学评价可分为: (1)诊断性评价,目的是确定学生学习化学新知识所具备的基础知识水平; (2)形成性评价,目的是了解教学过程中存在的问题; (3)总结性评价,目的是评定某一阶段学生化学学业成绩。 4、按评价实施时间分类,化学教学评价可分为: (1)单元教学评价;(2)学期教学评价;(3)学年教学评价。 5、按评价标准和方法分类,化学教学评价可分为:(1)相对评价;(2)绝对评价。 三、学生群体学业成绩的评价 在化学教学实践中,常需要对学生群体的化学学业成绩进行评价,其目的是一方面了解学生群体在不同时期的整体化学学习 水平,以确定该群体化学学习水平是提高了还是下降了,这是学生群体化学学业成绩的纵向比较;另一方面了解不同学生群体,如不同班级、不同学校整体化学学习水平的差异,这是学生群体化学学业成绩的横向比较。通过学生群体化学学业成绩纵向或横向比较,分析影响学生化学学习的因素,研究并制定切实可行的改进化学教学的方案,以提高学生整体的化学学习水平。学生群体化学学业成绩的比较和评价可通过如下方法: 1、对学生化学考试分数分布情况进行分析 在已知参加化学考试的学生群体分数分布接近正态分布的前提下,当学生群体化学考试分数分布呈现几种典型形态时,可对学生群体的学习成绩作如下分析。 正态分布:说明该学生群体化学学习成绩正常,即大部分学生处于中等水平,优秀学生和差学生比例都比较小。 正偏态分布:说明该学生群体化学学习成绩较差的学生偏多,成绩较好的学生偏少,整体水平不高。 负偏态分布:说明该学生群体化学学习成绩较好的学生偏多,成绩较差的学生偏少,整体水平较高。 双峰型分布:说明该学生群体化学学习存在两极分化现象,即一部分学生学习成绩优秀,另一部分学生学习困难,这是最不利于组织班级教学的一种分布型态。 平坡型分布:说明该学生群体中化学学习成绩好、中、差比例 接近,学生间差异偏大。 陡峭型分布:说明该学生群体化学考试成绩比较集中,学生间差异小。 2、根据化学考试的平均分和标准差进行分析 平均分可以反映出学生群体化学考试成绩的平均水平。通过比较被评学生群体的平均分和参加考试的学生总体间平均分的差异,可以知道被评学生群体在学生总体中的大致位置。 当需要了解学生群体化学考试平均分对学生群体成绩代表性如何时,需要用考试分数的标准差加以说明。标准差越大,说明考试分数间的差异越大,分数分布越不均匀,则平均分的代表性越差,反之,标准差越小,说明考试分数分布越集中,平均分的代表性就越好。 四、学生个体化学学业成绩的评价 1、相对评价的标准与方法 相对评价也称常模参照评价,是一种以学生个体的成绩与同一群体的平均成绩相互比较,确定该生的程度或水平的评价方法。这种评价方法可以指出学生个体成绩在群体中的相对位置或名次。用这种评价方法有利于人才的选拔。这种评价方法对于基础差的学生来说缺少激励作用,因为即使通过努力,学生个体的成绩实质上提高了,但只要他的成绩在群体中的相对位置不变,其评价结果仍没有变化。 相对评价的标准——标准数值,是一种常模分数,指用以确定学生个体成绩在参照群体(常模团体)学生成绩中的位置的分数。在使用常模分数时应与被评价学生特质相同,这对具有同类特质的所有学生总体有很好的代表性。被参照的常模团体可以根据化学考试的目的、内容和被测学生的特点加以确定。例如,要确定学生个体在其所在班级的化学学习水平,可以以班级学生的平均水平作为班级的常模;要确定学生个体在全区或全市的化学学习水平,则应以全区或是全市同级学生化学考试平均水平作为全区或全市化学成绩常模。 常模分数有以下几种具体的表示方法:标准分数、T分数、百 分等级分数。 ① 标准分数。标准分数又称Z分数,是以标准差为单位,表示 一个原始分数在团体中所处相对位置的量数,即表示某个原始分 数在平均分上或平均分下有多少个标准差,其计算公式如下:  式x为任一考生的原始分数,X为同次考试中全体考生平均分,S为考生分数分布的标准差,Z是某考生的标准分数。 当Z=0时,学生成绩处于团体平均水平位置; 当Z=1时,学生成绩高于团体平均水平一个标准差; 当Z= -1时,学生成绩低于团体平均水平一个标准差。 因此从Z分数是大于零、小于零还是等于零就很容易判断该生化学学习成绩是处于团体平均水平之上还是之下,或是相当于团体平均水平。 例如,某班化学考试成绩平均分X=80,标准差S = 4,则该班级8名学生的化学成绩的标准分如下表所示。  算出Z分数后,还可以根据正态分布曲线图(如图7-4所示)  或正态分布表,求出学生个体在群体中所处相对位置和名次。例如,某生Z分数是1(即1S),可知他的分数比平均分多一个标准差,比他分数低的考生占84.13%,比他分数高的考生占15.78%,如果考生群体是100人,则该生在其中处于第16名的位次。 用标准分数很容易确定某一分数在正态分布曲线中的具体位置,而且各种成绩由原始分数转换为标准分数后,就可以进行比较和加合来考察各科水平的差异以及总体水平的高低。 标准分具有可比性和可加性。可用来评价一个学生的学习成绩在团体中处于什么位置,如表7-7所示,  也可用来评价一个学生在不同学习阶段其成绩处于团体中的位置,如表7-8所示。  ② T分数。由于Z分数有负数和小数,所以给成绩统计分析带来不便,也与日常教学中的评分形式不一致。美国教育测量专家麦柯尔建议将Z分数转换为T分数,其转换公式如下: T = 10Z + 50 根据正态分布的结果,标准分Z < -5和Z>5的可能性小于0.13%,所以转化成T分数后,标准分数一般就不再有负数和小数了。T分数的平均数为50,标准差为10,由原始分数转换成T分数时,如果大于50分,在平均分以上;若小于50分,则在平均分之下。 T分数实际是由标准分数派生出来的标准化分数。在麦柯尔的T分数转化公式基础上,又派生出其他的标准化导出分数。如著名的托福(TOEFL)考试是按下式报告成绩的: TOEFL分数 = 70Z + 500 ③百分等级分数。百分等级是指在常模团体中,某分数以下的人数的百分比。百分等级分数是把常模团体的全体学生分为100份,按被评学生的原始分数换算出其在常模团体中的相对位置所达到的一种导出分数,常用PR表示。 例如某学生化学考试成绩为65分,班上有50名学生,其中30名的分数低于65分,则该生在班上化学成绩以百分等级分数表示为: PR = 30/50*100 = 60分 这表明在该班中有60%的人数得分低于65分,即比该生成绩差的学生有60%。PR 越小,表明所处相对位置越低,成绩越差。 百分等级属于顺序量表,百分等级的差异与测验分数上的差 异不成比例,其单位是不等的,因而无加合性,这是使用百分等级分数的不足之处。但百分等级分数也有其优点,无论考试分数的 分布是否是正态分布(小范围考试分数分布往往不是正态分布),都可以用它表示学生在团体中的相对位置,而且百分等级分数计算也比较简单,在教学评价中应用十分广泛。 2,绝对评价的标准和方法 化学教学的绝对评价以化学教学目标为标准,所以也称为目标参照评价。绝对评价用以判断学生对指定学习的化学知识和技能达标的程度。 用以绝对评价的分数称为目标参照分数。利用目标参照分数,教师可以诊断学生学习中的困难,学生可以发现自己目标达到的状况。如果被测学生所要求达到的教学目标相同,则可以比较群体中学生的目标参照分数。目标参照分数有如下三种: (1)掌握分数。掌握分数是说明学生是否达到教学目标所要求的最低标准而设置的一种目标参照分数。它是以学生答对多少道体现教学目标的试题为标准。学生对试题作出正确反映的百分率在什么范围才算达到教学目标所要求的最低标准呢?有的学者提出在80%一90%范围内,布卢姆提出在80%一85%之间,我国学者认为在70%一85%范围内较为合适。一旦最低标准确定,掌握分数就可以以二分法记分,如及格一不及格,通过一不通过等。 掌握分数常用于那些能够确定出可能接受的最低标准的资格考试或成就考试。 (2)正确百分数。正确百分数是指学生答对题目所占百分比,即: 正确百分数 = (答对题目数 / 题目总数)*100% 当测试题目是测量目标的代表性取样而测量目标又是教学目标的具体体现时,正确百分数表示学生对所要求的教学目标达到的程度。正确百分数越高,说明学生对教学目标掌握得越好。与二分法记分的掌握分数相比,正确百分数可以对学生起到进一步的区分作用,只是在对正确百分数比较对应时应注意两点:一是对于取样范围不同、难度不同的考试,正确百分数的意义并不相同;二是在同一次考试中,正确百分数相同的学生由于答对的题目不尽相同,其分数的意义也不完全相同。 (3)等级分数。等级分数是把学生对教学目标达标程度或是学生的某种能力、技能或品质分成若干个等级,每个等级赋予某一分值或等第,如五级分数: 优——熟练掌握教学目标(答对率在90%—100%) 良——熟练掌握主要教学目标和大部分次要教学目标(答对率在85%—94%); 中——能掌握主要教学目标和少数次要教学目标(答对率在75%—85%) 及格——仅掌握一些主要教学目标和次要教学目标(答对率在65%一74%); 差——教学目标未掌握(答对率在64%以下)。 几种目标参照分数的表示方法可概括如表7-9所示。  思考与实践 1、化学教学测量和评价有何作用? 2、化学教学评价的特点是什么? 3、简述化学教学测量的一般步骤。 4·列表比较各种考试的功能。 5·简述化学认知领域学习水平分类情况。 6·比较相对教学评价与绝对教学评价异同。 7·设计一份初中化学终结性考试实施方案。 8·拟一份高中一年级第二章化学形成性考试试卷。 主要参考文献 1·刘知新,王建成.化学教育测量和评价.广西教育出版社,1996 2·刘知新,化学教学论,第2版·北京:高等教育出版社,1997 3·舒元梯,化学教育研究,电子科技大学出版社,1995 4·于信凤,考试学引论,沈阳:辽宁人民出版社,1987 5·候光文,教育评价概论,武汉:河北教育出版社,1996 6·张玉田,学校教育评价,北京:中央民族大学出版社,1998 8·陆 震,中外学校教育考试制度探讨,北京:高等教育出版社,1997