第三节 数学学习水平评估举例   学习水平评估是教学评估的重要组成部分。全国第一次初中数学教学抽样调查的报告科学地评估了1987届初中学生的数学学习水平,从中可以进一步看出数学学习水平评估的意义、内容和方法。这次教学调查采用分级分层整群随机抽样方法,从京、津、晋、沪、苏、皖、粤、鄂、桂、陕、甘、吉、黑、川、滇等15个省(自治区、直辖市)抽取605所学校的49603名学生作为调查对象。调查方式主要是对学生进行数学测试。以数学教学大纲为依据所设计的测试题(见附件一)分为Ⅰ试和Ⅱ试,Ⅰ试中全是客观性试题,主要考查数学基础知识,满分为100分;Ⅱ试中全是陈述性试题,主要考查数学基本技能和能力,满分也为100分。命题时设想两试成绩之和不低于120分为数学学习的合格水平。   一、全体被试的数学学习水平   全体被试的两试总平均成绩为130.89分,其中Ⅰ试平均成绩为73.73分,Ⅱ试平均成绩为57.16分。这表明全体被试在数学基础知识、基本技能和基本能力方面的平均成绩达到合格水平,并且达到数学教学大纲规定的基本要求。   全体被试两试成绩的标准差为52.41分,表明学生成绩的离散程度是相当高的,数学学习水平也很不平衡。Ⅰ试和Ⅱ试的变异系数(标准差除以平均分)分别为0.32和0.53,则进一步反映学生在基本技能和能力方面的离散程度高于在基础知识方面的离散程度。      从Ⅰ试的成绩分布(图4-3)可以看到,成绩高于80分的学生占51.6%,这一部分学生较好地掌握了数学基础知识;但尚有26%的学生的成绩低于60分,他们对基础知识掌握得较差。图4-3述表明,学生的比率对测试成绩呈递增趋势。从Ⅱ试的成绩分布(图4-4)可见,成绩高于80分的学生占28.8%,这一部分学生较好地掌握了数学基本技能和能力;但成绩低于60分的学生的比率高达47.8%,这一部分学生的数学技能和能力较差。图4-4还表明,全体学生的数学技能和能力处于“两头大、中间小”的分布状态。从Ⅰ、Ⅱ两试的成绩分布(图4-5)可见,成绩高于120分的学生仅占62.7%,这一部分学生达到了数学教学大纲所规定的基本要求;但处于合格水平以下学生的比率是很高的。图4-5还表明,学生的比率对测试成绩呈递增趋势。    二、各省被试的数学学习水平   从各省的平均成绩(表4-2)可以看到,11个省的两试平均成绩都超过120分,其中5个省超过140分;Ⅰ试平均成绩超过60分的有14个省,其中5个省超过80分;Ⅱ试平均成绩超过60分的只有7个省。这就是说,有三分之一的省在这次测试中取得了较好的成绩,另有三分之一的省的成绩不够理想。   通过考查各省学生成绩的标准差(表4-2),可以进一步发现,各省内部学生水平的离散程度也非常高,并且成绩较低省的情况更为严重。比较Ⅰ、Ⅱ两试成绩的变异系数还可以看到,各省普遍    存在着Ⅱ试成绩的离散程度高于Ⅰ试成绩的离散程度的现象。尽管成绩的离散程度有随着成绩的增大而减小的趋势,但是Ⅱ试成绩变异系数与Ⅰ试成绩变异系数比值的高低和成绩高低之间并无联系。   三、各校被试的数学学习水平   从各校Ⅰ试、Ⅱ试平均分的频率分布(表4-3)可以看到,有466所学校的Ⅰ试的平均成绩超过60分,占学校总数的77%,学生数占79.2%;有263所学校Ⅱ试的平均成绩超过60分,占学校总数的43.5%,学生数占44.6%。可以认为,有五分之四的学校在基础知识的教学上基本上达到了要求,有五分之二多一些的学校在基本技能和能力的教学上基本上达到了要求。从Ⅰ、Ⅱ两试平均分的频率分布(表4-4)可以看到,Ⅰ、Ⅱ两试的总平均成绩      超过120分的学校有372所,占学校总数的61.5%,学生数占63.8%;另有57所学校两试的总平均成绩低于80分,占学校总数的9.4%,学生数占7.7%。总的来看,有五分之三的学校数学教学基本上达到了要求,但有近十分之一学校的数学教学质量很差。   各校总平均分的标准差为35.24分,说明学校与学校成绩之间的差距也比较大。成绩最好的学校两试总平均成绩为198.08分(其中Ⅰ试平均成绩为99.54分,Ⅱ试平均成绩为98.54分),成绩最差的学校两试平均成绩仅为27.99分(其中Ⅰ试平均成绩为22.26分,Ⅱ试平均成绩为5.73分),相差170.09分(Ⅰ试相差77.28分,Ⅱ试相差92.81分),也说明了这个问题。   所有被调查学校中,属于厂矿、城市、城镇和农村的学校分别有33、83、47和422所,相应的学生数分别为2524、8778、5023和33278。按1986年初中会考成绩排序,把城市学校序列、城镇学校序列、农村学校序列各截成上、中、下三层,使其学生数依次占该类学生总数的25%、50%、25%。为了简便,我们用K1、K2、K3分别表示城市的上、中、下三层学校;用K4、K5、K6分别表示城镇的上、中、下三层学校;用K7、K8、K9分别表示农村的上、中、下三层学校;对厂矿学校,统一用K0表示。现在进一步考察这十类学校学生的数学学习水平。十类学校学生的平均分和标准差如表4-5所示。这十类学校学生的平均分按由大到小的次序排列为K1、K7、K4、K8、K9、K5、K2、K0、K3、K6。从十类学校学生成绩的标准差来看,K4的成绩最为稳定;K1,K7次之;K9的成绩波动最大,K0,K8次之。平均分与标准差的相关系数为-0.71,则反映了成绩越好水平越稳定的趋势。对十类学校学生成绩的两个主成分(有关主成分分析的原理和方法,可见参考书[12])值(表4-6)进行聚类分析,其结果如图4-6所示,由图表明,十类学校构成七个水        平层次,A.K1;B.K7,K4;C.K8;D.K9,K5,K2;E.K0;F.K3;G.K6。从中可以发现,城市中的上层学校成绩最好,属第一级水平;城镇和农村的上层学校比城市的上层学校差,但彼此成绩接近,同属第二级水平;农村的中层学校成绩优于城市、城镇的中层学校,为第三级水平;而农村的下层学校与城市、城镇的中层学校成绩接近,同为第四级水平;厂矿学校、城市下层学校和城镇下层学校分别为第五、六、七级水平。相邻各级水平之间的距离,按照从小到大的顺序是AB、DE、FG、BC、EF、CD。   四、男女学生的数学学习水平   全体被试中,男女学生各占58.1%和41.9%。从表4-7可见,男学生的I试、II试、I、II两试的平均分都大于女学生相应的平均分,分别相差2.72分、3.25分和5.97分;I试男学生成绩的标准差小于女学生成绩的标准差,II试、I、II两试都恰好相反。由独立大样本平均数差异的U检验可知,在5%的显著性水平下,男女学生I试、II试、 I、II两试的平均分都有显著差异。与直接比较平均分所不同的是,男女学生I试平均分差异的显著性程度高于男女学生II试平均分差异的显著性程度。    从表4-8可见,在15个省中,有14个省男学生的I试、II试、I、II两试的平均分都大于女学生相应的平均分。从表4-9又可见,只有5个省男女学生I试、II试,I、II两试成绩标准差的大小与全体被试中男女学生的情况相同。由独立大样本平均数差异的U检验可知,有7个省男女学生I试、II试、I、II两试的平均分都有显著差异,另有4个省I试、II试、I、II两试的平均分都无显著差异。   五、数学知识和能力水平   数学教学大纲指出,“中学数学的教学目的是:使学生学好从      事社会主义现代化建设和进一步学习现代科学技术所必需的数学基础知识和基本技能,培养学生的运算能力、逻辑思维能力和空间想象能力,以逐步形成运用数学知识来分析和解决实际问题的能力”。这次数学测试,I试侧重于基础知识的考查,II试侧重于基本技能和能力的考查。经统计, I、II两试得分的相关系数为0.87,表明知识和能力的水平具有高度一致性,掌握基础知识情况的好坏直接影响到基本技能和能力水平的高低。从I、II两试的成绩来看,I试的得分率为0.74,II试的得分率为0.57。再从双向细目表(见第三章第一节)中“了解”、“理解”、“掌握”和“灵活运用”四部分题目来看,前两部分题目侧重于基础知识的考查,后两部分题目侧重于基本技能和能力的考查,它们的得分率分别是0.74、0.71、0.59和0.25。这些都表明学生基础知识的水平优于基本技能和能力的水平。   测试涉及的代数内容可划分为数、式、方程、函数、解三角形和统计初步等几个部分。这几部分的得分率见表4-10(其中方程和解三角形的得分率在括号外和括号内的数分别表示不包括II试第10题和包括II试第10题的得分率)。从中可以看到,式的运算掌握得相对较好,而方程、解三角形和统计初步则相对较差。造成解方程内容得分率偏低的主要原因是与一元二次方程有关的内容没有掌握好。进一步的统计分析,I试中,考查求根公式和根的判别式的两个基本题,得分率都只有0.61,II试中解无理方程题目的得分率也只有0.63,低于方程的平均得分率。与解三角形有关各题的得分率见表4-11。从中可以发现,除了余弦定理以外,与斜三角形有关的题目的得分率并不低于解直角三角形题目的得分率。而运用余弦定理求三角形边长题目的得分率偏低,部分原因是由于学生解题时粗心大意,最后遗漏了取算术平方根。因此,造成解三角形这部分内容得分率偏低的原因不在于解斜三角形内容偏难,而在于学        生综合运用知识的能力不强。考查统计初步的唯一一道题目得分率不高,主要是由于目前初中对这一单元的教学不够重视,约有17%的学校根本不教这一单元。   测试涉及的几何内容可划分为直线、直线形、面积与勾股定理、相似形、圆、轨迹与作图等几方面的内容。这些内容的得分率见表4-12。从中可以看到,直线和相似形这两部分内容掌握得比较好,而圆和作图这两部分内容掌握得比较差。从与圆有关的各题的得分率(表4-13)来看,圆这部分内容的成绩不够理想,一方面是由于个别知识点未掌握好,如圆弧长的计算这一题是I试所有题目中得分率最低的一题,其原因是学生没有在理解的基础上记    住弧长公式,一旦公式被遗忘,题目也就无从着手解决了;另一方面是由于学生思维的灵活性和严密性还比较差,遇到需要添加辅助线的题目,就会产生种种问题。例如,II试第8题需要综合运用垂径定理、切线的性质和相交弦定理,与几何证明题的第9题相比,需要综合运用的知识并不太多,综合的程度也不很高,就是因为该题需要添加辅助线,得分率就比第9题的0.62低。一些学生由于不会添加合适的辅助线而不能解题,另一些学生虽然添上了辅助线,但却毫无理由地直接用图上观察得到的结果作为论证的依据。圆这部分内容的得分率较低,重要的原因在于学生逻辑推理能力的缺陷,而不单纯是由圆这部分内容本身所造成的。