第 6章 教育管理信息化
6.1 教育管理信息化标准
6.2基于网络的教育管理
6.3 计算机辅助测验( CAT)
6.1 教育管理信息化标准
21世纪,飞速发展的信息技术缩短了时间,空间,导致教育的全球化,从而改变了我们对传统教育组织结构的认识,教育新体制,新模式,
新内容出现的同时,教育管理的一系列问题也凸现出来了 。 在推动教育信息化过程中,首先要解决教育管理信息化问题 。
6.1.1制约教育管理信息化的问题
6.1.2教育管理信息化的现状和发展趋势
6.1.1制约教育管理信息化的问题目前我国教育管理现状不如人意的 原因很多,本节仅就教育管理信息化规范方面加以分析,其主要问题如下:
1.缺乏完备的教育管理信息规范
2.软件设计不规范
3.缺乏完整的网上信息交换规范
4.缺乏对教育管理信息化工作的指导和管理以上问题说明需要尽快制定与教育管理信息化相关的标准,引导全国教育管理信息化工作向规范化方向发展。
6.1.2教育管理信息化的现状和发展趋势推进教育领域的,电子政务,—— 教育管理信息化,
是实现信息技术环境下提升教育教学效率,效果的有效途径,也是当今教育领域亟待解决的问题 。
教育管理信息的标准化是整个国家教育管理信息化建设的基础,是实现全国范围内教育信息资源交流与共享的必要条件 。 为尽快制定与当今信息技术和教育管理信息化需求相适应的标准和规范,教育部于 1999
年开始由发展规划司和教育管理信息中心组织,专门成立了专家组,顾问组和课题组,研究制定我国,教育管理信息化标准,,课题组先后收集了大量信息,
并在全国各地开展试点工作,广泛征求各方面的意见 。
此项工作历时三年,于 2002年 9月,教育部正式颁布了,教育管理信息化标准,( 简称,标准,) 的第一部分,学校管理信息标准,
6.1.2教育管理信息化的现状和发展趋势
,标准,颁布后,教育部采取一系列措施推动,教育管理信息化标准,的实施,2003年出台了,教育管理信息化标准,实施办法;开展该标准的应用示范工作,在全国选择部分有条件的地区建立教育管理信息化标准应用示范区;统筹组织建设覆盖不同区域的教职工数据库,文凭数据库,学生信息库,校舍信息库,
就业信息库等基础数据库;建立教育管理软件认证制度等 。
,教育管理信息化标准,颁布,实施是中国教育信息化进程中一个重要的里程碑,标志着我国教育管理信息化工作开始朝着网络化,标准化,一体化的方向发展 。
6.2基于网络的教育管理
6.2.1网络教育系统构成及其功能
6.2.2网络教学模式
6.2.3网络教育管理
6.2.4网络教育资源管理
6.2.5网络教育平台典型案例
6.2.1网络教育系统构成及其功能
1.什么是网络教育系统网络教育系统是指以网络为主要媒介、用于支持教师教学和学生学习,能为教师、学生提供信息、工具和服务的系统,它由软件系统和硬件系统构成。
网络教育系统除了具有一般计算机网络的基本功能如共享网络中的软件硬件功能,电子邮件服务,文件传输服务等之外,还应具有交互性,即时性,开放性,
资源共享性等特征,以及能提供丰富的教育资源,自动进行教育信息管理等功能 。
6.2.1网络教育系统构成及其功能
2.网络教育系统的构成
从网络教育系统提供的资源的形态来看,网络教育系统由教育环境资源,教育信息资源,教育人力资源构成 。
从网络教育系统提供的管理,服务功能来看,网络教育系统由网上教学管理系统,网络教学平台和教学资源管理系统三部分构成 。
从网络教育系统所需要的支撑来看,网络教育系统由硬件支撑,软件支撑和教学资源三部分构成 。
6.2.1网络教育系统构成及其功能
3.网络教育系统的基本功能网络教育系统应具有以下基本功能,
( 1)教育管理功能
( 2)教学服务功能
( 3)科研服务功能
6.2.2网络教学模式根据不同的教学组织形式,基于网络的教学概括起来有五种模式 。
1,讲授型模式讲授型模式有可以分为同步式讲授和异步式讲授两种方式
2,个别辅导模式
3,讨论学习模式
4,探索学习模式
5,协作学习模式
6.2.3网络教育管理
1.网络教育管理的职能一个网络教育管理系统( NBEMS Net-Based
Education Management System) 应该具备以下管理职能( 如图 6.1所示 )。
此外,网络教育管理系统还应具有不同于传统教育管理的以下特性:
( 1)交互性
( 2)个性化
( 3)可控性
2,网络教育管理体系结构网络教育管理系统体系结构一般采用采用客户机 /
服务器模式 ( C/S) 或浏览器 /服务器 ( B/S) 模式,如图 8.2所示 。
6.2.3网络教育管理课程设置 ( 教学计划,课程开发与管理 )
教学管理 学生学习跟踪纪录教师管理人员管理 学生管理教学资源库管理与维护教学资源管理 教学资源使用管理系统安全管理系统管理 用户权限管理系统维护 ( 日志,故障恢复等 )
图 6.1网络教育管理职能
6.2.4网络教育资源管理
1.网络教育资源构成
2.网络教育资源的特点
3.网络教学资源库的建设与管理
4.网络教育资源规范
6.2.4网络教育资源管理
1,网络教育资源构成对于网络教育资源有不同的分类方法,
( 1) 按照资源的形态划分按照资源的形态划分,网络教育资源包括教育环境资源,教育信息资源和教育人力资源 。
( 2) 按照教育功能划分按照教育功能划分,网络教育资源由网络教学资源库和教育管理系统组成 。
( 3) 按照适用对象划分按照适用对象划分,网络教育资源包括学习资源,科研资源和备课资源 。 在网络环境,电子邮箱,搜索引擎,电子图书馆,
虚拟实验室等是各类人员共用的资源,此外,供学习者使用的学习资源还包括网络课程,题库,讨论组等 。
6.2.4网络教育资源管理
2.网络教育资源的特点
( 1)形式多样。
( 2)内容丰富。
( 3)获取便捷
( 4)快速即时
( 5)资源共享
6.2.4网络教育资源管理
3.网络教学资源库的建设与管理
( 1)网络教学资源库建设建立基于互联网的教育资源库可以帮助学习者进行自主学习、探索式学习和终身学习。教育资源库中存储大量的学习信息,并提供了先进的信息查询手段,
学习者可以方便快速的发现学习的内容,因此将会更加积极地进行探索式学习。
按照资源存储方式,资源库本身可以分为媒体素材库,试题库,网络课件库,案例库,文献资料库,用户信息库,访问记录库等多个模块 。 这些模块分别存储了相应的信息,便于系统管理和资源管理 。
按照资源使用目的,网络教学资源可分成三类:学习资源,科研资源,备课资源 。
6.2.4网络教育资源管理
( 2)网络教育资源库管理网络教育资源系统由公共资源数据库、资源库控制系统、资源查询系统、教师角色应用接口和学生角色应用接口几部分构成,其中除了公共资源数据库外,
其余模块均提供资源库管理的功能。
网络资源管理系统只对资源数据库内的资源进行严格管理,不会干涉教师个人资源 。
网络资源库管理系统应具有审核,添加,修改和删除等功能 。 在资源库管理系统的管理下,教学资源库会随着教师开展教学活动不断丰富,从而更好的服务于教学 。
6.2.4网络教育资源管理
4.网络教育资源规范
IEEE的 LOM模型是诸多开放学习元数据规范中相对完备的,它规定了在 WEB页面中呈现学习资源时,所应提供的一些基本元素,但并没有规定这些元数据的实现,如它们的体系结构、编辑语言、数据存取方法等。
教育部现代远程教育资源建设委员会于 2000年 5月颁布了《现代远程教育资源建设技术规范 (试 行 )》
(简称《规范》),该文件成为目前我国现代远程教育资源建设的标准。
6.2.4网络教育资源管理
2000年底,我国教育部高教司组织清华大学、北京大学、北京师范大学、华东师范大学、上海交通大学等十余所高校成立了中国现代远程教育技术标准化委员会。该委员会致力于借鉴国际上比较成熟的标准,
结合我国网上教育的具体实践对现行标准进行修订和完善,以促进我国网络教育的健康发展。几个著名的学习资源的元数据规范。
( 1) LOM模型
( 2) Dublin Core
( 3)我国《现代远程教育工程资源建设技术规范》
6.2.5网络教育平台典型案例
目前比较成熟的网上教学管理系统和教学支持系统有:
(1)Mentorware 公司的 Mentorware
(2)英属哥伦比亚大学计算机科学系开发的
WebCT
(3)WBT System 的 TopClass
(4)加拿大 Simon Fraser大学的 Virtual-U
(5)DataBeam 公司 DataBeam Learning Server
(6)Lotus 的 LearningSpace
6.3 计算机辅助测验( CAT)
本节主要讨论计算机如何应用于教育测验和评价中,
计算机辅助测验 ( Computer Assisted Testing简称 CAT)
系统的构成及其功能,并简单介绍设计 CAT系统所依据的教育测量理论和典型的 S_P分析数学模型 。
6.3.1 CAT系统概述
6.3.2 CAT系统设计
6.3.3 经典测量理论
6.3.4 项目反应理论
6.3.5 S— P分析
6.3.6 S— P— T分析
6.3.1 CAT系统概述一个完整的测验过程是一个循环过程
(如图 6.3),它包括测验构成、测验发送、
分级和分析、试题分析、题库五部分。
1.计算机辅助测验构成
2.计算机辅助测验发送
3.分级和分析
4.试题分析
5.题库
6.3.1 CAT系统概述题库 测试构成测试分析 测试发送学生的记录分级和分析分级和分析
6.3.1 CAT系统概述
1.计算机辅助测验构成今天,使用计算机,即使是个人计算机,就是在没有真正题库的情况下,也可以将问题存入文本文件 。 用一个简单的计算机程序从文件读出需要的题目,然后进行拷贝输出,
即可得到一份测验 。 稍加改进,例如利用计算机颠倒题目的顺序,就可以使相同的测验具有二个,三个或更多的版本,这样可以减少作弊的可能性 。 另外,还可以不断地加进新的题目,最终形成题库 。
6.3.1 CAT系统概述
2.计算机辅助测验发送如果有足够多的计算机终端或系统可以使用,则可以通过终端对学生进行测验,这样作有许多优点:
(1) 问题的排列顺序是无关紧要的。
(2) 因为计算机能支持打印、分级和方便对各种问题的处理,可以省去考卷 。
(3) 在具有内部时钟的系统中,允许对学生在一定的时间内进行单独测验。
(4) 在测验过程中,学生能够及时得到反馈,并且测验一结束。就能得到测验结果和分级。
6.3.1 CAT系统概述
3.分级和分析在利用计算机发送测验的情况下,计算机会自动地对测验结果进行分级和分析 。 还有一种情况,利用试卷发送测验,学生在试卷纸上标出符号表示对多重选择问题的回答 。 然后将标好符号的答卷送入光学扫描仪,自动记录学生的回答并对测验进行分类 。 使用适当的软件,可为教师构画出整个测验的轮廓,包括分数分布,问题的难易程度以及对测验信息进行标准统计处理后所得到的结果 。
6.3.1 CAT系统概述
4.试题分析有效的客观测验常常要求重新评价测验中使用的题目的有效性 。 在多重选择题的情况下,其有效性取决于好多因素,包括问题主干的结构,正确答案的结构和选择,迷惑答案的结构和选择等 。
在完整的计算机验试操作中,计算机保存着每个测验题目的历史轮廓,每次测验都被分级,保存题目,
题目的区分特性分析以及题目被修改的历史 。 用这种方法,在整个测验中,将不好的题目清除掉,将新的题目加进来,这样的过程从根本上保证了继续测验的有效性 。
6.3.1 CAT系统概述
5.题库题库系统要求复杂的软件和大量的计算功能,题目本身可以随时间发展。大的测验系统通常是把信息保存在称为题库的数据库内。一个大的题库具有以下特性:
( 1)按题目的应用领域 (如数学、英语或音乐等 )将它们分类,每一应用领域中的题目又可细分岁若干个题目组合。
( 2)在题库中的每一个题目有两部分组成:题目标识符和题目本身。
除了上述特性之外,它还具有构成和给出测试的等价形式的能力。
6.3.2 CAT系统设计
1.题库的定义
2.库建设依据的教育测量理论
3,CAT系统的组成和基本功能
4.试题库系统的建立
5.讨论
6.3.2 CAT系统设计
1.题库的定义题库是英文 item bank意译 。 在英国,人们也常使用
question bank来表达同一个意思,也有人认为,使用
item library更为恰当 。
题库不仅要有一定数量的题目,而且还要明确以什么教育测量理论作为基础,即要明确构造题库的数学模型 。 因此可以认为,题库是按照一定的教育测量理论,利用计算机技术构成的某种学科题目的集合 。
6.3.2 CAT系统设计
2.库建设依据的教育测量理论目前建题库常用的测量理论是国际上比较流行的所谓的,经典测量理论,( Classical Test Theory简称
CTT) 。 经典测量理论是 20世纪初提出来的,到了 50
年代逐步形成了完整的体系 。 CTT有一套完整的题目分析指标体系和评价标准,根据 CTT理论建的题库,
要求入库的每一试题,除了试题本身的内容外,还要包括题目的编号,来源,知识点,能力水平,难度,
效度,区分度,使用情况等多种定性,定量数据 。 一个题目从征题,经验筛选,到测试,项目分析,登记入库,要经过比较长的时间 。 但是,经典测量理论
( CTT) 存在一定的局限性 。
6.3.2 CAT系统设计
50年代以来,又有多种测量理论得到发展和应用 。 其中项目反应理论 ( Item Response Theory简称为 IRT)
在实践中显示了强大的生命力 。 项目反应理论,就是针对着经典测验理论的不足而提出来的一种新的测验理论,它的最大优点就是项目参数的不变性,当存在着大的被试总体时,项目参数估计是独立于标准化过程中所使用的特定被试组的;当存在着测量相同特质的题库时,被试特质发展水平的估计独立于所施测的试题组,并且能提供表明估计每个被试能力水平精确性的统计量,即项目信息函数和测验信息函数 ( Item
and Test Information Function) 。 因此,项目反应理论的应用,将会大大提高题库的质量 。
项目反应理论的一个成功应用,就是自适应测验
( Adaptive test) 的编制 。
6.3.2 CAT系统设计
3,CAT系统的组成和基本功能题库不仅要有足够数量的试题,同时还要明确它所使用的测量理论(详见 6.3.3节),以确定的测量理论建立数学模型,这是无论建立什么学科的题库都需解决的问题。具体到不同学科的题库,又有许多不同的问题需要解决。例如,英语题库、数学题库、物理题库、化学题库等,它们都有各自独有的特点,因此,
不同学科的题库系统的构成会有些不同,但对其功能要求大体上是一致的。
对于一个题库系统,所应具备的基本功能是:建库和维护;查询和检索;生成试卷;试题和试卷的测试分析。这些功能分别由系统中各个子系统完成。这些子系统在主控模块的控制下互相联系,组成一个有机体。
6.3.2 CAT系统设计
4.试题库系统的建立试题库系统是一个相当复杂的系统,它的建立需要专业课教师,程序设计人员和教育测量专家的分工合作 。
( 1) 教育测量专家为建立题库提供经典的或现代的教育测量理论,使题库具有科学的数学模型 。
( 2) 程序设计者的任务是设计程序,使之实现题库系统的各种功能,并能迅速,协调和可靠地工作 。 具体说,程序设计者应完成以下工作:
① 根据需要选择题库的运行环境 。
② 根据对题库的功能要求,设计题库系统的结构框图 。
6.3.2 CAT系统设计
③画出流程图,进行程序设计
( 3)专业课教师的任务是为建库提出目标,并提供有足够数量的题卡。题卡建设是建库的基础工作,也是工作量最大的 — 项工作。
建设题库系统是一项工作量很大的系统工程,它的完成不仅需要大量的人力和时间,还要有周密的施实计划和方案,并在实践的过程中进行不断的调整 。
6.3.2 CAT系统设计
5.讨论如上所述,题库系统是计算机辅助测验系统的一种重要形式,在国内外得到了越来越广泛的应用。它在生成试卷、进行试题和试卷分析等方面可以为教师节省大量的时间,而且能够在大范围内进行高质量的测验,这无疑会对提高教学质量产生积极的促进作用 。
但是用计算机实施测验和阅卷评分,主要是对客观题有效。这限制了试题的形式,只能是选择题、判断题、匹配题等,这样的测验有其局限性,它不能测验考生的综合能力、理解能力和文字表达能力 。
6.3.3 经典测量理论
根据 CTT理论,对每一次测验的分析主要包括如下内容的测量指标:




答案的有效性等难度、区分度、迷惑型项目分析信度、效度等整体分析试卷分析标准差、方差等差异量数分析平均分数等集中量数分析成绩分析
C TT
6.3.3 经典测量理论
1.成绩分析
集中量数指反映分数集中为止这个特征的数值,如平均数、中位数、众数等,它们各自反映一组分数的典型情况,因此常用来作不同分数组织间的比较 。
差异量数是指反映一组分数的分布情况,离散程度的数值 。 异量数的形式也有多种,标准差是最重要的差异量数 。
6.3.3 经典测量理论
2.项目分析通常,对考试的分析与评价分两方面进行。一是对各个试题进行的分析,称为“项目分析”,二是对整个试卷或考试进行的分析和评价,称为“整体分析”。
学业成绩测验可以用来衡量学生的相对水平,也可用于衡量学生的实际水平。在教育测量中,把用于衡量学生相对水平的测验叫做常模参照测验;把用于衡量学生实际水平的测验叫做目标参照测验 。
由于存在着常模参照测验和目标参照测验,因此,
对项目分析和整体分析有不同的要求 。 常模参照测验的项目分析包括难度分析,区分度分析和迷惑答案的有效性分析 。
6.3.3 经典测量理论
3.整体分析整体分析是利用测验的结果对试卷进行全面的分析和评价。它是通过两个数量指标来描述的。这两个指标称为效度和信度,它们是表明测验的有效性和可靠性的数量指标。
( 1) 信度信度又称可靠性,它是指测验的一致性程度 。 表现在同一个测验在不同时间上所得结果的一致性 。 通常以相关系数为数据指标,称为信度系数 。 如果信度系数大,则测验信度高;如果信度系数小,则测验信度低 。
6.3.3 经典测量理论
( 2) 效度效度即测验的有效性,指测验结果的正确性程度,
即是说测验在多大程度上测量到了所要测的东西,由于测验的目标不一样,因而便产生了几种效度形式:
内容效度,效标关联效度和结构效度 。
经典理论不足之处:
按照经典理论计算难度、区分度、信度等质量指标的方法,存在着严重依赖于样本的问题 。
6.3.3 经典测量理论在应用方面,经典理论也表现许多不足。
例如,它主要适合于常模参照测验,而难以较好地满足目标参照测验的要求;主要适合于进行观察分数等值,难以较好地满足题目参数等值的要求;特别是,它不能为自适应测验 (Adaptive Testing)这类新型测验提供坚实可靠的理论基础。
6.3.4项目反应理论
项目反应理论 ( IRT Iterm Response Theory) 是针对经典测量理论的局限性提出来的,它的质量指标 —
项目参数 —的估计值与样本选择无关;对被试能力水平的估计值与测试试题无关;同时能给出能力或知识水平估计值的精度 。
1,项目反应模型在 IRT研究过程中,人们提出了多种项目反应模型,
这些模型主要分为两大类:静态模型与动态模型 。
目前比较成熟的是静态模型。 目前应用较广的是单维逻辑斯蒂模型。 逻辑斯蒂型是由伯恩鲍姆于 1957年提出的,
他所假设的项目特性曲线如下页图所示。
6.3.4项目反应理论
如下所述,项目特性曲线描述的是被试测验得分与被试内在素质、能力水平之间的关系。
6.3.4项目反应理论
2.项目反应模型的参数估计对于项目反应模型中参数的估计,通常采用的是极大似然估计法 。
( 1) 极大似然估计法
( 2) 参数估计的基本过程首先,为能力参数质量参数指定初值 。
然后,按以下步骤进行迭代运算:
① 把 3个质量参数看作已知值,用极大似然估计法估算出能力参数;
② 将上一步中估出的能力参数作为已知值,用极大似然估计法估算出三个质量参数
③ 结束条若满足则最后一次的估计值即为最终估计值;
若不满足,则返回第一步继续迭代运算 。
6.3.4项目反应理论
3.项目与测验的信息函数信息函数是项目反应理论中的一个重要概念。某个试题 j的信息函数值的大小直接反映出该试题对被试能力素质水平的估计精度,信息函数值越大,这种估计就越精确。因而信息函数可作为衡量测验试题是否有效果的工具。
( 1)信息函数的数值就只与被试能力素质水平有关。
( 2)某一试题信息函数值大小 (即所能提供信息的大小 )就取决于该试题的质量 (即由其质量参数决定 )
( 3)信息数具有可加性。
6.3.5 S— P分析
1,S—P表 (Student—Problem Chart)的构成方法
( 1)把学生按照由高分到低分的顺序重新排列。
( 2)把问题 (或试题 )列按答对次数由多到少从左到右进行排列。
( 3)对于得分相同的两行,首先求出各行为 0的问题列的答对次数的和,和小的得分行放在上边。
( 4)对于答对次数相同的两列,首先求出各列为 0所在行的得分和,和值小者,说明是得分少的问学答错了这一问题,相对于为 0时得分和大的那一列的问题要容易些。因此放在左边。
6.3.5 S— P分析
2,S— P表的性质
( 1) S曲线左边的面积与 P曲线上边的面积是相等的 。
而且 S线左边的面积或 P线上边的面积与总面积的比等于所有学生对全部问题的回答的正确率 。
( 2)若把 S线左部和 P线上部不重叠的部分称作 S线与 P线的离差,则离差的大小反映了学生和问题的均匀程度。
( 3)一般情况下 S曲线与 P曲线总是相交的,而 P曲线的左端总在 S曲线的上方,P曲线的右端总在 S曲线的下方。
6.3.5 S— P分析
3.警告系数为了定量地描述问题或学生的异常程度,引入警告系数概念 。
( 1) 对问题的警告系数第 j个问题的警告系数:
( 2)关于学生的警告系数第 i个学生的警告系数,
)(
)(1)(
CC O V
PC O VPW
j
j
j
)(
)(1)(
CC O V
SC O VSW
i
i
I
6.3.6 S— P— T分析这一小节我们讨论全班同学对多个问题的反应情况 。
设全班有 m个学生,回答教师提出的 n个问题,答完之后,计算机形成学生 —问题 —反应时间短阵 。 用 T表示,即,
t 11 t 12 … t1n
T=[tij]= t21 t22 … t2n
---------------
tm1 tm2 … tmn
其中 tij表示学生 i回答问题 j的反应时间 (i= l,2,… m,j= l,2,n)
6.3.6 S— P— T分析
ST线直观地表明了学生反应时间的稳定程度,为了定量地描述这种反应时间上的稳定程度,引入反应时间稳定度的概念。第 i名学生的反应时间稳定度 RSTi
定义为:
通常认为,当 PSTi> 0,8时,说明该生的反应时间不够稳定。另外需要指出的是,前面在构造 S— P— T
表时,是将全体同学回答同一 — 问题的平均反应时间定为阈值。实际上,此阈值并不能保证在所有的情况下都是最佳的,应根据不同情况,通过实验来确定阈值。
协方差总体反应时间模式间的名学生完全反应模式与第协方差总体反应时间模式间的名学生反应时间模式与第
i
iR S T i 1