第七章 教育统计与教育测验
第一节 变量与变量种类
第二节 描述统计
第三节 分数的转换与解释
第四节 测验信度、效度、难度、区
分度
第一节 变量与变量种类
一,研究资料的定性分析
二,定量分析(统计分析)
三,变量及其种类
第二节 描述统计
统计描述方法,是研究简缩数据并描述这
些数据的统计方法
一,数据资料的整理和表示
二,特征参数的计算
三,相关关系的度量
第三节 分数的转换与解释
一,原始分数及其局限性
二、几种常用的导出分数
百分等级分数
标准分数
T分数
第四节 测验信度、效度,
难度、区分度
一,信度
二,测验效度
三,难度
四,区分度
一,研究资料的定性分析
? (一 )定性分析的定义与特点 用逻辑思维的方法,对研究所获资料进行
思维加工,揭示出研究对象的本质和规
律。
? (二 )定性分析的基本方法
比较与分类 归纳与演绎
分析与综合 抽象与具体
二,定量分析(统计分析)
? 1,定义与方法
用数学的方法(主要是统计的方法)分析数据,
找出研究对象的数量特征、水平、比例、结
构及发展变化规律。
数量描述、频数分析、差异分析、相关分析、
趋势分析等
? 2,与定性分析的关系
三,基本概念
总体与样本(样品、样本容量)
被试 概率 统计量 测量 测验
变量, 在性质与数量上可以变化并可以测量的条
件、现象或特征。
? 被试,被研究者的简称,也称研究对象或
受试。
? 概率,反映某一事件发生的可能性大小的
量,用符号 P表示,一般概率在 0和 1之间。
接近 1,表示事件发生的可能性越大;越接
近 0,则越小。
? 统计量,代表样本特征的量。
? 参数,代表总体特征的量。
? 测量,根据一定法则,对事物属性给予数
字化的过程。
? 测验,通常指测量的工具。
类型 含义 特点
定类变
量
表示事物在属
性与类别上的
不同
无测量单位也无绝对零点,有
“相等”和“不等”的关系,不
能比较大小和四则混合运算
定序变
量 (等
级变量 )
表示研究对象
在某一属性上
的顺序
既无测量单位也无绝对零点,不
能指出其间差别大小,但有“等
于、不等于关系、”序关系(优
于、劣于等),四则运算没有意
义。
定距变
量 间
距变量)
取值具有“距
离”特征的变
量
测量单位,但不一有无绝对零点 。
有“等于、不等于、大于、小于
等关系,可以进行加法、减法运
算,但乘、除无意义。
定比变
量
既有相等单位
又有绝对零点
可以进行全部运算
一、数据资料的整理和表示
?1,数据检查( 检查数据的完整性与正确性,
分逻辑检查和计算检查两种方法 )
?2,数据分类 (品质分类和数量分类 )
?⒊ 数据的排序 (数据排序、等级排列、次
数排序 )
?⒋ 数据统计表 (单项表,多项表,次数
分布表 )
?⒌ 数据的图示法 (条形图,曲线图、圆形
图 )
二,特征参数的计算
?(一) 集中量数
代表一组数据集中趋势的统计量
算术平均数,中数,众数
?(二) 差异量数
它是用以表示一群量数的离散程度 。 全距、平
均差,方差 S2,标准差 S、标准分数 。
?(三) 次数分布(频数分布)
指的是一批数据中各个不同数值所出现的次数
情况。
次数分布表, 次数分布直方图 或 次数分布曲线,
正态分布曲线
? 1,算术平均数,用 表示,算术平均数 =数据
值的总和 /数据数。
2,中数,是指一组按大小顺序排列起来的量数
中的中间点的数(不受极端值的影响),又称中位
数,用 Mdn来表示。
如 1 2 3 4 5,样品数是奇数,此组数据的中数
是 3,此数字是实数。如 1 2 3 4 5 6,样品数是偶
数,此组数据的中数是 3+4/ 2=3.5,此数字是虚数。
3,众数,是指一列数中出现次数最多的数值,
常用 M表示。
如 1 2 3 4 5 4,此组数据的众数是 4。如果都
不相同,则没有众数。
__X
? 标准差,它是与平均数的差数的平方和的
平均数的算术平方根。
下式中,S为标准差
?【 例 6-1】 现有 50名学生的成绩,原始数据如 表 6-1
所示:( n=50)
1,次数分布表
为了显示该组样本在不同分数段中的次数分布
情况,我们对该数组进行次数分布统计,编制出该
数组的次数分布表。方法如下,
( 1)求全距:最大数-最小数 =98- 51=47
( 2)定组数,一般 10- 20组为宜。
( 3)定组距,组距 =(全距 +1) /组数 =( 47+1)
/10=4.7(取 5)
( 4)定组限,95-100,90-95,85-90…… 等
( 5)求组中值:组中值 =(上限 +下限) /2,如
95-100一组,其组中值 =( 100+95) /2=97.5
( 6)归类 把原始数据,分别归到相关组中,
得出次数分布表如表 6-2所示,
正态分布是一种理论分布,在
次数分布中,中间的次数多,由中
间往两边的次数逐渐减少,且两边
的次数多少是相等的 。根据正态分
布绘成的曲线称为正态分布曲线,
正态分布曲线的形状和位置由平
均分 和标准差 S所决定。 __X
三,相关关系的度量
1,函数关系,变量之间的依存关系。
如 s=vt。 相关关系,变量之间有影响,
但没有确定的函数关系。如身高和体
重之间的关系
2,正相关、负相关和零相关 ( 特征 )
3、计算:皮尔森相关 (积差相关)
r=
? ?? ?
?
??
?
??
n
i
n
i
n
i
ii
yyxx
x
ii
yyx
1
2
1
2
1
)()(
))((
特征
? 1、相关系数的数值介于 — 1.00和十 1.00
之间,r< 0正值代表正相关,负值代表负
相关,0表示零相关。
? 2、零相关,指不相关,只能说明变量间不
存在线性关系,但还可能存在非线性关系。
如一变量随另一变量的变化忽大忽小,没
有线性规律。如果非线性关系也不存在,
则两变量独立,它们一定不相关 。
2、特点,
? ①直观简便,但不具有科学评价功能和指导
意义。
? ②不可比性 题目难度可能不同。
? ③不可加性 不同学科评分标准、考试内容、
信度、区分度不同。
? 不能反映学生在团体中的位置 如语文 95
分,处中下水平,数学 90却是第一,单凭原
始分数不能确定。
1,百分等级分数
它是相对地位量数。它把参加测量的全
体人数作为一百份来计算,从而以某原始
分数换算出其在全体中所占的地位,说明
分数比他少的人占人数的百分之几。
公式 PR=100—
R排名序数 N被试总人数
特征:有可比性,易解释,是定序变量,没
有可加性,对两极原始分数反映迟钝。
N
R 50100 ?
2,标准分数
? 表示原始分数在团体中的位置,即其在平均数之
上多少个标准差。
? 公式,Z=
X原始分数 平均数 S标准差
? 特点:定距变量,有可比性和可加性,可直接合
成运算,使分析结果更具科学性。但有负数和小
数,不易为人们所接受。
__X
S
XX
__
?
例:已知某班数学测验平均分 65,标准差 7分,
甲生得 72分;语文阅读平均分 30,标准差 6
分,甲生得 38分。问甲生哪一种测验成绩在
班级位置较高?
解,Z算术 =
T算术 =10Z+50=10× 1+50=60
Z阅读 =
T阅读 =10Z+50=10×⒈ 3 +50=63
答:甲生在阅读测验中的成绩在班级位置较
高。
31
6
3038,????
S
XX
17 6572 ????S XX
3,T分数
把 Z分数的小数和负数转化而成,是整数。
公式:一般考试,T=10Z+50( T分数的平均数
是 50,标准差为 10。> 50,则在平均数之上,
< 50,则在平均数之下。多在 10-90分之间,
符合人们的评分习惯,故常称标准百分。)
韦氏离差智商,T=15Z+100
高考后的公布分数,T=100Z+500 ( Z是
正态分布)
【 例 6-2】 某班语文平均考试成绩为 74分,
标准差 8分。甲学生得 90分,乙学生为 72分。
通过标准分数的计算可以得知他们在全体
同学中所出的位置。
信度
1、含义,指测验结果的一致性或稳定性程度,
即可靠性。
2、类型,重测信度、复本信度、分半信度
3,信度系数
r=
=
4,提高测验信度的方法
? ?? ?
?
??
?
??
n
i
n
i
n
i
ii
yyxx
x
ii
yyx
1
2
1
2
1
)()(
))((
rxx ?
r
r
21
2
?
二、测验效度
?1、效度,测验实际能测出所要测的特质或
能力的程度,即有效性
?2、信度与效度
?3、分类
内容效度,效标关联效度
?4、提高效度的方法
三、难度
1、含义,题目的难易程度。
2、计算
①平均得分率 P=
② 该题的通过率 P=
③ 测验的平均难度
P=
W
X
N
R
W
pw ii?
四、区分度
1、含义,题目对被试的知识水平(能力)差
异的区分能力。
2、计算
Dr=
? ?? ?
?
??
?
??
n
i
n
i
n
i
ii
yyxx
x
ii
yyx
1
2
1
2
1
)()(
))((
总体方差
样本方差
? ? 22
1
1
1
n
i
i
SX
n X?
??
? ?
? ? 22
1
1 n
i
i
SX
n X?
???
运用范围:主要
用于线性相关; X
和 Y是定距变量和
配对样本。
例:某班期末考
试,10位学生的
语文、数学成绩
分别如表所示,
请问语文成绩和
数学成绩的相关
系数是多少?
学生序号 语文 数学
1 70 69
2 65 79
3 78 80
4 82 77
5 91 86
6 66 78
7 73 67
8 86 81
9 81 69
10 74 88
? 解,1、求平均值 __
X
70+65 + +74 76 6
10
X ?????语,
69+ 67+ +8 8
77
10
X
???
??数, 4
? ?? ? ? ?? ? ? ?? ?
? ? ? ? ? ? ? ? ? ? ? ?
300
477884777947769676746766567670
477886767447779676654776967670
))((
222222
1
2
1
2
1
)()(
、
、、、、、、
、、、、、、
?
????????????????
???????????
?
??
?
? ?? ?
?
??
?
n
i
n
i
n
i
ii
xy
yyxx
x
ii
yyx
r 2、根据公式求相关系数
第一节 变量与变量种类
第二节 描述统计
第三节 分数的转换与解释
第四节 测验信度、效度、难度、区
分度
第一节 变量与变量种类
一,研究资料的定性分析
二,定量分析(统计分析)
三,变量及其种类
第二节 描述统计
统计描述方法,是研究简缩数据并描述这
些数据的统计方法
一,数据资料的整理和表示
二,特征参数的计算
三,相关关系的度量
第三节 分数的转换与解释
一,原始分数及其局限性
二、几种常用的导出分数
百分等级分数
标准分数
T分数
第四节 测验信度、效度,
难度、区分度
一,信度
二,测验效度
三,难度
四,区分度
一,研究资料的定性分析
? (一 )定性分析的定义与特点 用逻辑思维的方法,对研究所获资料进行
思维加工,揭示出研究对象的本质和规
律。
? (二 )定性分析的基本方法
比较与分类 归纳与演绎
分析与综合 抽象与具体
二,定量分析(统计分析)
? 1,定义与方法
用数学的方法(主要是统计的方法)分析数据,
找出研究对象的数量特征、水平、比例、结
构及发展变化规律。
数量描述、频数分析、差异分析、相关分析、
趋势分析等
? 2,与定性分析的关系
三,基本概念
总体与样本(样品、样本容量)
被试 概率 统计量 测量 测验
变量, 在性质与数量上可以变化并可以测量的条
件、现象或特征。
? 被试,被研究者的简称,也称研究对象或
受试。
? 概率,反映某一事件发生的可能性大小的
量,用符号 P表示,一般概率在 0和 1之间。
接近 1,表示事件发生的可能性越大;越接
近 0,则越小。
? 统计量,代表样本特征的量。
? 参数,代表总体特征的量。
? 测量,根据一定法则,对事物属性给予数
字化的过程。
? 测验,通常指测量的工具。
类型 含义 特点
定类变
量
表示事物在属
性与类别上的
不同
无测量单位也无绝对零点,有
“相等”和“不等”的关系,不
能比较大小和四则混合运算
定序变
量 (等
级变量 )
表示研究对象
在某一属性上
的顺序
既无测量单位也无绝对零点,不
能指出其间差别大小,但有“等
于、不等于关系、”序关系(优
于、劣于等),四则运算没有意
义。
定距变
量 间
距变量)
取值具有“距
离”特征的变
量
测量单位,但不一有无绝对零点 。
有“等于、不等于、大于、小于
等关系,可以进行加法、减法运
算,但乘、除无意义。
定比变
量
既有相等单位
又有绝对零点
可以进行全部运算
一、数据资料的整理和表示
?1,数据检查( 检查数据的完整性与正确性,
分逻辑检查和计算检查两种方法 )
?2,数据分类 (品质分类和数量分类 )
?⒊ 数据的排序 (数据排序、等级排列、次
数排序 )
?⒋ 数据统计表 (单项表,多项表,次数
分布表 )
?⒌ 数据的图示法 (条形图,曲线图、圆形
图 )
二,特征参数的计算
?(一) 集中量数
代表一组数据集中趋势的统计量
算术平均数,中数,众数
?(二) 差异量数
它是用以表示一群量数的离散程度 。 全距、平
均差,方差 S2,标准差 S、标准分数 。
?(三) 次数分布(频数分布)
指的是一批数据中各个不同数值所出现的次数
情况。
次数分布表, 次数分布直方图 或 次数分布曲线,
正态分布曲线
? 1,算术平均数,用 表示,算术平均数 =数据
值的总和 /数据数。
2,中数,是指一组按大小顺序排列起来的量数
中的中间点的数(不受极端值的影响),又称中位
数,用 Mdn来表示。
如 1 2 3 4 5,样品数是奇数,此组数据的中数
是 3,此数字是实数。如 1 2 3 4 5 6,样品数是偶
数,此组数据的中数是 3+4/ 2=3.5,此数字是虚数。
3,众数,是指一列数中出现次数最多的数值,
常用 M表示。
如 1 2 3 4 5 4,此组数据的众数是 4。如果都
不相同,则没有众数。
__X
? 标准差,它是与平均数的差数的平方和的
平均数的算术平方根。
下式中,S为标准差
?【 例 6-1】 现有 50名学生的成绩,原始数据如 表 6-1
所示:( n=50)
1,次数分布表
为了显示该组样本在不同分数段中的次数分布
情况,我们对该数组进行次数分布统计,编制出该
数组的次数分布表。方法如下,
( 1)求全距:最大数-最小数 =98- 51=47
( 2)定组数,一般 10- 20组为宜。
( 3)定组距,组距 =(全距 +1) /组数 =( 47+1)
/10=4.7(取 5)
( 4)定组限,95-100,90-95,85-90…… 等
( 5)求组中值:组中值 =(上限 +下限) /2,如
95-100一组,其组中值 =( 100+95) /2=97.5
( 6)归类 把原始数据,分别归到相关组中,
得出次数分布表如表 6-2所示,
正态分布是一种理论分布,在
次数分布中,中间的次数多,由中
间往两边的次数逐渐减少,且两边
的次数多少是相等的 。根据正态分
布绘成的曲线称为正态分布曲线,
正态分布曲线的形状和位置由平
均分 和标准差 S所决定。 __X
三,相关关系的度量
1,函数关系,变量之间的依存关系。
如 s=vt。 相关关系,变量之间有影响,
但没有确定的函数关系。如身高和体
重之间的关系
2,正相关、负相关和零相关 ( 特征 )
3、计算:皮尔森相关 (积差相关)
r=
? ?? ?
?
??
?
??
n
i
n
i
n
i
ii
yyxx
x
ii
yyx
1
2
1
2
1
)()(
))((
特征
? 1、相关系数的数值介于 — 1.00和十 1.00
之间,r< 0正值代表正相关,负值代表负
相关,0表示零相关。
? 2、零相关,指不相关,只能说明变量间不
存在线性关系,但还可能存在非线性关系。
如一变量随另一变量的变化忽大忽小,没
有线性规律。如果非线性关系也不存在,
则两变量独立,它们一定不相关 。
2、特点,
? ①直观简便,但不具有科学评价功能和指导
意义。
? ②不可比性 题目难度可能不同。
? ③不可加性 不同学科评分标准、考试内容、
信度、区分度不同。
? 不能反映学生在团体中的位置 如语文 95
分,处中下水平,数学 90却是第一,单凭原
始分数不能确定。
1,百分等级分数
它是相对地位量数。它把参加测量的全
体人数作为一百份来计算,从而以某原始
分数换算出其在全体中所占的地位,说明
分数比他少的人占人数的百分之几。
公式 PR=100—
R排名序数 N被试总人数
特征:有可比性,易解释,是定序变量,没
有可加性,对两极原始分数反映迟钝。
N
R 50100 ?
2,标准分数
? 表示原始分数在团体中的位置,即其在平均数之
上多少个标准差。
? 公式,Z=
X原始分数 平均数 S标准差
? 特点:定距变量,有可比性和可加性,可直接合
成运算,使分析结果更具科学性。但有负数和小
数,不易为人们所接受。
__X
S
XX
__
?
例:已知某班数学测验平均分 65,标准差 7分,
甲生得 72分;语文阅读平均分 30,标准差 6
分,甲生得 38分。问甲生哪一种测验成绩在
班级位置较高?
解,Z算术 =
T算术 =10Z+50=10× 1+50=60
Z阅读 =
T阅读 =10Z+50=10×⒈ 3 +50=63
答:甲生在阅读测验中的成绩在班级位置较
高。
31
6
3038,????
S
XX
17 6572 ????S XX
3,T分数
把 Z分数的小数和负数转化而成,是整数。
公式:一般考试,T=10Z+50( T分数的平均数
是 50,标准差为 10。> 50,则在平均数之上,
< 50,则在平均数之下。多在 10-90分之间,
符合人们的评分习惯,故常称标准百分。)
韦氏离差智商,T=15Z+100
高考后的公布分数,T=100Z+500 ( Z是
正态分布)
【 例 6-2】 某班语文平均考试成绩为 74分,
标准差 8分。甲学生得 90分,乙学生为 72分。
通过标准分数的计算可以得知他们在全体
同学中所出的位置。
信度
1、含义,指测验结果的一致性或稳定性程度,
即可靠性。
2、类型,重测信度、复本信度、分半信度
3,信度系数
r=
=
4,提高测验信度的方法
? ?? ?
?
??
?
??
n
i
n
i
n
i
ii
yyxx
x
ii
yyx
1
2
1
2
1
)()(
))((
rxx ?
r
r
21
2
?
二、测验效度
?1、效度,测验实际能测出所要测的特质或
能力的程度,即有效性
?2、信度与效度
?3、分类
内容效度,效标关联效度
?4、提高效度的方法
三、难度
1、含义,题目的难易程度。
2、计算
①平均得分率 P=
② 该题的通过率 P=
③ 测验的平均难度
P=
W
X
N
R
W
pw ii?
四、区分度
1、含义,题目对被试的知识水平(能力)差
异的区分能力。
2、计算
Dr=
? ?? ?
?
??
?
??
n
i
n
i
n
i
ii
yyxx
x
ii
yyx
1
2
1
2
1
)()(
))((
总体方差
样本方差
? ? 22
1
1
1
n
i
i
SX
n X?
??
? ?
? ? 22
1
1 n
i
i
SX
n X?
???
运用范围:主要
用于线性相关; X
和 Y是定距变量和
配对样本。
例:某班期末考
试,10位学生的
语文、数学成绩
分别如表所示,
请问语文成绩和
数学成绩的相关
系数是多少?
学生序号 语文 数学
1 70 69
2 65 79
3 78 80
4 82 77
5 91 86
6 66 78
7 73 67
8 86 81
9 81 69
10 74 88
? 解,1、求平均值 __
X
70+65 + +74 76 6
10
X ?????语,
69+ 67+ +8 8
77
10
X
???
??数, 4
? ?? ? ? ?? ? ? ?? ?
? ? ? ? ? ? ? ? ? ? ? ?
300
477884777947769676746766567670
477886767447779676654776967670
))((
222222
1
2
1
2
1
)()(
、
、、、、、、
、、、、、、
?
????????????????
???????????
?
??
?
? ?? ?
?
??
?
n
i
n
i
n
i
ii
xy
yyxx
x
ii
yyx
r 2、根据公式求相关系数