三,离散量数分析
离散量数分析指的是用一个特别的数值
来反映一组数据相互之间的离散程度,
它与集中量数一起分别从两个不同的侧
面描述和揭示一组数据的分布情况,共同反映出
资料分布的全面特征,同时它还兑现各级重量数
的代表性做出补充说明,
为了理解离散量数分析的作用请见下例,
某校三个系各选 5名同学参加
竞赛,他们的成绩分别如下,
中文系,78,79,80,81,82 X = 80
数学系,65,72,80,88,95 X = 80
外语系,35,78,89,98,100 X = 80
如果仅以集中量数来衡量,这三个队的水平一
样高,但是很明显,这 80分对中文系队的同学代表性
最高,而对外语系的同学代表性最低,
常见的离散量数统计量有全距,标准差,异众比
率,和四分位差,
1.全距 (Range)
全距也叫极差,它是一组数据中,最大
值与最小值之差,
全距的意义在于,
一组数据的全距越大,在一定程度上
说明一组数据的离散量数越大,而集中量数
统计量的代表性越低,反之一组数据的全距
越小,则说明这组数据的离散量数越小,集
中量数统计量的代表性越高,
2.标准差 (Standand Deviation)
标准差是指一组数据对其平均数的
偏差平方的算术平均数的平方根,它是用
得最多的,也是最重要的离散量数统计量,
其公式为,
2.1原始资料计算标准差,(以上例为例 )
2.2 单值分组资料计算标准差
? 公式为,
(见例题和表 1.)
2.3由组距分组资料计算标准差
先计算出各组的组中值,然后按照单值
分组资料计算标准差的公式和方法计算,
例题,调查 200户家庭的规模
得到下列资料,求标准差,
表 1,20 0 户家庭规模资料
家庭规模 户数 X - X (X - X)
2
(X - X)
2
? ?
2 人 10 - 1, 4 1, 9 6 1 9, 6
3 人 120 - 0, 4 0, 1 6 1 9, 2
4 人 50 0, 6 0, 3 6 18
5 人 20 1, 6 2, 5 6 5 1, 2
合计 200 108
3.异众比率 (Variation Ratio)
异众比率指的是一组数据中非众数的次数相对
于总体全部单位的比率,异众比例通常用 VR表示,
其计算公式为,
( 计算表 2中的异众比率 )
异众比率的意义是指众数不能代表的其他数值,
在总体种的比重,因此异众比率越大则众数在总体中
所占的比重越小,代表性越小,反之异中比率越小,众
数的代表性越大
n - ?? m
V R=
n
表 2, 某年级学生的年龄 分布
年龄 人数 ( 频数 )
17 10
18 25
19 50
20 40
21 20
22 5
合计 150
4.四分位差 (Interquartile Range)
四分位差是先将一组数据按大小排列成序,
然后将其四等分,去掉序列中最高的四分之一,
和最低的四分之一,仅就中间的一半数值来测定
序列的全距,
四分位差的符号通常用 Q(seita)来表示,用 Q1,
Q3来表示第一个四分位点和第三个四分位点所
对应的数值,
例题, 调查 11位同学的年龄如下 ;17岁,18岁,18
岁,19岁,19岁,20岁,20岁,21岁,21岁,22岁,22岁,
求其四分位差,
5.离散系数 (Coefficient of Variation)
离散系数也称变差系数,她是一种相对
的离散量数统计量,它使我们能够对同一
总体中的两种不同的离散量数统计量进
行比较,
离散系数是标准差与平均数的比值,用
百分比表示,符号为 CV.
计算公式为, S
C V =
X
× 100%
例题, 根据调查某市 100户职工家庭人均月
收入为 73,75元,标准差 6.52元,人均住房面积 8.21平
方米,标准差 3.09平方米,请比较收入和住房情况哪
一个差异程度表较大
职工收入的离散系数 = × 100% =8.8%
职工住房的离散系数 = × 100% =37.6%
住房情况的差异程度比较大,
6.52
73.75
3.09
8.21
练习题,
? 1.调查 100名学生的成绩,得到下列资料,求
成绩的平均数,众数和中位数,
成绩 人数
41 - 60 20
61 - 80 50
81 - 100 30
? 2.一项调查得到下列结果,某市人均月
收入为 92元,标准差为 17元,人均住房面积
7.5平方米,标准差为 1.8平方米,试比较该
市人均收入和人均住房情况哪一个差异
程度比较大,
? 3 对广州和沈阳两地居民生活质量调查
发现,广州居民平均收入为 680元,标准差
位 120元,沈阳居民平均收入为 360元,标准
差为 80元,问广州居民相互之间在收入上
的差异程度与沈阳居民相互之间在收入
上的差异程度哪一个更大一些?
? 4,调查 100名工人和 100名教师的收入,得
到下列资料,问,工人组收入的差别与教师组
收入的差别那个更大?
收入 工人数 教师数
300 30 20
400 20 30
500 30 40
600 20 10
离散量数分析指的是用一个特别的数值
来反映一组数据相互之间的离散程度,
它与集中量数一起分别从两个不同的侧
面描述和揭示一组数据的分布情况,共同反映出
资料分布的全面特征,同时它还兑现各级重量数
的代表性做出补充说明,
为了理解离散量数分析的作用请见下例,
某校三个系各选 5名同学参加
竞赛,他们的成绩分别如下,
中文系,78,79,80,81,82 X = 80
数学系,65,72,80,88,95 X = 80
外语系,35,78,89,98,100 X = 80
如果仅以集中量数来衡量,这三个队的水平一
样高,但是很明显,这 80分对中文系队的同学代表性
最高,而对外语系的同学代表性最低,
常见的离散量数统计量有全距,标准差,异众比
率,和四分位差,
1.全距 (Range)
全距也叫极差,它是一组数据中,最大
值与最小值之差,
全距的意义在于,
一组数据的全距越大,在一定程度上
说明一组数据的离散量数越大,而集中量数
统计量的代表性越低,反之一组数据的全距
越小,则说明这组数据的离散量数越小,集
中量数统计量的代表性越高,
2.标准差 (Standand Deviation)
标准差是指一组数据对其平均数的
偏差平方的算术平均数的平方根,它是用
得最多的,也是最重要的离散量数统计量,
其公式为,
2.1原始资料计算标准差,(以上例为例 )
2.2 单值分组资料计算标准差
? 公式为,
(见例题和表 1.)
2.3由组距分组资料计算标准差
先计算出各组的组中值,然后按照单值
分组资料计算标准差的公式和方法计算,
例题,调查 200户家庭的规模
得到下列资料,求标准差,
表 1,20 0 户家庭规模资料
家庭规模 户数 X - X (X - X)
2
(X - X)
2
? ?
2 人 10 - 1, 4 1, 9 6 1 9, 6
3 人 120 - 0, 4 0, 1 6 1 9, 2
4 人 50 0, 6 0, 3 6 18
5 人 20 1, 6 2, 5 6 5 1, 2
合计 200 108
3.异众比率 (Variation Ratio)
异众比率指的是一组数据中非众数的次数相对
于总体全部单位的比率,异众比例通常用 VR表示,
其计算公式为,
( 计算表 2中的异众比率 )
异众比率的意义是指众数不能代表的其他数值,
在总体种的比重,因此异众比率越大则众数在总体中
所占的比重越小,代表性越小,反之异中比率越小,众
数的代表性越大
n - ?? m
V R=
n
表 2, 某年级学生的年龄 分布
年龄 人数 ( 频数 )
17 10
18 25
19 50
20 40
21 20
22 5
合计 150
4.四分位差 (Interquartile Range)
四分位差是先将一组数据按大小排列成序,
然后将其四等分,去掉序列中最高的四分之一,
和最低的四分之一,仅就中间的一半数值来测定
序列的全距,
四分位差的符号通常用 Q(seita)来表示,用 Q1,
Q3来表示第一个四分位点和第三个四分位点所
对应的数值,
例题, 调查 11位同学的年龄如下 ;17岁,18岁,18
岁,19岁,19岁,20岁,20岁,21岁,21岁,22岁,22岁,
求其四分位差,
5.离散系数 (Coefficient of Variation)
离散系数也称变差系数,她是一种相对
的离散量数统计量,它使我们能够对同一
总体中的两种不同的离散量数统计量进
行比较,
离散系数是标准差与平均数的比值,用
百分比表示,符号为 CV.
计算公式为, S
C V =
X
× 100%
例题, 根据调查某市 100户职工家庭人均月
收入为 73,75元,标准差 6.52元,人均住房面积 8.21平
方米,标准差 3.09平方米,请比较收入和住房情况哪
一个差异程度表较大
职工收入的离散系数 = × 100% =8.8%
职工住房的离散系数 = × 100% =37.6%
住房情况的差异程度比较大,
6.52
73.75
3.09
8.21
练习题,
? 1.调查 100名学生的成绩,得到下列资料,求
成绩的平均数,众数和中位数,
成绩 人数
41 - 60 20
61 - 80 50
81 - 100 30
? 2.一项调查得到下列结果,某市人均月
收入为 92元,标准差为 17元,人均住房面积
7.5平方米,标准差为 1.8平方米,试比较该
市人均收入和人均住房情况哪一个差异
程度比较大,
? 3 对广州和沈阳两地居民生活质量调查
发现,广州居民平均收入为 680元,标准差
位 120元,沈阳居民平均收入为 360元,标准
差为 80元,问广州居民相互之间在收入上
的差异程度与沈阳居民相互之间在收入
上的差异程度哪一个更大一些?
? 4,调查 100名工人和 100名教师的收入,得
到下列资料,问,工人组收入的差别与教师组
收入的差别那个更大?
收入 工人数 教师数
300 30 20
400 20 30
500 30 40
600 20 10