4 - 1
统计学
(核心课程 ) 第 4 章 数据分布特征的测度
作者:中国人民大学统计学院
贾俊平
4 - 2
统计学
(核心课程 ) 第 4 章 数据分布特征的测度
4.1 集中趋势的测度
4.2 离散程度的测度
4.3 偏态与峰态的测度
4 - 3
统计学
(核心课程 ) 学习目标
1,集中趋势各测度值的计算方法
2,集中趋势各测度值的特点及应用场合
3,离散程度各测度值的计算方法
4,离散程度各测度值的特点及应用场合
5,偏态与峰态的测度方法
6,用 Excel计算描述统计量并进行分析
4 - 4
统计学
(核心课程 ) 数据分布的特征
集中趋势
(位置 )
偏态和峰态
(形状)
离中趋势
(分散程度 )
4 - 5
统计学
(核心课程 ) 数据分布特征的测度
数据特征的测度
分布的形状集中趋势 离散程度
众 数
中位数
均 值 离散系数方差和标准差 峰 态
四分位差
异众比率 偏 态
4 - 6
统计学
(核心课程 ) 4.1 集中趋势的测度
一, 分类数据:众数
二, 顺序数据:中位数和分位数
三, 数值型数据:均值
四, 众数、中位数和均值的比较
4 - 7
统计学
(核心课程 )
数据特征分布的和测度
(本节位置 )
数据的特征和测度
分布的形状集中趋势 离散程度
众 数
中位数
均 值 离散系数方差和标准差 峰 度
四分位差
异众比率 偏 态
4 - 8
统计学
(核心课程 )
集中趋势
(central tendency)
1,一 组数据向其中心值靠拢的倾向和程度
2,测度集中趋势就是寻找数据水平的代表值或中心值
3,不同类型的数据用不同的集中趋势测度值
4,低层次数据的测度值适用于高层次的测量数据,但高层次
数据的测度值并不适用于低层次的测量数据
5,测度值的选用取决于所掌握的数据的类型
4 - 9
统计学
(核心课程 )
分类数据:众数
4 - 10
统计学
(核心课程 )
众数
(mode)
1,集中趋势的测度值之一
2,出现次数最多的变量值
3,不受极端值的影响
4,可能没有众数或有几个众数
5,主要用于分类数据,也可用于顺序数据和
数值型数据
4 - 11
统计学
(核心课程 )
众数
(不唯一性 )
无众数
原始数据, 10 5 9 12 6 8
一个众数
原始数据, 6 5 9 8 5 5
多于一个众数
原始数据, 25 28 28 36 42 42
4 - 12
统计学
(核心课程 )
分类数据的众数
(例题分析 )
某城市居民关注广告类型的频数分布
广告类型 人数(人 ) 比例 频率 (%)
商品广告
服务广告
金融广告
房地产广告
招生招聘广告
其他广告
112
51
9
16
10
2
0.560
0.255
0.045
0.080
0.050
0.010
56.0
25.5
4.5
8.0
5.0
1.0
合计 200 1 100
解, 这里的变量为, 广告
类型,, 这是个分类变量
,不同类型的广告就是变
量值
在所调查的 200人当中
,关注商品广告的人数最
多, 为 112人, 占总被调
查人数的 56%,因此众数
为, 商品广告, 这一类别
,即
Mo=商品广告
4 - 13
统计学
(核心课程 )
顺序数据的众数
(例题分析 )
解,这里的数据为
顺序数据 。 变量为
,回答类别,
甲城市中对住
房表示不满意的户
数最多, 为 108户
,因此众数为, 不
满意, 这一类别,

Mo=不满意
甲城市家庭对住房状况评价的频数分布
回答类别 甲城市户数 (户 ) 百分比 (%)
非常不满意
不满意
一般
满意
非常满意
24
108
93
45
30
8
36
31
15
10
合计 300 100.0
4 - 14
统计学
(核心课程 )
顺序数据:中位数和分位数
4 - 15
统计学
(核心课程 )
中位数
(median)
1,集中趋势的测度值之一
2,排序后处于中间位置上的值
Me
50% 50%
3,不受极端值的影响
4,主要用于顺序数据,也可用数值型数据,但不能用于分
类数据
5,各变量值与中位数的离差绝对值之和最小,即
m in
1
???
?
n
i
ei Mx
4 - 16
统计学
(核心课程 )
中位数
(位置的确定 )
未分组数值型数据:
顺序数据:
2
1?? n中位数位置
2
n?中位数位置
4 - 17
统计学
(核心课程 )
未分组数据的中位数
(计算公式 )
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
为偶数时当
为奇数时当
nxx
nx
M
nn
n
e
1
22
2
1
2
1
4 - 18
统计学
(核心课程 )
顺序数据的中位数
(例题分析 )
解,中位数的位置为
300/2= 150
从累计频数看,
中位数在, 一般, 这
一组别中 。 因此
Me=一般
甲城市家庭对住房状况评价的频数分布
回答类别 甲城市户数 (户 ) 累计频数
非常不满意
不满意
一般
满意
非常满意
24
108
93
45
30
24
132
225
270
300
合计 300 —
4 - 19
统计学
(核心课程 )
数值型未分组数据的中位数
(9个数据的算例 )
【 例 】, 9个家庭的人均月收入数据
原始数据, 1500 750 780 1080 850 960 2000 1250 1630
排 序, 750 780 850 960 1080 1250 1500 1630 2000
位 置, 1 2 3 4 5 6 7 8 9
中位数 ? 1080
?
52 192 1 ????? n位置
4 - 20
统计学
(核心课程 )
数值型未分组数据的中位数
(10个数据的算例 )
【 例 】, 10个家庭的人均月收入数据
原始数据, 1500 750 780 660 1080 850 960 2000 1250 1630
排 序, 660 750 780 850 960 1080 1250 1500 1630 2000
位 置, 1 2 3 4 5 6 7 8 9 10
?
5.52 1102 1 ????? n位置
10202 1080960 ???中位数
4 - 21
统计学
(核心课程 )
四分位数
(quartile)
1,集中趋势的测度值之一
2,排序后处于 25%和 75%位置上的值
3,不受极端值的影响
4,主要用于顺序数据, 也可用于数值型数据,
但不能用于分类数据
QL QM QU
25% 25% 25% 25%
4 - 22
统计学
(核心课程 )
四分位数
(位置的确定 )
未分组数据:
?
?
?
??
?
?
?
?
?
?
4
)1(3
4
1
n
Q
n
Q
U
L
位置
位置
4 - 23
统计学
(核心课程 )
顺序数据的四分位数
(例题分析 )
解,QL位置 = (300)/4 =75
QU位置 =(3× 300)/4
=225
从累计频数看, QL在,
不满意, 这一组别中; QU
在, 一般, 这一组别中 。 因

QL = 不满意
QU = 一般
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数 (户 ) 累计频数
非常不满意
不满意
一般
满意
非常满意
24
108
93
45
30
24
132
225
270
300
合计 300 —
4 - 24
统计学
(核心课程 )
数值型未分组数据的四分位数
(9个数据的算例 )
【 例 】, 9个家庭的人均月收入数据
原始数据, 1500 750 780 1080 850 960 2000 1250 1630
排 序, 750 780 850 960 1080 1250 1500 1630 2000
位 置, 1 2 3 4 5 6 7 8 9
?
5.74 )19(35.24 19 ?????? 位置位置 UL QQ
?
15652 163015008152 850780 ?????? UL QQ
4 - 25
统计学
(核心课程 )
数值型未分组数据的四分位数
(10个数据的算例 )
【 例 】, 10个家庭的人均月收入数据
原始数据, 1500 750 780 660 1080 850 960 2000 1250 1630
排 序, 660 750 780 850 960 1080 1250 1500 1630 2000
位 置, 1 2 3 4 5 6 7 8 9 10
?
25.84 )110(375.24 110 ?????? 位置位置 UL QQ
5.1 5 3 2)1 5 0 01 6 3 0(25.01 5 0 0
5.772)750780(75.0750
?????
?????
U
L
Q
Q
?
4 - 26
统计学
(核心课程 )
数值型数据:均值
4 - 27
统计学
(核心课程 )
均值
(mean)
1,集中趋势的测度值之一
2,最常用的测度值
3,一组数据的均衡点所在
4,体现了数据的必然性特征
5,易受极端值的影响
6,用于数值型数据,不能用于分类数据和顺
序数据
4 - 28
统计学
(核心课程 )
简单均值
(simple mean)
设一组数据为,x1, x2, …, xn( xN)
样本均值
n
x
n
xxx
x
n
i
i
n
?
?????? 121 ?
N
x
N
xxx
N
i
i
N
?
?????? 121 ??总体均值
4 - 29
统计学
(核心课程 )
加权均值
(weighted mean)
设各组的组中值为,M1, M2, …, Mk
相应的频数为,f1, f2, …, fk
n
fM
fff
fMfMfM
x
k
i
ii
k
kk
?
??
???
???
? 1
21
2211
?
?样本 加权均值
总体 加权均值
N
fM
fff
fMfMfM
k
i
ii
k
kk
?
??
???
???
? 1
21
2211
?
?
?
4 - 30
统计学
(核心课程 )
已改至此!!
某电脑公司销售量数据分组表
按销售量分组 组中值( Mi) 频数( fi) Mi fi
140~150
150~160
160~170
170~180
180~190
190~200
200~210
210~220
220~230
230~240
145
155
165
175
185
195
205
215
225
235
4
9
16
27
20
17
10
8
4
5
580
1395
2640
4725
3700
3315
2050
1720
900
1175
合计 — 120 22200
185
120
222 00
1
??
?
?
?
n
fM
x
k
i
ii
加权均值
(例题分析 )
4 - 31
统计学
(核心课程 )
加权均值
(权数对均值的影响 )
甲乙两组各有 10名学生, 他们的考试成绩及其分布数据如下
甲组,考试成绩( x ), 0 20 100
人数分布( f ),1 1 8
乙组,考试成绩( x), 0 20 100
人数分布( f ),8 1 1
)(82
10
8100120101 分
甲 ?
??????? ??
n
x
x
n
i
i
)(12
10
1100120801 分
乙 ?
??????? ??
n
x
x
n
i
i
4 - 32
统计学
(核心课程 )
均值
(数学性质 )
1,各变量值与均值的离差之和等于零
2,各变量值与均值的离差平方和最小
?
?
??
n
i
i xx
1
2 m in)(
?
?
??
n
i
i xx
1
0)(
4 - 33
统计学
(核心课程 )
调和平均数
(harmonic mean)
1,集中趋势的测度值之一
2,均值的另一种表现形式
3,易受极端值的影响
4,计算公式为
原来只是计
算时使用了
不同的数据

?
?
?
? ???
i
ii
i
ii
ii
m f
fM
M
fM
fM
H
4 - 34
统计学
(核心课程 )
调和平均数
(例题分析 )
某日三种蔬菜的批发成交数据
蔬菜
名称
批发价格 (元 )
Mi
成交额 (元 )
Mi fi
成交量 (公斤 )
fi



1.20
0.50
0.80
18000
12500
6400
15000
25000
8000
合计 — 36900 48000
【 例 】 某蔬菜批发市场三种蔬菜的日成交数据如表, 计算三
种蔬菜该日的平均批发价格
(元)
批发价格
成交额
成交额
769.0
48000
36900
???
?
mH
4 - 35
统计学
(核心课程 )
几何平均数
(geometric mean)
1,集中趋势的测度值之一
2,n 个变量值乘积的 n 次方根
3,适用于对比率数据的平均
4,主要用于计算平均增长率
5,计算公式为
6,可看作是均值的一种变形
n
n
i
i
n
nm xxxxG ?
?
?????
1
21 ?
n
x
xxx
n
G
n
i
i
nm
?
?????? 1
21
lg
)lglg( l g1lg ?
4 - 36
统计学
(核心课程 )
几何平均数
(例题分析 )
【 例 】 一位投资者持有一种股票, 1996年, 1997
年, 1998年和 1999年收益率分别为 4.5%,2.0%
,3.5%,5.4%。 计算该投资者在这四年内的平
均收益率 。
%84.103
%4.105%5.103%0.102%5.1044
21
?
????
???? n
nm
xxxG ?
平均收益率= 103.84%-1=3.84%
4 - 37
统计学
(核心课程 )
众数、中位数和均值的比较
4 - 38
统计学
(核心课程 ) 众数、中位数和均值的关系
左偏分布
均值 中位数 众数
对称分布
均值 = 中位数 = 众数
右偏分布
众数 中位数 均值
4 - 39
统计学
(核心课程 ) 众数、中位数和均值的 特点和应用
1,众数
? 不受极端值影响
? 具有不唯一性
? 数据分布偏斜程度较大时应用
2,中位数
? 不受极端值影响
? 数据分布偏斜程度较大时应用
3,平均数
? 易受极端值影响
? 数学性质优良
? 数据对称分布或接近对称分布时应用
4 - 40
统计学
(核心课程 ) 数据类型与集中趋势测度值
数据类型和所适用的集中趋势测度值
数据类型 分类数据 顺序数据 间隔数据 比率数据






※ 众数 ※ 中位数 ※ 均值 ※ 均值
— 四分位数 众数 调和平均数
— 众数 中位数 几何平均数
— — 四分位数 中位数
— — — 四分位数
— — — 众数
4 - 41
统计学
(核心课程 ) 4.2 离散程度的测度
一,分类数据:异众比率
二,顺序数据:四分位差
三,数值型数据:方差及标准差
四,相对位置的测量:标准分数
五,相对离散程度:离散系数
4 - 42
统计学
(核心课程 ) 离中趋势
1,数据分布的另一个重要特征
2,反映各变量值远离其中心值的程度 ( 离散程度 )
3,从另一个侧面说明了集中趋势测度值的代表程度
4,不同类型的数据有不同的离散程度测度值
4 - 43
统计学
(核心课程 )
数据的特征和测度
(本节位置 )
数据的特征和测度
分布的形状离散程度集中趋势
众 数
中位数
均 值 离散系数方差和标准差 峰 态
四分位差
异众比率 偏 态
4 - 44
统计学
(核心课程 )
分类数据:异众比率
4 - 45
统计学
(核心课程 )
异众比率
(variation ratio)
1,离散程度的测度值之一
2,非众数组的频数占总频数的比率
3,计算公式为
4,用于衡量众数的代表性
??
? ????
i
m
i
mi
r f
f
f
ff
V 1
4 - 46
统计学
(核心课程 )
异众比率
(例题分析 )
某城市居民关注广告类型的频数分布
广告类型 人数 (人 ) 频率 (%)
商品广告
服务广告
金融广告
房地产广告
招生招聘广告
其他广告
112
51
9
16
10
2
56.0
25.5
4.5
8.0
5.0
1.0
合计 200 100
解:
在所调查的 200人当中, 关注
非商品广告的人数占 44%,异众
比率还是比较大 。 因此, 用, 商
品广告, 来反映城市居民对广告
关注的一般趋势, 其代表性不是
很好
%4444.0
200
112
1
112
112200
??
??
?
?
r
V
4 - 47
统计学
(核心课程 )
顺序数据:四分位差
4 - 48
统计学
(核心课程 )
四分位差
(quartile deviation)
1,离散程度的测度值之一
2,也称为内距或四分间距
3,上四分位数与下四分位数之差
QD = QU - QL
4,反映了中间 50%数据的离散程度
5,不受极端值的影响
6,用于衡量中位数的代表性
4 - 49
统计学
(核心课程 )
四分位差
(顺序数据的算例 )
解,设非常不满意为
1,不满意为 2,一般为
3,满意为 4,非常满
意为 5 已知
QL = 不满意 = 2
QU = 一般 = 3
四分位差:
QD = QU = QL
= 3 – 2 = 1
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数 (户 ) 累计频数
非常不满意
不满意
一般
满意
非常满意
24
108
93
45
30
24
132
225
270
300
合计 300 —
4 - 50
统计学
(核心课程 )
数值型数据:方差和标准差
4 - 51
统计学
(核心课程 )
极差
(range)
1,一组数据的最大值与最小值之差
2,离散程度的最简单测度值
3,易受极端值影响
4,未考虑数据的分布
5,计算公式为
R = max(xi) - min(xi)
4 - 52
统计学
(核心课程 )
平均差
(mean deviation)
1,离散程度的测度值之一
2,各变量值与其均值离差绝对值的平均数
3,能全面反映一组数据的离散程度
4,数学性质较差,实际中应用较少
5,计算公式为
未分组数据
组距分组数据
n
xx
M
n
i
i
d
?
?
?
? 1
n
fxM
M
k
i
ii
d
?
?
?
? 1
4 - 53
统计学
(核心课程 )
平均差
(例题分析 )
某电脑公司销售量数据平均差计算表
按销售量分组 组中值 (Mi) 频数 (fi)
140—150
150—160
160—170
170—180
180—190
190—200
200—210
210—220
220—230
230—240
145
155
165
175
185
195
205
215
225
235
4
9
16
27
20
17
10
8
4
5
40
30
20
10
0
10
20
30
40
50
160
270
320
270
0
170
200
240
160
250
合计 — 50 — 2040
xMi ? ii fxM ?
4 - 54
统计学
(核心课程 )
平均差
(例题分析 )
)(17
1 2 0
2 0 4 01
台??
?
?
?
?
n
fxM
M
k
i
ii
d
含义,每一天的销售量平均数相比,
平均相差 17台
4 - 55
统计学
(核心课程 )
方差和标准差
(variance and standard deviation)
1,离散程度的测度值之一
2,最常用的测度值
3,反映了数据的分布
4,反映了各变量值与均值的平均差异
5,根据总体数据计算的,称为总体方差或标
准差;根据样本数据计算的,称为样本方
差或标准差
4 - 56
统计学
(核心课程 )
总体方差和标准差
(population variance and standard deviation)
未分组数据:
组距分组数据:
未分组数据:
组距分组数据:
方差的计算公式 标准差的计算公式
N
x
N
i
i?
?
?
? 1
2
2
)( ?
?
N
fM
K
i
ii?
?
?
? 1
2
2
)( ?
?
N
x
N
i
i?
?
?
? 1
2)( ?
?
N
fM
K
i
ii?
?
?
? 1
2)( ?
?
4 - 57
统计学
(核心课程 )
总体标准差
(例题分析 )
某电脑公司销售量数据平均差计算表
按销售量分组 组中值 (Mi) 频数 (fi)
140—150
150—160
160—170
170—180
180—190
190—200
200—210
210—220
220—230
230—240
145
155
165
175
185
195
205
215
225
235
4
9
16
27
20
17
10
8
4
5
40
30
20
10
0
10
20
30
40
50
160
270
320
270
0
170
200
240
160
250
合计 — 120 — 55400
? ?2??iM ? ? ii fM 2??
4 - 58
统计学
(核心课程 )
总体标准差
(例题分析 )
含义,每一天的销售量与平均数相比,
平均相差 21.49台
)(49.21
120
55400
)(
1
2
台??
?
?
?
?
N
fM
k
i
ii
?
?
4 - 59
统计学
(核心课程 )
样本方差和标准差
(simple variance and standard deviation)
未分组数据:
组距分组数据:
未分组数据:
组距分组数据:
方差的计算公式 标准差的计算公式
注意:
样本方差用自
由度 n-1去除 !
1
)(
1
2
2
?
?
?
?
?
n
xx
s
n
i
i
1
)(
1
2
2
?
?
?
?
?
n
fxM
s
k
i
ii
1
)(
1
2
?
?
?
?
?
n
xx
s
n
i
i
1
)(
1
2
?
?
?
?
?
n
fxM
s
k
i
ii
4 - 60
统计学
(核心课程 )
样本方差
自由度 (degree of freedom)
1,一组数据中可以自由取值的数据的个数
2,当 样本数据的个数为 n 时, 若样本均值 ?x 确定后,
只有 n-1个数据可以自由取值, 其中必有一个数据则
不能自由取值
3,例 如, 样本有 3个数值, 即 x1=2,x2=4,x3=9,则 ?x
= 5。 当 ?x = 5 确定后, x1,x2和 x3有两个数据可以
自由取值, 另一个则不能自由取值, 比如 x1=6,
x2=7,那么 x3则必然取 2,而不能取其他值
4,样 本方差用自由度去除, 其原因可从多方面来解释
,从实际应用角度看, 在抽样估计中, 当用样本方
差去估计总体方差 σ2时, 它是 σ2的无偏估计量
4 - 61
统计学
(核心课程 )
样本方差与标准差
(例题分析 )
原始数据, 10 5 9 13 6 8
3.8
16
)5.88()5.85()5.810(
1
)(
222
1
2
2
?
?
??????
?
?
?
?
?
?
?
n
xx
s
n
i
i
88.23.8 ??s
方差
标准差
4 - 62
统计学
(核心课程 )
相对位置的测量:标准分数
4 - 63
统计学
(核心课程 )
标准分数
(standard score)
1,也称标准化值
2,对某一个值在一组数据中相对位置的度量
3,可用于判断一组数据是否有离群点
4,用于对变量的标准化处理
5,计算公式为
s
xxz i
i
??
4 - 64
统计学
(核心课程 )
标准分数
(性质 )
1,均值等于 0
2,方差等于 1
001)(1 ??????? ?? sns xxnn zz ii
1
)(1
)0()(
2
2
2
2
222
2
??
?
??
?
?
?
?
?
?
???
s
s
s
xx
n
n
z
n
z
n
zz
s
i
ii
z
4 - 65
统计学
(核心课程 )
标准分数
(性质 )
z分数只是将原始数据进行了线性变换, 它并没有
改变一个数据在改组数据中的位置, 也没有改变该
组数分布的形状, 而只是将该组数据变为均值为 0
,标准差为 1。
4 - 66
统计学
(核心课程 )
标准化值
(例题分析 )
9个家庭人均月收入标准化值计算表
家庭编号 人均月收入(元) 标准化值 z
1
2
3
4
5
6
7
8
9
1500
750
780
1080
850
960
2000
1250
1630
0.695
-1.042
-0.973
-0.278
-0.811
-0.556
1.853
0.116
0.996
4 - 67
统计学
(核心课程 ) 经验法则
?经验法则表明:当一组数据对称分布时
? 约有 68%的数据在平均数加减 1个标准差
的范围之内
? 约有 95%的数据在平均数加减 2个标准差
的范围之内
? 约有 99%的数据在平均数加减 3个标准差
的范围之内
4 - 68
统计学
(核心课程 )
切比雪夫不等式
(Chebyshev’s inequality )
1,如果一组数据不是对称分布,经验法则就
不再使用,这时可使用切比雪夫不等式,
它对任何分布形状的数据都适用
2,切比雪夫不等式提供的是“下界”,也就
是“所占比例至少和多少”
3,对于任意分布形态的数据,根据切比雪夫
不等式,至少有 的数据落在 k个标准
差之内。其中 k是大于 1的任意值,但不一
定是整数
4 - 69
统计学
(核心课程 )
切比雪夫不等式
(Chebyshev’s inequality )
?对于 k=2,3,4,该不等式的含义是
1,至少有 75%的数据落在平均数加减 2个标
准差的范围之内
2,至少有 89%的数据落在平均数加减 3个标
准差的范围之内
3,至少有 94%的数据落在平均数加减 4个标
准差的范围之内
4 - 70
统计学
(核心课程 )
相对离散程度:离散系数
4 - 71
统计学
(核心课程 )
离散系数
(coefficient of variation)
1,标准差与其相应的均值之比
2,对数据相对离散程度的测度
3,消除了数据水平高低和计量单位的影响
4,用于对不同组别数据离散程度的比较
5,计算公式为
x
svv
s ?? 或?
?
?
4 - 72
统计学
(核心课程 )
离散系数
(例题分析 )
某管理局所属 8家企业的产品销售数据
企业编号 产品销售额(万元) x
1
销售利润(万元)
x2
1
2
3
4
5
6
7
8
170
220
390
430
480
650
950
1000
8.1
12.5
18.0
22.0
26.5
40.0
64.0
69.0
【 例 】 某管理局抽查了所属的 8家企业, 其产品销售数
据如表 。 试比较产品销售额与销售利润的离散程度
4 - 73
统计学
(核心课程 )
离散系数
(例题分析 )
结论,计算结果表明, v1<v2,说明产品销售额
的离散程度小于销售利润的离散程度
v1= 536.25309.19 =0.577
)(19.3 0 9
)(25.5 3 6
1
1
万元
万元
?
?
s
x
v2= 32.521523.09 =0.710
)(09.23
)(5215.32
2
2
万元
万元
?
?
s
x
4 - 74
统计学
(核心课程 ) 数据类型与离散程度测度值
数据类型和所适用的离散程度测度 值
数据类型 分类数据 顺序数据 数值型数据






※ 异众比率 ※ 四分位差 ※ 方差或标准差
— 异众比率 ※ 离散系数 ( 比较时用 )
— — 平均差
— — 极差
— — 四分位差
— — 异众比率
4 - 75
统计学
(核心课程 ) 4.3 偏态与峰态的测度
一, 偏态及其测度
二, 峰态及其测度
4 - 76
统计学
(核心课程 )
数据的特征和测度
(本节位置 )
数据的特征和测度
分布的形状离散程度
众 数
中位数
均 值 离散系数方差和标准差 峰 度
四分位差
异众比率 偏 态
集中趋势
4 - 77
统计学
(核心课程 ) 偏态与峰态分布的形状
扁平分布
尖峰分布
偏态 峰态
左偏分布
右偏分布
与标准正态
分布比较!
4 - 78
统计学
(核心课程 )
偏 态
4 - 79
统计学
(核心课程 )
偏态
(skewness)
1,统计学家 Pearson于 1895年首次提出
2,数据分布偏斜程度的测度
2,偏态系数 =0为 对称分布
3,偏态系数 > 0为 右偏分布
4,偏态系数 < 0为 左偏分布
4 - 80
统计学
(核心课程 )
偏态系数
(skewness coefficient)
1,根据原始数据计算
2,根据分组数据计算
? ?
3
3
)2)(1( snn
xxn
SK i
??
?
? ?
3
1
3)(
ns
fxM
SK
k
i
ii?
?
?
?
4 - 81
统计学
(核心课程 )
偏态系数
(例题分析 )
某电脑公司销售量偏态及峰度计算表
按销售量份组 (台 ) 组中值 (Mi) 频数 fi
140—150
150—160
160—170
170—180
180—190
190—200
200—210
210—220
220—230
230—240
145
155
165
175
185
195
205
215
225
235
4
9
16
27
20
17
10
8
4
5
-256000
-243000
-128000
-27000
0
17000
80000
216000
256000
625000
10240000
7290000
2560000
270000
0
170000
1600000
6480000
10240000
31250000
合计 — 120 540000 70100000
? ? ii fxM 3? ? ? ii fxM 4?
4 - 82
统计学
(核心课程 )
偏态系数
(例题分析 )
448.0
)58.21(120
540000
)58.21(120
)185()(
3
3
10
1
3
3
1
3
?
?
?
?
?
?
?
?
??
?? i
ii
k
i
ii
fM
ns
fxM
SK
结论,偏态系数为正值,但与 0的差异不大,说
明电脑销售量为轻微右偏分布,即销售量较少的
天数占据多数,而销售量较多的天数则占少数
4 - 83
统计学
(核心课程 )
偏态与峰态
(从直方图上观察 )
按销售量分组 (台 )
结论, 1,为右偏分布
2,峰态适中
140 150 210
某电脑公司销售量分布的直方图
190 200180160 170


(天 )
25
20
15
10
5
30
220 230 240
4 - 84
统计学
(核心课程 )
峰 态
4 - 85
统计学
(核心课程 )
峰态
(kurtosis)
1,统计学家 Pearson于 1905年首次提出
2,数据分布扁平程度的测度
3,峰态系数 =0扁平峰度适中
4,峰态系数 <0为 扁平分布
5,峰态系数 >0为 尖峰分布
4 - 86
统计学
(核心课程 )
峰态系数
(kurtosis coefficient)
1,根据原始数据计算
2,根据分组数据计算
? ?
4
224
)3)(2)(1(
)1()(3)()1(
snnn
nxxxxnn
K ii
???
?????
? ? ?
3
)(
4
1
4
?
?
?
?
?
ns
fxM
K
k
i
ii
4 - 87
统计学
(核心课程 )
峰态系数
(例题分析 )
结论,偏态系数为负值,但与 0的差异不大,说
明电脑销售量为轻微扁平分布
306.03694.2
3
)58.21(120
7 0 10 0 0 00
3
)(
44
1
4
????
?
?
??
?
?
?
?
ns
fxM
K
k
i
ii
4 - 88
统计学
(核心课程 )
用 Excel计算描述统计量
4 - 89
统计学
(核心课程 ) 用 Excel计算描述统计量
?将 120的销售量的数据输入到 Excel工作表中, 然后按下
列步骤操作:
第 1步,选择, 工具, 下拉菜单
第 2步,选择, 数据分析, 选项
第 3步,在分析工具中选择, 描述统计,, 然后选择, 确定,
第 4步,当对话框出现时
在, 输入区域, 方框内键入 数据区域
在, 输出选项, 中选择 输出区域
选择, 汇总统计,
选择, 确定,
实例计算
4 - 90
统计学
(核心课程 ) 本章小节
1,数据水平的概括性度量
2,数据离散程度的概括性度量
3,数据分布形状的测度
4,用 Excel计算描述统计量
结 束