第三章 数据分布特征的描述
第一节 集中趋势的测定
第二节 离散程度的测定
第三节 偏态与峰度的测定数据分布的特征集中趋势
(位置 )
离中趋势
(分散程度 )
偏态和峰度
(形状)
数据分布的特征和测度峰 度偏 态数据的特征和测度分布的形状集中趋势 离散程度众 数中位数离散系数方差和标准差四分位差异众比率位置平均数数值平均数算术平均数调和平均数几何平均数第一节 集中趋势的测定一,定类数据:众数二,定序数据:中位数和分位数三,定距和定比数据:数值平均数四,众数、中位数和算术平均数的比较数据分布的特征和测度
(本节位置)
数据的特征和测度分布的形状集中趋势 离散程度众 数中位数离散系数方差和标准差四分位差异众比率位置平均数数值平均数算术平均数调和平均数几何平均数峰 度偏 态集中趋势
(Central tendency)
1,一组数据向其中心值靠拢的倾向和程度
2,测度集中趋势就是寻找数据一般水平的代表值或中心值
3,不同类型的数据用不同的集中趋势测度值
4,低层次数据的集中趋势测度值适用于高层次的测量数据,
反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据
5,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定众 数众数
(概念要点 )
1,集中趋势的测度值之一
2,出现次数最多的变量值
3,不受极端值的影响
4,可能没有众数或有几个众数
5,主要用于定类数据,也可用于定序数据和数值型数据众数
(众数的不唯一性 )
无众数原始数据,10 5 9 12 6
8
一个众数原始数据,6 5 9 8 5 5
多于一个众数原始数据,25 28 28 36 42 42
定类数据的众数
(算例 )
表 3-1 某城市居民关注广告类型的频数分布广告类型 人数 (人 ) 比例 频率 (%)
商品广告服务广告金融广告房地产广告招生招聘广告其他广告
112
51
9
16
10
2
0.560
0.255
0.045
0.080
0.050
0.010
56.0
25.5
4.5
8.0
5.0
1.0
合计 200 1 100
【 例 】 根据表 3-1中的数据,计算众数解,这里的变量为,广告类型,,这是个定类变量,不同类型的广告就是变量值 。
我们看到,在所调查的 200人当中,关注商品广告的人数最多,为 112人,占总被调查人数的 56%,因此众数为,
商品广告,这一类别,即
Mo=商品广告定序数据的众数
(算例 )
【 例 】 根据表 3-2中的数据,计算众数解,这里的数据为定序数据 。 变量为,回答类别,。 甲城市中对住房表示不满意的户数最多,为 108户
,因此众数为,不满意,这一类别,即
Mo=不满意表 3-2 甲城市家庭对住房状况评价的频数分布回答类别 甲城市户数 (户 ) 百分比 (%)
非常不满意不满意一般满意非常满意
24
108
93
45
30
8
36
31
15
10
合计 300 100.0
数值型分组数据的众数
(要点及计算公式 )
1,众数的值与相邻两组频数的分布有关
4,该公式假定众数组的频数在众数组内均匀分布
2,相邻两组的频数相等时,众数组的组中值即为众数 Mo
3,相邻两组的频数不相等时,众数采用下列近似公式计算
i
ffff
ffLM?

)()( 11
1
0?
Mo
Mo
数值型分组数据的众数
(算例 )
表 3-3 某车间 50名工人日加工零件数分组表按零件数分组 频数(人) 累积频数
105~110
110~115
115~120
120~125
125~130
130~135
135~140
3
5
8
14
10
6
4
3
8
16
30
40
46
50
合计 50 —
【 例 3.1】
根据表 3-3
中的数据
,计算 50
名工人日加工零件数的众数
)(1235)1014()814( 8141200 个M
中位数和分位数中位数
(概念要点 )
1,集中趋势的测度值之一
2,排序后处于中间位置上的值
Me
50% 50%
3,不受极端值的影响
4,主要用于定序数据,也可用数值型数据,但不能用于定类数据
5,各变量值与中位数的离差绝对值之和最小,即
m in
1

n
i
ei MX
中位数
(位置的确定 )
未分组数据:
组距分组数据:
2
∑f?
中位数位置
2
1 N中位数位置
2
N?
N为奇数
N为偶数未分组数据的中位数
(计算公式 )

为偶数时当为奇数时当
NXX
NX
M
NN
N
e
1
22
2
1
2
1
定序数据的中位数
(算例 )
【 例 3.2】 根据表 3-2中的数据,计算甲城市家庭对住房满意状况评价的中位数解,中位数的位置为:
300/2= 150
从累计频数看,中位数的在,一般,这一组别中 。 因此
Me=一般表 3-2 甲城市家庭对住房状况评价的频数分布回答类别 甲城市户数 (户 ) 累计频数非常不满意不满意一般满意非常满意
24
108
93
45
30
24
132
225
270
300
合计 300 —
数值型未分组数据的中位数
(5个数据的算例 )
原始数据,24 22 21 26 20
排 序,20 21 22 24 26
位 置,1 2 3 4 5
中位数? 22
3
2
15
2
1 N位置数值型未分组数据的中位数
(6个数据的算例 )
原始数据,10 5 9 12 6 8
排 序,5 6 8 9 10 12
位 置,1 2 3 4 5 6
位置N+1
2
6+1
2 3.5
中位数8 + 92 8.5
1,根据位置公式确定中位数所在的组
2,采用下列近似公式计算,
该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数
(要点及计算公式 )
if
S∑f
LM
m
m
e
′?

12?
数值型分组数据的中位数
(算例 )
表 3-3 某车间 50名工人日加工零件数分组表按零件数分组 频数(人) 累积频数
105~110
110~115
115~120
120~125
125~130
130~135
135~140
3
5
8
14
10
6
4
3
8
16
30
40
46
50
合计 50 —
【 例 3.3】
根据第三章表 3-3中的数据,
计算 50 名工人日加工零件数的中位数
)(21.1 2 35
14
16
2
50
1 2 0 个
eM
四分位数
(概念要点 )
1,集中趋势的测度值之一
2,排序后处于 25%和 75%位置上的值
3,不受极端值的影响
4,主要用于定序数据,也可用于数值型数据,但不能用于定类数据
QL QM QU
25% 25% 25% 25%
四分位数
(位置的确定 )
未分组数据:
组距分组数据:
下四分位数 (QL)位置 = N+14
上四分位数 (QU)位置 =
3(N+1)
4
下四分位数 (QL)位置 = ∑f4
上四分位数 (QL)位置 = 3∑f4
定序数据的四分位数
(算例 )
【 例 3.4】 根据第三章表 3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数解,下四分位数 (QL)的位置为

QL位置= (300)/4= 75
上四分位数 (QL)的位置为:
QU位置= (3× 300)/4= 225
从累计频数看,QL在,不满意
” 这一组别中; QU在,一般,
这一组别中 。 因此
QL =不满意
QU =一般表 3-2 甲城市家庭对住房状况评价的频数分布回答类别 甲城市户数 (户 ) 累计频数非常不满意不满意一般满意非常满意
24
108
93
45
30
24
132
225
270
300
合计 300 —
数值型未分组数据的四分位数
(7个数据的算例 )
原始数据,23 21 30 32 28 25 26
排 序,21 23 25 26 28 30 32
位 置,1 2 3 4 5 6 7
N+
1
QL= 23
7+1Q
L位置 = 4 = 4 = 2
QU位置 =
3(N+1)
4
3(7+1)
4= = 6
QU = 30

数值型未分组数据的四分位数
(6个数据的算例 )
原始数据,23 21 30 28 25 26
排 序,21 23 25 26 28 30
位 置,1 2 3 4 5 6
QL= 21+0.75(23-21)
= 22,5
QL位置 = N+14 = 6+14 = 1.75
QU位置 =
3(N+1)
4
3(6+1)
4= = 5.25
QU = 28+0.25(30-28)
= 28.5

数值型分组数据的四分位数
(计算公式 )
上四分位数,
3
4
U
U U U
U
f
S
Q L i
f

4 L
L L L
L
f
S
Q L i
f
下四分位数,
数值型分组数据的四分位数
(计算示例 )
QL位置= 50/4= 12.5
QU位置= 3× 50/4= 37.5
表 3-3 某车间 50名工人日加工零件数分组表按零件数分组 频数(人) 累积频数
105~110
110~115
115~120
120~125
125~130
130~135
135~140
3
5
8
14
10
6
4
3
8
16
30
40
46
50
合计 50 —
【 例 3.6】 根据表 3-3中的数据,计算 50
名工人日加工零件数的四分位数 。
)(81.1 1 758
8450
1 1 5 个
LQ
)(75.1 2 8510
304 503
1 2 5 个

UQ
数值平均数算术平均数
(概念要点 )
1.集中趋势的测度值之一
2.最常用的测度值
3.一组数据的均衡点所在
4.易受极端值的影响
5,用于数值型数据,不能用于定类数据和定序数据算术平均数
(计算公式 )
设一组数据为,X1,X2,…,XN
简单均值 的计算公式为设分组后的数据为,X1,X2,…,XK
相应的频数为,F1,F2,…,FK
加权均值 的计算公式为
N
X
N
XXX
X
N
i
i
N
121?

K
i
i
K
i
ii
N
NN
F
FX
FFF
FXFXFX
X
1
1
21
2211
简单算术平均数
(算例 )
原始数据,10 5 9 13 6 8
5.8
6
86139510
6
6543211

XXXXXX
N
X
X
N
i
i
加权算术平均数
(算例)
表 3-3 某车间 50名工人日加工零件均值计算表按零件数分组 组中值( Xi) 频数( Fi) XiFi
105~110
110~115
115~120
120~125
125~130
130~135
135~140
107.5
112.5
117.5
122.5
127.5
132.5
137.5
3
5
8
14
10
6
4
322.5
562.5
940.0
1715.0
1275.0
795.0
550.0
合计 — 50 6160.0
【 例 3.7】 根据表 3-3中的数据,计算 50 名工人日加工零件数的均值
(个)2.12 3
50
61 60
1
1

K
i
i
K
i
ii
F
FX
X
权数对算术平均数的影响
甲乙两组各有 10名学生,他们的考试成绩及其分布数据如下:
甲组,考试成绩( X ),0 20 100
人数分布( F ),1 1 8
乙组,考试成绩( X ),0 20 100
人数分布( F ),8 1 1
X甲
0× 1+20× 1+100× 8
n 10
i=1
Xi
82(分)
X乙
0× 8+20× 1+100× 1
n 10
i=1
Xi
12(分)
算术平均数的数学性质
1.各变量值与均值的离差之和等于零
2,各变量值与均值的离差平方和最小

n
i
i XX
1
2 m i n)(

n
i
i XX
1
0)(
1
( ) 0
n
ii
i
X X f

2
1
( ) m in
n
ii
i
X X f

调和平均数
(概念要点 )
1,集中趋势的测度值之一
2,均值的另一种表现形式
3,易受极端值的影响
4,用于定比数据
5,不能用于定类数据和定序数据
6,计算公式为
i
M
i
i
M
H
M
X

调和平均数
(算例 )
表 3-4 某日三种蔬菜的批发成交数据蔬菜名称批发价格 (元 )
Xi
成交额 (元 )
mi
成交量 (公斤 )
mi/ Xi
甲乙丙
1.20
0.50
0.80
18000
12500
6400
15000
25000
8000
合计 — 36900 48000
【 例 3.8】 某蔬菜批发市场三种蔬菜的日成交数据如表 3-4
,计算三种蔬菜该日的平均批发价格
36900
0,7 6 9
48000
i
M
i
i
m
H
m
X

( 元 /公斤 )
几何平均数
(概念要点 )
1,集中趋势的测度值之一
2,N 个变量值乘积的 N 次方根
3,适用于特殊的数据
4,主要用于计算平均发展速度
5,计算公式为
6,可看作是均值的一种变形
N
N
i
i
N
NM XXXXG?

1
21?
N
X
XXX
N
G
N
i
i
NM
1
21
l o g
)l o gl o g( l o g1l o g?
几何平均数
(算例 )
【 例 3.9】 一位投资者持有一种股票,1996年,
1997年,1998年和 1999年收益率分别为
4.5%,2.0%,3.5%,5.4%。 计算该投资者在这四年内的平均收益率 。
%84.103
%4.105%5.103%0.102%5.1044
21

N
NM
XXXG?
平均收益率= 103.84%-1=3.84%
众数、中位数和算术平均数的比较众数、中位数和算术平均数的关系左偏分布算术平均数 中位数 众数右偏分布众数 中位数 算术平均数对称分布算术平均数 =中位数 =众数数据类型与集中趋势测度值表 3-5 数据类型和所适用的集中趋势测度值数据类型 定类数据 定序数据 定距数据 定比数据适用的测度值众数 中位数 算术平均数 算术平均数
— 四分位数 众数 调和平均数
— 众数 中位数 几何平均数
— — 四分位数 中位数
— — — 四分位数
— — — 众数红色为该数据类型最适合用的测度值第二节 离散程度的测定一,定类数据:异众比率二,定序数据:四分位差三,定距和定比数据:方差及标准差四,相对离散程度:离散系数离中趋势
1,数据分布的另一个重要特征
2,离中趋势的各测度值是对数据离散程度所作的描述
3,反映各变量值远离其中心值的程度,因此也称为离中趋势
4,从另一个侧面说明了集中趋势测度值的代表程度
5,不同类型的数据有不同的离散程度测度值数据的特征和测度
(本节位置)
数据的特征和测度分布的形状离散程度众 数中位数离散系数方差和标准差四分位差异众比率位置平均数数值平均数算术平均数调和平均数几何平均数偏 态峰 度集中趋势定类数据:异众比率异众比率
(概念要点 )
1,离散程度的测度值之一
2,非众数组的频数占总频数的比率
3,计算公式为
4,用于衡量众数的代表性

i
m
i
mi
r F
F
F
FF
V 1
异众比率
(算例 )
表 3-1 某城市居民关注广告类型的频数分布广告类型 人数 (人 ) 频率 (%)
商品广告服务广告金融广告房地产广告招生招聘广告其他广告
112
51
9
16
10
2
56.0
25.5
4.5
8.0
5.0
1.0
合计 200 100
【 例 3.10】 根据第三章表 3-1
中的数据,计算异众比率 解:
在所调查的 200人当中,关注非商品广告的人数占 44%,异众比率还是比较大 。 因此,用,商品广告,来反映城市居民对广告关注的一般趋势,其代表性不是很好
Vr = 200 -112
200
= 1 - 112200
= 0.44 = 44%
定序数据:四分位差四分位差
(概念要点 )
1.离散程度的测度值之一
2.也称为内距或四分间距
3.上四分位数与下四分位数之差
QD = QU - QL
4.反映了中间 50%数据的离散程度不受极端值的影响用于衡量中位数的代表性四分位差
(定序数据的算例 )
【 例 3.11】 根据第三章表 3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位差解,设非常不满意为 1,
不满意为 2,一般为 3,满意为 4,非常满意为 5
已知 QL = 不满意 = 2
QU = 一般 = 3
四分位差:
QD = QU = QL
= 3 – 2 = 1
表 3-2 甲城市家庭对住房状况评价的频数分布回答类别 甲城市户数 (户 ) 累计频数非常不满意不满意一般满意非常满意
24
108
93
45
30
24
132
225
270
300
合计 300 —
定距和定比数据:
方差和标准差极 差
(概念要点及计算公式 )
1,一组数据的最大值与最小值之差
2,离散程度的最简单测度值
3,易受极端值影响
4,未考虑数据的分布 7 8 9 10 7 8 9 10
未分组数据 R = max(Xi) - min(Xi)
.
=组距分组数据 R 最高组上限 - 最低组下限
计算公式为平均差
(概念要点及计算公式 )
1,离散程度的测度值之一
2,各变量值与其均值离差绝对值的平均数
3,能全面反映一组数据的离散程度
4,数学性质较差,实际中应用较少
计算公式为未分组数据组距分组数据
N
XX
M
N
i
i
D
1
K
i
i
K
i
ii
D
F
FXX
M
1
1?
平均差
(计算过程及结果)
表 3-3 某车间 50名工人日加工零件标准差计算表按零件数分组 组中值 (Xi) 频数 (Fi) | Xi- X | |Xi-X |Fi
105~110
110~115
115~120
120~125
125~130
130~135
135~140
107.5
112.5
117.5
122.5
127.5
132.5
137.5
3
5
8
14
10
6
4
15.7
10.7
5.7
0.7
4.3
9.3
14.3
47.1
53.5
45.6
9.8
43.0
55.8
57.2
合计 — 50 — 312
【 例 3.12】 根据第三章表 3-3中的数据,计算工人日加工零件数的平均差
(个)24.6
50
3 1 2
1
1

K
i
i
K
i
ii
D
F
FXX
M
方差和标准差
(概念要点 )
1,离散程度的测度值之一
2,最常用的测度值
3,反映了数据的分布
4,反映了各变量值与均值的平均差异
5,根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差
4 6 8 10 12
X = 8.3
总体方差和标准差
(计算公式 )
未分组数据:
组距分组数据:
未分组数据:
组距分组数据:
方差的计算公式 标准差的计算公式
N
XX
N
i
i?
1
2
2
)(
K
i
i
K
i
ii
F
FXX
1
1
2
2
)(

N
XX
N
i
i?
1
2)(
K
i
i
K
i
ii
F
FXX
1
1
2)(

总体标准差
(计算过程及结果)
3100.5
739.47
572.45
259.92
6.86
184.90
518.94
817.96
(Xi- X )2Fi

246.49
114.49
32.49
0.49
18.49
86.49
204.49
(Xi- X )2
50—合计
3
5
8
14
10
6
4
107.5
112.5
117.5
122.5
127.5
132.5
137.5
105~110
110~115
115~120
120~125
125~130
130~135
135~140
频数 (Fi)组中值 (Xi)按零件数分组表 3-3 某车间 50名工人日加工零件标准差计算表
【 例 3.13】 根据第三章表 3-3中的数据,计算工人日加工零件数的标准差
(个)87.7
50
5.3100
)(
1
1
2

K
i
i
K
i
ii
F
FXX
样本方差和标准差
(计算公式 )
未分组数据:
组距分组数据:
未分组数据:
组距分组数据:
方差的计算公式 标准差的计算公式注意:
样本方差用自由度 n-1去除 !
1
)(
1
2
2
1?
n
xx
S
n
i
i
n
k
i
i
k
i
ii
n
f
fxx
S
1
1
2
2
1
1
)(
1
)(
1
2
1
n
xx
S
n
i
i
n
k
i
i
k
i
ii
n
f
fxx
S
1
1
2
1
1
)(
样本方差自由度 (degree of freedom)
1,一组数据中可以自由取值的数据的个数 。
2,当样本数据的个数为 n 时,若样本均值?x 确定后,
只有 n-1个数据可以自由取值,其中必有一个数据则不能自由取值 。
3,例如,样本有 3个数值,即 x1=2,x2=4,x3=9,则?x
= 5。 当?x = 5 确定后,x1,x2和 x3有两个数据可以自由取值,另一个则不能自由取值,比如 x1=6,
x2=7,那么 x3则必然取 2,而不能取其他值 。
4,样本方差用自由度去除,其原因可从多方面来解释,
从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差 σ2时,它是 σ2的无偏估计量 。
样本方差
(算例 )
原始数据,10 5 9 13 6 8
3.8
16
)5.88()5.85()5.810(
1
)(
222
1
2
2
1

n
xx
S
n
i
i
n
样本标准差样本标准差
(算例 )
样本标准差原始数据,10 5 9 13 6 8
88.23.8
1
)(
1
2
1
n
xx
S
n
i
i
n
方差
(简化计算公式 )
样本方差总体方差
)1(11
)(
2
11
2
1
2
2
1

nn
x
n
x
n
xx
S
n
i
i
n
i
i
n
i
i
n
21
2
1
2
2
)(
X
N
X
N
XX
N
i
i
N
i
i

方差
(数学性质 )
各变量值对均值的方差小于对任意值的方差证明提示:设 X0为不等于?X 的任意数,D2为对 X0
的方差,则:
2
0
21
2
0
2
)(
XX
N
XX
D
N
i
i

相对离散程度:离散系数变异系数
1,各种变异指标与其相应的均值之比
2.消除了数据水平高低和计量单位的影响
3.测度了数据的相对离散程度
4.用于对不同总体数据离散程度的比较标准差系数
(概念要点和计算公式 )
1.标准差与其相应的均值之比
2.消除了数据水平高低和计量单位的影响
3.测度了数据的相对离散程度
4.用于对不同组别数据离散程度的比较
计算公式为
x
SV
X
V s 或
标准差系数
(实例和计算过程)
表 3-6 某管理局所属 8家企业的产品销售数据企业编号 产品销售额(万元) X
1
销售利润(万元)
X2
1
2
3
4
5
6
7
8
170
220
390
430
480
650
950
1000
8.1
12.5
18.0
22.0
26.5
40.0
64.0
69.0
【 例 3.15】 某管理局抽查了所属的 8家企业,其产品销售数据如表 3-6。 试比较产品销售额与销售利润的离散程度标准差系数
(计算结果 )
X1=536.25(万元)
S1=309.19(万元)
V1= 536.25309.19 =0.577
S2=23.09(万元)
V2= 32.521523.09 =0.710
X2=32.5215(万元)
结论,计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度数据类型与离散程度测度值表 3-7 数据类型和所适用的离散程度测度 值数据类型 定类数据 定序数据 定距数据或定比数据适用的测度值
※ 异众比率 ※ 四分位差 ※ 方差或标准差
— 异众比率 ※ 离散系数 ( 比较时用 )
— — 平均差
— — 极差
— — 四分位差
— — 异众比率
※ 为该数据类型 最适合的用的测度值第三节 偏态与峰度的测度一,偏态及其测度二,峰度及其测度数据的特征和测度
(本节位置)
数据的特征和测度分布的形状离散程度众 数中位数离散系数方差和标准差四分位差异众比率位置平均数数值平均数算术平均数调和平均数几何平均数集中趋势偏 态峰 度偏 态偏态与峰度分布的形状扁平分布尖峰分布偏态 峰度左偏分布右偏分布与标准正态分布比较!
偏态
(概念要点 )
1,数据分布偏斜程度的测度
2,偏态系数 =0为 对称分布
3,偏态系数 > 0为 右偏分布
4,偏态系数 < 0为 左偏分布
5,计算公式为
3
1
3
3
a
Fi
FXX
K
i
ii?
偏态
(实例 )
【 例 3,1 6 】 已知
1997年我国农村居民家庭按纯收入分组的有关数据如表
4.9。 试计算偏态系数表 3-7 1997年 农村居民家庭纯收入数据按纯收入分组(元) 户数比重( %)
500以下
500~1000
1000~1500
1500~2000
2000~2500
2500~3000
3000~3500
3500~4000
4000~4500
4500~5000
5000以上
2.28
12.45
20.35
19.52
14.93
10.35
6.56
4.13
2.68
1.81
4.94
户数比重
(%)
25
20
15
10
5
农村居民家庭村收入数据的直方图偏态与峰度
(从直方图上观察 )
按纯收入分组 (元 )
1000500← 1500 2000 2500 3000 3500 4000 4500 5000 →
结论,1,为右偏分布
2,峰度适中偏态系数
(计算过程)
表 3-8 农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组
(百元)
组中值
Xi
户数比重 (%)
Fi (Xi- X ) Fi3 (Xi- X ) Fi4
5以下
5—10
10—15
15—20
20—25
25—30
30—35
35—40
40—45
45—50
50以上
2.5
7.5
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5
52.5
2.28
12.45
20.35
19.52
14.93
10.35
6.56
4.13
2.68
1.81
4.94
-154.64
-336.46
-144.87
-11.84
0.18
23.16
89.02
171.43
250.72
320.74
1481.81
2927.15
4686.51
1293.53
46.52
0.20
140.60
985.49
2755.00
5282.94
8361.98
46041.33
合计 — 100 1689.25 72521.25
偏态系数
(计算结果 )
根据上表数据计算得将计算结果代入公式得结论,偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大

956.07339.1766
25.1689
089.121
429.21
3
11
1
3
3
1
3
3′

i
ii
K
i
ii FX
∑F
FXX
a
(百元)4 2 9.21
1
1

K
i
i
i
K
i
i
F
FXX (百元)0 8 9.12
1
1

K
i
i
i
K
i
i
F
F
X?
峰 度峰度
(概念要点 )
1,数据分布扁平程度的测度
2,峰度系数 =3扁平程度适中
3,峰度系数 <3为 扁平分布
4,峰度系数 >3为 尖峰分布
5,计算公式为
K
4
1
4
4?a ∑Fi
FXX
i
ii?
峰度系数
(实例计算结果 )
代入公式得
【 例 3.17】 根据表 3-8中的计算结果,计算农村居民家庭纯收入分布的峰度系数由于峰度系数 α=3.4>3,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重

4.3089.121
25.72521
24
1
4
4?′?
a ∑F
FXX
K
i
ii
·