第 3章 集中趋势和离散趋势集中趋势的测度平均指标反映同类现象的 一般水平,是总体内各单位参差不齐的标志值的 代表值,也是对变量分布 集中趋势 的测定 。
数据集中区变量 xx
常用的平均指标指标名称 简单平均数 公式 加权平均数公式算术平均数调和平均数几何平均数中位数 将总体标志值按大小顺序排列,处于中间位置的标志值众数 总体中出现次数最多的标志值
N
X
X
N
i
i?
1?

N
i
i
N
i
ii
f
fX
X
1
1
N
i i
H
X
NX
1
1

N
i i
i
N
i
i
H
X
m
m
X
1
1
N iG XX i if f
iG XX
价格(元)
3.3
2.5
2.0
合计销售量(斤 )
3
4
5
12
价格(元)
3.3
2.5
2.0
合计销售额(元)
10
10
10
30
例:求某种商品三地零售价格的平均值算术平均
543
50.245.233.3



i
iif fxx
调和平均
100.2 1105.2 1103.3 1
101010
1


i
i
i
H m
x
mx
元4 9 2.212 9.29
元)(4 9 4.203.12 30
例,求 95%,93%,90%的几何平均数
%64.9279515.0
%90%93%95 ) 1(
3
3

Gx

455.8943.7561.8912.8
3
1
90.0l og93.0l og95.0l og
3
1
l og )2(

Gx
%71.92?Gx (计算误差,0.0007)
① 求比例,250-240/( 345-240) =0.095
② 分割中位数组的组距 ( 1400-1100) × 0.095=28.5
下限公式
③ 加下限,即 Me=1100+28.5=1128.5(元)
例,某市 500户居民人均月收入数据如下,计算其中位数。
分组 <500 <800 <1100 <1400 <1700 <2000
频数 40 90 110 105 70 50 35
累计频数 40 130 240 345 415 465 500
中位数位置,500/2=250
分组 <500 <800 <1100 <1400 <1700 <2000
频数 40 90 110 105 70 50 35
d1=20 d2=5
众数组 800~1100
① 求比例,d1/( d1+d2) =20/( 20+5) =0.8
② 分割众数组的组距,0.8× ( 1100-800) =240(元)
下限公式
③ 加下限,即 M0=800+240=1040(元)
例,某市 500户居民人均月收入数据如下,计算其众数。
离散趋势的测度标志变异指标是反映变量分布 离散趋势,
与平均指标 相匹配 的指标 。
反映变量分布的离散趋势
是对事物发展均衡性的量度
是对平均数的代表性程度的量度作 用指标名称 概 念 计算公式 特 点数列中最大值与最小值之差极 差( R)
R=最大值 -最小值优点:容易理解计算方便缺点:不能反映全部数据分布状况平均差
( A.D.)
各标志值与均值离差绝对值的算术平均
i
ii
f
fXXDA
..
N
XXDA i..简单加权优点:反映全部数据分布状况缺点:取绝对值 数字上 不尽合理常用的标志变异指标指标名称 概 念 计算公式 特 点各标志值与其平均数离差平方的平均方差的平方根
( 取正根 )
方差
( σ2)
标准差
(σ)
优点:反映全部数据分布状况,数字上合理缺点:受计量单位和平均水平影响不便于比较标准差系数
( Vσ)
标准差与平均数之商,是无量纲的系数优点:适宜不同数据集的比较缺点:对数据结构变化反应不灵敏X
V
简单加权

f
fXX
22

N
XX i 22
2
方差( σ2)和标准差( σ)是应用最广的标志变异指标
2222
2 ;,?




N
X
N
X
N
X
N
X iiii简单
222
2 ;:








i
ii
i
ii
i
ii
i
i
z
i
f
fX
f
fX
f
fX
f
fX加权
σ2和 σ的简易计算公式