,统计学,第四章 统计特征值第一节 集中趋势的测度第三节 偏态与峰度第二节 离散趋势的测度第四章 统计特征值第一节 集中趋势的测度指总体中各单位的次数分布从两边向中间集中的趋势,用 平均指标 来反映。集中趋势又称平均数,是反映社会经济现象总体各单位某一数量标志在一定时间、地点和条 件下所达到的一般水平的综合指标。
平均数数值平均数数值平均数算术平均数调和平均数几何平均数中位数众数总体单位总数总体标志总量平均数算术
基本形式:
总产量总成本平均成本职工人数工资总额平均工资
例:
直接承担者
※ 注意区分算术平均数与强度相对数算术平均数
,统计学,第四章 统计特征值
STAT
V A R 0 0 0 0 1
1
7
4
,0
1
7
3
,0
1
7
2
,0
1
7
1
,0
1
7
0
,0
1
6
9
,0
1
6
8
,0
1
6
7
,0
1
6
6
,0
1
6
5
,0
1
6
4
,0
1
6
3
,0
1
6
2
,0
1
6
1
,0
1
6
0
,0
1
5
9
,0
1
5
8
,0
1
5
7
,0
1
5
6
,0
1
5
5
,0
1
5
4
,0
1
5
3
,0
1
5
2
,0
14
12
10
8
6
4
2
0
S t d,D e v = 4,8 6
M e a n = 1 6 3,3
N = 8 3,0 0
算术平均数
1 5 0
1 5 5
1 6 0
1 6 5
1 7 0
1 7 5
1 8 0
83名女生的身高变量一般水平、代表性数值分布的集中趋势、
中心数值算术平均数
,统计学,第四章 统计特征值算术平均数的计算算术平均数 =
总体标志总量总体单位总数数据集 ),,,(
121 NNi xxxxx
数据个数 Nx
N
x
x
简单算术平均数
,统计学,第四章 统计特征值
A,简单算术平均数 —— 适用于总体资料未经分组整理、尚为原始资料的情况
N
X
N
XXX
X
N
i
i
N
121
式中,为算术平均数 ; 为总体单位总数;
为第 i 个单位的标志值。
iX
NX
算术平均数的计算方法
,统计学,第四章 统计特征值平均每人日销售额为:
元558
5
2 7 9 0
5
440750480600520

N
X
X
算术平均数的计算方法某售货小组 5个人,某天的销售额分别为 520元,600元,480元,750
元,440元,则
【 例 】
,统计学,第四章 统计特征值
B,加权算术平均数 —— 适用于总体资料经过分组整理形成变量数列的情况

m
i
i
m
i
ii
m
mm
f
fX
fff
fXfXfX
X
1
1
21
2211

式中,为算术平均数 ; 为第 组的次数;
为组数; 为第 组的标志值或组中值。
X
iX
if i
m i
算术平均数的计算方法
,统计学,第四章 统计特征值
【 例 】 某企业某日工人的日产量资料如下:
日产量(件) 工人人数(人)
10
11
12
13
14
70
100
380
150
100
合计 800
X f
计算该企业该日全部工人的平均日产量。
算术平均数的计算方法,统计学,第四章 统计特征值件)(1 3 7 5.12
8 0 0
9 7 1 0
1 0 070
1 0 0147010
1
1

m
i
i
m
i
ii
f
fX
X解:
算术平均数的计算方法若上述资料为组距数列,则应取各组的 组中值 作为该组的代表值用于计算;此时求得的算术平均数只是其真值的 近似值 。
说明
,统计学,第四章 统计特征值

m
i
i
m
i
ii
f
fX
X
1
1
分析:
成绩(分) 人数(人)甲班 乙班 丙班
60 39 1 50
100 1 39 50
平均成绩(分) 61 99 80
起到权衡轻重的作用算术平均数的计算方法 决定平均数的变动范围
,统计学,第四章 统计特征值表现为次数、频数、单位数;即公式 中的 fXfX f
表现为频率、比重;即公式中的?
f
fXfXfX? ff
算术平均数的计算方法指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度权数绝对权数相对权数
,统计学,第四章 统计特征值
2 3 4 5 6 7 81 9
权数与加权
5
9
987654321x
625.4
8
97654321x
2 3 4 5 6 7 81 9
,统计学,第四章 统计特征值权数与加权
2 3 4 5 6 7 81 9
,统计学,第四章 统计特征值权数与加权
,统计学,第四章 统计特征值权数与加权
2 3 4 5 6 7 81 9
24.4
21
191817263554432221x
,统计学,第四章 统计特征值权数与加权
2 3 4 5 6 7 81 9
24.4
21
191817263554432221x
算术平均数的计算取决于变量值和权数的共同作用:
变量值决定平均数的范围;
权数则决定平均数的位置
,统计学,第四章 统计特征值
⒈ 变量值与其算术平均数的离差之和衡等于零,即:
⒉变量值与其算术平均数的离差平方和为最小,即:
0)( xx
m in)( 2 xx
算术平均数的主要数学性质
,统计学,第四章 统计特征值离差的概念
1x
2x
3x
4x
5x
6x
1
2
3
4
5
6
7
8
5?x-1 -1-2
1
3
0)1(13)2(01)( xx
16)1(13)2(01)( 2222222 xx
,统计学,第四章 统计特征值
【 例 】 设 X=( 2,4,6,8),则其调和平均数可由定义计算如下:
⒉ 再求算术平均数,4
8
1
6
1
4
1
2
1?

⒈ 求各标志值的倒数,,,,
2
1
4
1
6
1
8
1
⒊ 再求倒数,?

8
1
6
1
4
1
2
14
是总体各单位标志值倒数的算术平均数的倒数,又叫 倒数平均数调和平均数
,统计学,第四章 统计特征值
A,简单调和平均数 —— 适用于总体资料未经分组整理、尚为原始资料的情况

X
m
XXX
m
X
m
H 1111
21
式中,为调和平均数 ; 为变量值的个数; 为第 个变量值。i
iX
mHX
调和平均数的计算方法
,统计学,第四章 统计特征值
B,加权调和平均数 —— 适用于总体资料经过分组整理形成变量数列的情况式中,为第 组的变量值; 为第组的标志总量。
imiX ii

m
X
m
X
m
X
m
X
m
mmm
X
m
m
m
H
1
2
2
1
1
21
调和平均数的计算方法
,统计学,第四章 统计特征值
—— 当己知各组变量值和标志总量时,
作为算术平均数的变形使用。
因为:
X
f
Xf
Xf
X
Xf
m
X
m
XXfm
H

1
1
,则设调和平均数的应用
,统计学,第四章 统计特征值
f
xf
x
x,f 为已知若只知 x 和 xf,而 f 未 知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式 。
xf
x
xf
x
1
苹果 单价 购买量 总金额品种 (元)(公斤) (元)
红富士 2 3 6
青香蕉 1.8 5 9
x f xf
875.1
53
58.132

x
875.1
8.1
9
2
6
96
x
,统计学,第四章 统计特征值日产量(件) 各组工人日总产量(件)
10
11
12
13
14
700
1100
4560
1950
1400
合计 9710
【 例 】 某企业某日工人的日产量资料如下:
计算该企业该日全部工人的平均日产量。
调和平均数的应用
X m
,统计学,第四章 统计特征值
件1 3 7 5.12
8 0 0
9 7 1 0
14
1 4 0 0
10
7 0 0
9 7 1 0
1

m
X
m
X
H
即该企业该日全部工人的平均日产量为
12.1375件。
调和平均数的应用解
,统计学,第四章 统计特征值比值 的平均数的计算方法由于比值( 平均数或相对数 )不能直接相加,求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比设比值
i
i
i f
mX?
分子变量分母变量则有:
mi
X
mffXm
i
i
iiii,,2,1,,
,统计学,第四章 统计特征值

m
X
m
f
Xf
f
m
X
1
己知,
采用基本平均数公式
fm,己知,
采用加权算术平均数公式
fX,己知,
采用加权调和平均数公式
mX、
比值
i
i
i f
mX?
,统计学,第四章 统计特征值比值 的平均数的计算方法
【 例 A】 某季度某工业公司 18个工业企业产值计划完成情况如下:
计划完成程度
( ﹪ )
组中值
( ﹪ )
企业数
(个)
计划产值
(万元)
90以下
90~ 100
100~ 110
110以上
85
95
105
115
2
3
10
3
800
2500
17200
4400
合计 — 18 24900
计算该公司该季度的平均计划完成程度。
,统计学,第四章 统计特征值比值 的平均数的计算方法
【 例 A】 某季度某工业公司 18个工业企业产值计划完成情况如下:
计划完成程度
( ﹪ )
组中值
( ﹪ )
企业数
(个)
计划产值
(万元)
90以下
90~ 100
100~ 110
110以上
85
95
105
115
2
3
10
3
800
2500
17200
4400
合计 — 18 24900
计算该公司该季度的平均计划完成程度。

f
mX
计划产值实际产值程度计划完成?分析:
X
f
应采用加权算术平均数公式计算
﹪12.1 0 5
2 4 9 0 0
2 6 1 7 5
4 4 0 08 0 0
4 4 0 015.18 0 085.0

f
Xf
X
,统计学,第四章 统计特征值比值 的平均数的计算方法
【 例 B】 某季度某工业公司 18个工业企业产值计划完成情况如下(按计划完成程度分组):
组别 企业数
(个)
计划产值
(万元)
实际产值
(万元)
1
2
3
4
2
3
10
3
800
2500
17200
4400
680
2375
18060
5060
合计 18 24900 26175
计算该公司该季度的平均计划完成程度。
,统计学,第四章 统计特征值比值 的平均数的计算方法
【 例 B】 某季度某工业公司 18个工业企业产值计划完成情况如下(按计划完成程度分组):
组别 企业数
(个)
计划产值
(万元)
实际产值
(万元)
1
2
3
4
2
3
10
3
800
2500
17200
4400
680
2375
18060
5060
合计 18 24900 26175
计算该公司该季度的平均计划完成程度。
求解比值的平均数的方法

f
mX
计划产值实际产值程度计划完成?分析:
f
m
应采用平均数的基本公式计算
﹪12.1 0 5
2 4 9 0 0
2 6 1 7 5

f
m
X
,统计学,第四章 统计特征值是 N项变量值连乘积的开 N次方根。几何平均数用于计算现象的平均比率或平均速度应用:
各个比率或速度的连乘积等于总比率或总速度;
相乘的各个比率或速度不为零或负值。
应用的前提条件:
,统计学,第四章 统计特征值
A,简单几何平均数
—— 适用于总体资料未经分组整理尚为原始资料的情况式中,为几何平均数 ; 为变量值的个数; 为第 个变量值。i
iX
NGX
NN
NG XXXXX21
几何平均数的计算方法
,统计学,第四章 统计特征值
【 例 】 某流水生产线有前后衔接的五道工序。
某日各工序产品的合格率分别为 95﹪,92﹪,
90﹪,85﹪,80﹪,求整个流水生产线产品的平均合格率。
分析:
设最初投产 100A个单位,则第一道工序的合格品为 100A× 0.95;
第二道工序的合格品为 ( 100A× 0.95) × 0.92;
……
第五道工序的合格品为
( 100A× 0.95× 0.92× 0.90× 0.85) × 0.80;
,统计学,第四章 统计特征值因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为
100A× 0.95× 0.92× 0.90× 0.85× 0.80;
则该流水线产品总的合格率为:
80.085.090.092.095.0
1 0 0 A
80.085.090.092.00,9 51 0 0 A

总产品总合格品即 该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,
故需采用几何平均法计算 。
,统计学,第四章 统计特征值因该流水线的最终合格品即为第五道工序的合格品,故该流水线总的合格品应为
100A× 0.95× 0.92× 0.90× 0.85× 0.80;
则该流水线产品总的合格率为:
80.085.090.092.095.0
1 0 0 A
80.085.090.092.00,9 51 0 0 A

总产品总合格品即 该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,
故需采用几何平均法计算 。
﹪24.885349.0
80.085.090.092.095.0
5
5

GX
解:
,统计学,第四章 统计特征值思考若上题中不是由五道连续作业的工序组成的流水生产线,而是五个 独立作业的车间,且各车间的合格率同前,
又假定各车间的产量相等均为 100件,
求该企业的平均合格率。
几何平均数的计算方法
,统计学,第四章 统计特征值因各车间彼此独立作业,所以有第一车间的合格品为,100× 0.95;
第二车间的合格品为,100× 0.92;
……
第五车间的合格品为,100× 0.80。
则该企业全部合格品应为各车间合格品的总和,即总合格品 =100× 0.95+……+100 × 0.80
几何平均数的计算方法分析:
,统计学,第四章 统计特征值不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为
﹪4.88
5 0 0
4 4 2
1 0 01 0 0
1 0 080.01 0 095.0

f
Xf
X
f mX 产品合格品合格率?
应采用加权算术平均数公式计算,即
,统计学,第四章 统计特征值
B,加权几何平均数
—— 适用于总体资料经过分组整理形成变量数列的情况式中,为几何平均数 ; 为第 组的次数;
为组数; 为第 组的标志值或组中值。
GX
iX
if
i
m i

m
i
i
i
m
i
i
m
f m
i
f
i
f
f
m
ff
G XXXXX 1
1 21
1
21?
几何平均数的计算方法
,统计学,第四章 统计特征值
【 例 】 某金融机构以复利计息。近 12年来的年利率有 4年为 3﹪,2年为 5﹪,2年为 8﹪,3年为 10﹪,1年为 15﹪ 。求平均年利率。
设本金为 V,则至各年末的本利和应为:
第 1年末的本利和为,﹪31?V
﹪﹪ 3131V第 2年末的本利和为,……… ………
﹪﹪﹪﹪﹪ 151101815131 3224V
第 12年末的本利和为:
分析:
第 2年的计息基础第 12年的计息基础
,统计学,第四章 统计特征值

15.010,0 5130.01
V
15.010,0 5130.01V
24
24

本金总的本利和则该笔本金 12年总的本利率为:
即 12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。

﹪﹪平均年利率

85.6185.1061
85.1062 1 5 4.2
15.0105.0103.01
12
124 24

G
G
X
X
解:
,统计学,第四章 统计特征值几何平均数的计算方法思考若上题中不是按复利而是按 单利计息,且各年的利率与上相同,
求平均年利率。
分析 第 1年末的应得利息为,03.0?V第 2年末的应得利息为,
03.0?V
第 12年末的应得利息为,15.0?V
…… ……
设本金为 V,则各年末应得利息为:
,统计学,第四章 统计特征值则该笔本金 12年应得的利息总和为:
=V( 0.03× 4+0.05× 2+……+0.15 × 1)
这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为

f
m
X
本金利息利息率?
假定本金为 V
,统计学,第四章 统计特征值所以,应采用加权算术平均数公式计算平均年利息率,即:

﹪92.6
12
83.0
14
115.0403.0

V
V
VV
VV
f
Xf
X
解:
(比较:按复利计息时的平均年利率为 6.85﹪ )
,统计学,第四章 统计特征值是否为比率或速度各个比率或速度的连乘积是否等于总比率或总速度是否为其他比值

f f
G
NG
XX
XX
是否否是 否 是 几何平均法
f
Xf
X
N
X
X
算术平均法

m
X
m
f
Xf
f
m
X 1
求解比值的平均数的方法数值平均数计算公式的选用顺序 指标
,统计学,第四章 统计特征值四种数值平均数均源于一个通式:
k
k
k
f
fx
x

f
x
f
f
f
x
f
fx
xk
1
1
1
1
1
1
时有
,统计学,第四章 统计特征值四种数值平均数均源于一个通式:
k
k
k
f
fx
x

f
f
k
k
k
x
f
fx
k
0
lim0 时有
,统计学,第四章 统计特征值四种数值平均数均源于一个通式:
k
k
k
f
fx
x

f
xf
xk 时有1
,统计学,第四章 统计特征值四种数值平均数均源于一个通式:
k
k
k
f
fx
x

f
fx
xk
2
2 时有
,统计学,第四章 统计特征值
f fx
f
xf
f
fx 2
f
x
f
1
k=-1 k=0 k=1 k=2
就同一资料计算时,有:
即,k 值越大,平均数值越大。
,统计学,第四章 统计特征值
QGh xxxx
设 x 取值为:
4、4、5、5、5,10
5?hx 21.5?Gx 5.5?Ax 87.5?Qx
< < <
算术平均与几何平均更为常用一些,
其中几何平均数对小的极端值敏感,
算术平均数对大的极端值敏感。
,统计学,第四章 统计特征值某系 83名女生身高资料(按序排列)
次序统计量的概念身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
152 154 154 155 155 156
156 156 156 157 158 158
159 159 160 160 160 160
160 160 160 160 160 160
160 160 161 161 161 161
161 161 161 162 162 162
162 162 162 162 162 163
163 163 163 164 164 164
165 165 165 165 165 165
165 165 166 166 166 166
166 167 167 167 168 168
168 168 168 168 168 169
170 170 170 170 170 171
171 172 172 172 174
将变量值按顺序排列起来,
当反映分布集中趋势的度量值仅仅由数列中某个位置的值来确定时,这个值就称为次序统计量,
也可以称为位置平均数。
位置平均数与数值平均数的基本区别在于其不需要依据每一个变量值来计算。
,统计学,第四章 统计特征值某系 83名女生身高资料(按序排列)
次序统计量的概念身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
将变量值按顺序排列起来,
当反映分布集中趋势的度量值仅仅由数列中某个位置的值来确定时,这个值就称为次序统计量,
也可以称为位置平均数。
位置平均数与数值平均数的基本区别在于其不需要依据每一个变量值来计算。
152 154 154 155 155 156
156 156 156 157 158 158
159 159 160 160 160 160
160 160 160 160 160 160
160 160 161 161 161 161
161 161 161 162 162 162
162 162 162 162 162 163
163 163 163 164 164 164
165 165 165 165 165 165
165 165 166 166 166 166
166 167 167 167 168 168
168 168 168 168 168 169
170 170 170 170 170 171
171 172 172 172 174
数列中点的值即第 42个值
,统计学,第四章 统计特征值
,统计学,第四章 统计特征值将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用 表示
eM
中位数不受极端数值的影响,在总体标志值差异很大时,具有较强的代表性。
中位数的作用:
位置平均数中位数把标志值数列分为两个部分,一部分标志值小于或等于它,另一部分标志值大于或等于它,
中位数的位次为:
3
2
15
2
1N
即第 3个单位的标志值就是中位数元5 2 0?
eM
【 例 A】 某售货小组 5个人,某天的销售额按从小到大的顺序排列为 440元,480元,520元、
600元,750元,则中位数的确定
(未分组资料)
,统计学,第四章 统计特征值中位数的位次为
5.32 162 1N
中位数应为第 3和第 4个单位标志值的算术平均数,即
元5602 600520eM
【 例 B】 若上述售货小组为 6个人,某天的销售额按从小到大的顺序排列为 440元,480元、
520元,600元,750元,760元,则中位数的确定
(未分组资料)
,统计学,第四章 统计特征值
【 例 C】 某企业某日工人的日产量资料如下:
日产量(件) 工人人数(人) 向上累计次数
(人)
10
11
12
13
14
70
100
380
150
100
70
170
550
700
800
合计 800 —
X f
计算该企业该日全部工人日产量的中位数。
中位数的位次:
5.4 0 02 18 0 0
eM
中位数的确定
(单值数列)
,统计学,第四章 统计特征值中位数的确定
(组距数列)
【 例 D】 某车间 50名工人月产量的资料如下:
月产量(件) 工人人数(人) 向上累计次数
(人)
200以下
200~ 400
400~ 600
600以上
3
7
32
8
3
10
42
50
合计 50 —
计算该车间工人月产量的中位数。
X f
d
f
S
f
LM
m
m
e?

1
2
件75.4 934 006 00
32
10
2
50
4 00
eM
,统计学,第四章 统计特征值中位数的确定 (组距数列)
共 个单位
2
f 共 个单位
2
f
共 个单位1?mS 共 个单位1?mS
L U
中位数组组距为 d
共 个单位mf
假定该组内的单位呈均匀分布共有单位数
12
mS
f
中位数下限公式为
d
f
S
f
LM
m
m
e?

12
该段长度应为
d
f
S
f
m
m
1
2
,统计学,第四章 统计特征值中位数一定存在;
中位数与算术平均数相近;
中位数不受极端值影响;
变量值与中位数离差绝对值之和最小。
中位数的作用及用法
,统计学,第四章 统计特征值中位数一定存在;
中位数与算术平均数相近;
中位数不受极端值影响;
变量值与中位数离差绝对值之和最小。
中位数的作用及用法变量值 3 4 5 5 6 9 10
中位数 5
平均值 6
与中位数离差 -2 -1 0 0 1 4 5
与平均数离差 -3 -2 -1 -1 0 3 4
绝对数值之和
13
14
,统计学,第四章 统计特征值
,统计学,第四章 统计特征值指总体中出现次数最多的变量值,
用 表示,它不受极端数值的影响,
用来说明总体中大多数单位所达到的一般水平。
0M
众数位置平均数众数( mode):出现次数最多即出现频率最高的变量值。
身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
152 154 154 155 155 156
156 156 156 157 158 158
159 159 160 160 160 160
160 160 160 160 160 160
160 160 161 161 161 161
161 161 161 162 162 162
162 162 162 162 162 163
163 163 163 164 164 164
165 165 165 165 165 165
165 165 166 166 166 166
166 167 167 167 168 168
168 168 168 168 168 169
170 170 170 170 170 171
171 172 172 172 174
,统计学,第四章 统计特征值众数的确定方法某年级 83名女生身高资料身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
,统计学,第四章 统计特征值身高 人数 比重
( CM) (人) ( %)
150-155 3 3.61
155-160 11 13.25
160-165 34 40.96
165-170 24 28.92
170以上 11 13.25
总计 83 100
某年级 83名女生身高资料众数的确定方法
2
UL
M o
概约众数:众数所在组的组中值,在本例为 162.5cm
dLM o?

21
1
48.1635
1023
23160
oM
,统计学,第四章 统计特征值日产量(件) 工人人数(人)
10
11
12
13
14
70
100
380
150
100
合计 800
【 例 A】 已知 某企业某日工人的日产量资料如下,
0M
众数的确定
(单值数列)
计算该企业该日全部工人日产量的众数。
,统计学,第四章 统计特征值众数的确定
(组距数列)
【 例 B】 某车间 50名工人月产量的资料如下:
月产量(件) 工人人数(人) 向上累计次数
(人)
200以下
200~ 400
400~ 600
600以上
3
7
32
8
3
10
42
50
合计 50 —
计算该车间工人月产量的众数。
X f
件500
2
ULM o dLM o

21
1
件502200
2425
25400
oM
概约众数,众数所在组的组中值,在本例为 500件众数的原理及应用
V A R 0 0 0 0 1
1
7
4
,0
1
7
3
,0
1
7
2
,0
1
7
1
,0
1
7
0
,0
1
6
9
,0
1
6
8
,0
1
6
7
,0
1
6
6
,0
1
6
5
,0
1
6
4
,0
1
6
3
,0
1
6
2
,0
1
6
1
,0
1
6
0
,0
1
5
9
,0
1
5
8
,0
1
5
7
,0
1
5
6
,0
1
5
5
,0
1
5
4
,0
1
5
3
,0
1
5
2
,0
14
12
10
8
6
4
2
0
S t d,D e v = 4,8 6
M e a n = 1 6 3,3
N = 8 3,0 083名女生身高原始数据
V A R 0 0 0 0 1
1 7 3,01 7 0,01 6 7,01 6 4,01 6 1,01 5 8,01 5 5,01 5 2,0
30
20
10
0
S t d,D e v = 4,8 6
M e a n = 1 6 3,3
N = 8 3,0 0
83名女生身高组距数列
oM
,统计学,第四章 统计特征值
当数据分布存在明显的集中趋势,
且有显著的极端值时,适合使用众数;
当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数( 前者无众数,后者为双众数或多众数,也等于没有众数 )
众数的原理及应用
,统计学,第四章 统计特征值出生
1981.01980.01979.01978.01977.01976.01975.0
160
140
120
100
80
60
40
20
0
没有突出地集中在某个年份
413名学生出生时间分布直方图众数的原理及应用
(无众数)
,统计学,第四章 统计特征值
60
50
40
30
20
10
0
413名学生的身高分布直方图
(双众数)
当数据分布呈现出双众数或多众数时,
可以断定这些数据来源于不同的总体。
出现了两个明显的分布中心
,统计学,第四章 统计特征值
0
2
4
6
8
1 0
1 2
1 4
1 6
1 8
2 0
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175
0
2 0
4 0
6 0
8 0
1 0 0
1 2 0
1 4 0
152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175
集中趋势弱、
离散趋势强集中趋势强、
离散趋势弱
cmx 164?
cmx 164?
,统计学,第四章 统计特征值第二节 离散趋势的测度标志变异指标 统计上用来反映总体各单位标志值之间差异程度大小的综合指标,
也称做 标志变动度 。
平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。
但总体各单位之间的差异是客观存在的,这种差异也是统计总体的重要特征之一。因此,要全面反映一个总体的特征,还必须测定总体各单位之间 差异程度 。
作用 1、衡量平均指标 代表性 的大小
2、反映社会经济活动过程的 均衡性 和 稳定性测定标志变异度的绝对量指标
( 与原变量值名数相同 )
测定标志变异度的相对量指标
( 表现为无名数 )
全距 平均差 标准差全距系数平均差系数标准差系数标志变异指标的种类
,统计学,第四章 统计特征值
m i nm a x XXR
指所研究的数据中,最大值与最小值之差,又称 极差 。全距最大变量值或最高组上限或开口组假定上限最小变量值或最低组下限或开口组假定下限
【 例 A】 某售货小组 5人某天的销售额分别为
440元,480元,520元,600元,750元,则
元310440750m i nm a x XXR
,统计学,第四章 统计特征值标志变异指标的种类
【 例 B】 某季度某工业公司 18个工业企业产值计划完成情况如下:
计划完成程度
( ﹪ )
组中值
( ﹪ )
企业数
(个)
计划产值
(万元)
90以下
90~ 100
100~ 110
110以上
85
95
105
115
2
3
10
3
800
2500
17200
4400
合计 — 18 24900
计算该公司该季度计划完成程度的全距。
X f


解:
4080120
109010110m i nm a x

XXR
,统计学,第四章 统计特征值标志变异指标的种类
优点,计算 方法简单、易懂;
缺点,易受极端数值的影响,不能全面反映所有标志值差异大小及分布状况,准确程度差往往应用于生产过程的质量控制中全距的特点
,统计学,第四章 统计特征值标志变异指标的种类
N
XX
N
XXXX
DA
N
i
i
N

1
1?
⑴ 简单平均差 —— 适用于未分组资料是各个数据与其算术平均数的离差绝对值的算术平均数,用 A.D表示平均差计算公式:
总体算术平均数总体单位总数第 个单位的变量值
i
,统计学,第四章 统计特征值标志变异指标的种类
【 例 A】 某售货小组 5个人,某天的销售额分别为 440元,480元,520元,600元,750
元,求该售货小组销售额的平均差。
解:
元6.93
5
468
5
558750558440
1

N
XX
DA
N
i
i
元55852 7 9 05 750600520480440X
即该售货小组 5个人销售额的平均差为 93.6元
,统计学,第四章 统计特征值标志变异指标的种类

m
i
i
m
i
ii
m
mm
f
fXX
ff
fXXfXX
DA
1
1
1
11
⑵ 加权平均差 —— 适用于分组资料平均差的计算公式总体算术平均数第 组变量值出现的次数
i第 组的变量值或组中值
i
,统计学,第四章 统计特征值
【 例 B】 计算下表中某公司职工月工资的平均差月工资(元) 组中值(元) 职工人数(人)
300以下
300~ 400
400~ 500
500~ 600
600~ 700
700~ 800
800~ 900
900以上
250
350
450
550
650
750
850
950
208
314
382
456
305
237
78
20
合计 — 2000
X f
,统计学,第四章 统计特征值
元95.5 2 22 0 0 01 0 4 5 9 0 02 0 0 0 209 5 02 0 82 5 0X
元95.138
2 0 0 0
6.2 7 7 8 9 3
2 0 0 0
2095.52295020895.522250
1

f
fXX
DA
m
i
i
解:
即该公司职工月工资的平均差为 138.95元
,统计学,第四章 统计特征值
优点,不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;
缺点,用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。
平均差的特点一般情况下都是通过计算另一种标志变异指标 —— 标准差,来反映总体内部各单位标志值的差异状况
,统计学,第四章 统计特征值

N
XX
N
i
i
2
1

⑴ 简单标准差 —— 适用于未分组资料是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫作方差,用 来表示。
2?
标准差计算公式:
总体单位总数第 个单位的变量值
i 总体算术平均数
,统计学,第四章 统计特征值
【 例 A】 某售货小组 5个人,某天的销售额分别为 440元,480元,520元,600元,750元,
求该售货小组销售额的标准差。
解:
元55852 7 9 05 750600520480440X
(比较:其销售额的平均差为 93.6元)

元62.1 0 9
5
6 0 0 8 0
5
5 5 87 5 05 5 84 4 0
22
2
1

N
XX
N
i
i
即该售货小组销售额的标准差为 109.62元。
,统计学,第四章 统计特征值
⑵ 加权标准差 —— 适用于分组资料

m
i
i
i
m
i
i
f
fXX
1
2
1?
标准差的计算公式总体算术平均数第 组变量值出现的次数
i第 组的变量值或组中值
i
,统计学,第四章 统计特征值
【 例 B】 计算下表中某公司职工月工资的标准差。
月工资(元) 组中值(元) 职工人数(人)
300以下
300~ 400
400~ 500
500~ 600
600~ 700
700~ 800
800~ 900
900以上
250
350
450
550
650
750
850
950
208
314
382
456
305
237
78
20
合计 — 2000
X f
,统计学,第四章 统计特征值
元95.5 222 00 01 04 5 90 02 00 0 209 502 082 50X
解:

元9.167
2 0 0 0
01.5 6 3 8 6 5 9 5
2 0 0 0
2095.52295020895.522250
22

(比较:其工资的平均差为 138.95元)
即该公司职工月工资的标准差为 167.9元。
,统计学,第四章 统计特征值由同一资料计算的标准差的结果一般要略大于平均差。
证明:当 a,b,c≥0时,有
33
222 cbacba

标准差的特点
不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;
用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算,
,统计学,第四章 统计特征值
22 XX
22

N
X
N
X
22

f
Xf
f
fX
简单标准差加权标准差标准差的简捷计算避免离差平方和计算过程的出现目的,
变量值平方的平均数变量值平均数的平方
,统计学,第四章 统计特征值测定标志变异度的绝对量指标
( 与原变量值名数相同 )
测定标志变异度的相对量指标
( 表现为无名数 )
全距 平均差 标准差全距系数平均差系数标准差系数标志变异指标的种类
,统计学,第四章 统计特征值
kg500?大象? kg5.0?
免子?
kgx 3500?大象 kgx 5.2?
免子可比变异系数指标
,统计学,第四章 统计特征值身高的差异水平,cm
体重的差异水平,kg
用 变异系数 可以相互比较身高身高
x
体重体重
x
可比
,统计学,第四章 统计特征值平均差系数标准差系数
﹪100
X
DAV
DA
﹪1 0 0
X
V
变异系数用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小,
—— 标准差系数小的总体,其平均数的代表性大;反之,亦然。
应用,
,统计学,第四章 统计特征值各种变指标与其算术平均数之比。一般用 V表示。
【 例 】 某年级一、二两班某门课的平均成绩分别为 82分和 76分,其成绩的标准差分别为 15.6
分和 14.8分,比较两班平均成绩代表性的大小。
解:
﹪﹪﹪ 02.1910082 6.15100
1
1
1 XV
一班成绩的标准差系数为:
二班成绩的标准差系数为:
﹪﹪﹪ 47.191 0 076 8.141 0 0
2
2
2 XV
因为,所以一班平均成绩的代表性比二班大。
21 VV?
,统计学,第四章 统计特征值是非标志总体分组 单位数 变量值具有某一属性不具有某一属性
1
0
合计 —
为研究是非标志总体的数量特征,令
0N
1N
N
指总体中全部单位只具有,是”
或,否”,,有” 或,无” 两种表现形式的标志,又叫 交替标志是非标志
,统计学,第四章 统计特征值性别,男、女(非男) 产品质量,合格、不合格
1 0 1 0
是非标志总体的指标具有某种标志表现的单位数所占的成数 NNP 1?
不具有某种标志表现的单位数所占的成数 NNQ 0?
10101 NNN NNNNNNQP且有指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重成数
,统计学,第四章 统计特征值是非标志总体的指标
P
N
N
N
NN
f
Xf
X P

101 01
平均数

PQPQPQQPPQ
NN
NPNP
f
fXX
p

22
01
0
2
1
22
01)(
标准差
,统计学,第四章 统计特征值
25.05.0 2m a x时,有当 QP
是非标志总体的指标
PPPQ 12?方差

P
Q
P
P
P
PP
X
V
P
P 11?
标准差系数
,统计学,第四章 统计特征值
【 例 】 某厂某月份生产了 400件产品,其中合格品 380件,不合格品 20件。求产品质量分布的集中趋势与离中趋势。
2 1 8.0)95.01(95.0
95.0
5
4 0 0
20
95
4 0 0
3 8 0
203 8 04 0 0
01
01

PQ
PX
N
N
Q
N
N
P
NNN
p
P
所以有:
﹪,﹪,则件,件,件,己知是非标志总体的指标解:
,统计学,第四章 统计特征值非对称的,
偏斜的分布对称的、
高度适中的分布 既偏斜又低平的分布
,统计学,第四章 统计特征值
,统计学,第四章 统计特征值第三节 偏态与峰度偏态 指分布数列的不对称性。
非对称的,
偏斜的分布对称的、高度适中的分布既偏斜又低平的分布偏度( skewness):度量数据分布非对称方向及程度的指标。
SK
eM xoM
eMx oM
oMxSK
偏态右正 )(0?SK
偏态左负 )(0?SK
,统计学,第四章 统计特征值
,统计学,第二章 统计数据动差法偏度的计算:
3
3
3
3
)(

f
fxx
SK
一阶中心矩衡为零,偶数阶中心矩为正数,
奇数阶中心矩可以反映分布偏度。
三阶中心矩有计量单位,不便于比较,
故用具有相同单位的?3相除,去掉单位
,统计学,第四章 统计特征值
,统计学,第二章 统计数据峰度( qurtosis):描述数据分布峰态的指标,也是度量数据分布集中程度的指标。

4
4
4
4
)(

f
fxx
K
344?
在正态分布情况下,
因此有:
344?
344?
高峰态低峰态
,统计学,第四章 统计特征值
-4 -3 -2 -1 0 1 2 3 4
4kg2kg 作用力力臂统计动差(矩):利用力的动差来反映数据分布特征的指标。
它以次数 f 为作用力,以变量 x 为力臂,并以总次数为单位计算平均动差。
kaxE )(?
称为随机变量 x 对 a
的 k 阶矩(动差)。

f
fax
k
)(
f
fx
k

f
fxx
k
)(
令 a=0,
则称为 k 阶原点矩?k
令 a=,
则称为 k 阶中心矩?k
x
常用的矩:
x
f
xf

1?
2
2
2
)(

f
fxx
,统计学,第四章 统计特征值