统计学原理
第一章绪论
第二章统计调查
第三章统计资料的整理
第四章总量指标与相对指标
第五章平均指标和变异指标
第六章时间数列
统计学原理
第七章统计指数
第八章抽样调查
第九章回归与相关分析
第十章统计预测
第十一章统计分析综述
第十二章我国国民经济核算体系
第五章 平均指标和变易指标
一、平均指标概述
二、数值平均数
三、位置平均数
四、标志变异指标
五、平均指标的运用原则
主
要
内
容
学习目标
1.了解平均指标的概念 。
2.掌握数值平均数的计算和运用 。
3.掌握位置平均数的特点和运用。
4.掌握标志变异指标的特点和计算。
5.理解平均指标的运用原则。
第一节 平均指标概述
一, 平均指标及其特点
二, 平均指标的作用
平均指标及其特点
一、平均指标
平均指标反映同类现象的一般水平, 是总体内各
单位参差不齐的标志值的代表值, 也是对变量分
布集中趋势的测定 。
数据集中区
变量 xx
平均指标的作用和种类
? 作用,
对现象进行对比分析
用来综合测定工作质量和工作效率
分析现象之间的依存关系
可以进行数量上的估算和推算
? 常用的平均指标,
? 数值平均数, 算术平均数,几何平均数,调和平均 数,
? 位置平均数, 中位数,众数。
第二节 数值 平均数
一, 算术平均数
二, 调和平均数
三,几何平均数
算术平均数
算术平均数的计算
算术平均数 =
总体标志总量
总体单位总数
数据集 ),,,(
121 NNi xxxxx ??
数据个数 Nx
N
x
x
?
?
简单算术平均数
身高 组中值 人数 比重
( cm) ( cm ) (人) ( %)
150-155 152.5 3 3.61
155-160 157.5 11 13.25
160-165 162.5 34 40.96
165-170 167.5 24 28.92
170以上 172.5 11 13.25
总计 83 100
某年级 83名女生身高资料
组距数列
次数
f
频率
f/Σf
变量值
x
f
xf
x
?
?
?
f
f
xx
?
???
加权算
术平均
数
权数与加权
2 3 4 5 6 7 81 9
24.4
21
191817263554432221 ???????????????????x
算术平均数的计算取决于
变量值和权数的共同作用:
变量值决定平均数的范围;
权数则决定平均数的位置
关于权数的选择
必须是标志值的直接承担者 ;
与标志值相乘具有标志总量的意义 ;
组的权数必须不尽相同。
算术平均数的性质
? 各标志值与算术平均数离差之和等于零 ;
? 各标志值与算术平均数离差平方之和最小 ;
? 各标志值同时减去一个常数一 (不等于零 ),计算的平
均数再加上一与原平均数相等 ;
? 将每个标志值同时除以常数 D(D 不等于零 ) 之后,计
算的平均数乘以 D,等于原来的平均数 ;
? 将每个标志值同时减去常数一再除以常数 D(A,D 不等
于零 ) 得新变量值,新变量值的平均数乘以 D 再加上
一之后与原变量平均值相等。
? 注意 A,D 的选择,
? A:最接近变量平均数的值,
? D:最大公约数。
调和平均数
f
xf
x
?
?
?
x,f 为已知
若只知 x 和 xf,而 f 未 知,则不能使用
加权算术平均方式,只能使用其变形即
加权调和平均方式 。
xf
x
xf
x
1
?
?
?
苹果 单价 购买量 总金额
品种 (元)(公斤) (元)
红富士 2 3 6
青香蕉 1.8 5 9
x f xf
875.1
53
58.132
?
?
???
?x
875.1
8.1
9
2
6
96
?
?
?
?x
概念 计算公式 特点
优点:①灵敏度高
②在某种不能计算
的条件下,可以代
替
缺点:①不易理解
②易受极值影响
③有,0,值时不能
计算
调和平均数
()
标志值倒
数平均数
的倒数
简单:
加权:
Hx
i
H x
nx
/1??
iXi
i
H m
mx
/?
??
调和平均数
例, (前例 )当已知各企业组计划完成程
度及相应的实际完成数时,
全局平均计划完成程度为,1050/1000=105%
计划完成
程度 (%)
组中值
(%) X
企业数 实际完
成数 (万
元 ) M
计划任
务数
( 万元 )
M/X
90-100
100-110
110-120
95
105
115
5
8
2
95
840
115
100
800
100
合计 ___ 15 1050 1000
几何平均数
几何平均数
概念 计算公式 特点
优点:灵敏度高
②受极值影响小
于和
③适宜于各比率
之积为总比率的变
量求平均
缺点,① 有,0,或负
值时不能计算
②偶数项数列只
能用正根
几何平均数
()
几个变量
值连乘积
的几次根
。
简单:
加权:
Gx
n iG xx ??
if ifiG xx ?? ?
就用途而言,几何平均方法直
接用于个体数量相乘等于总数量的
现象的平均。
某产品的总合格率
=各连续作业工序合格率之积
若干年间总的 1+利率(复利)
=各年度 1+利率之积
第一道工序 第二道工序 全工序
投入制品 1000个 900个 1000个
合格产品 900个 810个 810个
合格率% 90 90 81
81%=90%?90%
向银行借款 1000元,年利率(复利)
为 10%,则:第一年利息额 100元,第二
年利息额 110元,两年合计 210元。两年后
还款本利和与借款额的比例为 1.21。
1.21=1.1?1.1
第三节 位置平均数
一, 中位数
二, 众数
三,各种平均数之间的关系
中位数
152 154 154 155 155 156
156 156 156 157 158 158
159 159 160 160 160 160
160 160 160 160 160 160
160 160 161 161 161 161
161 161 161 162 162 162
162 162 162 162 162 163
163 163 163 164 164 164
165 165 165 165 165 165
165 165 166 166 166 166
166 167 167 167 168 168
168 168 168 168 168 169
170 170 170 170 170 171
171 172 172 172 174
中位数( median):位于变
量值序列中点的数值
中位数
中位数的确定方法
对于未分组数据:
中位数位置为
2
1?N
某年级 83名女生身高资料
身高 人数 累计
( CM) (人) 人数
152 1 1
154 2 3
155 2 5
156 4 9
157 1 10
158 2 12
159 2 14
160 12 26
161 7 33
162 8 41
163 4 45
身高 人数 累计
( CM) (人) 人数
164 3 48
165 8 56
166 5 61
167 3 64
168 7 71
169 1 72
170 5 77
171 2 79
172 3 82
174 1 83
总计 83
42
2
183
?
?
中位数的确定方法
身高 人数 累计
( CM) (人) 人数
150-155 3 3
155-160 11 14
160-165 34 48
165-170 24 72
170以上 11 83
总计 83
某年级 83名女生身高资料
d
f
S
f
LM
m
m
e ?
?
??
?
?
1
2
04.1 6 45
34
14
2
83
1 6 0 ??
?
??eM
中位数一定存在;
中位数与算术平均数相近;
中位数不受极端值影响;
变量值与中位数离差绝对值之和最小 。
中位数的作用及用法
众数
众数( mode):出现次数最多
即出现频率最高的变量值。
身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
152 154 154 155 155 156
156 156 156 157 158 158
159 159 160 160 160 160
160 160 160 160 160 160
160 160 161 161 161 161
161 161 161 162 162 162
162 162 162 162 162 163
163 163 163 164 164 164
165 165 165 165 165 165
165 165 166 166 166 166
166 167 167 167 168 168
168 168 168 168 168 169
170 170 170 170 170 171
171 172 172 172 174
众数的确定方法
某年级 83名女生身高资料
身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
身高 人数 比重
( CM) (人) ( %)
150-155 3 3.61
155-160 11 13.25
160-165 34 40.96
165-170 24 28.92
170以上 11 13.25
总计 83 100
某年级 83名女生身高资料
众数的确定方法
2
UL
M o
?
?
概约众数:众数所
在组的组中值,在
本例为 162.5cm
dLM o ?
???
?
??
21
1
48.1635
1023
23160 ??
?
??oM
要点解释
权数 ( 重量了 ), 是分布数列中的频数或频率对求
平均数具有权衡轻重的作用, 是影响平均数变动的
两个因素之一 ( 另一因素是变量值 ) 。
权数
例
(1) (2) (3)
X
4
5
6
合计
频数 频率 (%)
10
20
10
25.0
50.0
25.0
40 100.0
X
4
5
6
合计
频数 频率 (%)
20
40
20
25.0
50.0
25.0
80 100.0
X
4
5
6
合计
频数 频率 (%)
20
10
10
50.0
25.0
25.0
80 100.0
x
=5
x
=5
x
=4.75
调和平均数与算术平均数的区别
频率分布变了,均值也变因此,严格地说,
权数应指频率。
凡是掌握被平均指标的分母资料时,用算术平均法。
凡是掌握被平均指标的分子资料时,用调和平均法。
平均指标
分子:标志总量
分母:总体单位总数
=
几何平均等于对数的算术平均
组矩数列求中位数
是用插值法对中位数组分割的结果。
组距数列求众数
是以频数之差计算的比例分割众数组组距的结果。
价格(元)
3.3
2.5
2.0
合计
销售量(斤)
3
4
5
12
543
50.245.233.3
??
??????
?
??
i
ii
f
fxx
? ?元4 9 2.212 9.29 ??
算术平均
求某种商品三种零售价格的平均价格
调和平均
10
0.2
110
5.2
110
3.3
1
101010
1 ?????
???
?
??
i
i
i
H
m
x
mx
4 9 4.203.12 30 ??
价格(元)
3.3
2.5
2.0
合计
销售额(元)
10
10
10
30
各种平均数之间的关系
位置平均数与算术平均数的关系
X
f
X
f
X
f
MoMex ??
(对称分布 )
MoMex ??
正偏态分布(右)
MoMex ??
负偏态分布 (左)
在偏斜不大时 )(2 MexMoMe ???
xMeMo 23 ??
3
2 xMoMe ??
2
3 MoMex ??
12 1 2
x xMe MeMo MoxMeMo
第四节 标志变异指标
一, 标志变异指标的意义和作用
二, 变异指标的种类和计算方法
标志变异指标( Dispession )
概念
标志变异指标是反映变量分布离散趋势, 与平均
指标相匹配的指标 。
( 1 )
( 3 )在抽样调查中有重要作用。
( 2 )反映经济活动过程的均衡性、节奏性和稳
定性;
作用
是评价平均数代表性的依据;
0
5
10
15
20
152 154 156 158 160 162 164 166 168 170 172 174
0
50
100
150
152 154 156 158 160 162 164 166 168 170 172 174
集中趋势弱、
离散趋势强
集中趋势强、
离散趋势弱
cmx 164?
cmx 164?
概念 计算 特点
数列中最大值
与最小值之差1,极差( R )
R=最大值 -最小值 优点:容易理解,计算方便
缺点:不能反映全
部数据分布状况
2,平均差
( A,D )
各标志值与
均值离差绝
对值的算术
平均
i
i
f
fiXXDA
?
????
n
XXDA i ????简单:
加权:
优点:反映全部
数据分布状况
缺点:取绝对值
,数字上不尽合
理
152 154 154 155 155 156 156 156 156
157 158 158 159 159 160 160 160 160
160 160 160 160 160 160 160 160 161
161 161 161 161 161 161 162 162 162
162 162 162 162 162 163 163 163 163
164 164 164 165 165 165 165 165 165
165 165 166 166 166 166 166 167 167
167 168 168 168 168 168 168 168 169
170 170 170 170 170 171 171 172 172
172 174
全距= 174-152=22( cm)
四分位差= 167-160= 7( cm)
160 160
163 163
167
168
174 185 190 190 200
全距= 200 48( )
四分位差= 168 = 8( )
0
5
10
15
20
152 154 156 158 160 162 164 166 168 170 172 174Q
1 Q2 Q3
极
小
值
极
大
值
x1 x2 x3 x4 x5 x6 x7
3 4 4 4 5 5 10
x1 x2 x3 x4 x5 x6 x7
3 3 4 5 6 7 7
R=7
A ·D= 1.43 R= 4
A ·D= 1.43
概念 计算 特点
各标志值与均
值离差平方的
平均 。
方差的平方根
( 取正根 )
3, 方差
( σ 2 )
和
标 准 差
(σ)
优点:反映全部
数据分布状况,
数字上合理 。
缺点:受计量单
位和平均水平影
响, 不便于比较
4,标准
差系数
( V σ
)
标准差与均值
之商,是无量
纲的系数
简单:
加权:
优点:适宜不同
数据集的比较
缺点:对数据结
构变化反应不灵
敏
? ?
?
???
f
fXX
?
??? 22
? ?
n
XX i 22 ????
XV
?
? ?
2?? ?
方差( σ 2 )和标准差( σ)是应用最广的标志变异指标
方差及标准差的计算
N
xx? ?
?
2
2 )(?
N
xx? ?
?
2)(
?
简单式
?
? ??
f
fxx 22 )(
?
?
? ??
f
fxx 2)(
?
加权式
总体方差
及标准差
1
)( 22
?
?
? ?
N
xx
S
1
)( 2
?
?
? ?
N
xx
S
简单式
样本方差
及标准差
是非标志的均值及标准差
其值仅表现为具有某种特征
或不具有某种特征两种情况的标
志称为是非标志,也称交替标志 。
性别:男、女(非男)
产品质量:合格、不合格
1 0
1 0
是非标志的均值及标准差
1N 0N
?N ?
具有某种标志
的总体单位 数
不具有某种标志
的总体单位数总体单
位总数
P
f
f
N
N
??
?
11
Q
f
f
N
N
??
?
00
1?? QP
是非标志的均值及标准差
是非标志的均值,
PQP
f
f
xx ??????? ?
?
01
是非标志的标准差,
PQ
QP
QPPQ
f
fxx
?
?
?
?
?
?
?
? 222)(
?
某厂某月份生产了 1000件产品,
其中合格品 900件,不合格品 100件。
求产品质量分布的集中趋势与离散
趋势。
集中趋势
9.0
1 0 0 0
9 0 0
??P
离散趋势
3.009.0)9.01(9.0 ?????? PQp?
变异系数(离散系数):
数列的离散水平指标与数列均
值的比值 。
V
x
R
V R ?
x
DA
V DA
?
??
x
V
?
? ?
第五节 平均指标的运用原则
三, 平均指标的运用原则
1,必须是同质的量方可平均;
2,用组平均数补充说明总平均数;
3,用次数分布资料补充说明总平均;
4,用变异指标补充说明平均指标
组平均补充说明总平均
按地
势分
组
甲村 乙村
播种
面积
总产量
(公斤 )
平均
亩产
播
种
面
积
总产量
(公斤 )
平均
亩产
旱地
水田
210
90
66150
58500
315
650
200
300
60000
187500
300
625
合计 300 124650 415.5 500 247500 495
用分配数列补充说明平均数
企业按经济类型分组 工业增加值比上一年增
长 %
国有企业
集体企业
其中,乡办工业
三资企业
6.4
28.6
41.3
46.2
合计 21.2
与变异指标结合运用
情况一 情况二 情况三
平均完成
计划 (%)
执行计划
的标准差
系数 (%)
108
17.5
108
2.8
91
2.8
本章小结
1.平均指标概述
2.数值平均数
3.位置平均数
4.标志变异指标
5.平均指标的运用原则
结 束