3-1
第三章 统 计 描 述
? 第一节 统计图与统计表
? 第二节 分布的集中趋势
? 第三节 分布的离中趋势
? 第四节 分布的偏度和峰度
3-2
第一节 统计表与统计图
? 一、统计表
? (一)统计表的定义和结构
? 1、统计表:把统计数据按一定的顺序排列在
表格上,就形成了统计表。它清楚地、有条
理地显示统计资料,直观地反映统计分布特
征,是统计分析的一种重要工具。
3-3
2、统计表的结构
? 1)从表式上看,表格包括总标题、横行标题、
纵栏标题和指标数值四个部分。
? 2)从内容上看,统计表由主词栏和宾词栏两
个部分组成。
? 主词栏是统计表所要说明的总体及其组成部
分;宾词栏是统计表用来说明总体数量特征
的各个统计指标。此外,统计表还有补充资
料、注解、资料来源、填表单位、填表人等。
3-4
(二)统计表的分类
? 1、按主词的结构分类
? 1)简单表:主词未经任何分组的统计表称为
简单表,也称一览表。主词罗列各单位的名
称。
? 2)分组表:主词只按一个标志进行分组形成
的统计表,也称简单分组表,。
? 3)复合表:主词按两个或两个以上标志进行
分组的统计表,也称复合分组表。
3-5
2、按宾词设计分类
? 1)宾词简单排列是指宾词不加任何分组、按
一定顺序排列在统计表上,就是宾词简单排
列表。
? 2)宾词分组平行排列是指宾词栏中各分组标
志彼此分开,平行排列,就是宾词分组平行
排列表。
3-6
(三)统计表的设计
? 统计表的设计应注意如下事项:
? 1.线条的绘制。表的上下端应以粗线绘制,表
内纵横线以细线绘制。表格的左右两端一般
不划线,采用“开口式”。
? 2.合计栏的设置。
? 3.标题设计。以简练而又准确的文字表述统计
资料的内容、资料所属的空间和时间范围。
3-7
? 4.指标数值的填写。当数字因小可略而不计时,
可写上,0”;当缺某项数字资料时,可用符
号,…” 表示;不应有数字时用符号,—,表
示。
? 5.计量单位。统计表必须注明数字资料的计量
单位。当全表只有一种计量单位时,可以把
它写在表头的右上方。如果表中各格的指标
数值计量单位不同,可在横行标题后添一列
计量单位。
? 6.注解或资料来源。在统计表下,应注明资料
来源。
3-8
二、统计图
? 1、直方图:用直方形的宽度和高度来表示次
数分布的图形。绘制直方图时,横轴表示各
组组限,纵轴表示次数(一般标在左方)和
比率(或频率,一般标在右方)。
? 2、折线图:折线图可以在直方图的基础上,
用折线将各组次数高度的坐标连接而成,也
可以用组中值与次数求坐标点连接而成
? 3、曲线图:用平滑曲线连接各组次数坐标点
即得分布曲线。
3-9
第二节 统计平均数 众数 中位数
? 一、主要的统计平均数
? (一 )统计平均数的含义
? (二 )统计平均数的作用
? (三 )统计平均数的分类
3-10
二、算术平均数
? 1.算术平均数的基本公式
? 计算平均数的要求:总体标志总量必须是总
体各单位标志值的总和,标志值和单位之间
一一对应。
总体单位数
总体标志总量算术平均数 ?
3-11
2.计算方法
? ( 1)简单算术平均数。简单算术平均数主要
用于未分组资料,用总体各单位标志值简单
加总得到的标志总量除以单位总量而得。计
算公式:
n
x
n
xxx
x
n
i
i
n
?
?????? 121 ?
3-12
( 2)加权算术平均数。
? A,加权算术平均数主要用于原始资料已经分
组,并得出次数分布的条件。计算公式:
fi 为各组标志值出现的次数。
?
?
?
?
?
?
?
??
???
?
n
i
i
n
i
ii
n
nn
f
fx
fff
fxfxfx
x
1
1
21
2211
?
?
3-13
B.权数的意义和作用
? 权数:各组次数(频数)的大小所对应的标
志值对平均数的影响具有权衡轻重的作用。
? 当各组的次数都相同时,即当 f1=f2=f3=…= fn
时:
? 加权算术平均数就等于简单算术平均数。
n
x
nf
xf
f
fx
x
n
i
n
i
n
i
i
n
i
ii ??
?
?
??
?
?
??
?
?
11
1
1
3-14
3.是非标志的平均数
? 在总体中,具有某种性质的单位占总体的比
率为 p,不具有该种性质的单位占总体的比率
为 q,以 1作为具有某种性质的单位的标志值,
以 0作为不具有该种性质的单位的标志值:
? p也称为总体中具有某种属性的单位成数,是
非标志的平均数。
p
qp
qp
f
fx
x
n
i
i
n
i
ii
?
?
???
??
?
?
?
? 01
1
1
3-15
4.算术平均数的数学性质
? ( 1)算术平均数与标志值个数的乘积等于各
标志值的总和。
? 简单算术平均数:
? 加权算术平均数:
?
?
?
n
i
ixxn
1
??
??
?
n
i
ii
n
i
i fxxf
11
3-16
? ( 2)各个标志值与其算术平均数的离差之和
等于零。
? 简单算术平均数:
? 加权算术平均数:
??
??
???
n
i
i
n
i
i xxnxx
11
0)( ?
? ??? ?
? ??? ?
??????
n
i
n
i
i
n
i
iii
n
i
n
i
iii xffxfxxfxxf
1 111 1
0)(?
3-17
? ( 3)各标志值与算术平均数离差的平方和为
最小值。
? ( 4)对被平均的变量实施某种线性变换后,
新变量的算术平均数等于对原变量的算术平
均数实施同样的线性变换的结果。
? ( 5)对于任意两个变量 x和 y,它们的代数和
的算术平均数等于两个变量的算术平均数的
代数和。
?
?
???
n
i
i xx
1
2 m i n)(
3-18
三 调和平均数
? 1.简单调和平均数:标志值的倒数的算术平均
数的倒数。
n
xxx
H
n
111
1
21
???
?
? ?
?
?
???
?
n
i in x
n
xxx
n
121
1111
?
3-19
2.加权调和平均数
? 计算公式:
? 在权数选择合适时,加权调和平均数实际上
是加权算术平均数的变形:
?
?
?
??
???
???
?
n
i i
i
n
i
i
n
n
n
x
m
m
x
m
x
m
x
m
mmm
H
1
1
2
2
1
1
21
?
?
?
?
?
?
?
?
?
?
?
?
?
? ??
n
i
i
n
i
ii
n
i i
ii
n
i
ii
n
i i
i
n
i
i
f
fx
x
fx
fx
x
m
m
1
1
1
1
1
1
3-20
? 当各组标志总量相等,m1=m2=…=m n时,
加权调和平均数可化简成为简单调和平均数
形式。
???
?
???
?
??
n
i
n
i i
n
i i
i
n
i
i
x
n
x
m
nm
x
m
m
111
1
11
3-21
四、几何平均数
? 1.几何平均数:是 n项标志值连乘积的 n次方根。
? 2.分类:
? ( 1)简单几何平均数:是 n个标志值 xi连乘积
的 n次方根。计算公式为:
G=
式中 G表示几何平均数,xi表示各项标志值。
? ? nn n xxxx 1121 ??? ?
3-22
( 2)加权几何平均数
? 加权几何平均数是各标志值 fi次方的连乘积的
次方根,计算公式为:
G= ?
?
?
? ?? ?
n
i
i
i
n
i
i
n
f
f
i
f
f
n
ff xxxx 11 21
21 ?
3-23
四、幂平均数
? 设有一组变量求各变量 k次方的和:
? 根据算术平均数的数学性质 1,以幂平均代替
各具体变量 xi,其数值总和不变,则
? 称为 k阶幂平均数,当 k 取不同的整数值时,
幂平均数就给出不同的数值平均数计算公式。
?
?
?????
n
i
k
i
k
n
kkk xxxxx
1
321 ?
? ?
? ?
??
n
i
k
k
n
i
k
k
k
i xnxx
1 1
)()(
kn
i
k
ik nxx
/1
1
/ ?
?
??
?
?? ?
?
3-24
? 当 k=1时,幂平均数,为算
术平均数计算公式。
? 当 k=-1时,幂平均数
,为调和平均数计算公式。
? 当 时,
为几何平均数计算公式。
n
x
n
x
xx k ?? ???
?
?
?
?
?
?
??
1
1
1
1
1
1
1
1
1
1
?
??
?
??
?
?
?
?
??
?
?
?
?
???
?
?
?
?
?
?
??
??
n
x
n
x
xx k
?
??
?????
?
?
?
?
?
?
? ? n n
kk
k
k
k
xxxx
n
x
x ?? 321
1
00
limlim0?k
3-25
? 幂平均数的是关于 k阶的递增函数,即幂平均数是
随着 k的增大而增大,随着 k的减少而减少,当
k1<k2时,就有:
? 因为算术平均数、几何平均数、调和平均数都是幂
平均数的 k阶数由 1递减为 0又减为 -1的特例,三者之
间的一般数量关系为:调和平均数小于几何平均数
小于算术平均数;当各变量相等时,调和平均数等
于几何平均数等于算术平均数。
221
11
kkkk
n
x
n
x
?
?
?
?
?
?
?
?
???
?
?
?
?
?
? ??
3-26
五,众数 Mo
? 1.定义:众数是指社会现象总体中最普遍出现
的标志值。
? 2.众数的确定
? 1)单项式分配数列确定众数:出现次数最多的
标志值就是众数。
? 2)组距式分配数列确定众数:由组距数列确定
众数,先确定众数组,再通过一定的公式计
算众数的近似值。
3-27
3,众数的几何意义
1?? oo MM ff
1?? oo MM ff
oM
f
oMoML oMU
3-28
4,组距式数列确定众数的公式
? 下限公式:
? 上限公式:
o
oooo
oo
o M
MMMM
MM
Mo dffff
ff
LM ?
???
?
??
??
?
)()( 11
1
o
oooo
oo
o M
MMMM
MM
Mo dffff
ff
UM ?
???
?
??
??
?
)()( 11
1
3-29
六、中位数
? 1.定义:
? 中位数是将总体各个单位按其标志值的大小
顺序排列,处于数列中点的那个单位的标志
值,在总体中,标志值小于中位数的单位占
一半;标志值大于中位数的单位也占一半。
3-30
2.中位数的确定
? 1)未分组资料确定中位数。
? 将总体各单位的标志值按照大小顺序排列,
? 当总体单位数 n为奇数时:
? 当总体单位数 n为偶数时,:
2
1?? ne xm
2
1
22
?
?
?
nn
e
xx
m
3-31
2)单项式分组资料确定中位数
? 当 为奇数时:,
? 当 为偶数时,
?f
2
1??? fe xm
? f
2
1
22
??
??
?
ff
e
xx
m
3-32
3) 组距式分组资料确定中位数
? 下限公式:
? 上限公式:
e
e
e
e M
M
M
Me d
f
S
f
LM ?
?
??
?
?
12
e
e
e
e M
M
M
Me d
f
S
f
UM ?
?
??
?
?
12
3-33
3,众数、中位数和算术平均数的 关系
? 区别:
? 1) 三者的含义不相同;
? 2) 三者的计算(确定)方法不同;
? 3) 对资料的要求不同,
? 4) 对数据的“灵敏度”、“抗耐性”和“概
括能力”不同。
3-34
? 联系:
? ( 1) 三者都是作为反映总体一般水平(或
集中趋势)的平均指标:
? ( 2) 三者之间存在着一定的数量关系,
? A.在对称的正态分布条件下:算术平均数等于众
数等于中位数:
? B.在非对称正态分布的情况下,众数、中位数和
平均数三者的差别取决于偏斜的程度,偏斜的程
度越大,它们之间的差别越大。
eo MMx ??
3-35
? 当次数分配呈右偏 (正偏 )时:算术平均数受极
大值的影响
? 当次数分配呈左偏 (负偏 )时,算术平均数受极
小值的影响
? 中位数则总是介于众数和平均数之间。
oe MMx ?? xMM eo ??
3-36
3、皮尔生经验法则
? 分布在轻微偏斜的情况下,众数、中位数和
算术平均数数量关系的经验公式为:
)(3 eo MxMx ???
3-37
第三节 分布的离中趋势
? 一、变异指标的含义与作用
? 1.定义:变异指标反映总体内部的离中趋势或
变异状况。变异指标值越大,表明总体各单
位标志的变异程度越大。
? 2.作用:
? ( 1)衡量平均指标的代表性。
? ( 2)反映现象变动的均衡性。
? ( 3)研究总体标志值分布偏离正态的情况。
? ( 4 )进行抽样推断等统计分析的一个基本指标。
3-38
二、极差与四分位差
? 1、极差:
? 1)极差也称全距,它是统计总体中两个极端
标志值之差,表明总体中标志值变动的范围。
? 2)计算公式:
(未分组)
(分 组)
式中,Umax代表最高组的上限;
Lmin代表最低组的下限。
? 3)特点:计算简便,直观易于理解。
m i nm a x xxR ??
m i nm a x LUR ??
3-39
? 2、四分位差
? 1)计算公式:数列的 3/4位次与 1/4位次的标
志值之差除以 2。
? 2)特点:四分位差避免了数列中极端值的影
响,但去头弃尾,丢失大量的原始数据。
3-40
三、平均差( A.D)
? 1、定义:平均绝对偏差,总体所有单位的标
志值与其平均数的离差绝对值的算术平均数。
? 2、计算公式:
? 3、特点:概括地反映了所有单位标志值的变
异程度,但因取绝对值,数学性质不理想,
实际中较少用。
?
??
?
??
?
?
?
?
n
i
i
n
i
ii
n
i
i
f
fxx
DA
n
xx
DA
1
11,,.
3-41
四、方差与标准差
? (一 )数量标志的方差与标准差
? 1、数量标志方差与标准差的计算。其计算公
式为:
? 未分组的资料:方差:
? 标准差,
n
xx
n
i
i?
?
?
? 1
2
2
)(
?
n
xx
n
i
i?
?
?
? 1
2)(
?
3-42
用分组资料计算
? 方差:
? 标准差
?
?
?
?
?
?
n
i
i
n
i
ii
f
fxx
1
1
2
2
)(
?
?
?
?
?
?
?
n
i
i
n
i
ii
f
fxx
1
1
2
)(
?
3-43
2、总方差、组间方差和组内方差。
? 在资料分组的条件下,总体各标志值对平均
数的方差可以分解为组内方差和组间方差。
其关系式:
式中,代表总体方差;
代表组内方差的平均数;
代表组间方差。
222
i??? ??
2?
2i?
2?
3-44
3、方差与标准差的数学性质:
? 1)变量的方差等于变量平方的平均数减去变量
平均数的平方。即:
222 )( xx ???
3-45
? 2)变量对其算术平均数的方差小于对任意常数
的方差。
因为,所以,当 (x0为
任意常数 )时,
? 3) n 个同性质独立变量和的方差等于各个变
量方差的和。
设:
则:
?
?
??n
i
i xx
1
2 m in)( 0xx ?
n
xx
n
xx
n
i
i
n
i
i ??
??
?
?
?
1
2
0
1
2 )()(
nxxxx ???? ?21
22222
321 nxxxxx ????? ????? ?
3-46
? 4)n个同性质独立变量平均数的方差等于各变
量方差平均数的 1/n。
设:
则:
? 5)变量线性变换的方差等于变量的方差乘以变
量系数的平方。
设:
则:
n
xxxxx n????? ?321
2
2
22
3
2
2
2
12 1
i
n
x nn ?
????? ?????? ?
bxay ??
222 xy b ?? ?
3-47
? (二 )是非标志的方差与标准差
qppq
N
NpNp
f
fxx
n
i
i
n
i
ii
22
0
2
1
2
1
12
)0()1(
)(
??
???
?
?
?
?
?
?
?
?
)1( pppq ??? )1( pp ???
3-48
四、变异系数
? 1、变异系数:变异系数也称离散系数,是各
变异指标与其算术平均数的比值。
? 极差系数:极差与其平均数的比值。
? 标准差系数:标准差与其平均数的比值。
? 2、作用:消除现象由于不同计量单位、不同
平均水平所产生的影响。
%1 0 0?? xV ?
3-49
第三节 分布的偏度和峰度
? 一、统计动差
? 1、统计动差:也称为距,反映分布偏斜或离散程度
的指标。
? 2、原点动差:变量 x关于原点的 k阶距,一般形式:
(未分组) ( 分组)
? k= 1时,即 1阶的原点动差就是算术平均数。
? k= 2时,即 2阶的原点动差就是平方平均数。
n
x
n
i
k
k
?
?? 1?
?
?
?
??
n
i
i
n
i
i
k
k
f
fx
1
1?
3-50
3、中心动差:
? 变量 x关于分布中心(平均数)的 k阶距。一
般形式:
(未分组) (分组)
? 当 k=0时,即零阶中心动差 =1;
? 当 k=1时,即一阶中心动差 =0;
? 当 k=2时,即二阶中心动差 = 。
n
xx
n
i
k
i
k
?
?
?
? 1
)(
?
?
?
?
?
?
?
n
i
i
n
i
i
k
i
k
f
fxx
1
1
)(
?
0?
1?
2?
2?
3-51
二、偏度
? 1、偏度:衡量频数分配不对称程度,或偏斜
程度的指标。
? 2、计算公式:(用距法测定)
? ? 232
3
3
3
?
?
?
?
? ??
3-52
? 当 =0时,左右完全对称,为正态分布;当
>0时为正偏斜;当 <0时为负偏斜。
?
? ?
Ⅰ( α =0)
II(α >0) Ⅲ (α < 0)
3-53
三、峰度
? 1、峰度:用以衡量频数分配的集中程度,即
分布曲线的尖峭程度的指标。
? 2、计算公式:(用距法测定)
? ? 33 22
4
4
4 ????
?
?
?
??
3-54
? 峰度指标 β=0,分布为正态峰度,当峰度指标
β>0时,表示频数分布比正态分布更集中,分
布呈尖峰状态,β<0时表示频数分布比正态分
布更分散,分布呈平坦峰。如图所示:
Ⅱ( β >0)
Ⅰ( β =0)
Ⅲ (β <0)