04:18:06 1
第三章 统计整理
? 第一节 统计整理的概念
? 第二节 统计分组
? 第三节 分配数列
? 第四节 统计表
04:18:06 2
第一节 统计整理的概念
? 一,统计整理的意义
? 二,统计整理的内容
04:18:06 3
一、统计整理的意义
? 1,统计整理的概念
? 2,统计整理的意义
04:18:06 4
统计整理的概念
? 统计整理是根据统计研究的任务,对统计
调查所搜集到的大量原始资料进行加工汇
总,使其系统化、条理化、科学化,以得
出反映事物总体综合特征的资料的工作过
程。
04:18:06 5
统计整理的意义
?意义:统计整理 是统计调查的继续,是统
计分析的前提和基础,在整个统计工作中
发挥着承上启下的作用。
统计工作
统计调查 统计整理 统计分析
04:18:06 6
二、统计整理的内容
? 1,对调查的资料进行审核
? 2,统计分组
? 3,编制统计表
04:18:06 7
对调查的资料进行审核
? 对收集的各类统计资料, 在整理时首要的
工作就是对资料的准确性和完整性进行审
查 。
? 准确性审查,主要审查统计调查过程中的误差 。
? 完整性审查,主要是检查应调查的单位有无遗
漏, 应调查的内容是否齐全, 是否有未按时报
送的资料等 。
04:18:06 8
统计分组
? 一般来说,录入的数据是无序的,不能反
映现象之本质与规律性。
? 为了使用的方便,要将其进行排序、分组,
以便数据按要求排列,同时使性质相同的
数据归为一组,从而让它们之间的差异性
显示出来。
04:18:06 9
编制统计表
? 统计表是把大量的统计数字资料,按一定
顺序和格式列在表上,该表就是统计表。
? 统计表能够描述总体的内部结构,揭示总
体中的关键因素与本质特征。
04:18:06 10
第二节 统计分组
? 一,统计分组的概念和意义
? 二,统计分组的作用
? 三,统计分组标志的选择
? 四,简单分组和复合分组
04:18:06 11
一、统计分组的概念和意义
? 统计分组 就是根据统计研究目的的需要,
将统计总体按照一定的标志区分成若干组
成部分的一种统计方法。
? 统计分组的意义在于,总体经过分组,能
够突出组与组之间的差异而抽象掉组内各
单位之间的差异,使数据变得条理化,便
于进一步分析研究。
04:18:06 12
二、统计分组的作用
? ⒈ 划分现象的类型
? ⒉ 揭示现象内部结构
? ⒊ 分析现象之间的依存关系
04:18:06 13
划分现象的类型
? 按所有制类型分组
代 码 分 类 及 构 成
1
11
12
2
21
22
23
公有经济
国有经济
集体经济
非公有经济
私有经济
港澳台经济
外商经济
04:18:06 14
揭示现象内部结构
? 统计分组法是研究总体内部结构的前提,
所谓总体内部结构是指总体内各部分占总
体的比重。
? 例如:人口统计中的各种年龄构成、国民
经济中三次产业的构成等,都是统计分组
的结果。
04:18:06 15
分析现象之间的依存关系
? 社会经济现象之间不同程度的存在着相互依存关
系,通过统计分组,可以从数量上研究现象之间
依存关系的规律性。
? 居民家庭随着月收入的增加而月支出也在增加的
相关关系。
家庭月收入(元) 家庭户数(户) 家庭月平均支出(元)
1600以下 4 1000
1600-1700 7 1090
1700-1800 2 1200
1800-1900 9 1570
1900-2000 7 1660
2000以上 11 1690
04:18:06 16
三、统计分组标志的选择
? 选择分组标志应考虑以下三个原则:
? 1、根据研究问题的目的和任务选择分组标志。
? 2、在若干个标志中,选择能反映问题本质的标志
进行分组。
? 3、结合所研究现象所处的历史条件具体问题具体
分析。
04:18:06 17
三、统计分组标志的选择
? 统计分组是通过选择分组标志进行的, 而
标志只有两种, 即品质标志和数量标志,
因此统计分组也有两种:
? 品质标志分组
? 数量标志分组
04:18:06 18
四、简单分组和复合分组
? 根据分组选择标志的多少不同,统计分组又可分
为:
? 简单分组
? 简单分组是指对统计总体仅按一个标志进行分组
? 复合分组
? 复合分组是指对同一总体采用两个或两个以上的标志
重叠起来进行分组
? 分组体系
? 对于复杂的研究对象,必须从各个方面进行观察和分
析研究,以获得对事物全貌的认识,因此要采用一系
列相互联系、相互补充的标志对现象进行多种分组,
这些分组结合起来构成一个体系,称为分组体系。
04:18:06 19
按性别分 人数
男 60
女 40
按考试成绩分组(分) 人数
60以下 5
60~ 70 30
70~ 80 35
80~ 90 20
90以上 10
简单分组
04:18:06 20
按性别、考分分组 人数

60以下
60~ 70
70~ 80
90分以上

60以下
60~ 70
70~ 80
90分以上
(略)
复合分组
04:18:06 21
第三节 分配数列
? 一,分配数列的概念和种类
? 二,组距数列的编制
? 三,次数分布
04:18:06 22
一、分配数列的概念和种类
? 在统计分组的基础上,将总体的所有单位按
组归类整理,并按一定顺序排列,形成总体
中各个单位在各组间的分布,表现为一定的
数列形式,称为分配数列。
? 分布在各组的个体单位数叫次数或频数,各
组次数占总次数的比重叫频率。
04:18:06 23
一、分配数列的概念和种类
? 分配数列的分类
变量数列
品质数列分

异距数列
等距数列
组距数列
单值数列
04:18:06 24
单值数列
居民家庭按子女数分组 户数(户)
0
1
2
3
4
2000
30000
8000
6000
4000
合 计 50000
04:18:06 25
组距数列(等距)
按零件数分组(个) 频数(人) 频率(%)
105~ 110
110~ 115
115~ 120
120~ 125
125~ 130
130~ 135
135~ 140
3
5
8
14
10
6
4
6
10
16
28
20
12
8
合计 50 100
04:18:06 26
组距数列(不等距)
年龄 人数 (人 )
15下
15~ 34
35~ 60
60以上
21
28
32
10
合计 91
某村人口按年龄的不等距分组
04:18:06 27
二、组距数列的编制
? 1,计算极差
? 2,确定组数和组距
? 3,写出各组的组限和组中值
? 4,把 资料中各数值归到应属的组内
? 举例
04:18:06 28
计算极差
? 将原始资料按数值大小的顺序排列,找出
最大值和最小值,计算 极差 (全距 )。
? 极差 =最大值 —最小值
04:18:06 29
确定组数和组距
? 组距是每组中最大变量值与最小变量值之间的距
离或差数 。 其中最大的变量值称为上组限, 简称
上限, 最小的变量值称为下组限, 简称下限 。 组
距的计算公式为:
? 组距=上限 —下限
? 在全距一定的情况下,组距与组数成反比关系,
? 组数=极差 (全距 )÷ 组距
? 一般而言,组数可在 5 ~7组,组数尽可能取奇数,
避免偶数。
04:18:06 30
写出各组的组限和组中值
? 从根本上说, 组限应是区分事物质的差别的数量
界限 。 组限确定的好, 就能充分体现分组的功能,
分清组与组之间的差别;否则, 就有可能混淆现
象之间的本质区别 。
? 对于离散变量, 由于其变量值可以一一列举, 且相邻
两个数值之间没有中间数值, 所以可用相邻两组组限
不重叠的方式设置组限 。
? 如按工人人数分组,1-10,11-20,21-30,31-40等 。
? 对于连续变量, 由于变量值可以无限分割, 数值之间
不能断开, 因此可用相邻两组组限重叠的方式设置组
限 。
? 如对企业按产值分组,50-100,100-150,150-200等 。
04:18:06 31
写出各组的组限和组中值
? 确定了一个组的上限和下限之后, 就界定了变
量在这一组的取值范围 。 但这样各单位的具体
标志值就看不见了, 为了反映分布在各组中个
体单位变量值的一般水平, 统计工作中往往用
组中值来代表 。 组中值是各组变量值范围的中
间数值, 通常可根据各组上限, 下限计算出来,
即:
? 组中值 =( 上限 +下限 ) /2
? 开口组组中值的确定
? 缺下限开中组组中值 =上限 -邻组组距 /2
? 缺上限开中组组中值 =下限 +邻组组距 /2
04:18:06 32
把资料中各数值归到应属的组内
? 按照各个总体单位的具体标志值, 将其划归某一
具体组之中, 在归类汇总时, 要遵循, 不重复不
遗漏, 的基本原则 。
? 对于单项数列和不重叠设置的离散型组距数列来
说, 上述原则容易做到 。
? 对于重叠设置的连续型组距数列来说, 应处理好
恰好是组限的标志值的总体单位之归类问题, 一
般应按, 上组限不在内, 原则, 即本组下限的次
数属于本组, 本组上限的次数归于邻近的较大组 。
04:18:06 33
举例
89 88 76 99 74 60 82 60 89 86
93 99 94 82 77 79 97 78 95 92
87 84 79 65 98 67 59 72 84 85
56 81 77 73 65 66 83 63 79 70
40名学生统计学考试成绩
04:18:06 34
计算极差
? 最小值 =56
? 最大值 =99
? 极差 R=99-56=43
04:18:06 35
确定组数和组距
? 根据考试成绩性质的不同,在 60分的基础上
分为不及格、及格、中等、良好、优秀五
个类型。
? 令组距 =10
? 则组数 =43/10=4.3,因此组数取 5。
04:18:06 36
写出各组的组限和组中值并把资
料中各数值归到应属的组内
成绩 组中值 人数 比重
50~60 55 2 5.0
60~70 65 7 17.5
70~80 75 11 27.5
80~90 85 12 30.0
90~100 95 8 20.0
合计 40 100.0
04:18:06 37
? 1,次数分布的概念
? 2,频数与频率
? 3,次数分布的主要类型
三,次数分布
04:18:06 38
? 总体中各单位在各组间的分布,称为次数
分布。
1、次数分布的概念
04:18:06 39
? 在次数分布中,各组单位数称为次数或频数。
? 各组次数占总次数的比重称为频率。
? 将次数分布中各组的次数和频率按组累加而形
成累计次数分布,可分为如下两种累计次数分
布:
? 向上累计
? 向下累计
2、频数与频率
04:18:06 40
向上累计
? 指各组频数或频
率由变量值低的
组向变量值高的
组累计。
? 累计数反映各组
上限以下的累计
频数或频率。
? 如右表:学生考
试成绩分布
考分 人数(人 ) 比重 (%)
向上累计
人数
(人 )
比重
(%)
50— 60
60— 70
70— 80
80— 90
90— 100
2
7
11
8
2
6.67
23.33
36.67
26.67
6.67
2
9
20
28
30
6.67
30.00
66.67
93.33
100.0
合计 30 100.0 — —
04:18:06 41
向下累计
? 指各组频数或频
率由变量值高的
组向变量值低的
组累计。
? 累计数反映各组
下限以上的累计
频数或频率。
? 如右表:学生考
试成绩分布
考分 人数 (人 ) 比重 (%)
向下累计
人数
(人 )
比重
(%)
50— 60
60— 70
70— 80
80— 90
90— 100
2
7
11
8
2
6.67
23.33
36.67
26.67
6.67
30
28
21
10
2
100.0
93.33
70.00
33.33
6.67
合计 30 100.0 — —
04:18:06 42
? (一) 钟型分布
? (二) U型分布
? (三) J型分布
? (四) 洛伦兹分布
3、次数分布的主要类型
04:18:06 43
? 特征:, 两头小,中间大,,即靠近
中间的变量值分布的次数多,靠近两
边的变量分布次数少,形若古钟。
? 根据其偏斜情况分为对称钟型分布、
左偏钟型分布和右偏钟型分布。
(一)钟型分布
04:18:06 44
对称钟型分布,也叫正态分布,以中
心变量值为对称轴呈对称分布。
年龄 人数
17
18
19
20
21
5
10
15
10
5
合计 45
人数
年龄
04:18:06 45
左偏钟型分布,也叫正偏钟型分布,变
量值小的次数较变量值大的次数多。
人数
年龄
年龄 人数
15
16
17
18
19
20
21
1
3
5
10
15
10
5
合计 49
04:18:06 46
右偏钟型分布,也叫负偏钟型分布,
变量值大的次数较变量值小的次数多。
年龄 人数
17
18
19
20
21
22
23
5
10
15
10
5
3
1
合计 49
人数
年龄
04:18:06 47
? 特征,靠近中间的变量值分布的次数少,靠
近两端的变量值分布次数多,形成, 两头大,
中间小, 的U字型分布。
? 如人口死亡率按年龄分组。
(二)U型分布
人数
年龄
04:18:06 48
? 正 J型分布:其特征是随
着变量值的增大,分布
次数也随之增多,若根
据变量数列绘成线图,
形若英文字母, J”。
? 如老年人口按年龄分组
的死亡人数分布曲线多
呈正 J型。
(三) J型分布


(人 )
年龄
04:18:06 49
? 反 J型分布:其特征是
随着变量值的增大,
分布次数也随之减少,
若根据变量数列绘成
线图,形若反写的英
文字母, J”,
? 如按年龄分组的人口
总体的次数分布曲线
多呈反 J型。
反 J型分布


(人 )
年龄
04:18:06 50
? 洛伦兹曲线又称集中曲线,用以检验
社会收入分配的平等程度。可拓展用
于研究总体各单位标志分布集中状况
或平均性的其他社会经济现象。
(四)洛伦兹分布
04:18:06 51
? 洛伦兹曲线以累计
频率为横轴,以标
志值累计比重为纵
轴。
(四)洛伦兹分布
标志
值累
计比
重 (%)
累计频
率 (%)
b
a
04:18:06 52
第四节 统计表
? 一,统计表的作用
? 二,统计表的结构
? 三,统计表的种类
? 四,宾词指标的设计
? 五,编制统计表应注意的问题
04:18:06 53
统计表的作用
? 把统计调查得到的数字资料,经过汇总整理后,
得出一些系统化的统计资料,将其按一定顺序
填在一定的表格内,这个表格就是 统计表 。
? 统计表的作用
? 能使大量的统计资料系统化、条理化,因而能够更
清晰地表述统计资料的内容;
? 利用统计表便于比较各项目之间的关系,而且也便
于计算;
? 采用统计表格表述统计资料比用叙述的方法更直观;
? 利用统计表易于检查数字的完整性。
04:18:06 54
统计表的结构
? 从形式上看,统计表是由 总标题, 横行标
题, 纵栏标题 和 数字资料 四部分组成
? 从内容上看,统计表是由 主词 和 宾词 两部
分构成。
? 主词 是统计表要说明的总体及其分组。
? 宾词 是说明主词的统计指标。
04:18:06 55
统计表的结构



1998年全国 工业增加值
纵栏标题
项目 产值 (亿元 ) 比重 (%)




轻工业
重工业
59009
60684
49.3
50.7 指标

值合计 119693 100
主词 宾词
04:18:06 56
统计表的种类
? 根据主词是否分组及分组情况分:
? 简单表
? 主词不经过任何分组的统计表
? 简单分组表
? 主词按某一标志进行分组的统计表
? 复合分组表
? 主词按两个或两个以上标志进行复合分组的统计

04:18:06 57
简单表
国 家 位次 旅游收入收入(亿美元) 占世界比重(%)
美国
西班牙
意大利
法国
英国
德国
中国
奥地利
加拿大
墨西哥
1
2
3
4
5
6
7
8
9
10
730.0
315.0
310.0
307.0
209.7
165.0
141.0
112.0
102.8
78.5
16.0
6.9
6.8
6.7
4.6
3.6
3.1
2.5
2.3
1.7
1999年国际旅游收入居世界前十名的国家
04:18:06 58
简单分组表
厂 别 合格品数量(辆)
甲 厂
乙 厂
5 000
7 000
合 计 12 000
1998年某公司所属两企业自行车合格品数量表
04:18:06 59
复合分组表
人口数 /万人 比例 /%
按性别分 男 64 189 50.98女 61 720 49.02
按城乡分 市镇 38 892 30.89乡村 87 017 69.11
1999年我国人口数及构成
04:18:06 60
宾词的指标设计
? 1,平行配置
? 平行配置是对宾词栏中的分组指标按分组标
志做平行排列。
? 2,层叠配置
? 层叠配置就是将宾词栏中的分组指标按分组
标志进行层叠排列。
04:18:06 61
1.平行配置
某专业课程期末考试成绩


班级 性别 合计
1班 2班 男 女
50~ 60
60~ 70
70~ 80
80~ 90
90以上
2
7
11
8
2
4
6
13
10
1
4
7
10
11
1
2
6
14
7
2
6
13
24
18
3
合计 30 34 33 31 64
04:18:06 62
2.层叠配置
某专业课程期末考试成绩
成绩
班级

计一班 二班
男 女 合计 男 女 合计
50~ 60
60~ 70
70~ 80
80~ 90
90以上
2
4
8
3
1
0
3
3
5
1
2
7
11
8
2
2
3
2
8
0
2
3
11
2
1
4
6
13
10
1
6
13
24
18
3
合计 18 12 30 15 19 34 64
04:18:06 63
编制统计表应该注意的问题
? 1、统计表的标题应十分简明地概括所要反
映的内容;
? 2、表中主词各行和宾词各栏,一般应按先
局部后整体的原则排列,即先列各个项目,
后列总体;
? 3、表中必须注明数字资料的计量单位;
? 4、表中数字上下位置要对齐;
? 5、统计表的表式,一般采用开口式;
? 6、必要时,统计表必须加以注解,边同数
字资料的来源等都写在表的下端。