商学系 Business Depart,
主讲,
第一章 统计学导论
第二章 统计调查
第三章 统计整理
第四章 综合指标
第五章 动态数列
第六章 统计指数
第七章 抽样推断
第八章 相关回归分析
内 容 目 录
第三章
统 计 整 理
内 容 提 要
?本章内容
第一节 统计整理概述
第二节 统计分组
第三节 次数分布
第四节 统计表
?本章重点
1、统计分组
2、次数分布
内 容 提 要
?本章难点
组距式数列的编制及其中的几个概念
?具体要求
1.了解-统计整理的概念、意义等
2.理解-统计分组的涵义
3.掌握-统计分组的方法
4.掌握-组距式数列的编制及相关的概念
5.会看统计表
第一节 统计整理概述
一、统计整理的 概念和 意义
1.概念
◆ 统计整理是 根据统计研究的目的和任务,对
统计 调查 阶段 所搜集到的大量 原始 资料 进行 加工 汇
总,使其系统化、条理化,科学化,以得出反映事
物 总体综合特征 的资料 的 工作 过程。
2.意义,
( 1) 统计整理是统计工作中一个十分重要的中间
环节,它既是统计调查阶段的继续,又是统计分析阶
段的前提和基础。
( 2) 统计整理实现了从个别单位的标志值向说明
总体数量特征的指标值的过渡,是 对社会经济现象从
感性认识上升到理性认识的过渡阶段 。
二、统计整理的 原则和步骤( 内容 )
(一) 统计整理的 原则,要抓住最基本最能说明问
题本质特征的统计分组和统计指标,对统计资料进行
加工整理。
(二) 统计整理的 步骤(内容)
1.设计和编制统计整理方案
2.对原始资料进行审核
※3,按要求进行分组或分类,编制分配数列
4.根据分组分类情况进行汇总(现在主要采用电
脑汇总)和计算,得出各项指标值。
5.编制统计表,用统计表体现分组、汇总的结果
6.做好统计资料的汇编和积累
第二节 统计分组
一、统计分组的概念
◆ 统计分组是 根据统计研究的任务和目的,将 总体
按照一 个或几个 标志 划分为若干 个 性质不同又有联系的
部分。
例 1:某班学生( 20人)总体按 性别 标志分组情况
按 性别 分组
分组前 分组后
女生 8人
占 40%
男生 12人
占 60%
某班学生基本情况调查表
姓名 性别 民族 年龄 身高 政治面貌
张三 男 汉 21 1, 5 2 中共党员
李四 女 汉 21 1, 4 3 中共党员
王五 男 回 23 1, 5 8 团员
贾六 女 汉 23 1, 5 1 团员
刘七 男 汉 22 1, 6 9 团员
杨小 男 回 21 1, 7 5 中共党员
孙非 男 回 20 1, 8 1 团员
王继 男 满 23 1, 6 5 团员
赵可 女 汉 23 1, 6 5 中共党员
武思 男 汉 21 1, 7 6 团员
兰第 女 汉 23 1, 4 8 中共党员
拉达 女 汉 23 1, 4 3 团员
向乐 男 回 22 1, 5 8 中共党员
项于 女 汉 21 1, 6 1 团员
可人 男 汉 23 1, 7 1 团员
梁草 女 回 23 1, 5 2 团员
保安 男 汉 20 1, 4 6 中共党员
马宝 男 汉 20 1, 8 2 团员
姜清 女 满 20 1, 5 8 中共党员
林可 男 满 20 1, 7 3 团员
例 2,
汉族 12人,占 60%
回族 5人,占 25%
满族 3人,占 15%
1.按民族分组
20岁 5人,占 25%
21岁 5人,占 25%
22岁 2人,占 10%
2.按年龄分组
中共党员 8人,占 40%
团员 12人,占 60% 3.按政治面貌分组
23岁 8人,占 40%
4.按性别分组(参前例)
则,
二、统计分组的意义和作用
统计分组是基本的统计方法之一,通过分组把总体
中具有不同性质的单位分开,把性质相同的单位合在
一起,保持 组内资料的同质性 和 组间资料的差异性,
正确地反映出统计总体的本质特征,以便进一步运用
各种统计方法,研究现象的数量表现和数量特征。
统计分组法在统计认识中的作用是多方面的,主要
有以下三方面,
1.划分事物的类型,不同类型的事物有不同的特点、
性质和规律,只有通过科学的分组才能达到对不同类
事物和总体的认识。
2.揭示现象内部结构,一是从静态上来看,各组
占总体比重大小的不同,对总体的影响也不同,比重
相对大的决定着总体的性质或结构类型;二是从动态
上来看,观察各组比重的变化过程能更加深刻的认识
现象和事物发展的规律和趋势。
3.分析现象之间的依存关系,不同现象之间的依
存关系是一种比较紧密的联系,而统计分组法是分析
研究此种关系最基本的一种方法。具体运用时关键是
要分清影响因素(自变量)和结果因素(因变量)
『 参下例 』
耕地按耕作深度分组
(厘米) 地块数
平均收获率
(千克 /每亩)
10- 12
12- 14
14- 16
16- 18
18- 20
7
10
16
12
5
200
230
270
310
340
?上表反映了该农作物的 收获率 随耕作 深度的加深 而提
高,显然存在着 正依存关系 。
?在社会经济现象中,还有很多存在这种关系,如:收
入-消费、人口的文化程度-生育率等等。








例,
三,统计分组的 种类
统计分组可以按照不同的 标准 进行分类,一般有以
下几种分类,
1.按分组标志的性质 划分,统计分组 分为 品质分组
和 数量 分组 。品质分组是按品质标志进行的分组。变量
分组是按数量标志的分组。
[前例 ] 汉族 12人,占 60%
回族 5人,占 25%
满族 3人,占 15%
1.按 民族 分组
品质分组
22岁 2人,占 10%
20岁 5人,占 25%
21岁 5人,占 25% 2.按 年龄 分组
23岁 8人,占 40% 数量分组
2.按分组标志的多少 划分,统计分组 分为 简单分组
和 复合分组 。 简单分组 是对研究的总体 仅按一个标志进
行的分组; 复合分组 是对研究的同一总体选择两个或两
个以上标志层 叠起 来进行的分组 。
前例,
男 12人,占 60%
女 8人,占 40% 按 性别 分组 简单分组,
复合分组,
男 12人
女 8人
按 性别 分组
按 政治面貌 分组
团员 4人
中共党员 4人
团员 8人
中共党员 4人
按 政治面貌 分组
四,分组体系
1.概念,统计分组体系是指在统计整理中,为
研究现象总体的情况而运用多个分组标志对总体进
行分组,从而形成一系列相互联系、相互补充的分
组体系。
2.分类,平行分组体系和复合分组体系 。
★平行分组体系 就是对同一总体进行若干次简
单分组。 『 参前例 2』
★ 复合分组体系 就是对某一总体进行某种复合分
组。 『 参前一个幻灯片 』
五,分组标志的选择
分组标志的选择 是 分组的关键 。在统计整理中,选
择什么样的标志就会形成什么样的分组体系。且分组标
志一经确定,就突出了总体在此标志下的性质差异,而
掩盖了总体在其他标志下的差异
所以,根据统计研究的目的,在对研究对象进行分
析的基础上,抓住具有 本质性的 区别及反映现象内在联
系的标志 来作为分组的标志。
例,欲了解我校的师资梯队和水平情况,就应该选
取 职称标志和年龄标志 进行分组。若想了解我校学生的
来源情况,就应该选取 籍贯标志 进行分组。
六,统计分组的方法
1.按 品质 标志 分组,
(1)涵义,以 品质标志 为分组标志,并在品质标志
的变异范围内划定各组界限。
(2)具体情况,按品质标志进行的分组,有组与组
之间界限明确、划分简单的情况 ;如学校学生按性别
标志分为男、女两组。 也有划分较麻烦、归类比较困
难的 复杂 情况。在进行具体分组时,对于复杂情况的
划分,国家统计部门已经按有关分类标准,规定了统
一的分类目录,对有关内 容进行了 统一规定,以作为
分组的统一依据,供长期使用。
2.按数量标志进行的分组 (变量分组法),
( 1)涵义,以数量标志为分组标志,并在数量标
志的变异范围内划定各组界限。
( 2)数量标志分组的 关键是 要掌握决定事物质的
差异的数量界限。
( 3)主要的分法,单项式分组和组距式分组。
① 单项式分组。 单项式分组是对于变量值较少的
离散型变量而言的,在此情况下,可将每一个变量值
作为一组按顺序排列分组 。
例如,
按人口数对某地居民户进行分组
每户人口数 户数 每户人口数 户数
1 30 5 200
2 100 6 120
3 659 7 31
4 356 8 10
② 组距式分组。 组距式分组 是对于连续型变量和变
量值较多的离散型变量而言,将整个变量值依次划分为
几个区间,一个区间内的所有变量值作为一组。
例 1,某地区的高等院校按在校生人数(离散型
变量)分组,可分为 999人以下,1000- 2999人,
3000- 4999人,5000人以上等四组。
例 2,某班的学生按身高(连续型变量)分组,
可分为 1.4- 1.5米,1.5- 1.6米,1.6- 1.7米,
1.7- 1.8米,1.8- 1.9米六组。
对组距式分组必须要弄清如下几个问题和概念:
组距、组数、组限、组中值等 (详细内容见第三
节)。
第三节 次 数 分 布
一,次数分布及次数 的概念
1.次数分布 是在统计分组的基础上,将总体的所
有单位,按组归并排列,从而形成总体中的各个单位
在各组间的分布。又称为分配数列 。
2.分布在各组的个体单位数叫 次数 。次数可以用
绝对数表示,即频数;也可以用结构相对数表示,即
频率或比率或比重。
二、分配数列的种类
由于统计分组是按照统计标志进行的,因此,分配
数列相应的也有 品质分配数列和变量分配数列 两种。
1.品质分配数列 的含义和编制,
品质分配数列是按照品质标志进行分组所编制的分
配数列 (简称品质数列) 。 它由各组名称和次数组成。
例子 1,某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)


12
8
60
40
合计 20 100
各组名称 频数 比率或频率
按性别分组 绝对数人数 比重(%)



12
5
3
60
25
15
合计 20 100
各组名称 频数 比率或频率
某班学生的民族构成情况 例子 2,
2.变量 分配 数列
( 1)概念,变量 分配 数列是按照数量标志进行分组所
编制的分配数列 (简称变量数列) 。 它也是由各组名称
和次数组成。
( 2)变量数列的种类,单项式数列和组距式数列 。 单项
式数列 是按单项式分组而形成 的数列 (见例 1) 。组距
式数列 是 按组距式分组形成的分配数列 (见例 2) 。
例 1,某班学生年龄情况表
按年龄分组(岁) 人数(人) 比重(%)
20
21
22
23
5
5
2
8
25
25
10
40
合计 20 100
例 2,某班学生身高情况表
按身高分组(米) 人数(人) 比重(%)
1.4- 1.5
1.5- 1.6
1.6- 1.7
1.7- 1.8
1.8- 1.9
4
6
4
4
2
20
30
20
20
10
合计 20 100
各组名称 频数 频率
三、变量数列的编制
(一)单项式数列的编制,
单项式数列 是对于总体单位数不多的离散型变量
而言的,先按每一个变量值分组,列于数列的左方,
再将各变量值出现的次数列于数列的右方,即构成单
项式数列。在此种数列中,一个变量值就是一组,不
存在组距问题,组数即等于变量值的数目。
(参前面的例子 1)
(二)组距式数列的编制,
组距式 数列 是对于连续型变量和变量值较多的离
散型变量而言,其基本做法是先将整个变量值依次划
分为几个区间,也就是分成几个组,把其列于数列的
左方,再将出现在每个区间内的变量值的次数列于数
列的右方,即构成组组距式数列。编制这种数列牵涉
的问题相对较多。 主要有 组距、全距、组数、组限、
组中值、等距数列和异距数列 等问题。
(参前例 2和下例)
人口按年龄分组 人口数(万人) 比重(%)
1岁以下
1岁- 6岁
7岁- 15岁
16岁- 60岁
60岁以上
1
5
12
25
2
合计 45
例,
某地区人口分布状况
★ 关于编制此种数列的若干问题,
1.组距,指的是组距数列中各组变量值从小到大
的距离,也即是区间的距离和长度。
2.全距,也称极差,指的是全部变量值中,最大
值和最小值的差。
4.等距数列和不等距数列,前者是指按照相等的
组距划分的组距数列;后者是指按照不相等的组距划
分的组距数列。
5.组数,指的是根据一定的组距划分的区间的数
目。组数的多少与组距的大小呈反方向变化的关系。
在 等距数列 中有以下关系式,
组数
全距组距=
6.组限,
( 1)含义,指的是组距数列中,每个组的两端的变
量值。其中每组的最小值叫下限;每组的最大值叫上限。
( 2)组限的表示,若变量是离散型,相邻两组的上
下限用两个连续自然数表示;若变量是连续型,相邻两
组的上下限应用同一变量值表示,即相邻两组的上下限
必须重叠,若出现此情况,一般应把此值归入下限的那
以组,这也叫做, 上组限不在组内的原则, 。
( 3)开口组和闭口组,若某组变量值同时具有上限
和下限称为闭口组;若某组变量值仅具有上限或下限则
称为开口组,一般为最高组或最低组。
7.组中值,
( 1)含义,下限与上限之间的中点数值叫组中值。
( 2)组中值的计算,
计算公式,
2
下限+上限
组中值=
2
邻组组距=下限+缺上限的开口组组中值
2
邻组组距=上限-缺下限的开口组组中值
8.等距数列的编制步骤,
( 1) 将原始资料排序,并计算全距。
( 2) 确定组数和组距。
( 3) 确定组限。
( 4) 计算各组的次数,整理编制次数分布表。
9.异距数列的情况,
第一种办法 是将不等组距的次数换算为标准组距
次数。标准组距可以选用数列中的最小组组距。
第二种办法 是计算次数密度。公式如下,
各组组距
各组次数次数密度=
例:某工厂工人年龄分布情况
工人按年龄分组 组距 人数(人) 标准组距人数 次数密度
25- 30
30- 35
35- 45
45- 50
5
5
10
5
40
70
65
10
40
70
32.5
10
8
14
6.5
2
合计 - 185 - -
四、累计次数分布
1.向上累计,是将各组次数和比率由变量值低的组
向变量值高的组逐组累计。
2.向下累计,是将各组次数和比率由变量值高的组
向变量值低的组逐组累计。
例, 某班学生身高情况表
按身高分组(米) 人数(人) 比重(%)
1.4- 1.5
1.5- 1.6
1.6- 1.7
1.7- 1.8
1.8- 1.8
20 4 4
16 6 10
10 4 14
6 4 18
2 2 20
100 20 20
80 30 50
50 20 70
30 20 90
10 10 100
合计 20 100
向上累计 向下累计 向上累计
向下累计
五、次数分布的图形表示法
1.直方图
2.曲线图
各组组限
各组次数
六、次数分布的主要类型
1.钟型分布
2.U型分布 3.J型分布
第四节 统 计 表
一、什么是统计表
1.广义,
用于统计工作各个阶段的任何反映统计资料的表格
都是统计表,如用于调查阶段的调查表,用于统计整理
阶段的整理表,用于统计分析阶段的分析表等。
2.狭义,
专指用于统计整理阶段的整理表,即是指把经过整
理汇总的资料,按照一定的顺序集中而有条理地反映出
来的一种表格。 (参看前面的例子)
二、怎么样来看统计表
(一)统计表的结构
100 20 合计
60
25
15
12
5
3
汉族人数
回族人数
满族人数
比重(%) 绝对数(人) 按民族分组
例,某班学生的民族构成情况
主词 宾词
纵栏标题
总标题








1.形式结构,由 总标题、横行标题、纵栏标题和指
标数值 等要素组成。
2.内容结构,由 主词和宾词 构成
(二)统计表的种类
1.按主词的分组情况分类
( 1)简单表,即主词不经过任何分组的统计表,
或是罗列各单位名称或是按时间顺序排列。 (参教材
中表 2- 3)
( 2)分组表,即主词按某一个标志分组的统计表,
也就是按简单分组形成的统计表。 (参教材中表 2- 4)
( 3)复合表,即主词按两个或两个以上的标志进
行复合分组的统计表。 (参教材中表 2- 5) 注意平行
分组体系和复合分组体系。
2.按宾词的设计情况分类
( 1)简单设计,即是将指标作平行配置,一一排
列。 (参书中例表)
( 2)复合设计,即是把各个指标结合起来,作层
叠配置,分层排列。 (参书中例表)
(三)看表和制中须注意的其它若干细节问题
(参看书中 49- 50面的内容)