2-1
第二章 统计数据的搜集、整理和显示
? 第一节 统计资料的搜集
? 第二节 数据整理
? 第三节 频数分布
2-2
第一节 统计数据的搜集
? 一、统计数据搜集的基本理论
? 1、定义:
? 根据统计研究预定的目的要求和任务,运用
相应的科学的调查方法与手段,有计划、有
组织地向客观实际搜集数字资料。
? 从过程的阶段性看,统计数据的搜集处于统
计工作过程的基础阶段。
2-3
? 2、搜集数据的方法:实验与调查
? 3、搜集的统计数据有两种:
? 一种是原始资料,又称为初始资料;
? 另一种是次级资料或第二手资料。
2-4
二、统计调查的方案设计
? 1、确调查目的。
? 2、确定调查对象和调查单位。
? 调查对象:是指需要调查的现象总体,该总体是由许多性
质相同的调查单位组成的。
? 调查单位:是指所要调查的具体单位,它是进行调查登记
的标志的承担者。
? 报告单位:报告单位亦称填报单位,它是负责向上报告调
查内容、提交统计资料的单位。调查单位与报告单位,有
时是一致的,有时不一致。
? 3、确定调查项目。调查项目就是调查中所要登记的
调查单位的特征,即调查单位所承担的基本标志,
它由一系列品质标志(或称质量标志、属性标志)
和数量标志所构成。
2-5
? 4、调查表格和问卷的设计。
? 调查表:将各个调查项目按照一定的顺序排列在一定的表
格上,就构成了调查表。
? 问卷调查:根据调查目的,在调查对象中随机选择或有意
识地确定调查单位,以书面文字或表格形式了解被调查者
的意见,调查者自愿、自由地回答问卷中所提出的问题。
? 5、确定调查时间。 统计调查时间包括二种涵义,
即调查时间和调查期限。
? 调查时间:是指调查资料所属的时间。
? 调查期限:是进行调查工作的时限,包括搜集资料和报送
资料的工作所需的时间。
? 6,调查的计划实施
2-6
三、统计数据的搜集方法
? 1.直接观察法
? 2.报告法(通讯法)
? 3.采访法
? 4.登记法
? 5.实验设计调查法
? 6.其他调查法
2-7
四、统计调查的组织各种形式
? (一)全面调查与非全面调查
? 统计调查按调查的范围划分,可分为全面调
查和非全面调查两大类。
? 1、全面调查是对调查对象的所有单位一一进
行调查。普查、全面统计报表都属于全面调
查。
2-8
? 1)普查
? 普查是专门组织的一种全面调查,它主要是
用以调查某些不能或不宜用定期的全面报表
搜集的统计资料。
? 普查有主要特点:
? 第一,它是一次性(非连续性)的调查。
? 第二,它是一种全面调查,可获得大量详细、全
面的资料。
2-9
? 2)全面统计报表制度
? 全面统计报表制度是依照国家有关法规,自上而下
地统一布置,以一定的原始记录为依据,按照统一
的表式,统一的指标项目,统一的报送时间和报送
程序,自下而上地逐级地定期提供统计资料的一种
调查方式。
? 全面统计报表的实施范围,是调查对象的全部单位
均要填报。
? 统计报表的主要特点:
? 第一,资料的来源是各个基层单位的原始记录。
? 第二,逐级上报和汇总的。
? 第三,属于经常性(连续性)调查,调查项目相对稳定。
2-10
2、非全面调查:对调查对象其中的一部
分单位进行调查。
? 1)抽样调查。抽样调查是按随机原则从调查对象中
抽取一部分单位作为样本进行观察,然后根据所获
得的样本数据,对调查对象总体特征作出具有一定
可靠程度的推算。
? A)特点:
? 第一,按随机原则抽取样本。
? 第二,根据部分调查的实际资料对调查对象总体的数量特
征作出估计。
? 第三,抽样误差可以事先计算并加以控制。
? B)适用范围:
? 第一,不可能或不必要进行全面调查的社会现象。
? 第二,对普查资料进行必要的修正。
2-11
? C)抽样调查的理论基础
? 概率论和数理统计的有关定理。
? D)抽样调查对数据的要求:所研究的变量是
随机变量。
? E)抽样调查应遵循的原则:
? 第一,随机原则。
? 第二,最大抽样效果原则。
2-12
2)重点调查
? 重点调查:是指在调查对象中,只选择一部分重点
单位进行的非全面调查。
? 重点单位:着眼于现象量的方面而言,尽管这些单
位在全部单位中只是一部分,但它们在所研究现象
的标志总量中却占有绝大的比重,在总体中具有举
足轻重的作用。
? 3)典型调查:典型调查是一种专门组织的非全面调
查。根据调查的目的,在对所研究的对象进行初步
分析的基础上,有意识地选取若干具有代表性的单
位进行调查和研究,借以认识事物发展变化的规律。
有人也认为它是, 目的抽样,,以若干具有代表性
的单位为样本。
2-13
(二)经常性调查与一次性调查。
? 统计调查按时间标志可分为连续性(经常性)
和不连续性(一次性)调查两大类。
? 1、连续性(经常性)调查:是指随着研究现
象的变化,连续不断地进行调查登记。如统
计报表制度。
? 2、不连续性(一次性)调查:是指间隔一段
较长的时间对事物的变化进行一次性调查,
如普查、典型调查。
2-14
( 三)定期报表形式与专门调查
? 统计调查按组织形式可分为定期报表形式和
专门调查。
? 1、定期报表制度是按国家统一规定的表式
和内容,定期地向各级领导机构报送统计资
料的一种形式。
? 2、专门调查是为某一专题研究而组织的专
项调查,如抽样调查、典型调查、普查。
2-15
统计调查形式示意图
普 查
全面报表
抽样调查
重点调查
典型调查
周期性调查
一次性调查
普 查
抽样调查
重点调查
典型调查
全面调查
非全面调查
连续 (经常性 )调查
不连续调查
定期报表
专门调查
调查
范 围
调查
时 间
组织
形 式






2-16
五、统计调查体系
? 统计调查方法体系:建立以必要的周期性的
普查为基础,经常性的抽样调查为主体,同
时辅之以重点调查、科学推算和少量的全面
报表综合运用的统计调查方法体系。
? 普查和全面报表都是全面调查,但两者不能
互相替代。
2-17
? 抽样调查虽然是一种非全面调查,但它能够解决全
面调查无法或难以解决的问题,抽样调查调查单位
少,调查项目就可以多一些,以便对某一社会经济
现象进行更深入的研究,也可以节省调查费用,又
可以满足统计时效性的要求。所以,我国统计调查
体系是以经常性的抽样调查为主体。
? 如果调查任务只要求掌握基本情况,而现象总体中
又有部分单位能比较集中地反映研究项目的数量特
征,则可采用重点调查。在统计调查体系中,适度
地采用了科学的推算方法。
2-18
六 现有统计资料的主要来源
? 1.统计年鉴
? 2.有关期刊
? 3.有关网站
2-19
第二节 数据整理
? 一、数据整理的内容与程序
? 1、统计数据整理的内容:
? 2、数据整理的程序。
? 1)统计资料的审核。
? 2)资料的分组和汇总。分组,即对资料按其性
质和特点,划分为若干类;汇总,加总计算形成
各项统计指标。统计分组和统计指标是整理的中
心工作。
? 3)编制统计表或绘制统计图。
? 4)统计资料的积累、保管和公布。
2-20
二、统计分组
? (一)统计分组的概念与种类
? 1、统计分组
? 1)根据统计研究的目的和客观现象的内在特点,按某个
标志(或几个标志)把被研究的总体划分为若干个不同性
质的组,称为统计分组。
? 2)分组的性质来:兼有分和合双重含义。
? 2、统计分组的原则
? 穷尽原则,使总体中的每一个单位都应有组可归,或者说
各分组的空间足以容纳总体所有的单位。
? 互斥原则,在特定的分组标志下,总体中的任何一个单位
的只能归属于某一组,而不能同时或可能归属于几个组。
2-21
3、统计分组的种类
? 1)按分组标志的多少,可分为简单分组和复合分组。
? 简单分组:就是对研究现象按一个标志进行分组。
? 复合分组:用两个或两个以上标志分组,即先按一个标志
分组,在此基础上再按第二个标志分小组,又再层叠地按
第三个标志分成更小的组,这称为复合分组。
? 2)按分组的标志的性质不同,分为品质分组(或称
属性分组)和数量分组(或称变量分组)。
? 品质分组:按品质(或属性)标志进行分组。品质分组所
形成的数列称为品质数列。
? 数量分组:按数量标志分组,数量标志的变异性体现在它
不断变动自身的数量上,故也称为变量分组。变量分组所
形成的数列称为变量数列。
2-22
? 3)按分组的作用和任务不同,分为类型
分组、结构分组和分析分组。
? 类型分组:把复杂的现象总体,划分为若干个不
同性质的部分,就是类型分组。
? 结构分组:在对总体分组的基础上计算出各组对
总体的比重,借此研究总体各部分的结构,即结
构分组。
? 分析分组:为研究现象之间依存关系而进行的统
计分组即分析分组。
2-23
(二)统计分组的方法
? 1、品质分组的方法。
? 按品质标志分组,有些分组比较简单,分组
标志一经确定,组的名称和组数也随之确定。
? 2、数量分组的方法。
? 按数量标志分组,应注意如下两个问题:首
先,分组时各组数量界限的确定必须能反映
事物质的差别。其次,应根据被研究的现象
总体的数量特征,采用适当的分组形式,确
定相宜的组距、组限。
2-24
1)单项式分组与组距式分组
? A)单项式分组:用一个变量值作为一组,形成单项
式变量数列。
? 变量值又称标志值。按数量标志分组,数量标志的
表现,就是变量的取值
? 单项式分组一般适用于离散型变量且变量变动范围
不大的场合。
? B)组距式分组:将变量依次划分为几段区间,一段
区间表现为, 从 …… 到 ……, 距离,把一段区间内
的所有变量值归为一组,形成组距式变量数列。区
间的距离就是组距。
? 连续型变量或者变动范围较大的离散型变量,适宜
采用组距式分组。
2-25
2)间断组距式分组和连续组距式分组
? 下限,上限:组距式分组的每一组变量值中,其最
小值为下限,最大值为上限。
? 组距:上下限之间的距离。
? 组限:相邻两组的界限。
? 间断组距式分组:组限不相连的组距式分组。
? 连续组距式分组:组限相连(或称相重叠的),即
以同一数值作为相邻两组的共同界限的组距式分组。
? 离散型变量,可间断组距式分组,也可连续组距式
分组。连续型变量,只能采用连续组距式分组。
?, 上限在不内, 原则:在连续组距式分组中,以同
一个数值作为相邻两组共同的界限,统计上规定,
凡是总体某一个单位的变量值是相邻两组的界限值,
这一个单位归入作为下限值的那一组内。
2-26
3)等距分组与异距分组
? 等距分组:标志值在各组保持相等的组距,
即各组的标志值变动都限于相同的范围。一
般用于标志值变动比较均匀的场合。
? 异距分组:各组的组距不相等。
2-27
(三 ) 相关指标的计算
? 1.组距
? 连续式分组的组距计算公式:
组距 =本组上限 –本组下限
? 间断式分组的组距计算公式:
组距 =本组上限 –本组下限 +1
开口组的组距:以相邻组的组距为本组的组距。
? 2.组中值:上下限之间的中点数值称为组中
值,组中值的计算公式:
2
下限上限
组中值
??
2-28
? 计算平均指标或进行其它统计分析时,常以
组中值来代表各组标志值的平均水平。
? 3.组数
组数 =全距 /组距
? 斯特杰斯经验公式:
组数 =1+3.3 Lg N
? 由此推出
组距 =(最大变量值 -最小变量值) /( 1+3.3Lg N )
2-29
第三节 频数分布
? 一、频数分布的基本概念
? 1、频数分布
? 在统计分组的基础上,将总体所有的单位按某一标
志进行归类排列,称为频数分布,或次数分布。根
据分组标志特征的不同,分布数列可分为品质分布
数列和变量分布数列。
? 2、分布数列的两个要素
? 1)总体按某标志所分的组。
? 2)各组所出现的单位数,即频数,亦称次数。对于变量
数列,标志值形成的数列,称为变量,一般用 x表示;频
数(次数)用 f表示。
2-30
二、变量数列的编制
? 1、编制方法。
? 2,频率的性质
? 1)任何频率都是界于 0和 1之间的一个分数,即:
? 2)各组频率之和等于 1,即:
? 3、频数密度:采用异距分组,各组次数的多少受到
组距不同的影响,为消除异距分组所造成的影响须
计算频数密度(或称次数密度)。频数密度的计算
公式:
频数密度 =频数 /组距 频率密度 =频率 /组距
? 各组频数密度与各组组距乘积之和等于总体单位数,
各组频率密度与各组组距乘积之和等于 1。
2-31
三、累计频数与累计频率
? 1、向上累计频数(或频率)分布:先列出各组的上
限,然后由标志值低的组向标志值高的组依次累计。
向上累计频数表明某组上限以下的各组单位数之和
是多少,向上累计频率表明某组上限以下的各组单
位数之和占总体单位数比重的大小。
? 2、向下累计频数(或频率)分布:先列出各组的下
限,然后由标志值高的组向标志值低的组依次累计。
向下累计频数表明某组下限以上的各组单位数之和
是多少,向下累计频率表明某组下限以上的各组单
位数之和占总体单位数比重的大小。
2-32
? 3、累计频数分布特点
? 1)第一组的累计频数等于第一组本身的频数;
? 2)最后一组累计频数等于总体单位数。
? 累计频率同样也具有两个特点:
? 1)第一组的累计频率等于第一组本身的频率;
? 2)最后一组的累计频率等于 1。
? 累计频数(频率)分布图分为向上累计频数(频率)分布图
和向下累计频数(频率)分布图。以分组变量为横轴,以累
计频数(频率)为纵轴。
? 在直角坐标点系上将各组组距的上限与其相应的累计频数
(频率)所构成坐标点,依次用直线(或光滑曲线)相连,
即是向上累计曲线。
? 在直角坐标系上将各组组距下限与其相应累计频数(频率)
所构成坐标点,依次用直线(或光滑曲线)相连,即是向下
累计分布曲线图。