第二章 统计调查与整理
一、统计调查的意义
第一节 统计调查的内容与方法
统 计调查 就是按照统计任务的要求,运用科
学的调查方法,有组织地向社会实际搜集资
料的过程。
应当正确理解社会调查在人们认识中的地位;
应当正确理解统计调查在统计工作中的地位;
应当正确理解统计调查理论和方法在统计学原
理中的地位。
例,企业生存取决于市场。对企业来说,生产什么?
售价多少?何地销售?如何推广?产品市场份额多
大?产品发展潜力多深?竞争对手会有什么应对策
略?等等,一系列问题均要通过市场调查 。
请看目前,
各国企业和研究机构全年
投资于每个消费者的平均调查费 单位:美元
英国 22.9
美国 16.5
日本 8
中国 0.1
发达国家的调查公司,比如标准普尔公司
和盖洛普公司,他们提供的数据,向来是
世界 500强制定发展战略的重要依据。
二 统计调查的基本要求
准确性要求和及时性要求是相互结合相互依
存的,及时性在准确性要求的前提下才有意
义,而准确性也不能损害及时性的要求。
准确性 及时性
三 统计调查的设计 (即统计调查方案 )
调查对象就是我们需要进行研究的总体范围,
即调查总体。它是由性质相同的许多调查单位
所组成的。
作为调查单位乃是进行登记的标志表现的直接
承担者。例:人口普查的调查单位是每一个人
1.确 定调查的目的
—— 即为什么调查
2.确 定调查对象和调查单位
—— 即向谁做调查
3.拟 订调查提纲和制定调查表
—— 即用什么方法调查
拟订调查项目时要注意几个原则,
- 调查项目要少而精;
- 调查项目含义要明确;
- 尽可能做到各个调查项目之间有一定的联系。
调查表分为,
一览表
把 许多调查单位和相应的项目按次序登记
在一张表格里。这便于汇总,但缺点是分
不开,故调查深度不够;
单一表
将 一个调查单位的项目登记在一份表或一
种卡片上。这便于容纳较多的项目,且便
于整理、分类,缺点是繁琐。
4.确 定调查时间
—— 即在什么时间调查
要区别调查时间和调查期限的不同,
- 调查时间是指调查资料所属的时间(时点或时
期);
- 调查期限是指调查工作的起讫时间。
5.制 定调查的组织实施计划
四 统计调查的方法
直接观察法 报告法
采访法 网上调查法
另外,还有电话调查、座谈会、个别深度访谈等方法 。
第二节 统计调查的组织 (即调查的种类 )
按 调查的范围分,统计调查可以分为:全
面调查和非全面调查;
按 登记事物的连续性分,统计调查可以分
为:经常调查和一时调查;
按 组织形式分,统计调查可以分为:统计
报表和专门调查。
??
??
?
专门统计报表
基本统计报表
1,统计报表
统计报表分为,
按报送周期长短不同统计报表分为,
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
年报
半年报
季报
月报
旬报
日报
定期报表
分 为普查、重点调查、抽样调查、典型调查。
普查为全面调查,后三者为非全面调查。
2,专门调查
普查,为专门组织的一次性调查,用来调查
属于一定时点的社会现象的总量。
例, 每 5年进行一次的经济普查,包括工业
普查、三产普查、基本单位普查、建筑业
普查。这种普查制度在周期安排上和国家
编制五年计划相衔接。
重点调查,对重点单位进行调查。重点单位指
的是这些单位数占总体的很少部分,而研究
的标志总量占绝大部分(或绝大比重)。
例:某地区为了掌握该地区水泥生产的质量
情况,拟对占该地区水泥总产量 80%的五个
大型水泥厂的生产情况进行调查,属于重点
调查。
抽样调查,按随机原则从总体中抽取一
部分单位进行调查。
例,对一批灯泡的合格率进行调查,
应该采用抽样调查方式。
典型调查,先对总体进行分析,然后选择
有代表性的单位进行调查。
例,选取部分企业进行调查,以了解企业
股份制改革后的成果及问题。
第三节 统计分组
1.概 念 把同质总体中的具有不同特点的
单位分开,从而正确地认识事物
的本质及其规律性。
一 统计分组的概念和作用
2.作 用 主要有三个方面,
揭露社会经济现象的类型,反映各类型的特点。
⑴ 类型分组
类 型 2000年 2001年 2002年 2003年
农业 13 873.6 14 462.8 14 931.5 14870.1
林业 936.5 938.8 1 033.5 1239.9
牧业 7 393.1 7 963.1 8 454.6 9538.8
渔业 2 712.6 2 815.0 2 971.1 3137.6
合 计 24 915.8 26 179.6 27 390.8 29691.8
例 单位:亿元
说明社会经济现象的内部结构。
⑵ 结构分组
年 份 2000 2001 2002 2003
第一产业 16.4 15.8 15.3 14.6
第二产业 50.2 50.1 50.4 52.5
第三产业 33.4 34.1 34.3 33.1
合 计 100.0 100.0 100.0 100.0
例 我国国内生产总值构成( %)
研究经济现象之间的依存关系。
⑶ 分析分组
耕作深度分组 (cm) 地块数 平均收获率 (斤 /亩 )
10-12 7 400
12-14 10 460
14-16 16 540
16-18
18-20
12
5
620
680
例 某乡某种农作物的耕作深度与收获率的关系
二 选择分组标志的原则
根 据研究问题的目的来选择
要 选择最能反映被研究现象本质特征
的标志
要 结合现象所处的具体历史条件或经
济条件来选择
例,国际上对中小企业的标准界定为, 2,3,4”,
即员工在 2000人以下,销售额在 3亿元以下,资
产总额在 4亿元以下。由此标准,我国目前的大
企业仅 1948家,99%以上为中小企业。
品 质标志分组 —— 反映事物属性差异
三 分组标志的种类
1.按分组标志的特征不同分为,
- 简单分组。如人口按性别分组。
- 复杂分组,亦称分类。如人口按职业分组。
- 单项式数量分组 —— 运用于变量变动幅度
小、项目少的分组。
- 组距式分组 —— 运用于变量变动幅度大、
项目多的分组。
数 量标志分组 —— 反映事物数量差异
三 分组标志的种类
2.按总体所选择标志的个数分,
对社会经济现象需要从各方面进行观察和分
析研究,需要采用一系列相互联系、相互补充的
标志对现象进行多种分组,这些分组结合起来构
成一个体系,叫做分组体系。
简 单分组 —— 按一个标志对总体进行分组
复 合分组 —— 按两个或两个以上标志对同
一总体进行分组
第四节 分配数列
一 分配数列的概念和种类
统计总体按照某一标志分组以后,
用以反映总体各单位分配情况的
统计数列,称分配数列,又可称
次数分配,或次数分布。
1.概念

月工资分组 (元 ) 工人数 (人 ) 占总数比重 (%)
2000 以下 210 39.6
2000-2500 187 35.3
2500 以上 133 25.1
合 计 530 100.0
组别 (变量 ) 次数 (频数 ) 频率 (比率 )
2.种类
一 分配数列的概念和种类
以分组标志特征不同分为,
品质数列 变量数列

某班学生的性别构成情况
按性别分组 绝对数人数 比重 (%)
男 30 75
女 10 25
合计 40 100
组别 次数 频率
⑴ 品 质数列
⑵ 变 量数列
单 项变量数列 (单项数列) —— 按每
个变量值分别列组编制数列,适用于
不连续变量或变量能以整数表示,其
变动范围不大时。
组 距变量数列 (组距数列) —— 按组
距分组编制数列。适用于连续变量或
变量可用小数表示,其变动范围较大
时。
单项数列见例如下,
某厂第二季度工人平均日产量
工人平均日产量 (件 ) 工人人数 (人 )
2 10
3 15
4 30
5 40
6 20
合计 115
从另一角度看,变量数列分为,
连 续变量数列 —— 可有小数,采
取组距式。
非 连续变量数列 —— 整数,采取单
项式或组距式 (例:一个地区的
企业按职工人数分组 )。
二 组距数列的编制
组限 组 距两端的数值。分为上限和下限。
组距 某 一组的上限和下限的距离,分等距
和异距。
全距 分 组数列中最大值的上限与最小值的
下限之差。 组数全距等距数列的组距 R?
组中值 组 的上限和下限的中间值。
因数列两端组限形式不同分,
开口式组距,最低组与最高组不封口。例:
成绩 60分以下,90分以上。
闭口式组距,例 40-60分,90-100分。
组距 =上限 -下限
1.确定组距和组数
考试成绩 (分 ) 人数 (人 )
56-60 2
60-100 38
合计 40
例 若将考试成绩仅分为不及格与及格两组,
则可编成如下组距数列,
某班学生统计学考试成绩表
若把上表改变为如下统计表,则基本上能准确反
映总体的分布特征。
某班学生统计学考试成绩表
考试成绩 (分 ) 人数 (人 ) 比重 (%)
50-60 2 5.0
60-70 7 17.5
70-80 11 27.5
80-90 12 30.0
90-100 8 20.0
合计 40 100.0
2.确定组限和组中值
⑴ 关于组限问题
例 已 知组距为 5,组数为 7,最大值 39,
最小值 5,怎样分组?
按分法( c)较合适
( a) ( b) ( c)
1-5 3-8 4-9
5-10 8-13 9-14
10-15 13-18 14-19
15-20 18-23 19-24
20-25 23-28 24-29
25-30 28-33 29-34
30-35 33-38 34-39
上组限不在内
适 用于越大越好的变量,如产值。
适 用于越小越好的变量,如成本。
下组限不在内
对连续变量,组数也要连续。在登记次数
时,习惯上遵守,
对不连续变量,组与组间是间断的。
⑵ 关于组中值问题
闭口式分组的组中值求法,
2
2
下限上限下限或
组的下限组的上限组中值
???
??
⑵ 关于组中值问题
开口式分组的组中值求法,
邻组组距下限值缺上限的开口组的组中
邻组组距上限值缺下限的开口组的组中
2
1
2
1
??
??
三 次数分布的特征
1.次数分布的表示方法
⑴ 表示法 —— 即用统计表来表示
次数分布。

考分
次 数 以下累计次数
(上限 )
以上累计次数
(下限 )
人数 (人 ) 比率 (%) 人数 (人 ) 比率 (%) 人数 (人 ) 比率 (%)
50-60 2 5.0 2 5.0 40 100.0
60-70 7 17.5 9 22.5 38 95.0
70-80 11 27.5 20 50.0 31 77.5
80-90 12 30.0 32 80.0 20 50.0
90-100 8 20.0 40 100.0 8 20.0
合计 40 100.0 - - - -
某班统计学考试成绩次数分配
以 下累计次数 (上限 )—— 即较小制累
计。每一组的累计次数表示小于该组
上限(变量)值的次数共有多少。
以 上累计次数 (下限 )—— 即较大制累
计。每一组的累计次数表示大于该组
下限(变量)值的次数共有多少。
⑵ 图示法
即用统计图来表示次数分布
直方图 折线图
曲线图
直方图 (或次数分配曲线图 )
仍以上例考试成绩数据,画成如下直方图,
0
4
8
12
考分
次数
0
10
20
30
比率
(
%
)
40 50 60 70 80 90 100 110
若 组距不等的话,用标准组距人数,然后
据此画直方图,
按工人年龄分组
(岁)
组距 人数
(人)
标准组距人数
( 人 )
频数密度
=频数 /组距
15-20 5 17 17 3.4
20-25 5 28 28 5.6
25-30 5 40 40 8.0
30-35 5 70 70 14.0
35-45 10 65 32.5 6.5
45-50 5 10 10 2.0
合 计 - 230 - -
直方图 例
0
10
20
30
40
50
60
70
年龄
人数
0
2
4
6
8
10
12
14
频数密度
10 15 20 25 30 35 40 45 50 55
折线图
在直方图的基础上连接各条形顶边的中点成
折线图。
如下图红笔围成的,即为次数分配曲线图,
0
4
8
12
考分
次数
0
10
20
30
比率
(%
)
40 50 60 70 80 90 100 110
折 线图还可用来表示累计次数分布 (仍以上
例数据 ),
累计次数分布折线图
0
10
20
30
40
50 60 70 80 90 100
考分
人数
0
25
50
75
100
比率
(
%
)
曲线图是组数趋向于无限多时折线图的极限
描绘,是一种理论曲线。
向下累计 向上累计
2.次数分布的主要类型
一般次数分布呈正态分布曲线,或称正态
曲线
对称型
Y
Y
右偏型
(上偏型)
左偏型
(下偏型)
X
X
很多是偏态分布曲线,或称偏态曲线
还有其他形态
J型分配曲线
U型分配曲线
双峰曲线
第五节 统计表
一 统计表的结构和内容

分组 总产值
(万元 )
职工人数
(人 )
劳动生产率
(元 /人 )
P 1 2 3
大型
中型
小型
合计
2005年某月某公司各企业劳动生产率统计表
单位 ____




主词 宾词
总标题
纵栏标题
数据资料
(指标数值 )
从 形式上看,统计表由总标题、横行标
题、纵栏标题、指标数值构成。
从 内容上看,统计表由主词和宾词两部
分构成。
主词 说明总体或总体的分组。
宾词 用哪些指标数值来说明总体或总体
的分组。
二 统计表的特点
开 口式
上 下有基线
编 号:主词一般按 A,B,C…,宾词按 1、
2,3…
有 计量单位
表 中不允许有空格:若不需要此资料则
用, -”;暂缺某资料则用, ……”
三 统计表的分类
简单表 总体未分组
分组表 总体按一个标志进行分组
复合表 总体按二个或二个以上标志进
行复合分组
某年某公司所属两企业自行车合格品数量表
厂别 合格品数量(辆)
甲厂 5000
乙厂 7000
合 计 12000

某年某地区工业增加值和职工人数
项目 增加值(万元) 职工人数(人)
内资企业
大型 9 750 13 800
中型 8 600 45 000
小型 4 200 10 050
外商投资
经营企业
大型 7 300 7 500
中型 5 200 10 400
小型 4 400 4 500

四 统计表的编制原则
1,总 标题须简明扼要表达出全表的内容;
2,各 标题要确切反映表的内容,且表格安排合理;
3,指 标数值要位数对齐,合计或总计一般放在表的
尾部;
4,对 指标内容作必要说明时,可加注在表的下方;
5,表 的上下边线(基线)用粗实线或双线,表的两
边是开口式;
6,纵 栏较多时编栏号,指标数值栏要注明计量单位
和资料表示的时间。
总原则,合理、科学、实用、简练、美观。
End of Chapter 2