统计学原理
第一章绪论
第二章统计调查
第三章统计资料的整理
第四章总量指标与相对指标
第五章平均指标和变异指标
第六章时间数列
统计学原理
第七章统计指数
第八章抽样调查
第九章回归与相关分析
第十章统计预测
第十一章统计分析综述
第十二章我国国民经济核算体系
学习目标
? 1,了解统计整理的一般问题
? 2,理解统计分组的方法
? 3,理解统计分配数列的的编制
? 4,了解统计表的结构
第一节 统计资料整理的一般问题
一, 统计资料整理的意义
二, 统计资料整理的步骤
三,统计资料的审核方法
四,统计资料整理的组织形式和技术
统计资料整理的意义
概念,根据统计研究的目的,把统计调查搜集的大量反映个体
特征的原始资料,用科学的方法进行分类和汇总,使之系统化、
条理化,成为能够反映总体特征的综合资料的工作过程。包括 资
料审核、分组、汇总、计算、制表、制图等。
地位和作用,统计整理是统计分析的前提,统计整理的质
量直接影响统计分析的质量。统计整理是统计调查的继续,在整
个统计研究过程中起着承前启后的作用 。
整理的原则,抓住最基本的、最能说明问题本质特征的统
统计资料整理的步骤
整理的基本步骤
设计
方案
审核订正 分组
汇总 编制统计
图表
统计资料的审核方法
数
据
完整性
审核
准确性
审核
单位缺失
项目缺失
口径、方
法、计量
单位等等
审核种类 审核内容 审核方法
与调查方
案比较
逻辑审核
平衡校验
经验判断
全员劳动生产率 <工人劳动生产率
销售收入-销售成本费用=利润
某指标是否符合正常水平
统计资料整理的组织形式和技术
整理的组织形式
逐级
汇总
手工汇总
汇总
的技
术
集中
汇总
机汇总
电子计算机汇总
第二节 统计分组
一, 统计分组的意义
二, 统计分组的原则
三,统计分组的方法
四,统计分组体系
统计分组的意义
根据统计研究的需要和总体内在特征,按照一定标志,
将总体区分为若干个部分或若干个组的一种统计方法 。
分组前 分组后
25 %
33 %
42 %
1 ·区分事物的类型作用:
例:按所有制性质划分,我国现有 8 种经济类:国
有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济
2 ·研究总体的内部结构
例某市按国内生产毛额计算的三次产业结构( %)
1980 年 1990 年 1996 年 1997 年
国内生产毛额 100 100 100 100
第一产业 3.2 4.3 2.5 2.3
第二产业 75.7 63.8 54.5 52.2
第三产业 21.1 31.9 43.0 45.5
3 ·分析现象间的依存关系
例:中国农民家庭按收入分组的恩格尔系数( 1984 年
按收入分组(元) <2 00< 300< 400< 500< 600< 800< 1000
恩格尔系数( %) 64.9 60.2 56.7 54.4 50.5 49.9 43.6
统计分组的原则
统计分组的程序与原则
选择分
组标志
确定分
组体系
总体单
位归类
科学性,
组间差异
大,组内
差异小。
完备性和互斥
性, 每个单位
均能且只能归
到某个组中。
对大学生月生活费
支出情况进行分组
研究:
按家庭收入水
平分组;
按城乡分组;
按性别分组;
按年龄分组。?
统计分组的程序与原则
选择分
组标志
确定分
组体系
总体单
位归类
科学性,
组间差异
大,组内
差异小。
完备性和互斥
性, 每个单位
均能且只能归
到某个组中。
父母亲下
岗情况:
单亲下岗;
双亲下岗;
双亲在岗。
城乡区别
离退休
是否健在
统计分组的方法
分组标志的选择
关键,服从研究任务需要,反映总体本质特征
( 1)要根据研究目的选择
( 2)要反映现象的本质特征
( 3)要因时、因地制宜
统计
分组
方法
按品质标志分组
按数量标志分组
按主要标志和
辅助标志分组
统计分组体系
分组体系指同时使用两个以上
标志分组时,分组标志的组合形式。
具体形式有:平行分组体系和交叉
分组体系。
平行分组体系
对教
师的
分类
按性别分类 男性女性
按职称分类
按年龄分类
高级
中级
初级
青年
中年
共计 7组
2+3+2
复合分组体系
对教
师的
分类
按性别
分类
按职称
分类
按年龄
分类
男
女
高级
中级
初级
青年 中年
共计 12组
2× 3× 2
第三节 分配数列
一, 分配数列
二, 变量数列的编制
三,变量数列的表示方法
四,次数分布的主要类型
分配数列
分布数列及其构成要素
是一种重要的分组资料,反映总体单位在各组的
分布状态。
基本形式:
分组 单位数 频率
合计
… ……
100
频数分布
频率分布
分类
品质数列
变量数列
单项数列
组距数列
等距数列
异距数列
品质数列的种类
分配数列的编制
1.组限及其表示, 组限是组与组之间的界限。每组
的起点数值称为下限,终点数值为上限 。
3.组距、组数和组限的确定,组距大小与组数多少存
在着密切的联系。组距愈大、组数愈少;组距缩小,
组数就增多。
4 ·组距数列编制的经验公式,m=1+3.322lgn
变量数列的编制
2.组距和组中值, 组距 =本组上限 -本组下限
组中值是各组上限与下限之间的中点数值
射击 射击 体操 体操 乒乓球 举重
乒乓球 羽毛球 举重 乒乓球 羽毛球
举重 举重 跳水 跳水 跳水 乒乓球
跳水 射击 体操 羽毛球 柔道 柔道
举重 田径 羽毛球 跆拳道
中国体育代表团在悉尼
奥运会上获金牌的项目
获金牌项目 金牌数 占总数比例
跳水 5枚 0.1786
举重 5枚 0.1786
乒乓球 4枚 0.1429
羽毛球 4枚 0.1429
体操 3枚 0.1071
射击 3枚 0.1071
柔道 2枚 0.0714
田径 1枚 0.0357
跆拳道 1枚 0.0357
品质数列
获金牌项目 金牌数 占总数比例
跳水 5枚 0.1786
举重 5枚 0.1786
乒乓球 4枚 0.1429
羽毛球 4枚 0.1429
体操 3枚 0.1071
射击 3枚 0.1071
柔道 2枚 0.0714
田径 1枚 0.0357
跆拳道 1枚 0.0357
变量值
x
次数
f
频率
f /∑f
某年级 83名女生身高资料
身高 人数
( CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高 人数
( CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
变量值
x
次数
f
单项数列
身高 人数 比重
( CM) (人) ( %)
150-155 3 3.61
155-160 11 13.25
160-165 34 40.96
165-170 24 28.92
170以上 11 13.25
总计 83 100
某年级 83名女生身高资料
组距数列
次数
f
频率
f/Σf
某年级 83名女生身高资料
身高 人数
( CM) (人)
150-155 3
155-160 11
160-165 34
165-170 24
170以上 11
总计 83
组距数列
上组限 U
下组限 L
组距 d
d=U-L
如,160-155=5
组中值 x
x=(U+L)/2
如,(165+170)/2=167.5
开口组
d=邻组 d
估计上组
限为 175
估计组中
值为 172.5
V A R 0 0 0 0 1
1 7 2, 01 6 6, 01 6 0, 01 5 4, 0
40
30
20
10
0
S t d, D e v = 4, 8 6
M e a n = 1 6 3, 3
N = 8 3, 0 0
V A R 0 0 0 0 1
1 7 5, 0
1 7 2, 5
1 7 0, 0
1 6 7, 5
1 6 5, 0
1 6 2, 5
1 6 0, 0
1 5 7, 5
1 5 5, 0
1 5 2, 5
30
20
10
0
S t d, D e v = 4, 8 6
M e a n = 1 6 3, 3
N = 8 3, 0 0
V A R 0 0 0 0 1
1
7
4
,0
1
7
3
,0
1
7
2
,0
1
7
1
,0
1
7
0
,0
1
6
9
,0
1
6
8
,0
1
6
7
,0
1
6
6
,0
1
6
5
,0
1
6
4
,0
1
6
3
,0
1
6
2
,0
1
6
1
,0
1
6
0
,0
1
5
9
,0
1
5
8
,0
1
5
7
,0
1
5
6
,0
1
5
5
,0
1
5
4
,0
1
5
3
,0
1
5
2
,0
14
12
10
8
6
4
2
0
S t d, D e v = 4, 8 6
M e a n = 1 6 3, 3
N = 8 3, 0 0
V A R 0 0 0 0 1
1 7 4, 01 7 0, 01 6 6, 01 6 2, 01 5 8, 01 5 4, 0
40
30
20
10
0
S t d, D e v = 4, 8 6
M e a n = 1 6 3, 3
N = 8 3, 0 0
单项数列 组距为 2.5的 组距数列
组距为 4的组距数列 组距为 6的组距数列
第四节 统计表
一, 统计表的作用及构成
二, 统计表的种类
三,宾词指标的设计
四,编制统计表的规则
统计表的作用
(1)
(2)比用叙述的方式表现统计资料更简明易懂,
(3)便于比较各项目之间的关系,
(4)便于检查统计数字的完整性和正确性 。
统计表的结构
1997~ 1998年城镇居民家庭抽样调查资料
项目 单位 1997年 1998年
一、调查户数
二、平均每户家庭人口数
三、平均每户就业人口数
四、平均每人全部收入
五、平均每人实际支出
#消费性支出
非消费性支出
六、平均每人居住面积
户
人
人
元
元
元
元
平方米
37890
3.19
1.83
5188.54
4945.87
4185.64
755.94
11.90
39080
3.16
1.80
5458.34
5322.95
4331.61
987.17
12.40
资料来源:, 中国统计摘要 1999》,中国统计出版社,1999,第 79页。
注,1.本表为城市和县城的城镇居民家庭抽样调查材料。
2.消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗
保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。
行
标
题
表头
列
标
题
数
字
资
料
附
加
1.要合理安排统计表的结构
2.数据计量单位相同时, 可放在表的右上角标明, 不
同时应放在每个指标后或单列出一列标明
3.表中的上下两条横线一般用粗线, 其他线用细线
4.通常情况下, 统计表的左右两边不封口
5.表中的数据一般是右对齐, 有小数点时应以小数点
对齐, 而且小数点的位数应统一
6.对于没有数字的表格单元, 一般用, —,表示
7.必要时可在表的下方加上注释
编制统计表的规则
统计图
直方图 等距数列:(变量,频数)异距数列,(变量,频数密度 )
折线图
曲线图
等距数列:(组中值,频数)
异距数列:(组中值,频数密度)
单项数列:(变量,频数)
向上累计分布:(变量上限,累计频数)
向下累计分布:(变量下限,累计频数)
变量的组数无限增多时,折线
便趋于一条光滑的曲线。
0
10
20
30
40
50
60
70
80
90
第一季度 第二季度 第三季度 第四季度
0
10
20
30
40
50
60
70
80
90
100
第一季度 第二季度 第三季度 第四季度
东部
第一季度
第二季度
第三季度
第四季度
0
10
20
30
40
50
60
70
80
90
100
0 2 4 6
东部
本章小结
1.统计资料整理的一般问题
2.统计分组
3.分配数列
4.统计表
结 束