复习测验 (一 )
一、判断
1.学生的身高和考试成绩均为定比尺度。 ( )
2.调查时间是进行调查工作所需的时间。 ( )
3.变量的具体表现称为变量值,只能用数值表示。( )
4.统计调查是获取统计数据的直接来源。 ( )
复习测验 (二 )
二、选择
1.铁路里程是一种( )
A 定类尺度 B 定序尺度 C定距尺度 D 定比尺度
2.某市组织一次财税大检查,要求在 12月 10日到 25日之间全部完成,这一时间规定是( )
A 登记时间 B 标准时间 C 调查时间 D 调查时限
3.统计数据的直接来源有( )
A 统计调查 B 科学实验 C 统计出版物 D 计算机网络
4.定序尺度可以对事物( )
A 分类 B 排序 C 计算差距大小
D 计算数值之间的比值第三章 统计数据的整理学习目的及重难点提示本章学习目的:
了解 数据整理在统计活动中的地位,数据整理的内容,
数据审核与汇总的技术;
领会 统计分组的概念,关键,统计分组体系及次数分布的类型和特征;
明确 统计数据的表现形式 —— 统计表和统计图的基本内容;
掌握 统计分组,分配数列和统计图表的编绘制方法 。
本章重难点提示:
本章重点,统计分组,变量数列的编制,统计数据的显示方法 —— 统计表和统计图本章难点,统计分组、变量数列的编制、次数分布图的绘制第一节数据整理的一般问题一、数据整理的概念与作用
(一 )概念对 统计调查所搜集到的 数据进行分类和汇总,使其系统化,条理化,科学化,以 得出 反映事物总体综合特征 的资料的工作过程 。
(二 )作用统计数据整理,是统计调查的继续,也是统计分析的前提,承前启后,在整个统计工作中具有重要的作用 。
二、数据整理的程序数据整理方案的设计数据的审核与检查数据的排序数据分组数据的显示 —— 统计图表数据的积累与保管第二节 数据分组一,数据分组的概念根据统计研究目的和客观现象的内在特点,
按 照选定的某个或几个 标志,将 被研究的 总体数据分成若干部分 的科学分类 。
二,数据分组的作用
(1)区分现象的类型
(2)反映总体的内部结构
(3)揭示现象之间的依存关系
(4)反映事物的数量特征和发展规律三,数据分组的关键 **
选择分组标志 和分组 划分各组界限 (针对数值型变量 )
四,选择分组标志的原则 **
1.根据 研究任务 和 目的 选择分组标志
2.选择能 反映事物本质特征或重要特征 的标志
3.结合 现象所处的 历史条件和社会经济条件选择分组标志
( 一 ) 根据分组变量 (标志 )的性质不同按 品质变量分组按 数值变量分组
( 二 ) 根据采用的分组标志的个数多少简单分组,只按一个标志分组复合分组,按两个或以上的标志分组五、统计分组的种类第 三 节分配数列和次数分布一、分配数列
( 一 ) 概念
(二 )分配数列的要素组别次数 (频数 ):分布在各组的总体单位数 。 各组的次数 (频数 )之和等于总体单位总数 。
频率 (比重 ):各组次数占总次数的比重 。 各组 比重之和等于 100%( 或 1)
将总体按分组标志分组后形成的总体单位在各组的分布,又称 次数分布数列 或 频数分布数列 。
分配数列实例按海拔分组
(米)
面 积
(万平方公里)
占总面积比重
(%)
500 以下
500 ~ 1000
1000 ~ 2000
2000 ~ 3000
3000 以上
2 4 1,7
1 6 2,5
2 3 9,9
6 7,6
2 4 8,3
2 5,1 8
1 6,9 3
2 4,9 9
7,0 4
2 5,8 6
合计 9 6 0,0 1 0 0,0 0
组别 频数 频率表 3.1 我国土地状况分组表
(二)分配数列的种类
1.按分组标志的性质不同品质变量数列,按品质变量分组形成数值变量数列,按数值变量分组形成
2.数值变量数列又可分为,
单项数列,每组只有 一个变量值 的变量数列 。
组距数列,每组 变量值是一段区间 的变量数列 。
连续变量数列,按连续变量分组形成的数列离散变量数列,按离散变量分组形成的数列品质分配数列实例表 3.2 某高校在校生性别状况分组表 性别 人数(人) 比重( % )
男生 4500 5 5,5 6
女生 3600 4 4,4 4
合计 8100 1 0 0,0 0
数值变量分配数列实例表 3.3 某市餐饮业按营业额分组营业额(万元) 餐饮企业个数(家) 比重( % )
10 万元以下 1350 5 8,7 0
10 - 5 0 650 2 8,2 5
50 - 100 180 7,8 3
100 - 500 85 3,7 0
500 万元以上 35 1,5 2
合 计 2300 1 0 0,0 0
单项式变量数列实例表 3.4 某市居民家庭按家庭人口数分组家庭人口数(人) 家庭数(千户) 比重( % )
1 9,8 5,7 6
2 2 7,5 1 6,1 8
3 9 4,6 5 5,6 5
4 1 9,2 1 1,2 9
5 1 0,9 6,4 1
6 8,0 4,7 1
合 计 17 0,0 1 0 0,0 0
组距式变量数列实例表 3.5 某车间工人按月工资分组月工资(元) 工人数(人) 比重( % )
500 元以下 16 8,00
500 - 600 28 14,00
600 - 700 34 17,00
700 - 800 56 28,00
800 - 900 38 19,00
900 - 1000 18 9,00
1000 元以上 10 5,00
合 计 200 100,00
应用判断以下数列是品质数列还是变量数列?是连续变量数列还是离散变量数列?
A 按企业职工人数分组形成的数列
B 按企业销售利润率分组形成的数列
C 按教师职称分组形成的数列
( 一 ) 概念术语
1.全距 ( R) =数列中最大变量值-最小变量值
2.组限,每一组的最大变量值与最小变量值上限,每一组的最大变量值下限,每一组的最小变量值
3.组距 ( d),每一组的最大变量值与最小变量值之差组距 =上限 -下限
4.组数,数列中的分组个数二、分配数列的编制定性关系,全距一定的情况下,组数和组距呈反方向变动定量关系,
式二为确定组距的经验公式,其中 N代表组数组数和组距的关系组数 ≈全距 /组距 ≈R/d
组距 =R/( 1+ 3.322lgN)
二、分配数列的编制
(一 )概念术语
5.频数 (次数 )与 频率 (比重 )
6.品质数列 与 变量数列
7.等距数列 与 异距数列
8.次数密度,单位组距内分布的总体单位数,
公式,
次数密度=各组次数 / 各组组距开口组,缺上限或缺下限的组闭口组,上下限齐全的组
10.组中值及计算 **
(1)闭口组临近组 组限重合 时,组中值 =( 上限+下限 ) / 2
临近组 组限间断 时,组中值 =( 下限+下组下限 ) /2
(2)开口组缺上限 时,组中值 =下限+邻组组距 / 2
缺下限 时,组中值 =上限 -邻组组距 / 2
(一 )概念术语
9.
二、分配数列的编制
(二 )注意事项 **
1.组距 最好为 5或 10的 倍数
2.最小组的下限略低于最小变量值,最大组的上限略高于最大变量值
3.离散型变量 分组,相邻组的 组限可以间断,也可以重叠 ; 连续型变量 分组,相邻组的 组限必须重叠 。
4.组限重叠时,临界点的总体单位按,上限不在内”
的原则归组 。
二、分配数列的编制
(二 )简单次数分布数列的编制步骤数据排序并计算全距确定变量数列的形式(单项式或组距式)
确定组数和组距确定组限计算各组次数和频率绘制表格简单次数分布数列的编制实例
[例 3-1]:数据资料某车间 40名工人日产零件如下:
65 72 66 57 90 86 83 68 75
84 66 59 67 70 79 51 81 54
78 86 94 64 77 74 76 96 62
98 85 71 79 84 65 72 89 75
解题思路
*编制步骤之一 ----数据排序并确定全距将数据从低到高排列,形成如下变量序列:
51 54 57 59 62 64 65 65 66 66
67 68 70 71 72 72 74 75 75 76
76 77 78 78 79 81 83 84 84 84
85 86 86 88 89 90 93 94 96 98
计算全距 =98-51=47
*编制步骤之二 ----确定变量数列的形式因变量值较多、变动幅度较大,适宜采用 组距式数列解题思路
*编制步骤之三 ----确定组数和组距
[分析 ] 全距为 47,分为 5组,组距为 10
*编制步骤之四 ----确定组限
[分析 ] 离散型变量分组,相邻组的组限可以重叠,也可间断,本例选择重叠
*编制步骤之五 ----计算各组的频数和频率
[分析 ] 根据排序后的变量序列清点各数据区间的频数并计算比重,也可利用 excel统计软件进行解题思路编制步骤之六 ----绘制表格表 3-6 某车间工人日产零件分组表日产零件数量(件) 工人数(人) 比重( % )
50 - 60 4 1 0,0 0
60 - 70 8 2 0,0 0
70 - 80 13 3 2,5 0
80 - 90 10 2 5,0 0
90 - 100 5 1 2,5 0
合计 40 1 0 0,0 0
(三)累计次数分布表(图)的编制
1.相关概念
(1)累计次数 和 累计频率反映总体单位分布特征的指标,累计次数 说明总体中在某一变量值水平上下总共包含的总体单位次数;
累计频率 说明总体中在某一变量值水平上下总共包含的总体单位数占总体单位总数的比重 。
(三)累计次数分布表(图)的编制
1.相关概念
(2)累计次数和频率的计算方法向上累计,是将各组的次数和频率,由变量值低的组向高的组累计 。 说明各组 上限以下 包含的总体单位数和比率 。
向下累计,是将各组的次数和频率,由变量值高的组向低的组累计 。 说明各组 下限以上 包含的总体单位数和比率 。
2,累计次数分布表(图)的编 (绘 )制步骤数据排序并计算全距确定变量数列的形式(单项式或组距式)
确定组数和组距确定组限计算各组次数和频率计算各组累计次数和频率编 (绘 )制图表累计次数分布数列的示例表 3-7 某班级学生考试成绩累计次数分组表向上累计 向下累计 按成绩分组(分)
学生人数
(次数)
频率
(%) 次数 频率 次数 频率
50 ~ 60
60 ~ 70
70 ~ 80
80 ~ 90
90 ~ 100
3
8
16
8
5
7.5
20.0
40.0
20.0
12.5
3
11
27
35
40
7.5
27.5
67.5
87.5
100.0
40
37
29
13
5
100.0
92.5
72.5
32.5
12.5
合计 40 100.0 — — — —
二、次数分布
(一 )钟形分布 /丘形分布
1.含义,特点是,两头小,中间大,,越靠近中间的变量值分布次数愈多;愈远离变量值中点分布的次数愈少,
形如钟或山丘正态分布,左右两侧对称分布
2.种类 左偏分布偏态分布右偏分布正态分布 左偏分布 右偏分布
(二 )U形分布,是指较大和较小的变量值出现的次数多,
而中间变量值出现的次数少,特点是,两头大,中间小,。
(三 )J形分布,J形分布的特征是,一边大,一边小,。
即次数随着变量值的变化大多数集中在某一端的分布 。
其曲线形如英文字母的,J”字,具体有 正 J形分布和反
J形分布 两种类型 。
U形分布 正 J形分布 反 J形分布
**思考题,以下现象的次数分布符合哪种分布的特征?
A 人群中身高,体重的分布
B 学生考试成绩的分布
C 按人口年龄分布的死亡率
D 餐饮企业销售额的分布第四节 统计图表一、统计表
( 一 ) 统计表的概念
( 二 ) 统计表的结构
1.从 形式 上看:分为 总标题,横行标题,纵栏标题和 统计数值
2.从 内容 上看:分为 主词 和 宾词
( 三 ) 统计表种类 ( 按主词结构分 )
简单表,主词未做任何分组简单分组表,主词按一个标志分组复合分组表,主词按两个或以上的标志分组
( 四 ) 统计表的编制规则
( 一 ) 统计图的概念
( 二 ) 统计图的种类
1.直方图
2.条形图
3.折线图
4.圆形图
5.其他二、统计图家庭月收入 户数 比率
800 - 1000 5 9.26%
1000 - 1200 7 12.96%
1200 - 1400 10 18.52%
1400 - 1600 13 24.07%
1600 - 1800 8 14.81 %
1800 - 2000 6 11.11%
2000 - 2200 3 5.56%
2200 - 2400 2 3.70%
合计 54 100.00%
统计表示例某居民小区家庭按月收入简单分组表统计图示例条型图 —— 用长短或高矮来显示数值的大小
ò í¥ èù éú ·? ê? è? ′? êy ·? 2? í?
5
7
10
8
6
3
2
13
0
2
4
6
8
10
12
14
ê? è?
§êy
800£ - 1000
1000£ - 1200
1200£ - 1400
1400£ - 1600
1600£ - 1800
1800£ - 2000
2000£ - 2200
2200£ - 2400
统计图示例折线图 —— 将直方图的各条形中点用线连接起来而得到
§êy
5
7
10
13
8
6
3
2
0
2
4
6
8
10
12
14
800£
-
1000
1200£
-
1400
1600£
-
1800
2000£
-
2200
ê? è?
§êy
§êy
统计图示例圆形图 /饼图,是以圆形的分割来表示总体的分组及结构
(某居民小区家庭按月收入分组情况 )
9.26%
12.96%
18.52%
24.07%
14.81%
11.11%
5.56%
3.70%
800-1000
1000-1200
1200-1400
1400-1600
1600-1800
1800-2000
2000-2200
2200-2400
本章小结(一)
一,统计数据整理是统计数据调查的继续和数据分析的前提,是感性认识上升到理性认识的连接点 。 数据整理的前提是审核,分组汇总是核心 。 按品质变量分组的关键是界定各类型组的性质差异,按数值变量分组的关键是正确确定各组的数量界限,即组数与组限 。
二,统计分组必须遵循穷尽性和互斥性两个原则 。 数值变量分组有单项式和组距式两种 。 组距式分组又有离散型与连续型,等距与异距分组之分,对于组距式分组要计算组距,组数,组中值 。
本章小结(二)
三,分配数列 /次数分布数列由两个要素构成,一是组别,二是各组次数或频率 。
根据需要,可以编制 简单次数分布表 和 累计次数分布表 。
四,次数分布主要有 钟形 分布,U形 分布和 J形 分布 。
五,统计表和统计图是显示统计数据的两种重要形式 。 统计表的结构从形式看可分为总标题,横表目,纵标目和指标数值;
从内容上看可分为主词和宾词两部分 。 统计图主要有条形图,直方图,圆形图等 。
测验练习(一)
一,判断
1.能够对统计总体进行分组,是由统计总体中的各单位具有的,同质性,特点决定的 。 ( )
2.统计整理只包括对第一手数据的整理,不包括对第二手数据的整理 。 ( )
3.离散型变量可以作单项式或组距式分组,连续型变量只能作组距式分组。( )
测验练习(二)
二,选择
1,某企业职工分别按性别和技术职称交叉分组,这种分组表属于 ( )
A 按数量标志分组 B 按品质标志分组
C 简单分组 D 复合分组
2.大多数社会经济现象的分布符合 ( )的特征 。
A 正态分布 B U型分布
C 正 J型分布 D 反 J型分布
END