统 计 学
xo
y
主讲 史晓燕 副教授教材 统计学 邱东主编高等教育出版社

f
fxx( 2)
西北工业大学网络教育学院统计学课件
学习统计学的目的和要求:
在理解基本概念的基础上,掌握统计资料的搜集、整理以及分析的方法。重点掌握抽样推断、
动态分析、指数分析、相关与回归分析方法。
统计学内容
第一章 总论
第二章 统计调查
第三章 统计资料整理
第四章 综合指标
第五章 动态数列分析
第六章 指数
第七章 相关与回归分析
第八章 抽样推断
第九章 综合复习
第十章 习题解答
返回第一章 总论
通过本章学习要求学员了解统计学产生与发展的历史,明确统计学的涵义,研究对象等一些基本问题,重点理解统计学中的几个基本概念 。
第一节 统计学的产生和发展
第二节 统计学的基本问题
第三节 统计学中的几个基本概念
返回第一节 统计学的产生与发展一、统计实践活动的产生与发展二、古典统计学时期(十七世纪至十八世纪)
三、近代统计学时期(十八世纪末至十九世纪末)
四、现代统计学时期(二十世纪初至今)
返回一、统计实践活动的产生与发展统计实践活动产生于奴隶社会,当时的统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。封建社会末期,特别是进入资本主义社会以后,
社会生产力迅速发展,统计逐步成为社会分工中的一个独立的部门和专业。同时欧洲出现了一些统计理论著作,标志着统计学的产生。统计学产生后形成不同的学派。
返回二、古典统计学时期(十七世纪至十八世纪)
1,政治算术学
〈 1〉 创始人:威廉,配第
〈 2〉 产生的背景:当时的英国统治阶级为了管理国家,发展经济,争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派 。
〈 3〉 研究方法:从数量方面研究社会经济现象 。
2,国势学派
〈 1〉 创始人:海尔门,康令
〈 2〉 产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派 。
〈 3〉 研究方法:对国家重要事项的记述,几乎完全偏重于 品质方面而忽视了量的分析。 返回三、近代统计学时期(十八世纪末至十九世纪末)
1,数理统计学派
〈 1〉 创始人:阿道夫,凯特勒
〈 2〉 产生的背景,当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派,
〈 3〉 研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。
2,社会统计学派
( 1)创始人:德国的克尼斯
( 2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。
( 3) 研究方法:在对统计资料进行搜集、整理、
分析的基础上,明确现象内部的联系和规律性。
四、现代统计学时期(二十世纪初至今)
(数理统计学和社会统计学)
1、数理统计学这一时期的数理统计学,在深度和广度上都有了迅速的发展,出现了新的分支和边缘科学,成为现代统计学的主流学派。
2,社会统计学这一时期的社会统计学也有所发展,其基本趋势是由实质性科学向方法论科学的转变,但相对缓慢。
3,社会经济统计学在德国社会统计学的影响下,以前苏联为首的社会主义国家逐步建立和发展了社会经济统计学。其理论和方法曾成功地应用于社会主义的计划经济分析。然而由于当时国际意识形态上的对立,这些国家用武断的方法解决学术上的争议,使得统计科学没有按照科学自身的规律不断进步,因此发展缓慢。
4,中国的统计学新中国成立后,输入了苏联的社会经济统计学,虽然曾经发挥了重要作用,但同样进步迟缓。八十年代以后,统计进入了全面改革的新时期,统计方法更加丰富、应用更加广泛,统计学得到了很大的发展。
返回第二节 统计学的基本问题
一、统计学的涵义
统计资料:以文字、图表等形式显示出来,用来说明事物的现状、事物之间的内在联系以及未来发展趋势的数据。
统计工作:
统计工作者搜集、整理、计算分析或推断统计资料的工作过程。
统计学:是一门研究搜集、整理、分析或推断统计资料的方法论性质的科学。
返回
二、统计学的研究对象和性质
统计学的研究对象是社会现象和自然现象的数量方面。
就性质而言,统计学是一门适用于自然现象和社会现象的方法论学科。
三、统计学的内容
(一)描述统计学研究如何搜集、加工处理、显示及计算分析数据的方法。
(二)推断统计学研究如何根据样本数据推断总体数量特此的方法。
四、统计学与其他学科的关系
(一)统计学与数学的关系
1,统计学与数学的联系表现在统计方法以数学知识为基础 。 其共同点是两者都为各学科提供研究和探索客观规律的数量方法 。
2,统计学与数学的区别表现在两方面,一是统计研究的量是有计量单位的具体的量,而数学研究的量是没有量纲的抽象的量 。 二是统计学与数学研究中所使用的逻辑方法不同,统计研究是演绎与归纳的结合,
而数学所使用的是纯粹的演绎 。
(二)统计学与其他学科的关系统计方法是一种数量分析工具,它可以帮助其他学科探索各学科内在的数量规律性。但是对这种数量规律性的解释只能由各学科的研究完成。 返回第三节 统计学中的几个基本概念
一、总体与总体单位
二、标志
三、指标
四、变量
返回一、总体与总体单位(总体)
(一) 总体
1,概念总体是在同一性质基础上结合起来的许多个别事物的整体。
2、种类
( 1)有限总体:总体中的单位数是有限的。( 2)无限总体:总体中的单位数是无限
3、总体的特点
( 1)同质性:构成总体的各个单位至少具有某种相同的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。
( 2)大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。全国所有油田构成的总体,是由许多油田而不是个别油田组成。
( 3) 差异性:构成总体的各个单位在诸多方面是不同的。全国所有油田构 成的总体,虽然经济职能相同,但各油田的规模大小、经济效益、职工人数等是不同的。统计研究就是在大量性和同质性的基础上研究总体的差异性的。
(二) 总体单位构成总体的各个单位称为总体单位。
(三) 总体与总体单位不是固定的
随着研究目的和范围地改变,原来的总体(总体单位)可以变为总体单位(总体)。
返回二、标志
1,概念。
标志是说明总体单位特征的名称。
2,种类
( 1) 品质标志:说明总体单位质的特征,不能用数值表示。如果总体单位是一位学生,性别、籍贯、是否近视等是品质标志。
( 2) 数量标志:说明总体单位量的特征,是用数值表示的。年龄、身高、以百分制表示的学习成绩等是学生这个总体单位的数量标志
返回三、指标
( 一 ) 概念 。 指标是说明总体数量特征的名称及数值 。
( 二 ) 种类
1,数量指标:反映总体绝对数量多少的指标 。 全国所有的人口组成一个总体,2002年末全国总人口 128453万人,是一个数量指标 。 全国所有的工业企业组成一个总体,2002年国内生产总值 102398亿元是一个数量指标 。
其特点是指标数值随总体范围的扩大 ( 缩小 ) 而增大
( 减小 ) 。
2,质量指标:说明总体内部数量关系和总体一般水平的指标,一般表现为相对数和平均数 。 全国所有的人口组成一个总体,2002年全国人口出生率,性别比例,平均年龄是质量指标 。 其特点是指标数值大小不随总体范围的变化而增减 。
(三)指标体系
1,概念
具有内在联系的一系列指标构成的整体称为指标体系 。
2,表现形式
( 1) 以数学公式表现出来的指标体系,如:销售额
= 销售量 ×销售价格
( 2) 指标之间仅存在一种间接的相互依存关系,如衡量企业经济效益的若干指标所构成的指标体系 。
返回
(四) 指标与标志的关系
1,区别:
( 1)指标是说明总体特征的,标志是说明总体单位特征的。
( 2)指标都是用数值表示的,标志有用数值表示的和不用数值表示的。
2,联系:
( 1)综合关系,指标数值是总体单位的数量值综合而来的。
( 2)转换关系,由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标)
四、变量
1,概念
变量是可变的数量标志 。
2,种类
( 1) 按数值表现形式的不同,有只能用整数表示的离散型变量 ( 人数,企业数等 ) 和可以取任意小数的连续型变量 ( 销售额,身高等 ) 。
( 2) 按变量所受影响因素的不同,有影响因素是明确的,可以解释的确定性变量和影响因素是不确定的随机变量 。
返回第二章 统计调查
第一节 统计调查方式
第二节 统计调查的具体方法
第三节 统计调查方案返回第一节 统计调查方式一、统计报表
( 一 ) 概念:统计报表是按照国家有关法规的规定,自上而下统一布置,自下而上地逐级提供基本统计数据的一种调查方式 。
( 二 ) 种类,1,按报送范围不同,有要求调查对象中每个单位都填报的全面报表和只要求调查对象中的一部分单位填报的非全面报表 。 2、
按报送的周期不同,有日报,月报,季报,年报等 。 3,按报表的内容和性质不同,有国家统计报表,部门统计报表,地方统计报表 。
二、普查
( 一 ) 概念:普查是为某一特定目的而专门组织的一次性全面调查 。
( 二 ) 特点,1,普查通常是一次性或周期性的 。
2,普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏 。 标准时间一般定在调查对象比较集中,变动相对较小的时间上 。
3 普查数据一般比较准确,规范化程度也较高 。
4,普查的适用对象比较狭窄,只能调查一些最基本,最一般的现象 。
三,抽样调查
抽样调查是从总体中随机抽取一部分单位进行调查,根据其调查结果推断总体数量特征的一种非全面调查方法 。
四,重点调查
重点调查是从全部单位中选择少数重点单位进行调查,以了解总体的基本情况 。
五,典型调查
是从研究对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查,用来揭示同类事物的本质规律性 。
返回第二节 统计调查的具体方法
一、观察法
调查者通过实际观察事情发生的经过和结果,得到自己所需要的资料。
二、询问法
调查者采用各种询问的方式向被调查者了解情况的一种方法。有( 1)面谈询问法( 2)邮寄法( 3)留置问卷法( 4)电话法
三、实验法
控制一个或几个变量,调查另外一个市场变量有关资料的方法。
四、报告法
被调查单位按照统一要求和表格形式,向有关部门提供统计资料的方法。 返回第三节 统计调查方案
一、确定调查目的
调查研究所要达到的具体目标,解决的问题,具有的社会经济意义。
二、确定调查对象、调查单位和报告单位
( 1)调查对象:根据调查目的所确定的调查研究的总体。( 2)调查单位:构成调查对象的每个单位。
( 3)报告单位:负责报告调查内容的单位。
返回
三、确定调查内容
调查内容一般调查表或问卷的形式出现。( 1)调查表有单一表和一览表。( 2)问卷是一种特殊的调查表,其内容是由一系列问句所构成的。问卷通常由说明词、主题问句、作业记录三部分组成。其中主题问句中的问句有开放式、对选式、多项选择式、顺位式等形式。
四、确定调查时间
包括时期资料所属的时期、时点资料所属的时点和调查工作的期限。
五、其他事项
包括调查所采用的方法、组织和实施的具体细则等事项。
返回第三章 统计资料整理
通过本章的学习了解对原始资料进行加工的基本方法,重点掌握统计分组的方法和次数分布表的编制。
第一节 统计资料的预处理
第二节 统计分组
第三节 次数分布
第四节 统计表
返回第一节 统计资料的预处理一,资料的审核原始资料二手资料完整性准确性逻辑检查计算检查适用时效二、资料的排序第二节 统计分组
一、按分组标志个数不同
1、简单分组
2、复合分组
二、按分组标志性质不同
1、按品质标志分组
2、按数量标志分组返回一、按分组标志个数不同
1、简单分组
把总体只按一个标志分组。
2、复合分组
对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以 同时选择学科、学制,性别三个标志对某学院全体在校学生这个总体 进行分组。
返回举例,
理科学生组 文科学生组
本科学生组 本科学生组
男学生组 男学生组
女学生组 女学生组
专科学生组 专科学生组
男学生组 男学生组
女学生组 女学生组二、按分组标志性质不同
(一)按品质标志分组
(二)按数量标志分组
1、单项式分组:一个变量值表示
一个组的分组。适用于离散型变量
且变量的取值不多。例如,职工家
庭人口数,其取值不可能很多,且
每一个取值都可视为一种类型:
按家庭人口数分组
1人
2人
3人
4人
5人
6人
2、组距式分组
凡是用一定范围内的两个变量值表示一个组的分组。适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。
1)连续型变量的组距式分组如对商店按销售额进行分组,
按销售额分组 (万元 )
50以下
50— 200
200— 400
400— 600
600— 800
800以上
2)离散型变量的组距式分组
如对某企业的 20生产小组按人数分组:
生产小组按人数分组(人)
5— 10
11— 16
17— 22
3)组距式分组中的有关问题
( 1)等距分组和异距分组
( 2)开口组和闭口组
( 3)上限、下限、组距
(4) (闭口组 )
(缺上限的开口组)
(缺下限的开口组)
返回
2
上限下限组中值
2
邻组组距下限组中值
2
邻组组距上限组中值
第三节 次数分布
一、次数分布的概念
在统计分组的基础上将总体的所有单位按组归类,
并把所有的组及其单位数按一定顺序排列起来,用以反映总体单位在各组的分布状况。
二、次数分布的表示
(一)列表法
(二)图示法
三、次数分布的主要类型
四、次数分布的编制
返回二、次数分布的表示
(一)列表法
1、某高校学生性别分布表性 别 人 数(人) 频 率( %)
男 732 57.14
女 549 42.86
合 计 1281 100.00
2、某厂工人日产量分布表按日产量分组
(件)
工人数(人) 比 率( %)
9 12 4.00
10 38 12.67
11 65 21.67
12 85 28.33
13 60 20.00
14 30 10.00
15 10 3.33
合 计 300 100.00
3、某班学生按考试成绩分组按成绩分组
(分)
人数(人) 比率( %)
60以下 7 8.8
60— 70 21 26.2
70— 80 25 31.2
80— 90 19 23.8
90以上 8 10.0
合 计 80 100.0
(二 )图示法 1、直方图
(1)单式直方图
2002年我国旅客周转量 (亿人公里 )
0
2000
4000
6000
8000
ìú ì· ììì· ììì· ìììì
í?ü ×a á?
(2)复式直方图
1998— 2002年我国进出口总额 (亿美元 )
0
1000
2000
3000
4000
1998 1999 2000 2001 2002
ú

2、折线图
0
20
40
60
80
100
í? 1
3、曲线图
0
20
40
60
80
100
ú í?
返回三、次数分布的主要类型
1、钟型分布
(1)对称的钟型分布
0
20
40
60
80
100
9 10 11 12 13 14 15
ìììì( ìì)
日产量 (件 )
(2)左偏分布
0
20
40
60
80
100
4 9 10 11 12 13 14
ìììì( ìì)
日产量
(件 )
(3)右偏分布
0
20
40
60
80
100
10 11 12 13 14 15 19
ìììì( ìì)
日产量
(件 )
2、U型分布
0
10
20
30
40
50
ì
¤ì
×
ì
ù
ì
à
ì
ìì
ê
ì
ìì
ê
ì
ì
ì
ìì
ê
ì
ì
ìììììì( % )
3,J型分布 (1)
0
20
40
60
80
100
120
ìè ìó ìì
价格返回
J型分布(2)
0
20
40
60
80
100
ìììììì
价格四、次数分布的编制
例如,某生产车间 50名工人日加工零件数如下:
117 122 124 129 139 107
117 130 122 125 108 131
125 117 122 133 126 122
118 108 110 118 123 126
133 134 127 123 118 112
112 134 127 123 119 113
120 123 127 135 137 114
120 128 124 115 139 128
124 121
编制过程
首先,对上面的数据进行排序
107 108 108 110 112 112 113
114 115 117 117 117 118 118
118 119 120 120 121 122 122
122 122 123 123 123 123 124
124 124 125 125 126 126 127
127 127 128 128 129 130 131
133 133 134 134 135 137 139
139
第二步,确定组数和组距 组数 =4
组距可以根据(最大值 -最小值) ÷组数 =8来确定,
组距 =10
第三步,计算各组次数、频率及累计次数、频率
50名工人日产零件数次数分布表按零件数分组次数 频率
( %)
向上累计 向下累计次数 频率
( %)
次数 频率
( %)
110
以下
3 6 3 6 50 100
110

120
13 26 16 32 42 84
120

130
24 48 40 80 20 40
130

10 20 50 100 4 8 返回第四节 统计表
一、统计表的结构
(一)外形结构:总标题、横标题、纵标题、数字资料
(二)内容结构:主词、宾词二、统计表的种类
(一)简单表
(二)分组表
(三)复合表返回一、统计表的结构我国 2002年国内生产总值按三次产业分 国内生产总值
(亿元)
比上年增长率 (%)
第一产业 14883 2.9
第二产业 52982 9.9
第三产业 34522 7.3
合 计 102398 8.0
横标题纵标题数字资料主 词 宾 词二、统计表的种类
(一)简单表 1、我国三个城市的人口数
(1990年 7月 1日 0时 )
城 市 人口数 (人 ) 较 1982年 7月 1
日 0时增长 %
北京市 10819407 17.21
天津市 8785402 13.15
上海市 13341896 12.50
2、我国199 8-2002拥有电话户数
(万户 )
年份 固定电话 移动电话
1998 8742 2386
1999 10872 4330
2000 14483 8453
2001 18037 14522
2002 21442 20662
(二)分组表(见表的结构) 返回
(三)复合表某年末某地区人口资料按城乡及性别分组人口数(万人) 增长率(%)
(与上年比)
城镇人口男性人口女性人口农村人口男性人口女性人口合 计 返回第四章 综合指标
通过本章的学习,要求学员在理解总量指标、
相对指标、平均指标、变异指标概念的基础上,
重点掌握各种指标的计算方法。
第一节 总量指标
第二节 相对指标
第三节 平均指标
第四节 变异指标
返回第一节 总量指标
一、总量指标的概念
总量指标是反映总体的总规模和总水平的综合指标。
二、总量指标的计量单位
1、实物单位自然单位度量衡单位简单单位双重单位复合单位2、货币单位
3、劳动单位(工时、工日)
三、总量指标的种类
(一)按其所反映的内容不同
1、总体单位总量指标:反映总体中单位数多少的。
2、总体标志总量指标:是反映总体中某种数量标志值总和的。
(二)按其所反映的时间状况不同
1、时期指标:反映现象在某一段时期内的总量。
2、时点指标:反映现象在某一时刻上的总量。
(三)按计量单位的不同
1、实物量指标
2、价值量指标
3、劳动量指标
返回第二节 相对指标
一、相对指标的概念
二、相对指标的表现形式
三、相对指标的种类及计算
(一)结构、比例相对指标
(二)比较、动态相对指标
(三)强度相对指标
(四)计划完成相对指标
返回
一、相对指标的概念
用对比的方法反映某些相关事物之间数量联系程度的指标。
二、相对指标的表现形式
(一)名数
(二)无名数
1、系数和倍数
2、成数
3、百分数
4、千分数
返回三、相对指标的种类及计算(结构、比例)
%1 0 0 总体中全部数值总体中的部分数值结构相对指标
%1 0 0 总体中另一部分数值总体中某一部分数值比例相对指标女生人数男生人数总人数男生人数如,
如,
(一 )
(二 )
另一条件下的同类数值某条件下的某类数值比较相对指标三?)(
大庆油田原油产量长庆油田原油产量如,
%1 0 0) 基期数值报告期数值动态相对指标(四年国内生产总值年国内生产总值如
2001
2002:
返回
(五 )强度相对指标
1、基本公式的指标数值另一有联系但性质不同某一指标数值?
2、作用
( 1)反映现象的强弱程度如,
( 2)反映现象的密度如:
( 3)反映现象的经济效益如,返回销售收入流通费用总额流通费用率?( % )
平均人数国内生产总值人均国内生产总值?
)()(
)(
千人人口数地全国商业机构数地全国商业网密度?
(六)计划完成相对指标
1、基本公式
2、短期计划的检查
( 1)计划任务数为绝对数
某企业计划规定本年度销售收入达到 1000万元,
实际为 950万元,计划完成相对指标为
%100 计划数实际完成数计划完成相对指标
%10 0 计划绝对水平实际绝对水平计划完成相对指标
%951 0 0 0950?
( 2)计划任务数为平均数
某企业计划某种产品单位成本为 50元,实际为 45元,计划完成相对指标为
%10 0 计划平均水平实际平均水平计划完成相对指标
%905045?
( 3)计划数为相对数
某企业计划劳动生产率今年比去年提高 10%,实际提高了 15%。计划完成相对指标为
(正指标)
某企业计划某种产品成本今年比去年降低 5%,实际降低了 6%。计划完成相对指标为
(逆指标)
%1 0 0%% 计划规定实际完成计划完成相对指标
%5.104%110%115?
%95.98%95%94?
3、中长期计划任务的检查
( 1)水平法:
当计划任务是以计划期期末(最后一年)应达到的水平下达的,检查计划执行情况用水平法。
确定提前完成计划的时间:如果计划期内有连续一年的实际数,达到计划规定最后一年应达到的水平,
后面所余的时间就是提前完成计划的时间。
%1 0 0 平计划任务规定的期末水 水平计划期期末实际达到的计划完成相对指标
( 2)累计法
当计划任务是以计划期全期累计应达到的水平下达的,
检查计划执行情况用累计法。
确定提前完成计划的时间:从计划期开始至某一时间所累计完成的实际数达到了计划规定的累计数,以后的时间就是提前完成计划的时间。
返回
%1 0 0 计划规定全期累计数 数计划全期实际完成累计计划完成相对指标第三节 平均指标
平均指标(平均数)是反映现象的一般水平或平均水平的指标。它具有代表性和抽象性。根据掌握资料、研究目的及现象性质不同,有多种计算方法。重点掌握,H,G。
一、算术平均数
二、调和平均数
三、几何平均数
四、中位数
五、众数
六、切尾平均数和温氏化平均数
七、各种平均数的比较
返回
x
一、算术平均数( )
(一)简单 算术平均数
(二)加权算术平均数
1、根据单项数列计算的
2、根据组距数列计算的
3、用比重权数计算的加权算术平均数
4、根据相对数(平均数)计算的加权
5、是非标志的平均数
(三) 的数学性质
(四) 的应用条件
返回
x
x
x
x
(一)简单算术平均数计算公式,
应用条件:资料未分组,各组出现的次数都是 1。
举例,5名学生的学习成绩分别为,75,91、
64,53,82。则平均成绩为:
返回
n
x
n
xxxxx n321
分平均成绩 7353 6 558253649075
(二)加权算术平均数
1、根据单项数列计算的
计算公式:
应用条件:单项式分组,各组次数不同。
fxff fxfxfxfxx nn332211
举例
某车间 20名工人加工某种零件资料:
按日产量分组
(件) x
工人数(人)
f
日产总量 xf
14 2 28
15 4 60
16 8 128
17 5 85
18 1 18
合计 20 319
件平均日产量
16
20
3 1 9
返回
2、根据组距数列计算的应用条件:组距式分组,各组次数不同。
举例:某车间 200名工人日产量资料:
按日产量分组
(公斤)
工人数 f 组中值 x 日产总量 xf
20— 30 10 25 250
30— 40 70 35 2450
40— 50 90 45 4150
50— 60 30 55 1650
合 计 200 — 8400
公斤平均日产量
42
200
8 4 0 0
返回
3、由比重权数计算的
应用条件:已知的是比重权数(次数是比重)
公式:
举例:(仍用上例)

ffxffxffxffxffxx nn332211
按日产量分组(公斤)
人数比重
( %)
组中值 x
20— 30 5 25
30— 40 35 35
40— 50 45 45
50— 60 15 55
ff
)(42
%1555%4545
%3535%525
公斤平均日产量


返回
4、根据相对数(平均数)计算的加权
( 1)根据相对数计算的
某局所属的三个企业的资料:
x
企业 产值计划完成 %
x
计划产值(万元) f
实际产值(万元) xf
甲 95 300 285
乙 105 900 945
丙 115 300 345
合 计 — 1500 1575
%105
1500
1575
)f(
)xf(
%
计划产值实际产值平均计划完成
( 2)根据平均数计算的
某企业各班组工人劳动生产率资料,
班组平均劳动生产率 x
实际工时
f
产品产量
(件 ) xf
一 10 100 1000
二 12 200 2400
三 15 300 4500
四 20 300 6000
五 30 200 6000
合计 — 1100 19900
)(09.18
1100
19900
)f(
)xf(
工时件车间实际工时车间产品产量平均劳动生产率
返回
5、是非标志的平均数
是非标志,如果按照某种标志把总体只能分为具有某种特征的单位和不具有该种特征的单位两部分,这个标志就是是非标志。
平均数的计算:把具有某种特征的用,1”表示,不具有该种特征的用,0”表示。
是非标志
x
单位数 f 比重
1
0
合 计 N 1
0N
1N
ff
pNN 1?
qNN 0? P
N
N0N1
f
xf
x
01

是返回
(三)算术平均数的数学性质
1、各个变量值与其平均数离差之和等于零
2、各个变量值与其平均数离差平方之和为最小值
0xx
最小值 2xx
0f)xx(
最小值 fxx 2
xx?0设 cxx0


22
22
2
22
0
)(
)(2)(
)(
)()(
ncxx
ncxxcxx
cxx
cxxxx






为最小值2
22
0
2
)(
)()(
0



xx
xxxx
nc?
性质 (3,4)
3、给每个变量值增加或减少一个任意数 A,则算术平均数也相应增增加或减少这个任意数 A。
4、给每个变量值乘以或除以一个任意数 A,则算术平均数也相应扩大或缩小 A倍。
Ax
n
Ax Ax
f
fAx
xAnAx xA1nA
x
xAfAx f?
x
A
1
f
fAx
返回
(四)算术平均数的适用范围
1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分母资料,在这种情况下,
反映现象的平均水平用算术平均数。
2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,
而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。
返回二、调和平均数( H)
(一 )简单调和平均数
计算公式,
应用条件:资料未分组,各个变量值次数都是 1。
举例,一个人步行两里,走第一里时速度为每小时候 10里,走第二里时为每小时 20里,则平均速度为:

x
1
x
1
x
1
x
1
x
1
nnH
n321
)(31132
20
1
10
1 小时里?
(二)加权调和平均数
计算公式:
应用条件:资料经过分组,各组次数不同。
例 1:


x
m
n
n
3
3
2
2
x
m
n321 m
x
m
x
m
x
m
mmmm
H
1
1
速度
x
行走里程
m
所需时间
20 1
15 2
10 3
合计 6
)( 小时里
xm
201
152
103
103152201
)(
29
12
12
6
10
3
15
2
20
1
小时里平均速度

例 2
按日产量分组(件) x
日产总量
m
工人数(人)
14 28 2
15 60 4
16 128 8
17 85 5
18 18 1
合计 319 20
xm
已 知
)(16
20
319
件平均日产量
例 3
某局所属的三个企业的资料:
企业 产值计划完成 %
x
计划产值(万元)
实际产值(万元) m
甲 95 300 285
乙 105 900 945
丙 115 300 345
合 计 — 1500 1575
xm
已知 已知
%1 0 5
1 5 0 0
1 5 7 5
)(
)m(
%
x
m
计划产值实际产值平均计划完成例 4
某车间各班组工人劳动生产率资料,
班组平均劳动生产率 x
实际工时产品产量 (件 )
m
一 10 100 1000
二 12 200 2400
三 15 300 4500
四 20 300 6000
五 30 200 6000
合计 — 1100 19900
xm
已知 已知
)(09.18
1 1 0 0
1 9 9 0 0
)
x
m
(
)m(
工时件车间实际工时车间产品产量平均劳动生产率
返回
(三)调和平均数的适用范围
1,当变量值是绝对数时,变量值之间是和的关系,而且已知的是分子资料,在这种情况下,
反映现象的平均水平用调和平均数。
2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,
而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。
返回三、几何平均数( G)
(一)简单几何平均数
计算公式:
应用条件:资料未分组(各变量值次数都是 1)。
举例:某企业生产某种产品需经过三个连续作业车间才能完成。
nn n321 xxxxxG
车间 投入量 产出量 合格率
% x
一 1000 800 80
二 800 720 90
三 720 504 70
33 %450%70%90%80三个车间平均合格率
1 0 0 0
5 0 4
7 2 0
5 0 4
8 0 0
7 2 0
1 0 0 0
8 0 0
%70%90%80


(二)加权几何平均数
计算公式:
应用条件:资料经过分组,各组次数不同。
举例:将一笔钱存入银行,存期 10年,以复利计息,10年的利率分配是第 1年至第 2年为 5%、第 3年至 5年为 8%、
第 6年至第 8年为 10%、第 9年至第 10年 12%,计算平均年利率 设本金为
f ff fnf3f2f1 xxxxxG n321
0x
年份 累计存款额 本利率 %
第 1年 105%
第 2年 105%
第 3年 108%
… … …
第 10年 112%
%105%5 000 xxx
2000 %1 0 5%5%1 0 5%1 0 5 xxx
%1 0 8%1 0 5%8%1 0 5%1 0 5 202020 xxx
23320 %112%110%108%105x
%77108
%112%110%108%105
10 2332


平均本利率本利率 x 年数 f
105% 2
108% 3
110% 3
112% 2
合 计 10
平均年利率 =8.77%
(三 )几何平均数的适用范围
当变量值是相对数,而且变量值之间存在连乘关系,反映现象的一般水平用几何平均数。
返回四、中位数( )
把某一标志值按大小顺序排列起来居于中间位置的那个数就是中位数。
(一)由未分组资料确定中位数
1、标志值的个数是奇数
例,7名工人生产某种产品,日产量(件)分别为
4,6,6,8,9,12,14。位于中间位置的第四名
( )工人的日产量 8件为中位数。
2、标志值的个数是偶数
上例增加为 8名工人,日产量为 4,6,6,8,9、
12,13,14。中位数为,其位
置在第四和第五名中间 ( )
em
)(58298 件
4217
54218
(二)由单项数列确定中位数
例:
中位数为第 40 名和 41名日产量的平均值
[ ]
按日产量分组
(件) x
工人数
(人) f
累计次数向上累计向下累计
20 10 10 80
22 15 25 70
24 30 55 55
26 25 80 25
合计 80 — —
)(2422424 件
(三)由组距数列确定中位数
1、计算公式
)(d
f
s
lm
e
e
e
e m
m
1m2
f
me 下限公式?

)(d
f
s
um
e
e
e
e m
m
1m2
f
me 上限公式?

2、举例年人均纯收入
(千元)
农户数
(户)
向上累计次数
5以下 240 240
5— 6 480 720
6— 7 1100 1820
7— 8 700 2520
8— 9 320 2840
9以上 160 3000
合计 3000 —
)(7161
1100
720
2
3000
6 千元
em 返回
(1)计算累计次数
(2)确定中位数组 (6— 7)
(3)确定中位数数值
1500-720=780(户 )
6 X 7
1 780 1100
1500230002 f
em
1100 1
780 X
五、众数( )
总体中出现次数最多的标志值是众数。
(一)由未分组资料确定众数
例,7名工人日产量(件)为 4,5,6,6,6,7,8。
则众数是 6。
(二)由单项数列确定众数
0m
按日产量分组(件)
工人数
(人)
20 15
21 30
22 20
23 10
)(21m o 件?
(三)由组距数列确定众数
1、计算公式:
)(d)ff()ff(
ff
lm
0
0000
00
0 m
1mm1mm
1mm
m0 下限公式



)(d)ff()ff(
ff
um
0
0000
00
0 m
1mm1mm
1mm
m0 上限公式



2、举例年人均纯收入(千元)
农户数(户)
5以下 240
5— 6 480
6— 7 1100
7— 8 700
8— 9 320
9以上 160
合计 3000
( 1)确定众数组
( 6— 7)
( 2)计算众数
L x u
)(6161)7001100()4801100( 480110060 千元m
返回
0m
lu
x
ffff
ff
mmmm
mm o

)()(
2010
1
1)7001100()4801100(
4801100 x?

六、切尾平均数和温氏化平均数
( 一)切尾平均数
将变量值两端的个别极值切去,对中间的变量值进行平均。
(二)温氏化平均数
1、四分位数:将数值由小到大排列,分成四等份,得到三个分割点,每个分割点对应的数值是四分位数。
在 处,在 处,在 处。
例:流行歌比赛中,11名评委对某歌手的打分分别为 8.0
9.0 9.1 9.2 9.2 9.3 9.4 9.4 9.4 9.5 9.8
在 处,在 处在 处
2、温氏化平均数
1Q 2Q 3Q41?n 4)1(2?n 4)1(3?n
1Q 2Q
3Q
34111 1.91?Q 62111
3.92?Q 94)111(3 4.93Q
)(27911 54939229319 分x
返回六、各种平均数的比较
(一)各种平均数的特点及应用场合
是就全部数据计算的,具有优良的数学性质,
实际中应用最为广泛。其主要缺点是易受极端值的影响,对偏态分布其代表性较差。
H主要用于不能直接计算 的数据易受极端值的影响。
G主要用于计算比率数据的平均数,易受极端值的影响。
不受极端值大小的影响,对偏态分布其代表性较 好。但不是根据所有的变量值计算的,
不受极端值的影响,对偏态分布其代表性较好,但不是根据所有的变量值计算的,
x
x
em
x
0m
(二) 的关系x em 0m
x em 0m xem0m0e mmx
对称分布 左偏分布 右偏分布返回第四节 变异指标
变异指标是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。
一、绝对数形式
(一)全距
(二)平均差
(三)标准差
(四)适用条件
二、相对数形式
返回一、绝对数形式的变异指标
(一)全距( R)
公式,R =最大值 — 最小值
优点:计算简便
缺点:易受极端值的影响
举例,5名学生的成绩为 50,69,76,88,97
则 R=97-50=47
(二)平均差( A.D)
1、简单平均差
公式:
应用条件:资料未分组,各变量值出现的次数为 1。
举例,5名工人日产量资料
n
xxDA
日产量 (件 )
20 3
22 1
23 0
24 1
26 3
合计 8
xx?
)(235 2624232220x 件
)(6158DA 件
2、加权平均差
公式:
应用条件:资料经过分组,各组次数不同。
举例:前例,

f
fxxDA
按日产量分组(公斤)
工人数
f
组中值 x
20— 30 10 25 170
30— 40 70 35 490
40— 50 90 45 270
50— 60 30 55 390
合 计 200 — 1320
)(42x 公斤?
fxx?
公斤)(66
2 0 0
1 3 2 0
DA


3、平均差的优缺点
优点:平均差是根据全部数值计算的,受极端值影响较全距小。
缺点:由于采取绝对值的方法消除离差的正负号,应用较少。
返回
(三)标准差( )
1、简单标准差
公式:
应用条件:资料未分组,各组次数都是 1。
举例:前例,
n
)xx( 2
日产量(件)
20 9
22 1
23 0
24 1
26 9
合计 20
2)xx(?
)(23x 件?
)(2520 件σ
2、加权标准差
公式:
应用条件:资料经过分组,各组次数不同。
举例:前例,

f
f)xx( 2
)(42x 公斤?
日产量
(公斤)
工人数
f
组中值
x
20— 30 10 25 2880
30— 40 70 35 3430
40— 50 90 45 810
50— 60 30 55 5070
合 计 200 — 12190
f)xx( 2?
)(817
9560
200
1 2 1 9 0
公斤


3、是非标志的标准差
如前:是非标志的平均数为 P。
标志值 x 单位数 f
1
0
合计 N
f)xx( 2?
1N
0N
12 N)P1(?
02 N)P0(?
)P1(P
N
NPN)P1(
0
2
1
2



由于标准差有良好的数学性质,相比较而言,
它的应用最为广泛。
返回
(四)绝对数形式变异指标的适用条件
当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的代表性,用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。
返回二、相对数形式的变异指标
公式:有全距系数、平均差系数和标准差系数,应用最广泛的是标准差系数,其公式为:
举例:甲组日产量(件)为,60 65 70 75 80。
乙组日产量(台)为,2 5 7 9 12。
%10 0xv
组别 平均数 标准差 标准差系数 %
甲 70(件) 7.07(件 ) 10.1
乙 7(台) 3.41(台 ) 48.7
相对数形式变异指标的适用条件
当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平的代表性,用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。
返回第五章 动态数列分析
本章主要介绍如何根据动态数列进行动态分析,
动态分析包括两方面,一是计算各种动态分析指标,反映现象在某一段时期内发展变化的水平和速度。二是测定现象发展变化的规律性,
对未来状况作出预测。重点掌握动态分析指标。
第一节 动态数列的概念和种类
第二节 动态分析指标
第三节 动态数列的趋势分析
返回第一节 动态数列的概念和种类
一、概念
将一系列指标数值按时间先后顺序排列起来所形成的数列。
二、种类
(一)绝对数动态数列
时期数列
时点数列
(二)相对数动态数列
(三)平均数动态数列返回第二节 动态分析指标
一、动态分析的水平指标
(一)发展水平
(二)平均发展水平二、动态分析的速度指标
(一)增长量
(二)平均增长量
(三)发展速度
(四)增长速度
(五)增长 1%的绝对值
(六)平均发展速度和平均增长速度返回一、动态分析的水平指标
(一)发展水平
是动态数列中每一项具体的指标数值。
假如动态数列为:
叫最初水平,叫最末水平。
0a 1a 2a 1na? na
0a na
(二)平均发展水平
1、根据绝对数动态数列计算的
<1> 根据时期数列计算的
<2> 根据时点数列计算的
①根据连续性时点数列计算的
间隔相等 间隔不等
②根据间断性时点数列计算的
间隔相等 间隔不等
2、根据相对数动态数列计算的
3、根据平均数动态数列计算的
1、根据绝对数动态数列计算的
〈 1〉 根据时期数列计算的
例,1998-2002年我国国内生产总值(亿元)为
78345 82067 89442 95933 102398,则
平均国内生产总值为
n
aa
亿元)(8 9 6 3 7
5
4 4 8 1 8 5
5
1 0 2 3 9 89 5 9 3 38 9 4 4 28 2 0 6 77 8 3 4 5
a


〈 2〉 根据时点数列计算的
① 连续性时点数列
某养猪场 1— 5日生猪存栏头数为 1300 1400 1550
1550 1600则平均生猪存栏头数为
( 1300+1400+1550+1550+1600) ÷5=1480(头)
某商品价格自 4月 11日起从
70元降为 50元,4月份平均价格
)(n aa 间隔相等
(间隔不等)

f
afa
(元)57
30
20501070
a

返回
② 间断性时点数列
间隔相等
4月份平均库存额 =
5月份平均库存额 =
6月份平均库存额 =
第二季度的平均库存额
1n
2
aaa
2
a
a
n
1n2
1


日期 3.31 4.30 5.31 6.30
库存额(万元) 20 16 18 17.6
)(6.17
3
2
6.171816
2
20
a 万元?

1821620
1721816
817261718
间隔不等

f
f
2
aaf
2
aaf
2
aa
a
n
n1n
2
32
1
21?
日期 12.31 1.31 3.31 6.30
人数 1000 1050 1070 1100
返回
1月份 平均人数 =
1025210501000
2,3月份 平均人数 = 1060210701050
4,5,6月份 平均人数 = 1085211001070
1 0 6 7
6
321 1 0 01 0 7 0221 0 7 01 0 5 0121 0 5 01 0 0 0

a
2、根据相对数动态数列计算的平均发展水平
<1>基本公式
<2>由两个时期数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平
<3>由两个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平
①由两个连续性时点数列
②由两个间断性时点数列
<4>由 1个时期和 1个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平
返回
b
ac?
<2>由两个时期数列各对应指标的比值所形成的
平均计划完成 %
)ab(
b
a
n
b
n
a
b
ac 已知
)bc(bbcc 已知
)ac(
a
c
1
ac 已知
10月 11月 12月实际产量 (吨 )a 500 618 735
计划产量 (吨 )b 500 600 700
计划完成 %c 100 103 105
7 0 06 0 05 0 0
7 3 56 1 85 0 0c


700600500
%105700%103600%100500c


%105735%103618%100500
735618500c


返回
<2>由两个时点数列各对应指标的比值所形成的
①由两个连续性时点数列
间隔相等 (公式同时期 )
间隔不等平均非生产人员 %

bf
af
f
bf
f
af
b
ac
日期 1.1-2.9 2.10-3.4 3.5-3.31
全部人数 b 100 110 105
非生产人数 a 25 26 24
非生产人员 %c 25 24 23
间隔日数 f 40 23 27
%98.23271052311025100 272423264025c
返回
② 由两个间断性时点数列
间隔相等平均生产工人 %
间隔不等
2
bbb
2
b
2
aaa
2
a
b
a
c
n
1n2
1
n
1n2
1



日期 1月末 2月末 3月末 4月末生产工人数 a 435 452 462 576
全部工人数 b 580 580 600 720
生产工人 %c 75 78 77 80
%5.77
2
7 2 06 0 05 8 0
2
5 8 0
2
5 7 64 6 24 5 2
2
4 3 5
c?


1n
n1n
2
32
1
21
1n
n1n
2
32
1
21
f
2
bb
f
2
bb
f
2
bb
f
2
aa
f
2
aa
f
2
aa
c


返回
<4>1个时期和 1个时点数列各对应指标比值形成的
第四季度平均每人增加值
2
bb
2
b
a
b
ac
n21

日期 9月 10月 11月 12月工业增加值 (万元 )a 32 34 36
月末人数 b 600 612 618 630
26 3 06 1 86 1 226 0 0
363432c


返回
3、根据平均数动态数列计算的平均发展水平
<1>根据一般平均数计算的
第一季度人均工资 bac?
日期 上 12月 1月 2月 3月工资总额 (万元 )a 12.5 12.8 13.2
月末人数 b 200 215 220 240
2
2 4 02 2 02 1 5
2
2 0 0
2.138.125.12
2
b
bb
2
b
a
c
n
1n2
1



<2>根据序时平均数组成的平均数动态数列
例 1:已知各季平均人数为 351 353 352 350则全年平均人数为
例 2:某企业人数,1月份平均 452,2,3月平均 455,
第二季度平均每月 458,则上半年平均人数为
4
3 5 03 5 23 5 33 5 1
6
345824551451
返回二、动态分析的速度指标 (一)增长量
1、公式:增长量 =报告期水平 — 基期水平
2、种类:累计增长量 =报告期水平 — 最初水平
逐期增长量 =报告期水平 — 前期水平
3、关系:逐期增长量之和等于相应时期累计增长量
相邻两个 累计增长量之差等于相应时期逐期增长量
01 aa? 12 aa? 23 aa 1nn aa
01 aa? 02 aa? 03 aa 0n aa?
0n1nn231201 aaaaaaaaaa
1nn01n0n aa)aa()aa( 返回
(二)平均增长量逐期增长量个数逐期增长量之和平均增长量?
n
aa
n
aaaaaa
0n
1nn1201


平均增长量返回
(三)发展速度
1、公式:
2、种类:
3、关系基期水平报告期水平发展速度?
定基发展速度
0
1
a
a
1
2
a
a
2
3
a
a
0
2
a
a
0
3
a
a
1n
n
a
a
0
n
a
a
0
1
a
a环比发展速度
0
n
1n
n
1
2
0
1
a
a
a
a
a
a
a
a

1n
n
0
1n
0
n
a
a
a
a
a
a

返回
(四)增长速度
1、公式
2、种类
定基增长速度
环比增长速度
3、关系
增长速度 =发展速度 -1
返回基期水平增长量增长速度?
0
01
a
aa?
0
02
a
aa
0
0n
a
aa?
0
01
a
aa?
1
12
a
aa?
1n
1nn
a
aa

(五)增长 1%的绝对值
指报告期比基期每增长幅度 1%所包含的绝对量。
公式
思路
100( % )%1
基期水平增长速度增长量的绝对值增长
增长速度( %) 增长量
1% x(增长 1%绝对值)
返回
(六)平均发展速度和平均增长速度 ( =平均发展速度 -
1)
1、几何平均法
这种方法适宜于如产量、总值等水平指标平均发展速度的计算。
例 某地区 1995— 2000年粮食产量(万吨)资料如已知各年产量分别为 320 332 340 356 380 395则
如已知各年的发展速度为 104% 102% 105% 107% 104%则
如已知 2000年是 1995年的 123%则
nn n321 Rxxxxx n 0
nn
1n
n
1
2
0
1
a
a
a
a
a
a
a
ax
55 3 2 03 9 53 8 03 9 53 5 63 8 03 4 03 5 63 3 23 4 03 2 03 3 2x
5 %104%107%105%102%104x
5 %123x?
2、方程式法当 时递增
当 时递减 查相应递增或递减表,
根据 的大小得到平均增长速度。
这种方法适宜于如基本建设投资总额、植树造林总面积等表示国民财产存量的指标平均速度的计算。
返回
aaaaa n321 axaxaxa n0200?
0
n2
a
axxx
1a an1
0

1a an1
0

0a
a?
第三节 动态趋势分析
一、动态数列变动因素的分解与模式
二、长期趋势的测定
(一)时距扩大法
(二)移动平均法
(三)数学模型法
三、季节变动的测定
(一)按月(季)平均法
(二)趋势剔除法
返回一、动态数列变动因素的分解与模式
(一)分解
1、长期趋势( ):是现象在一个相当长的时期内持续发展变化的方向性趋势。它是由各个时期普遍起作用的根本性因素所决定的。
2、季节变动( S):是一年以内有一定周期的每年重复出现的变动。它是由季节变换和社会习俗等因素影响而发生的。
3、循环变动( C):指现象因某种原因而发生的周期较长的涨落起伏的波动。
4、不规则变动( I):指由于意外的、临时的、偶然的因素作用而引起的非周期性的或非趋势性的随机变动。
(二)模式
cy
ICSyy C
二、长期趋势的测定
(一)时距扩大法
某商场某年商品销售额资料 (万元 )
月份 1 2 3 4 5 6 7 8 9 10 11 12
销售额 50 55 48 46 56 57 56 52 57 54 60 66
指标 一季 二季 三季 四季商品销售额(万元) 153 159 165 180
平均月销售额(万元) 51 53 55 60 返回
(二)移动平均法 返回年份 粮食产量 3年移动 4年移动 4年移正
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2.86
2.83
3.05
3.32
3.21
3.25
3.54
3.87
4.07
3.79
__
2.91
3.07
3.19
3.26
3.00
3.55
3.82
3.91
__
3.02
3.09
3.21
3.06
3.15

(三 )数学模型法
1、直线趋势测定
(1)确定动态数列是否有直线趋势。用散点图或一次增量大致相等。
( 2)假设方程
( 3)计算 a,b两个参数。用最小平方法。
从 出发,得到:
bxay c
最小值 2c )yy(




2tbtaty
tbnay



22 )x(xn
yxxynb xbya

2tbty
nay
)0t(
举例:某地粮食产量 (万公斤 )资料(计算表)
年份 y t ty t ty
1993 230 1 1 250 -9 81 -2070
1994 236 2 4 472 -7 49 -1652
1995 241 3 9 723 -5 25 -1205
1996 246 4 16 984 -3 9 -738
1997 252 5 25 1260 -1 1 -252
1998 257 6 36 1542 1 1 257
1999 262 7 49 1834 3 9 786
2000 276 8 64 2208 5 25 1380
2001 281 9 81 2529 7 49 1967
2002 286 10 100 2860 9 81 2574
合计 2567 55 385 14642 0 330 1047
2t 2t
a,b两个参数的计算
把上表第一种编码的有关资料代入方程
2567=10a+b×55
得,14642=55a+b×385
计算得,a=221.78 b=6.35
趋势方程为,y=221.78+6.35t
预测 2003年产量,y=221.78+6.35×11=291.63(万公斤 )
把第二种编码资料代入方程,
得,2567=10a a=256.7
1047=330b b=3.17
趋势方程为,y=256.7+3.17t




2tbtaty
tbnay

2tbty
nay
2、曲线趋势的测定(指数曲线)
步骤:
( 1)确定动态数列是否有指数曲线趋势,用散点图或各期环比速度大致相等。
( 2)假设指数曲线方程
( 3)计算 a,b两个参数
1)把指数曲线转化为直线 ㏒ =㏒ a+t㏒ b
Y=A+Bt
2)计算 A,B两个参数(用最小平方法)
3)计算 a,b
tc aby?
cy

2tBtY
nAY
例题(某省发电量资料计算表)
年份 发电量 ㏒ y(Y) t t㏒ y(ty)
1996 130.37 2.11518 -3 9 -6.3455
1997 146.32 2.16530 -2 4 -4.3306
1998 147.52 2.16885 -1 1 -2.1689
1999 167.13 2.23305 0 0 0
2000 180.50 2.25648 1 1 2.2565
2001 221.83 2.34602 2 4 4.6920
2002 267.97 2.42809 3 9 7.2843
合计 __ 15.70297 0 28 1.3878
2t
计算 a,b
把上表有关资料代入方程
得 A=2.2433 B=0.0496
查反对数表得 a=175.1 b=1.121
指数曲线方程为返回

2tBtY
nAY
tc )121.1(1.175y
三、季节变动的测定 (一)按月 (季 )平均法
(某禽蛋加工厂增加值资料 万元 )
月份 1 2 3 4 5 6 7 8 9 10 11 12
第一年 10 50 80 90 50 20 8 9 10 60 50 20
第二年 15 54 85 93 51 22 9 9 11 75 54 22
第三年 22 60 88 95 56 23 9 10 14 81 51 23
第四年 23 64 90 99 60 30 11 12 15 85 59 25
第五年 25 70 93 98 62 32 13 14 19 90 61 28
月平均数
19 60 87 95 56 25 10 11 14 78 56 24
季节比率 %
43 134 196 213 125 57 22 24 31 176 126 53
季节比率的计算季节比率的计算如,
返回
)(45
245678141110255695876019
万元总平均数

%434519一月份季节比率
%1 3 44560二月份季节比率
%534524十二月份季节比率
(二)移动平均趋势剔除法
(某地保暖内衣零售量 万件)
年份
1999 2000 2001
季度 1 2 3 4 1 2 3 4 1 2 3 4
售量
( 1)
40 200 300 30 50 250 330 40 60 300 400 50
143 145 158 165 168 170 183 200 203
__ __ 144 151 161 166 169 176 191 201 __ __
__ __209 20 31 150 196 23 31 149 __ __
4项移动平均( 2)
4项移正平均( 3)
比率 %
)3()1()4(?
季节比率计算表 %
年份季 第一季度 第二季度 第三季度 第四季度 平均
1999
2000
2001
__
31
31
__
150
149
209
196
__
20
23
__
平均 31 149.5 202.5 21.5 101.2
季度比率
30.7 147.8 200.2 21.3 100
%2.10 14 %5.21%5.20 2%5.14 9%31总平均数
%7.30%2.1 0 1 %31第一季度季节比率 返回第六章 统计指数
通过本章的学习,要求学员在理解指数基本概念的基础上,掌握各种指数的编制及因素分析方法,重点掌握两因素的综合指数因素分析及平均指标指数因素分析。
第一节 指数的基本问题
第二节 综合指数
第三节 平均式指数
第四节 平均指标指数
第五节 指数体系及因素分析返回第一节 指数基本问题
一、概念
反映不能直接相加的复杂现象综合变动程度的相对数。
二、作用
1、综合反映复杂现象总体数量变动的方向和程度
2、利用指数体系进行因素分析
3、根据指数数列反映现象的变动趋势三、指数的种类
(一)按其所说明的对象范围不同
1、个体指数:反映个别现象变动的相对数。如
2、总指数:反映总体现象综合变动的相对数。
(二)按其所反映的指标性质不同
1、数量指标指数 2、质量指标指数
(三)总指数按对比的指标形式不同
1、综合指数 2、平均式指数 3、平均指标指数
(四)按编制任务不同
1、时间指数 2、区域指数 3、计划完成程度指数
0
1
q q
qk?
0
1
p p
pk?
0
1
z z
zk?
qk pk
qk pk
第二节 综合指数
一、综合指数编制的基本方法
(一)数量指数编制方法
(二)质量指数编制方法
二、综合指数的其它编制方法
三、综合指数的应用
(一)成本计划完成指数
(二)价格区域指数
返回一、综合指数编制的基本方法
(一)数量指数的编制 (某商店资料 )
商品 销量 价格
(元 )
销售额 (元 )
甲 (公斤 )
50 62.5 20 14 1000 1250
乙 (套 ) 75 90 10 8 750 900
丙 (件 ) 100 115 5 5 500 575
合计 __ __ __ __ 2250 2725
0q 1q 0p 1p 00pq 01pq
举例:计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。
%11.1 2 1
2 2 5 0
2 7 2 5
pq
pq
k
00
01
q

)(4 7 5
2 2 5 02 7 2 5
pqpq 00o1
元?


数量指数的编制原则
在编制数量指数时,即计算数量指标综合变动程度时,需要加入质量指标作为同度量因素,
而且把这个同度量因素固定下来,固定在基期。
返回
(二)质量指数编制方法商品 销售量 价格
(元 )
销售额 (元 )
甲 (公斤 )
50 62.5 20 14 875 1250
乙 (套 ) 75 90 10 8 720 900
丙 (件 ) 100 115 5 5 575 575
合计 __ __ __ __ 2170 2725
0q 1q 0p 1p 01pq11pq
举例:计算三种商品价格的综合变动程度及由于价格变动使销售额变动的绝对额。
%63.79
2725
2170
pq
pq
k
01
11
p

)(5 5 5
2 7 2 52 1 7 0
pqpq 0111



质量指数的编制原则
在编制质量指数时,即计算质量指标综合变动程度时,需要加入数量指标作为同度量因素,
而且把这个同度量因素固定下来,固定在报告期。
返回二、综合指数的其它编制方法
(一)拉氏公式
(二)派氏公式
(三)马艾公式
(四)费喧公式
(五)固定权数

00
01q
pq
pqk

00
10p
pq
pqk

10
11q
pq
pqk

01
11p
pq
pqk
)
2
pp
(q
)
2
pp
(q
k
01
0
01
1
q
)
2
qq
(p
)
2
qq
(p
k
01
0
01
1
p

10
11
00
01p
qp
qp
qp
qpk

10
11
00
01q
pq
pq
pq
pqk

n0
n1q
pq
pqk

n0
n1p
qp
qpk
返回三、综合指数的应用
(一)成本计划完成指数
某企业成本资料单位成本(元)
产量 总成本(元)

(台)
190 195 400 340 7600 78000

(件)
44 42 800 1000 35200 33600
合计 — — — — 111200 111600
nz 1z nq 1q nnzq 1nzq
计算两种产品成本计划综合完成程度及总成本增减额
%36.1 0 0
1 1 1 2 0 0
1 1 1 6 0 0
zq
zq
k
nn
1n
z
)(400
1 1 1 2 0 0
1 1 1 6 0 0
zqzq
nn1n
元?


返回
(二)价格区域指数
甲乙两地某日几种农副产品市场资料商品甲地区 乙地区 贸易额(元)
1 40 300 50 200 20000 25000
2 30 100 20 300 12000 8000
3 25 30 25 35 1625 1625
合计
— — — — 33625 34625
甲p 乙p 乙q甲q qp甲 qp乙乙甲 qqq
计算甲乙两地三种产品价格的综合比较程度
%11.97
3 4 6 2 5
3 3 6 2 5
qp
qP
k )(

乙甲甲比乙
%97.102
33625
34625
qp
qp
k )(
甲乙乙比甲返回第三节 平均式指数
一、基本编制方法
(一)加权算术平均式指数
(二)加权调和平均式指数
二、应用
(一)零售物价指数
(二)农产品收购价格指数
(三)工业生产指数
返回一、基本编制方法
(一)加权算术平均式指数举例商品 (%)
甲 (公斤 ) 125 1000 1250
乙 (套 ) 120 750 900
丙 (件 ) 115 500 575
合计 __ 2250 2725
qk 00pq 00q pqk
计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。

10
01q
pq
pqk
0
1
q q
qk?
0q1 qkq?
%11.121
2250
2725
pq
pqk
k
00
00q
q

)(555225 0272 5
pqpqk 0000q


加权算术平均式指数的适用条件
计算数量指数时,如果已知的是数量指标的个体指数和基期总额资料,用加权算术平均式指数计算数量指标的综合变动程度。
返回
(一)加权调和平均式指数
举例商品 ( %)
甲 (公斤 ) 70 875 1250
乙 (套 ) 80 720 900
丙 (件 ) 100 575 575
合计 — 2170 2725
pk 11pq 11
p
pqk1
计算三种商品价格的综合变动程度及由于价格变动使销售额变动的绝对额。

10
11p
qp
qpk
0
1
p p
pk?
1
p
0 pk
1p?
%63.79
2725
2250
qp
k
qp
k
11
p
11
p

)(55 527 2522 50
qp
k
1
qp 11
p
11


加权调和平均式指数的适用条件
计算质量指数时,如果已知的是质量指标的个体指数和报告期总额资料,用加权调和平均式指数计算质量指标的综合变动程度。
返回二、平均式指数的应用
(一)零售物价指数代表品 权数 W 指数( %)
一、食品类 54 135.3
1、粮食 46 149.1
( 1)细粮 60 146.1
面粉 标准(公斤) 1.81 2.80 40 154.5
大米 二等(公斤) 1.56 2.20 60 140.5
( 2)粗粮 40 153.5
2、副食品 42 128.0
3、烟茶酒 8 110.0
4、其它食品 4 103.2
二、衣着类 21 102.0
0p
0p 1p
%1.146100 60%5.14040%5.154k细

w
wkk p
p
%1.1 4 91 0 0 40%5.1 5 360%1.1 4 6k粮
%3.1 3 51 0 0 4%2.1 0 342%1 2 846%1.1 4 9k食返回
(二 )农产品收购价格指数大类 中类 小类 代表品 指数 % 万元甲 (120) 120
A (116) 58
(125) 25
140 14
110 11
110 33
B (124) 62
(115) 23
108.3 13
125 10
130 39
11pq
1A
2A
11A
12A
1B
2B
11B
12B
%1 2 5
%1 1 0
11
%1 4 0
14
1114K
1A?

%1 16
%1 10
33
%1 40
25
3325K
A?

%1 20
%1 16
62
%1 24
58
6258K?


11
p
11
p
qp
k
1
qp
k
返回
(三 )工业生产指数
%25.111100 25.111w wkk qq
工业部门代表品数
W
%
制造业 500 60 120 72
矿业 20 25 82 20.5
电信业 30 15 125 18.751
合计 550 100 __ 111.25
qk wkq
返回第四节 平均指标指数
这里的平均指标包括第四章所讲的加权算术平均数和与此相似的相对指标,如全员劳动生产率、人均国内生产总值。所以平均指标指数是反映两个不同时期同一经济内容这类指标的变动程度,即两个时期的加权算术平均数及与此相似的相对指标对比形成的指数。
一、可变构成指数
)(
f
fx
f
fx
x
x
k
0
00
1
11
0
1
相对数可变

)(f fxf fx
0
00
1
11 绝对数

二、固定构成指数
)(
f
fx
f
fx
k
1
10
1
11
相对数固定
)(f fxf fx
1
10
1
11 绝对数

三、结构影响指数
)(
f
fx
f
fx
k
0
00
1
10
相对数结构
)(f fxf fx
0
00
1
10 绝对数

工人类别工人数 平均工资(元) 工资总额(万元)
技工 300 300 500 550 15 16.5 15
徒工 200 700 300 350 6 24.5 21
合计 500 1000 — — 21 41 36
0f 1f 0x 1x 00fx 11fx 10fx
1、计算所有工人总平均工资变动的程度和绝对额某企业工资资料
%62.97
4 2 0
4 1 0
5 0 0
2 1 0 0 0 0
1 0 0 0
4 1 0 0 0 0
f
fx
f
fx
k
0
00
1
11

可变
)(10420410f fxf fx
0
00
1
11 元
2、计算由于各组工资水平的变动使总平均工资变动的程度及绝对额 %89.1 1 3
3 6 0
4 1 0
1 0 0 0
3 6 0 0 0 0
4 1 0
f
fx
f
fx
k
1
10
1
11

固定
)(503 6 04 1 0f fxf fx
1
10
1
11 元
3、计算由于结构的变动使总平均工资变动的程度及绝对额 %71.85
4 2 0
3 6 0
f
fx
f
fx
k
0
00
1
10

结构
)(60420360f fxf fx
0
00
1
10 元
返回第五节 指数体系及因素分析
一、指数体系
二、综合指数体系的因素分析
(一)两因素综合指数体系的因素分析
(二)多因素综合指数体系的因素分析
三、平均式指数体系的因素分析
四、平均指标指数体系的因素分析
返回一、指数体系
(一)概念
把经济上有联系,数量上保持一定关系的三个或三个以上的指数组成的整体称为指数体系。
(二)种类
1、综合指数体系
( 1)两因素 总成本指数 =产量指数 ×单位成本指数
( 2)多因素
2、平均指标指数体系
3、两者结合的指数体系总成本指数 =产量指数 ×单位成本指数
=产量指数 ×单位成本的固定构成指数 ×单位成本的结构影响指数原材料费用总额指数 =
产量指数 ×
单耗指数 ×
原材料价格指数结构固定可变 kkk
二、综合指数体系的因素分析
(一)两因素综合指数体系的因素分析商品 销量 价格 (元 ) 销售额 (元 )
甲 (公斤 ) 50 62.5 20 14 1000 1250 875
乙 (套 ) 75 90 10 8 750 900 720
丙 (件 ) 100 115 5 5 500 575 575
合计 __ __ __ __ 2250 2725 2170
0q 1q 0p 1p 00pq 01pq 11pq
从相对数和绝对数两方面对销售额的变动进行因素分析销售额指数 =销售量指数 ×价格指数

10
11
00
01
00
11
qp
qp
pq
pq
qp
qp
2 7 2 5
2 1 7
2 2 5 0
2 7 2 5
2 2 5 0
2 1 7 0
96.44%=121.11%×79.63%
-80=475+(-555)
计算结果表明,
从相对数来说,销售额下降了 3.56%,是由于销售量上升了 21.11%和价格下降了 20.37%两个因素共同影响的结果,
从绝对数来说,销售额减少了 80元,是由于销售量的上升使销售额增加了 475元和由于价格下降使销售额减少了 555元两个因素共同影响的结果,
返回
)qpqp()pqpq(pqpq 101100010011
2170-2250=(2725-2250)+(2170-2725)
(二)多因素综合指数体系的因素分析原材料产品生产量单耗 材料价格费用总额 (百元 )

(公斤 )
A
(百件 )
8 10 0.6 0.5 20 21 96 120 100 105

(米 )
B
(百套 )
5 5 1.2 1.1 15 14 90 90 82.5 77

(米 )
C
(百套 )
10 12 2.4 2.5 30 28 720 86.4 900 840
合计
__ __ __ __ __ __ __ 906 1074 1082.5 1022
0q 1q 1m0m 0p 1p 000 pmq 001 pmq 011 pmq 111 pmq
从相对数和绝对数两个方面对该企业费用总额的变动进行因素分析费用总额指数 =
产量指数 ×
单耗指数 ×
原材料价格指数

011
111
001
011
000
001
000
111
pmq
pmq
pmq
pmq
pmq
pmq
pmq
pmq
相对数
)pmqpmq()pmqpmq
pmqpmqpmqpmq
011111001011
000001000111





)(
绝对数
5.1 0 8 2
1 0 2 2
1 0 7 4
5.1 0 8 2
9 0 6
1 0 7 4
9 0 6
1 0 2 2
112.8%=118.5%×100.8%×94.4%
1022-906=(1074-906)+(1082.5-1074)+(1022-1082.5)
11600(元 )=16800(元 )+850(元 )+(-6050元 )
计算结果表明,
从相对数来说,该企业费用总额增长了 12.8%,是由于产量增长了 18.5%,单耗增长 0.8%,原材料价格下降 5.6%三个因素共同影响的结果。
从绝对数来说,该企业费用总额增加了 11600元是由于产量增长使其增加了 16800元,单耗增长使其增加 850元,原材料价格的下降使其减少了 6050元三个因素共同作用的结果。
三、平均式指数体系的因素分析
商品 % %
甲 (公斤 ) 125 70 1000 875
乙 (套 ) 120 80 750 720
丙 (件 ) 115 100 500 575
合计 __ __ 2250 2170
qk pk 00pq 11pq

11
p
11
00
00q
00
11
pq
k
1
pq
pq
pqk
pq
pq
从相对数和绝对数两个方面对销售额的变动进行因素分析
)pqk
1pq()pqpqk(pqpq
11
p
110000q0011
2 7 2 5
2 1 7 0
2 2 5 0
2 7 2 5
2 2 5 0
2 1 7 0 96.44%=121.11%×79.63%
-80=475+(-555)2170-2250=(2725-2250)+(2170-2725)
计算结果表明,(同上 )
四、平均指标指数体系的因素分析结构固定可变 kkk

0
00
1
10
1
10
1
11
0
00
1
11
f
fx
f
fx
f
fx
f
fx
f
fx
f
fx
相对数
)f fxf fx()f fxf fx(f fxf fx
0
00
1
10
1
10
1
11
0
00
1
11

绝对数
-10=50+(-60)97.62%=113.89%×85.71%
计算结果表明,从相对数说,所有工人的总平均工资下降了 2.38%,是由于各组工人的平均工资上升了 13.89%和结构的影响使平均工资下降了 14.29%两个因素共同作用的结果。从绝对数说,总平均工资减少 10元,是由于各组工人平均工资的上升使平均工资增加 50元和结构的影响使平均工资减少了 60元两个因素共同作用的结果。
第七章 相关与回归分析
相关与回归分析是研究现象之间依存关系的一种统计方法。重点掌握简单线性相关系数的计算与分析及一元线性回归方程的建立。
第一节 相关与回归分析的基本问题
第二节 简单线性相关分析
第三节 一元线性回归分析
一、相关的概念
二、相关关系的种类
三、相关与回归分析的的主要内容第一节 相关与回归分析的基本问题一、相关的概念
(一)相关分析
从数量上分析现象之间相关关系的理论和方法。
(二)函数关系(确定性关系)
对于某一变量的每个数值都有另一变量的完全确定的值与之对应。
(三)相关关系(非确定性关系)
现象之间存在一定的依存关系,但不是一一对应的关系,即相随变动关系。
二、相关关系的种类
(一)按变量之间相关的程度
1、完全相关 2、完全不相关 3、不完全相关
(二)按相关关系涉及变量的多少
1、单相关 2、复相关
(三)按变量之间相关关系的表现形式
1、线性相关 2、非线性相关
(四)对线性相关,按相关的方向
1、正相关 2、负相关三、相关与回归分析的的主要内容
(一)确定变量之间有无相关关系及呈现的形态
用定性分析、相关表或相关图。
(二)确定变量之间相关关系的密切程度
用相关系数。
(三)建立变量之间变动关系的方程式
用最小平方法建立变量之间的回归方程。
(四)测定因变量估计值的可靠性
计算估计标准误差。
第二节 简单线性相关分析
一、相关表
(一 )简单相关表
(二 )单变量分组相关表
(三 )双变量分组相关表
二、相关图
三、相关系数
(一)基本公式
(二)性质
(三)其它计算公式
(四)例题一、相关表(一)简单相关表机床
1 2 3 4 5 6 7 8 9 10 11
使用年限
2 2 3 4 4 5 5 6 6 6 8
年维修费用

元)
400 540 520 640 740 600 800 700 760 900 840
(二 )单变量分组相关表使用年限 机床数 (台 ) 平均维修费用
( )
2 2 470
3 1 520
4 2 690
5 2 700
6 3 787
8 1 840
9 1 1080
合计 12 __
年元
(三 )双变量分组相关表年维修费用
(元)
机床使用年限 (年 ) 合计
2 3 4 5 6 8 9
1000— 1100 1 1
900— 1000 1 1
800— 900 1 1 2
700— 800 1 2 3
600— 700 1 1 2
500— 600 1 1 2
400— 500 1 1
合计 2 1 2 2 3 1 1 12
二、相关图
0
200
400
600
800
1000
1200
0 2 4 6 8 10
ìê ìììì·ì
使用年限三、相关系数
(一)基本公式
1、基本公式
yx
xy
2
22 )yy(
n
1
)xx(
n
1
)yy)(xx(
n
1
r




2,的作用与不足
(1)说明相关的方向 (2)显示相关程度
y
)yy)(xx(
xy x
0)xx(
0)yy(
0)xx(
0)yy(
0)xx(
0)yy(
0)xx(
0)yy(
( 3)不足:受变量值个数、变量值大小和计量单位的影响
( 1)作用:消除了变量值个数的影响。
( 2)不足,协方差数值受变量值大小和计量单位的影响。例:
3,的作用与不足 )yy)(xx(n1
人均销售额
(千元)
利润率 % 人均销售额
(元)
利润率 %
6 12.6 6000 12.6
5 10.4 5000 10.4
8 18.5 8000 18.5
1 3.0 1000 3.0
4 8.1 4000 8.1
1x 1y 2x 2y
4,的作用
同协方差相比,相关系数有两个作用;
( 1)它是一个系数,不受变量值水平和计量单位的影响,可以在不同资料之间对相关程度进行对比。
( 2)相关系数的数值有一定范围即
x? y?
1r?
yx
xy
2
22 )yy(
n
1
)xx(
n
1
)yy)(xx(
n
1
r




(二 )相关系数的性质
1、当 时,x与 y为完全线性相关,即 x 与 y之间存在着函数关系。
2、当 时,表示 x与 y之间存在一定的线性相关。 的数值愈接近于 1,表示 x与 y之间直线相关程度愈高;反之 的数值愈接近于 0,表示 x与 y之间直线相关程度愈低。通常判断的标准是:
微弱相关 低度相关
显著相关 高度相关
3、当 r﹥0 时,为正相关,当 r﹤0 时,为负相关。
4、当 时,表示 y的变化与 x无关,即 x与 y完全没有直线相关。
1r?
1r0
r
r
30r 50r30
80r50 1r80
0r?
(三)相关系数的其它计算公式



2222 )y(
n
1
y)x(
n
1
x
yx
n
1
xy
r
设 xylyxn1xy)yy)(xx(
xx222 l)x(n1x)xx( yy222 l)y(n1y)yy(

yyxx
xy
ll
lr?
举例使用年限 x 维修费用(元) y xy
2 540 4 291600 1080
3 520 9 270400 1560
4 640 16 409600 2560
4 740 16 547600 2960
5 600 25 360000 3000
5 800 25 640000 4000
6 700 36 490000 4200
6 760 36 577600 4560
6 900 36 810000 5400
8 840 64 705600 6720
9 1080 81 116400 9720
合计 58 8120 348 6268800 45760
2x 2y
294581205811145 76 0l xy
42)58(111348l 2xx
27 47 64)81 20(11162 68 80 0l 2yy
87027476442 2945r
计算结果表明,机床使用年限与维修费用之间为高度正相关。
第三节 一元线性回归分析
一、相关分析与回归分析的关系
(一)区别
(二)联系
二、一元线性回归方程的建立
(一)回归方程的建立
(二) r与 b的关系
三、估计标准误差
(一)基本公式
(二)计算公式
(三) 与 b的关系yxs
一、相关分析与回归分析的关系
(一)区别
1、相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。
2、相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。
3、相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。
4、相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。
(二)联系
1、相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。
2、回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,
并进一步进行预测。
二、一元线性回归方程的建立
(一)回归方程的建立
1、假设回归方程
2、计算 a,b两个参数(最小平方法)
从 出发,得到
前例
bxay
最小值 2)y?y(




2xbxaxy
xbnay
xx
xy
22 l
l
)x(
n
1
x
yx
n
1
xy
b
xbya



42l
2945l
xx
xy
8120y
58x
27.51158x
a=738.18-70.12×5.72=368.65
18.7 3 8118 1 2 0y
1270422 9 4 5b
x12.7065.3 6 8y
(二) b与 r的关系
例:
y
x
yy
xx
yy
xx
xx
xy
yyxx
xy
b
l
l
b
l
l
l
l
ll
l
r


x
yrb

252x 362y
r=0.9 a=2.8
08.1569.0b
x08.18.2y
三、估计标准误差
(一)定义公式
(二)计算公式
2n
)y?y(s 2
yx?

2n
xybyayy 2
yx?












xybyay
xybyaxyb2ya2y
)xbxa(b)xbna(axyb2ya2y
xbxab2naxyb2ya2y
)bxa(y)y?y(
2
2
22
2222
22
(三 )意义 估计标准误差是说明回归方程代表性大小的统计分析指标。其值小,表明方程代表性大;反之亦然。
用上例
4 5 7 6 0xy
6 2 6 8 8 0 0y
8 1 2 0y
2
元)(07.86
211
4 5 7 6 012.708 1 2 065.3 6 86 2 6 8 8 0 0
2n
xybyay
S
2
yx



a=368.65
b=70.12
(四) 与 r的关系yxS
2
y
2
yx
2
y Sr

2
yyx r1S
可见,当 r越大时,越小,这时相关密切程度较高,回归直线的代表性就大;反之亦然。
实际中,一般不常用这种方法计算 r,因为,( 1)
需要先求出回归直线方程,计算出估计标准误差,
才能求得 r。不符合一般程序。( 2)以这种方法计算的 r难以判断是正相关还是负相关。
yxS
x
y
y
y?
y
y
yy? y?y?
yy
)yy?()y?y(yy

)yy?)(y?y(2)yy?()y?y(
)yy?()y?y()yy(
22
22





0xbnayxb
xbxaxyb
)bxay(xbx)bxay(b
)xx)(bxay(b
)xbabxa)(bxay(
)yy?)(y?y(
2









)r1(l
l
ll
l
l
l
l
l
l
lbl
)xx(bl
)xbabxa(l
)yy?()yy(
)y?y(
2
yy
yy
yyxx
2
xy
yy
xx2
xx
2
xy
yy
xx
2
yy
22
yy
2
yy
22
2








)r1(S
)r1(
n
l
n
)y?y(
2
y
22
yx
2yy
2



2
y
2
yxS1r

第八章 抽样推断
本章介绍在一定的概率保证程度下,从数量上用样本指标推断总体指标的统计方法。重点掌握简单随机抽样方式下,抽样平均误差计算、抽样单位数目确定和区间估计的方法。
第一节 抽样推断的基本问题
第二节 抽样误差
第三节 抽样单位数目的确定
第四节 抽样估计第一节 抽样推断的基本问题
一、抽样推断的概念
二、抽样推断的特点
三、抽样推断的适用范围
四、抽样推断的有关概念
五、抽样方法
一、抽样推断的概念
抽样推断是指从被研究现象的总体中按照随机原则抽取一部分单位进行调查,并依据调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计,以达到对全部研究对象认识的一种统计方法。
二、抽样推断的特点
(一)按照随机原则从总体中抽取样本单位。
(二)用样本单位的指标数值推断总体的指标数值。
(三)抽样误差可以事先计算并加以控制。
三、抽样推断的适用范围(需要掌握总体的具体数据)
(一)不能进行全面调查
(二)理论上可以进行全面调查实际上办不到
(三)没有必要进行全面调查
(四)可以验证和补充全面调查资料四、抽样推断的有关概念
(一)全及总体和抽样总体
1、全及总体(总体 N):所要认识对象的全体。
( 1)有限总体 ( 2)无限总体
2、抽样总体(样本 n):所抽取的一部分单位。
( 1)大样本( n≥30) ( 2)小样本( n≤30)
(二)全及指标和抽样指标
1、全及指标:用来描述全及总体的指标
2、抽样指标:根据样本单位计算的指标
X )( 2XX σσ P )( 2PP σσ
x )( xx SS 2 p )( 2pp SS
五、抽样方法
(一 )按抽取样本单位的方法不同
1、重复抽样 2、不重复抽样
(二)根据对样本的要求不同
1、考虑顺序的抽样 AB≠BA
2、不考虑顺序的抽样 AB=BA
(三)两种分类交叉
1、考虑顺序的不重复抽样
2、考虑顺序的重复抽样
3、不考虑顺序的不重复抽样
4、不考虑顺序的重复抽样
nNn NB =
)1()1( nNNNA Nn?
!
)1()1(
! n
nNNN
n
AC Nn
Nn

!
)21(
1 n
NnNnNCD
nNnNn


)(
第二节 抽样误差
一、抽样平均误差
(一)概念
(二)计算
1、简单随机抽样
2、类型抽样
3、等距抽样
4、整群抽样
5、阶段抽样
(三)影响抽样平均误差的因素二、抽样极限误差三、抽样极限误差与抽样平均误差的关系一、抽样平均误差
(一)抽样平均误差的概念
1、登记汇总性误差
2、代表性误差
( 1)偏差 11 Xx? 22 Xx?
11 Pp? 22 Pp
( 2)随机误差实际误差平均误差 M
Xxu
x
2)(
M
Ppu
p
2)(
(二)抽样平均误差的计算
1、简单随机抽样
( 1)概念,是对总体单位不作任何分类或排队,
完全按随机原则逐个地抽取样本单位。
( 2)抽样平均误差的计算公式
①平均数的抽样平均误差
②成数的抽样平均误差
)(重复nu x σ? 或)1(
2

N
nN
nu x
σ )()1(2 不重复
N
n
nu x
σ
)()1( 重复n PPu p
)()1()1()1()1( 不重复或 Nnn PPuN nNn pPu pp






ji
jin
n
n
x
XxXxEXxEXxEXxE
n
XxXxXxE
n
n
XXX
n
xxx
E
XxEu
))(()()()(
1
)()()
1
)(
)(
22
2
2
12
2
212
221
22


在重复抽样下,样本变量是独立的。
则 0))(( XxXxE ji


n
n
n
XXEXXEXXE
n
XxEXxEXxE
n
u
nx
2
2
2
222
2
22
2
2
12
)(
1
)()()(
1
)()()(
1
σ
σ


( 3)例题
① 某冷库冻鸡平均每只重 1200克,标准差 70克,如果重复随机抽取 100只和 200只,分别计算 抽样平均误差。
②该 冷库冻鸡合格率为 97%,如果重复随机抽取 100
只和 200只,分别计算 抽样平均误差。
)(710070 克 nu xx σ )95420070 (克xu
%7110 0 %)971%(971( n PPu p )
%21200 %)971%(97pu
2、类型抽样
( 1)概念,类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。
( 2)样本单位数在各类型组中的分配方式
①等额分配:在各类型组中分配同等单位数。
②等比例分配:按各类型组在总体中所占比例分配样本单位数。即:
③最优分配:按各类型组的规模大小和差异程度,
确定各类型组的样本单位数。
N
n
N
n
N
n
N
n
k
k
2
2
1
1
( 3)抽样平均误差的计算公式
① 平均数的抽样平均误差
重复
不重复且等比例
②成数的抽样平均误差
重复
不重复且等比例
nu
i
x

N N iii 22 σσ
)1()1(
1
)1(
1
)1(
1
2
1
2
1
2
1
2
N
n
nN
N
N
n
n
N
n
N
N
nN
n
N
N
n
u
i
k
i
ii
k
i
ii
k
i
i
iii
x




σσ
σσ
n
PPu ii
p
)1(
N
NPP
PP ii
k
i i
ii
)1(
)1( 1

)1()1( Nnn PPu iip
( 4)例题
① 有 12块小麦地,每块 1亩。 6块处于丘陵地带,亩产量(斤)分别为,300 330 330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为,420 420 450
460 490 520。抽查 4块,测定 12块地的平均亩产量,
计算其抽样误差。
②设亩产在 350以上的为高产田,抽查 4块,测定 12块地高产田的比重,计算其抽样误差。
用类型抽样,每类抽 2块
计算各组方差 平均组内方差 抽样误差亩产量
300 1600
330 100
330 100
340 0
370 900
370 900
合计 3600
211 )( XX? 亩产量
420 1600
420 1600
450 100
460 0
490 900
520 3600
合计 7800
222 )( XX?
1X 2X
丘陵平原
3401?X
600
6
36002
1
σ
4602?X
1 3 0 0
6
7 8 0 02
2
σ
95012 61306600
2
2
N
Nσσ ii
i
41.154950
2
nσu ix
5712
)
12
4
1(
4
950
)1(
2


N
n
n
σ
u ix


地块数高产田数高产田比重 %
丘陵 6 2 33.3 66.67 22.2
平原 6 6 100 0 0
iP?1 )1( ii PP?
iP
%1.1112 06%2.22)1()1( N NPPPP iiiii
%65.164 %1.11)1( n PPu iip
%6.13)1241(4 %1.11)1()1( Nnn PPu iip
3、等距抽样
( 1)概念:将总体各单位标志值按某一标志顺序排队,
然而按一定的间隔抽取样本单位。
( 2)排对的方法
①无关标志排队 ②有关标志排队
( 3)抽取样本单位的方法
①按相等的距离取样
②对称等距取样
( 4)抽取第一个样本单位的方法
①随机抽取 ②居中抽取
( 5)抽样平均误差的计算公式
① 按无关标志排队,同不重复简单随机抽样
②按有关标志排队
)1(1)1(1
2
1
2
1
2

i
ik
i
iik
i
i
iiii
x nn
σ
N

nN
nN
N

nu?
n
PPu ii
p
)1(
Ⅰ 亩产量( ),300 330 330 1X 3201?X 20021?σ
Ⅱ 亩产量( ),340 370 3702X 3602?X 20022?σ
Ⅲ 亩产量( ),420 420 4503X 4303?X 20023?σ
Ⅳ 亩产量( ),460 490 5204X 4904?X 60024?σ
30012 36003200320032002iσ
66.84300xu
3412上例,抽选间隔为
( 6)例题
4、整群抽样
(1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。
( 2)抽样平均误差的计算公式某水泥厂一昼夜的产量为 14400袋,现每隔 144分钟抽取
1分钟的水泥( 10袋)检查平均每袋重量和一级品率,
样本资料如下:
计算抽样平均误差
)1(
2

R
rR
r
δu x
x R
XXδ i
x
22 )(
r
xxδ i
x
22 )(
)1(
2

R
rR
r
δu p
p R
PPδ i
p
22 )(
r
ppδ i
p
22 )(
( 3)例题样本群平均每袋重量一级品比重
1 49 2.25 0.80 0
2 51 0.25 0.75 0.0025
3 52 2.25 0.83 0.0009
4 53 6.25 0.82 0.0004
5 50 0.25 0.80 0
6 49 2.25 0.79 0.0001
7 50 0.25 0.78 0.0004
8 48 6.25 0.80 0
9 50 0.25 0.81 0.0001
10 53 6.25 0.82 0.0004
合计 505 26.25 8.00 0.0048
ix
2)( xx i?
ip 2)( pp i?
5.50
10
505

r
xx i
8.0
10
8

r
pp i
65.2
10
5.26
)( 22

r
xx
δ i
x
0 0 0 4 8.0
10
0 0 4 8.0
)(
2
2
r
pp
δ
i
p
一昼夜有 1440分钟,即把总体分为 1440群,R=1440
每隔 144分钟抽取 1分钟的水泥( 10袋),r= 10
513.0)11 4 40 101 4 40(10 652)1(
2
R rRrδu xx
0069.0)11440 101440(1000048.0)1(
2
R rRrδu pp
5、阶段抽样
( 1)概念:抽样时,先抽总体中较大范围的单位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。
( 2)抽样平均误差的计算公式(以两阶段为例)
同理可以得出成数抽样平均误差的计算公式
( 3)例题:某地区有 300户居民,分成 10群,现从 10群中抽 6群,再从抽中的群中每群抽 2户调查其平均收入,
计算抽样平均误差。资料如下:
群 1,300 330(户收入)
n
σ
R
rR
r
δu ix
x
22
)1( )1()1(
22


M
mM
n
σ
R
rR
r
δu ix
x
n=rm
315?ix 450)( 211 xx
225245021σ
群 2:户收入 330 340
3352?x 50)( 222 xx 2525022σ
群 3:户收入 370 390
38 63?x 200)( 233 xx 10022002
3σ群 4:户收入 418 434
4264?x 128)( 244 xx 64212 824σ
群 5:户收入 462 484
4735?x
242)( 255 xx 1 2 122 4 22

群 6;户收入 507 525
51 66?x 162)( 266 xx 81216226σ
671 02)811 21641 00252 25(612iσ
540 751 647 342 638 033 531 561 )(x
6
)5.407516()5.407315( 222

773.19
)
130
230
(
12
67.102
)
110
610
(
6
25.516 2
)
1
()
1
(
22
M
mM
n
σ
R
rR
r
δ
u
ix
x
(三)影响抽样平均误差的因素
1、总体标准差的大小
2、样本单位数的多少
3、抽样方法的不同
4、抽样组织方式的差别二、抽样极限误差
样本指标围绕总体指标左右两侧波动形成的一定范围。
PppXxx
三、抽样极限误差与抽样平均误差的关系
(一)抽样分布
据中心极限定理,当总体为正态或总体非正态但 n≥30时,
样本均值的分布趋近于正态分布;当 n足够大时,样本成数的分布近似为正态分布。
(二)关系令
22 )
2
1)(
2
1
)( 2
1
2
1 xx u
Xx
x
σ
xx
x
x euπeσπf



x
x
x uu
Xxt
2
2
1
)( 2
1 t
t eπf

0)(?tE 12?tσ
第三节 抽样单位数目的确定
一、抽样单位数目的计算
(一)简单随机抽样
(二)类型抽样
(三)等距抽样
(四)整群抽样
(五)阶段抽样二、影响 抽样单位数目的因素一,抽样单位数目的计算
(一)简单随机抽样
1、计算公式
( 1)平均数
( 2)成数
n
σttu x
xx
2
2
22
x
xσtn
222
22
xx
x
σtN
σNtn

2
2 )1(
p
PPtn

)1(
)1(
22
2
PPtN
PpNtn
p

2、例题
( 1)某类产品根据以往资料的估计,总体方差 5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到 99.73%,误差范围不超过
0.9千克,需要抽多少样本单位?
按题意
( 2)根据以往资料的估计,该类产品的一等品率为
90%,可靠程度仍为 99.73%,误差范围不超过 5%,
推断该批产品的一等品率,需要抽多少样本单位?
按题意
45652xσ 3?t
90 x
61)90( 45653 2
2
n
%90?P 3?t
%5 p
32 4)050( 10903 2
2
n
(二)类型抽样
1、计算公式重复抽样 不重复抽样平均数成数
2
22
x
iσtn
222
22
ix
i
σtN
σNtn

2
2 )1(
p
ii pptn

)1(
)1(
22
2
iip
ii
PPtN
PPNtn


2、例题
某工厂早、中、晚生产罐头 10000瓶,根据以往资料的估计平均重量的类型平均方差为 0.549克,合格率的类型平均方差为 0.02787,要求可靠程度为何 95%,平均重量的允许误差为 0.11克,合格率的允许误差为 0.025,
用类型抽样推断 10000瓶罐头的平均重量和合格率,
需要抽多少样本单位?
据题意
1715490)961()110(10 00 0 5490)961(10 00 0 22
2
n
1 0 0 0 0?N 5 4 902iσ 961t 110 x
027870)1( ii PP 0 2 50 p
171)0250( 02 78 70)961( 2
2
n
(三)等距抽样
计算公式
( 1)按有关标志排队
同类型重复抽样
( 2)按无关标志排队
同简单随机不重复抽样
2
22
x
iσtn
2
2 )1(
p
ii pptn

222
22
xx
x
σtN
σNtn
)1(
)1(
22
2
PPtN
PpNtn
p

(四)整群抽样