统 计 学
xo
y
主讲 史晓燕 副教授教材 统计学 邱东主编高等教育出版社

f
fxx( 2)
西北工业大学网络教育学院统计学课件
学习统计学的目的和要求:
在理解基本概念的基础上,掌握统计资料的搜集、整理以及分析的方法。重点掌握抽样推断、
动态分析、指数分析、相关与回归分析方法。
统计学内容
第一章 总论
第二章 统计调查
第三章 统计资料整理
第四章 综合指标
第五章 动态数列分析
第六章 指数
第七章 相关与回归分析
第八章 抽样推断
第九章 综合复习
第十章 习题解答
返回第一章 总论
通过本章学习要求学员了解统计学产生与发展的历史,明确统计学的涵义,研究对象等一些基本问题,重点理解统计学中的几个基本概念 。
第一节 统计学的产生和发展
第二节 统计学的基本问题
第三节 统计学中的几个基本概念
返回第一节 统计学的产生与发展一、统计实践活动的产生与发展二、古典统计学时期(十七世纪至十八世纪)
三、近代统计学时期(十八世纪末至十九世纪末)
四、现代统计学时期(二十世纪初至今)
返回一、统计实践活动的产生与发展统计实践活动产生于奴隶社会,当时的统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。封建社会末期,特别是进入资本主义社会以后,
社会生产力迅速发展,统计逐步成为社会分工中的一个独立的部门和专业。同时欧洲出现了一些统计理论著作,标志着统计学的产生。统计学产生后形成不同的学派。
返回二、古典统计学时期(十七世纪至十八世纪)
1,政治算术学
〈 1〉 创始人:威廉,配第
〈 2〉 产生的背景:当时的英国统治阶级为了管理国家,发展经济,争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派 。
〈 3〉 研究方法:从数量方面研究社会经济现象 。
2,国势学派
〈 1〉 创始人:海尔门,康令
〈 2〉 产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派 。
〈 3〉 研究方法:对国家重要事项的记述,几乎完全偏重于 品质方面而忽视了量的分析。 返回三、近代统计学时期(十八世纪末至十九世纪末)
1,数理统计学派
〈 1〉 创始人:阿道夫,凯特勒
〈 2〉 产生的背景,当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派,
〈 3〉 研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。
2,社会统计学派
( 1)创始人:德国的克尼斯
( 2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。
( 3) 研究方法:在对统计资料进行搜集、整理、
分析的基础上,明确现象内部的联系和规律性。
四、现代统计学时期(二十世纪初至今)
(数理统计学和社会统计学)
1、数理统计学这一时期的数理统计学,在深度和广度上都有了迅速的发展,出现了新的分支和边缘科学,成为现代统计学的主流学派。
2,社会统计学这一时期的社会统计学也有所发展,其基本趋势是由实质性科学向方法论科学的转变,但相对缓慢。
3,社会经济统计学在德国社会统计学的影响下,以前苏联为首的社会主义国家逐步建立和发展了社会经济统计学。其理论和方法曾成功地应用于社会主义的计划经济分析。然而由于当时国际意识形态上的对立,这些国家用武断的方法解决学术上的争议,使得统计科学没有按照科学自身的规律不断进步,因此发展缓慢。
4,中国的统计学新中国成立后,输入了苏联的社会经济统计学,虽然曾经发挥了重要作用,但同样进步迟缓。八十年代以后,统计进入了全面改革的新时期,统计方法更加丰富、应用更加广泛,统计学得到了很大的发展。
返回第二节 统计学的基本问题
一、统计学的涵义
统计资料:以文字、图表等形式显示出来,用来说明事物的现状、事物之间的内在联系以及未来发展趋势的数据。
统计工作:
统计工作者搜集、整理、计算分析或推断统计资料的工作过程。
统计学:是一门研究搜集、整理、分析或推断统计资料的方法论性质的科学。
返回
二、统计学的研究对象和性质
统计学的研究对象是社会现象和自然现象的数量方面。
就性质而言,统计学是一门适用于自然现象和社会现象的方法论学科。
三、统计学的内容
(一)描述统计学研究如何搜集、加工处理、显示及计算分析数据的方法。
(二)推断统计学研究如何根据样本数据推断总体数量特此的方法。
四、统计学与其他学科的关系
(一)统计学与数学的关系
1,统计学与数学的联系表现在统计方法以数学知识为基础 。 其共同点是两者都为各学科提供研究和探索客观规律的数量方法 。
2,统计学与数学的区别表现在两方面,一是统计研究的量是有计量单位的具体的量,而数学研究的量是没有量纲的抽象的量 。 二是统计学与数学研究中所使用的逻辑方法不同,统计研究是演绎与归纳的结合,
而数学所使用的是纯粹的演绎 。
(二)统计学与其他学科的关系统计方法是一种数量分析工具,它可以帮助其他学科探索各学科内在的数量规律性。但是对这种数量规律性的解释只能由各学科的研究完成。 返回第三节 统计学中的几个基本概念
一、总体与总体单位
二、标志
三、指标
四、变量
返回一、总体与总体单位(总体)
(一) 总体
1,概念总体是在同一性质基础上结合起来的许多个别事物的整体。
2、种类
( 1)有限总体:总体中的单位数是有限的。( 2)无限总体:总体中的单位数是无限
3、总体的特点
( 1)同质性:构成总体的各个单位至少具有某种相同的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。
( 2)大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。全国所有油田构成的总体,是由许多油田而不是个别油田组成。
( 3) 差异性:构成总体的各个单位在诸多方面是不同的。全国所有油田构 成的总体,虽然经济职能相同,但各油田的规模大小、经济效益、职工人数等是不同的。统计研究就是在大量性和同质性的基础上研究总体的差异性的。
(二) 总体单位构成总体的各个单位称为总体单位。
(三) 总体与总体单位不是固定的
随着研究目的和范围地改变,原来的总体(总体单位)可以变为总体单位(总体)。
返回二、标志
1,概念。
标志是说明总体单位特征的名称。
2,种类
( 1) 品质标志:说明总体单位质的特征,不能用数值表示。如果总体单位是一位学生,性别、籍贯、是否近视等是品质标志。
( 2) 数量标志:说明总体单位量的特征,是用数值表示的。年龄、身高、以百分制表示的学习成绩等是学生这个总体单位的数量标志
返回三、指标
( 一 ) 概念 。 指标是说明总体数量特征的名称及数值 。
( 二 ) 种类
1,数量指标:反映总体绝对数量多少的指标 。 全国所有的人口组成一个总体,2002年末全国总人口 128453万人,是一个数量指标 。 全国所有的工业企业组成一个总体,2002年国内生产总值 102398亿元是一个数量指标 。
其特点是指标数值随总体范围的扩大 ( 缩小 ) 而增大
( 减小 ) 。
2,质量指标:说明总体内部数量关系和总体一般水平的指标,一般表现为相对数和平均数 。 全国所有的人口组成一个总体,2002年全国人口出生率,性别比例,平均年龄是质量指标 。 其特点是指标数值大小不随总体范围的变化而增减 。
(三)指标体系
1,概念
具有内在联系的一系列指标构成的整体称为指标体系 。
2,表现形式
( 1) 以数学公式表现出来的指标体系,如:销售额
= 销售量 ×销售价格
( 2) 指标之间仅存在一种间接的相互依存关系,如衡量企业经济效益的若干指标所构成的指标体系 。
返回
(四) 指标与标志的关系
1,区别:
( 1)指标是说明总体特征的,标志是说明总体单位特征的。
( 2)指标都是用数值表示的,标志有用数值表示的和不用数值表示的。
2,联系:
( 1)综合关系,指标数值是总体单位的数量值综合而来的。
( 2)转换关系,由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标)
四、变量
1,概念
变量是可变的数量标志 。
2,种类
( 1) 按数值表现形式的不同,有只能用整数表示的离散型变量 ( 人数,企业数等 ) 和可以取任意小数的连续型变量 ( 销售额,身高等 ) 。
( 2) 按变量所受影响因素的不同,有影响因素是明确的,可以解释的确定性变量和影响因素是不确定的随机变量 。
返回 返回第二章 统计调查
第一节 统计调查方式
第二节 统计调查的具体方法
第三节 统计调查方案返回第一节 统计调查方式一、统计报表
( 一 ) 概念:统计报表是按照国家有关法规的规定,自上而下统一布置,自下而上地逐级提供基本统计数据的一种调查方式 。
( 二 ) 种类,1,按报送范围不同,有要求调查对象中每个单位都填报的全面报表和只要求调查对象中的一部分单位填报的非全面报表 。 2、
按报送的周期不同,有日报,月报,季报,年报等 。 3,按报表的内容和性质不同,有国家统计报表,部门统计报表,地方统计报表 。
二、普查
( 一 ) 概念:普查是为某一特定目的而专门组织的一次性全面调查 。
( 二 ) 特点,1,普查通常是一次性或周期性的 。
2,普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏 。 标准时间一般定在调查对象比较集中,变动相对较小的时间上 。
3 普查数据一般比较准确,规范化程度也较高 。
4,普查的适用对象比较狭窄,只能调查一些最基本,最一般的现象 。
三,抽样调查
抽样调查是从总体中随机抽取一部分单位进行调查,根据其调查结果推断总体数量特征的一种非全面调查方法 。
四,重点调查
重点调查是从全部单位中选择少数重点单位进行调查,以了解总体的基本情况 。
五,典型调查
是从研究对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查,用来揭示同类事物的本质规律性 。
返回第二节 统计调查的具体方法
一、观察法
调查者通过实际观察事情发生的经过和结果,得到自己所需要的资料。
二、询问法
调查者采用各种询问的方式向被调查者了解情况的一种方法。有( 1)面谈询问法( 2)邮寄法( 3)留置问卷法( 4)电话法
三、实验法
控制一个或几个变量,调查另外一个市场变量有关资料的方法。
四、报告法
被调查单位按照统一要求和表格形式,向有关部门提供统计资料的方法。 返回第三节 统计调查方案
一、确定调查目的
调查研究所要达到的具体目标,解决的问题,具有的社会经济意义。
二、确定调查对象、调查单位和报告单位
( 1)调查对象:根据调查目的所确定的调查研究的总体。( 2)调查单位:构成调查对象的每个单位。
( 3)报告单位:负责报告调查内容的单位。
返回
三、确定调查内容
调查内容一般调查表或问卷的形式出现。( 1)调查表有单一表和一览表。( 2)问卷是一种特殊的调查表,其内容是由一系列问句所构成的。问卷通常由说明词、主题问句、作业记录三部分组成。其中主题问句中的问句有开放式、对选式、多项选择式、顺位式等形式。
四、确定调查时间
包括时期资料所属的时期、时点资料所属的时点和调查工作的期限。
五、其他事项
包括调查所采用的方法、组织和实施的具体细则等事项。
返回 返回第三章 统计资料整理
通过本章的学习了解对原始资料进行加工的基本方法,重点掌握统计分组的方法和次数分布表的编制。
第一节 统计资料的预处理
第二节 统计分组
第三节 次数分布
第四节 统计表
返回第一节 统计资料的预处理一,资料的审核原始资料二手资料完整性准确性逻辑检查计算检查适用时效二、资料的排序第二节 统计分组
一、按分组标志个数不同
1、简单分组
2、复合分组
二、按分组标志性质不同
1、按品质标志分组
2、按数量标志分组返回一、按分组标志个数不同
1、简单分组
把总体只按一个标志分组。
2、复合分组
对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以 同时选择学科、学制,性别三个标志对某学院全体在校学生这个总体 进行分组。
返回举例,
理科学生组 文科学生组
本科学生组 本科学生组
男学生组 男学生组
女学生组 女学生组
专科学生组 专科学生组
男学生组 男学生组
女学生组 女学生组二、按分组标志性质不同
(一)按品质标志分组
(二)按数量标志分组
1、单项式分组:一个变量值表示
一个组的分组。适用于离散型变量
且变量的取值不多。例如,职工家
庭人口数,其取值不可能很多,且
每一个取值都可视为一种类型:
按家庭人口数分组
1人
2人
3人
4人
5人
6人
2、组距式分组
凡是用一定范围内的两个变量值表示一个组的分组。适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。
1)连续型变量的组距式分组如对商店按销售额进行分组,
按销售额分组 (万元 )
50以下
50—200
200—400
400—600
600—800
800以上
2)离散型变量的组距式分组
如对某企业的 20生产小组按人数分组:
生产小组按人数分组(人)
5—10
11—16
17—22
3)组距式分组中的有关问题
( 1)等距分组和异距分组
( 2)开口组和闭口组
( 3)上限、下限、组距
(4) (闭口组 )
(缺上限的开口组)
(缺下限的开口组)
返回
2
上限下限组中值
2
邻组组距下限组中值
2
邻组组距上限组中值
第三节 次数分布
一、次数分布的概念
在统计分组的基础上将总体的所有单位按组归类,
并把所有的组及其单位数按一定顺序排列起来,用以反映总体单位在各组的分布状况。
二、次数分布的表示
(一)列表法
(二)图示法
三、次数分布的主要类型
四、次数分布的编制
返回二、次数分布的表示
(一)列表法
1、某高校学生性别分布表性 别 人 数(人) 频 率( %)
男 732 57.14
女 549 42.86
合 计 1281 100.00
2、某厂工人日产量分布表按日产量分组
(件)
工人数(人) 比 率( %)
9 12 4.00
10 38 12.67
11 65 21.67
12 85 28.33
13 60 20.00
14 30 10.00
15 10 3.33
合 计 300 100.00
3、某班学生按考试成绩分组按成绩分组
(分)
人数(人) 比率( %)
60以下 7 8.8
60—70 21 26.2
70—80 25 31.2
80—90 19 23.8
90以上 8 10.0
合 计 80 100.0
(二 )图示法 1、直方图
(1)单式直方图
2002年我国旅客周转量 (亿人公里 )
0
2000
4000
6000
8000
ìú ì· ììì· ììì· ìììì
í?ü ×a á?
(2)复式直方图
1998—2002年我国进出口总额 (亿美元 )
0
1000
2000
3000
4000
1998 1999 2000 2001 2002
ú

2、折线图
0
20
40
60
80
100
í? 1
3、曲线图
0
20
40
60
80
100
ú í?
返回三、次数分布的主要类型
1、钟型分布
(1)对称的钟型分布
0
20
40
60
80
100
9 10 11 12 13 14 15
ìììì( ìì)
日产量 (件 )
(2)左偏分布
0
20
40
60
80
100
4 9 10 11 12 13 14
ìììì( ìì)
日产量
(件 )
(3)右偏分布
0
20
40
60
80
100
10 11 12 13 14 15 19
ìììì( ìì)
日产量
(件 )
2、U型分布
0
10
20
30
40
50
ì
¤ì
×
ì
ù
ì
à
ì
ìì
ê
ì
ìì
ê
ì
ì
ì
ìì
ê
ì
ì
ìììììì( % )
3,J型分布 (1)
0
20
40
60
80
100
120
ìè ìó ìì
价格返回
J型分布(2)
0
20
40
60
80
100
ìììììì
价格四、次数分布的编制
例如,某生产车间 50名工人日加工零件数如下:
117 122 124 129 139 107
117 130 122 125 108 131
125 117 122 133 126 122
118 108 110 118 123 126
133 134 127 123 118 112
112 134 127 123 119 113
120 123 127 135 137 114
120 128 124 115 139 128
124 121
编制过程
首先,对上面的数据进行排序
107 108 108 110 112 112 113
114 115 117 117 117 118 118
118 119 120 120 121 122 122
122 122 123 123 123 123 124
124 124 125 125 126 126 127
127 127 128 128 129 130 131
133 133 134 134 135 137 139
139
第二步,确定组数和组距 组数 =4
组距可以根据(最大值 -最小值) ÷组数 =8来确定,
组距 =10
第三步,计算各组次数、频率及累计次数、频率
50名工人日产零件数次数分布表按零件数分组次数 频率
( %)
向上累计 向下累计次数 频率
( %)
次数 频率
( %)
110
以下
3 6 3 6 50 100
110

120
13 26 16 32 42 84
120

130
24 48 40 80 20 40
130

10 20 50 100 4 8 返回第四节 统计表
一、统计表的结构
(一)外形结构:总标题、横标题、纵标题、数字资料
(二)内容结构:主词、宾词二、统计表的种类
(一)简单表
(二)分组表
(三)复合表返回一、统计表的结构我国 2002年国内生产总值按三次产业分 国内生产总值
(亿元)
比上年增长率 (%)
第一产业 14883 2.9
第二产业 52982 9.9
第三产业 34522 7.3
合 计 102398 8.0
横标题纵标题数字资料主 词 宾 词二、统计表的种类
(一)简单表 1、我国三个城市的人口数
(1990年 7月 1日 0时 )
城 市 人口数 (人 ) 较 1982年 7月 1
日 0时增长 %
北京市 10819407 17.21
天津市 8785402 13.15
上海市 13341896 12.50
2、我国199 8-2002拥有电话户数
(万户 )
年份 固定电话 移动电话
1998 8742 2386
1999 10872 4330
2000 14483 8453
2001 18037 14522
2002 21442 20662
(二)分组表(见表的结构) 返回
(三)复合表某年末某地区人口资料按城乡及性别分组人口数(万人) 增长率(%)
(与上年比)
城镇人口男性人口女性人口农村人口男性人口女性人口合 计返回 返回第四章 综合指标
通过本章的学习,要求学员在理解总量指标、
相对指标、平均指标、变异指标概念的基础上,
重点掌握各种指标的计算方法。
第一节 总量指标
第二节 相对指标
第三节 平均指标
第四节 变异指标
返回第一节 总量指标
一、总量指标的概念
总量指标是反映总体的总规模和总水平的综合指标。
二、总量指标的计量单位
1、实物单位自然单位度量衡单位简单单位双重单位复合单位2、货币单位
3、劳动单位(工时、工日)
三、总量指标的种类
(一)按其所反映的内容不同
1、总体单位总量指标:反映总体中单位数多少的。
2、总体标志总量指标:是反映总体中某种数量标志值总和的。
(二)按其所反映的时间状况不同
1、时期指标:反映现象在某一段时期内的总量。
2、时点指标:反映现象在某一时刻上的总量。
(三)按计量单位的不同
1、实物量指标
2、价值量指标
3、劳动量指标
返回第二节 相对指标
一、相对指标的概念
二、相对指标的表现形式
三、相对指标的种类及计算
(一)结构、比例相对指标
(二)比较、动态相对指标
(三)强度相对指标
(四)计划完成相对指标
返回
一、相对指标的概念
用对比的方法反映某些相关事物之间数量联系程度的指标。
二、相对指标的表现形式
(一)名数
(二)无名数
1、系数和倍数
2、成数
3、百分数
4、千分数
返回三、相对指标的种类及计算(结构、比例)
%100 总体中全部数值总体中的部分数值结构相对指标
%100 总体中另一部分数值总体中某一部分数值比例相对指标女生人数男生人数总人数男生人数如,
如,
(一 )
(二 )
另一条件下的同类数值某条件下的某类数值比较相对指标三?)(
大庆油田原油产量长庆油田原油产量如,
%100) 基期数值报告期数值动态相对指标(四年国内生产总值年国内生产总值如
2001
2002:
返回
(五 )强度相对指标
1、基本公式的指标数值另一有联系但性质不同某一指标数值?
2、作用
( 1)反映现象的强弱程度如,
( 2)反映现象的密度如:
( 3)反映现象的经济效益如,返回销售收入流通费用总额流通费用率?( % )
平均人数国内生产总值人均国内生产总值?
)()(
)(
千人人口数地全国商业机构数地全国商业网密度?
(六)计划完成相对指标
1、基本公式
2、短期计划的检查
( 1)计划任务数为绝对数
某企业计划规定本年度销售收入达到 1000万元,
实际为 950万元,计划完成相对指标为
%100 计划数实际完成数计划完成相对指标
%10 0 计划绝对水平实际绝对水平计划完成相对指标
%951000950?
( 2)计划任务数为平均数
某企业计划某种产品单位成本为 50元,实际为 45元,计划完成相对指标为
%10 0 计划平均水平实际平均水平计划完成相对指标
%905045?
( 3)计划数为相对数
某企业计划劳动生产率今年比去年提高 10%,实际提高了 15%。计划完成相对指标为
(正指标)
某企业计划某种产品成本今年比去年降低 5%,实际降低了 6%。计划完成相对指标为
(逆指标)
%100%% 计划规定实际完成计划完成相对指标
%5.104%110%115?
%95.98%95%94?
3、中长期计划任务的检查
( 1)水平法:
当计划任务是以计划期期末(最后一年)应达到的水平下达的,检查计划执行情况用水平法。
确定提前完成计划的时间:如果计划期内有连续一年的实际数,达到计划规定最后一年应达到的水平,
后面所余的时间就是提前完成计划的时间。
%1 0 0 平计划任务规定的期末水 水平计划期期末实际达到的计划完成相对指标
( 2)累计法
当计划任务是以计划期全期累计应达到的水平下达的,
检查计划执行情况用累计法。
确定提前完成计划的时间:从计划期开始至某一时间所累计完成的实际数达到了计划规定的累计数,以后的时间就是提前完成计划的时间。
返回
%1 0 0 计划规定全期累计数 数计划全期实际完成累计计划完成相对指标第三节 平均指标
平均指标(平均数)是反映现象的一般水平或平均水平的指标。它具有代表性和抽象性。根据掌握资料、研究目的及现象性质不同,有多种计算方法。重点掌握,H,G。
一、算术平均数
二、调和平均数
三、几何平均数
四、中位数
五、众数
六、切尾平均数和温氏化平均数
七、各种平均数的比较
返回
x
一、算术平均数( )
(一)简单 算术平均数
(二)加权算术平均数
1、根据单项数列计算的
2、根据组距数列计算的
3、用比重权数计算的加权算术平均数
4、根据相对数(平均数)计算的加权
5、是非标志的平均数
(三) 的数学性质
(四) 的应用条件
返回
x
x
x
x
(一)简单算术平均数计算公式,
应用条件:资料未分组,各组出现的次数都是 1。
举例,5名学生的学习成绩分别为,75,91、
64,53,82。则平均成绩为:
返回
n
x
n
xxxxx n321
分平均成绩 7353 6 558253649075
(二)加权算术平均数
1、根据单项数列计算的
计算公式:
应用条件:单项式分组,各组次数不同。
fxff fxfxfxfxx nn332211
举例
某车间 20名工人加工某种零件资料:
按日产量分组
(件) x
工人数(人)
f
日产总量 xf
14 2 28
15 4 60
16 8 128
17 5 85
18 1 18
合计 20 319
件平均日产量
16
20
319
返回
2、根据组距数列计算的应用条件:组距式分组,各组次数不同。
举例:某车间 200名工人日产量资料:
按日产量分组
(公斤)
工人数 f 组中值 x 日产总量 xf
20—30 10 25 250
30—40 70 35 2450
40—50 90 45 4150
50—60 30 55 1650
合 计 200 — 8400
公斤平均日产量
42
200
8 4 0 0
返回
3、由比重权数计算的
应用条件:已知的是比重权数(次数是比重)
公式:
举例:(仍用上例)

ffxffxffxffxffxx nn332211
按日产量分组(公斤)
人数比重
( %)
组中值 x
20—30 5 25
30—40 35 35
40—50 45 45
50—60 15 55
ff
)(42
%1555%4545
%3535%525
公斤平均日产量


返回
4、根据相对数(平均数)计算的加权
( 1)根据相对数计算的
某局所属的三个企业的资料:
x
企业 产值计划完成 %
x
计划产值(万元) f
实际产值(万元) xf
甲 95 300 285
乙 105 900 945
丙 115 300 345
合 计 — 1500 1575
%1 0 5
1 5 0 0
1 5 7 5
)f(
)xf(
%
计划产值实际产值平均计划完成
( 2)根据平均数计算的
某企业各班组工人劳动生产率资料,
班组平均劳动生产率 x
实际工时
f
产品产量
(件 ) xf
一 10 100 1000
二 12 200 2400
三 15 300 4500
四 20 300 6000
五 30 200 6000
合计 — 1100 19900
)(09.18
1100
1 9 9 0 0
)f(
)xf(
工时件车间实际工时车间产品产量平均劳动生产率
返回
5、是非标志的平均数
是非标志,如果按照某种标志把总体只能分为具有某种特征的单位和不具有该种特征的单位两部分,这个标志就是是非标志。
平均数的计算:把具有某种特征的用,1”表示,不具有该种特征的用,0”表示。
是非标志
x
单位数 f 比重
1
0
合 计 N 1
0N
1N
ff
pNN 1?
qNN 0? P
N
N0N1
f
xf
x
01

是返回
(三)算术平均数的数学性质
1、各个变量值与其平均数离差之和等于零
2、各个变量值与其平均数离差平方之和为最小值
0xx
最小值 2xx
0f)xx(
最小值 fxx 2
xx?0设 cxx0


22
22
2
22
0
)(
)(2)(
)(
)()(
ncxx
ncxxcxx
cxx
cxxxx






为最小值2
22
0
2
)(
)()(
0



xx
xxxx
nc?
性质 (3,4)
3、给每个变量值增加或减少一个任意数 A,则算术平均数也相应增增加或减少这个任意数 A。
4、给每个变量值乘以或除以一个任意数 A,则算术平均数也相应扩大或缩小 A倍。
Ax
n
Ax Ax
f
fAx
xAnAx xA1nA
x
xAfA x f?
x
A
1
f
fAx
返回
(四)算术平均数的适用范围
1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分母资料,在这种情况下,
反映现象的平均水平用算术平均数。
2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,
而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。
返回二、调和平均数( H)
(一 )简单调和平均数
计算公式,
应用条件:资料未分组,各个变量值次数都是 1。
举例,一个人步行两里,走第一里时速度为每小时候 10里,走第二里时为每小时 20里,则平均速度为:

x
1
x
1
x
1
x
1
x
1
nnH
n321
)(31132
20
1
10
1 小时里?
(二)加权调和平均数
计算公式:
应用条件:资料经过分组,各组次数不同。
例 1:


x
m
n
n
3
3
2
2
x
m
n321 m
x
m
x
m
x
m
mmmm
H
1
1
速度
x
行走里程
m
所需时间
20 1
15 2
10 3
合计 6
)( 小时里
xm
201
152
103
103152201
)(
29
12
12
6
10
3
15
2
20
1
小时里平均速度

例 2
按日产量分组(件) x
日产总量
m
工人数(人)
14 28 2
15 60 4
16 128 8
17 85 5
18 18 1
合计 319 20
xm
已 知
)(16
20
319
件平均日产量
例 3
某局所属的三个企业的资料:
企业 产值计划完成 %
x
计划产值(万元)
实际产值(万元) m
甲 95 300 285
乙 105 900 945
丙 115 300 345
合 计 — 1500 1575
xm
已知 已知
%105
1500
1575
)(
)m(
%
x
m
计划产值实际产值平均计划完成例 4
某车间各班组工人劳动生产率资料,
班组平均劳动生产率 x
实际工时产品产量 (件 )
m
一 10 100 1000
二 12 200 2400
三 15 300 4500
四 20 300 6000
五 30 200 6000
合计 — 1100 19900
xm
已知 已知
)(09.18
1100
19900
)
x
m
(
)m(
工时件车间实际工时车间产品产量平均劳动生产率
返回
(三)调和平均数的适用范围
1,当变量值是绝对数时,变量值之间是和的关系,而且已知的是分子资料,在这种情况下,
反映现象的平均水平用调和平均数。
2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,
而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。
返回三、几何平均数( G)
(一)简单几何平均数
计算公式:
应用条件:资料未分组(各变量值次数都是 1)。
举例:某企业生产某种产品需经过三个连续作业车间才能完成。
nn n321 xxxxxG
车间 投入量 产出量 合格率
% x
一 1000 800 80
二 800 720 90
三 720 504 70
33 %450%70%90%80三个车间平均合格率
1 0 0 0
5 0 4
7 2 0
5 0 4
8 0 0
7 2 0
1 0 0 0
8 0 0
%70%90%80


(二)加权几何平均数
计算公式:
应用条件:资料经过分组,各组次数不同。
举例:将一笔钱存入银行,存期 10年,以复利计息,10年的利率分配是第 1年至第 2年为 5%、第 3年至 5年为 8%、
第 6年至第 8年为 10%、第 9年至第 10年 12%,计算平均年利率 设本金为
f ff fnf3f2f1 xxxxxG n321
0x
年份 累计存款额 本利率 %
第 1年 105%
第 2年 105%
第 3年 108%
… … …
第 10年 112%
%1 0 5%5 000 xxx
2000 %105%5%105%105 xxx
%1 0 8%1 0 5%8%1 0 5%1 0 5 202020 xxx
23320 %112%110%108%105x
%771 0 8
%1 1 2%1 1 0%1 0 8%1 0 5
10 2332


平均本利率本利率 x 年数 f
105% 2
108% 3
110% 3
112% 2
合 计 10
平均年利率 =8.77%
(三 )几何平均数的适用范围
当变量值是相对数,而且变量值之间存在连乘关系,反映现象的一般水平用几何平均数。
返回四、中位数( )
把某一标志值按大小顺序排列起来居于中间位置的那个数就是中位数。
(一)由未分组资料确定中位数
1、标志值的个数是奇数
例,7名工人生产某种产品,日产量(件)分别为
4,6,6,8,9,12,14。位于中间位置的第四名
( )工人的日产量 8件为中位数。
2、标志值的个数是偶数
上例增加为 8名工人,日产量为 4,6,6,8,9、
12,13,14。中位数为,其位
置在第四和第五名中间 ( )
em
)(58298 件
4217
54218
(二)由单项数列确定中位数
例:
中位数为第 40 名和 41名日产量的平均值
[ ]
按日产量分组
(件) x
工人数
(人) f
累计次数向上累计向下累计
20 10 10 80
22 15 25 70
24 30 55 55
26 25 80 25
合计 80 — —
)(2422424 件
(三)由组距数列确定中位数
1、计算公式
)(d
f
s
lm
e
e
e
e m
m
1m2
f
me 下限公式?

)(d
f
s
um
e
e
e
e m
m
1m2
f
me 上限公式?

2、举例年人均纯收入
(千元)
农户数
(户)
向上累计次数
5以下 240 240
5—6 480 720
6—7 1100 1820
7—8 700 2520
8—9 320 2840
9以上 160 3000
合计 3000 —
)(7161
1100
720
2
3000
6 千元
em 返回
(1)计算累计次数
(2)确定中位数组 (6—7)
(3)确定中位数数值
1500-720=780(户 )
6 X 7
1 780 1100
1500230002 f
em
1100 1
780 X
五、众数( )
总体中出现次数最多的标志值是众数。
(一)由未分组资料确定众数
例,7名工人日产量(件)为 4,5,6,6,6,7,8。
则众数是 6。
(二)由单项数列确定众数
0m
按日产量分组(件)
工人数
(人)
20 15
21 30
22 20
23 10
)(21m o 件?
(三)由组距数列确定众数
1、计算公式:
)(d)ff()ff(
ff
lm
0
0000
00
0 m
1mm1mm
1mm
m0 下限公式



)(d)ff()ff(
ff
um
0
0000
00
0 m
1mm1mm
1mm
m0 上限公式



2、举例年人均纯收入(千元)
农户数(户)
5以下 240
5—6 480
6—7 1100
7—8 700
8—9 320
9以上 160
合计 3000
( 1)确定众数组
( 6—7)
( 2)计算众数
L x u
)(6161)7 0 01 1 0 0()4 8 01 1 0 0( 4 8 01 1 0 060 千元m
返回
0m
lu
x
ffff
ff
mmmm
mm o

)()(
2010
1
1)7 0 01 1 0 0()4 8 01 1 0 0(
4 8 01 1 0 0 x?

六、切尾平均数和温氏化平均数
( 一)切尾平均数
将变量值两端的个别极值切去,对中间的变量值进行平均。
(二)温氏化平均数
1、四分位数:将数值由小到大排列,分成四等份,得到三个分割点,每个分割点对应的数值是四分位数。
在 处,在 处,在 处。
例:流行歌比赛中,11名评委对某歌手的打分分别为 8.0
9.0 9.1 9.2 9.2 9.3 9.4 9.4 9.4 9.5 9.8
在 处,在 处在 处
2、温氏化平均数
1Q 2Q 3Q41?n 4)1(2?n 4)1(3?n
1Q 2Q
3Q
34111 1.91?Q 62111
3.92?Q 94)111(3 4.93?Q
)(27911 54939229319 分x
返回六、各种平均数的比较
(一)各种平均数的特点及应用场合
是就全部数据计算的,具有优良的数学性质,
实际中应用最为广泛。其主要缺点是易受极端值的影响,对偏态分布其代表性较差。
H主要用于不能直接计算 的数据易受极端值的影响。
G主要用于计算比率数据的平均数,易受极端值的影响。
不受极端值大小的影响,对偏态分布其代表性较 好。但不是根据所有的变量值计算的,
不受极端值的影响,对偏态分布其代表性较好,但不是根据所有的变量值计算的,
x
x
em
x
0m
(二) 的关系x em 0m
x em 0m xem0m0e mmx
对称分布 左偏分布 右偏分布返回第四节 变异指标
变异指标是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。
一、绝对数形式
(一)全距
(二)平均差
(三)标准差
(四)适用条件
二、相对数形式
返回一、绝对数形式的变异指标
(一)全距( R)
公式,R =最大值 —最小值
优点:计算简便
缺点:易受极端值的影响
举例,5名学生的成绩为 50,69,76,88,97
则 R=97-50=47
(二)平均差( A.D)
1、简单平均差
公式:
应用条件:资料未分组,各变量值出现的次数为 1。
举例,5名工人日产量资料
n
xxDA
日产量 (件 )
20 3
22 1
23 0
24 1
26 3
合计 8
xx?
)(235 2624232220x 件
)(6158DA 件
2、加权平均差
公式:
应用条件:资料经过分组,各组次数不同。
举例:前例,

f
fxxDA
按日产量分组(公斤)
工人数
f
组中值 x
20—30 10 25 170
30—40 70 35 490
40—50 90 45 270
50—60 30 55 390
合 计 200 — 1320
)(42x 公斤?
fxx?
公斤)(66
2 0 0
1 3 2 0
DA


3、平均差的优缺点
优点:平均差是根据全部数值计算的,受极端值影响较全距小。
缺点:由于采取绝对值的方法消除离差的正负号,应用较少。
返回
(三)标准差( )
1、简单标准差
公式:
应用条件:资料未分组,各组次数都是 1。
举例:前例,
n
)xx( 2
日产量(件)
20 9
22 1
23 0
24 1
26 9
合计 20
2)xx(?
)(23x 件?
)(2520 件σ
2、加权标准差
公式:
应用条件:资料经过分组,各组次数不同。
举例:前例,

f
f)xx( 2
)(42x 公斤?
日产量
(公斤)
工人数
f
组中值
x
20—30 10 25 2880
30—40 70 35 3430
40—50 90 45 810
50—60 30 55 5070
合 计 200 — 12190
f)xx( 2?
)(817
9560
200
1 2 1 9 0
公斤


3、是非标志的标准差
如前:是非标志的平均数为 P。
标志值 x 单位数 f
1
0
合计 N
f)xx( 2?
1N
0N
12 N)P1(?
02 N)P0(?
)P1(P
N
NPN)P1(
0
2
1
2



由于标准差有良好的数学性质,相比较而言,
它的应用最为广泛。
返回
(四)绝对数形式变异指标的适用条件
当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的代表性,用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。
返回二、相对数形式的变异指标
公式:有全距系数、平均差系数和标准差系数,应用最广泛的是标准差系数,其公式为:
举例:甲组日产量(件)为,60 65 70 75 80。
乙组日产量(台)为,2 5 7 9 12。
%100xv
组别 平均数 标准差 标准差系数 %
甲 70(件) 7.07(件 ) 10.1
乙 7(台) 3.41(台 ) 48.7
相对数形式变异指标的适用条件
当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平的代表性,
用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。
返回 返回第五章 动态数列分析
本章主要介绍如何根据动态数列进行动态分析,
动态分析包括两方面,一是计算各种动态分析指标,反映现象在某一段时期内发展变化的水平和速度。二是测定现象发展变化的规律性,
对未来状况作出预测。重点掌握动态分析指标。
第一节 动态数列的概念和种类
第二节 动态分析指标
第三节 动态数列的趋势分析
返回第一节 动态数列的概念和种类
一、概念
将一系列指标数值按时间先后顺序排列起来所形成的数列。
二、种类
(一)绝对数动态数列
1、时期数列
2、时点数列
(二)相对数动态数列
(三)平均数动态数列返回第二节 动态分析指标
一、动态分析的水平指标
(一)发展水平
(二)平均发展水平二、动态分析的速度指标
(一)增长量
(二)平均增长量
(三)发展速度
(四)增长速度
(五)增长 1%的绝对值
(六)平均发展速度和平均增长速度返回一、动态分析的水平指标
(一)发展水平
是动态数列中每一项具体的指标数值。
假如动态数列为:
叫最初水平,叫最末水平。
0a 1a 2a 1na? na
0a na
(二)平均发展水平
1、根据绝对数动态数列计算的
<1> 根据时期数列计算的
<2> 根据时点数列计算的
①根据连续性时点数列计算的
间隔相等 间隔不等
②根据间断性时点数列计算的
间隔相等 间隔不等
2、根据相对数动态数列计算的
3、根据平均数动态数列计算的
1、根据绝对数动态数列计算的
〈 1〉 根据时期数列计算的
例,1998-2002年我国国内生产总值(亿元)为
78345 82067 89442 95933 102398,则
平均国内生产总值为
n
aa
亿元)(8 9 6 3 7
5
4 4 8 1 8 5
5
1 0 2 3 9 89 5 9 3 38 9 4 4 28 2 0 6 77 8 3 4 5
a


〈 2〉 根据时点数列计算的
① 连续性时点数列
某养猪场 1—5日生猪存栏头数为 1300 1400 1550
1550 1600则平均生猪存栏头数为
( 1300+1400+1550+1550+1600) ÷5=1480(头)
某商品价格自 4月 11日起从
70元降为 50元,4月份平均价格
)(n aa 间隔相等
(间隔不等)

f
afa
(元)57
30
20501070
a

返回
② 间断性时点数列
间隔相等
4月份平均库存额 =
5月份平均库存额 =
6月份平均库存额 =
第二季度的平均库存额
1n
2
aaa
2
a
a
n
1n2
1


日期 3.31 4.30 5.31 6.30
库存额(万元) 20 16 18 17.6
)(6.17
3
2
6.171816
2
20
a 万元?

1821620
1721816
817261718
间隔不等

f
f
2
aaf
2
aaf
2
aa
a
n
n1n
2
32
1
21?
日期 12.31 1.31 3.31 6.30
人数 1000 1050 1070 1100
返回
1月份 平均人数 =
1 0 2 521 0 5 01 0 0 0
2,3月份 平均人数 = 1 0 6 021 0 7 01 0 5 0
4,5,6月份 平均人数 = 1 0 8 521 1 0 01 0 7 0
1 0 6 7
6
321 1 0 01 0 7 0221 0 7 01 0 5 0121 0 5 01 0 0 0

a
2、根据相对数动态数列计算的平均发展水平
<1>基本公式
<2>由两个时期数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平
<3>由两个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平
①由两个连续性时点数列
②由两个间断性时点数列
<4>由 1个时期和 1个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平
返回
b
ac?
<2>由两个时期数列各对应指标的比值所形成的
平均计划完成 %
)ab(
b
a
n
b
n
a
b
ac 已知
)bc(bbcc 已知
)ac(
a
c
1
ac 已知
10月 11月 12月实际产量 (吨 )a 500 618 735
计划产量 (吨 )b 500 600 700
计划完成 %c 100 103 105
7 0 06 0 05 0 0
7 3 56 1 85 0 0c


70 060 050 0
%10 570 0%10 360 0%10 050 0c


%1 0 57 3 5%1 0 36 1 8%1 0 05 0 0
7 3 56 1 85 0 0c


返回
<2>由两个时点数列各对应指标的比值所形成的
①由两个连续性时点数列
间隔相等 (公式同时期 )
间隔不等平均非生产人员 %

bf
af
f
bf
f
af
b
ac
日期 1.1-2.9 2.10-3.4 3.5-3.31
全部人数 b 100 110 105
非生产人数 a 25 26 24
非生产人员 %c 25 24 23
间隔日数 f 40 23 27
%98.23271052311025100 272423264025c
返回
② 由两个间断性时点数列
间隔相等平均生产工人 %
间隔不等
2
bbb
2
b
2
aaa
2
a
b
a
c
n
1n2
1
n
1n2
1



日期 1月末 2月末 3月末 4月末生产工人数 a 435 452 462 576
全部工人数 b 580 580 600 720
生产工人 %c 75 78 77 80
%5.77
2
720600580
2
580
2
576462452
2
435
c?


1n
n1n
2
32
1
21
1n
n1n
2
32
1
21
f
2
bb
f
2
bb
f
2
bb
f
2
aa
f
2
aa
f
2
aa
c


返回
<4>1个时期和 1个时点数列各对应指标比值形成的
第四季度平均每人增加值
2
bb
2
b
a
b
ac
n21

日期 9月 10月 11月 12月工业增加值 (万元 )a 32 34 36
月末人数 b 600 612 618 630
26 3 06 1 86 1 226 0 0
363432c


返回
3、根据平均数动态数列计算的平均发展水平
<1>根据一般平均数计算的
第一季度人均工资 bac?
日期 上 12月 1月 2月 3月工资总额 (万元 )a 12.5 12.8 13.2
月末人数 b 200 215 220 240
2
2 4 02 2 02 1 5
2
2 0 0
2.138.125.12
2
b
bb
2
b
a
c
n
1n2
1



<2>根据序时平均数组成的平均数动态数列
例 1:已知各季平均人数为 351 353 352 350则全年平均人数为
例 2:某企业人数,1月份平均 452,2,3月平均 455,
第二季度平均每月 458,则上半年平均人数为
4
35 035 235 335 1
6
345824551451
返回二、动态分析的速度指标 (一)增长量
1、公式:增长量 =报告期水平 —基期水平
2、种类:累计增长量 =报告期水平 —最初水平
逐期增长量 =报告期水平 —前期水平
3、关系:逐期增长量之和等于相应时期累计增长量
相邻两个 累计增长量之差等于相应时期逐期增长量
01 aa? 12 aa? 23 aa 1nn aa
01 aa? 02 aa? 03 aa 0n aa?
0n1nn231201 aaaaaaaaaa
1nn01n0n aa)aa()aa(
返回
(二)平均增长量逐期增长量个数逐期增长量之和平均增长量?
n
aa
n
aaaaaa
0n
1nn1201


平均增长量返回
(三)发展速度
1、公式:
2、种类:
3、关系基期水平报告期水平发展速度?
定基发展速度
0
1
a
a
1
2
a
a
2
3
a
a
0
2
a
a
0
3
a
a
1n
n
a
a
0
n
a
a
0
1
a
a环比发展速度
0
n
1n
n
1
2
0
1
a
a
a
a
a
a
a
a

1n
n
0
1n
0
n
a
a
a
a
a
a

返回
(四)增长速度
1、公式
2、种类
定基增长速度
环比增长速度
3、关系
增长速度 =发展速度 -1
返回基期水平增长量增长速度?
0
01
a
aa?
0
02
a
aa
0
0n
a
aa?
0
01
a
aa?
1
12
a
aa?
1n
1nn
a
aa

(五)增长 1%的绝对值
指报告期比基期每增长 1%所包含的绝对量。
公式
思路
1 0 0( % )%1
基期水平增长速度增长量的绝对值增长
增长速度( %) 增长量
1% x(增长 1%绝对值)
返回
(六)平均发展速度和平均增长速度 ( =平均发展速度 -
1)
1、几何平均法
这种方法适宜于如产量、总值等水平指标平均发展速度的计算。
例 某地区 1995—2000年粮食产量(万吨)资料如已知各年产量分别为 320 332 340 356 380 395则如已知各年的发展速度为 104% 102% 105% 107% 104%则
如已知 2000年是 1995年的 123%则
nn n321 Rxxxxx n 0
nn
1n
n
1
2
0
1
a
a
a
a
a
a
a
ax
55 320395380395356380340356332340320332x
5 %104%107%105%102%104x
5 %12 3x?
2、方程式法当 时递增
当 时递减 查相应递增或递减表,
根据 的大小得到平均增长速度。
这种方法适宜于如基本建设投资总额、植树造林总面积等表示国民财产存量的指标平均速度的计算。
返回
aaaaa n321 axaxaxa n0200?
0
n2
a
axxx
1a an1
0

1a an1
0

0a
a?
第三节 动态趋势分析
一、动态数列变动因素的分解与模式
二、长期趋势的测定
(一)时距扩大法
(二)移动平均法
(三)数学模型法
三、季节变动的测定
(一)按月(季)平均法
(二)趋势剔除法
返回一、动态数列变动因素的分解与模式
(一)分解
1、长期趋势( ):是现象在一个相当长的时期内持续发展变化的方向性趋势。它是由各个时期普遍起作用的根本性因素所决定的。
2、季节变动( S):是一年以内有一定周期的每年重复出现的变动。它是由季节变换和社会习俗等因素影响而发生的。
3、循环变动( C):指现象因某种原因而发生的周期较长的涨落起伏的波动。
4、不规则变动( I):指由于意外的、临时的、偶然的因素作用而引起的非周期性的或非趋势性的随机变动。
(二)模式
cy
ICSyy C
二、长期趋势的测定
(一)时距扩大法
某商场某年商品销售额资料 (万元 )
月份 1 2 3 4 5 6 7 8 9 10 11 12
销售额 50 55 48 46 56 57 56 52 57 54 60 66
指标 一季 二季 三季 四季商品销售额(万元) 153 159 165 180
平均月销售额(万元) 51 53 55 60 返回
(二)移动平均法 返回年份 粮食产量 3年移动 4年移动 4年移正
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2.86
2.83
3.05
3.32
3.21
3.25
3.54
3.87
4.07
3.79
__
2.91
3.07
3.19
3.26
3.00
3.55
3.82
3.91
__
3.02
3.09
3.21
3.06
3.15

(三 )数学模型法
1、直线趋势测定
(1)确定动态数列是否有直线趋势。用散点图或一次增量大致相等。
( 2)假设方程
( 3)计算 a,b两个参数。用最小平方法。
从 出发,得到:
bxay c
最小值 2c )yy(




2tbtaty
tbnay



22 )x(xn
yxxynb xbya

2tbty
nay
)0t(
举例:某地粮食产量 (万公斤 )资料(计算表)
年份 y t ty t ty
1993 230 1 1 250 -9 81 -2070
1994 236 2 4 472 -7 49 -1652
1995 241 3 9 723 -5 25 -1205
1996 246 4 16 984 -3 9 -738
1997 252 5 25 1260 -1 1 -252
1998 257 6 36 1542 1 1 257
1999 262 7 49 1834 3 9 786
2000 276 8 64 2208 5 25 1380
2001 281 9 81 2529 7 49 1967
2002 286 10 100 2860 9 81 2574
合计 2567 55 385 14642 0 330 1047
2t 2t
a,b两个参数的计算
把上表第一种编码的有关资料代入方程
2567=10a+b×55
得,14642=55a+b×385
计算得,a=221.78 b=6.35
趋势方程为,y=221.78+6.35t
预测 2003年产量,y=221.78+6.35×11=291.63(万公斤 )
把第二种编码资料代入方程,
得,2567=10a a=256.7
1047=330b b=3.17
趋势方程为,y=256.7+3.17t




2tbtaty
tbnay

2tbty
nay
2、曲线趋势的测定(指数曲线)
步骤:
( 1)确定动态数列是否有指数曲线趋势,用散点图或各期环比速度大致相等。
( 2)假设指数曲线方程
( 3)计算 a,b两个参数
1)把指数曲线转化为直线 ㏒ =㏒ a+t㏒ b
Y=A+Bt
2)计算 A,B两个参数(用最小平方法)
3)计算 a,b
tc aby?
cy

2tBtY
nAY
例题(某省发电量资料计算表)
年份 发电量 ㏒ y(Y) t t㏒ y(tY)
1996 130.37 2.11518 -3 9 -6.3455
1997 146.32 2.16530 -2 4 -4.3306
1998 147.52 2.16885 -1 1 -2.1689
1999 167.13 2.23305 0 0 0
2000 180.50 2.25648 1 1 2.2565
2001 221.83 2.34602 2 4 4.6920
2002 267.97 2.42809 3 9 7.2843
合计 __ 15.70297 0 28 1.3878
2t
计算 a,b
把上表有关资料代入方程
得 A=2.2433 B=0.0496
查反对数表得 a=175.1 b=1.121
指数曲线方程为返回

2tBtY
nAY
tc )121.1(1.175y
三、季节变动的测定 (一)按月 (季 )平均法
(某禽蛋加工厂增加值资料 万元 )
月份 1 2 3 4 5 6 7 8 9 10 11 12
第一年 10 50 80 90 50 20 8 9 10 60 50 20
第二年 15 54 85 93 51 22 9 9 11 75 54 22
第三年 22 60 88 95 56 23 9 10 14 81 51 23
第四年 23 64 90 99 60 30 11 12 15 85 59 25
第五年 25 70 93 98 62 32 13 14 19 90 61 28
月平均数
19 60 87 95 56 25 10 11 14 78 56 24
季节比率 %
43 134 196 213 125 57 22 24 31 176 126 53
季节比率的计算季节比率的计算如,
返回
)(45
245678141110255695876019
万元总平均数

%434519一月份季节比率
%1 3 44560二月份季节比率
%534524十二月份季节比率
(二)移动平均趋势剔除法
(某地保暖内衣零售量 万件)
年份
1999 2000 2001
季度 1 2 3 4 1 2 3 4 1 2 3 4
售量
( 1)
40 200 300 30 50 250 330 40 60 300 400 50
143 145 158 165 168 170 183 200 203
__ __ 144 151 161 166 169 176 191 201 __ __
__ __209 20 31 150 196 23 31 149 __ __
4项移动平均( 2)
4项移正平均( 3)
比率 %
)3()1()4(?
季节比率计算表 %
年份季 第一季度 第二季度 第三季度 第四季度 平均
1999
2000
2001
__
31
31
__
150
149
209
196
__
20
23
__
平均 31 149.5 202.5 21.5 101.2
季节比率
30.7 147.8 200.2 21.3 100
%2.1 0 14 %5.21%5.2 0 2%5.1 4 9%31总平均数
%7.30%2.101 %31第一季度季节比率 返回返回第六章 统计指数
通过本章的学习,要求学员在理解指数基本概念的基础上,掌握各种指数的编制及因素分析方法,重点掌握两因素的综合指数因素分析及平均指标指数因素分析。
第一节 指数的基本问题
第二节 综合指数
第三节 平均式指数
第四节 平均指标指数
第五节 指数体系及因素分析返回第一节 指数基本问题
一、概念
反映不能直接相加的复杂现象综合变动程度的相对数。
二、作用
1、综合反映复杂现象总体数量变动的方向和程度
2、利用指数体系进行因素分析
3、根据指数数列反映现象的变动趋势三、指数的种类
(一)按其所说明的对象范围不同
1、个体指数:反映个别现象变动的相对数。如
2、总指数:反映总体现象综合变动的相对数。
(二)按其所反映的指标性质不同
1、数量指标指数 2、质量指标指数
(三)总指数按对比的指标形式不同
1、综合指数 2、平均式指数 3、平均指标指数
(四)按编制任务不同
1、时间指数 2、区域指数 3、计划完成程度指数
0
1
q q
qk?
0
1
p p
pk?
0
1
z z
zk?
qk pk
qk pk
第二节 综合指数
一、综合指数编制的基本方法
(一)数量指数编制方法
(二)质量指数编制方法
二、综合指数的其它编制方法
三、综合指数的应用
(一)成本计划完成指数
(二)价格区域指数
返回一、综合指数编制的基本方法
(一)数量指数的编制 (某商店资料 )
商品 销量 价格
(元 )
销售额 (元 )
甲 (公斤 )
50 62.5 20 14 1000 1250
乙 (套 ) 75 90 10 8 750 900
丙 (件 ) 100 115 5 5 500 575
合计 __ __ __ __ 2250 2725
0q 1q 0p 1p 00pq 01pq
举例:计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。
%11.121
2 2 5 0
2 7 2 5
pq
pq
k
00
01
q

)(4 7 5
2 2 5 02 7 2 5
pqpq 00o1
元?


数量指数的编制原则
在编制数量指数时,即计算数量指标综合变动程度时,需要加入质量指标作为同度量因素,
而且把这个同度量因素固定下来,固定在基期。
返回
(二)质量指数编制方法商品 销售量 价格
(元 )
销售额 (元 )
甲 (公斤 )
50 62.5 20 14 875 1250
乙 (套 ) 75 90 10 8 720 900
丙 (件 ) 100 115 5 5 575 575
合计 __ __ __ __ 2170 2725
0q 1q 0p 1p 01pq11pq
举例:计算三种商品价格的综合变动程度及由于价格变动使销售额变动的绝对额。
%63.79
2725
2170
pq
pq
k
01
11
p

)(5 5 5
2 7 2 52 1 7 0
pqpq 0111



质量指数的编制原则
在编制质量指数时,即计算质量指标综合变动程度时,需要加入数量指标作为同度量因素,
而且把这个同度量因素固定下来,固定在报告期。
返回二、综合指数的其它编制方法
(一)拉氏公式
(二)派氏公式
(三)马艾公式
(四)费喧公式
(五)固定权数

00
01q
pq
pqk

00
10p
pq
pqk

10
11q
pq
pqk

01
11p
pq
pqk
)
2
pp
(q
)
2
pp
(q
k
01
0
01
1
q
)
2
qq
(p
)
2
qq
(p
k
01
0
01
1
p

10
11
00
01p
qp
qp
qp
qpk

10
11
00
01q
pq
pq
pq
pqk

n0
n1q
pq
pqk

n0
n1p
qp
qpk
返回三、综合指数的应用
(一)成本计划完成指数
某企业成本资料单位成本(元)
产量 总成本(元)

(台)
190 195 400 340 7600 78000

(件)
44 42 800 1000 35200 33600
合计 — — — — 111200 111600
nz 1z nq 1q nnzq 1nzq
计算两种产品成本计划综合完成程度及总成本增减额
%36.1 0 0
1 1 1 2 0 0
1 1 1 6 0 0
zq
zq
k
nn
1n
z
)(400
1 1 1 2 0 0
1 1 1 6 0 0
zqzq
nn1n
元?


返回
(二)价格区域指数
甲乙两地某日几种农副产品市场资料商品甲地区 乙地区 贸易额(元)
1 40 300 50 200 20000 25000
2 30 100 20 300 12000 8000
3 25 30 25 35 1625 1625
合计
— — — — 33625 34625
甲p 乙p 乙q甲q qp甲 qp乙乙甲 qqq
计算甲乙两地三种产品价格的综合比较程度
%11.97
3 4 6 2 5
3 3 6 2 5
qp
qP
k )(

乙甲甲比乙
%97.1 0 2
3 3 6 2 5
3 4 6 2 5
qp
qp
k )(
甲乙乙比甲返回第三节 平均式指数
一、基本编制方法
(一)加权算术平均式指数
(二)加权调和平均式指数
二、应用
(一)零售物价指数
(二)农产品收购价格指数
(三)工业生产指数
返回一、基本编制方法
(一)加权算术平均式指数举例商品 (%)
甲 (公斤 ) 125 1000 1250
乙 (套 ) 120 750 900
丙 (件 ) 115 500 575
合计 __ 2250 2725
qk 00pq 00q pqk
计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。

00
01
pq
pqk
q
0
1
q q
qk?
0q1 qkq?
%11.121
2250
2725
pq
pqk
k
00
00q
q

)(5 5 52 2 5 02 7 2 5
pqpqk 0000q


加权算术平均式指数的适用条件
计算数量指数时,如果已知的是数量指标的个体指数和基期总额资料,用加权算术平均式指数计算数量指标的综合变动程度。
返回
(一)加权调和平均式指数
举例商品 ( %)
甲 (公斤 ) 70 875 1250
乙 (套 ) 80 720 900
丙 (件 ) 100 575 575
合计 — 2170 2725
pk 11pq 11
p
pqk1
计算三种商品价格的综合变动程度及由于价格变动使销售额变动的绝对额。

10
11p
qp
qpk
0
1
p p
pk?
1
p
0 pk
1p?
%63.79
2 7 2 5
2 2 5 0
qp
k
qp
k
11
p
11
p

)(5 5 52 7 2 52 2 5 0
qp
k
1
qp 11
p
11


加权调和平均式指数的适用条件
计算质量指数时,如果已知的是质量指标的个体指数和报告期总额资料,用加权调和平均式指数计算质量指标的综合变动程度。
返回二、平均式指数的应用
(一)零售物价指数代表品 权数 W 指数( %)
一、食品类 54 135.3
1、粮食 46 149.1
( 1)细粮 60 146.1
面粉 标准(公斤) 1.81 2.80 40 154.5
大米 二等(公斤) 1.56 2.20 60 140.5
( 2)粗粮 40 153.5
2、副食品 42 128.0
3、烟茶酒 8 110.0
4、其它食品 4 103.2
二、衣着类 21 102.0
0p
0p 1p
%1.1 4 61 0 0 60%5.1 4 040%5.1 5 4k细

w
wkk p
p
%1.149100 40%5.15360%1.146k粮
%3.1 3 51 0 0 4%2.1 0 342%1 2 846%1.1 4 9k食返回
(二 )农产品收购价格指数大类 中类 小类 代表品 指数 % 万元甲 (120) 120
A (116) 58
(125) 25
140 14
110 11
110 33
B (124) 62
(115) 23
108.3 13
125 10
130 39
11pq
1A
2A
11A
12A
1B
2B
11B
12B
%125
%110
11
%140
14
1114K
1A?

%116
%110
33
%140
25
3325K
A?

%120
%116
62
%124
58
6258K?


11
p
11
p
qp
k
1
qp
k
返回
(三 )工业生产指数
%25.111100 25.111w wkk qq
工业部门代表品数
W
%
制造业 500 60 120 72
矿业 20 25 82 20.5
电信业 30 15 125 18.751
合计 550 100 __ 111.25
qk wkq
返回第四节 平均指标指数
这里的平均指标包括第四章所讲的加权算术平均数和与此相似的相对指标,如全员劳动生产率、人均国内生产总值。所以平均指标指数是反映两个不同时期同一经济内容这类指标的变动程度,即两个时期的加权算术平均数及与此相似的相对指标对比形成的指数。
一、可变构成指数
)(
f
fx
f
fx
x
x
k
0
00
1
11
0
1
相对数可变

)(f fxf fx
0
00
1
11 绝对数

二、固定构成指数
)(
f
fx
f
fx
k
1
10
1
11
相对数固定
)(f fxf fx
1
10
1
11 绝对数

三、结构影响指数
)(
f
fx
f
fx
k
0
00
1
10
相对数结构
)(f fxf fx
0
00
1
10 绝对数

工人类别工人数 平均工资(元) 工资总额(万元)
技工 300 300 500 550 15 16.5 15
徒工 200 700 300 350 6 24.5 21
合计 500 1000 — — 21 41 36
0f 1f 0x 1x 00fx 11fx 10fx
1、计算所有工人总平均工资变动的程度和绝对额某企业工资资料
%62.97
420
410
500
21 0 00 0
10 0 0
41 0 00 0
f
fx
f
fx
k
0
00
1
11

可变
)(10420410f fxf fx
0
00
1
11 元
2、计算由于各组工资水平的变动使总平均工资变动的程度及绝对额 %89.11 3
36 0
41 0
10 00
36 00 00
41 0
f
fx
f
fx
k
1
10
1
11

固定
)(50360410f fxf fx
1
10
1
11 元
3、计算由于结构的变动使总平均工资变动的程度及绝对额 %71.85
420
360
f
fx
f
fx
k
0
00
1
10

结构
)(604 2 03 6 0f fxf fx
0
00
1
10 元
返回第五节 指数体系及因素分析
一、指数体系
二、综合指数体系的因素分析
(一)两因素综合指数体系的因素分析
(二)多因素综合指数体系的因素分析
三、平均式指数体系的因素分析
四、平均指标指数体系的因素分析
返回一、指数体系
(一)概念
把经济上有联系,数量上保持一定关系的三个或三个以上的指数组成的整体称为指数体系。
(二)种类
1、综合指数体系
( 1)两因素 总成本指数 =产量指数 ×单位成本指数
( 2)多因素
2、平均指标指数体系
3、两者结合的指数体系总成本指数 =产量指数 ×单位成本指数
=产量指数 ×单位成本的固定构成指数 ×单位成本的结构影响指数原材料费用总额指数 =
产量指数 ×
单耗指数 ×
原材料价格指数结构固定可变 kkk
二、综合指数体系的因素分析
(一)两因素综合指数体系的因素分析商品 销量 价格 (元 ) 销售额 (元 )
甲 (公斤 ) 50 62.5 20 14 1000 1250 875
乙 (套 ) 75 90 10 8 750 900 720
丙 (件 ) 100 115 5 5 500 575 575
合计 __ __ __ __ 2250 2725 2170
0q 1q 0p 1p 00pq 01pq 11pq
从相对数和绝对数两方面对销售额的变动进行因素分析销售额指数 =销售量指数 ×价格指数

10
11
00
01
00
11
qp
qp
pq
pq
qp
qp
2 7 2 5
2 1 7
2 2 5 0
2 7 2 5
2 2 5 0
2 1 7 0
96.44%=121.11%×79.63%
-80=475+(-555)
计算结果表明,
从相对数来说,销售额下降了 3.56%,是由于销售量上升了 21.11%和价格下降了 20.37%两个因素共同影响的结果,
从绝对数来说,销售额减少了 80元,是由于销售量的上升使销售额增加了 475元和由于价格下降使销售额减少了 555元两个因素共同影响的结果,
返回
)qpqp()pqpq(pqpq 101100010011
2170-2250=(2725-2250)+(2170-2725)
接到
(二)多因素综合指数体系的因素分析原材料产品生产量单耗 材料价格费用总额 (百元 )

(公斤 )
A
(百件 )
8 10 0.6 0.5 20 21 96 120 100 105

(米 )
B
(百套 )
5 5 1.2 1.1 15 14 90 90 82.5 77

(米 )
C
(百套 )
10 12 2.4 2.5 30 28 720 86.4 900 840
合计
__ __ __ __ __ __ __ 906 1074 1082.5 1022
0q 1q 1m0m 0p 1p 000 pmq 001 pmq 011 pmq 111 pmq
从相对数和绝对数两个方面对该企业费用总额的变动进行因素分析费用总额指数 =
产量指数 ×
单耗指数 ×
原材料价格指数

011
111
001
011
000
001
000
111
pmq
pmq
pmq
pmq
pmq
pmq
pmq
pmq
相对数
)pmqpmq()pmqpmq
pmqpmqpmqpmq
011111001011
000001000111





)(
绝对数
5.1082
1022
1074
5.1082
906
1074
906
1022
112.8%=118.5%×100.8%×94.4%
1022-906=(1074-906)+(1082.5-1074)+(1022-1082.5)
11600(元 )=16800(元 )+850(元 )+(-6050元 )
计算结果表明,
从相对数来说,该企业费用总额增长了 12.8%,是由于产量增长了 18.5%,单耗增长 0.8%,原材料价格下降 5.6%三个因素共同影响的结果。
从绝对数来说,该企业费用总额增加了 11600元是由于产量增长使其增加了 16800元,单耗增长使其增加 850元,原材料价格的下降使其减少了 6050元三个因素共同作用的结果。
三、平均式指数体系的因素分析
商品 % %
甲 (公斤 ) 125 70 1000 875
乙 (套 ) 120 80 750 720
丙 (件 ) 115 100 500 575
合计 __ __ 2250 2170
qk pk 00pq 11pq

11
11
00
00
00
11
1
pq
k
pq
pq
pqk
pq
pq
p
q
从相对数和绝对数两个方面对销售额的变动进行因素分析
)pqk
1pq()pqpqk(pqpq
11
p
110000q0011
2 7 2 5
2 1 7 0
2 2 5 0
2 7 2 5
2 2 5 0
2 1 7 0 96.44%=121.11%×79.63%
-80=475+(-555)2170-2250=(2725-2250)+(2170-2725)
计算结果表明,(同上 )
四、平均指标指数体系的因素分析结构固定可变 kkk

0
00
1
10
1
10
1
11
0
00
1
11
f
fx
f
fx
f
fx
f
fx
f
fx
f
fx
相对数
)f fxf fx()f fxf fx(f fxf fx
0
00
1
10
1
10
1
11
0
00
1
11

绝对数
-10=50+(-60)97.62%=113.89%×85.71%
计算结果表明,从相对数说,所有工人的总平均工资下降了 2.38%,是由于各组工人的平均工资上升了 13.89%和结构的影响使平均工资下降了 14.29%两个因素共同作用的结果。从绝对数说,总平均工资减少 10元,是由于各组工人平均工资的上升使平均工资增加 50元和结构的影响使平均工资减少了 60元两个因素共同作用的结果。
返回返回第七章 相关与回归分析
相关与回归分析是研究现象之间依存关系的一种统计方法。重点掌握简单线性相关系数的计算与分析及一元线性回归方程的建立。
第一节 相关与回归分析的基本问题
第二节 简单线性相关分析
第三节 一元线性回归分析
返回
一、相关的概念
二、相关关系的种类
三、相关与回归分析的的主要内容
返回第一节 相关与回归分析的基本问题一、相关的概念
(一)相关分析
从数量上分析现象之间相关关系的理论和方法。
(二)函数关系(确定性关系)
对于某一变量的每个数值都有另一变量的完全确定的值与之对应。
(三)相关关系(非确定性关系)
现象之间存在一定的依存关系,但不是一一对应的关系,即相随变动关系。
二、相关关系的种类
(一)按变量之间相关的程度
1、完全相关 2、完全不相关 3、不完全相关
(二)按相关关系涉及变量的多少
1、单相关 2、复相关
(三)按变量之间相关关系的表现形式
1、线性相关 2、非线性相关
(四)对线性相关,按相关的方向
1、正相关 2、负相关三、相关与回归分析的主要内容
(一)确定变量之间有无相关关系及呈现的形态
用定性分析、相关表或相关图。
(二)确定变量之间相关关系的密切程度
用相关系数。
(三)建立变量之间变动关系的方程式
用最小平方法建立变量之间的回归方程。
(四)测定因变量估计值的可靠性
计算估计标准误差。
返回
第二节 简单线性相关分析
一、相关表
(一 )简单相关表
(二 )单变量分组相关表
(三 )双变量分组相关表
二、相关图
三、相关系数
(一)基本公式
(二)性质
(三)其它计算公式
(四)例题
返回一、相关表(一)简单相关表机床
1 2 3 4 5 6 7 8 9 10 11
使用年限
2 2 3 4 4 5 5 6 6 6 8
年维修费用

元)
400 540 520 640 740 600 800 700 760 900 840
(二 )单变量分组相关表使用年限 机床数 (台 ) 平均维修费用
( )
2 2 470
3 1 520
4 2 690
5 2 700
6 3 787
8 1 840
9 1 1080
合计 12 __
年元
(三 )双变量分组相关表年维修费用
(元)
机床使用年限 (年 ) 合计
2 3 4 5 6 8 9
1000—1100 1 1
900—1000 1 1
800—900 1 1 2
700—800 1 2 3
600—700 1 1 2
500—600 1 1 2
400—500 1 1
合计 2 1 2 2 3 1 1 12
二、相关图
0
200
400
600
800
1000
1200
0 2 4 6 8 10
ìê ìììì·ì
使用年限三、相关系数
(一)基本公式
1、基本公式
yx
xy
2
22 )yy(
n
1
)xx(
n
1
)yy)(xx(
n
1
r




2,的作用与不足
(1)说明相关的方向 (2)显示相关程度
y
)yy)(xx(
xy x
0)xx(
0)yy(
0)xx(
0)yy(
0)xx(
0)yy(
0)xx(
0)yy(
( 3)不足:受变量值个数、变量值大小和计量单位的影响
( 1)作用:消除了变量值个数的影响。
( 2)不足,协方差数值受变量值大小和计量单位的影响。例:
3,的作用与不足 )yy)(xx(n1
人均销售额
(千元)
利润率 % 人均销售额
(元)
利润率 %
6 12.6 6000 12.6
5 10.4 5000 10.4
8 18.5 8000 18.5
1 3.0 1000 3.0
4 8.1 4000 8.1
1x 1y 2x 2y
4,的作用
同协方差相比,相关系数有两个作用;
( 1)它是一个系数,不受变量值水平和计量单位的影响,可以在不同资料之间对相关程度进行对比。
( 2)相关系数的数值有一定范围即
x? y?
1r?
yx
xy
2
22 )yy(
n
1
)xx(
n
1
)yy)(xx(
n
1
r




(二 )相关系数的性质
1、当 时,x与 y为完全线性相关,即 x 与 y之间存在着函数关系。
2、当 时,表示 x与 y之间存在一定的线性相关。 的数值愈接近于 1,表示 x与 y之间直线相关程度愈高;反之 的数值愈接近于 0,表示 x与 y之间直线相关程度愈低。通常判断的标准是:
微弱相关 低度相关
显著相关 高度相关
3、当 r﹥0 时,为正相关,当 r﹤0 时,为负相关。
4、当 时,表示 y的变化与 x无关,即 x与 y完全没有直线相关。
1r?
1r0
r
r
30r 50r30
80r50 1r80
0r?
(三)相关系数的其它计算公式



2222 )y(
n
1
y)x(
n
1
x
yx
n
1
xy
r
设 xylyxn1xy)yy)(xx(
xx222 l)x(n1x)xx( yy222 l)y(n1y)yy(

yyxx
xy
ll
lr?
举例使用年限 x 维修费用(元) y xy
2 540 4 291600 1080
3 520 9 270400 1560
4 640 16 409600 2560
4 740 16 547600 2960
5 600 25 360000 3000
5 800 25 640000 4000
6 700 36 490000 4200
6 760 36 577600 4560
6 900 36 810000 5400
8 840 64 705600 6720
9 1080 81 116400 9720
合计 58 8120 348 6268800 45760
2x 2y
2 9 4 58 1 2 0581114 5 7 6 0l xy
42)58(111348l 2xx
2 7 4 7 6 4)8 1 2 0(1116 2 6 8 8 0 0l 2yy
8702 74 7 6442 2 94 5r
计算结果表明,机床使用年限与维修费用之间为高度正相关。
返回第三节 一元线性回归分析
一、相关分析与回归分析的关系
(一)区别
(二)联系
二、一元线性回归方程的建立
(一)回归方程的建立
(二) r与 b的关系
三、估计标准误差
(一)基本公式
(二)计算公式
(三) 与 b的关系 返回yxs
一、相关分析与回归分析的关系
(一)区别
1、相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。
2、相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。
3、相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。
4、相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。
(二)联系
1、相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。
2、回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,
并进一步进行预测。
二、一元线性回归方程的建立
(一)回归方程的建立
1、假设回归方程
2、计算 a,b两个参数(最小平方法)
从 出发,得到
前例
bxay
最小值 2)y?y(




2xbxaxy
xbnay
xx
xy
22 l
l
)x(
n
1
x
yx
n
1
xy
b
xbya



42l
2945l
xx
xy
81 20y
58x
27.51158x
a=738.18-70.12×5.72=368.65
18.7 3 8118 1 2 0y
1270422945b
x12.7065.368y
(二) b与 r的关系
例:
y
x
yy
xx
yy
xx
xx
xy
yyxx
xy
b
l
l
b
l
l
l
l
ll
l
r


x
yrb

252x 362y
r=0.9 a=2.8
08.1569.0b
x08.18.2y
三、估计标准误差
(一)定义公式
(二)计算公式
2n
)y?y(s 2
yx?

2n
xybyayy 2
yx?












xybyay
xybyaxyb2ya2y
)xbxa(b)xbna(axyb2ya2y
xbxab2naxyb2ya2y
)bxa(y)y?y(
2
2
22
2222
22
(三 )意义 估计标准误差是说明回归方程代表性大小的统计分析指标。其值小,表明方程代表性大;反之亦然。
用上例
45760xy
6268800y
8120y
2
元)(07.86
211
4 5 76 012.708 1 2065.3686 2 68 8 0 0
2n
xybyay
S
2
yx



a=368.65
b=70.12
(四) 与 r的关系yxS
2
y
2
yx
2
y Sr

2
yyx r1S
可见,当 r越大时,越小,这时相关密切程度较高,回归直线的代表性就大;反之亦然。
实际中,一般不常用这种方法计算 r,因为,( 1)
需要先求出回归直线方程,计算出估计标准误差,
才能求得 r。不符合一般程序。( 2)以这种方法计算的 r难以判断是正相关还是负相关。
返回
yxS
x
y
y
y?
y
y
yy? y?y?
yy
)yy?()y?y(yy

)yy?)(y?y(2)yy?()y?y(
)yy?()y?y()yy(
22
22





0xbnayxb
xbxaxyb
)bxay(xbx)bxay(b
)xx)(bxay(b
)xbabxa)(bxay(
)yy?)(y?y(
2









)r1(l
l
ll
l
l
l
l
l
l
lbl
)xx(bl
)xbabxa(l
)yy?()yy(
)y?y(
2
yy
yy
yyxx
2
xy
yy
xx2
xx
2
xy
yy
xx
2
yy
22
yy
2
yy
22
2








)r1(S
)r1(
n
l
n
)y?y(
2
y
22
yx
2yy
2



2
y
2
yxS1r

第八章 抽样推断
本章介绍在一定的概率保证程度下,从数量上用样本指标推断总体指标的统计方法。重点掌握简单随机抽样方式下,抽样平均误差计算、抽样单位数目确定和区间估计的方法。
第一节 抽样推断的基本问题
第二节 抽样误差
第三节 抽样单位数目的确定
第四节 抽样估计
第五节 假设检验
返回第一节 抽样推断的基本问题
一、抽样推断的概念
二、抽样推断的特点
三、抽样推断的适用范围
四、抽样推断的有关概念
五、抽样方法
返回
一、抽样推断的概念
抽样推断是指从被研究现象的总体中按照随机原则抽取一部分单位进行调查,并依据调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计,以达到对全部研究对象认识的一种统计方法。
二、抽样推断的特点
(一)按照随机原则从总体中抽取样本单位。
(二)用样本单位的指标数值推断总体的指标数值。
(三)抽样误差可以事先计算并加以控制。
三、抽样推断的适用范围(需要掌握总体的具体数据)
(一)不能进行全面调查
(二)理论上可以进行全面调查实际上办不到
(三)没有必要进行全面调查
(四)可以验证和补充全面调查资料四、抽样推断的有关概念
(一)全及总体和抽样总体
1、全及总体(总体 N):所要认识对象的全体。
( 1)有限总体 ( 2)无限总体
2、抽样总体(样本 n):所抽取的一部分单位。
( 1)大样本( n≥30) ( 2)小样本( n≤30)
(二)全及指标和抽样指标
1、全及指标:用来描述全及总体的指标
2、抽样指标:根据样本单位计算的指标
)(X? )( 2XX σσ P )( 2PP σσ
x )( xx SS 2 p )( 2pp SS
五、抽样方法
(一 )按抽取样本单位的方法不同
1、重复抽样 2、不重复抽样
(二)根据对样本的要求不同
1、考虑顺序的抽样 AB≠BA
2、不考虑顺序的抽样 AB=BA 返回
(三)两种分类交叉
1、考虑顺序的不重复抽样
2、考虑顺序的重复抽样
3、不考虑顺序的不重复抽样
4、不考虑顺序的重复抽样
nNn NB =
)1()1( nNNNA Nn?
!
)1()1(
! n
nNNN
n
AC Nn
Nn

!
)21(
1 n
NnNnNCD
nNnNn


)(
第二节 抽样误差
一、抽样平均误差
(一)概念
(二)计算
1、简单随机抽样
2、类型抽样
3、等距抽样
4、整群抽样
5、阶段抽样
(三)影响抽样平均误差的因素二、抽样极限误差三、抽样极限误差与抽样平均误差的关系 返回一、抽样平均误差
(一)抽样平均误差的概念
1、登记汇总性误差
2、代表性误差
( 1)偏差 )(1 Xx )(2 Xx
Pp?1 Pp?2?
( 2)随机误差实际误差平均误差 M
Xxu
x
2))((?
M
Ppu
p
2)(
(二)抽样平均误差的计算
1、简单随机抽样
( 1)概念,是对总体单位不作任何分类或排队,
完全按随机原则逐个地抽取样本单位。
( 2)抽样平均误差的计算公式
①平均数的抽样平均误差
②成数的抽样平均误差
)(重复nu x σ? 或)1(
2

N
nN
nu x
σ )()1(2 不重复
N
n
nu x
σ
)()1( 重复n PPu p
)()1()1()1()1( 不重复或 Nnn PPuN nNn pPu pp






ji
jin
n
n
x
XxXxEXxEXxEXxE
n
XxXxXxE
n
n
XXX
n
xxx
E
XxEu
))(()()()(
1
)()()
1
)(
)(
22
2
2
12
2
212
221
22


在重复抽样下,样本变量是独立的。
则 0))(( XxXxE ji


n
n
n
XXEXXEXXE
n
XxEXxEXxE
n
u
nx
2
2
2
222
2
22
2
2
12
)(
1
)()()(
1
)()()(
1
σ
σ


( 3)例题
① 某冷库冻鸡平均每只重 1200克,标准差 70克,如果重复随机抽取 100只和 200只,分别计算 抽样平均误差。
②该 冷库冻鸡合格率为 97%,如果重复随机抽取 100
只和 200只,分别计算 抽样平均误差。
)(71 0 070 克 nu xx σ )95420070 (克xu
%711 0 0 %)971%(971( n PPu p )
%212 0 0 %)971%(97pu
2、类型抽样
( 1)概念,类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。
( 2)样本单位数在各类型组中的分配方式
①等额分配:在各类型组中分配同等单位数。
②等比例分配:按各类型组在总体中所占比例分配样本单位数。即:
③最优分配:按各类型组的规模大小和差异程度,
确定各类型组的样本单位数。
N
n
N
n
N
n
N
n
k
k
2
2
1
1
( 3)抽样平均误差的计算公式
① 平均数的抽样平均误差
重复
不重复且等比例
②成数的抽样平均误差
重复
不重复且等比例
nu
i
x

N N iii 22 σσ
)1()1(
1
)1(
1
)1(
1
2
1
2
1
2
1
2
N
n
nN
N
N
n
n
N
n
N
N
nN
n
N
N
n
u
i
k
i
ii
k
i
ii
k
i
i
iii
x




σσ
σσ
n
PPu ii
p
)1(
N
NPP
PP ii
k
i i
ii
)1(
)1( 1

)1()1( Nnn PPu iip
( 4)例题
① 有 12块小麦地,每块 1亩。 6块处于丘陵地带,亩产量(斤)分别为,300 330 330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为,420 420 450
460 490 520。抽查 4块,测定 12块地的平均亩产量,
计算其抽样误差。
②设亩产在 350以上的为高产田,抽查 4块,测定 12块地高产田的比重,计算其抽样误差。
用类型抽样,每类抽 2块
计算各组方差 平均组内方差 抽样误差亩产量
300 1600
330 100
330 100
340 0
370 900
370 900
合计 3600
211 )( XX? 亩产量
420 1600
420 1600
450 100
460 0
490 900
520 3600
合计 7800
222 )( XX?
1X 2X
丘陵平原
3401?X
6 0 0
6
3 6 0 02
1
σ
4602?X
1 3 0 0
6
7 8 0 02
2
σ
9 5 012 61 3 066 0 0
2
2
N
Nσσ ii
i
41.1549 5 0
2
nσu ix
5712
)
12
4
1(
4
9 5 0
)1(
2


N
n
n
σ
u ix


地块数高产田数高产田比重 %
丘陵 6 2 33.3 66.67 22.2
平原 6 6 100 0 0
iP?1 )1( ii PP?
iP
%1.1112 06%2.22)1()1( N NPPPP iiiii
%65.164 %1.11)1( n PPu iip
%6.13)1241(4 %1.11)1()1( Nnn PPu iip
3、等距抽样
( 1)概念:将总体各单位标志值按某一标志顺序排队,
然而按一定的间隔抽取样本单位。
( 2)排对的方法
①无关标志排队 ②有关标志排队
( 3)抽取样本单位的方法
①按相等的距离取样
②对称等距取样
( 4)抽取第一个样本单位的方法
①随机抽取 ②居中抽取
( 5)抽样平均误差的计算公式
① 按无关标志排队,同不重复简单随机抽样
②按有关标志排队
)1(1)1(1
2
1
2
1
2

i
ik
i
iik
i
i
iiii
x nn
σ
N

nN
nN
N

nu?
n
PPu ii
p
)1(
Ⅰ 亩产量( ),300 330 330 1X 3201?X 20021?σ
Ⅱ 亩产量( ),340 370 3702X 3602?X 20 022?σ
Ⅲ 亩产量( ),420 420 4503X 4303?X 2 0 023?σ
Ⅳ 亩产量( ),460 490 5204X 4904?X 60024?σ
30012 36003200320032002iσ
66.843 0 0xu
3412上例,抽选间隔为
( 6)例题
4、整群抽样
(1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。
( 2)抽样平均误差的计算公式某水泥厂一昼夜的产量为 14400袋,现每隔 144分钟抽取
1分钟的水泥( 10袋)检查平均每袋重量和一级品率,
样本资料如下:
计算抽样平均误差
)1(
2

R
rR
r
δu x
x R
XXδ i
x
22 )(
r
xxδ i
x
22 )(
)1(
2

R
rR
r
δu p
p R
PPδ i
p
22 )(
r
ppδ i
p
22 )(
( 3)例题样本群平均每袋重量一级品比重
1 49 2.25 0.80 0
2 51 0.25 0.75 0.0025
3 52 2.25 0.83 0.0009
4 53 6.25 0.82 0.0004
5 50 0.25 0.80 0
6 49 2.25 0.79 0.0001
7 50 0.25 0.78 0.0004
8 48 6.25 0.80 0
9 50 0.25 0.81 0.0001
10 53 6.25 0.82 0.0004
合计 505 26.25 8.00 0.0048
ix
2)( xx i?
ip 2)( pp i?
5.50
10
505

r
xx i
8.0
10
8

r
pp i
65.2
10
5.26
)( 22

r
xx
δ i
x
00048.0
10
0048.0
)(
2
2
r
pp
δ
i
p
一昼夜有 1440分钟,即把总体分为 1440群,R=1440
每隔 144分钟抽取 1分钟的水泥( 10袋),r= 10
5 1 3.0)11 4 4 0 101 4 4 0(10 652)1(
2
R rRrδu xx
0069.0)11440 101440(1000048.0)1(
2
R rRrδu pp
5、阶段抽样
( 1)概念:抽样时,先抽总体中较大范围的单位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。
( 2)抽样平均误差的计算公式(以两阶段为例)
同理可以得出成数抽样平均误差的计算公式
( 3)例题:某地区有 300户居民,分成 10群,现从 10群中抽 6群,再从抽中的群中每群抽 2户调查其平均收入,
计算抽样平均误差。资料如下:
群 1,300 330(户收入)
n
σ
R
rR
r
δu ix
x
22
)1( )1()1(
22


M
mM
n
σ
R
rR
r
δu ix
x
n=rm
315?ix 450)( 211 xx
225245021σ
群 2:户收入 330 340
3352?x 50)( 222 xx 2525022σ
群 3:户收入 370 390
3863?x 200)( 233 xx 1 0 022 0 02
3σ群 4:户收入 418 434
4264?x 128)( 244 xx 64212824σ
群 5:户收入 462 484
4735?x
242)( 255 xx 1 2 122 4 22

群 6;户收入 507 525
5166?x 16 2)( 266 xx 81216226σ
67102)811216410025225(612iσ
54 0 75 1 64 7 34 2 63 8 03 3 53 1 561 )(x
6
)5.407516()5.407315( 222

7 7 3.19
)
130
230
(
12
67.1 0 2
)
110
610
(
6
25.5 1 6 2
)
1
()
1
(
22
M
mM
n
σ
R
rR
r
δ
u
ix
x
(三)影响抽样平均误差的因素
1、总体标准差的大小
2、样本单位数的多少
3、抽样方法的不同
4、抽样组织方式的差别二、抽样极限误差
样本指标围绕总体指标左右两侧波动形成的一定范围。
Ppp xx
三、抽样极限误差与抽样平均误差的关系
(一)抽样分布
据中心极限定理,当总体为正态或总体非正态但 n≥30时,
样本均值的分布趋近于正态分布;当 n足够大时,样本成数的分布近似为正态分布。
(二)关系令
22 )
2
1)(
2
1
)( 2
1
2
1 xx u
Xx
x
σ
xx
x
x euπeσπf



x
x
x uu
Xxz
2
2
1
)( 2
1 z
z ef

0)(?zE
12?z?
返回2?z2?z?
第三节 抽样单位数目的确定
一、抽样单位数目的计算
(一)简单随机抽样
(二)类型抽样
(三)等距抽样
(四)整群抽样二、影响 抽样单位数目的因素返回一,抽样单位数目的计算
(一)简单随机抽样
1、计算公式
( 1)平均数
( 2)成数
nzuz
x
xx
2
22

2
22
2
x
xzn

22
2
2
22
2
xx
x
zN
Nz
n

2
2
2
)1(
p
PPz
n
)1(
)1(
2
2
2
2
2
PPzN
PpNz
n
p
2、例题
( 1)某类产品根据以往资料的估计,总体方差 5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到 99.73%,误差范围不超过
0.9千克,需要抽多少样本单位?
按题意
( 2)根据以往资料的估计,该类产品的一等品率为
90%,可靠程度仍为 99.73%,误差范围不超过 5%,
推断该批产品的一等品率,需要抽多少样本单位?
按题意
45652xσ 32z
90 x
61)90( 4 5 653 2
2
n
%90?P
%5 p
3 2 4)050( 10903 2
2
n32z
(二)类型抽样
1、计算公式重复抽样 不重复抽样平均数成数
2
22
2
x
iz
n

22
2
2
22
2
ix
i
zN
Nz
n

2
2
2
)1(
p
ii ppz
n
)1(
)1(
2
2
2
2
2
iip
ii
PPzN
PPNz
n

2、例题
某工厂早、中、晚生产罐头 10000瓶,根据以往资料的估计平均重量的类型平均方差为 0.549克,合格率的类型平均方差为 0.02787,要求可靠程度为何 95%,平均重量的允许误差为 0.11克,合格率的允许误差为 0.025,
用类型抽样推断 10000瓶罐头的平均重量和合格率,
需要抽多少样本单位?
据题意
1 7 15 4 90)961()110(1 0 0 0 0 5 4 90)961(1 0 0 0 0 22
2
n
10000?N 54902iσ 9612z 110 x
0 2 7 8 70)1( ii PP 0250 p
171)0250( 0 2 7 8 70)961( 2
2
n
(三)等距抽样
计算公式
( 1)按有关标志排队
同类型重复抽样
( 2)按无关标志排队
同简单随机不重复抽样
2
22
2
x
iz
n

2
2
2
)1(
p
ii ppz
n
22
2
2
22
2
xx
x
zN
Nz
n

)1(
)1(
2
2
2
2
2
PPzN
PpNz
n
p
(四)整群抽样
1、计算公式
2、例题:某水泥厂对一昼夜所生产的 14400袋( 1440群)
水泥抽样检查其质量,根据以往资料,水泥平均重量的群间方差为 2.65,允许误差为 1.5公斤;一级品率的群间方差为 0.00048,允许误差为 0.015,要求可靠程度为
95.45%,需要抽多少样本群?
据题意:
22
2
2
22
2
xx
x
zR
Rz
r

22
2
2
22
2
pp
p
zR
Rz
r

1440?R 22z 6522xδ 51 x
0 0 0 4 802pδ
0150 p
56522)51(1 4 4 0 65221 4 4 0 22
2
r
80 0 0 4 802)0 1 50(1 4 4 0 0 0 0 4 8021 4 4 0 22
2
r
二、影响抽样单位数目的因素
(一)总体各单位的变异程度
(二)抽样推断的准确程度△
(三)抽样推断的可靠程度 t
(四)抽样的组织形式
(五)抽样的方法
返回
σ
第四节 抽样估计
一、估计量的优良标准
二、抽样估计的方法
(一)点估计
(二)区间估计
1、平均数的区间估计
2、成数的区间估计
3,2个总体平均数之差的估计
4、两个总体比例之差的估计返回
一、估计量的优良标准 (一)无偏性
1、概念:如果样本统计量的期望值等于该统计量所估计的总体参数,这个估计量叫无偏估计量。
2、样本平均数是总体平均数的无偏估计量
总体变量值有 N个( ),样本容量为 n个( )。
( 1)重复抽样
θθE?)?(
XxE?)(
1x
1X 2X? NX
2x? nx
)()()(1
)()(
21
21
n
n
xExExE
n
n
xxx
ExE


XXXX
N
N
X
N
X
N
X
PXxExExE
N
N
N
i
iin



)(
1
111
)()()(
21
21
1
21
X
XXX
n
xE
)(
1
)(
( 2)不重复抽样
)()()(1)()( 2121 nn xExExEnn xxxExE
XNXNXNXPXxE NN
i ii

111)(
2111?
NN
N
i ii PXPXPXPXxE221112 )(
NNN
NPPP
N
1
1
11
21

XNXNXNXxE N 111)( 212?
XxExExE n )()()( 21?
XXXXnxE )(1)(?
NN
N
i ii PXPXPXPXxE221113 )(
NNN
N
N
NPPP
N
1
2
1
1
21
21

XxE )( 3
3、样本成数是总体成数的无偏估计量
4、样本方差是总体方差的无偏估计量
(二)有效性:有两个无偏估计量( ),如果那个估计量与总体参数间的平均离差小,这个估计量更有效。
和 都是 的无偏估计量,与 间的平均离差为,与 间的平均离差为,所以在估计
( P ) 时,( p ) 更有效。
(三)一致性:随着样本容量的增大,估计量与被估参数的偏差越来越小。
是 的一致估计量。有限总体时,n最大为 N,这时 = ;无限总体时,当 n ∞时,与 间的偏差( )的极限为 0。 p( )是 P( )的一致估计量。
22 )( σsE?
PpE?)(
1?θ 2?θ
1X x X 1X
Xσ x
X

2X
x
x X
x X
2σ 2S
x X

2 2S 2σ
二、抽样估计的方法
(一)点估计
(二)区间估计
1、平均数的区间估计
(1)样本取自总体方差已知的正态分布 (大、小样本)
xX? pP?
xu
Xxz
xx uzxXuzx 22
返回
nux
)
1(
2

N
nN
nu x
某制造厂质量管理部门希望估计本厂生产的 5500包原材料的平均重量,抽出 250包,测得平均重量 65
千克。总体标准差 15千克。总体为正态分布,在置信水平为 95%的条件下建立这种原材料的置信区间。
5500包原材料的平均重量在 63.14~66.86之间。
65?x 15 05.0 96.12z
86.1652 5 01596.165
2
nzx
(2) 正态总体总体方差未知且小样本
因总体方差 未知,只能用 代替,
而 n很小 常常与 差异较大,就不再是一个标准正态分布,而是一个 t分布。
例:为了估计一分钟广告的平均费用,抽出 15个电视台组成样本,得样本均值 10000元,标准差 2000元。总体近似服从正态分布,在置信水平为 95%的条件下建立广告平均费用的置信区间。
电视台一分钟广告的平均费用在 8894~11106之间。
n
s
xt x
1 0 0 0 0?x 2000?s
14.2)14()1( 0 2 5.02 tnt?
05.0
1 1 0 61 0 0 0 0152 0 0 014.21 0 0 0 0
2
nstx?
2s
n
s
x x
2?
2? 2s
( 3)正态总体总体方差未知且大样本
总体方差 未知,只能用 来代替,因 n很大,就是 的一个较好的估计量,仍然是一个近似的标准正态分布。
n
s
xz x
2? 2s 2s
2?
n
s
x x
(4)样本取自总体方差已知的非正态分布
某职业介绍所从申请某一职业的 1000名申请者中采用不重复抽样方式随机抽取了 200名,以此来估计
1000名的平均成绩。 200名的平均分为 78,由以往经验知总体方差 90,不知总体服从何种分布。在置信水平为 90%的条件下建立 1000名申请者平均成绩的置信区间。
1000名申请者平均成绩在 77~79之间。
30?n
78?x 90 1.0 645.1
2z
9 8 7.078)
11 0 0 0
2 0 01 0 0 0
(
2 0 0
90
6 4 5.178
)
1
(
2
2


N
nN
n
zx
( 5)样本取自总体方差未知的非正态分布
例:某超市通过 100位的样本研究每次购买额,均值和标准差分别为 80元和 20元,在置信水平为 90%的条件下建立 100位顾客 购买额 的置信区间。
所有顾客 购买额在 76.71和 83.29之间。
30?n
n
s
xz x
1.0 645.1
2z
80?x 20?s
29.3801 0 0206 4 5.180
2
nszx?
2、成数的区间估计
pu
Ppz
pp uzpPuzp 22
n
ppu
p
)1(
n
ppu
p
)?1(
例 1:某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了 200人访问,有 140人离开的原因是工资太低。以 95%的置信水平对总体这种原因离开的人员比例进行区间估计。
7.0p 05.0 96.1
2z
064.07.0200 )7.01(7.096.17.0)?1(
2
n ppzp?
该企业由于工资低离开的职工比例为 63.6% 与 76.4%之间
例 2
对一批灯泡抽取 1%进行质量检验,结果为平均寿命 1010
小时,抽样平均误差 5.6小时 ;合格率 92%,抽样平均误差 2.4%。要求在 95%的可靠程度下,对该批灯泡的平均寿命和合格率进行 区间估计。
据题意 1010?x 6.5?xu p=92% %4.2?
Pu
976.1020024.999
6.5109610106.596.11010


X
X
%7.96%3.87
%4.296.1%92%4.296.1%92


P
P
96.12z
3,2个总体平均数之差的估计
我们经常希望对来自 2个不同总体的平均数进行比较
( )。而往往无法直接得到其数据,只能用样本数据( )对其作出估计。
( 1) 2个样本平均数之差的抽样分布
如果有 2个正态总体,其平均数分别为 和,方差分别为 和,那么从 2个正态总体中抽取的容量分别为 和 的 2个独立样本的平均数之差
也一定服从均值为,方差为
的正态分布。如果是从 2个非正态总体中抽
取 2个独立的样本,只要,根据中心极限定理,
样本平均数之差的抽样分布就会逼近正态分布,
21
21 xx?
1? 2?
21 xx?
21? 22?
1n 2n
21
)(
2
2
2
1
2
1
nn

30?n
( 2) 2个总体平均数之差的估计
2个正态总体且方差已知
例:某银行负责人想知道储户两家银行的钱数,随从每家各抽取 25个储户。样本平均值为:,
。两个总体均服从方差分别为和 的正态分布。在 95%的置信水平下对总体平均数之差 进行区间估计。
有 95%的把握认为总体平均数之差在 1200.42和 1299.58
之间。
4 5 0 0?Ax
3 2 5 0?Bx 7 5 0 02?A?
8 5 0 02?B?
)( BA
B
B
A
A
BA nnzxx
22
2
)(
96.12z
25
8500
25
750096.1)32504500(
58.491250?
2
2
2
1
2
1
2121 )()(
nn
xx
z



两个正态总体方差未知但相等(小样本)
首先求出共同方差 的估计值,用加权平均数,
权数是它们的自用度。
这时,其统计量 服从自由度为 的 t分布,标准差为:
总体平均数之差 的置信区间为:
2? 2s
2
)2()1(
21
2
22
2
112


nn
snsns
221 nn
212
2
1
2 11
nnsn
s
n
s
2121
2
22
2
11
2
21
21
2
21
11
2
)1()1(
)(
11
)(
nnnn
snsn
txx
nn
stxx





)( 21
例:某工厂中有两台生产金属棒的机器,分别抽取 11根和 21根。两个样本的数据为,英寸,
英寸;,。假定两个总体近似服从正态分布,且总体方差相等。 在 95%的置信水平下对总体平均数之差 进行区间估计。 )( BA
1.6?Ax 95.5?Bx
0 1 8.02?As 02.02?Bs
0 1 9.0
22111
02.0)121(0 1 8.0)111(
2
)2()1(
21
2
22
2
112




nn
snsn
s
1.015.0
21
1
11
1
0 19.00 42.2)95.51.96(
11
)(
21
2
21


nn
stxx
有 95%的把握认为两台机器所生产金属的平均长度差别在 0.05和 0.25英寸之间。
两个正态总体方差未知且不等(小样本)
其统计量
不服从自
由度为 的 t分布,而服从自由度为的 t分布,
置信区间为:
221 nn
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
)()(
)(
n
ns
n
ns
n
s
n
s
fd

2
2
2
1
2
1
2
21 )( n
s
n
stxx
2
2
2
1
2
1
2121 )()(
n
s
n
s
xx
t



例:上例中总体方差不等。

23
21
2102.0
11
110 18.0
12
02.0
11
0 18.0
22
2
fd
07.22t
11.015.021 02.011018.007.2)95.51.6(
有 95%的把握认为两台机器所生产金属的平均长度差别
在 0.04和 0.26英寸之间。
两个非正态总体方差未知(大样本)
2
2
2
1
2
1
221
)( nnzxx
例; A,B两所大学某期末英语考试采用同一试题。 A
校认为该校学生成绩能比 B校高 10分。为了证实,从两校各抽取一个样本,样本资料如下,人,
人,
分,,,。在
95%的置信水平下确定两校平均分之差的置信区间。
75?An 80?Bn
6.78?Ax 8.73?Bx 2.8?As 4.7?Bs
96.1205.02 zz?
5.28.480 4.775 2.896.1)8.736.78(
22

有 95%的把握认为两校成绩之差在 2.3和 7.3之间。
4、两个总体比例之差的估计
在大样本且总体比例不太接近 0或 1时,两个独立样本的比例之差 的抽样分布近似服从正态分布,其平均值为,标准差为:
21 ~~ pp?
21 ~~ pp?
21 pp?
2
22
1
11 )1()1(
21 n
pp
n
pp
pp


2
22
1
11 )
~1(~)~1(~
21 n
pp
n
pps
pp

2
22
1
11
221
)~1(~)~1(~)~~(
n
pp
n
ppzpp
例:某企业有两个车间,对 B车间的工人首先进行业务培训。 3个月后,对两个车间的产品进行检验。从车间
A抽取 200件,从车间 B抽取 220件,废品率为
。在 95%的把握程度下构造两车间废品率之差的置信区间。
%15~?Ap
%3~?Bp
96.1205.02 zz?
2
22
1
11
221
)~1(~)~1(~)~~(
n
pp
n
ppzpp
054.012.0
220
)03.01(03.0
200
)15.01(15.0
96.1)03.015.0(




有 95%的把握认为两车间 废品率之差在 6.6%和 17.4%之间,
返回第五节 假设检验
一、假设检验与参数估计的区别
二、假设检验的程序
三、双侧检验和单侧检验
四、一个总体平均数的假设检验
五、一个总体成数的假设检验
七、两个总体比例之差的假设检验六、两个总体平均数之差的假设检验返回一、假设检验与参数估计的区别
参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。
参数估计是在总体参数未知的情况下用样本统计量估计总体参数。假设检验是先对总体参数提出一个假设,
然后利用样本信息去检验这个假设是否成立,如果成立,就接受这个假设,否则就放弃。
某企业生产了一批灯管,按规定每只灯管的使用寿命不得低于 1000小时。现从中任意抽取 100只,发现有 6
只的使用寿命低于 1000小时,若规定不合格率达到
5%时,灯管就不能出厂,问该批灯管能否出厂。
从 2002年的新生儿中随机抽取 30个,测得其平均体重为此 3210克,而 2001年为 3190克,问新生儿体重 2002
年比 2001年有无显著差异。
二、假设检验的程序
第一,提出原假设和替换假设
把需要通过样本去推断其正确与否的命题称为原假设,
用 表示。上例,
与原假设对立的假设是替换假设,:
第二,确定适当的检验统计量
根据样本的大小、总体方差是否已知,选择适当的检验统计量。
第三,规定显著性水平
是当原假设为正确时人们却把它拒绝了的概率或风险。
是由人们确定的,当 取 0.05时,表明作出接受原假设的决定时,其正确的可能性(概率)为 95%。
第四,计算检验统计量的值
第五,作出统计决策
α
0H 3190?μ
1H 3190?μ
0H
α
三、双侧检验和单侧检验
(一)双侧检验
,,
只要 > 3190 或 < 3190 中有一个成立,就可以否定原假设。
0H 3190?μ 1H 3190?μ
μ μ
25.02?α25.02?α
接受域拒绝域 拒绝域临界值 临界值
05.0?α
(二)单侧检验
1、左单侧检验
按规定灯泡的使用寿命平均低于 1000小时,该批灯泡不能出厂。已知灯泡的使用寿命服从正态分布,标准差为 20小时。在总体中随机抽取了 100只,得知样本均值为 960小时,该批灯泡能否出厂。
,,<10000H 10 001H
接受域临界值拒绝域
05.0
2、右单侧检验
如前例,不合率不能高于 5%。
,,>5%0H %5 1H?
临界值接受域 拒绝域
05.0
四、一个正态总体的假设检验
(一)总体为正态分布且方差已知
例:我国出口凤尾鱼罐头,标准规格是每罐净重 250克,
据以往经验,标准差是 3克。某食品厂生产一批供出口用的这种罐头,从中抽取 100罐检验,其平均净重 251克。
假定罐头重量服从正态分布,按规定显著性水平,问这批罐头是否合乎出口标准?
( 1)提出假设,克,,克
( 2)建立统计量 ~N( 250,) ~N( 0,1 )
( 3)临界值
( 4)计算统计量的值
05.0
0H 250 1H 250
x 10032
n
xz

96.1
2
z
33.3
1 0 0
3
2 5 02 5 1z
( 5)进行决策 拒绝
0-1.96 1.96
拒绝域 拒绝域接受域
33.3
0H
(二 )总体为正态分布但方差未知且 n<30
例:某汽车轮胎厂声称该厂生产的汽车轮胎平均行使里程大于 25000公里。现对 15个轮胎作了试验,得到平均行使里程为 27000公里,标准差 5000公里,假定轮胎的行驶里程数近似服从正态分布,我们能否得出结论,该厂的产品与该厂声称的标准相符?( )
,,,>2500
05.0
0H 25 00 1H?
55.1
15
5000
2500027000
n
s
xt?
76.1)14()1( 05.0 tnt?
1.76
接受域 拒绝域
(三 )总体为非正态分布
1,总体的标准差已知
2,总体的标准差未知
某房产经纪人称邻近地区房屋的平均价值低于 480000
元。现抽查了 40间房屋,平均价值 450000元,标准差为 120000元。在 0.05的置信水平下,这些数据能否支持这位经纪人的说法?
,,,μ <480000
30?n
n
xz

30?n ns
xz
0H 1H4 8 0 0 0 0
581.1
40
120000
480000450000
n
s
xz?
645.1z
五、一个总体比率的假设检验
例,一项调查结果表明某市老年人口比重为 14.7%,该市
老年人口研究会为了检验该项调查是否可靠,随机抽选了 400名居民,发现其中有 57人年龄在 65岁以上。调查结果是否支持该市老年人口比重为 14.7%的看法?
,p=14.7%,05.00H %7.14?p1H %25.14
4 0 0
57p
254.0
400
%)7.141%(7.14
%7.14%25.14
)1(
00
0


n
pp
ppz
96.1
2
z
六、两个总体平均数之差的假设检验
(一 )两个正态总体且方差已知 服从标准正态分布。
例:有两种方法可用于制造两种以抗拉强度为重要特征的产品,经验表明,用这两种方法生产出来的产品的抗拉强度都近似服从正态分布。 千克,千克。
现分别抽取 12和 16,得到样本均值分别为 40千克和 34千克。想知道这两种方法所生产产品的抗拉强度是否相同。
( )
,,,27.2
16
64
12
36
0)344()()(
2
2
2
1
2
1
2121?


nn
xx
z


61 82
05.0
0H 021 1H 021
96.1
2
z
(二)两个正态总体方差未知(大样本)
2
2
2
1
2
1
2121 )()(
n
s
n
s
xx
z


(三)两个正态总体方差未知但相等(小样本)
2
2
1
2
2121 )()(
n
s
n
s
xx
t


2
)2()1(
21
2
22
2
112


nn
snsns
已知某年来自城市和农村中考考生的成绩都服从正态分布且方差基本相等。抽样资料城市:,,
。农村为:,,。
能否说明城市考生的平均成绩比农村考生的平均成绩高。
,,,0H 1H021 021
171?n
152?n
5451?x
4952?x501?s 552?s
27 4521517 55)115(50)117(
22
2?

s
69.2
15
2 7 4 5
17
2 7 4 5
0)4 9 55 4 5(?
t
7.1)30(05.0?t
(四)两个正态总体方差未知且不等(小样本)
2
2
2
1
2
1
2121 )()(
n
s
n
s
xx
t



2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
)()(
)(
n
ns
n
ns
n
s
n
s
fd

某纺织厂可以从两个地区购买原纱。如果有理由认为 A地区的产品(价格低)抗断强度不低于 B地区的产品,该厂将购买 A地区的产品。现各抽取一个随机样本,结果为:,,;,,
。假定抗断强度近似服从正态分布,总体方差不等。在 水平下,你是否建议纺织厂购买价格低的原纱。
10?An 12?Bn94?Ax 98?Bx142?As
92?Bs
05.0
0H 1H:,,0 BA 0 BA
73.2
12
9
10
14
0)9894(
t
19
12
)129(
10
)1014(
)
12
9
10
14
(
22
2
fd
73.1)19(05.0 t
(五)两个非正态总体方差已知(大样本)
2
2
2
1
2
1
2121 )()(
nn
xx
z



(六)两个非正态总体方差未知(大样本)
例:一个样本由 A居民区的 100个家庭组成,另一个样本由 B居民区的 150个家庭组成。两个样本关于居住时间的信息为,个月,; 个月,。
能否说明 A区平均居住时间比 B区短?( )
,,,
05.0
33?Ax 49?Bx9002?As 1 0 5 02?Bs
BA BA0H 1H 0.4
15 0
10 50
10 0
90 0
0)4933()()(
2
2
2
1
2
1
2121


n
s
n
s
xx
z

645.105.0 z
七、两个总体比例之差的假设检验
(一)检验两个总体比例之差是否为 0
2
22
1
11
2121
)1()1(
)()~~(
n
pp
n
pp
pppp
z

21
21
nn
xxp

)
11
)(1(
)()~~(
)1()1(
)()~~(
21
2121
21
2121
nn
pp
pppp
n
pp
n
pp
pppp
z



例,甲、乙两公司属于同一行业,现调查工人愿意增加福利还是工资。在甲公司 150名工人中有 75人愿意增加工资,乙公司 200名工人中有 103人愿意增加工资,
在 的显著性水平下,可以判断这两个公司中愿意增加工资的工人所占比例不同吗?
01.0
0H 1H001 pp 001 pp
5.01 5 075~ 1p 5 1 5.0
2 0 0
1 0 3~
2p 509.0200150
10375?
p
278.0
)
200
1
150
1()509.01(509.0
515.050.0

z
58.22z
(二)检验两个总体比例之差为某一常数
例:某厂检验员认为该厂 A车间的产品一级品率比 B车间的产品一级品率至少高 5%,现从 A车间抽取 150,
一级品 113;从 B车间抽取 160,一级品 104。检验员的观点对吗?( )05.0
0H 1H 05.0 BA pp
027.1
160
)65.01(650.0
150
)753.01(753.0
05.0)650.0753.0(
)
~
1(
~
)
~
1(
~
)
~~
(
0




B
BB
A
AA
BA
n
pp
n
pp
dpp
z
05.0 BA pp
753.0150113~Ap 65.0
1 6 0
1 0 4~
Bp
6 4 5.1z
返回第九章 综合复习
一,总论
二,统计调查三,统计资料整理
四,综合指标
五,动态数列分析
六,指数
七,相关与回归分析
八,抽样推断返回一,总论
(一)统计学基本问题
1、统计学的涵义
2、统计学的研究对象和性质
(二)统计学中的几个基本概念二、统计调查
(一)统计调查的组织方式
1、普查
2、重点调查与典型调查的适用条件
(二)统计调查方案
1、调查对象、调查单位
2、调查时间三、统计资料的整理
(一)统计分组
1、单项式分组
2、组距式分组
3、组距式分组中的有关问题
(二)次数分布的编制
(三)统计表的结构和种类四、综合指标
(一)总量指标
时期指标、时点指标的概念及特点
(二)相对指标
1、结构、比例、比较、动态相对指标的涵义
2、强度相对指标的涵义及与平均指标的区别
3、计划任务数为相对数的计划完成相对指标的计算
(三)平均指标
1、加权算术、加权调和、几何平均数的计算及适用条件。
2、各种平均数的优缺点
(四)变异指标
标准差、标准差系数的作用、计算、适用条件。
五、动态数列分析
(一)动态分析指标
1、增长量的计算及种类、增长 1%的绝对值的计算
2、发展速度的计算、种类及与增长速度的关系
3、用几何平均法计算的平均发展速度和平均增长速度
4、根据时点数列和相对数数列计算的平均发展水平
(二)动态趋势分析
1、动态数列发展变化的四种趋势
2、了解测定长期趋势的方法
3、了解测定季节变动的方法六、指数
( 一)综合指数的计算及两因素综合指数体系的因素分析
(二)平均式指数的计算及因素分析
(三)平均指标指数的计算及因素分析七、相关与回归分析
(一)相关与回归分析的主要内容
(二 )相关系数的计算及性质
(三)相关分析与回归分析的关系
(四)回归方程的建立
(五) b与 r的关系
(六)估计标准误差的计算及与 r的关系八、抽样推断
(一)抽样误差
1、概念
2、简单随机抽样下抽样平均误差的计算
3、抽样平均误差与极限误差的关系
4、影响抽样平均误差的因素
(二)抽样单位数目的确定
1、简单随机抽样下抽样单位数目的计算
2、影响抽样单位数目的因素
(三)抽样估计
1、估计量的优良标准
2、区间估计
3、假设检验 返回第十章 习题解答
第一节、课本习题解答
(一 ) 第 25题 用两种方法计算工人的平均月工资109p
月工资
x
工人数 f
比重 % xf
646 5 10 3230
676 15 30 10140
706 16 32 11296
740 10 20 7400
780 4 8 3120
__ 50 100 35186
f
f 72.70350
35186
f
xfx
72.703
47801074016706
156765646



f
f
xx
(二 ) 第 27题110p
按劳动生产率分组
( )
班组工人数 f
组中值 x
Xf
60—70 8 50 65 3250
70—80 15 100 75 7500
80—90 5 80 85 6800
90以上 2 65 95 6175
合计 30 295 __ 23725
人件工人平均劳动生产率
4.80
2 9 5
2 3 7 2 5
)(
)(

f
xf
工人数产量
(三 ) 第 28题
1车间实际产量 200件,完成计划 96%,2车间实际产量
300件,完成计划 100%,3车间实际产量 150件,完成计划
104%,则 3个车间产量的平均计划完成程度为:
1车间产品单位成本为 15元,2车间产品单位成本为 25
元,3车间产品单位成本为 20元,则 3个平均单位成本为,
110p
%10 4
15 0
%10 0
30 0
%96
20 0
15 030 020 0

%1003
%104%100%96
150300200
150203002520015

件元203 202515
(四 ) 第 29题甲、乙两农贸市场农产品资料110p
品种 价格
x
甲市场成交额 m 乙市场成交量
f
xf
1
2
3
1.2
1.4
1.5
1.2
2.8
1.5
2
1
1
1
2
1
2.4
1.4
1.5
合计 __ 5.5 4 4 5.3
x
m
甲市场平均价格 = 3 7 5.14
5.5
x
m
m
乙市场平均价格 = 325.14 3.5
f
xf
(五 ) 第 31题 甲、乙两单位职工资料甲单位 乙单位工资人数工资人数
555
570
595
615
8
12
17
3
4440
6840
10115
1845
5408
1452
3332
3468
560
575
597
620
10
24
2
4
5600
13800
1194
2480
2890
96
800
7396
合计 40 23240 13660 合计 40 23074 11182
甲x 甲f 乙x 乙f
111p
甲甲 fx 甲甲甲 fxx 2)(? 乙乙 fx 乙乙乙 fxx 2)(?
5814023240甲x
5 7 7402 3 0 7 4乙x 72.164011182乙?
45.184013660甲? %18.35 8 145.181v
%84.2577 72.162v
(六) 第 32题 两种不同农作物试种111p
村庄 甲品种 乙品种收获率面积收获率面积
1
2
3
4
5
475
450
550
525
500
11
9
10
8
12
5225
4050
5500
4200
6000
6603
22052
25503
5202
3
350
450
560
500
604
9
13
15
13
10
3150
5850
8400
6500
6040
199809
31213
55815
13
110250
合计 — 50 24975 59363 — 60 29940 397100
甲x 甲f 甲甲 fx
甲甲甲 fxx 2)(?
乙x 乙f
乙乙 fx
乙乙乙 fxx 2)(?
4 9 9602 9 9 4 0乙x
46.345059363甲?
35.8160110250乙?
5.4 9 9502 4 9 7 5甲x %5.145.4 9 946.341v
%3.16499 35.812?v
(七 ) 12题 1990—1997年我国年末居民储蓄存款余额资料
1990 1991 1992 1993 1994 1995 1996 1997
7034 9110 11545 15204 21519 29662 38521 46280
1991—1997年我国居民储蓄存款平均余额为,
7
24 6 2 8 03 8 5 2 12 9 6 6 22 1 5 1 91 5 2 0 41 1 5 4 59 1 1 027 0 3 4a
(八 ) 第 14题 4月份工人变动登记如下,
4.1 4.11 4.16 5.1
1210 1240 1300 1270
30
151 3 0 051 2 4 0101 2 1 0a
4月份平均人数为,
158p
159p
1.1 4.1 6.1 9.1 12.1 12.31
在冊人数 1326 1335 1408 1414 1412 1412
(九 ) 第 115题 1998年各月人数如下,
1998年平均人数为,
12
1
2
14 1214 123
2
14 1214 14
3
2
14 1414 082
2
14 0813 353
2
13 3513 26


a
159p
(十 ) 第 16题 1995年各季度的资料计划产值 计划完成 %
1季度 1860 114
2季度 1887 105
3季度 1875 110
4季度 1889 120
年平均计划完成 %
1 8 8 91 8 7 51 8 8 71 8 6 0
%1 2 01 8 8 9%1 1 01 8 7 5%1 0 51 8 8 7%1 1 41 8 6 0

c
159p
(十一 ) 17题 1990—1995各年底我国从业人员资料160p
年份 从业人员数 第三产业人数
1990
1991
1992
1993
1994
1995
63909
64799
65554
66373
67199
69600
11828
12247
12979
14071
15456
18375
“八五,期间我国第三产业人数占全国从业人数的平均比重为,
2
696 00671 99663 73655 54647 99
2
639 09
2
183 75154 56140 71129 79122 47
2
118 28


c
(十二 ) 18题 某工厂 1998年下半年资料160p
月份 月初人数 总产值 (万元 )
6
7
8
9
10
11
12
2690
2850
2750
2680
2800
2780
2850
1500
1600
1560
1520
1580
1620
1650
12月底工人数为 2840
(1)下半年平均人数为
(2)下半年月平均产值
2 7 8 46 2
2 8 4 02 8 5 02 7 8 02 8 0 02 6 8 02 7 5 022 8 5 0

b
1 5 8 86 1 6 5 01 6 2 01 5 8 01 5 2 01 5 6 01 6 0 0a
(1)
(2)
(3)下半年月平均劳动生产率
2 7 8 41 5 8 8?c
(4)下半年劳动生产率
627841588c
(十三 ) 20题我国 1990年和,八五,时期家用电冰箱资料161p
1990 1991 1992 1993 1994 1995
产量
(万台 )
463.06 469.94 485.76 596.66 768.12 918.54
增长量
(万台 )
__ 6.88 15.82 110.9 171.46 150.42
发展速度 %
__ 101.49 103.37 122.83 128.74 119.58
增长速度 %
__ 1.49 3.37 22.83 28.74 19.58
增长 1%
绝对值
__ 4.6306 4.6994 4.8576 5.9666 7.6812
平均增长速度 % 106.463
54.9185?
(十四 ) 21题 某地区粮食产量 1990—1992年平均发展速度是 1.05,1993 —1994年是 1.15,1995年比 1994
年增长 7%,求 1990 —1995年 6年的平均发展速度
6 23 07.115.105.1x
161p
161p?(十五 ) 22题 已知 1990年我国国民生产总值为
18598.4亿元,若以平均每年增长 8%的速度发展,到 2000年国民生产总值将达到什么水平?
1008.14.1 8 5 9 8na
(十六 ) 14题
(1)产量增长 10%,某种原材料消耗总量增长 6%,单耗的变动程度为,
(2)销售额增长 20%,价格总的上涨 8%,销售量的变动程度为,
%1 1 0%1 0 6
208p
%1 0 8%1 2 0
(十七 ) 16题 某厂产量和价格资料209p
产品 产量 价格 (元 ) 产值 (万元 )
甲 (件 )1500 1600 180 170 27 28.8 27.2
乙 (吨 )2300 2700 60 60 13.8 16.2 16.2
丙 (吨 )300 300 340 310 10.2 10.2 9.3
合计 __ __ __ __ 51 55.2 52.7
0q 1q 0p 1p 00pq 11pq01pq

10
11
00
01
00
11
qp
qp
pq
pq
qp
qp
)qpqp()pqpq(pqpq 101100010011
2.55
7.52
51
2.55
51
7.52
103.33%=108.24% 95.47%?
1.7=4.2+(-2.5)
(十八 ) 17题 某商场销售 3种商品资料209p
商品
% %
销售额 (万元 )
甲 (匹 ) 100 115 10 11.5 11.5 11.5
乙 (吨 ) 110 110 10 12.1 11 11
丙 (件 ) 125 105 6 7.875 6.3 6.3
合计 __ __ 26 31.475 28.8 28.8
qkpk
00pq 11pq

11
11
00
00
00
11
1
pq
k
pq
pq
pqk
pq
pq
p
q
00 pqkq
11
1 pq
kp
8.28
45.31
26
8.28
26
45.31
%2.1 09%77.1 10%96.1 20
)pqk
1pq()pqpqk(pqpq
11
p
110000q0011
5.45=2.8+2.65
(十九 ) 18题 两个分厂资料209p
分厂 生产工人数 劳动生产率 工业增加值 (万元 /人 )
1 100 130 1.00 1.20 100 156 130
2 85 90 0.90 0.95 76.5 85.5 81
合计 185 220 __ __ 176.5 241.5 211
0f 1f 0x 1x 00 fx 11fx 10 fx

0
00
1
10
1
10
1
11
0
00
1
11
f
fx
f
fx
f
fx
f
fx
f
fx
f
fx
18 5
5.17 6
22 0
21 1
22 0
21 1
22 0
5.24 1
18 5
5.17 6
22 0
5.24 1

115.1%=114.5% 100.5%
4.95
9.95
9.95
8.109
4.95
8.109
14.4=13.9+0.5
(二十 ) 11题 编制回归方程,计算相关系数
8?n 4.36x 880y 54.2072 x 1 0 4 2 1 42 y
6.4544xy



2222 )y(
n
1
y)x(
n
1
x
yx
n
1
xy
r
97.0
880811 0 4 2 1 44.368154.207
8804.36816.4 5 4 4
22


r
xx
xy
22 l
l
)x(
n
1
x
yx
n
1
xy
b
xbya



b=12.9
55.48 4.36x
1108880y
a=110-12.9ⅹ4.55=51.305
xy 9.12305.51
234p
(二十一 ) 12题234p
234p
xxxy LL 6.1? xy 2?
yyy
xxx
L
n
L
n
1
1
xxyy LnLn
121?
xxyy LL 4?
8.046.1
xxxx
xx
yyxx
xy
LL
L
LL
Lr
(二十二 ) 13题 252?x? 9.0?r8.2?a
08.1569.0
x
yrb
62.2)9.01(36)1( 222 rs yyx?
362?y?
(二十三 ) 15题 某企业产量及单位成本资料235p
月份 产量 (千件 )x 单位成本 (元 )y xy
1 2 73 146 4
2 3 72 216 9
3 4 71 284 16
4 3 73 219 9
5 4 69 276 16
6 5 68 340 25
合计 21 426 1481 79
2x
82.1
)21(6179
21426611481
2



b 63.6462182.16426a
xy 82.163.64
81.6282.163.64y
71.53682.163.64y
(二十四 ) 9题某外贸公司出口一种水果罐头,规定每瓶包装规格不低于 400克,现用不重复抽样的方法抽取
1%进行检验,其结果如下:
274p
每瓶重量 g 瓶数 f x xf
380—390 10 385 3850 3240
390—400 20 395 7900 1280
400—410 50 405 20250 200
410—420 20 415 8300 2800
合计 100 — 40300 7520
fxx 2)(?
403
100
4 0 3 0 0

f
xf
x
67.81007520s
32z
)1(
2
2?

N
nN
n
szx
N=10000 n=100
P=70%
)1()1(
2?

N
nN
n
ppzp
(二十五) 10题 某小区有 1500位 20至 60岁的女性,
用简单随机重复抽样的方法抽出 50位,调查结果如下:
275p
每日家务时间
124 134 140 150 160 180 200 260 合计人数 f 4 6 9 10 8 6 4 3 50
xf 496 804 1260 1500 1280 1080 800 780 8000
5184 4056 3600 1000 0 2400 6400 30000 52640
fxx 2)(? 160508000x
x
45.325052 64 0s
18.916050 45.322160
2
nszx?
22z
(二十六) 11题 某大学有学生 5000人,近年资料表明学生的人均月生活费用为 300元,均方差 8元。
若采用不重复抽样方法调查学生的人均月生活费用,
应抽取多少人才能以 95%的置信度保证最大估计误差不超过 3元?
275p
96.12z 3x8?x? N=5000
27
8)96.1(35000
8)96.1(5000
222
22
22
2
2
22
2?



xx
x
zN
Nz
n
(二十七) 14题 一个主持人想了解节目的收视情况,
选取了 500名观众进行问卷调查,结果发现经常看该节目的有 225人,以 95%的概率保证程度估计经经常看该节目比例的区间范围。
276p
%45500225p 96.12z n=500
%36.4%45
500
%55%4596.1%45
)1(
2


n
pp
zp
第二节、摸拟题及答案
摸拟题(一)
一、填空题(每空 1分,共 10分)
1、统计学是 ————性质的科学。(方法论)
2、统计研究总体是在 ——性,——性的基础上,研究其 ——性的。(同质、大量、差异)
3、变量按影响因素是否确定可分为 ——型变量和 ——
型变量。(连续、离散)
4、反映现象在某一段时期内总量的指标是 ——指标。
(时期)
5、总体的某一部分数值与总体的全部数值之比得到 —
—相对指标。(结构)
6、主词不作任何分组所形成的统计表是 ——。(简单)
7,12个月的季节比率之和应该等于 ——。( 1200%)
二、判断题(每小题 2分,共 20分)
1、某市对占该市钢铁产量三分之二的 5个钢铁企业进行调查,以了解该市钢铁生产的基本情况,这种调查方式属于典型调查。( × 重点调查)
2,2002年我国人口出生数是一个时点指标。( × 时期)
3,2002年我国人均粮食产量是一个平均指标。( ×
强度相对指标)
4、连续型变量只能用组距式分组。
5、当两个数列的平均水平相等时,可以用标准差对比其平均水平的代表性。
6、相邻两个累计增长量之比等于相应时期的逐期增长量。( × 之差)
7、加权算术平均式产量指数公式权数为 ( × )
8,r的值越大,相关的程度越高。( × r的绝对值)
9、测定长期趋势的方法有时距扩大法、移动平均法、
数学摸型法。
10、某企业本年计划增加值 1000万元,实际为 1100万元,则计划完成相对指标为 110%。
三、多项选择题(每小题 2分,共 10分)
1、属于平均指标的有( )
某地区平均每人粮食产量
某企业工人平均工资
某地区平均每人钢产量产量
某企业人均增加值
某车间工人平均日产量
11qp 00qp
2、属于时期指标的有( )
某年死亡人口数?月初物资库存量
某年初耕地面积数?某校毕业学生数
某学期初在校学生数
3、标准差与平均差( )
都能反映现象的变异程度
都能衡量平均数的代表性
标准差比平均差准确
消除离差正负号的方法不同
适用条件相同
4、衡量估计值是否优良的标准有
无偏性?抽象性? 差异性
一致性?有效性
5、测定季节变动的方法有
移动平均法? 按月平均法
按季平均法? 移动平均趋势剔除法
剩余法
四、简答题(每小题 5分,共 10分)
1、简要说明参数估计和假设检验的异同
( 1)相同:都是利用样本资料对总体进行某种推断的方法,参数估计的置信区间所对应的就是假设检验的接受域。
( 2)不同:推断的角度不同。参数估计是在总体参数未知的情况下用样本统计量估计总体参数。假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立。
2、简要说明抽样的各种组织形式
( 1)简单随机抽样:对总体不进行任何分类排队。
( 2)类型抽样:先把总体分为若干类
( 3)等距抽样:排队后按相等的距离抽取
( 4)整群抽样:从总体群中抽取样本群
( 5)阶段抽样:分阶段抽取样本
五、计算题(共 50分)
1、某企业两个生产班组日产量资料如下表
计算有关指标说明哪个班组的平均日产量的代表程度高。
日产量工人数 f
x xf 日产量 工人数 f
x xf
1-3 3 2 6 27 10-30 4 20 80 1024
3-5 4 4 16 4 30-50 4 40 160 64
5-7 5 6 30 5 50-70 2 60 120 1152
合计
10 — 52 36 合计 10 — 360 2240
fxx 2)(? fxx 2)(?
510521 fxfx
36103 6 02x
967.14102 2 402
%95.375897.11 xv?
%58.41369 6 7.142v 897.1
10361
2、某百货公司的资料如下表,计算该公司
(1)第二季度平均销售额 (2)第二季度平均职工人数
(3)第二季度人均月销售额月份 3 4 5 6
销售额 (万元 )a
月末人数 (人 )b
1500
600
1600
615
1650
630
1850
660
17003 185016501600 naa
6253 2
6606306152600

b
72.26251700 bac
3、已知某产品生产费用总额,2002年为 12.9万元,比
2001年多 9000元,单位成本比 2001年降低 3%.计算生产费用总额指数、产量指数、由于成本降低而节约的生产费用、由于产量增加而增加的生产费用。
9.1211 zq 129.09.1200 zq %97
01
11
zq
zqk
z
%5.10712 9.12
00
11
zq
zqk
qz
%82.1 1 0
12
%97
9.12
12
%97
11
00
01
zq
zq
zqk
q
3 9 8 9 7.0%979.129.120111 zqzq
29897.112%979.120001 zqzq
4、为调查农民生活水平,在某地区 5000户中随机抽取 400户进行调查,得知 400户中有 300户拥有彩电,
以 95%的把握程度估计该地区所有农户中拥有彩电的农户比例;若要求允许误差不超过 0.02,至少应抽取多少户作为样本?(重复抽样 )
N=5000 n=400 %75
400
300p 96.1
2z
96.12z
%24.4%75
4 0 0
%)751%(75
96.1%75
)?1(?
2


n
pp
zp
1 8 0 1
)02.0(
%)751%(75)96.1()?1(?
2
2
2
2
2
p
ppz
n
5、某地居民 2000——2002年有关资料如下表
建立以销售额为因变量的直线回归方程,并估计人均收入为 600元时,商品销售额为多少。
年份 月人均收入 (元)
x
商品销售额
(万元) y
xy
2000
2001
2002
300
400
500
15
17
16
4500
6800
8000
90000
160000
250000
合计 1200 48 19300 500000
xx
xy
22 l
l
)x(
n
1
x
yx
n
1
xy
b
xbya



2x
025.0
)1200(
3
1
500000
481200
3
1
19300
2


b
631 2 0 0025.0348a
6、某企业资料 ( 1)计算第一季度平均月劳动生产率
( 2)计算第二季度平均月劳动生产率
( 3)计算上半年平均月劳动生产率月份月初人数增加值
(万元)
1
2
3
4
5
6
7
1850
2050
1950
2150
2216
2190
2250
250
272
271
323
374
373
380
3
2
21 5019 5020 50
2
18 50
3
27 127 225 0
)1(



b
a
c
3
2
22 5 021 9 022 1 6
2
21 5 0
3
373374323
)2(



b
a
c
6
2
2 2 5 02 1 9 02 2 1 62 1 5 01 9 5 02 0 5 0
2
1 8 5 0
6
373374323271272250
)3(


c
摸拟题(二)
一、填空题(每空 1分,共 13分)
1、某企业计划规定增加值今年在去年的基础上提高 5%,
实际提高了 6%,增加值计划完成程度为 ——。( )
2、众数是 ——的那个变量值。(出现次数最多)
3、加权算术平均数大小受 ——和 ——两个因素的影响。
(变量值、次数)
4、各标志值与算术平均数的离差之和为 ——。( 0)
5、测定长期趋势的方法有时距扩大法,——和 ——。
(移动平均法、数学模型法)
6、某厂报告期职工的总平均工资比基期提高 3.2%,职工人数增加 2%,工资总额提高 ____.(103.2%?102%)
7、抽样极限误差是 ——指标与 ——指标之间最大可能的误差范围。
8、假设检验有 ——侧检验,——单侧检验,——单侧检验。
%105
%106
二、判断题(每小题 2分,共 20分)
1、相关系数 越大,估计标准误差就越大。(小)
2、在相关系数 的计算公式中,标准差 所起的主要作用是显示 x,y之间相关的方向。( )
3、无偏性是指样本统计量的平均值等于未知的总体指标。
4、对某企业的产品,每隔 20小时抽取 1小时的产品全部检验其质量,这种方式是等距抽样。(整群)
5、增长 1%的绝对值等于基期水平比 100。
6、某产品产量 2002年是 1999年的 135%,2000——2002
年的年平均发展速度为 。 ( )
7、变异指标与平均数的代表性成正比关系。
8、是非标志的标准差是 p( 1-p)。( )
r
x? y?
2xy?
4 %13 5 3 %13 5
)1( pp?
9、三个车间的合格率分别为 96%,99%,94%,则三个车间的平均合格率为 。
10、普查时必须确定一个标准时点。
三、多项选择题(每小题 2分,共 10分)
1、测定离散程度的指标有( )
全距?平均差?标准差?标准差系数
2、当现象完全相关时,相关系数为( )
0? 1?0.5?-1?-0.5
3、缩小抽样误差的途径有( )
缩小总体方差?增加样本数
减少样本数
将重复抽样改为不重复抽样
将不重复抽样改为重复抽样
3 %94%99%96
)( xx
4、影响动态数列发展变化的因素有( )
长期趋势?季节变动?循环变动
不规则变动?时期的长短
5、当 时,说明( )
甲数列的变异程度大于乙数列
甲数列的变异程度可能大于乙数列
甲数列的变异程度可能小于乙数列
甲数列的变异程度小于乙数列
甲数列平均水平的代表性可能大于乙数列乙甲
四、简答题 (每小题 5分,共 10分)
1、影响抽样单位数目因素有那些,并说明各种因素与抽样单位数目的关系。
( 1) 总体各单位的变异程度,正比关系。
( 2)抽样推断的准确程度△,反比关系。
( 3)抽样推断的可靠程度 t,正比关系。
( 4)抽样的组织形式。
( 5)抽样的方法。
2、说明相关分析与回归分析的区别与联系
( 1)区别?任务不同?两个变量是非对等
两个变量是非都是随机的
( 2) 联系?相关分析是回归分析的基础和前提。
回归分析是相关分析的继续和深化
五、计算题(共 47分)
1、甲、乙两地同种商品的资料如下表,比较哪个地区的平均价格高并说明原因等级 价格 x 甲地销额 (元 )m 乙地销量 f xf
1级 1.3 1300 1000 1300 1000
2级 1.2 2400 1000 1200 2000
3级 1.1 1100 2000 2200 1000
合计 ___ 4800 4000 4700 4000
xm
2.1
4000
4800
x
m
mH
175.14 0 0 04 7 0 0
f
xfx
2、确定表中所缺的与上年相比的各种动态分析指标年份 1998 1999 2000 2001 2002
增加值 (万元 )
(4500) 4800 (5100) (5355) (5515.65)
增长量 (万元 )
___ (300) 300 (255) (160.65)
发展速度 (%)___ (106.67)(106.25)105 (103)
增长速度 (%)___ (6.67) (6.25) (5) 3
增长 1%的绝对值 (万元 )
___ 45 (48) (51) (53.55)
平均增长速度 (%) 4 450065.5515
3、某企业生产三种产品有关资料如下表。从相对数和绝对数两方面对该企业总成本的变动进行因素分析。
产品 产量 单位成本(元) 总成本(元)
甲(百吨) 12 14 1000 1000 12000 14000 14000
乙(百台) 4 5 500 400 2000 2500 2000
丙(百箱) 10 16 100 100 1000 1600 1600
合计 —



—— —— 15000 18100 17600
0q 0z1q 1z 00zq 01zq 11zq

10
11
00
01
00
11
qz
qz
zq
zq
qz
qz
1 8 1 0 0
1 7 6 0 0
1 5 0 0 0
1 8 1 0 0
1 5 0 0
1 7 6 0 0
117.33%=120.67%× 97.24
% 2600=3100+(-500)
4、用重复抽样的方法从 10000个电子管中随机抽取 4%
进行耐用性能的检查,样本计算结果平均寿命为 4500
小时,样本寿命时数方差为 15000,不合格率为 3%,
要求以 95.45%的概率保证程度估计该批电子管的平均寿命和不合格率的范围,( )
4500?x 150002?s %3?p n=400
22z
25.12450 0400150 002450 0
2
nszx?
%7.1%3
4 0 0
%)31%(3
2%3
)?1(?
2


n
pp
zp
5、根据下列资料计算相关系数、建立回归方程
6、某企业人数资料
计算该企业第一季度平均人数
252?x? 362?y? 272?xy? a=2.8
9.065 2722
2

yx
xyr

08.1
5
69,
x
yrb
返回
1月 1日 1月 20日 2月 3日 2月 25日 3月 31日实有人数 1256 1264 1275 1270 1281
90
342 1 2 8 11 2 7 0222 1 2 7 01 2 7 5142 1 2 7 51 2 6 4202 1 2 6 41 2 5 6
a