统计学原理
浙江工贸学院
经贸系 刘锋
E-mail,liufeng63@126.com
? 介绍本课程的教学目的
? 本学期教学计划
? 教材和参考书目
? 本课程是为提高财会人员的统计知识水平
而设立的。在中国的许多企业或管理部门
中,财会人员与统计人员在工作中有许多
联系,很多财会人员本身就兼职统计,因
此他们需要掌握一定的统计知识。另一方
面,统计作为一门关于数据的收集、整理、
分析和应用的方法论科学,其作用在人们
的日常生活和工作中处处体现出来。
? 在科技高速发展、信息处理日显重要的时
代里,统计学已经成为人们生活、学习和
工作的重要工具,甚至成为人们所需要具
备的重要的基本素质。因此,财会人员掌
握统计的基本知识,不仅有利于他们做好
自己的本职工作,而且有利于他们提高自
己的能力,进一步跟上时代发展的步伐。
教材,
? 统计学原理
第二版 栗方忠 主编
东北财经大学出版社
参考书目,
? 统计学
袁卫 庞皓 曾五一
高等教育出版社
? 统计学
中国时代经济出版社
※ 第一章 总论
※ 第四章 总量指标和相对指标
※ 第五章 平均指标和变异指标
※ 第二章 统计设计和统计调查
※ 第三章 统计整理
※ 第六章 动态数列
※ 第七章 统计指数
※ 第八章 抽样调查
※ 第九章 相关与回归分析
※ 第十章 统计预测
※ 第十一章 统计综合分析
总论
第一章
内容提要
统计是社会认识的有力武器之一。, 统计,
一词有统计工作、统计资料和统计科学三种含
义。本章阐述了统计研究对象的特点 (数量性、
总体性、具体性和社会性 );统计的作用;统计
学中的基本概念 (总体、总体单位、标志、指标、
变异、变量和变量值 );统计研究的基本方法和
统计工作的一般过程 (统计设计、统计调查、统
计整理和统计分析 );统计工作的任务和组织。
统计研究的对象、特点和作用
第一节
统计作为一种社会实践活动已有悠久
的历史。最初,统计只是为统治者管理国
家的需要而搜集资料,弄清国家的人力、
物力和财力,作为管理国家的依据。
统计有三种含义,即统计工作、统计资料和
统计科学。
统计工作,即统计实践,是指根据科学的
方法从事统计设计、搜集、整理、分析研
究和提供各种统计资料和统计咨询意见的
活动总称,其成果是统计资料。
统计资料,是统计工作活动过程所获
得的各种有关数字资料以及与之相联系的
其他资料的总称。
统计科学,即统计理论,是指统计工作
实践的理论概括和科学总结。
? 统计学是一门收集、整理和分析统计数据
的方法科学,其目的是探索数据的内在数
量规律性,以达到对客观事物的科学认识。
二、统计研究的对象和特点
统计以社会经济现象为其研究领域,具有
自己的特点。
(一 )数量性
(二 )总体性
(三 )具体性
(四 )社会性
三、统计的作用
(一 )统计是社会认识的一种有力武器
(二 )统计是制订计划、实行宏观调控的基础
(三 )统计是制定政策的依据
(四 )统计是实行管理的手段
(五 )统计是认识世界、开展国际交流和科学
研究的工具
四、统计学的理论基础
统计研究的基本方法与过程
第二节
一, 统计研究的基本方法
(一 )大量观察法
大量观察法就是对所要研究的事物的全
部或足够多数的单位进行观察 。
(二 )分组法
根据所研究对象总体的特点和统计研究
的任务,按照一定的标志,把所研究的现象总
体划分为不同性质或类型的组,这种方法在统
计上称为统计分组法 。
(三 )综合指标法
所谓综合指标法, 是指利用综合指
标对现象总体的数量特征和数量关系进
行综合, 概括和分析的方法 。
二, 统计工作的过程
(一 )统计设计
(二 )统计调查
(三 )统计整理
(四 )统计分析
统计学中的基本概念
第三节
一, 统计总体与总体单位
统计为正确认识客观现象,必须从总体角度进
行观察,这就产生了统计总体的概念 。 凡是客观存
在,并在某一相同性质基础上结合起来的由许多个
别事物组成的整体,称为统计总体,简称总体 。
构成统计总体的每个独立的个别事物称为总
体单位,简称单位或个体, 如全部工业企业中的每
个企业, 全国人口总体的每个人等 。
二, 标志与指标
☆ 标志是说明总体单位特征的名称 。
例如,对人口普查中的, 某人, 来说,有性别,
年龄, 爱好等方面的特征, 这里的, 性别,
年龄, 爱好, 等名称就是标志 。
?一个完整的标志包括标志名称和标志表现两
个方面 。
? 标志分为品质标志和数量标志
? 品质标志是表明总体单位属性方面特征的,
不能用数值表示,而只能用文字陈述。
如 某人的性别、民族、文化程度等
? 数量标志是表明总体单位数量特征的,其
具体表现为数值,如 某人的年龄、工龄、
工资等
? 标志还可分为不变标志和可变标志
? 凡是总体中各单位某种标志的具体表现都
相同的,成为不变标志。不相同的称为可
变标志。
? 例如研究某学校教师的工资收入情况
该学校所有教师是总体,,职业, 是不变
标志,,工资, 就是可变标志
☆ 指标 (指统计指标 )是说明现象总体量的
特征的概念或范畴,及通过统计实践活动
可得到指标的具体数值的总称 。
标志和指标的主要区别是,
(1)标志是说明总体单位特征的,而指标
是说明总体特征的 ;
(2)标志有不能用数值表示的品质标志与
能用数值表示的数量标志,然而不论什么指标,
都是用数值表的 。
标志与指标的主要联系是,
(1)有些统计指标的数值是从总体单位的数
量标志值汇总得到的,如一个县的粮食实际入库总
产量是所属各乡村粮食实际入库量的汇总数,一个
工业主管局的总产值是所属各企业总产值的总和
等等 ;
(2)在一定的研究范围内指标和数量标志之间
存在着变换关系,当研究目的改变,原来的总体如
变为总体单位,则相应的统计指标就变为数量标志
了,反之亦然 。
三, 变异, 变量和变量值
可变标志在总体各个单位具体表现上的差别
就是变异,包括质 (性质, 属性 )的变异和量 (数值 )
的变异 。
一般来说, 变量就是可变的数量标志, 如工
人家庭人口数, 工人的工资等就是变量 。 变量的
数值表现就是变量值 。
量两种 。
统计总体具有同质性, 大量性和差异
性三个主要特点 。
1.同质性
2.大量性
3.差异性 (或称变异性 )
我国统计的任务和组织
第四节
一, 我国统计的任务
(一 )进行统计调查, 统计分析
(二 )提供统计资料和统计咨询意见
(三 )实行统计监督
二, 我国的统计组织
统计设计和
统计调查
第二章
内容提要
占有一定的统计资料是统计研究的基础。获得
高质量的统计资料的前提是统计设计。本章阐述
了统计设计的中心内容 (统计指标和统计指标体系
的设计 );统计设计一般原则;统计表及其设计;
统计调查方案;统计调查方法和组织方式,各种方
法的结合运用。根据统计研究任务要求,采用科学
的调查方式和方法搜集资料,是保证统计质量的基
本环节。目前,我国统计调查体系是以周期性普查
为基础,以经常性抽样调查为主体,以必要的统计
报表、重点调查、综合分析等为补充,搜集、整理
统计设计的概念和内容
第一节
一、统计设计的概念和意义
统计设计是根据统计研究对象的性质
和研究目的,对统计工作各个方面和各个
环节通盘考虑和安排,制定各种设计方案
的过程。
二、统计设计的种类
(一 )按统计设计所包括的研究对象的范围,可
分为整体设计和专项设计
整体设计,是以研究对象为一整体,对整个统计
工作进行的全面设计。
专项设计,是对研究对象的某一部分的统计设计。
(二 )按统计设计所包括的工作阶段,可分
为全过程设计和单阶段设计
全过程设计,是从确立统计任务、内容、
指标体系到分析研究的全过程的通盘安排。
单阶段设计,是就统计工作过程中的某一
阶段的安排,如统计调查的设计、统计整理
的设计、统计专题分析的设计等等。
(三 )按统计设计包括的时期,可分为长期设计、
短期设计和中期设计
长期设计是指五年以上的统计设计 ;
短期设计是一年或年度内的统计设计 ;
二三年的统计设计则可称为中期统计设计。
三、统计设计的内容
(一 )明确规定统计研究的目的和任务
(二 )确定统计指标和统计指标体系
(三 )确定统计分类和分组
(四 )研究设计统计表
(五 )确定统计分析研究的内容
三、统计设计的内容
(六 )制定统计调查方案
(七 )制定统计整理方案
(八 )规定各个阶段的工作进度和时间安排
(九 )考虑各部门和各阶段的配合与协调
(十 )统计力量的组织与安排
统计指标和指标体系的设计
第二节
一, 统计指标的概念和特点
(一 )统计指标的概念
统计指标反映总体现象的数量特征及其具体数
值 。 统计指标由六个要素构成
?指标名称
?计量单位
?计算方法
?时间限制
?空间限制
?指标数值
例如,2004年中国 GDP为 13.6万亿元人民币
(二 )统计指标的特点
1.数量性 。
2.综合性 。
3.具体性 。
二, 统计指标的种类
?绝对数与相对数的概念
绝对数是统计数据的基本表现形式, 现象的
总体规模和水平一般都以绝对数形式体现 。
比如:一个地区的总人口, 国内生产总值,
商品零售额等等都是绝对数 。
相对数是两个绝对数的比值, 反映事物的相
对数量 。 一般分为比例和比率两种形式 。 比
如人口统计中的性别比, 人口的出生率, 死
亡率, 自然增长率等等 。
(一 )统计指标按其表现形式不同, 可以分为
总量指标, 相对指标和平均指标
总量指标 是反映社会经济现象规模, 水
平或总量的指标,其数值表现为绝对数 。
相对指标 是表明两个有联系的统计指标
数值之比,是反映数量关系的指标,其数值表
现为相对数 。 平均指标 是同质总体内标志总
量与总体单位数相除的结果,表明总体各单位
标志值的一般水平的指标 。
(二 )统计指标按其说明的总体现象的内容不同,
可以分为 数量指标和质量指标
数量指标是反映社会经济现象的规模大小或数
量多少的统计指标,一般表现为总量指标, 绝对数,
如人口数, 企业数, 商品销售额等 。
质量指标是说明总体性质和数量关系,表明总
体的内部构成, 比例, 发展变化速度和一般水平的
指标,一般表现为相对指标和平均指标,其数值表现
为相对数和平均数, 如人口的性别构成, 出生率,
死亡率, 人口密度, 职工平均工资, 单位面积粮食
产量等等 。
(三 )统计指标按其反映事物的性质不同,
可分为实体指标和行为指标
实体指标是指它所反映的事物具有实物形
态,是客观存在的事物的量的特征, 如产品产量
指标, 劳动者人数指标, 固定资产价值指标等
等 。
行为指标是指它所反映的是某种行为的量
的特征, 如设备故障事故, 人员工伤事故, 违
法犯罪行为指标等等 。
(四 )统计指标按其数据取值依据不同,可分
为客观指标和主观指标
客观指标是指其取值依据,是对统计对象的
实际度量或计数,具有具体性和客观性,这类指
标多属实体指标,如产品产量, 劳动者人数等等 。
主观指标是指不可能或难以直接度量或计
数取值, 而只能凭人们的印象感受, 观察评价
确定其量的指标, 如民意测验, 对事物综合评
价等指标 。
(五 )统计指标按其在管理工作中的作
用不同, 可分为考核指标和非考核指标
考核指标是指用于定期或不定期检查,
评比, 考核用的指标 。
非考核指标是指不做考核用,主要是
用于了解情况和一般分析研究的指标 。
三, 统计指标体系的概念和种类
统计指标体系的概念
? 统计指标体系是一系列相互联系、相互制
约的统计指标所组成的整体。
指标体系的形式
? 加法模式
指标体系数值 =各个相关指标数值之和
例如:某产品的制造成本 =原材料消耗 +人
工费用消耗 +制造费用 +其他支出
公共收入 =税收收入 +公共收费 +公债 +国有
资产收益 +其他收入
? 乘法模式
指标体系数值 =各个相关指标数值之积
例如,
应纳所得税额 =应纳税所得额 *相应税率
原材料消耗费用 =产品产量 *单位产品原材料
消耗量 *单位原材料价格
四, 统计指标体系的设计原则
(一 )科学性原则
(二 )目的性原则
(三 )联系性原则
(四 )统一性原则
(五 )可比性原则
统计表及其设计
第三节
一,
(一 )统计表的意义
(1)能使统计资料的排列条理化, 系统
化, 标准化,一目了然 ;
(2)能科学地, 合理地组织统计资料,
便于阅读, 对照比较和分析 。
(二 )统计表的构成
从形式上看,统计表主要由总标题, 横
行标题, 纵栏标题和指标数值四部分组成
二, 统计表的种类
(一 )按用途, 统计表分为调查表, 汇总表
和分析表
1.调查表 。
它是指在统计调查中用于登记, 搜集原始
统计资料的表格 。
2.汇总表或整理表 。
它是在统计汇总或整理过程中用于表现统
计汇总或整理结果的表格, 如各种汇总表, 统
计台账, 手册, 年鉴等 。
3.分析表 。
它是在统计分析中用于对整理所得的统计
资料进行定量分析的表格 。
(二 )按统计数列的性质,统计表分为空间
数列表, 时间数列表和时空数列结合表
1.空间数列表 。
它是反映在同一时间条件下,不同空间范
围内的统计数列的表格,用以说明静态条件下
社会经济现象在不同空间的数量分布,又称静
态表 。
2.时间数列表 。
它是反映在同一空间条件下不同时间的
统计数列的表格 。
3.时空数列结合表 。
它是同时反映上述两方面内容的统计表 。
既说明社会经济现象在不同空间的数量分布,
又说明它们在不同时间上的数量变动 。
(三 )按分组情况,统计表分为简单表, 简单
分组表和复合分组表
1.简单表 。
2.简单分组表 。
3.复合分组表 。
三, 统计表的设计
(一 )统计表设计的一般原则和要求
1.总标题和纵横标目 (题 )能准确, 简明扼要
地反映统计资料的内容 。
2.纵, 横栏的排列内容要对应,尽量反映它们
的逻辑关系 。
3.根据统计表的内容,全面考虑表的布局,合
理安排主体栏和叙述栏,避免出现统计表过长, 过
短, 过宽, 过窄的现象,使表的大小适度, 比例恰
当, 醒目美观 。
4.统计表中的指标数值,都是有计量单位的,
必须标写清楚 。
5.统计表中的横线要清晰,顶线和底线要粗些,
各部分的界限宜粗些,其他线条要细些,表
的左右侧可不划封口线 。
6.当表的栏数较多时,要统一编写序号,一般
是主体栏部分用甲, 乙, 丙等文字表明,叙述栏部
分用 (1),(2),(3)…… 等数字编号 。
(二 )
(三 )整理表的设计
(四 )分析表的设计
统计调查的概念和种类
第四节
一, 统计调查的概念, 地位和要求
(一 )统计调查的概念
统计调查,就是根据统计研究的目的, 要求和
任务,运用各种科学的调查方法,有计划, 有组织地
搜集有关现象的各个单位的资料,对客观事实进行
登记,取得真实可靠的调查资料的活动过程 。
(二 )统计调查的地位
(三 )统计调查的要求
二, 统计调查的种类
(一 )按调查对象包括的范围不同,可分
全面调查是指对调查中的全部单位,无
一例外都进行登记或观察 。
非全面调查,是指只对调查对象总体中的
一部分单位进行登记或观察 。
(二 )按调查登记时间是否有连续性,可分为经
经常性调查,就是按研究现象不断变化,而连
续不断地进行登记或观察,以反映事物在一定时期
内的全部发展过程 。
一次性调查,就是对被研究现象在某一时刻
(或瞬间 )的状况进行一次性登记,以反映事物在一
定时点上的发展水平 。
(三 )按组织方式不同,可分为统计报表和专门
调查
统计报表是按照统一规定的表式要求,自上
而下地统一布置, 自下而上地统一提供统计资料
的一种调查组织方式 。
专门调查是为研究某些专门问题,由进行调查
的单位专门组织的调查,这种调查属一次性调查,
如人口普查, 劳动力调查, 科技普查等 。
(四 )按搜集资料的方法不同,可分为直接观
察法, 访问调查法, 报告报表法, 问卷调查法,
1.直接观察法 。 2.访问调查法 。
3.报告报表法 。 4.问卷调查法 。
5.卫星遥感法 。 6.互联网调查法 。
统计调查方案
第五节
一, 确定调查目的和任务
二, 确定调查对象和调查单位
三, 确定调查项目,设计调查表式
(一 )确定调查项目
(二 )拟订调查表式
四, 确定调查的时间, 空间和方法
五, 制订调查工作的组织实施计划
第六节
一, 普查
(一 )普查的意义
普查是根据统计任务的特定目的 (如为
详细了解国情, 国力 )而专门组织的一次性全
面调查 。
普查是一种很重要的调查方式方法,是其
他方式不可代替的 。
(二 )普查的组织
1.要紧紧依靠各级党委和人民政府的统一领导;
2.要依靠群众,走群众路线;
3.要先进行试点,总结经验,再全面开展;
4.要组织和培训普查队伍;
5.要制定周密的工作规程,以使工作有序进行;
6.要对普查工作的各环节进行严格的质量控制 。
1.要确定一个统一的调查时点,也叫标准时间,
所有调查资料都必须反映这一时点上的状况 。 标准
时间的选择,要根据研究对象性质和实际条件来决
定 。
2.在普查范围内的各调查单位或调查点要同
时行动,在方法, 步调上保持一致,要力求在最短的
期限内完成,以保证调查材料的时效性,避免发生重
复或遗漏 。
3.普查项目要有统一的规定,不能任意改变或
增减,以免影响汇总和综合,降低资料质量 。 性质相
同的普查,其各个时期的普查项目也应尽可能保持
相同,便于对比分析 。
4.根据普查任务,选择最适当的普查时间 。 普
查时间的间隔,应当尽可能保持一定的周期,以便进
行动态分析,观察现象的发展变化情况及其规律性 。
二, 抽样调查
抽样调查是按随机原则,从总体中抽选
部分单位进行观察,并根据这部分单位的调
查材料,从数量方面推断总体指标的一种非
全面调查 。
三, 统计报表
统计报表是依照国家有关法规的规定,
自上而下地统一布置,以一定的原始记录为
依据,按照统一的表式,统一的指标项目,统
一的报送时间和报送程序,自下而上地逐级
定期提供基本统计资料的一种调查方式 。
(一 )统计报表的特点
1.统计报表可以根据研究任务事先布置到基层
填报单位,基层单位可以根据报表的要求,建立健全各
种原始记录 。
2.由于统计报表是逐级上报, 汇总,各级领导部
门都能得到管辖范围内的统计报表资料,可以经常了
解本地区, 本部门经济和社会发展情况 。
3.由于统计报表属于经常性调查,内容相对稳定,
有利于经常搜集和积累资料,可以系统进行历史资料
的对比,研究经济建设和社会发展变化的规律性 。
(二 )统计报表的种类
1.按调查范围不同,统计报表分为全面
调查的统计报表和非全面调查的统计报表 。
2.按报送周期不同,统计报表分为定期
报表和年报 。
3.按报送的方式不同,统计报表分为邮
寄和电讯两种 。
4.按填报单位不同,统计报表分为基层报
表和综合报表 。
5.按实施的范围不同,统计报表分为国家
统计报表, 部门统计报表和地方统计报表 。
6.按性质和内容不同,统计报表分为基本
统计报表和专业统计报表 。
(三 )统计报表制度
(四 )统计报表资料来源
四, 重点调查
(一 )重点调查的意义
重点调查,是指在调查对象中,只选择一
部分重点单位而进行的非全面调查 。
重点调查对于领导及时了解情况,掌握基
本趋势指导全局有重要的作用 。
(二 )
五, 典型调查
典型调查是根据调查目的和要求,在对
所研究总体全面分析的基础上,有意识地从
中选择少数具有典型性的单位进行深入调
查研究的一种非全面调查 。
典型调查的特点是,
(1)调查单位是根据调查目的有意识选择出来
的少数具有典型性的单位,便于从典型入手,逐步
扩大到认识事物的一般性和普遍性 。
(2)典型调查单位少,调查方法可以机动灵活,
省时省力,提高调查效果 。
(3)典型调查是一种深入, 细致的调查,通过
深入细致的调查,既可以搜集有关数字资料,又可
以掌握具体, 生动的情况,探索事物发展变化的规
律性 。
典型调查的主要作用是,
(1)可用以研究新生事物,抓住苗头,认
真地进行调查研究,探索它们的发展方向,形
成预见,加以推广;
(2)可以补充全面调查的不足;
(3)可以利用典型资料,结合基本统计数
字,估计推算有关数据 。
六, 其他调查和综合分析方法
七, 各种调查组织方式的结合运用
八, 统计调查误差及其防止
(一 )统计调查误差的概念和种类
统计调查误差,就是调查结果所得的统计数
字与调查总体实际数量表现的差别 。 统计调查误
差有两种,一种是登记误差,一种是代表性误差 。
(二 )统计调查误差的防止
统计整理
第三章
内容提要
本章主要阐述了统计整理的意义;统
计整理在整个统计工作中的重要作用;统
计整理的基本步骤和方法;统计分组的作
用和分组方法;统计汇总的组织与技术;
统计整理的意义和步骤
第一节
统计整理在整个统计工作中起着承前启后
的重要作用,它既是统计调查的继续,
又是统计分析的前提。
二、统计整理的原则和步骤
(一 )设计和编制统计资料整理方案
(二 )
(三 )对原始资料进行统计分组和统计汇总
(四 )编制统计表或绘制统计图
统计分组
第二节
一, 统计分组的概念
统计分组是根据所研究事物的特点和统
计研究的目的,按照某一标志将统计总体划分
为若干个组成部分的一种统计方法 。
二, 统计分组的作用
(一 )区分现象质的差别点 。
(二 )反映现象总体的内部结构
(三 )分析现象之间的相互依存关系
三, 统计分组的方法
(一 )正确选择分组标志
1.根据统计研究的目的选择分组标志 。
2.选择最能反映事物本质特征的标志进行
分组 。
3.选择分组标志时,要考虑到现象发展的
历史条件和经济条件 。
(二 )按品质标志或按数量标志分组
1.按品质标志分组 。
2.按数量标志分组 。
(三 )简单分组和复合分组
1.简单分组 。 简单分组是指对所研究的总体
按一个标志进行分组 。
2.复合分组 。 复合分组是指对所研究的总体
按两个或两个以上的标志进行的多层次分组 。
次数分布
第三节
一, 次数分布的概念
次数分布是指将总体中的所有单位按某个标志
分组后,所形成的总体单位数在各组之间的分布 。
分布在各组的总体单位数叫做次数或频数 。
根据分组标志特征的不同,次数分布数列可
以分为品质分布数列和变量分布数列 。
按品质标志分组形成的次数分布数列叫品
质分布数列,简称品质数列 ;
按数量标志分组形成的次数分布数列叫变
量分布数列,简称变量数列 。
二, 变量数列的种类
(一 )单项变量数列
单项变量数列是按数量标志分组后,用
一个变量值代表一个组形成的数列 。
(二 )组距变量数列
组距变量数列是按照数量标志分组后,
用变量值变动的一定范围 (即组距 )代表一
个组所形成的数列 。
组距=上限-下限
( 上限+下限 )÷ 2
缺下限的最小组的组中值
=上限-相邻组的组距 ÷ 2
缺上限的最大组的组中值
=下限+相邻组的组距 ÷ 2
图 3— 1 某地区商业企业销售收入次数分布曲线图
三, 变量数列的编制
(一 )将原始资料按数值大小依次排列
(二 )确定组数 (k)和组距 (i)
k=1+3.322logn [ 公式 3— 1]
i= R/k
[ 公式 3— 1] 称为斯德吉斯 (H.A.Sturges)
组数公式 。 上述公式中, n为数据个数,R为全
距 。
定组距和组数应考虑下列原则,
1.要尽量能反映出总体单位的分布情况
及总体单位的集中趋势 ;
2.要尽可能区分出组与组性质上的差异 。
(三 )确定组限和组限的表示方法
1.最小组的下限要略低于最小变量值,最大
组的上限要略高于最大变量值 ;
2.组限的确定应当有利于表现总体单位分布
的规律性 ;
3.对于等距数列,如果组距是 5,10,…,100,…,
则每组的下限最好是它们的倍数 。
四, 次数分布的主要类型
(一 )钟形分布
图 3— 2 钟形分布图
(二 )U形分布
图 3— 3 U形分布图
(三 )J形分布
图 3— 4 正、反 J形分布图
统计汇总的组织、技术与
现代化
第四节
一, 统计汇总的组织形式
(一 )逐级汇总
(二 )集中汇总
(三 )综合汇总
二, 统计汇总的审核
三, 统计汇总的技术与现代化
(一 )手工汇总法
1.划记法 。
2.过录法 。
3.折叠法 。
4.卡片法 。
(二 )机械汇总法
1.明确所要编制的程序的目的, 即确定程序要完
成些什么功能 。 它完全取决于统计汇总的目的和要求 。
2.进行技术准备工作, 就是要掌握准备采用的电
子计算机语言 。
3.进行可行性分析 。
4.根据汇总方案画出 程序框图 。
5.进行代码设计, 就是对事物进行编码 。
6.编写程序 。
7.程序调试及运行 。
图 3— 5 程序功能框图
总量指标和
相对指标
第四章
内容提要
综合指标法是利用统计指标对所研究
对象进行深入分析研究,揭示其特征和规
律性的方法。根据作用、表现形式的不同,
统计指标可以分为总量指标、相对指标和
平均指标。本章阐述了总量指标的概念、
作用和种类;相对指标的概念、作用、种
类和计算方法;计算和运用总量指标和相
第一节
总量指标是反映一定时间、地点和条件下
某种现象总体规模或水平的统计指标。
1.它可用来反映一个国家、地区、部门或
单位的基本状况。
2.它是制定政策、编制计划、进行科学管
理的重要依据。
3.它是计算相对指标和平均指标的基础。
二、总量指标的种类
(一 )总量指标按其说明总体内容不同,分
为总体单位总量和总体标志总量
总体单位总量简称单位总量,它表示总
体本身的规模大小,是统计总体单位的合计数 ;
总体标志总量简称标志总量,它是反映
总体单位某种标志值总和的总量指标。
(二 )总量指标按其反映的时间状况不同,
分为时期指标和时点指标
时期指标反映现象在一段时期内发展过
程的总数量,如产品产量、商品销售额、国内
生产总值等。
时点指标表示现象在某一时刻上的状态,
如人口数、商品库存额、固定资产原值等。
(三 )总量指标按其采用的计量单位不同,分为实
物指标、价值指标和劳动指标
度量衡的、物理的或化学的计量单位计算的总量指标,
如人口数、粮食产量、发电量分别以, 人,,, 吨,,
,千瓦时, 为计量单位等。
价值指标是以货币为单位计算的总量指标,如增
加值、产品销售收入、工商税收等。
相对指标
第二节
一, 相对指标的概念和表现形式
相对指标是说明现象之间数量对比关系
的指标, 用两个或两个以上有联系的指标数
值对比来求得, 其结果表现为相对数, 故也
将相对指标称为相对数 。
相对指标有无名数和有名数两种表现形
式 。
二, 相对指标的作用
利用相对指标, 可以较清楚地反映现象内
部结构和现象之间的数量联系程度, 对现象进
行更深入地分析和说明 。
, 利用相对指标可以使某些不能直接
对比分析的统计指标, 取得可以比较的基础 。
三,
(一 )结构相对指标
[公式 4— 1]
总体全部数值
总体部分数值
结构相对指标 ?
[ 例 4— 1] 我国 2002年的农, 林, 牧, 渔业总产值
为 27 390.8亿元, 其中农业产值 1 4931.5亿元, 林业
产值 1 033.5亿元, 牧业产值 8 454.6亿元, 渔业产值
2 971.1亿元, 求结构相对指标 。
农, 林, 牧, 渔业的产值在总产值中所占的比重为,
农业 14 931.5÷ 27 390.8× 100%= 54.51%
林业 1 033.5÷ 27 390.8× 100%= 3.77%
牧业 8 454.6÷ 27 390.8× 100%= 30.87%
渔业 2 971.1÷ 27 390.8× 100%= 10.85%
结构相对指标有两个主要作用,
(1)利用结构相对指标, 对事物的内部结构进行
分析, 不仅可以说明事物的性质和特征, 还能够反映
事物发展的不同阶段和量变引起质变的过程 。
(2)利用结构相对指标, 可以反映事物总体的质
量或工作的质量, 反映人力, 物力和财力的利用情况 。
(二 )比例相对指标
的数量对比关系的相对指标 。 计算公式为
[公式 4— 2]
总体中另一部分的数值
总体中某一部分的数值比例相对指标 ?
[ 例 4— 2] 根据第五次全国人口普查的快速汇总结
果, 中国大陆 31个省, 自治区, 直辖市人口和现役军
人人口中, 男性为 65 355万人, 占总人口的 51.63%;
女性为 61 228万人, 占总人口的 48.31%。 性别比为
106.74∶ 100.00(65 355∶ 61 288)。
计算结果是比例相对指标, 它表明了 2000年我
国人口中的性别比例 。
[ 例 4— 3] 利用 [ 例 4— 1] 的资料求比例相对指标 。
14 931.5÷ 1 033.5= 14.45
8 454.6÷ 1 033.5= 8.18
2 971.1÷ 1 033.5= 2.87 即农业,
林业, 牧业, 渔 业 产 值 之 间 的 比 例 为
14.45∶ 1∶ 8.18∶ 2.87。
(三 )比较相对指标
[公式 4— 3]
数值另一条件下的同类指标
值某条件下的某类指标数比较相对指标 ?
[ 例 4— 5] 1999年中国的棉花产量为 383万吨, 美国
的棉花产量为 369万吨 。
比较相对指标= 383÷ 369= 1.04
它表明中国的棉花产量是美国的 1.04倍 。
(四 )动态相对指标
动态相对指标是表明某类现象在不同时间上的
指标数值对比关系的相对指标, 用以说明现象发展变
化的方向和程度 。 计算公式为,
[公式 4— 4]
基期水平
报告期水平动态相对指标 ?
[ 例 4— 6] 我国的汽车产量 (万辆 )1978年为 14.91,1990年
为 51.40,1995年为 145.27,2000年为 207.00,2002年为
325.10。 求动态相对指标 。
动态相对指标分别为,
325.10÷ 14.91= 21.80
325.10÷ 51.40= 6.32
325.10÷ 145.27= 2.24
325.10÷ 207.00= 1.57 计算结果表明, 我国的汽车产量
在改革开放 20多年内增长了 20.80倍, 近 10多年增长了 5.32倍,
近 7年来增长了 1.24倍, 2002年比 2000年增长了 57%。
(五 )强度相对指标
,但有一定联系的总
量指标数值之比 。 计算公式为,
[公式 4— 5]
的总量指标数值另一有联系而性质不同
某一总量指标数值强度相对指标 ?
[例 4— 7] 2000年第五次全国人口普查, 中国大陆 31个
省, 自治区, 直辖市 (不包括福建省的金门, 马祖等岛
屿 )人口和现役军人的人口 126 583万人, 国土面积为
960万平方公里, 求强度相对指标 。
人口密度= 126 583 ÷ 960= 132(人/平方公里 )
[ 例 4— 8] 2004年某地区有医院, 卫生院 669个,
医生 2.04万人, 医院床位数 2.92万张, 人口 1 259万
人, 求强度相对指标 。
每千人口医生数= (2.04÷ 1 259)× 1 000=
1.62(人 )
每千人口医院床位数= (2.92÷ 1 259)× 1 000=
2.32(张 )
平均每一医院服务人口数
= (1 259× 10 000)÷ 669= 18 819(人 )
在实践中, 强度相对指标主要有三个作用,
1.强度相对指标能够说明社会经济现象的强弱
程度, 因而被广泛地用于反映一个国家或地区的经济
发展水平的高低和经济实力的强弱 。
2.强度相对指标还可以用来反映现象的密度或
普遍程度, 如人口密度, 商业网密度等 。
3.强度相对指标还可以反映社会生产活动的条件
或效果 。
(六 )计划完成情况相对指标
[公式 4— 7]
%1 0 0??
计划任务数
实际完成数
计划完成情况相对指标
1.计划数为绝对数时, 计划完成情况相对指标的计算
公式为,
[公式 4— 8]
%1 0 0??
计划水平
实际水平
计划完成情况相对指标
2.计划数为平均数时, 计划完成情况相对指标的计算
公式为,
[公式 4— 9]
%100??
计划平均水平
实际平均水平
计划完成情况相对指标
3.计划数为相对数时, 计划完成情况相对指标的计算
公式为,
[公式 4— 10]
)计划任务数(
)实际完成数(
计划完成情况相对指标
%
%
?
[ 例 4— 10] 某企业计划规定 2004年的劳动生产率
要比 2000年提高 4%,实际执行结果是提高 5%,求计划
完成情况相对指标 。
该企业劳动生产率计划完成情况为,
计划完成情况相对指标
= (100%+ 5%) /100%+ 4%× 100%
= 105%/104%× 100%= 100.96%
[ 例 4— 11] 某企业计划规定 2004年的可比产品成本
比 2000年降低 5%,实际执行结果是可比产品成本降低
了 6%,求计划完成情况相对指标 。
该企业可比产品成本计划完成情况为,
计划完成情况相对指标
= (100%- 6%) /( 100%- 5%)× 100%
= (94%/95%)× 100%= 98.95%
[公式 4— 11]
%100??
全期计划任务数
数累计至本期止实际完成
计划执行进度指标
计划完成情况的检查, 可分为长期计划检查和短期计
划检查两种 。 依计划任务数的规定不同, 检查长期计
划的完成情况又有水平法和累计法两种方法 。
1.水平法 。
%1 0 0??
如末年)水平长期计划规定的末期(
)实际达到的水平长期计划末期(如末年
情况相对数
长期计划完成
[公式 4— 12]
[ 例 4— 12] 某企业, 九五, (1996— 2000年 )期间规定甲种
产品产量 2000年达到 200万吨, 2000年实际达到 210万吨 ;实际
执行结果是到 2000年 8月止, 就达到了 200万吨的产量, 求计划
完成程度以及提前完成计划的时间 。
该企业甲产品产量的五年计划完成情况相对指标为,
甲产品计划完成程度
= (210/200)× 100%
= 105%
甲产品的五年计划任务于 2000年 8月完成, 提前了 4个月 。
2.累计法 。
%1 0 0??
本期计划任务数
的累计数长期计划期间实际完成
情况相对数
长期计划完成
[公式 4— 13]
[ 例 4— 13] 某企业, 九五, 计划规定基本建设投资总额为 1
500万元, 五年实际累计完成投资额为 1 540万元, 求计划完成
情况相对指标 。
该企业五年基本建设投资计划完成程度为,
计划完成程度= (1540/1500)× 100%= 102.7%
按累计法计算提前完成计划的时间, 是将计划期的全部时
间减去自执行计划之日起至累计完成计划的时间 。 假如上例中
该企业于 2000年 8月底实际完成的累计投资额已达 1500万元,
则该企业提前完成计划的时间为, 60- 56= 4(月 )
即该企业提前 4个月完成了五年计划 。
计算和运用总量指标、相对指
标的原则
第三节
一, 计算和运用总量指标的原则
(一 )在计算实物指标时, 应注意现象的同类
性
(二 )统计总量指标时要有明确的统计含义和
合理的统计方法
(三 )统一计量单位
二, 计算和运用相对指标的原则
三, 相对指标和总量指标结合运用的
原则
平均指标和
变异指标
第五章
内容提要
本章包括平均指标和变异指标两部分内
容,阐述了平均指标的概念和作用;各种
平均数的计算原则、方法与应用条件;主
要的平均指标 (算术平均数、调和平均数、
几何平均数、众数和中位数 );变异指标的
作用、计算方法和运用条件;主要的变异
指标 (全距、平均差、标准差及其系数 )。
第一节
平均指标,是同类社会经济现象总体内
各单位某一数量标志在一定时间、地点和条件
下数量差异抽象化的代表性水平指标,其数值
表现为平均数。
二、平均指标的作用
(一 )利用平均指标,可以了解总体次数分布的集
(二 )利用平均指标,可以对若干同类现象在不同
单位、地区间进行比较研究
(三 )利用平均指标,可以研究某一总体某种数值
的平均水平在时间上的变化,说明总体的发展过程和
趋势
二、平均指标的作用
(四 )利用平均指标,可以分析现象之间
的依存关系
(五 )平均指标可作为某些科学预测、决策
和某些推算的依据
算术平均数
第二节
一, 算术平均数的基本形式
[公式 5— 1]
总体单位总数
总体标志总量算术平均数 ?
二, 算术平均数的计算方法
(一 )简单算术平均数
总体单位总数总体标志数值之总和简单算术平均数 ?
用符号表示,
[公式 5— 2]
n
X
n
XXXXX n ??????? ?321
[ 例 5— 1] 某机械厂某生产班组有 10名工人, 生产
某种零件, 每个工人的日产量分别为 45件, 48件, 52
件, 62件, 69件, 44件, 52件, 58件, 38件, 64件 。
试用简单算术平均数法计算工人平均日产量 。
(件)2.53
10
532
10
64385852446962524845
?
?
?????????
?
?
?
n
X
X
(二 )
各组单位数的总和 位数乘积的总和各组标志数值与该组单
加权算术平均数
?
用符号表示,
[公式 5— 3]
1 1 2 3 3
2 n
n
X
X f X f X f X f
n
Xf
f
? ? ? ?
?
?
?
?
[ 例 5-3]
(元)
工人月平均工资
50.1 7 2 7
2 0 0 0
3 4 5 5 0 0 0
?
?
?
?
n
Xf
X
三, 算术平均数的几个主要数学性质
(一 )平均数与次数和的乘积等于所有变
量值 (数量标志值 )的总和 。
(二 )所有变量值与平均数的离差之和等
于零 。
(三 )各个变量值与平均数离差平方之和
为最小 。
调和平均数
第三节
一, 调和平均数的概念
调和平均数是平均数的一种, 它是根
据变量值的倒数计算的, 是变量值倒数
的算术平均数的倒数, 故又称倒数平均
数 。
二, 简单调和平均数
X
n
XXXX
n
H
n
11111
321 ?
?
????
?
?
[公式 5— 5]
三, 加权调和平均数
[公式 5— 6]
X
m
X
m
X
m
X
m
X
m
mm
H
n
n
nmm
1
321
321
321
?
?
?
????
?
?
??
?
?
[ 例 5-4]
(元)
)为:平均每千克(
39.55
1020
56500
???
?
?
X
m
m
H
H
几何平均数
第四节
一, 几何平均数的概念和特点
几何平均数不同于算术平均数和调和
平均数, 是 n个变量值连乘积的 n次方根,
是计算平均比率和平均速度时比较适用的
一种方法, 符合人们的认识规律 。
二, 几何平均数的计算方法
(一 )简单几何平均数
[公式 5— 7]
nn n XXXXXG ?????? ?321
[ 例 5— 5]
%93.91%87%91%93%97
4
?????
? ?n X
G
(二 )加权几何平均数
[公式 5— 8]
??
????
?
???
f f
fnfff fn
n
fff
X
XXXX
G
?
?
321 3
3
2
2
1
1
[ 例 5— 6]
求反对数得本利率,G= 103.75%
平均年利率= 103.75%- 100%= 3.75%
这就是说, 25年间的年平均本利率为 103.75%,
年平均利率为 3.75%。
0 1 6 0 0.2
25
4 0 0 0 2.50
lg
lg ???
?
?
f
Xf
G
众数和中位数
第五节
一, 众数
在观察某一总体时, 最常遇到的标志值, 在
统计上称为众数 。
下限公式,
iL
i
ffff
ff
LM
?
???
?
??
?
???
?
??
??
?
21
1
)10)10
)10
0
((
(
[公式 5— 9]
上限公式,
iU
i
ffff
ff
UM
?
???
?
??
?
???
?
??
??
?
21
1
)10)10
)10
0
((
(
[公式 5— 10]
二, 中位数
2/)(
2
1
2
??? nn XXMe
1
2
n
M e X
?
?
(n为偶数 )
(n为奇数 )
正确计算和运用
平均指标的原则
第六节
(一 )必须注意所研究社会经济现象的同质性
(二 )必须注意用组平均数补充说明总平均数
(三 )
(四 )必须注意一般与个别相结合, 把平均数和
典型事例结合起来
(五 )平均指标要与变异指标结合运用
标志变异指标
第七节
一, 标志变异指标的概念和作用
(一 )
标志变异指标是反映统计数列中以平均数为
中心, 总体各单位标志值的差异大小范围或离差
程度的指标 。
(二 )标志变异指标的作用
1.标志变异指标可以衡量平均数代表性的大小 。
2.标志变异指标可以反映社会经济活动过程的
节奏性和均衡性 。
3.标志变异指标可以反映总体单位标志值的均
匀性和稳定性 。
4.标志变异指标是科学地确定必要的抽样单位
数应考虑的重要因素 。
二, 标志变异指标的计算方法
(一 )变异全距
变异全距=最大标志值-最小标志值
[公式 5— 13]
变异全距=最高组上限-最低组下限
[公式 5— 14]
(二 )平均差
1.如果掌握的是未经分组的 (原始数列 )
资料, 则采用简单算术平均式 。
[公式 5— 15]
n
XX
DA ?
?
?..
[例 5-11]
(件)
第二组平均差为
(件)
第一组平均差为
6.7
10
76
..
28
10
280
..
??
?
?
??
?
?
?
?
n
XX
DA
n
XX
DA
2.如果掌握的资料是分组数列时, 则应
采用加权算术平均式 。
[公式 5— 16]
?
? ?
?
f
fXX
DA,.
[例 5-12]
(箱)965.0
1 0 0 0
965
..
??
?
?
?
?
f
fXX
DA
(三 )标准差
1.简单平均式 。
[公式 5— 17]
? ?
n
XX? ?
?
2
?
2.加权平均式 。
[公式 5— 18]
? ?
?
? ?
?
f
fXX
2
?
3.是非标志的标准差 。
[公式 5— 19]
)1( pppq ????
(四 )标准差系数
[公式 5— 20]
X
V
?
? ?
动态数列
第六章
内容提要
动态分析是统计分析方法之一,其依据是动态
数列。本章阐述了动态数列的概念、作用、种类
和编制原则;总量指标、相对指标和平均指标三
种动态数列 (其中总量指标动态数列是基础 );动
态分析的水平和速度指标 (平均发展水平、平均增
长量、平均发展速度和平均增长速度 );测定事物
变动长期趋势的主要方法 (时距扩大法、序时平均
法、移动平均法和直线配合法 );直线配合法的常
用方法;测定季节变动的主要指标。
动态数列的一般问题
第一节
一、动态数列的概念
把反映某种现象的同一指标,在不同时间
上的指标数值,按时间 (如按年、季、月、日
等 )先后顺序编排所形成的数列,称为动态数
列或时间数列,又称时间序列。
二、动态数列的种类
(一 )总量指标动态数列
1.时期数列。
2.时点数列。
(二 )相对指标动态数列
(三 )平均指标动态数列
1.静态平均数动态数列。
2.序时平均数动态数列。
三、编制动态数列的原则
(一 )总体范围应一致
(二 )指标的内容应相同
(三 )时期数列的时期长短应一致,时期数列
和时点数列的间隔力求一致
(四 )指标的计算方法、计算价格和计量单位
动态数列的水平指标
第二节
一, 发展水平和平均发展水平
(一 )发展水平
发展水平是动态数列中与其所属时间相
对应的反映某种现象发展变化所达到的规模,
程度和水平的指标数值, 通常指总量指标,
也可指相对指标和平均指标的数值 。
(二 )平均发展水平
将一个动态数列各期发展水平加以平均
而得的平均数, 叫平均发展水平, 又称为动
态平均数或序时平均数 。
(三 )序时平均数的计算方法
1.总量指标动态数列序时平均数的计算 。
(1)时期数列序时平均数的计算 。
[公式 6— 1
n
a
n
aaaaa nnn ??????? ? 121 ?
[ 例 6— 1] 依 [ 公式 6— 1] 计算得,
(万元)16.176
12
2 1 8, 4+1 9 5, 0+1 9 6, 0+1 9 8, 9+1 8 6, 2+1 7 0, 2+1 7 7, 6+1 6 0, 2+1 6 4, 5+1 5 4, 7+1 4 8, 2+1 4 4, 0
?
?
a
(2)时点数列序时平均数的计算 。
[公式 6— 2
?
?
?
????
????
?
?
??
t
ta
tttt
tatatata
a
nn
nn
nnnn
n
121
112211
?
?
[公式 6— 3
.
1 2 1
1
1
2
/ 2 / 2
1
( ) / 2
1
nn
n
ni
i
a
a a a a
n
a a a
n
?
?
?
? ? ? ?
?
?
??
?
?
?
[公式 6— 4
2 3 112
1 2 1
1 2 1
1
1
1
1
1
2 2 2
2
nn
n
n
n
ii
i
i
n
i
i
a
a a a aaa
t t t
t t t
aa
t
t
?
?
?
?
?
?
?
?
???
? ? ? ? ?
?
? ? ?
?
?
?
?
?
2.相对指标动态数列序时平均数的计算 。
(1)若两个相关的总量指标动态数列均为
时期数列 。
[公式 6— 5]
? ??? ??? banb nabac ///
(2)若两个相关的总量指标动态数列均为
时点数列 。
(3)若两个相关的总量指标动态数列, 一
个是时期数列, 另一个是时点数列 。
3.平均指标动态数列序时平均数的计算 。
二,
(一 )增长量
增长量=报告期水平-基期水平
[公式 6— 8]
逐期增长量之和
=(a1-a0)+(a2- a1)+(a3- a2)+… +(an-an-1)
=∑( ai- ai-1)= an - a0
两个相邻累计增长量之差
=(ai - a0)-(ai-1- a0)= ai - ai-1
(二 )
平均增长量是某种现象各逐期增长量的
序时平均数, 它表明该现象在一定时期
内, 单位时间平均增长的绝对量 。
动态数列的速度指标
第三节
一, 发展速度和增长速度
(一 )发展速度
发展速度是将现象报告期水平除以基期水
平 求得的表明某种现象发展程度的相对指
标 。
发展速度=报告期水平 ÷ 基期水平
[公式 6— 9]
?发展速度通常用百分数表示,它说明现象
报告期水平为基期水平的百分之几。
?由于采用的基期不同,发展速度可分为 环
比发展速度 和 定基发展速度 。
? 环比发展速度 =
1
i
i
a
a ?
?
报告期水平
前一期水平
? 定基发展速度 =
0
ia
a
?
报告期水平
某一固定基期水平
312
0 1 2 1 0
1
0 0 1
nn
n
i i i
i
a a aaa
a a a a a
a a a
a a a
?
?
?
? ? ? ? ? ?
? ? ?
各期环比发展
速度的连乘积
两个相邻定基
发展速度之比
(二 )增长速度
增长速度是某种现象报告期的增长量与基期水
平之比, 表明该现象增长程度的相对指标 。
[公式 6— 10]
1
?
?
?
??
报告期增长量
增长速度
基期水平
报告期水平 基期水平
基期水平
报告期水平
基期水平
[公式 6— 11]
1
?
?
?
??
环比 报告期逐期增长量
增长速度 前一期水平
报告期水平 前一期水平
前一期水平
环比
发展速度
[公式 6— 12]
1
?
?
?
??
定基 报告期累计增长量
增长速度 固定基期水平
报告期水平 固定基期水平
固定基期水平
定基
发展速度
[公式 6— 13]
(以百分点表示)报告期的环比增长速度
报告期的逐期增长量
的绝对值增长
?
%1
二, 平均发展速度和平均增长速度
(一 )平均发展速度和平均增长速度的概念
平均发展速度, 是某种现象各期环比发展速
度的平均数, 它表明该现象在一个较长时期内,
平均单位时间发展变化的程度 。
平均增长速度是某种现象各期环比增长速度
的平均数, 它表明该现象在一个较长时期内, 平
均单位时间增长的程度 。
(二 )平均发展速度的计算
1.几何平均法 (水平法 )。
[公式 6— 14]
n nn
n
n
a
a
a
a
a
a
a
a
a
aX
012
3
1
2
0
1 ??????
?
?
[公式 6— 15]
nn n XXXXXX ??????? ?321
[公式 6— 16]
[公式 6— 17]
n RX ?
n mX 2?
2.高次方程法 (累计法 )。
[公式 6— 18]
解此高次方程所得的正根,即为所求的平
均发展速度。
0
0
231 ??????? ??
a
a
RRRRR nn ?
长期趋势和季节变动
第四节
一, 长期趋势的分析
(一 )长期趋势的概念
长期趋势, 是指某种现象在相当长的
时期内, 发展过程表现为不断增长或不断
下降的总趋势 。
(二 )长期趋势分析法
1.时距扩大法 。
2.序时平均法 。
3.移动平均法 。
4.直线配合法 。
(1)半数平均法 。
btay c ??
[公式 6— 19]
? ? 0??? cyy
[公式 6— 20]
0
0
0
]026[1 9 ]6[
???
???
???
? ??
?
tbay
n
btay
btay
除上式后得:用
即
)(
:—公式代入—公式将
[ 公式 6— 21]
? ?
? ?
??
?
?
?
??
??
???
??
? ??
? ?
?
?
2
2
2
tbtaty
tbnay
btay
yy
c
式:导出下列两个标准方程根据数学预算,上式可
最小值)(
最小值
(2)最小平方法
? ?
?
?
?
?
?
?
?
????
?
?
?
??
? ?
? ? ?
tby
n
t
b
n
y
a
ttn
yttyn
b
22
推导得:
[ 公式 6— 22]
t
t aby ??
二, 指数曲线趋势模型
[ 公式 6— 23]
?
?
?
?
?
?
?
??
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
??
? ?
? ? ?
n
t
b
n
y
a
ttn
yttyn
b
lg
lg
lg
lg
2
2
推导得:
[ 公式 6— 24]
三, 季节变动的分析
(一 )季节变动的概念
季节变动, 是指某些现象由于受自然因素
和社会条件的影响, 在一年之内比较有规律地
变动 。
(二 )季节变动的测定
第一步, 将三年以上各月或各季度的完整资料
排列整齐 。
第二步, 计算同季 (月 )的合计数及其平均数,
计算年度的合计数及其平均数 。
第三步, 计算出全期季 (月 )的平均数 。
第四步, 将各同季 (月 )的平均数, 分别与全期
季 (月 )的平均数对比, 即为季节比率 。
统计指数
第七章
内容提要
统计指数法是统计分析中广为采用的重要方
法。本章阐述了统计指数的概念、作用和种类;
个体指数和总指数;简单指数和加权指数;定基
指数和环比指数 ;综合指数的编制原则与方法;平
均指数的编制方法 ;指数体系和因素分析;总量指
标的两因素分析和多因素分析 ;平均指标的因素分
统计指数概述
第一节
一、统计指数的概念与作用
(一 )统计指数的概念
广义指数泛指社会经济现象数量变动的
比较指标,即用来表明同类现象在不同空间、
不同时间、实际与计划对比变动情况的相对数。
狭义指数仅指反映不能直接相加的复杂社
会经济现象在数量上综合变动情况的相对数。
(二 )统计指数的作用
1.综合反映社会经济现象总变动方
向及变动幅度。
2.分析现象总变动中各因素变动的影
响方向及影响程度。
3.反映同类现象变动趋势。
二、统计指数的分类
(一 )按研究范围不同,可分为个体指数和
总指数
1.个体指数,是表明个别事物变动情况的
相对数。
2.总指数,是表明复杂经济现象中多种不
同度量的事物综合变动情况的相对数。
(二 )按编制指数的方法论原理不同,可分
为简单指数和加权指数
1.简单指数,是指直接将个别事物的计算
期数值与基期数值对比的相对数。
2.加权指数,是由个体指数加权平均或汇
总求得的总指数。加权指数是计算总指数广为
采用的方法,
(三 )按指数性质不同,可分为数量指标指数
和质量指标指数
1.数量指标指数,是用来反映社会经济现象
的数量或规模变动方向和程度的指数,如职工人
数指数、产品产量指数、商品销售量指数等。
2.质量指标指数,是用以反映社会经济现象
质量、内涵变动情况的指数,如成本指数、物价
指数、劳动生产率指数等。
(四 )按反映的时态状况不同,可分
为动态指数和静态指数
1.动态指数,是表明某种事物在不
同时间上发展变化的指数, 如股票价格
指数, 商品零售价格指数, 农副产品产
量指数等 。
2.静态指数,是反映某种事物在同
时期不同空间对比情况的指数, 如计划
完成情况指数, 地区经济综合评价指数
等 。
综合指数法
第二节
一,
[公式 7— 1]
?
??
pq
pq
I q
0
1
[ 例 7— 1]
,用报告期出厂价格作为同度量因素,其公式和
计算过程为,
该指数表明,将同度量因素 (价格 )固定在报告期,该
厂全部工业产品产量增长了7,61 %,由于产量增长
而增加的产值为 329万元 。
(万元)32943264655
0761.1
4326
4655
95812324180720
96012304188721
1011
10
11
????
??
???????
???????
??
??
?
?
pqpq
pq
pq
I
q
第二,用基期出厂价格作为同度量因素,其公
式和计算过程为,
这个指数表明,将同度量因素 (价格 )固定在
基期,该工厂全部工业产品产量增长了 7.91%,由
于产量增长而增加的产值为 339万元 。
(万元)3 3 94 2 8 44 6 2 3
0 7 9 1.1
4 2 8 4
4 6 2 3
85810324280720
86010304288721
0001
00
01
????
??
???????
???????
??
??
?
?
pqpq
pq
pq
I
q
二, 质量指标综合指数的编制
[公式 7— 2]
?
??
qp
qp
I p
0
1
第一,用报告期销售量作为同度量因素,其公
式和计算过程为,
这个指数表明,将同度量因素 (销售量 )固定在报
告期,该零售商店 5种商品价格综合上涨4,16 %,
由于价格上涨使销售额增加 20620元 。
(元)2 0 6 2 04 9 5 9 6 05 1 6 5 8 0
0 4 1 6.1
4 9 5 9 6 0
5 1 6 5 8 0
4 5 01 2 01 0 0 0202 1 0 0653 6 0 0758 8 041
4 5 01 2 01 0 0 0202 1 0 0653 6 0 0758 8 041
1011
10
11
????
??
?????????
?????????
?
?
??
?
?
qpqp
qp
qp
I
p
第二,用基期销售量作为同度量因素,其公式
和计算过程为,
这个指数表明将同度量因素 (销售量 )固定在基
期,该零售商店 5种商品价格综合上涨4,57 %,由
于价格上涨使销售额增加 21000元 。
(元)21000459800480800
0457.1
459800
480800
5001209002020006532007588042
5001209002020006532007588041
0011
00
01
????
??
?????????
?????????
?
?
??
?
?
qpqp
qp
qp
I
p
三, 综合指数法的特点
(一 )
(二 )
(三 )用综合指数法编制总指数,使用的
是全面材料,
平均指数法
第三节
一, 加权算术平均法
加权算术平均法,是以个体指数为变量
值,以一定时期的总值资料为权数,对个体
指数加权算术平均以计算总指数的方法 。
[公式 7— 3
?
?
?
? ??
00
00
00
10
qp
qpk
qp
qp
I qq
[例 7— 3]
这表明,该百货公司出售的 4种商品销售量报
告期比基期平均增长了 11.74%,由于销售量增
加而增加的销售额为 1.35万元 。
(万元)35.150.1185.12
1 1 7 4.1
50.11
85.12
0000
00
00
????
???
??
?
?
qpqpk
qp
qpk
I
q
q
q
二, 加权调和平均法
[公式 7— 4
1 1 1 1
01
11
1p
p
p q p q
I
pq pq
k
??
??
? ?
[例 7— 4]
11
11
1 1 1 1
19,35
1.0 64 9
1 18,17
1
19,35 18,17 1.1 8
p
p
p
pq
I
pq
k
p q p q
k
? ? ?
? ? ? ?
?
?
?? (万元)
三, 固定权数加权平均法
[公式 7— 5
?
??
w
wk
I pp
[例 7— 5]
该地区商品零售物价总指数,
%45.1 0 3
1 0 0
%89.1 0 3 4 4
??
?
?
?
w
wk
I
p
p
四,
(一 )工业生产指数
工业生产指数是综合反映工业产品产
量增减变化的相对数,可以用来表明一个国
家国民经济发展的状况 。
[公式 7— 6]
[公式 7— 7]
?
??
00
00
qp
qpk
I qq
?
??
w
wk
I qq
(二 )居民消费价格指数
居民消费价格指数,又称消费者价格指数,
居民生活费价格指数, 即通常所说的生活费
用指数,是指反映一定时期内居民消费价格变
动趋势和变动程度的相对数 。
[公式 7— 8]
?
??
w
wk
I pp
(三 )农产品收购价格指数
农产品收购价格指数,是反映一定时期内
农产品收购价格变动趋势和程度的相对数 。
[公式 7— 9] ?
??
11
11
1
qp
k
qp
I
p
p
(四 )
1.根据上市公司的行业分布, 经济实力, 资
信等级等因素, 选择适当数量的有代表性的股票,
作为编制指数的样本股票 。 样本股票可以随时更
换或作数量上的增减, 以保持良好的代表性 。
2.按期到股票市场上采集样本股票价格, 简
称采样 。
3.利用科学的方法和先进的手段计算出
指数值 。
4.通过新闻媒体向社会公众公开发布 。
为保持股价指数的连续性, 使各个时期计
算出来的股价指数相互可比, 有时还需要
对指数值作相应的调整 。
编制股票价格指数的主要方法是加权综合法, 即
以样本股票的发行量或成交量为同度量因素 (或称权数 )
计算股价指数 。 其计算公式按同度量因素所属时期不同
分为两种,
[公式 7— 10]
[公式 7— 11] ?
?
?
?
?
?
10
11
00
01
QP
QP
QP
QP
数报告期加权综合股价指
基期加权综合股价指数
(五 )货币购买力指数
货币购买力的大小同商品和服务价格变
化成反比。统计上根据这种关系,通过编制
居民消费价格指数 (居民生活费用指数 ),以
其倒数来表示货币购买力指数。
货币购买力指数货币工资指数实际工资指数
货币购买力指数货币收入指数实际收入指数
??
??
居民消费价格指数货币购买力指数
1?
[公式 7— 12]
第四节
指数体系和因素分析
一, 指数体系
(一 )指数体系的概念
在统计分析中,将一系列相互联系, 彼此间
在数量上存在推算关系的统计指数所构成的整
体称为指数体系 。
[公式 7— 13]
?
?
?
?
?
? ??
01
11
00
01
00
11
pq
pq
pq
pq
pq
pq
统计指数体系一般具有三个特征,
(1)具备三个或三个以上的指数 。
(2)体系中的单个指数在数量上能相互推算 。
如已知销售额指数, 销售量指数,则可推算出
价格指数 ;已知价格指数, 销售量指数,则可推
算出销售额指数 。
(3)现象总变动差额等于各个因素变动差额
的和 。
(二 )指数体系的作用
1.指数体系是进行因素分析的根据。
2.利用各指数之间的联系进行指数间的
相互推算。
3,用综合指数法编制总指数时,指数体
系也是确定同度量因素时期的根据之一。
二、因素分析
(一 )因素分析的含义
指数体系的目的,就是要分析多种因素的变动
对某种社会经济现象总体变动情况的影响。
1.因素分析的对象是复杂现象。
2.因素分析中的指数体系以等式的形式表现。
3.因素分析的结果有相对数也有绝对数。
(二 )因素分析的分类
(1)总量指标的两因素分析 ;
(2)总量指标的多因素分析 ;
(3)平均指标的两因素分析 ;
(4)含平均指标的多因素分析。
三、总量指标的因素分析
(一 )两因素分析
,在指数体
系上表现为总变动指数等于两个因素
指数的乘积。
)()( ????
??
?
?
?
?
?
?
????
?
??
01110001
0011
01
11
00
01
00
11
pqpqpqpq
pqpq
pq
pq
pq
pq
pq
pq
[例 7— 6]
出口数额指数,
出口量指数,
(美元)50900002039000025480000
2496.1
20390000
25480000
0011
00
11
????
??
??
?
?
pqpq
pq
pq
(美元)40200002039000024410000
1972.1
20390000
24410000
0001
00
01
????
??
??
?
?
pqpq
pq
pq
出口价指数,
分析,由于出口价格上升 4.38%,出口额增加了
107万美元;由于出口量上升 19.72%,出口额增加
了 402万美元;受两者共同影响,三种商品的出口
额上涨了 24.96%,即增加 509万美元。
(美元)1 0 7 0 0 0 02 0 3 9 0 0 0 02 5 4 8 0 0 0 0
0 4 3 8.1
2 0 3 9 0 0 0 0
2 5 4 8 0 0 0 0
0011
00
11
????
??
??
?
?
pqpq
pq
pq
(二 )多因素分析
1.多因素分析必须遵循连环代替法的
原则,即在分析受多因素影响的事物的发
展变化时,要逐项分析,逐项确定同度量因
素。
2.在多因素分析中,为了分析某一因素的
影响,要把其余因素固定不变。
3.对多因素的排列顺序,要具体分析
现象总体的经济内容,使之符合客观事物
的联系或逻辑。各因素顺序的排列一般应
遵循数量指标因素在前、质量指标因素在
后的原则。具体可采用逐项层层分解法来
确定。
)(
)()(
??
????
??
?
?
?
?
?
?
?
?
??
????
?
???
011111
001011000001
000111
011
111
001
011
000
001
000
111
pmqpmq
pmqpmqpmqpmq
pmqpmq
pmq
pmq
pmq
pmq
pmq
pmq
pmq
pmq
[公式 7— 14]
[例 7— 7]
产品产量指数,
原材料单耗指数,
1 0 0
0 0 0
1 0 0 0 0 0
17000
0, 8 7 1 8
19500
1 7 0 0 0 1 9 5 0 0 2 5 0 0 ( )
q m p
q m p
q m p q m p
??
? ? ? ? ?
?
?
?? 元
)(17001700015300
8718.0
17000
15300
001011
001
011
元?????
??
??
?
?
pmqpmq
pmq
pmq
原材料价格指数,
原材料费用总额指数,
1 1 1
1 1 0
1 1 1 1 1 0
14400
0, 9 4 1 2
15300
1 4 4 0 0 1 5 3 0 0 9 0 0 ( )
q m p
q m p
q m p q m p
??
? ? ? ? ?
?
?
?? 元
51001 9 5 0 01 4 4 0 0
7385.0
1 9 5 0 0
1 4 4 0 0
000111
000
111
?????
??
??
?
?
pmqpmq
pmq
pmq
综合影响,
各因素指数连乘积=原材料费用总指数
0.8718 × 0.9000 × 0.9412= 0.7385
2500)+( -1700)+( -900)= -5100(元 )
分析,由于生产量减少 12.82%,少支出的费用为 2500元 ;
由于单位产品原材料消耗降低 10%,少支出费用 1700元 ;又
由于原材料价格下降 5.88%,少支出费用 900元。三者共同
影响,使原材料费用总额下降 26.15%,减少 5100元。
四, 平均指标的因素分析
[公式 7— 15]
?
?
?
?
?
?
?
?
?
?
?
?
??
0
00
1
10
1
10
1
11
0
00
1
11
f
fX
f
fX
f
fX
f
fX
f
fX
f
fX
[例 7— 8]
1.可变组成指数,
)(61.1 5 947.1 5 6 286.1 4 0 2
0
00
1
11
8 9 7 8.0
47.1 5 6 2
86.1 4 0 2
7 3 0
1 1 4 0 6 0 0
2 1 0 0
2 9 4 6 0 0 0
0
00
1
11
元?????
???
?
?
?
?
?
?
?
?
f
fX
f
fX
f
fX
f
fX
2.固定组成指数,
)(29.7457.1 3 2 886.1 4 0 2
1
10
1
11
0 5 5 9.1
57.1 3 2 8
86.1 4 0 2
2 1 0 0
2 7 9 0 0 0 0
2 1 0 0
2 9 4 6 0 0 0
1
10
1
11
元????
???
?
?
?
?
?
?
?
?
f
fX
f
fX
f
fX
f
fX
3.结构影响指数,
)(90.2 3 347.1 5 6 257.1 3 2 8
0
00
0
10
8 5 0 3.0
47.1 5 6 2
57.1 3 2 8
7 3 0
2 1 1 4 0 6 0
2 1 0 0
2 7 9 0 0 0 0
0
00
0
10
元?????
???
?
?
?
?
?
?
?
?
f
fXfX
f
fX
fX
f
f
4.综合影响,
1,0559× 0.8503= 0.8979
74.29+(- 233.90)= -15 9.61(元 )
分析,由于工资水平上升 5.59%,总平均工资增
加 74.29元,由于工人结构的变动,总平均工资降低
14.97%,即总平均工资减少 233.9元,两者共同影
响,使总平均工资下降 10.22%,即减少 159.61元。
抽样调查
第八章
内容提要
本章主要阐述了抽样调查的概念、
特点、作用和几个基本概念;影响抽样
误差的主要因素;抽样调查几种主要组
织方式的抽样平均误差的计算;抽样估
计推断;点估计和区间估计;必要抽样
抽样调查的一般问题
第一节
一、抽样调查的概念与作用
(一 )抽样调查的概念与特点
抽样调查又称抽样推断或抽样估计,它是
从总体中按随机原则抽取一部分单位进行观测,
并根据这部分单位的资料推断总体数量特征的
一种方法。
抽样调查具有下列三个主要特点,
(1)按随机原则抽取调查单位。
(2)由部分推断全体。
(3)抽样误差可以事先计算并加以控制。
(二 )抽样调查的作用
(1)用于不可能进行全面调查的无限总体。
(2)用于不可能进行全面调查而又需要了解全
面情况的现象。
(3)用于不必要进行全面调查的现象。
(4)用于对全面调查的资料进行评价与修正。
(5)用于工业生产过程的质量控制。
二、抽样调查中的几个基本概念
(一 )全及总体和抽样总体
1.全及总体。全及总体简称总体或母体,
它是指所要调查研究对象的全体。
2.抽样总体。抽样总体简称样本或子样,
它是指在全及总体中按随机原则抽取的那部分,
单位所构成的集合体。
(二 )总体指标和样本指标
1.总体指标。
总体指标也称为母体参数或全及指标,
它是根据全及总体各单位的标志值或标志特征
计算的,反映总体某种属性的综合指标。由于
全及总体是唯一确定的,根据全及总体计算的
全及指标也是唯一确定的。
2.样本指标。
样本指标也称样本统计量或抽样指标,它
是根据抽样总体各单位的标志值或标志特征计
算的综合指标。由于可以从一个全及总体中抽
取许多个不同的样本,不同的样本其分布结构
也会有差异,抽样指标的数值也就不同,所以
抽样指标的数值不是唯一确定的。
三, 抽样调查的组织方式
(一 )简单随机抽样
简单随机抽样也叫纯随机抽样, 它对总
体单位不作任何分类排队, 而是直接从总体
中随机抽取一部分单位来组成样本的抽样组
织方式 。
(1)抽签法 。
(2)随机数字法 。
(二 )类型抽样
类型抽样又称分类抽样或分层抽样, 它
是先将总体按某个主要标志进行分组 (或分
类 ),再按随机原则从各组中抽取样本单位的
一种抽样方式 。
(1)等数分配类型抽样法。
(2)等比例类型抽样法。
[公式 8— 1]
),,2,1( ki
N
inN
in ???
(3)不等比例类型抽样法。
[公式 8— 2]
?
?
i
i
i
i
i
i
n
i
n
??
??
(三 )等距抽样
等距抽样也称机械抽样或系统抽样,
它是将总体各单位按某一标志顺序排列,
然后按固定顺序和相等距离或间隔抽取
样本单位的抽样组织方式 。
[公式 8— 3]
nNk ?
图 8— 1 等距抽样示意图
(四 )整群抽样
整群抽样也称集团抽样, 区域抽样
或分群随机抽样, 它是将总体各单位按
时间或空间形式划分成许多群, 然后按
纯随机抽样或机械抽样方式从中抽取部
分群, 对中选群的所有单位进行全面调
查的抽样组织方式 。
[公式 8— 4]
[公式 8— 5]
),,3,2,1(
),,3,2,1(
1
1
1
ri
M
Mx
x
ri
M
x
x
r
i
i
i
r
i
i
i
M
j
i
i
ij
?
?
??
??
?
?
?
?
?
?
抽样误差
第二节
一, 抽样误差的概念
即使遵守了随机原则, 也会由于被抽取
的样本各种各样, 导致样本内部各单位的分
布比例结构与总体实际分布状况有偶然性的
差异, 从而使不同的随机样本得出不同的估
计量, 造成样本指标数值与总体指标数值之
间产生差距, 如抽样平均数与总体平均数的
离差, 抽样成数与总体成数的离差等 。 这类
误差通常称为抽样误差或随机误差 。
二, 影响抽样误差的主要因素
(一 )样本单位数 (样本容量 n)的多少
(二 )总体被研究标志变异程度 (总体方差
σ 2 )的大小
(三 )抽样组织方式
(四 )抽样方法
三, 抽样平均误差
(一 )抽样平均误差的概念
抽样平均误差是指以全部可能样本指标为变
量, 以总体指标为平均数计算得到的标准差, 以
符号 表示, 通常以 代表平均数的抽样平均
误差, 以 代表成数的抽样平均误差, 以 K代表
可能组成的样本总数 。
??? x?
p?
(二 )计算抽样平均误差的理论公式
[公式 8— 6]
[公式 8— 7]
? ?
? ?
? ?
K
Pp
K
Xx
p
x
?
?
?
?
?
?
?
?
?
2
2
2
?
?
?
?
?
即:
可能组成的样本总数
总体指标样本指标
[ 例8 — 1 ] 为叙述简便起见, 假设有 10,20,30和
40四个数字组成一个总体, 从中随机抽取两个数字
作为样本, 求抽样平均误差 。
? ?
? ?
46.6
16
2 5 0
91.7
16
1 0 0 0
:
25
4
1 0 0
25
16
4 0 0
25
4
1 0 0
2
2
??
?
?
??
?
?
?????
???
?
?
??
?
n
N
x
x
i
C
Xx
K
Xx
N
X
K
x
x
N
X
X
?
?
采取不重复抽样
准差为全部可能组成样本的标
采取重复抽样
(三 )抽样平均误差的计算方法
1.平均数的抽样平均误差
(1)重复抽样条件下,
[公式 8— 8]
(2)不重复抽样条件下,
[公式 8— 9]
当 N很大时,
[公式 8— 10]
nn
n
nx
???? ??? 2
? ?
? ?1
2
?
??
Nn
Nn
x
??
???
?
???
? ??
N
n
nx
1
2?
?
2.成数的抽样平均误差
(1)重复抽样条件下,
[公式 8— 11]
(2)不重复抽样条件下,
[公式 8— 12]
当 N很大时,
[公式 8— 13]
? ?
n
PPp ?? 1?
? ?
???
?
???
?
?
???
1
1
N
Nn
n
PPp?
? ?
???
?
???
? ???
N
n
n
PPp 11?
[例8 — 2] 某仪表厂生产某种型号的精密仪表,按正常
生产经验,产品合格率为 85%。今按简单随机抽样方式从 800
只仪表中抽取 10%进行检验,求合格品比率的抽样平均误差。
在重复条件下,采用[公式 8— 11],
8— 13],
? ? %79.3
8 0 0
801
80
%75.1211 ?
???
?
???
? ???
???
?
???
? ???
N
n
n
PPp?
? ? %99.3
80
%75.121 ????
n
PPp?
? ?
80%10800
%,75.12%)851(%851
%,85
2
???
??????
?
n
PP
P
?
[例 8— 3]某大学有 4500名学生,采用不重复简单
随机抽样方式从中抽取 10%的学生,调查其每月生
活费用支出情况。抽样结果显示,学生平均每人每
月生活费支出 350元,标准差 80元,生活费用支出
在 500元以上的学生占全部学生的 20%。试求抽样平
均误差。
? ?
%79.1
4500
450
1
450
%)201(%20
1
1
)(58.3
4500
450
1
450
80
1
22
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
??
N
n
n
PP
N
n
n
s
p
x
?
? 元
%20,80,3 5 0
4 5 0%108 0 0,4 5 0 0
???
????
psx
nN
(四 )其他抽样组织方式抽样平均误差的计算方法
1.类型比例抽样平均误差的计算。
(1)平均数的抽样平均误差
重复抽样条件下,
[公式 8— 14]
不重复抽样条件下,
[公式 8— 15]
nx
2?
? ?
???
?
???
? ??
N
n
nx
1
2?
?
(2)成数的抽样平均误差
[公式 8— 16]
不重复抽样条件下,
[公式 8— 17]
? ?
n
PPp ?? 1?
? ?
???
?
???
? ???
N
n
n
PPp 11?
其中,
[公式 8— 18]
[公式 8— 19]
N
N ii?
?
2
2
?
?
? ?
? ?
N
PP
PP
ii? ?
??
1
1
[ 例 8— 4]
)/(99.12
48
17.8 0 1 4
17.8 0 1 4
48
895161202460
)/(4 4 0 0
48
83 6 0 0162 4 0 0246 0 0 0
2
222
2
2
公顷千克
公顷千克
???
?
?????
??
?
?????
??
?
?
n
s
n
ns
s
n
nx
x
x
ii
ii
?
2.等距抽样平均误差的计算。
3.整群抽样平均误差的计算。
(1)平均数的抽样平均误差
[公式 8— 20]
(2)成数的抽样平均误差
[公式 8— 21]
???
?
???
? ??
R
r
r
xx 12??
???
?
???
? ??
R
r
r
p
p 1
2?
?
其中,
[公式 8— 22]
[公式 8— 23]
? ?
R
XX i
x
? ?? 2
2?
? ?
R
PP i
p
? ?? 2?
[ 例 8— 5]
首先, 分别计算样本平均数和样本成数,
%83%84
3
2 5 3%80%85
)(4 4 0 0
3
2 5 32 4 62 4 8
?
??
??
?
??
??
?
?
r
p
p
r
x
x
i
i
克
然后, 分别求出样本平均数群间方差和成数群间
方差,
? ?
67.8
3
26
2
2 ??
?
? ?
R
xx i
x?
? ?
67.4
3
14
2
??
?
? ?
R
pp i
p?
最后, 根据 [ 公式 8— 20] 和 [ 公式 8— 21] 求出
μ x和 μ p为,
)(69.1
300
31
3
67.812 克?
???
?
???
? ??
???
?
???
? ??
R
r
r
xx ??
%51.2
300
31
3
1412 ?
???
?
???
? ??
???
?
???
? ??
R
r
r
p
p
?
?
总体指标的推断
第三节
一, 统计比较的概念和作用
总体指标的推断是指对总体平均数 总
体成数 P推断估计的问题 。 抽样调查的直接
目的, 就是为了推断, P,然后, 再结
合总体单位数 N去推算总体的有关标志总量 。
xX
X
一, 点估计
点估计也称定值估计, 它是以抽样得到的
样本指标作为总体指标的估计量, 并以样本指
标的实际值 (, p)直接作为总体未知参数
(, P)的估计值的一种推断方法 。
X
x
1.一致性。设 为未知参数 θ 的估计量,
当 n→∞ 时,要求 按概率收敛于 θ
[公式8 — 26]
? ? 1?lim ???
??
???
n
P
??
??
2.无偏性。若要求估计量 的数学期
望等于未知参数的真值 θ
[公式8 — 27] ? ? ?? ?
?E
??
3.有效性。无偏性只考虑估计量的平均结果是
否等于待估计参数的真值,有效性则要求每个估计值
与待估参数真值之间的偏差尽可能地小。
设,为 θ 的两个无偏估计量,若 的方差小
于
[公式8 — 28]
1?? 2??
1??
2??
? ? ? ?11 ?? ?? DD ?
二、区间估计
区间估计就是以一定的概率保证估计包
含总体参数的一个值域,即根据样本指标和
抽样平均误差推断总体指标的可能范围。
图 8— 2 正态分布曲线图
根据数理统计证明,总体单位的标志值如果是
正态分布,其全部可能样本也一定是正态分布的;
如果总体单位的标志值不是正态分布的,只要是
大样本 (即 n≥30),全部可能样本指标也会接近正
态分布。从正态分布图中,可以总结两个特点:
一是样本指标高于或低于总体指标的概率分布完
全是对称的;二是样本指标接近于总体指标的概
率越大 (小 ),出现的可能性也越大 (小 )。
图 8— 3 样本指标置信度图
误差范围 与概率度 (t)和抽样平均误差
三者之间的关系为,
[公式 8— 29]
由此得到平均数和成数的误差范围公式,
8— 30]
[公式 8— 31]
?? ? ?? t??
??? ???
pp
xx
t
t
?
?
??
??
进而得到总体平均指标和总体成数指标的区间
估计公式为,
8— 32]
[公式 8— 33] pp
xx
pPp
xXx
??????
??????
[例8 — 6]
公里公里即:
则
查表得
01.507899.4921
80.3996.15000
80.39
10000
100
1
100
400
1:
,96.1:
%,95)F(,400
,5000,100%110000
2
2
??
????
??
?
?
?
?
?
??
?
?
?
?
?
?
??
?
??
????
X
x
N
n
n
t
t
xn
x
x
?
?
?
?
有了区间估计的结果,就可以对这批轮胎的使
用寿命得出结论,因为区间估计最低公里数为
4921.99公里,可将 4900公里规定为最低可行驶公
里数。这样做虽不能保证百分之百的可靠,但可
以有 95%的把握,还是令人可信的。
[例8 — 7]
%58.23%42.16%58.3%20%58.3%20
500
]338[
16.35784.34216.735016.7350
]328[
%58.3%79.12
)(16.758.32:
,2:%,45.95)F(
%79.158.3%20,350
??????
??????
?????
?????
??
????
PP
XX
t
t
tt
px
pp
xx
px
即
重的可能范围:元以上的学生所占的比在
活费用得出全体学生月平均生—采用公式
即
活费用的可能范围:得出全体学生月平均生—采用公式
元则
查表得
元,,元
?
?
??
[例8 — 8]
? ?
%90
100
10203228
500100
1417900
100
141790000
100
11390
100
1139000
100
2
2
?
???
?
??
?
?
???
?
?
p
f
fxx
s
f
xf
x
为:元以上的户数所占比重收入在户农民家庭的年人均纯
收入的方差为:户农民家庭的年人均纯
(元)
收入为:户农民家庭的年人均纯
[例8 — 8]
? ? ? ?
%88.95%12.84%88.5%90%88.5%90
1 0 0 0 0
]338[
40.1 1 6 2 360.1 1 1 5 640.2 3 31 1 3 9 040.2 3 31 1 3 9 0
]328[
%88.5
1 0 0
9.019.0
96.1
1
)(40.2 3 3
1 0 0
1 4 1 7 9 0 0
96.1
]318[]308[
2
??????
??????
?
??
??
?
????
???????
PP
XX
n
pp
tt
n
s
tt
pp
xx
即
的可能范围:元以上的户数所占比重在
人均纯收入得出全县农民家庭中年—采用公式
即
均纯收入的可能范围:得出全县农民家庭年人—采用公式
元
:,求出抽样的误差范围—和公式—分别用公式
?
?
第四节
必要抽样数目的确定
一, 影响抽样数目的主要因素
(一 )
(二 )对推断精确度的要求
(三 )对推断可靠性的要求
(四 )抽样调查的组织方式和方法
(五 )人力, 物力和财力的允许条件
二, 确定抽样数目的方法
(一 )在重复抽样条件下
[公式 8— 34]
[公式 8— 35]
2
22
x
x
tn
?
? ?
2
2 )1(
p
o
PPtn
?
??
(一 )在不重复抽样条件下
[公式 8— 36]
[公式 8— 37]
222
22
?
?
tN
Ntn
x
x ???
NPPtN
NPPtn
p
o )1(
)1(
22
2
???
??
[ 例8 — 9 ]
(1)采用重复抽样公式计算,
(户)
有:—公式根据
元时,当极限误差
400
150
1 5 0 02
]348[
150
2
22
2
22
?
?
?
?
?
??
x
x
x
t
n
?
(户)
有:—公式根据
元时,当极限误差
1 6 0 0
75
1 5 0 02
]348[
75
2
22
2
22
?
?
?
?
?
??
x
x
x
t
n
?
可见,在重复抽样中,极限误差缩小一半
(即为原来的 1/2)时,必须把样本容量增到 4
倍。
(2)采用不重复抽样公式计算,
(户)
有:—公式根据
元时,当极限误差
3923.391
1500215018000
1500218000
]368[
150
222
22
??
???
??
?
??
x
x
n
(户)
元时,当极限误差
1 4 5 04.1 4 6 9
752751 8 0 0 0
1 5 0 021 8 0 0 0
75
222
22
??
???
??
?
??
x
x
n
如果是采用其他抽样组织方式, 则公式略有不
同 。 例如, 采用重复的分层抽样, 则所需的
抽样数目计算公式为,
[公式 8— 38]
[公式 8— 39]
2
22
x
x
tn
?
? ?
2
2 )1(
p
o
PPtn
?
??
相关与回归分析
第九章
内容提要
相关分析与回归分析是两种既有区别又有联
系的统计分析方法。本章阐述了相关关系的概念
与特点;相关关系与函数关系的区别与联系;相
关关系的种类;相关关系的测定方法 (直线相关
系数的含义、计算方法与运用 );回归分析的概
念与特点;直线回归方程的求解及其精确度的评
相关分析的一般问题
第一节
(一 )相关关系的概念
量变化上受随机因素的影响,非确定性的相互
依存关系。
(二 )相关关系的主要特点
1.相关关系表现为数量相互依存关系。
2.相关关系在数量上表现为非确定性
的相互依存关系。
(一 )相关关系按变量的多少,可分为单相
关和复相关
单相关是指两个变量间的相关关系,如
自变量 x和因变量 y的关系。
复相关是指多个自变量与因变量间的相关
关系。
(二 )相关关系从表现形态上划分,可分为
直线相关和曲线相关
直线相关是指两个变量的对应取值在坐
标图中大致呈一条直线。
曲线相关是指两个变量的对应取值在坐
标图中大致呈一条曲线,如抛物线、指数曲线、
双曲线等。
(三 )相关关系从变动方向上划分,可分为
正相关和负相关
正相关是指直线相关中,两个变量的变动
方向相同,即变量 x增加,变量 y也相应增加;
变量 x减少,变量 y也相应减少。
负相关是指直线相关中,两个变量的变动
方向相反,即变量 x增加,变量 y反而减少;变
量 x减少,变量 y反而增多。
(四 )按相关的密切程度分,有完全相关、
不完全相关和不相关
完全相关是两个变量之间有确定的函数
关系。
若两个变量之间有一定联系,当一个变
量变化时,另一个变量也会因此发生变化,但
不存在严格的函数关系,称为不完全相关。
若两个变量之间各自独立,当一个变量变
化,另一个变量不变化,或呈不规则变化,两
(一 )判别现象间有无相关关系
(二 )判定相关关系的表现形态和密切程度
相关关系的判断
第二节
一,
(一 )定性分析
对现象进行定性分析, 就是根据现
象质的规定性, 运用理论知识, 专业知
识, 实际经验来进行判断和分析 。
(二 )相关表
相关表就是把被研究现象的观察值
对应排列所形成的统计表格 。
表 9— 1 某地区工业劳动者数与工业增加值相关表
工业劳动者数 (万人 ) 工业增加值 (亿元 )
1373
1501
1400
1375
2416
2881
2979
2224
1705
156
174
179
212
257
401
527
565
345
303
相关表中的两列数据叫相关数列, 它有
别于变量数列 。 相关表中的数值是变量的观
测值, 是实际资料, 是样本数据, 它是判别
相关关系的基础 。 在相关表中, 如果观测值
的分布呈现一定的规律性, 则表明现象间存
在相关关系 。
相关表可分为简单相关表和分组相关表 。
(三 )相关图
相关图也叫相关散点图, 它是根据相
关表中的观测数据在坐标图中所绘制的点
状图形 。 用 x和 y分别代表两个变量, 把相
关表中的对应观测值一一描绘在坐标图中,
则形成了反映相关点分布状况的图形, 据
此就可以观测现象间相关关系的情况 。
图 9— 1
图 9— 2 商品销售额与流通费用率相关图
二,
(一 )相关系数的含义
相关系数是指直线相关条件下, 说明两现
象之间相关关系密切程度的统计分析指标, 用
r表示 。 其定义公式为,
[公式 9— 1]
? ?? ?
? ? ? ?
n
yy
n
xx
n
yyxx
r
yy
xy
??
?
??
??
??
22
2
??
?
依相关系数的定义公式可知相关系数的含
义如下,
(1)r的取值范围为-1 ≤ r≤ 1。 因为协方差
的绝对值最小为 0,最大为 σ x和 σ y的乘积 。
(2)r的绝对值越接近于 1,表明相关关系越
密切;越接近于 0,表明相关关系越不密切 。
(3)r=+1或 r=-1,表明两现象完全相关 。
(4)r=0,表明两变量无直线相关关系 。
(5)r>0,表明现象呈正直线相关; r<0,
表明现象呈负直线相关 。 实际中| r| <0.3,
视为无相关;0,3 ≤ | r|<0,5, 为低
度相关;0,5| r| <0,8, 为显著相
关;| r| ≥ 0,, 一般称为高度相关 。
(二 )相关系数的计算
1.根据相关系数的定义公式可直接计
算相关系数 。
? ?? ?
? ? ? ?
9 8 5.0
7
4 0 6
7
1 8 3 6
7
8 5 0
22
??
??
??
?
??
?
n
yy
n
xx
n
yyxx
r
2.相关系数的简捷计算法
按照定义公式计算相关系数 r运算量较大,
过程繁琐, 实践中多采用由定义公式推导出的
简捷公式计算相关系数 。 简捷计算公式为,
[公式 9— 2]
? ? ? ? 2222 ????
???
??
?
?
yynxxn
yxxyn
r
? ? ? ?
? ? ? ?
9 8 5.0
2 1 77 1 3 374 3 42 8 7 4 47
2 1 74 3 41 4 3 0 47
22
2222
?
????
???
?
??
?
?
????
???
yynxxn
yxxyn
r
3.相关系数的其他公式
[公式 9— 3]
[公式 9— 4]
[公式 9— 5]
? ?? ?
? ? ? ???
?
??
??
?
22 yyxx
yyxx
r
? ? ? ? 2222 ynyxnx
yxnxy
r
??
??
?
??
?
yx
yxnxyr
??
???
回归分析的一般问题
第三节
一,
(一 )回归分析的概念
,虽然不是严格
的函数关系, 但现象之间的一般关系值,
可以通过函数关系的近似表达式来反映,
这种表达式根据相关现象的实际对应资料,
运用数学的方法来建立, 这类数学方法称
回归分析 。
(二 )回归分析的特点
与相关分析相比, 回归分析的特点有,
1.回归分析的两个变量是非对等关系 。
2.回归分析中, 因变量是随机变量, 自
变量是可控制变量 。
(一 )
(二 )测定数学模型的拟合精度
三、相关分析和回归分析的区别与联系
相关分析与回归分析既相互区别又密切联系,
是相辅相成的。相关分析是研究两个或两个以上变
量之间相关关系及其密切程度的分析。判断相关关
系及其密切程度,一般可通过进行定性与定量分析、
编制相关图表、计算相关系数等,来反映相关方向
和密切程度。回归分析是指将相关现象的关系转变
为函数关系,并建立变量关系的数学表达式,来研
究变量之间数量变动关系的统计分析方法。
相关分析和回归分析是研究现象之间互相依
存关系的不可分割的两个方面。一般先进行相关分
析,测定相关现象之间相关程度大小,进而决定是
否需要进行回归分析,并拟合相应的回归方程,以
便进行推算和预测等,因而可以说相关分析是进行
回归分析的基础,回归分析是把变量的相关关系转
变为函数关系的手段。但须指出,相关分析可以不
分自变量和因变量,而进行回归分析时,则必须明
确自变量和因变量,当自变量与因变量位置互换时
所得到的回归方程则不同。
第四节
回归模型的建立与检测
一,
一元线性回归模型是用来进行两个变量间
回归分析的 。 回归分析的重要内容之一, 就
是根据变量观测值构建回归直线方程, 对现
象间存在的一般数量关系进行描述 。
(一 )构建回归模型应具备的条件
1.现象间确实存在数量上的相互依存
关系 。
2.现象间存在直线相关关系 。
3.具备一定数量的变量观测值 。
(二 )直线回归方程的求法
直线回归方程又称一元一次线性回归方程,若以
x表示自变量,y表示因变量,则其基本形式为,
a,b与直线趋势方程相同,通常用最
小平方法来求。最小平方法的数学出发点是,
bxay ???
? ?
? ? 最小值
最小值
???
??
?
?
2
2?
bxay
yy
根据高等数学中求极值的原理,
[公式 9— 6]
? ?? ?
? ?? ?
?
?
?
?
?
??
??
?
?
?
?
?
????
????
?
?
?
?
?
?
???
??
?
?
2
012
012
0,0
xbxaxy
xbnay
bxay
bxay
b
G
a
G
即
这就是求解参数 a,b的二元一次方程组。解之即得
求 a,b的公式如下,
[公式 9— 7]
? ?
xby
n
x
b
n
y
a
xxn
yxxyn
b
????
?
?
?
??
? ?
? ??
2
2
[ 例9 — 2 ]
根据相关系数的简捷公式计算有,
? ? ? ?
? ? ? ?
978.0
80954718550037
8018521807
22
2222
?
????
???
?
??
?
?
????
???
yynxxn
yxxyn
r
再求回归直线方程,
? ?
xy
n
x
b
n
y
a
xxn
yxxyn
b
bxay
5 7 8.08 4 4.3?
8 4 4.3
7
1 8 5
5 7 8.0
7
80
5 7 8.0
1 8 55 0 0 37
801 8 52 1 8 07
?
22
2
???
???????
??
???
?
?
?
?
??
??
? ?
? ??
(一 )估计标准误差的概念与计算
表性大小的统计分析指标。其计算公式为,
[公式 9— 8]
? ?
n
yy
S yx
? ?
?
2?
实践中,在已知直线回归方程的情况下,
通常用下面的简便公式计算估计标准误差,
[公式 9— 9]
n
xybyay
S yx ???
??
?
2
(二 )估计标准误差与相关系数的关系
估计标准误差与相关系数存在着密切的关系,
二者的关系可由如下表达式描述,
[公式 9— 10]
根号前面的正负号表明正相关或负相关,具体
取舍由回归系数的符号来确定:回归系数为正,则
取正;回归系数为负,则取负。
y
yxS
r
2
2
1
?
???
在给定相关系数的情况下,估计标准误差
的计算公式又为,
[公式 9— 11]
21 rS
yyx ?? ?
(三 )相关系数与回归系数的关系
[公式 9— 12]
[公式 9— 13]
x
y
y
x
rb
br
?
?
?
?
??
??
或
(四 )回归方程的变形形式
[公式 9— 14]
? ?xxryy
x
y ?? ???
?
?
[例9 — 3]
(1)先求直线回归方程
9— 13],
bxay ???
64.0
5
48.0 ?????
x
yrb
?
?
由[公式 9— 7],
故所求直线回归方程为,
4.1816564.0124 ?????? xbya
xy 64.0124? ??
(2)求估计标准误差
9— 11]有,
(万元)4.2
8.014
1
2
2
?
??
?? rS
yyx
?
三、应用相关分析与回归分析应注意的
(一 )注意定性分析与定量分析的结合
(二 )注意客观现象质的规定性
(三 )注意社会经济现象的复杂性
(四 )注意对相关系数和回归直线方程的
有效性进行检验
统计预测
第十章
内容提要
本章阐述了统计预测的概念、特点和种
类;统计预测的基本原则和基本程序;一些
常用的预测方法 (简单模型预测法、长期趋势
模型预测法、回归模型预测法 );长期趋势模
型预测法中的参数估计 (最小平方法、取点 );
回归模型预测法中的行列式法估计二元线性
回归模型的参数;回归预测应注意的问题;
统计预测概述
第一节
一、统计预测的概念和特点
(一 )统计预测的概念
统计预测是根据有关的统计理论,利用统
计方法,对尚未发生或已经发生而不为人们所
知的社会经济现象的特征和表现做出判断和预
见。
(二 )统计预测的特点
1.统计预测属于一种定量预测。
2.统计预测的基本特征是运用统计方
法,建立数学模型。
3.统计预测的准确性可以通过预测误
差来进行检验和控制。
二、统计预测的种类
1.按预测方法可以分为定性预测和定量预测。
定性预测是根据实践经验和有关理论对现象
做出科学分析后,对其性质或特征做出预测。其
目的在于对预测事物有个概括的了解,对某种现
象出现的可能性做出判断。
定量预测是在对统计数据进行分析的基础
上,根据有关的理论和方法建立数学模型,然
后对社会经济现象可能出现的特征做出数量上
的描述。
2.按预测的对象可以分为宏观预测和微观预测。
宏观预测是指对社会总体进行全局性的预测,
如对全社会基本建设投资规模、物价变动趋势、
人民生活水平、国民经济发展速度的预测等。
微观预测是指对单个社会单元活动的预测,
如对某个商店商品销售量、销售额的预测。
3.按预测的性质可以分为趋势预测和回归
预测。
趋势预测是依据现象在时间上的变动和发
展规律,对其未来的变化特征做出推断和预见。
进行这种预测要求掌握时间数列资料。
回归预测是依据现象之间的因果联系,通
过一个或多个现象的变化情况来对另一个相关
现象的变化特征进行描述,这种预测要求掌握
相关数列资料。趋势预测和回归预测这种分类
的实用性强,本章将按照这种分类,介绍统计
三、统计预测的基本原则
(一 )连续性原则
(二 )类比性原则
(三 )概率性原则
四、统计预测的基本程序
(一 )确定预测目标
(二 )搜集统计资料
(三 )加工整理资料
(四 )构建预测模型
(五 )估计模型参数,进行预测
(六 )分析预测误差,改进预测
几种常用的简单模型预测
第二节
一, 进度预测法
当现象的数量变化比较平稳, 没有
明显的递增或递减趋势, 可以根据以往
的实践, 结合考虑有关因素的作用, 来
预计月度, 季度或年度所能达到的水平
或完成程度的一种预测方法, 此法一般
用于短期预测 。
[公式 10— 1]
1
1
?
%1 0 0?
?
?
??
?
?
?
nit
n
ni
t
yyy
y
yy
y
或
[ 例 10— 1] 某化肥厂 1— 11月份共生产尿素
3 200吨, 其中最后 3个月产量为 900吨 。 全年
计划任务数为 3 400吨, 预计全年计划完成程
度为,
%94.102
%100
3400
3500
3400
1
3
900
3200
? %
?
??
??
?)(
t
y
二, 比例预测法
事物与事物之间的联系有的表现为
一定的比例关系 。 这时, 就可根据这种
客观存在的比例关系进行推算和预测 。
[公式 10— 2]
( % )
?
i
t
t X
y
y ?
[ 例 10— 2] 某地区生产总值 900亿元, 其中工
业, 农业, 建筑业等生产物质产品部门的增加值
为 585亿元, 占生产总值的 65 %。 如果已知第 2年
的工业, 农业, 建筑业等生产物质产品部门的增
加值为 692亿元, 就可以根据上年工业, 农业,
建筑业等生产物质产品部门的增加值的比重估算
第 2年该地区的生产总值为,
(亿元)62.1 0 6 4%656 9 2? ??ty
[ 例 10— 3] 某厂某年 1— 11月份共生产某种产
品 1 800吨 。 12月份上, 中旬实际生产该产品 120
吨 。 该工厂生产比较稳定, 每月生产计划一般都
是上, 中旬完成 65.5%左右, 下旬完成 34.5%左右,
这就可以用比例预测法预算该年 12月份的产量和
全年的产量 。
(吨)全年预计产量
(吨)月份产量
(吨)月份下旬产量
21.1 9 8 321.1 8 31 8 0 0
21.1 8 321.631 2 012
21.633 4 5.0
6 5 5.0
1 2 0
12
???
???
???
三, 简单序时平均预测法
简单序时平均预测法就是把研究时
期的全部观察值都考虑在内, 采用简单
算术平均法, 求出该时期的序时平均数,
作为下一期的预测值 。
[公式 10— 3]
t
y
t
yyyy
y
t
i
i
t
kt
?
?
?
?
????
? 1321?
?
[ 例 10— 4]
(万吨)400
11
4 8 3 7
11
448470468450467439433420413444385
? 1
??
??????????
??ty
四, 移动平均数预测法
移动平均数预测公式为
[公式 10— 4]
[公式 10— 5] 15
2345
?
5
?
4321
1
121
1
????
?
????
?
????
?
?
????
?
ttttt
t
ntttt
t
yyyyy
y
n
n
yyyy
y
,则设
?
五, 增长量和平均增长量预测法
[公式 10— 6]
[公式 10— 7]
11
?
2?
11
1
111
?
?
??
?
?
??
?????
? ?
?
???
n
yy
y
n
yy
yy
yyyyyy
t
t
tt
tt
tttttt
)(
)(
[ 例 10— 5]
增长量预测,
2005年生产总值为,
平均增长量预测,
2005年生产总值为,
(万元)
)(
1 2 2 3 5 8 31 1 2 9 1 81 1 1 0 6 6 5
9 9 7 7 4 71 1 1 0 6 6 51 1 1 0 6 6 5? 1
???
????ty
(万元)
)(
1 1 8 1 9 2 0
110
4 6 9 3 6 61 1 1 0 6 6 5
1 1 1 0 6 6 5? 1
?
?
?
???ty
六, 增长速度和平均速度预测法
[公式 10— 8]
[公式 10— 9]
度。为水平法的平均发展速G
Gyy
y
y
y
y
yy
yy
tt
t
t
t
t
tt
tt
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
??
?
??
?
?
1
11
1
1
?
1?
长期趋势模型预测
第三节
一, 最小平方法
(一 )直线趋势预测模型
直线趋势预测模型为,
[公式 10— 10]
? ?? ?
? ??
?
?
?
??
??
2
2
,
?
ttn
yttyn
b
tbya
ba
btay
t
:为参数,可由下式估计式中,
[ 例 10— 6]
? ?
(亿元)
测值为:年该地区生产总值的预所以,
故实际预测模型为:
用最小平方法估计:
经计算,
:设直线趋势预测模型为
01.90)19(38.421.46?
2 0 0 5
38.421.46?
21.46
9
45
38.4
9
6 1 3
38.4
452 8 59
6 1 3453 3 2 89
3 3 2 8,6 1 3,2 8 5,45,9
?
1
22
2
2
????
??
??????
?
??
???
?
?
?
?
?????
??
?
?
??
? ?
? ??
? ???
t
kt
t
y
ty
n
t
b
n
y
a
ttn
yttyn
b
tyyttn
btay
(二 )二次抛物线趋势预测模型
二次抛物线趋势预测模型为,
[公式 10— 11]
? ?
? ?
2
24
22
2
2
24
224
2
,,
?
??
???
?
?
??
? ???
?
?
?
?
?
?
?
???
?
ttn
tyytn
c
t
ty
b
ttn
yttty
a
cba
ctbtay
kt
的一般公式为:此时求解
[ 例 10— 6]
(万元))()(
值为:年农产品收购额的预测
4.6 1 8148 8 1.3140 3 3.442 3 8.3 0 1?
2 0 0 5
8 8 1.30 3 3.442 3 8.3 0 1?
8 8 1.3
2 7 7 2
1 0 7 5 8
607 0 89
602 9 4 42 0 8 2 29
0 3 3.44
60
2 6 4 2
2 3 8.3 0 1
2 7 7 2
8 3 5 0 3 2
607 0 89
2 0 8 2 2607 0 82 9 4 4
2
1
2
2
2
??????
???
??
??
???
?
??
??
??
???
?
?t
t
y
tty
c
b
a
二, 取点法
取点预测法的具体做法是:根据预测模型
参数的多少, 在时间数列的首, 尾或者首, 中,
尾分别取三项或五项数值, 从远到近用 1,2,
3或 1,2,3,4,5加权平均, 这样来确定两个
点, 或者三个点, 通过这两点或三点来估计模
型的参数 。 直线预测模型由于只需要确定两个
参数, 因此确定, 尾两点即可 。
二次曲线预测模型有三个参数, 因此需确
定首, 中, 尾三个点 。 值得注意的是, 三点间
距应相等 。 若时间数列为偶数时, 通常删去最
早一期数据 。 每一个点是取三项还是五项, 完
N来确定 。 当时间数列
N很大时, 一般取五项平均;当时间数
N不大时, 一般取三项平均 。
(一 )直线趋势预测模型
求参数 a,b的计算公式为,
[公式 10— 12]
[公式 10— 13]
)(
5
3
11
)(
3
3
7
五项加权平均
三项加权平均
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
N
RT
b
bRa
N
RT
b
bRa
btay kt ????
[ 例 10— 8]
(亿元)
(亿元)
年的预测财政收入为:年、用这一模型得
则
那么
04.117)211(52.728.19?
52.109)111(52.728.19?
20062005
52.728.19?
28.1952.7
3
7
83.36
3
7
52.7
311
83.3697
3
97
6
103394285
6
32
83.36
6
40336229
6
32
13
12
321
321
????
????
??
??????
?
?
?
?
?
?
?
?
????
?
??
?
?
????
?
??
?
?
???
y
y
ty
bRa
N
RT
b
yyy
T
yyy
R
kt
NNN
(二 )二次曲线趋势预测模型
a,b,c的计算公式为,
[公式 10— 14]
[公式 10— 15]
? ?
? ?
? ?
? ?
)(
5
22
3
73
5
15
3
11
)(
3
22
3
53
3
6
3
7
2
2
五项加权平均
三项加权平均
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
???
N
STR
c
c
N
N
RT
b
cbRa
N
STR
c
c
N
N
RT
b
cbRa
2? ctbtay t ???
[ 例 10— 8]
? ?
? ?
? ?
? ?
(亿元)
年出口额的预测值为:用这一模型得
86.1 3 0 2)211(52.7)211(49.6448.493?
2 0 0 6
52.749.6448.493?
48.49375.96)49.64(
3
7
5.4016
3
7
49.6475.9
3
5113
311
5.40183.873
3
53
3
75.9
311
67.481283.8735.4012
3
22
83.873
6
5 2 4 3
6
32
67.481
6
2 8 9 0
6
32
5.401
6
2 4 0 9
6
32
2
13
2
22
11109
765
321
??????
???
??????????
???
??
?
?
?
?
?
?
?
?
?
?
?
????
?
?
??
?
??
??
?
??
??
?
??
??
?
y
tty
cbRa
c
N
N
RT
b
N
STR
c
yyy
T
yyy
S
yyy
R
t
第四节
回归模型预测
一, 一元线性回归模型预测
(一 )一元线性回归模型的建立
x和 y为两个相关变量, 其中 x为自变量,
y为因变量 。 若通过样本数据判定两变量间存
在线性相关关系, 则其一元线性回归模型为,
xbby t 10? ??
(二 )模型参数的估计方法
在最小平方法下, 求参数 b0 及 b1 的公式为,
[公式 10— 16]
? ?? ?
? ??
??
?
?
?
??
2
2
1
10
xxn
yxxyn
b
n
x
b
n
y
b
(三 )
例 10— 10] ? ?
)(67.1912367927.05932.4?
2005
7927.05932.4?
5932.44.1117927.09.92
7927.0
111414058210
929111411655710
?
10
22
2
1
10
亿元
为:年消费支出额点预测值所以,
可以预测模型为
????
??
??????
?
??
???
?
?
?
?
??
? ?
? ??
y
xy
xbyb
xxn
yxxyn
b
xbby
二, 多元回归预测
(一 )多元线性回归模型的建立
uxbxbxbby pp ?????? ?22110
(二 )模型参数的估计方法
用最小平方法求参数 。
[公式 10— 17]
?? ???
????
???
???
???
???
2
22211202
212
2
11101
22110
xbxxbxbyx
xxbxbxbyx
xbxbnby
22110? xbxbby t ???
???
???
??
?
???
2
2212
21
2
11
21
2
2
1
1
0
0
xxxx
xxxx
xxn
D
D
Db
b
D
Db
b
D
Db
b,,
???
???
???
?
2
2212
21
2
11
21
0
xxxyx
xxxyx
xxy
Db
???
???
??
?
2
222
2111
2
1
xyxx
xxyxx
xyn
Db
???
???
??
?
yxxxx
yxxx
yxn
Db
2212
1
2
11
1
2
(三 )二元线性回归预测模型的运用
[ 例 10— 11]
设二元线性回归方程为,
其中,
22110? xbxbby t ???
D
Dbb
D
Dbb
D
Dbb 2
2
1
1
0
0 ???,,
先按标准方程组的要求计算出有关数据,
将计算结果代入方程组,得,
210
210
210
19.373.3105.188.1 6 3 4
3.3102 8 6 21601 3 4 9 7
5.1816010789
bbb
bbb
bbb
???
???
???
b0,b1,b2,
(万件)
,,,
13.1 1 85.24 8 7 6.58261 2 1 2 8.02 4 2 5.31?
4 8 7 6.581 2 1 2 8.02 4 2 5.31?
4 8 7 6.58
4.6 9 0 9
4 0 4 1 1 4
1 2 1 2 8.0
4.6 9 0 9
8 3 8
2 4 2 5.31
4.6 9 0 9
2.2 1 5 8 6 7
4 0 4 1 1 48 3 82.2 1 5 8 6 74.6 9 0 9
21
2
2
1
1
0
0
210
???????
????
???
???
??
?
??
?????
y
xxy
D
Db
b
D
Db
b
D
Db
b
DbDbDbD
三、回归预测应注意的问题
(一 )对预测对象进行定性分析
(二 )对回归系数进行分析
(三 )注意样本资料的结构变形
(四 )注意因变量的滞后变动
(五 )注意变量间的非线性关系
统计预测误差分析
第五节
一, 分析预测误差的意义
研究产生预测误差的原因, 计算与分析
误差的数量, 不但可以认识预测结果的准确
性, 为编制计划, 进行决策提供可靠的依据,
而且也有利于改进预测工作, 发展和完善预
测理论 。
二, 影响预测准确度的主要因素
(一 )模型的科学性
(二 )数据资料的可靠性
(三 )统计方法的正确性
(四 )主观判断的准确性
三, 预测准确度的测量
(一 )单个预测值的误差
,计算公
式为,
[公式 10— 18]
式中,et为预测误差; et= 0为准确预测; et>0为
低估预测; et<0为高估预测 。
),,2,1(? ntyye ttt ????
(二 )总预测误差
,计算公式为,
[公式 10— 19]
nn
n
n
t
t
yyyyyy
eeee
???
2211
21
1
???????
?????
?
?
?
?
(三 )平均绝对误差
n个误差绝对值的平均数, 通常用 MAD
表示, 计算公式为,
[公式 10— 20]
n
yy
n
e
M A D
n
t
tt
n
t
t ??
??
?
?? 11
?
(四 )预测相对误差
[公式 10— 21]
。
t
t
t
t
t y
y
y
e
R
?
1 ???
(五 )均方根误差
均数的算术根, 通常用 Syx表示 。 其计算公
10— 22]
? ?
n
yy
S
n
t
nn
yx
?
?
?
? 1
2
?
四, 统计预测误差的计算
[ 例 10— 12]
根据资料, 分别配合二次抛物线和趋势直线,
用最小平方法求参数值 。
(一 )配合抛物线
2
2
8 2 1 4.075.26 7 8 6.15?
8 2 1 4.075.26 7 8 6.15
,,
?
tty
cba
cba
ctbtay
???
???
???
,,
求解
(二 )配合趋势直线
? ?
ty
n
t
b
n
y
a
ttn
yttyn
b
btay
t
t
14.1037.3?
37.3
8
36
8
8
392
14.10
362048
3923621908
?
22
2
??
??????
?
??
???
?
?
?
?
??
??
? ?
? ??
(三 )进行预测误差分析
抛物线模型的均方根误差为,
趋势直线方程的均方根误差为,
? ?
4 0 4.1
8
77.15
?
1
2
??
?
?
?
?
n
yy
S
n
t
nn
yx
? ?
02.4
8
12.129
?
1
2
??
?
?
?
?
n
yy
S
n
t
nn
yx
上述计算结果表明,就本例的资料而言,用最小
平方法拟合的二次抛物线方程的预测误差要小于用
最小平方法拟合的趋势直线预测方程的预测误差。
当然外推预测时,其效果如何,还必须根据现象本
身的进一步发展来判定。此外,还可运用预测误差
分布图来研究预测误差。
浙江工贸学院
经贸系 刘锋
E-mail,liufeng63@126.com
? 介绍本课程的教学目的
? 本学期教学计划
? 教材和参考书目
? 本课程是为提高财会人员的统计知识水平
而设立的。在中国的许多企业或管理部门
中,财会人员与统计人员在工作中有许多
联系,很多财会人员本身就兼职统计,因
此他们需要掌握一定的统计知识。另一方
面,统计作为一门关于数据的收集、整理、
分析和应用的方法论科学,其作用在人们
的日常生活和工作中处处体现出来。
? 在科技高速发展、信息处理日显重要的时
代里,统计学已经成为人们生活、学习和
工作的重要工具,甚至成为人们所需要具
备的重要的基本素质。因此,财会人员掌
握统计的基本知识,不仅有利于他们做好
自己的本职工作,而且有利于他们提高自
己的能力,进一步跟上时代发展的步伐。
教材,
? 统计学原理
第二版 栗方忠 主编
东北财经大学出版社
参考书目,
? 统计学
袁卫 庞皓 曾五一
高等教育出版社
? 统计学
中国时代经济出版社
※ 第一章 总论
※ 第四章 总量指标和相对指标
※ 第五章 平均指标和变异指标
※ 第二章 统计设计和统计调查
※ 第三章 统计整理
※ 第六章 动态数列
※ 第七章 统计指数
※ 第八章 抽样调查
※ 第九章 相关与回归分析
※ 第十章 统计预测
※ 第十一章 统计综合分析
总论
第一章
内容提要
统计是社会认识的有力武器之一。, 统计,
一词有统计工作、统计资料和统计科学三种含
义。本章阐述了统计研究对象的特点 (数量性、
总体性、具体性和社会性 );统计的作用;统计
学中的基本概念 (总体、总体单位、标志、指标、
变异、变量和变量值 );统计研究的基本方法和
统计工作的一般过程 (统计设计、统计调查、统
计整理和统计分析 );统计工作的任务和组织。
统计研究的对象、特点和作用
第一节
统计作为一种社会实践活动已有悠久
的历史。最初,统计只是为统治者管理国
家的需要而搜集资料,弄清国家的人力、
物力和财力,作为管理国家的依据。
统计有三种含义,即统计工作、统计资料和
统计科学。
统计工作,即统计实践,是指根据科学的
方法从事统计设计、搜集、整理、分析研
究和提供各种统计资料和统计咨询意见的
活动总称,其成果是统计资料。
统计资料,是统计工作活动过程所获
得的各种有关数字资料以及与之相联系的
其他资料的总称。
统计科学,即统计理论,是指统计工作
实践的理论概括和科学总结。
? 统计学是一门收集、整理和分析统计数据
的方法科学,其目的是探索数据的内在数
量规律性,以达到对客观事物的科学认识。
二、统计研究的对象和特点
统计以社会经济现象为其研究领域,具有
自己的特点。
(一 )数量性
(二 )总体性
(三 )具体性
(四 )社会性
三、统计的作用
(一 )统计是社会认识的一种有力武器
(二 )统计是制订计划、实行宏观调控的基础
(三 )统计是制定政策的依据
(四 )统计是实行管理的手段
(五 )统计是认识世界、开展国际交流和科学
研究的工具
四、统计学的理论基础
统计研究的基本方法与过程
第二节
一, 统计研究的基本方法
(一 )大量观察法
大量观察法就是对所要研究的事物的全
部或足够多数的单位进行观察 。
(二 )分组法
根据所研究对象总体的特点和统计研究
的任务,按照一定的标志,把所研究的现象总
体划分为不同性质或类型的组,这种方法在统
计上称为统计分组法 。
(三 )综合指标法
所谓综合指标法, 是指利用综合指
标对现象总体的数量特征和数量关系进
行综合, 概括和分析的方法 。
二, 统计工作的过程
(一 )统计设计
(二 )统计调查
(三 )统计整理
(四 )统计分析
统计学中的基本概念
第三节
一, 统计总体与总体单位
统计为正确认识客观现象,必须从总体角度进
行观察,这就产生了统计总体的概念 。 凡是客观存
在,并在某一相同性质基础上结合起来的由许多个
别事物组成的整体,称为统计总体,简称总体 。
构成统计总体的每个独立的个别事物称为总
体单位,简称单位或个体, 如全部工业企业中的每
个企业, 全国人口总体的每个人等 。
二, 标志与指标
☆ 标志是说明总体单位特征的名称 。
例如,对人口普查中的, 某人, 来说,有性别,
年龄, 爱好等方面的特征, 这里的, 性别,
年龄, 爱好, 等名称就是标志 。
?一个完整的标志包括标志名称和标志表现两
个方面 。
? 标志分为品质标志和数量标志
? 品质标志是表明总体单位属性方面特征的,
不能用数值表示,而只能用文字陈述。
如 某人的性别、民族、文化程度等
? 数量标志是表明总体单位数量特征的,其
具体表现为数值,如 某人的年龄、工龄、
工资等
? 标志还可分为不变标志和可变标志
? 凡是总体中各单位某种标志的具体表现都
相同的,成为不变标志。不相同的称为可
变标志。
? 例如研究某学校教师的工资收入情况
该学校所有教师是总体,,职业, 是不变
标志,,工资, 就是可变标志
☆ 指标 (指统计指标 )是说明现象总体量的
特征的概念或范畴,及通过统计实践活动
可得到指标的具体数值的总称 。
标志和指标的主要区别是,
(1)标志是说明总体单位特征的,而指标
是说明总体特征的 ;
(2)标志有不能用数值表示的品质标志与
能用数值表示的数量标志,然而不论什么指标,
都是用数值表的 。
标志与指标的主要联系是,
(1)有些统计指标的数值是从总体单位的数
量标志值汇总得到的,如一个县的粮食实际入库总
产量是所属各乡村粮食实际入库量的汇总数,一个
工业主管局的总产值是所属各企业总产值的总和
等等 ;
(2)在一定的研究范围内指标和数量标志之间
存在着变换关系,当研究目的改变,原来的总体如
变为总体单位,则相应的统计指标就变为数量标志
了,反之亦然 。
三, 变异, 变量和变量值
可变标志在总体各个单位具体表现上的差别
就是变异,包括质 (性质, 属性 )的变异和量 (数值 )
的变异 。
一般来说, 变量就是可变的数量标志, 如工
人家庭人口数, 工人的工资等就是变量 。 变量的
数值表现就是变量值 。
量两种 。
统计总体具有同质性, 大量性和差异
性三个主要特点 。
1.同质性
2.大量性
3.差异性 (或称变异性 )
我国统计的任务和组织
第四节
一, 我国统计的任务
(一 )进行统计调查, 统计分析
(二 )提供统计资料和统计咨询意见
(三 )实行统计监督
二, 我国的统计组织
统计设计和
统计调查
第二章
内容提要
占有一定的统计资料是统计研究的基础。获得
高质量的统计资料的前提是统计设计。本章阐述
了统计设计的中心内容 (统计指标和统计指标体系
的设计 );统计设计一般原则;统计表及其设计;
统计调查方案;统计调查方法和组织方式,各种方
法的结合运用。根据统计研究任务要求,采用科学
的调查方式和方法搜集资料,是保证统计质量的基
本环节。目前,我国统计调查体系是以周期性普查
为基础,以经常性抽样调查为主体,以必要的统计
报表、重点调查、综合分析等为补充,搜集、整理
统计设计的概念和内容
第一节
一、统计设计的概念和意义
统计设计是根据统计研究对象的性质
和研究目的,对统计工作各个方面和各个
环节通盘考虑和安排,制定各种设计方案
的过程。
二、统计设计的种类
(一 )按统计设计所包括的研究对象的范围,可
分为整体设计和专项设计
整体设计,是以研究对象为一整体,对整个统计
工作进行的全面设计。
专项设计,是对研究对象的某一部分的统计设计。
(二 )按统计设计所包括的工作阶段,可分
为全过程设计和单阶段设计
全过程设计,是从确立统计任务、内容、
指标体系到分析研究的全过程的通盘安排。
单阶段设计,是就统计工作过程中的某一
阶段的安排,如统计调查的设计、统计整理
的设计、统计专题分析的设计等等。
(三 )按统计设计包括的时期,可分为长期设计、
短期设计和中期设计
长期设计是指五年以上的统计设计 ;
短期设计是一年或年度内的统计设计 ;
二三年的统计设计则可称为中期统计设计。
三、统计设计的内容
(一 )明确规定统计研究的目的和任务
(二 )确定统计指标和统计指标体系
(三 )确定统计分类和分组
(四 )研究设计统计表
(五 )确定统计分析研究的内容
三、统计设计的内容
(六 )制定统计调查方案
(七 )制定统计整理方案
(八 )规定各个阶段的工作进度和时间安排
(九 )考虑各部门和各阶段的配合与协调
(十 )统计力量的组织与安排
统计指标和指标体系的设计
第二节
一, 统计指标的概念和特点
(一 )统计指标的概念
统计指标反映总体现象的数量特征及其具体数
值 。 统计指标由六个要素构成
?指标名称
?计量单位
?计算方法
?时间限制
?空间限制
?指标数值
例如,2004年中国 GDP为 13.6万亿元人民币
(二 )统计指标的特点
1.数量性 。
2.综合性 。
3.具体性 。
二, 统计指标的种类
?绝对数与相对数的概念
绝对数是统计数据的基本表现形式, 现象的
总体规模和水平一般都以绝对数形式体现 。
比如:一个地区的总人口, 国内生产总值,
商品零售额等等都是绝对数 。
相对数是两个绝对数的比值, 反映事物的相
对数量 。 一般分为比例和比率两种形式 。 比
如人口统计中的性别比, 人口的出生率, 死
亡率, 自然增长率等等 。
(一 )统计指标按其表现形式不同, 可以分为
总量指标, 相对指标和平均指标
总量指标 是反映社会经济现象规模, 水
平或总量的指标,其数值表现为绝对数 。
相对指标 是表明两个有联系的统计指标
数值之比,是反映数量关系的指标,其数值表
现为相对数 。 平均指标 是同质总体内标志总
量与总体单位数相除的结果,表明总体各单位
标志值的一般水平的指标 。
(二 )统计指标按其说明的总体现象的内容不同,
可以分为 数量指标和质量指标
数量指标是反映社会经济现象的规模大小或数
量多少的统计指标,一般表现为总量指标, 绝对数,
如人口数, 企业数, 商品销售额等 。
质量指标是说明总体性质和数量关系,表明总
体的内部构成, 比例, 发展变化速度和一般水平的
指标,一般表现为相对指标和平均指标,其数值表现
为相对数和平均数, 如人口的性别构成, 出生率,
死亡率, 人口密度, 职工平均工资, 单位面积粮食
产量等等 。
(三 )统计指标按其反映事物的性质不同,
可分为实体指标和行为指标
实体指标是指它所反映的事物具有实物形
态,是客观存在的事物的量的特征, 如产品产量
指标, 劳动者人数指标, 固定资产价值指标等
等 。
行为指标是指它所反映的是某种行为的量
的特征, 如设备故障事故, 人员工伤事故, 违
法犯罪行为指标等等 。
(四 )统计指标按其数据取值依据不同,可分
为客观指标和主观指标
客观指标是指其取值依据,是对统计对象的
实际度量或计数,具有具体性和客观性,这类指
标多属实体指标,如产品产量, 劳动者人数等等 。
主观指标是指不可能或难以直接度量或计
数取值, 而只能凭人们的印象感受, 观察评价
确定其量的指标, 如民意测验, 对事物综合评
价等指标 。
(五 )统计指标按其在管理工作中的作
用不同, 可分为考核指标和非考核指标
考核指标是指用于定期或不定期检查,
评比, 考核用的指标 。
非考核指标是指不做考核用,主要是
用于了解情况和一般分析研究的指标 。
三, 统计指标体系的概念和种类
统计指标体系的概念
? 统计指标体系是一系列相互联系、相互制
约的统计指标所组成的整体。
指标体系的形式
? 加法模式
指标体系数值 =各个相关指标数值之和
例如:某产品的制造成本 =原材料消耗 +人
工费用消耗 +制造费用 +其他支出
公共收入 =税收收入 +公共收费 +公债 +国有
资产收益 +其他收入
? 乘法模式
指标体系数值 =各个相关指标数值之积
例如,
应纳所得税额 =应纳税所得额 *相应税率
原材料消耗费用 =产品产量 *单位产品原材料
消耗量 *单位原材料价格
四, 统计指标体系的设计原则
(一 )科学性原则
(二 )目的性原则
(三 )联系性原则
(四 )统一性原则
(五 )可比性原则
统计表及其设计
第三节
一,
(一 )统计表的意义
(1)能使统计资料的排列条理化, 系统
化, 标准化,一目了然 ;
(2)能科学地, 合理地组织统计资料,
便于阅读, 对照比较和分析 。
(二 )统计表的构成
从形式上看,统计表主要由总标题, 横
行标题, 纵栏标题和指标数值四部分组成
二, 统计表的种类
(一 )按用途, 统计表分为调查表, 汇总表
和分析表
1.调查表 。
它是指在统计调查中用于登记, 搜集原始
统计资料的表格 。
2.汇总表或整理表 。
它是在统计汇总或整理过程中用于表现统
计汇总或整理结果的表格, 如各种汇总表, 统
计台账, 手册, 年鉴等 。
3.分析表 。
它是在统计分析中用于对整理所得的统计
资料进行定量分析的表格 。
(二 )按统计数列的性质,统计表分为空间
数列表, 时间数列表和时空数列结合表
1.空间数列表 。
它是反映在同一时间条件下,不同空间范
围内的统计数列的表格,用以说明静态条件下
社会经济现象在不同空间的数量分布,又称静
态表 。
2.时间数列表 。
它是反映在同一空间条件下不同时间的
统计数列的表格 。
3.时空数列结合表 。
它是同时反映上述两方面内容的统计表 。
既说明社会经济现象在不同空间的数量分布,
又说明它们在不同时间上的数量变动 。
(三 )按分组情况,统计表分为简单表, 简单
分组表和复合分组表
1.简单表 。
2.简单分组表 。
3.复合分组表 。
三, 统计表的设计
(一 )统计表设计的一般原则和要求
1.总标题和纵横标目 (题 )能准确, 简明扼要
地反映统计资料的内容 。
2.纵, 横栏的排列内容要对应,尽量反映它们
的逻辑关系 。
3.根据统计表的内容,全面考虑表的布局,合
理安排主体栏和叙述栏,避免出现统计表过长, 过
短, 过宽, 过窄的现象,使表的大小适度, 比例恰
当, 醒目美观 。
4.统计表中的指标数值,都是有计量单位的,
必须标写清楚 。
5.统计表中的横线要清晰,顶线和底线要粗些,
各部分的界限宜粗些,其他线条要细些,表
的左右侧可不划封口线 。
6.当表的栏数较多时,要统一编写序号,一般
是主体栏部分用甲, 乙, 丙等文字表明,叙述栏部
分用 (1),(2),(3)…… 等数字编号 。
(二 )
(三 )整理表的设计
(四 )分析表的设计
统计调查的概念和种类
第四节
一, 统计调查的概念, 地位和要求
(一 )统计调查的概念
统计调查,就是根据统计研究的目的, 要求和
任务,运用各种科学的调查方法,有计划, 有组织地
搜集有关现象的各个单位的资料,对客观事实进行
登记,取得真实可靠的调查资料的活动过程 。
(二 )统计调查的地位
(三 )统计调查的要求
二, 统计调查的种类
(一 )按调查对象包括的范围不同,可分
全面调查是指对调查中的全部单位,无
一例外都进行登记或观察 。
非全面调查,是指只对调查对象总体中的
一部分单位进行登记或观察 。
(二 )按调查登记时间是否有连续性,可分为经
经常性调查,就是按研究现象不断变化,而连
续不断地进行登记或观察,以反映事物在一定时期
内的全部发展过程 。
一次性调查,就是对被研究现象在某一时刻
(或瞬间 )的状况进行一次性登记,以反映事物在一
定时点上的发展水平 。
(三 )按组织方式不同,可分为统计报表和专门
调查
统计报表是按照统一规定的表式要求,自上
而下地统一布置, 自下而上地统一提供统计资料
的一种调查组织方式 。
专门调查是为研究某些专门问题,由进行调查
的单位专门组织的调查,这种调查属一次性调查,
如人口普查, 劳动力调查, 科技普查等 。
(四 )按搜集资料的方法不同,可分为直接观
察法, 访问调查法, 报告报表法, 问卷调查法,
1.直接观察法 。 2.访问调查法 。
3.报告报表法 。 4.问卷调查法 。
5.卫星遥感法 。 6.互联网调查法 。
统计调查方案
第五节
一, 确定调查目的和任务
二, 确定调查对象和调查单位
三, 确定调查项目,设计调查表式
(一 )确定调查项目
(二 )拟订调查表式
四, 确定调查的时间, 空间和方法
五, 制订调查工作的组织实施计划
第六节
一, 普查
(一 )普查的意义
普查是根据统计任务的特定目的 (如为
详细了解国情, 国力 )而专门组织的一次性全
面调查 。
普查是一种很重要的调查方式方法,是其
他方式不可代替的 。
(二 )普查的组织
1.要紧紧依靠各级党委和人民政府的统一领导;
2.要依靠群众,走群众路线;
3.要先进行试点,总结经验,再全面开展;
4.要组织和培训普查队伍;
5.要制定周密的工作规程,以使工作有序进行;
6.要对普查工作的各环节进行严格的质量控制 。
1.要确定一个统一的调查时点,也叫标准时间,
所有调查资料都必须反映这一时点上的状况 。 标准
时间的选择,要根据研究对象性质和实际条件来决
定 。
2.在普查范围内的各调查单位或调查点要同
时行动,在方法, 步调上保持一致,要力求在最短的
期限内完成,以保证调查材料的时效性,避免发生重
复或遗漏 。
3.普查项目要有统一的规定,不能任意改变或
增减,以免影响汇总和综合,降低资料质量 。 性质相
同的普查,其各个时期的普查项目也应尽可能保持
相同,便于对比分析 。
4.根据普查任务,选择最适当的普查时间 。 普
查时间的间隔,应当尽可能保持一定的周期,以便进
行动态分析,观察现象的发展变化情况及其规律性 。
二, 抽样调查
抽样调查是按随机原则,从总体中抽选
部分单位进行观察,并根据这部分单位的调
查材料,从数量方面推断总体指标的一种非
全面调查 。
三, 统计报表
统计报表是依照国家有关法规的规定,
自上而下地统一布置,以一定的原始记录为
依据,按照统一的表式,统一的指标项目,统
一的报送时间和报送程序,自下而上地逐级
定期提供基本统计资料的一种调查方式 。
(一 )统计报表的特点
1.统计报表可以根据研究任务事先布置到基层
填报单位,基层单位可以根据报表的要求,建立健全各
种原始记录 。
2.由于统计报表是逐级上报, 汇总,各级领导部
门都能得到管辖范围内的统计报表资料,可以经常了
解本地区, 本部门经济和社会发展情况 。
3.由于统计报表属于经常性调查,内容相对稳定,
有利于经常搜集和积累资料,可以系统进行历史资料
的对比,研究经济建设和社会发展变化的规律性 。
(二 )统计报表的种类
1.按调查范围不同,统计报表分为全面
调查的统计报表和非全面调查的统计报表 。
2.按报送周期不同,统计报表分为定期
报表和年报 。
3.按报送的方式不同,统计报表分为邮
寄和电讯两种 。
4.按填报单位不同,统计报表分为基层报
表和综合报表 。
5.按实施的范围不同,统计报表分为国家
统计报表, 部门统计报表和地方统计报表 。
6.按性质和内容不同,统计报表分为基本
统计报表和专业统计报表 。
(三 )统计报表制度
(四 )统计报表资料来源
四, 重点调查
(一 )重点调查的意义
重点调查,是指在调查对象中,只选择一
部分重点单位而进行的非全面调查 。
重点调查对于领导及时了解情况,掌握基
本趋势指导全局有重要的作用 。
(二 )
五, 典型调查
典型调查是根据调查目的和要求,在对
所研究总体全面分析的基础上,有意识地从
中选择少数具有典型性的单位进行深入调
查研究的一种非全面调查 。
典型调查的特点是,
(1)调查单位是根据调查目的有意识选择出来
的少数具有典型性的单位,便于从典型入手,逐步
扩大到认识事物的一般性和普遍性 。
(2)典型调查单位少,调查方法可以机动灵活,
省时省力,提高调查效果 。
(3)典型调查是一种深入, 细致的调查,通过
深入细致的调查,既可以搜集有关数字资料,又可
以掌握具体, 生动的情况,探索事物发展变化的规
律性 。
典型调查的主要作用是,
(1)可用以研究新生事物,抓住苗头,认
真地进行调查研究,探索它们的发展方向,形
成预见,加以推广;
(2)可以补充全面调查的不足;
(3)可以利用典型资料,结合基本统计数
字,估计推算有关数据 。
六, 其他调查和综合分析方法
七, 各种调查组织方式的结合运用
八, 统计调查误差及其防止
(一 )统计调查误差的概念和种类
统计调查误差,就是调查结果所得的统计数
字与调查总体实际数量表现的差别 。 统计调查误
差有两种,一种是登记误差,一种是代表性误差 。
(二 )统计调查误差的防止
统计整理
第三章
内容提要
本章主要阐述了统计整理的意义;统
计整理在整个统计工作中的重要作用;统
计整理的基本步骤和方法;统计分组的作
用和分组方法;统计汇总的组织与技术;
统计整理的意义和步骤
第一节
统计整理在整个统计工作中起着承前启后
的重要作用,它既是统计调查的继续,
又是统计分析的前提。
二、统计整理的原则和步骤
(一 )设计和编制统计资料整理方案
(二 )
(三 )对原始资料进行统计分组和统计汇总
(四 )编制统计表或绘制统计图
统计分组
第二节
一, 统计分组的概念
统计分组是根据所研究事物的特点和统
计研究的目的,按照某一标志将统计总体划分
为若干个组成部分的一种统计方法 。
二, 统计分组的作用
(一 )区分现象质的差别点 。
(二 )反映现象总体的内部结构
(三 )分析现象之间的相互依存关系
三, 统计分组的方法
(一 )正确选择分组标志
1.根据统计研究的目的选择分组标志 。
2.选择最能反映事物本质特征的标志进行
分组 。
3.选择分组标志时,要考虑到现象发展的
历史条件和经济条件 。
(二 )按品质标志或按数量标志分组
1.按品质标志分组 。
2.按数量标志分组 。
(三 )简单分组和复合分组
1.简单分组 。 简单分组是指对所研究的总体
按一个标志进行分组 。
2.复合分组 。 复合分组是指对所研究的总体
按两个或两个以上的标志进行的多层次分组 。
次数分布
第三节
一, 次数分布的概念
次数分布是指将总体中的所有单位按某个标志
分组后,所形成的总体单位数在各组之间的分布 。
分布在各组的总体单位数叫做次数或频数 。
根据分组标志特征的不同,次数分布数列可
以分为品质分布数列和变量分布数列 。
按品质标志分组形成的次数分布数列叫品
质分布数列,简称品质数列 ;
按数量标志分组形成的次数分布数列叫变
量分布数列,简称变量数列 。
二, 变量数列的种类
(一 )单项变量数列
单项变量数列是按数量标志分组后,用
一个变量值代表一个组形成的数列 。
(二 )组距变量数列
组距变量数列是按照数量标志分组后,
用变量值变动的一定范围 (即组距 )代表一
个组所形成的数列 。
组距=上限-下限
( 上限+下限 )÷ 2
缺下限的最小组的组中值
=上限-相邻组的组距 ÷ 2
缺上限的最大组的组中值
=下限+相邻组的组距 ÷ 2
图 3— 1 某地区商业企业销售收入次数分布曲线图
三, 变量数列的编制
(一 )将原始资料按数值大小依次排列
(二 )确定组数 (k)和组距 (i)
k=1+3.322logn [ 公式 3— 1]
i= R/k
[ 公式 3— 1] 称为斯德吉斯 (H.A.Sturges)
组数公式 。 上述公式中, n为数据个数,R为全
距 。
定组距和组数应考虑下列原则,
1.要尽量能反映出总体单位的分布情况
及总体单位的集中趋势 ;
2.要尽可能区分出组与组性质上的差异 。
(三 )确定组限和组限的表示方法
1.最小组的下限要略低于最小变量值,最大
组的上限要略高于最大变量值 ;
2.组限的确定应当有利于表现总体单位分布
的规律性 ;
3.对于等距数列,如果组距是 5,10,…,100,…,
则每组的下限最好是它们的倍数 。
四, 次数分布的主要类型
(一 )钟形分布
图 3— 2 钟形分布图
(二 )U形分布
图 3— 3 U形分布图
(三 )J形分布
图 3— 4 正、反 J形分布图
统计汇总的组织、技术与
现代化
第四节
一, 统计汇总的组织形式
(一 )逐级汇总
(二 )集中汇总
(三 )综合汇总
二, 统计汇总的审核
三, 统计汇总的技术与现代化
(一 )手工汇总法
1.划记法 。
2.过录法 。
3.折叠法 。
4.卡片法 。
(二 )机械汇总法
1.明确所要编制的程序的目的, 即确定程序要完
成些什么功能 。 它完全取决于统计汇总的目的和要求 。
2.进行技术准备工作, 就是要掌握准备采用的电
子计算机语言 。
3.进行可行性分析 。
4.根据汇总方案画出 程序框图 。
5.进行代码设计, 就是对事物进行编码 。
6.编写程序 。
7.程序调试及运行 。
图 3— 5 程序功能框图
总量指标和
相对指标
第四章
内容提要
综合指标法是利用统计指标对所研究
对象进行深入分析研究,揭示其特征和规
律性的方法。根据作用、表现形式的不同,
统计指标可以分为总量指标、相对指标和
平均指标。本章阐述了总量指标的概念、
作用和种类;相对指标的概念、作用、种
类和计算方法;计算和运用总量指标和相
第一节
总量指标是反映一定时间、地点和条件下
某种现象总体规模或水平的统计指标。
1.它可用来反映一个国家、地区、部门或
单位的基本状况。
2.它是制定政策、编制计划、进行科学管
理的重要依据。
3.它是计算相对指标和平均指标的基础。
二、总量指标的种类
(一 )总量指标按其说明总体内容不同,分
为总体单位总量和总体标志总量
总体单位总量简称单位总量,它表示总
体本身的规模大小,是统计总体单位的合计数 ;
总体标志总量简称标志总量,它是反映
总体单位某种标志值总和的总量指标。
(二 )总量指标按其反映的时间状况不同,
分为时期指标和时点指标
时期指标反映现象在一段时期内发展过
程的总数量,如产品产量、商品销售额、国内
生产总值等。
时点指标表示现象在某一时刻上的状态,
如人口数、商品库存额、固定资产原值等。
(三 )总量指标按其采用的计量单位不同,分为实
物指标、价值指标和劳动指标
度量衡的、物理的或化学的计量单位计算的总量指标,
如人口数、粮食产量、发电量分别以, 人,,, 吨,,
,千瓦时, 为计量单位等。
价值指标是以货币为单位计算的总量指标,如增
加值、产品销售收入、工商税收等。
相对指标
第二节
一, 相对指标的概念和表现形式
相对指标是说明现象之间数量对比关系
的指标, 用两个或两个以上有联系的指标数
值对比来求得, 其结果表现为相对数, 故也
将相对指标称为相对数 。
相对指标有无名数和有名数两种表现形
式 。
二, 相对指标的作用
利用相对指标, 可以较清楚地反映现象内
部结构和现象之间的数量联系程度, 对现象进
行更深入地分析和说明 。
, 利用相对指标可以使某些不能直接
对比分析的统计指标, 取得可以比较的基础 。
三,
(一 )结构相对指标
[公式 4— 1]
总体全部数值
总体部分数值
结构相对指标 ?
[ 例 4— 1] 我国 2002年的农, 林, 牧, 渔业总产值
为 27 390.8亿元, 其中农业产值 1 4931.5亿元, 林业
产值 1 033.5亿元, 牧业产值 8 454.6亿元, 渔业产值
2 971.1亿元, 求结构相对指标 。
农, 林, 牧, 渔业的产值在总产值中所占的比重为,
农业 14 931.5÷ 27 390.8× 100%= 54.51%
林业 1 033.5÷ 27 390.8× 100%= 3.77%
牧业 8 454.6÷ 27 390.8× 100%= 30.87%
渔业 2 971.1÷ 27 390.8× 100%= 10.85%
结构相对指标有两个主要作用,
(1)利用结构相对指标, 对事物的内部结构进行
分析, 不仅可以说明事物的性质和特征, 还能够反映
事物发展的不同阶段和量变引起质变的过程 。
(2)利用结构相对指标, 可以反映事物总体的质
量或工作的质量, 反映人力, 物力和财力的利用情况 。
(二 )比例相对指标
的数量对比关系的相对指标 。 计算公式为
[公式 4— 2]
总体中另一部分的数值
总体中某一部分的数值比例相对指标 ?
[ 例 4— 2] 根据第五次全国人口普查的快速汇总结
果, 中国大陆 31个省, 自治区, 直辖市人口和现役军
人人口中, 男性为 65 355万人, 占总人口的 51.63%;
女性为 61 228万人, 占总人口的 48.31%。 性别比为
106.74∶ 100.00(65 355∶ 61 288)。
计算结果是比例相对指标, 它表明了 2000年我
国人口中的性别比例 。
[ 例 4— 3] 利用 [ 例 4— 1] 的资料求比例相对指标 。
14 931.5÷ 1 033.5= 14.45
8 454.6÷ 1 033.5= 8.18
2 971.1÷ 1 033.5= 2.87 即农业,
林业, 牧业, 渔 业 产 值 之 间 的 比 例 为
14.45∶ 1∶ 8.18∶ 2.87。
(三 )比较相对指标
[公式 4— 3]
数值另一条件下的同类指标
值某条件下的某类指标数比较相对指标 ?
[ 例 4— 5] 1999年中国的棉花产量为 383万吨, 美国
的棉花产量为 369万吨 。
比较相对指标= 383÷ 369= 1.04
它表明中国的棉花产量是美国的 1.04倍 。
(四 )动态相对指标
动态相对指标是表明某类现象在不同时间上的
指标数值对比关系的相对指标, 用以说明现象发展变
化的方向和程度 。 计算公式为,
[公式 4— 4]
基期水平
报告期水平动态相对指标 ?
[ 例 4— 6] 我国的汽车产量 (万辆 )1978年为 14.91,1990年
为 51.40,1995年为 145.27,2000年为 207.00,2002年为
325.10。 求动态相对指标 。
动态相对指标分别为,
325.10÷ 14.91= 21.80
325.10÷ 51.40= 6.32
325.10÷ 145.27= 2.24
325.10÷ 207.00= 1.57 计算结果表明, 我国的汽车产量
在改革开放 20多年内增长了 20.80倍, 近 10多年增长了 5.32倍,
近 7年来增长了 1.24倍, 2002年比 2000年增长了 57%。
(五 )强度相对指标
,但有一定联系的总
量指标数值之比 。 计算公式为,
[公式 4— 5]
的总量指标数值另一有联系而性质不同
某一总量指标数值强度相对指标 ?
[例 4— 7] 2000年第五次全国人口普查, 中国大陆 31个
省, 自治区, 直辖市 (不包括福建省的金门, 马祖等岛
屿 )人口和现役军人的人口 126 583万人, 国土面积为
960万平方公里, 求强度相对指标 。
人口密度= 126 583 ÷ 960= 132(人/平方公里 )
[ 例 4— 8] 2004年某地区有医院, 卫生院 669个,
医生 2.04万人, 医院床位数 2.92万张, 人口 1 259万
人, 求强度相对指标 。
每千人口医生数= (2.04÷ 1 259)× 1 000=
1.62(人 )
每千人口医院床位数= (2.92÷ 1 259)× 1 000=
2.32(张 )
平均每一医院服务人口数
= (1 259× 10 000)÷ 669= 18 819(人 )
在实践中, 强度相对指标主要有三个作用,
1.强度相对指标能够说明社会经济现象的强弱
程度, 因而被广泛地用于反映一个国家或地区的经济
发展水平的高低和经济实力的强弱 。
2.强度相对指标还可以用来反映现象的密度或
普遍程度, 如人口密度, 商业网密度等 。
3.强度相对指标还可以反映社会生产活动的条件
或效果 。
(六 )计划完成情况相对指标
[公式 4— 7]
%1 0 0??
计划任务数
实际完成数
计划完成情况相对指标
1.计划数为绝对数时, 计划完成情况相对指标的计算
公式为,
[公式 4— 8]
%1 0 0??
计划水平
实际水平
计划完成情况相对指标
2.计划数为平均数时, 计划完成情况相对指标的计算
公式为,
[公式 4— 9]
%100??
计划平均水平
实际平均水平
计划完成情况相对指标
3.计划数为相对数时, 计划完成情况相对指标的计算
公式为,
[公式 4— 10]
)计划任务数(
)实际完成数(
计划完成情况相对指标
%
%
?
[ 例 4— 10] 某企业计划规定 2004年的劳动生产率
要比 2000年提高 4%,实际执行结果是提高 5%,求计划
完成情况相对指标 。
该企业劳动生产率计划完成情况为,
计划完成情况相对指标
= (100%+ 5%) /100%+ 4%× 100%
= 105%/104%× 100%= 100.96%
[ 例 4— 11] 某企业计划规定 2004年的可比产品成本
比 2000年降低 5%,实际执行结果是可比产品成本降低
了 6%,求计划完成情况相对指标 。
该企业可比产品成本计划完成情况为,
计划完成情况相对指标
= (100%- 6%) /( 100%- 5%)× 100%
= (94%/95%)× 100%= 98.95%
[公式 4— 11]
%100??
全期计划任务数
数累计至本期止实际完成
计划执行进度指标
计划完成情况的检查, 可分为长期计划检查和短期计
划检查两种 。 依计划任务数的规定不同, 检查长期计
划的完成情况又有水平法和累计法两种方法 。
1.水平法 。
%1 0 0??
如末年)水平长期计划规定的末期(
)实际达到的水平长期计划末期(如末年
情况相对数
长期计划完成
[公式 4— 12]
[ 例 4— 12] 某企业, 九五, (1996— 2000年 )期间规定甲种
产品产量 2000年达到 200万吨, 2000年实际达到 210万吨 ;实际
执行结果是到 2000年 8月止, 就达到了 200万吨的产量, 求计划
完成程度以及提前完成计划的时间 。
该企业甲产品产量的五年计划完成情况相对指标为,
甲产品计划完成程度
= (210/200)× 100%
= 105%
甲产品的五年计划任务于 2000年 8月完成, 提前了 4个月 。
2.累计法 。
%1 0 0??
本期计划任务数
的累计数长期计划期间实际完成
情况相对数
长期计划完成
[公式 4— 13]
[ 例 4— 13] 某企业, 九五, 计划规定基本建设投资总额为 1
500万元, 五年实际累计完成投资额为 1 540万元, 求计划完成
情况相对指标 。
该企业五年基本建设投资计划完成程度为,
计划完成程度= (1540/1500)× 100%= 102.7%
按累计法计算提前完成计划的时间, 是将计划期的全部时
间减去自执行计划之日起至累计完成计划的时间 。 假如上例中
该企业于 2000年 8月底实际完成的累计投资额已达 1500万元,
则该企业提前完成计划的时间为, 60- 56= 4(月 )
即该企业提前 4个月完成了五年计划 。
计算和运用总量指标、相对指
标的原则
第三节
一, 计算和运用总量指标的原则
(一 )在计算实物指标时, 应注意现象的同类
性
(二 )统计总量指标时要有明确的统计含义和
合理的统计方法
(三 )统一计量单位
二, 计算和运用相对指标的原则
三, 相对指标和总量指标结合运用的
原则
平均指标和
变异指标
第五章
内容提要
本章包括平均指标和变异指标两部分内
容,阐述了平均指标的概念和作用;各种
平均数的计算原则、方法与应用条件;主
要的平均指标 (算术平均数、调和平均数、
几何平均数、众数和中位数 );变异指标的
作用、计算方法和运用条件;主要的变异
指标 (全距、平均差、标准差及其系数 )。
第一节
平均指标,是同类社会经济现象总体内
各单位某一数量标志在一定时间、地点和条件
下数量差异抽象化的代表性水平指标,其数值
表现为平均数。
二、平均指标的作用
(一 )利用平均指标,可以了解总体次数分布的集
(二 )利用平均指标,可以对若干同类现象在不同
单位、地区间进行比较研究
(三 )利用平均指标,可以研究某一总体某种数值
的平均水平在时间上的变化,说明总体的发展过程和
趋势
二、平均指标的作用
(四 )利用平均指标,可以分析现象之间
的依存关系
(五 )平均指标可作为某些科学预测、决策
和某些推算的依据
算术平均数
第二节
一, 算术平均数的基本形式
[公式 5— 1]
总体单位总数
总体标志总量算术平均数 ?
二, 算术平均数的计算方法
(一 )简单算术平均数
总体单位总数总体标志数值之总和简单算术平均数 ?
用符号表示,
[公式 5— 2]
n
X
n
XXXXX n ??????? ?321
[ 例 5— 1] 某机械厂某生产班组有 10名工人, 生产
某种零件, 每个工人的日产量分别为 45件, 48件, 52
件, 62件, 69件, 44件, 52件, 58件, 38件, 64件 。
试用简单算术平均数法计算工人平均日产量 。
(件)2.53
10
532
10
64385852446962524845
?
?
?????????
?
?
?
n
X
X
(二 )
各组单位数的总和 位数乘积的总和各组标志数值与该组单
加权算术平均数
?
用符号表示,
[公式 5— 3]
1 1 2 3 3
2 n
n
X
X f X f X f X f
n
Xf
f
? ? ? ?
?
?
?
?
[ 例 5-3]
(元)
工人月平均工资
50.1 7 2 7
2 0 0 0
3 4 5 5 0 0 0
?
?
?
?
n
Xf
X
三, 算术平均数的几个主要数学性质
(一 )平均数与次数和的乘积等于所有变
量值 (数量标志值 )的总和 。
(二 )所有变量值与平均数的离差之和等
于零 。
(三 )各个变量值与平均数离差平方之和
为最小 。
调和平均数
第三节
一, 调和平均数的概念
调和平均数是平均数的一种, 它是根
据变量值的倒数计算的, 是变量值倒数
的算术平均数的倒数, 故又称倒数平均
数 。
二, 简单调和平均数
X
n
XXXX
n
H
n
11111
321 ?
?
????
?
?
[公式 5— 5]
三, 加权调和平均数
[公式 5— 6]
X
m
X
m
X
m
X
m
X
m
mm
H
n
n
nmm
1
321
321
321
?
?
?
????
?
?
??
?
?
[ 例 5-4]
(元)
)为:平均每千克(
39.55
1020
56500
???
?
?
X
m
m
H
H
几何平均数
第四节
一, 几何平均数的概念和特点
几何平均数不同于算术平均数和调和
平均数, 是 n个变量值连乘积的 n次方根,
是计算平均比率和平均速度时比较适用的
一种方法, 符合人们的认识规律 。
二, 几何平均数的计算方法
(一 )简单几何平均数
[公式 5— 7]
nn n XXXXXG ?????? ?321
[ 例 5— 5]
%93.91%87%91%93%97
4
?????
? ?n X
G
(二 )加权几何平均数
[公式 5— 8]
??
????
?
???
f f
fnfff fn
n
fff
X
XXXX
G
?
?
321 3
3
2
2
1
1
[ 例 5— 6]
求反对数得本利率,G= 103.75%
平均年利率= 103.75%- 100%= 3.75%
这就是说, 25年间的年平均本利率为 103.75%,
年平均利率为 3.75%。
0 1 6 0 0.2
25
4 0 0 0 2.50
lg
lg ???
?
?
f
Xf
G
众数和中位数
第五节
一, 众数
在观察某一总体时, 最常遇到的标志值, 在
统计上称为众数 。
下限公式,
iL
i
ffff
ff
LM
?
???
?
??
?
???
?
??
??
?
21
1
)10)10
)10
0
((
(
[公式 5— 9]
上限公式,
iU
i
ffff
ff
UM
?
???
?
??
?
???
?
??
??
?
21
1
)10)10
)10
0
((
(
[公式 5— 10]
二, 中位数
2/)(
2
1
2
??? nn XXMe
1
2
n
M e X
?
?
(n为偶数 )
(n为奇数 )
正确计算和运用
平均指标的原则
第六节
(一 )必须注意所研究社会经济现象的同质性
(二 )必须注意用组平均数补充说明总平均数
(三 )
(四 )必须注意一般与个别相结合, 把平均数和
典型事例结合起来
(五 )平均指标要与变异指标结合运用
标志变异指标
第七节
一, 标志变异指标的概念和作用
(一 )
标志变异指标是反映统计数列中以平均数为
中心, 总体各单位标志值的差异大小范围或离差
程度的指标 。
(二 )标志变异指标的作用
1.标志变异指标可以衡量平均数代表性的大小 。
2.标志变异指标可以反映社会经济活动过程的
节奏性和均衡性 。
3.标志变异指标可以反映总体单位标志值的均
匀性和稳定性 。
4.标志变异指标是科学地确定必要的抽样单位
数应考虑的重要因素 。
二, 标志变异指标的计算方法
(一 )变异全距
变异全距=最大标志值-最小标志值
[公式 5— 13]
变异全距=最高组上限-最低组下限
[公式 5— 14]
(二 )平均差
1.如果掌握的是未经分组的 (原始数列 )
资料, 则采用简单算术平均式 。
[公式 5— 15]
n
XX
DA ?
?
?..
[例 5-11]
(件)
第二组平均差为
(件)
第一组平均差为
6.7
10
76
..
28
10
280
..
??
?
?
??
?
?
?
?
n
XX
DA
n
XX
DA
2.如果掌握的资料是分组数列时, 则应
采用加权算术平均式 。
[公式 5— 16]
?
? ?
?
f
fXX
DA,.
[例 5-12]
(箱)965.0
1 0 0 0
965
..
??
?
?
?
?
f
fXX
DA
(三 )标准差
1.简单平均式 。
[公式 5— 17]
? ?
n
XX? ?
?
2
?
2.加权平均式 。
[公式 5— 18]
? ?
?
? ?
?
f
fXX
2
?
3.是非标志的标准差 。
[公式 5— 19]
)1( pppq ????
(四 )标准差系数
[公式 5— 20]
X
V
?
? ?
动态数列
第六章
内容提要
动态分析是统计分析方法之一,其依据是动态
数列。本章阐述了动态数列的概念、作用、种类
和编制原则;总量指标、相对指标和平均指标三
种动态数列 (其中总量指标动态数列是基础 );动
态分析的水平和速度指标 (平均发展水平、平均增
长量、平均发展速度和平均增长速度 );测定事物
变动长期趋势的主要方法 (时距扩大法、序时平均
法、移动平均法和直线配合法 );直线配合法的常
用方法;测定季节变动的主要指标。
动态数列的一般问题
第一节
一、动态数列的概念
把反映某种现象的同一指标,在不同时间
上的指标数值,按时间 (如按年、季、月、日
等 )先后顺序编排所形成的数列,称为动态数
列或时间数列,又称时间序列。
二、动态数列的种类
(一 )总量指标动态数列
1.时期数列。
2.时点数列。
(二 )相对指标动态数列
(三 )平均指标动态数列
1.静态平均数动态数列。
2.序时平均数动态数列。
三、编制动态数列的原则
(一 )总体范围应一致
(二 )指标的内容应相同
(三 )时期数列的时期长短应一致,时期数列
和时点数列的间隔力求一致
(四 )指标的计算方法、计算价格和计量单位
动态数列的水平指标
第二节
一, 发展水平和平均发展水平
(一 )发展水平
发展水平是动态数列中与其所属时间相
对应的反映某种现象发展变化所达到的规模,
程度和水平的指标数值, 通常指总量指标,
也可指相对指标和平均指标的数值 。
(二 )平均发展水平
将一个动态数列各期发展水平加以平均
而得的平均数, 叫平均发展水平, 又称为动
态平均数或序时平均数 。
(三 )序时平均数的计算方法
1.总量指标动态数列序时平均数的计算 。
(1)时期数列序时平均数的计算 。
[公式 6— 1
n
a
n
aaaaa nnn ??????? ? 121 ?
[ 例 6— 1] 依 [ 公式 6— 1] 计算得,
(万元)16.176
12
2 1 8, 4+1 9 5, 0+1 9 6, 0+1 9 8, 9+1 8 6, 2+1 7 0, 2+1 7 7, 6+1 6 0, 2+1 6 4, 5+1 5 4, 7+1 4 8, 2+1 4 4, 0
?
?
a
(2)时点数列序时平均数的计算 。
[公式 6— 2
?
?
?
????
????
?
?
??
t
ta
tttt
tatatata
a
nn
nn
nnnn
n
121
112211
?
?
[公式 6— 3
.
1 2 1
1
1
2
/ 2 / 2
1
( ) / 2
1
nn
n
ni
i
a
a a a a
n
a a a
n
?
?
?
? ? ? ?
?
?
??
?
?
?
[公式 6— 4
2 3 112
1 2 1
1 2 1
1
1
1
1
1
2 2 2
2
nn
n
n
n
ii
i
i
n
i
i
a
a a a aaa
t t t
t t t
aa
t
t
?
?
?
?
?
?
?
?
???
? ? ? ? ?
?
? ? ?
?
?
?
?
?
2.相对指标动态数列序时平均数的计算 。
(1)若两个相关的总量指标动态数列均为
时期数列 。
[公式 6— 5]
? ??? ??? banb nabac ///
(2)若两个相关的总量指标动态数列均为
时点数列 。
(3)若两个相关的总量指标动态数列, 一
个是时期数列, 另一个是时点数列 。
3.平均指标动态数列序时平均数的计算 。
二,
(一 )增长量
增长量=报告期水平-基期水平
[公式 6— 8]
逐期增长量之和
=(a1-a0)+(a2- a1)+(a3- a2)+… +(an-an-1)
=∑( ai- ai-1)= an - a0
两个相邻累计增长量之差
=(ai - a0)-(ai-1- a0)= ai - ai-1
(二 )
平均增长量是某种现象各逐期增长量的
序时平均数, 它表明该现象在一定时期
内, 单位时间平均增长的绝对量 。
动态数列的速度指标
第三节
一, 发展速度和增长速度
(一 )发展速度
发展速度是将现象报告期水平除以基期水
平 求得的表明某种现象发展程度的相对指
标 。
发展速度=报告期水平 ÷ 基期水平
[公式 6— 9]
?发展速度通常用百分数表示,它说明现象
报告期水平为基期水平的百分之几。
?由于采用的基期不同,发展速度可分为 环
比发展速度 和 定基发展速度 。
? 环比发展速度 =
1
i
i
a
a ?
?
报告期水平
前一期水平
? 定基发展速度 =
0
ia
a
?
报告期水平
某一固定基期水平
312
0 1 2 1 0
1
0 0 1
nn
n
i i i
i
a a aaa
a a a a a
a a a
a a a
?
?
?
? ? ? ? ? ?
? ? ?
各期环比发展
速度的连乘积
两个相邻定基
发展速度之比
(二 )增长速度
增长速度是某种现象报告期的增长量与基期水
平之比, 表明该现象增长程度的相对指标 。
[公式 6— 10]
1
?
?
?
??
报告期增长量
增长速度
基期水平
报告期水平 基期水平
基期水平
报告期水平
基期水平
[公式 6— 11]
1
?
?
?
??
环比 报告期逐期增长量
增长速度 前一期水平
报告期水平 前一期水平
前一期水平
环比
发展速度
[公式 6— 12]
1
?
?
?
??
定基 报告期累计增长量
增长速度 固定基期水平
报告期水平 固定基期水平
固定基期水平
定基
发展速度
[公式 6— 13]
(以百分点表示)报告期的环比增长速度
报告期的逐期增长量
的绝对值增长
?
%1
二, 平均发展速度和平均增长速度
(一 )平均发展速度和平均增长速度的概念
平均发展速度, 是某种现象各期环比发展速
度的平均数, 它表明该现象在一个较长时期内,
平均单位时间发展变化的程度 。
平均增长速度是某种现象各期环比增长速度
的平均数, 它表明该现象在一个较长时期内, 平
均单位时间增长的程度 。
(二 )平均发展速度的计算
1.几何平均法 (水平法 )。
[公式 6— 14]
n nn
n
n
a
a
a
a
a
a
a
a
a
aX
012
3
1
2
0
1 ??????
?
?
[公式 6— 15]
nn n XXXXXX ??????? ?321
[公式 6— 16]
[公式 6— 17]
n RX ?
n mX 2?
2.高次方程法 (累计法 )。
[公式 6— 18]
解此高次方程所得的正根,即为所求的平
均发展速度。
0
0
231 ??????? ??
a
a
RRRRR nn ?
长期趋势和季节变动
第四节
一, 长期趋势的分析
(一 )长期趋势的概念
长期趋势, 是指某种现象在相当长的
时期内, 发展过程表现为不断增长或不断
下降的总趋势 。
(二 )长期趋势分析法
1.时距扩大法 。
2.序时平均法 。
3.移动平均法 。
4.直线配合法 。
(1)半数平均法 。
btay c ??
[公式 6— 19]
? ? 0??? cyy
[公式 6— 20]
0
0
0
]026[1 9 ]6[
???
???
???
? ??
?
tbay
n
btay
btay
除上式后得:用
即
)(
:—公式代入—公式将
[ 公式 6— 21]
? ?
? ?
??
?
?
?
??
??
???
??
? ??
? ?
?
?
2
2
2
tbtaty
tbnay
btay
yy
c
式:导出下列两个标准方程根据数学预算,上式可
最小值)(
最小值
(2)最小平方法
? ?
?
?
?
?
?
?
?
????
?
?
?
??
? ?
? ? ?
tby
n
t
b
n
y
a
ttn
yttyn
b
22
推导得:
[ 公式 6— 22]
t
t aby ??
二, 指数曲线趋势模型
[ 公式 6— 23]
?
?
?
?
?
?
?
??
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
??
? ?
? ? ?
n
t
b
n
y
a
ttn
yttyn
b
lg
lg
lg
lg
2
2
推导得:
[ 公式 6— 24]
三, 季节变动的分析
(一 )季节变动的概念
季节变动, 是指某些现象由于受自然因素
和社会条件的影响, 在一年之内比较有规律地
变动 。
(二 )季节变动的测定
第一步, 将三年以上各月或各季度的完整资料
排列整齐 。
第二步, 计算同季 (月 )的合计数及其平均数,
计算年度的合计数及其平均数 。
第三步, 计算出全期季 (月 )的平均数 。
第四步, 将各同季 (月 )的平均数, 分别与全期
季 (月 )的平均数对比, 即为季节比率 。
统计指数
第七章
内容提要
统计指数法是统计分析中广为采用的重要方
法。本章阐述了统计指数的概念、作用和种类;
个体指数和总指数;简单指数和加权指数;定基
指数和环比指数 ;综合指数的编制原则与方法;平
均指数的编制方法 ;指数体系和因素分析;总量指
标的两因素分析和多因素分析 ;平均指标的因素分
统计指数概述
第一节
一、统计指数的概念与作用
(一 )统计指数的概念
广义指数泛指社会经济现象数量变动的
比较指标,即用来表明同类现象在不同空间、
不同时间、实际与计划对比变动情况的相对数。
狭义指数仅指反映不能直接相加的复杂社
会经济现象在数量上综合变动情况的相对数。
(二 )统计指数的作用
1.综合反映社会经济现象总变动方
向及变动幅度。
2.分析现象总变动中各因素变动的影
响方向及影响程度。
3.反映同类现象变动趋势。
二、统计指数的分类
(一 )按研究范围不同,可分为个体指数和
总指数
1.个体指数,是表明个别事物变动情况的
相对数。
2.总指数,是表明复杂经济现象中多种不
同度量的事物综合变动情况的相对数。
(二 )按编制指数的方法论原理不同,可分
为简单指数和加权指数
1.简单指数,是指直接将个别事物的计算
期数值与基期数值对比的相对数。
2.加权指数,是由个体指数加权平均或汇
总求得的总指数。加权指数是计算总指数广为
采用的方法,
(三 )按指数性质不同,可分为数量指标指数
和质量指标指数
1.数量指标指数,是用来反映社会经济现象
的数量或规模变动方向和程度的指数,如职工人
数指数、产品产量指数、商品销售量指数等。
2.质量指标指数,是用以反映社会经济现象
质量、内涵变动情况的指数,如成本指数、物价
指数、劳动生产率指数等。
(四 )按反映的时态状况不同,可分
为动态指数和静态指数
1.动态指数,是表明某种事物在不
同时间上发展变化的指数, 如股票价格
指数, 商品零售价格指数, 农副产品产
量指数等 。
2.静态指数,是反映某种事物在同
时期不同空间对比情况的指数, 如计划
完成情况指数, 地区经济综合评价指数
等 。
综合指数法
第二节
一,
[公式 7— 1]
?
??
pq
pq
I q
0
1
[ 例 7— 1]
,用报告期出厂价格作为同度量因素,其公式和
计算过程为,
该指数表明,将同度量因素 (价格 )固定在报告期,该
厂全部工业产品产量增长了7,61 %,由于产量增长
而增加的产值为 329万元 。
(万元)32943264655
0761.1
4326
4655
95812324180720
96012304188721
1011
10
11
????
??
???????
???????
??
??
?
?
pqpq
pq
pq
I
q
第二,用基期出厂价格作为同度量因素,其公
式和计算过程为,
这个指数表明,将同度量因素 (价格 )固定在
基期,该工厂全部工业产品产量增长了 7.91%,由
于产量增长而增加的产值为 339万元 。
(万元)3 3 94 2 8 44 6 2 3
0 7 9 1.1
4 2 8 4
4 6 2 3
85810324280720
86010304288721
0001
00
01
????
??
???????
???????
??
??
?
?
pqpq
pq
pq
I
q
二, 质量指标综合指数的编制
[公式 7— 2]
?
??
qp
qp
I p
0
1
第一,用报告期销售量作为同度量因素,其公
式和计算过程为,
这个指数表明,将同度量因素 (销售量 )固定在报
告期,该零售商店 5种商品价格综合上涨4,16 %,
由于价格上涨使销售额增加 20620元 。
(元)2 0 6 2 04 9 5 9 6 05 1 6 5 8 0
0 4 1 6.1
4 9 5 9 6 0
5 1 6 5 8 0
4 5 01 2 01 0 0 0202 1 0 0653 6 0 0758 8 041
4 5 01 2 01 0 0 0202 1 0 0653 6 0 0758 8 041
1011
10
11
????
??
?????????
?????????
?
?
??
?
?
qpqp
qp
qp
I
p
第二,用基期销售量作为同度量因素,其公式
和计算过程为,
这个指数表明将同度量因素 (销售量 )固定在基
期,该零售商店 5种商品价格综合上涨4,57 %,由
于价格上涨使销售额增加 21000元 。
(元)21000459800480800
0457.1
459800
480800
5001209002020006532007588042
5001209002020006532007588041
0011
00
01
????
??
?????????
?????????
?
?
??
?
?
qpqp
qp
qp
I
p
三, 综合指数法的特点
(一 )
(二 )
(三 )用综合指数法编制总指数,使用的
是全面材料,
平均指数法
第三节
一, 加权算术平均法
加权算术平均法,是以个体指数为变量
值,以一定时期的总值资料为权数,对个体
指数加权算术平均以计算总指数的方法 。
[公式 7— 3
?
?
?
? ??
00
00
00
10
qp
qpk
qp
qp
I qq
[例 7— 3]
这表明,该百货公司出售的 4种商品销售量报
告期比基期平均增长了 11.74%,由于销售量增
加而增加的销售额为 1.35万元 。
(万元)35.150.1185.12
1 1 7 4.1
50.11
85.12
0000
00
00
????
???
??
?
?
qpqpk
qp
qpk
I
q
q
q
二, 加权调和平均法
[公式 7— 4
1 1 1 1
01
11
1p
p
p q p q
I
pq pq
k
??
??
? ?
[例 7— 4]
11
11
1 1 1 1
19,35
1.0 64 9
1 18,17
1
19,35 18,17 1.1 8
p
p
p
pq
I
pq
k
p q p q
k
? ? ?
? ? ? ?
?
?
?? (万元)
三, 固定权数加权平均法
[公式 7— 5
?
??
w
wk
I pp
[例 7— 5]
该地区商品零售物价总指数,
%45.1 0 3
1 0 0
%89.1 0 3 4 4
??
?
?
?
w
wk
I
p
p
四,
(一 )工业生产指数
工业生产指数是综合反映工业产品产
量增减变化的相对数,可以用来表明一个国
家国民经济发展的状况 。
[公式 7— 6]
[公式 7— 7]
?
??
00
00
qp
qpk
I qq
?
??
w
wk
I qq
(二 )居民消费价格指数
居民消费价格指数,又称消费者价格指数,
居民生活费价格指数, 即通常所说的生活费
用指数,是指反映一定时期内居民消费价格变
动趋势和变动程度的相对数 。
[公式 7— 8]
?
??
w
wk
I pp
(三 )农产品收购价格指数
农产品收购价格指数,是反映一定时期内
农产品收购价格变动趋势和程度的相对数 。
[公式 7— 9] ?
??
11
11
1
qp
k
qp
I
p
p
(四 )
1.根据上市公司的行业分布, 经济实力, 资
信等级等因素, 选择适当数量的有代表性的股票,
作为编制指数的样本股票 。 样本股票可以随时更
换或作数量上的增减, 以保持良好的代表性 。
2.按期到股票市场上采集样本股票价格, 简
称采样 。
3.利用科学的方法和先进的手段计算出
指数值 。
4.通过新闻媒体向社会公众公开发布 。
为保持股价指数的连续性, 使各个时期计
算出来的股价指数相互可比, 有时还需要
对指数值作相应的调整 。
编制股票价格指数的主要方法是加权综合法, 即
以样本股票的发行量或成交量为同度量因素 (或称权数 )
计算股价指数 。 其计算公式按同度量因素所属时期不同
分为两种,
[公式 7— 10]
[公式 7— 11] ?
?
?
?
?
?
10
11
00
01
QP
QP
QP
QP
数报告期加权综合股价指
基期加权综合股价指数
(五 )货币购买力指数
货币购买力的大小同商品和服务价格变
化成反比。统计上根据这种关系,通过编制
居民消费价格指数 (居民生活费用指数 ),以
其倒数来表示货币购买力指数。
货币购买力指数货币工资指数实际工资指数
货币购买力指数货币收入指数实际收入指数
??
??
居民消费价格指数货币购买力指数
1?
[公式 7— 12]
第四节
指数体系和因素分析
一, 指数体系
(一 )指数体系的概念
在统计分析中,将一系列相互联系, 彼此间
在数量上存在推算关系的统计指数所构成的整
体称为指数体系 。
[公式 7— 13]
?
?
?
?
?
? ??
01
11
00
01
00
11
pq
pq
pq
pq
pq
pq
统计指数体系一般具有三个特征,
(1)具备三个或三个以上的指数 。
(2)体系中的单个指数在数量上能相互推算 。
如已知销售额指数, 销售量指数,则可推算出
价格指数 ;已知价格指数, 销售量指数,则可推
算出销售额指数 。
(3)现象总变动差额等于各个因素变动差额
的和 。
(二 )指数体系的作用
1.指数体系是进行因素分析的根据。
2.利用各指数之间的联系进行指数间的
相互推算。
3,用综合指数法编制总指数时,指数体
系也是确定同度量因素时期的根据之一。
二、因素分析
(一 )因素分析的含义
指数体系的目的,就是要分析多种因素的变动
对某种社会经济现象总体变动情况的影响。
1.因素分析的对象是复杂现象。
2.因素分析中的指数体系以等式的形式表现。
3.因素分析的结果有相对数也有绝对数。
(二 )因素分析的分类
(1)总量指标的两因素分析 ;
(2)总量指标的多因素分析 ;
(3)平均指标的两因素分析 ;
(4)含平均指标的多因素分析。
三、总量指标的因素分析
(一 )两因素分析
,在指数体
系上表现为总变动指数等于两个因素
指数的乘积。
)()( ????
??
?
?
?
?
?
?
????
?
??
01110001
0011
01
11
00
01
00
11
pqpqpqpq
pqpq
pq
pq
pq
pq
pq
pq
[例 7— 6]
出口数额指数,
出口量指数,
(美元)50900002039000025480000
2496.1
20390000
25480000
0011
00
11
????
??
??
?
?
pqpq
pq
pq
(美元)40200002039000024410000
1972.1
20390000
24410000
0001
00
01
????
??
??
?
?
pqpq
pq
pq
出口价指数,
分析,由于出口价格上升 4.38%,出口额增加了
107万美元;由于出口量上升 19.72%,出口额增加
了 402万美元;受两者共同影响,三种商品的出口
额上涨了 24.96%,即增加 509万美元。
(美元)1 0 7 0 0 0 02 0 3 9 0 0 0 02 5 4 8 0 0 0 0
0 4 3 8.1
2 0 3 9 0 0 0 0
2 5 4 8 0 0 0 0
0011
00
11
????
??
??
?
?
pqpq
pq
pq
(二 )多因素分析
1.多因素分析必须遵循连环代替法的
原则,即在分析受多因素影响的事物的发
展变化时,要逐项分析,逐项确定同度量因
素。
2.在多因素分析中,为了分析某一因素的
影响,要把其余因素固定不变。
3.对多因素的排列顺序,要具体分析
现象总体的经济内容,使之符合客观事物
的联系或逻辑。各因素顺序的排列一般应
遵循数量指标因素在前、质量指标因素在
后的原则。具体可采用逐项层层分解法来
确定。
)(
)()(
??
????
??
?
?
?
?
?
?
?
?
??
????
?
???
011111
001011000001
000111
011
111
001
011
000
001
000
111
pmqpmq
pmqpmqpmqpmq
pmqpmq
pmq
pmq
pmq
pmq
pmq
pmq
pmq
pmq
[公式 7— 14]
[例 7— 7]
产品产量指数,
原材料单耗指数,
1 0 0
0 0 0
1 0 0 0 0 0
17000
0, 8 7 1 8
19500
1 7 0 0 0 1 9 5 0 0 2 5 0 0 ( )
q m p
q m p
q m p q m p
??
? ? ? ? ?
?
?
?? 元
)(17001700015300
8718.0
17000
15300
001011
001
011
元?????
??
??
?
?
pmqpmq
pmq
pmq
原材料价格指数,
原材料费用总额指数,
1 1 1
1 1 0
1 1 1 1 1 0
14400
0, 9 4 1 2
15300
1 4 4 0 0 1 5 3 0 0 9 0 0 ( )
q m p
q m p
q m p q m p
??
? ? ? ? ?
?
?
?? 元
51001 9 5 0 01 4 4 0 0
7385.0
1 9 5 0 0
1 4 4 0 0
000111
000
111
?????
??
??
?
?
pmqpmq
pmq
pmq
综合影响,
各因素指数连乘积=原材料费用总指数
0.8718 × 0.9000 × 0.9412= 0.7385
2500)+( -1700)+( -900)= -5100(元 )
分析,由于生产量减少 12.82%,少支出的费用为 2500元 ;
由于单位产品原材料消耗降低 10%,少支出费用 1700元 ;又
由于原材料价格下降 5.88%,少支出费用 900元。三者共同
影响,使原材料费用总额下降 26.15%,减少 5100元。
四, 平均指标的因素分析
[公式 7— 15]
?
?
?
?
?
?
?
?
?
?
?
?
??
0
00
1
10
1
10
1
11
0
00
1
11
f
fX
f
fX
f
fX
f
fX
f
fX
f
fX
[例 7— 8]
1.可变组成指数,
)(61.1 5 947.1 5 6 286.1 4 0 2
0
00
1
11
8 9 7 8.0
47.1 5 6 2
86.1 4 0 2
7 3 0
1 1 4 0 6 0 0
2 1 0 0
2 9 4 6 0 0 0
0
00
1
11
元?????
???
?
?
?
?
?
?
?
?
f
fX
f
fX
f
fX
f
fX
2.固定组成指数,
)(29.7457.1 3 2 886.1 4 0 2
1
10
1
11
0 5 5 9.1
57.1 3 2 8
86.1 4 0 2
2 1 0 0
2 7 9 0 0 0 0
2 1 0 0
2 9 4 6 0 0 0
1
10
1
11
元????
???
?
?
?
?
?
?
?
?
f
fX
f
fX
f
fX
f
fX
3.结构影响指数,
)(90.2 3 347.1 5 6 257.1 3 2 8
0
00
0
10
8 5 0 3.0
47.1 5 6 2
57.1 3 2 8
7 3 0
2 1 1 4 0 6 0
2 1 0 0
2 7 9 0 0 0 0
0
00
0
10
元?????
???
?
?
?
?
?
?
?
?
f
fXfX
f
fX
fX
f
f
4.综合影响,
1,0559× 0.8503= 0.8979
74.29+(- 233.90)= -15 9.61(元 )
分析,由于工资水平上升 5.59%,总平均工资增
加 74.29元,由于工人结构的变动,总平均工资降低
14.97%,即总平均工资减少 233.9元,两者共同影
响,使总平均工资下降 10.22%,即减少 159.61元。
抽样调查
第八章
内容提要
本章主要阐述了抽样调查的概念、
特点、作用和几个基本概念;影响抽样
误差的主要因素;抽样调查几种主要组
织方式的抽样平均误差的计算;抽样估
计推断;点估计和区间估计;必要抽样
抽样调查的一般问题
第一节
一、抽样调查的概念与作用
(一 )抽样调查的概念与特点
抽样调查又称抽样推断或抽样估计,它是
从总体中按随机原则抽取一部分单位进行观测,
并根据这部分单位的资料推断总体数量特征的
一种方法。
抽样调查具有下列三个主要特点,
(1)按随机原则抽取调查单位。
(2)由部分推断全体。
(3)抽样误差可以事先计算并加以控制。
(二 )抽样调查的作用
(1)用于不可能进行全面调查的无限总体。
(2)用于不可能进行全面调查而又需要了解全
面情况的现象。
(3)用于不必要进行全面调查的现象。
(4)用于对全面调查的资料进行评价与修正。
(5)用于工业生产过程的质量控制。
二、抽样调查中的几个基本概念
(一 )全及总体和抽样总体
1.全及总体。全及总体简称总体或母体,
它是指所要调查研究对象的全体。
2.抽样总体。抽样总体简称样本或子样,
它是指在全及总体中按随机原则抽取的那部分,
单位所构成的集合体。
(二 )总体指标和样本指标
1.总体指标。
总体指标也称为母体参数或全及指标,
它是根据全及总体各单位的标志值或标志特征
计算的,反映总体某种属性的综合指标。由于
全及总体是唯一确定的,根据全及总体计算的
全及指标也是唯一确定的。
2.样本指标。
样本指标也称样本统计量或抽样指标,它
是根据抽样总体各单位的标志值或标志特征计
算的综合指标。由于可以从一个全及总体中抽
取许多个不同的样本,不同的样本其分布结构
也会有差异,抽样指标的数值也就不同,所以
抽样指标的数值不是唯一确定的。
三, 抽样调查的组织方式
(一 )简单随机抽样
简单随机抽样也叫纯随机抽样, 它对总
体单位不作任何分类排队, 而是直接从总体
中随机抽取一部分单位来组成样本的抽样组
织方式 。
(1)抽签法 。
(2)随机数字法 。
(二 )类型抽样
类型抽样又称分类抽样或分层抽样, 它
是先将总体按某个主要标志进行分组 (或分
类 ),再按随机原则从各组中抽取样本单位的
一种抽样方式 。
(1)等数分配类型抽样法。
(2)等比例类型抽样法。
[公式 8— 1]
),,2,1( ki
N
inN
in ???
(3)不等比例类型抽样法。
[公式 8— 2]
?
?
i
i
i
i
i
i
n
i
n
??
??
(三 )等距抽样
等距抽样也称机械抽样或系统抽样,
它是将总体各单位按某一标志顺序排列,
然后按固定顺序和相等距离或间隔抽取
样本单位的抽样组织方式 。
[公式 8— 3]
nNk ?
图 8— 1 等距抽样示意图
(四 )整群抽样
整群抽样也称集团抽样, 区域抽样
或分群随机抽样, 它是将总体各单位按
时间或空间形式划分成许多群, 然后按
纯随机抽样或机械抽样方式从中抽取部
分群, 对中选群的所有单位进行全面调
查的抽样组织方式 。
[公式 8— 4]
[公式 8— 5]
),,3,2,1(
),,3,2,1(
1
1
1
ri
M
Mx
x
ri
M
x
x
r
i
i
i
r
i
i
i
M
j
i
i
ij
?
?
??
??
?
?
?
?
?
?
抽样误差
第二节
一, 抽样误差的概念
即使遵守了随机原则, 也会由于被抽取
的样本各种各样, 导致样本内部各单位的分
布比例结构与总体实际分布状况有偶然性的
差异, 从而使不同的随机样本得出不同的估
计量, 造成样本指标数值与总体指标数值之
间产生差距, 如抽样平均数与总体平均数的
离差, 抽样成数与总体成数的离差等 。 这类
误差通常称为抽样误差或随机误差 。
二, 影响抽样误差的主要因素
(一 )样本单位数 (样本容量 n)的多少
(二 )总体被研究标志变异程度 (总体方差
σ 2 )的大小
(三 )抽样组织方式
(四 )抽样方法
三, 抽样平均误差
(一 )抽样平均误差的概念
抽样平均误差是指以全部可能样本指标为变
量, 以总体指标为平均数计算得到的标准差, 以
符号 表示, 通常以 代表平均数的抽样平均
误差, 以 代表成数的抽样平均误差, 以 K代表
可能组成的样本总数 。
??? x?
p?
(二 )计算抽样平均误差的理论公式
[公式 8— 6]
[公式 8— 7]
? ?
? ?
? ?
K
Pp
K
Xx
p
x
?
?
?
?
?
?
?
?
?
2
2
2
?
?
?
?
?
即:
可能组成的样本总数
总体指标样本指标
[ 例8 — 1 ] 为叙述简便起见, 假设有 10,20,30和
40四个数字组成一个总体, 从中随机抽取两个数字
作为样本, 求抽样平均误差 。
? ?
? ?
46.6
16
2 5 0
91.7
16
1 0 0 0
:
25
4
1 0 0
25
16
4 0 0
25
4
1 0 0
2
2
??
?
?
??
?
?
?????
???
?
?
??
?
n
N
x
x
i
C
Xx
K
Xx
N
X
K
x
x
N
X
X
?
?
采取不重复抽样
准差为全部可能组成样本的标
采取重复抽样
(三 )抽样平均误差的计算方法
1.平均数的抽样平均误差
(1)重复抽样条件下,
[公式 8— 8]
(2)不重复抽样条件下,
[公式 8— 9]
当 N很大时,
[公式 8— 10]
nn
n
nx
???? ??? 2
? ?
? ?1
2
?
??
Nn
Nn
x
??
???
?
???
? ??
N
n
nx
1
2?
?
2.成数的抽样平均误差
(1)重复抽样条件下,
[公式 8— 11]
(2)不重复抽样条件下,
[公式 8— 12]
当 N很大时,
[公式 8— 13]
? ?
n
PPp ?? 1?
? ?
???
?
???
?
?
???
1
1
N
Nn
n
PPp?
? ?
???
?
???
? ???
N
n
n
PPp 11?
[例8 — 2] 某仪表厂生产某种型号的精密仪表,按正常
生产经验,产品合格率为 85%。今按简单随机抽样方式从 800
只仪表中抽取 10%进行检验,求合格品比率的抽样平均误差。
在重复条件下,采用[公式 8— 11],
8— 13],
? ? %79.3
8 0 0
801
80
%75.1211 ?
???
?
???
? ???
???
?
???
? ???
N
n
n
PPp?
? ? %99.3
80
%75.121 ????
n
PPp?
? ?
80%10800
%,75.12%)851(%851
%,85
2
???
??????
?
n
PP
P
?
[例 8— 3]某大学有 4500名学生,采用不重复简单
随机抽样方式从中抽取 10%的学生,调查其每月生
活费用支出情况。抽样结果显示,学生平均每人每
月生活费支出 350元,标准差 80元,生活费用支出
在 500元以上的学生占全部学生的 20%。试求抽样平
均误差。
? ?
%79.1
4500
450
1
450
%)201(%20
1
1
)(58.3
4500
450
1
450
80
1
22
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
??
N
n
n
PP
N
n
n
s
p
x
?
? 元
%20,80,3 5 0
4 5 0%108 0 0,4 5 0 0
???
????
psx
nN
(四 )其他抽样组织方式抽样平均误差的计算方法
1.类型比例抽样平均误差的计算。
(1)平均数的抽样平均误差
重复抽样条件下,
[公式 8— 14]
不重复抽样条件下,
[公式 8— 15]
nx
2?
? ?
???
?
???
? ??
N
n
nx
1
2?
?
(2)成数的抽样平均误差
[公式 8— 16]
不重复抽样条件下,
[公式 8— 17]
? ?
n
PPp ?? 1?
? ?
???
?
???
? ???
N
n
n
PPp 11?
其中,
[公式 8— 18]
[公式 8— 19]
N
N ii?
?
2
2
?
?
? ?
? ?
N
PP
PP
ii? ?
??
1
1
[ 例 8— 4]
)/(99.12
48
17.8 0 1 4
17.8 0 1 4
48
895161202460
)/(4 4 0 0
48
83 6 0 0162 4 0 0246 0 0 0
2
222
2
2
公顷千克
公顷千克
???
?
?????
??
?
?????
??
?
?
n
s
n
ns
s
n
nx
x
x
ii
ii
?
2.等距抽样平均误差的计算。
3.整群抽样平均误差的计算。
(1)平均数的抽样平均误差
[公式 8— 20]
(2)成数的抽样平均误差
[公式 8— 21]
???
?
???
? ??
R
r
r
xx 12??
???
?
???
? ??
R
r
r
p
p 1
2?
?
其中,
[公式 8— 22]
[公式 8— 23]
? ?
R
XX i
x
? ?? 2
2?
? ?
R
PP i
p
? ?? 2?
[ 例 8— 5]
首先, 分别计算样本平均数和样本成数,
%83%84
3
2 5 3%80%85
)(4 4 0 0
3
2 5 32 4 62 4 8
?
??
??
?
??
??
?
?
r
p
p
r
x
x
i
i
克
然后, 分别求出样本平均数群间方差和成数群间
方差,
? ?
67.8
3
26
2
2 ??
?
? ?
R
xx i
x?
? ?
67.4
3
14
2
??
?
? ?
R
pp i
p?
最后, 根据 [ 公式 8— 20] 和 [ 公式 8— 21] 求出
μ x和 μ p为,
)(69.1
300
31
3
67.812 克?
???
?
???
? ??
???
?
???
? ??
R
r
r
xx ??
%51.2
300
31
3
1412 ?
???
?
???
? ??
???
?
???
? ??
R
r
r
p
p
?
?
总体指标的推断
第三节
一, 统计比较的概念和作用
总体指标的推断是指对总体平均数 总
体成数 P推断估计的问题 。 抽样调查的直接
目的, 就是为了推断, P,然后, 再结
合总体单位数 N去推算总体的有关标志总量 。
xX
X
一, 点估计
点估计也称定值估计, 它是以抽样得到的
样本指标作为总体指标的估计量, 并以样本指
标的实际值 (, p)直接作为总体未知参数
(, P)的估计值的一种推断方法 。
X
x
1.一致性。设 为未知参数 θ 的估计量,
当 n→∞ 时,要求 按概率收敛于 θ
[公式8 — 26]
? ? 1?lim ???
??
???
n
P
??
??
2.无偏性。若要求估计量 的数学期
望等于未知参数的真值 θ
[公式8 — 27] ? ? ?? ?
?E
??
3.有效性。无偏性只考虑估计量的平均结果是
否等于待估计参数的真值,有效性则要求每个估计值
与待估参数真值之间的偏差尽可能地小。
设,为 θ 的两个无偏估计量,若 的方差小
于
[公式8 — 28]
1?? 2??
1??
2??
? ? ? ?11 ?? ?? DD ?
二、区间估计
区间估计就是以一定的概率保证估计包
含总体参数的一个值域,即根据样本指标和
抽样平均误差推断总体指标的可能范围。
图 8— 2 正态分布曲线图
根据数理统计证明,总体单位的标志值如果是
正态分布,其全部可能样本也一定是正态分布的;
如果总体单位的标志值不是正态分布的,只要是
大样本 (即 n≥30),全部可能样本指标也会接近正
态分布。从正态分布图中,可以总结两个特点:
一是样本指标高于或低于总体指标的概率分布完
全是对称的;二是样本指标接近于总体指标的概
率越大 (小 ),出现的可能性也越大 (小 )。
图 8— 3 样本指标置信度图
误差范围 与概率度 (t)和抽样平均误差
三者之间的关系为,
[公式 8— 29]
由此得到平均数和成数的误差范围公式,
8— 30]
[公式 8— 31]
?? ? ?? t??
??? ???
pp
xx
t
t
?
?
??
??
进而得到总体平均指标和总体成数指标的区间
估计公式为,
8— 32]
[公式 8— 33] pp
xx
pPp
xXx
??????
??????
[例8 — 6]
公里公里即:
则
查表得
01.507899.4921
80.3996.15000
80.39
10000
100
1
100
400
1:
,96.1:
%,95)F(,400
,5000,100%110000
2
2
??
????
??
?
?
?
?
?
??
?
?
?
?
?
?
??
?
??
????
X
x
N
n
n
t
t
xn
x
x
?
?
?
?
有了区间估计的结果,就可以对这批轮胎的使
用寿命得出结论,因为区间估计最低公里数为
4921.99公里,可将 4900公里规定为最低可行驶公
里数。这样做虽不能保证百分之百的可靠,但可
以有 95%的把握,还是令人可信的。
[例8 — 7]
%58.23%42.16%58.3%20%58.3%20
500
]338[
16.35784.34216.735016.7350
]328[
%58.3%79.12
)(16.758.32:
,2:%,45.95)F(
%79.158.3%20,350
??????
??????
?????
?????
??
????
PP
XX
t
t
tt
px
pp
xx
px
即
重的可能范围:元以上的学生所占的比在
活费用得出全体学生月平均生—采用公式
即
活费用的可能范围:得出全体学生月平均生—采用公式
元则
查表得
元,,元
?
?
??
[例8 — 8]
? ?
%90
100
10203228
500100
1417900
100
141790000
100
11390
100
1139000
100
2
2
?
???
?
??
?
?
???
?
?
p
f
fxx
s
f
xf
x
为:元以上的户数所占比重收入在户农民家庭的年人均纯
收入的方差为:户农民家庭的年人均纯
(元)
收入为:户农民家庭的年人均纯
[例8 — 8]
? ? ? ?
%88.95%12.84%88.5%90%88.5%90
1 0 0 0 0
]338[
40.1 1 6 2 360.1 1 1 5 640.2 3 31 1 3 9 040.2 3 31 1 3 9 0
]328[
%88.5
1 0 0
9.019.0
96.1
1
)(40.2 3 3
1 0 0
1 4 1 7 9 0 0
96.1
]318[]308[
2
??????
??????
?
??
??
?
????
???????
PP
XX
n
pp
tt
n
s
tt
pp
xx
即
的可能范围:元以上的户数所占比重在
人均纯收入得出全县农民家庭中年—采用公式
即
均纯收入的可能范围:得出全县农民家庭年人—采用公式
元
:,求出抽样的误差范围—和公式—分别用公式
?
?
第四节
必要抽样数目的确定
一, 影响抽样数目的主要因素
(一 )
(二 )对推断精确度的要求
(三 )对推断可靠性的要求
(四 )抽样调查的组织方式和方法
(五 )人力, 物力和财力的允许条件
二, 确定抽样数目的方法
(一 )在重复抽样条件下
[公式 8— 34]
[公式 8— 35]
2
22
x
x
tn
?
? ?
2
2 )1(
p
o
PPtn
?
??
(一 )在不重复抽样条件下
[公式 8— 36]
[公式 8— 37]
222
22
?
?
tN
Ntn
x
x ???
NPPtN
NPPtn
p
o )1(
)1(
22
2
???
??
[ 例8 — 9 ]
(1)采用重复抽样公式计算,
(户)
有:—公式根据
元时,当极限误差
400
150
1 5 0 02
]348[
150
2
22
2
22
?
?
?
?
?
??
x
x
x
t
n
?
(户)
有:—公式根据
元时,当极限误差
1 6 0 0
75
1 5 0 02
]348[
75
2
22
2
22
?
?
?
?
?
??
x
x
x
t
n
?
可见,在重复抽样中,极限误差缩小一半
(即为原来的 1/2)时,必须把样本容量增到 4
倍。
(2)采用不重复抽样公式计算,
(户)
有:—公式根据
元时,当极限误差
3923.391
1500215018000
1500218000
]368[
150
222
22
??
???
??
?
??
x
x
n
(户)
元时,当极限误差
1 4 5 04.1 4 6 9
752751 8 0 0 0
1 5 0 021 8 0 0 0
75
222
22
??
???
??
?
??
x
x
n
如果是采用其他抽样组织方式, 则公式略有不
同 。 例如, 采用重复的分层抽样, 则所需的
抽样数目计算公式为,
[公式 8— 38]
[公式 8— 39]
2
22
x
x
tn
?
? ?
2
2 )1(
p
o
PPtn
?
??
相关与回归分析
第九章
内容提要
相关分析与回归分析是两种既有区别又有联
系的统计分析方法。本章阐述了相关关系的概念
与特点;相关关系与函数关系的区别与联系;相
关关系的种类;相关关系的测定方法 (直线相关
系数的含义、计算方法与运用 );回归分析的概
念与特点;直线回归方程的求解及其精确度的评
相关分析的一般问题
第一节
(一 )相关关系的概念
量变化上受随机因素的影响,非确定性的相互
依存关系。
(二 )相关关系的主要特点
1.相关关系表现为数量相互依存关系。
2.相关关系在数量上表现为非确定性
的相互依存关系。
(一 )相关关系按变量的多少,可分为单相
关和复相关
单相关是指两个变量间的相关关系,如
自变量 x和因变量 y的关系。
复相关是指多个自变量与因变量间的相关
关系。
(二 )相关关系从表现形态上划分,可分为
直线相关和曲线相关
直线相关是指两个变量的对应取值在坐
标图中大致呈一条直线。
曲线相关是指两个变量的对应取值在坐
标图中大致呈一条曲线,如抛物线、指数曲线、
双曲线等。
(三 )相关关系从变动方向上划分,可分为
正相关和负相关
正相关是指直线相关中,两个变量的变动
方向相同,即变量 x增加,变量 y也相应增加;
变量 x减少,变量 y也相应减少。
负相关是指直线相关中,两个变量的变动
方向相反,即变量 x增加,变量 y反而减少;变
量 x减少,变量 y反而增多。
(四 )按相关的密切程度分,有完全相关、
不完全相关和不相关
完全相关是两个变量之间有确定的函数
关系。
若两个变量之间有一定联系,当一个变
量变化时,另一个变量也会因此发生变化,但
不存在严格的函数关系,称为不完全相关。
若两个变量之间各自独立,当一个变量变
化,另一个变量不变化,或呈不规则变化,两
(一 )判别现象间有无相关关系
(二 )判定相关关系的表现形态和密切程度
相关关系的判断
第二节
一,
(一 )定性分析
对现象进行定性分析, 就是根据现
象质的规定性, 运用理论知识, 专业知
识, 实际经验来进行判断和分析 。
(二 )相关表
相关表就是把被研究现象的观察值
对应排列所形成的统计表格 。
表 9— 1 某地区工业劳动者数与工业增加值相关表
工业劳动者数 (万人 ) 工业增加值 (亿元 )
1373
1501
1400
1375
2416
2881
2979
2224
1705
156
174
179
212
257
401
527
565
345
303
相关表中的两列数据叫相关数列, 它有
别于变量数列 。 相关表中的数值是变量的观
测值, 是实际资料, 是样本数据, 它是判别
相关关系的基础 。 在相关表中, 如果观测值
的分布呈现一定的规律性, 则表明现象间存
在相关关系 。
相关表可分为简单相关表和分组相关表 。
(三 )相关图
相关图也叫相关散点图, 它是根据相
关表中的观测数据在坐标图中所绘制的点
状图形 。 用 x和 y分别代表两个变量, 把相
关表中的对应观测值一一描绘在坐标图中,
则形成了反映相关点分布状况的图形, 据
此就可以观测现象间相关关系的情况 。
图 9— 1
图 9— 2 商品销售额与流通费用率相关图
二,
(一 )相关系数的含义
相关系数是指直线相关条件下, 说明两现
象之间相关关系密切程度的统计分析指标, 用
r表示 。 其定义公式为,
[公式 9— 1]
? ?? ?
? ? ? ?
n
yy
n
xx
n
yyxx
r
yy
xy
??
?
??
??
??
22
2
??
?
依相关系数的定义公式可知相关系数的含
义如下,
(1)r的取值范围为-1 ≤ r≤ 1。 因为协方差
的绝对值最小为 0,最大为 σ x和 σ y的乘积 。
(2)r的绝对值越接近于 1,表明相关关系越
密切;越接近于 0,表明相关关系越不密切 。
(3)r=+1或 r=-1,表明两现象完全相关 。
(4)r=0,表明两变量无直线相关关系 。
(5)r>0,表明现象呈正直线相关; r<0,
表明现象呈负直线相关 。 实际中| r| <0.3,
视为无相关;0,3 ≤ | r|<0,5, 为低
度相关;0,5| r| <0,8, 为显著相
关;| r| ≥ 0,, 一般称为高度相关 。
(二 )相关系数的计算
1.根据相关系数的定义公式可直接计
算相关系数 。
? ?? ?
? ? ? ?
9 8 5.0
7
4 0 6
7
1 8 3 6
7
8 5 0
22
??
??
??
?
??
?
n
yy
n
xx
n
yyxx
r
2.相关系数的简捷计算法
按照定义公式计算相关系数 r运算量较大,
过程繁琐, 实践中多采用由定义公式推导出的
简捷公式计算相关系数 。 简捷计算公式为,
[公式 9— 2]
? ? ? ? 2222 ????
???
??
?
?
yynxxn
yxxyn
r
? ? ? ?
? ? ? ?
9 8 5.0
2 1 77 1 3 374 3 42 8 7 4 47
2 1 74 3 41 4 3 0 47
22
2222
?
????
???
?
??
?
?
????
???
yynxxn
yxxyn
r
3.相关系数的其他公式
[公式 9— 3]
[公式 9— 4]
[公式 9— 5]
? ?? ?
? ? ? ???
?
??
??
?
22 yyxx
yyxx
r
? ? ? ? 2222 ynyxnx
yxnxy
r
??
??
?
??
?
yx
yxnxyr
??
???
回归分析的一般问题
第三节
一,
(一 )回归分析的概念
,虽然不是严格
的函数关系, 但现象之间的一般关系值,
可以通过函数关系的近似表达式来反映,
这种表达式根据相关现象的实际对应资料,
运用数学的方法来建立, 这类数学方法称
回归分析 。
(二 )回归分析的特点
与相关分析相比, 回归分析的特点有,
1.回归分析的两个变量是非对等关系 。
2.回归分析中, 因变量是随机变量, 自
变量是可控制变量 。
(一 )
(二 )测定数学模型的拟合精度
三、相关分析和回归分析的区别与联系
相关分析与回归分析既相互区别又密切联系,
是相辅相成的。相关分析是研究两个或两个以上变
量之间相关关系及其密切程度的分析。判断相关关
系及其密切程度,一般可通过进行定性与定量分析、
编制相关图表、计算相关系数等,来反映相关方向
和密切程度。回归分析是指将相关现象的关系转变
为函数关系,并建立变量关系的数学表达式,来研
究变量之间数量变动关系的统计分析方法。
相关分析和回归分析是研究现象之间互相依
存关系的不可分割的两个方面。一般先进行相关分
析,测定相关现象之间相关程度大小,进而决定是
否需要进行回归分析,并拟合相应的回归方程,以
便进行推算和预测等,因而可以说相关分析是进行
回归分析的基础,回归分析是把变量的相关关系转
变为函数关系的手段。但须指出,相关分析可以不
分自变量和因变量,而进行回归分析时,则必须明
确自变量和因变量,当自变量与因变量位置互换时
所得到的回归方程则不同。
第四节
回归模型的建立与检测
一,
一元线性回归模型是用来进行两个变量间
回归分析的 。 回归分析的重要内容之一, 就
是根据变量观测值构建回归直线方程, 对现
象间存在的一般数量关系进行描述 。
(一 )构建回归模型应具备的条件
1.现象间确实存在数量上的相互依存
关系 。
2.现象间存在直线相关关系 。
3.具备一定数量的变量观测值 。
(二 )直线回归方程的求法
直线回归方程又称一元一次线性回归方程,若以
x表示自变量,y表示因变量,则其基本形式为,
a,b与直线趋势方程相同,通常用最
小平方法来求。最小平方法的数学出发点是,
bxay ???
? ?
? ? 最小值
最小值
???
??
?
?
2
2?
bxay
yy
根据高等数学中求极值的原理,
[公式 9— 6]
? ?? ?
? ?? ?
?
?
?
?
?
??
??
?
?
?
?
?
????
????
?
?
?
?
?
?
???
??
?
?
2
012
012
0,0
xbxaxy
xbnay
bxay
bxay
b
G
a
G
即
这就是求解参数 a,b的二元一次方程组。解之即得
求 a,b的公式如下,
[公式 9— 7]
? ?
xby
n
x
b
n
y
a
xxn
yxxyn
b
????
?
?
?
??
? ?
? ??
2
2
[ 例9 — 2 ]
根据相关系数的简捷公式计算有,
? ? ? ?
? ? ? ?
978.0
80954718550037
8018521807
22
2222
?
????
???
?
??
?
?
????
???
yynxxn
yxxyn
r
再求回归直线方程,
? ?
xy
n
x
b
n
y
a
xxn
yxxyn
b
bxay
5 7 8.08 4 4.3?
8 4 4.3
7
1 8 5
5 7 8.0
7
80
5 7 8.0
1 8 55 0 0 37
801 8 52 1 8 07
?
22
2
???
???????
??
???
?
?
?
?
??
??
? ?
? ??
(一 )估计标准误差的概念与计算
表性大小的统计分析指标。其计算公式为,
[公式 9— 8]
? ?
n
yy
S yx
? ?
?
2?
实践中,在已知直线回归方程的情况下,
通常用下面的简便公式计算估计标准误差,
[公式 9— 9]
n
xybyay
S yx ???
??
?
2
(二 )估计标准误差与相关系数的关系
估计标准误差与相关系数存在着密切的关系,
二者的关系可由如下表达式描述,
[公式 9— 10]
根号前面的正负号表明正相关或负相关,具体
取舍由回归系数的符号来确定:回归系数为正,则
取正;回归系数为负,则取负。
y
yxS
r
2
2
1
?
???
在给定相关系数的情况下,估计标准误差
的计算公式又为,
[公式 9— 11]
21 rS
yyx ?? ?
(三 )相关系数与回归系数的关系
[公式 9— 12]
[公式 9— 13]
x
y
y
x
rb
br
?
?
?
?
??
??
或
(四 )回归方程的变形形式
[公式 9— 14]
? ?xxryy
x
y ?? ???
?
?
[例9 — 3]
(1)先求直线回归方程
9— 13],
bxay ???
64.0
5
48.0 ?????
x
yrb
?
?
由[公式 9— 7],
故所求直线回归方程为,
4.1816564.0124 ?????? xbya
xy 64.0124? ??
(2)求估计标准误差
9— 11]有,
(万元)4.2
8.014
1
2
2
?
??
?? rS
yyx
?
三、应用相关分析与回归分析应注意的
(一 )注意定性分析与定量分析的结合
(二 )注意客观现象质的规定性
(三 )注意社会经济现象的复杂性
(四 )注意对相关系数和回归直线方程的
有效性进行检验
统计预测
第十章
内容提要
本章阐述了统计预测的概念、特点和种
类;统计预测的基本原则和基本程序;一些
常用的预测方法 (简单模型预测法、长期趋势
模型预测法、回归模型预测法 );长期趋势模
型预测法中的参数估计 (最小平方法、取点 );
回归模型预测法中的行列式法估计二元线性
回归模型的参数;回归预测应注意的问题;
统计预测概述
第一节
一、统计预测的概念和特点
(一 )统计预测的概念
统计预测是根据有关的统计理论,利用统
计方法,对尚未发生或已经发生而不为人们所
知的社会经济现象的特征和表现做出判断和预
见。
(二 )统计预测的特点
1.统计预测属于一种定量预测。
2.统计预测的基本特征是运用统计方
法,建立数学模型。
3.统计预测的准确性可以通过预测误
差来进行检验和控制。
二、统计预测的种类
1.按预测方法可以分为定性预测和定量预测。
定性预测是根据实践经验和有关理论对现象
做出科学分析后,对其性质或特征做出预测。其
目的在于对预测事物有个概括的了解,对某种现
象出现的可能性做出判断。
定量预测是在对统计数据进行分析的基础
上,根据有关的理论和方法建立数学模型,然
后对社会经济现象可能出现的特征做出数量上
的描述。
2.按预测的对象可以分为宏观预测和微观预测。
宏观预测是指对社会总体进行全局性的预测,
如对全社会基本建设投资规模、物价变动趋势、
人民生活水平、国民经济发展速度的预测等。
微观预测是指对单个社会单元活动的预测,
如对某个商店商品销售量、销售额的预测。
3.按预测的性质可以分为趋势预测和回归
预测。
趋势预测是依据现象在时间上的变动和发
展规律,对其未来的变化特征做出推断和预见。
进行这种预测要求掌握时间数列资料。
回归预测是依据现象之间的因果联系,通
过一个或多个现象的变化情况来对另一个相关
现象的变化特征进行描述,这种预测要求掌握
相关数列资料。趋势预测和回归预测这种分类
的实用性强,本章将按照这种分类,介绍统计
三、统计预测的基本原则
(一 )连续性原则
(二 )类比性原则
(三 )概率性原则
四、统计预测的基本程序
(一 )确定预测目标
(二 )搜集统计资料
(三 )加工整理资料
(四 )构建预测模型
(五 )估计模型参数,进行预测
(六 )分析预测误差,改进预测
几种常用的简单模型预测
第二节
一, 进度预测法
当现象的数量变化比较平稳, 没有
明显的递增或递减趋势, 可以根据以往
的实践, 结合考虑有关因素的作用, 来
预计月度, 季度或年度所能达到的水平
或完成程度的一种预测方法, 此法一般
用于短期预测 。
[公式 10— 1]
1
1
?
%1 0 0?
?
?
??
?
?
?
nit
n
ni
t
yyy
y
yy
y
或
[ 例 10— 1] 某化肥厂 1— 11月份共生产尿素
3 200吨, 其中最后 3个月产量为 900吨 。 全年
计划任务数为 3 400吨, 预计全年计划完成程
度为,
%94.102
%100
3400
3500
3400
1
3
900
3200
? %
?
??
??
?)(
t
y
二, 比例预测法
事物与事物之间的联系有的表现为
一定的比例关系 。 这时, 就可根据这种
客观存在的比例关系进行推算和预测 。
[公式 10— 2]
( % )
?
i
t
t X
y
y ?
[ 例 10— 2] 某地区生产总值 900亿元, 其中工
业, 农业, 建筑业等生产物质产品部门的增加值
为 585亿元, 占生产总值的 65 %。 如果已知第 2年
的工业, 农业, 建筑业等生产物质产品部门的增
加值为 692亿元, 就可以根据上年工业, 农业,
建筑业等生产物质产品部门的增加值的比重估算
第 2年该地区的生产总值为,
(亿元)62.1 0 6 4%656 9 2? ??ty
[ 例 10— 3] 某厂某年 1— 11月份共生产某种产
品 1 800吨 。 12月份上, 中旬实际生产该产品 120
吨 。 该工厂生产比较稳定, 每月生产计划一般都
是上, 中旬完成 65.5%左右, 下旬完成 34.5%左右,
这就可以用比例预测法预算该年 12月份的产量和
全年的产量 。
(吨)全年预计产量
(吨)月份产量
(吨)月份下旬产量
21.1 9 8 321.1 8 31 8 0 0
21.1 8 321.631 2 012
21.633 4 5.0
6 5 5.0
1 2 0
12
???
???
???
三, 简单序时平均预测法
简单序时平均预测法就是把研究时
期的全部观察值都考虑在内, 采用简单
算术平均法, 求出该时期的序时平均数,
作为下一期的预测值 。
[公式 10— 3]
t
y
t
yyyy
y
t
i
i
t
kt
?
?
?
?
????
? 1321?
?
[ 例 10— 4]
(万吨)400
11
4 8 3 7
11
448470468450467439433420413444385
? 1
??
??????????
??ty
四, 移动平均数预测法
移动平均数预测公式为
[公式 10— 4]
[公式 10— 5] 15
2345
?
5
?
4321
1
121
1
????
?
????
?
????
?
?
????
?
ttttt
t
ntttt
t
yyyyy
y
n
n
yyyy
y
,则设
?
五, 增长量和平均增长量预测法
[公式 10— 6]
[公式 10— 7]
11
?
2?
11
1
111
?
?
??
?
?
??
?????
? ?
?
???
n
yy
y
n
yy
yy
yyyyyy
t
t
tt
tt
tttttt
)(
)(
[ 例 10— 5]
增长量预测,
2005年生产总值为,
平均增长量预测,
2005年生产总值为,
(万元)
)(
1 2 2 3 5 8 31 1 2 9 1 81 1 1 0 6 6 5
9 9 7 7 4 71 1 1 0 6 6 51 1 1 0 6 6 5? 1
???
????ty
(万元)
)(
1 1 8 1 9 2 0
110
4 6 9 3 6 61 1 1 0 6 6 5
1 1 1 0 6 6 5? 1
?
?
?
???ty
六, 增长速度和平均速度预测法
[公式 10— 8]
[公式 10— 9]
度。为水平法的平均发展速G
Gyy
y
y
y
y
yy
yy
tt
t
t
t
t
tt
tt
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
??
?
??
?
?
1
11
1
1
?
1?
长期趋势模型预测
第三节
一, 最小平方法
(一 )直线趋势预测模型
直线趋势预测模型为,
[公式 10— 10]
? ?? ?
? ??
?
?
?
??
??
2
2
,
?
ttn
yttyn
b
tbya
ba
btay
t
:为参数,可由下式估计式中,
[ 例 10— 6]
? ?
(亿元)
测值为:年该地区生产总值的预所以,
故实际预测模型为:
用最小平方法估计:
经计算,
:设直线趋势预测模型为
01.90)19(38.421.46?
2 0 0 5
38.421.46?
21.46
9
45
38.4
9
6 1 3
38.4
452 8 59
6 1 3453 3 2 89
3 3 2 8,6 1 3,2 8 5,45,9
?
1
22
2
2
????
??
??????
?
??
???
?
?
?
?
?????
??
?
?
??
? ?
? ??
? ???
t
kt
t
y
ty
n
t
b
n
y
a
ttn
yttyn
b
tyyttn
btay
(二 )二次抛物线趋势预测模型
二次抛物线趋势预测模型为,
[公式 10— 11]
? ?
? ?
2
24
22
2
2
24
224
2
,,
?
??
???
?
?
??
? ???
?
?
?
?
?
?
?
???
?
ttn
tyytn
c
t
ty
b
ttn
yttty
a
cba
ctbtay
kt
的一般公式为:此时求解
[ 例 10— 6]
(万元))()(
值为:年农产品收购额的预测
4.6 1 8148 8 1.3140 3 3.442 3 8.3 0 1?
2 0 0 5
8 8 1.30 3 3.442 3 8.3 0 1?
8 8 1.3
2 7 7 2
1 0 7 5 8
607 0 89
602 9 4 42 0 8 2 29
0 3 3.44
60
2 6 4 2
2 3 8.3 0 1
2 7 7 2
8 3 5 0 3 2
607 0 89
2 0 8 2 2607 0 82 9 4 4
2
1
2
2
2
??????
???
??
??
???
?
??
??
??
???
?
?t
t
y
tty
c
b
a
二, 取点法
取点预测法的具体做法是:根据预测模型
参数的多少, 在时间数列的首, 尾或者首, 中,
尾分别取三项或五项数值, 从远到近用 1,2,
3或 1,2,3,4,5加权平均, 这样来确定两个
点, 或者三个点, 通过这两点或三点来估计模
型的参数 。 直线预测模型由于只需要确定两个
参数, 因此确定, 尾两点即可 。
二次曲线预测模型有三个参数, 因此需确
定首, 中, 尾三个点 。 值得注意的是, 三点间
距应相等 。 若时间数列为偶数时, 通常删去最
早一期数据 。 每一个点是取三项还是五项, 完
N来确定 。 当时间数列
N很大时, 一般取五项平均;当时间数
N不大时, 一般取三项平均 。
(一 )直线趋势预测模型
求参数 a,b的计算公式为,
[公式 10— 12]
[公式 10— 13]
)(
5
3
11
)(
3
3
7
五项加权平均
三项加权平均
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
N
RT
b
bRa
N
RT
b
bRa
btay kt ????
[ 例 10— 8]
(亿元)
(亿元)
年的预测财政收入为:年、用这一模型得
则
那么
04.117)211(52.728.19?
52.109)111(52.728.19?
20062005
52.728.19?
28.1952.7
3
7
83.36
3
7
52.7
311
83.3697
3
97
6
103394285
6
32
83.36
6
40336229
6
32
13
12
321
321
????
????
??
??????
?
?
?
?
?
?
?
?
????
?
??
?
?
????
?
??
?
?
???
y
y
ty
bRa
N
RT
b
yyy
T
yyy
R
kt
NNN
(二 )二次曲线趋势预测模型
a,b,c的计算公式为,
[公式 10— 14]
[公式 10— 15]
? ?
? ?
? ?
? ?
)(
5
22
3
73
5
15
3
11
)(
3
22
3
53
3
6
3
7
2
2
五项加权平均
三项加权平均
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
???
N
STR
c
c
N
N
RT
b
cbRa
N
STR
c
c
N
N
RT
b
cbRa
2? ctbtay t ???
[ 例 10— 8]
? ?
? ?
? ?
? ?
(亿元)
年出口额的预测值为:用这一模型得
86.1 3 0 2)211(52.7)211(49.6448.493?
2 0 0 6
52.749.6448.493?
48.49375.96)49.64(
3
7
5.4016
3
7
49.6475.9
3
5113
311
5.40183.873
3
53
3
75.9
311
67.481283.8735.4012
3
22
83.873
6
5 2 4 3
6
32
67.481
6
2 8 9 0
6
32
5.401
6
2 4 0 9
6
32
2
13
2
22
11109
765
321
??????
???
??????????
???
??
?
?
?
?
?
?
?
?
?
?
?
????
?
?
??
?
??
??
?
??
??
?
??
??
?
y
tty
cbRa
c
N
N
RT
b
N
STR
c
yyy
T
yyy
S
yyy
R
t
第四节
回归模型预测
一, 一元线性回归模型预测
(一 )一元线性回归模型的建立
x和 y为两个相关变量, 其中 x为自变量,
y为因变量 。 若通过样本数据判定两变量间存
在线性相关关系, 则其一元线性回归模型为,
xbby t 10? ??
(二 )模型参数的估计方法
在最小平方法下, 求参数 b0 及 b1 的公式为,
[公式 10— 16]
? ?? ?
? ??
??
?
?
?
??
2
2
1
10
xxn
yxxyn
b
n
x
b
n
y
b
(三 )
例 10— 10] ? ?
)(67.1912367927.05932.4?
2005
7927.05932.4?
5932.44.1117927.09.92
7927.0
111414058210
929111411655710
?
10
22
2
1
10
亿元
为:年消费支出额点预测值所以,
可以预测模型为
????
??
??????
?
??
???
?
?
?
?
??
? ?
? ??
y
xy
xbyb
xxn
yxxyn
b
xbby
二, 多元回归预测
(一 )多元线性回归模型的建立
uxbxbxbby pp ?????? ?22110
(二 )模型参数的估计方法
用最小平方法求参数 。
[公式 10— 17]
?? ???
????
???
???
???
???
2
22211202
212
2
11101
22110
xbxxbxbyx
xxbxbxbyx
xbxbnby
22110? xbxbby t ???
???
???
??
?
???
2
2212
21
2
11
21
2
2
1
1
0
0
xxxx
xxxx
xxn
D
D
Db
b
D
Db
b
D
Db
b,,
???
???
???
?
2
2212
21
2
11
21
0
xxxyx
xxxyx
xxy
Db
???
???
??
?
2
222
2111
2
1
xyxx
xxyxx
xyn
Db
???
???
??
?
yxxxx
yxxx
yxn
Db
2212
1
2
11
1
2
(三 )二元线性回归预测模型的运用
[ 例 10— 11]
设二元线性回归方程为,
其中,
22110? xbxbby t ???
D
Dbb
D
Dbb
D
Dbb 2
2
1
1
0
0 ???,,
先按标准方程组的要求计算出有关数据,
将计算结果代入方程组,得,
210
210
210
19.373.3105.188.1 6 3 4
3.3102 8 6 21601 3 4 9 7
5.1816010789
bbb
bbb
bbb
???
???
???
b0,b1,b2,
(万件)
,,,
13.1 1 85.24 8 7 6.58261 2 1 2 8.02 4 2 5.31?
4 8 7 6.581 2 1 2 8.02 4 2 5.31?
4 8 7 6.58
4.6 9 0 9
4 0 4 1 1 4
1 2 1 2 8.0
4.6 9 0 9
8 3 8
2 4 2 5.31
4.6 9 0 9
2.2 1 5 8 6 7
4 0 4 1 1 48 3 82.2 1 5 8 6 74.6 9 0 9
21
2
2
1
1
0
0
210
???????
????
???
???
??
?
??
?????
y
xxy
D
Db
b
D
Db
b
D
Db
b
DbDbDbD
三、回归预测应注意的问题
(一 )对预测对象进行定性分析
(二 )对回归系数进行分析
(三 )注意样本资料的结构变形
(四 )注意因变量的滞后变动
(五 )注意变量间的非线性关系
统计预测误差分析
第五节
一, 分析预测误差的意义
研究产生预测误差的原因, 计算与分析
误差的数量, 不但可以认识预测结果的准确
性, 为编制计划, 进行决策提供可靠的依据,
而且也有利于改进预测工作, 发展和完善预
测理论 。
二, 影响预测准确度的主要因素
(一 )模型的科学性
(二 )数据资料的可靠性
(三 )统计方法的正确性
(四 )主观判断的准确性
三, 预测准确度的测量
(一 )单个预测值的误差
,计算公
式为,
[公式 10— 18]
式中,et为预测误差; et= 0为准确预测; et>0为
低估预测; et<0为高估预测 。
),,2,1(? ntyye ttt ????
(二 )总预测误差
,计算公式为,
[公式 10— 19]
nn
n
n
t
t
yyyyyy
eeee
???
2211
21
1
???????
?????
?
?
?
?
(三 )平均绝对误差
n个误差绝对值的平均数, 通常用 MAD
表示, 计算公式为,
[公式 10— 20]
n
yy
n
e
M A D
n
t
tt
n
t
t ??
??
?
?? 11
?
(四 )预测相对误差
[公式 10— 21]
。
t
t
t
t
t y
y
y
e
R
?
1 ???
(五 )均方根误差
均数的算术根, 通常用 Syx表示 。 其计算公
10— 22]
? ?
n
yy
S
n
t
nn
yx
?
?
?
? 1
2
?
四, 统计预测误差的计算
[ 例 10— 12]
根据资料, 分别配合二次抛物线和趋势直线,
用最小平方法求参数值 。
(一 )配合抛物线
2
2
8 2 1 4.075.26 7 8 6.15?
8 2 1 4.075.26 7 8 6.15
,,
?
tty
cba
cba
ctbtay
???
???
???
,,
求解
(二 )配合趋势直线
? ?
ty
n
t
b
n
y
a
ttn
yttyn
b
btay
t
t
14.1037.3?
37.3
8
36
8
8
392
14.10
362048
3923621908
?
22
2
??
??????
?
??
???
?
?
?
?
??
??
? ?
? ??
(三 )进行预测误差分析
抛物线模型的均方根误差为,
趋势直线方程的均方根误差为,
? ?
4 0 4.1
8
77.15
?
1
2
??
?
?
?
?
n
yy
S
n
t
nn
yx
? ?
02.4
8
12.129
?
1
2
??
?
?
?
?
n
yy
S
n
t
nn
yx
上述计算结果表明,就本例的资料而言,用最小
平方法拟合的二次抛物线方程的预测误差要小于用
最小平方法拟合的趋势直线预测方程的预测误差。
当然外推预测时,其效果如何,还必须根据现象本
身的进一步发展来判定。此外,还可运用预测误差
分布图来研究预测误差。