统计学概论
曾五一 主编
陈珍珍、罗乐勤副主编
1-2
第一章 绪论
? 第一节 什么是统计
? 第二节 统计学的种类及其性质
? 第三节 统计学的基本概念
1-3
第一节 什么是统计
? 一、无处不在的统计
? 2005年 4月 1日,笔者利用“搜狗” 对互联网进行搜
索,得到的结果是:包含,统计”这一词汇的网页
高达 34,692,925项,包含“粮食”这一词汇的网
页有 5,045,290项,前者是后者的 60多倍。
? 在诺贝尔经济学获奖者中,三分之二以上的研究成
果与统计和定量分析有关。因此,著名经济学家萨
缪尔森在其经典的教科书,,经济学, 12版中特别
提到:“在许多与经济学有关的学科中,统计学是
特别重要的”。 诺贝尔经济学奖得主
1-4
? 美国杜邦公司的总经理理查德曾经指出“现代公司
在许多方面是根据统计来行事的。”(转引自, 马
夸德特谈统计学家的重要作用,,, 统计教育,
1994年第 3期)。
? 美国总统布什的年薪已经达到 40万美元,在各国元
首中名列首位,但根据美国, 工作等级年鉴, 一书
的排名,总统一职并未进入最好工作之列。根据该
书的统计,在美国,工作环境最好的工作是:统计
学家。(转引自 2002年 3月 7日, 扬子晚报, )
1-5
? 1981年,首届国际, 红楼梦, 研讨会在美国
召开,威斯康星大学讲师陈炳藻独树一帜,
宣读了题为, 从词汇上的统计论 〈 红楼梦 〉
作者的问题, 的论文。他从字、词出现频率
入手,通过计算机进行统计、处理、分析,
对, 红楼梦, 后 40回系高鹗所作这一流行看
法提出异议,认为 120回均系曹雪芹所作。
? 精确到小数点的爱情 --统计学博士的求婚信
1-6
统计数字
? 大仲马的作品多曲折感人,而大仲马又多私生子,
所以,取笑讥讽他的人,往往把他的 作品比作他的
私生子。 最使他头痛的是巴黎统计学会的秘书长李
昂纳,这人是大仲马的朋友,每次举统计数字 的例
子,总是说大仲马的情妇和私生子有多少。 有一年
该统计学会开年会,大仲马估计,李昂纳又要大放
厥词,说他的坏话了。于是他 请求参加年会,获得
了批准,果然不出大仲马所料,李昂纳又举他的情
妇和私生子的例子。 李昂纳报告完毕,请大仲马致
词。一向不愿在大庭广众之下发表演讲的大仲马,
这次却 破例登台说:“所有统计数字都是撒谎的,
包括有关本人的数字在内。”听众哄堂大笑。
1-7
? 数学家的幽默
统计学家调侃数学家:你们不是说若X=Y且Y=
Z,则X=Z吗!那么想必你若喜欢一个女孩,那
么这个女孩喜欢的男生你也喜欢吧?
数学家反问道:那么你把左手放到一锅一百度的开
水中,右手放到一锅零度的冰水里想来也没事吧!
因为它们平均不过是五十度而已!”
? 由上可知,统计与数量有关,同时它已经渗透到社
会经济活动和科学研究的方方面面,统计无处不在。
那么究竟何为统计?统计是如何开展研究的?作为
一门科学的统计学与其他学科有何区别与联系?这
些正是本章所要介绍的主要内容
1-8
二、统计 (Statistics)的涵义
? 统计是人们认识客观世界总体
数量变动关系和变动规律的活
动的总称,是认识客观世界的
有力工具。
? 统计的研究对象的特点:
? (一)数量性。统计数据是客观
事物量的反映。
? (二)总体性。统计的数量研究
是对现象总体中各单位普遍存在
的事实进行大量观察和综合分析。
? (三)变异性。总体各单位的特
征表现存在着差异,而且这些差
异并不是事先可以预知的。
1-9
日常生活中,,统计, 的 3种含义
? 统计工作(又称统计实践)是搜集、整理、分析和
提供关于社会经济现象的数字资料工作的总称。
? 英文中的统计 statistics与“国家” 同一词根,可以说,自
从有了国家,就有统计实践活动。
? 统计数据是统计实践活动的成果。
? 如:经济增长速度、价格指数等。
? 对统计数据要求:客观性、准确性和及时性。
? 统计学是研究如何测定、收集、整理、归纳和分析
反映客观现象总体数量的数据,以便给出正确认识
的 方法论科学 。
? 统计学与统计实践活动的关系是理论与实践的关系,理论
源于实践,理论又高于实践,反过来又指导实践
1-10
二、统计研究的基本环节
统计设计
收集数据
整理与分析
资料积累
开发应用
描述统计
推断统计
统计调查、
实验
1-11
统计研究的全过程包括以下基本环节:
? (一)统计设计
? 根据所要研究问题的性质,在有关学科理论的指导下,制定
统计指标、指标体系和统计分类,给出统一的定义、标准。
同时提出收集、整理和分析数据的方案和工作进度等。搞好
统计设计不仅要有统计学的一般理论和方法为指导,而且还
要求设计者对所要研究的问题本身具有深刻的认识和相关的
学科知识。
? (二)收集数据
? 统计数据的收集有两种基本方法。对于大多数自然科学和工
程技术研究来说,有可能通过有控制的科学实验去取得数据,
这时可以采用实验法。对于社会经济现象来说,一般无法进
行重复实验,要取得有关数据就必须进行调查观察。
1-12
? (三)整理与分析
? 描述统计是指对采集的数据进行登记、审核、整理、归类,
在此基础上进一步计算出各种能反映总体数量特征的综合指
标,并用图表的形式表示经过归纳分析而得到的各种有用的
统计信息。
? 推断统计是在对样本数据进行描述的基础上,利用一定的方
法根据样本数据去估计或检验总体的数量特征。推断统计是
现代统计学的主要内容。
? (四)统计资料的积累、开发与应用
? 对于已经公布的统计资料需要加以积累,同时还可以进行进
一步的加工,结合相关的实质性学科的理论知识去进行分析
和利用。如何更好地将统计数据和统计方法应用于各自的研
究领域是应用统计学研究的一个重要方面。
1-13
第二节 统计学的种类及其性质
? 一、统计学的产生与发展
? (一)政治算术学派
? 最早的统计学源于 17世纪英国。其代表人物是威廉.配第
(William Patty,1623—1687年 ) 。威廉 ·佩第在, 政治算术一
书中,写到:本书“不用比较级、最高级进行思辨或议论,而
是用数字 …… 来表达自己想说的问题 …… 借以考察在自然中
有可见的根据的原因。” 政治算术学派主张用大量观察和数
量分析等方法对社会经济现象进行研究的主张,为统计学的
发展开辟了广阔的前景。
? (二)国势学派
? 最早使用“统计学”这一术语的是德国国势学派。国势学派
虽然创造了统计学这一名词,但他们主要使用文字记述方法
对国情国力进行研究,其学科内容与现代统计学有较大差别。
1-14
? (三)社会统计学派
? 1850年,德国的统计学家克尼斯 (K.G.A.knies)发表了题为
,独立科学的统计学, 的论文,提出统计学是一门独立的社
会科学,是一门对社会经济现象进行数量对比分析的科学,
他主张以“国家论”作为国势学的科学命名,而以“统计学”
作为“政治算术”的科学命名。 在德国、日本和前苏联,社
会统计学派都曾有相当大的影响。
? 各国学者在社会经济统计指标的设定与计算、指数的编制、
资料的收集与整理、统计调查的组织和实施、经济社会的数
量分析和预测等方面做出的贡献已成为现代统计学的重要组
成部分。例如,“恩格尔系数”,至今仍为人们广泛使用。
国民收入和国内生产总值的核算方法被称为,20世纪最伟大
的发明之一。”
1-15
(四)数理统计学派
? 创始人是比利时统计学家凯特勒 (Adolphe Quetelet,
1796—1874年 )。他所著的代表作, 社会物理学, 等
将概率论和统计方法引入社会经济方面的研究。
? 认为统计学是一门通用的方法论科学。
? 从 19世纪中叶到 20世纪中叶,数理统计学得到迅速
发展。
? 英国生物学家高尔顿提出并阐述了“相关”的概念;
? 皮尔逊提出了计算复相关和偏相关的方法。
? 戈塞特建立了“小样本理论”,即所谓的,t分布”;
? 费歇 样本相关系数的分布、方差分析、实验设计等方面
的研究中做出了重要贡献。
? 到 20世纪中期,数理统计学的基本框架已经形成。数理统
计学派成为英美等国统计学界的主流。
1-16
二、理论统计学和应用统计学
? 历经 300多年的发展,统计学目前已经成为横跨社会
科学和自然科学领域的多科性的科学。
?,统计学是有关如何测定、收集和分析反映客观现
象总体数量的数据,以便给出正确认识的方法论科
学。”从横向看,各种统计学都具有上述共同点,
因而能够形成一个学科“家族”。从纵向看,统计
学方法应用于各种实质性科学,同它们相结合,产
生了一系列专门领域的统计学。
? 由此可见,现代统计学可以分为两大类:一类是以
抽象的数量为研究对象,研究一般的收集数据、整
理数据和分析数据方法的理论统计学。另一类是以
各个不同领域的具体数量为研究对象的应用统计学。
1-17
图 1-2 统计学学科体系












































统 计 学



















1-18
? 理论统计学把研究对象一般化、抽象化,以数学中的概率论
为基础,从纯理论的角度,对统计方法加以推导论证,其中
心内容是以归纳方法研究随机变量的一般规律。理论统计学
的特点是计量不计质,它具有通用方法论的理学性质。
? 应用统计学是有具体对象的方法论。所谓应用既包括一般统
计方法的应用,更包括各自领域实质性科学理论的应用。应
用统计学从所研究的领域或专门问题出发,视研究对象的性
质采用适当的指标体系和统计方法,解决所需研究的问题。
应用统计学不仅要进行定量分析,还需要进行定性分析。所
以应用统计学通常具有边缘交叉和复合型学科的性质。
? 理论统计学和应用统计学总是互相促进,共同提高的。理论
统计的研究为应用统计提供方法论基础,应用统计学在对统
计方法的实际应用中,又常常会对理论统计学提出新的问题,
开拓理论统计学的研究领域。
1-19
? 社会经济统计学
? 是一门以社会经济现象的数量方面为特定研究对象的应用统
计学。
? 要在社会经济领域应用统计方法,必须解决如何科学地测定
社会经济现象即如何科学地设置指标的问题。要对社会经济
问题进行统计分析,也必须以有关的经济与社会理论为指导。
因此,社会经济统计学的特点是在质与量的紧密联系中,研
究事物的数量特征和数量表现。
? 由于社会经济现象所具有的复杂性和特殊性,社会经济统计
学不仅要应用一般的统计方法,而且还需要研究自己独特的
方法,如核算的方法、综合评价的方法等等。
? 通过社会经济统计,国家可以准确、及时、全面、系统地掌
握国民经济和社会发展情况,对国民经济和社会运行监督和
预警,为宏观调控和决策提供依据。企业可以及时了解商品
市场和要素市场运行的状况和企业自身的经营动态,为企业
营销决策、投资理财提供参考。
1-20
三、统计学与有关学科的联系与区别
? 数学与统计学。
? 数学与统计学都是研究数量规律的,都要利用各种公式进
行运算。数学中的概率论,为统计学提供了数量分析的理
论基础。统计学中的理论统计学以抽象的数量为研究对象,
其大部分内容也可以看作是数学的分支。
? 统计学与数学的区别。
? 从研究对象看,数学以最一般的形式研究数量的联系和空间形式。
统计学特别是应用统计学则总是与客观的对象联系在一起的。
? 从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计
本质上是归纳的方法。统计学家特别是应用统计学家需要深入实
际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,
而且还要掌握某一专门领域的知识。
1-21
统计学与经济学
? 统计学与相关的实质性学科如经济学等,有密切的
联系。
? 统计学是开展经济研究不可或缺的重要工具。通过统计的
实证研究,可以帮助人们认识有关的数量规律,同时检验
经济学理论的真实性和完善程度。
? 经济学等实质性学科对经济统计学起着重要的指导作用。
不仅统计指标的设定离不开实质性学科的指导,而且应用
统计方法也在很大的程度上受所研究对象性质的影响。
? 统计学与相关实质性学科的区别。
? 实质性学科研究该领域现象的本质关系并对有关规律作出合理的
解释和论证。而统计学只是为实质性学科研究和认识数量规律提
供专门的方法和工具,并不直接对规律产生的原因和机理作进一
步的分析。
1-22
? 统计学家未必是经济学
家,经济学家也未必是
统计学家。但经济统计
学家应当既是统计学家
又是经济学家。经济学数学
统计学
1-23
第三节 统计学的基本概念
? 一、总体与总体单位
? 统计总体是根据一定目的确定的所要研究的事物的全体。它
是由客观存在的、具有某种共同性质的许多个别事物构成的
整体。例如要研究全国城镇居民的收支情况,就以全国城镇
居民作为一个总体。。
? 同质性是确定统计总体的基本标准,它是根据统计的研究目
的而定的。
? 研究目的不同,则所确定的总体也不同,其同质性的意义也
随之变化。例如,研究城镇居民贫困户的生活状况,那么,
贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇
居民户是同质的,而贫困线上的城镇居民户是非同质的。
? 统计总体还应具备大量性。统计总体应该由足够数量的同质
性单位构成。
1-24
? 总体单位(简称单位)是组成总体的各个个体。根
据研究目的的不同,单位可以是人、物、机构等实
物单位,也可以是一种现象或活动等非实物单位。
? 总体和单位的概念是相对而言的,随研究目的不同,
总体范围不同而变化。同一研究对象,在一种情况
下为总体,但在另一情况下又可能变成单位。
? 根据总体所包含的单位数量,总体可以分为有限总
体和无限总体两类。有限总体是由有限量的单位构
成的总体。当总体单位数难以确定,其数量可能是
无限时,便构成无限总体。
1-25
? 二、样本
? 当总体单位数量很多甚至无限时,不必要或不可能对构成总
体的所有单位都进行调查。这时,需要采用一定的方式,从
由作为研究对象的事物全体构成的总体(又称母体)中,抽
取一部分单位,作为总体的代表加以研究。这种由总体的部
分单位组成的集合称为样本(又称子样)。样本也由一定数
量的单位构成的,样本所包含的总体单位数称为样本容量。
? 三、标志
? 总体各单位普遍具有的属性或特征称为标志。例如每个工人
都具有性别、工种、文化程度、技术等级、年龄、工龄、工
资等属性和特征,这些就是工人作为总体单位的标志。
1-26
? 标志分为品质标志和数量标志两种。品质标志表明单位属性
方面的特征,品质标志的表现只能用文字、语言来描述如工
人的性别。数量标志表明单位数量方面的特征,可以用数值
来表现,如年龄。
? 如果一个总体中各单位有关标志的具体表现都相同,称之为
不变标志。例如在工人这一总体中,职业是不变标志。在一
个总体中,当一个标志在各单位的具体表现有可能不同时,
这个标志便称为变异标志。例如各人的工龄可能表现不同,
因而是可变标志。
? 一个总体至少要有一个不变标志,才能够使各单位结合成一
个总体。不变标志是总体同质性的基础。
? 作为总体,同时必须存在变异标志,这表示所研究的现象在
各单位之间存在着差异,才需要进行统计研究。
1-27
四、统计指标与指标体系
? 统计指标是反映统计总体数量特征的概念和数值。
如 2002年我国国内生产总值 104790.6亿元。
? 统计指标由两项基本要素构成,即指标的概念(名称)和
指标的取值。
? 指标的概念(名称)是对所研究现象本质的抽象概括,也
是对总体数量特征的质的规定性。确定统计指标必须有一
定的理论依据,使之与社会经济或科学技术的范畴相吻合。
同时,又必须对理论范畴和计算口径加以具体化。
? 指标的数值反映所研究现象在具体时间、地点、条件下的
规模和水平。在观察指标数值时,必须了解其具体的时间
状态、空间范围、计量单位、计量方法等限定,同时注意
由于上述条件的变化而引起数值的可比性问题。
1-28
指标与标志的关系
? 标志反映总体单位的属性和特征,而指标则反映
总体的数量特征。标志和指标的关系是个别和整
体的关系。需要通过对各单位标志的具体表现进
行汇总和计算才能得到相应的指标。
? 总体和单位的概念会随着研究目的不同而变化,
因此指标与标志的概念也是相对而言的。例如,
所要研究的是全国工业企业的情况,则各企业的
职工人数、固定资产、工业增加值等都是总体单
位(即各个企业)的标志,如果研究目的变成研
究某一企业的职工状况,则该企业变成一个总体,
企业职工人数变成了统计指标,每个职工的文化
程度、技术等级、性别等就成为标志。
1-29
? 统计指标可以分为数量指标和质量指标。
? 凡是反映现象总规模、总水平的统计指标称为数量指标。
例如人口总数、企业总数、商品进出口总额等等,这些指
标反映现象或过程的总规模和水平,所以也称为总量指标,
用绝对数来表示。
? 凡是反映现象相对水平和工作质量的统计指标称为质量指
标,例如职工平均工资、人口密度、工人出勤率等等。质
量指标是总量指标的派生指标,用相对数或平均数来表示,
以反映现象之间的内在联系和对比关系。
? 统计指标体系是由一系列相互联系的统计指标所组
成的有机整体。用以反映所研究现象各方面相互依
存相互制约的关系。例如,工业企业统计指标体系。
1-30
五、统计数据
? (一)变量与变量值
? 说明现象的某一数量特征的概念也被称为变量,变量的具体
取值是变量值,统计数据就是统计变量的具体表现。
? 例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。
? 为了区别,在本书中,凡是变量均用大写的英文字母表示,而变量值
则用小写英文字母表示。
? 连续型变量是指变量的取值在数轴上连续不断,无法一一列
举,即在一个区间内可以取任意实数值。
? 例如,气象上的温度、湿度,零件的尺寸等。
? 离散型变量是指变量的其取值是整数值,可以一一列举。
? 例如,企业数,职工人数等。
1-31
? 确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。
? 随机变量则是受许多微小的不确定因素(又称随机
因素)影响的变量。变量的取值无法事先确定。
? 社会经济现象既有确定性变量也有随机变量。统计
学所研究的主要是随机变量。
? (二)数据的计量尺度
? 统计数据是总体单位标志或统计指标的具体数量表
现。
? 根据对研究对象计量的不同精确程度,人们将计量
尺度由低到高、由粗略到精确分为四个层次:定类
尺度、定序尺度、定距尺度和定比尺度。
1-32
? 1.定类尺度是按照客观现象的某种属性对其进行分类。这
一场合的所使用的数值只是作为各种分类的代码,并不反
映各类的优劣、量的大小或顺序。例如,人口按性别分为
男女,用,1”表示男性,用,0”表示女性。定类尺度的主
要数学特征是,=”或,≠”。在统计处理中,对于不同的
类别,虽然可以计算单位数,但它不能表明第一类的一个
单位可以相当于第二类的几个单位。
? 2.定序尺度是对客观现象各类之间的等级差或顺序差的一
种测度。利用定序尺度不仅可以将研究对象分成不同的类
别,而且还可以反映各类的优劣、量的大小或顺序。例如,
学生成绩可以分为优、良、中、及格和不及格等五类。在
这里,定序尺度虽然无法表明一个优等于几个良,但却能
确切地表明优高于良,良又高于中 …… 。定序尺度的主要
数学特征是,<”或,>”。
1-33
? 3.定距尺度是对现象类别或次序之间间距的测度。定距尺
度不但可以用数表示现象各类别的不同和顺序大小的差异,
而且可以用确切的数值反映现象之间在量方面的差异。定
距尺度使用的计量单位一般为实物单位 (自然或物理 )或者
价值单位。定距尺度的主要数学特征是,+”或,–”。统计
中的总量指标就是运用定距尺度计量的。
? 4.定比尺度。定比尺度是在定距尺度的基础上,确定相应
的比较基数,然后将两种相关的数加以对比而形成相对数
(或平均数 ),用于反映现象的结构、比重、速度、密度等
数量关系。例如,将一个企业创造的增加值与该企业的职
工人数对比,计算全员劳动生产率,以此反映该企业的生
产效率。定比尺度的主要数学特征是,×,或,÷,。
1-34
(三 )数据的类型
? 横截面数据又称为静态数据,它是指在同一
时间对同一总体内不同单位的数量进行观察
而获得的数据。
? 时间序列数据又称为动态数据,它是指在不
同时间对同一总体的数量表现进行观察而获
得的数据。
? 例如,2005年全国各省市自治区的国内生产总值
就属于横截面数据。而“十五”期间我国历年的
国内生产总值就属于时间序列数据。
1-35
(四 )数据的表现形式
? 绝对数。现象的规模、水平一般以绝对数形式表现。绝对数
的计量单位一般为实物单位或价值单位,有时也采用复合单
位。实物单位可以是自然计量单位,也可以是物理计量单位,
如人口数用人计量,机器数用台计量,对于一些化工产品和
燃料,常常还折合成标准实物单位计量。复合计量单位是由
两种或两种以上计量单位复合而成的,如以“吨公里”为货
物周转量的计量单位,以“千瓦时”为用电量的计量单位。
? 相对数。相对数由 2个互相联系的数值对比求得。常用的相
对数包括:结构相对数、动态相对数、比较相对数、强度相
对数、利用程度相对数、计划完成相对数等。
? 平均数。平均数反映现象总体的一般水平或分布的集中趋势。
关于这部分的内容,本书将在第三章作详细介绍。