统 计 学兰州商学院统计学院
第一章 绪 论
第二章 统计数据的搜集与整理
第三章 数据分布特征的描述
第四章 时间序列分析
第五章 统计指数
第六章 抽样与抽样估计
第七章 假设检验
第八章 相关与回归分析
第九章 国民经济统计概述第一章 绪 论
第一节 统计与统计学
第二节 统计学的分科
第三节 统计学与其他学科的关系
第四节 统计学的产生与发展
第五节 统计学的基本概念第一节 统计与统计学一,统计与统计学的含义二,统计数据的规律与统计方法什么是统计?
1,统计工作
– 收集数据的活动
2,统计数据
对现象计量的结果
3,统计学
– 分析数据的方法与技术什么是统计学?
1,数据搜集:如,调查与试验
2,数据整理:如,分组
3,数据显示:如,图和表
4,数据分析:如,回归分析
统计学是一门收集,整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识
Statistics的定义
Statistics,the science of collecting,
analyzing,presenting,and interpreting
data,
Copyright 1994-2000 Encyclopaedia Britannica,
Inc,(不列颠百科全书)
统计数据的内在规律
(一些例子)
1,正常条件下新生婴儿的性别比为 107,100
2,投掷一枚均匀的硬币,出现正面和反面的频率各为 1/2;投掷一枚骰子出现 1~ 6点的频率各为 1/6
3,农作物的产量与施肥量之间存在相关关系统计学的性质和特点
性质统计学是一门研究
1、从研究对象看,研究客观事物总体数量方面,
其对象具有:总体性;数量性;具体性。
客观事物 数量方面的 方法论科学。
特点
2、从方法核心看,强调对客观总体进行大量观察,
通过归纳推理以获得总体数量方面的综合性认识。
3、从学科体系看,是一门多科性的学科“家族”
统计方法统计方法描述统计 推断统计参数估计 假设检验一,描述统计学和推断统计学二,理论统计学和应用统计学三,统计学与其他学科的关系第二节 统计学的分科统计学的分科描述统计 推断统计
统计学的分科理论统计 应用统计描述统计
1,内容
– 搜集数据
– 整理数据
– 显示数据
2,目的
– 描述数据特征
– 找出数据的基本规律
0
25
50
Q1 Q2 Q3 Q4

x = 30 s2 = 105
推断统计
1,内容
参数 估计
假设检验
2,目的
对总体特征作出推断样本总体描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计
(利用样本信息和概率论对总体的数量特征进行估计和检验等)
概率论
(包括分布理论、大数定律和中心极限定理等)
描述统计
(统计数据的搜集、整理
、显示和分析等)总体数据样本数据统计学探索现象数量规律性的过程理论统计与应用统计
1,理论统计
研究统计学的一般理论
研究统计方法的数学原理
2,应用统计
研究统计学在各领域的具体应用统计学的应用领域统计学经济学管理学医学工程学社会学 …
应用统计的领域
actuarial work (精算 ) agriculture (农业 )
animal science (动物学 ) anthropology (人类学 )
archaeology (考古学 ) auditing (审计学 )
crystallography (晶体学 ) demography (人口统计学 )
dentistry (牙医学 ) ecology (生态学 )
econometrics (经济计量学 ) education (教育学 )
election forecasting and projection (选举预测和策划 )
engineering (工程 ) epidemiology (流行病学 )
finance (金融 )
fisheries research (水产渔业研究 )
gambling (赌博 ) genetics (遗传学 )
geography (地理学 ) geology (地质学 )
historical research (历史研究 ) human genetics (人类遗传学 )
应用统计的领域 (续 )
hydrology (水文学 ) Industry (工业 )
linguistics (语言学 ) literature (文学 )
manpower planning (劳动力计划 )
management science (管理科学 )
marketing (市场营销学 ) medical diagnosis (医学诊断 )
meteorology (气象学 ) military science (军事科学 )
nuclear material safeguards (核材料安全管理 )
ophthalmology (眼科学 ) pharmaceutics (制药学 )
physics (物理学 ) political science (政治学 )
psychology (心理学 ) psychophysics (心理物理学 )
quality control (质量控制 ) religious studies (宗教研究 )
sociology (社会学 ) survey sampling (调查抽样 )
taxonomy (分类学 ) weather modification (气象改善 )
统计学与其他学科的关系
统计学与数学的关系
统计学与其他学科的关系统计学与数学的关系
(联系)
1,统计学运用到大量的数学知识
2,数学为统计理论和统计方法的发展提供基础
3,不能将统计学等同于数学统计学与数学的关系
(区别)
1,数学研究的是抽象的数量规律,统计学则是研究具体的,实际现象的数量规律
2,数学研究的是没有量纲或单位的抽象的数,统计学研究的是有具体实物或计量单位的数据
3,统计学与数学研究中所使用的逻辑方法不同
数学研究所使用的主要是的演绎
统计学则是演绎与归纳相结合,占主导地位的是归纳统计学与其他学科的关系
1,统计学可以用到几乎所有的学科领域
2,统计学可以帮助其他学科探索学科内在的数量规律性
3,统计学不能解决各学科领域的所有问题
4,对统计分析结果的解释需要各学科领域的专业人员
一、统计的产生与发展
二、古典统计学的起源及演变
三、近代统计学的形成及演变
四、现代统计学的形成及发展第三节 统计学的产生与发展一、统计的产生与发展
统计的起源可以追溯到远古时代,它是随着人类社会生产的发展,随着治国和管理的需要而产生发展起来的,至今有四五千年的历史。
1、原始社会时期,就有结绳记事、结绳计量的方法,
这是统计的萌芽阶段。
2、我国很早就出现了统计活动,并且一直到封建社会的很长一段时间里,在实际的统计活动及统计思想等众多方面都处于世界各国的先进水平,只是到了封建社会后期,我国开始落后于其他国家。
夏朝,我国就有了人口、土地等方面的统计。当时为了治国治水的需要,进行国初步的国势调查,将全国分为九州,并按土质的优劣将九州的田、赋分成上中下三等,
每等又分为上中下三级,形成了,三等九级,的复合分组。这被欧洲统计学者称为国势统计学最早的萌芽。
西周 已设有专门负责国势调查的官员 ——职方氏。
春秋战国时期的管仲提出了系统、周密的国情调查提纲与国情研究纲要,指出,举事必成,不知计数不可,,,不明于计数而欲举大事,犹无舟楫而欲经于水险也,,因此要求,明法审数,。
说明统治阶级和精明的政治家认识到了统计的重要性。
秦国 的商鞅提出,强国知十三数:境内仓、口之数,壮男、壮女之数,老、弱之数,官、士之数,
以言说取食者之数,利民之数,马、牛、刍、蒿之数。,
到了 秦汉,就有了地方田亩和户口的记录。
唐宋 有了统计资料的汇编 ——,国计簿,,,会计录,,同时在统计图表的理论和方法方面有了较大的发展。
明清时期,建立了经常人口登记和保甲制度(一种户籍制度,若干户为一甲,若干甲为一保),
特别是明初的户贴制度被称为,世界上最早实行全面人口普查的历史记录,。
3、西方
古埃及为建造金字塔和农业灌溉系统,进行了全国的人口及财产调查;而古罗马帝国以国势调查作为治理国家的有效手段,规定每 5年进行一次人口、土地、牲畜、家奴的调查。到了封建社会,统计调查往往采取编制财产目录的形式,后来则成为说明各国国情的工具。
进入资本主义社会以后,随着社会生产力的发展,对于统计数据资料的需求增多,此时开始出现了专业的统计机构和研究组织,统计初步发展成为社会分工中的一个独立部门,到了 17世纪中叶,统计学应运而生。
二、古典统计学的起源及其演变
统计学从古典统计学到现代统计学,几经演变,已有 300多年的历史。
我们说,古典统计学有三个源头:国势学、政治算术和概率论。
(一)国势学与统计学的演变
国势学产生于 17世纪中叶的德国,以 康令 和 阿亨瓦尔 为代表。
1、最初,康令将国势学从,国法学、地理学、历史学混合在一起的杂学,中分离出来。
2,其后,阿亨瓦尔于 1749年改称国势学为统计学,并将其明确定义为,,主要 采用文字记述的方法,把国家的显著事项全部记述下来的学科,。此时,有统计学之名,但无统计学之实。
3,后期,在政治算术学派的影响下,德国从国势学中分化出的表式学派,改用列表的方法研究社会经济现象的数量方面,
开始体现统计学的特点。表式学派逐渐发展为政府记录或政府统计,成为统计学的渊源之一,使徒有统计学虚名的国势学向近代统计学迈进了一步。
(二)政治算术与统计学的演变
政治算术产生于 17世纪中叶的英国,其代表人物是威廉 ·配第 和 约翰 ·格朗特 。
威廉 ·配第 在其所著的,政治算术,一书中,运用大量的数字资料对对比英、法、荷三国的国力进行比较。马克思认为,政治算术,,即一般所说统计学,因此,威廉 ·配第是政治经济学之父,在某种程度上也可以说是统计学的创始人,。
约翰 ·格朗特 是利用大量数据研究社会人口变动规律的创始人,因此,也可以算作是政治算术学派的鼻祖。
由此可见,政治算术学派是以数量分析为特征,研究客观现象的数量关系,就其内容和方法来看,应该算是统计学的真正的渊源。
政治算术在英国诞生后,很快在欧洲各国得以传播,
直到 18世纪 80年代以后,英国才逐渐以德国国势学所用的,统计学,名称来代替,政治算术,。
综上所述,作为统计学源流之一的政治算术的出现,
标志着古典统计学的诞生。
(三)概率论与统计学的演变
古典概率论产生于 17世纪中叶,奠基人为法国的 帕斯卡尔 和 费马特 。
在此之前,一些数学家对赌博中的数量规律性进行了研究。法国数学家帕斯卡尔和费马特在讨论赌博中的数量规律时,提出了,概率,这一概念,用来描述某一事件发生的可能性,并归纳出了概率的一般原理。
后来,经过伯努利、德 ·莫佛尔、拉普拉斯、以及高斯等数学家的努力,概率论在理论和应用两方面都取得了重大发展,并为统计学的发展奠定了重要的基础。
自十七世纪中叶,统计学从国势学、政治算术和概率论三个不同的源头开始萌芽,
随后经过几代统计学家的艰苦努力,历经两个半世纪,到 19世纪末终于建成了古典统计学(主要是描述统计学)的基本框架。
三、近代统计学的形成及演变
凯特勒把国势学、政治算术与古典概率论结合在一起,构建了一门近代统计学 ——“社会物理学,,
为数理统计学的形成奠定了基础。
凯特勒第一次把概率论引进到统计学的研究中,为统计方法提供了理论基础。
欧美统计学界尊称凯特勒为“近代统计学之父”,
将其所处的年代称为“统计学的凯特勒时代”。
四、现代统计学的形成及其发展
在凯特勒的近代统计学的基础上,19世纪末期以后,
欧美统计学界产生了社会统计学和数理统计学这两门现代统计学。
(一)社会统计学的产生与统计学的演变
社会统计学产生于德国,它是由梅尔在政府统计
(即表式学派发展而成)的基础上接受了凯特勒的主张而创立的,它推动了从记述的统计学向分析的统计学的转化。
(二)数理统计学的产生与统计学的演变
数理统计学最早出现于德国统计学者韦斯特坦 1867年发表的,关于数理统计学及其在政治经济学和保险学中的应用,
一文。
一般认为,数理统计学由描述统计学和推断统计学所构成,
并分成描述统计学派和推断统计学派。
描述统计学与推断统计学都以概率论为其理论基础,它在发展过程中,由通用的实质性科学,逐步演变为通用的方法论科学。
二战以后,特别是在美国,推断统计学的研究成为数理统计学的主流。
(三)现代统计学的发展趋势
1、社会统计学和数理统计学相互渗透,成为统计学的发展方向。
2、推断统计学的应用领域不断拓展,在自然科学、
社会科学、医学、心理学、行为科学、管理、工农业生产、商业、气象等几乎所有的领域,推断统计学都得以应用。
3、数理统计学的理论和方法不断完善和深化。
4、计算机及其相应的统计软件已逐步成为统计学研究和统计实践活动中不可缺少的工具。
统计学家是科学家
Le onh ar d E u le r ( 欧拉 ) ( 17 07 - 1783)
Th om as R o b e r t M alt h u s ( 马尔萨斯 ) ( 17 66 - 18 34 )
P ie r r e Sim on Lap lac e ( 拉普拉斯 ) ( 17 49 - 1827)
Jo h ann G r e go r M e n d e l ( 孟德尔 ) ( 18 22 - 1884)
F r ie d r ic h G auss ( 高斯 ) ( 17 77 - 1855)
统计学家是科学家历史上著名的统计学家
Jacob Bernoulli (伯努利 ) (1654-1705)
Edmond Halley (哈雷 ) (1656-1742)
De Moivre (棣美佛 ) (1667-1754)
Thomas Bayes (贝叶斯 ) (1702-1761)
Leonhard Euler (欧拉 ) (1707-1783)
Pierre Simon Laplace (拉普拉斯 ) (1749-1827)
Adrien Marie Legendre (勒让德 ) (1752-1833)
Thomas Robert Malthus (马尔萨斯 ) (1766-1834)
Friedrich Gauss (高斯 ) (1777-1855)
Johann Gregor Mendel (孟德尔 ) (1822-1884)
Karl Pearson (皮尔森 ) (1857-1936)
Ronald Aylmer Fisher (费歇 ) (1890-1962)
Jerzy Neyman (内曼 )(1894-1981)
Egon Sharpe Pearson (皮尔森 ) (1895-1980)
William Feller (费勒 )(1906-1970)
第四节 统计学的基本概念
一、统计总体与样本
二、标志与指标
三、变量一、统计总体与样本
总体与总体单位
样本
(一)总体与总体单位
1、概念
– 总体:是指客观存在的、在某种共性的基础上由许多个别事物结合起来的整体。
– 总体单位:构成总体的个别事物被称为总体单位。
例如:在工业普查中,,工业企业,就是一个总体,其中每一个工业企业就是总体单位。工业切设备普查中,总体是,工业企业的所有设备,,而总体单位是,工业企业的每一台设备,。
2、总体具有三方面的特征:
1)同质性。即构成总体的各个单位必须具有某一方面的共性,这个共性是确定总体范围的标准。
2)大量性。即总体是由许多单位组成的,
而不是仅有的少数个别单位。
– 总体根据它所包含的总体单位的数目是否有限分为有限总体和无限总体。对于有限总体既可以进行全面调查也可以进行非全面调查;而对于无限总体只能进行非全面调查。
3)差异性。即各总体单位之间,除了必须在某一方面有共性之外,其他方面必然存在差异。
– 例如工业普查中,各工业企业的经济类、行业性质、职工人数、资金总额、产值等必然存在着差异。)这些差异是统计研究的基础,如果各总体单位之间不存在任何差异,则没有必要进行统计调查和研究。
3、总体与总体单位的转化
总体和总体单位是根据统计研究的目的来确定的,随着统计研究目的的变化,总体和总体单位也会发生变化。
– 例如一个企业、一所大学,既可以是某一调查研究的总体单位,也可以是另一调查研究的总体。
(二)样本
样本:又称做抽样总体或子样,它是由从总体中按一定规则抽选出来的一部分单位所组成的一个小的整体,是总体的代表 。
在现实生活中,要么总体都是无限总体;要么总体规模较大,总体单位数量较多,因此,现代统计学所采用的研究思路一般是根据样本信息来推断总体 。
所以说,样本是现代统计学中非常重要的概念 。
注意:在一个具体问题的研究中,总体总是唯一确定的,而样本却不唯一。
二、标志与指标
(一)标志
(二)统计指标
(三)指标和标志的联系与区别
(一)标志
标志:是用来说明总体单位特征的名称。
1、标志可分为 品质标志 和 数量标志 。
品质标志:是说明总体单位质的特征的,不能用数值来表示。
数量标志:是表示总体单位量的特征,用数值来表示。
一个总体单位常常是品质标志和数量标志兼而有之,这就要求我们用不同的方法研究某一个总体单位的各个方面。
例如:调查某企业职工情况,该企业的每一个职工是总体单位,性别、民族、工种、籍贯、年龄、工资额等调查项目就是标志,其中性别、民族、工种、籍贯是说明总体单位属性特征的,为品质标志,对于品质标志只能用文字回答问题;而年龄、工资额是说明总体单位数量特征的,为数量标志,对于数量标志则需要用数字来回答问题。
2、标志还可以分为 不变标志 和 可变标志 。
不变标志:是指某一标志在各单位的具体表现是相同的,它是构成总体的必要条件和确定总体范围的标准。
可变标志:是指某一标志在各单位的具体表现不同 。
(二)统计指标
1、统计指标:是反映现象总体数量特征的概念和数值。如在工业普查中,所有工业企业构成该调查的总体,工业企业总数、工业职工人数、工资总额、平均工资、固定资产总值、利润总额等都是指标,上述指标从不同方面反映总体的数量特征。
2、指标的分类
– 按反映的内容分为:数量指标和质量指标
– 按数值表现形式分为:总量指标、相对指标、
平均指标
1)按反映内容分为 数量指标 和 质量指标
数量指标:是指反映总体的总规模、总水平或工作总量的指标。如全国人口数国民生产总值;
质量指标:是指反映是总体内部的数量对比关系或一般水平的指标。如企业男女职工比例,人均收入等。
2)按其数值表现形式不同,分为 总量指标,
相对指标 和 平均指标 。
总量指标:反映的是总体绝对数量的多少,
是以绝对数的形式来表示的。
相对指标:反映的是总体的相对水平,是以相对数的形式来表示的,如年龄的构成、性别比、人口密度等。
平均指标:反映的是总体的一般水平,是以平均数形式来表示的。
3、统计指标体系
统计指标体系:是指反映同类现象,同时相互间具有内在联系的一系列统计指标构成的整体。
(三)指标和标志的联系与区别
指标和标志的区别
– 第一,指标说明总体的特征,而标志则说明总体单位的特征;
– 第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标;而标志则既有反映总体单位数量特征的,也有反映总体单位的品质特征的,只有数量标志才用数字回答问题,品质标志则用文字回答问题。
指标和标志的联系
– 第一,许多指标的数值都是由总体单位的数量标志的标志值汇总而来的;
– 第二,由于总体和总体单位可随统计研究的目的而易位,
所以指标和数量标志在一定的条件下可转化。
三、变量
(一)变量与变量值
(二)数值变量的分类
( 一 ) 变量与变量值
变量 ( 广义 ),可变的量,包括品质变量和数值变量 。
变量 ( 狭义 ),即数值变量,是指各种可变的数量标志和所有的统计指标,它都是以数值表示的 。
变量值:是变量的具体表现,品质变量值表现为具体的属性;而数值变量值表现为一系列数值 。
变量及其类型变 量定序变量离散变量 连续变量定类变量 数值变量
( 二 ) 数值变量的分类
按数值变量取值是否连续可分为 连续型变量和 离散型变量 。
按性质可区分为 确定性变量 和 随机变量 。
1、按数值变量取值是否连续可分为 连续型变量 和 离散型变量
离散型变量:是指凡是变量值只能以整数出现的变量,即在任意两个相邻的取值之间不会有其他取值可取。
连续型变量:指凡变量值可作无限分割的变量,也就是说,在任意两个相邻的取值之间都可以有一系列数值存在,这些变量就属于连续型变量。
连续变量的离散化处理
在某些特殊场合,连续变量也可作离散变量处理。
– 如人口按年龄分组时,可分为 0,1,2,3……
岁,其含义是,0”表示不满 1岁,,1”表示满 1
岁而不足 2岁,,2”表示满 2岁而不足 3岁,依次类推。约定俗成,众所周知或事先明确规定,
为了确保不发生错漏统计现象,连续变量可离散化处理。
2,按性质可分为 确定性变量 和 随机变量
确定性变量:是指其取值由于受到某些确定性因素的影响,因而呈现出有规律变动的变量。
随机变量:是指由于受到众多因素的综合影响,而使其取值表现出一定的波动性与随机性的变量。统计学中所研究的变量绝大多数都属于随机变量。
– 如人的身高受遗传基因、人种、地域、气候、营养等多因素的影响,并且影响程度各不相同。
统计学中的几个主要术语
1,总体 (Population)
– 所关心的所有元素的集合
2,样本 (Sample)
– 总体的一部分
3,参数 (Parameter)
– 总体的数字特征
4,统计量 (Statistic)
– 样本的概括性测度值几种常用的统计软件
(Software)
典型的统计软件
– SAS
– SPSS
– MINITAB
– STATISTICA
– Excel
MINITAB
STATISTICA
ExcelSAS
SPSS