商学系 Business Depart,
主讲,
第一章 统计学导论
第二章 统计调查
第三章 统计整理
第四章 综合指标
第五章 动态数列
第六章 统计指数
第七章 抽样推断
第八章 相关回归分析
内 容 目 录
第 七章
抽 样 推 断
?本章内容
第一节 抽样推断概述
第二节 抽样推断的几个基本概念
第三节 抽样误差
第四节 抽样估计的方法
第五节 抽样方案设计
?本章重点
第三、四节内容
?本章难点
第三节内容
?具体要求
理解-抽样推断的含义、作用及基本概念
掌握-抽样误差的计算、参数估计等。
单击此处编辑母版副标题样式
第一节 抽样推断概述
一、抽样推断的概念
, 抽样推断、抽样调查和抽样估计, 基本上是
相同的意思。 『 回顾第二节“抽样调查”的概念 』
抽样推断是按照 随机原则 从全部研究对象中抽
取一部分单位进行观察,并根据被抽取的那部分单
位的数量特征,运用一定的数理统计方法,对总体
的数量性作出具有一定可靠程度的估计和判断。
【 参书中的例子或自己举些例子 】
二、抽样推断的特点
1,抽样推断是非全面调查。可以节省人力物力
和财力,取得事半功倍的效果。
2,抽样推断是按随机原则抽选调查单位。
理解:什么是随机原则。广义抽样和狭义抽样。
3,抽样推断是用样本的指标数值去推算总体的
指标数值。
4,抽样推断运用的是归纳推理方法。
5,抽样推断运用的是概率原理。
6,抽样推断中产生的误差可以事先计算并加以
控制。
三、抽样推断的作用(适用范围)
『 参书中 130- 131面的内容 』
1,对无限总体全面情况的了解,必须采用抽样推
断。
2,对破坏性或消耗性检查,必须采用抽样调查。
3,对某些可以但事实上不必或不可能进行全面调
查的现象总体,可以采用抽样推断获取相关资料。
4,抽样调查可以对全面调查得来的资料进行验证
,并据以进行补充和修改。
5,抽样推断可以用于生产过程的质量控制。
6,抽样推断可以对某些总体的假设进行检验,判
断真伪,为决策服务。
单击此处编辑母版副标题样式
第二节 抽样推断的几个概念
一、全及总体和抽样(样本)总体
1、全及总体 又称母体,简称总体,它是指所要
认识的,具有某种共同性质的许多单位的集合体。
组成全及总体的单位称为 总体单位,全及总体的
单位数一般用 N表示。
2、抽样总体 又称子样,简称样本,是从全及总
体中随机抽取的那一部分单位所构成的集合体。
组成抽样总体的单位称为 样本单位,样本单位数
亦称 样本容量,一般用 n表示。
样本单位数的范围,1<n<N
抽样比例,
大样本,n≥30;小样本,n<30
重点理解,如果说对于一次抽样调查,全及总体
是唯一确定的,那么抽样总体就不是这样,样本是不
确定的,一个全及总体可能抽出很多个样本总体,样
本的个数和样本的容量有关,也和抽样的方法有关。
二、全及指标和抽样指标
1,根 据全及总体各个单位的标志值或标志属性
计算的,反映总体某种属性或特征的综合指示称为 全
及指标。
※ 全及指标的 惟一确定性 。
n
N
全及指标的种类,
( 1)总体平均数
( 2)总体成数
( 3)总体标准差和总体方差
2,由样本总体各单位标志值计算出来反映样本特征,
用来估计全及指标的综合指标称为 抽样指标(统计量)。
※ 抽样指标的 随机变化性(为什么) 。
抽样指标的种类,
( 1)抽样平均数
( 2)抽样成数
( 3)抽样总体标准差和方差
含义、计算公式
含义、计算公式
三、重复抽样和不重复抽样
抽取样本的两种基本方法,不同的方法会影响抽
样的误差。
1、重复抽样(重置抽样、放回抽样)
基本的特点和做法;(参书中)
样本个数的计算,Nn(可重复 排列数 )
2、不重复抽样(不重置抽样、不放回抽样)
基本的特点和做法;(参书中)
样本个数的计算,(不重复 排列数 )
N(N-1)(N-2)......(N-n+1)= N!/(N-n)!
以上都是考虑 顺序 的抽样!
单击此处编辑母版副标题样式
第三节 抽 样 误 差
一、抽样误差的概念
1、什么是误差
样本估计值(样本指标)与总体真实值(总体指
标)之间的差别
2、误差的种类
( 1)登记性误差(调查误差或工作误差)
※ 实际调查获取资料时产生的误差。
( 2)代表性误差
※ 用部分推算总体时产生的误差。
①偏差 系统性误差
②随机误差 偶然性误差
3、什么是抽样误差
※ 它就是指随机误差;
※ 它是一个随机变量(为什么);
※ 它是抽样推断中不可避免不可消除的误差;
※ 它可以用数理统计方法进行计算和控制;
※ 抽样误差的大小反映了样本代表性的高低。
二、抽样平均误差
1、含义及意义,
抽样平均误差实质就是 所有可能出现的抽样平均
数(抽样成数)的标准差。 它反映了抽样指标与总体
指标的平均离差程度。
※ 具体意义,
⊕ 从同一全及总体抽取同样单位数的样本可以有
多种不同的取法;
⊕ 每个样本都可以计算出相应的抽样平均数或抽
样成数指标;
⊕ 从而样本指标和总体指标之间的抽样误差也是
各不相同的,是一个随机变量;
⊕ 为了测定样本(指标)的代表性程度的高低,
单独用某一次的抽样误差来衡量是不科学的,因此就
需要采用 一定的方法(求标准差的方法) 计算所有抽
样误差的平均数,这就是抽样平均误差。同时它在参
数估计中也要用到。 『 参书 142页或下例的内容 』
重复抽样
N=3(A,B,C)=(1,2,3) ? n= 2
样本 数据
i
x
??
i
x
( A, A )
( A, B )
( A, C )
( B, A )
( B, B )
( B, C )
( C, A )
( C, B )
( C, C )
1,1
1,2
1,3
2,1
2,2
2,3
3,1
3,2
3,3
1
1.5
2
1.5
2
2.5
2
2.5
3
y 1 = - 1
y 2 = - 0.5
y 3 =0
y 4 = - 0.5
y 5 =0
y 6 =0.5
y 7 =0
y 8 =0.5
y 9 =1
合计 0
样本可能数目 M = 9, ? =2
定义公式,
A,抽样平均数的抽样平均
误差
B,抽样成数的抽样平均误

※ ?可理解成是 样本平
均数的平均数或总体平均
数,因为 样本平均数的平
均数就等于总体平均数。
理解成前者就理解了抽样
平均误差的含义。
M
x i
x
2)( ?
? ???
M
Pp i
p
2)?( ??
??
例,
2、抽样平均误差的计算,
N=3(A,B,C)=(1,2,3) ? n=2
样本 数据
i
x
2
)( ??
i
x
( A, A )
( A, B )
( A, C )
( B, A )
( B, B )
( B, C )
( C, A )
( C, B )
( C, C )
1,1
1,2
1,3
2,1
2,2
2,3
3,1
3,2
3,3
1
1.5
2
1.5
2
2.5
2
2.5
3
1
0.25
0
0.25
0
0.25
0
0.25
1
合计 3
样本可能数 目 M = 9, ? =2
58.0
3
1
9
3
)(
2
???
??
?
M
x
i
x
?
?
nx
?? ?
3
1
2
1
3
2 ???
( 1)抽样平均数的抽样平
均误差
A、重复抽样
实际工作中不可能用第
一个定义公式计算,而必
须用第二个公式计算。
N=3(A,B,C)=(1,2,3) ? n=2
样本 数据
i
x
2
)( ??
i
x
( A, A )
( A, B )
( A, C )
( B, A )
( B, B )
( B, C )
( C, A )
( C, B )
( C, C )
1,1
1,2
1,3
2,1
2,2
2,3
3,1
3,2
3,3
1
1.5
2
1.5
2
2.5
2
2.5
3
1
0.25
0
0.25
0
0.25
0
0.25
1
合计 1
样本可能数 目 M= 6, ? =2
B、不重复抽样
41.0
6
1)( 2
??
??
?
M
x i
x
?
?
1?
??
N
nN
nx
??
6
1
13
23
2
1
3
2 ?
?
????
修正因子?
nN
n
nN
nN
nx
???
? ???
?
?
? 1
1
实际工作
中不可能用第
一个定义公式
计算,而必须
用下面的公式
计算。
N=3(A,B,C)=( 男,男,女 ) ? n=2
样本
i
p?
Pp
i
??
2
)?( Pp
i
?
( A, A )
( A, B )
( A, C )
( B, A )
( B, B )
( B, C )
( C, A )
( C, B )
( C, C )
1
1
0,5
1
1
0,5
0,5
0,5
0
1/3
1/3
- 1/6
1/3
1/3
- 1/6
- 1/6
- 1/6
- 2/3
1 /9
1/9
1/36
1/9
1/9
1/36
1/36
1/36
4/9
合计 6 0 1
求男性比例。 M = 9, P = 2 / 3
( 2)抽样成数的抽样平
均误差
A、重复抽样
3
1
9
1)?( 2 ?????
M
Pp i
p?
?p?
3
1)1(
?
?
n
PP
实际工作中不可能用第
一个定义公式计算,而必
须用第二个公式计算。
B、不重复抽样
N=3(A,B,C)=( 男,男,女 ) ? n= 2
样本
i
p?
Pp
i
??
2
)?( Pp
i
?
( A, A )
( A, B )
( A, C )
( B, A )
( B, B )
( B, C )
( C, A )
( C, B )
( C, C )
1
1
0,5
1
1
0,5
0,5
0,5
0
1/3
1/3
- 1/6
1/3
1/3
- 1/6
- 1/6
- 1/6
- 2/3
1 /9
1/9
1/36
1/9
1/9
1/36
1/36
1/36
4/9
合计 4 0 1/3
求男性比例。 M= 6, P = 2/ 3
18
1?
18
1
6
3/1)?( 2
??
??
?
M
Pp i
p?
?p?
1
)1(
?
??
N
nN
n
PP
?p?
N
n
n
PP
?
?
? 1
)1(
1
)1(
?
??
N
nN
n
PP
n
PP )1( ?
?
实际工作
中不可能用第
一个定义公式
计算,而必须
用下面的公式
计算。
※ 在没有总体方差和标准差时怎么办?
(用样本的相关指标代替即可)
?
?
?
?
?
?
?
???
??
不重复抽样
重复抽样
抽样平均数
N
n
n
n
x
x
1
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
??
不重复抽样
重复抽样
抽样成数
N
n
n
PP
n
PP
n
p
p
p
1
)1(
)1(
?
?
?
计算公式汇总,
三、影响抽样(平均)误差的因素
1、抽样单位数目的多少;
2、总体被研究标志的变异程度;
3、抽样方法和组织形式的不同。
【 参书中 141- 142内容及抽样平均误差的计算式 】
四、抽样极限误差
含义,抽样极限误差是指抽样指标和总体指标之
间抽样误差的可能范围。
意义,由于抽样误差是一个随机变量,因此在实
际工作中到底 允许抽样误差 在一个什么样 的范围 内,
这要根据实际情况来定。
用式子表示,
Xxx ??? Ppp ???
抽样平均数极限误差 抽样成数极限误差
xx
x
xXx
Xx
???????
????
(理解其意义)
pp
pp
pPp
PpPp
???????
???????
Xxx ???
(理解其意义)
),( xx xx ???? ),
pp pp ????(
置信区间,
『 例 1』 对某地农户年收入进行抽样调查,随机
抽取 100户进行调查,求得年均户收入为 1000元,如
果确定抽样极限误差为 50元,这就要求该地区农户
年均收入在 1000〒 50之间,即( 950,1050)之间。
『 例 2』 要检验某产品质量,随机抽取 100件,其
中不合格品为 5件,则产品合格率为 95%,若确定抽
样极限误差为 3%,这就要求该产品合格率落在 95%
〒 3%之间,即( 98%,92%)之间。
单击此处编辑母版副标题样式
第四节 抽样估计的方法
一、抽样估计的可靠程度(可信程度、置信度)
1、意义和含义,抽样平均误差是衡量误差范围的
尺度,它说明抽样估计的 准确度 ;而抽样极限误差则是
说明抽样估计 准确程度的可能范围 。
由于样本指标和抽样误差都是随机变量,抽样估计
过程中并不能保证误差一定落在某一范围内,而 只能以
一定程度的概率 来保证。
那么,抽样估计的可靠程度(可信程度、置信度)
就是表明抽样指标和总体的指标的误差不超过一定范围
的概率保证程度。 『 参前例及平均误差的计算式 』
2、抽样估计可靠程度 (可信程度、置信度 )的求得
实际计算中抽样估计的可靠程度是通过 概率度 (用 t
表示)求得的。 概率度 是由以下关系式得到的,即
从上式可以看出,概率度 t就是指以抽样平均误差为
尺度来衡量的 相对误差范围 。而数理统计证明,概率度
和概率之间保持一定的函数关系,即概率是概率度 t的增
函数,实际计算中通过查已编制好的“正态概率表”即
可获得概率度 t值和概率之间的具体关系,从而计算时知
道其中一个的值就可查到另一个的值。
ppxx
p
p
x
x tttt ??
??
?????
?
?
?
? 或或
※ 由上述内容,我们可以得到此关系式的下述重要
意义,
1,说明了抽样极限误差和抽样平均误差之间的关
系,即前者可表示为后者的若干倍。
2,在抽样平均误差一定的条件下,概率度越大,
则抽样极限误差的范围越大,可能样本落在误差范围内
的概率越大,从而抽样估计的可信程度也就越高。
反之,概率度越小,则抽样极限误差的范围越小,
可能样本落在误差范围内的概率越小,从而抽样估计的
可信程度也就越低。
当然,也可以从抽样极限误差值的大小对概率度值
的大小影响的角度来看。
二、参数估计的方法
总体参数的估计主要有两种方法,即总体参数的 点
估计 和总体参数的 区间估计 。下面分别讲述之。
(一)总体参数的点估计
1、含义,点估计实际上就是以样本指标值直接作
为总体指标的估计值的一种估计方法。比区间估计要简
单。
2、计算,当然在资料充分的情况下,可以得到抽
样极限误差、置信度或求出 估计精度 。置信度的求得同
区间估计的方法,估计精度的计算公式如下,
( 误差系数)( 误差系数)
px
px ???? 11

【 参书中例子 】
(二)总体参数的区间估计
1、含义,总体参数的区间估计是指根据一定的
精确度和可信程度的要求,指出总体参数可能存在的
区间范围,而不是直接给出总体参数的估计值。
2、计算,在总体参数的区间估计时,精确度 和
可信度 的要求是相互制约的(具体参书中 148面内
容)。在估计时只能照顾一边,因此在对总体参数
(总体平均数或总体成数)估计时就有 两套模式,每
种模式又有对总体平均数的估计和对总体成数的估计
两种情况。
下面分别看这两种模式。
※ 第一套模式,即抽样极限误差已知,求概率保
证程度。 此模式的具体步骤为,
( 1) 根据样本 计算样本指标 并以此作为总体指标
的估计值; 计算样本标准差 以推算 抽样平均误差 。
( 2) 根据给定的抽样极限误差,求出总体指标的
上限和下限,即 置信区间 。
( 3) 运用下面抽样平均误差和抽样极限误差的关
系式求出 概率度 t的值, 然后查概率表求出 相应的可信
度,即 概率保证程度 。
【 此模式的具体计算可参书中
149- 151面的例 6- 2和 6- 3】
p
p
x
x tt
??
?
?
?
? 或
※ 第二套模式,即概率保证程度(置信度)已知,
求抽样极限误差的可能范围。 此模式的具体步骤为,
( 1) 根据样本 计算样本指标 并以此作为总体指标的
估计值; 计算样本标准差 以推算 抽样平均误差 。
( 2) 根据给定的可信度,查概率表求出 概率度 t的值 。
( 3) 运用下面概率度和抽样平均误差的关系式求出
抽样极限误差,最后根据抽样极限误差,对总体指标的
区间作出估计。
【 此模式的具体计算可参书中
151- 12面的例 6- 3和 6- 4】 ppxx tt ?? ???? 或
单击此处编辑母版副标题样式
第五节 抽样方案设计
一、抽样方案设计的基本原则
1、保证实现抽样的随机性原则;
※ 理解,什么是随机原则及遵守随机原则对抽样
调查的重要意义。
※ 了解,抽样实践中常出现的违规现象。
2、保证实现最大的抽样效果的原则。
※ 此原则主要说明的是,如何以较小的费用支出取
得一定准确程度的数据。
※ 理解,提高数据的精度和节省费用支出是矛盾的,
二者之间的关系是非线性的,可以用以下示意图表示。
费用 (%)

度(
%)
100 98
90
50 75 100
※ 要根据实际情况确定对精度的要求,最终达
到精度一定,费用最少或费用一定,精度最高。
二、简单随机抽样
(一 ) 含义
※ 简单随机抽样又称“纯随机抽样”,相对其它
抽样组织形式而言,它是对总体不作任何处理,不进
行任何分类或排队,而是按照随机原则直接从全及总
体中抽选所需的样本。
简单随机抽样不是“随便抽样”也不是“任意抽
样”,抽样时必须遵循一定的方法。
(二)具体的做法
第一步,确定总体范围,对总体各单位进行 编号,
形成明确的抽样框。
第二步,根据编定的号码,然后采取抽签的方式
或随机数表法抽取所要的样本。
1、抽签的方法
把号码写在纸片上,搀和后一个一个抽取即可。此方
法有其自身的特点。
2、随机数表法
了解,什么时随机数表及怎么用。
【 参书中及下例 】
随机数字表
75
18
26
53
86
90
85
89
64
97
96
18
48
81
06
91
63
57
95
12
16
56
26
33
24
01
82
54
17
32
66
16
31
29
42
15
66
40
38
51
08
33
07
41
61
48
98
89
52
71
N=30?n=5
(三)特点
1、简单,易于掌握。
2、理论上最符合随机原则,是抽样调查最基本的
形式。
3、适用于比较均匀和总体单位数目不大的总体。
三、简单随机抽样条件下必要样本单位数的确定
(一)确定抽样单位数的意义和原则
1、意义,主要是考虑抽样单位数和样本的代表性、
抽样误差、数据的精度及调查费用之间的关系。
2、原则,在保证一定的可靠程度和精确程度的要
求下,确定恰当的抽取样本单位的数目。
(二)确定抽样单位数的依据
1,首先是要求的可靠程度和精确程度。
2,总体标志的变异程度。
3,不同的抽样组织方法。
4,人力财力物力的许可情况。
以上情况必须综合考虑。
(三)必要样本单位数目的计算
简单随机抽样条件下必要样本单位数目的计算
公式有以下几种,
1、重复抽样平均数指标的抽样单位数的计算
)(2
2222
2 公式两边平方 ?
?????? xx
tn
n
t ??
n
tx ????
n
t xxx ??? ????
222
22
,?? tN Ntn
x ??
?? 公式
N
n
n
t
N
n
n
t xxxx ???????? 11 ???? ?
Nn
nt
n
t
N
n
n
t
x
222222
2 1 ??? ???
?
??
?
? ????两边平方
2、不重复抽样平均数指标的抽样单位数的计算
3、重复抽样成数指标的抽样单位数的计算
4、不重复抽样成数指标的抽样单位数的计算
n
PP
t
n
PP
n
t
p
p
ppp
)1(
)1(
?
???
?
????
?
???
)()1()1( 2
22
2 公式两边平方 ?
?
???????
p
p
PPtn
n
PPt
即可)替代替代(用 ?? )1( PPpxp ????
)1(
)1(
22
2
PPtN
PPNtn
p ???
??
222
22
?
?
tN
Ntn
x ??
?比较公式