第 七 章抽 样 与 抽 样 估 计本章学习目的了解 抽样估计的概念和特征,抽样调查的组织方式领会 抽样估计中的相关概念掌握 抽样估计中常用的统计量 ( 均值,方差,标准差,
成数 )
掌握 正态分布总体参数的估计方法 ( 点估计,区间估计 )
本章重难点提示本章重点,抽样估计的相关概念,抽样分布,样本统计量,区间估计方法本章难点,抽样误差的相关概念,不同已知条件下的区间估计方法第 一 节抽样及抽样估计中的基本概念
( 一 ) 抽样及抽样估计的概念
1.抽样 即 抽样调查,是指在总体中选取部分单位组成样本并收集样本单位的数据资料的过程 。
2.抽样估计 是在抽样调查的基础上,利用 样本的数据资料计算 样本指标,以样本特征值 对总体特征值 做出具有一定可靠程度的 估计和判断 。
一、抽样估计的概念和特征
(二 )抽样估计的特点
1.抽样估计是 由部分推断总体 的一种认识方法
2.抽样估计建立在 随机取样 的基础上
3.抽样估计运用的是 不确定的概率估计方法
4.抽样估计的 误差可 以事先 计算 并加以 控制二、抽样及抽样估计中的相关概念
( 一 ) 全及总体和样本
1.全及总体,是由 被调查对象的全部单位 所构成的集合体,简称总体 。
总体容量,总体中的单位数,用 N表示
2.样本,样本是从总体中 抽取的进行调查的部分单位 的集合体,又称抽样总体样本容量,样本中的单位数,用 n表示大样本和小样本,n≥ 30时称大样本,n< 30称小样本
**应用,在班级 40名学生中随机选取 15人进行健康状况调查,说明其中的总体,样本及容量二、抽样及抽样估计中的相关概念
( 二 ) 概率抽样与非概率抽样
1.概率抽样,又称随机抽样,是按随机原则抽取样本单位 。
本章所指 的均为概率抽样 。
2.非概率抽样,又称非随机抽样,是指从研究的目的和需要出发,根据调查者的经验或判断,从总体中 有意识地抽取 部分单位构成样本 。
**应用举例,重点调查,典型调查应为非概率抽样二、抽样及抽样估计中的相关概念
(三)重复抽样和不重复抽样
1.重复抽样,又称 有放回的抽样,从总体中抽取样本时,
每次被抽中的单位都再被放回总体中参与下一次抽样 。
2.不重复抽样,又称 无放回的抽样,总体中随机抽选的单位经观察后不放回到总体中,即不再参加下次抽样 。
**思考与讨论,
从容量为 N的总体中随机抽取容量为 n的样本,根据概率论与数理统计知识,讨论重复抽样和不重复抽样中各单位依次被抽中的概率,并比较在同等条件下,哪种抽样的代表性好?
二、抽样及抽样估计中的相关概念
(四)抽样框
1.概念,抽样框是 包括全部抽样单位的名单框架 。
2.形式名单抽样框,如学生名单、职工名单、企业名单等区域抽样框,如将一个城市按行政区划分为若干区、街道、居委会等时间抽样框,如对流水线上的产品每隔一定时间抽取一定单位
(五)总体参数 和 样本统计量
1.总体参数,是 反映总体数量特征的数值 。在抽样推断中,参数是未知的、待估计的确定值 。
2.样本统计量,是根据样本资料计算的 反映样本数量特征的变量,它的值随着样本的不同而变化,因此 是 一个 随机变量 。
二、抽样及抽样估计中的相关概念表 7-1 总体参数和样本统计量符号总体指标符号 样本指标符号总体容量,N
总体平均数,
总体成数,P
总体方差,2?
总体标准差,?
样本容量,n
样本平均数,x
样本成数,
p
样本方差,2S
样本标准差,S
(六)抽样误差
1.统计误差及分类偏差 /系统误差,由于破坏随机原则而产生随机性误差 /抽样误差 **,即使遵循随机原则以样本指标代表总体指标时的偏差统计误差登记性误差,统计调查中,由于观察、测量、
登记、计算等原因或被调查者提供虚假信息所造成代表性误差,以样本指标推断总体指标时产生的代表 性程度的差异。
(六)抽样误差
2.抽样误差与抽样误差有关的三个概念
( 1)抽样实际误差,指某一次具体抽样中,样本指标值与总体参数真实值之间的偏差。
( 2)抽样平均误差,是指所有可能的样本指标与总体指标之间的平均差异程度,即 样本估计值的标准差 。
( 3)抽样极限 /允许误差,又称 置信区间,是指一定概率下 抽样误差的可能范围,说明样本估计量在总体参数周围变动的范围,记作 Δ。
抽样误差是指不包括登记性误差和系统性误差在内的随机误差,它衡量了抽样估计的精确度 。
抽样平均误差
① 抽样平均数的平均误差概念,就是抽样平均数的标准差,反映抽样平均数的所有可能值对总体平均数的平均离散程度,记作 。
定义公式:
其中:,各个可能样本的平均数
:总体平均数
:重复抽样条件下所有可能的样本数
)(x?
m
xx i 2)()(
ix
m
抽样平均误差实际抽样推断中采用的公式重复 简单随机抽样不重复 简单随机抽样其中,为总体方差为不重复抽样的修正因子
nx
2
)(
)1()(
2

N
nN
nx

2?
1?
N
nN
抽样平均误差
② 样本成数(比例)的抽样平均误差重复抽样条件下:
不重复抽样条件下:
总体中具有某种特征的单位占全部总体单位数的比例称为总体比例,记作,样本中具有此种特征的单位占全部样本单位数的比例称为样本比例,记作 。
P
p
n
PPp )1()(
)1()1()( Nnn PPp
抽样极限误差
① 样本平均数的抽样极限误差,以绝对值形式表示的样本平均数的抽样误差的可能范围,用符号表示为:
即:
说明样本均值以确定的总体均值为中心,在之间变动。在实际抽样估计中是以样本均值推断总体均值的区间范围,因此,可将上述不等式做如下变换:
xx
x
xx xx
xx x
抽样极限 /允许误差
② 样本比例的抽样极限误差,以绝对值形式表示的样本比例的抽样误差的可能范围,用符号表示为:
即:
同理,也可将上述不等式转换为:
pPp
pp PpP
pp pPp
第二节 抽样分布一、抽样分布的概念和种类
(一)概念精确分布/小样本分布,大多数是在正态分布总体条件下得到的,但应用不广
(二)种类渐进分布/大样本分布,样本容量无限增大时统计量的极限分布,可看作是抽样分布的一种近似。
抽样分布是样本统计量的概率分布 。 从一个总体中随机抽取容量相等的样本,根据样本资料计算某一统计量所有可能的概率分布,称为这个统计量的抽样分布 。
常见的抽样分布
(一)正态分布
1,正态分布,如果随机变量的概率密度函数为:
-∞ < < +∞
其中,为常数且 > 0,则称 服从参数为,
的正态分布,记作 ~,。
*正态分布是最常见的抽样分布

2
2
2
2
1)(


x
exf x
X
X?(N )2?
常见的抽样分布
2.标准正态分布,在正态分布中,当参数 =0,=1时,
则称 服从标准正态分布,记作 ~,1)。
标准正态分布的分布密度 和分布函数 的性质如下:
( 1) 是偶函数,即 =
( 2) =1-
( 3)如果 ~,,则 的分布函数为上述公式称为正态分布函数的标准化公式。

X X 0(N
)(x? )(x?
)(x? )( x )(x?
)( x )(x?
X?(N )2? X
)()( xxF
常见的抽样分布
(二) 分布设 是独立同分布的随机变量,且每个随机变量都服从标准正态分布,即 ~( 0,1),
则随机变量
= 的分布称为自由度为 的 分布,记作
( )。
当 ∞时,分布趋近于正态分布,即 ( ) ~
(,2 )。
2?
nxxx,,,21?
ix
2?
n
i
ix
1
2 n 2?2?
n
n 2? n2?
n
n
n
常见的抽样分布
(三) 分布设随机变量 与 相互独立,~( 0,1),
~ ( ),则称随机变量服从自由度为 的 分布,记作 ( )。
当 ∞时,分布趋近于标准正态分布 。实际应用中,当 > 30时,分布可用标准正态分布近似。
t
X Y X
Y 2? n
nY
Xt
/?
n tt n
n t
tn
常见的抽样分布
(四) 分布
1.设随机变量 与 相互独立,且分别服从自由度为,的 分布,则称随机变量服从第一自由度为,第二自由度为 的 分布,记作 (,)。
2,分布对于两个总体的方差比的统计推断问题十分重要,是方差分析等统计推断方法的基础。与前两种分布不同的是 分布不以正态分布为其极限分布,它总 是一个正偏分布 。
F
F FF ~
X Y
1n 2n 2?
2
1
/
/
nY
nXF? 1n
2n 1n 2n
F
F
二、样本平均数的抽样分布
(一)总体方差 已知时,样本平均数 的抽样分布
[定理 7-1]设总体,( )是一个简单随机样本,则有,~ (,)
将样本平均数标准化,即有:
( 0,1)
上述定理说明,样本平均数的数学期望值等于总体平均数,样本平均数的方差等于总体方差除以样本容量,
同时也说明了样本平均数抽样分布具有的基本性质。
2? x
),(~ 2NX nxxx,,,21?
x N? n/2?
)(xE nxV /)( 2
~/)( nxxxZ
二、样本平均数的抽样分布
(一)总体方差 已知时,样本平均数 的抽样分布
[定理 7-2]中心极限定理,设 是具有期望值,方差 的任意总体,则样本平均数的抽样分布将随 的增大而趋于总体平均数为,标准差为 的正态分布,即 渐近服从 (,)。 将这一正态随机变量进行标准化,则有:
0,1)
**说明:样本无论抽自正态或非正态总体,只要样本容量足够大,在总体平均数 和方差 已知和有限的条件下,
样本平均数 的抽样分布就会趋于正态分布。一般认为样本容量 ≥30时,即可用定理 7-2作为推断的依据。
2? x
X? 2?
n
nX x
N? n/2?
(~
/
N
n
xZ

n
2?
x
二、样本平均数的抽样分布
(二)总体方差 未知时,样本平均数 的抽样分布当总体方差 未知时,可以用样本方差 代替总体方差,或用样本标准差 代替总体标准差,则有:
[定理 7-3]设总体,),( )是其一个简单随机样本,样本平均数为,样本标准差,
则统计量 ~ ( )
**即当总体方差未知时,样本平均数服从自由度为的 分布
2? x
2? 2S
2? S?
(~ NX 2? nxxx,,,21?
x S
nS
xt
/
t 1?n
1?n
t
三、样本比例(成数)的抽样分布当从总体中抽取一个容量为 的样本时,样本中具有某种特征的单位数 服从二项分布,即有 ~,),且有,
因此样本比例 也服从二项分布,且有:
根据中心极限定理,当 ∞时,二项分布趋近于正态分布。所以,在大样本下,若 和 均大于 5,样本比例近似服从正态分布:
n
x x nB( P
nPXE?)( )1()( PnPXV
nxp /?
PxEnnxEpE )(1)()(
)1(1)(1)()( 2 PPnxVnnxVpV
n
nP )1( Pn?
)1(1,~ PPnPNP
第 三 节抽样估计的基本方法一、点估计
(一)概念
1.点估计
2.矩估计设总体随机变量的分布函数已知,但它的一个或多个参数未知,若从总体中抽取一组样本观察值,以该组数据来估计总体参数,就称为参数的点估计 。
矩估计法是用样本的矩去估计总体的矩,从而获得总体有关参数的估计量的方法 。 矩是指以期望值为基础定义的数字特征,如数学期望,方差,协方差等 。
一、点估计
(二)矩估计法的评价优点,
一,计算简便直观,一般不考虑抽样误差和可靠程度二,适用于对估计准确与可靠程度要求不高的情况局限性,
一,它要求总体矩存在二,不能充分利用估计时已掌握的有关总体分布的信息一、点估计
(三)应用例题
[例 7-1] 某厂对所生产的电子元件抽取 5%进行抽样调查,计算出样本的平均耐用时间 =4340小时,样本合格率 =98%。根据矩估计法原理,估计该厂所生产的电子元件的平均耐用时间和合格率。
解,点估计法是用样本指标直接作为总体指标的代表值,所以,全部电子元件的平均耐用时间即为 4340小时;总体合格率为 98%。
二、区间估计
(一)区间估计的概念根据样本统计量 以一定的可靠程度去 估计总体参数值所在的范围 或区间,是抽样估计的主要方法。
(二)抽样估计的置信度与精确度
1.置信度,表示 区间估计的可靠程度或把握程度,
也即所估计的区间包含总体参数真实值的可能性大小,
一般以 1- 表示。其中 表示显著性水平,即某一小概率事件发生的临界水平 。
置信度通常采用三个标准:
( 1)显著性水平 =0.05,即 1- =0.95
( 2)显著性水平 =0.01,即 1- =0.99
( 3)显著性水平 =0.001,即 1- =0.999?

(二)抽样估计的置信度与精确度 **
2.抽样估计的精确度,用 置信区间的大小 即 抽样极限 /允许误差 来表示
3.抽样估计的 置信度 与 精确度的矛盾关系在 样本容量和其他条件一定 的情况下,
若希望抽样估计有 较高的可靠度,则必须扩大置信区间,即 必须降低估计的精确度 ;
若希望抽样估计有 较高的精确度,即置信区间范围缩小,则 必须降低估计的把握度 。
即,抽样估计要求的把握度越高,则抽样允许误差越大,精确度越低 ; 反之则相反 。
**思考,在抽样调查中,如何同时提高抽样估计的精确度和把握度?
区间估计的应用
(一)总体均值的区间估计
1.总体方差已知时当,)时,来自该总体的简单随机样本的样本均值服从数学期望为,方差 为的正态分布,将样本均值统计量标准化,得到 统计量根据区间估计的定义,在给定的显著性水平 下,总体均值 在
1- 的置信度下的置信区间为:
(,),即其中,即抽样平均误差,即抽样允许误差
(~ NX 2? nxxx,,,21?
2?
x
)1,0(~/ NnxZ
Z
nZx
2/? n
Zx 2/? xx xx
)(xnnZ 2/ x?
1.总体方差已知时总体均值的区间估计例题应用
[例 7-3] 某厂生产的零件长度服从正态分布,从该厂生产的零件中随机抽取 25件,测得它们的平均长度为 30.2厘米。已知总体标准差 =0.45厘米。
要求,( 1)计算抽样平均误差和抽样允许误差
( 2)估计零件平均长度的可能范围( =0.05)
已知,,),=30.2,=25,
1- =0.95,
(~ NX 245.0 x n
解题过程
( 1)抽样平均误差查标准正态分布表可知在 =0.05时,=1.96,所以,
抽样允许误差
( 2)总体均值的置信区间为:
(,) =
=(,) = ( 30.02,30.38)
即我们可以以 95%的概率保证该厂零件平均长度在
30.02厘米到 30.38厘米之间。
09.02545.0)( nx
2/?Z
1 7 6 4.009.096.12/ nZx
nZx
2/? nZx
2/? ),( xx xx
1 7 6 4.02.30? 1764.02.30?
2.总体方差未知时总体均值的区间估计
**总体方差 未知,可以以样本方差 代替,但新的统计量不服从标准正态分布,而是服从自由度为 -1的分布
**给定置信度 1-,可查 分布表确定临界值从而总体均值的置信区间为:
(,)
其中,即为抽样平均误差即为抽样允许误差上式也可表示为:
2? 2S
n t
t )1(2/?nt?
n
Stx n 1
2/

n
Stx n 1
2/

)(1 xnS n
nSt n 12/? x?
xx xx
例题应用
[例 7-4] 从某市高中生中按不重复抽样方法随机抽取 25名调查每周收看电视的时间,分组资料见表 7-3。
要求,( 1)计算抽样平均误差和抽样允许误差
( 2)估计该市全体高中生每周平均看电视时间的置信区间(给定的显著性水平为 0.05)。
每周看电视时间 ( 小时 ) 学生人数 ( 人 )
2 以下
2 — 4
4 — 6
6 — 8
8 — 10
2
6
8
8
1
合计 25
解题过程(一)
已知,=25,=0.05
样本均值样本方差
=4.16
( 1)查 分布表知 =0.05时,临界值 =
2.0639,因此,
抽样平均误差抽样允许误差
n?
)(525 1987856321 小时x
25
15)-(98)5-7(8)5-5(6)5-3(25)-(1 222222s
)1(2/?nt )125(025.0t
4 0 8.02516.4)( 1nSx n?
8 4 2.04 0 8.00 6 3 9.212/nSt nx?
t
解题过程(二)
( 2)总体均值置信度为 95%的置信区间为:
(,)
=
=( 5-0.842,5+0.842)
=( 4.16,5.84)
即我们可以以 95%的把握保证该市高中生每周平均看电视时间在 4.16到 5.84小时之间。
n
Stx n 1
2/

n
Stx n 1
2/

),( xx xx
(二)总体比例的区间估计
**在大样本下,样本比例的分布趋近于均值为,方差为的正态分布。因此,给定置信度 1-,查正态分布表得,则样本比例的抽样极限误差为:
所以,总体比例的置信度为 1- 的置信区间为:
P
n
PP )1(?
2/?Z
)(2/ pZp
pp pPp
例题分析
[例 7-5] 某厂对一批产成品按不重复抽样方法随机抽选
200件进行质量检测,其中一等品 160件,试以 90%的概率估计一等品率的范围。
已知,,1- =90%,=200
查表知,=1.645
计算得样本比例的抽样平均误差为:
抽样极限误差为:
所以,该批产品的一等品比例的置信区间为:
即这批产品的一等品率在 75.35% 到 84.66% 之间。
%802 0 01 6 0p
n
2/?Z
%83.2200 %)801(%80)1()( n ppp?
%6 5 5.4%83.26 4 5.1)(2/ pZp
%6 5 5.4%80%6 5 5.4%80 P
(三)总体方差的区间估计 *
1.大样本情况下,样本标准差 的分布近似服从正态分布,所以,总体标准差 的置信度为 1-
的置信区间近似为:
( )
2.小样本情况下,若总体呈正态分布且其均值和方差未知,则总体方差 的置信区间可由如下统计量的分布来确定:
总体方差的置信度为 1- 的置信区间为:
(,)
S
)2/,( 2 nN
n
SZS
n
SZS
2,2 2/2/
)1(~)1( 22 22 nSn
)1(
)1(
2
2/
2
n
Sn
)1(
)1(
2
2/1
2
n
Sn

2?
例题应用
[例 7-6] 从某班学生中随机抽取 16人,计算得语文平均成绩为 75分,方差为 25分。假定学生成绩服从正态分布,试求总体方差及标准差的置信区间(给定的显著性水平为 0.05)。
解,已知 =25,=0.05,,查 分布表确定两个临界值:
=
=
将临界值数字带入上述公式中,总体方差 和标准差的置信度为 1- 的置信区间分别为:
(,),即为( 13.64,
59.89)
(,),即为( 3.69,7.74)
n? 2?
)1(2/12 n 2 6 2.6)116(975.02
)1(2/2?n 4 8 8.27)116(0 2 5.02
2?
488.27
25)116(
2 6 2.6
25)116(
64.13 89.59
(四)两个总体均值之差的区间估计
**设两个正态总体为,)、,),
方差,已知,从两个总体中分别抽取容量为和 的大样本,则样本均值之差服从正态分布,均值为,方差为即从而可以构造 在置信度为 1- 水平下的置信区间:
11 (~?NX 21? 22 (~?NX 22? 21? 22?
1n 2n
21
2
2
2
1
2
1
nn

),(~
2
2
2
1
2
1
2121 nnNxx

21

2
2
2
1
2
1
2/21 )( nnZxx

例题应用
[例 7-7] 两家公司员工的月平均工资都服从正态分布,
现从两公司随机各抽取 16名员工组成样本,计算得样本均值分别为 3000元和 2400元,已知两公司全体职工平均工资的标准差分别为 3600元和 2800元。
[要求 ] 分别以 95%和 99%的置信度估计两公司员工平均工资之差的置信区间。
解:已知,,,
,,= =16
根据上述公式,- 的置信区间为
)3 6 0 0,(~ 11?Nx )2 8 0 0,(~ 22?Nx
3 0 0 01?x 24002?x 1n 2n
1x 2x

2
2
2
1
2
1
2/21 )( nnZxx

例题应用
( 1) 当 1- =95%时,查表知,,置信区间为:
即我们以 95%的概率保证两公司员工平均工资之差在 560.8元到 639.2元之间 。
( 2)当 1- =99%时,查表知,此时的置信区间为:
即我们以 99%的概率保证两公司员工平均工资之差在 548.4元到 651.6元之间。
96.1
2/Z

2.6 3 9,8.5 6 0
2.396 0 0
16
2 8 0 0
16
3 6 0 096.1)2 4 0 03 0 0 0(



58.22/Z

6.651,4.548
6.51600
16
2800
16
360058.2)24003000(



(五)两个总体比例之差的区间估计
**设两个总体的比例分别为 和,分别从两个总体中随机抽取容量为 和 的大样本,并计算样本比例和,可以证明,当 和 都很大,从而 > 5和
> 5时,- 的分布近似服从正态分布,且:
因此 - 的置信度为 1- 的置信区间为:
由于总体比例未知,以样本比例来代替,上述置信区间为:
1P 2P
1n 2n 1p
2p 1n 2n np )1( pn?
1p 2p
21 PP
2
22
1
11 )1()1()(
n
PP
n
PPp
1p 2p



2
22
1
112/21 )1()1()(
n
PP
n
PPZpp



2
22
1
11
2/21
)1()1()(
n
pp
n
ppZpp
例题应用
[例 7-8]对两个高校的在校生参加社会实践的情况进行调查,分别随机抽取了 200名学生,其中参加过社会实践的学生比例分别为 80%和 60%。
[要求 ] 计算两个高校参加过社会实践的学生比例之差的置信区间( =0.05)。
解,由于 = =200属于大样本,符合 > 5和
> 5的条件,又知,=80%,=60%,1- =95%,查表知
,故置信区间为:
即我们有 95%的把握保证两个高校的学生参加过社会实践的比例之差在 16.08%到 23.92%之间。
1n 2n np )1( pn?
1p 2p?
96.12/Z
)2392.0,1608.0()0392.020.0(
1000
)6.01(60.0
1000
)80.01(80.096.1)60.080.0(





第 四 节抽样调查的组织方式一、简单随机抽样
(一 )概念
(二 )评价,简单易行,最符合随机原则,是抽样调查的基本形式
(三 )适用情况,当总体单位数不多且分布比较均匀,
或总体单位之间数量特征值差异较小,或总体单位有现成的编号时,采用这种方式比较适宜 。
又称纯随机抽样,是对总体单位不做任何分类或排队,直接从总体中按随机原则抽取样本单位的调查方式二、类型抽样
(一)概念
(二) 适用情况,总体单位在被研究标志上有明显差异时。
(三) 遵循原则,分组时应使组内差异尽可能小,组间差异尽可能大。
等比例类型抽样
(四)种类,
不等比例类型抽样又称分层抽样或分类抽样,是将统计分组和抽样调查结合起来的组织方式 。 先将总体单位按某一标志分成若干组,然后在各组中采用简单随机抽样或其他方式抽取样本单位 。
三、等距抽样
(一)概念无关标志排序抽样,排序的标志与被研究的标志无关,实质是简单随机抽样。
(二)分类有关标志排序抽样,排序的标志与被研究的标志有关,有利于提高样本的代表性 。
(三)评价,抽样误差一般较简单随机抽样小,当被研究现象标志变异程度较大时,更能显示出其优越性。但有可能产生系统性误差。
又称机械抽样或系统抽样,它是先将总体各单位按某一标志顺序排列,然后按照固定的顺序和相同的间隔抽取样本单位的抽样组织方式 。
四、整群抽样
(一)概念
(二) 整群抽样与类型抽样的区别类型抽样划分的组称为,类,,作用是缩小总体,使总体的变异减少,而抽取的基本单位仍是总体单位;
整群抽样划分的组称为,群,,作用是扩大单位,抽取的基本单位不是总体单位而是群,从而简化抽样工作程序。
(三)评价样本单位集中于群内,显著地影响了总体单位分配的均匀性。
与其他方式相比,在相同的条件下,抽样误差较大,代表性较低。
又称分群抽样或集团抽样,是将总体划分为若干群,然后以群为单位按简单随机抽样或等距抽样方式抽取部分群,对中选群中的所有单位一一调查的抽样组织方式 。
五、多阶段抽样
(一)概念
(二) 优点
1.便于组织抽样
2.可以获得各阶段单元的调查资料
3.方式灵活
4.抽样单位的分布较广,降低抽样误差
(三)适用情况当总体单位很多且分布广泛,几乎不可能从总体中直接抽取总体单位时,常采用多阶段抽样。
多阶段抽样又称为多级抽样,它是将抽取样本单位的过程划分为几个阶段,然后逐阶段抽取样本单位的抽样组织方式 。
本章小结 (一 )
抽样和抽样估计,是在抽样调查的基础上,利用样本资料计算样本指标,据以对总体特征值做出有一定可靠程度的估计和判断 。
抽样估计涉及的概念,
总体和样本概率抽样和非概率抽样重复抽样和不重复抽样抽样框总体参数和样本统计量抽样误差 (抽样平均误差,抽样极限误差等概念需深入领会和重点掌握 )
本章小结 (二 )
抽样估计方法点估计和区间估计 。 其中区间估计是主要方法 。 应理解置信区间,置信度,显著性水平的含义,领会区间估计精确度和可靠度之间的关系,重点掌握总体均值和总体比例的区间估计方法 。
抽样调查的组织方式简单随机抽样,类型抽样,等距抽样,整群抽样和多阶段抽样等,应根据研究目的和研究对象的特点,选择合适的抽样组织方式 。
END