统计学原理
第一章绪论
第二章统计调查
第三章统计资料的整理
第四章总量指标与相对指标
第五章平均指标和变异指标
第六章时间数列
统计学原理
第七章统计指数
第八章抽样调查
第九章回归与相关分析
第十章统计预测
第十一章统计分析综述
第十二章我国国民经济核算体系
学习目标
? 1,了解抽样调查的概念和作用
? 2,理解抽样中的几个基本概念
? 3,理解掌握抽样误差的计算
? 4,掌握参数估计的方法
? 5,理解样本容量的概念及计算
? 6.了解抽样组织形式及推断
第一节 抽样调查的概念和作用
一, 抽样调查的概念
二, 抽样调查的应用范围
三,抽样调查的作用
四,抽样调查的理论基础
抽样调查的概念
抽样推断,即根据样本统计量推断总体参数的过程。也
叫抽样估计。
抽样调查的特点之一,由部分推断总体
统计推断
全及总体指标:参
数(未知量)
样本总体指标:统
计量(已知量)
抽样调查(抽样推断)的概念
随机样本:
与总体分布
特征相同
非随机样本:
与总体分布
特征不同
并非所
有的抽样估
计都按随机
原则抽取样
本。也有 非
随机抽样 。
特点之一:按随机原则抽取样本
特点之三:存在估计误差,并可
加以控制。
抽样推
断误差
登记
误差
代表性
误差
用设计、培训、管
理等方法消除
用抽样方法、样本
容量等手段控制
抽样调查的应用范围:
破坏性测量或试验
无限总体
视同无限总体的现象
无法进行全面调查时
抽样调查的作用:
( 1)节省人、财、物,利于提高经济
效益和统计 资料的时效性
( 2)与全面调查同时进行可互相补
充和验证
( 3)是开展专题研究,提供信息咨
询的重要手段
抽样调查的理论基础
概率论
大数定律
中心极限定理
第二节 抽样中的几个基本概念
一, 全及总体和样本总体
二, 全及指标和样本指标
三,抽样方法和样本可能数目
全及总体和样本总体
总体、样本
?全及总体,调查研究的事物或现象的全体
?样本总体,从总体中所抽取的部分单位构成的集
合体
?样本容量,样本中所含的样本单位数
大样本, n≥30
小样本, n < 30
全及指标和样本指标
全及指标、样本指标
?全及指标,根据全及总体计算的指标,也叫总体参数,
如,总体,总体成数 P、总体方差
或标准差。
?样本指标,根据样本各个单位标志值或标志表现
计算的指标,也叫统计量,
?如:样本均值
样本成数
样本方差
n
XX i??
n
nP i??
22 )(
1
1 XX
nS i ????
均值 E ( X )
方差 E[x-E(x)]2
抽样方法和样本可能数目
抽样方法和样本可能数目
?重复抽样 (放回抽样 ):抽出样本单位登记后放回总
体,再抽时总体不变
?不重复抽样 (不放回抽样 ):抽出样本单位登记后不
放回总体,再抽时总体渐次减少
?样本可能数目:最多可能抽取的样本个数
第三节 抽样误差
一, 抽样误差
二, 抽样平均误差
三,抽样极限误差
抽样误差
抽样推
断误差
登记
误差
代表性
误差
由人为原因造成的、可以
避免的误差,非抽样误差
非人为原因造成的、无法
避免的误差,抽样误差
抽样估计的可能误差
非抽样误差的种
类及产生的原因:
?设计失误或工具不良;
?调查对象选择失误;
?无回答;
?数据处理失误;
?调查人员误导;
?被调查者说谎。
抽样误差
产生的原因:
?用部分单位来
推断总体
抽样估计的可能误差
抽样误差的控制
抽样误差的控制途径:
第一,选择合适的抽样方式
第二,控制样本容量
分层随机样本可能
优于简单随机样本
样本容量越大,则
样本统计量就越接
近总体参数。
关于抽样误差的几点认识:
?抽样误差是样本统计量与
总体参数之间的绝对差异
?对于任何一个样本,其抽
样误差都不可能测量出来
?抽样误差的大小可以依据
概率分布理论加以说明
抽样平均误差
抽样平均误差的概念
抽样平均误差即全部可
能样本的统计量与总体参数
离差的平均数。又称抽样标
准误差、抽样标准误
m e a nESxx ???
m
x
x
? ?
?
2
)( ?
?
n
xx
S
? ?
?
2
)(
注意:不要混淆抽样
标准差与样本标准差!
m
x
x
? ?
?
2
)( ?
?
平均数的抽样平均误差
nn
xx
??
?? ??
2
)(
总体方差
11
)(
2
?
?
??
?
?
??
N
nN
nN
nN
n
xx
??
??
若总体方差 ?2 未知:
?用样本方差S 2 代替
?用历史资料代替
?用试验结果估算
n
S
S
xx
???
1
)(
2
?
?
?
?
n
xx
S
1
)1(
)(
?
?
?
?
?
N
nN
n
PP
pp ??
比率的抽样平均误差
n
PP
n
PP
pp
)1()1(
)(
?
?
?
???
n
pp
S pp
)1( ?
???
总体方
差已知
总体方
差未知
抽样极限误差
抽样极限误差,在一定概
率保证下,样本统计量偏离总
体参数的最大幅度。
抽样极限误差的概念
抽样极限误差越大,则概
率保证程度越高。
)()( px ??
比率的抽样极限误差
n
PP
zzp
p
)1(
)(
?
??? ?
抽样极限误差的概念
样本统计量的抽样分布
总体中心值
N(总体中心值,)
n?
xxx ??? 123 ??? xxx ??? 321
0.6827
0.9545
0.9973
抽样极限误差
可以以抽样平均误
差为单位,用正态
分布特征加以解释
平均数的抽样极限误差
n
zzx x
?
? ??? )(
z值为给定概率保证程
度下样本均值偏离总体均
值的抽样标准差个数。常
用的值及相应的概率保证
程度为:
z 概率保证程度
1 0.6827
1.96 0.95
2 0.9545
2.33 0.98
2.58 0.99
3 0.9973
第四节 抽样估计方法
一, 点估计
二, 区间估计
三,小样本的应用
点估计
在参数估计中,直接以样本
统计量的值作为待估计的总体参
数的值,称为点估计。
点估计的概念
Pp
S
x
?
?
?
?
?
估计值的优良标准
(有效性)
有效性,一个方差较小的无偏估计量称为一个更
有效的估计量 。 如, 与其他估计量相比
,样本均值是一个更有效的估计量
A
B
?
中位数的抽样分布
均值的抽样分布
X
P(X )
估计值的优良标准
(无偏性)
? 无偏性,估计量的数学期望等于被估计
的总体参数
?
P( X )
X
CA
?
无偏 有偏
估计值的优良标准
(一致性)
? 一致性,随着样本容量的增大, 估计量
越来越接近被估计的总体参数
A
B
较小的样本容量
较大的样本容量
?
P(X )
X
为 的无偏、有效、
一致估计量;
为 的无偏、有效、一致估
计量;
为 的无偏、有效、一致估
计量。
x ?
1?nS
?
p P
区间估计
区间估计
1.根据一个样本的观察值给出总体参数的
估计范围
2.给出总体参数落在这一区间的概率
3.例如, 总体均值落在 50~70之间,置信度
为 95% 样本统计量
(点估计 )置信区间
置信下限 置信上限
置信水平
1,总体未知参数落在区间内的概率
2,表示为 (1 - ????
? ??为显著性水平,是总体参数未在区间内
的概率 ?
3,常用的显著性水平值有 99%,95%,
90%
? 相应的 ??为 0.01,0.05,0.10
区间与置信水平
均值的抽样分布
?? ?x
1 - ? ?/2?/2
x?
X
(1 - ?) % 区间包含了 ?
? % 的区间未包含 ?
第五节 样本容量的确定
一, 确定样本容量的必要性
二, 影响样本容量的因素
三,样本容量的确定方法
四,抽样误差系数与抽样精度
五,确定样本容量时应注意的几个问题
确定样本容量的必要性
样本容量
调查误差
调查费用
小样本容量
节省费用但
调查误差大
大样本容量
调查精度高
但费用较大
找出在规定误差
范围内的最小样
本容量
找出在限定费用
范围内的最大样
本容量
样本容量的确定方法
1,根据均值区间估计公式可得样本容量 n为
平均数抽样推断样本容量的确定
2,样本容量 n与总体方差 ?2、允许误差 ?、可
靠性系数 Z之间的关系为
? 与总体方差成正比
? 与允许误差成反比
? 与可靠性系数成正比
其中:
2
22
2
?
??Z
n ? nZ
??
? 2?
例:某地硕士研究生毕业第一年年薪
的标准差大约为 2000元人民币。如果
以 95%的置信度估计其平均年薪,并且
希望抽样极限误差分别不超过 500元和
100元,样本容量应为多少?
?
96.12 ??Z
x?
x?
6247.61
500
200096.1
2
22
2
22
2 ????
?
?
x
Z
n
??
153764.1536
100
200096.1
2
22
2
22
2 ????
?
?
x
Z
n
??
1,根据比例区间估计公式可得样本容量 n为
成数抽样的样本容量的确定
2,若总体比例 P未知时,可用样本比例 来代
替
p^
其中:
2
2
2 )1(
?
? ppZn ??
)1(2 pp
nZ
?
? ??
某网站一个由 400名使用者组成的样
本表明,该网站的使用者中 26%的使用
者为女性。在 95%的置信度下,若希望
将抽样极限误差控制在 3%,则样本容量
应当为:
8 2 225.8 2 1
03.0
)26.01(26.096.1
2
2
??????n
确定样本容量时应注意的
几个问题
1,关于总体方差的问题
2,替代方差问题
3.一次调查满足多项需要问题
抽样组织形式及推断
抽样调查的组织方式:
1·简单随机抽样(纯随机抽样)
?方法:将总体单位编成抽样框,而后用抽签或
随机数表抽取样本单位。
?适用:总体规模不大;总体内部差异小
2·类型抽样(分层抽样)
?方法:将总体全部单位分类,形成若干个类型
组,后从各类型中分别抽取样本单位,合成样本。
总体
N 样本 n
等额
等比例
最优
?
?
?
???
k
i
i
k
nn
nnn
1
21 ?
nNNn i ??1
nNNn
ii
ii ?
?
??
? ?
?
1
2N
kN
1N 1n
2n
kn
··· ···
3·等距抽样(机械抽样)
?方法:将总体单位按某一标志排序,而后按一
定的间隔抽取样本单位。
排序依据的标志,( 1) 无 关标志; ( 2) 有 关标志
(总体单位按某一标志排序)
······ · · · · · ·
4·整群抽样
?方法,将总体全部单位分为许多个,,群,, 然
后随机抽取若干,,群,, 对被抽中的各,,群,
内的所有单位登记调查 。
总体群数 R=16 样本群数 r=4 样本容量
例:
A
B CD
E
F
G H I
J
K
L
M N
O
P L
H
P
D
hlpd nnnnn ????
例,在某省 100多万农户抽取 1000户调查农户生产
性投资情况。
5·多阶段抽样
第一阶段:从省内部县中抽取 5个县
第二阶段:从抽中的 5个县中各抽 4个乡
第三阶段:从抽中的 20个乡中各抽 5个村
第四阶段:从抽中的 100个村中各抽 10户
样本 n=100× 10=1000(户 )
本章小结
1.抽样调查的概念和作用
2.抽样中的几个基本概念
3.抽样误差
4.抽样估计方法
5.样本容量的确定
6.抽样组织形式及推断
结 束