抽样方法简介
北京大学公共卫生学院
陈育德
2
抽样方法
1,单纯随机抽样:如:抽签、摸球、随机数字表
2,系统抽样:又称间隔抽样、机械抽样:例如:抽
户的方法是先确定一户,如第 5户,以后每间隔 10
户抽一户,则得到样本户 5,15,25,35……
3,分层抽样:先按某种特征将总体分为若干组(类
型、区),统称为“层”,再从每一“层”中进
行随机抽样。
4,整群抽样:以“整群”为抽样单位。例如以乡、
村等为“整群”进行抽样。
5,阶段抽样(多阶段抽样):例如在市(区、县)
中先以乡镇(街道)为整群进行抽样再在乡(街
道)中以管理区(村)、居委会为整群进行抽样。
3
第二阶段抽样调查实例
1,全县人口累计(各乡)数为,248600
2,抽样间隔,248600/5=49720
3,取一张人民币:号为 FP59243854,后 5位为 43854,是
为随机数
4,确定第一个样本,43854落在第 3编号乡(玉阳镇)后面
的累计数之内,故确定玉阳为第 1个样本。
5,确定第二个样本,43854+49720=93574,落在第 5编号
乡(新龙乡)后面的累计数之内,故确定新龙乡为第 2个样
本。
6,确定第三个样本,93574+49720=143294,落在第 8编
号乡(新原乡)后面的累计数之内,故确定新原乡为第 3个
样本。
4
第二阶段抽样调查实例
编号乡镇 人口

累计 编号乡镇 人口

累计 编号乡镇 人口

累计
1城关镇 22000 22000 7平原乡 16400 134900 13新店镇 10000 205500
2平湖镇 21000 43000 8新原乡 15000 149900
*
14安定乡 9500 215000
3玉阳镇 20000 63000* 9古农乡 14000 163900 15五岖乡 8900 223900
4五一乡 19500 82500 10王店乡 11000 174900 16五庙乡 8500 232400
5新龙乡 18400 100900
*
11双莲乡 10500 185400
*
17双山乡 8200 240600
6湖泊乡 17600 118500 12桐连乡 10100 195500
*
18四顶乡 8000 248600
*
5
第三阶段随机整群抽样实例
? 全乡人口(各村人口累计),7337
? 抽样间隔,7337/2=3669
? 取一张人民币,确定其编号后四位数 2273为
随机数
? 确定第一个样本,2273落在第四编号(镇北
村)的累计数之内,确定镇北村为第一个样本。
? 确定第二个样本,2273+3669=5942,落
在第 10编号的累计数之内,确定清平村为第
二样本村。
6
第三阶段随机整群抽样实例


村 人口数 累计数 编号 村 人口数 累计数
1 镇西店村 724 724 7 长生庙村 589 4606
2 唐家铺村 721 1445 8 王甸子村 574 5180
3 镇东村 689 2134 9 民生村 571 5751
4 镇北村 671 2805* 10 清平村 544 6295*
5 李家店村 610 3415 11 老平埠村 534 6829
6 湖泊村 602 4017 12 高水村 508 7337
7
样本个体的抽样
? 最终的抽样单位是住户,在每个“样本村”
(居委会)中按 20%的比例随机抽取住户,
平均每个村抽 60户,全国共抽取 54000户。
全国平均每户被抽取为样本的概率为
54000/28000万,约每 5000户中抽一户。
如果按每户四人计算,人口抽样比也为 1:
5000左右。
8
样本个体的抽样
? 抽户方法是个样本乡镇(街道)的调查指导员按
上述抽样比例在样本村(居委会)随机抽取。具
体方法是,
1,按人口普查的编码顺序,按门牌号、楼号、单元
号、门号从小到大排列;
2,对同一门牌号、同一个大院和楼号的,按门号从
小到大排列,对同一门牌号内没有门号的按从左
到右、从外到里、从下到上的原则编码,一经编
码不许变动。
3,编好住户码列入住户清单表式中,
9
样本个体的抽样
? 本村人口,1200,户数 300,每户平均人口数 4人
? 应抽户数,60
? 抽样间隔,1200/60=20
? 确定随机数字:取一张人民币,后两位数为 12
? 确定第一样本户,12落在第三编号户累计数之内,
故确定第三户为第一样本户。
? 确定第二样本户,12+20=32,落在第几编号户累
计数内,该户即为第二样本户。
10
样本个体的抽样
序号 户主名称 家庭住址 门牌号码 家庭人口数 累计人口数 抽中住户
1 张三 *村 *组 东 1 5 5
2 李四 *村 *组 东 2 4 9
3 王五 *村 *组 东 3 4 13 *
4 赵六 *村 *组 东 4 3 17
5 陈七 *村 *组 东 5 5 22




300 赵末 *村 *组 北 6 6 1200