第七章 样本设

7.1样本设计概述
7.1.1 抽样调查的含义及其特点
? 抽样调查的概念
抽样调查也称为抽查,是指从调
研总体中抽选出一部分要素作为样本,
对样本进行调查,并根据抽样所得的
结果推断总体的一种专门性的调查活
动。抽样调查是一种被广泛使用的有用
方法。
抽样调查的特点
抽样调查最主要的特点在于其应用科
学的方法, 在总体中抽取有代表性的调查
对象进行调查, 克服了普查的组织困难和
费用高、时间长的缺点, 也克服了传统调
查方法 ( 如重点调查、典型调查 )的主
观随意性和样本代表性不强的弱点, 具有
较强的代表性和科学性, 是比较科学和客
观的一种调查方法。
抽样调查的优点
? 时间短、收效快。
? 质量高、可信程度好。
? 费用省、易推广。
抽样调查的 缺点
由于抽样调查所调查的对象是
调查对象中的一部分, 抽样调查的
结果是从抽取的样本中获取的信息
资料推断出来的, 所以, 抽 样调
查存在着抽样误差。抽样误差是客
观存在的, 在一定范围内也是允
许的。
? 确定调查总体
? 个体编号
? 选择调查样本
? 实施调查
? 测算结果
7.1.2 抽样调查的一般程序
7,2.抽样技术
?随机抽样技术, 交称为概率抽样技术, 是对总体中每
一个体都 ; 等的抽取机会的抽样技术。在随机抽样的条
件下, 每个个体抽中或抽不中完全凭机遇, 排除了人的
主观因素的选择, 在具体操作过程中, 由于采用的技术
和调查总体的特征不同又可细分为不 同 的方法。
?非随机抽样技术是对总体中每一个个体不具有被平等
抽取的机会, 而是根据一定主观标准来抽选样本的抽样
技术。由于主观标准的确定和判断力的不同以技采用的
具体方法、操作技巧等不用又可分为不同的非随机抽样
方法。
7.2.1 抽样技术的种类
随机抽样技术,
1,简单随机抽样技术
简单随机抽样技术,又称为单纯随机抽样技术,是在总体单
位中不进行任何有 目 的的选择, 而是按随机原则,纯粹偶然的方法
抽取样本。
2,分层随机抽样技术
分层随机抽样技术,又称为分类随机抽样技术,是把调查总
体按其属性不同分为若干层次 ( 或类型 ),然后在各层 ( 或类
型 ) 中随机抽取样本。
3.系统抽样技术
系统抽样技术,又称等距离随机抽样技术或机械随机抽样技
术。它是在总体中先按一定标志顺序排列,并根据总体单位数和
样 本单位数计算出抽样距离 ( 即相同的间隔 ),然后按相同的距
离或间隔抽选样本单位。
4.整群抽样技术
分群随机抽样技术,又称分群随机抽样技术, 是把调查总
体区分为若干个群体,然后用单纯随机抽样法,从中抽取某些群
体进行全面调查。
简单随机抽样技术
? 常用的有抽签法和乱数表法。
? 1,抽签法
用抽签法抽取样本, 先将调查总体的每个单位编上号码, 然后将
号码写在卡片上搅拌均匀, 任意从中抽选, 抽到一个号码, 就对
上一个单位, 直到抽足预先规定的样本数目为止。这种方法适用于
总体单位数目较少的情况。
? 2,乱数表法
乱数表又称随机数表, 是指含有一系列组别的随机数字的表格。
利用特制的摇码机器 ( 或利用电子计算机 ) 在 O 到 9 的阿拉伯 数
字中,按照每组数字位数的要求 ( 如 2 位,3 位,甚至 10 位一
组等 ),自动随机逐个摇出 ( 或由电子计算机打出 ) 一定数目的号
码编成, 以备查用, 或参照乱数表选择
乱数表
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62
97 74 24 67 62 42 81 14 57 20 42 53 32 37 32
16 76 62 27 66 56 50 26 75 07 32 90 79 78 53
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90
01 22 77 94 39 49 54 43 55 82 17 37 93 23 78
41 11 17 53 71 57 24 55 06 88 77 04 74 47 67
61 26 63 78 59 16 95 55 67 19 98 10 50 71 75
33 21 12 86 29 78 64 56 07 82 52 42 07 44 38
57 60 17 34 44 09 47 27 96 54 49 17 45 09 62
70 28 17 12 13 40 33 20 38 26 79 83 51 03 74
56 62 37 35 18 98 83 50 87-75 83 11 25 93 47
? 使用乱数表时,首先要把调查总体中的所有单位加以编号,
根 据编号的位数确定使用若干位数字,然后查乱数表。在乱数
表中任意选定一行或一列的数字作为开始数,接着可从上而下,
或从左至 右,或一定间隔 ( 隔行或隔列 ) 顺序取数,凡编
号范围内的数字号码 即为被抽取的样本。如果不是重复抽样,
碰上重复数字应舍掉,直到抽足预定样本数目为止。
? 例如,要从 94 家上市公司中抽取 12 家作为调查样本,可
先将 94 家公司由 94 编号 N=94,然后在乱数表上任意一点一行
( 或一列 ) 中的一个数字作为起点数,从这个数字按上下或左
右顺序读起,每出现两个数字,即为被抽中的单位码号。假定
本例是从第四行左边第五个数字向右顺序读起,则所抽取单位
是,59 16 55 67 19 10 50 71 75 33 21 12 在顺序抽取的过程
中,遇到比编号大的数字,应该舍去。此例中的 95, 98 两个
数字因大于 94,故舍去不用。
系统抽样技术 实例
某地区有零售店 110 户,采用系统抽样技术抽选 11户进行调查。
第一步,将总体调查对象 (110 户零售店 ) 进行编号,即从 1 号至 110
号。
第二步,确定抽样间隔。已知调查总体 N=110,样本数 n=11户,故抽样间
隔 =110/11=10( 户 ) 。
第三步,确定起抽号数。用 10 张卡片 ( 即抽样间隔 ) 从 1 号至 10 号编
号,然
后从中随机抽取 1 张作为起抽数号。如果抽出的是 2 号,2 号则为起抽号数。
第四步,确定被抽取单位。从起抽号开始,按照抽样间隔选择 样本。本例
从 2 号起每隔 10 号抽选一个,直至抽足 11 个为止。计算方法是,
2
2 十 10=12
2 十 10 × 2=22
2 十 10 × 10=102
即所抽的单位是编号为 2, 12, 22, 32, 42, 52, 62, 72,
82, 92, 102 的 11 个零售店。
分群随机抽样
分层随机抽样
随机抽样 优

技术 优点 缺点
非 随机抽样技术
1.便利抽样法
又称 任意抽样技术 。它是调查人员按工作的
方便,随意抽选样本的一种抽样方法。
2,判断抽样技术
判断抽样技术又称目的抽样法。这是一种根据
调查人员的经验 或 某些有见解的专家选定样本的抽
样方法。
3,配额抽样技术
配额抽样技术是按照一定标准,分配样本数
额,然后在规定数额知由调查人员任意抽选样本
的一种抽样方法。
配额抽样 一般可 分为 以下 两大类,
?独立控制配额抽样, 它是对调查对象只规
定具有一种控制特征的样本抽取数目并规定
配额, 而不是规定具有两种或两种以上控
制特征的样本抽取数目并规定配额。
?非独立控制配额抽样, 相互控制的配额抽
样它同时对具有两种或两种以上控制特征
的每一样本数目都作 出 具体规定。
按被调查对象的 控制特征分为年龄、性别、收入三种。确定样本
总数为 180 个, 按独立控制特征配额抽样则可列成 下 表,
从 上 表可以看出, 虽然有年龄、性别、收入三个控制特
征,但各特征是独立控制配额抽取样本数目的, 不要求相互
受到牵制,也不规定三种控制特征之间有任何关系。如在年
龄组 18- 29 岁的有 30人, 这 30 人中间男、女各多少, 高收
入、中收入及低收入又有多少, 都没有规定样本抽取数目。这
就是独立控制配额抽样的特点。
独立控制配额抽样具有简便易行, 费用少等优点, 但有
选择样本容易偏向某一类型而忽视其他类型的缺点。例如,
偏重于年龄较轻的低收入或年龄较大的高收入者。这个缺点可
通过相互控制配额抽样来弥补。
相互控制的配额抽样具体操作方法是借助于交叉控制表, 又称相互控制配额抽样表,
根据交叉控制表, 调查人员可以清楚知道自己应当抽取若干个控制特征的样本抽取数。
例如,18- 29 岁的被调查者应有 30 人,其中高收入的男性和女性各抽 3 人, 中收入的
男、女各抽 4 人, 低收入的男、女各抽 8 人。
7,3,样本容量
7.3.1样本容量与样本代表性和精确
性的关系
样本容量即样本大小, 样本容量
与样本代表性无关, 与样本精确度相
关 。
SYμ
? y yi
? y yi
? y yi
? SY
? SY
? SYμ -y = z s
y
7.3.2 简单随机抽样 下的样本容量
μ — 总体平均数
Y= Σ yi/n (样本 平均数 )
SY2=Σ (yi-y)2/n-1 (样本方差)
SY2={Σ (yi-y)2/n-1}(N-n/N-1)(修正后样本方差)
SY =SY/n-2 (样本标准误)
?置信区间:
Y + Z S Y (n>30)
简单随机抽样 下的样本容量大小 n*
n*=Z 2(δ y)2/h2
Z — 可靠性系数(取值 1,2,3)
δ y — 标准差 (δ y— SY)
h2— 容许水平或精确度( h=μ - y 其
中 μ 总体特征平均值,y— 样本特征平
均值)
h=Z SY
SY= h/Z= SY / n-2
故, n* =Z 2SY2/ h2
r— 相对容许水平(固定百分比,如 5%、
10%)
r=h / y h= r y
n*=Z 2 SY2/ h2=Z 2 SY2 / (r y)2
=Z 2(SY / y)2/ r2
令,CY =δ y/ y
n*= Z2 CY2 /r2
置信区间:
Y + ( Z /2 ) SY (n>30)
简单随机抽样 下的样本容量大小 n*(成数确定)
n*=( Z )2( pq )2/ r2
p=(1-q) (当 p=50%时,n*最大 当 p=0 时,
n*最小)
某企业欲作一市场调查,了解被调查者对
本企业产品的态度,该企业目标市场内估计有
5000个用户,根据企业调查能力,选定 30个样
本,在 30个被调查者中,有 14个认为, 很满意,
其余认为, 不满意,,试估计目标市场用户的
的满意程度。( 置信 度取 95%)
7.3.2 分层 抽样 下的样本容量
?N=∑N h n= ∑n h wh= Nh/N
?Y(ST)= ∑ w hyh
?SY(ST)= {∑ w h2 SYh2}-2
?SY(ST)= {∑ w h2 SYh2/nh}-2
?(其中 SYh2=Σ (yih- yh)2/nh-1)
分层 抽样 下的样本容量
n*≈N Z 2(δ wy2/ Y )/ (Z 2)(δ wy2/ Y) + Nr2
(其中 δ wy2= ∑ N h δ yh2/N)
比例分层,
nh=(Nh/N)n
最优分层,
nh=(Nhδ yh/∑ Nhδ yh )n
某县农资公司去年底对本县的 30000 户农户进 行
了一次农用喷雾器需求的简单随机抽样调研, 调研
结果, 在 1200户调研样本户中, 农用喷雾器的保有
量为 540 架, 今年打算 购买喷雾器为 72 架 。
根据以上资料,要求,
(1)计算出样本户去年底喷雾器农户普及率以
及今年每百户预期购买喷雾器多少架? 并对该县今
年农用喷雾器需求量作点估计 。
(2 )设允许抽样误差不超过 1.35%,试运用简单随
机 抽样确定 平均抽样误差, 推断需求量置信区间
。并指出这个推 算结果的把握程度有多大?
某企业欲作一市场调查,该企业目标市
场内估计有 5000户居民,根据企业调查能
力,选定 30个样本,调查结果如下表所示,
试估计目标市场居民每月平均支出额及总
购买支出。( 置信 度取 95%)
家庭顺序 n 每月支出 yi 离差 yi-y 方差和 (yi-y)2
1 100 -10 100
2 130 20 400
3 120 10 100
??
??
?
??
??
??
??
?
??
??
30 110 -20 400
n=30 ΣYi=3300 Σ(yi-y)2=5000
某地共有居民 20000户, 按经济收入高低进
行分类, 其中高收入的居民为 4000户, 中收
入为 12000户, 低收入为 4000户 。要从中抽
选 200 户进行购买力调查,试用比例分层、
最佳分层、最低成本抽样法确定每层样本数,
并比较结果。 (c1=7, c2=10,c3=12,
syi=100,sy2=150,sy3=200 )