第四章 市场调查的抽样技术市场调查的抽样抽样方法与程序抽样控制
4.1 市场调查的抽样抽样调查的概念抽样调查的优点抽样误差与非抽样误差抽样调查的基本要求关于普查抽样调查的概念抽样调查是按照一定的规则从总体中抽取一部分个体单位作为样本,通过对样本的调查研究所获得的信息资料,来推断总体的信息资料的方法;
因而抽样调查也称作抽样推断。
抽样调查的优点抽样调查采取以部分推断总体的方式,减少了市场调查的工作量,简化了市场调查工作;抽样调查具有如下一些 优点,
费用低速度快应用范围广准确度高市 场 普 查市场普查概述市场普查是指对与市场有关总体的每一个单位进行逐一的、普遍的、全面的调查。市场普查可以获得全面的、
准确的信息资料。适用于不经常进行调查领域的信息资料收集。
市场普查的 局限性耗费时间长,资料的时效性差费用昂贵,耗费大量人、财、物
4.2 随机抽样调查简单随机抽样分群随机抽样分层随机抽样系统抽样
4.2.1 简单随机抽样简单随机抽样的概念简单随机抽样的方法简单随机抽样的估计简单随机抽样的样本容量估计简单随机抽样的概念简单随机抽样又称单纯随机抽样,是所有随机抽样方法中最简单的一种方法。它按照随机的原则从调查总体中不加任何分类、排序、分组等先行工作,直接地抽取调查样本单位。各单位被抽到的机会完全均等,相互独立,排除了抽样过程中各种主观因素的干扰。
简单随机抽样的方法抽签法随机数字表法(利用随机数字表进行随机抽样)
简单随机抽样的估计平均数的估计总体平均数的估计区间重复抽样时抽样平均数的误差估计不重复抽样时抽样平均数的误差估计百分比的估计总体百分比的区间估计重复抽样条件下百分比平均数误差的估计不重复抽样条件下百分比平均数误差的估计总体平均数的估计区间其中 t 为可信度,可根据置信水平查表获得。当可信水平为 68.27%时,t=1;当可信水平为 95%时,t=1.96;当可信水平为 95.54%时,t=2;当可信水平为 99.73%时,
t=3;当可信水平为 99.994%时,t=4;当可信水平为
99.999%时,t=5。
xx txXtx
重复抽样时抽样平均数的误差估计
n
xx
S
n
S
n
i
i
x
1
2
)(
不重复抽样时抽样平均数的误差估计
n
xx
S
n
N
nS
n
i
i
x
1
2
2
)(
)1(
总体百分比的区间估计其中 t 为可信度,可根据置信水平查表获得。当可信水平为 68.27%时,t=1;当可信水平为 95%时,t=1.96;当可信水平为 95.54%时,t=2;当可信水平为 99.73%时,
t=3;当可信水平为 99.994%时,t=4;当可信水平为
99.999%时,t=5。
pp tpPtp
重复抽样百分比平均数误差的估计
n
pp
p
)1(
不重复抽样百分比平均数误差的估计
)1()1( Nnn ppp
简单随机抽样样本容量的估计估计平均数情形下样本容量估计重复抽样不重复抽样估计百分比情形下样本容量估计重复抽样不重复抽样估计平均数情形下样本容量估计( 1)
重复抽样
2
2
x
Sn
估计平均数情形下样本容量估计( 2)
不重复抽样
22
2
SN
NSn
x?
估计百分比情形下样本容量估计( 1)
重复抽样
2
)1(
p
ppn
估计百分比情形下样本容量估计( 2)
不重复抽样
)1(
)1(
2 ppN
Nppn
p
4.2.2 分群随机抽样分群抽样概述分群抽样的数学估计分 群 抽 样 概 述分群抽样是先将市场调查的总体划分为若干个群体,然后以简单随机抽样的方法选取部分群体作为调查样本,
对群体内各个单位进行调查的一种随机抽样方法。分群抽样适用于调查总体单位分布较分散并且无法确定分层标准的大总体。当调查总体相当大时,可以进行逐级分群,一直进行到单个群体的数目足够小时为止,然后从所有的群中随机抽取一定的群作为调查对象实施调查。
分群抽样对总体推断的准确性较差。因而往往与其它方法相结合使用。
分群抽样的数学估计分群抽样样本群的平均数分群抽样样本总体的平均数群平均数的群间方差分群抽样样本平均数的误差分群抽样总体平均数的估计区间分群抽样样本群的平均数其中 为被抽取的第 i群的样本数量,为第 i群中的第 j
个样本单位。 为第 i群样本的平均数为被抽取的样本群数量,r ),r(ixMx i
M
j
ji
i
i 1
1
1
,
iM jix,
ix
分群抽样样本总体的平均数为被抽取的群的数量,为样本总体平均数
r
x
x
r
i
i?
1
r x
群平均数的群间方差
r
xx
r
i
i?
1
2
2
)(
分群抽样样本平均数的误差为总体的总群数)( R
R
rR
rx
)
1
(
2
分群抽样总体平均数的估计区间在给定的自信水平下,分群抽样的总体平均数的估计可以由下式得到
xx txXtx
4.2.3 分层随机抽样分层比例抽样分层最佳抽样分层最低成本抽样分层比例抽样先将总体按照相似性原则分为若干层,然后根据各层在总体中所占的比重从层中抽取相应的样本组成研究样本。
分层抽样可以避免样本差异过大导致的抽样分布不准确。
nNNn ii
分层最佳抽样分层最佳抽样又称做非比例抽样。它是根据各层的样本标准差的大小,又考虑到各层在总体中所占比例的差异,
而调整各层样本数目的抽样方法。分层最佳抽样可以降低样本分布的不准确性。
k
i
ii
ii
i
SN
SNnn
1
分层最低成本抽样分层最低成本抽样既考虑到抽样的统计效果,又考虑到抽样的经济性。
)/(
/
1
k
i
iii
iii
i
CSN
CSNnn
4.2.4 系统抽样系统抽样又称机械抽样或等距抽样。它是先将总体各单位按照某一标志排列,然后根据一定的抽样距离从总体中抽取样本;或者将总体划分为若干类型,然后在各类型中根据一定的抽样距离抽取样本的一种抽样方法。系统抽样既可以属于随机抽样,也可以属于非随机抽样,
其关键在于第一个样本的抽取方式。
4.3 非随机抽样调查任意抽样法判断抽样法配额抽样法配额抽样法配额抽样法是在分层基础上进行的。配额抽样根据其抽样方法可以分为独立控制配额抽样交叉控制配额抽样配额抽样法的基本步骤选择控制特性作为分层标准分层确定各层样本额配额指派独立控制配额抽样分别按照收入水平、年龄与性别进行的独立控制配额抽样的样本分布收入水平 年龄 性别高 100 50以上 50 男 50
中 70 25-50 100 女 150
低 30 25以下 50 -- --
合计 200 合计 200 合计 200
交叉控制配额抽样以年龄、性别与收入水平作为交叉控制因素进行配额抽样的样本配额分布收入水平高 中 低 合计性别 男 女 男 女 男 女年龄
50以上 6 19 4 13 2 6 50
25-50 13 37 9 26 3 12 100
25以下 6 19 5 13 2 5 50
合计 25 75 18 52 7 23 200
合计 100 70 30
抽样误差与非抽样误差抽样误差指总体的位置特性与从样本收集到的数据之间的差异,
这是由于样本不能完全代表总体所带来的,抽样误差是抽样调查所固有的;抽样误差可以进行计算与控制,因而也称做可控误差。
非抽样误差指在选择样本和调查过程中所产生的误差。
抽样调查的基本要求正确确定抽样方法,是抽出来的样本具有充分的代表性。
恰当地确定样本的单位数目;样本单位数的大小取决于调查的精确度要求、抽样调查方法、调查费用预算以及调查时间等因素的综合作用;一般而言,样本容量越大抽样误差越小,但费用也越多,时间也越长。
加强抽样调查组织,提高工作质量。