第九讲,抽样设计
?抽样设计在营销调研中的必要性
?抽样调查方案设计的主要内容
?如何确定抽样方式和抽样方法
?如何确定样本容量
?如何确定抽样估计方法
本章学完后学生应知道:
抽样基本概念及选取样本的理由
不采取抽样调研的偏误
何时应采取抽样调查来研究
市场营销问题
一,抽样设计在营销调研中的必要性
抽样调查的涵义
抽样调查 是一种非全面调查。它有
广义的抽样调查与狭义抽样调查之分
广义的抽样调查 是 指根据统计研究目的,按
照一定的原则( 包括随机原则与非随机原则 )
从总体中抽取一定数目的样本,对样本进行调
查后,获得样本指标,然后依据样本指标对总
体相应指标作出估计或推断( 包括有概率保证
的估计与无概率保证的估计 )。
狭义抽样调查 是指根据统计
研究目的,按照随机原则 从总
体中抽取一定数目的样本,对
样本进行调查后,获得样本指
标,然后样本指标对总体相应
指标作出估计或推断。
狭义抽样调查
抽样推断的真实意义
?总体与样本
?总体指标 (参数) 与样本指标
(统计量)
?样本容量和样本个数
抽样调查中几个最基本的范畴
总体 是指根据调研计划的目的所规
定的研究整体 。 The population
is the entire group under study as
defined by research objectives
样本 是能代表整体的总体的子集 。
The sample is a subset of the
population,and the sample unit pertains
to the basic level of investigation.
总体与样本
抽样框与样本结构误差
抽样框 是能够用于抽样的全
部总体的名单
A sample frame is master
list of the entire population.
– A listing of the population
may be inaccurate and thus
contain sample frame error.
样本个数与样本规模
样本个数( Number of Samples)
是按一定的抽样方法在抽样总体中
可抽取的样本个数。意即按一种抽
样方式对特定总体最多能抽多少个
样本。
样本容量 (Sample Size) 是一次抽
样中所抽取的样本包含的样本单元
数。
总体参数与样本统计量
总体参数 ( parameters of
population)是指反映特定现象数量
特征的指标。用 表示。
样本统计量 ( Statistics of Samples)
是对样本的观察与计量后所得到
的反映样本数量特征的一系列指
标。用 表示
?
??
总体参数与样本统计量的关系
总体参数 样本统计量
指标名称 符号 指标名称 符号
总体单位数 N 样本容量 n
总体平均值 样本平均值
总体比例 P 样本比例 p
总体方差 样本方差
总体标准差 样本标准差
总体抽样个数 M 抽样误差
X
2? 2
s
??
? s
x
? ??
101
×ü
ì?
?ù ±?
μ¥ ??
í3 ??
á?
??
±ê
·′ ó3 ?ù ±? ×ü ì?
μ? êy á? ì× ?÷
·? ?a
×? o?
·′
ó3
??
±ê
×ü
ì?
ì×
êy
á?
ì×
?÷
à′ ?′
?ˉ o?
?? ?? ?ù ±? ?? ?? ?? ?? μ? 1× ?μ?? ?? ?ù ±? ?? ?? ?? ?? μ? 1× ?μ
抽样基本概念之间的关系
市场调查误差的来源
调查误差的来源
登记性误差 代表性误差
系统性误差
(偏差)
随 机 性 误 差
(抽样误差)
*
*
偏差与抽样误差的异同
*******
*******
*******
**
***
***
*
*
*
* ******
*
*
***
***
***
***
********
*****
*******
1, 如何科学地抽选样本,
才能 满足抽样推断 的要求;
2.如何 科学地进行估计 才
能实现对总体数量特征的正
确认识
必须提出与论证以下两方面的问题,
抽样方法体系 是指多种具有不
同特点与功能的抽样方法组合起来
,相互补充, 从而构成了抽样方法
体系, 其基本功能是为满足不同统
计研究目的的需要, 因地制宜, 因
时制宜地提供实用的抽样方法 。
抽样方法体系
抽样方法图示
未知
总体
样本 i
样本 i样本 i
样本 i
样本 i
样本 i
样本 i
样本 i
样本 i
样本 i 样本 i
样本 i
样本
个数
M
样本
容量
抽样调查方法的种类
1、按抽样所遵循
的原则划分为
非随机抽样
随机抽样
2, 按总体
中每个单位
被抽取的概
率是否相等
划分为
等概率抽样
不等概率抽样
3, 按被抽取的样本是否放回划分为
重置抽样
不重置抽样
4.按抽样的
组织形式不同,
随机抽样可划
分为
简单纯随机抽样
分层随机抽样
等距抽样(也称机械抽样或
系统抽样)
整群抽样
5, 按抽样是否一次完成划分为
一阶段抽样
二阶段抽样
多阶段抽样
6, 按抽取样本
前是否确定样本
容量划分为
序贯抽样
固定样本容量抽样
7, 按抽样研究目的的多少划分
单一目的抽样
多目的抽样
8.按抽取样本个数多少划分
单样本抽样
交叉样本 抽样
9, 按抽取的样
本是否固定进行
调查划分为
不固定样本的一次性调查
固定样本的持续性调查
定义有
关总体
获得
总体
名单
设计样
本方案
接近
总体
抽取
样本
样本
证实
若有需要,重新抽样
二,抽样调查方案设计的主要内容
案例研究,浙江财经学院学生就业意愿调查
确立
项目
调查
前的
准备
调查分
析过程
调查
结果
陈述
确立项目
明确该项调查的必要性
建立项目小组
进行调查费用、时间及
人力、物力的评估
调查前的准备
设计调研方案(含问卷设计)
试调查及访员培训
印刷问卷及与被访者预约
定义有关总体
目标总体 —— 根据市场调查目的
所确定的调研范围
总体的有限与无限
抽样总体应与目标总体在理论上
保持一致
获得总体名单
获取完整的抽样框是困难的。
抽样框的缺陷表现为:
样本单元的遗漏与重复
从学生处获取学生花名册
设计样本方案
设计抽样方式
确定样本容量
例如:在浙江财经学院运用配额抽样
抽取 500名学生进行就业意愿的调查
接近总体
如何能够接触到所有的抽样单元
是值得很好研究的。
无回答率是抽样估计方式与样本
容量设计中应重视的重要因素
抽取样本
抽取样本的两阶段过程:第一
阶段,必须选择样本单位;第
二阶段,必须从样本单位中获
得信息
实际抽样中应考虑 样本替换 及
超量抽样 以及 重新抽样 等问题。
样本证实
样本证实是提供抽样依据的过程。
向调查委托人保证抽样的科学性
和有效性是必要的
确定抽样方式应考虑的因素或条件
案例讨论,如何确定浙江财
经学院学生就业意愿调查的样本
项目对估计精度的要求
项目预算费用的丰欠
调查人员的素质高低
三、如何确定抽样方式和抽样方法
概率与非概率抽样方式的选择
概率抽样方式 ( Probability Sampling Methods)
简单随机抽样 ( SIMPLE RANDOM SAMPLING)
系统抽样 ( SYSTEMATIC SAMPLING)
整群抽样 ( CLUSTER SAMPLING)
分层抽样 ( STRATIFIED SAMPLING)
非概率抽样方式 ( Nonprobability Sampling Methods)
便利抽样 ( CONVENIENCE SAMPLING)
判断抽样 ( JUDGMENT SAMPLING)
推荐抽样 ( REFERRAL SAMPLING)
定额抽样 ( QUOTA SAMPING)
简单随机抽样 Simple Random Sampling
操作方法 —— 是在抽样总体中
按随机原则利用抓阄或随机数表
等方法来直接抽取样本的方法。
优点 —— 简便易行 。
缺点 —— 当总体差异性大时,这
种方法会带来较大的误差。
评述 —— 对总体小且分布均匀的
情况下,适合于 SRS。
系统抽样 Systematic Sampling
操作方法 —— 访是将总体各单位按一
定顺序排列并编号,先随机形成起点,
尔后按相同间隔抽取样本,直至抽够全
部样本本单位。
优点 —— 比 SRS更容易抽取样本和节省 。
缺点 —— 当总体层次差异显著时,易产
生偏差( Vias) 。
评述 —— 当总体层次差异小,分布均匀
且抽样框完整时,可以采用。
整群抽样 Cluster Sampling
操作方法 —— 先将总体分成若干次
总体(或称群),然后,随机地从
中抽取若干群,并对被抽中的群进
行全面调查。
优点 —— 成本较低、节约时间,容
易操作。
缺点 —— 对分布不均匀的总体按此
方法会产生较大偏差 。
评述 —— 当总体容易进行分群且调
查对象相对集中时,可以采用此法 。
分层抽样 Stratified Sampling
操作方法 —— 是对分布不均匀且层次
分明的总体按, 层内方差尽量小,层间
方差尽量大, 的原则进行分层,然后在
每层中随机抽取足量样本进行调查。
优点 —— 抽样误差较小,估计效果较好 。
缺点 —— 操作复杂,成本也较高 。
评述 —— 在总体分布层次分明且有足够
的时间和经费保证的条件下,应尽可能
用此方法进行市场调查 。
分层抽样图示
总体
N
1N
2N
LN
1n
2n
L n
样本
n
便利抽样 Convenience Sampling
操作方法 —— 访问者通过 拦截调查
等方法确定样本单位并获取定性或定
量的市场信息。
优点 —— 成本低,容易进行。
缺点 —— 由于所抽取的样本其结构难
以成为总体结构的映射,因此很容易
产生偏差且不能计算抽样误差 。
评述 —— 在对抽样估计精度要求不高
且时间紧,费用不足的情况下可以进
行这类市场调查 。
判断抽样 Judgment Sampling
操作方法 —— 访问者运用 焦点访谈
等方法事先在总体中筛选被调查者、
然后进行调查。
优点 —— 容易进行 。
缺点 —— 被选对象难以成为总体的代
表,因此往往会出现偏差,也同样未
能提供抽样误差 。
评述 —— 进行在新产品试销过程中可
以采用此法 。
推荐抽样 Referral Sampling
操作方法 —— 访问者在所调查的少量样
本之后,要求被调查者再提供更多的可
进行更大范围的调查者名单。如此,使
调查总体不断扩大。
优点 —— 当没有掌握抽样框的信息,而
回答者又能提供更多的被调查者时,利
用本方法很有效。
缺点 —— 容易产生偏差及不能提供抽样
误查 。
评述 —— 对总体较小且在某些特征方面
具有层次分明特点时可以进行这类调查 。
定额抽样 Quota Sampling
操作方法 —— 先确定需调查的总量。
然后将样本量按一定原则进行分配,由
每位访员自已确定被调查者进行访问。
优点 —— 成本容易控制。访问者容易进
行调查。
缺点 —— 调查质量深受访问者工作态度
与能力的影响,也不能提供抽样误差 。
评述 —— 在当今的市场营销调研中这种
方法普遍运用 。
如何选定抽样方法
注意,在选定抽样方式后,运用每种
抽样方式都有一些具体的做法可供再选
取,其中,相当多的是经验与技术相结
合的。
简单随机抽样
蒙眼(抓阄)法
随机数表法
系统抽样的取样方法
中心开花法
顺序法
左(右)手法则法
教
条
式
方
法
约
定
式
方
法
成
本
基
础
法
统
计
分
析
法
置
信
区
间
法
四、如何确定样本容量
决定样本容量大小的因素
样本容量、
估计精度与
估计成本之
间的关系
差异性、置信
区间、抽样分
布和标准误差
之间的关系
?
?
教条式方法
教条式方法 —— 是按照“老
经验”来确定样本。如,“凭
经验,为保证精确,样本至少
应该是总体的 5%”
教条式方法 —— 访问者按过去的经
验或别人通行的做法来确定样本容量。
优点 —— 容易操作。
缺点 —— 要么太浪费,要么样本不
足量 。
评述 —— 进行对费用、估计精度要
求不高、调查时间紧的项目可进行此
类调查 。
教条式方法
约定式方法
约定式方法 —— 是按某一约定( MR
的提供方和使用方都接受的)来确
定样本容量。
优点 —— 简便易行。比教条法有些
合乎逻辑。
缺点 —— 成本高且难保证估计精度 。
评述 —— 教条法与约定法都有显著
的缺陷,注意选择应用。
成本基础法
成本基础法 —— 按预算控制
所要求的调查成本来反推算可接受
的样本容量。
优点 —— 成本控制容易得到实现。
缺点 —— 抽样估计精度难以保证 。
评述 —— 当估计精度要求不高时
可采用此法 。
以成本为基础考虑样本容量
设总成本为 C,则总成本包括:固定
成本 C1(包括设计费用、宣传费用等)
和可变成本 C2=n CD(包括调查人员的
差旅费用、礼品费用等) 有:
C= C1+ C2= C1+n CD
例如:某委托公司愿出 20000元 RMB 进行一
次市场调研,除去其预留费用外,可直接用
于调查的费用是 12000元,据估计,各种固定
费用合计为 4000元,每调查一个样本的费用
是 80元,试问最多可抽多少样本?
计算结果
据上述信息计算如下:
? ? ? ? 1 0 0
80
4 0 0 01 2 0 0 01 ?????
DC
CCn
确定样本容量的一个较好的方法是考
虑成本与调研对于经理的价值之间的
关系。如果经理需要非常精确的信息,
则调研人员应当建议采用大样本,然
后,再估计取得这一样本所需的成本。
精度
100%
95%
50%
50%
20% 100%
可以用下的图形来表示抽样精度和调查
费用之间的关系:
费用
统计分析法
操作方法 —— 是多目标抽样估计
时或针对不同样本子集进行调研时,
通过统计分析计算,获得满足这些
子集研究所需要的最小样本量。
优点 —— 可以满足多目标的样本容
量要求。
缺点 —— 计算复杂 。
评述 —— 进行大规模市场调研时,
可考虑采用此法 。
置信区间法
操作方法 —— 按照抽样理论来科学计
算能够确保抽样估计精度的样本容量。
优点 —— 精度高、成本合理。
缺点 —— 费时、费力,对营销调研人
员要求具有较高的抽样理论知识 。
评述 —— 进行大多数具有较高估计精
度要求及调查费用预算明确的市场调
查都应采用此法 。
影响样本容量的因素
影响样本容量的因素
总
体
方
差
允
许
误
差
置
信
度
抽
样
方
法
组
织
形
式
样本分布 —— 是按一种抽样方
法对同一总体抽取若干独立的样本,
后,而由每个样本统计量所形成的
状况就是样本分布 。
依抽样分布定理,大样本的平均
数的期望与总体均值一致 。
大样本的分布特征可以用正态分
布或近似正态分布来描述
样本分布
样本的差异性是客观存在的
样本的差异性受总体差异性的制约。
大样本的差异性分布特征服从或接
近钟形分布特征
差异性小的样本统计量落入由一定
估计精度确定的范围的可能性大,反
之则可能性小。
差异性置信区间
抽样平均误差
抽样平均误差 —— 是反映样本统计量与
总体参数之间的平均误差程度或所有可能样本的
实际误差的一般水平。
计算公式:
可能样本个数
总体参数)(样本统计量抽样平均误差 2-??
M
2)?(
)?( ???? ?? ?
影响抽样平均误差大小的因素
影响的因素
总
体
方
差
样
本
容
量
抽
样
方
法
组
织
形
式
抽样平均误差、抽样极限误差与
概率度之间的关系
抽样极限误差 =
概率度 × 抽样平均误差
)()( xx t ????
)()( pp t ????
在平均数情况下:
在成数情况下:
)?()?( ?? ??? t?
样本容量的确定(平均数)
不重复抽样
重复抽样
2
)(
2
)(
2
2
x
x
Z
n
?
?
??
2
)(
2
2
2
)(
2
)(
2
2
xx
x
ZN
NZ
n
?
?
?
?
??
?
例题:用平均数确定样本容量
3841003 8 4 0 0100 1 0 0 0 084.310 10096.1 2
22
??????n
若以总体方差估计值为 100,置信区间为 95%,允
许误差为正负 10%,则最佳样本容量为:
样本容量的确定(成数)
不重复抽样
重复抽样
2
)(
2
)(
2
2
p
pZ
n
?
?
??
2
)(
2
2
2
)(
2
)(
2
2
pp
p
ZN
NZ
n
?
?
?
?
??
?
例题:用样本成数(百分率)确定样本容量
1067996009 250084.33 505096.1 2
2
???????n
18509166509 250066.63 5050.582 2
2
??????? 。n
若以相对误差率为正负 3%,则最佳样本容量为:
若改变相对误差率为正负 3%,则最佳样本容量为:
设允许误差为正负 3%,总体方差取最大值
( P=0.5),置信区间为 95% 或 99%
抽样估计步骤
抽样估计基本方法
抽样估计的优劣的标准
区间估计
五、如何确定抽样估计方法
估计的步骤
计算样本统计量
计算抽样平均误差
在给定的 即 F(t)下,
计算抽样极限误差
在给定的抽样极限误差下,
计算 即 F(t)的值
计算总体参数的估计区间
第一步
第二步
第三步
第四步
??1
??1
抽样估计的基本方法
参数估计
点估计 区间估计
估计量优劣的标准
优劣标准
无
偏
性
有
效
性
一
致
性
区间估计
根据样本估计量以一定可靠程度推断总体参
数所在的区间范围
设总体参数为 为由样本确定
的两个统计量,对给定的,有 )( 10 ?? ??
则称 为参数 的置信度为
的 置信区间
)( ULθ ?,? ??1
???? ???? 1)( ULP
U???,,L
L?
—— 置信下限
—— 置信下限
U?
??1
?
—— 显著性水平
置信度或可靠程度、可信度、
把握程度、概率保证程度 [也可用 F
( t)表示 ]
置信区间与置信度的含义
—— 置信度
总体均值的区间估计(一)
????????? 1)( )()( xx xXxP
大样本情况下
n
sZZ
xx ????? 2)(2)( ?? ?
查正态分布表— 2?Z
总体均值的区间估计(二)
??????? 1)( )()( xx xXxP ??
小样本情况下
n
stt
xx ???? 22 ?? ? )()(?
分布表查— tt 2?
计算样本统计量
计算抽样平均误差
在给定的 即 F(t)下,
计算抽样极限误差
在给定的抽样极限误差下,
计算 即 F(t)的值
计算总体参数的估计区间
第一步
第二步
第三步
第四步
??1
??1
抽样估计步骤
例:对某款手机购买能力调查,抽样资料如下,
使用 95.45%的概率,估计某市居民对该款手机
的购买平均价格。
购买
价格
875 925 975 1025 1075 1125 1175 1225 合
计
人数 1 2 6 35 43 9 3 1 100
第一步:计算样本统计量
元5.1055
100
105550 ??
?
??
f
xfx
元91.51
)( 2
?
?
??
?
f
xx
s
第二步:计算抽样平均误差
191.5
100
91.51
)(
2
???
n
s
x?
第三步:在给定 的条件下计算
极限 误差 ??1
)(x?
4.101 9 1.52)(
2
9 5 4 5.01
2
)(
2/
??????
??
??
xZ
Z
x
?
?
?
?
?
第四步:计算总体参数的估计区间
9.1 0 6 54.105.1 0 5 5
1.1 0 4 54.105.1 0 5 5
)(
)(
??????
??????
x
x
x
x
上限
下限
这一城市居民平均购买手
机的价格的置信区间为
元元 9.10651.1045 ?? x
在营销调研中常出现的问题及解决办法
?要注意与 MR的使用者进行沟通以
便能够既能尽可能地保证抽样估计精度,
也能尽可能地减小抽样费用。
大规模的市场调研时,在精度要
求高,特别是多目标抽样估计时,
应最好请抽样专家、市场调查专家
和社会学者共同参与 调研方案设计
在抽样设计中应注意的实际问题
如何估计总体的差异性
如何确定期望精度的值
如何计算期望置信度
对小总体的抽样
运用非概率抽样确定样本容量
如何估计总体的差异性
在对平均数研究所在总体的差异性的测
定时,调研人员应考虑所有与差异性有
关的信息,甚至还可能需要进行导向性
研究,在在确定最终样本容量之前,对
总体的性质有更好的理解。如果确实不
知道有关总体差异性的信息,而且又不
可能进行导向性研究,则调研人员可以
运用区间测定法,如:该区间近似于平
均数正负 3的标准差。
在对成数进行总体差异性研究或估计时,
可以考虑运用 P=0.5
如何确定期望精度的值
小样本的精确度比大样本低,尤其
是对于差异性大的总体而言
运用平均数方法时,精确度因素较
为复杂
精确度较低时,如正负 15%,则样本
容量也将较小
精确度要求应与客户要求尽可能
一致
如何计算期望置信度
在置信区间和置信度的选择上,应
与客户进行很好地沟通
一般置信区间选择在 99%或 95%,
由此可以换算出置信度为 2.58和
1.96
对小总体的抽样
小总体情况是指其样本超过总体
总容量的 5%.
如果是小总体,则样本容量的公式
就需要用 有限乘数 来进行调整,有
限乘数是指近似于不包括样本的
总体比率的平方根的一个调整因
素。
有限乘数 调整因子 = ? ?? ?
1?
?
N
nN
运用非概率抽样确定样本容量
运用非概率抽样确定样本容量的
惟一合理方法是,衡量从样本中
所获信息的利益或价值与收集这
些信息的成本
本章提要
营销调研中运用科学方法进行抽样设计是十分必要的
抽样设计一般是按七个步骤完成的,其中设计抽
样方式和确定样本容量大小是核心内容
确定样本容易有五种方法,其中最科学且常用
的是按抽样理论进行计算获得的样本容量
确定抽样估计方法同样是抽样设计的重要内容
抽样方式按概率抽样和非概率抽样可分为八大类,
每种方式确定后还要选择具体抽样方法
返回
思考与练习题
教材中第 315 页
的 1,5,8 题和第
343页的 1,7,9题
课后阅读内容
,抽样调查, 凯什主编,中国统
计出版社出版
THE END
?抽样设计在营销调研中的必要性
?抽样调查方案设计的主要内容
?如何确定抽样方式和抽样方法
?如何确定样本容量
?如何确定抽样估计方法
本章学完后学生应知道:
抽样基本概念及选取样本的理由
不采取抽样调研的偏误
何时应采取抽样调查来研究
市场营销问题
一,抽样设计在营销调研中的必要性
抽样调查的涵义
抽样调查 是一种非全面调查。它有
广义的抽样调查与狭义抽样调查之分
广义的抽样调查 是 指根据统计研究目的,按
照一定的原则( 包括随机原则与非随机原则 )
从总体中抽取一定数目的样本,对样本进行调
查后,获得样本指标,然后依据样本指标对总
体相应指标作出估计或推断( 包括有概率保证
的估计与无概率保证的估计 )。
狭义抽样调查 是指根据统计
研究目的,按照随机原则 从总
体中抽取一定数目的样本,对
样本进行调查后,获得样本指
标,然后样本指标对总体相应
指标作出估计或推断。
狭义抽样调查
抽样推断的真实意义
?总体与样本
?总体指标 (参数) 与样本指标
(统计量)
?样本容量和样本个数
抽样调查中几个最基本的范畴
总体 是指根据调研计划的目的所规
定的研究整体 。 The population
is the entire group under study as
defined by research objectives
样本 是能代表整体的总体的子集 。
The sample is a subset of the
population,and the sample unit pertains
to the basic level of investigation.
总体与样本
抽样框与样本结构误差
抽样框 是能够用于抽样的全
部总体的名单
A sample frame is master
list of the entire population.
– A listing of the population
may be inaccurate and thus
contain sample frame error.
样本个数与样本规模
样本个数( Number of Samples)
是按一定的抽样方法在抽样总体中
可抽取的样本个数。意即按一种抽
样方式对特定总体最多能抽多少个
样本。
样本容量 (Sample Size) 是一次抽
样中所抽取的样本包含的样本单元
数。
总体参数与样本统计量
总体参数 ( parameters of
population)是指反映特定现象数量
特征的指标。用 表示。
样本统计量 ( Statistics of Samples)
是对样本的观察与计量后所得到
的反映样本数量特征的一系列指
标。用 表示
?
??
总体参数与样本统计量的关系
总体参数 样本统计量
指标名称 符号 指标名称 符号
总体单位数 N 样本容量 n
总体平均值 样本平均值
总体比例 P 样本比例 p
总体方差 样本方差
总体标准差 样本标准差
总体抽样个数 M 抽样误差
X
2? 2
s
??
? s
x
? ??
101
×ü
ì?
?ù ±?
μ¥ ??
í3 ??
á?
??
±ê
·′ ó3 ?ù ±? ×ü ì?
μ? êy á? ì× ?÷
·? ?a
×? o?
·′
ó3
??
±ê
×ü
ì?
ì×
êy
á?
ì×
?÷
à′ ?′
?ˉ o?
?? ?? ?ù ±? ?? ?? ?? ?? μ? 1× ?μ?? ?? ?ù ±? ?? ?? ?? ?? μ? 1× ?μ
抽样基本概念之间的关系
市场调查误差的来源
调查误差的来源
登记性误差 代表性误差
系统性误差
(偏差)
随 机 性 误 差
(抽样误差)
*
*
偏差与抽样误差的异同
*******
*******
*******
**
***
***
*
*
*
* ******
*
*
***
***
***
***
********
*****
*******
1, 如何科学地抽选样本,
才能 满足抽样推断 的要求;
2.如何 科学地进行估计 才
能实现对总体数量特征的正
确认识
必须提出与论证以下两方面的问题,
抽样方法体系 是指多种具有不
同特点与功能的抽样方法组合起来
,相互补充, 从而构成了抽样方法
体系, 其基本功能是为满足不同统
计研究目的的需要, 因地制宜, 因
时制宜地提供实用的抽样方法 。
抽样方法体系
抽样方法图示
未知
总体
样本 i
样本 i样本 i
样本 i
样本 i
样本 i
样本 i
样本 i
样本 i
样本 i 样本 i
样本 i
样本
个数
M
样本
容量
抽样调查方法的种类
1、按抽样所遵循
的原则划分为
非随机抽样
随机抽样
2, 按总体
中每个单位
被抽取的概
率是否相等
划分为
等概率抽样
不等概率抽样
3, 按被抽取的样本是否放回划分为
重置抽样
不重置抽样
4.按抽样的
组织形式不同,
随机抽样可划
分为
简单纯随机抽样
分层随机抽样
等距抽样(也称机械抽样或
系统抽样)
整群抽样
5, 按抽样是否一次完成划分为
一阶段抽样
二阶段抽样
多阶段抽样
6, 按抽取样本
前是否确定样本
容量划分为
序贯抽样
固定样本容量抽样
7, 按抽样研究目的的多少划分
单一目的抽样
多目的抽样
8.按抽取样本个数多少划分
单样本抽样
交叉样本 抽样
9, 按抽取的样
本是否固定进行
调查划分为
不固定样本的一次性调查
固定样本的持续性调查
定义有
关总体
获得
总体
名单
设计样
本方案
接近
总体
抽取
样本
样本
证实
若有需要,重新抽样
二,抽样调查方案设计的主要内容
案例研究,浙江财经学院学生就业意愿调查
确立
项目
调查
前的
准备
调查分
析过程
调查
结果
陈述
确立项目
明确该项调查的必要性
建立项目小组
进行调查费用、时间及
人力、物力的评估
调查前的准备
设计调研方案(含问卷设计)
试调查及访员培训
印刷问卷及与被访者预约
定义有关总体
目标总体 —— 根据市场调查目的
所确定的调研范围
总体的有限与无限
抽样总体应与目标总体在理论上
保持一致
获得总体名单
获取完整的抽样框是困难的。
抽样框的缺陷表现为:
样本单元的遗漏与重复
从学生处获取学生花名册
设计样本方案
设计抽样方式
确定样本容量
例如:在浙江财经学院运用配额抽样
抽取 500名学生进行就业意愿的调查
接近总体
如何能够接触到所有的抽样单元
是值得很好研究的。
无回答率是抽样估计方式与样本
容量设计中应重视的重要因素
抽取样本
抽取样本的两阶段过程:第一
阶段,必须选择样本单位;第
二阶段,必须从样本单位中获
得信息
实际抽样中应考虑 样本替换 及
超量抽样 以及 重新抽样 等问题。
样本证实
样本证实是提供抽样依据的过程。
向调查委托人保证抽样的科学性
和有效性是必要的
确定抽样方式应考虑的因素或条件
案例讨论,如何确定浙江财
经学院学生就业意愿调查的样本
项目对估计精度的要求
项目预算费用的丰欠
调查人员的素质高低
三、如何确定抽样方式和抽样方法
概率与非概率抽样方式的选择
概率抽样方式 ( Probability Sampling Methods)
简单随机抽样 ( SIMPLE RANDOM SAMPLING)
系统抽样 ( SYSTEMATIC SAMPLING)
整群抽样 ( CLUSTER SAMPLING)
分层抽样 ( STRATIFIED SAMPLING)
非概率抽样方式 ( Nonprobability Sampling Methods)
便利抽样 ( CONVENIENCE SAMPLING)
判断抽样 ( JUDGMENT SAMPLING)
推荐抽样 ( REFERRAL SAMPLING)
定额抽样 ( QUOTA SAMPING)
简单随机抽样 Simple Random Sampling
操作方法 —— 是在抽样总体中
按随机原则利用抓阄或随机数表
等方法来直接抽取样本的方法。
优点 —— 简便易行 。
缺点 —— 当总体差异性大时,这
种方法会带来较大的误差。
评述 —— 对总体小且分布均匀的
情况下,适合于 SRS。
系统抽样 Systematic Sampling
操作方法 —— 访是将总体各单位按一
定顺序排列并编号,先随机形成起点,
尔后按相同间隔抽取样本,直至抽够全
部样本本单位。
优点 —— 比 SRS更容易抽取样本和节省 。
缺点 —— 当总体层次差异显著时,易产
生偏差( Vias) 。
评述 —— 当总体层次差异小,分布均匀
且抽样框完整时,可以采用。
整群抽样 Cluster Sampling
操作方法 —— 先将总体分成若干次
总体(或称群),然后,随机地从
中抽取若干群,并对被抽中的群进
行全面调查。
优点 —— 成本较低、节约时间,容
易操作。
缺点 —— 对分布不均匀的总体按此
方法会产生较大偏差 。
评述 —— 当总体容易进行分群且调
查对象相对集中时,可以采用此法 。
分层抽样 Stratified Sampling
操作方法 —— 是对分布不均匀且层次
分明的总体按, 层内方差尽量小,层间
方差尽量大, 的原则进行分层,然后在
每层中随机抽取足量样本进行调查。
优点 —— 抽样误差较小,估计效果较好 。
缺点 —— 操作复杂,成本也较高 。
评述 —— 在总体分布层次分明且有足够
的时间和经费保证的条件下,应尽可能
用此方法进行市场调查 。
分层抽样图示
总体
N
1N
2N
LN
1n
2n
L n
样本
n
便利抽样 Convenience Sampling
操作方法 —— 访问者通过 拦截调查
等方法确定样本单位并获取定性或定
量的市场信息。
优点 —— 成本低,容易进行。
缺点 —— 由于所抽取的样本其结构难
以成为总体结构的映射,因此很容易
产生偏差且不能计算抽样误差 。
评述 —— 在对抽样估计精度要求不高
且时间紧,费用不足的情况下可以进
行这类市场调查 。
判断抽样 Judgment Sampling
操作方法 —— 访问者运用 焦点访谈
等方法事先在总体中筛选被调查者、
然后进行调查。
优点 —— 容易进行 。
缺点 —— 被选对象难以成为总体的代
表,因此往往会出现偏差,也同样未
能提供抽样误差 。
评述 —— 进行在新产品试销过程中可
以采用此法 。
推荐抽样 Referral Sampling
操作方法 —— 访问者在所调查的少量样
本之后,要求被调查者再提供更多的可
进行更大范围的调查者名单。如此,使
调查总体不断扩大。
优点 —— 当没有掌握抽样框的信息,而
回答者又能提供更多的被调查者时,利
用本方法很有效。
缺点 —— 容易产生偏差及不能提供抽样
误查 。
评述 —— 对总体较小且在某些特征方面
具有层次分明特点时可以进行这类调查 。
定额抽样 Quota Sampling
操作方法 —— 先确定需调查的总量。
然后将样本量按一定原则进行分配,由
每位访员自已确定被调查者进行访问。
优点 —— 成本容易控制。访问者容易进
行调查。
缺点 —— 调查质量深受访问者工作态度
与能力的影响,也不能提供抽样误差 。
评述 —— 在当今的市场营销调研中这种
方法普遍运用 。
如何选定抽样方法
注意,在选定抽样方式后,运用每种
抽样方式都有一些具体的做法可供再选
取,其中,相当多的是经验与技术相结
合的。
简单随机抽样
蒙眼(抓阄)法
随机数表法
系统抽样的取样方法
中心开花法
顺序法
左(右)手法则法
教
条
式
方
法
约
定
式
方
法
成
本
基
础
法
统
计
分
析
法
置
信
区
间
法
四、如何确定样本容量
决定样本容量大小的因素
样本容量、
估计精度与
估计成本之
间的关系
差异性、置信
区间、抽样分
布和标准误差
之间的关系
?
?
教条式方法
教条式方法 —— 是按照“老
经验”来确定样本。如,“凭
经验,为保证精确,样本至少
应该是总体的 5%”
教条式方法 —— 访问者按过去的经
验或别人通行的做法来确定样本容量。
优点 —— 容易操作。
缺点 —— 要么太浪费,要么样本不
足量 。
评述 —— 进行对费用、估计精度要
求不高、调查时间紧的项目可进行此
类调查 。
教条式方法
约定式方法
约定式方法 —— 是按某一约定( MR
的提供方和使用方都接受的)来确
定样本容量。
优点 —— 简便易行。比教条法有些
合乎逻辑。
缺点 —— 成本高且难保证估计精度 。
评述 —— 教条法与约定法都有显著
的缺陷,注意选择应用。
成本基础法
成本基础法 —— 按预算控制
所要求的调查成本来反推算可接受
的样本容量。
优点 —— 成本控制容易得到实现。
缺点 —— 抽样估计精度难以保证 。
评述 —— 当估计精度要求不高时
可采用此法 。
以成本为基础考虑样本容量
设总成本为 C,则总成本包括:固定
成本 C1(包括设计费用、宣传费用等)
和可变成本 C2=n CD(包括调查人员的
差旅费用、礼品费用等) 有:
C= C1+ C2= C1+n CD
例如:某委托公司愿出 20000元 RMB 进行一
次市场调研,除去其预留费用外,可直接用
于调查的费用是 12000元,据估计,各种固定
费用合计为 4000元,每调查一个样本的费用
是 80元,试问最多可抽多少样本?
计算结果
据上述信息计算如下:
? ? ? ? 1 0 0
80
4 0 0 01 2 0 0 01 ?????
DC
CCn
确定样本容量的一个较好的方法是考
虑成本与调研对于经理的价值之间的
关系。如果经理需要非常精确的信息,
则调研人员应当建议采用大样本,然
后,再估计取得这一样本所需的成本。
精度
100%
95%
50%
50%
20% 100%
可以用下的图形来表示抽样精度和调查
费用之间的关系:
费用
统计分析法
操作方法 —— 是多目标抽样估计
时或针对不同样本子集进行调研时,
通过统计分析计算,获得满足这些
子集研究所需要的最小样本量。
优点 —— 可以满足多目标的样本容
量要求。
缺点 —— 计算复杂 。
评述 —— 进行大规模市场调研时,
可考虑采用此法 。
置信区间法
操作方法 —— 按照抽样理论来科学计
算能够确保抽样估计精度的样本容量。
优点 —— 精度高、成本合理。
缺点 —— 费时、费力,对营销调研人
员要求具有较高的抽样理论知识 。
评述 —— 进行大多数具有较高估计精
度要求及调查费用预算明确的市场调
查都应采用此法 。
影响样本容量的因素
影响样本容量的因素
总
体
方
差
允
许
误
差
置
信
度
抽
样
方
法
组
织
形
式
样本分布 —— 是按一种抽样方
法对同一总体抽取若干独立的样本,
后,而由每个样本统计量所形成的
状况就是样本分布 。
依抽样分布定理,大样本的平均
数的期望与总体均值一致 。
大样本的分布特征可以用正态分
布或近似正态分布来描述
样本分布
样本的差异性是客观存在的
样本的差异性受总体差异性的制约。
大样本的差异性分布特征服从或接
近钟形分布特征
差异性小的样本统计量落入由一定
估计精度确定的范围的可能性大,反
之则可能性小。
差异性置信区间
抽样平均误差
抽样平均误差 —— 是反映样本统计量与
总体参数之间的平均误差程度或所有可能样本的
实际误差的一般水平。
计算公式:
可能样本个数
总体参数)(样本统计量抽样平均误差 2-??
M
2)?(
)?( ???? ?? ?
影响抽样平均误差大小的因素
影响的因素
总
体
方
差
样
本
容
量
抽
样
方
法
组
织
形
式
抽样平均误差、抽样极限误差与
概率度之间的关系
抽样极限误差 =
概率度 × 抽样平均误差
)()( xx t ????
)()( pp t ????
在平均数情况下:
在成数情况下:
)?()?( ?? ??? t?
样本容量的确定(平均数)
不重复抽样
重复抽样
2
)(
2
)(
2
2
x
x
Z
n
?
?
??
2
)(
2
2
2
)(
2
)(
2
2
xx
x
ZN
NZ
n
?
?
?
?
??
?
例题:用平均数确定样本容量
3841003 8 4 0 0100 1 0 0 0 084.310 10096.1 2
22
??????n
若以总体方差估计值为 100,置信区间为 95%,允
许误差为正负 10%,则最佳样本容量为:
样本容量的确定(成数)
不重复抽样
重复抽样
2
)(
2
)(
2
2
p
pZ
n
?
?
??
2
)(
2
2
2
)(
2
)(
2
2
pp
p
ZN
NZ
n
?
?
?
?
??
?
例题:用样本成数(百分率)确定样本容量
1067996009 250084.33 505096.1 2
2
???????n
18509166509 250066.63 5050.582 2
2
??????? 。n
若以相对误差率为正负 3%,则最佳样本容量为:
若改变相对误差率为正负 3%,则最佳样本容量为:
设允许误差为正负 3%,总体方差取最大值
( P=0.5),置信区间为 95% 或 99%
抽样估计步骤
抽样估计基本方法
抽样估计的优劣的标准
区间估计
五、如何确定抽样估计方法
估计的步骤
计算样本统计量
计算抽样平均误差
在给定的 即 F(t)下,
计算抽样极限误差
在给定的抽样极限误差下,
计算 即 F(t)的值
计算总体参数的估计区间
第一步
第二步
第三步
第四步
??1
??1
抽样估计的基本方法
参数估计
点估计 区间估计
估计量优劣的标准
优劣标准
无
偏
性
有
效
性
一
致
性
区间估计
根据样本估计量以一定可靠程度推断总体参
数所在的区间范围
设总体参数为 为由样本确定
的两个统计量,对给定的,有 )( 10 ?? ??
则称 为参数 的置信度为
的 置信区间
)( ULθ ?,? ??1
???? ???? 1)( ULP
U???,,L
L?
—— 置信下限
—— 置信下限
U?
??1
?
—— 显著性水平
置信度或可靠程度、可信度、
把握程度、概率保证程度 [也可用 F
( t)表示 ]
置信区间与置信度的含义
—— 置信度
总体均值的区间估计(一)
????????? 1)( )()( xx xXxP
大样本情况下
n
sZZ
xx ????? 2)(2)( ?? ?
查正态分布表— 2?Z
总体均值的区间估计(二)
??????? 1)( )()( xx xXxP ??
小样本情况下
n
stt
xx ???? 22 ?? ? )()(?
分布表查— tt 2?
计算样本统计量
计算抽样平均误差
在给定的 即 F(t)下,
计算抽样极限误差
在给定的抽样极限误差下,
计算 即 F(t)的值
计算总体参数的估计区间
第一步
第二步
第三步
第四步
??1
??1
抽样估计步骤
例:对某款手机购买能力调查,抽样资料如下,
使用 95.45%的概率,估计某市居民对该款手机
的购买平均价格。
购买
价格
875 925 975 1025 1075 1125 1175 1225 合
计
人数 1 2 6 35 43 9 3 1 100
第一步:计算样本统计量
元5.1055
100
105550 ??
?
??
f
xfx
元91.51
)( 2
?
?
??
?
f
xx
s
第二步:计算抽样平均误差
191.5
100
91.51
)(
2
???
n
s
x?
第三步:在给定 的条件下计算
极限 误差 ??1
)(x?
4.101 9 1.52)(
2
9 5 4 5.01
2
)(
2/
??????
??
??
xZ
Z
x
?
?
?
?
?
第四步:计算总体参数的估计区间
9.1 0 6 54.105.1 0 5 5
1.1 0 4 54.105.1 0 5 5
)(
)(
??????
??????
x
x
x
x
上限
下限
这一城市居民平均购买手
机的价格的置信区间为
元元 9.10651.1045 ?? x
在营销调研中常出现的问题及解决办法
?要注意与 MR的使用者进行沟通以
便能够既能尽可能地保证抽样估计精度,
也能尽可能地减小抽样费用。
大规模的市场调研时,在精度要
求高,特别是多目标抽样估计时,
应最好请抽样专家、市场调查专家
和社会学者共同参与 调研方案设计
在抽样设计中应注意的实际问题
如何估计总体的差异性
如何确定期望精度的值
如何计算期望置信度
对小总体的抽样
运用非概率抽样确定样本容量
如何估计总体的差异性
在对平均数研究所在总体的差异性的测
定时,调研人员应考虑所有与差异性有
关的信息,甚至还可能需要进行导向性
研究,在在确定最终样本容量之前,对
总体的性质有更好的理解。如果确实不
知道有关总体差异性的信息,而且又不
可能进行导向性研究,则调研人员可以
运用区间测定法,如:该区间近似于平
均数正负 3的标准差。
在对成数进行总体差异性研究或估计时,
可以考虑运用 P=0.5
如何确定期望精度的值
小样本的精确度比大样本低,尤其
是对于差异性大的总体而言
运用平均数方法时,精确度因素较
为复杂
精确度较低时,如正负 15%,则样本
容量也将较小
精确度要求应与客户要求尽可能
一致
如何计算期望置信度
在置信区间和置信度的选择上,应
与客户进行很好地沟通
一般置信区间选择在 99%或 95%,
由此可以换算出置信度为 2.58和
1.96
对小总体的抽样
小总体情况是指其样本超过总体
总容量的 5%.
如果是小总体,则样本容量的公式
就需要用 有限乘数 来进行调整,有
限乘数是指近似于不包括样本的
总体比率的平方根的一个调整因
素。
有限乘数 调整因子 = ? ?? ?
1?
?
N
nN
运用非概率抽样确定样本容量
运用非概率抽样确定样本容量的
惟一合理方法是,衡量从样本中
所获信息的利益或价值与收集这
些信息的成本
本章提要
营销调研中运用科学方法进行抽样设计是十分必要的
抽样设计一般是按七个步骤完成的,其中设计抽
样方式和确定样本容量大小是核心内容
确定样本容易有五种方法,其中最科学且常用
的是按抽样理论进行计算获得的样本容量
确定抽样估计方法同样是抽样设计的重要内容
抽样方式按概率抽样和非概率抽样可分为八大类,
每种方式确定后还要选择具体抽样方法
返回
思考与练习题
教材中第 315 页
的 1,5,8 题和第
343页的 1,7,9题
课后阅读内容
,抽样调查, 凯什主编,中国统
计出版社出版
THE END