第三章 市场抽样调查
第一节 市场抽样调查的特点
市场是由千差万别的个体所组成的复杂总体,对市场总体情况进行调查,若能够做全面的、普遍的调查,其所得的资料当然是最能反映市场总体特征的。但是在许多情况下对市场实施普查是非常困难的,甚至是根本不可能的。
例如,总体非常大,总体单位数非常多的情况下,不可能进行全面调查。市场调查中这种现象不少,如居民家庭收支是市场购买力及其构成的直接表现,但居民户很多,普查的工作量太大,费用也过高,无法进行普查;再如,对商品进行质量检测,在检验或测量过程中会对商品产生破坏性,根本不能用普查方法,只能用抽样调查。随着市场调查工作的深入开展,市场抽样调查已经成为一种最重要的组织调查方式,得到极其广泛的应用。
一、市场抽样调查的涵义
市场抽样调查有广义和狭义之分。广义的抽样调查包括随机抽样和非随机抽样;狭义的抽样调查只包括随机抽样。下面市场抽样调查的涵义是狭义的。
市场抽样调查的涵义:
抽样调查是从研究对象的总体中,按照随机原则抽取一部分单位作为样本进行调查,并用对样本调查的结果来推断总体。
抽样调查的目的决不是仅仅了解样本情况,而是通过对样本的了解来推断总体,抽样调查虽然是一种非全面调查,但其目的则是得到总体的有关资料。
2、随机原则:是指调查总体的每个单位都有同等被抽中或不被抽中的概率,即样本的抽取
完全是客观的,而不能主观地、有意识地选择样本。
二、抽样调查的特点
抽样调查是市场调查中应用最多的方法,它具有以下明显的特点:
1.客观性
这个特点主要表现在随机抽样当中,随机抽样按照随机原则抽取样本,从根本上排除了主观因素的干扰,保证了样本推断总体的客观性,是抽样调查科学性的根本所在,是市场调查结果的真实性和可靠性的基础。
2.准确性
抽样调查可以比较准确地推断总体。抽样调查的最终目的,是用对样本调查所计算的指标推断总体的相应指标。抽样推断的抽样误差不但可以准确计算,还可以根据研究市场问题目的的需要,对误差的大小加以控制。由于在抽样推断过程中以数学中的概率论为基础,所以保证了统计推断的准确性和可靠性。
3.经济性
抽样调查是一种比较节省的调查方法。抽样调查仅对总体中少数样本单位进行调查,因此对人、财、物力都比较节省,从而降低了市场调查的费用。抽样调查还很省时。由于抽样调查的单位少,所需搜集、整理和分析的数据也相应减少许多,因而能够在较短时间内完成市场调查工作,大大节省了调查时间。
4.广泛性
抽样调查的应用范围广泛。在市场调查中,调查的内容很多。抽样调查所适用的范围是广泛的,它可用于不同所有制商品营销单位的调查。它可用于不同地区市场调查;既可以在城市开展,也可以在农村开展。它可用于不同商品的市场调查,既可对全部商品进行调查,也可对某一类或某一种商品进行调查。在这些调查中,抽样调查突出地表现出对市场现象数量问题研究的适用性。
抽样调查的不足,由于抽样调查所调查的对象是调查对象中的一部分,抽样调查的结果是从抽取的样本中获取的信息资料推断出来的,所以。抽样调查存在着抽样误差。
三、市场抽样调查的程序
市场抽样调查,特别是随机抽样,有比较严格的程序,只有按一定程序进行调查,才能保证调查顺利完成,取得应有效果。
抽样调查一般分为以下几个步骤:
1.确定调查总体
确定调查总体是根据市场抽样调查的目的要求,明确调查对象的内涵、外延及具体的总体单位数量,并对总体进行必要的分析。抽样调查虽然仅对一部分单位进行调查,但它最终目的并不是描述所调查的这一部分单位的特征,而是从部分单位所显示的特征推断其所属总体的特征,其目的是研究总体的特征与规律性。
如:对某地区居民购买力进行抽样调查,那么首先要明确居民购买力是居民具有货币支付能力的需求量;还要明确是城市居民,还是城乡居民;进而明确总体的数量是多少,若以户为单位进行调查,就要掌握该地居民总户数。在此基础上,还要对总体情况进行必要的分析,如该地区居民购买力是否存在明显的水平差别,形成不同的层次,如果存在,可以考虑用分类随机抽样抽取样本,这样用样本特征推断总体时才更准确。
2,设计和抽取样本
设计样本包括两项具体工作:
一是确定样本数目的大小或样本容量的多少,即样本所要包含的部分总体单位的个数。
二是选择具体的抽样方式,抽样方式有许多种,必须根据调查目的和调查总体的具体情况选择适当方式。
对样本进行周密设计后,就可以实际进行抽样,组成所要实际调查的样本。
3.收集样本资料,计算样本指标
收集样本资料是非常具体的工作,它可以根据样本各单位的实际情况,选择其一种或一种以上搜集资料的方法,对样本各单位进行实际调查。收集到样本资料后,还要对资料做整理和分析,最后计算出样本的指标。
4.用样本指标推断调查总体指标
统计推断是抽样调查的最后一步工作,是对总体认识的过程,也是抽样调查的目的。在用样本指标推断总体指标时,要计算抽样误差,同时依据概率论的有关理论,对推断的可靠程度加以控制。
第二节 随机抽样方式
随机抽样的具体方法,又可分为单纯随机抽样、等距随机抽样、类型随机抽样、整群随机抽样等,下面分别予以说明。
单纯随机抽样
(一)定义
单纯随机抽样又称纯随机抽样。它是最基本的随机抽样方法,也是理论上最符合随机原则的抽样方法。这种抽样方法在抽样之前,对总体单位不进行任何分组、排列等处理,完全按随机原则从总体中抽取样本。
(二)分类:直接抽取法、抽签法和随机数表法。
1.直接抽取法
定义:是从调查总体中直接随机抽取样本进行调查。
适用
这种方法适合对集中于某个较小空间的总体进行抽样,如对存放于仓库的同类
产品直接随机抽出若干产品为样本进行质量检查。
2.抽签法
定义:是将总体各单位编上序号并将号码写在外形相同纸片上掺和均匀后,再从中随机抽取,被抽中的号码所代表的单位,就是随机样本,直到抽够预先规定的样本数目为止。
如:在某城市某街道所管辖的10 000户居民中,抽200户居民面向居民对某种商品的需求量进行调查,就可以做10 000张纸片,写上 l一10 000号,从中随机抽取200张,即得到被抽中的居民为样本。一般在随机抽样中,用N代表总体单位数,用n代表样本单位数。显然这个问题中 N=10 000个,n=200个。
3.随机数表法
是先把总体各单位编号,根据编号的最大数即总体单位数位数确定使用随机数表中若干列或若干行数字,然后从任意行或任意列的第一个数字起,可以向任何方向数去,遇到属于总体单位编号范围内的号码就定为样本单位,直到抽够预定的样本单位数为止。
随机数表是由0~9组成的表,这10个数字排列完全是随机的。较大的随数表有美国兰德公司1955年编制出版的100万数字表和肯德尔与史密斯在1938年编年制出版的10万数字表。表3-1是美国兰德公司1955年编制出版的随机数表中的由1 000个数字组成的片断。
下面举例说明随机数表的使用过程。本书后还有附表1供参照使用。
假定在某城市某街道所管辖的10 000户居民中,抽取200户居民对某种商品的需求量进行调查。首先将总体单位按l~10 000编号,最大编号为10 000,是五位数,必须从表3-1中选五列数。然后从表中任意抽五列,假定随机抽到6—10列,从任意行向任意方向数去,假定从第一行向下数去,选出200个l—10 000之间的不同数(当遇到大于10 000的数时均跳过),它们分别是8391,597,406;再从第7—11列中选出4462,5978,4069;从第9~13列中选出7268,6201,6963;从第10~14行中选出175,7196;从第11一15列中选出1390,1758;从第12一16列中选出1174;从第13~17列中选出5188;从第14---18列中选出8898;从第15--20 ,j中选出7995,9228,2840;依此类推,直到抽够200个号为止,被抽中的200个号所代表的居民户就组成了一个n=200户的样本。
(三)单纯随机抽样的不足
在总体很大的情况下使用,编号工作量繁重;
当总体单位差异程度较大时,必须使样本容量充分大才能保证样本推断总体的可靠程度和准确程度;
所抽取的样本在总体中的分布或过于集中,或过于分散,很不均匀,给实际调查带来困难。在实践中应用有不便之处。
二、等距随机抽样
1、定义:
等距随机抽样又称机械随机抽样或系统随机抽样。它是先将总体各单位按某一标志顺序排列,编上序号;然后用总体单位数除以样本单位数求得抽样间隔,并在第一个抽样间隔内随机抽取一个单位作为组成样本的单位;最后按计算的抽样距离作等距抽样,直到抽满n个单位。
例如,前例中从10000户居民中抽取200户居民进行抽样调查,采用等距随机抽样方法,具体做法是:
首先把10000户居民按一定标志排列,其标志可以采用与调查内容有关的标志(与需
求量有关的标志有收入水平、家庭人口数等),也可以采用与调查内容无关的标志(如居住地址等),并编上1-10000序号;
然后求出抽样间隔,用k表示抽样间隔,则k ===50,即间隔50户抽取一户,同时在第一个k间隔即1~50中随机抽一个单位,假设抽中第38号单位;最后从38开始,每隔50户抽取1户,即38,88,138,188、······· 9988,共抽取到200户组成样本。2、注意
等距随机抽样,能使样本在总体中的分布比较均匀,从而抽样误差减小。但在应用此方法时要特别注意,抽样间隔与现象本身规律之间的关系。
如:对城乡集市贸易商品成交量或成交价格有时间间隔地进行调查,抽样的时间间隔不能用7或30这种与周、月周期一致的数。这种方法最适用于同质性较高的总体,而对于类别比较明显的总体,则采用类型随机抽样法。
三、类型随机抽样
定义
类型随机抽样,又称分层随机抽样。它是先将总体按一定标志分成各种类型(或称层);然后,根据各类单位数占总体单位数比重,确定从各类型中抽取样本单位的数量;最后,按单纯随机抽样或等距随机抽样从各类型中抽取样本的各单位,最终组成调查总体的样本。
2、分类
类型随机抽样可分为按比例分类抽样和最优分类抽样。在随机抽样的实际工作中,通常采用按比例分类抽样,因为它比最优分类抽样简单,不必考虑各类的标准差。
如前例,在某城市某街道所管辖的10000户居民,抽取200户对居民需求某种商品的数量进行调查,由于该商品的需求量与家庭人口的多少有关,所以决定采用家庭人口数标志对总体分类,并用分类随机抽样方法确定样本。对总体分类和样本的组成单位在各类中分布见表3-2。
按家庭人
口数分类
(人)
各类居民户数(户)
Ni
各类居民户比重(%)
各类样本单位数(户)
1
2
3
4
4以上
800
1 500
6 000
1 000
700
8
15
60
10
7
16
30
120
20
14
合 计
10 000
100
200
四、整群随机抽样
1、定义
整群随机抽样是将总体按一定标准划分成群或集体,以群或集体为单位按随机的原则从总体中抽取若干群或集体,作为总体的样本,并对被抽中各群中的每一个单位都进行实际调查。
通常,生产企业或销售企业对商品质量进行抽样调查时,采用整群随机抽样的方法。
如:生产企业把产品生产按生产时间分成群,从中抽取一定时间的产品进行质量检验。对生产周期较短的产品,从每周48小时的产品中,抽取2小时的产品进行检验,从每月30天的产品中抽3天的产品进行检验;对生产周期较长的产品,可以从每年12个月的产品中抽取一个月的产品进行检验。此外,还可按产品的包装单位分群,如抽取若干箱饮料,对所包括的每瓶饮料进行检验;抽取若干打袜子,对所包括的每双袜子进行检验。
2、整群随机抽样与类型随机抽样的关系
相似之处在于,它们都是首先根据某种标准把总体划分为若干部分(若干群)。
二者的区别是,
(1)类型随机抽样必须在总体的每一部分中,按照其比例抽取一定数量的样本单位;而整群随机抽样则是将总体中被抽取部分的全部单位作为样本单位。
(2)二者在对总体进行划分时,所依据的原则也是不同的。类型随机抽样要求被划分开的总体各部分之间具有明显差异,而各部分内部的差异要尽可能小;整群随机抽样则要求被划分开的总体各部分(各群)之间尽可能无差异,总体部分(群)内部各单位允许存在明显差异。
3、优点
整群随机抽样能使得样本单位比较集中,调查工作比较便利,它适合于总体比较大,而又无明显类型的调查对象。
如:在拥有几万以至于几十万户的城市中以户为单位进行调查,就需要将几万以至几十万户排列出的名单,这显然是非常难于做到的。若应用整群随机抽样,以城市中的居委会为群,抽取若干个居委会为样本,对作为样本的居委会所管辖的居民户全部进行调查,这显然比以户为单位抽取样本方便得多,同时由于各居委会所管辖的居民一般并无本质差异,而一个居委会内部的居民户在各方面会有明显差异,所以采用整群随机抽样方法抽取的样本对总体的代表性不会降低。
用整群随机抽样的方法。如生产企业把产品生产按生产时间分成
群,从中抽取一定时间的产品进行质量检验。对生产周期较短的
产品,从每周48小时的产品中,抽取2小时的产品进行检验,
从每月30天的产品中抽3天的产品进行检验;对生产周期较长
的产品,可以从每年12个月的产品中抽取一个月的产品进行检
验。此外,还可按产品的包装单位分群,如抽取若干箱饮料,对
所包括的每瓶饮料进行检验;抽取若干打袜子,对所包括的每双
袜子进行检验。
整群随机抽样与类型随机抽样的相似之处在于,它们都是首
先根据某种标准把总体划分为若干部分(若干群)。二者的区别
是,类型随机抽样必须在总体的每一部分中,按照其比例抽取一
定数量的样本单位;而整群随机抽样则是将总体中被抽取部分的
全部单位作为样本单位。此外,二者在对总体进行划分时,所依
据的原则也是不同的。类型随机抽样要求被划分开的总体各部分
之间具有明显差异,而各部分内部的差异要尽可能小;整群随机
抽样则要求被划分开的总体各部分(各群)之间尽可能无差异,
总体部分(群)内部各单位允许存在明显差异。
整群随机抽样能使得样本单位比较集中,调查工作比较便
利,它适合于总体比较大,而又无明显类型的调查对象。如在拥
有几万以至于几十万户的城市中以户为单位进行调查,就需要将
几万以至几十万户排列出的名单,这显然是非常难于做到的。若
应用整群随机抽样,以城市中的居委会为群,抽取若干个居委会
为样本,对作为样本的居委会所管辖的居民户全部进行调查,这
显然比以户为单位抽取样本方便得多,同时由于各居委会所管辖
的居民一般并无本质差异,而一个居委会内部的居民户在各方面
会有明显差异,所以采用整群随机抽样方法抽取的样本对总体的
代表性不会降低。
五、多阶段随机抽样
1、定义
多阶段随机抽样,是把从市场调查总体中抽取样本的过程,分成两个或两个以上的阶段进行随机抽样的方法。通常在总体层次比较多或层次内单位数目比较多时,就采用多阶段随机抽样,以求更加经济实用。
2、多阶段抽样的具体步骤是:
首先,将调查总体各单位按一定标志分成若干集体,作为抽样的第一级单位;然后将第一级单位再分成若干小集体,作为抽样的第二级单位;依此类推,可按研究问题的需要和现象本身的特点,分出第三级单位,第四级单位等。
其次,依照随机原则,先在第一级单位中抽出若干单位作为第一级单位样本;然后在第一级被抽中的单位中再抽出第二级单位样本;依此类推,还可抽出第三级单位样本,第四级单位样本。由此形成了两阶段随机抽样、三阶段随机抽样或四阶段随机抽样等。
适用
在市场调查工作中,多阶段抽样的方法对城乡市场都是适用的。对于城市市场,多阶段随机抽样可分为省、市、自治区、区、街道、居委会等阶段来进行。在各阶段具体抽取样本时,可采取纯随机抽样,也可采用等距随机抽样或类型随机抽样等方法。对于乡村市场,可分为县、乡、村委会等阶段来进行随机抽样。
第三节 推断市场总体
抽样调查的目的,是用样本指标推断总体指标。通常较多用的是用样本平均数推断总体平均数,用样本成数推断总体成数等。当谈到随机抽样时,仅仅了解随机抽样抽取样本的方法是不够的,还必须要知道抽取了样本,计算了样本指标后,如何用样本指标推断总体。对于这个问题,应该分两步考虑:首先是看样本指标和总体指标之间的差异能否用具体数量表示;其次是如何利用样本指标及其与总体指标之间的差异来推断总体指标。
一、抽样误差
定义:
抽样误差,是指随机抽样调查中样本指标与总体指标之间的差异。
抽样误差的大小,由于抽样方法的不同而有所差别。一般来说,重复抽样的误差大于不重复抽样的误差;也各不相同。从理论上对抽样误差进行介绍时,一般以单纯随机抽样法为基础,用重复抽样误差公式为例,计算抽样平均误差。
2、在重复抽样条件下,
(1)简单随机抽样抽样平均数的抽样平均误差计算公式是:
=
式中: 抽样平均数的抽样误差
总体的标准差
n 样本单位数
(2)抽样成数抽样平均误差计算公式是:
式中: μp 抽样成数抽样平均误差
p 总体成数
n 样本单位数
需要说明的是,在抽样误差计算公式中,要求用总体标准差和总体成数,但在此问题中只具有样本标准差和样本成数。抽样调查的理论证明,在大样本情况(n≥30)下,可以采用样本标准差代替总体标准差,用样本成数代替总体成数。 ‘
例如:假定在某城市某街道办事处所管辖的10 000户居民中,用单纯随机抽样方法抽取200户,对某种商品的月平均需求量和需求倾向进行调查。对200户居民采用问卷法搜集资料,对资料整理、分析计算的结果表明,每户居民对该商品的月平均需求量为500克,标准差为100克;表示一年内不选择其他替代商品,继续消费该商品的居民户为90%。现对抽样平均数和抽样成数的抽样误差进行计算。
抽样平均数的抽样误差为:
===7.1(克)
抽样成数的抽样误差为:
==0.02
上面所计算出的抽样误差,用数字说明由于随机原因样本指标与总体指标之间的差异。
总体的标准差越大,即总体各单位之间客观存在的差异越大抽样误差也就越大。抽样的单位越大抽样误差就越小。
因此在实践中,为了有效地控制样本指标与总体指标之间的误差,更准确地推断总体指标,往往可以通过加大样本单位数(样本容量)的办法,或对总体分层抽样的办法,减小或控制抽样误差。
利用样本指标和所计算出的抽样误差,可以对相应的市场总体指标进行区间估计。
二、推断总体 :
在市场抽样调查中推断总体,应用的是统计推断原理。
统计推断即用样本指标推断总体指标的过程。
统计推断一般是采用区间估计的方法。区间估计就是在一定的抽样误差范围内建立一个置信区间,并联系这个区间的置信度以样本指标推断总体指标o
1.抽样估计的置信度
(1)定义
所谓置信度就是进行推断时的可靠程度大小。
抽样推断可靠程度,是指总体所有可能样本的指标落在一定区间的概率度。
抽样推断可靠程度有高低之分,通常用%表示。
对于置信度与抽样误差之间的关系,数理统计的理论可用正态分布来描述它,即在抽样误差前乘以t,并使置信度成为t的分布函数F(t),将二者关系对应起来建立正态分布概率表,以便使用时查找。这样任何一个置信度都可以查到对应的t值。如前面所说的几个常用的置信度90%,95%,99%,所对应的t值分别是:1.65,l:96,2.58。任何一个t倍抽样误差范围也可以查到对应的置信度。t=1时置信度为68.27%,t=2时置信度为95.45%,t=3时置信度为99.73%。
在市场调查实践中,对于抽样误差范围或置信度,是在调查方案中事先规定的,并据此确定样本单位数。书后附表2即为正态分布概率表。
(2)抽样误差与置信度的关系
抽样误差与置信度是一对矛盾。如果加大t值,当然可以提高置信度;但随着置信度的提高必然加大抽样误差范围,就降低了抽样调查的准确程度。因此,在市场抽样调查的实践中,既不能只强调置信度而忽视了市场调查的准确度,也不能只重视准确度而不顾调查总体数据的置信度。对调查的准确度和置信度,应根据市场调查的具体需要和市场现象的不同特点,综合地考虑二者的关系o
2.市场随机抽样的区间估计
区间估计是统计推断的常用方法,它是在考虑到抽样误差的情况下以样本指标推断总体指标的过程,同时必须联系到前面所谈到的抽样误差与置信度的关系。
区间估计可以用样本平均数推断总体平均数,也可以用样本成数推断总体成数。
用样本平均数推断总体平均数的区间估计公式为:
式中: 总体平均数;
样本平均数;
抽样平均数误差范围。
以上区间估计公式说明,总体平均数表现为样本平均数加减抽样误差范围的区间值,而不是一个固定点值。
用样本成数推断总体成数的区间估计公式为:
式中:P 总体成数;
p 样本成数;
抽样成数误差范围。
以上区间估计公式说明,总体成数表现为样本成数加减抽样误差范围的区间值,而不是一个固定点值。
现仍以前面计算抽样误差的问题为例,以样本指标推断总体指标。为了进一步说明抽样推断的准确性与置信度之间的关系,分别以不同的置信度作区间估计o
(1) 置信度为85%的区间估计。
若以85%的置信度作区间估计,其相应t=1.44。对总体平均数和总体成数的区间估计结果为:
500—1.44×7.1≤≤500+1.44×7.1
489.8≤≤510.2 (克)
即某街道所辖10000户居民对该商品的月户平均需求量为 489.8—510.2克,这种估计的置信度为85%。
0.9—1.44×0.02≤P≤0.9十1.44×0.02
0.87≤P≤0.93
即某街道所辖10000户居民表示将继续消费该商品的居民户占87%~93%。
(2) 置信度为95%的区间估计。
若以95%的置信度作区间估计,其相应t=1.96。对总体平均数和总体成数的区间估计结果为:
500—1.96×7.1≤X≤500+1.96×7.1
486.1≤X≤513.9 (克)
即某街道所辖10000户居民对该商品的月户平均需求量应为486.1~513.9克,其置信度为95%。
0.9—l.96×0.02≤P≤0.9+1.96×0.02
0.86≤P≤0.94
即某街道所辖10000户居民表示将继续消费该商品的居民户占86%~94%。
从以上采用85%和95%两种置信度对总体指标的推断可见,不同的置信度会产生不同的抽样误差范围。在85%置信度要求下,推断总体平均数的抽样误差范围是±1.44×7.1,即±10.2克;推断总体成数的抽样误差范围是±1.44×0.02,即±0.03。在95%置信度要求下,推断总体平均数的抽样误差范围是±1.96×7.1,即±13.9克;推断总体成数的抽样误差范围是±1.96×0.02,即±0.04。
显然,提高抽样推断的置信度的同时,也就加大了抽样误差范围,即降低了抽样推断的准确性。因此,在市场调查的实践中,应当兼顾置信度和准确度两方面。若置信度和准确度的要求都提高,就只能加大样本容量,当然也就增加了工作量。
(3) 推断总体总量。 ”
若将市场调查看做市场预测的一个步骤,根据上述抽样调查的结果,还可对市场进行预测。
假定以95%的置信度的推断结果为依据,其每户月平均需求量为486.1~513.9克,表示继续消费该商品的居民户占86%~94%。则某街道办事处所辖10 000户对该商品的月需求总量大致可如下预计。
若以最低需求户比重预计需求量为:
486.11×0 000×86%= 4180.5 (公斤)
513.9×10 000×86%= 4419.5 (公斤)
即以最低需求户比重预计每月需求总量将达到4 180.5公斤至4 419.5公斤。
若以最高需求户比重预计每月总需求量为:
486.1×10 000×94%= 4 569.3 (公斤)
513.9×10 000×94%= 4 830.7 (公斤)
即以最高需求户比重预计每月需求总量将达到4 569.3公斤至4 830。7公斤。
总的来说,某街道办事处所辖10 000户居民对该商品的月需求总量将会在4 181公斤至4 83l公斤之间,这种推断有95%的置信度。
第四节 非随机抽样方式
随机抽样有明显优点,如排除了市场调查中调查者的主观影响,从而使样本具有客观性;它能够测定抽样误差指标并能对其大小加以控制,从而达到用样本指标推断总体指标的目的。但是在很多情况下,随机抽样几乎无法进行。如对市场调查总体的外延无法具体确定,就根本无法进行随机抽样。另外,为了保证抽样的随机原则,对操作过程要求严格,实施起来的比较麻烦,费时费力。因此,如果市场调查目的仅仅是对问题做初步探索,以便制定研究问题的方案,或市场调查并不需要推断总体指标,抽样调查就并不一定要按随机原则,而可以采取非随机抽样。
非随机抽样
也称立意抽样。它是指在抽样中不将随机性作为抽样原则,而是根据市场调查者的主观分析判断抽取样本。
2、优点
非随机抽样方法操作方便,省时省力,若使用得当,就能对市场调查对象总体有较好的了解,抽样调查同样能获得成功。
3、不足
非随机抽样由于没有使总体的每个单位都有同等被抽取的可能,也不排除调查者主观因素的影响,因此用。这样的样本指标推断总体指标就缺乏依据,需要特别慎重,否则就会出现以偏概全的错误。
非随机抽样的具体方法,主要有以下几种类型:
一、偶遇抽样
定义
偶遇抽样又称任意抽样、方便抽样。它是指市场调查者把在一定时间、一定环境所遇见的人,作为调查对象选入样本的方法。
如在街头路口把行人作为调查对象,任选若干位进行访问调查;在商店柜台前把购买者当做调查对象,向他们中的任意部分人作市场调查等等;在剧院、车站、码头等公共场所,任意选择某些人进行调查。
如果在偶遇调查中,调查者所选中的人不情愿被调查,也可将自愿被调查的人所作为样本。可见,偶遇调查完全是根据调查者的方便任意选取样本。
2、特点
应用偶遇抽样法进行调查能够体现方便、节省,但其偶然性极大,在一定时间、环境能遇到什么人,是很偶然的。
理论依据
这种方法的基本理论依据是,认为被调查总体的每个单位都是相同的,因此把谁选为样本进行调查,其调查结果都是一样的。而如果在调查前就可以肯定知道,被调查总体各单位存在明显差异,即不符合原理论假设,就不宜采用偶遇抽样法。
主观抽样
1、定义
主观抽样又称判断抽样、立意抽样。它是指市场调查者根据主观判断选取样本的方法。
2、分类
主观抽样在市场调查的实际工作中应用,会有两种基本情形:
(1)一种强调样本对总体的代表性;
当主观抽样的目的在于,通过对样本的调查推论总体的一般性时,主观抽样必须严格选择对总体有代表性的单位作为样本。所选择并被调查的样本对总体代表性高低,完全取决于调查者对被调查总体了解的程度和自身的判断能力。当被调查总体规模较小,所涉及的范围较窄时,主观抽样样本的代表性较高;当被调查总体规模较大,但涉及的范围较广时,主观抽样样本的代表性会明显降低,或不容易做到有较高的代表性。在市场调查中,如果被调查对象总体界限确定有困难,或因时间和力量有限无法进行随机抽样时,恰当地采用主观抽样法也可以取得相对满意的调查效果。
(2)一种是注重对总体中某类问题的研究。
就是市场调查注重对总体中某类问题的研究,而并不过多考虑对总体的代表性。这种情况下,主观抽样必须有目的地选择样本,即选择与研究问题的目的一致的单位作为样本。
如对问卷设计的问题及回答形式是否得当进行检验,就有目的地选择对市场现象的看法差异较大,回答问题的能力明显不同的被调查者作为样本;对某项市场调查结果中,观点明显偏离一般情况的特殊人也可作为主观抽样的样本;在城市或农村居民中调查特高收入或特低收入者的收支情况,尤其是要了解其消费结构,则选这种收人水平的居民作为主观抽样样本。
显然,上述几种主观抽样的调查目的,是为了研究一些特定问题,而不是为了推论总体,所以主观抽样的目的性就更强,这种主观抽样在市场调查中往往能得到明显的收获。
三、定额抽样
1、定义
定额抽样又称配额抽样。它与类型随机抽样具有相似之处。它是指按市场调查对象总体单位的某种特征,将总体分为若干类,按一定比例在各类中分配样本单位数额.并按各类数额任意或主观抽样。由于在各类中抽样时并不遵循随机原则,所以说它
是非随机油祥的方法之一。
2、理论依据
定额抽样是以说明总体为目的,因此在对总体分类时,必须对总体的性质有充分的了解。应用定额抽样法的理论依据是,认为同类调查对象中各单位大致相同,差异很小,因此
不必按随机原则抽样,只要用任意或主观抽样就可以了。
特点
在市场调查实践中,采用定额抽样法,简便易行,省时又省力,并且能保证样本单位在总体中较均匀分布,调查结果比较可靠。定额抽样法是非随机抽样法中被应用得员广泛的方法之一。
定额抽样是在对总体分类的基础亡进行的.对于总体进行分类可按一个标志,也可按一个以上的标志,从而造成了定额抽样具体做法不同。若对市场调查的总体只按一个标志分类,只需按各类总体单位数占总体单位总量的比重将样本单位数分配在各类
中就可以。若对市场调查总体按——个以上标志分类,则在各类分配样本单位数时所依据的比重会有所不同。
例如.在某乡抽样400户,对某种商品的需求量进行调查。对该乡所属全部居民按人均年纯收入分类,这是考虑到收入水平的差异自接影响着对该商品的需求。同时持全部居民按每户人口数分组、即居民对该商品的需求量不仅受收入水平的影响,还受家庭人口数多少的影响。
(一)单标志分组配额抽样
若对某乡所属全部居民只按人均年收入水平分类.其各类比重和样本单位在各类的分配如表3-3
表3-3 单标志分类定额抽样计算表
按人均年纯收入分类(元)
总体各类户数比重(%)
各类中样本单位数(户)
500及以下
500~ 1 000
1 000以上
10
75
15
40
300
60
合计
100
400
(二)复合标志分组配额抽样
若对某乡全部居民按人均年纯收入和家庭人口数两个标志分类,其各类比重如表3-4。
表3-4 双标志分类总体比重表
3人以下(%)
3人及以上(%)
合计(%)
500及以下
500~1 000
1000以上
3
22
4
7
53
11
10
75
15
合 计
29
71
100
根据表3-4中各类比重,各类应抽样本单位数如下:
①500元及以下、3人以下类:400~3%-12(户)
②500元以下、3人及以上类:400x7%-28(户)
③500~1 000元、3人以下类:400x22%-88(户)
④500~1 000元、3人及以上类:400x53%-212(户)
⑤1 000元以上、3人以下类:400x4%-16(户)
⑥1 000元以上、3人及以上类:400x11%-44(户)
共抽取400户,其中3人以下各种收入水平样本户数116户
(400 x 29%=116户,或12户+88户+16户=116户);3人及以上各种收入水平样本户数284
户(400x 71%-284户,或28户+212户+44户=284户)。
(三)最佳比例定额抽样
1、定义
不论是单标志还是双标志的定额抽样,在定样本单位数额时所依据的是总体各类单位数占总体单位数的比重,故称其为比例定额抽样。实际工作中还常采用的一种方法是最佳比例定额抽样,这种方法在将总体分类定额抽样时,不仅要依据各类在总体中的比重,还考虑到总体各类标准差的大小。即对标准差大的类别和标准差小的类别在抽样时给予不同数额。
其样本单位数在各类中的定额公式为:
式中: 各类应抽样本单位数;
n 样本容量(样本单位数);
各类总体单位数;
总体各类标准差。
在市场调查中,总体各类标准差的资料往往不是本次调查所得,而是对同一现象过去所做的各种调查或市场抽样调查资料。
下面用前例说明最佳比例定配抽样法的应用。见表3-5。
表3-5 最佳比例定额抽样表
按人均年收入分类(元)
(%)
500及以下
500~1 000
1 000 以上
1 000
7 500
1 500
50
30
100
50 000
225 000
150 000
12
53
35
48
212
140
合 计
10 000
-
425 000
100
400
从表3—5中各类样本单位数定额看,它与比例定额抽样结果不完全一致。这是因为l 000元以上收入类的标准差最大,500元及以下类的标准差也较大,所以必须加大这两类样本单位数的定额,而相应减少标准差较小的500—1 000元类的样本单位数定额。最佳比例定额抽样能够使样本的分配更加合理,由此所得出的市场调查结果也就更能反映实际情况。
第五节 确定样本容量
样本容量即指样本单位的多少,在市场抽样调查中样本容量的确定是一个必须要解决的实际问题,它关系到样本对总体的代表性,也关系到抽样调查费用和人力的花费。样本太小会影响样本对总体的推断准确性和可靠程度,样本过大则会造成不必要的人力和费用的消耗,因此在抽样调查中样本的容量要适当。
适当地确定样本的容量,一般应考虑到市场调查研究的目的,市场现象总体的性质及特点,在组织抽样调查时所具备的客观条件等等。市场调查研究的目的不同,具体表现在抽样调查中,就是置信度与置信区间要求不同;市场现象总体的性质和特点不同就决定其具体的调查过程要采用不同的抽样方式;在组织抽样调查时所具备的客观条件,包括着人、财、物力条件,调查时间要求的长短等;这些都直接影响着样本容量的确定。
一、根据调查目的确定样本容量
市场调查研究的目的不同,对抽样调查的置信度及置信区间要求有所不同。抽样调查的置信度是样本指标推断总体指标时,保证其抽样误差不超出允许范围的概率水平,它也被称为可靠程度。市场调查中常用的置信度有90%、95%、99%等。抽样调查的置信区间则是样本指标推断总体指标时的误差范围,它也被称为允许误差范围。置信区间与置信度和抽样误差之间,置信度越高置信区间也会越大,抽样误差越大则置信区间也越大。置信度和置信区间一般都是由资料使用者或市场调查者,根据市场调查的目的在调查方案中事先确定的,然后再根据研究市场问题所必须的置信度和所允许的置信区间,确定样本的容量。置信度反映抽样调查的可靠程度,置信区间则反映市场抽样调查的精确度。在市场抽样调查中置信度要求越高,所必须抽取的样本单位就相应地越多;在市场抽样调查中置信区间越小,所必须抽取的样本单位相应越少。
二、考虑总体性质和特点确定样本容量
市场现象总体的性质和特点,也是在确定样本容量时必须考虑到的方面。在分析市场现象总体性质和特点时,应该从几方面来考虑。首先,就是分析总体规模的大小,在抽样调查中,总体规模大小用总体单位数N多少来衡量,总体规模越大所必须抽取的样本就应当相对加大,以减少抽样误差。其次,是分析总体的标准差,即分析总体各单位的差异程度大小。这是因为总体标准差大小是决定抽样误差大小的一个重要因素,在一定置信区间要求下,总体的标准差越大,所必须抽取的样本容量也就应相对越大。最后,还应对总体是否存在明显的类型加以分析,若总体内部存在不同类型,就应采取类型随机抽样方式抽取样本;否则就会使抽样误差加大,也影响到样本的容量。采取适合总体的抽样方式,可以相对缩小样本,减少市场抽样调查的工作量。
三、按市场调查条件确定样本容量
市场调查所具备的条件,即人、财、物力和时间等条件,对样本容量也起着某种限定作用。在市场抽样调查的人、财、物力、时间都比较宽松的条件下,调查者可不必为增加或减,少几个样本单位而过多考虑,应以样本容量能够满足研究问题的需要为基本出发点。但在人、财、物力和时间比较紧张时,也不能只考虑缩小样本会达到节省费用和时间的一面,而忽视了调查目的要求的置信度和置信区间,造成市场抽样调查的失败。
四、样本容量的计算
确定样本容量在考虑到各方面因素后,则必须具体确定样本的大小。抽样调查不论是计算抽样误差中,还是统计推断中,都是以概率论和数理统计的有关理论为依据的,这些理论大多是以大样本为前提建立的。在数理统计中将小于30个单位的样本称为小样本,将大于等于30个单位的样本称为大样本。为了应用有关数理统计的理论;也由于市场现象总体一般都比较大,总体标准差也比较大;所以市场抽样调查的样本一般都采用大样本。
其样本单位在50 55 5000之间。在具体确定样本单位数时可按公式法和经验法进行。
1.公式法计算样本容量
利用公式法确定样本容量,是根据市场抽样调查中的置信度和置信区间,根据总体标准差的大小等因素,计算出确切的样本单位数。抽样调查中采用的随机抽样方式不同,其具体计算公式也不同,以单纯随机抽样为基本形式来说明样本单位数的计算。
其公式为:
信度呈正方向变化,即总体标准差越大,抽样调查的置信度要求
极高,样本单位数就越大;样本单位数与调查的误差范围要求呈
反方向变化,即误差范围要求越小,样本单位数就越大。
例如,某地区居民户数为10000户,其年消费水平标准差为
200元。若采取抽样调查了解其年平均消费水平,并要求LL(95%
的置信度推断总体,其样本指标与总体指标之间的允许误差范围
星15元(即置信区间为15元),则样本单位数按公式计算为:
n’(芝)’二(·1.'90~ZUU)’-683(户)
即根据该调查的置信度和置信区间要求,根据该总体的标准
差,必须抽683户进行抽样调查,才能满足研究问题的需要。
相应地,其他抽样方式也有计算样本单位数的方式,应用时
可参阅统计学的有关理论。
2.经验法确定样本容量
应用经验法确定样本单位数,是根据抽样调查的经验,得出
不同规模总体,样本单位数占总体的比重经验数,供抽样调查抽
取样本时参考。由于它是根据多次成功的抽样调查总结出的经
验,所以具有较高的参考价值。不过这个比重只是为调查者提供
了一个样本单位数的范围,在应用时还必须根据市场调查的具体
要求和总体的具体情况,确定样本单位数。不同规模总体样本单
位数占总体比重见表3-6。
表3-6 经验确定样本容量的范围
总体
规模
100 1)..L-N
100,、,
1 000
1 000——
5 000
5 000—-
10 000
10 000·、,
100 000
100 000
以上
样本
占凸
L斗,匕\
体比
重%
50~_k
50--20
30--10
15~3
5--1
1以下
n=
信度呈正方向变化,即总体标准差越大,抽样调查的置信度要求
极高,样本单位数就越大;样本单位数与调查的误差范围要求呈
反方向变化,即误差范围要求越小,样本单位数就越大。
例如,某地区居民户数为10000户,其年消费水平标准差为
200元。若采取抽样调查了解其年平均消费水平,并要求LL(95%
的置信度推断总体,其样本指标与总体指标之间的允许误差范围
星15元(即置信区间为15元),则样本单位数按公式计算为:
n’(芝)’二(·1.'90~ZUU)’-683(户)
即根据该调查的置信度和置信区间要求,根据该总体的标准
差,必须抽683户进行抽样调查,才能满足研究问题的需要。
相应地,其他抽样方式也有计算样本单位数的方式,应用时
可参阅统计学的有关理论。
2.经验法确定样本容量
应用经验法确定样本单位数,是根据抽样调查的经验,得出
不同规模总体,样本单位数占总体的比重经验数,供抽样调查抽
取样本时参考。由于它是根据多次成功的抽样调查总结出的经
验,所以具有较高的参考价值。不过这个比重只是为调查者提供
了一个样本单位数的范围,在应用时还必须根据市场调查的具体
要求和总体的具体情况,确定样本单位数。不同规模总体样本单
位数占总体比重见表3-6。
表3-6 经验确定样本容量的范围
总体
规模
100 1)..L-N
100,、,
1 000
1 000——
5 000
5 000—-
10 000
10 000·、,
100 000
100 000
以上
样本
占凸
L斗,匕\
体比
重%
50~_k
50--20
30--10
15~3
5--1
1以下
式中:n 样本单位数;
σ 总体标准差;
厶x 抽样平均数的误差范围;
t 与置信度对应的函数值。
显然从这个公式中可以看出,样本单位数与总体标准差和置信度呈正方向变化,即总体标准差越大,抽样调查的置信度要求极高,样本单位数就越大;样本单位数与调查的误差范围要求呈反方向变化,即误差范围要求越小,样本单位数就越大。
例如,某地区居民户数为10000户,其年消费水平标准差为200元。若采取抽样调查了解其年平均消费水平,并要求以(95%)的置信度推断总体,其样本指标与总体指标之间的允许误差范围是15元(即置信区间为15元),则样本单位数按公式计算为:
n= ==683 (户)
即根据该调查的置信度和置信区间要求,根据该总体的标准差,必须抽683户进行抽样调查,才能满足研究问题的需要。
2.经验法确定样本容量
应用经验法确定样本单位数,是根据抽样调查的经验,得出不同规模总体,样本单位数占总体的比重经验数,供抽样调查抽取样本时参考。由于它是根据多次成功的抽样调查总结出的经验,所以具有较高的参考价值。不过这个比重只是为调查者提供了一个样本单位数的范围,在应用时还必须根据市场调查的具体要求和总体的具体情况,确定样本单位数。不同规模总体样本单位数占总体比重见表3-6。
表3-6 经验确定样本容量的范围
总体
规模
100 以下
100~
1 000
1 000~
5 000
5 000~
10 000
10 000~
100 000
100 000
以上
样本
占总
体比
重%
50以上
50~20
30~10
15~3
5~1
1以下
由经验确定样本单位数,一般多用非随机抽样;而在随机抽样中应用公式计算样本单位数更为科学,当然在随机抽样中把经验作为参考也是可以的。
课后习题
简答题
1.简要回答单纯随机抽样的具体分类及其各自特点。
2.简述类型随机抽样的优点及其适用范围。
3.试比较整群抽样和类型随机油样的异同。
4.试述抽样误差与置信度的关系。
5.怎样理解和应用偶遇抽样法?
6.怎样应用主观抽样法进行市场调查?
7.简要回答样本容量的计算方法。
8.随机抽样调查的优点有哪些?
9.市场调查中怎样应用等距随机抽样?
10.怎样通过样本指标推断总体指标?
11.非随机抽样的适用范围及其特点。
12.简述定额抽样的理论基础及其具体应用。
二、论述题
1.试论述抽样调查的特点。
2.试论述确定样本容量的重要性及其确定方法。
案例分析3
Juan Carlos墨西哥饭店(JC)的老板Juan CarLos Garcia ,遇到了同其他许多小企业主一样的问题。他想在一个中小型社区成功地经营一家墨西哥饭店,直到6个月前这种理想一直是在很成功地实现着。从那时起,他注意到平均每周顾客数量开始小幅下降,相应的利润也遭受到了波及。他很重视这件事,曾花费了大量时间在高峰时间到饭店观察他的雇员对主顾需要的满足是否够好和有效。
Garcia于是请当地大学教授Gilmore进行市场调研,以帮他解决利润下降的问题。Gilmore教授承诺下个星期领着一组学生来,开展这项调研工作。Garcia向学生们讲了饭店的历史和这些时期的所有财务指标。学生们向Garcia问了很多有关当地饭店、行业趋势的问题,以及任何可能存在的周朗性变化。大部分情况下,Garcia都能向小组的提问传递信息。不过,有一件事他没有做,就是调查他的顾客以弄清楚他的饭店和菜肴对消费者有哪种吸引力。小组确定了下列目标用来指导针对饭店的调研。
1.在空气、服务、位置、饭荣质量和数量以及饭菜价格方面确定JC的墨西哥饭店最有吸引力的特色。
2.评估顾客在空气、服务、位置、饭莱质量和数量以及饭菜价格方面满意度的重要性。
3.确定在空气、服务、位置、饭菜质量和数量以及饭菜价格
方面选择墨西哥饭店时考虑的因素。
4.确定顾客对于将来在这里就餐的意识和最有可能的反映。
5.根据地区和顾客人口统计量评估顾客在人口统计和地理方面的特征。
6.推导结果的战略性含义。
小组在这些研究领域选择厂—种两步取样法。第一步涉及对一组饭店员工的取样,其信息会在淮备设计用于第二步的问卷时对小组有帮助,第二步应用问卷调查对一组随机挑选的饭店顾客进行了调查。
这个样本包括了在两个不同的星期天的下午5点到7点随机挑选的顾客,总共收到了91份有效答卷。小组首先总体上对数据进行了分析,接着使用SPSS对结果进行了交叉制表处理以便分析与具体的人口统计和个人品质相关的具体问题。使用概率、交叉表和百分率对数据进行了系统分析,确定了基于人口统计和个人品质差异的调查对象差异。基于收集的这些信息,制定了表1—表3。
从上面的案例中,我们比较清楚地了解了市场抽样调查的具体程序,以及抽样调查的特点:
首先.调查小组确定了此项调查的总体对象,即对饭店员工和顾客进行调查,同时为了更好地进行饭店市场调查,调查小组制定6条目标作为市场调查的指导目标。
其次.调查小组设计了样本范围,采用两步取样法对饭店员工和顾客进行抽样。同时,在抽样时,调查小组严格坚持抽取样本的客观性,按照随机的原则,充分体现了抽样调查抽取样本客观性的特点。
再次,收集样本资料后,小组从总体上对数据进行了分析,并使用SPSS对结果进行了交叉制表处理以便分析与具体的人口统计和个人品质相关的具体问题。
最后,用样本指标推断总体指标,制定了消费音对的Juan Carlos的墨西哥饭店的评价,对Juan carIos饭店进行改善的建议以及不同年龄段的满意度3个有价值的表格,进而给墨西哥饭店的成功经营带来了有效的决策参考。