2 - 1
统计学
(核心课程 ) 第 2章 统计数据的搜集
作者:中国人民大学统计学院
贾俊平
2 - 2
统计学
(核心课程 ) 第 2章 统计数据的搜集
2.1 统计数据的来源
2.2 调查方案设计
2.3 调查问卷设计
2.4 统计数据的质量
2 - 3
统计学
(核心课程 ) 学习目标
1,了解统计数据的来源
2,了解数据的搜集方法
3,掌握调查方案的设计内容与要求
4,掌握调查问卷及其设计技巧
5,了解数据误差及对数据的质量要求
2 - 4
统计学
(核心课程 ) 2.1 统计数据的来源
一, 统计数据的间接来源
二, 统计数据的直接来源
2 - 5
统计学
(核心课程 ) 统计数据的间接来源
1,公开出版物:, 中国统计年鉴,,, 中国统计摘
要,,, 中国社会统计年鉴,,, 中国工业经济
统计年鉴,,, 中国农村统计年鉴,,, 中国人
口统计年鉴,,, 中国市场统计年鉴,,, 世界
经济年鉴,,, 国外经济统计资料,,, 世界发
展报告, ……
Internet
2,网络 中国














2 - 6
统计学
(核心课程 )
统计调查方式
统计数据的直接来源
2 - 7
统计学
(核心课程 ) 统计调查方式
统计调查方式










重点
调查
典型
调查
2 - 8
统计学
(核心课程 )
抽样调查
(sample survey)
1,从总体中随机抽取一部分单位 (样本 )进行调查
总体? ?
?
?
??? 随机样本
??
4,具有经济性、时
效性强、适应面
广、准确性高等
特点
2,目的是推断总体的未知数字特征
3,最常用的调查方式
2 - 9
统计学
(核心课程 )
普查
(census)
1,为特定目的专门组织的非经常性全面调查
2,通常是一次性或周期性的
3,一般需要规定统一的标准调查时间
4,数据的规范化程度较高
5,应用范围比较狭窄
总体
2 - 10
统计学
(核心课程 )
统计表报
(statistical report forms)
1,统计调查方式之一
2,过去曾经是我国主要的数据收集方式
3,按照国家有关法规的规定,自上而下地
统一布置、自下而上地逐级提供基本统
计数据
4,有各种各样的类型
2 - 11
统计学
(核心课程 ) 重点调查和典型调查
2,典型调查 (model survey)
? 从调查对象的全部单位中选择少数典
型单位进行调查
? 目的是描述和揭示事物的本质特征和
规律
? 调查结果不能用于推断总体
? ?
?
?
??? ?
?
??
?
1,重点调查 (key-point investigation)
? 从调查对象的全部单位中选择少数重点单位进行
调查
? 调查结果不能用于推断总体
2 - 12
统计学
(核心课程 )
数据的搜集方法
2 - 13
统计学
(核心课程 ) 数据的搜集方法
数据的搜集方法
询问调查
访



观察实验




















访


2 - 14
统计学
(核心课程 )
访问调查
(Personal interview)
1,调查者与被调查者通过面
对面地交谈而获得资料
2,有标准式访问和非标准式
访问
? 标准式访问通常按事先设
计好的问卷进行
? 非标准式访问事先一般不
制作问卷
对不起,
打扰了!
2 - 15
统计学
(核心课程 )
邮寄调查
(Mail survey)
1,也称邮寄问卷调查
2,是一种标准化调查
3,调查者与被调查者没有直接的语言交流, 信
息的传递依赖于问卷
4,通过某种方式将调查表或问卷送至某调查者
手中, 由被调查者填写, 然后将问卷寄回指
定收集点
5,问卷或表格的发放方式有邮寄, 宣传媒介传
送, 专门场所分发三种
2 - 16
统计学
(核心课程 )
电话调查
(Telephone survey)
1,调查者利用电话与被调查者进
行语言交流以获得信息
2,时效快, 成本低
3,问题的数量不宜过多
您好 !
我是 ×× 调查
公司的调查
员 …
2 - 17
统计学
(核心课程 )
电脑辅助调查
(Computer— Assisted Telephone Interviewing)
1,又称电脑辅助电话调查
2,电脑与电话相结合完成调查的全过程
3,一般需借助专门的软件进行
4,硬件设备要求较高
2 - 18
统计学
(核心课程 )
座谈会
(colloquia)
1,也称集体访谈
2,将一组被调查者集中在调查现场, 让他们对
调查的主题发表意见以获得资料
3,参加座谈会的人数不宜过多, 一般为 6~ 10人
4,侧重于定性研究
2 - 19
统计学
(核心课程 )
个别深度访问
(personal interviewing)
1,一次只有一名受访者参加,
针对特殊问题的调查
2,适合于较隐秘的问题, 如个
人隐私问题;或较敏感的问
题, 如政治方面的问题
3,侧重于定性研究
2 - 20
统计学
(核心课程 )
观察法
(observational method)
1,就调查对象的行动和意
识, 调查人员边观察边
记录以收集所需信息
2,调查人员不是强行介入
3,能够在被调查者不察觉
的情况下获得资料
2 - 21
统计学
(核心课程 )
实验法
(experimental method)
1,在设定的特殊实验场所, 特
殊状态下, 对调查对象进行
实验以获得所需资料
2,有室内实验法和市场实验法
2 - 22
统计学
(核心课程 ) 2.2 调查方案设计
一, 确定调查目的
二, 确定调查对象和调查单位
三, 设计调查项目和调查表
四, 方案设计中的其他内容
2 - 23
统计学
(核心课程 )
调查方案设计
(survey plan )
调查方案的内容




调查
对象
调查
单位
调查
项目
和调
查表


2 - 24
统计学
(核心课程 )
确定调查目的
(objective of survey)
1,调查要达到的具体目标
2,回答, 为什么调查?,
3,调查之前必须明确
2 - 25
统计学
(核心课程 ) 确定调查对象和调查单位
1,调查对象 (respondent),调查研究的总体或调
查范围
2,调查单位 (survey unit),需要对之进行调查的
单位。可以是调查对象的全部单位(全面调查
),也可以是调查对象中的一部分单位(非全
面调查)
3,回答“向谁调查?” 调查对象? ?
?
?
?
?? 调查单位?
??
2 - 26
统计学
(核心课程 ) 设计调查项目和调查表
1,调查项目 (survey items),调查的具体内容
2,调查表 (questionnaire),表现调查项目的表
格或问卷
3,回答, 调查什么?,
Q1 …………
Q2 …………
Q3 …………
Q4 …………
2 - 27
统计学
(核心课程 ) 方案设计中的其他问题
1,明确调查所采用的方法
2,确定调查资料的所属时间和调查工作的期限
3,调查的组织与实施细则
2 - 28
统计学
(核心课程 ) 2.3 调查问卷设计
一,问卷的基本结构
二,提问项目的设计
三,回答项目的设计
四,问题顺序的设计
2 - 29
统计学
(核心课程 )
问卷的基本结构
2 - 30
统计学
(核心课程 )
什么是问卷?
(questionnaires)
1,用来搜集调查数据的一种工具
2,调查者根据调查目的和要求所设计的, 由
一系列问题, 备选答案, 说明以及码表组
成的一种调查形式
3,不同的调查问卷在具体结构, 题型, 措词
,版式等设计上会有所不同, 但在结构上
一般都由 开头部分, 甄别部分, 主体部分
和 背景部分 组成
2 - 31
统计学
(核心课程 ) 问卷的基本结构
问卷的基本结构
开头
部分
甄别
部分
主体
部分
背景
部分
问候语
填写说明
问卷编号
2 - 32
统计学
(核心课程 )
开头部分
(问候语)
×× 女士 /小姐 /先生
您好 ! 我是 ×× 市场调查公司访问院, 我们正在
进行一项有关公众医疗保险意识方面的调查, 目的是
想了解人们对医疗保险的看法和意见, 以便更好地促
进医疗保险事业的发展 。 您的回答无所谓对错, 只要
真实地反映了您的情况和看法, 就达到了这次调查的
目的 。 希望您能积极参与, 我们对您的回答完全是保
密的 。 调查要耽搁您一些时间, 请您谅解 。 谢谢您的
支持与合作 !
2 - 33
统计学
(核心课程 )
开头部分
(填写说明)
填写要求:
1,请您在所选择答案的题号上画圈
2,对只许选择一个答案的问题只能画一个圈;对
可选多个答案的问题, 请在你认为合适的答案
上画圈
3,需填写数字的题目在留出的横线上填写
4,对于表格中选择答案的题目, 在所选的栏目内
画勾
5,对注明要求您自己填写的内容, 请在规定的地
方填上您的意见
2 - 34
统计学
(核心课程 )
开头部分
(问卷的编号)
1,用于识别问卷, 调查者, 被调查者姓名和
地址等
2,便于校对检查, 更正错误
2 - 35
统计学
(核心课程 ) 甄别部分
1,甄别也称为过滤, 它是先对被调查者进行过滤
,筛选掉不需要的部分, 然后针对特定的被调
查者进行调查
2,通过甄别, 可以筛选掉与调查事项有直接关系
的人, 以达到避嫌的目的
3,可以确定哪些人是合格的被调查者, 哪些人不

4,甄别的目的是确保被调查者合格, 能够作为该
市场调查项目的代表, 从而符合调查研究的需

2 - 36
统计学
(核心课程 ) 甄别部分
S1,请问您或您的家庭有没有在下列行业工作的呢?
1,广告, 公关机构 …………………………………
2,市场研究, 咨询, 调查机构 ……………………
3,电视, 广播, 报纸等媒介机构 ………………… 终止访问
4,轿车制造 …………………………………………
5,轿车批发, 零售 …………………………………
6,以上皆无 ………………………………………… 继续访问
S2,请问您的年龄是:
1,20岁以下 ……… 终止访问
2,20- 30岁
3,30- 40岁
4,40- 50岁
5,50岁以上 ……… 终止访问
2 - 37
统计学
(核心课程 ) 主体部分
1,是调查问卷的核心内容
2,包括所要调查的全部问题, 主要由问题和
答案所组成
2 - 38
统计学
(核心课程 ) 背景部分
1,通常放在问卷的最后, 主要是有关被调查
者的一些背景资料
2,该部分所包含的各项问题, 可使研究者根
据背景资料对被调查者进行分类比较分析
2 - 39
统计学
(核心课程 ) 背景部分
A,[出 示 卡 片 ]请 问 您 的 教 育 程 度? (901)
没 受 过 正 式 教 育 ……………………… …… ………… 1
小 学,初 中 ………………………… …… ………… 2
高 中,职 高,中 专,技 校 …… … …… … …… 3
大 专,大 学 或 以 上 ………………… …… …… … 4
B,[出 示 卡 片 ]请 问 您 的 职 业 和 职 位 是 什 么? (902)
普 通 职 员,工 人 …………………………………… 1
部 门 经 理 负 责 人 // 高 级 管 理 人 员 …… … … … 2
公 司 老 板,厂 长,总 经 理 ………… …………… 3
专 业 人 员 …………………………… …… ………… 4
个 体 户,自 营 职 业 ……………… ……… ……… 5
失 业,待 业 ……………………………… …… …… 6
学 生 …………………………………………………… 7
离 退 休 人 员 ………………………………………… 8
其 他 (请注明 ) …………………………………… … 9
2 - 40
统计学
(核心课程 )
提问项目的设计
2 - 41
统计学
(核心课程 ) 提问项目的设计
1,提问的内容尽可能短
2,用词要确切, 通俗
? 可按 6W准则加以推敲 。 6W即 Who(谁 ),Where(
何处 ),When(何时 ),Why(为什么 ),What(什么
事 ),How(如何 )
3,一项提问只包含一项内容
4,避免诱导性提问
5,避免否定形式的提问
6,避免敏感性问题
2 - 42
统计学
(核心课程 ) 用词要确切、通俗
请问您使用什么牌子的洗发水?
请问您最近三个月使用什么牌子的洗发水?
您最近一段时间使用什么品牌的化妆品?
您最近一个月使用什么品牌的化妆品?
您觉得这种电视机的画面质量怎么样?
您是否认为使用电脑数字技术制作的广告更
具有吸引力?
?
?
?
?
?
?
2 - 43
统计学
(核心课程 ) 一项提问只包含一项内容
您觉得这种新款轿车的加速性能和制动性
能怎么样?
?您觉得这种新款轿车的加速性能怎么样?
?您觉得这种新款轿车的制动性能怎么样??
?
2 - 44
统计学
(核心课程 ) 避免诱导性提问
人们认为长虹牌彩电质量不错, 你觉得怎
么样?
您觉得长虹牌彩电的质量怎么样??
?
2 - 45
统计学
(核心课程 ) 避免否定形式的提问
您觉得这种产品的新包装不美观吗?
您 觉 得 这 种 产 品 的 新 包 装 美 观 吗??
?
2 - 46
统计学
(核心课程 )
回答项目的设计
2 - 47
统计学
(核心课程 ) 回答的类型与方法








开放性问题
(自由回答型 )
封闭性问题
(选择回答型 )
两项选择法
多项选择法
顺序选择法
评定尺度法
双向列联法
限制选择型
多项选择型
单项选择型
2 - 48
统计学
(核心课程 ) 开放性问题
1,对问题的回答未提供任何具体的答案, 由被调
查者根据自己的想法自由作出回答
2,属于自由回答型
3,优点:比较灵活, 适合于搜集更深层次的信息
,特别适合于那些尚未弄清各种可能答案或潜
在答案类型较多的问题 。 而且可以使被调查者
充分表达自己的意见和想法, 有利于被调查者
发挥自己的创造
4,缺点:由于会出现各种各样的答案, 给调查后
的资料整理带来一定困难
2 - 49
统计学
(核心课程 )
开放性问题
(例子)
?您认为我国目前的广告宣传中, 存在的
主要问题是什么?
?您对这种捷达新款车有何更具体的看法?
2 - 50
统计学
(核心课程 ) 封闭性问题
1,对问题事先设计出了各种可能的答案, 由被调
查者从中选择
2,问题的答案是标准化的, 有利于被调查者对问
题的理解和回答, 也有利于调查后的资料整理
3,对答案的要求较高, 对一些比较复杂的问题,
有时很难把答案设计周全
4,问题的答案是选择回答型, 所以设计出的答案
一定要穷尽和互斥
5,回答方法有:两项选择法, 多项选择法, 顺序
选择法, 评定尺度法, 双向列联法五种
2 - 51
统计学
(核心课程 )
封闭性问题
(两项选择法)
1,答案只有两项, 要求被调查者选择其中之一
来回答
2,优点:被调查者只需在二中之中选择一项,
回答比较容易;调查后的数据处理也很方便
3,缺点:得到的信息量较少;当被调查者对两
项答案均不满意时, 很难作出回答
?您家里有电视机吗?
1,有 2.没有
2 - 52
统计学
(核心课程 )
封闭性问题
(多项选择法)
1,在设计问卷时, 对一个问题给出三个或三个以
上的答案, 让被调查者从中选择进行回答
2,根据要求选择的答案多少不同, 有以下类型
? 单项选择型,要求被调查者对所给出的问题答案选
择其中的一项
? 多项选择型,要求被调查者对所给出的问题答案中
,选出自己认为合适的答案, 数量不受限制
? 限制选择型,要求被调查者在所给出的问题答案中
,选出自己认为合适的答案, 但数量要受一定限制
2 - 53
统计学
(核心课程 )
封闭性问题
(单项选择法实例)
?单项选择型
?您觉得哪种类型的广告宣传效果最好?
(选一项 )
1,电视广告
2,广播广告
3,杂志广告
4,报纸广告
5,路牌广告
2 - 54
统计学
(核心课程 )
封闭性问题
(多项选择法实例)
?多项选择型
?请问您在购买小轿车时, 主要考虑哪些因素?
(选出您认为合适的答案 )
1,价格 6,维修费用
2,款式 7,乘坐舒适
3,品牌 8,行使平稳
4,耗油量 9,加速性能
5,售后服务 10,制动性能
2 - 55
统计学
(核心课程 )
封闭性问题
(顺序选择法)
1,问题答案有多个, 要求被调查者在回答时, 对所选的答
案按要求的顺序或重要程度加以排列 。 其中, 对所选的
的答案数量可以进行一定的限制, 也可以不进行限制
2,问题答案不仅可以反映所要调查的内容, 而且可以反映
出被调查者对问题的看法, 从而增加了信息量
? 您在购买这种牌子的电视机时,主要是考虑哪些因素?
1,产品的品牌
2,价格合理
3,售后服务
4,外形美观
5,维修方便
( 按重要程度进行排序 )
2 - 56
统计学
(核心课程 )
封闭性问题
(评定尺度法)
?问题答案, 由表示不同等级的形容词组成,
并按照一定的程度排序, 由被调查者依次
选择
?您对这种新款轿车是否感到满意?
1,非常满意; 2,比较满意; 3,一般
4,不太满意; 5,不满意 。
2 - 57
统计学
(核心课程 )
封闭性问题
(双向列联法)
1,将两类不同问题综合到一起, 通常用表格
来表现
2,表的横向是一类问题, 纵向是另一类问题
3,这种问题结构可以反映两方面因素的综合
作用, 提供单一类型问题无法提供的信息
4,可以节省问卷的篇幅
2 - 58
统计学
(核心课程 )
封闭性问题
(双向列联法实例)
神龙富康 捷 达 桑塔纳
1,耗油量低
2,外观大方
3,乘坐舒适
4,整车价格合理
5,驾驶容易
6,制动性好
7,维修方便
8,零配件齐全
9,故障率低
10,售后服务周到
请在您赞同项目的空格内划,√”
2 - 59
统计学
(核心课程 )
问题顺序的设计
2 - 60
统计学
(核心课程 ) 问题顺序的设计
1,问题的安排应具有逻辑性
2,问题的顺序应先易后难
3,能引起被调查者兴趣的问题放在前面
4,开放性问题放在后面
5,版面格式的设计
? 问卷的结构安排要合理, 问卷的主体部分要突出,
醒目
? 不要编排过密, 各问题之间要留出一定的空间
? 外表及内容的印刷要美观
2 - 61
统计学
(核心课程 ) 2.4 统计数据的质量
一, 统计数据的误差
二, 统计数据的质量要求
2 - 62
统计学
(核心课程 )
误差来源
登记性误差
数据误差的来源
代表性误差
2 - 63
统计学
(核心课程 ) 统计数据的误差
1,统计数据与客观现实之间的差距
2,有登记性误差和代表性误差两类
? 登记性误差,由于调查者或被调查者的人为
因素所造成的误差。理论上讲可以消除
? 代表性误差,用样本数据进行推断时所产生
的误差。通常无法消除,但事先可以进行控
制和计算
2 - 64
统计学
(核心课程 ) 统计数据的质量要求
1,精 度,最低的抽样误差或随机误差
2,准 确 性,最小的非抽样误差或偏差
3,关 联 性,满足用户决策, 管理和研究的需要
4,及 时 性,在最短的时间里取得并公布数据
5,一 致 性,保持时间序列的可比性
6,最低成本,以最经济的方式取得数据
2 - 65
统计学
(核心课程 ) 本章小结
1,统计数据的来源
2,调查方案设计
3,调查问卷设计
4,统计数据的质量
结 束