学时:4 目标和要求:掌握现况调查中抽样调查方法及资料基本分析方法,筛检定义及筛检实验评价 方法,一般了解普查和生态学研究的概念。 教学手段:多媒体、例证、提问等。 现况调查 描述性研究(descriptive study)是指利用已有的资料或特殊调查的资料,包括实验室检查结果,描述疾病或健康状况在不同时间、地点或人群中的分布特点,为进一步开展分析流行病学研究提供病因或流行因素的线索。现况调查(prevalence survey)又称横断面研究(cross-sectional study)是一种较为常用的描述性流行病学调查方法,是其他流行病学研究的基础和出发点,也是进行公共卫生决策的立足点之一,在流行病学方法体系中占有重要地位。本章着重介绍现况调查的概念及目的;现况调查的方法及种类;现况调查的设计步骤;现况调查的资料来源和收集,资料整理分析与结果解释;现况调查中可能出现的偏倚及其防止等内容。 第一节 现况调查概述 一、概念 现况调查是按照事先设计的要求,在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状况的分布及某因素与疾病的关联。从时间上说,现况调查是在特定时间内进行的,即在某一时点或在短时间内完成,这个时间点犹如一个断面,故又称之为横断面研究。它所收集的资料既不是过去的记录,也不是常规报告资料或随访的调查资料,而是调查当时所得到的疾病、健康和其他有关资料。 现况调查是通过完成某特定时间该人群健康经历的一个“快照”,提供某病频率和特征的信息。现况调查强调在一定时间内,这个时间应尽可能短一些,如果调查的时间拖延过长,则有可能所研究的疾病或因素发生变化,使调查结果的分析和解释较为困难。 需要指出的是,现况调查并不等于只对现象作静态分析,它也可以对多个断面的现况调查作动态分析。例如我国先后5次进行的人口普查,尽管就某一次普查而言只能了解调查当时的人口基本状况、年龄构成、性别比例、人口素质状况分布等,但如果对5次人口普查的资料作动态分析,那么我们就可以了解上述指标在5次人口普查期间的变化动态和趋势,能够发现人口变化的规律,并有可能对将来的人口变化趋势作出预测。 二、特点 1. 现况调查既可以弥补常规报告资料的不足,又能在较短的时间内得到调查结果、花费不大,是常用的流行病学调查方法。 2. 现况调查在时序上属于横向研究,是指在一个时点上收集研究资料,并用以描述研究对象在这一时点上的状况,或者探讨这一时点上不同变量之间的关系;而病例对照研究和队列研究在时序上都属于纵向研究,只不过前者是由现在追溯到以前(从后向前),而后者是由现在随访到将来(由前向后)。 3. 由于所调查的疾病或健康状况与某些特征或因素是同时存在的,即在调查时因与果并存,无法判断谁先谁后,故在现况调查中常进行相关性分析,只能为病因研究提供线索,而不能得出有关病因因果关系的结论。 4. 现况调查一般不用于病程比较短的疾病。因为现况调查是在一个极短的时间完成的,如果所调查疾病的病程过短,在调查时有许多人可能已经痊愈,而另一些人可能在调查后才发病,故不利于反映该疾病的全貌。 5. 现况调查中的相关因素选择有一定的限制,一般所涉及的暴露因素最好是持续不变(或很长时间内不变)的,比如血型、性别、职业等等,这些变量的目前的信息与其他以往的信息同样有效。而如果分析的变量是可以改变的,比如体温、脉搏等等,那么其目前信息的利用价值不是很大。另外,现况调查还适用于暴露因素后期累积作用的观察。 三、现况调查的目的 1.描述疾病或健康状况的分布 通过现况调查可以描述疾病或健康状况的三间分布,发现高危人群,分析疾病或健康状况的频率与哪些环境因素、人群特征等因素有关。例如通过我国1979~1980年进行的高血压全国抽样调查,可以了解高血压的总患病率,以及高血压在各省、地区、城市、乡村、年龄、性别中的分布。 2.发现病因线索 描述某些因素或特征与疾病或健康状况的联系以确定病因假设,供分析流行病学研究。例如在对冠心病的现况调查中发现冠心病患者中有高血压、高血脂、肥胖等因素的比例明显高于非冠心病人群,从而提出冠心病的某些病因假设。 3.适用于疾病的二级预防 早期发现病人,利用普查或筛检等手段,可实现“早发现,早诊断,早治疗”的目的。例如1972~1974年我国江苏省进行的三次麻风病全民普查,发现了大量早期麻风病人,并及时进行了早期治疗,对控制麻风病的流行、降低麻风畸残发生率有很大的促进。 4.评价疾病的防治效果 考核防治措施的效果,如定期在某一人群中进行横断面研究,收集有关暴露与疾病的资料,通过这种类似前瞻性研究的研究结果,可评价某些疾病防治措施的效果。 5.进行疾病监测 在某一特定的人群中长期进行疾病监测,可以对所监测疾病的分布规律和长期变化趋势有深刻的认识和了解。 6.其他 现况调查还可用于衡量一个国家或地区的卫生水平和健康状况;用于卫生服务需求的研究;用于社区卫生规划的制订与评估;进行参数估计,用于有关卫生或检验标准的制订;为卫生行政部门的科学决策提供依据。 第二节 现况调查的方法及种类 一、现况调查的方法 在现况调查取得成功的关键是资料的可靠性,因此在其实施过程中必须有科学的调查方法。现况调查常用的方法有:面访、信访、电话访问、自我管理式问卷调查、必要的体格检查和实验室检查等,今年来随着网络的普及还出现了网上调查等新的调查方法。 1. 面访 也叫访问调查法、访谈法,就是访问调查者通过口头交谈等方式向被访问者了解所要的信息,是一种最古老、最普遍的资料收集方法。访问调查一般都是访问者向被访问者做的面对面的直接调查,是通过口头交流的方式获取社会信息的口头调查,是双方互动的过程。访问调查的特点在于:整个访谈过程是访问者与被访问者互相影响、互相作用的过程,调查者可以创造和谐的调查气氛,可以获得较高的应答率。但面访花费的人力、物力、财力较大,也比较费时。 2. 信访 就是通过邮局传递、派人送发等方式将调查问卷交到被调查者手中,由被调查者自行填写,然后再返回调查者。信访的优点是节约人力、物力和财力,但其应答率不如面访高。 3. 电话访问 在发达国家,由于电话的普及率很高,故有许多调查是通过电话完成的,近年来随着我国通讯工具的普及,在城市和发达地区电话访问也越来越多地被采用。它既有面访灵活性的优点、又有信访省力、省时的优点,缺点是在电话普及率较低的不发达地区和农村地区,有时无法实施。 4.自我管理式问卷调查 它按照统一设计的有一定结构的问卷进行调查,由调查者组织调查对象集中发放问卷,而由被调查者自己填答问卷。其优点是调查者可以对问卷进行必要的讲解、调查集中、实施方便、省时、省力。缺点是这种调查要求其对象相对集中在某地,否则不易实施实施。 5.体格检查和实验室检查 现况调查中往往涉及到一些需要经过一定设备进行测量的变量,如身高、体重、血压、血脂、血色素等等,这时就需要做相应的体格检查或实验室检查。 6.敏感问题调查方法 所谓敏感性问题(sensitive problem)是指涉及个人(或单位)的隐私或利益的问题、以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括一些违法或犯罪的行为。敏感性问题在现况调查中经常会遇到,例如人工流产史、婚外性行为、不洁性行为、吸毒、手淫、学生吸烟情况、学生早恋、精神疾病等。敏感问题按其答案的特征可分为两大类:即属性特征敏感问题和数量特征敏感问题。 属性特征敏感问题也称分类特征敏感问题,它被用于了解被调查者是否具有敏感问题的特征,并估计具有敏感问题特征的人在总体中所占的比重,故也可以称为敏感性比例问题。例如是否有吸毒行为?是否有婚外性行为?等等,都是属性特征的敏感问题。这些敏感问题根据其所提供答案的数目又可进一步分为两分类敏感问题和多分类敏感问题,前者是指能把调查人群分为相互排斥、互相独立的两类,答案为2选1,非此即彼,例如:“你是否曾经吸毒?①是,②否”,这就属于两分类属性特征的敏感问题。而多分类敏感问题则把调查人群分为相互排斥、互相独立的多类,答案为多选1,例如,“您的子女对您孝顺吗?①很孝顺,②孝顺,③一般,④不孝顺”,这就是一个多分类敏感问题。 数量特征敏感问题是指被调查者具有敏感问题数额大小的特征,一般是估计敏感问题数值的均数,故也可称为敏感性均值问题。例如“你有几个婚外性伴侣?”,“你一个月吸毒量是多少?”,“你每月的工资外收入有多少?”等等,这些都是数量特征的敏感问题。 对敏感性问题进行调查时,必须采取特殊的、科学可行的方法来提高应答率、降低或消除不真实回答率,以使调查结果真实可靠。随机应答技术(randomized response technique ,RRT)是敏感问题调查中常用的方法之一。RRT是指在调查过程中使用特定的随机化装置,使被调查者以一个预定的基础概率P从两个或两个以上的问题中选择一个问题进行回答,除被调查者本人以外的所有人(包括调查者)均不知道被调查者的回答是针对哪一个问题,以便保护被调查者的隐私,最后根据概率论的知识计算出敏感问题特征在人群中的真实分布情况的一种调查方法。例如在调查学生吸烟情况时,设计外形、大小、颜色等完全一样的卡片N 张,其中N1张卡片上印有:“你是否有过吸烟行为?”,在剩下的N-N1张卡片上印有:“你是否喜欢看NBA的蓝球比赛?”。然后把所有卡片放到一个黑色的布袋中混匀,调查时,由每一个被调查者从袋中任意抽一张卡片,根据卡片上的问题作回答,回答完毕后将卡片放回布袋,这样被调查者回答的是哪一个问题,只有他本人知道,调查者无权过问,从而保护了被调查者的隐私,易于得到被调查者的真实回答。 二、现况调查的种类 (一)普查(censns) 1.概念 普查是指为了了解某病的患病率或健康状况,于特定时间内对特定范围内的人群中每一成员所作的调查或检查。特定时间应该较短,甚至指某时点,一般为1~2天或1~2周,最长不宜超过2~3个月,特定范围可指某一地区或某种特征的人群。 2.目的可因不同的研究工作而异。①为了早期发现和治疗病人(如各地开展宫颈癌的普查),如了解血吸虫病、高血压病、冠心病等的分布,;②为了了解疾病和健康状况的分布而进行的,如对儿童发育、营养的调查等。 3.普查的适用条件有:①有足够的人力、物质和设备用于发现病例和及时治疗。②只有调查目的十分明确,调查项目非常简单,方可采用普查方式。③需有一个权威的高度统一、集中的领导班子,并且有统一部署,统一计划、统一行动的客观条件,方可实施普查;④所普查的疾病患病率较高。⑤需有群众基础,疾病的检验方法操作技术不很复杂,试验的敏感性和特异性均较高。 4.普查的原则:①要有严密的组织和高质量的普查人员队伍;②要有严格的时间要求;③调查项目和指标必须集中统一;④尽可能按一定的周期进行。 5.普查的优缺点 普查的优点:①由于是调查某一人群的所有成员,所以在确定调查对象上比较简单;②所获得的资料全面,可以知道全部调查对象的相关情况,准确性高;③普查所获得的数据对疾病的流行因素研究能有一定的启示。 缺点:①工作量大,花费大,组织工作复杂;②调查内容有限;③易产生重复和遗漏现象;④由于工作量大而可能导致调查的精确度下降,调查质量不易控制。 (二)抽样调查(sampling survey) 1.概念 抽样调查是指从全体被研究对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,以此推论全体被研究对象状况的一种调查。抽样调查的目的是根据调查所得的样本资料估计和推断被调查现象的总体特征,根据抽取样本所调查出的结果可以估计出该人群某病的患病率,或某些特征的情况。它是以少窥多、以小测大、以局部估计全体的调查方法。 2.基本原理 抽样要遵循随机化原则,且样本必须足够大,这样才能获得有代表性样本,通过样本信息推断总体。抽样调查中被研究的全部单位的总和被称为总体或母体,分为二种:有限总体和无限总体。 抽样调查的一般步骤:①界定总体;②选择适当抽样方法;③确定抽样单位,编制抽样框;④确定样本的大小;⑤收集,整理和分析样本资料。 4.抽样调查的优缺点 优点:①它按随机化原则抽取调查单位,以足够数量的调查单位组成的“样本”来代表和说明总体;②节省人力,物力和时间;③以样本推断总体的误差可以事先计算并加以控制;④调查的精确度高。由于其上述众多优点,所以在流行病学调查中占有重要的地位,是最常用的方法。抽样调查可以用于描述疾病的分布、衡量卫生水平、研究影响因素、考核防治效果以及调查质量控制等。 缺点:①它毕竟是一种非全面调查方法,只能提供说明整个总体情况的统计资料,而不能提供说明各级情况的资料;②抽样调查的设计、实施与资料分析比较复杂,存在抽样误差和偏倚,不适用于变异过大的资料;③不适用于发病率过低的疾病等。 5.抽样方法 依照抽样调查的理论依据和特点,可将其分为以下几类。 (1)单纯随机抽样(simple ranom sampling):是最基本的抽样的方法,也是其他抽样方法的基础。它按随机化的原理,直接从含有N个单位的总体中,抽出n个单位作为样本进行调查。这种方法的基本原则是每个抽样单元被抽中选入样本的机会是相等的。 单纯随机抽样首先要有一份所有研究对象排列成序的编号名单,再用抽签、摸球、随机数字法、电子计算机抽取等方法随机选出进入样本的号码,已经入选的号码一般不能再次列入,直到达到预定的样本含量为止。 例如某县有31个乡镇,欲从中抽取3个乡镇作调查,可以先将31个乡镇进行编号(1号~31号),制作31张大小完全相同的纸片,把1~31数字分别写到31张纸片上,然后将纸片揉成球状,全部放入一个纸箱中完全混匀,在任何人都看不见的情况下摸出3个纸团,其上的3个数字所对应的乡镇即为所抽取的样本。 此法的优点是实施简单、易理解;其缺点是抽样范围较大时,工作量太大难以采用,但当抽样比例较小而样本含量较小时,所得样本代表性差。 (2)系统抽样(syetematic sampling):又称机械抽样或等距抽样。它是把总体中的全部调查单位按某一标志排列起来,按固定顺序和间隔抽取样本。例如,拟选一个5%的样本(即抽样比为1/20),可先从1~20之间随机选一个数,设为14,这就是选出的起点,再加上20,得34,34加20得54,……。这样,14,34,54,74,94就是前100号中入选的数字,以后依此类推。 系统抽样优点是简便易行,样本的观察单位在总体中分布均匀,抽样代表性较好,抽样误差与单纯随机抽样相似或略小一些。缺点是如果总体各单元的排列顺序有周期性,则抽取的样本可能有偏倚。比如在某街道以门牌号码的顺序抽取调查对象,大多数街道的门牌号码单数在街道的同一侧,双数号码在另一侧,那么用系统抽样方法时可能出现这样的情况:所抽到的对象均在街道的同一侧,而街道的两侧有许多因素是不同的(如日晒、采光、通风等),如果这些因素对某些疾病的发生有影响,那么抽到的样本的发病情况可能与总体有差异。再比如身份证号码的末位数字男为单数、女为双数,如果以该数字为基础进行系统抽样,那么可能抽到的调查对象均为男性或均为女性。因此必须事先对总体的结构有所了解才能恰当地应用。 (3)分层抽样(stratified sampling):它是把调查总体按一定的标准分为若干类型,然后从每一类中按照相同的或不同的比例随机抽取样本。即先按照某些人口学特征或某些标志(如年龄、性别、住址、职业、教育程度、民族等)将研究人群分为若干组(统计学上称为层),然后从每层抽取一个随机样本。分层抽样又分为两类:一类叫按比例分配分层随机抽样,即各层内抽样比例相同;另一类叫最优分配分层随机抽样(或称不等比例分层随机抽样),即各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本均数或样本率的方差最小。 从分布不均匀的研究人群中抽取有代表性样本的方法。要求层内变异越小越好,层间变异越大越好,因而可以提高每层的精确度,而且便于层间进行比较。 (4)整群抽样(cluster sampling):利用现成的集体,随机地一群一群地抽取集体单位,加以研究,由此推断总体的情况,称为整群抽样。用此法抽样时,抽样单位不是个体而是群体,如居民区、班级、连队、乡、村、县、工厂、学校等。抽到的样本包括若干个群体,对群体内所有个体均进行调查。群体内个体数可以相等,也可以不等。 整群抽样要求群间的变异越小越好,否则抽样误差较大,不能提供总体的可靠信息。 这种方法的优点是便于组织,节约人力、物力,抽样和调查均比较方便,在实际工作中易为群众所接受,因而适合大规模调查。缺点是抽样误差较大,分析工作量也较大。 (5)两级或多级抽样(two-stage or multi-stage sampling):这是大型调查时常用的一种抽样方法。从总体中先抽取范围较大的单元,称为一级抽样单元(例如县、市),再从抽中的一级单元中抽取范围较小的二级单元(如区、街),这就是两级抽样。还可依次再抽取范围更小的单元,即为多级抽样。 多级抽样常与上述各种基本抽样方法结合使用。 5.抽样调查样本大小的确定 (1)确定抽样调查样本大小时应根据以下几点,①考虑总体与个体之间的差异程度,如果研究单位之间的变异较大,样本则要大些,如其间均衡性较好,则样本可以小些;②考虑调查要求达到的精确和可信程度,调查要求的精确度高些,样本量就要大。反之,样本量不必过大;③预计所调查疾病的患病率,如现患率低,则样本量要大。反之,样本可小些;④考虑调查的项目和任务的要求情况;⑤不同的抽样方法,各种抽样方法的抽样误差有差异,所以其样本量的大小各有要求,在此我们仅介绍单纯随机抽样的样本量估计方法。 (2)样本量大小的估计 计量资料样本大小的估计公式:  式中n:样本量大小,α:显著性水平通常取0.05或0.01,t:是指统计学上的t值,当α=0.05时t≈2,S:标准差,d:容许误差,即样本均数与总体均数之差的容许范围。 例1 欲调查肝硬化患者的血色素含量,预定α=0.05,则t≈2,从正常人群的资料查知一般人群的血色素标准差约为3.0g/100ml,调查的容许误差为0.2 g/100ml,则所抽取的样本含量应为多大? 根据题意,t=2,S=3.0g/100ml,d=0.2 g/100ml,则n为: n= t2S2/d2=4×9/0.04=900(人) ②计数资料样本大小估计公式  式中d为容许误差,即样本率与总体均数率之差,是调查设计者根据实际情况规定的。P为预期的某病现患率,Q=1-P,余同上。 例2欲调查我国的肺结核患病率,预定α=0.05,则t≈2,从以往全国结核病流行病学调查的资料获知以往我国的结核病患病率为367/10万,若调查的容许误差定为50/10万,则所抽取的样本含量应为多大? 根据题意,t=2,P=367/10万=0.00367,Q=1-P=0.99633,d=50/10万=0.0005,则n为: n= t2PQ/d2=4×0.00367×0.99633/0.00052=58500(人) 例3某工厂有职工一万余人,现需估计全体职工携带乙型肝炎表面抗原情况。该地区乙型肝炎表面抗原携带率约10%。现采用抽样调查,要求允许误差为0.15P,α=0.05,计算需抽样调查人数。   d=0.15P=0.015   n= t2PQ/d2=4×0.1×0.9/0.0152=1600人 其它抽样方法的样本量和抽样误差的计算公式请查阅相关统计书籍。 第三节 现况调查的实施步骤 在现况调查中所遇到的问题可能是复杂多样,所以现况调查的实施要遵循科学的研究程序,对调查中的每个环节都要进行周密的设计和推敲,只有遵循科学研究共同的规范、程序,调查结果才能被严格地检验、复测。而且只有在按照相同程序的前提下,调查的结果才有可能相互比较,共同的程序提供了比较的准绳。图1来简单反映了现况调查的实施步骤。 确定研究目的 研究设计 图1 现况调查的实施步骤 一、确定研究目的 确定研究目的是现况调查的第一步,也是关键的一步。开展一个现况调查必须首先明确本次研究的目的是为了描述疾病的三间分布,还是要寻找疾病危险因素的线索;是建立有关正常生理生化指标的参考值,还是进行疾病的三早预防;或者是为了评价疾病防治措施的效果。研究目的是整个现况调查的出发点,它对现况调查的各个步骤都有决定性的影响。 确定研究目的需要做许多准备工作,包括查阅文献资料、实地考察、向专家咨询、总结自己的经验等。只有充分地掌握背景资料,了解该问题现有的知识水平,国内、外进展情况,才能阐明该研究的科学性、创新性和可行性,才能估价其社会效益和经济效益。 二、确定研究对象 选择研究对象首先要考虑研究目的。如果研究目的是为了“三早”,则可选择高危人群;如果为了研究某些相关因素与疾病的关联,则要选择暴露人群或职业人群;如果是为了获得疾病的三间分布资料或确定某些生理、生化指标的参考值,则要选择有代表性的人群;如果是为了评价疾病的防治措施的效果,则要选择已实施了该预防或治疗措施的人群。 例如,比较某市不同区的精神疾病患病率,则可从不同区进行抽样。如果对某职业暴露有兴趣,可选择有暴露的工厂的工人与无暴露的工厂的工人,比较其患病率;或选择工厂中有暴露的部分工人与另一部分无暴露的工人比较。 选择研究对象时还要结合实际进行考虑,例如经费来源的多少,是否便于调查等等。如果是相对小的人群,则可包括全部人群;如果不实际或花费太大,则可选择暴露组与非暴露组。 三、确定研究类型和方法 研究类型的确定也要以研究目的为依据。如目的是为了“三早”,则可以选择其高危人群进行普查;如果为了了解调查某病的患病率,则可以采用抽样调查。确定研究类型时,还要考虑现有的人力、物力和财力,权衡利弊后再作决定。 研究方法的确定也应从研究目的出发,结合所收集资料的特殊性,并考虑调查对象的特点和适应性进行选择。如果调查的对象集中、且文化水平较高,则选用自我管理式问卷调查效果较好,并能节省人力、物力和时间;如果所调查的人群电话普及率高,则可以考虑电话采访;如果调查对象极其分散,则信访调查可能比较合适;而如果调查的要求较高,所调查的内容需经被调查者的当面核实,或者调查内容中有现场观察的部分,则选择面访更合适。 在人群中进行现况调查时,可能会涉及到一些需要经过一定设备进行测量的变量,需要做相应的实验室检查,应注意尽量采用简单易行的技术和灵敏度、特异度高的检验方法,这一点在患病率低的疾病的现况调查中尤为重要。如果特异度过低,则会出现大量假阳性者, 四、确定研究变量和制定调查表 (一) 确定研究变量 现况调查的目的确定后,在实施过程中需要进一步具体化,一般来讲研究目的可以通过研究变量来反映。现况调查的研究变量具体可分为疾病指标(包括死亡、发病、现患、伤残、生活质量、疾病负担等),人口学资料(包括姓名、年龄、性别、职业、文化程度、民族、住址)以及相关因素变量(主要是指某些可能与研究疾病相关的特征,例如吸烟、流产、经济收入、饮食习惯、家族史等等)。 (二)调查表的制定 研究变量是通过调查表来具体体现的。调查表又称问卷(questionnaire),是流行病学研究的主要工具,其设计好坏,直接关系到调查的质量与水平,故需精心设计。 问卷的种类 按是否要被调查者自己填答可以分为代填问卷和自填问卷两类。代填问卷是由调查者按照统一设计的问卷向被调查者当面提出问题,然后再由调查者根据被调查者的口头回答来填写。代填问卷多用于面访、电话访问中,故又称访问问卷。 自填问卷的调查者一般不与被调查者直接见面,而由被调查者按照统一设计的有一定结构的调查表自己填答问卷,然后再返回调查者手里,为一种间接的调查。自填问卷可通过调查员直接发放、报刊发行、邮局传递、网络传送等方式交到被调查者手中。 2. 问卷的基本结构 一般来说,一份问卷通常包括:封面信、指导语、问题用答案、编码和其他资料。 (1)封面信:即一封致被调查者的短信,其作用在于向被调查者介绍和说明调查者的身份、调查的目的等内容。封面信的篇幅虽短小,但在整个问卷中却起着重要的作用。一般而言,在封面信中需要说明以下内容:调查的主办单位或个人的身份;调查的内容和范围;调查的目的;调查对象的选取方法和调查结果保密的措施。除此,有的问卷通常还把填答问卷的方法、要求、回收问卷的方式和时间等等具体事项写进封面信中。在信的结尾处还要向被调查者表示感谢。封面信的文笔要简明、亲切、谦虚、诚恳,切忌罗嗦。 (2)指导语:即用来指导调查者如何正确填答,指导访问员如何正确完成问卷调查工作的一组陈述,好比一部新机器的说明书。指导语有卷头指导语和卷中指导语之别。卷头指导语一般以“填表说明”的形式出现在封面信之后,正式调查问题之前。其作用是对填表的要求、方法、注意事项等作一个总的说明。下面就是这种填表说明的一个例子: 填表说明 1、请在每一问题后适合你自己情况的答案序号上画圈,或在 处填上适当的内容。 2、问卷每页左边的数码用短横线——是上计算机用的,你不必填写。 3、如无特殊说明,每一问题只能选择一个答案。 4、填答问卷时请不要与他人商量。 ?卷中的指导语一般是针对某些较特殊的问题所做出的特定指示。如“可选多个答案”、“请按重要程度排列”、“若不是,请跳过10~14题,直接从15题开始答起”等。总之,问卷中每一个有可能使回答者不清楚、不明白、难以理解的地方,一切有可能成为回答者填答问卷障碍的地方,都需要给予某种指导,而对于编写指导语来说,最主要的标准,就是要简明易懂。 (3)问题和答案:问题和答案是问卷的主体,可以说,被调查者的各种情况正是通过问题和答案来收集的。问卷中的问题在形式上可分为开放形式和封闭形式两大类;在内容上又可分为有关事实的、有关态度的和有关个人背景资料的三大类。 所谓开放式问题,就是不为回答者提供具体的答案,而是由回答者自由回答的问题。如“你喜欢哪一类的书籍?” ,“你对学校实行学分制是如何认识的?”等。开放式问题的优点是它能使回答者充分按照自己的方式和自己的想法回答问题,而不受什么限制,所得到的资料往往比封闭形式问题所得资料要丰富和生动得多。缺点是:①它要求回答者要有较高的知识水平和文字表达能力,这就大大限制了调查的范围和对象;②它要求回答者花费较多的时间和精力;③所获得的资料难于处理和进行定量分析。 所谓封闭式问题,就是在提出问题的同时,还给出若干个可能的答案,供回答者根据自己的实际情况从中选择一个作为回答。封闭式问题的缺点是①由于封闭式问题已为回答者提供了可供选择的答案,所以实际上也就限制了回答者回答的范围和回答的方式,因此,封闭式问题所得到的资料往往失去了开放式问题所得资料中所表现出来的那种自发性和表现力;②回答者在回答中的偏误难以发现。由于在封闭式问题中,回答者所做的事件只是在某个答案上打一记号,如划圈、打勾等,因此那些由于笔误打错的或由于心理压力而故意错打的,甚至由于不明题意乱打的记号往往难以发觉,从而影响到调查结果的准确性和真实性。优点是:①回答者填写问卷十分方便,对文字表达能力也无特殊的要求,因此回答者完成问卷十分容易,所需的时间和精力也较少;②封闭式问题所得的资料十分集中,而且特别便于进行统计处理和定量分析。 (4)编码和其他资料:所谓编码就是赋予每一个问题及其答案一个数字作为它的代码,便于计算机处理,常在每项数据后留出编码用方框,以便于编码输入。除了编码以外,有些问卷还需要在封面上写上访问员姓名、问卷发放及回收日期、审核员姓名、被调查者居住地等有关资料等等。 3.问卷设计的具体方法 (1)问题设计的基本要求:①问题应具体、明确,不能是抽象、笼统的问题;②避免复合性或双重含义问题,比如“您吸烟喝酒吗?” ,“您父母吸烟吗?” 这些问题中其实包含了两个或两个以上的问题,是应答者难以回答;③问题必须适合被调查者的特点、回答的能力,尽量做到通俗易懂,避免应用专业术语或冷僻的词汇。比如“您是否感到心悸?” ,有一些人不知心悸为何物,故无法作出正确的回答;④避免带有倾向性和诱导性的问题;⑤不要直接提出敏感性或具有威胁性的问题,要考虑回答者如实回答的可能性;⑥问题的用词要准确,而不要使用模棱两可、含混不清或容易产生歧义的词或概念;⑦必须围绕调查课题和研究假设选择最必要的问题,通俗地讲就是“有用的问题一个不漏,无关的问题一个不多”;⑧问题要尽量简短。 (2)问题的数目和结构:问题数目的多少,决定着整个问卷的长短。一份问卷究竟应该包含多少个问题合适,主要依据研究的内容、样本的性质、分析的方法、拥有的人力、财力等多种因素而定,没有统一的标准。但总的来说,问卷不宜太长,问题也不宜太多,一般以回答者能在30分钟内完成为宜。问题太长,容易引起回答者的厌烦情绪,从而影响填答的质量和回收率。 问题的结构即问题的排列组合方式。一般来说,问题的排列要便于被调查者顺利回答问题,便于调查后资料的整理和分析。注意事项如下:①按问题的性质或类别排列,即把同类性质的问题安排在一起,而不要让同类别的问题互相混杂。②按问题的复杂程度或困难程度排列。如先易后难,由浅入深;先事实、行为问题,后观念、情感问题;先一般性质问题,后特殊性质问题等。③按问题的时间顺序排列。④封闭式问题放要前,开放式问题放在问卷的结尾部分。⑤按一定的逻辑顺序排列问题。⑥被调查者熟悉、简单易懂的问题放在前,比较生疏、较难回答的问题放在后面。⑦能引起调查者兴趣的问题放在前,把容易使调查者紧张和顾虑的问题放在后面。 (3)问题的形式 ① 填空式 这种形式常用于较简单的问题。如你家有 口人,你有_______个孩子,等。 ② 是否式 这种问题的答案只有肯定与否定两种,回答者根据自己的情况择其中之一。如:你是待业青年吗?是 □ 否 □。  ③ 多项式 即给出的答案至少在两个以上,由回答者择其中之一或二回答。这是问卷调查中采用最多的的一种形式。 例.您的婚姻状况(请在合适的答案号码上划圈) A 未婚  B 已婚  C 离婚  D 丧偶  E 其他 ④当询问若干个具有相同答案形式的问题时,可以将其设计成矩阵形式。这种形式的优点是节省空间,使问卷显得紧凑。同时,由于同类问题集中在一起,回答方式也相同,因而也节省了回答者阅读和填答的时间。如: 您认为下列环境问题在您居住的城市里严重程度如何(在每一行适当的方框内打上√)         很严重    比较严重   不太严重   不严重   不知道 (1)噪音      囗      囗      囗     囗     囗 (2)烟尘     囗      囗      囗     囗     囗 (3)污水     囗      囗      囗     囗     囗 (4)垃圾     囗      囗      囗     囗     囗 (5)有害气体   囗      囗      囗     囗     囗 (6)塑料废品   囗      囗      囗     囗     囗 ? ⑤ 表格式 这种形式与矩阵式十分相似,即将上述例子变成表格形式如下: 表1 居住地环境问题的严重程度 环境问题种类 很严重 比较严重 不太严重 不严重 不知道  噪音       烟尘       污水       垃圾       有害气体       塑料废品       ?表格形式的问题除了具有矩阵式的特点外,还显得更为整齐、醒目。不过,二者虽然简明、集中,但都容易使人产生呆板、单调的感觉,故不宜过多使用。 ⑥ 后续性回答或相倚性问题 这类问题是为了防止出现一个问题仅与少部分回答者有关,而大部分都回答“不知道”或“不适合于本人”的情况而设计的。前面的那个问题叫过滤问题或筛选问题。回答者是否应该回答后面的相倚性问题,要视其对前面的过滤问题或筛选问题的回答而定。这种问题的格式要注意:一是它要用方框与过滤问题隔开;二是要用箭头将相倚问题方框与过滤问题中的适当答案联在一起,以表明回答这一答案的那部分回答者才继续回答方框中的问题,回答其他答案的人则不回答方框中的问题,而只须继续往下填答。 ? 例:您有孩子吗? ①有   。 ②无   。 ?    A 有几个孩子   。      B 有几个孩子与您生活在一起   。   ⑦ 半封闭半开放问卷形式。 封闭式问题有许多优点,它的答案是已经设计好的、标准化的,这不仅有利于被调查者正确理解问题和回答问题,节约回答问题的时间,提高问卷的回复率和有效率,而且有利于对回答的结果进行编码、统计分析和定量研究。其缺点首先是设计较困难,尤其是一些比较复杂、回答类型较多或不太清楚的问题,很难把答案设计周全。如答案设计有缺陷,就会影响到被调查者对问题的正确理解和回答;其次是封闭式问题的回答问题的方式较机械,没有弹性,难以适应比较复杂的情况,也难以发挥被调查者的主观能动性;最后是它的填写较容易,被调查者对一些不懂或不清楚,甚至根本不了解的问题可能会任意填写,从而降低回答的真实性和可靠性。 为了克服封闭式问题的缺陷,吸取开放式问卷的优点,于是出现了半封闭半开放问卷形式。 例:您认为人工流产对人体有害吗?(请在适当的空格内打上√) ①有害 囗    ②无害 囗    ③说不清 囗 ? 如您认为有害,请举例说明                      ? (4)答案的设计:答案是封闭式问题中非常重要的一半。如何列举答案,关系到回答者是否能够回答,是否容易回答,还关系到问卷资料价值的大小。因此,设计答案时应注意以下几个方面的问题:①答案的设计应符合实际情况,要根据研究的需要来确定变量的测量层次;②首先要保证答案的穷尽性和互斥性。所谓穷尽性是答案包括了所有可能的情况,不能有遗漏;所谓的互斥性,是指答案相互之间不能相互重叠或相互包含;③答案只能按一个标准分类;④程度式答案应按一定的顺序排列,前后须对称,注意等级答案的明确性;⑤当答案太多时,除了选择几个主要的答案列出外,然后再加上“其他”,以便回答时能将其他未列出的答案归于其中。 一般地说,一个完善的调查表并不是一次就可以拟定的。如有可能,最好做几次包括设计人员参加的预调查,经试用和修改方可日臻完善。 五、资料的收集 1.掌握有关的背景资料 现况调查最基本内容是调查被研究对象有无某种疾病或特征,并尽可能分级或定量。此外还须收集一些其他的数据,以便说明分布状况和控制混杂因子的作用。分析性的现况调查以研究病因为目的,所以还须调查对某些可疑危险因子的暴露情况。收集有关资料应包括下列几方面:①个人的基本情况:年龄(出生日期)、性别、文化程度、婚姻状况、家庭人数及组成、家庭经济状况等;②职业情况:具体工作性质、职务、从事该工作年限;③生活习惯及保健情况:饮食情况、吸烟历史及量、饮酒历史及量、个人对自我保健重视及开展情况、医疗保健条件、身体锻炼情况;④妇女月经史及生育情况:调查某些疾病常须收集月经史、生育史、使用避孕药及激素的情况;⑤环境、气象资料:有时须收集生活环境和工作环境的某些数据,最好用数量指标表示;⑥人口资料:由于需要计算各种率,故应收集抽样总体的人口数、分组人口数等。 2.疾病测量 在人群中进行现况调查时,应尽量采用简单、易行的技术和灵敏度高的方法。同时需注意检验结果中的假阳性,特别是患病率较低的疾病进行现况调查时尤为重要。例如,用甲胎蛋白(AFP)方法检测肝癌,该方法的灵敏度与特异度均为99%,其假阳性率为1%。假定调查人群肝癌患病率为5/10万,也即调查10万人有5名病人,而同时在其余99 995名中检出假阳性病人999.95人,即1 000人。这时,如不能鉴别5例病人和1 000例假阳性病人,就会误认为患病率为1 000/10万或1%。由此可见,一些检测手段在临床上诊断疾病的准确性极高,但在人群中通过现况调查研究发现病人与在医院中诊断病人是性质不同的两件事。 对疾病必须首先建立严格的诊断标准,诊断标准要利于不同地区的比较。调查表、体检或一些特殊检查常联合应用。如果可能,应测定疾病首次症状发作的时间。但有时由于疾病是逐渐发生难于确定具体发作时点,或直到现况调查时才知道疾病存在。 对有恶化期或缓解期的疾病,重要的是询问现在没有症状或体征的人过去是否曾有过症状。虽然调查者或许不能据此肯定他们是否有病,但可以考虑他们可能有病或分析时将他们分开分析。 3.暴露测量 暴露又称变量即我们所研究的因素,研究对象所具有的特征,所发生的事件。暴露并不仅限于与研究对象有关的外界因素,同时也包括机体内部的因素如遗传因素、内分泌因素和精神因素等。暴露必须有明确的定义和测量尺度,应尽量采用定量或半定量尺度和客观的指标,如可以用调查表、记录、实验室检查、体检和其他手段来测量暴露,了解暴露于某些因素多长时间,什么时候暴露很重要。例如调查者常想知道是否吸烟时间越长,疾病患病率越高。 4.对调查员的要求 对调查员的最基本要求是实事求是的科学工作态度和高度的责任心。调查员要有一定的文化水平,但是并非医学水平越高的人越适于做调查工作。相反,有医学知识的人容易掺入自己的假设和看法,调查时有时由于诱导性地提问题而产生信息上的偏倚。从这个意义上讲,非医务人员调查时可能更客观。在进行现况调查前对调查员应经过严格的培训和考核后再决定取舍。 六、资料的整理、分析及结果解释 (一) 资料的整理 现况调查结束后首先应对原始资料逐项进行检查与核对,以提高原始资料的准确性、完整性,同时应填补缺漏、删去重复,纠正错误等,以免影响调查质量。接下来按照卫生统计有关技术规定及流行病学需要来整理原始资料,如组的划分、整理表的拟订,以便进一步分析计算。 随着计算机的普及应用,一般现况调查的资料都需应用计算机处理,因此还需要建立相应的数据库,将原始资料录入计算机,在输入计算机时尽可能用专业人员双轨录入数据,并科学应用某些软件中的数据录入核对功能(如Epi Info软件的核对模块)。 (二) 资料分析 1. 常用的分析指标:患病率是横断面研究的最基本的分析指标,患病率的计算方法已在前一章中阐述,此处不再重复,需要注意的是在进行现况调查的资料分析时,为了便于不同地区的比较,常采用率的标准化方法(标化率)。 在现况调查中对于某些诊断时间明确的慢性病或有明显症状、短时间不会遗忘的疾病也可以计算发病率或死亡率,另外,两次重复的现况调查也可计算发病率。 除患病率外,现况调查中还常用到感染率、病原携带率、抗体阳性率、某因素的流行率(如吸烟率)等指标,这些率的计算方法与患病率相似。此外还可能用到一些比、构成比等指标,如性别比、年龄构成等。 在计算出上述的各种率以后,还要计算率的标准差(即标准误),以估计率的抽样误差。 对于调查中获得的定量数据,如身高、体重、年龄、肺活量、血色素等,可计算出平均数、标准差等指标。 2. 分析方法: (1)描述分布:将疾病的现况调查资料按不同的人口学特征和时间、地区、某种生活习惯等方面加以整理,并计算疾病的发病率、患病率和死亡率等,以观察疾病在不同的人群、时间、地区上的分布特征,此即疾病的三间分布。 (2)相关分析:相关分析是描述一个变量随另一个变量的变化而发生线性变化的关系,相关分析适用于双变量正态分布资料或等级资料,如体重与肺活量之间的相关分析。 (3)单因素对比分析:对于二分类变量(如是否患高血压、是否吸烟)的资料,可以分析对比患病与未患病组之间某因素阳性率的差异(例如高血压组与非高血压组的吸烟率差异),分析两者是否存在关联。也可以反过来比较有无某因素组的患病率差异(例如吸烟组与非吸烟组的高血压患病率差异)。 例4某现况调查共抽取12013名调查对象,其中患高血压者1349人患高血压,吸烟者3477人,其中患高血压的吸烟者465人,而未患高血压的吸烟者3012人,试对上述现况调查结果进行分析。 针对上述现况调查资料可作如下分析: ① 高血压患病率:1349/12013=11.23%; ② 人群的吸烟率:3477/12013=28.94% ③ 高血压者吸烟率:465/1349=34.47% 未患高血压者吸烟率:3012/(12013-1349)=28.24% ④单因素对比分析: 将上述资料整理成下面的表格 表2. 高血压组与非高血压组的吸烟率差异 吸烟 高血压 合计   有 无   有 465(a) 3012(b) 3477  无 884(c) 7652(d) 8536  合计 1349 10664 12013(n)   计算值  = (465*7652-3012*884)2*12013/3477*8536*1349*10664 = 22.57 值>6.63,P<0.01,表明高血压组与非高血压组的吸烟率差异有显著意义,高血压组的吸烟率明显高于非高血压组,提示吸烟可能与高血压的发生存在关联。注意:①这里是现况调查结果,不能得出吸烟为高血压的危险因素的结论,只能提供高血压危险因素的线索,供进一步流行病学研究参考。②率的差异性还可以用二项分布或Poisson分布作检验,此处从略。 (4)多因素分析: 在单因素分析的基础上,可进一步用多因素分析(多元线性回归、logistic回归等)的方法进行分析,例如可以用logistic回归分析高血压与体重、吸烟、性别、年龄、血脂等因素的关系。 (三)结果的解释 现况调查的最后必须对调查结果进行解释讨论。一般先应表明样本的代表性,应答率等情况。然后要估计分析调查中有无偏倚及其来源、大小、方向和调整方法。最后归纳疾病分布规律的正确性及提供病因线索。 现况调查若为了查明疾病分布,可根据“三间”分布特征的结果,结合有关因素进行解释。 若是利用现况调查来提供病因线索,则可把研究对象分为病例与非病例,从而比较两者的某些特征和某些因素在病例与非病例组间的差异。要注意:现况调查一般只能为进一步的流行病学研究(如定群研究及病例对照研究等)提供病因线索,不能作因果联系分析。 七、现况调查的质量控制 为了保证现况调查的质量,必须在调查实施过程中进行质量控制,主要质控措施有:①样本选取必须随机化;②应答率一般应高于80%~90%;③进行预调查;④统一培训调查员;⑤调查或检查方法标准化且前后一致;⑥控制偏倚;⑦调查后复检(一般复检10%)等。 第四节 现况调查中的偏倚及其控制 影响现况调查资料准确性的有抽样误差和偏倚。抽样误差是不可避免的,但可以测量其误差大小和评价,且可以通过样本大小和抽样设计来适当控制。流行病学研究中的偏倚(bias),是指在流行病学调查研究设计或实施阶段,由于某些因素的影响,使得研究或推论的结果不符合真实的情况,或指在研究或推论过程中所获得的结果系统地偏离其真实值。偏倚属于系统误差,应设法防止其产生。偏倚造成的结果与真实值间的差异具有方向性,它可以发生在高于真实值的方向(正偏倚),也可发生在低于真实值的方向(负偏倚)。 (一)现况调查中产生偏倚的种类 1. 选择偏倚(selection bias)指研究者在选择研究人群时由于选择条件受限制或设计失误所致的系统误差。 (1)无应答偏倚:调查对象不合作或因种种原因不能或不愿意参加,由于其身体素质、暴露状况、患病情况、嗜好等可能与应答者不同,由此产生的偏倚称为无应答偏倚。如应答率低于10%就较难以调查结果来估计整个研究人群的现况。 (2)选择性偏倚:在调查过程中,被抽中的调查对象没有找到,而随便找了其他人代替,从而可能破坏了调查对象的同质性。 (3)幸存者偏倚:在现况调查中,调查对象均为幸存者,无法调查死亡者,因此不能概括某病的实际现况,带有一定局限性和片面性。 2.信息偏倚(information bias)指在收集和整理有关暴露或疾病资料时所出现的系统误差,主要发生在观察、收集资料及测量等实施阶段。 (1)调查对象所引起的偏倚:询问调查对象有关个人疾病史、个人生活习惯、经济状况等,由于种种原因,回答不准确,从而引起偏性,称之为报告偏性。另外病人因受疾病的折磨,故能回忆过去暴露史,而健康的调查对象常不介意过去的暴露史而将其遗忘,这种偏倚称为回忆偏倚。 (2)调查员偏倚:调查员有意识地深入调查某些人群或具有某种特征者,而比较马虎地调查另一些人群或不具备某些特征者,如对肺癌患者调查员再三追问其吸烟史,而对健康者则不然。这些情况可引起结果的偏倚。 (3)测量偏倚:是指测量工具、检验方法不准确,化验技术操作不规范等,或工作粗枝大叶而造成的偏倚。 (二) 防止产生偏倚的措施: 1. 随机化:在抽取调查对象时,必须严格遵守随机化原则,使研究对象都有等同的概率(同等的机会)被分配到各处理组中,从而使潜在的混杂因素,可测量或不可测量及无法预知的非处理因素(非研究因素)在各组间分布均衡。另外样本大小要适当。 2.提高应答率:采取各种措施,提高抽中对象的应答率。对于不应答者最好要追踪调查,一般要求应答率达到90%以上。另外在分析时还要分析不应答者的特征和原因。 3. 控制测量偏倚:选用不易产生偏差的仪器、设备,仪器使用前要进行校正。诊断标准、排除标准、纳入标准必须统一。 4.培训调查员:在调查前必须对调查员进行系统、科学的培训,并组织调查员开展互相监督和复查工作。