描述性研究
( Descriptive Study)
许林勇
概念及分类
? 概念
? 根据日常记录资料和通过特殊调查所得到的
资料,描述疾病的三间分布特征,设计时无
需设立对照,不能分析暴露与效应之间的联
系。
? 分类
? 横断面研究(现况研究)
? 纵向研究
? 生态学研究(关系研究)
第一节、现况研究概述
现况研究的概念
? 现况研究是流行病学研究方法中的一种基础性
研究方法。它是按照事先设计的要求在某一人
群应用普查或抽样调查的方法收集特定时间内
疾病的描述性资料,以描述疾病的分布及观察
某些因素与疾病之间的关联。
现况研究目的
? 1,描述疾病或健康状况分布情况及影响分布的
因素;
? 2,寻找病因及流行因素线索;
? 3,进行疾病监测并为评价防治措施的效果提供
参考信息;
? 4,调查与决定高危人群, 从而为卫生保健工作
的计划和决策提供依据;
? 5,达到早期发现病人, 早期筛检和早期治疗的
第二级预防的目的;
? 6,确定各项生理指标和正常参考值范围 。
现况研究的特点
? 1、现况研究在开始时一般不设对照组
? 2、现况研究的特定时点或时期
? 3、现况研究在确定因果联系时受到限制
? 4、对不会发生改变的暴露因素,可以作
因果推论
? 5、现况研究用现在的暴露(特征)来替
代或估计过去情况的条件
? 6、现况研究定期重复可获得发病率资料
普查( census)
?概念:
在特定时点或时期、特定范
围内的全部人群(总体)均为研
究对象的调查。
普查( census)
? 优点,
确定调查对象简单
可以准确了解疾病的三间分布
? 缺点,
漏查难免
调查质量不易控制
对于患病率低,诊断技术复杂的疾病不宜进行
普查
抽样调查
? ( sampliingsurvey)
? 1.概念 指从研究对象的总体中随机
抽取有代表性的部分样本进行调查,从
样本获得的信息来推断总体情况。它是
以小测大,以样本统计量估计总体参数
的调查研究方法。
抽样调查的优缺点
? 优点
节省财力, 物力和时间
能够增加准确度
提高应答率
? 缺点
调查对象的选择比较麻烦
存在抽样误差和系统误差
第二节、现况研究的设计与实施
? 一、明确研究目的和研究类型
? 二、确定研究的对象
? 三、样本含量和抽样方法
样本大小的确定
? n=PQ/S2=t2PQ/d2 (S=d/t)
当 d=0.1P n =400 Q/P
当 d=0.15P n =178 Q/P
? 此公式适用于二项分布, 阳性率在 5%以
上, 最好在 20%以下, 超过此范围不适用,
如果阳性率太低, 则用 poisson分布期望值
可信限表 。
?
?
? 计算实例:某工厂有职工一万余人, 现
需估计全体职工携带乙型肝炎表面抗原
情况 。 该地区乙型肝炎表面抗原携带率
约 10%。 现采用抽样调查, 要求允许误
差为 0.15P,计算需抽样调查人数 。
? 根据题意, N=178× 0.9/0.1=1602人
2
4 ?
?
??
?
??
?
sN
某防疫站拟调查了解该地成人白细胞数是否偏低,
若用抽样调查,样本含量至少应为多少人?
4 0 0
1 0 0
1 0 0 044
2
2
2
2
?
?
??
d
s
n 人
样本量大小
n=PQ/S2=t2PQ/d2=400*Q/P (S=d/t)
n=4s2/d2
取决于以下因素,
1,患病率
2.对调查结果精确度的要求
3.研究单位间的均衡性
4.检验水准
5.把握度
5.抽样方法
?
)1( ??
抽样方法
抽样调查应遵循随机化的原理,随机抽
样的方法有以下几种:
? 单纯随机抽样 (simple random sampling)
? 系统抽样 (systematic sampling )
? 分层抽样 (stratified sampling)
? 整群抽样 (cluster sampling )
? 多级抽样 (multistage sampling)
四、资料收集
? 调查表设计 (研究项目有哪些? )
( 1) 标题:
( 2) 一般项目:通常, 它包括姓名, 住址, 联
系电话, 性别, 出生年月或年龄, 婚姻状况,
职业, 文化程度等
( 3) 研究项目, 主要指的是由标题所确定的调
查主题范围内的特色项目, 在流行病学调查中
通常指的是疾病及其相关危险因素 。
( 4) 签名档和调查日期备忘
调查表设计
? 设计的步骤
? 注意的问题:
1、调查表上问题的排列
2、调查表上问句的措词
3、表式
4、应有核实被调查这回答问题正确性的
项目
5、时间记录
6、预试( pilot study)
调查表设计
? 1、定义研究变量
? 2、设定测量尺度
调查员
五、资料整理分析和结果解释
? (一)资料整理分析
(按照不同特征分组,比较各组的患病率)
? (二)结果解释
七、常见偏倚
( 一 ) 选择偏倚
? 1,**选择性偏倚:在调查过程中, 被抽中的
调查对象没有找到, 而随便找了其他人代替,
从而破坏了调查对象的代表性, 导致研究结果
与真实结果之间产生差异 。
? 2,**无应答引起的偏倚 ( nonresponse bias)
? 3,幸存者偏倚:在现况研究中, 调查对象均
为幸存者, 无法调查死亡者, 因此不能概括某
病的实际现况 。
? 4,志愿者偏倚
(二)信息偏倚
? 1,回忆偏倚:由于对既往事实记忆缺失导致
回忆不准确所引起的偏倚
? 2,报告偏倚:由于调查者自身不愿意提供
敏感的真实情况而引起的偏倚 。
? 3,**观察者偏倚:观察者间变异, 观察者
自身变异
? 4,**测量偏倚:测量仪器, 检测试剂等本
身不准确导致的偏倚
? 5.预期偏倚:调查者在调查时希望获得预
期的结果,因而有意或无意地选择性收集材料
导致偏倚。
质量控制
? 1、确保抽样过程的随机化原则的完全实
施;
? 2、提高研究对象的依从性和受检率;
? 3、正确选择测量工具和检测方法,包括
调查表的编制等;
? 4、组织好研究工作,统一方法;
? 5、作好资料的复查、复核等工作;
? 6、选择正确的统计方法。
生态学研究 ( ecological studies)
? 它是在群体水平上研究因素与疾病之间
的关系, 即以群体为观察, 分析单位,
通过描述不同人群中某因素的暴露情况
与疾病的频率, 分析该因素与疾病的关
系 。 从医学的角度上看则是研究人群的
生活方式与生存条件对健康 ( 疾病 ) 的
影响 。
生态学研究的方法 ( 图见下张 )
? 1, 生态比较研究 ( ecological comparision
study):比较不同人群中某疾病或健康状态,
他们的疾病率或死亡率的差别, 以了解某疾病
或健康状态在不同人群中分布有无异同点 。 从
而探索该现象产生的原因, 找到值得进一步深
入研究的线索 。
? 2,生态趋势研究 (ecological trend study):指连
续观察不同人群中某疾病或健康状态的发生率
和死亡率, 了解其变动趋势 。
生态学研究的应用
1,可应用现成资料和常规资料进行研究,
因而省时间, 人力, 物力;
2,可以从群体角度提供病因假设的线索;
3,适合于对人群干预措施的评价;
4,在疾病监测工作中, 应用生态趋势研究
可估计某种疾病发展的趋势 。
生态学研究的局限性
? 1、生态学谬误
? 2、难以确定两变量之间的因果关系
生态学研究不能计算发病率, 其证明病
因的作用较弱 。
生态学谬误 ( ecological fallacy)
? 生态学研究发现的某因素与某疾病的一致性,
可能是两者间的真正联系, 也可能是两者间毫
无关系 。 这种得出虚假联系的情况称为生态学
谬误 ( ecological fallacy),原因主要有:
? 由于以群体的平均或代理资料代替个体暴露量,
所得到的暴露与实际情况有误差 。
? 由于研究单位是群体而非个体, 无法得知个体
暴露与效应之间的关系, 从而得到的联系为虚
假联系 。
? 由于混杂因素干扰, 得到的联系为虚假联系 。
? 和疾病仅存在统计学关联, 而没有因果联系 。
生态学研究小结
? 生态学是研究人群与其环境关系的科学, 这里
应用于流行病学研究, 要注意观察单位是人群
而非个体 。
? 其优点是方便易行, 分析的技巧不复杂, 但是
在进行生物学推断时难以解释 。
? 注意生态学谬误 —— 用代理资料或平均资料来
代替个体资料并不准确;分析时运用加权回归
的方法;要控制混杂因子, 分析时运用分层分
析及多因素分析法 。
( Descriptive Study)
许林勇
概念及分类
? 概念
? 根据日常记录资料和通过特殊调查所得到的
资料,描述疾病的三间分布特征,设计时无
需设立对照,不能分析暴露与效应之间的联
系。
? 分类
? 横断面研究(现况研究)
? 纵向研究
? 生态学研究(关系研究)
第一节、现况研究概述
现况研究的概念
? 现况研究是流行病学研究方法中的一种基础性
研究方法。它是按照事先设计的要求在某一人
群应用普查或抽样调查的方法收集特定时间内
疾病的描述性资料,以描述疾病的分布及观察
某些因素与疾病之间的关联。
现况研究目的
? 1,描述疾病或健康状况分布情况及影响分布的
因素;
? 2,寻找病因及流行因素线索;
? 3,进行疾病监测并为评价防治措施的效果提供
参考信息;
? 4,调查与决定高危人群, 从而为卫生保健工作
的计划和决策提供依据;
? 5,达到早期发现病人, 早期筛检和早期治疗的
第二级预防的目的;
? 6,确定各项生理指标和正常参考值范围 。
现况研究的特点
? 1、现况研究在开始时一般不设对照组
? 2、现况研究的特定时点或时期
? 3、现况研究在确定因果联系时受到限制
? 4、对不会发生改变的暴露因素,可以作
因果推论
? 5、现况研究用现在的暴露(特征)来替
代或估计过去情况的条件
? 6、现况研究定期重复可获得发病率资料
普查( census)
?概念:
在特定时点或时期、特定范
围内的全部人群(总体)均为研
究对象的调查。
普查( census)
? 优点,
确定调查对象简单
可以准确了解疾病的三间分布
? 缺点,
漏查难免
调查质量不易控制
对于患病率低,诊断技术复杂的疾病不宜进行
普查
抽样调查
? ( sampliingsurvey)
? 1.概念 指从研究对象的总体中随机
抽取有代表性的部分样本进行调查,从
样本获得的信息来推断总体情况。它是
以小测大,以样本统计量估计总体参数
的调查研究方法。
抽样调查的优缺点
? 优点
节省财力, 物力和时间
能够增加准确度
提高应答率
? 缺点
调查对象的选择比较麻烦
存在抽样误差和系统误差
第二节、现况研究的设计与实施
? 一、明确研究目的和研究类型
? 二、确定研究的对象
? 三、样本含量和抽样方法
样本大小的确定
? n=PQ/S2=t2PQ/d2 (S=d/t)
当 d=0.1P n =400 Q/P
当 d=0.15P n =178 Q/P
? 此公式适用于二项分布, 阳性率在 5%以
上, 最好在 20%以下, 超过此范围不适用,
如果阳性率太低, 则用 poisson分布期望值
可信限表 。
?
?
? 计算实例:某工厂有职工一万余人, 现
需估计全体职工携带乙型肝炎表面抗原
情况 。 该地区乙型肝炎表面抗原携带率
约 10%。 现采用抽样调查, 要求允许误
差为 0.15P,计算需抽样调查人数 。
? 根据题意, N=178× 0.9/0.1=1602人
2
4 ?
?
??
?
??
?
sN
某防疫站拟调查了解该地成人白细胞数是否偏低,
若用抽样调查,样本含量至少应为多少人?
4 0 0
1 0 0
1 0 0 044
2
2
2
2
?
?
??
d
s
n 人
样本量大小
n=PQ/S2=t2PQ/d2=400*Q/P (S=d/t)
n=4s2/d2
取决于以下因素,
1,患病率
2.对调查结果精确度的要求
3.研究单位间的均衡性
4.检验水准
5.把握度
5.抽样方法
?
)1( ??
抽样方法
抽样调查应遵循随机化的原理,随机抽
样的方法有以下几种:
? 单纯随机抽样 (simple random sampling)
? 系统抽样 (systematic sampling )
? 分层抽样 (stratified sampling)
? 整群抽样 (cluster sampling )
? 多级抽样 (multistage sampling)
四、资料收集
? 调查表设计 (研究项目有哪些? )
( 1) 标题:
( 2) 一般项目:通常, 它包括姓名, 住址, 联
系电话, 性别, 出生年月或年龄, 婚姻状况,
职业, 文化程度等
( 3) 研究项目, 主要指的是由标题所确定的调
查主题范围内的特色项目, 在流行病学调查中
通常指的是疾病及其相关危险因素 。
( 4) 签名档和调查日期备忘
调查表设计
? 设计的步骤
? 注意的问题:
1、调查表上问题的排列
2、调查表上问句的措词
3、表式
4、应有核实被调查这回答问题正确性的
项目
5、时间记录
6、预试( pilot study)
调查表设计
? 1、定义研究变量
? 2、设定测量尺度
调查员
五、资料整理分析和结果解释
? (一)资料整理分析
(按照不同特征分组,比较各组的患病率)
? (二)结果解释
七、常见偏倚
( 一 ) 选择偏倚
? 1,**选择性偏倚:在调查过程中, 被抽中的
调查对象没有找到, 而随便找了其他人代替,
从而破坏了调查对象的代表性, 导致研究结果
与真实结果之间产生差异 。
? 2,**无应答引起的偏倚 ( nonresponse bias)
? 3,幸存者偏倚:在现况研究中, 调查对象均
为幸存者, 无法调查死亡者, 因此不能概括某
病的实际现况 。
? 4,志愿者偏倚
(二)信息偏倚
? 1,回忆偏倚:由于对既往事实记忆缺失导致
回忆不准确所引起的偏倚
? 2,报告偏倚:由于调查者自身不愿意提供
敏感的真实情况而引起的偏倚 。
? 3,**观察者偏倚:观察者间变异, 观察者
自身变异
? 4,**测量偏倚:测量仪器, 检测试剂等本
身不准确导致的偏倚
? 5.预期偏倚:调查者在调查时希望获得预
期的结果,因而有意或无意地选择性收集材料
导致偏倚。
质量控制
? 1、确保抽样过程的随机化原则的完全实
施;
? 2、提高研究对象的依从性和受检率;
? 3、正确选择测量工具和检测方法,包括
调查表的编制等;
? 4、组织好研究工作,统一方法;
? 5、作好资料的复查、复核等工作;
? 6、选择正确的统计方法。
生态学研究 ( ecological studies)
? 它是在群体水平上研究因素与疾病之间
的关系, 即以群体为观察, 分析单位,
通过描述不同人群中某因素的暴露情况
与疾病的频率, 分析该因素与疾病的关
系 。 从医学的角度上看则是研究人群的
生活方式与生存条件对健康 ( 疾病 ) 的
影响 。
生态学研究的方法 ( 图见下张 )
? 1, 生态比较研究 ( ecological comparision
study):比较不同人群中某疾病或健康状态,
他们的疾病率或死亡率的差别, 以了解某疾病
或健康状态在不同人群中分布有无异同点 。 从
而探索该现象产生的原因, 找到值得进一步深
入研究的线索 。
? 2,生态趋势研究 (ecological trend study):指连
续观察不同人群中某疾病或健康状态的发生率
和死亡率, 了解其变动趋势 。
生态学研究的应用
1,可应用现成资料和常规资料进行研究,
因而省时间, 人力, 物力;
2,可以从群体角度提供病因假设的线索;
3,适合于对人群干预措施的评价;
4,在疾病监测工作中, 应用生态趋势研究
可估计某种疾病发展的趋势 。
生态学研究的局限性
? 1、生态学谬误
? 2、难以确定两变量之间的因果关系
生态学研究不能计算发病率, 其证明病
因的作用较弱 。
生态学谬误 ( ecological fallacy)
? 生态学研究发现的某因素与某疾病的一致性,
可能是两者间的真正联系, 也可能是两者间毫
无关系 。 这种得出虚假联系的情况称为生态学
谬误 ( ecological fallacy),原因主要有:
? 由于以群体的平均或代理资料代替个体暴露量,
所得到的暴露与实际情况有误差 。
? 由于研究单位是群体而非个体, 无法得知个体
暴露与效应之间的关系, 从而得到的联系为虚
假联系 。
? 由于混杂因素干扰, 得到的联系为虚假联系 。
? 和疾病仅存在统计学关联, 而没有因果联系 。
生态学研究小结
? 生态学是研究人群与其环境关系的科学, 这里
应用于流行病学研究, 要注意观察单位是人群
而非个体 。
? 其优点是方便易行, 分析的技巧不复杂, 但是
在进行生物学推断时难以解释 。
? 注意生态学谬误 —— 用代理资料或平均资料来
代替个体资料并不准确;分析时运用加权回归
的方法;要控制混杂因子, 分析时运用分层分
析及多因素分析法 。