第五章、计数资料的统计描述
分类数据的统计描述指标 —
相对数指标
例,108例高血压患者治疗后临床记录
? 编号 年龄 性别 治疗组 舒张压 心电图 疗效
? X1 X2 X3 X4 X5 X6
? 1 37 男 A 11.27 正常 显效
? 2 45 女 B 12.53 正常 有效
? 3 43 男 A 10.93 异常 有效
? 4 59 女 B 14.67 异常 无效
? 。
? 100 54 男 B 16.80 正常 无效
分类数据的统计描述方法
? 将分类和等级原始数据,整理为频数表
? 1.两因素交叉频数表
不同用药与疗效的关系
? 分组 疗效( Y)
? ( X) 有效数 无效数 合计
? 用 A药组 20 30 50
? 用 B药组 10 40 50
例:心脏外科病人心理反应
? 心理反应 病例 数
? 焦虑 102
? 抑郁 57
? 自我认同紊乱 10
? 恐惧 5
? 合计 174
? 反映该指标(心理反应)分类的分布
2.一个因素分类计数的频数表
不同用药、性别与疗效的比较
? 男 女
? 用药 有效 无效 有效 无效
? 试验组 20 10 10 10
? 对照组 10 15 15 20
? 反映用药与疗效、性别与疗效的关
系。
3.两因素以上的交叉分组表
? 相对数的概念及其意义:
? 绝对数, 即各分类事物的合计数,绝对数反映某
事物实际发生的规模大小。
? 相对数:是两个有关绝对数之比,统称为相对数 。
? 相对数的意义,
? 1,消除基数影响,便于事物间的 比较 。
? 2.给出事物发生频率(强度)的估计。
? 3.相对数是工作决策的依据。
?
第一节 常用相对数
常用的相对数指标有:
率、构成比、相对比
? 1.率( rate),又称为强度相对数,说明
某事物在单位观察数中发生的频率和强度。
? 率的计算通式:
? 实际发生某结果的观察数
? 率 = × 比例基数
? 可能发生某结果的观察总数
?
比例基数可以取 100%,1000‰, 10万 /10万
率的命名
? 1.率的命名:一般根据分子现象而定义。
? 例:分子数为治愈人数,率为治愈率;分
子为某病患病人数,率为患病率等。
? 2.率的命名决定了分子、分母的数据。
? 呼吸内科感染人数
? 呼吸内科感染率 =
? 呼吸内科调查人数
?
例,某医院部分科室院内感染情况
? 科 室 调查 感染 感染 感染人数
? 病 人数 人数 率 % 构成比 %
? 呼吸内科 100 10 10,0 26.32
? 心血管内科 100 8 8.0 21.05
? 泌尿外科 40 6 15.0 15.78
? 胸外科 42 2 11.9 13.16
? 普外科 100 12 12.0 31.58
? 合计 382 38 9.9 100.00
率的分类
? 根据率的分母中有无时间量纲分为:
? 速率( rate),即分母中有时间量纲,
速率反映在一定时间内某现象出现的
频率,如某年某病发病率等。
? 比率( proportion),分母中无时间
量纲。反映某事件出现频率。如某病
治愈率、死亡率等。
常用的几个频率指标
1)反映医院医疗质量 (疗效)的频率指标(比率)
某病治愈人数
? 某病治疗总人数
?
? 某病治疗有效人数
? 某病治疗总人数
? 某病死亡人数
? 某病治疗总人数
治愈率 =
有效率 =
病死率 =
× 100%
× 100%
× 100%
2)反映人群健康状况的频率指标(速率)
? 某病某时期(年、季度) 发病率 =
? 某时期内新发生某病人(例)数
? 该时期观察总人数或平均人口数
? 发病率:反映某时期人群中某疾病新增加的数量
(速度)
? 某病 患病率 =
? 某时期(年、季度)新旧某病人数
? 该时期观察的总人数
? 患病率:反映某时期人群中已存在某疾病的数量
× 100%
× 100%
? 某时期某病死亡人数
? 某病病死率 =
? 该时期患某病的人数
? 某时期内死亡人数
? 某病死亡率 =
? 该地该时期平均人口数
× 100%
× 1000%
或 10万
?反映某时期人群患某病后的危险性和预后
某年某地区人口年龄分组某病资料
? 年龄 人口数 患者数 新发病数 死亡数
? 0 - 82920 488 170 9
? 患病率 ‰ 发病率 ‰ 死亡率 ‰ 病死率 %
? 488/82920 170/82920 9/82920 9/488
? 5.88 2.05 0.108 1.84
讲义 85页第 2题
率指标做统计结论的描述
? 描述内容:
? 1.描述出某现象发生 频率水平 。
? 2.不同组间频率指标可作比较。
? 3.如比较组为年代、年龄、剂量等,
可观察比较组(如年龄变化)与各
组频率变化的趋势关系。
例,某地老年人白内障的患病情况
? 年龄组 受检 白内障 患者 白内障
? (岁) 人数 患者 构成比 % 患病率 %
? 40- 560 68 15.18 12.14
? 50- 441 129 28.79 29.25
? 60- 296 135 30.13 45.61
? 70- 149 97 21.65 65.10
? ≥80 22 19 4.24 86.36
? 合计 1468 448 100.00 30.52
描述:随着年龄的增加,白内障患病率增加,
80岁人群达 86.36%
2.结构相对数:构成比
( constituent ratio )
概念,说明某事物内部各组成部分在总量
中所占的比重,
? 计算通式:
? 事物某部分的例数
? 某部分构成比 = × 100 %
? 同一事物各部分的总例数
? 例,40岁组白内障患者数
40岁组白内障患者构成 = × 100 %
? 各年龄组白内障患者总数
构成比的特点和意义
特点:
( 1) 各部分构成比的合计为 100%。
( 2) 事物内部某一部分的构成比发生变化, 其
他部分构成也发生变化 。 例讲义表 5-1
意义:
( 1) 研究事物按一个特征分类, 构成比反映
事物内部组成的结构特征, 指出工作重点 。
见例 1
( 2) 事物按两个特征分类, 构成比反映事物
与两个特征的关联关系 。 例 2
表 5-1 某医院 1990年和 1998年住院病
人五种疾病死亡人数和构成比
疾病
分类
1990年 1998年
死亡
人数
构成比
( %)
死亡
人数
构成比
( %)
恶性肿瘤 58 30.53 40 26.85
循环系统疾病 44 23.16 44 29.53
呼吸系统疾病 37 19.47 29 19.46
消化系统疾病 19 10.00 18 12.08
传染病 32 16.84 18 12.08
合 计 190 100.00 149 100.00
? 我国某次抽样调查 15岁以上人口文化程度与构成
? 文化程度 98年( %) 93年( %)
? 文盲或半文盲 20.9 25.9
? 小学文化 28.1 35.1
? 初中文化 33.1 28.0.
? 高中文化 11.0 9.0
? 大专及以上 3.9 2.0
? 合计 100.0 100.0
? 结论;我国人口在 98年初中以上文化程度构成高
于 93年。
61.%
48% 39%
例 1
例 2:研究 胆结石类型与结石部位的关系
? 结石 结石类型
? 部位 胆固醇 胆红素 其它 合计
? 胆囊 70 16 32 118
? ( %) 59.3 13.6 27.1 100
? 肝外胆管 12 39 24 75
? ( %) 16.0 52.0 32.0 100
? 肝内胆管 2 20 7 29
? ( %) 7.0 69.0 24.0 100
? 合计 84 75 63 222
?
? 初步结论:胆结石的类型与结石部位有关系,在胆囊部
位主要为胆固醇结石,在胆管部位主要为胆红素结石。
3.相对比( relative ratio )
? 相对比:反映两个指标(指标可为绝对数、相对
数;性质相同或不同)相比的倍数或百分数 。
? 例 1,某医院出生性别比 =男性婴儿数 /女性婴儿数
? =370/358=1.03(或 103%)
? 医护比 =医生人数 /护士人数
)(倍数或百分数
乙指标
甲指标相对比 %?
? 与时间点有关的相对比,即发展速度和增
长速度(讲义 82页),说明事物在一定时
期内变化的速度。
? 1) 后一时间点指标
? 前一时间点指标
? 2)增长速度 =发展速度- 1(或 100%)
1??
?
?
前一时间点某指标
后一时间点某指标
前一时间点某指标
前一时间点某指标后一时间点某指标
增长速度
发展速度 =
? 例:某疾病 80年死亡率 =20.1‰
? 81年死亡率 =16.6‰
? 问,81年死亡率是 80年的百分之几?
81年与 80年相比减少的幅度为多少?
? 发展速度 =16.6/20.1=82.58%
? 增长速度 =82.58-100= -17.42%
? 81年该病的死亡率是 80年的 82.58%。
81年比 80年减少了 17.42%
? 表 5-9 某医院 1991-1999年门诊量动态分析
? 门诊 发展速度 % 增长速度 %
年份 人数 定基比 环比 定基比 环比
1991 1200 100 100 — —
1992 1500 125 125 25 25
1993 1600 133 106.7 33 6.7
? 定基比:即用某年指标做基数,各时间点指标与
基数相比较。
? 环比:各后时间点指标与前一时间点指标比较
相对比的应用:某事物不同时间的动态分析
肝部分切除后肝细胞增殖标记的动态分析
? 术后时间 标记数 定基比 环比
? (小时) ( %) ( 倍) (倍)
? 0~ 0.088 1 —
? 12~ 3.721 42.3 42.3
? 24~ 23.95 272.2 6.44
? 36~ 14.47 164.5 0.60
? 48~ 8.44 95.9 0.58
? 60~ 6.56 75.6 0.79
? 72~ 4.39 49.9 0.66
发展速度
第二节、相对数应用时的注意事项
? 1.正确区分率和构成比,分析时不能以构成比
代率做结论。
? 2.计算相对数指标时,应有一定数量的观察数。
? 3.医院计算的率不表示人群的患病情况(讲义
表 5-3)。
? 4.注意组间相对数比较的可比性:见讲义
? 5.如是样本资料,组间率和构成比应做统计检
验后,再作出有无差别的结论。
某单位冠心病调查结果
? 年龄 干部 工人
? 岁 患者 % 患者 %
? 40- 21 60 12 70.6
? 50- 9 25.7 4 23.5
? 60-70 5 14.3 1 5.9
? 合计 35 100.0 17 100.0
? 作者认为:冠心病发病率随年龄增加而下降
?讲义 85页计算分析题第 1题
各型白血病患病率的比较
? 类型 例数 患病率 %
? 急粒 468 32.8
? 急淋 341 23.9
? 急单 176 12.3
? 恶网 136 9.5
? 慢粒 204 14.3
? 慢淋 10 0.7
? 其他 92 6.5
? 合计 1427 100.0
例,高危出血热病人不同方法透析死
亡率的比较
? 组别 例数 死亡例数 死亡率 %
? 试验组 23 2 8.69
? 对照组 19 4 21.31
? 合计 42 6 14.28
第三节、率的标准化法
? 一、标准化的意义和基本思想
? 问题的提出:
? 计数资料组间(试验组、对照组,x)
的率(效应指标,y)比较时,各比较
组观察人数中如年龄、病情等因素 ( z)
与 y的效应有关因素,在组间的构成明
显不同时,对计算各组率有影响。称 Z
为混杂因素,组间的率不能合理比较,
见例。
表 5-4甲乙两疗法某病治愈率比较
? 病型 甲疗法 乙疗法
? 病人 治愈 治愈 病人 治愈 治愈
( Z) 数 数 率 数 数 率
普通型 300 180 60.0 100 65 65.0
重型 100 35 35.0 300 125 41.7
合计 400 215 53.8 400 190 47.5
讲义,78页
f
pfpf
?
?????? 2211
400
10035.03006.08.53
f起了权重的作用
甲乙两疗法某病治愈率比较
? 疗法 疗效( Y)
? ( X) 病人数 治愈数 治愈率 %
? 甲疗法 400 215 53.8
? 乙疗法 400 190 47.5
? 结论:乙医院生存率为 67.1%较甲医院 64.2%高,
乙医院医疗水平高于甲,正确?。
两医院乳腺癌术后 5年生存率
腋下淋巴 甲医院 乙医院
结转移 病例 生存 生存率 病例 生存 生存率
? 无 45 35 77.7 300 215 71.6
? 有 710 450 63.4 83 42 50.6
? 合计 755 485 64.2 383 257 67.1
例 2
解决方法:
? 1.单因素方法:计算标准化率( standardized
rate)或调整( adjust)率后做比较(调整一个
混杂因素)。
? 2.多因素统计方法:采用 logistic回归模型,可
同时调整多个混杂因素。方法略
? 目的:将组间的混杂因素(年龄、病情构成不
一致情况)调整为一致,合理对效应指标( y)
作出评价。
标准化率的基本思想,
? 两组都选择同一构成的观察人数
(例如相同构成的病情人数)作为
标准,即统一了影响因素的构成,
重新计算调整后各组率(调整率或
标准化率)后做比较。
二、直接法标准化率计算( 79页)
? 1.标准人数(统一构成)的选择:
? 可选两组例数合计或其中某组的观察例数。
? 2.计算各小组调整的人数
? =原某小组的率( Pi) ?某小组标准人数( Ni)
? 3.计算各组的调整率或标准化率( P’)
i
ii
N
PN
P
?
?
?'
5-4
**其他标准化方法不要求掌握
表 5-4甲乙两疗法某病治愈率 %比较
? 病型 甲疗法 乙疗法
? 病人 治愈 治愈 病人 治愈 治愈
? 数 数 率 数 数 率
? 普通型 300 180 60.0 100 65 65.0
? 重型 100 35 35.0 300 125 41.7
? 合计 400 215 53.8 400 190 47.5
例:
直接法标准化率计算见表 5-5
表 5-5直接法计算标准化治愈率
? 病型 标准 甲疗法 乙疗法
? 治疗 原治 预期 原治 预期
? 人数 愈率 治愈数 愈率 治愈数
普通型 400 60.0 240 65.0 260
重型 400 35.0 140 41.7 167
合计 800 380 427
? 调整率(标准化率):
?
%5.47
8 0 0
3 8 0' ??
?
??
i
ii
N
PNP
甲 %4.53800
427' ??
乙P
补充:计数资料的统计描述指标
相对危险度与优势比
? 一、相对危险度
? 危险度( risk)是医学研究中常用统
计指标,常用频率(或概率)表示。
? 如:某疾病发病、患病、死亡的危
险性常用某病发病率、患病率、死
亡率表示 。
相对危险度( relative risk,简称 RR)
? RR:指表示暴露( exposure)于某种危险因
素观察对象的发病(死亡)危险度( P1)与
无暴露因素组(或低暴露)观察对象发病危
险度( P0)的比值。
RR说明危险因素与疾病的关联。 常用于前瞻
性或队列研究。
非暴露组的发病率
暴露组的发病率
??
0
1
P
p
RR
例,HBsAg阳性与肝癌发生率的队列研究
? 暴露 结 果 发生
? 因素 观察人数 肝癌人数 率 ‰
? HBsAg组 + 3454 40 11.58
? HBsAg组 - 19252 1 0.052
? 有表抗阳性(有暴露因素)肝癌发生危险性是无
表抗阳性的 222.6倍。
69.2 22
0 52.0
58.11
0
1 ???
P
p
RR
优势比 ( odds ratio, OR)
? 优势比是医学(特别临床研究)常用的统计指标。
一般用于病例对照研究 (case-control study)。
? 优势( odds):指某病患者组(或非患者组)中
某种危险因素存在的比例 P( e)与不存在的比例
( 1-P( e))的比值称为优势。
b
a
ba
b
ba
a
ep
epo d d s ?
??
?
?
? /
)(1
)(
如 odds> 1,表示某暴露因素存在与不存在相
比是有优势。
吸烟与肺癌关系的病例对照研究
? 暴露因素( X)
? 结果 吸烟 不吸烟 合计
? 肺癌组 688 ( a) 21( b) 709 ( a+b)
? 对照组 350 ( c) 359( d) 709( c+d)
? 合计 1038( a+c) 380( b+d)
76.32
709/21
709/688
/
/
)(1
)(
1 ???
??
?
?
bab
baa
ep
epodds
暴露因素在肺癌组患者的优势( odds1)
同理:暴露因素在对照组人群的 odds2=0.975
优势比( odds ratio,OR)
? 定义:病例组有暴露因素的优势( odds1)
与对照组有暴露因素的优势( odds2)的
比值,称为优势比( odds ratio,OR)
? 公式:
cb
da
d
c
b
aOR
?
??? /
6.33
213 5 0
3 5 96 8 8 ?
?
??
?
??
cb
daOR
例:
OR值的意义
? OR值 >1表示有暴露因素的人患某疾病的机会
或优势与对照组相比增加, 为危险因子 。
? OR值 <1,表示有暴露因素的人患疾病的机会
( 或优势 ) 减少, 为保护因子 。
? OR值 =1,意味无论暴露出现与否,与疾病关系不
大,
? 暴露因素对疾病的作用大小,取决 OR值大小
? 注:样本计算的 OR后,应检验 H0,OR=1,H1:
OR≠1,如 P<0.05,OR 有统计意义,表明暴露与疾
病有关系。
OR的应用例子
? 在结果变量 Y与 X(风险因素)均为两分类变量。考察
结果(疾病)与风险因素的关系。
? 例:考察糖尿病人发生视网膜病与风险因素关系
? 风险因素 视网膜病 ( Y)
? ( X) 发生 未发生 OR p
? 舒张压
? ≥85 110 23
? < 85 118 61 2.47 0.004
? 甘油三脂
? ≥250 61 14
? < 250 167 70 1.83 0.064
RR和 OR的意义及区别
? 意义,RR和 OR二者均是说明暴露因素对
疾病的关联关系指标,都用于病因分析。
? 区别,RR OR
用于队列研究资料,
该研究是 由因到果 的
研究,暴露对结果
的关联指标计算 RR,
结果说服力强。
用于病例对照研究,
该研究是 由果到因 的
研究,暴露对结果的
关联指标计算 OR,结
果说服力低于队列研

作业
? 讲义第 83页和 85页:
? 一、选择题
? 三、计算题的第 2题和第 4题