计数资料的
统计学处理
公共卫生学院
一、前言
? 绝对数:实际观察得到的数据,反
映真实情况。
? 相对数:两个有关指标之比,用于
比较。
二、常用相对数指标
? 构成比( proportion):又称构成指
标,表示事物或现象内部各组成部分
的比重或分布。
100%? ?构成比
某组成部分的观察单位数
各组成部分的观察单位总数
特点,
(1)总和等于100%或1;
(2)不能同时都增大或减小。
? 率( rate):又称频率指标,说明某现
象发生的频率或强度。
注意事项,
(1)分子是发生某现象的观察单位数,分
母是 可能 发生 该现象的观察单位总数。
( 2)观察单位:病人与病例,孩子数与妇女
数。
( 3)比例基数 K。
常用的频率 /类频率指标,
100%
100%
K??
??
??
患病人数
患病率
调查人数
观察期内新发病例数
发病率
同期内可能发生该病的总人数
感染人数
感染率
检查人数
1000
100%
100%
??
??
??
某年内的总死亡人数
死亡率
同年内的平均人口数
死于某病的人数
病死率
该病的患病总人数
某病的治愈人数
治愈率
该病接受治疗的人数
‰
100%
100%
??
??
未被诊断为某病的病人数
漏诊率
确实为该病的病人数
确实不是某病的人数
误诊率
被诊断该病的病人数
? 相对比( ratio):反映指标间的相
对水平。
增加了 /增加到
减少了 /减少到
一成 /两番
? 甲指标相对比
乙指标
三、应用相对数的注意事项
? 分母不能太小
? 比与率不能混用
? 合并率(总率)的计算
? 可比性
? 抽样误差 —— 假设检验
四、标准化法 ( standardization)
? 条件:小组构成影响总率;小组构
成各不相同;比较总率。
? 目的意义
? 方法
( 1)直接法
适用条件:各小组率已知。
步骤,
1,选定标准
2,计算预期发生数
3,求标准化率
例:某医师观察某种病两种方法的治疗
效果,结果见下表。比较这两种方法
的治愈率。
某病两种治疗方法的治疗效果
组别
甲法 乙法
治疗
人数
治愈
人数
治愈率
( %)
治疗
人数
治愈
人数
治愈率
( %)
儿童 100 40 40.0 50 10 20.0
成人 50 30 60.0 100 80 80.0
合计 150 70 46.7 150 90 60.0
( 2)间接法,
各小组率不清楚时选用
标准选用标准发生率
由于理论方面的问题,尽量少用间接法,最好不
用。
S M R
S M R
?
??
实际死亡数
预期死亡数
标化率 标准死亡率
? 注意事项
( 1)标化率不能反映实际水平,只 能用
于比较;
( 2)选用标准不同,标化率会改变,但
比较结果只有一个,不能改变;
( 3)比较标化率,也要作显著性检验。
五、率的标准误与可信区间
? 率的标准误
( 1 )
( 1 )
p
p
n
pp
s
n
??
?
?
?
?
?
? 总体率的可信区间
样本量不太小,总体率既不太小,
也不太大,接近 0.5时,样本率近似
正态分布。此时总体率的可信区间
为
pp u s???
例:某社区共有 12000人。现抽查了
800人,发现 200人患有蛔虫病。
如要作集体驱虫治疗,至少应
准备多少份药物?( 95%)
六、率的检验
? 样本率与总体率比较
满足近似正态条件时,可用 u检验。
p
p
u
?
?
?
?
例:根据以往经验,一般溃疡病患
者中有 20%发生胃出血症状。
现有某医生观察 65岁以上溃疡
病人 152例,其中 48例发生胃出
血症状。试问老年患者胃出血
的发生率是否高于一般?
? 两样本率的比较
近似正态分布时,仍可用 u检验。
12
12
12
()
()
12
1 1 2 2
12
11
()
,1
pp
p p c c
c c c
pp
u
s
s p q
nn
n p n p
p q p
nn
?
?
?
?
??
?
? ? ?
?
例:某医师进行高血压子代患病率调查,结果
如下表。试问两组的高血压患病率是否一
样?
两组子代的高血压患病率
患病
人数
未患病
人数 合计
患病率
( %)
父或母患病组 101 104 205 49.268
父母均患病组 112 41 153 73.203
合计 213 145 358 59.497
七,?2检验
? 基本思想
? 常用的 ?2检验
2
2 ()AT
T
? ?? ?
( 1)成组(四格表)资料的 ?2检验
n>40,T>5时
+ - 合计
甲 a b a+b
乙 c d c+d
合计 a+c b+d n=a+b+c+d
2
2
2
2
()
)
( ) ( ) ( ) ( )
AT
T
a d b c n
a b c d a c b d
?
?
?
?
?
?
? ? ? ?
? 或
(
n>40,1<T<5时
n<40或 T<1时,不能用 ?2检验
2
2
(
2
2
(
| | 0, 5 )
( | | )
2
( ) ( ) ( ) ( )
AT
T
n
a d b c n
a b c d a c b d
?
?
??
?
??
?
? ? ? ?
?校正)
校正)
(
或
例 1:某医师研究洛赛克治疗消化性溃
疡的疗效,以泰胃美作对照,其
观察结果见下表。试问两种药物
治疗消化性溃疡的疗效是否相同?
两种药物治疗溃疡病的疗效
药物 例数 有效数 有效率( %)
泰胃美 60 36 60.0
洛赛克 60 54 90.0
例 2 某医生比较两种不同手术治疗某
病的疗效,共收治病 71例,结果
见下表。试问这两种手术治疗该
病的疗效是否相同?
两种手术治愈率
分组 痊愈 未愈 治愈率( %)
甲手术 25 7 78.13
乙手术 37 2 94.87
( 2)配对资料的 ?2检验
配对设计
资料陈述形式
关联性检验(独立性检验):同四格表
甲 乙 + -
+ a b
- c d
差异性检验,
2
2
2
()
40
( | | 1 )
40
bc
bc
bc
bc
bc
bc
?
?
?
? ? ?
?
??
? ? ?
?
2
校正
时,
时,
例 1 用甲乙两种方法检查已确诊的胰腺
癌病人 120例,结果如下表。问两种
方法检出结果是否有差异?
甲乙两法对胰腺癌的检出结果
甲法 乙法 合计
+ -
+ 42 30 72
- 18 30 48
合计 60 60 120
例 2 现对 53例经标准化诊断为原发性肝癌
( HCC)病人和 42例非原发性肝癌病人
采用血清胎盘酸性同功铁蛋白( PAIF)
进行鉴别诊断,结果见下表。问 PAIF判
断结果与标准诊断结果是否一样?
对原发性肝癌的鉴别诊断
PAIF诊断 标准诊断 合计 HCC 非 HCC
HCC 48 8 56
非 HCC 5 34 39
合计 53 42 95
( 3)行 × 列表资料的 ?2检验
行 × 列表
? ?? T TA
2
2 )(?
但经推导,也可按下式计算,
计数。为实际数所对应的列合
计数,为实际数所对应的行合
为实际数,为总样本量,其中,
C
R
CR
n
n
AN
nn
A
N )1(
2
2
?
?
?? ??
? 适用条件,
?总样本量不能太小,至少大于 50;
?理论数不能小于 1;
?理论数在 1~ 5之间的不能多于 1/5的总格子
数。
例 某医师研究血型与胃、十二指肠溃疡间的
关联性,比较胃溃疡病人与十二指肠溃疡
病人的血型分布,结果见下表。试问溃疡
病与血型是否有关?
胃溃疡与十二指肠溃疡病人的血型分布
疾病 血型分布 合计 O A B AB
胃溃疡 25 11 13 4 53
十二指
肠溃疡 63 71 57 9 200
合计 88 82 70 13 253
( 4)两组有序资料的 ?2检验
要回答“越 … 越 …” 这样的问题,行 ×
列表资料的 ?2检验就不能达到目的,
而要趋势 ?2检验。
例 某医师研究复方风湿宁治疗类风湿
性关节炎的疗效,用消炎痛作对照,
结果如下。试问类风湿性关节炎的疗
效是否与疗法有关联?
复方风湿宁与消炎痛治疗类风湿性关节炎的疗效
药物
疗效 (c)
合计 临床治
愈( 1)
显效
( 2)
缓解
( 3)
无效
( 4)
复方风湿宁 (a) 32 77 9 2 120(A)
消炎痛 (b) 0 1 5 24 30
合计 (n) 32 78 14 26 150(N)
计算
ac 32 154 27 8 221(∑ac)
nc 32 156 42 104 334(∑nc)
nc2 32 312 126 416 886(∑nc2)
作检验前先计算 ac,∑ac,nc,∑nc,nc2,
∑nc2和 P=A/N=120/150=0.80。
对于按数量分组的资料,只需改变评分的
方法就可以了。一般可取各组的组中值。
1
)1(]/)([
)/(
22
2
2
?
??????
????
?
??
??
v
PPNcncn
NcnAca
?
( 5)拟合优度 ?2检验
也称适合性检验,是 ?2检验基本思想最经
典的应用。在遗传学中应用广泛,还常用
作某分布是否符合某一特定分布的检验。
2
2 ()AT
T
vT
?
?
?
??
?
累加的次数 计算 时所用的参数个数
例 孟德尔用豌豆的两对相对性状进行杂交实
验。黄色圆滑种子与绿色皱缩种子的豌
豆杂交后,F2代分离的情况为:黄圆 315
粒,黄皱 101粒,绿圆 108粒,绿皱 32粒,
共 556粒。试问此结果是否符合遗传学自
由组合规律?
( 根据自由组合规律,理论分离比为,
黄圆:黄皱:绿圆;绿皱 =9,3,3,1)
谢谢!
统计学处理
公共卫生学院
一、前言
? 绝对数:实际观察得到的数据,反
映真实情况。
? 相对数:两个有关指标之比,用于
比较。
二、常用相对数指标
? 构成比( proportion):又称构成指
标,表示事物或现象内部各组成部分
的比重或分布。
100%? ?构成比
某组成部分的观察单位数
各组成部分的观察单位总数
特点,
(1)总和等于100%或1;
(2)不能同时都增大或减小。
? 率( rate):又称频率指标,说明某现
象发生的频率或强度。
注意事项,
(1)分子是发生某现象的观察单位数,分
母是 可能 发生 该现象的观察单位总数。
( 2)观察单位:病人与病例,孩子数与妇女
数。
( 3)比例基数 K。
常用的频率 /类频率指标,
100%
100%
K??
??
??
患病人数
患病率
调查人数
观察期内新发病例数
发病率
同期内可能发生该病的总人数
感染人数
感染率
检查人数
1000
100%
100%
??
??
??
某年内的总死亡人数
死亡率
同年内的平均人口数
死于某病的人数
病死率
该病的患病总人数
某病的治愈人数
治愈率
该病接受治疗的人数
‰
100%
100%
??
??
未被诊断为某病的病人数
漏诊率
确实为该病的病人数
确实不是某病的人数
误诊率
被诊断该病的病人数
? 相对比( ratio):反映指标间的相
对水平。
增加了 /增加到
减少了 /减少到
一成 /两番
? 甲指标相对比
乙指标
三、应用相对数的注意事项
? 分母不能太小
? 比与率不能混用
? 合并率(总率)的计算
? 可比性
? 抽样误差 —— 假设检验
四、标准化法 ( standardization)
? 条件:小组构成影响总率;小组构
成各不相同;比较总率。
? 目的意义
? 方法
( 1)直接法
适用条件:各小组率已知。
步骤,
1,选定标准
2,计算预期发生数
3,求标准化率
例:某医师观察某种病两种方法的治疗
效果,结果见下表。比较这两种方法
的治愈率。
某病两种治疗方法的治疗效果
组别
甲法 乙法
治疗
人数
治愈
人数
治愈率
( %)
治疗
人数
治愈
人数
治愈率
( %)
儿童 100 40 40.0 50 10 20.0
成人 50 30 60.0 100 80 80.0
合计 150 70 46.7 150 90 60.0
( 2)间接法,
各小组率不清楚时选用
标准选用标准发生率
由于理论方面的问题,尽量少用间接法,最好不
用。
S M R
S M R
?
??
实际死亡数
预期死亡数
标化率 标准死亡率
? 注意事项
( 1)标化率不能反映实际水平,只 能用
于比较;
( 2)选用标准不同,标化率会改变,但
比较结果只有一个,不能改变;
( 3)比较标化率,也要作显著性检验。
五、率的标准误与可信区间
? 率的标准误
( 1 )
( 1 )
p
p
n
pp
s
n
??
?
?
?
?
?
? 总体率的可信区间
样本量不太小,总体率既不太小,
也不太大,接近 0.5时,样本率近似
正态分布。此时总体率的可信区间
为
pp u s???
例:某社区共有 12000人。现抽查了
800人,发现 200人患有蛔虫病。
如要作集体驱虫治疗,至少应
准备多少份药物?( 95%)
六、率的检验
? 样本率与总体率比较
满足近似正态条件时,可用 u检验。
p
p
u
?
?
?
?
例:根据以往经验,一般溃疡病患
者中有 20%发生胃出血症状。
现有某医生观察 65岁以上溃疡
病人 152例,其中 48例发生胃出
血症状。试问老年患者胃出血
的发生率是否高于一般?
? 两样本率的比较
近似正态分布时,仍可用 u检验。
12
12
12
()
()
12
1 1 2 2
12
11
()
,1
pp
p p c c
c c c
pp
u
s
s p q
nn
n p n p
p q p
nn
?
?
?
?
??
?
? ? ?
?
例:某医师进行高血压子代患病率调查,结果
如下表。试问两组的高血压患病率是否一
样?
两组子代的高血压患病率
患病
人数
未患病
人数 合计
患病率
( %)
父或母患病组 101 104 205 49.268
父母均患病组 112 41 153 73.203
合计 213 145 358 59.497
七,?2检验
? 基本思想
? 常用的 ?2检验
2
2 ()AT
T
? ?? ?
( 1)成组(四格表)资料的 ?2检验
n>40,T>5时
+ - 合计
甲 a b a+b
乙 c d c+d
合计 a+c b+d n=a+b+c+d
2
2
2
2
()
)
( ) ( ) ( ) ( )
AT
T
a d b c n
a b c d a c b d
?
?
?
?
?
?
? ? ? ?
? 或
(
n>40,1<T<5时
n<40或 T<1时,不能用 ?2检验
2
2
(
2
2
(
| | 0, 5 )
( | | )
2
( ) ( ) ( ) ( )
AT
T
n
a d b c n
a b c d a c b d
?
?
??
?
??
?
? ? ? ?
?校正)
校正)
(
或
例 1:某医师研究洛赛克治疗消化性溃
疡的疗效,以泰胃美作对照,其
观察结果见下表。试问两种药物
治疗消化性溃疡的疗效是否相同?
两种药物治疗溃疡病的疗效
药物 例数 有效数 有效率( %)
泰胃美 60 36 60.0
洛赛克 60 54 90.0
例 2 某医生比较两种不同手术治疗某
病的疗效,共收治病 71例,结果
见下表。试问这两种手术治疗该
病的疗效是否相同?
两种手术治愈率
分组 痊愈 未愈 治愈率( %)
甲手术 25 7 78.13
乙手术 37 2 94.87
( 2)配对资料的 ?2检验
配对设计
资料陈述形式
关联性检验(独立性检验):同四格表
甲 乙 + -
+ a b
- c d
差异性检验,
2
2
2
()
40
( | | 1 )
40
bc
bc
bc
bc
bc
bc
?
?
?
? ? ?
?
??
? ? ?
?
2
校正
时,
时,
例 1 用甲乙两种方法检查已确诊的胰腺
癌病人 120例,结果如下表。问两种
方法检出结果是否有差异?
甲乙两法对胰腺癌的检出结果
甲法 乙法 合计
+ -
+ 42 30 72
- 18 30 48
合计 60 60 120
例 2 现对 53例经标准化诊断为原发性肝癌
( HCC)病人和 42例非原发性肝癌病人
采用血清胎盘酸性同功铁蛋白( PAIF)
进行鉴别诊断,结果见下表。问 PAIF判
断结果与标准诊断结果是否一样?
对原发性肝癌的鉴别诊断
PAIF诊断 标准诊断 合计 HCC 非 HCC
HCC 48 8 56
非 HCC 5 34 39
合计 53 42 95
( 3)行 × 列表资料的 ?2检验
行 × 列表
? ?? T TA
2
2 )(?
但经推导,也可按下式计算,
计数。为实际数所对应的列合
计数,为实际数所对应的行合
为实际数,为总样本量,其中,
C
R
CR
n
n
AN
nn
A
N )1(
2
2
?
?
?? ??
? 适用条件,
?总样本量不能太小,至少大于 50;
?理论数不能小于 1;
?理论数在 1~ 5之间的不能多于 1/5的总格子
数。
例 某医师研究血型与胃、十二指肠溃疡间的
关联性,比较胃溃疡病人与十二指肠溃疡
病人的血型分布,结果见下表。试问溃疡
病与血型是否有关?
胃溃疡与十二指肠溃疡病人的血型分布
疾病 血型分布 合计 O A B AB
胃溃疡 25 11 13 4 53
十二指
肠溃疡 63 71 57 9 200
合计 88 82 70 13 253
( 4)两组有序资料的 ?2检验
要回答“越 … 越 …” 这样的问题,行 ×
列表资料的 ?2检验就不能达到目的,
而要趋势 ?2检验。
例 某医师研究复方风湿宁治疗类风湿
性关节炎的疗效,用消炎痛作对照,
结果如下。试问类风湿性关节炎的疗
效是否与疗法有关联?
复方风湿宁与消炎痛治疗类风湿性关节炎的疗效
药物
疗效 (c)
合计 临床治
愈( 1)
显效
( 2)
缓解
( 3)
无效
( 4)
复方风湿宁 (a) 32 77 9 2 120(A)
消炎痛 (b) 0 1 5 24 30
合计 (n) 32 78 14 26 150(N)
计算
ac 32 154 27 8 221(∑ac)
nc 32 156 42 104 334(∑nc)
nc2 32 312 126 416 886(∑nc2)
作检验前先计算 ac,∑ac,nc,∑nc,nc2,
∑nc2和 P=A/N=120/150=0.80。
对于按数量分组的资料,只需改变评分的
方法就可以了。一般可取各组的组中值。
1
)1(]/)([
)/(
22
2
2
?
??????
????
?
??
??
v
PPNcncn
NcnAca
?
( 5)拟合优度 ?2检验
也称适合性检验,是 ?2检验基本思想最经
典的应用。在遗传学中应用广泛,还常用
作某分布是否符合某一特定分布的检验。
2
2 ()AT
T
vT
?
?
?
??
?
累加的次数 计算 时所用的参数个数
例 孟德尔用豌豆的两对相对性状进行杂交实
验。黄色圆滑种子与绿色皱缩种子的豌
豆杂交后,F2代分离的情况为:黄圆 315
粒,黄皱 101粒,绿圆 108粒,绿皱 32粒,
共 556粒。试问此结果是否符合遗传学自
由组合规律?
( 根据自由组合规律,理论分离比为,
黄圆:黄皱:绿圆;绿皱 =9,3,3,1)
谢谢!