Dr,宇传华 制作医疗等本科,医学统计学,
第五章计数资料的统计学推断
2009年 7月 28日第四军医大学卫生统计学教研室第一节 率的抽样误差与可信区间第二节 率的统计学推断一、样本率与总体率比较的 u检验二、两个样本率比较的 u检验第三节 卡方检验一、卡方检验的基本思想二、四格表专用公式三、连续性校正公式四、配对四格表资料的 χ 2检验五、行 3列( R3C)表资料的 χ 2检验计数资料的统计学推断
2009年 7月 28日第四军医大学卫生统计学教研室第一节 率的抽样误差与可信区间一、率的抽样误差与标准误二、总体率的可信区间
2009年 7月 28日第四军医大学卫生统计学教研室一,率的抽样误差与标准误样本率 (p)和总体率 (π)的差异称为率的 抽样误差 (sampling error of rate),用 率的标准误 ( standard error of rate)度量。
np
)1(
如果总体率 π未知,用样本率 p估计
n
pp
s p
)1(?
2009年 7月 28日第四军医大学卫生统计学教研室标准误的计算例 5 - 1 观 察 某 医 院 产 妇 106 人,其 中 行 剖 腹 产 者 62 人,
剖 腹 产 率 为 58,5%,试 估 计 剖 腹 产 率 的 标 准 误 。
解,已 知 n =106,p =0,585,其 标 准 误 为,
%8.4048.0
106
)585.01(585.0)1(

n
pp
S
p
2009年 7月 28日第四军医大学卫生统计学教研室二,总体率的可信区间总体率的可信区间 (confidence interval of
rate),根据样本率推算总体率可能所在的范围
μ± n 3á?o ′ó £ n p 1ì n £¨ 1 - p £|?ù ′ó òú 5 é± £?
p μ? 3· Dù 2? 2? ±y 2? 2£?a?èa í§ £1
ê¨ 2′ £1 ( p - u ¥à /2 ′ S p,p + u ¥à /2 ′ S p ) £¨ u 0.05 /2 = 1,96 £|
μ¤ 2′ £1 p - u ¥à ′ S p oò p + u ¥à ′ S p £¨ u 0.05 = 1,64 5 £|
éó p =0,58 5 £? S p =0,04 8 μ? 3ü áé ê¨ 2′ 95%?èa?£
£1 u 0.05 /2 = 1,96 £? ( p - u ¥à /2 ′ S p,p + u ¥à /2 ′ S p ) £?
£¨ 0,58 5 - 1,96?à 0,0 48 £? 0,5 85 +1,9 6?à 0.048 £| = £¨ 0,4 91 £? 0.679 £|
′ 3ü áé μ? 9 5%?èa í§ 49,1% ~ 67,9 %?£
3¢?à £1 êá o? μ? μèa?á?T òú 0% £? èT ′ó òú 1 00 % £?
óò?¨?á?T?±?ò?¨ í§ 0% £? èT?±?ò?¨ í§ 1 00 %?£
2009年 7月 28日第四军医大学卫生统计学教研室第二节 率的统计学推断一、样本率与总体率比较 u检验二、两个样本率的比较 u检验
2009年 7月 28日第四军医大学卫生统计学教研室一、样本率与总体率比较的 u检验
u检验的条件,n p 和 n( 1- p) 均大于 5时例 5 - 5,α - 地中海贫血基因携带率:山区 p =12/ 125=0,096,
n =125 ;本省一般成人 π 0 =0,076,
H
0
,π = π 0 =0.076 H
1
,π ≠ π 0 α =0.05 。
按 α = 0.05 水准,不拒绝 H
0
,即不能认为 该山区与本省一般成人的 α - 地中海贫血基因携带率有差异。
)1(
00
00
n
pp
u
p

844.0
125
)076.01(076.0
076.0096.0
2009年 7月 28日第四军医大学卫生统计学教研室二、两个独立样本率比较的 u检验
96.11 9 49.2
)641204 1)(1 0 45.01(1 0 45.0
0 3 13.01 2 75.0

u
表 5-1 两种疗法的心血管病病死率比较疗法 死亡 生存 合计 病死率 (%)
盐酸苯乙双胍 26 (X1) 178 204(n1) 12.75 (p1)
安慰剂 2 (X2) 62 64(n2) 3.13 (p2)
合 计 28 240 268 10.45 (pc)
21
2211
21
21
nn
pnpn
nn
XXp
c?

)11)(1(
21
2121
21
nn
pp
pp
S
ppu
cc
pp

u检验的条件:
n1p1 和 n1(1- p1)与
n2p2 和 n2(1- p2)均 >5
2009年 7月 28日第四军医大学卫生统计学教研室小 结
1.样本率也有抽样误差,率的抽样误差的大小用 σp或 Sp来衡量。
2.率的分布服从二项分布。当 n足够大,π和 1-π
均不太小,有 nπ≥5和 n( 1-π) ≥5时,近似正态分布

3,总体率的可信区间是用样本率估计总体率的可能范围 。 当 p分布近似正态分布时,可用正态近似法估计率的可信区间 。
4,根据正态近似原理,可进行样本率与总体率以及两样本率比较的 u检验 。
2009年 7月 28日第四军医大学卫生统计学教研室率的 u检验能解决以下问题吗?
率的反应为生与死、阳性与阴性、发生与不发生等二分类变量,如果二分类变量为非正反关系(如治疗 A、治疗 B);反应为多分类,如何进行假设检验?
率的 u检验要求,n足够大,且 nπ ≥5 和
n( 1-π ) ≥ 5。如果条件不满足,如何进行假设检验?
2009年 7月 28日第四军医大学卫生统计学教研室第三节 卡方检验
χ 2检验 (Chi-square test)是现代统计学的创始人之一,英国人 K,Pearson( 1857-1936)
于 1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。
本章仅限于介绍两个和多个率或构成比比较的 χ 2检验。
2009年 7月 28日第四军医大学卫生统计学教研室一、卡方检验的基本思想 (1)
疗法 死亡 生存 合计 病死率 (%)
盐酸苯乙双胍 26 (a) 178 (b) 204(a+b) 12.75 (p1)
安慰剂 2 (c) 62 (d) 64(c+d) 3.13 (p2)
合 计 28 (a+c.) 240(b+d.) 268(a+b+c+d=n) 10.45 (pc)
表 5-1 两种疗法的心血管病病死率的比较
232表或四格表 (fourfold table)
实际频数 A (actual frequency) ( a,b,c,d)的理论频数 T( theoretical frequency)( H0:π1=π2=π):
a的理论频数= (a+b)3pc= (a+b)3[(a+c.)/ n]=nRnC/n =21.3
b的理论频数= (a+b)3(1-pc)= (a+b)3[(b+d.)/ n] =nRnC/n =182.7
c的理论频数= (c+d)3pc= (c+d)3[(a+c)/ n] =nRnC/n =6.7
d的理论频数= (c+d)3(1-pc)= (c+d)3[(b+d.)/ n] =nRnC/n =57.3
n
nnc o l u m nr o wT CR?′?
总例数合计列合计行 )()(
2009年 7月 28日第四军医大学卫生统计学教研室一、卡方检验的基本思想 (2)
各种情形下,理论与实际偏离的总和即为卡方值(
chi-square value),它服从自由度为 ν 的卡方分布。
)1)(1(,1)()( 2
2
2 CR
TTAT
TA
1)12)(12(
82.4)
3.57
1
7.6
1
7.182
1
3.21
1
(7.4 2
3.57
)3.5762(
2
7.6
)7.62(
2
7.182
)7.182178(
2
3.21
)3.2126(
2
2


v
2009年 7月 28日第四军医大学卫生统计学教研室
0,0
0,1
0,2
0,3
0,4
0,5
0 3 6 9 1 2 1 5 1 8
¨ 2μ
3Y
·?
3ó òè £? 1
3ó òè £? 2
3ó òè £? 3
3ó òè £? 6
2/
)12/(2
2 2
2)2/(2
1)(?



ef
3.84 7.81 12.59
P= 0.05的临界值
χ2分布 ( chi-square distribution)
2009年 7月 28日第四军医大学卫生统计学教研室
χ2检验的基本公式
)1)(1(1)()( 2
2
2 CR
TTAT
TA
上述 基本公式 由 Pearson提出,因此软件上常称这种检验为 Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行 3列表”。
2009年 7月 28日第四军医大学卫生统计学教研室二、四格表专用公式( 1)
为了不计算理论频数 T,可由 基本公式 推导出,直接由各格子的实际频数( a,b,c,d)计算卡方值的公式:
(四格表专用公式)
基本公式:;1
))()()((
)(
))((
))((
))((
))((
))((
))((
)(
2
222
2
2
















dbcadcba
nbcad
dcba
dbdc
dcba
dbdc
d
dcba
dbba
dcba
dbba
b
dcba
caba
dcba
caba
a
T
TA
2009年 7月 28日第四军医大学卫生统计学教研室二、四格表专用公式( 2)
0
2
1,05.0
2
210
2
1,05.0
2
2
1,05.0
2
05.0;84.3
,,05.0;84.3
05.0;84.3
1,82.4
6424028204
268)21786226(
2
2
HP
HP
P
,即不拒绝则如果即拒绝如果下结论:




′′′
′′?′




2(1) ~ u2 = 2.19492= 4.82( n>40,所有 T?5时 )
2009年 7月 28日第四军医大学卫生统计学教研室三、连续性校正公式( 1)
χ 2分布是一连续型分布,而行 3列表资料属离散型分布
,对 其 进 行 校 正 称 为 连 续 性 校 正 (correction for
continuity),又称 Yates校正 ( Yates' correction) 。
⑴ 当 n≥40,而 1≤T< 5时,用 连续性校正 公式
⑵ 当 n< 40或 T< 1时,用 Fisher精确 检验 (Fisherexact test )
校正公式,
列表资料),(也适合其它行 ′ TTAc
2
2 )5.0(?
))()()((
)2/( 22
dbcadcba
nnbcad
c

2009年 7月 28日第四军医大学卫生统计学教研室三、连续性校正公式( 2)
表 5 - 2 两零售点猪肉表层沙门氏菌带菌情况检查结果沙门氏菌零售点阳性 阴性合计 带菌率( % )
甲 2 ( 4.17 ) 26 ( 23.33 ) 28 7.14
乙 5 ( 2.33 ) 9 ( 11.67 ) 14 35.71
合计 7 35 42 16.67
1,62.33571428 42)24262592(
22
′′′ ′?′?′ c
1,49.53571428 42)26592( 22′′′ ′′?′
因为 1< T< 5,且 n> 40时,所以应用连续性校正 χ 2检验
2009年 7月 28日第四军医大学卫生统计学教研室四、配对四格表资料的 χ2检验
a?ó è ±í 5 - 3 °íé?á
à à?
3?à à?
ê? ì? ( + ) èú ′? ( - )
1
ê? ì? ( + ) 6 £¨ a £| 12 £¨ b £| 18
èú ′? ( - ) 3 £¨ c £| 18 £¨ d £| 21
1 9 30 39
3è 3· è ±í °íé?á
μ
2? 3·
ê? ì? ( + ) èú ′? ( - )
1
3?à à? £¨ a £| £¨ b £|
à à? £¨ c £| £¨ d £|
1 78
ó 3ò 13?à àà à?
1 ê? ì? ê? ì?
2 ê? ì? èú ′?
… … …
39 èú ′? èú ′?
±′ 1à à? 3·?μ
1?3 ê? ì?
2 èú ′?
… … …
78?3 èú ′?
2009年 7月 28日第四军医大学卫生统计学教研室配对四格表资料的 χ2检验也称
McNemar检验( McNemar's test)
1,)1(
2
40 2 cb cbcb 时,需作连续性校正,
1,27.4
312
)1312( 22
,4015




采用连续性校正本例 cb
1,)(
22
40c cb cbb 时,当
05.0;84.32 1,05.02 P
H0,b,c来自同一个实验总体 ( 两种剂量的毒性无差异 ) ;
H1,b,c来自不同的实验总体 ( 两种剂量的毒性有差别 ) ; α =0.05。
2009年 7月 28日第四军医大学卫生统计学教研室配对四格表资料的 χ2检验公式推导
( +,? ) 和 (?,+ ) 两 个 格 子 中 的 理 论 频 数 均 为
2
cb?
40 cb 时
2
)
2
(
2
)
2
(
)(
22
2
2
cb
cb
c
cb
cb
b
T
TA

cb
cb
2
)(
~?
2
分 布同 理 可 得 40 cb 时校 正 公 式,
cb
cb
T
TA



22
2
)1|(|)5.0|(|
2009年 7月 28日第四军医大学卫生统计学教研室五、行 × 列( R× C)表资料的 χ 2检验
° é? ê? ·? ±í £′ 2?à 2 ±í £? é? 3ò μ¤ μo R?à C ±í
í é£?ò í§?a où ±? éy?Y ò? R C à? £é ì¨ 3à à? ±í oò
R?à C à? ৠ±í £¨ c o n t i n g e n c y t a b l e £| £ò 3? R?à C ±í?£
R?à C ±í μ? 3é àí é? ò? £1
1,?′ ·? Dù ±? áé μ? ± £¨y 5 - 10 μ? 4?à 2 ±í £|
2,à? 3· 3è ±? μ? ± £¨y 5 - 11 μ? 2?à 5 ±í £|
3,?′ 3· 3è ±? μ? ± £¨y 5 - 12 μ? 4?à 3 ±í £| μ?
2009年 7月 28日第四军医大学卫生统计学教研室
R× C表的 χ 2检验通用公式
n
nn
T
CR

总例数列合计行合计理论频数 代入基本公式可推导出,
基本公式 通用公式
)1(
)(
2
2
2
2


CR
nn
A
n
T
TA

自由度 = (行数? 1 )(列数? 1 )
2009年 7月 28日第四军医大学卫生统计学教研室几种 R× C表的检验假设 H0
1,多 个 样 本 率 的 比 较
H 0,π 1 = π 2 = π 3 = π 4 ( 四 种 疗 法 三 年 总 体 生 存 率 相 等 )
H 1,π i ≠ π j,4 ji ( 四 种 疗 法 三 年 总 体 生 存 率 不 全 相 等 )
2,两 组 构 成 比 的 比 较
H 0,两 处 理 组 的 总 体 构 成 相 同
H 1,两 处 理 组 的 总 体 构 成 不 同
3,多 组 构 成 比 的 比 较
H 0,各 年 龄 组 病 变 类 型 的 总 体 构 成 相 同 ( 年 龄 与 病 变 类 型 无 关 )
H 1,各 年 龄 组 病 变 类 型 的 总 体 构 成 不 全 相 同 ( 年 龄 与 病 变 类 型 有 关 )
2009年 7月 28日第四军医大学卫生统计学教研室
R× C表的计算举例例 5 - 12 对 1 135 例绝经后出血的妇女进行临床与病理分析,
结果见表 5 - 6,试分析病变类型是否与年龄有关。
表 5 - 6 不同年龄妇女绝经后出血的病变类型病变类型,例数( % )
年龄组(岁)
功能性 恶性 良性合计
≤ 50 60 ( 4 4,4 ) 16 ( 1 1,9 ) 59 ( 4 3,7 ) 135
51 ― 208 ( 33,3 ) 111 ( 17,8 ) 306 ( 49,0 ) 625
61 ― 66 ( 2 5,0 ) 79 ( 2 9,9 ) 119 ( 45,1 ) 264
71 ― 21 ( 1 8,9 ) 47 ( 4 2,3 ) 43 ( 3 8,7 ) 111
合计 355 ( 31,3 ) 253 ( 22,3 ) 527 ( 46,4 ) 1 1 35
2 2 2 2
60 16 432
1 11 35 ( 1 ) 58,91
13 5 35 5 13 5 25 3 11 1 52 7
( 4 1 ) ( 3 1 ) 6
RC
A
n
nn



′ ′ ′


χ
2
=58,91 > χ
2
0,0 5,6
= 12,59,所以,P < 0.05,以 α =0.05 水准拒绝 H 0
2009年 7月 28日第四军医大学卫生统计学教研室
R× C表 χ 2检验的应用注意事项
1,对 R× C表,若较多格子 ( 1/5) 的理论频数小于 5
或有一个格子的理论频数小于 1,则易犯第一类错误 。
出现某些格子中理论频数过小时怎么办?
( 1) 增大样本含量 ( 最好 ! )
( 2) 删去 该格所在的行或列 ( 丢失信息 ! )
( 3) 根据 专业知识 将该格所在行或列与别的行或列 合并
。 ( 丢失信息 ! 甚至出假象 )
2009年 7月 28日第四军医大学卫生统计学教研室
R× C表 χ 2检验的应用注意事项
2.多组比较时,若效应有强弱的等级,如 +,++,+++,
最好采用后面的非参数检验方法 。 χ 2检验只能反映其构成比有无差异,不能比较效应的平均水平 。
3.行列两种属性皆有序时,可考虑趋势检验或等级相关分析 。
表 6 - 2 某 药 对 两 种 不 同 病 情 的 支 气 管 炎 疗 效疗 效单 纯 型
( 1 )
单 纯 型 合 并 肺 气 肿
( 2 )
控 制 65 42
显 效 18 6
有 效 30 23
近 控 13 11
合 计 126 82