第七章 ?2检验
讲课思路
??2检验的基本思想
?2× 2表资料的 ?2检验 (步骤 )
一般公式
校正公式
?配对资料 的 ?2检验
?行 × 列 表资料的 ?2检验
为何要进行检验?
存在抽样误差。
目的:样本 总体
?2检验 ( chi-square test)
定义, ?2检验是处理 计数 资料的一
种方法,是推断两个或两个以上
样本率或比 之间差 别 是否 有统计
学意义 或两因素间有无关联的问
题。
**第一节 四格表 资料的 χ 2检验
一, ?2检验的基本思想 ( 听懂 )
? ?? T TA
2
2 )(?
结果
组别
阳性 阴性
合计
A a b a+ b
B c d c+ d
合计 a+ c b+ d a+ b+ c+ d= N
观察频数,A
理论频数,TRC=nrnc/N
假设检验流程图 -哲学思想
假设 (两组相同 )
两组数据合并
确定实际频数 A,计算理论频数 T
A- T (A- T)2 (A- T)2/T
?2= ?(A- T)2/T 即为 ?2的基本公式
**第一节 四格表 资料的 χ 2 检验
**二, 基本公式计算
例 7-1 P103。
目的
疗效
组别 有效 无效 合计
试验组 99 5 104
对照组 75 21 96
合计 174 26 200
**二、基本公式计算
步 骤:
1.建立假设, 确定检验水准 α 。
H0, π 1 = π 2, 即试验组与对照组降
低颅内压的总体有效率相等 。
H1, π 1 ≠ π 2, 即试验组与对照组降
低颅内压的总体有效率不等 。
α = 0.05
2.计算检验统计量 。
疗效
组别 有效 无效 合计
试验组 99 ( 90.48 ) 5( 13.52 ) 104
对照组 75 ( 83.52 ) 21 ( 12.48 ) 96
合 计 174 2 6 200
86.12
)( 22
?
?
? ?
T
TA
?
3,确定 P值,下结论 。
ν =(R-1)(C-1)=1,查附表 8,P533.
χ 20.05= 3.84,χ 20.01=6.63,(记住 !u值 )
统计结论, χ 2> χ 20.01,P<0.01
,在 α =0.01水平处, 拒绝 H0,接受 H1,
两组率的差别有统计学意义 。
医学结论, 可以认为两组降低颅内压
总体有效率不等, 即可认为异梨醇口服
液降低颅内压的有效率高于氢氯噻嗪 +地
塞米松的有效率 。
**三, 专用 公式计算
))()()((
)( 22
dbcadcba
Nbcad
????
?
??
86.12
261 7 4961 0 4
2 0 0)7552199( 22 ?
???
?????
两公式比较:计算, 应用, 含义
结果
组别
阳性 阴性
合计
A a b a+ b
B c d c+ d
合计 a+ c b+ d a+ b+ c+ d= N?
??
T
TA 22 )(?
**四, 校正 公式计算
为何校正, 因 χ 2 是连续性的理论分
布,但 2× 2表资料 χ 2 检验处理的资料是
不连续的,是计数资料,故两者有误差,
表现为 计算的 χ 2 值>实际的 χ 2 值,故
所得的 P值偏低,容易出现,假显著,,
为校正,假显著,应作连续性校正。特别是
当 n>=40,但 1=<T<5,(?2略大于 3.84时 )。
))()()((
)5.0|(| 22
dbcadcba
NNbcad
c ????
??
??
解答问题的步骤
例 7-2 P106。
1.建立假设, 确定检验水准 α 。
H0,π 1 = π 2
H1,π 1 ≠ π 2
α =0.05
8对应的理论频数为 4.67。
解答问题的步骤
2.计算检验统计量 。
a=46,b=6,c=18,d=8
不校正 ?2=4.35
14.3
))()()((
)5.0|(| 22
?
????
??
?
dbcadcba
NNbcad
c?
解答问题的步骤
3.查相应界值表,确定 P值,下结论 。
ν =(R-1)(C-1), 查附表 8,
χ 20.05 = 3.84, 本例,χ 2<χ 20.05,
P>0.05,在 α =0.05水平处, 不拒绝 H0,
两者的差别 无统计学意义, 尚不能认为
两种药物治疗脑血管疾病的有效率不等
。
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
免疫荧光法 + - 合计
+ 11 ( a ) 12 ( b ) 23
- 2 ( c ) 33 ( d ) 35
合计 13 45 58
乳胶凝集法
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
1.建立假设、确定检验水准 α 。
H0,B=C,即两种方法的总体检测结果
相同
H1,B≠C, 即两种方法的总体检测结
果不相同
α =0.05
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
2.计算检验统计量。
cb
cb
?
?? 22 )(?
79.5
212
)1|212(|)1( 222
?
?
??
?
?
??
?
cb
cb
c?
1=?
免疫荧光法 + - 合计
+ 11 ( a ) 12 ( b ) 23
- 2 ( c ) 33 ( d ) 35
合计 13 45 58
乳胶凝集法
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
3.确定 P值,下结论。
P<0.05,按 ?=0.05检验水准, 拒
绝 H0,接受 H1,差别有统计学意
义, 可以认为两种方法的检测结
果不同, 免疫荧光法的阳性检测
率较高 。 ( 23/58和 13/58)
第三节, Fisher精确概率 计算
条件, 当 n<40或 T<1时,应该用精确概
率计算。
例 7-4 P108 。 N=36<40。
程序,
DATA A;
INPUT X A B;
CARDS;
4 1 1 18 1 2 5 2 1 6 2 2 ; RUN;
PROC FREQ; WEIGHT X; TABLE A*B/EXACT;
RUN;
4 18
5 6
Statistics for Table of a by b
Statistic DF Value Prob
------------------------------------------------------
Chi-Square 1 2.7500 0.0973
Likelihood Ratio Chi-Square 1 2.6525 0.1034
Continuity Adj,Chi-Square 1 1.5469 0.2136
Mantel-Haenszel Chi-Square 1 2.6667 0.1025
Phi Coefficient -0.2887
Contingency Coefficient 0.2774
Cramer's V -0.2887
WARNING,25% of the cells have expected counts less
than 5,Chi-Square may not be a valid test.
Fisher's Exact Test
----------------------------------
Cell (1,1) Frequency (F) 4
Left-sided Pr <= F 0.1081
Right-sided Pr >= F 0.9795
Table Probability (P) 0.0876
Two-sided Pr <= P 0.1210
Sample Size = 33
实 例
穿新旧两种防护服工人的皮肤炎患病率比较
防护服种类 调查人数 患病人数 患病率 (%)
新 15 1 6.7
旧 28 9 32.1
合 计 43 10 23.3
?2=2.384 ?c2=1.349
Fisher p=0.25
第 四 节 行 × 列 表资料的 χ 2 检验
① 多个样本率比较时, 有 R行 2列, 称为表 R
× 2;
② 两个样本的构成比比较时, 有 2行 C列,
称 2× C表;
③ 多个样本的构成比比较, 以及双向无序分
类资料关联性检验时, 有 R行 C列, 称为 R
× C表 。
以上 3种情况可统称为行列表资料 。
例 7-6,P111。
)1(
2
2 ?? ?
CR nn
A
n?
疗法 有效 无效 合计
物理疗法组 199 7 206
药物治疗组 164 18 182
外用膏药组 118 26 144
合计 481 51 532
?=(R-1)(C-1)
解答问题的步骤
1、检验假设
H0, ?1=?2=?3,即三种疗法治疗周围性面
神经麻痹的有效率相等。
H1, 三种疗法治疗周围性面神经麻痹的有
效率 不全相等 。
α = 0.05
解答问题的步骤
2.计算检验统计量 。
)1(
2
2 ?? ?
CR nn
A
n?
04.21)1
51144
26
51206
7
481206
199(532 2222 ??
?
??
?
?
?
? ???
解答问题的步骤
3.查相应界值表,确定 P值,下结论 。
?=(R-1)(C-1)=2,查附表 8,
χ 20.005,2= 10.6,本例, χ 2> χ 20.005,
P<0.005,在 α =0.005水平处,拒绝 H0,
接受 H1,三 组率的差别有统计学意义,
可认为三种疗法治疗周围性面神经麻痹
的有效率有差别。
R× C表资料的 三种形式
当行、列数都大于 2时即为 R× C
表的资料,有三种类型:
?双向无序 R× C表资料
?单向有序 R× C表资料
?双向有序 R× C表的资料
某地人群按两种血型划分的结果
人 数ABC
血型 MN 血型 M N MN
合计
O 431 490 902 1823
A 388 410 800 1598
B 495 587 950 2032
AB 137 179 325 641
合计 1451 1666 2977 6094
3种药物疗效的观察结果
人 数
疗效
药物,A B C
合计
治愈
15 4 1 20
显效
49 9 15 73
好转
31 50 45 126
无效
5 22 24 51
合计
100 85 85 270
眼晶状体浑浊度与年龄的关系
眼 数
程度
年龄,20-- 30-- 40--
合计
+
2 15 131 148 494
++
67 101 128 296
+++
44 63 132 239
合计
326 295 408 1029
总 结
重点 2?2表资料的 ?2检验
一般公式:
校正公式:
精确概率 。 若三者结果不同, 以精确概率的
为准 。
要求记住 0.05和 0.01水平的界值, 3.84和
6.63。
))()()((
)( 22
dbcadcba
Nbcad
????
???
))()()((
)5.0|(| 22
dbcadcba
NNbcad
????
????
总 结
对于 R?C资料根据资料的性质用统计
软件计算,如资料 可为 双向无序, 单向有
序, 双向有序 。
两个率的 u检验和 ?2检验的关系:
1.962=3.84,2.582=6.63
2??u
结 束
讲课思路
??2检验的基本思想
?2× 2表资料的 ?2检验 (步骤 )
一般公式
校正公式
?配对资料 的 ?2检验
?行 × 列 表资料的 ?2检验
为何要进行检验?
存在抽样误差。
目的:样本 总体
?2检验 ( chi-square test)
定义, ?2检验是处理 计数 资料的一
种方法,是推断两个或两个以上
样本率或比 之间差 别 是否 有统计
学意义 或两因素间有无关联的问
题。
**第一节 四格表 资料的 χ 2检验
一, ?2检验的基本思想 ( 听懂 )
? ?? T TA
2
2 )(?
结果
组别
阳性 阴性
合计
A a b a+ b
B c d c+ d
合计 a+ c b+ d a+ b+ c+ d= N
观察频数,A
理论频数,TRC=nrnc/N
假设检验流程图 -哲学思想
假设 (两组相同 )
两组数据合并
确定实际频数 A,计算理论频数 T
A- T (A- T)2 (A- T)2/T
?2= ?(A- T)2/T 即为 ?2的基本公式
**第一节 四格表 资料的 χ 2 检验
**二, 基本公式计算
例 7-1 P103。
目的
疗效
组别 有效 无效 合计
试验组 99 5 104
对照组 75 21 96
合计 174 26 200
**二、基本公式计算
步 骤:
1.建立假设, 确定检验水准 α 。
H0, π 1 = π 2, 即试验组与对照组降
低颅内压的总体有效率相等 。
H1, π 1 ≠ π 2, 即试验组与对照组降
低颅内压的总体有效率不等 。
α = 0.05
2.计算检验统计量 。
疗效
组别 有效 无效 合计
试验组 99 ( 90.48 ) 5( 13.52 ) 104
对照组 75 ( 83.52 ) 21 ( 12.48 ) 96
合 计 174 2 6 200
86.12
)( 22
?
?
? ?
T
TA
?
3,确定 P值,下结论 。
ν =(R-1)(C-1)=1,查附表 8,P533.
χ 20.05= 3.84,χ 20.01=6.63,(记住 !u值 )
统计结论, χ 2> χ 20.01,P<0.01
,在 α =0.01水平处, 拒绝 H0,接受 H1,
两组率的差别有统计学意义 。
医学结论, 可以认为两组降低颅内压
总体有效率不等, 即可认为异梨醇口服
液降低颅内压的有效率高于氢氯噻嗪 +地
塞米松的有效率 。
**三, 专用 公式计算
))()()((
)( 22
dbcadcba
Nbcad
????
?
??
86.12
261 7 4961 0 4
2 0 0)7552199( 22 ?
???
?????
两公式比较:计算, 应用, 含义
结果
组别
阳性 阴性
合计
A a b a+ b
B c d c+ d
合计 a+ c b+ d a+ b+ c+ d= N?
??
T
TA 22 )(?
**四, 校正 公式计算
为何校正, 因 χ 2 是连续性的理论分
布,但 2× 2表资料 χ 2 检验处理的资料是
不连续的,是计数资料,故两者有误差,
表现为 计算的 χ 2 值>实际的 χ 2 值,故
所得的 P值偏低,容易出现,假显著,,
为校正,假显著,应作连续性校正。特别是
当 n>=40,但 1=<T<5,(?2略大于 3.84时 )。
))()()((
)5.0|(| 22
dbcadcba
NNbcad
c ????
??
??
解答问题的步骤
例 7-2 P106。
1.建立假设, 确定检验水准 α 。
H0,π 1 = π 2
H1,π 1 ≠ π 2
α =0.05
8对应的理论频数为 4.67。
解答问题的步骤
2.计算检验统计量 。
a=46,b=6,c=18,d=8
不校正 ?2=4.35
14.3
))()()((
)5.0|(| 22
?
????
??
?
dbcadcba
NNbcad
c?
解答问题的步骤
3.查相应界值表,确定 P值,下结论 。
ν =(R-1)(C-1), 查附表 8,
χ 20.05 = 3.84, 本例,χ 2<χ 20.05,
P>0.05,在 α =0.05水平处, 不拒绝 H0,
两者的差别 无统计学意义, 尚不能认为
两种药物治疗脑血管疾病的有效率不等
。
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
免疫荧光法 + - 合计
+ 11 ( a ) 12 ( b ) 23
- 2 ( c ) 33 ( d ) 35
合计 13 45 58
乳胶凝集法
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
1.建立假设、确定检验水准 α 。
H0,B=C,即两种方法的总体检测结果
相同
H1,B≠C, 即两种方法的总体检测结
果不相同
α =0.05
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
2.计算检验统计量。
cb
cb
?
?? 22 )(?
79.5
212
)1|212(|)1( 222
?
?
??
?
?
??
?
cb
cb
c?
1=?
免疫荧光法 + - 合计
+ 11 ( a ) 12 ( b ) 23
- 2 ( c ) 33 ( d ) 35
合计 13 45 58
乳胶凝集法
第二节, 配对四格表资料的 ?2检验
例 7-3 P106
3.确定 P值,下结论。
P<0.05,按 ?=0.05检验水准, 拒
绝 H0,接受 H1,差别有统计学意
义, 可以认为两种方法的检测结
果不同, 免疫荧光法的阳性检测
率较高 。 ( 23/58和 13/58)
第三节, Fisher精确概率 计算
条件, 当 n<40或 T<1时,应该用精确概
率计算。
例 7-4 P108 。 N=36<40。
程序,
DATA A;
INPUT X A B;
CARDS;
4 1 1 18 1 2 5 2 1 6 2 2 ; RUN;
PROC FREQ; WEIGHT X; TABLE A*B/EXACT;
RUN;
4 18
5 6
Statistics for Table of a by b
Statistic DF Value Prob
------------------------------------------------------
Chi-Square 1 2.7500 0.0973
Likelihood Ratio Chi-Square 1 2.6525 0.1034
Continuity Adj,Chi-Square 1 1.5469 0.2136
Mantel-Haenszel Chi-Square 1 2.6667 0.1025
Phi Coefficient -0.2887
Contingency Coefficient 0.2774
Cramer's V -0.2887
WARNING,25% of the cells have expected counts less
than 5,Chi-Square may not be a valid test.
Fisher's Exact Test
----------------------------------
Cell (1,1) Frequency (F) 4
Left-sided Pr <= F 0.1081
Right-sided Pr >= F 0.9795
Table Probability (P) 0.0876
Two-sided Pr <= P 0.1210
Sample Size = 33
实 例
穿新旧两种防护服工人的皮肤炎患病率比较
防护服种类 调查人数 患病人数 患病率 (%)
新 15 1 6.7
旧 28 9 32.1
合 计 43 10 23.3
?2=2.384 ?c2=1.349
Fisher p=0.25
第 四 节 行 × 列 表资料的 χ 2 检验
① 多个样本率比较时, 有 R行 2列, 称为表 R
× 2;
② 两个样本的构成比比较时, 有 2行 C列,
称 2× C表;
③ 多个样本的构成比比较, 以及双向无序分
类资料关联性检验时, 有 R行 C列, 称为 R
× C表 。
以上 3种情况可统称为行列表资料 。
例 7-6,P111。
)1(
2
2 ?? ?
CR nn
A
n?
疗法 有效 无效 合计
物理疗法组 199 7 206
药物治疗组 164 18 182
外用膏药组 118 26 144
合计 481 51 532
?=(R-1)(C-1)
解答问题的步骤
1、检验假设
H0, ?1=?2=?3,即三种疗法治疗周围性面
神经麻痹的有效率相等。
H1, 三种疗法治疗周围性面神经麻痹的有
效率 不全相等 。
α = 0.05
解答问题的步骤
2.计算检验统计量 。
)1(
2
2 ?? ?
CR nn
A
n?
04.21)1
51144
26
51206
7
481206
199(532 2222 ??
?
??
?
?
?
? ???
解答问题的步骤
3.查相应界值表,确定 P值,下结论 。
?=(R-1)(C-1)=2,查附表 8,
χ 20.005,2= 10.6,本例, χ 2> χ 20.005,
P<0.005,在 α =0.005水平处,拒绝 H0,
接受 H1,三 组率的差别有统计学意义,
可认为三种疗法治疗周围性面神经麻痹
的有效率有差别。
R× C表资料的 三种形式
当行、列数都大于 2时即为 R× C
表的资料,有三种类型:
?双向无序 R× C表资料
?单向有序 R× C表资料
?双向有序 R× C表的资料
某地人群按两种血型划分的结果
人 数ABC
血型 MN 血型 M N MN
合计
O 431 490 902 1823
A 388 410 800 1598
B 495 587 950 2032
AB 137 179 325 641
合计 1451 1666 2977 6094
3种药物疗效的观察结果
人 数
疗效
药物,A B C
合计
治愈
15 4 1 20
显效
49 9 15 73
好转
31 50 45 126
无效
5 22 24 51
合计
100 85 85 270
眼晶状体浑浊度与年龄的关系
眼 数
程度
年龄,20-- 30-- 40--
合计
+
2 15 131 148 494
++
67 101 128 296
+++
44 63 132 239
合计
326 295 408 1029
总 结
重点 2?2表资料的 ?2检验
一般公式:
校正公式:
精确概率 。 若三者结果不同, 以精确概率的
为准 。
要求记住 0.05和 0.01水平的界值, 3.84和
6.63。
))()()((
)( 22
dbcadcba
Nbcad
????
???
))()()((
)5.0|(| 22
dbcadcba
NNbcad
????
????
总 结
对于 R?C资料根据资料的性质用统计
软件计算,如资料 可为 双向无序, 单向有
序, 双向有序 。
两个率的 u检验和 ?2检验的关系:
1.962=3.84,2.582=6.63
2??u
结 束