第九章
卡方检验
2011年 7月 17日
主讲内容
第一节 2× 2表卡方 检验
第二节 R× C表卡方检验
第三节 Fisher确切概率检验
第四节 优势比检验
第五节 拟合优度的卡方检验
2011年 7月 17日
卡方检验概述
? 研究目的,率的假设检验(大样本率或小样本率)
? 资料类型,计数资料
? 基本思想,检验中的 是希腊字母,称为卡方
检验,是一种用途较广的计数资料的假设检验方法
,属于非参数检验的范畴,主要是比较两个及两个
以上样本率 ( 构成比)以及两个分类变量的关联性
分析。其根本思想就是在于比较理论频数和实际频
数的吻合程度或拟合优度问题。
2?2?
2011年 7月 17日
检验的应用
? ① 检验两个样本率之间差别的显著性;
? ②检验多个样本率或构成比之间差别的
显著性;
? ③检验两个双向无序分类变量是否存在
关联;
? ④配对计数资料的比较。
2?
2011年 7月 17日
第一节 2× 2卡方检验
一、两独立样本率检验
两独立样本率资料的四格表形式
例 9-1 为研究肿瘤标志物癌胚抗原( CEA)对肺癌
的诊断价值,随机抽取 72例确诊为肺癌的患者为
肺癌组,114例接受健康体检的非肺癌患者为对照
组。用 CEA对其进行检测,结果呈阳性反应者病
例组中 33例,对照组中 10例。问两组人群的 CEA
阳性率有无差异?
2011年 7月 17日
2011年 7月 17日
? 本例资料经整理成表 9-1形式。更一般地说,对
于任何两个独立样本率的资料,均可以表达为表
9-2形式,即有两个处理组,每个处理组的例数
由阳性事件发生数和未发生数两部分组成。表中
有四个基本数据,其余数据均由此四个数据派生
出来,故称此种资料为四格表( fourfold table)
资料。因为四格表资料有 2行 2列,又称四格表为
2× 2表 (2× 2 contingency table)。此类资料比较
的是两种处理的效果,而每种处理只产生两种相
互对立的结果,如生与死,有效与无效,患病与
未患病,阳性与阴性,检出与未检出,等等
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
4.卡方检验的连续性校正问题
? 赞成依据是:这样做可使卡方统计量抽样
分布的连续性和平滑性得到改善,可以降
低 I类错误的概率,连续性校正后的卡方检
验,其结果更接近于 Fisher确切概率法。不
过,校正也不是无条件的,它只适合于自
由度为 1时,样本含量较小,如 n< 40,或
至少有一个格子的理论频数太小,如 T< 5
的情形。
2011年 7月 17日
4.卡方检验的连续性校正问题
? 反对依据是:经连续性校正后,P值有过分
保守之嫌。此外,Fisher确切概率法建立在
四格表双边固定的假定下,而实际资料则
是单边固定的四格表,连续性校正卡方检
验的 P值与 Fisher确切概率法的 P值没有可
比性。
2011年 7月 17日
? 就应用而言,无论是否经过连续性校
正,若两种检验的结果一致,无须在
此问题上纠缠。但是,当两种检验结
果相互矛盾时,如例 9-2,就需要谨慎
解释结果了。
? 为客观起见,建议将两种结论同时报
告出来,以便他人判断。当然,如果
两种结论一致,如均为或,则只报道
非连续性检验的结果即可。
2011年 7月 17日
2011年 7月 17日
二、两相关样本率检验( McNemar)
? 1.资料类型
两个相关样本率资料又称配对计数资料,顾名
思义,是采用配对设计,且结果以频数方式表
达的资料,见例 9-3。
? 例 9-3 某抗癌新药的毒理研究中,将 78只大鼠
按性别、窝别、体重、年龄等因素配成 39对,
每个对子的两只大鼠经随机分配,分别接受甲
剂量和乙剂量注射,试验结果见表 9-4。试分析
该新药两种不同剂量的毒性有无差异。
2011年 7月 17日
2011年 7月 17日
?在上述配对设计的试验中,就每个对子而言,
两种处理的结果不外乎有四种可能,即两只
大鼠均死亡(甲+乙+),两只均生存(甲
-乙-),其中一只死亡(甲+乙- 或 甲-
乙+)。将所有试验的对子汇总后形成表 9-5,
这也是一种四格表类型,即由四个配对试验
结果的数据构成,更一般的表示方法见表 9-5。
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
第二节 R× C表 ?2检验
? 凡反应变量为频数的资料,均可通过列表
形式表达,因为其基本数据有 R行 C列,故
通称行 × 列表或列联表( contingency
table),简称 R× C表。前述四格表,即
2× 2表,是最简单的一种 R× C表形式。
R× C表有多种资料形式,如多个样本率的
比较(如例 9-4),两组百分比的比较(如
例 9-5),多组百分比的比较(如例 9-6)
,等等。
2011年 7月 17日
2011年 7月 17日
一、多个样本率的比较
例 9-4 用 A,B,C三种不同方法
分别处理新生儿脐带,发生
感染的情况见表 9-6,试比较
3种不同方法的脐带感染率
有无差异。
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
例 9-5 为研究某种新药对尿路疼痛的止
痛效果,将有尿路疼痛的患者 144例
随机分为两组,每组 72例,一组服
该新药(治疗组),另一组服安慰剂
(对照组)。两组患者尿路疼痛的原
因见表 9-7,问两组患者尿路疼痛原
因的分布有无差异?
二、两组百分比的比较
2011年 7月 17日
2011年 7月 17日
2,求检验统计量和自由度。将表 9-
7数据代入公式 9-14,有
2011年 7月 17日
? 例 9-6 在某项疼痛测量研究中,给 160例手术
后疼痛的患者提供四种疼痛测量量表,即直观
模拟量表( VAS),数字评估量表( NRS),
词语描述量表( VDS),面部表情疼痛量表(
FPS),患者首选的量表以及患者的文化程度
见表 9-8,问患者首选疼痛量表与文化程度是
否有关?
三、多组百分比的比较
2011年 7月 17日
??P
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
理论频数太小的三种处理方法
1,增大样本量。以达到增大理论频数的目
的,属首选方法,只是有些研究无法增大
样本量,如同一批号试剂已用完等。
2,删去理论频数太小的格子所对应的行或
列。这样做会损失信息及损害样本的随机
性。
3.合并理论频数太小的格子所相邻的行或
列。这样做同样会损失信息及损害样本的
随机性,但损失的信息比第②种方法小一
些。不过,应注意合并得是否合理,如不
同年龄组是可以合并的,但不同血型就不
能合并。
2011年 7月 17日
第三节,Fisher确切概率检验 *
? 确切概率检验是由 Fisher 1934年提出的一种用
于两个独立样本率比较的方法,故又称 Fisher
确切概率法。有人认为,当样本量 n和理论频数
T太小时,如 n< 40而且 T< 5,或 T< 1,或 n<
20,应该用确切概率检验。这一观点所基于的
理论是,当样本量太小时,二项分布的正态逼
近性较差,因而不宜用基于正态分布的检验。
提出上述条件的另外一种考虑是确切概率法的
计算量偏大,但随着计算工具的大大改进,确
切概率法的应用不一定限于上述条件。
2011年 7月 17日
第四节 优势比检验 *
优势比的概念
在观察性研究中,不仅需要分析暴露因
素是否与疾病或死亡等阳性事件有关,
还希望知道它们之间关联的强度,即暴
露较之于非暴露有多大的患病或死亡的
风险。对于前者,用四格表卡方检验即
可,对于后者,就需要用优势比( odds
ratio)来度量了。
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日