第十四章
基于秩次的统计方法
2011年 7月 17日
主讲内容
第一节 两独立样本差别的秩和检验
第二节 配对设计资料的 秩和 检验
第三节 完全随机设计多组差别的秩和检验
第四节 多组差别秩和检验的注意事项
第 五节 Spearman 秩相关
2011年 7月 17日
? 我们常常遇到以下一些资料,如需比较患者和
正常人的血铁蛋白、血铅值等各项指标、护理
效果评分、医疗质量评估等,这类资料有如下
特点:
( 1)资料的总体分布类型未知;
( 2)资料分布类型已知,但不符合正态分布;
( 3)某些变量可能无法精确测量如等级资料。
对这类资料可以采用非参数统计:即不考虑总
体分布类型是否已知,不比较总体参数,只比
较总体分布的位置是否相同的统计方法。此类
资料可以采用非参数方法进行统计分析。
2011年 7月 17日
秩和检验概述
? 研究目的,均数或率的假设检验
? 资料类型,计量、计数或等级资料
? 基本思想,基于秩次(通过编秩,用秩次
代替原始数据信息来进行检验)
即检验各组的平均秩是否相等。如果经检验得
各组的平均秩不相等,则可以推论数据的分
布不同,进一步可推论各分布间分布位置发
生了平移;
2011年 7月 17日
一、秩次和秩和
?,秩”即按数据大小排定的次序号,又称秩次号
。编秩就是将观察值按顺序由小到大排列,并
用序号代替原始变量值本身。用秩次号代替原
始数据后,所得某些秩次号之和,即按某种顺
序排列的序号之和,称为秩和。设有以下两组
数据:
? A组 4.7 6.4 2.6 3.2 5.2
? B组 1.7 2.6 3.6 2.3 3.7
2011年 7月 17日
? 两组各有 5个变量值。现在依从小到大的顺
序将它们排列起来,并标明秩次,结果如
下:
? A组 2.6 3.2 4.7 5.2 6.4
? B组 1.7 2.3 2.6 3.6 3.7
? 秩次 1 2 3 4 5 6 7 8 9 10
2011年 7月 17日
? 原始值中有两个,2.6”,分属 A,B组,它们的秩
次应是 3和 4,然而它们的数值本来是同样大小的
,哪组取,3”,哪组取,4”呢?我们计算它们的
平均数( 3+4) /2=3.5,作为,2.6”的秩次,称
为“平均秩次”,这样才公平合理。这样两组所
得的秩次及秩和如下:
? A组 3.5 5 8 9 10 /35.5
? B组 1 2 3.5 6 7 /19.5
2011年 7月 17日
? 上面 A组和 B组中各有五个原始值,按顺序排
列:最小值设为 1,再按绝对值大小对余下的
变量逐个排序,最大值为两组变量个数之和
10。依次可得 1,2,3.5,3.5,5,6,7,8,9,10。这
10 个序号即是秩次。 A组秩和就是等于
3.5+5+8+9+10=39.5,B组秩和就是等于
1+2+3.5+6+7=19.5。从两组的原始变量值也
可以初步看出,A组偏大,B组偏小。现在得
出的秩和也是 A组大于 B组,与由变量值所观
察到的一致。
2011年 7月 17日
二、怎样编秩
? 编秩就是将观察值按顺序由小到大排列
,并用序号代替原始变量值本身。不同
的实验设计类型,有不同的编秩规则,
2011年 7月 17日
1.配对资料的编秩规则
? 按照配对设计,先求出对子之间的差值
,按其差值的绝对值,从小到大进行排
序,其序号即秩次,并在秩次之前保持
原差值的正负号不变。编秩遇到差值为
零时则舍去不编秩,对绝对值相等的差
值取平均值,并在秩次之前保持原差值
的正负号。一般来说,秩次最小为 1,最
大为对子数 N,当有差值为零时,最大秩
次等于对子数 n减去差值为零的个数。
2011年 7月 17日
2.随机化区组设计资料的编秩规则
? 先将各区组内数据从小到大排序编秩,
遇到相等数据取平均秩次,再将各组的
秩次相加就得到各组的秩和。
2011年 7月 17日
3.完全随机设计的两组或多组资料的
编秩规则
? 将各组变量依据从小到大的顺序进行排序,其序
号即为秩次,如果有多个相等的变量值分布在同
一组中,,则按顺序依次对其编列秩次,如果有
多个相等的变量值分布在不同组中,则按顺序排
序然后取其平均秩次。
2011年 7月 17日
三、怎样选用不同设计的秩和检验方法
? 首先要区分试验设计和资料的类型:
? 若是一个样本资料或者配对设计的资料,来自
非正态总体或总体分布无法确定,可选用
wilcoxon符号秩和检验方法;
? 若是两组独立样本资料,来自非正态分布的定量
资料或有序二分类变量资料(等级资料)宜用
wilcoxon秩和检验;
2011年 7月 17日
? 若是多组独立样本资料,来自非正态总体
或方差不齐(转化后也不满足)的定量资
料或者是有序多分类变量资料(等级资料
)宜用 Kruskal-Wallis秩和检验。
? 若是随机区组设计的自非正态总体或方差
不齐(转化后也不满足)的定量资料,宜
用 Firedman秩和检验。
? 各种类型的秩和检验通常有查表法和正态
近似法两种计算方式,分别适用于不同样
本量的资料。在相同秩次的个数大于样本
量的 25%时需要采用相应的公式进行校正

2011年 7月 17日
第一节 两独立样本差别的秩和检验
? 对于定量数据,如果两独立样本分别来自方差
相等的正态总体的假定成立,就可以用 t检验比
较两样本均数与的差别是否有统计学意义 ;如果
此假定不成立或不能确定是否成立,就不能应
用 t检验,而应采用非参数统计分析方法 —秩和
检验来分析两样本是否来自同一总体。为了直
观地介绍秩和检验,我们从一个实际试验中节
选了两组数据,形成两个样本 A,B:
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
? 所谓秩和就是秩号的和,例如
R1=4+6+10+11+13+14+15+16=89。秩和检验
的检验统计量 T定义为:
?, n1,n2是两组的例数。 ( 14-1)
? 在成立的条件下,T值应接近,其中。如果 T严
重偏离,提示可能是不正确的。当样本例数较小
时,T的分布可以直接写出来,为了便于使用已
制作出 T的检验界值表(见附表 9)。
2011年 7月 17日
2011年 7月 17日
相同秩问题
? 上例中两组数据没有相同的数值,但在
应用中由于测量精度所限,常常出现相
同的数值,编秩时,相同数值当然应具
有相同的秩号,这种情况称为同秩 (ties)
。样本较小时,如果同秩较多,检验结
果会存在偏性,因此应提高测量精度,
尽量避免出现较多的同秩。大样本时,
通过对公式 14-2做适当校正,以减小因
同秩带来的偏性。
2011年 7月 17日
? 例 14-1分别用 5%咪喹莫特软膏和 5-氟脲嘧啶软
膏治疗尖锐湿疣的随机双盲临床研究的疗效观察
结果见表 14-2第 (1)、( 2)列,试比较两种药物
治疗尖锐湿疣的疗效。
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
注意
? 一般文献上使用的方法是 Mann_Whitney
的 U检验法并给出 U统计量。两种方法是
独立提出的,检验结果完全等价的;前
者用 T统计量,而后者用 U统计量,U统
计量有明确含义,为了避免与 T统计量混
淆,不再给出 U统计量的定义。
2011年 7月 17日
第二节 配对设计资料的秩检验
?适用条件:
1.配对设计;
2.如果差数严重偏离正态分布
,但差数的总体分布对称
2011年 7月 17日
例 14-2 采用配对设计,用某种
放射线的 A,B两种方式分别局
部照射家兔的两个部位,观察
放射性急性皮肤损伤程度,见
表 14-3。 比较 A,B的损伤程度
是否不同。
2011年 7月 17日
2011年 7月 17日
? 检验步骤:
? 1,H0:两处理效应相同
? H1:两处理效应不相同。
a=0.05
? 2.编秩号。成对资料编秩号时较为复杂,要
注意三点:
? ( 1)剔去差数为 0的数据;
? ( 1)余下的 n个差数按绝对值自小至大排秩
号,但排好后秩号要保持原差数的正负号;
? ( 2)差数绝对值相等时,要以平均秩号表示
,如表 14-3中差数绝对值为 4者共三个,其秩号
依次应为 2,3,4,现皆取平均秩号 3;
2011年 7月 17日
? 3.求秩号和即将正、负秩号分别相加,本例得
正秩号和为 68,负秩号和为 10,正负秩号绝对
值之和应等于 n(n+1)/2,可用以核对,如本例
68+10=12(12+1)/2=78,说明秩号计算正确。
? 4,检验统计量 R取较小一个秩号和,根据 R值查
附表 10进行判断,该表左侧为对子数,表身内部
是较小秩号和,与上端纵标目之概率 a=0.05,
a=0.01相对应,其判断标准是(注意此处与其它
检验方法的区别):
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
校正问题
? 如果存在多个差数的绝对值相等,即有
相同的秩号,有必要对公式 14-5计算的 u
值作校正:
2011年 7月 17日
2011年 7月 17日
第三节 完全随机设计
多组差别的秩和检验
? 适用条件:
1.完全随机设计的多组均数比较 ;
2,试验观测结果严重偏离正态分布
3.组间方差不齐,
4.观测结果是有序的
?基本思想,如果各组均来自同一总
体,则各组的平均秩和近似相等
2011年 7月 17日
? 例 14-3 为了研究精氨酸对小鼠截肢
后淋巴细胞转化功能的影响,将 21
只昆明种小鼠随机等分成 3组:对照
组 A、截肢组 B、截肢后用精氨酸治
疗组 C。实验观测脾淋巴细胞对 HPA
刺激的增值反应,测量指标是 3H吸
收量,数据如下:
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
两两比较问题
2011年 7月 17日
第四节 多组差别秩和检验的注意事项
注意 1
? 优点:要求满足的条件宽松,分析结果
比较稳健。
? 缺点:当数据满足参数统计分析的要求
的时候,仍选择使用的话会损失数据的
信息。
2011年 7月 17日
注意 2
? Wilcoxon(Mann-Whitney)法和 Kruskal-
Wallis法本质上是相同的,即检验各组的
平均秩是否相等。如果经检验得各组的
平均秩不相等,则可以推论数据的分布
不同,进一步可推论各分布间分布位置
发生了平移;反之,即使各组平均秩相
等,也不能说明数据的分布相同,
2011年 7月 17日
注意 3
? 另外,Wilcoxon(Mann-Whitney)法和
Kruskal-Wallis检验统计量的同秩校正公
式计算比较复杂,可以借助第十一章完
全随机设计资料方差分析中离差平方和
分解的思想计算检验统计量,计算出的
检验统计量与用校正公式计算的相等。
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
第五节 Spearman秩相关
? 适用条件:求两变量的相关系数,当 X、
Y并不服从二元正态分布,对数据做秩变
换后再计算直线相关系数,用 rs记之 。
可间接反应 X,Y间的相关性而且不依赖
于 X,Y的分布,称之为 Spearman秩相
关系数。
2011年 7月 17日
?例 14-4 调查了某地区 10个乡
的钉螺密度与血吸虫感染率
( %)数据如表 14-7。试分
析该地区螺密度与感染率之
间有无相关关系?
2011年 7月 17日
2011年 7月 17日
?由于本例数据涉及感染率,
而率一般不服从正态分布,
故计算 Spearman秩相关。
将表中数据代入公式 14- 9
,得 rs=0.817
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
2011年 7月 17日
小结
1,多个样本两两比较的秩和检验
同样的,多个样本组比较的秩和检验,如拒绝 H0,只说明比
较各组的总体分布位置不同或不全相同,应在此基础上进行两两
比较,常用 Nemenyi法。
2,秩和检验的优缺点
秩和检验的优点是
( 1)不受总体分布限制,适用面广;
( 2)适用于等级资料及两端无缺定值的资料;
( 3)易于理解,易于计算。
缺点是符合参数检验的资料,用秩和检验,则不能充分利用
信息,检验效能低。
3,应用中的注意事项:
( 1)注意应用条件;
( 2)编秩时相同值要取平均秩次;
( 3)相同秩次较多时,统计量要校正