第八章
秩转换的非参数统计
概 念
不受总体参数的影响,不要求总体呈某
种特定分布的统计推断方法。
秩转换:将数值转换成秩,再计算检验统计量
参数( 总体指标 )
统计量( 样本指标 )
参数统计( 有条件的 )
非参数统计( 无条件的 )
只检验分布,而不检验参数。
非参数检验的特点
1,不必考虑样本分布 。
2,资料可用, 等级,,, 符号, 表示, 收
集方便, 但资料粗糙 。
3,方法简便, 易于理解和掌握 。
缺点:损失信息, 效率低 。
非参数检验的适用情况
⒈ 等级资料 。
⒉ 偏态分布资料 。
⒊ 个别数据偏离过大资料 。
⒋ 各组离散程度相差悬殊 ( 方差
明显不齐 ) 的资料 。
⒌ 分布形态不明的资料 。
符合条件 首选参数检验
不符合条件 非参数检验
凡符合或经过变换后符合参
数法条件的资料,最好用参数法
检验。当资料不具备用参数法的
条件时,非参数法是一种有效的
分析方法。
注 意
**秩和检验
**1、配对资料的秩和检验 ( Wilcoxon配对法)
**2、两样本比较的秩和检验 (Wilcoxon两样本法 )
*3,Wilcoxon两样本法用于检验等级资料
*4、完全随机设计资料的秩和检验 (Kruskal-Wallis
两样本法 )
*5、随机区组设计资料的秩和检验 (Friedman法 )
6、多个样本间两两比较的秩和检验
7、各实验组与对照组比较的秩和检验
第一节
配对样本比较的 Wilcoxon符
号秩检验
(Wilcoxon signed rank test)
*配对资料的秩和检验P123 例 8-1
1、假设
H0,Md=0,
H1,Md?0,?=0.05
2、计算
求差值,编差值的秩
号,求秩和
3、下结论
(1)查表法 (n<=50),附表 9
(2)公式计算 (n>50)。
24/)12)(1(
4/)1(
??
???
nnn
nnTu
=1.9116
编号 ( 1 )
原法
(2 )
新法
(3 )
差值 d
(4)=( 3 ) - (2)
秩次
( 5 )
1 6 0 8 0 2 0 8
2 142 152 1 0 5
3 195 243 4 8 1 1
4 8 0 8 2 2 1,5
5 242 240 - 2 - 1,5
6 220 220 0
7 190 205 1 5 7
8 2 5 3 8 1 3 6
9 212 243 3 1 9
10 3 8 4 4 6 4
11 236 200 - 36 - 10
12 9 5 100 5 3
?
T
= 5 4,5
?
T
= 1 1,5
2
)1(94.2018.10 ?????
??
nnTTSd
d
当相同的值较多时,求得的 u值偏
小,需用校正公式:
? tj为第 j个相同数值的个数, 如本例相同数值的
有 1个, 有两个数, 即 t1=2,代入校正公式,
u=1.9106,结论相同 。
?本例资料若做 t检验, 得 t=1.6023,p>0.05,差
别无统计学意义, 结论相同 。
48
)(
24
)12)(1(
|4/)1(
3? ?
?
??
??
?
jj ttnnn
nnT
u
单个样本中位数与总体中位数比较
?介绍思路
?假设,M=45.3
?求差、编秩、求和
?查表,n=11,T=1.5,P<0.005,差别有
统计学意义,可认为该厂工人的尿氟含
量高于当地正常人的尿氟含量。
μúò????èμú?t???èμúèy???èμú?????è??2? 20.427.49020.4?÷ 30.638.634.631.6±±2? 45.946.94543.9
**第二节 两个独立样本
比较的 Wilcoxon秩和检验
( Wilcoxon rank sum test)
**一、两样本比较的秩和检验P66 例 7-2。
1、假设
H0,Md1=Md2(总体分布位置相同 )
H1,Md1>Md2,(单侧 )
?=0.05
2、计算:排队,编秩,
两组统一编秩号,并规定
n1?n2,以 n1组的秩和为统计
量 T值,本例 n1=10,n2=12,
T=141.5。
肺癌病人 矽肺工人
RD 值 秩次 RD 值 秩次
2.78 1 3.23 2.5
3.23 2.5 3.50 4
4.20 7 4.04 5
4.87 14 4.15 6
5.12 17 4.28 8
6.21 18 4.34 9
7.18 19 4.47 10
8.05 20 4.64 11
8.56 21 4.75 12
9.60 22 4.82 13
4.95 15
5.10 16
n
1
=10 T
1
= 141,5 n
2
=1 2 T
2
= 1 11,5
F=16.84 p<0.0001
3、下 结论
( 1) 查表法 。 T=141.5。 当 n1?10,n2-n1?10时, 查附表 10,
P535,T界值表 。 在范围之外有统计学意义, 本例 P<0.05,按
?=0.05水准拒绝 H0,接受 H1,两组的差别有统计学意义, 故
可认为肺癌病人的 RD值高于矽肺 0期工人的 RD值 。
( 2) 计算法 。 当 n1>10,n2-n1>10时, 用正态近似法计算 。
N=n1+n2,u=1.74<u0.05=1.67,p<0.05。 (在界值附近 )
tj为第 j个相同数值的个数, 本例 t1=2,
**一、两样本比较的秩和检验
)
)(
1(
12
)1(
2/)1(
3
3
21
1
NN
ttNnn
NnT
u
jj
?
?
?
?
??
?
?
二、两样本等级资料的比较
P 128 例 8-4。
表 8 – 6 吸烟工人和不吸烟工人的 HbCO ( % ) 含量比较
秩 和
吸烟工人 不吸烟工人
含量
( 1 )
吸烟工人
( 2 )
不吸烟工人
( 3 )
合计
( 4 )
秩范围
( 5 )
平均秩
( 6 )
( 7 ) =( 2 )( 6 ) ( 8 ) = ( 3 )( 6 )
很低 1 2 3 1 ~ 3 2 2 4
低 8 23 31 4 ~ 34 19 152 437
中 16 11 27 35 ~ 61 48 768 528
偏高 10 4 14 62 ~ 75 68.5 685 274
高 4 0 4 76 ~ 79 77.5 310 0
合计 39( n
1 ) 40( n 2 ) 79 — — 1917( T 1 ) 1243( T 2 )
n1 n2 T
二, 两样本等级资料的比较
8940.07979 )44()1414()2727()3131()33(1 3
33333
?? ???????????C
确定 P值并得出推断结论,u0.01/2<u,0.01>P,故按
双侧 α=0.01水准,拒绝 H0,接受 H1。 两者的差别有统
计学意义, 认为吸烟工人的 HbCO含量高于不吸烟工
人的 。
)
)(
1(
12
)1(
2/)1(
3
3
21
1
NN
ttNnn
NnT
u
jj
?
?
?
?
??
?
?
7 0 2 3.3
8 9 4 0.0
12
)179(4039
2/)179(391 9 1 7 ?
???
????u
C 校正
*第三节、完全随机设计多个样
本比较的 Kruskal-Wallis H检验
例 8-5 p130。比较三组的死亡率。
表 8 – 9 三种药物杀灭钉螺的死亡率 % 比较
甲 药 乙 药 丙 药
死亡率 秩 死亡率 秩 死亡率 秩
32.5 10 16.0 4 6.5 1
35.5 11 20.5 6 9.0 2
40.5 13 22.5 7 12.5 3
46.0 14 29.0 9 18.0 5
49.0 15 36.0 12 24.0 8
R
i
63 — 38 — 19
n
i
5 — 5 — 5
*一,多样本比较的秩和检验
1.建立检验假设:
H0:三个处理组总体分布相同;
H1:三个总体的分布不同或不全相同 。
?=0.05。
2.计算
编秩:将各组由小到大排队, 再将三个组的数据统一
编秩 。
编秩中,
若有相同的数据在同一组内,其秩次按位置顺序编号 ;
若相同的数据在不同组内, 则取其平均秩次 。
求秩和:将各组秩次相加, 得 Ri。
*一,多样本比较的秩和检验
计算统计量 H值:
式中 ni为各组观察值个数;, 为各组
观察值例数之和 。 将本例数据代入得
=9.74
? ???? )1(3)1( 12
2
N
n
R
NN
H
i
i
?? inN
)115(3
5
19
5
38
5
63
)115(15
12 222 ??
???
?
???
? ??
?
?H
*一,多样本比较的秩和检验
3.确定 P值并作出推断结论:
( 1) 查表法:附表 11,P536,若组数 k=3,每
组例数 ≤5,可查表得出 P值 。
( 2) 计算法:若 k≥4,最小样本例数不小于 5
,则 H近似服从 ?=k-1的分布,可查附表 8,
P533,的界值表得出 P值 。 本例组数 k=3,查
表, H>H0.01, P<0.01,按 ?=0.01水准拒绝
H0,接受 H1,差别有统计学意义, 认为三
种药物杀灭钉螺的死亡率不同 。
二、频数表资料的多样本比较
表 8- 1 1 四种疾病患者痰液内的嗜酸性白细胞比较
白细胞
支气管扩

肺水肿 肺癌
病毒性呼
吸道感染
合计 秩范围 平均秩
⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻
- 0 3 5 3 11 1 ~ 11 6
+ 2 5 7 5 19 12 ~ 30 21
++ 9 5 3 3 20 31 ~ 50 40,5
+++ 6 2 2 0 10 51 ~ 60 55,5
i
R
73 9.5 43 6.5 40 9.5 24 4.5 ─ ─ ─
i
n
17,0 15 17 11 60 ─ ─
i
R
43,50 29,10 24,09 22,23 ─ ─ ─
? ???? )1(3)1( 12
2
N
n
R
NN
H
i
i
Hc=H/C ? ???? )/()(1 33 NNttC jj
*第四节,随机区组资料的
秩和检( Friedman M法)
P302 例 16.7
步骤:
1、假设:处理组和单位组
2、列表
3、编秩号:处理组、单位组
4、求秩号合计 Ri,并写出组数
5、求 H,下结论
补充 1:多个样本间两两比较
的秩和检验
1,各样本秩和从大到小排列
2、
3,查表下结论 ( 此法仅适用于各组样
本含量相等的资料 )
BA RR
BA
s
RRq
?
??
12
)1)(( ?
??
nanan
s
BA RR
补充 2、各实验组与对照组
比较的秩和检验
1,各样本秩和从大到小排列
2、
3,查表下结论(此法仅适用于各组样本含量相
等的资料)
CT RR
CT
s
RRq
?
??? ||
6
)1)(( ?
??
nanan
s
CT RR
结 束