第八章 秩转换的 非参数 检验非参数检验的概念:
非参数检验是指对原始资料无特殊要求(如正态分布、总体方差相等)的一类检验方法,它不是比较参数,而是比较分布的位置。不符合 t 检验和 F检验的数值变量资料可用秩和检验,此外,秩和检验还可用于两组或多组等级资料以及“开口”
资料的比较。等级相关也属于非参数检验。
非参数检验的优点:
1.应用范围广;
2.易于理解和掌握;
3.多数计算简便。
非参数检验的缺点:
1.检验效率较低;
2.少数计算较复杂。
秩转换的非参数检验简称 秩和检验,分析时先将数值变量资料从小到大,或等级变量资料从弱到强转换成秩次,再求出秩次之和以及相应的检验统计量,并与理论值比较后确定 P值,最后 P值与 α
比较作出相应的判断。
第一节 配对样本比较的符号秩和检验一、配对样本差值的中位数和 0(总体中位数) 比较例 8-1 对 12份血清分别用原方法(检测时间 20
分钟)和新方法(检测时间 10分钟)测谷 -丙转氨酶,结果见表 8-1的第( 2)、( 3)栏。问两法所得结果有无差别?
表 8-1 12份血清用原法和新法测血清谷 -丙转氨酶
( nmol· S-1/L)的比较编 号 原 法 新 法 差 值 正 秩 负 秩
(1) (2) (3) ( 4) (5) (6)
1 60 76 16 8
2 142 152 10 5
3 195 243 48 11
4 80 82 2 1.5
5 242 240 - 2 1.5
6 220 220 0
7 190 205 15 7
8 25 38 13 6
9 198 243 45 9
10 38 44 6 4
11 236 190 - 46 10
12 95 100 5 3
合 计 ─ ─ ─ 54.5 11.5
1.建立假设,确定检验水准:
2,计算检验统计量:
( 1)计算差值,见上表。
( 2)按差值的绝对值从小到大编秩次,见上表。
注意,
a,如有差值相等,应求平均等级,
b.如果差值有 0,则按以下方法处理:
①舍去不计;
②所占等级秩和正负各半。
,双侧检验。;差值的总体中位数
05.0,0:
0:
1
0

d
d
MH
MH
(3)计算正负秩和,
= 54.5,= 11.5
(4)确定检验统计量 T
任取 和 为 T,本例取 T =11.5。
3.确定 P 值,作出推论:
( 1) n≤50,查表法。本例 n=11,查附表 9得本例 11.5在此范围内,故 P >0.05,按 α =0.05
水准,不拒绝 Ho 还不能认为 两法测定结果有差别。
( 2) n>50,u 检验。
T?T
,~为,56101105.0T
T?T
24/)12)(1(
5.04/)1(


nnn
nnT
u
48/)(24/)12)(1(
5.04/)1(
3
jj ttnnn
nnT
u


当相同秩次较多时:
个相同秩次的个数。为第式中 jt j
二、单个样本中位数和总体中位数比较例 8-2 已知某地正常人尿氟含量的中位数为
45.30。今在该地某厂随机抽取 12名工人,测得尿氟含量见表 8-2第( 1)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?
表 8-2 12名工人的尿氟含量( )与 45.30比较编 号 尿氟含量 差值 正 秩 负 秩
1 44.21 - 1.09 1.5
2 45.30 0
3 46.39 1.09 1.5
4 49.47 4.17 3
5 51.05 5.75 4
6 53.16 7.86 5
7 53.26 7.96 6
8 54.37 9.07 7
9 57.16 11.86 8
10 67.37 22.07 9
11 71.05 25.75 10
12 87.37 42.07 11
合 计 ─ ─ 64.5 1.5
mol/L?
1.建立假设,确定检验水准:
2,计算检验统计量:
( 1)计算差值,见上表。
( 2)按差值的绝对值从小到大编秩次,见上表。
,单侧检验。;位数工人尿氟含量的总体中
05.0,0:
30.45:
1
0

MH
MH
(3)计算正负秩和,
= 64.5,= 1.5
(4)确定检验统计量 T
任取 和 为 T,本例取 T =1.5。
3.确定 P 值,作出推论:
本例 n=11,查附表 9得 P < 0.005,按 α =0.05水准,拒绝 Ho,可认为 该厂工人的尿氟含量高于当地正常人的尿氟含量。
T?T
T?T
三、本法的基本思想:
如果检验假设成立,那么由于随机测量误差的原因,各对数据的差值既可以是正值也可以是负值,也就是说它们的秩次之和应该接近。但是,
如果 相差过大,则有理由拒绝检验假设。
此外,当 n 确定后,总秩和为一定值,总秩和
=n(n+1)/2,如果 大则 小。每一对的概率分布也具有一定的规律,而且在 n足够大时近似正态分布,因此除了用查表法,还可采用 u检验法。 从 u值的计算公式中可以看出,如果实际秩和与平均秩和相差过大,则有理由拒绝 H0。
TT 和
T?
T TT 和第二节 完全随机设计两组资料比较一、两组计量资料比较例 8-3 对 10例肺癌病人和 12例矽肺(硅沉着病)
0期工人用 X线片测量肺门横径右侧距 RD( cm),
结果见表 8-5。问肺癌病人的 RD值是否高于矽肺 0
期工人的 RD值?
表 8-5 肺癌病人和矽肺 0期工人的 RD值( cm)比较肺癌病人 矽肺 0期工人
RD值 秩次 RD值 秩次
2.78 1 3.23 2.5
3.23 2.5 3.50 4
4.20 7 4.04 5
4.87 14 4.15 6
5.12 17 4.28 8
6.21 18 4.34 9
7.18 19 4.47 10
8.05 20 4.64 11
8.56 21 4.75 12
9.60 22 4.82 13
4.95 15
5.10 16
1 10n? 1 1 4 1,5T? 2 12n? 2 1 1 1,5T?
1,建立假设,确定检验水准,
H0,肺癌病人和矽肺 0期工人的 RD值 总体分布位置相同(总体中位数相同);
H1,肺癌病人和矽肺 0期工人的 RD值 总体分布位置不同。 α =0.05,双侧检验。
2,计算检验统计量:
( 1)编秩次 将两组变量值混合编秩,如有数据相同则求平均秩次,见上表。
( 2)求秩和 肺癌病人 秩和= 141.5
矽肺 0期工人 秩和= 111.5
( 3)确定检验统计量 T
一般规定当 则以 组秩和为 T值,
当 则任取一组秩和为 T值。
本例 T= 141.5
4.确定 P 值,作出推论:
( 1)查表法 查附表 10,本例查得 值的范围为 89~ 141,141.5已超出此范围,故 P< 0.05,按 α =0.05拒绝 H0,接受 H1,说明肺癌病人的 RD值高于矽肺 0期工人的 RD值。
,21 nn?
,21 nn? 1n
,21 nn?
,101?n
,101?n,212 nn
05.0T
( 2)正态近似法 u 检验 如果 n超出附表 10范围,则用以下公式计算 u值,进行 u检验:


NN
ttnnnn
nnnT
u
jj
3
3
2121
211
1
12
)1(
2/)1(
)(

NN
tt
C jj
3
3
1
)(

本法的基本思想为:
如果检验假设成立,则两组的秩和应较接近,
若两组的秩和相差过大,的秩和就会超出理论分布范围,因此有理由拒绝 H0 。
此外,当 确定后,总秩和为一定值,
总秩和 =,每一对秩和的概率分布也具有一定的规律,而且在 n足够大时近似正态分布,因此除了用查表法,还可采用 u检验法。
从 u值的计算公式中可以看出,如果实际秩和与理论秩和相差过大,则有理由拒绝 H0。
1n
Nnn 21
2/)1( 21 nnN
例 8-4 39名吸烟工人和 40名不吸烟工人的碳氧血红蛋白 HbCO(%)含量见表 8-6。问吸烟工人的 HbCO(%)含量是否高于不吸烟工人的 HbCO(%)含量?
表 8-6 吸烟工人和不吸烟工人的 HbCO(%)含量比较含量 吸烟 不吸烟 合 秩次 平均 秩和工人 工人 计 范围 秩次 吸烟 不吸烟
(1) (2) (3) (4) (5) (6) (7)=(2)× (6) ( 8)=(3)× (6)
很低 1 2 3 1~ 3 2 2 4
低 8 23 31 4~ 34 19 152 437
中 16 11 27 35~ 61 48 768 528
偏高 10 4 14 62~ 75 68.5 685 274
高 4 0 4 76~ 79 77.5 310 0
合 计 39( ) 40( ) 79( ) ─ ─ 1917( ) 1243( )1n 2n
1T
2TN
二、两组频数表或等级资料比较
1,H0,吸烟工人和 40名不吸烟工人的碳氧血红蛋白含量分布相同;
H1,吸烟工人和 40名不吸烟工人的碳氧血红蛋白含量 分布不同,α =0.05。
2,计算两组秩和:见上表。
3,计算 u值:本例总例数超出查表范围,故应采用 u检验,
而且相同等级较多,u值须作教正。
5 2 2 3 0)44()1414(
)2727()3131()33(
33
3
3
33

)( jj tt
7 0 2 3.3
7979
5 2 2 3 0
1
12
)179(4039
|2/)179(391 9 1 7|
1
12
)1(
|2/)1(|
3
3
3
2121
211




NN
ttnnnn
nnnT
u
jj
)(

4.确定 P值,作出判断,3.7023>1.96,P<0.05,说明吸烟工人的碳氧血红蛋白含量高于不吸烟工人。。
三,Mann-Whitney U检验某试验室在缺氧条件下观察猫和兔各 4只的生存时间 (小时)结果如下,试比较缺氧条件下猫和兔的生存时间是否有差别?
A组 7 4 9 17
B组 11 6 14 21以上原始数据 4 6 7 9 11 14 17 21以上组 别 A B A A B B A B
U= 0+ 1+ 1+ 3= 5
U’= 1+ 3+ 3+ 4= 11
U + U’= = 5+ 11= 4× 4= 16
21 nn?
将 AB两组数据从小到大排列,清点位于 A组每个数据前 B组数据的个数总和,即 U值,
如果 A组数据都比 B组数据大,则 U值最大,且=,
如果 A组数据都比 B组数据小,则 U值最小,且 U= 0,
如果 AB两组数据相间出现,说明两组数据大小相差不大,此时 U值较为适中。
根据 U值的大小可用查 U值表判断两数据相差有无显著性,样本较大时可用正态近似法 u检验。
21 nn?


NN
ttNnn
nnU
u
jj
3
3
21
11
1
12
)1(
|2/|
)(

第三节 完全随机设计多组资料比较一,H检验
1.原始数据的多个样本比较例 8-5 用三种药物杀灭钉螺,每批用 200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率( %),结果见表 8-9。问三种药物杀灭钉螺的效果有无差别?
表 8-9 三种药物杀灭钉螺的死亡率( %)比较甲药 乙药 丙药死亡率 秩次 死亡率 秩次 死亡率 秩次
32.5 10 16.0 4 6.5 1
35.5 11 20.5 6 9.0 2
40.5 13 22.5 7 12.5 3
46.0 14 29.0 9 18.0 5
49.0 15 36.0 12 24.0 8
63 ─ 38 ─ 19
5 ─ 5 ─ 5in
iR

74.9)115(3
9
193863
)115(15
12
)1(3/)1(/12
222
2


NnTNNH
ii
1)假设:
H0:三种药物杀灭钉螺的死亡率总体分布位置相同;
H1:三种药物杀灭钉螺的死亡率总体分布位置不全相同,
α= 0.05。
2)计算检验统计量 H值:
( 1)编秩次:将三组变量值混合编秩,如有数据相同则求平均秩次,见上表。
( 2)求秩和:三组的秩和分别为 63,38,19。
( 3)计算 H值:
( 1)当 g= 3,查 H界值表(附表 11)。
按 α=0.05水准拒绝 H0,,接受 H1,说明三种药物杀灭钉螺的死亡率总体分布位置不全相同。
( 2)当 g >3,或 g = 3,查 界值表,
3)确定 P值,作出判断:
,2131 k?
2?
,5?in
。,05.0,78.574.978.505.0 PH
,5?in
例 8-6 比较小白鼠接种三种不同菌型伤寒杆菌 9D,11C和
DSC1后存活日数,结果见表 8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?
表 8-10 接种三种不同菌型伤寒杆菌的存活日数比较
9D 11C DSC1
存活日数 秩 存活日数 秩 存活日数 秩
2 2 5 10.5 3 4.5
2 2 5 10.5 5 10.5
2 2 6 15.5 6 15.5
3 4.5 6 15.5 6 15.5
4 7 6 15.5 6 15.5
4 7 7 21 7 21
4 7 8 24 7 2
5 10.5 10 26.5 9 25
7 21 12 30 10 26.5
7 21 11 28.5
11 28.5
84 ─ 169 ─ 212
10 ─ 9 ─ 11
8.40 ─ 18.78 ─ 19.27
iR
in
iR

77.9)130(3
11
2 1 2
9
1 6 9
10
84
)130(30
12
)1(3/)1(/12
222
2


++
NnTNNH
ii
CHH c /?
97.998.0/77.9cH
98.0
3030
)22()22()22()33(
1
)/()(1
3
3333
33


NNtTC ii
。,,05.0,99.597.999.52 205.0 P?
如果 H已大于理论值则可不作校正。
2.多组频数表或等级资料比较例 8-7 四种疾病患者痰液内嗜酸性粒细胞的检查结果见表
8-11。问四种疾病患者痰液内的嗜酸性粒细胞有无差别?
表 8-11 四种疾病患者痰液内的嗜酸性粒细胞比较白细胞 支气管 肺水肿 肺癌 病毒性呼 合计 秩范围 平均秩扩张 吸道感染
⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻
- 0 3 5 3 11 1~ 11 6
+ 2 5 7 5 19 12~ 30 21
++ 9 5 3 3 20 31~ 50 40.5
+++ 6 2 2 0 10 51~ 60 55.5
739.5 436.5 409.5 244.5 ─ ─ ─
17 15 17 11 60 ─ ─
43.50 29.10 24.09 22.23 ─ ─ ─
iR
in
iR

28.14160(3
11
5.2 4 4
17
5.4 0 9
15
5.4 3 6
17
5.7 3 9
)160(60
12
)1(3/)1(/12
2222
2


+++
NnTNNH
ii
H已大于理论值则可不作校正。
本法的基本思想为:
如果检验假设成立,则各组的秩和应较接近,H值不应该太大,若各组的秩和相差过大,
H值就会超出理论界值,因此有理由拒绝 H0 。
二、多个样本的两两比较例 8-8 对例 8-6资料(表 8-10)作三个样本间的两两比较。
。1,
11
12
)1(
)( 22

g
C
nn
NN
RR
ji
ii

99.52 205.0?,?
72.6
98.0
9
1
10
1
12
)130(30
)78.1840.8( 22
21?


0 1 6.02 3215.8231 =
第四节 配伍设计多个样本比较一,M检验患者编号 治疗前
1 周 2 周 3 周
1 62 ② 188 ④ 139 ③ 54 ①
2 90 ① 238 ④ 220 ③ 144 ②
3 54 ① 300 ④ 83 ② 92 ③
4 45 ① 140 ③ 213 ④ 100 ②
5 54 ② 175 ④ 150 ③ 36 ①
6 72 ① 300 ④ 163 ③ 90 ②
7 64 ① 207 ④ 185 ③ 87 ②
R
i
( 秩和 ) 9 27 21 13
表 23 - 5 某方剂治疗血吸虫病患者 A L T 变化表治疗后例 8-9 8名受试对象在相同实验条件下分别接受 4种不同频率声音的刺激,他们的反应率( %)资料见表 8-12。
问 4种频率声音刺激的反应率是否有差别?
表 8-12 4种不同频率声音刺激的反应率 ( %) 比较受试号 频率 A 频率 B 频率 C 频率 D
反应率 秩 反应率 秩 反应率 秩 反应率 秩
1 8.4 1 9.6 2 9.8 3 11.7 4
2 11.6 1 12.7 4 11.8 2 12.0 3
3 9.4 2 9.1 1 10.4 4 9.8 3
4 9.8 2 8.7 1 9.9 3 12.0 4
5 8.3 2 8.0 1 8.6 3.5 8.6 3.5
6 8.6 1 9.8 3 9.6 2 10.6 4
7 8.9 1 9.0 2 10.6 3 11.4 4
8 7.8 1 8.2 2 8.5 3 10.8 4
─ 11 ─ 16 ─ 23.5 ─ 29.5
iR
1.假设:
H0,4种不同频率声音刺激的反应率总体分布位置相同;
H1,4种不同频率声音刺激的反应率总体分布位置不全相同,α= 0.05。
2,计算检验统计量 M值:
( 1)编秩次:将每个区组的数据由小到大编秩,
如有数据相同求平均秩次;
( 2)求处理组秩和:四组的秩和分别为 11,16、
23.5,29.5。
( 3)计算 M值:
3.确定 P值,作出判断:
当 n≤15,g≤15,查 M界值表。
当 n>15,g>15,计算 值,查 界值表
,81.72 305.0?,?
5.1 9 9
4
)1(
)(
22
22 ggnRRRM
ii
2?
96.14
)1(
122

gng
M
2?
3141 g?
本法的基本思想为:
如果检验假设成立,则各组的秩和应较接近,M值不应该太大,若各组的秩和相差过大,M值就会超出理论界值,因此有理由拒绝 H0 。
F近似法(略)
二、两两比较- q检验。
误差MSn
RR
q
ji
69.0
)1)(1(
)(
12
11
6
)12)(1( 3




gn
ttR
n
ggng
MS
jji
误差表 8- 15 两两比较表对比组 q ν a P
A与 D 7.87 21 4 <0.01
A与 C 5.32 21 3 <0.01
A与 B 2.13 21 2 >0.05
B与 D 5.75 21 3 <0.01
B与 C 3.19 21 2 <0.05
C与 D 2.55 21 2 >0.05
结束