第十一章 非参数检验非参数检验是一种与总体分布状况无关的检验方法,它主要是 利用样本数据之间的大小比较及大小顺序,对样本及其所属总体作差别检验,而不对总体分布的参数如平均数、标准差等进行估计推断。
优点 — 计算简便,直观,
— 易于掌握,检验速度较快缺点 — 降低了检验的准确性,效率一般要低于参数检验方法本章只介绍常用的
— 符号检验( sign test)
— 秩和检验( rank-sum test)
— 等级相关分析( rank correlation
analysis)
第一节 符号检验一、配对资料的符号检验二、样本中位数与总体中位数比较的符号检验一、配对资料的符号检验
1、建立假设无效假设 HO:两处理差值 d总体中位数 =0
备择假设 HA:两处理差值 d总体中位数 ≠0
或 d总体中位数< 0 (一尾检验)
或 d总体中位数> 0(一尾检验)
2,计算差值并赋予符号
d> 0者记为,+”,总个数记为 n+
d< 0者记为,-,,总个数记为 n-
d=0记为,0”,总个数记为 n0
n= n++ n-
检验的统计量为 K 为 n+,n-中的较小者
3、统计推断由 n查附表 15得临界值 K0.05(n),K0.01(n),作统计推断:
如果 K> K0.05(n),P> 0.05,则不能否定 HO,
两个试验处理差异不显著;
如果 K0.01(n) < K≤K0.05(n),0.01<
P≤0.05,则否定 HO,接受 HA,两个试验处理差异显著;
如果 K≤K0.01(n),P≤0.01,则否定 HO,接受
HA,两个试验处理差异极显著。
【 例 11.1】 某研究测定了噪声刺激前后 15头猪的心率,结果见表 11-1。问噪声对猪的心率有无影响?
表 11-1 猪噪声刺激前后的心率 (次 /分钟)
猪 号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
刺激前 61 70 68 73 85 81 65 62 72 84 76 60 80 79 71
刺激后 75 79 85 77 84 87 88 76 74 81 85 78 88 80 84
差 值 -14 -9 -17 -4 1 -6 -23 -14 -2 3 -9 -18 -8 -1 -13
符 号 - - - - + - - - - + - - - - -
1,提出无效假设与备择假设
HO,噪声刺激前后猪的心率差值 d总体中位数
=0;
HA,噪声刺激前后猪的心率差值 d总体中位数
≠0。
2,计算差值并赋予符号 噪声刺激前后的差值符号列于表 11-1第 4行和第 5行,从而得 n+=2,n-=13,n=2+13=15,
K=min{ n+,n-} = n+=2 。
3,统计推断 当 n=15时,查附表 11 得 临 界 值
K0.05(15)=3,K0.01(15) = 2,因 为 K = 2 =
K0.01(15),P≤0.01,表明噪声刺激对猪的心率影响极显著。
二、样本中位数与总体中位数比较的符号检验
1,建立假设
HO:样本所在的总体中位数 =已知总体中位数;
HA:样本所在的总体中位数 ≠ 已知总体中位数 。
( 若将备择假设 HA中的,≠,改为,<
” 或,>,,则进行一尾检验 )
2,计算差值,确定符号及其个数统计样本观察值与已知总体中位数的差值的符号,
n= n++ n-
检验的统计量 K 为 n+,n-中的较小者 。
3,统计推断 ( 同配对资料的符号检验 )
注意:
样本的配对数少于 6对时,不能检验出差别,在 7— 12对时也不敏感,在 20对以上则比较有用。
【 例 11.2】 已知某品种成年公黄牛胸围平均数为 140厘米,今在某地随机抽取 10头该品种成年公黄牛,测得一组胸围数字,128.1,
144.4,150.3,146.2,140.6,139.7,
134.1,124.3,147.9,143.0( cm)。 问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异?
表 11-2 成年公黄牛胸围测定值符号检验表牛号 1 2 3 4 5 6 7 8 9 10
胸围 128.1 144.4 150.3 146.2 140.6 139.7 134.1 124.3 147.9 143
差值 -11.9 4.4 6.3 6.2 0.6 -0.3 -5.9 -15.7 7.9 3
符号 - + + + + - - - + +
1,提出无效假设与备择假设
HO,该地成年公黄牛胸围的平均数 =140厘米,
HA,该地成年公黄牛胸围的平均数 ≠ 140厘米 。
2,计算差值,确定符号及其个数 样本各观测值与总体平均数的差值及其符号列于表 11-2,并由此得 n+=6,n-=4,
n=6+4=10,K=min{ n+,n-} = n-=4 。
3、统计推断 由 n = 10,查 附 表 11,得
K0.05(10)=1,K> K0.05(10),P> 0.05,不能否定 HO,表明样本平均数与总体平均数差异不显著,可以认为该地成年公黄牛胸围的平均数与该品种胸围总体平均数相同。
第二节 秩和检验秩和检验也叫做符号秩和检验( signed
rank-sum test),或称 Wilcoxon检验,其统计效率远较符号检验为高。秩和检验与符号检验法不同,要求差数来自某些对称分布的总体,但并不要求每一差数来自相同的分布。
方法,— 将观察值按由小到大的次序排列,
— 编定秩次,
— 求出秩和进行假设检验。
一、配对试验资料的符号秩和检验
( Wilcoxon配对法)
1、建立假设
HO:差值 d总体的中位数 =0;
HA:差值 d总体的中位数 ≠0。
2、秩次和符号求配对数据的差值 d;
按 d绝对值从小到大编秩次;
根据原差值正负在各秩次前标上正负号
3,统计量 T
分别计算正秩次及负秩次的和,
以绝对值较小的秩和绝对值为检验的统计量 T。
4,统计推断根据 n(正、负差值的总个数为 n )查附表 14(1)
符号秩和检验用 T临界值表,得 T0.05(n),T0.01(n)。
如果 T> T0.05(n),P> 0.05,则不能否定 HO,表明两个试验处理差异不显著;
如果 T0.01(n) < T≤T 0.05(n),0.01< P≤0.05,则否定 HO,接受 HA,表明两个试验处理差异显著;
如果 T≤T 0.01(n),P≤0.01,则否定 HO,接受 HA,
表明两个试验处理差异极显著
【 例 11.3】 某试验用大白鼠研究饲料维生素 E
缺乏与肝脏中维生素 A含量的关系,先将大白鼠按性别、月龄、体重等配为 10对,再把每对中的两只大白鼠随机分配到正常饲料组和维生素 E缺乏饲料组,
试验结束后测定大白鼠肝中维生素 A的含量如表 11-4。
试检验两组大白鼠肝中维生素 A的含量是否有显著差异。
表 11-3 不同饲料鼠肝维生素 A含量资料(国际单位 /克)
鼠对别 1 2 3 4 5 6 7 8 9 10
正常饲料组 3550 2000 3100 3000 3950 3800 3620 3750 3450 3050
维生素
E缺乏组
2450 2400 3100 1800 3200 3250 3620 2700 2700 1750
差值 di 1100 -400 0 1200 750 550 0 1050 750 1300
秩次 +6 -1 +7 +3.5 +2 +5 +3.5 +8
1,提出无效假设与备择假设
HO:差值 d总体的中位数 =0;
HA:差值 d总体的中位数 ≠0。
2、编秩次、定符号计算表 11-3中配对数据差值 di,将 d =0的舍去,
共有差值 n=8 个。按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为 750的有两个,它们的秩次为 3和 4,所以其平均秩次为( 3+4) /2=3.5,结果见表 11-3。
3,确定统计量 T
此例,正号有 7个,其秩次为 2,3.5,3.5,5,6,
7,8,秩次和为,2+3.5+3.5+5+6+7=35;负号只有 1
个,其秩次为 1,秩次和等于 1。 负号秩次和较小,
所以 T=1。
4、统计推断由 n=8查附表 10(1)得,T0.05(8)=3,T0.01(n)=0,因为 T0.01(8) < T< T0.05(8),0.01< P< 0.05,否定 HO,接受 HA,表明两个试验处理差异显著。
二、非配对试验资料的秩和检验
( Wilcoxon非配对法)
1、建立假设
HO:甲样本所在的总体的中位数 =乙样本所在的总体的中位数;
HA:甲样本所在的总体的中位数 ≠ 乙样本所在的总体的中位数。
2、求两个样本合并数据的秩次将两样本合并后的数据按从小到大的顺序排列,
与每个数据对应的序号即为该数据的秩次,最小数值的秩次为,1”,最大数值的秩次为,n1+n2”。
3,确定统计量 T
将两个样本重新分开,计算各自的秩和 。 将较小的样本含量作为 n1,其秩和作为检验的统计量 T。
若 n1=n2,则任取一组的秩和为 T。
4,统计推断由 n1,(n2–n1)查附表 14(2),得接受区域 T’0.05—
— T0.05,T’0.01--T0.01 。
若 T 在 T’0.05—— T0.05之内,P> 0.05,则不能否定 HO,
若 T在 T’0.05—— T0.05之外但在 T’0.01—— T0.01之内,
0.01< P≤ 0.05,则否定 HO,接受 HA;
若 T在 T’0.01—— T0.01之外,P< 0.01,则否定 HO,
接受 HA,
【 例 11.4】 研究两种不同能量水平饲料对 5-6周龄肉仔鸡增重(克)的影响,资料如表 11-4所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异?
表 11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验饲 料 肉仔鸡增重( g)
高能量 603 585 598 620 617 650 n1=6
秩 次 12 8.5 11 14 13 15 T1=73.5
低能量 489 457 512 567 512 585 591 531 467 n2=9
秩 次 3 1 4 7 5 8.5 10 6 2 T2=46.5
1,提出无效假设与备择假设
HO:高能量饲料增重总体的中位数 =低能量饲料增重总体的中位数;
HA:高能量饲料增重总体的中位数 ≠低能量饲料增重总体的中位数 。
2、编秩次将两组数据混合从小到大排列为秩次。
在低能量组有两个,512”,不求平均秩次,
其 ;在高、低两组有一对数据为,585”,需求它们的平均秩次,(8+9)/2=8.5。结果见表
11-4。
3,确定统计量 T
以较小样本的秩次和为统计量 T,即 T= 73.5。
4、统计推断由 n1=6,n2-n1=9-6=3查附表 10( 2)得,为 31—
65,为 26— 70。 T=73.5在,即 26— 70之外,P< 0.01,
否定 HO,接受 HA,表明饲料能量高低对肉仔鸡增重的影响差异极显著。
三、多个样本比较的秩和检验
( Kruskal-Wallis法,H法)
1、提出无效假设与备择假设
HO:各个样本所分别代表的各总体分布位置相同;
HA:各个样本所分别代表的各总体分布位置不完全相同 。
2、编秩次、求秩和将各个样本的所有观测值混合后,按照由小到大的顺序排成 1,2,…,n个秩次。不同样本的相同观测值,取平均秩次;一个样本内的相同观测值,不求平均秩次。按样本把每个观测值的秩次一一相加,求出各样本的秩和。
3、求 H值式中,Ri为第 i个样本的秩次之和;
ni为第 i个样本的含量; n=∑ni
)1(3)1( 12
2
n
n
R
nn
H
i
i
4、统计推断根据 n,ni查附表 10( 3),得临界值:
H0.05,H0.01。 若 H< H0.05,P> 0.05,不能否定 HO,可以认为各样本代表的各总体分布位置相同;若 H0.05≤H< H0.01,0.01< P≤0.05,否定 HO,接受 HA,表明各样本所代表的各总体分布位置显著不同;若 H≥H0.01,P≤0.01,表明各样本所代表的各总体分布位置极显著不同 。
当样本数 k> 3,ni> 5时,不能从附表 10( 3) 中查得 H值 。 这时 H近似地呈自由度为 k- 1的分布,可对 H进行检验 。
当相同的秩次较多时,按 ( 11-1) 式计算的 H值常常偏低,此时应按 ( 11-2) 式求校正的 H值 HC:
式中,tj表示某个数重复的次数。
nn
tt
H
H
jj
C
3
3
)(
1
【 例 11.5】 某试验研究三种不同制剂治疗钩虫的效果,用 11只大白鼠做试验,分为三组。每只鼠先人工感染 500条钩蚴,感染后第 8天,三组分别给服用甲,乙,丙三种制剂,第 10天全部解剖检查各鼠体内活虫数,
试验结果如表 11-5所示 。 试检验三种制剂杀灭钩虫的效果有无差异。
表 11-7 三种制剂杀灭钩虫效果及秩和检验制剂甲组( a) 制剂乙组( b) 制剂丙组( c)
活虫数 秩次 活虫数 秩次 活虫数 秩次
279 6 229 4 210 3
338 11 274 5 285 7
334 10 310 9 117 1
198 2
303 8
ni 5 3 3
Ri 37 18 11
1,提出无效假设与备择假设
HO:三种制剂活虫数总体分布位置相同;
HA:三种制剂活虫数总体分布位置不完全相同 。
2、编秩次、求秩和三个组观测值混合后的秩次如表 11-5所示,
最后一行为各组秩次之和。
3,求 H值由 ( 11-1) 式,得
4、统计推断当 n=11,n1=5,n2=3,n3=3时,查附表 10( 3),得
H0.05=5.65。因为 H< H0.05,P> 0.05,不能否定 HO,
表明三种制剂杀灭钩虫的效果差异不显著。
38.2)111(3)
3
11
3
18
5
37(
)111(11
12 222

H
【 例 11.6】 对某种疾病采用一穴、二穴、
三穴作针刺治疗,治疗效果分为控制、显效、
有效、无效 4级。治疗结果见表 11-6第( 2)、
( 3)、( 4)栏。问 3种针刺治疗方式疗效有无显著差异?
表 11-6 3种针刺方式治疗效果及秩和检验等级 一穴 二穴 三穴 合计 秩次范围 平均秩次 各组秩和
⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ 一穴 ⑻ 二穴 ⑼ 三穴 ⑽
控制 21 30 10 61 1~ 61 31.0 651.0 930.0 310.0
显效 18 10 22 50 62~ 111 86.5 1557.0 865.0 1903.0
有效 15 8 11 34 112~ 145 128.5 1927.5 1028.0 1413.5
无效 5 2 8 15 146~ 160 153.0 765.0 306.0 1224.0
合计 59 50 51 160 4900.5 3129.0 4850.5
(n1) (n2) (n3) (n) (R1) (R2) (R3)
1,提出无效假设与备择假设
HO:三种针刺方式治疗效果相同;
HA:三种针刺方式治疗效果不完全相同 。
2、编秩次、求秩和 秩次、秩和等的计算结果列于表 11-6。其中的合计栏( 5) =( 2) +( 3) +( 4)
栏;秩次范围栏( 6)为每一等级组应占的秩次;平均秩次栏( 7),是因为同一组所包含的秩次同属一个等级,不能分列出高低,故一律以其平均秩次为代表,平均秩次等于各等级组秩次下限与上限之和的平均;各组秩和 R1,R2,R3分别等于第( 2)、( 3)、
( 4)栏乘以第( 7)栏所得第( 8)、( 9)、( 10)
栏各自的和。
3,求 H值 因为各等级组段均以平均秩次作为代表,视为相同秩次,其相同秩次的个数等于各自的秩次合计,见第 ( 5) 栏 。 显然相同秩次较多,宜用 ( 11-2) 式求 HC。 先按 ( 11-
1) 式计算 H值:
7293.12)1160(351 5.485050 0.312959 5.4900)1160(160 12
222



H
而于是利用 ( 11-2) 式,得:
此试验处理数为 3,所以 df=3- 1=2,查值表得。因为
>,P< 0.01,表明 3种针刺方式的治疗效果差异极显著。
3 9 4 5 0 0)1515()3434()5050()6161( 33333 jj tt
0 8 5 8.14
9 0 3 7.0
7 2 9 3.12
160160
3 9 4 5 0 0
1
7 2 9 3.12
3

CH
四、多个样本两两比较的秩和检验
( Nemenyi-Wilcoxson-Wilcox法)
当多组计量资料或等级资料经多个样本比较的秩和检验,认为各总体的分布位置不完全相同时,常需要进一步作两两比较的秩和检验,
以推断哪两个总体的分布位置不同,哪两个总体分布位置并无不同 。
这个方法类似方差分析中的多重比较,常用 q法:
式中,为秩和差异标准误,计算公式为:
n为样本含量即处理的重复数; k为比较的两秩和差数范围内所包含的处理数。可见,这里的 q法只适用于重复数相等的试验资料。
计算 q值后,以 df=∞和 k查附表 5,得临界值,作出统计推断。
ji RR
ji
S
RR
q
12
)1)((
nknknS
ji RR
【 例 11.7】 某种激素 4种剂量对大白鼠耻骨间隙宽度增加量的影响试验,结果见表 11-
7。问 4种剂量大白鼠耻骨间隙的增加量是否有显著差异?
表 11-7 四种剂量大白鼠耻骨间隙增加量及秩和检验剂量 增加量(单位,mm) Ri
1 0.15 (1) 0.30 (2) 0.40 (3) 0.40 (4) 0.50 (5) 15
2 1.20 (6.5) 1.35 (8) 1.40 (9.5) 1.50 (11) 1.90 (14) 49
3 2.50 (19.5) 1.20 (6.5) 1.40 (9.5) 2.00 (15) 2.20 (16.5) 67
4 1.80 (13) 1.60 (12) 2.50 (19.5) 2.20 (16,5) 2.30 (18) 79
1,提出无效假设与备择假设
HO:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置相同;
HA:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置不全相同 。
2、编秩次、求秩和 将 四 组 观测值混合,由 小 到大编秩次,见表 11-7 括 号 内 数字。不同组的相同观测值取平均秩次,如第
2,3组各有一个 1.20,取它们原来秩次 6 和 7
的平均 6.5,余此类推 ;同一组内相同观测值不求平均秩次 。 各组 秩 和 见 表 11-7最后一栏。
3,求 H值 因为本例有 2个 1.20,2个 1.40,
2个 2.20,2个 2.50,所以用 ( 11-1) 式求校正
HC。 先按 ( 11-2) 式计算 H。
而所以
32.13)120(3
5
79
5
67
5
49
5
15
)120(20
12 2222



H
24)22()22()22()22()( 33333 jj tt
36.13
9 9 7 0.0
32.13
2020
24
1
32.13
3

CH
4、统计推断 本例 k=4,超出附表 10( 3)
的范围,故用值(附表 7)进行统计推断。当
df=4- 1=3时,查附表 7,得。因为>,P<
0.01,表明用 4种剂量的大白鼠耻骨间隙宽度的增加量差异极显著。
5、多个样本的两两比较 列出两两比较表(表 11-8)。
表 11-8 4种剂量大白鼠耻骨间隙宽度增加量秩和两两比较比较 差数R
i-Rj
秩次距
k q值临界 q值 检验结果α=0.05 α=0.01
( 1) ( 2) ( 3) ( 4) ( 5) ( 6) ( 7) ( 8)
1与 4 64 4 13.2288 4.84 3.63 4.40 **
1与 3 52 3 10.0000 5.20 3.32 4.12 **
1与 2 34 2 6.7700 5.02 2.77 3.64 **
2与 4 30 3 10.0000 3.00 3.32 4.12 ns
2与 3 18 2 6.7700 2.66 2.77 3.64 ns
3与 4 12 2 6.7700 1.77 2.77 3.64 ns
ji RRS?
第三节 等级相关分析等级相关程度的大小和相关方向用等级相关系数( coefficient of rank correlation)表示,
亦称为秩相关系数。样本等级相关系数记为 rs,
rs的性质,值介于 -1与 1之间,
rs为正表示正相关,
rs为负表示负相关,
rs等于零为零相关,
根据 rs绝对值的大小区分为强相关、中等程度相关和弱相关。
1,建立假设
HO,ρ s=0
HA,ρ s≠ 0
2,列出变量的等级将变量 x,y分别由小到大列出等级,相邻两数相同时,取平均等级 。
3,求每对观察值的秩次之差 d
4,计算等级相关系数用公式 ( 11-9) 计算等级相关系数:
)1(
6
1
2
2

nn
d
r s
5,rs的显著性检验根据 n查附表 13,得临界值 r0.05,r0.01。
若 rs< r0.05,P> 0.05,表明两变量 x、
y等级相关不显著;
若 r0.05 ≤ rs < r0.01,0.01< P≤ 0.05,
表明两变量 x,y等级相关显著;
若 rs ≥ r0.01,P≤ 0.01,表明两变量 x、
y等级相关极显著 。
【 例 11.8】 研究含有必需氨基酸添加剂的某种饲料的营养价值时,用大白鼠做试验获得了关于进食量 ( x) 和增重 ( y)的 数据,见表 11-9。试分析大白鼠的进食量与增重之间有无相关。
表 11-9 大白鼠进食量与增重结果及等级相关分析表鼠号 变量 x 变量 y 秩次差 秩次差平方进食量( g) 秩次 增重( g) 秩次 d d2
1 820 7.5 165 7 0.5 0.25
2 780 5 158 5.5 -0.5 0.25
3 720 4 130 2 2 4
4 867 9 180 9 0 0
5 690 3 134 3 0 0
6 787 6 167 8 -2 4
7 934 10 186 10 0 0
8 679 2 145 4 -2 4
9 639 1 120 1 0 0
10 820 7.5 158 5.5 2 4
合计 16.5
1、计算等级相关系数 rs
对表 11-9中各个试验数据分别按进食量与增重从小到大,排列秩次,对数值相同的数据则取平均秩次,如进食量 820克的平均秩次为 ( 7+8) /2=7.5。 求出进食量的秩次与增重的秩次之差 d和秩次差平方 d2。 利用 (11-5)式,

90.0
)110(10
5.166
1
)1(
6
1
22
2


nn
d
r s
2,rs的显著性检验此例 n=10,查附表 12,得 rs(0.01) =0.794,
因为 rs> rs(0.01),P< 0.01,等级相关极显著,
表明大白鼠的进食量与增重之间存在着极显著正相关。