4- 1
第 4章 假设检验
4.1 基本概念
4.1.1引言关于总体特征的随机变量的概率分布的一个陈述称为统计假设,如果这个陈述只涉及到总体的参数则称为参数假设。否则称为非参数假设,验证统计假设的方法叫做统计假设检验。
其意义:是利用适当的统计量对总体的分布或参数做出种种零假设 H0,然后根据观测信息来对 H0 进行检验,
从而判断 H0 是否成立。
其任务,( 1)对不同的问题确定相应的方法,通过选择适当统计量来判断 H0 是否成立。若成立接受它,若不成立拒绝它。
( 2)评价检验方法好坏的标准。
4- 2
其基本思想:
1)实际推断原理
2)统计假设检验主要是起否定作用,其逻辑推理表现为 —— 否定之否定(即反证法)
统计推断的另一类重要问题是根据样本的信息来判断总体分布是否具有指定的特征。如已知样本来自正态总体,
要问它的均值是否为 μ0。
例 1,某车间用一台包装机包装葡萄糖,包得的袋装糖重是一个随机变量,它服从正态分布。当机器正常时,其均值为 0.5公斤,标准差为 0.015公斤。某日开工后为检验包装机是否正常,随机地抽取它所包装的糖 9袋,称得净重为 (公斤 ):
0.497 0.506 0.518 0.524 0.498
0.511 0.520 0.515 0.512
问机器是否正常?
4- 3
,即有为,犯这类错误的概 率记断错误即判绝是对的,我们也可能拒可知即使假设
,反之接受 时拒绝假设,当 
要找一个常数的偏差又不能太大。即与动,但定的波来进行判断,允许有一自然想到可用

)
(HH
.HHk|X|k
X
X
00
00
*
0
*
0
。那么成立如果假设
 和  
 为此可提出假设现在的问题是要检验 
由假设可知 
为解 设该天的袋装糖重
)015.0,5.0(N~X,H
,:H,5.0:H
5.0
).015.0,(N~X
,X
2
0
0100
2


)015.0,( 2?NX ~
)0 1 5.0,5.0( 2NX ~
4- 4
等。或=一般取或
 
为真拒绝
01.005.0
,}k
n
X
{P
.}|k|X{|P
}H|H{P
0
0
*
0
00
0



时,则很小时,比如取,当
 其中,于是 
 由假设知对于本题可用统计量:
05.010
.z
9015.0
5.0X
P)1,0(N~Z
,
9015.0
5.0X
Z
2/




U
U 2?u
4- 5
的工作不正常。
不成立,即这天包装机因而有理由认为原假设中是很难发生的小概率事件在一次试验原理根据实际推断居然发生了率事件
 这说明小概, 
计算得到。对于所给的样本值查表可知是一个小概率事件
5.0
,":"
,z
90 1 5.0
5.0X
,96.1z2.2
90 1 5.0
5.0x
5 1 1.0x
,96.1z
,z
90 1 5.0
5.0X
2/
2/
025.0
2/


025.0u
2?u
2?u
2?u
4- 6
注,假设检验所采用的方法类似一种反证法,
先假设结论成立,然后在这个结论成立的条件下进行推导和运算,如果得到矛盾,则推翻原来的假设。
这里的矛盾是与实际推断原理的矛盾,即如果,小概率事件在一次试验中发生了,,则认为出现了与实际情况不符的矛盾,故原假设不成立,因此,假设检验是一种带有概率性质的反证法。
基本概念与术语,
1,称给定的?(0<?<1) 为显著性水平,
.
n
XZ.2 0 称为检验统计量统计量

U
4- 7
。备选假设称为备择假设称为原假设,其中
,
下,检验假设在显著性水平述为一般地,检验问题可叙
)(HH
.:H:H
:.3
10
0100
为临界点。
和,故为点,如在上例中界点称为临界为拒绝域,拒绝域的边,称假设中的值时,则拒绝原域当检验统计量取某个区
/2/2/2
0
zZzZz|Z|C
CH
C.4

2?uU?U U2?
u
2?u?
的选择是很重要的。可见则应接受取如上例中然相反的结论可能得到截下在不同的显著性水平同一组样本值对于的大小有关水平拒绝域的大小与显著性注


,H,58.22.2
,58.2z,01.0,,
,,
.:
0
005.0
005.0u
4- 8
5,假设检验的一般步骤:
的结论。拒绝或接受否落入拒绝域内,作出的观察值,看观察值是根据样本值计算统计量
,确定拒绝域选择显著性水平
,的概率分布,如假设量服从成立的条件下,该统计求出在原假设选择统计量,如 ;,
如及备择假设提出原假设
0
0
0100
10
H
)5; )4
);1,0(N~Z5.0
H )3;
9015.0
5.0X
Z )2
:H 5.0:H
,HH )1


U
U
4- 9
4.1.2 假设在用统计方法为实际问题作决断时,常常需要做出适当的假设,然后再根据样本提供的信息进行判断,决定是否接受这个假设。在例 1中我们要判断这批糖的重量是否合格时,
首先假设它合格,H0:μ=μ0= 0.5 然后抽取 9 袋看是否存在常数 k*,是否有是否成立。来验证 0*0,HkX
对非参数分布族的假设检验的问题称为“非参数假设检验”。
一个假设是需要“检验”的,就是要在假设 H0 成立的前提下,根据样本观测值结果来判定是接受它还是拒绝它。
这样的假设 H0称为“零假设”或“原假设”,它是作为检验的前提假设,当“零假设”被拒绝时,就意味着接受一个与之对立的假设,称为“备择假设”或“对立假设”,常用
H1表示。
4- 10
零假设通常应该受到保护的,没有充足的证据是不能被拒绝的,而对备择假设则应取慎重态度,没有充足的理由不能轻易接受。在例 1中我们希望这批产品是合格的,没有充分证据不想轻易将它判为是不合格的。
4.1.3 检验对给定的假设,要根据样本的取值情况来决定它是接受还是拒绝零假设,不能等到试验结果已经得知以后来制定接受或拒绝零假设的准则,而是应该事先规定好这种准则 ——
即检验。对于一个假设,一个检验就是给出一个拒绝域和一个接受域。



22 9
0 15.05.0,
9
0 15.05.01
uu中接受域为:在例
,90 1 5.05.090 1 5.05.0,22 uu?拒绝域为:
。即接受,否则就拒绝落入接受域时就接受当 100 HHHX,
4- 11
为了确定拒绝域、接受域,往往首先由问题的实际背景出发,寻找一个统计量,使得在零假设 H0 成立时和备择假设 H1 成立时,该统计量的值有差异。从而使得我们能够根据统计量的值的大小选定拒绝域。并且我们称这个能从样本空间中划分出拒绝域的统计量为检验统计量。
9015.0
5.01 XU中的例如
4.1.4 两种错误概率和检验水平在进行检验时,由于样本的随机性我们可能做出正确的判断也可能做出错误的判断。一般有两类错误:
第一类错误是:原假设 H0 成立时被拒绝,称为
“弃真错误”犯弃真错误的概率常记为 α;
第二类错误是:原假设 H0 不成立时被接受,称为
“采伪错误”犯采伪错误的概率常记为 β。
4- 12
1:1:
.,,,,,,)(~
10
11

HH
xxXXPX nn 样本值为样本为例如设总体即 如果一个检验接受域为,拒绝域为,那么
XpXp
的充分完备统计量是
n
i
ixT
1



n
i
i Cxx
1
,
11
1
1
1
0






k
nkC
k
nk
Ck
nk
!k
en
!k
en
!k
en
)()(
)(

4- 13
从这里我们还可以看出当样本容量是固定时,要减少犯第一类错误的概率必须增加 C,从而导致增大犯第二类错误的概率,反之若要减少犯第二类错误的概率必须减少 C,
从而使犯第一类错误的概率增。换句话说,当样本容量 n
固定时,不可能使犯两类错误的概率减少,这一现象在一般检验问题中都出现。基于这种情况,我们总是使犯第一类错误的概率限制在某个范围内,然后寻求使犯第二类错误尽可能小的检验。

称为显著性水平。
的检验。称为水平的检验满足
,?g
,,10 XPg满足)(一个较小的选定求一个好的检验法就是在这种思想指导下,寻
4- 14

。为犯第二类错误的概率时,当;为犯第一类错误的概率时,当




11
0
4.1.5 功效函数、无偏检验称样本观测值落在拒绝域的概率为检验的功效函数,
又称为“势函数”即:
XP
4- 15
且称满足上述条件的水平为 α的检验为无偏检验。即对一个真实水平 α的检验。
就称为无偏检验。1
001101
:

要求它满足对一个合理的检验,应

为正确决策的概率。上,在而为犯错误的概率,上,在


1
0
4- 16
4.2 常用分布族的参数假设检验
4.2.1 假设的种类设样本分布族由一个 k 维参数所决定,关于参数的假设可以有很多种。无论是零假设还是备择加设,如果一个假设值只指定参数参数的一个点,则它称为“简单假设”;否则就称为“复合假设”。如果一个假设只涉及一个(一维)
参数,则它称为“单参数假设”。在单参数假设中(假定 θ
为一个一维参数),又分:
。::“双边假设”:
(左单边检验)::或者
(右单边检验)::“单边假设”:
0100
0100
0100
)2(;
,)1(






HH
HH
HH
4- 17
4.2.2 单个正态总体的均值检验
。和差分别为的样本,样本均值和方是来自
,设总体
2
n21
2
SXX
X,,X,X),(N~X
(一 )a,单个正态总体,已知,检验,2
)}({.z||
}z|{|k
k
)1,0(~
)10(
,::)(
/2
0
/202
1
010
0
0100
检验法或称检验法 绝域为
,从而拒成立时有。而当或为偏大。故拒绝域的形式偏小;反之,
,成立时,若,而当成立时,当
,,对于给定的取统计量
, 
Zu
n
X
ZPHZ
ZZZ
HNZH
n
X
Z
HHi







2?uU
~U
U U
U
U
2?u
U
4- 18
.z
n
n

X 0从而拒绝域为
,}z
n
X{P}z
n
X{P 0


,则若
)1,0(N~
n
Xz
n
Xz
n
X 0



,蕴含
n
X
n
XH)10( 0
0?

,故成立时,,当的
XZ
:H,:H)ii(
0
0100


,对于给定取统计量 u
,而
u
u
u
u
u
U
4- 19
.z
n
X
}-z
n
X
{P}-z
n
X
{P
)1,0(N~
n
X
-z
n
X
-z
n
X
n
X
n
X
H)10(
n
X
Z
:H,:H)iii(
0
0
0
0
0
0
0100
















从而拒绝域为
,,则若
,,而蕴含
,故成立时, ,当的
,对于给定取统计量
u
uu
uu
u
U
4- 20
。,可类似地推出拒绝域统计量:
),仍取和关于单侧假设检验(注
nS
X
T
:
0
00


(一 )b,单个正态总体,未知,检验,2
)t().1n(t|
nS
X
|
,)}1n(t|t{|P)1n(t~t,H
),10(
nS
X
t
:H,:H
/2
0
/20
0
0100
检验法 从而拒绝域为
,成立时当
,对于给定的取统计量:
 检验: 







4- 21
,,蕴含知 
,成立时,由当
。,统计量:取按题意需检验解
)1n(t
nS
X
)1n(t
nS
X
nS
X
nS
X
H
nS
X
t05.0
.225:H,225:H:
0
0
0
100










例 2,某种电子元件的寿命 x (以小时计 )服从正态分布,?,?2 均未知,现测得 16只元件的寿命如下,
159 280 101 212 224 379 179 264
222 362 168 250 149 60 485 170
是否有理由认为元件的平均寿命大于 225小时?
4- 22
小时。命不大于,即认为元件的平均寿故接受不落在拒绝域中,,
,即有,又算得
,,。现
 所以拒绝域为:
,成立时,当
225H
t7531.16685.0
nS
X
t
7259.98s5.241x
7531.1)15(t16n)1n(t
nS
X
.)}1n(tt{P
)1n(t~tH
0
0
05.0
0
0







4- 23
4.2.3 单个正态总体方差的检验
)1(2 2?n )1(2 21 n
2
2


).1n(
)1n(
.
2
)1n(P
,
2
)1n(P
)1n(~H,
S)1n(
:
:H:H:)
(XX,,X,X
,),(N~X
2
2/
2
2
2/1
2
2
2/
2
2
2/1
2
22
0
2
0
2
2
2
0
2
0
2
1
2
0
2
0
n21
22










或故拒绝域为
,有 对于给定的
。成立时,当取统计量是已知常数。,, 水平显著性的样本。要求检验假设是来自均未知,,设总体


4- 24
例 3.某厂生产的某种型号的电池,其寿命长期以来服从方差为?2=5000(小时 2)的正态分布,现有一批这种电池,从它的生产情况看,寿命的波动性有所改变,现随机取
26只,测出其寿命的样本方差为 s2=9200(小时 2).问根据这一数据能否推断这批电池寿命的波动性较以往的有显著的变化 。 (取? = 0.02)?
:
,5 0 0 0,5 2 4.11)25()1n(
,3 1 4.44)25()1n(,26n
.5 0 0 0:H,5 0 0 0:H
:02.0:
2
0
2
99.0
2
2/1
2
01.0
2
2/
2
1
2
0
的结论,可知拒绝域为由前面现下检验假设在水平解





4- 25
.
,H 0
著的变化动性较以往有显认为这批电池寿命的波所以拒绝
,3 3 1 4.4446
s)1n(
9 2 0 0s
.5 2 4.11
s)1n(
3 1 4.44
s)1n(
2
0
2
2
2
0
2
2
0
2

,得由观察值或 
是否变大了?方差有没有显著变化? 方差下检验:。试在水平样本标准差件,测得抽取。现从新产品中随机地
,且知品的测试指标仍记为出了新产品。假设新产
,。后来改变了生产工艺,其中
,某产品的测试指标 在正常的生产条件下例
22



)2()1(
05.033.0
10),(~
23.0),(~
3
2
0
2
00

S
NX
X
NX
例 4.


4- 26
:
0529.07.2)9()1(
,023.19)9()1(,10
.:,23.0:
:05.0)1(:
2
0
2
975.0
2
2/1
2
025.0
2
2/
2
1
22
0
的结论,可知拒绝域为
,由前面,
现下检验假设要在 解










n
nn
HH
.0 2 3.195 2 7 4 1.187.2
,5 2 7 4 1.18
)1(
33.0
.0 2 3.19
)1(
7.2
)1(
0
2
0
2
22
2
0
2
2
0
2
H
Sn
S
SnSn
接受原假设,
,得由观察值或 


4- 27
:
,9 1 9.16)9()1(,10
.:,23.0:
:
,05.0)2(
2
05.0
2
2'22'
绝域为由前面的结论,可知拒现 
检验假设下 由题意要在

01

00




nn
HH
的方差显著地变大。
比正常情况下产品指标说明新产品指标的方差拒绝原假设,
由观察值算得
.9 1 9.165 2 7 4 1.18
,5 2 7 4 1.18
)1(
.9 1 9.16
)1(
'
0
2
0
2
2
0
2
H
Sn
Sn

4- 28
4.3 似然比检验针对不同的分布、不同的参数构造不同的检验统计量,
再根据所设定的假设来构造检验,是假设检验的中心任务。
我们称此检验为似然比检验,且称 λ为似然比。
。取任何一个行动若;拒绝若;接受若
,使得倘若存在数检验样本的是来自总体设
k
Hk
Hk
k
HH
iidxfXXX
n


0
0
1100
1
,::
,),(~,,?
),(,,),(
),(,,),(
),,(
111
001
1


n
n
n
xfxf
xfxf
xxt
其中

4- 29
)22e x p (
2
1
2
1
)0,(
)2,(
,0:2:
,,,)1,(~.5
2
2
2
1
)2(
2
1
1
1
10
1
nxn
e
e
xf
xf
HH
XXNX
i
i
x
n
x
n
n
i
i
n
i
i
n





有样本容量为总体设例?
.
1ln
2
1
1ln
2
1
2ln2
.)22e x p (
0
0
0
HCx
HCxCk
n
k
n
xnkxn
Hknxn
时拒绝当时接受则当记即则上式取对数给出接受如果



4- 30
。增加Ⅰ减少但Ⅱ增大时可用下图表示当率表示,因此犯错误的概因这个似然比能用
)()( PPC
x


查标准正态表。),,(对
Ⅱ同时
Ⅰ那么
。注意到Ⅰ时,对给定例如当
CxP
CxPP
CxPPC
Pn




10
0 0 9.00|)(
05.02|)(,1 7 5 5.1
4
6 4 5.1
205.0)(4
2
0


4- 31
nn
U
CP
nn
U
CP
PP
nPP
3 2 3.2
001.0)(
0 5 4.2
202.0)(
01.0)(02.0)(
)()(
01.0
1
02.0
0



,Ⅱ对
,Ⅰ对
Ⅱ,Ⅰ若取在此题中则是另一类重要问题。要求样本容量Ⅱ、Ⅰ若给定
06.1
323.2
8.4
2
377.4323.2054.2
2
2



n
C
n
nn
而且有由此
.06.101.002.0
5
0HCx
n
时接受的要求,即当和于将满足犯错误的概率小于是样本容量是

4- 32
估计。的真值的相合渐近正态知道它是参数质,根据极大似然估计的性显然有定义,函数的全局最大值。由最大值,而分母是似然上的子是似然函数在零假设为一个统计量,它的分似然比为考虑假设

.10
)(s u p
)(s u p
|::
0
0100




LR
LR
L
L
LR
HH
这种似然比检验也称为广义似然比检验
。时接受;当时拒绝当样本为设总体例
0
0
0
0
0
0
0100
1
2
0
,::
,,,),(~.6
H
n
X
H
n
X
HH
XXNX n





4- 33






n
i
i
n
n
i
i
n
n
i
i
n
XnXXL
X
n
X
XL
1
22
2
00
2
0
1
2
02
00
1
2
02
00
0
2
1
e x p
2
1
)(
22
1
e x p
2
1
2
1
e x p
2
1
)(




分母分子






0
2
02
0
0
0
1
2
2
00
)(
2
e x p
)(
)(
1
2
1
e x p
2
1
)()(s u p


XX
n
XL
L
X
LR
XXXLL
n
i
i
n
x
当当
4- 34
)
,,
(
),,(
,,
,,),,(
,,:
,,:
),,,(~
1
010
111
01011
01010
1
k
k
kkk
kk
kk
k
L
L
LM
MLL
H
H
xfX









则估计为的中若对于

.)(
ln2 2,1
为独立参数的个数此时拒绝域为
kn
LR n

相互唯一确定。和时拒绝等价于时拒绝当
n
a
H
n
XHaLR
0
0
0
0,
4- 35
4.4.1 均值差的假设检验,
,
11
:
,::
21
0
02110210
nn
S
YX
T
HH
p?



取统计量
,检验:
4.4 双正态总体参数的假设检验
.,;
),(,,
),(,,
2
21
2
2
2
1
2
21
2
11
2
1
均未知、、并设、方差分别为
、本均值分别为且设两样本独立,两样的样本,是来自正态总体的样本,是来自正态总体设



SS
YX
NYY
NXX
n
n
4- 36
).2(t||
,)}2(t|{|
)2(t~
,
2
)1()1(
21/2
21/2
210
21
2
22
2
112





nnT
nnTP
nnTH
nn
SnSn
S
p
故拒绝域为
 
,对于给定的成立时,当其中 
注,
1,对于单侧检验,H0,?1-?2≤?0” 和
,H0,?1-?2 ≥?0”,可以类似地讨论。
常用的是?0 = 0。
2,对于两个正态总体的方差均为已知时,
可用,u-检验方法,检验。
4- 37
例 7,在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的,
每炼一炉钢时除操作方法外,其它条件都尽可能做到相同,
先用标准方法炼一炉,然后用建议的方法炼一炉,以后交替进行,各炼了 10炉,其得率分别为,
标准方法,78.1 72.4 76.2 74.3 77.4
78.4 76.0 75.5 76.7 77.3
新方法,79.1 81.0 77.3 79.1 80.0
79.1 79.1 77.3 80.2 82.1
设这两个样本相互独立,且分别来自正态总体 N(?1,?2)
和 N(?2,?2);?1,?2,?2 均未知,问建议的新操作方法能否提高得率?(取 α =0.05.)
4- 38
能提高得率。
即认为新方法故拒绝可算得故拒绝域为:
,,7 3 4 1.12 9 5.4
,7 3 4 1.1)18(
10
1
10
1
0
05.0
HT
t
S
YX
T
p


,7 3 4 1.1)18(,775.2
21010
)110()110(
.225.2,43.79,10;325.3,23.76,10
.0:0:
05.0
2
2
2
12
2
22
2
11
211210






t
ss
s
syn
sxn
HH
p
又,
和样本方差:
的样本均值分别求出两种方法对应

解 需要检验假设:

4- 39
.0:0,211210 HH,
假设:解 由题意,需要检验
.
,7 3 4.1)18(1 9 9.1
10
1
10
1
0
05.0
H
t
S
YX
T
p
故接受


例 8,某地区高考负责人想知道某年来自城市中学考生的平均成绩是否比来自农村中学考生的平均成绩高。已知总体服从正态分布且方差大致相同,由抽样获得资料如下:
93839788969283917888
91788985948878927585
农村城市
4- 40
(二 ),成对数据比较检验法设 X 和 Y 是两个正态总体,均值分别为?1 和?2,
X 和 Y 不是相互独立的。
取成对样本,(X1,Y1),…,(Xn,Yn)。
要检验,H0,?1 =?2,H1,?1 ≠?2,
可以把这个问题转化成单个总体的假设检验,
令 U=X- Y,它服从 N(?,?2),
这里? (=?1-?2),?2 均未知。
Ui=Xi- Yi(i=1,…,n)是来自该正态总体的样本。
显然,
检验 H0,?1=?2,H1,?1 ≠?2
等价于检验 H0,?=0,H1,?≠0,
于是可把问题转化为上节的情况。
4- 41
解,分别作各对数据的差,如上表,
iii yxu
问能否认为这两台仪器的测量结果有显著的差异?
例 9.有两台光谱仪 Ix,Iy用来测量材料中某种金属的含量,为鉴定它们的测量结果有无显著的差异,制备了 9 件试块
(它们的成份、金属含量、均匀性等均各不相同 ),现在分别用这两台仪器对每一试块测量一次,得到 9 对观察值如下,
0.20 0.30 0.40 0.50 0.60
0.70 0.80 0.90 1.00
0.10 0.21 0.52 0.32 0.78
0.59 0.68 0.77 0.89
(%)iY
(%)iX
yx II,
0.10 0.09 - 0.12 0.18 - 0.18
0.11 0.12 0.13 0.11iii YXU
4- 42
结果并无显著差异。,认为两台仪器的测量故接受的值不落在拒绝域内,现
 由观察值算得
,即知拒绝域为,现取
,,知其拒绝域为成立,,若由前面的结论知,可取
0
0 0 5.0
2/
0
,||3 5 5 4.34 6 7.1||
,1 2 2 7.0,06.0z.3 5 5 4.3|
0z
|||
3 5 5 4.3)8(t,901.0
)1(t|
0z
|||)1(t~
0z
H
TT
S
nS
T
n
n
nS
TnT
H
nS
T
d
d
d
d





并假设 u
1,…,u9来自正态总体 N(?,?2),这里?,?2
均属未知。若两台仪器的性能一样,则各对数据的差异可看作是随机误差,而随机误差可以认为服从正态分布,其均值为零,因此本题归结为检验假设,H0,? = 0,H1,?≠0.
4- 43
4.4.2 方差比的假设检验
,取统计量,2
2
2
2
2
1
2
1
S
SF?
:均未知,需要检验假设、、、设
。、方差分别为且两样本独立,两样本的样本,是来自正态总体的样本,是来自正态总体设
2
2
2
121
2
2
2
1
2
221
2
111
),(,,
),(,,
2
1



SS
NYY
NXX
n
n
.:,,2221122210 HH
4- 44
).1n,1n(FF.)}1n,1n(FF{P
}kF{P}H|H{Pk
k
S
S
S
S
F),S(E)S(E,H
2121
H00
2
2
2
1
2
2
2
12
2
2
2
2
1
2
11
0





拒绝域为即为真拒绝由下式决定:
,。对于给定的形式为的趋势,因而拒绝域的有偏大故为真时而当拒绝域。可用类似的方法给出其的另外两个检验,关于注 2221,,;
成立时,有可知当
 
的独立性,及,由
)1,1(~
.2,1),1(~/)1(
212
2
2
1
0
222
2
2
2
1


nnF
S
S
F
H
inSn
SS
iiii



4- 45
例 10,在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的,每炼一炉钢时除操作方法外,其它条件都尽可能做到相同,先用标准方法炼一炉,然后用建议的方法炼一炉,以后交替进行,各炼了 10炉,其得率分别为,
标准方法,78.1 72.4 76.2 74.3 77.4
78.4 76.0 75.5 76.7 77.3
新方法,79.1 81.0 77.3 79.1 80.0
79.1 79.1 77.3 80.2 82.1
设这两个样本相互独立,且分别来自正态总体 (?1,?12)
和 N(?2,?22),?1,?2,?12,?22均未知。
4- 46
.,总体具有方差齐性两总体方差相等也称两注等。,即认为两总体方差相故接受即有
,,,而 
:由附表,可知拒绝域为
,,此处解
0
2
2
2
1
2
2
2
1
2
2
2
1
01.02
2
2
1
21
,35.5/
49.1/225.2325.3
.35.5)110,110(F
01.010:
H
SS
SSSS
S
S
nn



试对数据检验假设 (?=0.01),H0,?12≤?22,H1,?12>?22.
4- 47
例 11,某校某年级分别抽取男生和女生个 14名,进行英语测验成绩如下:
9694929069959396949292809190
98991 0 09280919095929690768091
女生男生
.:,:
05.0
),(~),(~
2
2
2
11
2
2
2
10
2
22
2
11


HH
NYNX
的显著性水平检验试以
,和分布:测验成绩分别服从正态假定男生和女生的英语
~ ~
4- 48
等。,即认为两总体方差相故接受
,即有而 
 或

,可知拒绝域为:由附表
,,此处解
0
2
2
2
1
02 5.02
2
2
1
02 5.012
2
2
1
21
,11.332.002.1
.11.3)114,114(F
32.0)114,114(F
6
05.014:
H
F
S
S
F
S
S
S
S
nn




4- 49
4.7 秩检验
4.7.1 非参数检验与秩统计量在统计的理论中,基于中心及限定理,把正态分布摆在重要的位置是正确的。然而往往不知道中心极限定理是否适用于基本分布,也不知道对正态分布的近似是否足够好,使得正态理论的置信区间和假设检验象我们要求的那样精确。但在许多情况下试验工作者并不知道基本分布的形式,他需要一种与分布形式武官的统计方法,这种方法称为非参数方法。非参数统计是统计统计学中的一个重要且有特点的领域。非参数检验中较有代表性的有:
( 1)一组独立样本是否是同分布的;
( 2)两个变量是否独立;
( 3)两组样本是否取于同一总体非参数检验广泛使用秩统计量。
4- 50
的例如一组容量为秩次统计量。就是秩统计量。又称为在样本中的秩。为则称若顺序统计量顺序排成根据观察值将样本
6
),,(
,,2,1
.,,
,,,,,
1
21
11
n
iinii
nnnn
nn
RR
niXjRXX
xxx
xxXX



341625
666564636261
865432
:
xxxxxx
xxxxxx
顺序统计量为
426835
654321 xxxxxx
样本观察值为:
。排在则秩统计量为:
641654321,3,1,5,6,2,4 xxrrrrrr
如果两个观察值相等,则秩样本中存在一个“结”,此时将按原序小的排在前面。但对连续总体分布不存在“结”。
基于秩统计量的检验方法就称为秩检验。
4- 51
4.7.2 随机性检验
xFxFxFH
FFFH
FF
XXn
n
n
n
n


.,,)()(:
,,:
.,,
,,
211
210
1
1
备择假设置信假设我们可设相应分布为立的,依时间顺序排列是独天的水样,假定样本为汞的含量,取了水中天取一个水样来测定河例如我们从一条河内每的统计量。逆序总数来作为基检验可能性较小,因此考虑下存在逆序的显然在,存在一个“逆序”,若之间与我们称为检验此假设,对给定
1
,1
HYX
YXni
ii
ii

2
)1(
0
,
2
)1(
1
0
1



nn
QhQ
h
nn
nji
XX
h
ji
ij
ij
ji
ij
而逆序总数为个共有对所有其他当定义
4- 52
。,接受绝小于某个临界值时就拒当的分布偏向小端。成立时,当备择假设上是对称的。到的分布在成立时当零假设
10
1
0
2
)1(
1
HHQ
QH
nn
QH

;的个数的所有排列中记;的个数的所有排列中记
,中逆序总数为记中逆序总数,为成立时,记在
qQXXqM
qQXXqM
XXQ
XXQH
nnn
nnn
nn
nn




111
1
111
10
,,#)(
,,#)(
,,
,,
1,m i n,)()(,! )()( *
0
1
*

nqrrqmqmn
qmqQP r
r
nn
n
n有
)1,0()52)(1( 4)1(212 Nnnn nnQn n 时,有当
4- 53
10
2
)1(
0.4,5
.74235,5 54321


nn
QQn
xxxxxn
到的取值范围为这里
、、、、若取
1491520222015941)(
109876543210
5 qm
q
来。再根据对称性计算出个逆序数的排列的个数元全排列中有表示
)(
4312
3421
4231
3)1(
9135)0()1()2()2(
25)2(
5
4
4445
5
qm
m
mmmm
m

4- 54
408.012049!5 20159414QP可推出较小时,效果不太好。但渐进分布虽然简便,比精确概率要小不少,
,)(查标准正态表:
代入若用渐近分布,将
n
nnn
nn
Q
Q
n
3 1 2.049.0
49.0
3 0 0
54
2
12
)52()1(
4
)1(
2
12
4



4- 55
4.7.3 独立性检验
0
),(
),(,,),(),( 11
相互独立的充要条件是与为二维正态总体变量,为一组简单样本。假定为一个二维总体,设
YX
YX
YXYXYX nn?
,正相关”
双边假设左单边假设“正相关”
右单边假设“正相关”
此时检验假设有:
0:
0:
0:
0:
1
1
1
0
H
H
H
H

的样本的秩;为的样本的秩;为为秩统计量;
在非参数模型下,记:
YniYR
XniXR
niYRXR
i
i
ii
,,1)(
,,1)(
,,1)(,)(
4- 56
12)1(
)()(
1
1
12
1
2
1
)(
1
2
1
)(
1
)()(
2
1
2
2
1
2
1


n
YRXR
n
n
n
XR
n
n
XR
n
YRXR
n
i
ii
r
n
i
i
n
i
i
ii
此时相关系数
)(相同的方差样本均值有相同的与可得排列中由小到大排列,使其中一个样本在初始样本,独立同分布,可以重排与由于 YX
4- 57
111
2
1
2
1
2
1
)(
!
1
),,1),,(
2
4
2
1
1






n
r
r
n
n
n
f
nn
n
n
nRR
YX
的极限分布有密度时,较大时有当的分布。不难算出对较小的任一排列的概率都是(取独立的假设下。与在

12)1(
2
11

2
1
2

n
n
iR
n
n
i
i
rr 的更简明的表达式
4- 58



2,2
,2
,2
)?(
,
)?(
,
)?(
,

nr
nr
nr
tt
YX
tt
YX
tt
YX
零假设的拒绝域为有相关性时与当备择假设零假设的拒绝域为负相关时与当备择假设零假设的拒绝域为正相关时与当备择假设第 4章结束
22 ~)?(,1
2
)(?
nr tt
n
t?
有为计算方便作变换