第 8.1节 假设检验的基本概念
X众所周知,总体 的全部信息可以通过其分布函数 反映出来,但实际上,参数 往往未知,有时甚至 的表达式也未知,因此需要根据实际问题的需要,对总体参数或分布函数的表达式做出某种假设 (称为 统计假设 ),再利用从总体中获得的样本信息来对所作假设的真伪做出判断或进行检验,
),X(F
),X(F?
1,问题的提法统计检验 (假设检验 )
这种利用样本检验统计假设真伪的过程叫做在许多实际研究中,都有需要做出检验的问题,如,某批产品能否出厂?某生产线工作是否正常?某人是否患有某种疾病?
某种新药的治疗效果是否提高了?发生事故是否与星期几有关?某次水平考试是否正常?等等,都需要做出检验,
假设检验
参数假设检验非参数假设检验,
X~F(x,θ),θ为参数假设 θ=θ0
例 X~F(x),F(x)未知假设 F(x)=F0(x)
例 8.1.1.某地旅游者的消费额服从正态分布 X~N(μ,σ2),调查
25个旅游者,得出一组样本观测值 x1,x2,…,x 25,若有专家认为消费额的期望值为 μ0,如何由这组观测值验证这个说法?
假设检验为 μ=μ0
例 8.1.2.用精确方法测量某化工厂排放的气体中有害气体的含量服从正态分布 X~N(23,22),现用一简便方法测量 6次得一组数据 23,21,19,24,18,18(单位,十万分之一 ),问用简便方法测的有害气体含量是否有系统偏差?
假设检验 μ=23,σ2=22
例 8.1.3.用精确方法测量某化工厂排放的气体中有害气 体的含量服从正态分布 N(23,22),现用一简便方法测量 6次得一组数据
23,21,19,24,18,18(单位,十万分之一 ),若用简便方法测得有害气体含量的方差不变,问用该方法测得有害气体含量的均值是否有系统偏差?
假设 H0,μ=23,
解,由题意得,用简便方法测得有害气体含量 X~N(μ,22),
若 H0成立,则
)1,0(N~n/XU
若取 α=0.05,则 P{|U|>z1-α/2}=α,即,P{|U|>1.96}=0.05,
在假设成立的条件下,|U|>1.96为概率很小事件,一般认为,
小概率事件在一次实验中是不会发生的,
将样本观测值代入 U得,06.3
n/2
23Xu |u|>1.96,
小概率事件在一次实验中发生了,
否定原假设,简便方法测得均值有系统偏差,
故假设不合情理,即,
2,假设检验的基本思想
(1)小概率原理 (实际推断原理 )认为概率很小的事件在一次试验中实际上不会出现,并且小概率事件在一次试验中出现了,就被认为是不合理的,
(2)基本思想,先对总体的参数或分布函数的表达式 做出某种假设,然后找出一个在假设成立条件下出现可能性甚小的 (条件 )小概率事件,如果试验或抽样的 结果使该小概率事件出现了,这与小概率原理相违背,表明原来的假设有问题,应予以否定,即 拒绝这个假设,若该小概率事件在一次试验或抽样中并未出现,就没有理由否定这个假设,表明试验或抽样结果支持这个假设,这时称假设与实验结果是 相容的,或者说可以 接受原来的假设,
另一方面,当原假设不成立时,却作出接受原假设的结论,
造成犯,取伪,的错误,称为 第二类错误,
3,假设检验的两类错误在假设检验中,否定原假设的理由是小概率事件在一次试验中出现了,但小概率事件并不是不会出现,只是出现的可能性较小,即出现的概率不超过很小的正数,?
就是犯第一类错误的概率的最大允许值,?
一般用 表示犯第二类错误的概率,?
因此,根据小概率原理否定原假设,有可能 把本来客观上正确的假设否定了,造成犯,弃真,的错误,称为 第一类错误,
在进行假设检验时,我们采取的 原则 是,
控制犯第一类错误 (即 事先给定且很小 )的同时使犯第二类错误的概率达到最小,
当样本容量 一定时,小,就大,反之,小,就大,n
另外,一般,1
即使 碰巧出现,也决不能把,犯第一类错误,

,犯第二类错误,理解为相互对立的事件,
1
3,假设检验的两类错误
弃真充伪

α/2
α/2
X
φ(x)
增大样本容量 n时,可以使 α和 β同时减小,注意,
z1-α/2- z1-α/2
β
n/
0

μ=μ0 )1,0(N~
n/
XZ 0

μ≠μ0(μ>μ0)
)1,
n/
(N~
n/
XZ 00


小概率原理中,关于“小概率”的值通常根据实际问题的要求而定,如取 α=0.1,0.05,0.01等,
α为检验的显著性水平 (检验水平 ).
4,显著性水平与否定域在假设检验过程中,使得小概率事件出现的统计量的取值范围称为该假设检验的 否定域 (拒绝域 ),
否定域的边界称为该假设检验的 临界值,
α/2α/2
X
φ(x)
接受域
P{|U|<u1-α/2}=1-α
否定域的大小,依赖于显著性水平的取值,
一般说来,显著性水平越高,即 α越小,否定域也越小,这时原假设就越难否定,
注意,
否定域 否定域
z1-α/2- z1-α/2
5.假设与对立假设统计假设通常用字母,H,表示,如果关于总体有两个二者必居其一的假设,习惯上把其中的一个称作 原假设
(基本假设、零假设 )用 H0表示,而把另一个假设称作 对立假设 (备择假设 )用 H1表示,
原假设的确定一般应遵循以下几条原则,
一,要把,着重考察的假设,确定为原假设 ;
二,要把,支持旧方法的假设,确定为原假设 ;
三,要把等号放在原假设里 ;
四,要所答是所问,不要所答非所问 ;
五,“后果严重的错误,定为第一类错误,
原假设备择假设
H0
H1
当对立假设位于原假设两侧时,称为 双侧假设,相应的检验称为 双侧假设检验 ;当对立假设位于原假设一侧时,称为 单侧假设,相应的检验称为 单侧假设检验,
6,假设检验的一般步骤第一步 提出待检验的原假设 和对立假设 ; 0
H
1H
第二步 选择 检验统计量,并 找出 在假设成立条件下,该统计量所服从的 概率分布 ;
0H
第三步 根据所要求的显著性水平 α 和所选取的统计量,查 概率分布临界值表,确定 临界值与否定域 ;
第四步 将样本观察值代入所构造的检验统计量中,计算出该统计量的值,若该值落入否定域,则拒绝原假设,否则接受原假设0H,0H
第 8.2节 一个正态总体的假设检验
(2)选择包含 μ的分布已知函数,
n/
XU

)1,0(N~
(4)将样本观测值代入 U,
若 |U|>u1-α/2,否定原假设 ; |U|≤u1-α/2,接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
1.σ2已知,μ的假设检验,(H0:μ=μ0,μ≥μ0,μ≤μ0)
.21)u(
21


1) H0:μ=μ0; H1:μ≠μ0,
(1)提出原假设和备择假设,H0:μ=μ0; H1:μ≠μ0,
(3)由给定 α,查 u1-α/2,得 否定域为 |U|> u1-α/2,其中,
α/2α/2
X
φ(x)
接受域
P{|u|<u1-α/2}=1-α
否定域 否定域
u1-α/2- u1-α/2
双侧假设检验
U检验
(2)选择包含 μ的分布已知统计量,
例 8.2.1.由经验知某零件重量 X~N(μ,σ2),其中
μ=15,σ2=0.05,技术革新后,抽查 6个样品测得重量为 (单位,
克 )14.7,15.1,14.8,15.0,15.2,14.6,已知方差不变,问平均重量是否仍为 15?(α=0.05)
分析,σ2已知,μ的假设检验
n/
XU

(4)将样本观测值代入,
解 (1) H0:μ=μ0=15; H1:μ≠15,
(3)α=0.05,查表 Φ(u1-α/2)=Φ(u0.975)=0.975得 u1-α/2=1.96,
所以 否定域为 |U|> 1.96,
09.1|
6/05.0
159.14||
n/
X||U|

|U|≤u1-α/2,故接受原假设,即零件的平均重量仍为 15.
<1.96
例 8.2.2.用传统工艺加工罐头,每瓶 Vc含量平均值为 19毫克,现改进加工工艺,抽出 16瓶罐头测得 Vc含量为
23,20.5,21,22,20,22.5,19,20,23,20.5,18.8,20,19.5,18,23(毫克 ),
假定 Vc含量服从正态分布,方差 σ2=4,问新工艺下 Vc平均含量是否比旧工艺下含量高?
分析,所求结果为 μ>19或 μ≤19,选择 μ≤19为原假设,
解,设 H0,μ≤19,H1,μ>19
取统计量,U的分布不确定,
n/
19XU

n/
XU
令 则
,UU),1,0(N~U 对给定的 α,{U>u1-α} }uU{ 1
P{U>u1-α}≤ }uU{P
1
=α P{U>u1-α}≤α (小概率事件 )
查表得 u1-α=1.64,将样本观测值代入得 u=3.6 >1.64
小概率事件发生了,所以否定原假设,即新工艺下
Vc平均含量比旧工艺下含量高,(所答是所问 )
α
X
φ(x)
接受域
P{U>u1-α}≤α
否定域
u1-α
单侧假设检验
1)u( 1
(2)选择统计量,
(4)将样本观测值代入 U,
若 U>u1-α,否定原假设 ; U≤u1-α,接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
.1)u( 1
2) H0:μ≤μ0; H1:μ>μ0,
(1)提出原假设和备择假设,H0:μ≤μ0; H1:μ>μ0,
(3)由给定 α,查 z1-α,得 否定域为 U> u1-α,其中
n/
XU 0

(2)选择包含 μ的分布已知函数,
(4)将样本观测值代入 T,
若 |T|>t1-α/2(n-1),否定原假设 ;
|T|≤t1-α/2(n-1),接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
2.σ2未知,μ的假设检验:
(1)提出原假设和备择假设,H0:μ=μ0; H1:μ≠μ0,
(3)由给定 α,查 tα(n-1),得 否定域为 |T|> t1-α/2(n-1);
n/S
X~T )1n(t~?
)1n(t 2/1 X
f(x)
α/2α/2
接受域否定域否定域
(T检验)
总体方差
2
已知检验统计量
n
0
X
U

(
U
检验 )
总体方差
2
未知检验统计量
n
S
0
X
T

(
T
检验 )
0
H
1
H
在显著性水平
下的 0
H
的拒绝条件
0

0

2
1
u|U|
)1n(t|T|
2
1

0

0


1
uU
)1n(tT
1


0

0



1
uU
)1n(tT
1


单正态总体假设检验列表如下,
甲厂产品与预定规格不符乙厂产品与预定规格相符
1 1 9,0,1 2 0,0,1 1 9,2,1 1 9,7,1 1 9,6
从乙厂也抽取 5 件产品,测得其指标值为,
1 1 0,5,1 0 6,3,1 2 2,2,1 1 3,8,1 1 7,2
要根据这些数据去判断这两厂产品是否符合预定规格 12 0? ( 显著性水平 0,0 5)解 设甲厂产品指标服从正态分布 ),(N 2
11,乙厂产品指标服从正态分布 ),(N 222,21? 和 22? 均未知,
对甲厂,1 2 0:H 010,1 2 0:H 011 进行 T 检验,
对乙厂,1 2 0,020H,1 2 0,021H 进行 T 检验例 8.2.3 两厂生产同一产品,其质量指标假定都服从正态分布,标准规格为均值等于 120,现从甲厂抽出 5件产品测得其指标值为,
解 依题意,总体为,包装食品每袋净重量 )5.1,(~ 2?NX,
1 9,5,1 9,0,2 0,1,2 1,0,1 8,9,2 0,3,2 1,5,1 8,8,1 9,6,1 9,8,
1 9,8,1 9,6,1 9,6,1 8,9,1 7,8,1 8,0,2 0,0,2 0,3,2 1,0,2 1,2,
1 8,5,1 9,9,2 0,6,2 0,1,2 1,1,2 2,0,2 0,8,2 0,4,2 0,4,2 0,3,
1 9,5,1 9,5,2 0,0,2 1,0,1 8,9,1 9,6,1 9,8,2 0,0,2 1,0,2 0,1,
2 0,0,1 8,8,1 8,9,2 0,0,2 1,0,1 9,6,1 9,8 1 9,6,2 0,0,1 9,9,
问有无充分证据说明这些包装食品的平均重量减少了?
假设,
20,00H,01,H
例 8.2.4一家食品加工公司的质量管理部门规定,
某种包装食品每包净重不得少于 20千克,经验表明,重 量近似服从标准差为 1.5的正态分布,假定得到 50包食品构成的样本为,
接受域
(2)选择包含 σ2的分布已知函数,
(1)提出原假设和备择假设,
(3)由给定 α,查
H0,σ2 = σ02; H1,σ2 ≠ σ02
2
2
2 )1(

Sn )1n(~ 2



)}1n(
)1n(
2
2
2
2
1
2
1


X
f(x)
α/2α/2
λ1 λ2
否定域否定域
3.未知期望 μ,σ2的 (双侧 )假设检验,( 检验)2?
得 接受域为 λ1< <λ2;2?
(4)将样本观测值代入,
若 λ1< <λ2,接受原假设 ;
否则,拒绝原假设,
2?
2?
例 8.2.5设某次考试的考生成绩服从正态分布,从中随机地抽取 36位考生的成绩,算得平均成绩为 66.5分,标准差为 15分,问在显著性水平 α=0.05下,是否可以认为这次考试全体考生的平均成绩为 70分?
(2)选择包含 μ的分布已知统计量,
分析,设考生成绩 X~N(μ,σ2),σ2未知,μ的假设检验
n/S
XT
(4)将样本观测值代入,
解 (1) H0:μ=μ0=70; H1:μ≠70,
(3)α=0.05,查表得 t1-α/2(n-1)=t0.975(35)=2.0301,
所以 否定域为 |T|> 2.0301,
|
n/S
X||T|?
故接受原假设,即可以认为考生平均成绩为 70.
<2.03014.1|
36/15
705.66|
例 8.2.6.某炼铁厂铁水含碳量在正常情况下服从正态分布,现对操作工艺进行了改变,从中抽取 7炉铁水的试样测得 问是否可以认为新工艺炼出的铁水含量的方差仍为 0.1122?(α=0.05)
,2 1 0 6.0)Xx(,36.4X
7
1i
2
i
(2)选择统计量,
故拒绝原假设,即认为方差不是 0.1122.
解,(1)H0,σ2 = 0.1122; H1,σ2 ≠ 0.1122
2
2
2 S)1n(
)1n(~ 2



4 49.14)6()1n(
,2 37.1)6()1n(
975.0
2
2
1
2
2
025.0
2
2
2
1(3)查表得
>14.449
接受域为 λ1< <λ22?
(4)将样本观测值代入,得 =16.792?
4.未知期望 μ,σ2的 (单侧 )假设检验:
(1)提出原假设和备择假设,H0,σ2 ≤σ02; H1,σ2 >σ02
2
2
2
1
S)1n(
)1n(~ 2(2)选择统计量
2
0
2
2 S)1n(

则 2
12
对给定的 α及任意实数 λ有 }{}{ 2
12
即 }{P}{P 2
12
取 )1n(
21

)}1n({P 212
(3) 所以,否定域为 ))1n(2
12
(4)将样本观测值代入,若接受原假设 ;否则,拒绝原假设,
))1n(1222?
接受域
X
f(x)
α
否定域
)}1n({P 212
))1n(12
单侧假设检验
2
2
2
1
S)1n(

)1n(~ 2
例 8.2.7.某中导线要求电阻的标准差不得超过
0.005Ω,今在生产的一批导线中取样品 9根,测得 S=0.007Ω.
设总体服从正态分布,在显著性水平 α=0.05条件下,能认为这批导线的标准差显著偏大吗?
解,(1)H0,σ ≤σ0=0.005; H1,σ>0.005
2
0
2
2 S)1n(

5 0 7.15)8()1n( 95.0212
(2)选择统计量
(3)查临界值得
507.152所以,否定域为
(4)将样本观测值代入,得 68.152 >15.507
所以 拒绝原假设,即认为标准差显著偏大,
2?
例 8.2.8 在正常的生产条件下,某产品的测试指标总体
),(~ 200NX,其中 23.00,后来改变了生产工艺,出了新产品,
假设新产品的测试指标总体仍为 X,且知 ),(~ 2NX,从新产品中随机地抽取 10 件,测得样本值为 1021,,,xxx L,计算得到样本标准差 S =0.33,试在检验水平? =0.05 的情况下检验,( a ) 方差 2?
有没有显著变化? ( b ) 方差 2? 是否变大?
解,( a ) 是双侧检验,( b ) 是单侧检验,
( a ) 建立假设 22020 23.0,H,2021,H
新产品指标的方差与正常情况下产品指标的方差比较没有显著变化
( b ) 建立假设 22020 23.0,H,2021,H
新产品指标的方差比正常情况下产品指标的方差显著地变大,
5.?已知,σ2的假设检验
2
0
2
0,H,
2
0
2
1,H
2
0
2
0,
H,2
0
2
1,
H
2
0
2
0,
H,2
0
2
1,
H
选用检验统计量为,
2
0
n
1i
2
i
2
)X(


未知时检验统计量
2
0
2
2 )1(
Sn
( 2? 检验 )
已知时检验统计量
2
0
1
2
2
)(
n
i
iX
( 2? 检验 )
0H 1H
在显著性水平? 下拒绝 0H 的条件
2
0
2 2
0
2 )1(
2
1
2
2
n 或
)1(22
2
< n
)(212
2
n 或
)(22
2
n
2
0
2 2
0
2
)1(22 n1 )(22 n1
2
0
2 2
0
2
)1(22 n )(22 n
结论如下,
例 8.2.9.
机器包装食盐,假设每袋盐重服从正态分布,规定每袋盐标准重量为 500 克,标准差不能超过 10 克。某日开工后,从装好的食盐中随机抽取 9 袋,测得重量为 ( 单位:克 ),
497 507 510 475 484 488 524 491 515
问这天包装机的工作是否正常 ( 05.0 )?
解,需分两步进行检验
5 0 0:H5 0 0:H 100( 1)
取统计量 )1n(t~
n
s
50 0Xt
2
查表得 3 0 6.2)8(t
21

经计算 306.2187.0
9
03.16
500499
n
s
X
|T|
22
0
0

不能否定 H0,可认为平均每袋盐 500克。
( 2)
221220 10:H10:H在 0
H? 成立的条件下,
)1n(~s)1n(
10
s)1n( 22
2
2
2
2
2
1

查表得 5.15)8(2
1
计算得
5.1556.2010 03.168s)1n( 2
2
2
0
2
2
0,1

所以,否定
0H?,即可以认为方差超过
210,包装机工作不稳定。
由( 1),( 2)可以认为,包装机工作不正常。
第 8.3节 两个正态总体的假设检验先看一个例子,某地区高考负责人从某年来自 A市中学考生和来自 B市中学考生中抽样获得如下资料,
A市中学考生,
B市中学考生,
50,5 4 5,17 111 sxn
55,495,15 222 sxn
已知两地考生成绩服从正态分布,方差大致相同,由以上资料 能不能说某年来自 A市中学考生的平均成绩比来自
B市中学考生的平均成绩高,
设 A市考生成绩 X~N(μ1,σ12),B市考生成绩 Y~ N(μ2,σ22),
21
假设检验
(一 ) σ12,σ22已知,μ1-μ2的假设检验,
设总体 X~N(μ1,σ12),总体 Y~ N(μ2,σ22),X,Y
相互独立,从中分别抽取容量为 n1,n2的样本 X1,…,和
Y1,…,,样本均值和样本方差分别记为,S,Y;S,X 2
221
1nX
2nY
2
2
21
2
1
0
n/n/
)YX(
U


(2) 选择检验统计量,
(1) 提出原假设和备择假设,
H0:μ1-μ2=μ0,H1,μ1-μ2≠ μ0
同单正态总体类似可得,0210,H
的拒绝条件为, 1uU
0210,H
的拒绝条件为, 1uU
(4)将样本观测值代入 U,
若 |U|>u1-α/2,否定原假设 ; 若 |U|≤u1-α/2,接受原假设,
.21)u(
21


(3)给定 α,查 u1-α/2,得 否定域为 |U|> u1-α/2,
其中解 设第一教学班数学成绩
)57,(N~X
1
,
第二教学班数学成绩
)43,(N~Y
2
,
21
nn?
= 1 6,05.0,
建立假设
0:H
210

,
0:H
211

用统计量
2
2
21
2
1
n/n/
YX
U

例 8.3.1 从两个教学班各随机选取 16名学生进行数学测验,第一教学班与第二教学班测验结果的样本方差分别为 80,82,已知两教学班数学成绩的方差分别为 57与 43,在显著性水平 0.05下,可否认为这两个教学班学生的数学测验成绩有差异?
(二 ) σ12=σ22=σ2,σ2未知,μ1-μ2的假设检验,
)2nn(t~
n/1n/1S
)YX(T
21
21w
0

(1) 选择检验统计量
(2)给定 α,查表得 t1-α/2(n1+n2-2)或 t1-α(n1+n2-2),可知
(T检验)
0210
:H 的拒绝条件为,)2nn(t|T| 211
2

0210
:H
的拒绝条件为,)2nn(tT 211
0210
:H
的拒绝条件为,)2nn(tT 211
(三 ) σ12,σ22未知,且 σ12?σ22,但 n1=n2,μ1-μ2的假设检验,
通常采用配对试验的 t检验法令 )n,,2,1i(YXZ
iii L
则 ),(N~Z 2
22121i
)Z,,Z,Z( n21 L 可看作是来自总体
),(N~Z 222121 的一个样本检验假设
02110210,H,:H
用统计量
)1n(t~
n
S
Z
T
2
0
成对数据比较检验法实例 设某一种农作物有两个品种 A,B,要比较谁的平均亩产量大,按前一段所讨论的检验两个正态总体均值之差的方法,
我们可以准备 块形状面积相同的地块,其中 块种植品种 A,得亩产量,另 块种植品种 B,得亩产量
,然后按上段检验法去处理,这样做有一个前提,就是这个地块的条件必须比较一致,不然的话,假如分配给品种 A
的那块地比较肥沃,或其它条件较好,则即使 A品种并不优于 B,
试验结果也可能有利于它,改进的方法是取 n对地块,每对包含两个形状条件一致的地块,其中一块种植 A,另一块种植 B (哪一块给 A可随机决定 ),这样设计时,哪一个品种也不会占地利之便,不同对的地块条件不必一致,因而较容易办到
21 nn? 1n
1n21 X,,X,X L 2n
2n21 Y,,Y,Y L
一般模型,设有两个需要进行比较的处理,
每对中的两个试验单元条件尽可能一致,而不同对之间则不要求一致,在每一对内,随机地决定把其中的一个试验单元给处理 1,另一个给处理 2,经过试验,观测各处理在每个试验单元上的试验结果,如下表,
对 处理 1 处理 2 差 iii YXZ
n
2
1
n
X
X
X
2
1
n
Y
Y
Y
2
1
nnn
YXZ
YXZ
YXZ



222
111
假定 iii YXZ 服从正态分布 ),( 2N,
表示处 理 1 平均优于处理 2 的量,
① 两处理效果一样,? =0
② 处理 2 不优于处理 1, 0
③ 处理 2 不劣于处理 1, 0
④ 处理 1 平均优于处理 2 的量为
0
,? =
0
⑤ 处理 1 平均优于处理 2 的量不超过
0
,?
0
⑥ 处理 1 平均优于处理 2 的量不小于
0
,?
0
nZZZ,,,21 L 可视为取自正态总体 ),(
2N 的样本,
选取检验统计量,
n
S d
Z
T 0

其中 YXZ,?

n
i
ind ZZS
1
2
1
12 )(,
00,H 成立时,)1(~?ntT,
对给定的显著性水平
,
00
:H
的拒绝条件为,
)1n(t|T|
2
1

00
:H
的拒绝条件为,
)1n(tT
1


00
:H
的拒绝条件为,
)1n(tT
1


(四 ) σ12,σ22未知,且 σ12?σ22,但 n1<n2,μ1-μ2的假设检验,
)n,,2,1i(Yn 1Ynn 1YnnXZ 1
n
1k
k
2
n
1k
k
21
i
2
1
ii
21 L


2122
2
1
2
2
1
1i n
n
n
n)Z(E
2
2
2
12
1
212
1
22
1
2
2
2
2
21
12
2
2
2
2
12
1
2
2
n
1k
k
2
2
n
1k
k
21
2i
2
1
1ii
n
n
)
nnn
n2
nn
n2
n
2
n
n
nn
n
(
n
n
)]Y(
n
1
)Y(
nn
1
)Y(
n
n
X[E)Z(D
21



其中 )n,,2,1j,i,ji(0)Z,Z(C o v
1ji L
)Z,,Z,Z( 1n21 L 可看作如下总体的样本 )
n
n,(N 2
2
2
12121
检验假设
02110210,H,:H
取统计量
)1n(t~
n
S
ZT
1
1
2
0
(五 )未知 μ1,μ2,方差比 σ12/σ22的假设检验,
(2)选择检验统计量,
(3)查临界值,
)1n,1n(F~
S
SF
212
2
2
1
)1n,1n(F 21
2

X
f(x)
α/2 α/2
)1n,1n(F 21
21

λ1 λ2
得否定域为 F<λ1或 F> λ2
)1n,1n(F
1
122/1



)1n,1n(F
,
)1n,1n(F
1
21
2
1
2
12
2
1
1
(4)将样本观测值代入 F,
若 F<λ1或 F> λ2否定原假设 ;
否则,接受原假设,
(1)提出原假设和备择假设,H0:σ12/σ22=1; H1,σ12/σ22 ≠1
类似地可得,
1:H
2
2
2
1
0

的拒绝条件为,
)1n,1n(FF
211


1:H
2
2
2
1
0

的拒绝条件为,
)1n,1n(FF
21

单正态总体参数的假设检验双正态总体的假设检验小结,
期望假设检验方差的假设检验
σ2已知
σ2未知
均值差的假设检验方差比的假设检验
两个方差都已知两个方差未知但相等
U
T
F
双侧单侧
双侧单侧
U
T
2?
(1)检验的命名依据的是所用检验统计量的概率分布,无论是哪种检验,都要用到相应分布的分位数,各种分布的分位数记号一定要清楚 ;
(2)无论是双侧检验还是单侧检验,对同一类检验问题,所选用的统计量都是一样的,所不同的是否定域,要很好地掌握确定否定域的方法 ;
(3)方差未知时,对两总体均值的比较,应当先进行方差的比较 (F-检验 ),得到两总体方差相等的结论后,再进行均值的比较 (t-检验 ).
注意,
例 8.3.3 为了解两种教学法对 9名学生试验的结果,经试验后,测得成绩如图中 A列和 B列,假定总体为正态,以
0.05为显著性水平,检验此两种教学法效果是否不同?
解 检验原假设
00,H
=0
1,设我国出口凤尾鱼罐头 250克,根据以往经验,标准差是 3克,现在某食品工厂生产一批供出口用的这种罐头,从中抽取
100罐检验,其平均净重是 251克,假定罐头重量服从正态分布,按规定显著性水平为 0.05,问这批罐头是否合乎出口标准,即净重恰为 250克?
σ 2=9已知,μ=250 的一个正态总体假设检验,
练习
2,一家食品加工公司的质量管理部门规定,某中包装食品每包净重不得少于 20千克,经验表明,重量近似服从标准差为 1.5千克的正态分布,假定从一个由
50包食品构成的随机样本中得到的平均重量为 19.5千克,问有无充分证据说明这些包装食品的平均重量减少了?
方差已知,一个正态总体均值的单侧假设检验
3(954),设 是来自正态总体的 s.r.s,其中 μ,σ2均为未知,记则假设 的 t 检验使用统计量 t =__



n
i
i
n
i
i XXSXnX
1
22
1
)(,1  
0:0H
),(~ 2NX
nXX,,1 L
)1(?nnSX
5 某公司人事部门为一项工程上马在社会上招大批青年工人,在文化考试结束后,经理问人事部门情况怎么样?回答说,很好,估计平均成绩可达 90分,经理随即地从试卷中抽出 20份,发现平均成绩为 83分,标准差为 12分,如果经理想在 0.01的显著性水平下检验人事部门所做的推测的准确性,应该怎样处理?
方差未知,一个正态总体均值的双侧假设检验
H0:μ=90
两个需要说明的问题
1,统计检验与区间估计的关系
① 利用统计检验可建立区间估计,反之亦然设 为取自正态总体 的样本,方差未知
n21 X,,X,X L ),(N 2
检验 00,H,01,H
接受条件为,)1n(t|X|
21
n
S
0

亦即
)1n(tX)1n(tX
22 1n
S0
1n
S

0? 改成?,便可得到? 的置信度为 1 -? 的置信区间,
反之,若我们先确定了 的区间估计,?
)1n(tX)1n(tX 22 1nS1nS
改成 0?
得到了原假设 00,H 的接受条件也就得到了 00,H 的拒绝条件,检验水平为?,
② 统计检验和区间估计的结果,在解释上可以有差别检验假设 00,H = 0 ( 水平? ) 及作? 的区间估计 ( 置信度为1 ),
对不同的样本值,以下几种情况都可能出现,
(Ⅰ ) 接受 = 0,区间估计为 (-0.001,0.002);
(Ⅱ ) 接受 = 0,区间估计为 (-1000,1500);
(Ⅲ ) 拒绝 = 0,区间估计为 (1000,2000);
(Ⅳ ) 拒绝 = 0,区间估计为 (0.001,0.002).
00,H
00,H
00,H
00,H
2,检验的 p值一般说来,用统计检验作出的结论,不如区间估计那么精细。 这一点的根由就在于统计检验这种形式固有的粗造性。
在正态总体 )1,(N? 中抽取样本 1621 X,,X,X L
检验假设 0:H 0,0:1H
取检验水平 0.05,拒绝的条件为,49.0|X|?
假设对一组具体的 1621 X,,X,X L 有 48.0?X
,接受 H0
假设另一组具体的 1621 X,,X,X L 有 12.0?X,
接受 H0
观察可见,在后一场合,作出 的结论根据大一些,0
设对某一组具体样本,计算出,则这组样本的 p值定义为,
bX?
)1,0(N~Z| },b||Z{|Pp  
p 愈大 ( 小 ),认为 0 的根据就愈足 ( 不足 ),
当 p 值落到给定的水平? 之下时,就要拒绝 0 了,
若,但离 很近,则我们虽不能拒绝,但对它抱着很怀疑的态度,
p?
推广到一般情况,设有一个原假设 H0,其拒绝条件为 |T|>C,T为检验统计量,
若对一组具体样本计算出统计量 T之值为 T0,则这组样本的 p值是,
}H||T||T{|Pp 00
如果拒绝条件为 T>C,则 p值为 }H|TT{Pp 00
如果拒绝条件为 T<C,则 p值为 }H|TT{Pp
00
例 从电话公司每月长途电话的帐单中,随机抽取 37张,计算平均费用为 33.15元,标准差为 21.21元,假定费用服从正态分布,未知,要检验假设
,,试计算 p值,
),(N 2 2?
30:H 0 30:H 1
n/S
XT 0
)1n(t~
0H
成立时解,取检验统计量依样本计算检验统计量的值为 9 0 3 3 8.03015.33T
37
21.210?

}H|90.0|T{|P}H||T||T{|Pp 000 =,37233
说明样本支持原假设,故要接受原假设,
注意,Excel中 p值应用函数为
3 7 2 3 3.0)2,137,9 0 3 3 8.0(T D I S T)T a i l s,df,x(T D I S T