第 8.1节 假设检验的基本概念
X众所周知,总体 的全部信息可以通过其分布
函数 反映出来,但实际上,参数 往往未知,有时
甚至 的表达式也未知,因此需要根据实际问题
的需要,对总体参数或分布函数的表达式做出某种
假设 (称为 统计假设 ),再利用从总体中获得的样本信
息来对所作假设的真伪做出判断或进行检验,
),X(F ? ?
),X(F ?
1,问题的提法
统计检验 (假设检验 )
这种利用样本检验统计假设真伪的过程叫做
在许多实际研究中,都有需要做出检
验的问题,如,某批产品能否出厂?某生产
线工作是否正常?某人是否患有某种疾病?
某种新药的治疗效果是否提高了?发生事
故是否与星期几有关?某次水平考试是否
正常?等等,都需要做出检验,
假
设
检
验
?
参数假设检验
非参数假设检验,
X~F(x,θ),θ为参数
假设 θ=θ0
例 X~F(x),F(x)未知
假设 F(x)=F0(x)
?
?
例 8.1.1.某地旅游者的消费额服从正态分布 X~N(μ,σ2),调查
25个旅游者,得出一组样本观测值 x1,x2,…,x 25,若有专家认为
消费额的期望值为 μ0,如何由这组观测值验证这个说法?
假设检验为 μ=μ0
例 8.1.2.用精确方法测量某化工厂排放的气体中有害气体
的含量服从正态分布 X~N(23,22),现用一简便方法测量 6次
得一组数据 23,21,19,24,18,18(单位,十万分之一 ),问用简便
方法测的有害气体含量是否有系统偏差?
假设检验 μ=23,σ2=22
例 8.1.3.用精确方法测量某化工厂排放的气体中有害气 体的
含量服从正态分布 N(23,22),现用一简便方法测量 6次得一组数据
23,21,19,24,18,18(单位,十万分之一 ),若用简便方法测得有害气体含量
的方差不变,问用该方法测得有害气体含量的均值是否有系统偏差?
假设 H0,μ=23,
解,由题意得,用简便方法测得有害气体含量 X~N(μ,22),
若 H0成立,则
)1,0(N~n/XU ? ???
若取 α=0.05,则 P{|U|>z1-α/2}=α,即, P{|U|>1.96}=0.05,
在假设成立的条件下,|U|>1.96为概率很小事件,一般认为,
小概率事件在一次实验中是不会发生的,
将样本观测值代入 U得,06.3
n/2
23Xu ??? |u|>1.96,
小概率事件在一次实验中发生了,
否定原假设,简便方法测得均值有系统偏差,
故假设不合情理,即,
2,假设检验的基本思想
(1)小概率原理 (实际推断原理 )认为概率很小的事件在一
次试验中实际上不会出现,并且小概率事件在一次试验中
出现了,就被认为是不合理的,
(2)基本思想,先对总体的参数或分布函数的表达式 做出某
种假设,然后找出一个在假设成立条件下出现可能性甚小
的 (条件 )小概率事件,如果试验或抽样的 结果使该小概率
事件出现了,这与小概率原理相违背,表明原来的假设有问
题,应予以否定,即 拒绝这个假设,若该小概率事件在一次
试验或抽样中并未出现,就没有理由否定这个假设,表明试
验或抽样结果支持这个假设,这时称假设与实验结果是 相
容的,或者说可以 接受原来的假设,
另一方面,当原假设不成立时,却作出接受原假设的结论,
造成犯, 取伪, 的错误,称为 第二类错误,
3,假设检验的两类错误
在假设检验中,否定原假设的理由是小概率事件在一次试
验中出现了,但小概率事件并不是不会出现,只是出现的可
能性较小,即出现的概率不超过很小的正数,?
就是犯第一类错误的概率的最大允许值,?
一般用 表示犯第二类错误的概率,?
因此,根据小概率原理否定原假设,有可能 把本来客观上正
确的假设否定了,造成犯, 弃真, 的错误,称为 第一类错误,
在进行假设检验时,我们采取的 原则 是,
控制犯第一类错误 (即 事先给定且很小 )的同时使犯
第二类错误的概率达到最小,
?
当样本容量 一定时,小,就大,反之,小,就大,n ?? ? ?
另外,一般,1?? ??
即使 碰巧出现,也决不能把, 犯第一类错误,
和
,犯第二类错误, 理解为相互对立的事件,
1?? ??
3,假设检验的两类错误
?
弃真
充伪
??
?
α/2
α/2
X
φ(x)
增大样本容量 n时,可以使 α和 β同时减小,注意,
z1-α/2- z1-α/2
β
n/
0
?
???
μ=μ0 )1,0(N~
n/
XZ 0
?
???
μ≠μ0(μ>μ0)
)1,
n/
(N~
n/
XZ 00
?
???
?
????
小概率原理中,关于“小概率”的值通常根据实
际问题的要求而定,如取 α=0.1,0.05,0.01等,
α为检验的显著性水平 (检验水平 ).
4,显著性水平与否定域
在假设检验过程中,使得小概率事件出现的统计
量的取值范围称为该假设检验的 否定域 (拒绝域 ),
否定域的边界称为该假设检验的 临界值,
α/2α/2
X
φ(x)
接受域
P{|U|<u1-α/2}=1-α
否定域的大小,依赖于显著性水平的取值,
一般说来,显著性水平越高,即 α越小,否定域也越
小,这时原假设就越难否定,
注意,
否定域 否定域
z1-α/2- z1-α/2
5.假设与对立假设
统计假设通常用字母, H,表示,如果关于总体有两个
二者必居其一的假设,习惯上把其中的一个称作 原假设
(基本假设、零假设 )用 H0表示,而把另一个假设称作 对
立假设 (备择假设 )用 H1表示,
原假设的确定一般应遵循以下几条原则,
一,要把, 着重考察的假设, 确定为原假设 ;
二,要把, 支持旧方法的假设, 确定为原假设 ;
三,要把等号放在原假设里 ;
四,要所答是所问,不要所答非所问 ;
五,“后果严重的错误, 定为第一类错误,
?
原假设
备择假设
H0
H1
当对立假设位于原假设两侧时,称为 双侧假设,相应的检
验称为 双侧假设检验 ;当对立假设位于原假设一侧时,称
为 单侧假设,相应的检验称为 单侧假设检验,
6,假设检验的一般步骤
第一步 提出待检验的原假设 和对
立假设 ; 0
H
1H
第二步 选择 检验统计量,并 找出 在假设
成立条件下,该统计量所服从的 概率分布 ;
0H
第三步 根据所要求的显著性水平 α 和所
选取的统计量,查 概率分布临界值表,确定 临界
值与否定域 ;
第四步 将样本观察值代入所构造的检验
统计量中,计算出该统计量的值,若该值落入否
定域,则拒绝原假设,否则接受原假设0H,0H
第 8.2节 一个正态总体的假设检验
(2)选择包含 μ的分布已知函数,
n/
XU
?
???
)1,0(N~
(4)将样本观测值代入 U,
若 |U|>u1-α/2,否定原假设 ; |U|≤u1-α/2,接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
1.σ2已知,μ的假设检验,(H0:μ=μ0,μ≥μ0,μ≤μ0)
.21)u(
21
????
??
1) H0:μ=μ0; H1:μ≠μ0,
(1)提出原假设和备择假设, H0:μ=μ0; H1:μ≠μ0,
(3)由给定 α,查 u1-α/2,得 否定域为 |U|> u1-α/2,其中,
α/2α/2
X
φ(x)
接受域
P{|u|<u1-α/2}=1-α
否定域 否定域
u1-α/2- u1-α/2
双侧假设检验
U检验
(2)选择包含 μ的分布已知统计量,
例 8.2.1.由经验知某零件重量 X~N(μ,σ2),其中
μ=15,σ2=0.05,技术革新后,抽查 6个样品测得重量为 (单位,
克 )14.7,15.1,14.8,15.0,15.2,14.6,已知方差不变,问平均重量
是否仍为 15?(α=0.05)
分析,σ2已知,μ的假设检验
n/
XU
?
???
(4)将样本观测值代入,
解 (1) H0:μ=μ0=15; H1:μ≠15,
(3)α=0.05,查表 Φ(u1-α/2)=Φ(u0.975)=0.975得 u1-α/2=1.96,
所以 否定域为 |U|> 1.96,
09.1|
6/05.0
159.14||
n/
X||U| ???
?
???
|U|≤u1-α/2,故接受原假设,即零件的平均重量仍为 15.
<1.96
例 8.2.2.用传统工艺加工罐头,每瓶 Vc含量平均值
为 19毫克,现改进加工工艺,抽出 16瓶罐头测得 Vc含量为
23,20.5,21,22,20,22.5,19,20,23,20.5,18.8,20,19.5,18,23(毫克 ),
假定 Vc含量服从正态分布,方差 σ2=4,问新工艺下 Vc平均含
量是否比旧工艺下含量高?
分析,所求结果为 μ>19或 μ≤19,选择 μ≤19为原假设,
解,设 H0,μ≤19,H1,μ>19
取统计量,U的分布不确定,
n/
19XU
?
??
n/
XU
?
????令 则
,UU),1,0(N~U ??? 对给定的 α,{U>u1-α} }uU{ 1 ?????
P{U>u1-α}≤ }uU{P
1 ????
=α P{U>u1-α}≤α (小概率事件 )
查表得 u1-α=1.64,将样本观测值代入得 u=3.6 >1.64
小概率事件发生了,所以否定原假设,即新工艺下
Vc平均含量比旧工艺下含量高,(所答是所问 )
α
X
φ(x)
接受域
P{U>u1-α}≤α
否定域
u1-α
单侧假设检验
???? ?? 1)u( 1
(2)选择统计量,
(4)将样本观测值代入 U,
若 U>u1-α,否定原假设 ; U≤u1-α,接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
.1)u( 1 ???? ??
2) H0:μ≤μ0; H1:μ>μ0,
(1)提出原假设和备择假设, H0:μ≤μ0; H1:μ>μ0,
(3)由给定 α,查 z1-α,得 否定域为 U> u1-α,其中
n/
XU 0
?
???
(2)选择包含 μ的分布已知函数,
(4)将样本观测值代入 T,
若 |T|>t1-α/2(n-1),否定原假设 ;
|T|≤t1-α/2(n-1),接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
2.σ2未知,μ的假设检验:
(1)提出原假设和备择假设, H0:μ=μ0; H1:μ≠μ0,
(3)由给定 α,查 tα(n-1),得 否
定域为 |T|> t1-α/2(n-1);
n/S
X~T ?? )1n(t~ ?
)1n(t 2/1 ??? X
f(x)
α/2α/2
接受域否定域
否定域
(T检验)
总体方差
2
? 已知
检验统计量
n
0
X
U
?
??
?
(
U
检验 )
总体方差
2
?
未知
检验统计量
n
S
0
X
T
??
?
(
T
检验 )
0
H
1
H
在显著性水平
?
下的 0
H
的拒绝条件
0
???
0
???
2
1
u|U|
?
?
?
)1n(t|T|
2
1
??
?
?
0
???
0
???
??
?
1
uU
)1n(tT
1
??
??
0
???
0
???
??
??
1
uU
)1n(tT
1
???
??
单正态总体假设检验列表如下,
甲厂产品与预定规格不符
乙厂产品与预定规格相符
1 1 9, 0,1 2 0, 0,1 1 9, 2,1 1 9, 7,1 1 9, 6
从乙厂也抽取 5 件产品,测得其指标值为,
1 1 0, 5,1 0 6, 3,1 2 2, 2,1 1 3, 8,1 1 7, 2
要根据这些数据去判断这两厂产品是否符合预定
规格 12 0? ( 显著性水平 0,0 5)解 设甲厂产品指标服从正态分布 ),(N 2
11 ??,乙厂产品指标服从
正态分布 ),(N 222 ??, 21? 和 22? 均未知,
对甲厂,1 2 0:H 010 ????,1 2 0:H 011 ???? 进行 T 检验,
对乙厂,1 2 0,020 ??? ??H,1 2 0,021 ??? ??H 进行 T 检验
例 8.2.3 两厂生产同一产品,其质量指标假定都服
从正态分布,标准规格为均值等于 120,现从甲厂抽出 5件产
品测得其指标值为,
解 依题意,总体为, 包装食品每袋净重量 )5.1,(~ 2?NX,
1 9, 5,1 9, 0,2 0, 1,2 1, 0,1 8, 9,2 0, 3,2 1, 5,1 8, 8,1 9, 6,1 9, 8,
1 9, 8,1 9, 6,1 9, 6,1 8, 9,1 7, 8,1 8, 0,2 0, 0,2 0, 3,2 1, 0,2 1, 2,
1 8, 5,1 9, 9,2 0, 6,2 0, 1,2 1, 1,2 2, 0,2 0, 8,2 0, 4,2 0, 4,2 0, 3,
1 9, 5,1 9, 5,2 0, 0,2 1, 0,1 8, 9,1 9, 6,1 9, 8,2 0, 0,2 1, 0,2 0, 1,
2 0, 0,1 8, 8,1 8, 9,2 0, 0,2 1, 0,1 9, 6,1 9, 8 1 9, 6,2 0, 0,1 9, 9,
问有无充分证据说明这些包装食品的平均重量减少了?
假设,
20,00 ?? ??H,01, ?? ?H
例 8.2.4一家食品加工公司的质量管理部门规定,
某种包装食品每包净重不得少于 20千克,经验表明,重 量
近似服从标准差为 1.5的正态分布,假定得到 50包食品构成
的样本为,
接受域
(2)选择包含 σ2的分布已知函数,
(1)提出原假设和备择假设,
(3)由给定 α,查
H0,σ2 = σ02; H1,σ2 ≠ σ02
2
2
2 )1(
??
Sn ?? )1n(~ 2 ??
??
?
?
?
??
?? ?
)}1n(
)1n(
2
2
2
2
1
2
1
?
?
??
??
X
f(x)
α/2α/2
λ1 λ2
否定域否定域
3.未知期望 μ,σ2的 (双侧 )假设检验,( 检验)2?
得 接受域为 λ1< <λ2;2?
(4)将样本观测值代入,
若 λ1< <λ2,接受原假设 ;
否则,拒绝原假设,
2?
2?
例 8.2.5设某次考试的考生成绩服从正态分布,从中
随机地抽取 36位考生的成绩,算得平均成绩为 66.5分,标准
差为 15分,问在显著性水平 α=0.05下,是否可以认为这次考
试全体考生的平均成绩为 70分?
(2)选择包含 μ的分布已知统计量,
分析,设考生成绩 X~N(μ,σ2),σ2未知,μ的假设检验
n/S
XT ???
(4)将样本观测值代入,
解 (1) H0:μ=μ0=70; H1:μ≠70,
(3)α=0.05,查表得 t1-α/2(n-1)=t0.975(35)=2.0301,
所以 否定域为 |T|> 2.0301,
??? |
n/S
X||T| ?
故接受原假设,即可以认为考生平均成绩为 70.
<2.03014.1|
36/15
705.66| ??
例 8.2.6.某炼铁厂铁水含碳量在正常情况下服从
正态分布,现对操作工艺进行了改变,从中抽取 7炉铁水
的试样测得 问是否可以
认为新工艺炼出的铁水含量的方差仍为 0.1122?(α=0.05)
,2 1 0 6.0)Xx(,36.4X
7
1i
2
i ??? ?
?
(2)选择统计量,
故拒绝原假设,即认为方差不是 0.1122.
解,(1)H0,σ2 = 0.1122; H1,σ2 ≠ 0.1122
2
2
2 S)1n(
?
??? )1n(~ 2 ??
??
?
?
?
???????
???????
?
?
?
4 49.14)6()1n(
,2 37.1)6()1n(
975.0
2
2
1
2
2
025.0
2
2
2
1(3)查表得
>14.449
接受域为 λ1< <λ22?
(4)将样本观测值代入,得 =16.792?
4.未知期望 μ,σ2的 (单侧 )假设检验:
(1)提出原假设和备择假设, H0,σ2 ≤σ02; H1,σ2 >σ02
2
2
2
1
S)1n(
?
??? )1n(~ 2 ??(2)选择统计量
2
0
2
2 S)1n(
?
???
则 2
12 ???
对给定的 α及任意实数 λ有 }{}{ 2
12 ???????
即 }{P}{P 2
12 ???????
取 )1n(
21 ???? ??
=α
?
?????? ?? )}1n({P 212
(3) 所以,否定域为 ))1n(2
12 ???? ??
(4)将样本观测值代入,若
接受原假设 ;否则,拒绝原假设,
))1n(122 ???? ??2?
接受域
X
f(x)
α
否定域
?????? ?? )}1n({P 212
))1n(12 ?? ??
单侧假设检验
2
2
2
1
S)1n(
?
???
)1n(~ 2 ??
例 8.2.7.某中导线要求电阻的标准差不得超过
0.005Ω,今在生产的一批导线中取样品 9根,测得 S=0.007Ω.
设总体服从正态分布,在显著性水平 α=0.05条件下,能认为
这批导线的标准差显著偏大吗?
解,(1)H0,σ ≤σ0=0.005; H1,σ>0.005
2
0
2
2 S)1n(
?
???
5 0 7.15)8()1n( 95.0212 ????? ??
(2)选择统计量
(3)查临界值得
507.152 ??所以,否定域为
(4)将样本观测值代入,得 68.152 ?? >15.507
所以 拒绝原假设,即认为标准差显著偏大,
2?
例 8.2.8 在正常的生产条件下,某产品的测试指标总体
),(~ 200 ??NX,其中 23.00 ??, 后来改变了生产工艺,出了新产品,
假设新产品的测试指标总体仍为 X,且知 ),(~ 2??NX, 从新产品
中随机地抽取 10 件,测得样本值为 1021,,,xxx L,计算得到样本标
准差 S =0.33,试在检验水平 ? =0.05 的情况下检验, ( a ) 方差 2?
有没有显著变化? ( b ) 方差 2? 是否变大?
解,( a ) 是双侧检验,( b ) 是单侧检验,
( a ) 建立假设 22020 23.0,?? ??H,2021, ?? ?H
新产品指标的方差与正常情况下产品指标的方差比较没有显著变化
( b ) 建立假设 22020 23.0,??? ??H,2021, ?? ??H
新产品指标的方差比正常情况下产品指标的方差显著地变大,
5.?已知,σ2的假设检验
2
0
2
0, ?? ?H,
2
0
2
1, ?? ?H
2
0
2
0, ?? ?
?H,2
0
2
1, ?? ?
?H
2
0
2
0, ?? ?
?H,2
0
2
1, ?? ?
?H
选用检验统计量为,
2
0
n
1i
2
i
2
)X(
?
??
??
?
?
? 未知时
检验统计量
2
0
2
2 )1(
?
? Sn??
( 2? 检验 )
? 已知时
检验统计量
2
0
1
2
2
)(
?
?
?
?
?
?
?
n
i
iX
( 2? 检验 )
0H 1H
在显著性水平 ? 下拒绝 0H 的条件
2
0
2 ?? ? 2
0
2 ?? ? )1(
2
1
2
2
?? ? n??? 或
)1(22
2
?< n???
)(212
2
n??? ?? 或
)(22
2
n??? ?
2
0
2 ?? ? 2
0
2 ?? ?
)1(22 ?? n1???? )(22 n1???? ?
2
0
2 ?? ? 2
0
2 ?? ?
)1(22 ?? n??? )(22 n??? ?
结论如下,
例 8.2.9.
机器包装食盐,假设每袋盐重服从正态分布,规定每袋盐
标准重量为 500 克,标准差不能超过 10 克。某日开工后,从
装好的食盐中随机抽取 9 袋,测得重量为 ( 单位:克 ),
497 507 510 475 484 488 524 491 515
问这天包装机的工作是否正常 ( 05.0?? )?
解,需分两步进行检验
5 0 0:H5 0 0:H 100 ??????( 1)
取统计量 )1n(t~
n
s
50 0Xt
2
??? 查表得 3 0 6.2)8(t
21
???
经计算 306.2187.0
9
03.16
500499
n
s
X
|T|
22
0
0 ??
?
?
??
?
不能否定 H0,可认为平均每袋盐 500克。
( 2)
221220 10:H10:H ??????在 0
H ? 成立的条件下,
)1n(~s)1n(
10
s)1n( 22
2
2
2
2
2
1 ?????
?????
查表得 5.15)8(2
1 ?? ??
计算得
5.1556.2010 03.168s)1n( 2
2
2
0
2
2
0,1 ??
??
?
??? 所以,否定
0H ?,即可以认为方差超过
210,包装机工
作不稳定。
由( 1),( 2)可以认为,包装机工作不正常。
第 8.3节 两个正态总体的假设检验
先看一个例子,某地区高考负责人从某年来自 A市
中学考生和来自 B市中学考生中抽样获得如下资料,
A市中学考生,
B市中学考生,
50,5 4 5,17 111 ??? sxn
55,495,15 222 ??? sxn
已知两地考生成绩服从正态分布,方差大致相同,由以
上资料 能不能说某年来自 A市中学考生的平均成绩比来自
B市中学考生的平均成绩高,
设 A市考生成绩 X~N(μ1,σ12),B市考生成绩 Y~ N(μ2,σ22),
21 ???
假设检验
(一 ) σ12,σ22已知,μ1-μ2的假设检验,
设总体 X~N(μ1,σ12),总体 Y~ N(μ2,σ22),X,Y
相互独立,从中分别抽取容量为 n1,n2的样本 X1,…,和
Y1,…,,样本均值和样本方差分别记为,S,Y;S,X 2
221
1nX
2nY
2
2
21
2
1
0
n/n/
)YX(
U
???
???
?
(2) 选择检验统计量,
(1) 提出原假设和备择假设,
H0:μ1-μ2=μ0, H1,μ1-μ2≠ μ0
同单正态总体类似可得, 0210,H ?????
?
的拒绝条件为, ??? 1uU
0210,H ?????
?
的拒绝条件为, ???? 1uU
(4)将样本观测值代入 U,
若 |U|>u1-α/2,否定原假设 ; 若 |U|≤u1-α/2,接受原假设,
.21)u(
21
????
??
(3)给定 α,查 u1-α/2,得 否定域为 |U|> u1-α/2,
其中
解 设第一教学班数学成绩
)57,(N~X
1
?
,
第二教学班数学成绩
)43,(N~Y
2
?
,
21
nn ?
= 1 6,05.0??,
建立假设
0:H
210
????
,
0:H
211
????
用统计量
2
2
21
2
1
n/n/
YX
U
???
?
?
例 8.3.1 从两个教学班各随机选取 16名学生进行数
学测验,第一教学班与第二教学班测验结果的样本方
差分别为 80,82,已知两教学班数学成绩的方差分
别为 57与 43,在显著性水平 0.05下,可否认为这两个
教学班学生的数学测验成绩有差异?
(二 ) σ12=σ22=σ2,σ2未知,μ1-μ2的假设检验,
)2nn(t~
n/1n/1S
)YX(T
21
21w
0 ??
?
????
(1) 选择检验统计量
(2)给定 α,查表得 t1-α/2(n1+n2-2)或 t1-α(n1+n2-2),可知
(T检验)
0210
:H ????? 的拒绝条件为, )2nn(t|T| 211
2
??? ?
?
0210
:H ?????
?
的拒绝条件为, )2nn(tT 211 ??? ??
0210
:H ?????
?
的拒绝条件为, )2nn(tT 211 ???? ??
(三 ) σ12,σ22未知,且 σ12?σ22,但 n1=n2,μ1-μ2的假设检验,
通常采用配对试验的 t检验法
令 )n,,2,1i(YXZ
iii ????
则 ),(N~Z 2
22121i ??????
)Z,,Z,Z( n21 ? 可看作是来自总体
),(N~Z 222121 ?????? 的一个样本
检验假设
02110210,H,:H ??????????
用统计量
)1n(t~
n
S
Z
T
2
0 ????
成对数据比较检验法
实例 设某一种农作物有两个品种 A,B,要比较谁的平均亩产
量大,按前一段所讨论的检验两个正态总体均值之差的方法,
我们可以准备 块形状面积相同的地块,其中 块种植品
种 A,得亩产量,另 块种植品种 B,得亩产量
,然后按上段检验法去处理, 这样做有一个前提,就
是这个地块的条件必须比较一致,不然的话,假如分配给品种 A
的那块地比较肥沃,或其它条件较好,则即使 A品种并不优于 B,
试验结果也可能有利于它, 改进的方法是取 n对地块,每对包含
两个形状条件一致的地块,其中一块种植 A,另一块种植 B (哪
一块给 A可随机决定 ),这样设计时,哪一个品种也不会占地利
之便,不同对的地块条件不必一致,因而较容易办到
21 nn ? 1n
1n21 X,,X,X ? 2n
2n21 Y,,Y,Y ?
一般模型, 设有两个需要进行比较的处理,
每对中的两个试验单元条件尽可能一致,而不同对之间
则不要求一致,在每一对内,随机地决定把其中的一个
试验单元给处理 1,另一个给处理 2,经过试验,观测
各处理在每个试验单元上的试验结果,如下表,
对 处理 1 处理 2 差 iii YXZ ??
n
?
2
1
n
X
X
X
?
2
1
n
Y
Y
Y
?
2
1
nnn
YXZ
YXZ
YXZ
??
??
??
?
222
111
假定 iii YXZ ?? 服从正态分布 ),( 2??N,
? 表示处 理 1 平均优于处理 2 的量,
① 两处理效果一样, ? =0
② 处理 2 不优于处理 1, ? ? 0
③ 处理 2 不劣于处理 1, ? ? 0
④ 处理 1 平均优于处理 2 的量为
0
?, ? =
0
?
⑤ 处理 1 平均优于处理 2 的量不超过
0
?, ?
?
0
?
⑥ 处理 1 平均优于处理 2 的量不小于
0
?, ?
?
0
?
nZZZ,,,21 ? 可视为取自正态总体 ),(
2??N 的样本,
选取检验统计量,
n
S d
Z
T 0
??
?
其中 YXZ ??,?
?
? ??
n
i
ind ZZS
1
2
1
12 )(,
00, ?? ?H 成立时,)1(~ ?ntT,
对给定的显著性水平
?
,
00
:H ???
的拒绝条件为,
)1n(t|T|
2
1
?? ?
?
00
:H ???
?
的拒绝条件为,
)1n(tT
1
??
??
00
:H ???
?
的拒绝条件为,
)1n(tT
1
???
??
(四 ) σ12,σ22未知,且 σ12?σ22,但 n1<n2,μ1-μ2的假设检验,
)n,,2,1i(Yn 1Ynn 1YnnXZ 1
n
1k
k
2
n
1k
k
21
i
2
1
ii
21 ?????? ??
??
则
2122
2
1
2
2
1
1i n
n
n
n)Z(E ????????????
2
2
2
12
1
212
1
22
1
2
2
2
2
21
12
2
2
2
2
12
1
2
2
n
1k
k
2
2
n
1k
k
21
2i
2
1
1ii
n
n
)
nnn
n2
nn
n2
n
2
n
n
nn
n
(
n
n
)]Y(
n
1
)Y(
nn
1
)Y(
n
n
X[E)Z(D
21
??????????????
???????????? ??
??
其中 )n,,2,1j,i,ji(0)Z,Z(C o v
1ji ????
)Z,,Z,Z( 1n21 ? 可看作如下总体的样本 )
n
n,(N 2
2
2
12121 ??????
检验假设
02110210,H,:H ??????????
取统计量
)1n(t~
n
S
ZT
1
1
2
0 ????
(五 )未知 μ1,μ2,方差比 σ12/σ22的假设检验,
(2)选择检验统计量,
(3)查临界值,
)1n,1n(F~
S
SF
212
2
2
1 ???
)1n,1n(F 21
2
???
X
f(x)
α/2 α/2
)1n,1n(F 21
21
????
λ1 λ2
得否定域为 F<λ1或 F> λ2
)1n,1n(F
1
122/1 ????
?
?
?
?
?
?
?
????
??
??
?
?
?
?
)1n,1n(F
,
)1n,1n(F
1
21
2
1
2
12
2
1
1
(4)将样本观测值代入 F,
若 F<λ1或 F> λ2否定原假设 ;
否则,接受原假设,
(1)提出原假设和备择假设, H0:σ12/σ22=1; H1,σ12/σ22 ≠1
类似地可得,
1:H
2
2
2
1
0
?
?
??
的拒绝条件为,
)1n,1n(FF
211
???
??
1:H
2
2
2
1
0
?
?
??
的拒绝条件为,
)1n,1n(FF
21
???
?
单正态总体参
数的假设检验
双正态总体
的假设检验
小结,
?
期望假设检验
方差的假设检验
?
σ2已知
σ2未知
?
均值差的假设检验
方差比的假设检验
?
两个方差都已知
两个方差未知但相等
U
T
F
?
双侧
单侧
?
双侧
单侧
U
T
2?
(1)检验的命名依据的是所用检验统计量的概率分
布,无论是哪种检验,都要用到相应分布的分位数,各种
分布的分位数记号一定要清楚 ;
(2)无论是双侧检验还是单侧检验,对同一类检验问
题,所选用的统计量都是一样的,所不同的是否定域,要
很好地掌握确定否定域的方法 ;
(3)方差未知时,对两总体均值的比较,应当先进行
方差的比较 (F-检验 ),得到两总体方差相等的结论后,再
进行均值的比较 (t-检验 ).
注意,
例 8.3.3 为了解两种教学法对 9名学生试验的结果,经试
验后,测得成绩如图中 A列和 B列, 假定总体为正态,以
0.05为显著性水平,检验此两种教学法效果是否不同?
解 检验原假设
00,H ?? ?
=0
1,设我国出口凤尾鱼罐头 250克,根据
以往经验,标准差是 3克,现在某食品工厂
生产一批供出口用的这种罐头,从中抽取
100罐检验,其平均净重是 251克,假定罐
头重量服从正态分布,按规定显著性水平
为 0.05,问这批罐头是否合乎出口标准,即
净重恰为 250克?
σ 2=9已知,μ=250 的一个正态总体假设检验,
练习
2, 一家食品加工公司的质量管理
部门规定,某中包装食品每包净重不得少
于 20千克,经验表明,重量近似服从标准
差为 1.5千克的正态分布,假定从一个由
50包食品构成的随机样本中得到的平均
重量为 19.5千克,问有无充分证据说明这
些包装食品的平均重量减少了?
方差已知,一个正态总体均值的单侧假设检验
3(954),设 是来自正态总体
的 s.r.s,其中 μ,σ2均为未知,记
则假设 的 t 检验使用统计量 t =__
??
??
???
n
i
i
n
i
i XXSXnX
1
22
1
)(,1
0:0 ??H
),(~ 2??NX
nXX,,1 ?
)1( ?nnSX
5 某公司人事部门为一项工程上马
在社会上招大批青年工人,在文化考试结束
后,经理问人事部门情况怎么样?回答说,很
好,估计平均成绩可达 90分,经理随即地从
试卷中抽出 20份,发现平均成绩为 83分,标
准差为 12分,如果经理想在 0.01的显著性水
平下检验人事部门所做的推测的准确性,应
该怎样处理?
方差未知,一个正态总体均值的双侧假设检验
H0:μ=90
两个需要说明的问题
1,统计检验与区间估计的关系
① 利用统计检验可建立区间估计,反之亦然
设 为取自正态总体 的样本,方差未知
n21 X,,X,X ? ),(N 2??
检验 00,H ???,01,H ???
接受条件为, )1n(t|X|
21
n
S
0 ????
??
亦即
)1n(tX)1n(tX
22 1n
S0
1n
S ???????
?? ??
0? 改成 ?,便可得到 ? 的置信度为 1 - ? 的置信区间,
反之,若我们先确定了 的区间估计,?
)1n(tX)1n(tX 22 1nS1nS ??????? ?? ??
? 改成 0?
得到了原假设 00,H ??? 的接受条件
也就得到了 00,H ??? 的拒绝条件,检验水平为 ?,
② 统计检验和区间估计的结果,在解释上可以有差别检验假设 00,H ??? = 0 ( 水平 ? ) 及作 ? 的区间估计 ( 置
信度为 ??1 ),
对不同的样本值,以下几种情况都可能出现,
(Ⅰ ) 接受 = 0,区间估计为 (-0.001,0.002);
(Ⅱ ) 接受 = 0,区间估计为 (-1000,1500);
(Ⅲ ) 拒绝 = 0,区间估计为 (1000,2000);
(Ⅳ ) 拒绝 = 0,区间估计为 (0.001,0.002).
00,H ???
00,H ???
00,H ???
00,H ???
2,检验的 p值
一般说来,用统计检验作出的结论,不如区间估计
那么精细。 这一点的根由就在于统计检验这种形式固
有的粗造性。
在正态总体 )1,(N ? 中抽取样本 1621 X,,X,X ?
检验假设 0:H 0 ??,0:1 ??H
取检验水平 0.05,拒绝的条件为, 49.0|X| ?
假设对一组具体的 1621 X,,X,X ? 有 48.0?X
,接受 H0
假设另一组具体的 1621 X,,X,X ? 有 12.0?X,
接受 H0
观察可见,在后一场合,作出 的结论根据大一些,0??
设对某一组具体样本,计算出,则这组样本
的 p值定义为,
bX?
)1,0(N~Z| },b||Z{|Pp ??
p 愈大 ( 小 ),认为 0?? 的根据就愈足 ( 不足 ),
当 p 值落到给定的水平 ? 之下时,就要拒绝 0?? 了,
若,但离 很近,则我们虽不能拒绝,但对它
抱着很怀疑的态度,
??p ?
推广到一般情况, 设有一个原假设 H0,其拒绝条件
为 |T|>C,T为检验统计量,
若对一组具体样本计算出统计量 T之值为 T0,则这
组样本的 p值是,
}H||T||T{|Pp 00??
如果拒绝条件为 T>C,则 p值为 }H|TT{Pp 00??
如果拒绝条件为 T<C,则 p值为 }H|TT{Pp
00??
例 从电话公司每月长途电话的帐单中,随机抽
取 37张,计算平均费用为 33.15元,标准差为 21.21元, 假定
费用服从正态分布,未知,要检验假设
,,试计算 p值,
),(N 2?? 2?
30:H 0 ?? 30:H 1 ??
n/S
XT 0???
)1n(t~
0H
?
成立时解, 取检验统计量
依样本计算检验统计量的值为 9 0 3 3 8.03015.33T
37
21.210 ?
??
}H|90.0|T{|P}H||T||T{|Pp 000 ???? =,37233
说明样本支持原假设,故要接受原假设,
注意, Excel中 p值应用函数为
3 7 2 3 3.0)2,137,9 0 3 3 8.0(T D I S T)T a i l s,df,x(T D I S T ???
X众所周知,总体 的全部信息可以通过其分布
函数 反映出来,但实际上,参数 往往未知,有时
甚至 的表达式也未知,因此需要根据实际问题
的需要,对总体参数或分布函数的表达式做出某种
假设 (称为 统计假设 ),再利用从总体中获得的样本信
息来对所作假设的真伪做出判断或进行检验,
),X(F ? ?
),X(F ?
1,问题的提法
统计检验 (假设检验 )
这种利用样本检验统计假设真伪的过程叫做
在许多实际研究中,都有需要做出检
验的问题,如,某批产品能否出厂?某生产
线工作是否正常?某人是否患有某种疾病?
某种新药的治疗效果是否提高了?发生事
故是否与星期几有关?某次水平考试是否
正常?等等,都需要做出检验,
假
设
检
验
?
参数假设检验
非参数假设检验,
X~F(x,θ),θ为参数
假设 θ=θ0
例 X~F(x),F(x)未知
假设 F(x)=F0(x)
?
?
例 8.1.1.某地旅游者的消费额服从正态分布 X~N(μ,σ2),调查
25个旅游者,得出一组样本观测值 x1,x2,…,x 25,若有专家认为
消费额的期望值为 μ0,如何由这组观测值验证这个说法?
假设检验为 μ=μ0
例 8.1.2.用精确方法测量某化工厂排放的气体中有害气体
的含量服从正态分布 X~N(23,22),现用一简便方法测量 6次
得一组数据 23,21,19,24,18,18(单位,十万分之一 ),问用简便
方法测的有害气体含量是否有系统偏差?
假设检验 μ=23,σ2=22
例 8.1.3.用精确方法测量某化工厂排放的气体中有害气 体的
含量服从正态分布 N(23,22),现用一简便方法测量 6次得一组数据
23,21,19,24,18,18(单位,十万分之一 ),若用简便方法测得有害气体含量
的方差不变,问用该方法测得有害气体含量的均值是否有系统偏差?
假设 H0,μ=23,
解,由题意得,用简便方法测得有害气体含量 X~N(μ,22),
若 H0成立,则
)1,0(N~n/XU ? ???
若取 α=0.05,则 P{|U|>z1-α/2}=α,即, P{|U|>1.96}=0.05,
在假设成立的条件下,|U|>1.96为概率很小事件,一般认为,
小概率事件在一次实验中是不会发生的,
将样本观测值代入 U得,06.3
n/2
23Xu ??? |u|>1.96,
小概率事件在一次实验中发生了,
否定原假设,简便方法测得均值有系统偏差,
故假设不合情理,即,
2,假设检验的基本思想
(1)小概率原理 (实际推断原理 )认为概率很小的事件在一
次试验中实际上不会出现,并且小概率事件在一次试验中
出现了,就被认为是不合理的,
(2)基本思想,先对总体的参数或分布函数的表达式 做出某
种假设,然后找出一个在假设成立条件下出现可能性甚小
的 (条件 )小概率事件,如果试验或抽样的 结果使该小概率
事件出现了,这与小概率原理相违背,表明原来的假设有问
题,应予以否定,即 拒绝这个假设,若该小概率事件在一次
试验或抽样中并未出现,就没有理由否定这个假设,表明试
验或抽样结果支持这个假设,这时称假设与实验结果是 相
容的,或者说可以 接受原来的假设,
另一方面,当原假设不成立时,却作出接受原假设的结论,
造成犯, 取伪, 的错误,称为 第二类错误,
3,假设检验的两类错误
在假设检验中,否定原假设的理由是小概率事件在一次试
验中出现了,但小概率事件并不是不会出现,只是出现的可
能性较小,即出现的概率不超过很小的正数,?
就是犯第一类错误的概率的最大允许值,?
一般用 表示犯第二类错误的概率,?
因此,根据小概率原理否定原假设,有可能 把本来客观上正
确的假设否定了,造成犯, 弃真, 的错误,称为 第一类错误,
在进行假设检验时,我们采取的 原则 是,
控制犯第一类错误 (即 事先给定且很小 )的同时使犯
第二类错误的概率达到最小,
?
当样本容量 一定时,小,就大,反之,小,就大,n ?? ? ?
另外,一般,1?? ??
即使 碰巧出现,也决不能把, 犯第一类错误,
和
,犯第二类错误, 理解为相互对立的事件,
1?? ??
3,假设检验的两类错误
?
弃真
充伪
??
?
α/2
α/2
X
φ(x)
增大样本容量 n时,可以使 α和 β同时减小,注意,
z1-α/2- z1-α/2
β
n/
0
?
???
μ=μ0 )1,0(N~
n/
XZ 0
?
???
μ≠μ0(μ>μ0)
)1,
n/
(N~
n/
XZ 00
?
???
?
????
小概率原理中,关于“小概率”的值通常根据实
际问题的要求而定,如取 α=0.1,0.05,0.01等,
α为检验的显著性水平 (检验水平 ).
4,显著性水平与否定域
在假设检验过程中,使得小概率事件出现的统计
量的取值范围称为该假设检验的 否定域 (拒绝域 ),
否定域的边界称为该假设检验的 临界值,
α/2α/2
X
φ(x)
接受域
P{|U|<u1-α/2}=1-α
否定域的大小,依赖于显著性水平的取值,
一般说来,显著性水平越高,即 α越小,否定域也越
小,这时原假设就越难否定,
注意,
否定域 否定域
z1-α/2- z1-α/2
5.假设与对立假设
统计假设通常用字母, H,表示,如果关于总体有两个
二者必居其一的假设,习惯上把其中的一个称作 原假设
(基本假设、零假设 )用 H0表示,而把另一个假设称作 对
立假设 (备择假设 )用 H1表示,
原假设的确定一般应遵循以下几条原则,
一,要把, 着重考察的假设, 确定为原假设 ;
二,要把, 支持旧方法的假设, 确定为原假设 ;
三,要把等号放在原假设里 ;
四,要所答是所问,不要所答非所问 ;
五,“后果严重的错误, 定为第一类错误,
?
原假设
备择假设
H0
H1
当对立假设位于原假设两侧时,称为 双侧假设,相应的检
验称为 双侧假设检验 ;当对立假设位于原假设一侧时,称
为 单侧假设,相应的检验称为 单侧假设检验,
6,假设检验的一般步骤
第一步 提出待检验的原假设 和对
立假设 ; 0
H
1H
第二步 选择 检验统计量,并 找出 在假设
成立条件下,该统计量所服从的 概率分布 ;
0H
第三步 根据所要求的显著性水平 α 和所
选取的统计量,查 概率分布临界值表,确定 临界
值与否定域 ;
第四步 将样本观察值代入所构造的检验
统计量中,计算出该统计量的值,若该值落入否
定域,则拒绝原假设,否则接受原假设0H,0H
第 8.2节 一个正态总体的假设检验
(2)选择包含 μ的分布已知函数,
n/
XU
?
???
)1,0(N~
(4)将样本观测值代入 U,
若 |U|>u1-α/2,否定原假设 ; |U|≤u1-α/2,接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
1.σ2已知,μ的假设检验,(H0:μ=μ0,μ≥μ0,μ≤μ0)
.21)u(
21
????
??
1) H0:μ=μ0; H1:μ≠μ0,
(1)提出原假设和备择假设, H0:μ=μ0; H1:μ≠μ0,
(3)由给定 α,查 u1-α/2,得 否定域为 |U|> u1-α/2,其中,
α/2α/2
X
φ(x)
接受域
P{|u|<u1-α/2}=1-α
否定域 否定域
u1-α/2- u1-α/2
双侧假设检验
U检验
(2)选择包含 μ的分布已知统计量,
例 8.2.1.由经验知某零件重量 X~N(μ,σ2),其中
μ=15,σ2=0.05,技术革新后,抽查 6个样品测得重量为 (单位,
克 )14.7,15.1,14.8,15.0,15.2,14.6,已知方差不变,问平均重量
是否仍为 15?(α=0.05)
分析,σ2已知,μ的假设检验
n/
XU
?
???
(4)将样本观测值代入,
解 (1) H0:μ=μ0=15; H1:μ≠15,
(3)α=0.05,查表 Φ(u1-α/2)=Φ(u0.975)=0.975得 u1-α/2=1.96,
所以 否定域为 |U|> 1.96,
09.1|
6/05.0
159.14||
n/
X||U| ???
?
???
|U|≤u1-α/2,故接受原假设,即零件的平均重量仍为 15.
<1.96
例 8.2.2.用传统工艺加工罐头,每瓶 Vc含量平均值
为 19毫克,现改进加工工艺,抽出 16瓶罐头测得 Vc含量为
23,20.5,21,22,20,22.5,19,20,23,20.5,18.8,20,19.5,18,23(毫克 ),
假定 Vc含量服从正态分布,方差 σ2=4,问新工艺下 Vc平均含
量是否比旧工艺下含量高?
分析,所求结果为 μ>19或 μ≤19,选择 μ≤19为原假设,
解,设 H0,μ≤19,H1,μ>19
取统计量,U的分布不确定,
n/
19XU
?
??
n/
XU
?
????令 则
,UU),1,0(N~U ??? 对给定的 α,{U>u1-α} }uU{ 1 ?????
P{U>u1-α}≤ }uU{P
1 ????
=α P{U>u1-α}≤α (小概率事件 )
查表得 u1-α=1.64,将样本观测值代入得 u=3.6 >1.64
小概率事件发生了,所以否定原假设,即新工艺下
Vc平均含量比旧工艺下含量高,(所答是所问 )
α
X
φ(x)
接受域
P{U>u1-α}≤α
否定域
u1-α
单侧假设检验
???? ?? 1)u( 1
(2)选择统计量,
(4)将样本观测值代入 U,
若 U>u1-α,否定原假设 ; U≤u1-α,接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
.1)u( 1 ???? ??
2) H0:μ≤μ0; H1:μ>μ0,
(1)提出原假设和备择假设, H0:μ≤μ0; H1:μ>μ0,
(3)由给定 α,查 z1-α,得 否定域为 U> u1-α,其中
n/
XU 0
?
???
(2)选择包含 μ的分布已知函数,
(4)将样本观测值代入 T,
若 |T|>t1-α/2(n-1),否定原假设 ;
|T|≤t1-α/2(n-1),接受原假设,
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
2.σ2未知,μ的假设检验:
(1)提出原假设和备择假设, H0:μ=μ0; H1:μ≠μ0,
(3)由给定 α,查 tα(n-1),得 否
定域为 |T|> t1-α/2(n-1);
n/S
X~T ?? )1n(t~ ?
)1n(t 2/1 ??? X
f(x)
α/2α/2
接受域否定域
否定域
(T检验)
总体方差
2
? 已知
检验统计量
n
0
X
U
?
??
?
(
U
检验 )
总体方差
2
?
未知
检验统计量
n
S
0
X
T
??
?
(
T
检验 )
0
H
1
H
在显著性水平
?
下的 0
H
的拒绝条件
0
???
0
???
2
1
u|U|
?
?
?
)1n(t|T|
2
1
??
?
?
0
???
0
???
??
?
1
uU
)1n(tT
1
??
??
0
???
0
???
??
??
1
uU
)1n(tT
1
???
??
单正态总体假设检验列表如下,
甲厂产品与预定规格不符
乙厂产品与预定规格相符
1 1 9, 0,1 2 0, 0,1 1 9, 2,1 1 9, 7,1 1 9, 6
从乙厂也抽取 5 件产品,测得其指标值为,
1 1 0, 5,1 0 6, 3,1 2 2, 2,1 1 3, 8,1 1 7, 2
要根据这些数据去判断这两厂产品是否符合预定
规格 12 0? ( 显著性水平 0,0 5)解 设甲厂产品指标服从正态分布 ),(N 2
11 ??,乙厂产品指标服从
正态分布 ),(N 222 ??, 21? 和 22? 均未知,
对甲厂,1 2 0:H 010 ????,1 2 0:H 011 ???? 进行 T 检验,
对乙厂,1 2 0,020 ??? ??H,1 2 0,021 ??? ??H 进行 T 检验
例 8.2.3 两厂生产同一产品,其质量指标假定都服
从正态分布,标准规格为均值等于 120,现从甲厂抽出 5件产
品测得其指标值为,
解 依题意,总体为, 包装食品每袋净重量 )5.1,(~ 2?NX,
1 9, 5,1 9, 0,2 0, 1,2 1, 0,1 8, 9,2 0, 3,2 1, 5,1 8, 8,1 9, 6,1 9, 8,
1 9, 8,1 9, 6,1 9, 6,1 8, 9,1 7, 8,1 8, 0,2 0, 0,2 0, 3,2 1, 0,2 1, 2,
1 8, 5,1 9, 9,2 0, 6,2 0, 1,2 1, 1,2 2, 0,2 0, 8,2 0, 4,2 0, 4,2 0, 3,
1 9, 5,1 9, 5,2 0, 0,2 1, 0,1 8, 9,1 9, 6,1 9, 8,2 0, 0,2 1, 0,2 0, 1,
2 0, 0,1 8, 8,1 8, 9,2 0, 0,2 1, 0,1 9, 6,1 9, 8 1 9, 6,2 0, 0,1 9, 9,
问有无充分证据说明这些包装食品的平均重量减少了?
假设,
20,00 ?? ??H,01, ?? ?H
例 8.2.4一家食品加工公司的质量管理部门规定,
某种包装食品每包净重不得少于 20千克,经验表明,重 量
近似服从标准差为 1.5的正态分布,假定得到 50包食品构成
的样本为,
接受域
(2)选择包含 σ2的分布已知函数,
(1)提出原假设和备择假设,
(3)由给定 α,查
H0,σ2 = σ02; H1,σ2 ≠ σ02
2
2
2 )1(
??
Sn ?? )1n(~ 2 ??
??
?
?
?
??
?? ?
)}1n(
)1n(
2
2
2
2
1
2
1
?
?
??
??
X
f(x)
α/2α/2
λ1 λ2
否定域否定域
3.未知期望 μ,σ2的 (双侧 )假设检验,( 检验)2?
得 接受域为 λ1< <λ2;2?
(4)将样本观测值代入,
若 λ1< <λ2,接受原假设 ;
否则,拒绝原假设,
2?
2?
例 8.2.5设某次考试的考生成绩服从正态分布,从中
随机地抽取 36位考生的成绩,算得平均成绩为 66.5分,标准
差为 15分,问在显著性水平 α=0.05下,是否可以认为这次考
试全体考生的平均成绩为 70分?
(2)选择包含 μ的分布已知统计量,
分析,设考生成绩 X~N(μ,σ2),σ2未知,μ的假设检验
n/S
XT ???
(4)将样本观测值代入,
解 (1) H0:μ=μ0=70; H1:μ≠70,
(3)α=0.05,查表得 t1-α/2(n-1)=t0.975(35)=2.0301,
所以 否定域为 |T|> 2.0301,
??? |
n/S
X||T| ?
故接受原假设,即可以认为考生平均成绩为 70.
<2.03014.1|
36/15
705.66| ??
例 8.2.6.某炼铁厂铁水含碳量在正常情况下服从
正态分布,现对操作工艺进行了改变,从中抽取 7炉铁水
的试样测得 问是否可以
认为新工艺炼出的铁水含量的方差仍为 0.1122?(α=0.05)
,2 1 0 6.0)Xx(,36.4X
7
1i
2
i ??? ?
?
(2)选择统计量,
故拒绝原假设,即认为方差不是 0.1122.
解,(1)H0,σ2 = 0.1122; H1,σ2 ≠ 0.1122
2
2
2 S)1n(
?
??? )1n(~ 2 ??
??
?
?
?
???????
???????
?
?
?
4 49.14)6()1n(
,2 37.1)6()1n(
975.0
2
2
1
2
2
025.0
2
2
2
1(3)查表得
>14.449
接受域为 λ1< <λ22?
(4)将样本观测值代入,得 =16.792?
4.未知期望 μ,σ2的 (单侧 )假设检验:
(1)提出原假设和备择假设, H0,σ2 ≤σ02; H1,σ2 >σ02
2
2
2
1
S)1n(
?
??? )1n(~ 2 ??(2)选择统计量
2
0
2
2 S)1n(
?
???
则 2
12 ???
对给定的 α及任意实数 λ有 }{}{ 2
12 ???????
即 }{P}{P 2
12 ???????
取 )1n(
21 ???? ??
=α
?
?????? ?? )}1n({P 212
(3) 所以,否定域为 ))1n(2
12 ???? ??
(4)将样本观测值代入,若
接受原假设 ;否则,拒绝原假设,
))1n(122 ???? ??2?
接受域
X
f(x)
α
否定域
?????? ?? )}1n({P 212
))1n(12 ?? ??
单侧假设检验
2
2
2
1
S)1n(
?
???
)1n(~ 2 ??
例 8.2.7.某中导线要求电阻的标准差不得超过
0.005Ω,今在生产的一批导线中取样品 9根,测得 S=0.007Ω.
设总体服从正态分布,在显著性水平 α=0.05条件下,能认为
这批导线的标准差显著偏大吗?
解,(1)H0,σ ≤σ0=0.005; H1,σ>0.005
2
0
2
2 S)1n(
?
???
5 0 7.15)8()1n( 95.0212 ????? ??
(2)选择统计量
(3)查临界值得
507.152 ??所以,否定域为
(4)将样本观测值代入,得 68.152 ?? >15.507
所以 拒绝原假设,即认为标准差显著偏大,
2?
例 8.2.8 在正常的生产条件下,某产品的测试指标总体
),(~ 200 ??NX,其中 23.00 ??, 后来改变了生产工艺,出了新产品,
假设新产品的测试指标总体仍为 X,且知 ),(~ 2??NX, 从新产品
中随机地抽取 10 件,测得样本值为 1021,,,xxx L,计算得到样本标
准差 S =0.33,试在检验水平 ? =0.05 的情况下检验, ( a ) 方差 2?
有没有显著变化? ( b ) 方差 2? 是否变大?
解,( a ) 是双侧检验,( b ) 是单侧检验,
( a ) 建立假设 22020 23.0,?? ??H,2021, ?? ?H
新产品指标的方差与正常情况下产品指标的方差比较没有显著变化
( b ) 建立假设 22020 23.0,??? ??H,2021, ?? ??H
新产品指标的方差比正常情况下产品指标的方差显著地变大,
5.?已知,σ2的假设检验
2
0
2
0, ?? ?H,
2
0
2
1, ?? ?H
2
0
2
0, ?? ?
?H,2
0
2
1, ?? ?
?H
2
0
2
0, ?? ?
?H,2
0
2
1, ?? ?
?H
选用检验统计量为,
2
0
n
1i
2
i
2
)X(
?
??
??
?
?
? 未知时
检验统计量
2
0
2
2 )1(
?
? Sn??
( 2? 检验 )
? 已知时
检验统计量
2
0
1
2
2
)(
?
?
?
?
?
?
?
n
i
iX
( 2? 检验 )
0H 1H
在显著性水平 ? 下拒绝 0H 的条件
2
0
2 ?? ? 2
0
2 ?? ? )1(
2
1
2
2
?? ? n??? 或
)1(22
2
?< n???
)(212
2
n??? ?? 或
)(22
2
n??? ?
2
0
2 ?? ? 2
0
2 ?? ?
)1(22 ?? n1???? )(22 n1???? ?
2
0
2 ?? ? 2
0
2 ?? ?
)1(22 ?? n??? )(22 n??? ?
结论如下,
例 8.2.9.
机器包装食盐,假设每袋盐重服从正态分布,规定每袋盐
标准重量为 500 克,标准差不能超过 10 克。某日开工后,从
装好的食盐中随机抽取 9 袋,测得重量为 ( 单位:克 ),
497 507 510 475 484 488 524 491 515
问这天包装机的工作是否正常 ( 05.0?? )?
解,需分两步进行检验
5 0 0:H5 0 0:H 100 ??????( 1)
取统计量 )1n(t~
n
s
50 0Xt
2
??? 查表得 3 0 6.2)8(t
21
???
经计算 306.2187.0
9
03.16
500499
n
s
X
|T|
22
0
0 ??
?
?
??
?
不能否定 H0,可认为平均每袋盐 500克。
( 2)
221220 10:H10:H ??????在 0
H ? 成立的条件下,
)1n(~s)1n(
10
s)1n( 22
2
2
2
2
2
1 ?????
?????
查表得 5.15)8(2
1 ?? ??
计算得
5.1556.2010 03.168s)1n( 2
2
2
0
2
2
0,1 ??
??
?
??? 所以,否定
0H ?,即可以认为方差超过
210,包装机工
作不稳定。
由( 1),( 2)可以认为,包装机工作不正常。
第 8.3节 两个正态总体的假设检验
先看一个例子,某地区高考负责人从某年来自 A市
中学考生和来自 B市中学考生中抽样获得如下资料,
A市中学考生,
B市中学考生,
50,5 4 5,17 111 ??? sxn
55,495,15 222 ??? sxn
已知两地考生成绩服从正态分布,方差大致相同,由以
上资料 能不能说某年来自 A市中学考生的平均成绩比来自
B市中学考生的平均成绩高,
设 A市考生成绩 X~N(μ1,σ12),B市考生成绩 Y~ N(μ2,σ22),
21 ???
假设检验
(一 ) σ12,σ22已知,μ1-μ2的假设检验,
设总体 X~N(μ1,σ12),总体 Y~ N(μ2,σ22),X,Y
相互独立,从中分别抽取容量为 n1,n2的样本 X1,…,和
Y1,…,,样本均值和样本方差分别记为,S,Y;S,X 2
221
1nX
2nY
2
2
21
2
1
0
n/n/
)YX(
U
???
???
?
(2) 选择检验统计量,
(1) 提出原假设和备择假设,
H0:μ1-μ2=μ0, H1,μ1-μ2≠ μ0
同单正态总体类似可得, 0210,H ?????
?
的拒绝条件为, ??? 1uU
0210,H ?????
?
的拒绝条件为, ???? 1uU
(4)将样本观测值代入 U,
若 |U|>u1-α/2,否定原假设 ; 若 |U|≤u1-α/2,接受原假设,
.21)u(
21
????
??
(3)给定 α,查 u1-α/2,得 否定域为 |U|> u1-α/2,
其中
解 设第一教学班数学成绩
)57,(N~X
1
?
,
第二教学班数学成绩
)43,(N~Y
2
?
,
21
nn ?
= 1 6,05.0??,
建立假设
0:H
210
????
,
0:H
211
????
用统计量
2
2
21
2
1
n/n/
YX
U
???
?
?
例 8.3.1 从两个教学班各随机选取 16名学生进行数
学测验,第一教学班与第二教学班测验结果的样本方
差分别为 80,82,已知两教学班数学成绩的方差分
别为 57与 43,在显著性水平 0.05下,可否认为这两个
教学班学生的数学测验成绩有差异?
(二 ) σ12=σ22=σ2,σ2未知,μ1-μ2的假设检验,
)2nn(t~
n/1n/1S
)YX(T
21
21w
0 ??
?
????
(1) 选择检验统计量
(2)给定 α,查表得 t1-α/2(n1+n2-2)或 t1-α(n1+n2-2),可知
(T检验)
0210
:H ????? 的拒绝条件为, )2nn(t|T| 211
2
??? ?
?
0210
:H ?????
?
的拒绝条件为, )2nn(tT 211 ??? ??
0210
:H ?????
?
的拒绝条件为, )2nn(tT 211 ???? ??
(三 ) σ12,σ22未知,且 σ12?σ22,但 n1=n2,μ1-μ2的假设检验,
通常采用配对试验的 t检验法
令 )n,,2,1i(YXZ
iii ????
则 ),(N~Z 2
22121i ??????
)Z,,Z,Z( n21 ? 可看作是来自总体
),(N~Z 222121 ?????? 的一个样本
检验假设
02110210,H,:H ??????????
用统计量
)1n(t~
n
S
Z
T
2
0 ????
成对数据比较检验法
实例 设某一种农作物有两个品种 A,B,要比较谁的平均亩产
量大,按前一段所讨论的检验两个正态总体均值之差的方法,
我们可以准备 块形状面积相同的地块,其中 块种植品
种 A,得亩产量,另 块种植品种 B,得亩产量
,然后按上段检验法去处理, 这样做有一个前提,就
是这个地块的条件必须比较一致,不然的话,假如分配给品种 A
的那块地比较肥沃,或其它条件较好,则即使 A品种并不优于 B,
试验结果也可能有利于它, 改进的方法是取 n对地块,每对包含
两个形状条件一致的地块,其中一块种植 A,另一块种植 B (哪
一块给 A可随机决定 ),这样设计时,哪一个品种也不会占地利
之便,不同对的地块条件不必一致,因而较容易办到
21 nn ? 1n
1n21 X,,X,X ? 2n
2n21 Y,,Y,Y ?
一般模型, 设有两个需要进行比较的处理,
每对中的两个试验单元条件尽可能一致,而不同对之间
则不要求一致,在每一对内,随机地决定把其中的一个
试验单元给处理 1,另一个给处理 2,经过试验,观测
各处理在每个试验单元上的试验结果,如下表,
对 处理 1 处理 2 差 iii YXZ ??
n
?
2
1
n
X
X
X
?
2
1
n
Y
Y
Y
?
2
1
nnn
YXZ
YXZ
YXZ
??
??
??
?
222
111
假定 iii YXZ ?? 服从正态分布 ),( 2??N,
? 表示处 理 1 平均优于处理 2 的量,
① 两处理效果一样, ? =0
② 处理 2 不优于处理 1, ? ? 0
③ 处理 2 不劣于处理 1, ? ? 0
④ 处理 1 平均优于处理 2 的量为
0
?, ? =
0
?
⑤ 处理 1 平均优于处理 2 的量不超过
0
?, ?
?
0
?
⑥ 处理 1 平均优于处理 2 的量不小于
0
?, ?
?
0
?
nZZZ,,,21 ? 可视为取自正态总体 ),(
2??N 的样本,
选取检验统计量,
n
S d
Z
T 0
??
?
其中 YXZ ??,?
?
? ??
n
i
ind ZZS
1
2
1
12 )(,
00, ?? ?H 成立时,)1(~ ?ntT,
对给定的显著性水平
?
,
00
:H ???
的拒绝条件为,
)1n(t|T|
2
1
?? ?
?
00
:H ???
?
的拒绝条件为,
)1n(tT
1
??
??
00
:H ???
?
的拒绝条件为,
)1n(tT
1
???
??
(四 ) σ12,σ22未知,且 σ12?σ22,但 n1<n2,μ1-μ2的假设检验,
)n,,2,1i(Yn 1Ynn 1YnnXZ 1
n
1k
k
2
n
1k
k
21
i
2
1
ii
21 ?????? ??
??
则
2122
2
1
2
2
1
1i n
n
n
n)Z(E ????????????
2
2
2
12
1
212
1
22
1
2
2
2
2
21
12
2
2
2
2
12
1
2
2
n
1k
k
2
2
n
1k
k
21
2i
2
1
1ii
n
n
)
nnn
n2
nn
n2
n
2
n
n
nn
n
(
n
n
)]Y(
n
1
)Y(
nn
1
)Y(
n
n
X[E)Z(D
21
??????????????
???????????? ??
??
其中 )n,,2,1j,i,ji(0)Z,Z(C o v
1ji ????
)Z,,Z,Z( 1n21 ? 可看作如下总体的样本 )
n
n,(N 2
2
2
12121 ??????
检验假设
02110210,H,:H ??????????
取统计量
)1n(t~
n
S
ZT
1
1
2
0 ????
(五 )未知 μ1,μ2,方差比 σ12/σ22的假设检验,
(2)选择检验统计量,
(3)查临界值,
)1n,1n(F~
S
SF
212
2
2
1 ???
)1n,1n(F 21
2
???
X
f(x)
α/2 α/2
)1n,1n(F 21
21
????
λ1 λ2
得否定域为 F<λ1或 F> λ2
)1n,1n(F
1
122/1 ????
?
?
?
?
?
?
?
????
??
??
?
?
?
?
)1n,1n(F
,
)1n,1n(F
1
21
2
1
2
12
2
1
1
(4)将样本观测值代入 F,
若 F<λ1或 F> λ2否定原假设 ;
否则,接受原假设,
(1)提出原假设和备择假设, H0:σ12/σ22=1; H1,σ12/σ22 ≠1
类似地可得,
1:H
2
2
2
1
0
?
?
??
的拒绝条件为,
)1n,1n(FF
211
???
??
1:H
2
2
2
1
0
?
?
??
的拒绝条件为,
)1n,1n(FF
21
???
?
单正态总体参
数的假设检验
双正态总体
的假设检验
小结,
?
期望假设检验
方差的假设检验
?
σ2已知
σ2未知
?
均值差的假设检验
方差比的假设检验
?
两个方差都已知
两个方差未知但相等
U
T
F
?
双侧
单侧
?
双侧
单侧
U
T
2?
(1)检验的命名依据的是所用检验统计量的概率分
布,无论是哪种检验,都要用到相应分布的分位数,各种
分布的分位数记号一定要清楚 ;
(2)无论是双侧检验还是单侧检验,对同一类检验问
题,所选用的统计量都是一样的,所不同的是否定域,要
很好地掌握确定否定域的方法 ;
(3)方差未知时,对两总体均值的比较,应当先进行
方差的比较 (F-检验 ),得到两总体方差相等的结论后,再
进行均值的比较 (t-检验 ).
注意,
例 8.3.3 为了解两种教学法对 9名学生试验的结果,经试
验后,测得成绩如图中 A列和 B列, 假定总体为正态,以
0.05为显著性水平,检验此两种教学法效果是否不同?
解 检验原假设
00,H ?? ?
=0
1,设我国出口凤尾鱼罐头 250克,根据
以往经验,标准差是 3克,现在某食品工厂
生产一批供出口用的这种罐头,从中抽取
100罐检验,其平均净重是 251克,假定罐
头重量服从正态分布,按规定显著性水平
为 0.05,问这批罐头是否合乎出口标准,即
净重恰为 250克?
σ 2=9已知,μ=250 的一个正态总体假设检验,
练习
2, 一家食品加工公司的质量管理
部门规定,某中包装食品每包净重不得少
于 20千克,经验表明,重量近似服从标准
差为 1.5千克的正态分布,假定从一个由
50包食品构成的随机样本中得到的平均
重量为 19.5千克,问有无充分证据说明这
些包装食品的平均重量减少了?
方差已知,一个正态总体均值的单侧假设检验
3(954),设 是来自正态总体
的 s.r.s,其中 μ,σ2均为未知,记
则假设 的 t 检验使用统计量 t =__
??
??
???
n
i
i
n
i
i XXSXnX
1
22
1
)(,1
0:0 ??H
),(~ 2??NX
nXX,,1 ?
)1( ?nnSX
5 某公司人事部门为一项工程上马
在社会上招大批青年工人,在文化考试结束
后,经理问人事部门情况怎么样?回答说,很
好,估计平均成绩可达 90分,经理随即地从
试卷中抽出 20份,发现平均成绩为 83分,标
准差为 12分,如果经理想在 0.01的显著性水
平下检验人事部门所做的推测的准确性,应
该怎样处理?
方差未知,一个正态总体均值的双侧假设检验
H0:μ=90
两个需要说明的问题
1,统计检验与区间估计的关系
① 利用统计检验可建立区间估计,反之亦然
设 为取自正态总体 的样本,方差未知
n21 X,,X,X ? ),(N 2??
检验 00,H ???,01,H ???
接受条件为, )1n(t|X|
21
n
S
0 ????
??
亦即
)1n(tX)1n(tX
22 1n
S0
1n
S ???????
?? ??
0? 改成 ?,便可得到 ? 的置信度为 1 - ? 的置信区间,
反之,若我们先确定了 的区间估计,?
)1n(tX)1n(tX 22 1nS1nS ??????? ?? ??
? 改成 0?
得到了原假设 00,H ??? 的接受条件
也就得到了 00,H ??? 的拒绝条件,检验水平为 ?,
② 统计检验和区间估计的结果,在解释上可以有差别检验假设 00,H ??? = 0 ( 水平 ? ) 及作 ? 的区间估计 ( 置
信度为 ??1 ),
对不同的样本值,以下几种情况都可能出现,
(Ⅰ ) 接受 = 0,区间估计为 (-0.001,0.002);
(Ⅱ ) 接受 = 0,区间估计为 (-1000,1500);
(Ⅲ ) 拒绝 = 0,区间估计为 (1000,2000);
(Ⅳ ) 拒绝 = 0,区间估计为 (0.001,0.002).
00,H ???
00,H ???
00,H ???
00,H ???
2,检验的 p值
一般说来,用统计检验作出的结论,不如区间估计
那么精细。 这一点的根由就在于统计检验这种形式固
有的粗造性。
在正态总体 )1,(N ? 中抽取样本 1621 X,,X,X ?
检验假设 0:H 0 ??,0:1 ??H
取检验水平 0.05,拒绝的条件为, 49.0|X| ?
假设对一组具体的 1621 X,,X,X ? 有 48.0?X
,接受 H0
假设另一组具体的 1621 X,,X,X ? 有 12.0?X,
接受 H0
观察可见,在后一场合,作出 的结论根据大一些,0??
设对某一组具体样本,计算出,则这组样本
的 p值定义为,
bX?
)1,0(N~Z| },b||Z{|Pp ??
p 愈大 ( 小 ),认为 0?? 的根据就愈足 ( 不足 ),
当 p 值落到给定的水平 ? 之下时,就要拒绝 0?? 了,
若,但离 很近,则我们虽不能拒绝,但对它
抱着很怀疑的态度,
??p ?
推广到一般情况, 设有一个原假设 H0,其拒绝条件
为 |T|>C,T为检验统计量,
若对一组具体样本计算出统计量 T之值为 T0,则这
组样本的 p值是,
}H||T||T{|Pp 00??
如果拒绝条件为 T>C,则 p值为 }H|TT{Pp 00??
如果拒绝条件为 T<C,则 p值为 }H|TT{Pp
00??
例 从电话公司每月长途电话的帐单中,随机抽
取 37张,计算平均费用为 33.15元,标准差为 21.21元, 假定
费用服从正态分布,未知,要检验假设
,,试计算 p值,
),(N 2?? 2?
30:H 0 ?? 30:H 1 ??
n/S
XT 0???
)1n(t~
0H
?
成立时解, 取检验统计量
依样本计算检验统计量的值为 9 0 3 3 8.03015.33T
37
21.210 ?
??
}H|90.0|T{|P}H||T||T{|Pp 000 ???? =,37233
说明样本支持原假设,故要接受原假设,
注意, Excel中 p值应用函数为
3 7 2 3 3.0)2,137,9 0 3 3 8.0(T D I S T)T a i l s,df,x(T D I S T ???