上一页 下一页湘潭大学数学与计算科学学院 1
§ 5.2 正态总体均值与方差的假设检验
上一页 下一页湘潭大学数学与计算科学学院 2
前面,我们已经了解到,在假设检验中使
用的逻辑是:
如果原假设 H0 是对的,那么衡量 差异
大小的某个 统计量落入区域 W(拒绝域 ) 是
个小概率事件, 如果该统计量的实测值落入
W,也就是说,H0 成立下的小概率事件发
生了,那么就认为 H0不可信而否定它, 否则
我们就不能否定 H0。
我们称这个小概率为 显著性水平,
用 表示,?
上一页 下一页湘潭大学数学与计算科学学院 3
在前面的假设检验中,这个 显著性水平 是
事先给定的,
.05.0,01.0,1.0 ??? ???如
根据给定的显著性水平,我们得到的假设
检验结果只有两个,拒绝或不能拒绝原假
设, 但作出这一结论或那一结论的可能性
有多大,则往往不易清楚地显示出来,
上一页 下一页湘潭大学数学与计算科学学院 4
拒绝域为 W,|U|>1.96
?要检验假设 H0,= 0; H1,≠ 0?
取检验统计量为 0X
U
n?
??
)1,0(~ N
例如从正态分布总体 N(,1)中抽样得
X1,X2,…,Xn,其中 n=16.
?
(显著性水平 =0.05)?
上一页 下一页湘潭大学数学与计算科学学院 5
拒绝域为 W,|U|>1.96
则根据拒绝域,我们不能拒绝 =0,?
也就是只能接受 =0.?
设又有另一组样本,由样本算得 U=0.48,
结论也是接受 = 0.?
对这两组样本而言,结论一致,
设由样本算得 U =1.92,
0??
然而,我们会觉得,在后一场合,作出
接受 的结论根据充分一些,而在前一
场合,根据就不很够,
上一页 下一页湘潭大学数学与计算科学学院 6
为了反映这一点,我们引进
检验的 p值,
上一页 下一页湘潭大学数学与计算科学学院 7
设有一个原假设 H0,其拒绝域为 |T|>C,
T是检验统计量, 若对一组具体样本,算出
统计量 T的值为 T0,则称这组样本的 p值 是
p= P(|T|>|T0|| H0)
它的意思是,如果 H0是对的,那么看到
|T|>|T0|的概率有多大?
如果这个概率很小,我们就倾向于拒绝 H0;
反之,如果这个概率不是很小,我们就不
能拒绝 H0.
上一页 下一页湘潭大学数学与计算科学学院 8
如果拒绝域为 T>C,则 p值是
p= P(T> T0| H0),
如果拒绝域为 T< C,则 p值是
p= P(T< T0| H0 )
类似地,
T0是对一组具体样本,算出的统计量 T的值,
p值是当 H0正确时,得到所观测的数
据或更极端值的概率,
上一页 下一页湘潭大学数学与计算科学学院 9
??若 p,则拒绝 H0.
??若 p,则不能
拒绝 H0;
将显著性
水平
与 p值
比较
?
上一页 下一页湘潭大学数学与计算科学学院 10
p值是人们可以拒绝原假设的
最小 显著性水平
在实践及各种统计软件中,人们并不
事先指定显著性水平的值,而是很方便地
利用上面定义的 p值, 对于任意大于 p值的显
著性水平,人们可以拒绝原假设,但不能
在任何小于它的水平下拒绝原假设,
上一页 下一页湘潭大学数学与计算科学学院 11
T H
正面 55次反面 45次
掷一枚均匀硬币 100次,
问这枚硬币是否均匀?
2/1:2/1,10 ??? pHpH
提出假设
其中 p为正面出现的概率,
取统计量
n
pU
/)5.01(5.0
5.0?
?
?? 近似 N(,1)
p? 为正面出现的 频 率,
由中心极限定理
上一页 下一页湘潭大学数学与计算科学学院 12
先算出统计量 U的实测值
我们来计算检验的 p值,
1
1 0 0/)5.01(5.0
5.055.0 ?
?
??U
p=P{|U|>1}
检验的 p值是,
=2-2(0.8413)=0.3174=2-2 (1)?
=1-P{|U|≤1}
若给定显著性水平 <0.3174,?
U的实测值就不落入拒绝域,
此时不能拒绝 H0.
上一页 下一页湘潭大学数学与计算科学学院 13
50次 50次 0.5 0 不能拒绝 H0
45次 55次
40次 60次
T H U值 决策值p
0.3174 1 不能拒绝 H0
0.0456 2 拒绝 H0
下面给出几种情况下的 p值及按 05.0??
的检验结果
35次 65次 0.0026 3 拒绝 H0
由 p值不难看出,出现 65次正面时,拒绝 H0
的把握较大 ; 出现 60次正面时,次之, 但若
<0.04,则不能拒绝 H0.?
上一页 下一页湘潭大学数学与计算科学学院 14
我们来看另一个例子:
1988年 7月 28日的纽约时报上刊登了一篇
有关人们地理知识的文章, 这篇文章中描述
了一个研究结果, 研究者们从一些国家抽取 许
多 成年人并请他们鉴别在一个地图上的 16个
地方 (包括 13个国家、中非、波斯湾和太平洋 );
然后把每个人答对的个数加起来,
四个国家的样本中答对的个数的均值如下:
美国 6.9 墨西哥 8.2
大不列颠 9.0 法国 9.2
上一页 下一页湘潭大学数学与计算科学学院 15
平均来看,法国的回答者有可能在地图上找
到的地方比其他三个国家的人要多,
美国 6.9 墨西哥 8.2
大不列颠 9.0 法国 9.2
几国答对个数
的均值
这篇文章称,从统计显著性方面考虑,得分
相差至少应在 0.6以上才算有差异,”
也就是说,样本均值的不同可能仅仅归于随
机性, 仅当两样本均值 相差在 0.6以上 才认为
两国均值是有差异的,
上一页 下一页湘潭大学数学与计算科学学院 16
美国 6.9 墨西哥 8.2
大不列颠 9.0 法国 9.2
几国答对个数
的均值
我们来探讨墨西哥的总体均值是否等于美国
的总体均值,
要检验的假设是:
我们用 表示墨西哥的总体均值,
1?
2?用 表示美国的总体均值
0:0,211210 ????? ???? HH
上一页 下一页湘潭大学数学与计算科学学院 17
取检验统计量
已知 n1=1200,n2=1600,
计算得 t 的实测值等于 4.25.
)2(~
11
2
)1()1(
)(
21
2121
2
22
2
11
21 ??
?
??
???
???
? nnt
nnnn
SnSn
YX
t
??
64
2
)1()1(
21
2
22
2
11 ?
??
???
nn
SnSn
已知墨西哥的样本中有 1200个观测,美国
的样本中有 1600个观测, 3.1?? YX
上一页 下一页湘潭大学数学与计算科学学院 18
我们来计算检验的 p值,
由于样本量很大,我们用正态分布 N(0,1)
近似 t 分布,
用计算机上软件求得
p值 =P(|t |>4.25)≈0.00001
因此样本均值的差大于等于 1.3的概率也是
0.00001,换句话说,从均值相等的总体中抽
取大约 100000个样本才有可能碰到一次样本
均值差在 1.3以上, 即在总体均值相等的情况
下样本均值差异这么大是件罕见的事情,
上一页 下一页湘潭大学数学与计算科学学院 19
于是我们认为导致这个小概率出现的
假设 -------两总体均值相等是错误的, 因此
拒绝假设 H0,即认为墨西哥和美国两个总
体均值差异不是 0,
由前述,只要显著性水平 大于 0.00001,
人们就可以拒绝原假设,
?
或者说,1.3这个差异是统计显著的,
作出这种结论犯错误的概率非常小,