(二)对总体方差的估计(只介绍小
样本下的)
? ? ? ?
? ?
? ? ? ? ? ?
? ? ? ?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
??
?
????????
?
?
?
1
11
1,
2
1
1
14.4,μ,,
2
2
2
2
2
2
2
2
2
1
a
n
b
n
P
bZaPbbPaZP
ba
n
n
Z
N
ss
s
xx n
的置信区间确定为:由此,
使得
,一般取和分布表可以确定查,定的
分布。对于给的服从具有自由度可知,
由定理,来自正态总体设样本 ?
总体方差区间估计的例题
?例 9 在本节例 8中,请对新生儿体重的方
差进行区间估计( ?=0.05)。
??=0.05 n-1=11,查 X2分布临界值表,得
? a=3.82 b=21.9, a,b满足:
? p(Z>=a)=0.975 p(Z>=b)=0.025
?有上例知,s2=140900,所以 (n-1)s2=1549000,
?则 ?2的置信区间为:
? 1549000/21.9< ?2< 1549000/3.82
?即 70700< ?2<405000
(三)关于区间估计的几点说明
?( 1)区间估计在方法上是定理 4.13~4.17的应
用。
?( 2)在进行屈驾估计时,应针对不同的情况,
采用不同的方法。例如分清分布的形式是已知
或是未知;是大样本或是小样本;小样本(估
计总体数学期望时)又分清是已知方差或是未
知方差等。充分利用分布信息可以得到较精确
的估计。
?( 3)一般地,?越大置信度越低,置信区间越
小;反之,则反。
第七节 通过样本,估计总体(三) —
—假设检验
?一、假设检验的概念
?二、两类错误
?三、假设检验与区间估计间的关系:置信区间
法
?四、假设检验的应用
?(一)正态总体的假设检验
?(二)两个正态总体的假设检验
?(三)总体分布的假设检验
?五、“小概率原理”在假设检验中的应用
一、假设检验的概念
? 定义:称对任何一个随机变量未知分布的假设为统计
假设,简称假设。
? 一个仅涉及到随机变量分布中未知参数的假设称为参
数假设。一个仅涉及到随机变量分布的形式而不涉及
到未知参数的假设称为非参数假设。
? 参数假设中对未知参数完全确定的假设称为单一假设,
否则称为复合假设。例如,H0:?=1,?=2为单一假设,
而 H0:?=1,? < >2为复合假设,因为满足这个假设的分
布有无数个。
? 提出一个统计假设的关键是将一个实际的研究问题用
数学语言转换为统计假设。
例 1.检验一个硬币是否均匀
?抛掷一个硬币 100次,“正面”出现 60次,
问此硬币是否均匀?
?分析:
?若用 X描述抛掷硬币的试验,,X=1”和
,X=0”分别表示“出现正面”和“出现
反面”。上述问题就是检验 X是否可以被
认为服从 p=0.5的 0-1分布。
?问题是分布形式已知,检验参数 p=0.5的
单一检验。记作,H0:p=0.5 HA:p<>0.5
零假设与备择假设
?在统计假设 ——H0:p=0.5 HA:p<>0.5中,
H0称为零假设或无效假设或待假设,是
我们进行统计假设检验欲确定其是否成
立的假设 ——体现我们进行假设检验的
目的,而且往往是希望否定这个假设,
否定其成立所冒的风险为。
?HA称为备择假设,统计假设检验是二择
一的判断,当不成立时,不得不接受它。
例 2.检验 1976年新生女婴体重是否等
于某个既定值
?从 1999年出生的女婴中随机地抽取 20名,测得
平均体重 =3160克,标准差 =300克,根据已有
的统计资料新生女婴的体重 =3140克,问现在
与过去新生女婴的体重是否有变化?
?分析:把 1999年出生的女婴视为一个总体,用
X描述,问题就是判断:
? H0:EX=3140 HA:EX < > 3140
?因为通常可以假定经过量测得到的资料是服从
正态分布的,无须检验总体的分布形式,显然
这是一个关于参数的复合假设检验问题。
二、两类错误
?( 1)两类错误的概念
?( 2) Neyman-Pearson方法
?( 3)显著性水平
( 1)两类错误的概念
? 由于我们作出判断的依据是一组样本,结论却是对于
总体的,即由局部 =>全面,由特殊 =>一般,由个别 =>
整体,因而假设检验的结果不可能绝对正确,它有可
能是错误的。而且出现错误可能性的大小,也是以统
计规律(小概率原理)为依据的。所可能犯的错误有
两类:
? 第一类 —弃真,原假设符合实际情况,而检验结果把
它否定了。设犯这类错误的概率为 ?,那么
? ? =p(否定 H0/H0实际上为真 )。 ?称为显著性水平
? 第二类 —纳伪,原假设不符合实际情况,而检验结果
却把它肯定下来。设犯这类错误的概率为 ?,那么
? ?=p(接受 H0/H0实际上为不正确 )。 1-?称为检验能力。
( 2) Neyman-Pearson方法
? 自然我们希望犯两类错误的概率都越小越好。但对一
定的样本容量 n,一般都不能作到犯这两类错误的概率
同时都小。由于减小 ? =>增大 ?,或者减小 ? =>增大 ?,
于是我们面临抉择,计量经济学中常常愿意使犯”第
一类错误“的概率 ?较小,因为我们提出假设时往往就
希望拒绝它,拒绝错了的概率就较小 。而不考虑 ?。
因此,拒绝 H0是坚决有力的(冒险率是确定的),而
不拒绝 H0则是无可奈何的(冒险率是没有确定的)。
? Neyman-Pearson提出了一种方法:先固定犯“第一类
错误”的概率 ?,再考虑如何减小犯“第二类错误”
的概率 ?,也称 Fix ?,Min ?方法。当 ?确定以后,让 ?
尽量的小,1- ?就越大,称不犯“第二类错误”的概率
为“检验能力( Power of test)。
不能同时减小犯两类错误概率的图示
?
?/2 ?/2
临界值减小,?
减小,?增大
假设总体 实际总体
拒绝 H0
拒绝 H0
x
( 3)显著性水平
? 显著水平指的是犯“第一类错误”的可能性,即“冒
险率” <==>冒 H0是真而我们抛弃了 H0所犯错误的概率
<==>反之,而不接受 H0,乃是因为客观事实与 H0假设
存在差异,且这种差异的程度已经太大了,在给定的
小概率 ?下,零假设几乎是不可能发生的,从而认为零
假设 H0是错的,必须抛弃它。所以,我们把犯弃真错
误的概率也称为差异达到和超过了显著(太大)的水
平,以至于达到显著水平后,我们不能接受 H0,而不
得不抛弃 H0。同时,即使抛弃零假设 H0,这时也只需
冒 ?的风险,<==>抛弃 H0的可靠性则为 1- ? 。
? 如果假设事关重大,譬如人命关载人的宇宙飞船升空
或药品试验,则必须提高差异显著水平即减小 ?,使我
们不能轻易地拒绝 H0。否则,则可以降低显著水平。
三、假设检验与区间估计间的关
系:置信区间法
?(一)问题的提出
?(二)假设检验的置信区间法
?(三)假设检验与区间估计的联系与区
别
(一)问题的提出
? 曾经提到“某甲成绩大概是 80 分左右”可以看成一个
区间估计问题。
?,大概 80分左右” <==>
? p(?1<?<?2)=大概的准确程度 <==>
? 如,p(75<?<85)=95% <==>
? (75,85)是某甲成绩的估计区间,某甲成绩落在此区间
的概率在 95%以上。
? 类似地,对这个问题,也可举出一个假设检验的问题
<==>在允许你犯 5%以下的错误,即以 95%的正确性来
回答:“某甲的成绩是 80,对吗?” <==>
? 假设 检验
? 同样的问题又是一个假设检验的问题。
(二)假设检验的置信区间法的定义
?对比区间估计和假设检验两种情况,我们发现
区间估计实际上给出了一种进行假设检验的方
法。
?比如,当涉及“某甲成绩为 80分”( =5%)
后,,首先对问题进行区间估计,得到成绩在
75~85之间的概率为 95%。若原假设 H0落在
( 75,85)内,显然应当接受 H0,否则,则拒
绝 H0。
?这种利用区间估计法来进行假设检验的方法称
为区间估计法。
(三)假设检验的检验水平 ? =区间估
计中的显著水平 ?
? 续以上问题继续讨论。对于给定的置信度 5%,对成绩
进行区间估计结果为( 75,85),若原假设落入该区间,
我们便接受 H0,认为甲的成绩是 80分。如此(接受
时),我们可能犯第二类错误,即甲的成绩实际上是
72,不是 80,而把错误的 H0接受了(纳伪了)。必须
指出,这里的置信度 95%只保证了我们运用置信区间
法进行假设检验时,在 95%下,如果 H0正确,我们不
会拒绝它,即 95%地防止了假设检验中第一类错误的
发生,也就是显著水平达到了 5%。
? 由此可见,在利用置信区间法进行假设检验时,区间
估计中的置信度 1-?中的 ?,就是假设检验中的检验水
平 ?。
?????也就是 ?,?不可能同时减小
的再探
?在置信区间法下,随着检验水平 ?的减小(第
一类错误的概率减小),例如 5%?1%,区间
估计的置信度就会增大( 95%?99%);
?置信度的加大,导致置信区间长度变大,比如
从( 75,95) ?( 70,90);
?这样就加了大犯第二类错误的概率 ?,换言之,
我们不但可能把 72 分成绩误认为 80分,还可能
把 70分误认为 80 分;
?所以 ?????,也就是 ?,?不可能同时减小
通过求置信区间进行假设检验的例子
? 例 3 根据长期经验和资料分析,某砖厂生产的砖的
“抗断强度”服从正态分布,方差 =1.21,今从该厂生
产的砖中随机地抽取 6块砖,测得强度如下(单位千克
/cm2):检验这批砖的平均抗断强度为 32.50千克 /cm2
是否成立( ? =0.05)?
? 解,H0:?=32.50 HA,? < >32.50
? 首先求 ?的置信区间:
Dò o? 1 2 3 4 5 6
?1 ?? ?? ?è 32.56 29.66 31.64 30.00 31.37 31.03
50.32:50.32
01.3225.3096.1
6
1.1
13.3196.1
6
1.1
13.31
96.105.01.121.16
13.31
1
1
0
1
??
????????
?????
?????
?
?
?
?
?
???? ?
?
?
??
??
?
?
?
?
?
??
?
??
H
x
n
n
x
n
x
n
xp
n
i
i
拒绝超过了置信区间,假设的
即
?
?
临界值法
? ?
,则不下结论。;接受就拒绝若
进行比较。与用计算出来的价于是否落入置信区间就等因此,检验
令
信区间:设检验,首先要计算置应用区间估计法进行假
???
?
??
????
??
???
?
??
????
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
???
?
???
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
????
?
?
?
?
?
????
???
?
?
?
?
?
????
?
UUU
U
Up
n
x
U
n
x
p
n
x
p
n
x
n
p
n
x
n
xp
HH 00;,
,μ
1
/
1
/
1
/
1
1
假设检验的步骤
? 1、提出零假设 H0,?= ?0 HA,? < > ?0
? 2、根据抽样所得样本计算检验统计量
? 3、确定显著水平 ?=0.05(或 0.01)和相应的临界值 ??
? 4、将计算的 U与 ??进行比较。如果 H0真的成立,必有
? < = ?0,否则必有 ? > ?0。
? 5、下结论:若 U> ??,P< ?,拒绝 H0;若 U< ??,P>
?,接受 H0;若 U= ??,不能对 H0下结论
? 6、依据统计结论,作出专业(经济学)上的解释
n
x
U
/
0
?
??
?
采用临界值法重作例 3
? 1、提出零假设 H0,?= 32.5 HA,? < >32.5
? 2、根据抽样所得样本计算检验统计量
? 3、确定显著水平 ?=0.05(或 0.01)和相应的临界值
??=1.96
? 4、将计算的 U=3.05与 ??=1.96进行比较
? 5、下结论:因为 U=3.05> ?? =1.96,故 P< ?=0.05小概
率事件发生,则拒绝 H0。不认为抗断强度为 32.5。
? 6、依据统计结论,作出专业(经济学)上的解释
05.3
6/1.1
5.3213.31
/
0 ???
?
?
n
x
U
?
?
(三)假设检验与区间估计的
联系与区别
四、假设检验的应用
?(一)正态总体的假设检验
?(二)两个正态总体的假设检验
?(三)总体分布的假设检验
(一)正态总体的假设检验
?设总体 ?~N( ?,?2),对于其参数 ?,?2
的假设检验,讨论 4种情况:
?( 1)已知方差 ?2,检验假设 H0,?= ?0
?( 2)未知方差 ?2,检验假设 H0,?= ?0
?( 3)未知期望 ?,检验假设 H0,?2= ?20
?( 4)未知期望 ?,检验假设 H0,?2<= ?20
?其中,H0中的 ?0和 ?20均是已知的数。
例 4 未知总体方差,检验总体均值等
于定值
? 从 1975年出生的新生女婴中随机抽取 20 个,测得起平均体重为
3160克,样本标准差为 300克,根据过去的资料,新生女婴平均体
重等于 3140 克,问现在女婴体重与过去有无差别( ?=0.01)?
显著的差异。婴的体重与过去没有极,即认为现在的新生女不能拒绝
小概率事件没有发生,:与临界值比较,下结论)将统计量(
统计量)根据样本观察值计算(
,即查表确定临界值,)根据给定的显著水平(
计检验量成立的条件下,选取统)在(
未知总体方差,用)建立零假设(解
H
t
t
H
sH
PTT
TT
s
x
p
s
x
ns
x
T
0
120,01.0
120,01.0
0
0
22
0
0
,,5
8 6 1.22 9 8.0
20/3 0 0
3 1 4 03 1 6 0
4
01.08 6 1.2
20/
3 1 4 0
8 6 1.23
20/
3 1 4 0
/
2
3 1 4 0:1
?
??
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
??
?
?
例 5 未知总体数学期望,检验总体方
差等于定值
? 某铁厂的铁水含碳量 ?在正常情况下服从正态分布,现对操作工艺
进行改进,然后抽取 5炉铁水测得含碳量数据如下:
? 问是否可以认为新工艺炼出的铁水含碳量的方差认为原先的
0.1082(?=0.05)? 4.421 4.052 4.375 4.287 4.683
? ?
? ?
? ? ? ?
? ?
? ?
。仍为,不可认为则拒绝)下结论:(
)具体计算(
其中,
的临界值,使表,确定拒绝,查)根据(
的检验统计量:成立下,选取关于样本)在(:)提出零假设(
:的问题,求解步骤如下检验方差这是一个未知数学期望
1 0 8.0
1 0 8.0
2 2 8.0
1 0 8.01 0 8.0
1 0 8.0
1 0 8.0
22
0
22
2
2
22
0 2 5.0
2
2
9 7 5.0
22
2
2
2
2
2
0
22
2
2
2
0
22
0
2
0
2
5
1.118 2 7.17
4
44.114
0 4 8 4.04,
2
11
05.031~
1
21
???
???
????
???
?
??
?
?
?
H
ss
H
s
HH
p
n
p
n
p
n
n
b
b
aba
???
??
?
???
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
(二)两个正态总体的假设检验
(三)总体分布的假设检验
五、“小概率原理”在假设检验
中的应用
? 数理统计学中的“小概率原理”认为:概率很小的事
件在一次抽样试验中几乎是不可能发生的。
? 在假设检验中,我们就是根据这一原理来拒绝各种 H0。
? 在 H0成立的条件下,统计量大于临界值为一个小概率
事件,因此,在一次抽样试验中,依据小概率原理,
是不会发生的。
? 但是,而今眼目下,小概率事件(“统计量 >临界值”
的事件)居然发生了。出错了,那么,错在那里呢?
? 因为,在整个假设检验过程中,抽样是正确的、统计
量的选择是正确的、根据显著水平确定的临界值是正
确的、统计量的计算是正确的,统计量与临界值的比
较也是正确的。因而,只能是提出的假设 H0发生了错
误,所以必须拒绝 H0。
检验“大海里丢了一棵针”?
? ( 1)提出假设:检验“大海里丢了一棵针”
? ( 2)进行抽样,并计算统计量 ——计算打捞起来的
“针”的棵数
? ( 3)因为“大海里捞针一场空”是一小概率事件,依
据小概率原理,在一次试验中几乎是不可能发生的,
确定“临界值” <1(不会捞到一棵针或 =0)是正常的、
大概率事件。
? ( 4)、( 5)计算统计量和下结论:
? A.捞到了一棵针,小概率事件发生了(不该发生的居
然发生了,只能是 H0出错),所以拒绝 H0,==>认为
大海里不只丢了一棵针。(针丢多了才可以捞到)
? B.得到了,0”棵针,大概率事件发生了(应该发生)
==>接受 H0,认为“大海里只丢了一棵针”。
大海里捞针的错误之一 ——“弃真”
? 1.提出假设 H0,,大海里丢了一棵针”
?真实情况:大海里真的只丢了一棵针,
? 2.如果假设为真,一次试验是不可能捞到一棵
针的 <==>小概率事件
? 3.打捞结果及下结论:
?在一次试验中捞到了一棵针,小概率事件居然
发生了,而不得不拒绝 H0,认为大海里不只一
棵针。对比真实情况,那么,此时发生了第一
类错误 ——“弃真”
大海里捞针的错误之一 ——“纳伪”
? 1.提出假设 H0,,大海里丢了一棵针”。而真
实情况是,大海里不是丢了一棵针,是很多很
多。
? 2.如果假设为真,一次试验是不可能捞到一棵
针的 <==>小概率事件。
? 3.打捞结果及结论:
?在一次试验中没有捞到了一棵针,大概率事件
发生了,是完全应该发生,接受 H0是顺理成章
之事,认为大海里只丢了一棵针。那么,对比
真实情况,此时发生了第二类错误 ——“纳伪”
(把错误的假设接纳了)。
本章的几点注意点:
? ( 1)数理统计学研究的核心问题是如何从样本来推断
总体的性质。作为观察者,我们对总体的情况往往是
不了解的,我们只能对总体进行随机抽样,获得一组
样本,通过对一组样本的研究,进而估计总体的各种
属性。所以,对总体的研究都是基于样本的。
? ( 2)为了描述总体引入了随机变量,只有随机变量这
类特殊的变量,才能用以对总体进行全面描述。
? ( 3)总体就是一个随机变量。
? ( 4)我们通常遵循统计量三个优良性来构造各种统计
量,而且利用假设检验来具体的评价关于总体参数的
假设是否合理。
? ( 5)区间估计和假设检验是一个问题的两个方面。
样本下的)
? ? ? ?
? ?
? ? ? ? ? ?
? ? ? ?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
??
?
????????
?
?
?
1
11
1,
2
1
1
14.4,μ,,
2
2
2
2
2
2
2
2
2
1
a
n
b
n
P
bZaPbbPaZP
ba
n
n
Z
N
ss
s
xx n
的置信区间确定为:由此,
使得
,一般取和分布表可以确定查,定的
分布。对于给的服从具有自由度可知,
由定理,来自正态总体设样本 ?
总体方差区间估计的例题
?例 9 在本节例 8中,请对新生儿体重的方
差进行区间估计( ?=0.05)。
??=0.05 n-1=11,查 X2分布临界值表,得
? a=3.82 b=21.9, a,b满足:
? p(Z>=a)=0.975 p(Z>=b)=0.025
?有上例知,s2=140900,所以 (n-1)s2=1549000,
?则 ?2的置信区间为:
? 1549000/21.9< ?2< 1549000/3.82
?即 70700< ?2<405000
(三)关于区间估计的几点说明
?( 1)区间估计在方法上是定理 4.13~4.17的应
用。
?( 2)在进行屈驾估计时,应针对不同的情况,
采用不同的方法。例如分清分布的形式是已知
或是未知;是大样本或是小样本;小样本(估
计总体数学期望时)又分清是已知方差或是未
知方差等。充分利用分布信息可以得到较精确
的估计。
?( 3)一般地,?越大置信度越低,置信区间越
小;反之,则反。
第七节 通过样本,估计总体(三) —
—假设检验
?一、假设检验的概念
?二、两类错误
?三、假设检验与区间估计间的关系:置信区间
法
?四、假设检验的应用
?(一)正态总体的假设检验
?(二)两个正态总体的假设检验
?(三)总体分布的假设检验
?五、“小概率原理”在假设检验中的应用
一、假设检验的概念
? 定义:称对任何一个随机变量未知分布的假设为统计
假设,简称假设。
? 一个仅涉及到随机变量分布中未知参数的假设称为参
数假设。一个仅涉及到随机变量分布的形式而不涉及
到未知参数的假设称为非参数假设。
? 参数假设中对未知参数完全确定的假设称为单一假设,
否则称为复合假设。例如,H0:?=1,?=2为单一假设,
而 H0:?=1,? < >2为复合假设,因为满足这个假设的分
布有无数个。
? 提出一个统计假设的关键是将一个实际的研究问题用
数学语言转换为统计假设。
例 1.检验一个硬币是否均匀
?抛掷一个硬币 100次,“正面”出现 60次,
问此硬币是否均匀?
?分析:
?若用 X描述抛掷硬币的试验,,X=1”和
,X=0”分别表示“出现正面”和“出现
反面”。上述问题就是检验 X是否可以被
认为服从 p=0.5的 0-1分布。
?问题是分布形式已知,检验参数 p=0.5的
单一检验。记作,H0:p=0.5 HA:p<>0.5
零假设与备择假设
?在统计假设 ——H0:p=0.5 HA:p<>0.5中,
H0称为零假设或无效假设或待假设,是
我们进行统计假设检验欲确定其是否成
立的假设 ——体现我们进行假设检验的
目的,而且往往是希望否定这个假设,
否定其成立所冒的风险为。
?HA称为备择假设,统计假设检验是二择
一的判断,当不成立时,不得不接受它。
例 2.检验 1976年新生女婴体重是否等
于某个既定值
?从 1999年出生的女婴中随机地抽取 20名,测得
平均体重 =3160克,标准差 =300克,根据已有
的统计资料新生女婴的体重 =3140克,问现在
与过去新生女婴的体重是否有变化?
?分析:把 1999年出生的女婴视为一个总体,用
X描述,问题就是判断:
? H0:EX=3140 HA:EX < > 3140
?因为通常可以假定经过量测得到的资料是服从
正态分布的,无须检验总体的分布形式,显然
这是一个关于参数的复合假设检验问题。
二、两类错误
?( 1)两类错误的概念
?( 2) Neyman-Pearson方法
?( 3)显著性水平
( 1)两类错误的概念
? 由于我们作出判断的依据是一组样本,结论却是对于
总体的,即由局部 =>全面,由特殊 =>一般,由个别 =>
整体,因而假设检验的结果不可能绝对正确,它有可
能是错误的。而且出现错误可能性的大小,也是以统
计规律(小概率原理)为依据的。所可能犯的错误有
两类:
? 第一类 —弃真,原假设符合实际情况,而检验结果把
它否定了。设犯这类错误的概率为 ?,那么
? ? =p(否定 H0/H0实际上为真 )。 ?称为显著性水平
? 第二类 —纳伪,原假设不符合实际情况,而检验结果
却把它肯定下来。设犯这类错误的概率为 ?,那么
? ?=p(接受 H0/H0实际上为不正确 )。 1-?称为检验能力。
( 2) Neyman-Pearson方法
? 自然我们希望犯两类错误的概率都越小越好。但对一
定的样本容量 n,一般都不能作到犯这两类错误的概率
同时都小。由于减小 ? =>增大 ?,或者减小 ? =>增大 ?,
于是我们面临抉择,计量经济学中常常愿意使犯”第
一类错误“的概率 ?较小,因为我们提出假设时往往就
希望拒绝它,拒绝错了的概率就较小 。而不考虑 ?。
因此,拒绝 H0是坚决有力的(冒险率是确定的),而
不拒绝 H0则是无可奈何的(冒险率是没有确定的)。
? Neyman-Pearson提出了一种方法:先固定犯“第一类
错误”的概率 ?,再考虑如何减小犯“第二类错误”
的概率 ?,也称 Fix ?,Min ?方法。当 ?确定以后,让 ?
尽量的小,1- ?就越大,称不犯“第二类错误”的概率
为“检验能力( Power of test)。
不能同时减小犯两类错误概率的图示
?
?/2 ?/2
临界值减小,?
减小,?增大
假设总体 实际总体
拒绝 H0
拒绝 H0
x
( 3)显著性水平
? 显著水平指的是犯“第一类错误”的可能性,即“冒
险率” <==>冒 H0是真而我们抛弃了 H0所犯错误的概率
<==>反之,而不接受 H0,乃是因为客观事实与 H0假设
存在差异,且这种差异的程度已经太大了,在给定的
小概率 ?下,零假设几乎是不可能发生的,从而认为零
假设 H0是错的,必须抛弃它。所以,我们把犯弃真错
误的概率也称为差异达到和超过了显著(太大)的水
平,以至于达到显著水平后,我们不能接受 H0,而不
得不抛弃 H0。同时,即使抛弃零假设 H0,这时也只需
冒 ?的风险,<==>抛弃 H0的可靠性则为 1- ? 。
? 如果假设事关重大,譬如人命关载人的宇宙飞船升空
或药品试验,则必须提高差异显著水平即减小 ?,使我
们不能轻易地拒绝 H0。否则,则可以降低显著水平。
三、假设检验与区间估计间的关
系:置信区间法
?(一)问题的提出
?(二)假设检验的置信区间法
?(三)假设检验与区间估计的联系与区
别
(一)问题的提出
? 曾经提到“某甲成绩大概是 80 分左右”可以看成一个
区间估计问题。
?,大概 80分左右” <==>
? p(?1<?<?2)=大概的准确程度 <==>
? 如,p(75<?<85)=95% <==>
? (75,85)是某甲成绩的估计区间,某甲成绩落在此区间
的概率在 95%以上。
? 类似地,对这个问题,也可举出一个假设检验的问题
<==>在允许你犯 5%以下的错误,即以 95%的正确性来
回答:“某甲的成绩是 80,对吗?” <==>
? 假设 检验
? 同样的问题又是一个假设检验的问题。
(二)假设检验的置信区间法的定义
?对比区间估计和假设检验两种情况,我们发现
区间估计实际上给出了一种进行假设检验的方
法。
?比如,当涉及“某甲成绩为 80分”( =5%)
后,,首先对问题进行区间估计,得到成绩在
75~85之间的概率为 95%。若原假设 H0落在
( 75,85)内,显然应当接受 H0,否则,则拒
绝 H0。
?这种利用区间估计法来进行假设检验的方法称
为区间估计法。
(三)假设检验的检验水平 ? =区间估
计中的显著水平 ?
? 续以上问题继续讨论。对于给定的置信度 5%,对成绩
进行区间估计结果为( 75,85),若原假设落入该区间,
我们便接受 H0,认为甲的成绩是 80分。如此(接受
时),我们可能犯第二类错误,即甲的成绩实际上是
72,不是 80,而把错误的 H0接受了(纳伪了)。必须
指出,这里的置信度 95%只保证了我们运用置信区间
法进行假设检验时,在 95%下,如果 H0正确,我们不
会拒绝它,即 95%地防止了假设检验中第一类错误的
发生,也就是显著水平达到了 5%。
? 由此可见,在利用置信区间法进行假设检验时,区间
估计中的置信度 1-?中的 ?,就是假设检验中的检验水
平 ?。
?????也就是 ?,?不可能同时减小
的再探
?在置信区间法下,随着检验水平 ?的减小(第
一类错误的概率减小),例如 5%?1%,区间
估计的置信度就会增大( 95%?99%);
?置信度的加大,导致置信区间长度变大,比如
从( 75,95) ?( 70,90);
?这样就加了大犯第二类错误的概率 ?,换言之,
我们不但可能把 72 分成绩误认为 80分,还可能
把 70分误认为 80 分;
?所以 ?????,也就是 ?,?不可能同时减小
通过求置信区间进行假设检验的例子
? 例 3 根据长期经验和资料分析,某砖厂生产的砖的
“抗断强度”服从正态分布,方差 =1.21,今从该厂生
产的砖中随机地抽取 6块砖,测得强度如下(单位千克
/cm2):检验这批砖的平均抗断强度为 32.50千克 /cm2
是否成立( ? =0.05)?
? 解,H0:?=32.50 HA,? < >32.50
? 首先求 ?的置信区间:
Dò o? 1 2 3 4 5 6
?1 ?? ?? ?è 32.56 29.66 31.64 30.00 31.37 31.03
50.32:50.32
01.3225.3096.1
6
1.1
13.3196.1
6
1.1
13.31
96.105.01.121.16
13.31
1
1
0
1
??
????????
?????
?????
?
?
?
?
?
???? ?
?
?
??
??
?
?
?
?
?
??
?
??
H
x
n
n
x
n
x
n
xp
n
i
i
拒绝超过了置信区间,假设的
即
?
?
临界值法
? ?
,则不下结论。;接受就拒绝若
进行比较。与用计算出来的价于是否落入置信区间就等因此,检验
令
信区间:设检验,首先要计算置应用区间估计法进行假
???
?
??
????
??
???
?
??
????
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
???
?
???
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
????
?
?
?
?
?
????
???
?
?
?
?
?
????
?
UUU
U
Up
n
x
U
n
x
p
n
x
p
n
x
n
p
n
x
n
xp
HH 00;,
,μ
1
/
1
/
1
/
1
1
假设检验的步骤
? 1、提出零假设 H0,?= ?0 HA,? < > ?0
? 2、根据抽样所得样本计算检验统计量
? 3、确定显著水平 ?=0.05(或 0.01)和相应的临界值 ??
? 4、将计算的 U与 ??进行比较。如果 H0真的成立,必有
? < = ?0,否则必有 ? > ?0。
? 5、下结论:若 U> ??,P< ?,拒绝 H0;若 U< ??,P>
?,接受 H0;若 U= ??,不能对 H0下结论
? 6、依据统计结论,作出专业(经济学)上的解释
n
x
U
/
0
?
??
?
采用临界值法重作例 3
? 1、提出零假设 H0,?= 32.5 HA,? < >32.5
? 2、根据抽样所得样本计算检验统计量
? 3、确定显著水平 ?=0.05(或 0.01)和相应的临界值
??=1.96
? 4、将计算的 U=3.05与 ??=1.96进行比较
? 5、下结论:因为 U=3.05> ?? =1.96,故 P< ?=0.05小概
率事件发生,则拒绝 H0。不认为抗断强度为 32.5。
? 6、依据统计结论,作出专业(经济学)上的解释
05.3
6/1.1
5.3213.31
/
0 ???
?
?
n
x
U
?
?
(三)假设检验与区间估计的
联系与区别
四、假设检验的应用
?(一)正态总体的假设检验
?(二)两个正态总体的假设检验
?(三)总体分布的假设检验
(一)正态总体的假设检验
?设总体 ?~N( ?,?2),对于其参数 ?,?2
的假设检验,讨论 4种情况:
?( 1)已知方差 ?2,检验假设 H0,?= ?0
?( 2)未知方差 ?2,检验假设 H0,?= ?0
?( 3)未知期望 ?,检验假设 H0,?2= ?20
?( 4)未知期望 ?,检验假设 H0,?2<= ?20
?其中,H0中的 ?0和 ?20均是已知的数。
例 4 未知总体方差,检验总体均值等
于定值
? 从 1975年出生的新生女婴中随机抽取 20 个,测得起平均体重为
3160克,样本标准差为 300克,根据过去的资料,新生女婴平均体
重等于 3140 克,问现在女婴体重与过去有无差别( ?=0.01)?
显著的差异。婴的体重与过去没有极,即认为现在的新生女不能拒绝
小概率事件没有发生,:与临界值比较,下结论)将统计量(
统计量)根据样本观察值计算(
,即查表确定临界值,)根据给定的显著水平(
计检验量成立的条件下,选取统)在(
未知总体方差,用)建立零假设(解
H
t
t
H
sH
PTT
TT
s
x
p
s
x
ns
x
T
0
120,01.0
120,01.0
0
0
22
0
0
,,5
8 6 1.22 9 8.0
20/3 0 0
3 1 4 03 1 6 0
4
01.08 6 1.2
20/
3 1 4 0
8 6 1.23
20/
3 1 4 0
/
2
3 1 4 0:1
?
??
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
??
?
?
例 5 未知总体数学期望,检验总体方
差等于定值
? 某铁厂的铁水含碳量 ?在正常情况下服从正态分布,现对操作工艺
进行改进,然后抽取 5炉铁水测得含碳量数据如下:
? 问是否可以认为新工艺炼出的铁水含碳量的方差认为原先的
0.1082(?=0.05)? 4.421 4.052 4.375 4.287 4.683
? ?
? ?
? ? ? ?
? ?
? ?
。仍为,不可认为则拒绝)下结论:(
)具体计算(
其中,
的临界值,使表,确定拒绝,查)根据(
的检验统计量:成立下,选取关于样本)在(:)提出零假设(
:的问题,求解步骤如下检验方差这是一个未知数学期望
1 0 8.0
1 0 8.0
2 2 8.0
1 0 8.01 0 8.0
1 0 8.0
1 0 8.0
22
0
22
2
2
22
0 2 5.0
2
2
9 7 5.0
22
2
2
2
2
2
0
22
2
2
2
0
22
0
2
0
2
5
1.118 2 7.17
4
44.114
0 4 8 4.04,
2
11
05.031~
1
21
???
???
????
???
?
??
?
?
?
H
ss
H
s
HH
p
n
p
n
p
n
n
b
b
aba
???
??
?
???
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
(二)两个正态总体的假设检验
(三)总体分布的假设检验
五、“小概率原理”在假设检验
中的应用
? 数理统计学中的“小概率原理”认为:概率很小的事
件在一次抽样试验中几乎是不可能发生的。
? 在假设检验中,我们就是根据这一原理来拒绝各种 H0。
? 在 H0成立的条件下,统计量大于临界值为一个小概率
事件,因此,在一次抽样试验中,依据小概率原理,
是不会发生的。
? 但是,而今眼目下,小概率事件(“统计量 >临界值”
的事件)居然发生了。出错了,那么,错在那里呢?
? 因为,在整个假设检验过程中,抽样是正确的、统计
量的选择是正确的、根据显著水平确定的临界值是正
确的、统计量的计算是正确的,统计量与临界值的比
较也是正确的。因而,只能是提出的假设 H0发生了错
误,所以必须拒绝 H0。
检验“大海里丢了一棵针”?
? ( 1)提出假设:检验“大海里丢了一棵针”
? ( 2)进行抽样,并计算统计量 ——计算打捞起来的
“针”的棵数
? ( 3)因为“大海里捞针一场空”是一小概率事件,依
据小概率原理,在一次试验中几乎是不可能发生的,
确定“临界值” <1(不会捞到一棵针或 =0)是正常的、
大概率事件。
? ( 4)、( 5)计算统计量和下结论:
? A.捞到了一棵针,小概率事件发生了(不该发生的居
然发生了,只能是 H0出错),所以拒绝 H0,==>认为
大海里不只丢了一棵针。(针丢多了才可以捞到)
? B.得到了,0”棵针,大概率事件发生了(应该发生)
==>接受 H0,认为“大海里只丢了一棵针”。
大海里捞针的错误之一 ——“弃真”
? 1.提出假设 H0,,大海里丢了一棵针”
?真实情况:大海里真的只丢了一棵针,
? 2.如果假设为真,一次试验是不可能捞到一棵
针的 <==>小概率事件
? 3.打捞结果及下结论:
?在一次试验中捞到了一棵针,小概率事件居然
发生了,而不得不拒绝 H0,认为大海里不只一
棵针。对比真实情况,那么,此时发生了第一
类错误 ——“弃真”
大海里捞针的错误之一 ——“纳伪”
? 1.提出假设 H0,,大海里丢了一棵针”。而真
实情况是,大海里不是丢了一棵针,是很多很
多。
? 2.如果假设为真,一次试验是不可能捞到一棵
针的 <==>小概率事件。
? 3.打捞结果及结论:
?在一次试验中没有捞到了一棵针,大概率事件
发生了,是完全应该发生,接受 H0是顺理成章
之事,认为大海里只丢了一棵针。那么,对比
真实情况,此时发生了第二类错误 ——“纳伪”
(把错误的假设接纳了)。
本章的几点注意点:
? ( 1)数理统计学研究的核心问题是如何从样本来推断
总体的性质。作为观察者,我们对总体的情况往往是
不了解的,我们只能对总体进行随机抽样,获得一组
样本,通过对一组样本的研究,进而估计总体的各种
属性。所以,对总体的研究都是基于样本的。
? ( 2)为了描述总体引入了随机变量,只有随机变量这
类特殊的变量,才能用以对总体进行全面描述。
? ( 3)总体就是一个随机变量。
? ( 4)我们通常遵循统计量三个优良性来构造各种统计
量,而且利用假设检验来具体的评价关于总体参数的
假设是否合理。
? ( 5)区间估计和假设检验是一个问题的两个方面。