? 引例,某工厂制造的产品,从过去较长一段时间的生产情况来看,其不合格率不超过 0.01。某天开工后,为检验生产过程是否稳定,随机抽取了 100件产品进行检验,发现其中 3件是不合格的。问这一天的生产是否稳定?
分析,我们可算得,不合格品出现的频率为 0.03。
由于我们不可能对所有生产的产品进行检验,
因此即使生产过程稳定,不合格率不超过 0.01,
在随机抽样检验中,不合格品出现的频率也有可能比 0.01大,如果记,X=1”表示生产出来的产品为不合格品;,X=0”表示生产出来的产品为合格品,我们有 这里参数 为不合格率。那么生产过程稳定等价于总体 X的分布为 0-1分布,参数 ;生产过程不稳定等价于总体的分布为 0-1分布,参数 。关于生产过程是否稳定的两种假设就转化为关于总体分布的两种假设
{ 1 } ; { 0 } 1P X p P X p
p
0,0 1p?
0.01p?
所谓假设检验问题,就是要判断原假设是否正确,也就是要作出一个决定,是接受还是拒绝原假设
0
1
,0,0 1
,0,0 1
Hp
Hp
01HH称 为 原 假 设 或 者 零 假 设 ; 称 为 备 择假 设 或 者 对 立 假 设,
如何作出选择,需要我们从总体中抽取样本,然后根据样本的观测值作出决定。这就需要我们给出一个规则,此规则告诉我们,在有了样本观测值后,我们可以作出是接受还是拒绝原假设。
我们把这样的规则称为检验。要给出一个有实际使用价值的检验,需要有丰富的统计思想。我们首先对样本进行加工,把样本中包含的关于未知参数的信息集中起来,构造出一个适合于假设检验的统计量 T。
上面例子中,我们取它表示所检验的 100件产品中不合格品的总数。
是 p的充分统计量,服从参数是 100,p的二项分布。一般说来,在 为真即生产过程稳定时,
T的值应比较小;而在 不真即生产过程不稳定时,T的值应相对地比较大。因此,我们可以根据 T值的大小来制定检验法则。对样本的每个观测值,当统计量的观测值较大时就拒绝,而当 T较小时就接受 。这就是说,
按照规则
n
i
iXT
1
0H
0H
0H0H
当 时,拒绝原假设;
当 时,接受原假设;
其中 c是一个待定的常数。不同的 c值表示不同的检验,如何确定 c,需要有熟练的计算技巧和丰富的统计思想,我们称 T为检验统计量; c为检验临界值; 为拒绝域;
为接受域。
ct?
tc?
{}W t c {}W T c
两类错误每一个检验都会不同程度地犯两类错误。
上面例子中,原假设本来正确,由于样本的随机性,检验统计量的观测值落入了拒绝域,就拒绝原假设,这时称假设检验过程中犯了第一类错误,也称,弃真错误,;原假设本来不正确,由于样本的随机性,检验统计量的观测值落入了接受域,就接受原假设,这时称假设检验过程中犯了第二类错误,也称,存伪错误,。
一个检验的好坏可由犯这两类错误的概率来度量。常把犯第一类错误的概率记为,犯第二类错误的概率记为 。由于它们常依赖于总体中未知参数,故又常记为 。
上面例子中
( ) ( )和
100
1
( ) { | 0 0,0 1 }i
i
p P X c p?
100
100
100 ( 1 ) ; 0 0,01
j j j
jc
C p p p?
100
1
1
100
100
0
( ) { | 0,01 1 }
( 1 ) ; 0,01 1
i
i
c
j j j
j
p P X c p
C p p p
可见,犯两类错误的概率均为参数 p的函数。犯第一类错误的概率是的函数;犯第二类错误的概率是的函数。犯两类错误的概率也是 c的函数,c的值越大,犯第一类错误的概率就越小,而犯第二类错误的概率就越大;相反,c的值越小,
犯第一类错误的概率就越大,而犯第二类错误的概率就越小;因此,犯两类错误的概率是相互制约的,
0 0,0 1p
0,0 1 1p
奈曼( Neyman)和皮尔逊( Pearson)提出,
首先控制犯第一类错误的概率,即选定一个数,使得检验中犯第一类错误的概率不超过 。然后,在满足这个约束条件的检验中,寻找犯第二类错误的概率尽可能小的检验。这就是假设检验理论中的奈曼 -皮尔逊原则。
寻找犯第二类错误的概率尽可能小的检验,在理论和计算中都并非容易。为简单起见,在样本容量 n固定时,我们着重对犯第一类错误的概率加以控制,适当考虑犯第二类错误的概率的大小。称控制犯第一类错误的概率不超过的检验为显著性检验。称 为显著性水平
(0 1 )
假设检验的一般步骤
( 1)根据实际问题提出原假设和备择假设;
( 2)确定检验统计量T;
( 3)取适当的显著性水平,并由显著性水平和统计量的分布确定拒绝域W,使得检验中犯第一类错误的概率的最大值尽可能的接近,特别在总体为连续型总体时,
往往要使它等于,拒绝域有单侧和双侧两种形式.
( 4)由样本观测值算得统计量的观测值,并与拒绝域中临界值比较,如果观测值落入拒绝域,则拒绝原假设,否则接受原假设.
}|{s u p 0 为真HWTP?
分析,我们可算得,不合格品出现的频率为 0.03。
由于我们不可能对所有生产的产品进行检验,
因此即使生产过程稳定,不合格率不超过 0.01,
在随机抽样检验中,不合格品出现的频率也有可能比 0.01大,如果记,X=1”表示生产出来的产品为不合格品;,X=0”表示生产出来的产品为合格品,我们有 这里参数 为不合格率。那么生产过程稳定等价于总体 X的分布为 0-1分布,参数 ;生产过程不稳定等价于总体的分布为 0-1分布,参数 。关于生产过程是否稳定的两种假设就转化为关于总体分布的两种假设
{ 1 } ; { 0 } 1P X p P X p
p
0,0 1p?
0.01p?
所谓假设检验问题,就是要判断原假设是否正确,也就是要作出一个决定,是接受还是拒绝原假设
0
1
,0,0 1
,0,0 1
Hp
Hp
01HH称 为 原 假 设 或 者 零 假 设 ; 称 为 备 择假 设 或 者 对 立 假 设,
如何作出选择,需要我们从总体中抽取样本,然后根据样本的观测值作出决定。这就需要我们给出一个规则,此规则告诉我们,在有了样本观测值后,我们可以作出是接受还是拒绝原假设。
我们把这样的规则称为检验。要给出一个有实际使用价值的检验,需要有丰富的统计思想。我们首先对样本进行加工,把样本中包含的关于未知参数的信息集中起来,构造出一个适合于假设检验的统计量 T。
上面例子中,我们取它表示所检验的 100件产品中不合格品的总数。
是 p的充分统计量,服从参数是 100,p的二项分布。一般说来,在 为真即生产过程稳定时,
T的值应比较小;而在 不真即生产过程不稳定时,T的值应相对地比较大。因此,我们可以根据 T值的大小来制定检验法则。对样本的每个观测值,当统计量的观测值较大时就拒绝,而当 T较小时就接受 。这就是说,
按照规则
n
i
iXT
1
0H
0H
0H0H
当 时,拒绝原假设;
当 时,接受原假设;
其中 c是一个待定的常数。不同的 c值表示不同的检验,如何确定 c,需要有熟练的计算技巧和丰富的统计思想,我们称 T为检验统计量; c为检验临界值; 为拒绝域;
为接受域。
ct?
tc?
{}W t c {}W T c
两类错误每一个检验都会不同程度地犯两类错误。
上面例子中,原假设本来正确,由于样本的随机性,检验统计量的观测值落入了拒绝域,就拒绝原假设,这时称假设检验过程中犯了第一类错误,也称,弃真错误,;原假设本来不正确,由于样本的随机性,检验统计量的观测值落入了接受域,就接受原假设,这时称假设检验过程中犯了第二类错误,也称,存伪错误,。
一个检验的好坏可由犯这两类错误的概率来度量。常把犯第一类错误的概率记为,犯第二类错误的概率记为 。由于它们常依赖于总体中未知参数,故又常记为 。
上面例子中
( ) ( )和
100
1
( ) { | 0 0,0 1 }i
i
p P X c p?
100
100
100 ( 1 ) ; 0 0,01
j j j
jc
C p p p?
100
1
1
100
100
0
( ) { | 0,01 1 }
( 1 ) ; 0,01 1
i
i
c
j j j
j
p P X c p
C p p p
可见,犯两类错误的概率均为参数 p的函数。犯第一类错误的概率是的函数;犯第二类错误的概率是的函数。犯两类错误的概率也是 c的函数,c的值越大,犯第一类错误的概率就越小,而犯第二类错误的概率就越大;相反,c的值越小,
犯第一类错误的概率就越大,而犯第二类错误的概率就越小;因此,犯两类错误的概率是相互制约的,
0 0,0 1p
0,0 1 1p
奈曼( Neyman)和皮尔逊( Pearson)提出,
首先控制犯第一类错误的概率,即选定一个数,使得检验中犯第一类错误的概率不超过 。然后,在满足这个约束条件的检验中,寻找犯第二类错误的概率尽可能小的检验。这就是假设检验理论中的奈曼 -皮尔逊原则。
寻找犯第二类错误的概率尽可能小的检验,在理论和计算中都并非容易。为简单起见,在样本容量 n固定时,我们着重对犯第一类错误的概率加以控制,适当考虑犯第二类错误的概率的大小。称控制犯第一类错误的概率不超过的检验为显著性检验。称 为显著性水平
(0 1 )
假设检验的一般步骤
( 1)根据实际问题提出原假设和备择假设;
( 2)确定检验统计量T;
( 3)取适当的显著性水平,并由显著性水平和统计量的分布确定拒绝域W,使得检验中犯第一类错误的概率的最大值尽可能的接近,特别在总体为连续型总体时,
往往要使它等于,拒绝域有单侧和双侧两种形式.
( 4)由样本观测值算得统计量的观测值,并与拒绝域中临界值比较,如果观测值落入拒绝域,则拒绝原假设,否则接受原假设.
}|{s u p 0 为真HWTP?