数理统计假设检验的基本思想和方法假设检验的一般步骤假设检验的两类错误课堂练习小结 布置作业第一节 假设检验数理统计假设检验
参数假设检验非参数假设检验这类问题称作假设检验问题,
总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题,这就是 根据样本的信息检验关于总体的某个假设是否正确,
一、假设检验的基本思想和方法数理统计让我们先看一个例子,
这一章我们讨论对参数的假设检验,
数理统计生产流水线上罐装可乐不断地封装,然后装箱外运,怎么知道这批罐装可乐的容量是否合格呢?
把每一罐都打开倒入量杯,看看容量是否合于标准,
这样做显然不行!
罐装可乐的容量按标准应在
350毫升和 360毫升之间,
数理统计每隔一定时间,抽查若干罐,如每隔 1小时,抽查 5罐,得 5个容量的值 X1,…,X5,根据这些值来判断生产是否正常,
如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量,
通常的办法是进行抽样检查,
数理统计很明显,不能由 5罐容量的数据,在把握不大的情况下就判断生产 不正常,因为停产的损失是很大的,
当然也不能总认为正常,有了问题不能及时发现,这也要造成损失,
如何处理这两者的关系,假设检验面对的就是这种矛盾,
数理统计在正常生产条件下,由于种种随机因素的影响,
每罐可乐的容量应在 355毫升上下波动,这些因素中没有哪一个占有特殊重要的地位,因此,根据中心极限定理,假定每罐容量服从正态分布是合理的,
现在我们就来讨论这个问题,
罐装可乐的容量按标准应在
350毫升和 360毫升之间,
数理统计它的对立假设是:
称 H0为原假设 (或零假设,解消假设);
称 H1为备选假设 (或对立假设),
在实际工作中,
往往把不轻易否定的命题作为原假设,
0
H0,( = 355)
0?
H1:
0
这样,我们可以认为 X1,…,X5是取自正态总体 的样本,
),( 2N
是一个常数,2?
当生产比较稳定时,
现在要检验的假设是:
数理统计那么,如何判断原假设 H0 是否成立呢?
较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?
由于 是正态分布的期望值,它的估计量是样本均值,因此 可以根据 与 的差距X X
0?
来判断 H0 是否成立,X - ||
0?
较小时,可以认为 H0是成立的;当 X - || 0?
生产已不正常,
当 较大时,应认为 H0不成立,即- |X|
0?
数理统计问题归结为对差异作定量的分析,以确定其性质,
差异可能是由抽样的随机性引起的,称为
“抽样误差”或 随机误差这种误差反映偶然、非本质的因素所引起的随机波动,
数理统计然而,这种随机性的波动是有一定限度的,
如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了,
必须认为这个差异反映了事物的本质差别,即反映了生产已不正常,
这种差异称作,系统误差”
数理统计问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?
即差异是“抽样误差”还是“系统误差”所引起的?
这里需要给出一个量的界限,
数理统计问题是:如何给出这个量的界限?
这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验中基本上不会发生,
数理统计现在回到我们前面罐装可乐的例中:
在提出原假设 H0后,如何作出接受和拒绝 H0的结论呢?
在假设检验中,我们称这个小概率为 显著性水平,用 表示,?
常取的选择要根据实际情况而定。
.05.0,01.0,1.0
数理统计罐装可乐的容量按标准应在 350毫升和 360毫升之间,一批可乐出厂前应进行抽样检查,现抽查了 n 罐,测得容量为 X1,X2,…,Xn,问这一批可乐的容量是否合格?
数理统计提出假设选检验统计量
n
XU
0 ~ N(0,1)
}|{| 2uUP
H0,= 355 H1,≠ 355
由于 已知,?
它能衡量差异 大小且分布已知,||
0X
对给定的显著性水平,可以在 N(0,1)表中查到分位点的值,使
2?u
数理统计故我们可以取拒绝域为,
也就是说,“
2||?uU?
”是一个小概率事件,
W:
2||?uU?
如果由样本值算得该统计量的实测值落入区域
W,则拒绝 H0 ;否则,不能拒绝 H0,
}|{| 2uUP
数理统计如果 H0 是对的,那么衡量差异大小的某个统计量落入区域 W(拒绝域 ) 是个小概率事件,如果该统计量的实测值落入 W,也就是说,H0 成立下的小概率事件发生了,那么就认为 H0不可信而否定它,否则我们就不能否定 H0 (只好接受它),
这里所依据的逻辑是:
数理统计不否定 H0并不是肯定 H0一定对,而只是说差异还不够显著,还没有达到足以否定 H0
的程度,
所以假设检验又叫
“显著性检验,
数理统计如果显著性水平 取得很小,则拒绝域也会比较小,
其产生的后果是:
H0难于被拒绝,
如果在 很小的情况下 H0
仍被拒绝了,则说明实际情况很可能与之有显著差异,
01.0
基于这个理由,人们常把 时拒绝 H0称为是 显著 的,而把在 时拒绝 H0称为是 高度显著 的,
05.0
数理统计在上面的例子的叙述中,我们已经初步介绍了假设检验的基本思想和方法,
下面,我们再结合另一个例子,进一步说明假设检验的一般步骤,
二、假设检验的一般步骤数理统计例 2 某工厂生产的一种螺钉,标准要求长度是 32.5
毫米,实际生产的产品,其长度 X 假定服从正态分布未知,现从该厂生产的一批产品中抽取 6件,得尺寸数据如下,
),,( 2N 2?
32.56,29.66,31.64,30.00,31.87,31.03
问这批产品是否合格?
…
分析:这批产品 (螺钉长度 )的全体组成问题的总体 X,现在要 检验 E(X)是否为 32.5.
数理统计提出原假设和备择假设
5.32:5.32,10 HH
第一步:
已知 X~ ),,( 2N 2? 未知,
第二步:
能衡量差异大小且分布已知取一检验统计量,在 H0成立下求出它的分布
)5(~
6
5.32 t
S
Xt
数理统计第三步:
即,”是一个小概率事件,)5(||
2?tt?
小概率事件在一次试验中基本上不会发生,
对给定的显著性水平 =0.01,查表确定临界值
0 3 2 2.4)5()5( 005.02 tt?
,使
)}5(|{| 2ttP
得否定域 W,|t |>4.0322
数理统计得否定域 W,|t |>4.0322
故不能拒绝 H0,
第四步,
将样本值代入算出统计量 t 的实测值,
| t |=2.997<4.0322 没有落入拒绝域这并不意味着 H0一定对,只是差异还不够显著,不足以否定 H0,
数理统计假设检验会不会犯错误呢?
由于作出结论的依据是下述小概率原理小概率事件在一次试验中 基本上 不会发生,
不是一定不发生三、假设检验的两类错误数理统计如果 H0成立,但统计量的实测值落入否定域,从而作出否定 H0的结论,那就犯了“以真为假”的错误,
如果 H0不成立,但统计量的实测值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的 H0,那就犯了“以假为真”的错误,
请看下表数理统计假设检验的两类错误
H0为真实际情况决定拒绝 H0
接受 H0
H0不真第一类错误 正确正确 第二类错误
P{拒绝 H0|H0为真 }=,
P{接受 H0|H0不真 }=,
犯两类错误的概率,
显著性水平 为犯第一类错误的概率,
数理统计两类错误的概率的关系两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加,
要同时降低两类错误的概率 或者要在 不变的条件下降低,需要增加样本容量,
,
请看演示数理统计假设检验和区间估计的关系请看演示假设检验和区间估计数理统计单、双侧检验前面一例的检验,拒绝域取在两侧,称为双侧检验,
下面看一个单侧检验的例子,
想了解单双侧检验的区别,请看演示,
单双侧检验数理统计例 3 某工厂生产的固体燃料推进器的燃烧率服从正态分布
./2,/40),,( 2 scmscmN
现在用新方法生产了一批推进器。从中随机取
n=25只,测得燃烧率的样本均值为
./25.41 scmx?
设在新方法下总体均方差仍为 2cm/s,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著性水平,05.0
数理统计代入 =2,n=25,并由样本值计算得 统计?
量 U的实测值
U=3.125>1.645
故拒绝 H0,即认为这批推进器的燃料率较以往生产的有显著的提高。
落入否定域解,提出假设,0100,40, HH
6 45.105.00 U
n
xU
取统计量否定域为 W,
05.0UU?
=1.645
数理统计某织物强力指标 X的均值 =21公斤,改进工艺后生产一批织物,今从中取 30件,测得 =21.55公斤,假设强力指标服从正态分布 且已知 =1.2公斤,问在显著性水平 =0.01 下,新生产织物比过去的织物强力是否有提高?
0?
X
),,( 2N
四、课堂练习数理统计代入 =1.2,n=30,并由样本值计算得 统计?
量 U 的实测值
U=2.51>2.33
故拒绝原假设 H0,即新生产织物比过去的织物的强力有提高。
落入否定域解,提出假设,21:21,10 HH
)1,0(~21 N
n
XU
取统计量否定域为 W,
01.0uU?
=2.33
数理统计提出假设根据统计调查的目的,提出原假设 H0 和备选假设 H1
作出决策抽取样本检验假设对差异进行定量的分析,
确定其性质 (是随机误差还是系统误差,为给出两者界限,找一检验统计量 T,
在 H0成立下其分布已知,)
拒绝还是不能拒绝 H0
显著性水平
P(T W)=
-----犯第一类错误的概率,
W为拒绝域
五
、
小结数理统计六、布置作业概率论与数理统计标准化作业 (七 )
参数假设检验非参数假设检验这类问题称作假设检验问题,
总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题在本节中,我们将讨论不同于参数估计的另一类重要的统计推断问题,这就是 根据样本的信息检验关于总体的某个假设是否正确,
一、假设检验的基本思想和方法数理统计让我们先看一个例子,
这一章我们讨论对参数的假设检验,
数理统计生产流水线上罐装可乐不断地封装,然后装箱外运,怎么知道这批罐装可乐的容量是否合格呢?
把每一罐都打开倒入量杯,看看容量是否合于标准,
这样做显然不行!
罐装可乐的容量按标准应在
350毫升和 360毫升之间,
数理统计每隔一定时间,抽查若干罐,如每隔 1小时,抽查 5罐,得 5个容量的值 X1,…,X5,根据这些值来判断生产是否正常,
如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量,
通常的办法是进行抽样检查,
数理统计很明显,不能由 5罐容量的数据,在把握不大的情况下就判断生产 不正常,因为停产的损失是很大的,
当然也不能总认为正常,有了问题不能及时发现,这也要造成损失,
如何处理这两者的关系,假设检验面对的就是这种矛盾,
数理统计在正常生产条件下,由于种种随机因素的影响,
每罐可乐的容量应在 355毫升上下波动,这些因素中没有哪一个占有特殊重要的地位,因此,根据中心极限定理,假定每罐容量服从正态分布是合理的,
现在我们就来讨论这个问题,
罐装可乐的容量按标准应在
350毫升和 360毫升之间,
数理统计它的对立假设是:
称 H0为原假设 (或零假设,解消假设);
称 H1为备选假设 (或对立假设),
在实际工作中,
往往把不轻易否定的命题作为原假设,
0
H0,( = 355)
0?
H1:
0
这样,我们可以认为 X1,…,X5是取自正态总体 的样本,
),( 2N
是一个常数,2?
当生产比较稳定时,
现在要检验的假设是:
数理统计那么,如何判断原假设 H0 是否成立呢?
较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?
由于 是正态分布的期望值,它的估计量是样本均值,因此 可以根据 与 的差距X X
0?
来判断 H0 是否成立,X - ||
0?
较小时,可以认为 H0是成立的;当 X - || 0?
生产已不正常,
当 较大时,应认为 H0不成立,即- |X|
0?
数理统计问题归结为对差异作定量的分析,以确定其性质,
差异可能是由抽样的随机性引起的,称为
“抽样误差”或 随机误差这种误差反映偶然、非本质的因素所引起的随机波动,
数理统计然而,这种随机性的波动是有一定限度的,
如果差异超过了这个限度,则我们就不能用抽样的随机性来解释了,
必须认为这个差异反映了事物的本质差别,即反映了生产已不正常,
这种差异称作,系统误差”
数理统计问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?
即差异是“抽样误差”还是“系统误差”所引起的?
这里需要给出一个量的界限,
数理统计问题是:如何给出这个量的界限?
这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验中基本上不会发生,
数理统计现在回到我们前面罐装可乐的例中:
在提出原假设 H0后,如何作出接受和拒绝 H0的结论呢?
在假设检验中,我们称这个小概率为 显著性水平,用 表示,?
常取的选择要根据实际情况而定。
.05.0,01.0,1.0
数理统计罐装可乐的容量按标准应在 350毫升和 360毫升之间,一批可乐出厂前应进行抽样检查,现抽查了 n 罐,测得容量为 X1,X2,…,Xn,问这一批可乐的容量是否合格?
数理统计提出假设选检验统计量
n
XU
0 ~ N(0,1)
}|{| 2uUP
H0,= 355 H1,≠ 355
由于 已知,?
它能衡量差异 大小且分布已知,||
0X
对给定的显著性水平,可以在 N(0,1)表中查到分位点的值,使
2?u
数理统计故我们可以取拒绝域为,
也就是说,“
2||?uU?
”是一个小概率事件,
W:
2||?uU?
如果由样本值算得该统计量的实测值落入区域
W,则拒绝 H0 ;否则,不能拒绝 H0,
}|{| 2uUP
数理统计如果 H0 是对的,那么衡量差异大小的某个统计量落入区域 W(拒绝域 ) 是个小概率事件,如果该统计量的实测值落入 W,也就是说,H0 成立下的小概率事件发生了,那么就认为 H0不可信而否定它,否则我们就不能否定 H0 (只好接受它),
这里所依据的逻辑是:
数理统计不否定 H0并不是肯定 H0一定对,而只是说差异还不够显著,还没有达到足以否定 H0
的程度,
所以假设检验又叫
“显著性检验,
数理统计如果显著性水平 取得很小,则拒绝域也会比较小,
其产生的后果是:
H0难于被拒绝,
如果在 很小的情况下 H0
仍被拒绝了,则说明实际情况很可能与之有显著差异,
01.0
基于这个理由,人们常把 时拒绝 H0称为是 显著 的,而把在 时拒绝 H0称为是 高度显著 的,
05.0
数理统计在上面的例子的叙述中,我们已经初步介绍了假设检验的基本思想和方法,
下面,我们再结合另一个例子,进一步说明假设检验的一般步骤,
二、假设检验的一般步骤数理统计例 2 某工厂生产的一种螺钉,标准要求长度是 32.5
毫米,实际生产的产品,其长度 X 假定服从正态分布未知,现从该厂生产的一批产品中抽取 6件,得尺寸数据如下,
),,( 2N 2?
32.56,29.66,31.64,30.00,31.87,31.03
问这批产品是否合格?
…
分析:这批产品 (螺钉长度 )的全体组成问题的总体 X,现在要 检验 E(X)是否为 32.5.
数理统计提出原假设和备择假设
5.32:5.32,10 HH
第一步:
已知 X~ ),,( 2N 2? 未知,
第二步:
能衡量差异大小且分布已知取一检验统计量,在 H0成立下求出它的分布
)5(~
6
5.32 t
S
Xt
数理统计第三步:
即,”是一个小概率事件,)5(||
2?tt?
小概率事件在一次试验中基本上不会发生,
对给定的显著性水平 =0.01,查表确定临界值
0 3 2 2.4)5()5( 005.02 tt?
,使
)}5(|{| 2ttP
得否定域 W,|t |>4.0322
数理统计得否定域 W,|t |>4.0322
故不能拒绝 H0,
第四步,
将样本值代入算出统计量 t 的实测值,
| t |=2.997<4.0322 没有落入拒绝域这并不意味着 H0一定对,只是差异还不够显著,不足以否定 H0,
数理统计假设检验会不会犯错误呢?
由于作出结论的依据是下述小概率原理小概率事件在一次试验中 基本上 不会发生,
不是一定不发生三、假设检验的两类错误数理统计如果 H0成立,但统计量的实测值落入否定域,从而作出否定 H0的结论,那就犯了“以真为假”的错误,
如果 H0不成立,但统计量的实测值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的 H0,那就犯了“以假为真”的错误,
请看下表数理统计假设检验的两类错误
H0为真实际情况决定拒绝 H0
接受 H0
H0不真第一类错误 正确正确 第二类错误
P{拒绝 H0|H0为真 }=,
P{接受 H0|H0不真 }=,
犯两类错误的概率,
显著性水平 为犯第一类错误的概率,
数理统计两类错误的概率的关系两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加,
要同时降低两类错误的概率 或者要在 不变的条件下降低,需要增加样本容量,
,
请看演示数理统计假设检验和区间估计的关系请看演示假设检验和区间估计数理统计单、双侧检验前面一例的检验,拒绝域取在两侧,称为双侧检验,
下面看一个单侧检验的例子,
想了解单双侧检验的区别,请看演示,
单双侧检验数理统计例 3 某工厂生产的固体燃料推进器的燃烧率服从正态分布
./2,/40),,( 2 scmscmN
现在用新方法生产了一批推进器。从中随机取
n=25只,测得燃烧率的样本均值为
./25.41 scmx?
设在新方法下总体均方差仍为 2cm/s,问这批推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?取显著性水平,05.0
数理统计代入 =2,n=25,并由样本值计算得 统计?
量 U的实测值
U=3.125>1.645
故拒绝 H0,即认为这批推进器的燃料率较以往生产的有显著的提高。
落入否定域解,提出假设,0100,40, HH
6 45.105.00 U
n
xU
取统计量否定域为 W,
05.0UU?
=1.645
数理统计某织物强力指标 X的均值 =21公斤,改进工艺后生产一批织物,今从中取 30件,测得 =21.55公斤,假设强力指标服从正态分布 且已知 =1.2公斤,问在显著性水平 =0.01 下,新生产织物比过去的织物强力是否有提高?
0?
X
),,( 2N
四、课堂练习数理统计代入 =1.2,n=30,并由样本值计算得 统计?
量 U 的实测值
U=2.51>2.33
故拒绝原假设 H0,即新生产织物比过去的织物的强力有提高。
落入否定域解,提出假设,21:21,10 HH
)1,0(~21 N
n
XU
取统计量否定域为 W,
01.0uU?
=2.33
数理统计提出假设根据统计调查的目的,提出原假设 H0 和备选假设 H1
作出决策抽取样本检验假设对差异进行定量的分析,
确定其性质 (是随机误差还是系统误差,为给出两者界限,找一检验统计量 T,
在 H0成立下其分布已知,)
拒绝还是不能拒绝 H0
显著性水平
P(T W)=
-----犯第一类错误的概率,
W为拒绝域
五
、
小结数理统计六、布置作业概率论与数理统计标准化作业 (七 )