第七章 假设检验第一节 假设检验基本原理第二节 总体均值、比例和方差的假设检验第三节 假设检验中的其他问题第一节 假设检验的基本原理一,假设检验的概念二,假设检验的步骤三,假设检验中的小概率原理四,假设检验中的两类错误五,双侧检验和单侧检验假设检验的概念与思想什么是假设?
对总体参数的一种看法
–总体参数包括 总体均值,
比例,方差 等
–分析 之前 必需陈述什么是假设检验?
1,概念
– 事先对总体参数或分布形式作出某种假设
– 然后利用样本信息来判断原假设是否成立
2,类型
– 参数假设检验
– 非 参数假设检验
3,特点
– 采用逻辑上的反证法
– 依据统计上的小概率原理假设检验的基本思想
..,因此我们拒绝假设? = 20
..,如果这是总体的真实均值样本均值? = 50
抽样分布
H0
这个值不像我们应该得到的样本均值,..
20
假设检验的过程
(提出假设 → 抽取样本 → 作出决策)
总体

抽取随机样本均值
X = 20
我认为人口的平均年龄是 50岁提出假设拒绝假设 !
别无选择,
作出决策假设检验的步骤
提出原假设和备择假设
确定适当的检验统计量
规定显著性水平?
计算检验统计量的值
作出统计决策提出原假设和备择假设
什么是原假设? (Null Hypothesis)
1,待检验的假设,又称,0假设,
2,如果错误地作出决策会导致一系列后果
3,总是有等号?,? 或
4,表示为 H0
– H0, 某一数值
– 指定为 = 号,即? 或
– 例如,H0, 3190(克)
为什么叫 0
假设
什么是备择假设? (Alternative
Hypothesis)
1,与原假设对立的假设
2,总是有不等号,?, 或?
3,表示为 H1
– H1,? <某一数值,或某一数值
– 例如,H1,? < 3910(克 ),或3910(克 )
提出原假设和备择假设
什么检验统计量?
1,用于假设检验问题的统计量
2,选择统计量的方法与参数估计相同,需考虑
1,是大样本还是小样本
2,总体方差已知还是未知
3,检验统计量的基本形式为确定适当的检验统计量
n
xz
0
规定显著性水平?
什么是显著性水平?
1,是一个概率值
2,原假设为真时,拒绝原假设的概率
–被称为抽样分布的拒绝域
3,表示为(alpha)
–常用的值有 0.01,0.05,0.10
4,由研究者事先确定作出统计决策
1,计算检验的统计量
2,根据给定的显著性水平?,查表得出相应的临界值 Z?或 Z?/2
3,将检验统计量的值与?水平的临界值进行比较
4,得出接受或拒绝原假设的结论假设检验中的小概率原理假设检验中的小概率原理
什么是小概率?
1,在一次试验中,一个几乎不可能发生的事件发生的概率
2,在一次试验中小概率事件一旦发生,
我们就有理由拒绝原假设
3,小概率由研究者事先确定假设检验中的两类错误
(决策风险)
假设检验中的两类错误
1,第一类错误(弃真错误)
–原假设为真时拒绝原假设
–会产生一系列后果
–第一类错误的概率为?
被称为显著性水平
2,第二类错误(取伪错误)
–原假设为假时接受原假设
–第二类错误的概率为(Beta)
H0,无罪假设检验中的两类错误
(决策结果)
陪审团审判裁决实际情况无罪 有罪无罪 正确 错误有罪 错误 正确
H0 检验决策实际情况
H0为真 H0为假接受 H0 1 -? 第二类错 误 (?)
拒绝 H0 第一类错 误 (?) 功效 (1-?)
假设检验就好像一场审判过程统计检验过程
错误和? 错误的关系
你不能同时减少两类错误 !
和?的关系就像翘翘板,?小?就大,?大?就小影响? 错误的因素
1,总体参数的真值
随着假设的总体参数的减少而增大
2,显著性水平?
当? 减少时增大
3,总体标准差?
当? 增大时增大
4,样本容量 n
当 n 减少时增大双侧检验和单侧检验双侧检验与单侧检验
(假设的形式 )
假设研究的问题双侧检验 左侧检验 右侧检验
H0=?000
H1≠?0<?0>?0
双侧检验
(原假设与备择假设的确定)
1.双侧检验属于 决策中的假设检验 。 也就是说,
不论是拒绝 H0还是接受 H0,我们都必需采取相应的行动措施
2.例如,某种零件的尺寸,要求其平均长度为
10厘米,大于或小于 10厘米均属于不合格
3.建立的原假设与备择假设应为
H0, 10 H1, 10
双侧检验
(确定假设的步骤)
1,例如问题为,检验该企业生产的零件平均长度为 4厘米
2,步骤
–从统计角度陈述问题 (? = 4)
–从统计角度提出相反的问题 ( 4)
必需互斥和穷尽
–提出原假设 (? = 4)
–提出备择假设 ( 4)
有? 符号
提出原假设,H0,? = 4
提出备择假设,H1, 4
该企业生产的零件平均长度是 4厘米吗?
(属于决策中的假设 )
双侧检验
(例子)
双侧检验
(显著性水平与拒绝域 )
抽样分布
H0值 临界值临界值
/2?/2
样本统计量拒绝域 拒绝域接受域
1 -?
置信水平双侧检验
(显著性水平与拒绝域 )
H0值 临界值临界值
/2?/2
样本统计量拒绝域 拒绝域接受域抽样分布
1 -?
置信水平双侧检验
(显著性水平与拒绝域 )
H0值 临界值临界值
/2?/2
样本统计量拒绝域 拒绝域接受域抽样分布
1 -?
置信水平双侧检验
(显著性水平与拒绝域 )
H0值 临界值临界值
/2?/2
样本统计量拒绝域 拒绝域接受域抽样分布
1 -?
置信水平单侧检验
(原假设与备择假设的确定)
检验 研究中的假设
1,将所研究的假设作为备择假设 H1
2,将认为研究结果是无效的说法或理论作为原假设 H0。 或者说,把希望 (想要 )证明的假设作为备择假设
3,先确立备择假设 H1
单侧检验
(原假设与备择假设的确定)
例如,采用新技术生产后,将会使产品的使用寿命明显延长到 1500小时以上
– 属于研究中的假设
– 建立的原假设与备择假设应为
H0, 1500 H1, 1500
例如,改进生产工艺后,会使产品的废品率降低到 2%以下
– 属于研究中的假设
– 建立的原假设与备择假设应为
H0, 2% H1, 2%
单侧检验
(原假设与备择假设的确定)
检验 某项声明的有效性
1,将所作出的说明 (声明 )作为原假设
2,对该说明的质疑作为备择假设
3,先确立原假设 H0
– 除非我们有证据表明,声明,无效,否则就应认为该,声明,是有效的单侧检验
(原假设与备择假设的确定)
例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在 10000小时以上
除非样本能提供证据表明使用寿命在
10000小时以下,否则就应认为厂商的声称是正确的
建立的原假设与备择假设应为
H0, 10000 H1, 10000
提出原假设,H0, 10000
选择备择假设,H1, 10000
该批产品的平均使用寿命超过 10000小时吗?
(属于检验声明的有效性,先提出原假设 )
单侧检验
(例子)
提出原假设,H0, 25
选择备择假设,H1:, 25
学生中经常上网的人数超过 25%吗?
(属于研究中的假设,先提出备择假设)
单侧检验
(例子)
单侧检验
(显著性水平与拒绝域 )
H0值临界值
样本统计量拒绝域接受域抽样分布
1 -?
置信水平左侧检验
(显著性水平与拒绝域 )
H0值临界值
样本统计量拒绝域接受域抽样分布
1 -?
置信水平观察到的样本统计量左侧检验
(显著性水平与拒绝域 )
H0值临界值
样本统计量拒绝域接受域抽样分布
1 -?
置信水平右侧检验
(显著性水平与拒绝域 )
H0值临界值
样本统计量拒绝域接受域抽样分布
1 -?
置信水平观察到的样本统计量右侧检验
(显著性水平与拒绝域 )
H0值临界值
样本统计量接受域抽样分布
1 -?
置信水平拒绝域第二节 一个正态总体的参数检验一,总体方差已知时的均值检验二,总体方差未知时的均值检验三,总体比例的假设检验一个总体的检验
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
均值一个总体比例 方差检验的步骤
陈述原假设 H0
陈述备择假设 H1
选择显著性水平?
选择检验统计量
选择 n
给出临界值
搜集数据
计算检验统计量
进行统计决策
表述决策结果总体方差已知时的均值检验
(双尾 Z 检验 )
一个总体的检验
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
均值一个总体比例 方差均值的双尾 Z 检验
(?2 已知 )
1,假定条件
– 总体服从正态分布
– 若不服从正态分布,可用正态分布来近似
(n?30)
2,原假设为,H0,?=?0; 备择假设为,H1:0
3,使用 z-统计量
)1,0(~0 N
n
xz

均值的双尾 Z 检验
(实例 )
【 例 】 某机床厂加工一种零件,根据经验知道,
该厂加工零件的椭圆度近似服从正态分布,其总体均值为?0=0.081mm,总体标准差为?=
0.025 。 今换一种新机床进行加工,抽取 n=200
个零件进行检验,得到的椭圆度为 0.076mm。
试问新机床加工零件的椭圆度的均值与以前有无显著差异? (?= 0.05)
均值的双尾 Z 检验
( 计算结果)
H0,? = 0.081
H1, 0.081
= 0.05
n = 200
临界值 (s):
检验统计量,
Z0 1.96-1.96
.025
拒绝 H0 拒绝 H0
.025
决策,
结论,
拒绝 H0
有证据表明新机床加工的零件的椭圆度与以前有显著差异
83.2
200025.0
081.0076.00
n
xz
总体方差已知时的均值检验
(单尾 Z 检验 )
均值的单尾 Z 检验
(?2 已知 )
1,假定条件
总体服从正态分布
若不服从正态分布,可以用正态分布来近似 (n?30)
2,备择假设有 <或 >符号
3,使用 z-统计量
)1,0(~0 N
n
x
z

均值的单尾 Z 检验
(提出假设)
左侧,H0:0 H1:<?0
必须是 显著地 低于?0,大的值满足 H0,不能拒绝
Z0
拒绝 H0
右侧,H0:0 H1,>?0
必须 显著地 大于?0,小的值满足 H0,不能拒绝
Z0
拒绝 H0
均值的单尾 Z检验
(实例)
【 例 】 某批发商欲从生产厂家购进一批灯泡,
根据合同规定,灯泡的使用寿命平均不能低于
1000小时 。 已知灯泡使用寿命服从正态分布,
标准差为 20小时 。 在总体中随机抽取 100只灯泡,测得样本均值为 960小时 。 批发商是否应该购买这批灯泡? (?= 0.05)
均值的单尾 Z检验
(计算结果)
H0, 1000
H1,? < 1000
= 0.05
n = 100
临界值 (s):
检验统计量,
在? = 0.05的水平上拒绝 H0
有证据表明这批灯泡的使用寿命低于 1000小时决策,
结论,
2
10020
10009600
n
xz
-1.645 Z0
拒绝域
均值的单尾 Z检验
(实例)
【 例 】 根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布 N~(1020,1002)。
现从最近生产的一批产品中随机抽取 16只,
测得样本平均寿命为 1080小时 。 试在 0.05
的显著性水平下判断这批产品的使用寿命是否有显著提高? (?= 0.05)
均值的单尾 Z检验
(计算结果)
H0, 1020
H1,? > 1020
= 0.05
n = 16
临界值 (s):
检验统计量,
在? = 0.05的水平上拒绝 H0
有证据表明这批灯泡的使用寿命有显著提高决策,
结论,
4.2
141 0 0
1 0 2 01 0 8 00
n
xz
Z0
拒绝域
0.05
1.645
总体方差未知时的均值检验
(双尾 t 检验 )
一个总体的检验
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
均值一个总体比例 方差均值的双尾 t 检验
(?2 未知 )
1,假定条件
– 总体为正态分布
– 如果不是正态分布,只有轻微偏斜和大样本
(n?30)条件下
2,使用 t 统计量
)1(~0 nt
ns
xt?
均值的双尾 t 检验
(实例)
【 例 】 某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,
每包标准重量为 1000克 。
某日随机抽查 9包,测得样本平均重量为 986克,样本标准差为 24克 。 试问在
0.05的显著性水平上,能否认为这天自动包装机工作正常?
属于决策中的假设!
均值的双尾 t 检验
(计算结果)
H0,? = 1000
H1, 1000
= 0.05
df = 9 - 1 = 8
临界值 (s):
检验统计量,
在? = 0.05的水平上接受 H0
有证据表明这天自动包装机工作正常决策:
结论:
75.1
924
1 0 0 09 8 60
ns
xt?
t0 2.306-2.306
.025
拒绝 H0 拒绝 H0
.025
总体方差未知时的均值检验
(单尾 t 检验 )
均值的单尾 t 检验
(实例)
【 例 】 一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下 大于 40000公里,对一个由 20个轮胎组成的随机样本作了试验,测得平均值为 41000
公里,标准差为 5000公里 。 已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符? (? = 0.05)
属于检验声明有效性的假设!
均值的单尾 t 检验
(计算结果)
H0, 40000
H1,? < 40000
= 0.05
df = 20 - 1 = 19
临界值 (s):
检验统计量,
在? = 0.05的水平上接受 H0
有证据表明轮胎使用寿命显著地大于 40000公里决策,
结论,
8 94.0
205 00 0
4 00 0 04 10 0 0
0
ns
x
t
-1.7291 t0
拒绝域
.05
总体比例的假设检验
( Z 检验)
适用的数据类型离散数据 连续数据数值型数据数 据品质数据一个总体的检验
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
均值一个总体比例 方差一个总体比例的 Z 检验
1,假定条件
– 有两类结果
– 总体服从二项分布
– 可用正态分布来近似
2,比例检验的 z 统计量
P0为假设的总体比例
)1,0(~
)1(
00
0 N
n
pp
pp
z
一个总体比例的 Z 检验
(实例)
【 例 】 某研究者估计本市居民家庭的电脑拥有率为 30%。 现随机抽查了 200的家庭,其中
68个家庭拥有电脑 。 试问研究者的估计是否可信? (? = 0.05)
属于决策中的假设!
一个样本比例的 Z 检验
(结果)
H0,p = 0.3
H1,p? 0.3
= 0.05
n = 200
临界值 (s):
检验统计量,
在? = 0.05的水平上接受 H0
有证据表明研究者的估计可信决策,
结论,
234.1
200
7.03.0
3.034.0
)1(
00
0
n
pp
pp
z
Z0 1.96-1.96
.025
拒绝 H0 拒绝 H0
.025
总体方差的检验
(?2 检验 )
一个总体的检验
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
均值一个总体比例 方差方差的卡方 (?2) 检验
1,检验一个总体的方差或标准差
2,假设总体近似服从正态分布
3,原假设为 H0,?2 =?02
4,检验统计量样本方差假设的总体方差
)1(~)1( 22
0
2
2 nsn?
卡方 (?2)检验实例
【 例 】 根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为 0.0025。 现从某日产品中随机抽取 20根,测得样本方差为 0.0042。 试判断该日纤度的波动与平日有无显著差异? (0.05 )
属于决策中的假设!
卡方 (?2) 检验计算结果
H0,?2 = 0.0025
H1,?2? 0.0025
= 0.05
df = 20 - 1 = 19
临界值 (s):
统计量,
在? = 0.05的水平上接受 H0
有证据表明该日纤度的波动比平时没有显著差异?20 32.8528.907
/2 =.05
决策,
结论,
92.31
0 0 2 5.0
0 0 4 2.0)120(
)1(
2
0
2
2
sn
第三节 假设检验中的其他问题
用置信区间进行检验二,利用 P - 值进行检验利用置信区间进行假设检验利用置信区间进行假设检验
(双侧检验)
1,求出双侧检验均值的置信区间
2已知时:

n
zx
n
zx 22,
2未知时:

n
stx
n
stx nn 1
2
1
2,
2,若总体的假设值?0在置信区间外,拒绝 H0
利用置信区间进行假设检验
(左侧检验)
n
stx
n
zx n 1 或
1,求出单边置信下限
2,若总体的假设值?0小于单边置信下限,拒绝 H0
利用置信区间进行假设检验
(右侧检验)
1,求出单边置信上限
2,若总体的假设值?0大于单边置信上限,拒绝 H0
n
stx
n
zx n 1 或利用置信区间进行假设检验
(例子 )
【 例 】 一种袋装食品每包的标准重量应为 1000克 。 现从生产的一批产品中随机抽取 16袋,
测得其平均重量为 991克 。 已知这种产品重量服从标准差为
50克的正态分布 。 试确定这批产品的包装重量是否合格? (?
= 0.05)
属于决策的假设!
香脆蛋卷利用置信区间进行假设检验
( 计算结果)
H0,? = 1000
H1, 1000
= 0.05
n = 49
临界值 (s):
置信区间为决策,
结论,
假设的?0?=1000在置信区间内,接受 H0
表明这批产品的包装重量合格
( )5.1015,5.966
16
50
96.1991,
16
50
96.1991
,
22

n
zx
n
zx

Z0 1.96-1.96
.025
拒绝 H0 拒绝 H0
.025
利用 P-值进行假设检验什么是 P 值?
( P-Value)
1,是一个概率值
2,如果我们假设原假设为真,P-值是观测到的样本均值不同于 (?或?)?实测值的概率
– 左侧检验时,P-值为曲线上方 小于等于 检验统计量部分的面积
– 右侧检验时,P-值为曲线上方 大于等于 检验统计量部分的面积
3,被称为观察到的 (或实测的 )显著性水平
– H0 能被拒绝的?的最小值利用 P 值进行决策
1,单侧检验
– 若 p-值,不能拒绝 H0
– 若 p-值 <?,拒绝 H0
2,双侧检验
– 若 p-值/2,不能拒绝 H0
– 若 p-值 <?/2,拒绝 H0
双尾 Z 检验
(P-值计算实例 )
【 例 】 欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为 368克 。 现从某天生产的一批食品中随机抽取 25盒进行检查,
测得每盒的平均重量为?x
= 372.5克 。 企业规定每盒重量的标准差?为 15克 。
确定 P - 值 。
368 克欣欣儿童食品厂双尾 Z 检验
(P-值计算结果 )
样本统计量的 Z值
(观察到的)
计算的检验统计量为:
5.1
2515
3 6 85.3 7 20
n
xZ
0 1.50-1.50 Z
双尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? -1.50 或 Z? 1.50)
样本统计量的 Z值
(观察到的)
0 1.50-1.50 Z
双尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? -1.50 或 Z? 1.50)
样本统计量的 Z值
(观察到的)
0 1.50-1.50 Z
1/2 p-值1/2 p-值双尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? -1.50 或 Z? 1.50)
从 Z分布表查找 1.50
样本统计量的 Z值
(观察到的)
注,0.9332 - 0.5
= 0.4332
0 1.50-1.50 Z
1/2 p-值1/2 p-值
.4332
双尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? -1.50 或 Z? 1.50)
从 Z分布表查找 1.50
样本统计量的 Z值
(观察到的)
0.5000-0.4332
= 0.06680
1.50-1.50 Z
1/2 p-值1/2 p-值
.4332
双尾 Z 检验
(P-值计算结果 )
0 1.50-1.50 Z
1/2 p-值 =,06681/2 p-值 =,0668
1/2? =,0251/2? =,025
拒绝 拒绝双尾 Z 检验
(P-值计算结果 )
2p = 0.1336 = 0.05,不能拒绝 H0
检验统计量未在拒绝区域
0 1.50-1.50 Z
1/2 p-值 =,06681/2 p-值 =,0668
1/2? =,0251/2? =,025
拒绝 拒绝单尾 Z 检验
(P-值计算结果 )
【 例 】 欣欣儿童食品厂生产的某种盒装儿童食品,规定每盒的重量 不低于 368克 。
现从某天生产的一批食品中随机抽取 25盒进行检查,测得每盒的平均重量为
x=372.5克 。 企业规定每盒重量的标准差?为 15克 。
确定 P-值 。
368 克欣欣儿童食品厂单尾 Z 检验
(P-值计算结果 )
样本统计量的 Z值计算的检验统计量为:
5.1
2515
3 6 85.3 7 20
n
xZ
0 1.50-1.50 Z
双尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? -1.50 或 Z? 1.50)
从 Z分布表查找 1.50
样本统计量的 Z值
(观察到的)
1.50-1.50
注,0.9332 - 0.5
= 0.4332
0 Z
1/2 p-值1/2 p-值
.4332
单尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? 1.50)
样本统计量的 Z值
用备择假设找出方向
0 1.50 Z
P-值单尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? 1.50)
样本统计量的 Z值
用备择假设找出方向
从 Z分布表
:查找 1.50
0 1.50 Z
P-值
.4332
单尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? 1.50)
样本统计量的 Z值
用备择假设找出方向
从 Z分布表
:查找 1.50
0.5000-0.4332
= 0.0668
0 1.50 Z
P-值
.4332
单尾 Z 检验
(P-值计算结果 )
p-值为 P(Z? 1.50)=.0668
样本统计量的 Z值
用备择假设找出方向
从 Z分布表
:查找 1.50
0.5000-0.4332
= 0.0668
0 1.50 Z
.4332
P-值
.0668
单尾 Z 检验
(P-值计算结果 )
0 1.50 Z
1 p-值 =,0668
=,05
拒绝单尾 Z 检验
(P-值计算结果 )
检验统计量未在拒绝区域
(p-值 =0,0668)? (? =,05),不能拒绝 H0
0 1.50 Z
1 p-值 =,0668
=,05
拒绝