第二节 单变量推论统计
? 推论统计就是利用样本的统
计值对总体的参数值进行估计
的方法,
推论统计的内容主要包括
两个方面,
区间估计 和 假设检验
一,区间估计 (Interval Estimation)
1,区间估计的概念
区间估计是指在一定的可信度 (置信度 )下,用样本
统计值的某个范围 (置信区间 )来“框”住总体的参数值,
范围的大小反映的是这种估计的精确性问题,而可
信度高低反映的则是这种估计 可靠性或把握性 的问题,
区间估计的结果通常可以采取下述方式来表述,我
们有 95%的把握认为,全市职工的月收入在 182元至 218
元之间,或者“全市人口中,女性占 50%至 52%的可能性为
99%.
区间估计中的可靠性或把握性是指用
某个区间去估计总体参数值时,成功的可能
性有多大,
? 它可以这样来解释,如果从这个总体中重复抽样
100次,约有 95%次所抽 样本的统计值都落 在这个区间,
说明这个区间估计的可靠性为 95%.
对于同一总体和同一抽样规模来说
①所给区间的大小与做出这种估计所具有的把握性形
成正比,
② 区间大小所体现的是估计的精确性,区间越大,精确
性程度越低,区间越小精确性越高,二者成反比,
③ 从精确性出发,要求所估计的区间越
小越好,从把握性出发,要求所估计的区间越大
越好,因此人们总是需要在这二者之间进行平
衡和选择,
在社会统计中,常用的置信度分别为 90%,
95%和 99%.与他们所对应的允许误差 (α)分别
为 10%,5%和 1%.在计算中,置信度常用 1-α来
表示,
以下我们分别介绍总体均值,和总体百分
比的区间估计方法
2.总体均值的区间估计
总体均值的区间估计公式,
X ± Z (1-α)
其中 X为样本平均数,S为样本标准差,Z(1-α) 为置
信度是 1- α所对应的 Z 值, n为样本规模,
计算练习,
调查某单位的工资情况,随机抽取 900名工人作
为样本,调查得到他们的月平均工资为 186元,标准
差为 42元,求 95%得置信度下,全单位职工的月平均
工资的置信区间是多少,
S
√n
(解 ) 将调查资料带入总体均值的
区间估计公式得,
? 186± Z (1- 0.05)
? 查表得 Z (1- 0.05) = 1.96
所以,总体均值的置信区间为,
186± 1.96× 得 183.26 — 188.74元
当我们希望提高估计的可靠性时就必须相
应扩大置信区间,比如我们将置信度提高到
99%时,那么,上例中得置信区间又是多大呢?
42
√900
42
√900
Z 检验表
│ Z │≥
P ≤
一端 二端
0,1 0 1,2 9 1,6 5
0,0 5 1,6 5 1,9 6
0,0 2 2,0 6 2,3 3
0,0 1 2,3 3 2,5 8
3.总体百分数的区间估计
总体百分数的区间估计公式为,
P± Z( 1- α)
这里,P为样本的百分比 。
例题:
从某工厂随机抽取 400名工人进行调查,结
果表明女工的比例为 20%现在要求在 90%的置
信度下,估计全厂工人中女工比例的置信区间。
P( 1— p)
n
(解)带入公式得:
20%× (1-20%)
400
即,16.7-23.3%
而当提高置信度时,比如在 95%的置
信度下,置信区间为 16.1%和 23.9%.可见随着
制度的提高,置信区间进一步扩大,估计的精
确性则进一步降低,
20%± 1.65×
练习题,
? 从某校随机抽取 300名教师进
行调查,得出他们的平均年龄为 42
岁,标准差为 5岁,在 95%的置信度
下,该校全体教师平均年龄的置信
区间是多少?
二,假设检验
假设检验是推论统计中的另一种类型,需要
说明的是,这里的假设不是指抽象层次的理论假
设,而是指和抽样手段联系在一起并且依靠抽样
调查的数据进行验证的经验层次的假设,即统计
假设,
(一 )假设检验及其依据
假设检验实际上就是先对总体的某一参数
作出假设,然后用样本的统计量去进行验证,以决
定假设是否为总体所接受,
1.假设检验的依据
? 假设检验所依据的是概率论中的“小概率

理”即“小概率事件在一次观察中不可能出现的

理”,但是如果现实的情况恰恰是在一次观察中小
概率事件出现了,应该如何判断呢?
一种意见认为该事件的概率仍然很小,只不
过偶然被遇上了,
另一种则是怀疑和否定该事件的概率未必很
小,即认为该事件本身就不是一种小概率事件,而
是一种大概率事件,
后一种意见代表的正是假设检验的基本思想
2.举例说明假设检验的基本思路
某单位职工上月平均收入为 210元,这个月
的情况与上月没有大的变化,我们设想平均收
入还是 210元,
为了验证这一假设是否可靠,我们抽取 100
人作调查,结果得出月平均收入为 220元,标准
差位 15元,
显然,样本的结果与总体 结果之间出现了
误差,这个误差是由于我们假设错误引起的,还
是由于抽样误差引起的呢?
如果是抽样误差引起的,我们就应该承认
原来的假设,而如果是假设错误引起的,我们就
应该否定原假设,
方法,
? 通过将原假设作为虚无假设,而将与之对
立的假设作为研究假设,然后用样本的数据计算
统计量并与临界值比较,
? 当统计值的绝对值小于临界值,
即 │Z│≤Zα/2 时则接受虚无假设,否定
研究假设 ;当统计值的绝对值大于或等于临界值,
? 即 │z│≥ Zα/2 时则拒绝虚无假设,接受研
究假设,
3.假设检验的步骤,
① 建立虚无假设和研究假设通常将原假
设作为虚无假设,
② 根据需要选择适当的显著性水 α(即
小概率的大小 ).通常 α=0.05或 α=0.01等,
③ 根据样本数据计算出统计值,并根据显
著性水平查出对应的临界值,
④ 将临界值与统计值进行比较,以判定是
接受虚无假设还是接受研究假设,
(二 )总体均值的假设检验
? 某单位职工上月平均奖金为 210元,本月调查
了 100名职工,平均奖金为 220元,标准差为 15元,问
该单位职工平均奖金与上月相比是否有变化,
(解 )首先建立虚无假设 (用 H0 表示 ) 和研究假设
(用 H1 表示 ),即有,
H0, μ =210 H1, μ≠210
选择显著性水平 α= 0.05,由 Z检验表查得
Z(0.05/2)=1.96
然后根据样本数计算统计值,
? 公式为,
Z= = = 6.67
由于 Z=6.67> Z (0.05/2) =1.96
所以,拒绝虚无假设,接受研究假设,即
从总体上说,该单位职工月平均奖金与上月
相比有变化,
X— μ 220— 210
S/√n 15/√100
(三 ).总体百分比的假设检验,
总体百分比的假设检验的基本思路和方法
与总体均值的假设检验相同,只是统计量的计
算公式为, P — P0
Z = P0(1— P0)
n
例题,一所大学全体学生中抽烟者的比例为
35%,经过学习和戒烟宣传后,随机抽取 100名大
学生进行调查,结果发现抽烟者为 25明,问戒烟
宣传是否受到了成效,
(解) 1.建立假设
? H0, P0 = 0.35 H1, P0 < 0.35
2.选择显著性水平
α=0.05,由 Z检验表查得 Z 0.05 =1.65
3.根据公式计算统计量
0.25— 0.35
= 0.35× (1-0.35) = - 2.1
100
4.将统计值与临界值进行比较做出判断
由于 │ Z │=2.1> Z 0.05 = 1.65
所以,拒绝虚无假设,接受研究假设,即从总体上
说,戒烟宣传受到了成效,戒烟者的比例明显下降,