第 5章 参数估计
5.1 参数估计的基本内容
5.2 总体均值区间估计
5.3 两均值之差的区间估计
5.4 总体比例区间估计
5.5 总体标准差及方差的估计本章学习目标
Excel在总体均值区间估计中的应用
Excel在总体比例区间估计中的应用
Excel在总体标准差及方差估计中的应用
5.1 参数估计的基本内容参数估计就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计量 。 包括点估计和区间估计两种 。
若总体 X的分布函数形式已知,但它的一个或多个参数未知,则由总体 X的一个样本估计总体未知参数的值的问题就是参数的点估计问题 。
要求由样本构造一个以较大的概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间估计 。
返回首页
5.2 总体均值区间估计
5.2.1 总体均值区间估计的基本内容
5.2.2 利用 Excel计算总体均值置信区间
5.2.3 必要抽样容量的计算公式
5.2.4 利用 Excel计算必要样本单位数返回首页
5.2.1 总体均值区间估计的基本内容设是总体 X的一个样本,X~N(μ,σ2),求总体均值 μ的置信区间 。
1,总体方差 σ2已知,求 μ的置信区间构造总体均值 μ的置信区间为:
2,总体方差 σ2未知,求 μ的置信区间构造均值 μ的置信区间为:
nzxnzx
22
,
n
stx
n
stx
22
,
返回本节
5.2.2 利用 Excel计算总体均值置信区间例 5-1 从某班男生中随机抽取 10名学生,测得其身高 ( cm) 分别为 170,175,172,168、
165,178,180,176,177,164,以 95%的置信度估计本班男生的平均身高 。
在 95%的置信度下,本班男生身高的置信区间为 ( 168.5063658,176.4936342) 。 计算结果如图 5-1所示 。
图 5-1 总体均值置信区间的计算返回本节
5.2.3 必要抽样容量的计算公式在总体均值的区间估计中,置信区间为 。
从公式中可以看出,从到的距离实际上为置信区间长度的 1/2,这段距离表示在一定的置信度
1-α下,用样本均值估计总体均值时所允许的最大绝对误差,即抽样极限误差,它表示抽样误差的可能范围,又称允许误差 。
如果用 Δ表示抽样极限误差,则那么样本容量 n的大小则为
nzx
2
x
nz
2
2
22
2
z
n
确定抽样数目,应考虑以下几个问题:
( 1) 被调查总体的标志变动程度 。 总体各单位值之间差异程度大,抽样数目就多,反之可以少些 。
( 2) 对推断精确度的要求,即被允许的抽样误差范围 。
在标志变动程度不变的条件下,精确度要求越高,即被允许的误差范围越小,抽样数目就需要增加,反之可以减少 。
( 3) 对推断把握程度的要求 。 在其他条件不变的情况下,要提高抽样的把握程度,抽样数目就需要增加,
反之可以减少 。
( 4) 抽取调查单位的方式 。
返回本节
5.2.4 利用 Excel计算必要样本单位数例 5-2 某县进行农村经济情况调查,已知农户平均年收入标准差为 30元,要求把握程度 ( 置信度 ) 为 95.45%,抽样极限误差为 5元,计算应抽取的样本户数? 如图 5-2,5-3所示 。
图 5-2,样本容量计算”
工作表 图 5-3 必要样本容量计算返回本节
5.3 两均值之差的区间估计
5.3.1 总体方差已知
5.3.2 大样本总体方差未知
5.3.3 小样本总体方差未知但相等
5.3.4 小样本总体方差未知且不等
5.3.5 成对样本的均值之差返回首页
5.3.1 总体方差已知返回本节
5.3.2 大样本总体方差未知返回本节
5.3.3 小样本总体方差未知但相等返回本节
5.3.4 小样本总体方差未知且不等如果正态分布总体的方差未知,而且不相等,
则当小样本时:
并不服从 t分布,只是近似服从 t分布,其自由度为:
返回本节上述的两均值之差是建立在两个独立样本上,
样本之间彼此无关 。 但如果两个样本是成对地发生,那么这两个样本必定相关 。 由于受试者是成对地被观察,例如抽取某个家庭的老大和老小;调查某位先生和他的太太;测量某位受试者受训前和受训后的体重,因此两样本之间会有关连,而非两个独立样本 。
5.3.5 成对样本的均值之差返回本节
5.4 总体比例区间估计
5.4.1 样本比例的区间估计
5.4.2 估计总体比例的必要抽样容量返回首页
5.4.1 样本比例的区间估计同均值的区间估计一样,总体比例的推断也建立在样本比例的抽样分布基础上 。 样本比例分布直接来源于二项分布 。 从理论上说,二项分布是确定置信区间用以估计总体比例的一种恰当的分布,但当样本单位数较大时,概率的计算非常复杂,所以使用二项分布估计总体比例非常困难 。 根据中心极限定理,随着样本容量的增加,二项分布渐近于正态分布,所以这时可以用正态分布代替二项分布 。
样本比例抽样分布的数量特征如下:
样本比例抽样分布的标准差为标准正态分布,确定围绕 值的置信区间是:
ip
np
1
1
n
ppzp
n
ppzp 1,1
22
图 5-4 建立工作表图 5-5 样本比例区间估计的计算结果返回本节
5.4.2 估计总体比例的必要抽样容量比例估计同均值估计相同,也存在一个必要样本容量问题,也受极限误差,置信水平的制约 。
对于比例估计来讲,其必要样本容量的计算公式为:
2
1
n
图 5-6,比例样本容量”工作表图 5-7 计算结果返回本节
5.5 总体标准差及方差的估计
5.5.1 方差估计的内容和工作表函数
5.5.2 总体方差的置信区间返回首页
5.5.1 方差估计的内容和工作表函数
1.大样本情况下总体标准差的区间估计
2.小样本情况下正态总体方差的置信区间
1.大样本情况下总体标准差的区间估计
n
zs
n
zs
2
,
2 22
2.小样本情况下正态总体方差的置信区间
1
1
,
1
1
2
2
2
2
2
1
2
nx
sn
nx
sn
Excel提供了两个用于方差估计的工作表函数。
( 1) 卡方分布函数 。
该函数返回卡方分布的单尾概率 。
( 2) 卡方分布反函数 。
该函数返回卡方分布单尾概率的反函数值 。
返回本节
5.5.2 总体方差的置信区间例 5-5 对某机床生产的一批模具随机抽取 20件进行尺寸检测,其尺寸的标准差为 0.5毫米,假定总体服从正态分布,以 95%的置信度估计这批模具尺寸的方差的置信区间 。 结果如下图所示 。
图 5-8,方差区间估计”工作表图 5-9 计算结果返回本节
5.1 参数估计的基本内容
5.2 总体均值区间估计
5.3 两均值之差的区间估计
5.4 总体比例区间估计
5.5 总体标准差及方差的估计本章学习目标
Excel在总体均值区间估计中的应用
Excel在总体比例区间估计中的应用
Excel在总体标准差及方差估计中的应用
5.1 参数估计的基本内容参数估计就是要从样本出发去构造一个统计量作为总体中某未知参数的一个估计量 。 包括点估计和区间估计两种 。
若总体 X的分布函数形式已知,但它的一个或多个参数未知,则由总体 X的一个样本估计总体未知参数的值的问题就是参数的点估计问题 。
要求由样本构造一个以较大的概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的方法称为区间估计 。
返回首页
5.2 总体均值区间估计
5.2.1 总体均值区间估计的基本内容
5.2.2 利用 Excel计算总体均值置信区间
5.2.3 必要抽样容量的计算公式
5.2.4 利用 Excel计算必要样本单位数返回首页
5.2.1 总体均值区间估计的基本内容设是总体 X的一个样本,X~N(μ,σ2),求总体均值 μ的置信区间 。
1,总体方差 σ2已知,求 μ的置信区间构造总体均值 μ的置信区间为:
2,总体方差 σ2未知,求 μ的置信区间构造均值 μ的置信区间为:
nzxnzx
22
,
n
stx
n
stx
22
,
返回本节
5.2.2 利用 Excel计算总体均值置信区间例 5-1 从某班男生中随机抽取 10名学生,测得其身高 ( cm) 分别为 170,175,172,168、
165,178,180,176,177,164,以 95%的置信度估计本班男生的平均身高 。
在 95%的置信度下,本班男生身高的置信区间为 ( 168.5063658,176.4936342) 。 计算结果如图 5-1所示 。
图 5-1 总体均值置信区间的计算返回本节
5.2.3 必要抽样容量的计算公式在总体均值的区间估计中,置信区间为 。
从公式中可以看出,从到的距离实际上为置信区间长度的 1/2,这段距离表示在一定的置信度
1-α下,用样本均值估计总体均值时所允许的最大绝对误差,即抽样极限误差,它表示抽样误差的可能范围,又称允许误差 。
如果用 Δ表示抽样极限误差,则那么样本容量 n的大小则为
nzx
2
x
nz
2
2
22
2
z
n
确定抽样数目,应考虑以下几个问题:
( 1) 被调查总体的标志变动程度 。 总体各单位值之间差异程度大,抽样数目就多,反之可以少些 。
( 2) 对推断精确度的要求,即被允许的抽样误差范围 。
在标志变动程度不变的条件下,精确度要求越高,即被允许的误差范围越小,抽样数目就需要增加,反之可以减少 。
( 3) 对推断把握程度的要求 。 在其他条件不变的情况下,要提高抽样的把握程度,抽样数目就需要增加,
反之可以减少 。
( 4) 抽取调查单位的方式 。
返回本节
5.2.4 利用 Excel计算必要样本单位数例 5-2 某县进行农村经济情况调查,已知农户平均年收入标准差为 30元,要求把握程度 ( 置信度 ) 为 95.45%,抽样极限误差为 5元,计算应抽取的样本户数? 如图 5-2,5-3所示 。
图 5-2,样本容量计算”
工作表 图 5-3 必要样本容量计算返回本节
5.3 两均值之差的区间估计
5.3.1 总体方差已知
5.3.2 大样本总体方差未知
5.3.3 小样本总体方差未知但相等
5.3.4 小样本总体方差未知且不等
5.3.5 成对样本的均值之差返回首页
5.3.1 总体方差已知返回本节
5.3.2 大样本总体方差未知返回本节
5.3.3 小样本总体方差未知但相等返回本节
5.3.4 小样本总体方差未知且不等如果正态分布总体的方差未知,而且不相等,
则当小样本时:
并不服从 t分布,只是近似服从 t分布,其自由度为:
返回本节上述的两均值之差是建立在两个独立样本上,
样本之间彼此无关 。 但如果两个样本是成对地发生,那么这两个样本必定相关 。 由于受试者是成对地被观察,例如抽取某个家庭的老大和老小;调查某位先生和他的太太;测量某位受试者受训前和受训后的体重,因此两样本之间会有关连,而非两个独立样本 。
5.3.5 成对样本的均值之差返回本节
5.4 总体比例区间估计
5.4.1 样本比例的区间估计
5.4.2 估计总体比例的必要抽样容量返回首页
5.4.1 样本比例的区间估计同均值的区间估计一样,总体比例的推断也建立在样本比例的抽样分布基础上 。 样本比例分布直接来源于二项分布 。 从理论上说,二项分布是确定置信区间用以估计总体比例的一种恰当的分布,但当样本单位数较大时,概率的计算非常复杂,所以使用二项分布估计总体比例非常困难 。 根据中心极限定理,随着样本容量的增加,二项分布渐近于正态分布,所以这时可以用正态分布代替二项分布 。
样本比例抽样分布的数量特征如下:
样本比例抽样分布的标准差为标准正态分布,确定围绕 值的置信区间是:
ip
np
1
1
n
ppzp
n
ppzp 1,1
22
图 5-4 建立工作表图 5-5 样本比例区间估计的计算结果返回本节
5.4.2 估计总体比例的必要抽样容量比例估计同均值估计相同,也存在一个必要样本容量问题,也受极限误差,置信水平的制约 。
对于比例估计来讲,其必要样本容量的计算公式为:
2
1
n
图 5-6,比例样本容量”工作表图 5-7 计算结果返回本节
5.5 总体标准差及方差的估计
5.5.1 方差估计的内容和工作表函数
5.5.2 总体方差的置信区间返回首页
5.5.1 方差估计的内容和工作表函数
1.大样本情况下总体标准差的区间估计
2.小样本情况下正态总体方差的置信区间
1.大样本情况下总体标准差的区间估计
n
zs
n
zs
2
,
2 22
2.小样本情况下正态总体方差的置信区间
1
1
,
1
1
2
2
2
2
2
1
2
nx
sn
nx
sn
Excel提供了两个用于方差估计的工作表函数。
( 1) 卡方分布函数 。
该函数返回卡方分布的单尾概率 。
( 2) 卡方分布反函数 。
该函数返回卡方分布单尾概率的反函数值 。
返回本节
5.5.2 总体方差的置信区间例 5-5 对某机床生产的一批模具随机抽取 20件进行尺寸检测,其尺寸的标准差为 0.5毫米,假定总体服从正态分布,以 95%的置信度估计这批模具尺寸的方差的置信区间 。 结果如下图所示 。
图 5-8,方差区间估计”工作表图 5-9 计算结果返回本节