上一页 下一页湘潭大学数学与计算科学学院 1
§ 3,4 区间估计
上一页 下一页湘潭大学数学与计算科学学院 2
引言
前面,我们讨论了参数点估计, 它
是用样本算得的一个值去估计未知参数,
但是,点估计值仅仅是未知参数的一个
近似值,它没有反映出这个近似值的误
差范围,使用起来把握不大, 区间估计
正好弥补了点估计的这个缺陷,
上一页 下一页湘潭大学数学与计算科学学院 3
譬如,在估计湖中鱼数的问题中,若
我们根据一个实际样本,得到鱼数 N的极
大似然估计为 1000条,
若我们能给出一个区间,在此区间
内我们合理地相信 N 的真值位于其中,
这样对鱼数的估计就有把握多了,
实际上,N的真值可能大于 1000条,
也可能小于 1000条,
上一页 下一页湘潭大学数学与计算科学学院 4
也就是说,我们希望确定一个区间,使我
们能以比较高的 可靠程度 相信它包含真参
数值,
?
湖中鱼数的真值
[ ]
这里所说的,可靠程度,是用概率来度量的,
称为置信概率,置信度或置信水平,
习惯上把置信水平记作 ??1 ?,这里 是一个
很小的正数,
上一页 下一页湘潭大学数学与计算科学学院 5
置信水平的大小是根据实际需要选定的,
例如,通常可取置信水平 =0.95或 0.9等,??1
???? ???? 1}??{ 21P
根据一个实际样本,由给定的置信水平,我
]?,?[ 21 ??小的区间,使们求出一个尽可能
置信区间,
?称区间 为 的]?,?[ 21 ?? ??1置信水平为 的
上一页 下一页湘潭大学数学与计算科学学院 6
寻找置信区间的方法,一般是从确定
误差限 入手,
???? ???? 1}|?{|P使得
称 为 与 之间的 误差限, ?? ??
我们选取未知参数的某个估计量, 根
据置信水平, 可以找到一个正数,
??
??1 ?
只要知道 的概率分布,确定误差限并不难, ??
上一页 下一页湘潭大学数学与计算科学学院 7
下面我们就来正式给出置信区间的定义,
并通过例子说明求置信区间的方法,
????? ???? ??
?由不等式 ??? ?? |?| 可以解出,
这个不等式就是我们所求的置信区间,
上一页 下一页湘潭大学数学与计算科学学院 8
教材上已经给出了概率分布的上侧分位数
(分位点)的定义,为便于应用,这里我们
再简要介绍一下,
在求置信区间时,要查表求分位数,
设 0< <1,对随机变量 X,称满足
?? ?? )( xXP
的点 为 X的概率分布的上 分位数,
?
?x
?
上一页 下一页湘潭大学数学与计算科学学院 9
例如,
645.105.0 ?u
96.10 2 5.0 ?u
设 0< <1,对随机变量 X,称满足
?? ?? )( xXP
?
的点 为 X的概率分布的上 分位数,
?x ?
标准正态分布的
上 分位数
?u?
?
上一页 下一页湘潭大学数学与计算科学学院 10
例如,
348.9)3(2 025.0 ??
216.0)3(2 975.0 ??
设 0< <1,对随机变量 X,称满足
?? ?? )( xXP
?
的点 为 X的概率分布的上 分位数,
?x ?
分布的上
分位数
?
)(2 n??
2?
自由度为 n的
?
上一页 下一页湘潭大学数学与计算科学学院 11
设 0< <1,对随机变量 X,称满足
?? ?? )( xXP
?
的点 为 X的概率分布的上 分位数,
?x ?
F分布的上 分
位数
?
),( 21 nnF ?
自由度为 n1,n2的
?
上一页 下一页湘潭大学数学与计算科学学院 12
书末附有 分布, t 分布, F分布的上侧
分位数表, 供使用, 需要注意的事项在教
材上有说明,
2?
至于如何由标准正态分布函数表查表
求得分位数,若你对分布函数定义熟悉的
话,这个问题不难解决,
现在回到置信区间题目上来,
上一页 下一页湘潭大学数学与计算科学学院 13
一,置信区间定义:
???? ???? 1}??{ 21P
),,,,(?? 2111 nXXX ??? ?
?
),,,(?? 2122 nXXX ??? ?
)??( 21 ?? ? 满足
设 是 一个待估参数,给定,0??
若由样本 X1,X2,… Xn确定的两个统计量
则称区间 是 的 置信水平 (置信度、
置信概率)为 的置信区间,
?]?,?[ 21 ??
??1
21 ?? ?? 和
分别称为置信下限和置信上限,
上一页 下一页湘潭大学数学与计算科学学院 14
一旦有了样本,就把 估计在区间? ]?,?[
21 ??
内, 这里有两个要求,
可见,
11 ?? ?? ?
对参数 作区间估计,就是要设法找出
两个只依赖于样本的界限 (构造统计量 )
?
22 ?? ?? ?
)??( 21 ?? ?
(X1,… Xn)
(X1,… Xn)
上一页 下一页湘潭大学数学与计算科学学院 15
2,估计的精度要尽可能的高, 如要求区间
12 ?? ?? ?
长度 尽可能短,或能体现该要求的其
它准则,
]?,?[ 21 ??1,要求 以很大的可能被包含在区间?
}??{ 21 ??? ??P内,就是说,概率 要尽可能大,
即要求估计尽量可靠,
可靠度与精度是一对矛盾,
一般是在保证可靠度的条件下
尽可能提高精度,
上一页 下一页湘潭大学数学与计算科学学院 16
~N(0,1)
?选 的点估计为 X
求参数 的置信度为 的置信区间,
例 1 设 X1,… Xn是取自 的样本,,2已知?),( 2??N
? ??1
n
XU
?
???取
二、置信区间的求法
明确问题,是求什么参数的置信区间?
置信水平是多少?
寻找未知参数的
一个良好估计,
解:
寻找一个待估参数和
估计量的函数,要求
其分布为已知,
有了分布,就可以求出
U取值于任意区间的概率,
上一页 下一页湘潭大学数学与计算科学学院 17
,1 ??对给定的置信水平
查正态分布表得,2?u
对于给定的置信水平 (大概率 ),根据 U的分布,
确定一个区间,使得 U取值于该区间的概率为
置信水平,
?
?
?
? ???
? 1}|{|
2un
XP使
为什么
这样取?
上一页 下一页湘潭大学数学与计算科学学院 18
,1 ??对给定的置信水平
查正态分布表得,2?u
???? ?? ?????? 1}{ 22 unXunXP
?
?
?
? ???
? 1}|{|
2un
XP使
从中解得
上一页 下一页湘潭大学数学与计算科学学院 19
],[ 22 ?? ?? u
n
Xu
n
X ??
也可简记为
2?
? u
n
X ?
?
?
?
?
??
??
????
1
}{ 22 u
n
Xu
n
XP
于是所求 的 置信区间为?
上一页 下一页湘潭大学数学与计算科学学院 20
从例 1解题的过程,我们归纳出求置
信区间的一般步骤如下,
1,明确问题,是求什么参数的置信区间?
置信水平 是多少???1
2,寻找参数 的一个良好的点估计
T (X1,X2,… Xn)
?
称 S(T,)为 枢轴量, ?
3,寻找一个待估参数 和估计量 T的函数
S(T,),且其分布为已知, ?
?
上一页 下一页湘潭大学数学与计算科学学院 21
4,对于给定的置信水平,根据 S(T,)
的分布,确定常数 a,b,使得
??1 ?
??1?P(a ≤S(T,)≤b)=
5,对,a≤S(T,)≤b”作等价变形,得到如下
形式,
?
???? ???? 1}??{ 21P
]?,?[ 21 ?? ??1?则 就是 的 100( )%的置信区间,
上一页 下一页湘潭大学数学与计算科学学院 22
可见,确定区间估计很关键的是要寻找
一个待估参数 和估计量 T 的函数 S(T,),
且 S(T,)的分布为已知,不依赖于任何未知
参数
?
? ?
(这样我们才能确定一个大概率区间 ).
而这与总体分布有关,所以,总体分布的
形式是否已知,是怎样的类型,至关重要,
上一页 下一页湘潭大学数学与计算科学学院 23
这里,我们主要讨论总体分布为 正态
的情形, 若样本容量很大,即使总体分布
未知,应用中心极限定理,可得总体的近
似分布,于是也可以近似求得参数的区间
估计,
上一页 下一页湘潭大学数学与计算科学学院 24
教材上讨论了以下几种情形:
单个正态总体均值 和方差 的区间估计,? 2?
两个正态总体均值差 和方差比
的区间估计,
21 ?? ?
2
2
2
1
?
?
比例 p 的区间估计,
下面我们举几个例子,其余部分请自己看,
上一页 下一页湘潭大学数学与计算科学学院 25
例 2 已知某地区新生婴儿的体重 X~ ),,( 2??N
,,2未知??
随机抽查 100个婴儿

得 100个体重数据
X1,X2,…,X100
? 的区间估计2?求 和 (置信水平为 1- ),?
上一页 下一页湘潭大学数学与计算科学学院 26
解:这是单总体均值和方差的估计
未知22,),,(~ ????NX已知
?先求均值 的区间估计,
)1(~ ??? nt
nS
Xt ?因方差未知,取
对给定的置信度,确定分位数??1 ),1(2 ?nt?
使 ?
? ???? 1)}1(|{| 2 nttP
?? ? ????? 1)}1(|{| 2 nt
nS
XP即
上一页 下一页湘潭大学数学与计算科学学院 27
)]1(),1([ 22 ???? nt
n
SXnt
n
SX
??
均值 的置信水平为 的区间估计,
即为
? ??1
从中解得
?? ?? ???????? 1)}1()1({ 22 ntnSXntnSXP
上一页 下一页湘潭大学数学与计算科学学院 28
)1(~)1( 22
2
?? nSn ??取枢轴量
???? ?? ???????? 1)}1()1()1({ 2 22
2
2
21 n
SnnP
从中解得
?
?
?
? ??
??
?
???
?
?
?
1}
)1(
)1(
)1(
)1({
2
21
2
2
2
2
2
n
Sn
n
SnP
2?再求方差 的置信水平为 的区间估计,??1
对给定的置信度,确定分位数??1
,)1(2 2 ?n?? 使,)1(2 21 ?? n??
上一页 下一页湘潭大学数学与计算科学学院 29
于是 即为所求, ]
)1(
)1(,
)1(
)1([
2
21
2
2
2
2
?
?
?
?
? n
Sn
n
Sn
?? ??
?
?
?
? ??
??
?
???
?
?
?
1}
)1(
)1(
)1(
)1({
2
21
2
2
2
2
2
n
Sn
n
SnP
上一页 下一页湘潭大学数学与计算科学学院 30
需要指出的是,给定样本,给定置信水
平,置信区间也 不是唯一 的,
对同一个参数,我们可以构造许多置信区间,
上一页 下一页湘潭大学数学与计算科学学院 31
~N(0,1)
n
XU
?
???取枢轴量
由标准正态分布表,对任意 a,b,我们可
以求得 P( a<U<b),
例如,设 X1,… Xn是取自 的样本,
,2已知?
),( 2??N
求参数 的置信水平为 的? ??1
置信区间,
上一页 下一页湘潭大学数学与计算科学学院 32
~N(0,1)
n
XU
?
???
例如,由 P(-1.96≤U≤1.96)=0.95
)(uf
u96.196.1?
95.0
我们得到 均值 的置信水平为? ??1 的
置信区间为 ]96.1,96.1[ nXnX ?? ??
上一页 下一页湘潭大学数学与计算科学学院 33
由 P(-1.75≤U≤2.33)=0.95
这个区间比前面一个要长一些,
置信区间为 ]33.2,75.1[ nXnX ?? ??
我们得到 均值 的置信水平为? ??1 的
)(uf
u33.275.1?
上一页 下一页湘潭大学数学与计算科学学院 34
我们总是希望置信区间尽可能短,
类似地,我们可得到若干个不同的置信
区间,
任意两个数 a和 b,只要它们的纵标包含
f(u)下 95%的面积,就确定一个 95%的置信
区间,
0 b
u
u
u
)(uf
a
a
a
b
b
950.
950.
950.
上一页 下一页湘潭大学数学与计算科学学院 35
在概率密度为单峰且对称的情形,当 a =-b时
求得的置信区间的长度为最短,
0 b
u
u
u
)(uf
a
a
a
b
b
950.
950.
950.
a =-b
上一页 下一页湘潭大学数学与计算科学学院 36
即使在概率密度不对称的情形,如
分布, F分布,习惯上仍取对称的百分位点
来计算未知参数的置信区间,
2?
我们可以得到未知参数的的任何 置信水
平小于 1的 置信区间,并且 置信水平越高,
相应的 置信区间 平均长度 越长,
)(2 2 n??)(2 21 n?? ?
)(xf
x
)(~ 2 nX ?
上一页 下一页湘潭大学数学与计算科学学院 37
也就是说,要想得到的区间估计可靠
度高,区间长度就长,估计的精度就差,
这是一对矛盾,
实用中应在保证足够可靠的前提下,
尽量使得区间的长度短一些,
上一页 下一页湘潭大学数学与计算科学学院 38
例 3 某单位要估计平均每天职工的总医疗费,
观察了 30天,其总金额的平均值是 170元,标准
差为 30元,试决定职工每天总医疗费用平均值
的区间估计(置信水平为 0.95),
解,设每天职工的总医疗费为 X,
近似服从正态分布X ),( 2
n
N ??
大样本,由中心极限定理,
2??E(X)=,D(X)=
? 未知,用样本标准差 S近似代替,
上一页 下一页湘潭大学数学与计算科学学院 39
取枢轴量
nS
XU ??? 近似 N(0,1)分布
对给定的置信水平,确定分位数??1,2?u
使
?? ? ???? 1}|{| 2u
nS
XP
],[ 22 ?? u
n
SXu
n
SX ??
得均值 的置信水平为 的区间估计为? ??1
上一页 下一页湘潭大学数学与计算科学学院 40
将 =170,S=30,=1.96,n=30代入得,X
的置信水平为 0.95的置信区间是
[ 159.27,180.74]
?
2?u
],[ 22 ?? u
n
SXu
n
SX ??
得均值 的置信水平为 的区间估计为? ??1
上一页 下一页湘潭大学数学与计算科学学院 41
三、单侧置信区间
上述置信区间中置信限都是双侧的,但
对于有些实际问题,人们关心的只是参数在
一个方向的界限,
例如对于设备、元件的使用寿命来说,平均
寿命过长没什么问题,过短就有问题了,
这时,可将置信上限取
为 +∞,而只着眼于置信下
限,这样求得的置信区间
叫单侧置信区间,
上一页 下一页湘潭大学数学与计算科学学院 42
于是引入单侧置信区间和置信限的定义:
??? ??? 1}?{ 1P
),,,(?? 2111 nXXX ??? ?
?
满足
设 是 一个待估参数,给定,0??
若由样本 X1,X2,… Xn确定的统计量
则称区间 是 的置信水平为 的
单侧置信区间,
?),?[ 1 ?? ??1
1?? 称为单侧置信下限,
上一页 下一页湘潭大学数学与计算科学学院 43
),,,(?? 2122 nXXX ??? ?又若统计量 满足
??? ??? 1}?{ 2P
2??
则称区间 是 的置信水平为 的
单侧置信区间,
?]?,( 2??? ??1
称为单侧置信上限,
上一页 下一页湘潭大学数学与计算科学学院 44
设灯泡寿命服从正态分布, 求灯泡寿命均
值 的置信水平为 0.95的单侧置信下限,
例 4 从一批灯泡中随机抽取 5只作寿命试
验,测得寿命 X(单位:小时)如下:
1050,1100,1120,1250,1280
?
)1(~ ?? nt
nS
X ?
由于方差 未知,取枢轴量2?
解,的点估计取为样本均值? X
上一页 下一页湘潭大学数学与计算科学学院 45
对给定的置信水平,确定分位数 )1( ?nt???1
?? ? ????? 1)}1({ nt
nS
XP使
即 ??
? ????? 1})1({ n
SntXP
于是得到 的置信水平为 的单侧置
信区间为
? ??1
],)1([ ???
n
SntX
?
上一页 下一页湘潭大学数学与计算科学学院 46
将样本值代入得
? 的置信水平为 0.95的单侧置信下限是
1065小时
? 的置信水平为 的单侧置信下限为??1即
n
SntX )1( ??
?