§ 7.3 区间估计
一.置信区间概念
对于未知参数,除了得到它的点估
计 外,我们还希望估计出一个范围,并
希望知道 这个范围包含参数真值 的可信
程度.这样的范围通常以区间的形式给出,
而可信程度由概率给出.这种估计称为区
间估计或置信区间,以下先给出置信区间
概念.
?
??
?
定义 7.4 设 为总体 X的一个未知参数,
是预先给定一个数,,
是 两个估计量,如果
( 7-10)
则称随机区间 为未知参数 的一个
置信度 为 的 置信区间 (Confidence
Interval).置信度也常称为 置信水平
(confidence level)或 置信系数 (confidence
coefficient).通常 取 0.05,0.01,0.10,
视具体需要而定.
? )10( ?? ??
),,,(?? 2111 nXXX ??? ? ),,,(?? 2122 nXXX ??? ?
?
? ? ???? ???? 1?? 21P
)?,?( 21 ?? ?
??1
?
二.求区间估计的一般方法
1,首先根据样本寻找一个随机变量(枢轴变
量),使其分布完全已知.
2,对给定的置信度,由 T的分布确定两
个常数 C1,C2使
3,将事件 表示为
则
即 的置信度为 的置信区间为,
);,,,( 21 ?nXXXTT ??
??1
?? ?? ???? 1);,,,( 2211 CXXXTCP n?
?? 2211 );,,,( CXXXTC n ?? ??
?? ),,(),,( 212211 nn XXXTXXXT,,?? ?? ?
?? ?? ???? 1),,(),,( 212211 nn XXXTXXXTP,,??
? ??1 ),( 21 TT
三,正态总体均值的区间估计
鉴于实际问题中最常见的参数估计问
题多数是要求估计总体的均值和方差,且
正态总体又是实际问题中最常遇到的总体,
因此,以下着重讨论正态总体均值和方差
的区间估计.
总体 X~ N, μ是未知参数,现在
我们分两种情形讨论 μ的区间估计问题
从该总体 X中抽取随机样本,并
以作为 μ=EX的点估计,服从正态分布
),( 2??
),,,( 21 nXXX ? X
),(
2
n
N ??
1,已知情形下 μ的置信区间
若 是已知参数,这时可选取枢轴变量
~ N( 0,1)( 7-11)
则对给定的置信度, 存在,
使
( 7- 12)
这里 是标准正态分布的 -上侧分位数,
其值可查附表 2求得.将 U的表示式代入
( 7-12)可得
2?
2?
nXU ? ???
)10(,1 ??? ??
2
?U
?? ??
?
?
?
?
?
?
? 1
2
UUP
2
?U
2
?
?
?
?
? ??
?
?
?
?
?
?
?
?
1
2
Un
X
P
所以 μ的置信度为 的置信区间是
( 7-14)
其长度为
??1
??
?
?
??
?
?
??
22
,?? ?? U
n
XU
n
X
2
2 ?? U
n
2,为未知情形下,μ的置信区间
若 是未知参数,则以 的无偏估计
代替,这时由于枢轴变量
~ ( 7-15)
所以对给定的置信度,存在 使
( 7-16)
这里 的是自由度为 n-1的 t分布的 -
上侧分位数,它的值可查附表 4求得,将
( 7-15)中的 T代入( 7-16)可得
2?
2? 2?
2?
n
S
XT ??? )1( ?nt
??1
)1(
2
?nt?
? ? ?? ???? 1)1(
2
ntTP
)1(
2
?nt? 2?
因此有
( 7-17)
所以 μ的置信度为 的置信区间是
( 7-18)
其长度为
需要说明的是:置信区间公式中
的,,在实际问题中都是具体观测值,
计算时应是,
?? ?? ??
?
?
?
?
?
? ?????? 1)1()1(
22
ntnSXntP
?? ?? ??
?
?
?
?
?
? ?????? 1)1()1(
22
nt
n
SXnt
n
SXP
??1
???
?
???
? ???? )1(,)1(
22
nt
n
SXnt
n
SX
??
)1(2
2
?ntnS ?
X 2S
2,sx
四.大样本情形下总体均值的区间
估计.
对一般的总体 X,无论它服从什么分布,
只要其均值 μ=EX和方差 σ2=DX都存在,我
们便可以用增大样本容量的办法对其均值 μ
作区间估计.
根据中心极限定理 5.2,当样本容量 n充
分大时,便近似服从正态分布.又因
为
,所以
N( 0,1)( 7-19)
X???
n
XDXE
2
,?? ??
n
X
?
??
近似
~
又因为样本二阶中心矩 Sn是 σ的相合估计,当
n充分大时,σ近似等于 Sn,从而( 7-19)
式中以 Sn代替 σ,可得枢轴变量
N( 0,1)( 7-20)
对于指定的 α∈ (0,1),查附表 2可得到,使
即 ( 7-21)
故 的置信度为 的置信区间近似为
( 7-22)
n
S
XU
n
??? 近似 ~
2
?U
?? ?? ??
??
???
??
??? ???
?
?
?
?
?
? ? 1
22
UnSXPUUP
n
?? ?? ??
?
?
?
?
?
?
???? 1
22
U
n
SXU
n
SXP nn
? ??1
???
?
???
?
?? ??
22
,U
n
SXU
n
SX nn
这里应指出,用( 7-22 )式求置信区
间的前提是样本容量 n很大,n多大才算很
大呢?理论上很难作出明确的回答,实际
经验告诉我们一般应有 n≥50.
设总体 X服从正态分布,其中
和 都是未知参数,从总体中抽取一个样
本,求总体方差 或标准差 的
区间估计.
五.正态总体方差的区间估计
),( 2??N
?
2?
),,,( 21 nXXX ? 2? ?
六.两个正态总体均值差和方差比
的区间估计
( 7-25)
σ的置信度为 置信区间
( 7-26)
假设某产品的某项质量指标 X服从正态
分布,由于工艺的改进、原材料的不同、
设备以及操作人员素质的变化等,都会引
起总体均值、方差的变化.
??
?
?
?
?
??
?
?
?
?
?
?
?
?
?
)1(
)1(
,
)1(
)1(
2
2
1
2
2
2
2
n
Sn
n
Sn
?? ??
??
?
?
?
?
??
?
?
?
?
?
?
?
?
?
)( 1
1
,
)1(
1
2
2
1
2
2
n
n
S
n
n
S
?? ??
??1
实际工作中,往往需要估计这种变化的大
小,即讨论两个正态总体均值差或方差比
的估计问题.
1.两个正态总体均值差 的置信区间
设总体,总体,两
总体相互独立.现从两总体中各取一个容
量分别为 n1和 n2 的样本,并记两个样本的
均值、方差分别为 和
( 1) 和 已知时,的置信区间
21 ?? ?
),(~ 211 ??NX ),(~ 222 ??NY
21S,X 22,SY
2
1?
22?
21 ?? ?
取 作为 的点估计,显然这个估计是
无偏的,并且,
由定理 6.2的结论( 1)
有 ~ N( 0,1)
于是可得 的置信度为 的置信区间为
( 7-27)
( 2),但 未知时,的置信
区间仍取 作为 的估计量,由
定理 6.2的结论( 2)
~ t (n1+n2-2)
YX ?
21 ?? ?
21)( ?? ??? YXE
2
2
2
1
2
1)(
nn
YXD ?? ???
2
2
2
1
2
1
21 )()(
nn
YX
??
??
?
???
21 ?? ? ??1
???
?
???
? ??????
2
2
2
1
2
1
22
2
2
1
2
1
2
)(,)( nnUYXnnUYX ???? ??
22221 ??? ?? 2? 21 ?? ?
YX ? 21 ?? ?
21
2121 )()(
nn
nn
S
YX
T
w ?
???
?
??
2.两个正态总体方差比的置信区间.
其中,见( 6-28).从
而得到 的置信度为 1-α的置信区间为
( 7-28)
我们仅讨论总体均值 μ1,μ2为未知的
情况.由定理 6.2的结论( 3)知
~ F (n1-1,n2-1)
2
)1()1(
21
2
22
2
11
??
????
nn
SnSnS
w
21 ?? ?
? ?
21
21
21
221
21
21
2
)2(,)2( nn nnSnntYXnn nnSnntYX ww ?????????? ??
2
2
2
1
2
2
2
1
??
SS
并且分布 F (n1-1,n2-1)不依赖于任何未知
参数,由此得
,即
( 7-29)
于是得 的一个置信度为 的置信区间
,( 7-30)
?
?? ??
??
??
???
?
?
???????
?
1)1,1(
/
/)1,1(
21
2
2
2
2
1
2
2
2
1
21
2
1
nnFSSnnFP
? ? ???
??
????????
?
1)1,1( 1)1,1( 1
21
21
2
2
2
1
2
2
2
1
21
2
2
2
2
1
nnFS
S
nnFS
SP
2221 σ/σ ??1
?
?
?
?
?
?? )1,1(
1
21
2
2
2
2
1
nnFS
S
? ?
?
?
?
?
??
?
)1,1(
1
21
2
1
2
2
2
1
nnFS
S
?
七.置信界
前面讨论的区间估计对未知参数 给
出了两个统计量,得到 的置信区
间.但在某些实际问题中,有时往往关心
的只是 在一个方向的界限.例如对设备、
元件的寿命来说,我们常常关心的是平均
寿命的“下界”是多少?而在考虑产品的
废品率 p时,我们关心的却是废品率的“上
界”.本节讨论置信界的估计问题.
?
21 ?,? ??
?
?
定义 7.5 设 是来自总体 X的一个样本,
是总体分布中的一个未知参数,对于给定
的,若统计量
满足 (7-31)
则称 是 的置信度为 的 置信下界 ;
又若统计量 满足
( 7-32)
则称 是 的置信度为 的 置信上
界,
对于置信界问题的讨论,基本与区间
估计的方法相同,只是对于精度的标准不
nXXX,,,21 ?
?
)10( ?? ?? ),,,(??
21** nXXX ??? ?
? ? ??? ??? 1? *P
*??
? ??1
),,,(?? 21** nXXX ??? ?
? ? ??? ??? 1? *P
*??
? ??1
能像置信区间那样,用区间的长度来刻
画.对于给定的置信度,选择置信
下界 时,应使 愈大愈好;选择置信
上界 时,应是 愈小愈好.
1.正态总体均值 的置信界
设总体, 和 未知,由于
~ t (n-1),所以,对于给定的置信度,
有,即
( 7-33)
??1
*??
)?( *?E
*??
)?( *?E
?
)(~ 2??,NX ? 2? n
S
X ??
??1
? ? ?? ? ????? 1)1( ntnSXP
? ? ?? ? ????? 1)1( nt
n
SXP
于是就得到 的一个置信度为 的置信下
界 ( 7-34)
2.正态总体方差 的置信界
由于 ~,所以
,即 ( 7-35)
于是得到 的一个置信度为 的置信上界
( 7-36)
? ??1
)1(? * ??? ntnSX ??
2?
2
2)1(
?
Sn ? )1(2 ?n? ? ? ??
? ? ????
?
? 1)1(
)1( 2
12
2
nSnP
? ? ???
?
?????
?
1)1( )1( 2
1
2
2
n
SnP
2? ??1
)1(
)1(?
2
1
22
?
??
?
?
n
Sn
??
?