§ 6.3 参数的区间估计
定义 6.7 设总体X的分布函数为( )θ;xF,θ为未知参数,( )
n
XXX,...,,
21
是来自总体X的样本。如果存在两个统计量( )
n
XXX,...,,
211
θ和
2
θ ( )
n
XXX,...,,
21
,对于给定的()10 <<αα,使得
()( ){ } αθθθ?=≤≤ 1,...,,
,...,,
212211 nn
XXXXXXP (6.14)
则称区间[ ]
21
,
θθ为参数θ的置信度为α?1的置信区间,称为置信下限,称为置信上限。本节仅讨论正态总体下参数的区间估计问题。
1
θ
2
θ
6.3.1 数学期望的置信区间
1,已知方差,求
2
σ μ的置信区间
设总体X~ ( )
2
,σμN,已知,求总体均值
2
σ μ的区间估计。
设是来自总体
n
XXX,...,,
21
X的一个样本,自然用X对μ作点估计,因为X~
n
N
2
,
σ
μ,故
U
n
X
def

μ?
~ ( )1,0N
由正态分布表(附表2)可知,对于给定的α,存在一个值,使得
2/α
u
{}α
α
=≤ 1
2/
uUP
其中是标准正态分布
α/2
u 2/α上侧分位数。于是
α
σ
μ
α
=

1
/
2/
u
n
X
P

{ } α
σ
μ
σ
αα
=+≤≤? 1
2/2/
n
uX
n
uXP
故μ的置信度为1 α?的置信区间为
1
+?
n
uX
n
uX
σσ
αα 2/2/
,(6.15)
若给定=α 0.05,查正态分布表知96.1
025.0
=u,于是得μ的置信度度95%置信区间为
+?
n
X
n
X
σσ
96.1,96.1 (6.16)
这意味着总体均值μ以95%的概率落在该区间内,粗略地说,如果做100次抽样,
可有式(6.16)算出一百个区间,则有95个区间都包含着μ。这样,在实际应用中,做一次抽样算出的置信区间,我们就认为它包含了μ,即是μ的区间估计。
当然,也可能遇到算出的区间不含μ的偶然情形,但这种情况出现的可能性很小
(约为5%)此外由式(6.13)可知
%9596.1 =
≤?
n
XP
σ
μ
这表明当方差已知时,用X作为μ的点估计,其绝对误差以95%的概率不超过
1.96σ / n,由此便确定了点估计的估计精度和误差范围。
值得注意的是,在总体的分布未知,只要n充分大,仍可用
+?
n
uX
n
uX
σσ
αα 2/2/
,作为总体均值μ 的置信区间,这是因为,由中心极限定理可知,无论服从什么分布,当充分大时,随机变量 X n
n
X
U

μ?
=
近似服从正态分布。至于多大才算充分大,没有绝对标准,一般认为不应小于50,最好大于100。
n n
例6.21某车间生产的滚珠直径X服从正态分布(,0.06)N μ,现从某天生产的产品中抽取6个,测得直径分别为(单位:mm)
14.6 15.1 14.9 14,8 15.2 15.1
试求平均直径置信度95%的置信区间,
2
解,置信度
0.025
2
1 0.95,0.05,1.96,uu
α
α α? == =
又由样本值14.95,6,0.05,xnσ===由式(6.14)有
置信下限
2
0.06
14.95 1.96 14.75
6
xu
n
α
σ
=? ≈
置信上限
2
0.06
14.95 1.96 15.15
6
xu
n
α
σ
+=+ ≈,
所以平均直径μ的置信度为95%的置信区间为[ ]14.75,15.15,
若取0.01,α =则可算出μ的置信度为99%的置信区间为[ ]14.69,15.21,
2,未知方差,求
2
σ μ的置信区间
设总体X服从正态分布( )
2
,σμN,未知,求
2
σ μ的区间估计。
设是来自总体的样本,由于未知,若仍用上述U的分布求
n
XXX,...,,
21
2
σ μ的置信区间时,因置信上下限包含σ而无法计算。此时,自然想到用样本标准差来代替
n
S
σ,再考虑到式(,有 )42.5
T
nS
X
def
n
/
μ
~ ( )1?nt
从而,对给定的置信区间α?1,存在( )1
2/
nt
α
,使得
(){ } α
α
=?≤ 11
2/
ntTP
其中 (1
2/
)?nt
α
是自由度为1?n 的t 分布关于2/α的上侧分位数,它可由附表3查得,于是有
() α
μ
α
=

11
/
2/
nt
nS
X
P
n

=
+≤≤?

n
S
tX
n
S
tXP
nn
2/2/ αα
μ
α?1
故μ的置信度为α?1的置信区间为
3
+?

n
S
tX
n
S
tX
nn
2/2/
,
αα
(6.16)
例6.22 某糖厂用自动包装机装糖,设每包糖的重量服从正态分布
2
(,)N μ σ,某日开工后测得9包糖的重量分别为(单位,) kg
99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5
试求每包糖平均重量μ的的置信度为95%的置信区间,
解,置信度1 0.95,0.05,α α?= =查附表3得
20.025
( 1) (8) 2.306tn t
α
==,由样本值算得
2
*
99.978,1.47,
n
xS==故
置信下限
*
2
1.47
99.978 2.306 99.046
9
S
xt
n
α
=? =
置信上限
*
2
1.47
99.978 2.306 100.91
9
S
xt
n
α
+=+ =,
所以μ的置信度为95%的置信区间为[ ]99.046,100.91,
6.3.2 正态总体方差的区间估计,
设总体X ~ ( )
2
,σμN,未知,,是来自总体
2
,σμ
n
XXX,...,,
21
X的样本,现求总体方差或标准差
2
σ σ的区间估计。
考虑用估计,由定理5.8知
2
n
S
2
σ
2
χ def
( )
2
2
1
σ
n
n
Sn?
~ ( )1
2

于是,对于给定的置信度α?1,可选择,使得dc,( ) αχ?=≤≤ 1
2
dcP
但满足上式的有很多对,究竟如何选取呢? dc,
通常采用的方法是选取( )1
2
2/
n
α
χ和
2
2/1 α
χ
( )1?n(如图6.1所示),使
P (){}
2
1
2
2/
2
α
χχ
α
=?> n
P (){}
2
1
2
2/1
2
α
χχ
α
=?<
n
于是就有
4
P () ( ){ }11
2
2/1
22
2/
≤≤?
nn
αα
χχχ α?=1 (6.19)
故将式(6.18)代入上式,得

()
()
()
()
α
χ
σ
χ
αα
=
≤≤
1
1
1
1
1
2
2/1
2
2
2/
22
n
Sn
n
Sn
P
nn
nn
(6.20)
例6.23 从自动机床加工的同类零件中抽取16件,测得长度值分别为(单位,),cm
12.15 12.12 12.01 12.08 12.09 12.16 12.06 12.13
12.07 12.11 12.08 12.01 12.03 12.01 12.03 12.06
假设零件的长度服从正态分布
2
(,)N μ σ,分别求零件长度方差
2
σ和标准差σ的的置信度为95%的置信区间,
解,根据题意
16,0.95,0.05,n α α== =查附表4得又
22
0.025 0.975
(15) 27.5,(15) 6.26,χχ==
2
*
12.08,( 1) 0.037,
n
xnS=?=
置信下限
2
*
2
2
(1) 0.037
0.0013,
( 1) 27.5
n
nS
n
α
χ
=≈
置信上限
2
*
2
12
(1) 0.037
0.0059,
( 1) 6.26
n
nS
n
α
χ
=≈
所以
2
σ的置信度为95%的置信区间为[ ]0.0013,0.0059,σ的置信度为95%的置信区间为[ ]0.036,0.077,
6.3.3 两个正态总体均值差的区间估计
设有两个总体X ~ ( )
2
11
,σμN,Y ~ ( )
2
22
,σμN,X与Y相互独立且但未知。和分别是来自总体
2
2
2
1
σσ =
1
,...,,
21
n
XXX
2
,...,,
21 n
YYY X和Y的样本,求两个总体的均值差
21
μμ?的区间估计。
由式(5.43)知
T
( ) ( )
21
21
/1/1 nnS
YX
def
W
+
μμ
~ ( )2
21
+nnt
5
其中
()()
2
11
2
21
2211
21
2
22
2
11
22
+
+?
=
+
+
=

nn
SnSn
nn
SnSn
S
w
于是,对给定的置信度α?1,存在( )1
212/
+nnt
α
,使得
(){}α
α
=?+≤ 11
212/
nntTP

()() ()() αμμ
αα
=
+?++?≤?≤+?+ 1
11
2
11
2
21
212/21
21
212/
nn
SnntYX
nn
SnntYXP
ww
从而得
21
μμ?的置信度为α?1的置信区间为
()() ()()
+?++?+?+
21
212/
21
212/
11
2,
11
2
nn
SnntYX
nn
SnntYX
ww αα
,
例6.24 机床厂某日从两台机床加工的零件中,分别抽取若干个样品,测得零件尺寸分别如下(单位:cm ),
第一台机器 6.2 5.7 6.5 6.0 6.3 5.8 5.7 6.0 6.0 5.8 6.0
第二台机器 5.6 5.9 5.6 5.7 5.8 6.0 5.5 5.7 5.5
假设两台机床加工的零件均服从均匀分布,且方差相等,试求两台机床加工的零件平均尺寸之差的区间估计.( 0.05α = ),
解:用X表示第一台机床加工的零件尺寸,:用Y表示第二台机床加工的零件尺寸,由题设
1 2 0.025
11,9,0.05,(18) 2.1009,nn tα=== =经计算,
1
1
2
*2 2
11 1
1
2
*2 2
22 2
1
*2 *2
11 2 2
12
6.0,( 1) 0.64
5.7,( 1) 0.24
( 1) ( 1) 0.64 0.24
0.2211
21192
n
i
i
n
i
i
W
xnSxnx
ynSyny
nSnS
S
nn
=
=
==
==
+? +
==
+? +?


=
置信下限
0.025
12
11
(18) 0.0912,
W
xyt S
nn
+ =
置信上限
0.025
12
11
(18) 0.5088,
W
xyt S
nn
+ + =
6
故所求
12
μ μ?的置信度为95%的置信区间为[0.0912,0.5088],
6.3.4 两个正态总体方差比的区间估计
设有两个正态总体X ~ ( )
2
11
,σμN和~Y ( )
2
22
,σμN,X与相互独立,
未知,和是分别来自总体X和Y的样本,
现对两个总体的方差比作区间估计。
Y
2
2
2
121
,,,σσμμ
n
XXX,...,,
21 n
YYY,...,,
21
2
2
2
1
/σσ
自然可用和分别作为和的点估计。根据式(5.44)知
2
1
S
2
2
S
2
1
σ
2
2
σ
F def
2
21
2
12
2
2
σ
σ
S
S
~ ( )1,1
12
nnF (6.21)
于是,给定置信度α?1,选取使得 dc,
{}α?=≤≤ 1dFcP
满足上式的有许多对,一般采用的方法是选取dc,( )1,1
122/
nnF
α

2/1 α?
F (1,1
12
nn ),(如图6.2)所示使得
(){}
2
1,1
122/
α
α
=> nnFFP
()
2
1,1
122/1
α
α
=<
nnFFP
从而
()( ){ } α
αα
=≤≤
11,11,1
122/122/1
nnFFnnFP
将式(6.22)代入上式,得
() ()α
σ
σ
αα
=
≤≤
11,11,1
2
2
2
2
2
1
122/
2
2
2
1
2
1
122/1
S
S
nnF
S
S
nnFP
故的置信度为
2
2
2
1
/σσ α?1的置信区间为
()()

2
2
2
2
2
1
122/
2
1
122/1
1,1,1,1
S
S
nnF
S
S
nnF
αα
(6.22)
例6.25 为了考察温度对某物体断裂强力的影响,在与分别重复作了8
次试验,测得断裂强力的数据如下(单位:MPa),
0
70 C
0
80 C
7
0
70 C,20.5 18.8 19.8 20.9 21.5 19.5 21.0 21.2
0
80 C,17.7 20.3 20.0 18.8 19.0 20.1 20.2 19.1
假定与的断裂强力分别用X和Y表示,且
0
70 C
0
80 C
22
11 2 2,
~(,),~(,)XN YNμ σμσ,
X与Y相互独立.试求方差比
22
12
σ σ的置信度为95%的置信区间,
解:由样本值计算得
*2
11
*2
22
8,20.4,0.8857,
8,19.4,0.8286,
nx S
ny S
== =
== =
由10.90,0.1,α α?= =查附表5得
005
77F

(,)= 3.79,
0.95
0.05
11
(7,7) 0.2639,
(7,7) 3.79
F
F
===
将以上结果代入式()()

2
2
2
2
2
1
122/
2
1
122/1
1,1,1,1
S
S
nnF
S
S
nnF
αα
得到
22
12
σ σ的置信度为95%的置信区间为
0.8857 0.8857
0.2639,3.79
0.8286 0.8286

××


,即[0.2821,4.0512],
8