1
概率论与数理统计第七章参数估计
2
第七章 参数估计
在实际问题中,所研究的总体的分布类型往往是已知的,但依赖于一个或几个未知参数,
这时,求总体分布的问题就归结为求一个或几个未知参数的问题,
例如,某灯泡厂在稳定地生产条件下生产的灯泡的寿命 X是一个 随机变量,由实际经验知道它服从
N(μ,σ 2)分布,
要了解该厂 生产的灯泡的质量就要估计参数 μ 和 σ 2
的值,
3
又如在一定时间间隔内某电话交换台接到的呼叫次数 X是一个 随机变量,由泊松流的性质推知它是服从泊松分布的,
要了解该电话交换台在一定时间间隔内接到 k次呼叫的概率就要估计参数 λ 的值,
因此,在总体分布类型已知的情况下,如何从样本估计总体分布中的未知参数就成为数理统计的基本问题之一,
如上这一类问题就是参数估计问题,
另外,在有些实际问题中,人们并不关心总体分布的形式,而只想知道它的某些数字特征 (例如均值与方差 ).对这些数字特征的估计问题,也称为参数估计问题,
4
参数估计有点估计与区间估计两方面问题,下面将分别予以介绍,
5
第七章 参数估计
7.1 点估计
设 θ 是 总体 X的 未知参数,可以用样本 X1,X2,…,Xn
构成的一个 统计量
),,,( 21 nXXX
来估计 θ,称

为 θ 的 估计量,
6
对于具体的 样本值 x1,x2,…,xn,估计量

的 值
),,,(? 21 nxxx
称为 θ 的 估计 值,仍简记为
.
在没有必要强调估计量或估计 值的时候,常把二者都简称 为 估计,
如果总体 X有 m个 未知参数需要估计,我们就要构造
m个 统计量分别作为对每一个参数的估计,
7
点估计就是寻求未知参数的 估计量与估计 值,
由于抽样的随机性,人们不能单靠一次抽样结果所确定的 估计 值去评价这个估计的好坏,应该寻求统计 量
),,,(? 21 nXXX
作为 θ 的估计量,考虑到抽样的一切可能结果,使得在某种统计意义下

是 θ 的好的估计,
有了 θ 的一个好的估计量与 样本值,只要经过计算就可以得到 θ 的估计 值,
8
因此,现在的主要问题是建立求 估计量的方法和鉴定估计量的标准,
9
第七章 参数估计
7.1 点估计
7.1.1 矩估计法
众所周知,随机变量的矩是描写随机变量统计规律的最简单、最基本的数字特征,
随机变量的一些参数往往本身就是随机变量的矩或者是某些矩的函数,
例如 X~N(μ,σ 2)
10
于是,在进行点估计时,人们自然想到,如果可以把未知参数 θ 用总体 矩
μ k=EXk(k=1,2,…,m)
的函数表示为
θ =h(μ 1,μ 2,…,μ m),
那么就可以用样本矩
n
i
k
ik Xna
1
1
估计 总体 矩 μ k,进而用样本矩的函数
),,,(? 21 maaah
11
作为 未知参数 θ 的估计,这就是所谓的 矩估计法,
这种估计法的优良性在下面的 7.1.3中将会看到,
现在就连续型总体来具体说明这一估计法,
离散型总体的情况完全类似,不予重复,
设总体 X的 概率密度 为 f(x;θ 1,θ 2,…,θ m ),其中
θ 1,θ 2,…,θ m为未知参数,
假设 X的前 m阶 矩 μ k=EXk(k=1,2,…,m)都存在,它们是 θ 1,θ 2,…,θ m的函数,记为
gk(θ 1,θ 2,…,θ m ) (k=1,2,…,m),即
k
k EX
12
mkg
dxxfx
EX
mk
m
k
k
k
,,2,1),,,,(
),,,;(
21
21






如果从此方程 (组 )可以解出
mkh mkk,,2,1),,,,( 21
那么,当 μ 1,μ 2,…,μ m均未知时,
mkaaah mkk,,2,1),,,,(? 21
13
就是 θ k的 矩估计,其中
n
i
k
ik Xna
1
1
为样本 k阶原点矩,
14
例 1 设总体 X的 概率密度 为
)0(
.,0
,0,
1
);(?




其它
x
xf
试求 未知参数 θ 的 矩估计,
解 因
202
11
);(
2
0
1







xdxx
dxxxfEX
15
解 因
202
11
);(
2
0
1







xdxx
dxxxfEX

12
从而 θ 的 矩估计为
.22? 1 Xa
16
例 2 求总体 均值 μ =EX与方差 σ 2=DX的 矩估计,
解 由矩估计法得到方程组
2222
2
1
)(



EXDXEX
EX
解得
.,21221
于是 μ 和 σ 2的 矩估计为
Xa 1
17
1? aX
2 2 2 2
21
1
22
1
1
1
()
n
i
i
n
i
i
a a X X
n
X X S
n


18
例 3 设总体 X~B(1,p),0<p<1,试求 参数 p的 矩估计,
解 因
ppxEX
j
jj1?

1p
从而 p的 矩估计为

n
i
iXnXap
1
1
1?
19
这里

n
i
iXnXap
1
1
1?
实际上是事件的频率,而 p为 事件的概率,
所以,人们得到的 矩估计就是用 事件的频率估计事件的概率,
20
例 4设总体服从正态分布 X~N(3,σ 2),σ 2为未知参数,试求 参数 σ 2的 矩估计,
解 μ 1=EX=3,
93
)(
222
22
2



EXDXEX
解得
922
故得 σ 2的 矩估计为
22
2
1
1? 9 9.n
i
i
aX
n

21
第七章 参数估计
7.1 点估计
7.1.2 极大似然估计法
极大似然估计法的直观想法是:一个试验有若干个可能的结果 A1,A2,…,An,…,如果在一次试验中 A1
发生了,那么一般说来作出的估计应该有利于 A1的出现,即使 A1出现的概率最大,
例如,设甲箱中有 99个白球 1个黑球,乙箱中有 1个白球 99个黑球,今 随机取出一箱,再从该箱中任取一球,结果取出的是 白球,
22
例如,设甲箱中有 99个白球 1个黑球,乙箱中有 1个白球 99个黑球,今 随机取出一箱,再从该箱中任取一球,结果取出的是 白球,
我们自然估计这球是从甲箱内 取出的,因为从 甲箱中取得白球的概率为 99%,远大于自乙箱中取得白球的概率为 1%.
又如,甲 (国家级射手 )、乙 (普通射手 )两人射击同一目标,每人各打一发,结果有一人击中目标,我们当然估计是甲射中的,
设总体 X的 概率密度 为 f(x; θ 1,θ 2,…,θ m ),其中
θ 1,θ 2,…,θ m为未知参数,x1,x2,…,xn是取自 总体的 样本 值,现在用上述的直观想法来估计
θ 1,θ 2,…,θ m.
23
设总体 X的 概率密度 为 f(x;θ 1,θ 2,…,θ m ),其中
θ 1,θ 2,…,θ m为未知参数,x1,x2,…,xn是取自 总体的 样本 值,
现在用上述的直观想法来估计 θ 1,θ 2,…,θ m.
我们知道 f(x;θ 1,θ 2,…,θ m )在 x处的 值越大,总体
X在 x附近取值的概率也 越大,而 样本 (X1,X2,…,Xn)
的 概率密度
n
i
mixf
1
21 ),,,;(
在 (x1,x2,…,xn)处的 值越大,样本 (X1,X2,…,Xn)
在 x1,x2,…,xn附近取值的概率也 越大,
24
现在抽样结果是 样本 值为 (x1,x2,…,xn),就是说在一次试验中样本 (X1,X2,…,Xn)取 样本 值
(x1,x2,…,xn)这一事件发生了,
所以人们作出对 θ 1,θ 2,…,θ m的估计时,应 有利于 这一事件的发生,即取使
n
i
mixf
1
21 ),,,;(
达到最大的
m,,?,? 21?
作为对 θ 1,θ 2,…,θ m的估计,
25
根据这个朴素的想法,英国统计学家费歇耳
(R.A.Fisher)提出了极大似然估计的概念并严格证明了这一估计的某些优良性,
下面称
n
i
mi
mn
m
xf
xxxL
LL
1
21
2121
21
),,,;(
),,,;,,,(
),,,(




为 似然函数 (likelihood function),对确定的样本值 x1,x2,…,xn,它是 θ 1,θ 2,…,θ m的函数,
26
若有
),,,( 21 njj xxx
使得
),,,(m a x)?,,?,?( 21
,,,21 21 mm
LL
m



则称
),,,( 21 njj xxx
是 θ j (j=1,2,…,m)的 极大似然估计量 (maximum
likelihood estimator).
27
由于 lnx是 x的单调函数,使
),,,(lnm a x
)?,,?,?(ln
21
,,,
21
21
m
m
L
L
m



成立的
j
也使式
),,,(m a x)?,,?,?( 21
,,,21 21 mm
LL
m



成立,
28
为了计算方便,常从式
),,,(lnm a x
)?,,?,?(ln
21
,,,
21
21
m
m
L
L
m



来求
.?j?
29
通常采用微积分学求函数极值的一般方法,即从方程 (组 )
mj
L
j
,,2,1,0
ln

求得 lnL的驻点,然后再从这些驻点中找到满足式
),,,(lnm a x
)?,,?,?(ln
21
,,,
21
21
m
m
L
L
m




.?j?
30
称式
mj
L
j
,,2,1,0
ln

为 似然方程 (组 )(likelihood equation).
31
例 6 设总体 X服从正态分布 N(μ,σ 2),参数 μ,
σ 2未知,求它们的 极大似然估计,
解 似然函数为


n
i
i
n
n
i
x
n
i
i
x
e
xfL
i
1
2
2
2
2
1
2
)(
1
22
)(
2
1
e x p2
]
2
1
[
),;(),(
2
2



32
于是

n
i
ix
n
L
1
2
2
2 )(
2
1
)2l n (
2
ln?

从而 似然方程组为
2
1
2
2 2 4
1
l n 1
( ) 0
l n 1
( ) 0
22
n
i
i
n
i
i
L
x
Ln
x




33
解似然方程得


n
i
i
n
i
i
xx
n
xx
n
1
22
1
)(
1
1
这就是 μ 和 σ 2的 极大似然估计,
μ 和 σ 2的 极大似然估计与例 2中求得的矩估计是相同的,
34
例 5 设总体 X服从指数分布

.0,0
0,0,
);(
x
xe
xf
x
求 未知参数 λ 的极大似然估计,
解 似然函数为
1
1
,0,0( ) ( ; )
0,
n
i
i
xn
n
ii
i
exL f x



其 它
35
例 5 设总体 X服从指数分布

.0,0
0,0,
);(
x
xe
xf
x
求 未知参数 λ 的极大似然估计,
解 似然函数为
1
1
( ) ( ),0
n
i
ii
n x
x n
i
L e e


36
解 似然函数为
1
1
( ) ( ),0
n
i
ii
n x
x n
i
L e e


于是

n
i
ixnL
1
ln)(ln
从而似然方程为
0
)(ln
1

n
i
ix
n
d
Ld

37
解似然方程得
x
x
n
n
i
i
1?
1

从而 λ 的极大似然估计为
X/1
38
例 7 设总体 X的 概率密度 为
)0(
.,0
,0,
1
);(?




其它
x
xf
试求 未知参数 θ 的 极大似然估计,
解 似然函数为
12
1
1
,0,,,,
( ) ( ; )
0,.
n
nn
i
i
x x x
L f x



其 它
39
例 7 设总体 X的 概率密度 为
)0(
.,0
,0,
1
);(?




其它
x
xf
试求 未知参数 θ 的 极大似然估计,
解 似然函数为


.,0
,0,
1
)( )()1(
其它

nn xxL
40
θO
L(
θ )
x(1) x(2) x(n)
n
nx )(/1
nL
1
)(?
41
(1() )
1
,0,
()
0,.
nn
x
L
x


其 它
42
θO
L(
θ )
x(1) x(2) x(n)
n
nx )(/1
nL
1
)(?
43
此处 似然函数作为 θ 的 函数不连续,因此不能从解似然方程得到 θ 的 极大似然估计,
但是由 L(θ )的表达式易知 L在 θ =x(n)处取极大值,
因此由极大似然估计的定义知
),,,m a x (? 21)( nn XXXX
为 θ 的 极大似然估计,
44

12
1
11( ) (,,,; ) n
n n
i
L L x x x


l n ( ) l nLn
l n ( ) 0d L n
d


由极大似然估计的定义知 θ 越小越好,但 θ 不能小于 X(n),故 θ 的 极大似然估计为
( ) 1 2? m a x (,,,),nnX X X X
45
对于离散型总体,似然函数表达式
),,,;,,,(
),,,(
2121
21
mn
m
xxxL
LL





n
i
mi
m
xXP
LL
1
21
21
),,,;(
),,,(


同样地取使 式
46
同样地取使 式
),,,(m a x)?,,?,?( 21
,,,21 21 mm
LL
m



或式
),,,(lnm a x
)?,,?,?(ln
21
,,,
21
21
m
m
L
L
m



成立的
m,,?,? 21?
作为 θ 1,θ 2,…,θ m的极大似然估计,
47
例 8 设总体 X~B(1,p),0<p<1,试求 参数 p的 极大似然估计,
解 设 X1,X2,…,Xn为 X的一 个 容量为 n的样本,那么
Xi(i=1,2,…,n)的概率分布为
Xi 0 1
P 1?p p

10,)1()( 1 或其中 ixxi xppxXP ii
48
于是由 离散型总体似然函数 的 表达式 知 此处的似然函数为
10
)1()1()(
)1(11



p
pppppL
xnxn
xnx
n
i
i
n
i
i
取对数得
)1l n ()1(ln)(ln pxnpxnpL
似然方程为
49
0
1
)1()(ln?

p
xn
p
xn
dp
pLd
解得
xx
n
p
n
i
i
1
1?
这就是未知 参数 p的 极大似然估计,它与例 3中求得的矩估计也是相同的,
50
例 9 设总体 X服从参数为 λ 的泊松分布,求未知参数 λ 的极大似然估计,
解 设 X1,X2,…,Xn为 X的一 个 容量为 n的样本,那么
nie
x
xXP
i
x
ii
i
,,2,1,
!
)(
似然函数为
0,
!!
)
!
()(
11
1



n
n
x
n
i i
x
e
xx
e
x
L
n
i
i
i
51
取对数得
nxxxL n
n
i
i
)!!l n (ln)()(ln 1
1
似然方程为
01)(ln
1

nx
d
Ld n
i
i

0?x
时,解得
52
xx
n
n
i
i
1
1?
此即为 λ 的极大似然估计,

0?x
时,λ 的极大似然估计不存在,
( 0),1,2,,iP X e i n
53
上面介绍了未知 参数的两种估计方法:
矩估计法和极大似然估计法
用矩估计法估计参数通常比较方便,便于实际应用,
但所得估计的优良性有时比较差,
极大似然估计法使用时常常要进行比较复杂的计算,
然而得到的估计在许多情形下具有各种优良性,它是目前仍然得到广泛应用的一种估计方法,
54
例,(2002,试卷一,7分 )
设 总体 X的概率分布为
X 0 1 2 3
P θ 2 2θ (1?θ ) θ 2 1?2θ
其中 θ (0< θ <1/2)是未知参数,利用总体 X的如下样本值
3,1,3,0,3,1,2,3
求 θ 的矩估计 值 和最大似然估计 值,
55
解,
1
220 1 2 ( 1 ) 2 3 ( 1 2 )
EX?


34
1
( 3 1 3 0 3 1 2 3 )
8
1
1 6 2
8
X

56

EX x?

3 4 2
解得 θ 的矩估计 值 为
1?,
4

57
例,(2002,试卷一,7分 )
设 总体 X的概率分布为
X 0 1 2 3
P θ 2 2θ (1?θ ) θ 2 1?2θ
其中 θ (0< θ <1/2)是未知参数,利用总体 X的如下样本值
3,1,3,0,3,1,2,3
求 θ 的矩估计 值 和最大似然估计 值,
58
对于给定的样本 值,似然函数为
2 2 2 4( ) [ 2 ( 1 ) ] ( 1 2 )L
6 2 44 ( 1 ) ( 1 2 )
6 2 4l n ( ) l n 4 l n l n ( 1 ) l n ( 1 2 )L
l n 4 6 l n 2 l n ( 1 ) 4 l n ( 1 2 )
l n ( ) 1 1 2
6 2 4
1 1 2
6 2 8
1 1 2
dL
d







59
l n ( ) 1 1 2
6 2 4
1 1 2
6 2 8
1 1 2
dL
d







26 28 24
( 1 ) ( 1 2 )





l n ( ) 0dL
d
60

21 2 1 4 3 0
从而
14 52 7 13
24 12


7 1 3 1
1 2 2

不合题意,所以 θ 的最大似然估计 值为 7 1 3
.
12

61
第七章 参数估计
7.1 点估计
7.1.3 鉴定估计量的标准
对同一 未知 参数用不同的估计方法得到的估计量可能是不同的,甚至于都用矩估计法或都用极大似然估计法也可能得到不同的估计量,
62
例如总体 X服从参数为 λ 的泊松分布,由于 λ 可用总体 矩的不同函数来表示:
1 EX

212 DX
故用矩估计法也可能得到两种不同的估计量:
X


n
i
i xxn
1
2)(1
63
既然对同一 未知 参数可以找到种种不同的估计量 (实际上,从估计量的定义可知,原则上任何统计量都可以作为 未知 参数的估计量 ),那么它们中哪一个是较好的估计呢?
好的标准又是什么?
下面介绍最常用的三条标准,
64
1.无偏性

),,,( 21 nxxx
是 θ 的估计量,若对任何可能的参数值 θ 都有
)],,,(?[ 21 nXXXE?
则称

是 未知 参数 θ 的 无偏 估计量,
65
无偏性表示

围绕被估计参数 θ 而摆动,以致平均误差为零,即用

估计 θ 没有系统性误差,
这里和以后将用
)()( TDTE 和
分别表示 随机变量 T的概率分布中的参数值为 θ 时,
随机变量 T的数学期望和方差,
66
例 10 样本 k阶原点矩
n
i
k
ik Xna
1
1
是 总体 k阶原点矩 μ k=EXk(k≥ 1)的无偏 估计,
特别地,样本均值是 总体 均值的无偏 估计,
67
例 11 样本方差
2),(
1
1
)(
1
1
1
22
1
22

nXnX
n
XX
n
S
n
i
i
n
i
i
是 总体 方差 σ 2=DX的无偏 估计,
证 设 X1,X2,…,Xn独立,每个 Xi与 X总体 有相同的分布,因而
EXi=μ,DXi=σ 2,i=1,2,…,n.
68

n
XDXE
2
,
故由
)(
1
1
)(
1
1
1
22
1
22
n
i
i
n
i
i
XnX
n
XX
n
S
69

2
2
2
22
1
22
1
22
)]()([
1
1
)(
1
1
)(
1
1


n
nn
n
XnEEX
n
XXE
n
ES
n
i
i
n
i
i
70
由例 11样本方差 是 总体 方差的无偏 估计可见,样本二阶中心矩

n
i
i XXnS
1
22 )(1
作为 σ 2的 矩估计量和某些情况下的极大似然估计量是有偏的,这就是引进样本方差 S2的原因,
通常用 S2作为总体方差的估计,
当然,当样本容量较大时,S*2与 S2之间相差是很小的,
71
由 例 10和 11可见,用 样本原点矩估计 总体 原点矩有无偏 性,但一般 矩估计不一定具有无偏 性,
虽然 无偏 性只是表示平均误差为零,但从实际应用的角度看无偏估计的意义在于,如果使用这一 估计量
),,,( 21 nXXX
反复计算出 N个估计值
N,,?,? 21?
72
虽然 无偏 性只是表示平均误差为零,但从实际应用的角度看无偏估计的意义在于,如果使用这一 估计量
),,,( 21 nXXX
反复计算出 N个估计值
N,,?,? 21?
那么根据大数定律,当 N很大时,它们的平均值
Ni i N1 /
可以给出非常接近于真值的估计,
73
从这一意义上说,无偏 性是衡量 估计量好坏的一个重要标准,
但在实际应用问题中,并不是都能进行反复抽样的,
通常只是由一个 容量为 的样本 值,根据 估计量来计算出一个 估计值,就以此作为对未知参数的估计,
这样,要想达到准确的估计值,自然要在 无偏 估计中选择有较小方差的估计,
74
2.有效性

),,,( 21 nXXX

),,,( 21 nXXX
都是 θ 的 无偏 估计量,如果对任何可能的参数值 θ
都有
)?()?( DD
75
且至少对某个 参数值 θ 0使小于号成立,则称

有 效,
76
例 12 若取
1,?,1?
111


n
i
i
n
i
ii
n
i
i cXcXnX
显然,它们都是总体均值 μ 的无偏估计,





n
i
i
n
i
ii
n
i
ii
DXcDXc
XcDD
1
2
1
2
1
)(
)(
77
利用柯西不等式



n
i
i
n
i
n
i
i
n
i
i cncc
1
2
1
2
1
22
1
)1)(()||(1

D
n
DXD
可见,作为 μ 的无偏估计有效,较 )1(
11


n
i
i
n
i
ii cXcX
78
除非
.121
n
ccc n
特别地,取
0,1 21 nccc?
即知
.1 有效较 XX
79
3.相合性
人们自然希望样本容量越大,越能精确地估计未知参数,也就是说,随着样本容量的增大,一个好的估计量与被估计参数任意接近的可能性就随之增大,
这就产生了 相合性 (或称一致性 )的概念,
80
称估计量
),,,( 21 nnn XXX
是未知 参数 θ 的相合 (或一致 )估计量,如果
n
依概率收敛于 θ,即对任意的 ε >0,有
.0)|?(|lim

n
n
P
81
例 13 样本 k阶原点矩
n
i
k
ik Xna
1
1
是 总体 k阶原点矩 μ k=EXk(k≥ 1)的 相合估计,
证 设 X1,X2,…,Xn独立同分布,可见对任意的 k≥ 1,
X1k,X2k,…,Xnk也相互独立且与 Xk同分布,
因此,由 辛钦 大数定律,对任意的 ε >0,有
0)|
1
(|lim
1


k
n
i
k
in EXXnP
82
这说明 样本 k 阶原点矩 α k 是 总体 k 阶原点矩
μ k=EXk(k≥ 1)的 相合估计,
可以证明样本方差 S2是总体方差 σ 2的 相合估计,
由于样本 k阶原点矩 α k与样本方差 S2分别作为 总体 k
阶原点矩 μ k与总体方差 σ 2的 估计是 无偏的,相合的,因而是较好的估计,常常在实际中使用它们,
83
还可以证明:若是 h(t1,t2,…,tm)连续函数,那么
h(α 1,α 2,…,α m)是 h(μ 1,μ 2,…,μ m)的相合估计,
所以用矩估计法确定的统计量一般是相合估计,
人们还证明了在相当广泛的条件下,极大似然估计也是 相合估计,
由大数定律,通常相合性对一个估计量来说是容易满足的,然而在很多情况下,证明一个估计的相合性并不容易,而且有的估计并不具有相合性,
84
第七章 参数估计
7.2 区间估计
参数的点估计是用一个数

来估计 未知参数 θ,
85
在评价近似式

的质量时,主要是用估计量的数字特征来表征估计的优劣 (无偏性,有效性相合性 ),仅在样本容量充分大时,对近似等式的误差作了一般性的说明 (相合性 ).
实际上,点估计对估计的精度与可靠度并没有作明确的回答,
例如用样本均值 估计总体 均值,有多大的误差和以多大的可靠度可以期望误差不超过某一个限度等问题都未讲述,
这些问题在样本容量较小时,显得尤其重要,
86
估计的精度用置信区间表示,可靠性用置信度表示,
下边就来说明这个问题,
为了叙述方便,今后在上下文能辨别清楚的情况下,
常常把样本和样本值统称为样本并用小写字母
x1,x2,…,xn
表示,并把样本均值和样本方差与它们的观察值分别用小写字母
2xs和
表示,
87
对未知参数 θ,如果两个统计量
),,,(),,,,( 21222111 nn xxxxxx
使对给定的 α (0<α <1)有
)(1)( 21P
则称
)?,?( 21
为 θ 的 置信区间,1?α 为 置信度,
21 和
分别为 置信下限 和 置信上限,
88
置信度 1?α 要根据具体问题选定,为查表方便,常取 α =0.1,0.05,0.01.
关于式
)(1)( 21P
的含义解释如下,
初看起来,式 (*)似乎表示未知参数落在区间内的概率为 1?α,
这种看法是不对的,因为 θ 是一个完全确定的数,

)?,?( 21
是随机区间,故式 (*)的正确含义为该随机区间包含
θ 的概率为 1?α,
89
在对未知参数作具体估计时,人们把由样本值算出的一个完全确定的区间
)?,?( 21
也称为 θ 的置信区间,这时,
)?,?( 21
不再是随机区间了,
90
当取 α =0.05时,如果取 100个容量为 n的样本,可以得到 100个置信区间,那么其中大约有 95个是包含
θ 的,
所以,如果只抽取一个容量为 n的样本,得到一个具体的置信区间
)?,?( 21
就认为它包含 θ,
当然,这样的判断可能是错误的,即实际上
)?,?( 21
并不包含 θ,
但只要 α 很小,判断错了的可能性是很小的,
91
构造置信区间的一般方法如下:
(1)设法构造一个含有未知参数 θ 而不含其它未知参数的随机变量 T(x1,x2,…,xn;θ ),使其分布为已知且与 θ 无关;
(2)对给定的 α,根据 T的分布查表找出两个临界值
c与 d,使
P{c<T(x1,x2,…,xn;θ )<d}=1?α ;
(3)将不等式 c<T(x1,x2,…,xn;θ )<d转化为等价形式
),,,(?),,,(? 212211 nn xxxxxx
则有
92
1)),,,(?),,,(?( 212211 nn xxxxxxP
于是
)?,?( 21
即为 θ 的置信度为 1?α 的置信区间,
93
第七章 参数估计
7.2 区间估计
7.2.1 单个正态总体参数的区间估计
设 x1,x2,…,xn为取自正态总体 N(μ,σ 2)的一个容量为 n的样本,
2xs和
分别表示样本均值和样本方差,
现在考虑以下的区间估计问题
94
1.σ 2已知,求 μ 的置信度为 1?α 的置信区间
由式
)1,0(~ Nnxu

对给定的 α,查标准正态分布表 (附表 2)得到临界值
uα /2(如图 )使
1}{ 2/2/ uuuP
95
uO
φ (
u)
2/?u
α /2
2/?u?
96
将上式括号内的不等式
2/2/
unxu
转化为等价形式
n
ux
n
ux
2/2/
故得 μ 的置信度为 1?α 的置信区间为
),( 2/2/
n
ux
n
ux


97
例 1 设在正常条件下,某机床加工的小孔的孔径
X(单位:厘米 )服从 N(μ,σ 2)分布,长期积累资料表明 σ = 0.048.今从加工的 小孔中,测得 10个孔径的平均值为 1.416.试求 μ 的置信区间 (置信度为
0.95).? 解 由已知
05.0,10,0 4 8.0,4 1 6.1 nx
从标准正态分布表 N(0,1)查出
96.1025.02/05.02/ uuu?
故置信限为
98
0 3 0.01,4 1 6
10
0,0 4 8
1,9 61,4 1 6
2/


n
ux
μ 的置信度为 0.95的置信区间为
).446.1,386.1(
99
2.σ 2未知,求 μ 的置信度为 1?α 的置信区间
由式
)1(~ ntn
s
xt?
对给定的 α,查 t分布表 (附表 4)得到临界值 tα /2(n?1)
(如图 )使
1)}1()1({ 2/2/ nttntP
100
tO
f(t)
α /2
)1(2/ nt? )1(2/?nt?
101
将上式括号内的不等式
)1()1( 2/2/ ntn
s
xnt

转化为等价形式
n
s
ntx
n
s
ntx )1()1( 2/2/
故得 μ 的置信度为 1?α 的置信区间为
) )1(,)1( ( 2/2/
n
s
ntx
n
s
ntx
102
例 2 设 有 一批胡椒粉,每袋净重 X(单位:克 )服从
N(μ,σ 2)分布,今任取 8袋测得 净重是 12.1,11.9,
12.4,12.3,11.9,12.1,12.4,12.1.试求 μ 的置信区间 (α =0.01).
解 经计算
15.12)1.124.121.12
9.113.124.129.111.12(
8
1
1
1



n
i
i
x
n
x
103
02.0
04.0
])15.121.12()15.121.12[(
7
1
)(
1
1
22
1
22


s
xx
n
s
n
i
i
104
又 n=8,α =0.01,
4 9 9 5.3)7()7()1( 005.02/01.02/ ttnt?
故置信限为
25.01 2,1 5
8
0,2
3,4 9 9 51 2,1 5 )1(
2/


n
s
ntx
μ 的置信区间为
).40.12,90.11(
105
3,μ 未知,求 σ 2的置信度为 1?α 的置信区间
由式
)1(~
)1( 2
2
2
2 nsn?
对给定的 α,查?2分布表 (附表 3)得到临界值
21-α /2(n?1)与?2α /2(n?1)
(如图 )使
1))1()1(( 2 2/22 2/1 nnP
106
xO
f(x)
α /2
)1(2 2/1 n )1(2
2/?n
α /2
107
将上式括号内的不等式
)1()1( 2 2/22 2/1 nn
转化为等价形式
)1(
)1(
)1(
)1(
2
2/1
2
2
2
2/
2

n
sn
n
sn

则得 μ 未知时 σ 2的置信度为 1?α 的置信区间为
)
)1(
)1(
,
)1(
)1(
(
2
2/1
2
2
2/
2
n
sn
n
sn

108
μ 未知时 σ 的置信度为 1?α 的置信区间为
)1(
)1(
,
)1(
)1(
2
2/1
2
2
2/
2
n
sn
n
sn

109
例 3 (例 2)设 有 一批胡椒粉,每袋净重 X(单位:克 )
服从 N(μ,σ 2)分布,今任取 8袋测得 净重是 12.1,
11.9,12.4,12.3,11.9,12.1,12.4,12.1.试求 σ 2
的置信区间 (α =0.01).
解 经计算
15.12)1.124.121.12
9.113.124.129.111.12(
8
1
1
1



n
i
i
x
n
x
110
04.0
])15.121.12()15.121.12[(
7
1
)(
1
1
22
1
22


n
i
i
xx
n
s
111
又 n=8,α =0.01,
98 9.0)7()18()1(
27 8.20)7()18()1(
2
9 9 5.0
2
2/01.01
2
2/1
2
0 0 5.0
2
2/01.0
2
2/




n
n
故置信限为
283.0
989.0
)2.0(7
)1(
)1(
014.0
278.20
)2.0(7
)1(
)1(
2
2
2/1
2
2
2
2/
2
n
sn
n
sn
112
σ 2的置信区间为
).283.0,014.0(
113
如在本节的开头所述,区间估计有两个要素:一是其精度,二是其可靠度,分别用置信区间与置信度表示,
在进行区间估计时,人们自然希望置信区间短一些,
置信度大一些,
但是在样本容量一定的情况下,二者是不可兼得的,
不难看出,样本容量一定,置信度越大,置信区间越长,估计的意义也就越小,
所以,在置信区间的定义中,限制置信度小于 1,而决不能要求达到 1.
实际上,因为抽样具有随机性,人们不能以百分之百的可靠度对未知参数作出任何有意义的估计,
114
例如在 1,2中,如果硬性要求绝对可靠,那么只能用区间 (?∞,+∞ )来估计 μ,这显然是毫无意义的,
但只要给定了置信度 1?α (0<α <1),不管它多么接近 1,人们总可以对未知参数作出估计,而且可以用增大样本容量的办法来缩短置信区间的长度,这正是统计方法可以发挥作用之处,
当然,在实际问题中,样本容量太大是很难办到的,
所以人们要确定合适的 α 与 n.
115
对给定置信度 1?α 和同一未知参数 θ,即使使用同一个 随机变量 T(x1,x2,…,xn;θ ),也可以构造出许多不同的置信区间,
例如在 3中,如果从?2分布表 (附表 3)查出临界值
)1()1( 2121 21 nn 与
满足
2
2
1
2
1
2
1
2
)}1({
)}1({
2
1




nP
nP
116
那么,只要
2121,0,0
成立
)
)1(
)1(
,
)1(
)1(
(
2
1
2
2
2
12
n
sn
n
sn

就是 σ 2的置信度为 1?α 的置信区间,
117
一般说来,在进行区间估计时,总是先规定一个置信度,以保证其可靠度达到一定的要求,
在这个前提下,精度越高越好,
对确定的样本容量,在一定置信度下,置信区间长度的均值
)( 12E
越小越好,
对这个问题的讨论,已超出了本书的范围,
在 3中选择 α 1=α 2=α /2,主要是为了查表方便,而不是基于如上的考虑,因为在这种情况下,求长度最短的置信区间是较复杂的事情,不便于实际计算,
118
第七章 参数估计
7.2 区间估计
7.2.2 两个正态总体参数的区间估计
设总体 X~N(μ 1,σ 12),Y~N(μ 2,σ 22).
21,,,,,,2121 nn yyyxxx 和
为取自正态总体 X的容量为 n1的一个样本,
2
1xs和
分别表示它的样本均值和样本方差;
119
2,,,21 nyyy?
为取自正态总体 Y的容量为 n2的一个样本,
2
2ys和
分别表示它的样本均值和样本方差,
又设这两个样本相互独立,现在考虑以下的区间估计问题,
120
1.已知 σ 12=σ 22,求 μ 1?μ 2的置信度为 1?α 的置信区间? 由式
)2(~
11
)(
21
21
21

nnt
nn
S
yx
t
W

其中
2
)1()1(
21
2
22
2
11


nn
snsn
S W
121
对给定的 α,查 t分布表 (附表 4)得到临界值
tα /2(n1+n2?2)
(如图 )使
1)}2()2({ 212/212/ nnttnntP
将上式括号内的不等式转化为等价形式,容易得到
μ 1?μ 2的置信度为 1?α 的置信区间为
122
tO
f(t)
α /2
)2( 212/ nnt? )2( 212/ nnt?
123
)
11
)2(
,
11
)2((
21
212/
21
212/
nn
Snntyx
nn
Snntyx
W
W


124
2.求 σ 12/σ 22 的置信度为 1?α 的置信区间
由式
)1,1(~ 21
2
1
2
2
2
2
2
1 nnF
s
s
F
对给定的 α,查 F分布表 (附表 3)得到临界值
F1-α /2(n1?1,n2?1)与 Fα /2(n1?1,n2?1)
(如图 )使
125
xO
f(x)
α /2
)1,1( 212/1 nnF? )1,1( 212/ nnF?
α /2
126



1)}1,1(
)1,1({
212/
212/1
nnF
FnnFP
将上式括号内的不等式转化为等价形式,容易得到
σ 12/σ 22 的置信度为 1?α 的置信区间为
)
)1,1(
1
,
)1,1(
1
(
212/1
2
2
2
1
212/
2
2
2
1


nnFs
s
nnFs
s
127
例 4 设从 正态总体 X~N(μ 1,σ 12)与总体
Y~N(μ 2,σ 22)中独立地各抽取容量为 10的样本,其样本方差依次为 0.5419,0.6065.求方差比 σ 12/σ 22
的置信区间 (置信度为 0.90).
解 由题意知 (α =0.01)
10.0,10
,6065.0,5419.0
21
2
2
2
1


nn
ss
查表得
128
18.3)9,9(
)110,110()1,1(
05.0
2/10.0212/


F
FnnF?
从而
18.3
1
)9,9(
1
)9,9()1,1(
05.0
95.0212/1


F
FnnF
129
故置信限为
841.2
18.3
6065.0
5419.0
)1,1(
1
281.0
18.3
1
6065.0
5419.0
)1,1(
1
212/1
2
2
2
1
212/
2
2
2
1




nnFs
s
nnFs
s
130
故 σ 12/σ 22的置信区间为
).841.2,281.0(
131
第七章 参数估计
7.2 区间估计
7.2.3 大样本区间估计
7.2.1与 7.2.2中的结果,无论 样本容量 n多大都适用,因为那里构造置信区间时所用随机变量的精确分布都已知,这是在正态总体的大前提下才得到的,
对于非正态总体,通常精确分布很难找到,为了对未知参数进行区间估计,只好利用中心极限定理来处理,这样,就需要样本容量 n充分大,
132
(一 )一般总体均值的区间估计
设总体 X的均值为 μ,方差为 σ 2,今从总体 X中不断抽取样本,随着样本容量的增大,得到一个独立同分布的随机变量序列 x1,x2,…,xn,…,
由中心极限定理,对任何实数 x有
dtex
n
nx
P
t
x
n
i
i
n
21
2
2
1
lim



133
即当 n充分大时
)1,0(
~
Nnxu
对给定的 α,查标准正态分布表 N(0,1)表 (附表 2)
得到临界值 uα /2使
1}{ 2/2/ uuuP
将上式括号内的不等式转化为等价形式,容易得到
μ 的置信度近似为 1?α 的置信区间为
134
),( 2/2/
n
ux
n
ux


如果 σ 未知,可用样本标准差 S代替总体标准差 σ
而得到的置信区间,
实际上,可以证明,当 n充分大时,有
)1,0(
~
Nn
S
xu
135
如果 σ 未知,可用样本标准差 S代替总体标准差 σ
而得到的置信区间,
实际上,可以证明,当 n充分大时,有
)1,0(
~
Nn
S
xu
故可得 μ 的置信度近似为 1?α 的置信区间为
),( 2/2/
n
s
ux
n
s
ux
136
(二 ) 0— 1分布参数的区间估计
设总体 X~B(1,p)(0<p<1).显然,μ =p,
σ 2=p(1?p).? 为估计 p,取容量 n充分大 的 样本 x
1,x2,…,xn.由中心极限定理
)1,0(
)1( ~
Nn
pp
px
n
x
u?
对给定的 α,有
1)|(| 2/uuP
137
上式括号内的不等式
2/
)1(
un
pp
px
等价于
2
2/
2
)1(
)(
upp
pxn

0)2()( 22 2/22 2/ xnpuxnpun
138

22
2/
2
2/ ),2(,xncuxnbuna
知上式的等价形式为
21 ppp
其中
)4(
2
1
),4(
2
1
2
2
2
1
acbb
a
p
acbb
a
p


139
从而 p的置信区间为
)?,?( 21 pp
置信度近似为为 1?α,
由于
244,10 xnxnx

0]4)4[(4 22 2/2 2/2 xnxnuuacb
因此上边的
21?,? pp
总是存在的,
140
例 5 为 估计一批齿轮的一级品率 p,从中抽取 100个进行检验,发现有 60个一级品,若取 α =0.05,试求 p的置信区间,
解 由题意知
0 2 5.02/,6.0,1 0 0xn

69.0?,50.0?
,36,84.123,84.103
,84.3,96.1
21
2
2/2/



pp
cba
uu

141
从而 p的置信区间为
).69.0,50.0(
142
参数估计历届考题
143
例,从正态总体 N(3.4,62)中抽取容量为 n的简单随机样本,如果要求其样本均值位于区间 (1.4,5.4)内的概率不小于 0.95,问样本容量 n至少应取多大?
解,依题意有 0,9 5 ( 1,4 5,4 )
5,4 3,4 1,4 3,4
( ) ( )
6 / 6 /
1
2 ( ) 1
3
PX
nn
n




144

)96.1(975.0)
3
1( n
查正态分布表得
96.1
3
1?n

57.349)96.1( 2n
所以 n至少应取为 35,
145
例,(2000,试卷三,8分 )
设 0.50,1.25,0.80,2.00是来自总体 X的简单随机样本,已知 Y=lnX服从 正态分布 N(μ,1).
(1)求 X的数学期望 EX(记 EX为 b);
(2)求 μ 的置信度为 0.95的置信区间;
(3)利用上述的结果求 b的置信度为 0.95的置信区间
(u0.025= 1.96,u0.05= 1.65),
146
解 (1)由 Y=lnX得 X=eY,而 Y~N(μ,1),于是
2
1
2
)1(
2
1
2
2
)(
)1(
2
1
2
1
2
1
2
2
2










etdee
dteeyt
dyeeEeEXb
t
t
t
y
yY

147
(2)总体 Y~N(μ,1),样本值为 ln(0.50),ln(1.25),
ln(0.80),ln(2.00),μ 的置信度为 0.95的置信区间为
)
4
1
,
4
1
( 025.0025.0 uYuY

01ln
4
1
)]0.2l n ()8.0l n ()25.1l n ()5.0[ l n (
4
1

Y
148
u0.025= 1.96
所以,μ 的置信度为 0.95的置信区间为
(?0.98,0.98),
149
(3)由函数 y=ex的严格递增性,可见
)(
)48.1
2
1
48.0(
)98.098.0(95.0
48.198.0



YY
eeP
YYP
YYP
注意到
0?Y
150
从而 b的置信度为 0.95的置信区间为
).,( 48.198.0 ee