§ 5 总体参数的估计从本章起,我们开始介绍统计推断,它是数理统计的一个重要组成部分。所谓统计推断就是利用样本(子样)提供的信息对总体的某些统计特性进行估计和判断,从而认识总体。 统计推断 分为两大类,一类是 参数估计,另一类是 假设检验 。本章介绍参数估计。
设总体 X的分布函数的类型已知,但是其中有一个或多个参数未知。设 X1,X2,┄,Xn 为总体 X的容量为 n的样本。 参数估计就是讨论如何由样本 X1,X2,┄,Xn 提供的信息对未知参数作出估计,以及讨论如何建立一些准则对作出的估计进行评价。 一般是建立适当的统计量
,当样本观察值为 x1,x2,┄,xn 时,如果以作为总体分布中未知参数 θ 的估计值,这样的估计方法叫做点估计。并称 为 θ 的估计量。如果总体分布函数中有 t个未知参数,则要建立 t个统计量作为 t
个未知参数的估计量。
点估计的方法很多,本章介绍最常见的矩法估计与极大似然估计。
),,,(? 21 nXXX
),,,(? 21 nxxx
),,,(? 21 nXXX
§ 5.1 点估计本节要求理解参数的点估计、估计量与估计值的概念;掌握矩估计法(一阶、二阶)和极大似然估计法;
了解估计量的无偏性,有效性(最小方差性)和一致性
(相合性)的概念,并会验证估计量的无偏性。
设总体 X的分布函数的形式为已知,但它的一个或多个参数为未知,借助于总体 X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。
例 1 电话总机在某一段时间内接到的呼唤次数服从泊松分布,参数 λ为未知。现观察一分钟内接到的呼唤次数,如果观察 40次,获得数据如下,
呼唤叫次数 /分 k 0 1 2 3 4 5 6 7
观察次数 nk 5 10 12 8 3 2 0 0
求泊松分布中未知参数 λ 的估计。
点估计问题的一般提法如下,设总体 X的分布函数 F(x,θ) 的形式为已知,θ 是待估参数。
X1,X2,┅,Xn 是 X的一个样本,x1,x2,┅,xn 是相应的一个样本值。点估计问题就是要构造一个适当的统计量,用它的观察值作为未知参数 θ的近似值。我们称为 θ的 估计量,称 为 θ的 估计值 。
由于估计量是样本的函数,因此对于不同的样本值,θ的估计值一般是不相同的。
如例 1,我们用样本均值来估计总体均值。即有估计量 估计值下面介绍两种常用的构造估计量的方法:矩估计法和最大似然 估计法。
),,,(? 21 nXXX
),,,(? 21 nXXX
),,,(? 21 nxxx
),,,(? 21 nxxx
40,1
1

nXn
n
k
k
21
1

n
k
kxn
§ 5.1.1 矩估计法设 X1,X2,┅,Xn 是总体 X的一个样本,假设总体 X的前 k阶矩 μi=E(Xi) 存在。一般来说,它们是未知参数
θ1,θ2,…,θ k 的函数。
基于样本矩 依概率收敛于相应的总体矩 μi(i=1,2,…,k),样本矩的连续函数依概率收敛于相应的总体矩的连续函数,我们就 用样本矩作为相应的总体矩的估计量,而以样本矩的连续函数作为相应的总体矩的连续函数的估计量。这种估计方法称为矩估计法。由矩估计法得到的未知参数的估计量称为矩估计量,矩估计量的观察值称为矩估计值。
例 2 设总体 X服从泊松分布 π(λ ),λ 是未知参数,
X1,X2,┅,Xn 是 总体 X的一个样本,试求未知参数 λ 的矩估计量。
n
XXXA inii
i
21
例 3 设 X1,X2,┅,Xn 是 总体 X的随机样本,且总体的二阶矩存在。试求总体均数 μ 和总体方差 σ 2 的矩估计量。
解 因为解得分别以 A1,A2 代替 μ 1,μ 2,得 μ 和 σ 2 的矩估计量分别为所得结果表明,总体均值与方差的矩估计量不因不同的总体分布而异,


2222
2
1
)]([)()(
)(


XEXVXE
XE

2
12
2
1


2
1
2
1
22
12
2
1
)(
11
,?




n
i
i
n
i
i XXnXXnAA
XA
矩估计法的基本思想是:如果总体中有 k个未知参数可以用前 k阶样本矩估计相应的前 k阶总体矩,然后利用未知参数与总体矩的函数关系,求出参数的估计量,即为矩估计量。
具体作法是:令总体矩 μi=Ai(样本矩 ),i =1,2,…,k,
得到一个包含 k个未知参数 θ1,θ2,…,θ k 的联立方程,从中解出 θ1,θ2,…,θ k,则这组解 就作为 θ1,θ2,…,
θk 的矩估计量。其观察值就是矩估计值。
点估计的矩估计法是由皮尔逊 (Pearson)提出的,它直观、简便,
特别对总体数学期望和方差进行估计时不需要知道总体的分布。但是它要求总体原点矩存在,而有些随机变量(如柯西分布)的原点矩不存在,因此就不能用此法进行参数估计。此外,矩法估计有时不唯一(如泊松分布中参数 λ 的矩法估计按例 3有因为 E(X)=V(X)= λ ),有时不合理(如离散型均匀分布中参数 N的矩估计量为 不一定为正整数,推导略);再者,它常常没有利用总体分布函数提供的信息,因此很难保证它有优良的性质。

n
i
i XXnX
1
2)(1?,
12?X
k,,?,? 21?
§ 5.1.2 最大似然估计法如果一事件发生的概率为 p,且 p只能取 0.01或 0.9。现在在连续两次试验中该事件都发生了,显然认为 p=0.9是合理的。两人向同一目标各打一枪,一人击中目标,另一人没击中目标,认为击中目标者比没击中目标者射击技术好也是合理的,这些都是 极大似然估计法的基本思想。即使样本获得最大概率的参数值作为未知参数的估计值。
若总体 X属于离散型,其分布律 P{X=x}=p(x,θ),θ∈ Θ 的形式为已知,θ为待估参数,Θ是参数 θ的可能取值范围。设 X1,X2,┅,Xn 是来自总体 X的样本,则 X1,X2,┅,Xn 的联合分布律为又设 x1,x2,┅,xn是相应于样本 X1,X2,┅,Xn 的一个样本值。易知样本
X1,X2,┅,Xn 取到观察值 x1,x2,┅,xn的概率,亦即事件
P{X1=x1,X2=x2,…,X n=xn} 发生的概率为这一概率随 θ的取值而变化,它是 θ的函数,L(θ)称为样本的 似然函数 (注意,这里 x1,x2,┅,xn是已知的样本值,它们都是常数)
n
i
ixP
1
),(?

n
i
in xPxxxLL
1
21,),();,,,()(
关于最大似然估计法,我们有以下的直观想法:现在已经取到样本值 x1,x2,┅,xn了,这表明取到这一样本值的概率 L(θ)比较大。
我们当然不会考虑那些不能使样本 x1,x2,┅,xn出现的 θ∈ Θ 作为 θ的估计,再者,如果已知当 θ=θ0∈ Θ 时使 L(θ)取很大值,而 Θ中的其它 θ
值使 L(θ)取很小值,我们自然认为 θ0作为未知参数 θ的估计值,较为合理。由费希尔( R.A.Fisher)引进的最大似然估计法,就是固定样本观察值 x1,x2,┅,xn,在 θ取值的可能范围 Θ内挑选使似然函数
L(x1,x2,…,x n;θ) 达到最大的参数值,作为参数 θ的估计值。即使这样得到的 与样本值 x1,x2,┅,xn有关,常记为,
称为参数 θ的 最大似然估计值,而相应的统计量称为参数 θ的 最大似然估计量 。
这样,确定最大似然估计量的就归结为微分学中的求最大值的问题了。
在很多情形下,p(x,θ)关于 θ可微,这时 θ可从方程解得。又因 L(θ)与 ln L(θ)在同一 θ处

);,,,(m a x?,,,( 2121 nn xxxLxxxL);
),,,(? 21 nxxx
),,,(? 21 nXXX
0)( Ldd

取到极值,因此,θ的最大似然估计值 θ也可以从方程求得,而从后一方程求解往往比较方便,上式称为 对数似然方程 。
例 4 设 X~B(1,p)。 X1,X2,┅,Xn 是来自总体 X的一个样本,试求参数 p的最大似然估计量。
解 设 x1,x2,┅,xn是相应于样本 X1,X2,┅,Xn 的一个样本值。 X的分布律为故似然函数为而令解得 p的最大似然估计值
p的最大似然估计量 。它与矩估计量是相同的。
0)(ln Ldd
.1,0,)1(}{ 1 xppxXP xx


n
i i
n
i iii xnx
n
i
xx pppppL 11 )1()1()(
1
1
)1ln ()(ln)()(ln
11
pxnpxpL
n
i
i
n
i
i




n
i
i
n
i
i pxnpxpLdp
d
11
0)1/()(/)()(ln

n
i
i xxnp
1
1?

n
i
i XXnp
1
1?
例 5 设 X1,X2,┅,Xn 是来自概率函数为的 Poisson分布总体的样本,其观察值为 x1,x2,┅,xn。试求参数 λ 的最大似然估计值。
解 由题设可得,似然函数为而令解得 λ 的最大似然估计值 与矩估计量相同。
),1,0(!),( xexxP
x





n
i
i
n
xn
i
n
i i
x
i xeexxPL
n
i
ii
11 1
!/
!
),()( 1
!lnlnln
11



n
i
i
n
i
i xnxL
0ln 1 n
x
d
Ld
n
i i

xn x
n
i i 1?
若总体 X属连续型,其概率密度函数 f(x,θ),θ∈ Θ 的形式已知,
θ为待估参数,Θ是 θ可能取值范围。设 X1,X2,┅,Xn 是来自 X的样本,
x1,x2,┅,xn是相应于样本 X1,X2,┅,Xn 的一个样本值。则似然函数为解方程 或即可得最大似然估计值 。
最大似然估计法也适用于分布中含有多个未知参数 θ1,θ2,…,θ k
的情况。这时,似然函数 L( θ1,θ2,…,θ k )是这些未知参数的多元函数 。分别令或令解上述 k个方程组成的方程组,即可得到各未知参数 θi(i=1,2,…,k) 的最大似然估计值 。

n
i
in xfxxxLL
1
21 ),();,,,()(
0ddL 0
ln?
d
Ld
),,,( 21 nxxx
i
kiL
i
,,2,1,0
kiL
i
,,2,1,0ln
例 6 设总体 X的概率密度函数为
x1,x2,┅,xn是 X的一组样本观察值,求参数 λ 的最大似然估计值。
解 似然函数为令得 λ 的最大似然估计值
)0(
00
0),(?

x
xexf x
0
)(ln
ln)(ln
)(
1
1
1
1



n
i
i
n
i
i
x
n
n
i
x
x
n
d
Ld
xnL
eeL
n
i
i
i



Xx
n
n
i i
1?
1

例 7 已知 X服从正态分布 N(μ,σ 2),x1,x2,┅,xn是 X的一组样本观察值,用最大似然估计法估计 μ,σ 2的值。
解 X的概率密度函数为似然函数为而令由前一式解得代入后一式得
222 )(2
1e x p
2
1),;(?
xxf



n
i
i
nn
i
n
i
x
xL
1
2
2
222
2
2
1
2
)(
2
1
e x p)()2(
)(
2
1
e x p
2
1
),(



n
i
ix
nnL
1
2
2
2 )(
2
1ln
2)2l n (2ln



n
i
i
n
i
i
x
n
L
nxL
1
2
2222
1
2
0)(
)(2
1
2
ln
0][
1
ln


xnxni i /? 1?
nxxni i /)(? 1 22
从 以上两种点估计的方法可以看出,矩估计法具有方法直观,便于应用的特点。最大似然估计法所得的估计量往往具有较好的性质,
但只能用于总体分布的密度函数或概率函数已知的情况,且计算过程比较复杂。应用时,视具体情况使用。
§ 5.1.3 估计量优劣的评选标准总体参数的矩法估计量与最大似然估计量一般是不同的,那一个估计量比较好呢?这里首先要回答,好,的标准是什么?
1 无偏性 若选取的统计量能保证其估计值是以未知参数的真值为中心分布,则用它求估计值时,可免除系统误差的影响。
定义 若 θ 的估计量 的数学期望 存在,且,则称 是
θ 的无偏估计量。否则称为有偏估计量。
在科学技术中 称为以 作为 θ 的估计的 系统误差 。无偏估计的实际意义就是无系统误差。
),,,( 21 nXXX
)?(?E)?(E
)?(E

例 8 设总体 X的均值 μ,方差 σ2 >0均未知,X1,X2
,┅,Xn 是来自 X的样本,证明样本均值 与样本方差 S2
分别是 μ与 σ2 的无偏估计量。
证明 因为 X1,X2,┅,Xn 是来自 X的样本,其总体均值为 μ,所以 E(Xi)=μ ( i=1,2,…,n)
故 是 μ的无偏估计量。
又因总体方差为 σ2,所以


nnXEnXnEXE
n
i
i
n
i
i
11
1)(1)1()(
X
),,2,1()()(
2
2 ni
nXVXV i

X







n
i
ii
i
n
i
n
i
i
XXXXE
n
XXE
n
XX
n
ESE
1
22
2
11
22
)())((2)(
1
1
})()({
1
1
)(
1
1
)(


22
2
2
1
1
22
2
1
2
22
1
2
1 1
2
1
2
)1(
1
1
)(
1
1
)()(
1
1
)()(
1
1
)()(
1
1
)()(2)(
1
1
)()()(2)(
1
1












n
nn
nn
n
XnVXV
n
XEXnEEXXE
n
XnXE
n
XnXnXE
n
XXXXE
n
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
n
i
i
n
i
i
故 S2 是 σ2 的无偏估计量。
这个例题说明 不论总体服从什么分布,样本均值 是总体均值 μ的无偏估计;样本方差 S2 是 σ2 的无偏估计 。而估计量却不是 σ2 的无偏估计,因此我们一般取 S2
作为 σ2 的估计。
例 9 设总体 X的 k阶矩 存在,又设
X1,X2,┅,Xn 是 X的一个样本。试证明不论 X服从什么分布,k阶样本矩 是 k阶总体矩 μk 的无偏估计量。
证 X1,X2,┅,Xn 与 X同分布,故有即有
n
i
i XXn
1
2)(1
X
)1()( kXE kk?
n
i
k
ik XnA
1
1
.,,2,1,)()( niXEXE kkki
k
n
i
k
i
n
i
k
ik XEnXnEAE

)(1)1((
11

2 有效性 仅要求估计量具有无偏性是不够的。无偏性仅反映估计量在参数 θ 真值的周围波动,而没有反映出“集中”的程度。
然而,一个好的估计量不仅应该是待估参数 θ 的无偏估计,而且应该有尽可能小的方差,
定义 设 与都是 θ 的无偏估计量,若有则称 比 有效。
例 10 从总体 X中抽取样本 X1,X2,X3,证明下列三个统计量都是总体均值 μ 的无偏估计量,并确定哪个估计量更有效。
解 因 E(μi) = μ i = 1,2,3,所以
),,,( 2111 nXXX ),,,( 2122 nXXX
)?()?( 21 VV?
1 2
)31,442,632 321332123211 XXXXXXXXX (
6 )(3 )(2 )(632)( 3213211 XEXEXEXXXEE
所以 μ1,μ2,μ3 都是总体均值 μ 的无偏估计量。
易知 V(μ3)<V(μ2)<V(μ1),从而估计量 μ3更有效。






3
)(
3
)(
3
)(
333
)(
4
)(
4
)(
2
)(
442
)(
321321
3
321321
2
XEXEXEXXX
EE
XEXEXEXXX
EE
39
)(
9
)(
9
)(
333
)(
8
3
16
)(
16
)(
4
)(
442
)(
18
7
36
)(
9
)(
4
)(
632
)(
2
321321
3
2
321321
2
2
321321
1






XVXVXVXXX
VV
XVXVXVXXX
VV
XVXVXVXXX
VV
3 一致性(相合性) 前面讲的无偏性与有效性都是在样本容量 n固定的前提下提出的。我们自然希望一个好的估计量应该随着样本容量 n的增大而越来越接近被估计参数的真值,因为当 n越大时得到关于总体的信息也就越多。
定义 设 为参数 θ 的估计量,
若当 n→∞ 时,依概率收敛于 θ,则称 为 θ的相合估计量(一致估计量)。即,若对于任意 ε
> 0,有则称 是 θ的相合估计量。
例 11 试证样本均值是总体均值的一致估计量。
相合性是对一个估计量的基本要求,若估计量不具有相合性,那么不论将样本容量 n取得多么大,都不能将 θ
估计得足够准确,这样的估计量是不可取的。
),,,( 21 nXXX

1}?{limPn


§ 5.2 区间估计本节要求了解区间估计的概念,会求单个正态总体均值和方差的置信区间。
对于一个未知量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度(亦即所求真值所在的范围)。类似地,对于未知参数 θ,除了求出它的点估计外,我们还希望估计出一个范围,并希望知道这个范围包含参数 θ真值的可信程度。这样的范围通常以区间的形式给出,同时还给出此区间包含参数 θ真值的可信程度。这种形式的估计称为区间估计,这样的区间即所谓置信区间。
§ 5.2.1 置信区间定义 设总体 X的分布函数 F(x,θ) 含有一个未知参数 θ,对于给定值 α(0<α<1),若由样本 X1,X2,┅,Xn 确定的两个统计量
θ1=θ1(X1,X2,…,X n) 和 θ2=θ2(X1,X2,…X n) 满足
P{θ1(X1,X2,…,X n)<θ<θ2(X1,X2,…,X n)}=1-α
则称随机区间 (θ1,θ2) 是 θ的置信水平为 1-α的 置信区间,θ1和 θ2分别称为置信水平为 1-α的双侧置信区间的 置信下限 和 置信上限,1-α称为 置信水平 。而这种 用具有特定概率含义的区间来表示未知参数所在范围的方法称为参数的区间估计。

解释,因为样本 X1,X2,┅,Xn为随机变量,θ1(X1,X2,…,X n) 和
θ2(X1,X2,…X n) 也是随机变量。则区间 (θ1,θ2) 是一个随机区间,它是否包含 θ是一个随机事件,其发生的概率为 1-α。若将某次抽样获得的一组样本观察值 x1,x2,┅,xn代入统计量 θ1(X1,X2,…,X n) 和
θ2(X1,X2,…X n),便得 θ1(x1,x2,…,x n) 和 θ2(x1,x2,…,x n),则区间 (θ1,θ2)
就是一个非随机的数值区间。若反复抽样多次(各次得到的样本容量相等,都是 n),每个样本值都确定一个区间 (θ1,θ2),每个这样的区间要么包含 θ的真值,要么不包含 θ的真值。在这样多的区间中,
包含 θ真值的约占 100(1- α)%,不包含 θ 真值的约仅占 100α% 。例如,
若 α=0.01,反复抽样 1000次,则得到的 1000个区间中不包含 θ 真值的约仅为 10个。
如何构造 θ1与 θ2呢?这与评价区间估计的标准有关。 评价一个置信区间 的好坏有两个标准,一是精度,即 θ2 - θ1,越小精度越高,
也就越好。另一个是置信度,即 P{θ1<θ<θ2},越大越好。 我们当然希望 θ2 - θ1 尽可能地小,同时希望 P{θ1<θ<θ2} 尽可能地大。但是当样本容量 n固定时,精度与置信度不可能同时提高。因为当精度提高时即 θ2 - θ1 变小时,(θ1,θ2) 覆盖 θ的可能性也变小,从而降低了置信度。相反,当置信度增大时,θ2 - θ1 必然增大,从而降低了精度。
在实际问题中,一般是根据实际问题的需要,先选定置信度为 1-α,
然后再通过增加样本容量 n提高精度。
下面我们通过讨论正态总体均值与方差的区间估计来介绍求置信区间的思想与方法。
§ 5.2.2 正态总体均值 μ 的区间估计
1 总体方差 σ2 已知,正态总体均值 μ 的区间估计一般而言,在一个具体的问题中正态总体的参数 μ和 σ2都是未知的,这里我们所说的 σ2已知,是根据以往的研究和资料,对有的正态总体的方差 σ2作出过较好的估计,可以把这样的估计值作为 σ2
的真值来用。
设总体 X~N(μ,σ2),σ2 为已知,μ为未知,设 X1,X2,┅,Xn为来自
X的一个样本,求 μ的置信水平为 1-α的置信区间。
我们知道 是 μ的无偏估计。且有所服从的分布 N(0,1)不依赖于任何未知参数。按正态分布的上 α分位点的定义,有
X
)1,0(~/ NnXU
n
X
/?



1
/ 2/
u
n
XP








1
1
/
2/2/
2/2/
uX
n
uP
u
n
X
uP
这样,我们就得到了 μ的一个置信水平为 1-α的置信区间
(1)
如果取 α=0.05,即 1-α=0.95,又若 σ=1,n=16,查附表得
u0.05/2=1.96,于是我们得到一个置信水平为 0.95的置信区间再者,若该样本值的样本均值,则得到一个区间( 4.71,5.69)。
注意,这已经不是一个随机区间了。但我们仍称它为置信水平为 0.95的置信区间。其含义是:若反复抽样多次,每个样本值( n=
16)按公式确定一个区间,按前面的解释,在这么多 的区间中,






1
1
2/2/
2/2/
n
uX
n
uXP
n
uX
n
uXP


n
uX
n
uX 2/2/,
16196.1,16196.1 XX
20.5?x
包含 μ的约占 95%,不包含 μ的约占 5%。现抽样得到区间( 4.71,
5.69),则该区间属于那些包含 μ的区间的可信程度为 95%,或“该区间包含 μ”这一陈述的可信程度为 95%。
然而,置信水平为 1-α的置信区间并不是唯一的。以前一问题来说,若给定 α=0.05,则又有
(2)
也是 μ的置信水平为 0.95的置信区间。我们将它与 (1)式中令 α=0.05所得的置信水平为 0.95的置信区间相比较,可知由( 1)所确定的区间长度为,这一长度要比区间( 2)的长度为短,u0.01=u0.02/2=2.33,u0.04=u0.08/2=1.75
95.0}/{ 01.004.0 unXuP
95.004.001.0?



nuXnuXP



n
uX
n
uX 04.001.0,
nnu
92.32
2/05.0
nnuu
08.4)(
01.004.0
置信区间短表示估计的精度高。故由( 1)给出的区间较( 2)为优。
易知,像 N(0,1)分布那样其概率密度函数的图形是单峰且对称的情况,
当 n固定时,以形如( 1)那样的区间其长度为最短,我们自然选用它。
通过前面的叙述,可以得到寻找未知参数 θ 的置信区间的一般步骤为:
( 1)构造随机变量,根据需要,构造一个能确定其分布的随机变量 W=W(X1,X2,…,X n;θ),而它是未知参数和样本的函数,且其分布不依赖于任何未知参数(当然不依赖于待估参数 θ );
( 2)确定临界值,由给定的置信水平 1-α,按上述随机变量的分布确定临界值 a和 b,使得 P{a<W(X1,X2,…X n)<b)=1-α ;
( 3)建立随机不等式,从 a<W(X1,X2,…X n)<b得到等价的不等式
θ1<θ<θ2,则 P{θ1(X1,X2,…X n)<θ<θ2(X1,X2,…,X n)}=1-α,其中 θ1,θ2 仅为样本的函数(统计量),所以( θ1,θ2 )就是 θ 的一个置信水平为 1-α的置信区间;
( 4)算出 θ1和 θ2的样本值,将样本观察值 x1,x2,…,x n代入 θ1和 θ2
的算式,计算出置信区间的下限 θ1(x1,x2,…,x n)和上限 θ2(x1,x2,…,x n),
得到置信区间( θ1,θ2 ) 。
例 1 已知对某种药物中的有效成分的含量进行了 6次独立测量,其结果是 0.8572,0.8612,0.8587,0.8615,
0.8603,0.8589,据以往的资料可知,该项指标服从正态分布,方差为 0.132,试估计该药物中的有效成分含量的
95%置信区间。
解 由题设知 n=6,σ2=0.132,1-α=0.95,α=0.05,查附表得
u0.05/2=1.96,,代入( 1)式故该药物中有效成分含量的均数的 95%置信区间为 (0.7556,0.9636)。
另外,对不服从正态分布的总体,根据中心极限定理,当 n较大时总体近似服从正态分布,因而仍可按( 1)近似计算总体均值 μ 的
1-α置信区间。
8596.0?x
9636.0
6
13.0
96.18596.0?
7556.0
6
13.0
96.18596.0?
2/2
2/1


n
ux
n
ux
2 总体方差 σ2 未知,正态总体均值 μ 的区间估计在没有可靠的资料作为方差 σ2的真值时,我们只能完全依靠样本提供的信息,以样本方差 S2代替总体方差 σ2 (因 S2是 σ2的无偏估计),
对总体均数 μ 作出估计。
按建立区间估计的一般步骤,首先构造一个包含未知参数 μ 的和随机样本 X1,X2,┅,Xn的随机变量,由抽样分布定理可知:
并且右边的分布 t(n-1)不依赖于任何未知参数。可得(如右图)
于是得 μ 的一个置信水平为 1- α的置信区间 ( 3)
)1(~/ ntnSXT?








1
1)1(
/
)1(
22
22
n
S
tX
n
S
tXP
nt
n
X
ntP



n
SntX
n
SntX )1(,)1(
22

例 2 某药厂用自动包装机装药。某日开工后测得 9
包药的重量(单位 g)如下,99.3,98.7,100.5,101.2,
98.3,99.7,99.5,102.1,100.5,假设每包药的重量服从正态分布,试求药重量均数的区间估计( α=0.05 )
解 由题设可得 n=9,,s=1.212,自由度 df=n-1=8,
α=0.05,查附表得,代入故药重量均数的 95%的置信区间为( 99.046,100.909),
978.99?x
3 0 6.2)8(
2
05.0?t



9 0 9.1 0 0
9
2 1 2.1
3 0 6.29 7 8.99)8(?
0 4 6.99
9
2 1 2.1
3 0 6.29 7 8.99)8(?
2
2
2
1
n
s
tx
n
s
tx
3 两个正态总体 N(μ1,σ12),N(μ2,σ22)的情况在实际中常遇到下面问题:已知产品的某一质量指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素,引起总体均值、总体方差有所改变。我们需要知道这些变化有多大,这就需要考虑两个正态总体均值差或方差比的估计问题。
设已经给定置信水平 1-α,并设 X1,X2,…,X n1 是来自第一个总体
N(μ1,σ12)的样本; Y1,Y2,…,Y n2 是来自第二个正态总体 N(μ2,σ22)的样本,这两个样本相互独立。且设 分别为第一、二个总体的样本均值,S12,S22分别为第一、二个总体的样本方差。
( 1) σ12,σ22 均为已知。 因 分别为 μ1,μ2 的无偏估计,
故 是 μ1-μ2 的无偏估计。由 的独立性以及得或
YX,
YX?
),(~),,(~
2
2
2
2
1
2
1
1 nNYnNX

),(~
2
2
2
1
2
1
21 nnNYX

)1,0(~
//
)()(
2
2
21
2
1
21 N
nn
YX



YX,
YX,
由( 1)式得 μ1-μ2 的一个置信水平为 1-α的置信区间
( 4)
( 2) σ12=σ22=σ2,但 σ2为未知。此时由抽样分布定理由公式( 2)可得 μ1-μ2 的一个置信水平为 1-α的置信区间 ( 5)
此处

2
2
2
1
2
1
2/
2
2
2
1
2
1
2/,nnuYXnnuYX


)2(~
11
)()(
21
21
21

nnt
nn
S
YX

21
21
221
21
2
11)2()(,11)2()(
nnSnntYXnnSnntYX
2
21
2
22
2
112,
2
)1()1( SS
nn
SnSnS?


例 3 为比较 Ⅰ,Ⅱ 两种型号步枪子弹的枪口速度,随机地取 Ⅰ 型子弹 10发,得到枪口速度的平均值,标准差
s1=1.10 (m/s),随机地取 Ⅱ 型子弹 20发,得到枪口速度标准差 s2=1.20 (m/s) 。假设两总体都可以近似地服从正态分布,且由生产过程可认为方差相等 。 求两总体均值的一个置信水平为 0.95的置信区间。
解 按实际情况,可认为分别来自两个总体的样本是相互独立的,
又因由假设两总体方差相等,但数值未知,故可用( 5)式求均值差的置信区间。
由于 1-α=0.95,α/2=0.025,n1=10,n2=20,n1+n2-2=28,
t0.025(28)=2.0484,s2=(9× 1.102+19× 1.202)/28,s=1.1688,故所求的两总体均值差 μ1-μ2的一个置信水平为 0.95的置信区间是即 (3.07,4.93) 。
本题中得到的置信区间的下限大于零,在实际中我们就认为 μ1比 μ2
大。
)/(5001 smx?
)/(4962 smx?
)93.04(
20
1
10
1)28(
025.021

stxx
例 4 为提高某一药物的收率,试图采用一种新的催化剂。为慎重起见,在实验工厂先进行试验。设采用原来的催化剂进行了 n1=8
次试验,得到收率的 平均值,样本方差 s12=3.89 ;又采用新的催化剂进行了 n2=8 次试验,得到收率的均值,
样本方差 s22=4.02 。假设两总体都可认为服从正态分布,且方差相等,
两样本独立。试求两总体均值差 μ1-μ2 的置信水平为 0.95的置信区间。
解由公式得所求的置信区间为即 (-4.15,0.11).
由于所得置信区间包含零,在实际中我们就认为采用这两种催化剂所得的收率的均值没有显著差别。
96.3,96.32 )()1(
21
2
22
2
112

s
nn
snsns
73.911?x
75.932?x
)13.202.2(
8
1
8
1)14(
025.021

stxx
1 4 5.2)14(2/05.0?t
§ 5.2.3 方差 σ2的置信区间这里,根据实际问题的需要,只介绍 μ未知的情况。
σ2的无偏估计为 S2,
由抽样分布定理知并且上式右端的分布不依赖于任何未知参数,故有
)1(~)1( 22
2
nSn











1
)1(
)1(
)1(
)1(
1
)1(
)1(1
)1(
)1(
1)1(
)1(
)1(
2
2/1
2
2
2
2/
2
2
2
2/
22
2
2/1
2
2/2
2
2
2/1
n
Sn
n
Sn
P
Sn
n
Sn
n
P
n
Sn
nP
这就得到方差 σ2的一个置信水平为 1-α的置信区间
( 6)
由( 6)式,还容易得到标准差 σ的一个置信水平为 1-α的置信区间
( 7)
注意,在概率密度函数不对称时,如 分布和 F分布,习惯上仍是取对称的分位点( 与 )来确定置信区间的。


)1(
)1(,
)1(
)1(
2
2/1
2
2
2/
2
n
Sn
n
Sn

)1(
1
,
)1(
1
2
2/1
2
2/ n
Sn
n
Sn

2?
)1(2 2/1 n )1(2 2/?n
例 5 就例 2的数据,对药重量的方差 σ2作区间估计。
解 由例 2可知 n=9,S2=1.469,自由度 df=n-1=8 。
取 α=0.1,查附表得代入( 6)得故 σ2的 90%置信区间为 (0.758,4.301)。
733.2)8(,507.15)8( 2 95.02 05.0
3 0 1.4
7 3 3.2
4 6 9.1)19(
)1(
)1(
7 5 8.0
5 0 7.15
4 6 9.1)19(
)1(
)1(
2
2/1
2
2
2
2
2/
2
2
1


n
sn
n
sn
§ 5.3参数估计的样本容量从理论上说,在通过样本推断总体时,容量 n越大,其结果越可靠,但在解决实际问题时,由于受到人力物力等客观因素的影响,很难选一个任意大的样本,
对于正态总体,对于事先取定的,若要求置信区间的长度 (精度 )不超过给定的正数,当 已知时,有解之得当 未知,则应先抽取一定的样本,对 作点估计,再用上面的公式估算样本量,
例 6:若计划抽取一定数量的某种药物来对其有效成分含量的均数作 95%区间估计。据以往资料知 =0.02,要求区间估计精度不得超过 0.01。问至少需抽取多大容量的样本?
2?
nu 2/2
2
2/2?


un
2? 2?
小结:本章主要介绍总体参数 θ 的点估计和区间估计。点估计是利用样本值求得参数 θ 的一个近似值,对了解参数 θ 的大小有一定的参考价值,
但没有给出近似值的精确程度和可信程度,因此在实际中意义不大。而区间估计是通过两个统计量 θ1和 θ2,构成随机区间 (θ1,θ2),使此区间包含未知参数 θ 的概率不小于事先设定的常数(置信水平) 1- α( 0< α<1)。 1- α值越大,则 (θ1,θ2)包含 θ真值的概率越大,即由样本值得到的区间
(θ1,θ2)覆盖未知参数 θ 的可信程度越大。而 (θ1,θ2)
的长度越小,又反映估计 θ 的精确程度越高。所以区间估计不仅提供了 θ 的一个估计范围,还给出了估计范围的精度与可信程度,弥补了点估计的不足,有广泛的实用意义。