数理统计第三节 区间估计置信区间定义置信区间的求法单侧置信区间课堂练习小结 布置作业数理统计引言前面,我们讨论了参数点估计,它是用样本算得的一个值去估计未知参数,但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大,区间估计正好弥补了点估计的这个缺陷,
数理统计譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数 N 的极大似然估计为 1000条,
若我们能给出一个区间,在此区间内我们合理地相信 N 的真值位于其中,这样对鱼数的估计就有把握多了,
实际上,N的真值可能大于 1000条,也可能小于 1000条,
数理统计也就是说,我们希望确定一个区间,使我们能以比较高的 可靠程度 相信它包含真参数值,
湖中鱼数的真值
[ ]
这里所说的,可靠程度,是用概率来度量的,
称为 置信度 或 置信水平,
习惯上把置信水平记作1?,这里 是一个很小的正数,
数理统计置信水平的大小是根据实际需要选定的,
置信区间,
称区间 为 的1置信水平为 的(,)θ θ
例如,通常可取置信水平 =0.95或 0.9等,1
根据一个实际样本,由给定的置信水平,我小的区间,使们求出一个尽可能 (,)θ θ
{ } 1P θ θ θ α
数理统计一,置信区间定义
满足设 是 一个待估参数,给定,0
X1,X2,… Xn确定的两个统计量则称区间 是 的置信水平(置信度 )为的 置信区间,
1
和 分别称为 置信下限 和 置信上限,
若由样本
{ } 1P θ θ θ α
12(,,,)nθ θ X X X?
12(,,,)nθ θ X X X?
()θ θ?
θ θ
(,)θ θ
数理统计这里有两个要求,
可见,
对参数 作区间估计,就是要设法找出两个只依赖于样本的界限 (构造统计量 ).
一旦有了样本,就把 估计在区间 内,?
12(,,,)nθ θ X X X?
12(,,,)nθ θ X X X?
()θ θ?
(,)θ θ
数理统计可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度,
1,要求 以很大的可能被包含在区间?
内,就是说,概率 要尽可能大,
即要求估计尽量可靠,
(,)θ θ
{}P θ θ θ
2,估计的精度要尽可能的高,如要求区间长度尽可能短,或能体现该要求的其它准则,θ θ?
数理统计在求置信区间时,要查表求分位点,
二、置信区间的求法
( ) 1P a X b α
( ) ( ) 1P X b P X a α
( ) 1,2αP X b() 2P X a
设,对随机变量 X,称满足的点 为 X的概率分布的上 分位点,αx α
01α
() αP X x α
定义
( ) 1αP X x α
数理统计
( ) 1P a X b α
( ) ( ) 1P X b P X a α
若 X 为连续型随机变量,则有
12,αax 2,αbx?
( ) 1,3αP X b 2() 3αP X a
所求 置信区间为 1 2 2(,)α αxx?
所求 置信区间为
1 2 3,αax 3,αbx?
1 2 3 3(,)α αxx?
数理统计
标准正态分布的上 分位点 αuα
() αP U u α
2(,)UN μ σ
数理统计分布的上分位数
)(2 n
2?
自由度为 n的
22( ( ) )αP χ χ n α
22()χ χ n
数理统计
F分布的上 分位数
),( 21 nnF?
自由度为 n1,n2的
12(,)F F n n
12{ (,) }αP F F n n α
数理统计
~ N(0,1)
选 的点估计为,X
求参数 的置信度为 的置信区间,
例 1 设 X1,… Xn是取自 的样本,,2已知?),( 2N
1
n
XU
取明确问题,是求什么参数的置信区间?
置信水平是多少?
寻找未知参数的一个良好估计,
解寻找一个待估参数和统计量的函数,要求其分布为已知,
有了分布,就可以求出
U取值于任意区间的概率,
数理统计
,1对给定的置信水平查正态分布表得,
2?u
对于给定的置信水平,根据 U的分布,确定一个区间,使得 U取值于该区间的概率为置信水平,

1}|{|
2un
XP使为什么这样取?
数理统计
1}{ 22 u
n
Xu
n
XP
从中解得
,1对给定的置信水平查正态分布表得,
2?u

1}|{|
2un
XP
使数理统计
],[ 22 u
n
Xu
n
X
也可简记为
2() α
σ
Xu
n



1
}{ 22 u
n
Xu
n
XP
于是所求 的 置信区间为?
数理统计从例 1解题的过程,我们归纳出求置信区间的一般步骤如下,
1,明确问题,是求什么参数的置信区间?
置信水平 是多少1
2,寻找参数 的一个良好的点估计
T(X1,X2,… Xn)
3,寻找一个待估参数 和估计量 T 的函数
U(T,),且其分布为已知,?
数理统计
4,对于给定的置信水平,根据 U(T,)
的分布,确定常数 a,b,使得
1?
1?P(a <U(T,)<b) =
5,对,a<S(T,)<b”作等价变形,得到如下形式,?
θ θ θ
{ } 1P θ θ θ α即
1?于是 就是 的 100( )%的置信区间,(,)θ θ
数理统计可见,确定区间估计很关键的是要寻找一个待估参数 和估计量 T 的函数 U(T,),且 U(T,)
的分布为已知,不依赖于任何未知参数,

而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要,
数理统计休息片刻继续数理统计需要指出的是,给定样本,给定置信水平,
置信区间也 不是唯一 的,
对同一个参数,我们可以构造许多置信区间,
,2已知?
例如,设 X1,…,Xn 是取自 的样本,),( 2N
求参数 的置信水平为 的置1
~N(0,1)
n
XU

0.95?
信区间,
由标准正态分布表,对任意 a,b,我们可以求得
P( a<U<b),
数理统计
~N(0,1)
n
XU

例如,由 P(-1.96≤U≤1.96)=0.95
)(uf
u
96.196.1?
95.0
]96.1,96.1[ nXnX
我们得到 均值 的置信水平为1 的置信区间为
0.95?
数理统计由 P(-1.75≤U≤2.33)=0.95
这个区间比前面一个要长一些,
]33.2,75.1[ nXnX
)(uf
u
33.275.1?
置信区间为我们得到 均值 的置信水平为1 的0.95?
数理统计我们总是希望置信区间尽可能短,
类似地,我们可得到若干个不同的置信区间,
任意两个数 a和 b,只要它们的纵标包含 f(u)
下 95%的面积,就确定一个 95%的置信区间,
0 b
u
u
u
)(uf
a
a
a
b
b
950.
950.
950.
数理统计在概率密度为单峰且对称的情形,当 a =-b时求得的置信区间的长度为最短,
0 b
u
u
u
)(uf
a
a
a
b
b
950.
950.
950.
a =-b
数理统计即使在概率密度不对称的情形,如 分布,
F分布,习惯上仍取对称的分位点来计算未知参数的置信区间,
2?
我们可以得到未知参数的的任何 置信水平小于 1 的 置信区间,并且 置信水平越高,相应的 置信区间 平均长度 越长,
)(2 2 n)(2 21 n
)(xf
x
)(~ 2 nX?
数理统计也就是说,要想得到的区间估计可靠度高,
区间长度就长,估计的精度就差,这是一对矛盾,
实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些,
数理统计三、单侧置信区间上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限,
例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了,
这时,可将置信上限取为 +∞,而只着眼于置信下限,这样求得的置信区间叫 单侧置信区间,
数理统计于是引入单侧置信区间和置信限的定义:
满足设 是 一个待估参数,给定,0
若由样本 X1,X2,… Xn确定的统计量则称区间 是 的置信水平为 的单侧置信区间,
1
定义
12(,,,)nθ θ X X X?
{ } 1P θ θ α
[,)θ
称为 的置信水平为 的单侧置信θ
下限,
1?
θ对于任意,
数理统计满足若由样本 X1,X2,… Xn确定的统计量则称区间 是 的置信水平为 的单侧置信区间,
1
12(,,,)nθ θ X X X?
{ } 1P θ θ α
(,]θ
称为 的置信水平为 的单侧置信θ
上限,
1?
θ对于任意,
数理统计设灯泡寿命服从正态分布,求灯泡寿命均值 的置信水平为 0.95的单侧置信下限,
例 2 从一批灯泡中随机抽取 5只作寿命试验,测得寿命 X(单位:小时)如下:
1050,1100,1120,1250,1280
)1(~ nt
nS
X?
方差 未知2?
解 的点估计取为样本均值,? X
数理统计对给定的置信水平,确定分位点 )1(?nt
1
1)}1({ nt
nS
XP
使即
1})1({
n
SntXP
于是得到 的置信水平为 的单侧置信区间为
1
],)1([
n
SntX
数理统计将样本值代入得
的置信水平为 0.95的单侧置信下限是
1065小时
的置信水平为 的 单侧置信下限 为1即
n
SntX )1(
数理统计请自己画一张表,将各种情况下的区间估计加以总结,
留作作业数理统计四、课堂练习随机地取炮弹 10 发做试验,得炮口速度的标准差,炮口速度服从正态分布,求这种炮弹的炮口速度的标准差 的置信水平为 0.95
的置信区间,
σ
11 ( )s m s?
数理统计
2
2
2
( 1 ) ( 1 )nS χ n
σ


2
22
1 2 22
( 1 ){ ( 1 ) ( 1 ) } 1
α α
nSP χ n χ n α
σ?

解随机地取炮弹 10 发做试验,得炮口速度的标准差,炮口速度服从正态分布,求这种炮弹的炮口速度的标准差 的置信水平为 0.95
的置信区间,
σ
11 ( )s m s?
数理统计于是得到 的 置信水平为 的置信区间 为0.95
22
2 1 2
11(,)
( 1 ) ( 1 )α α
n s n s
χ n χ n?


σ
这里 2 0,0 2 5,1 2 0,9 7 5,1 9,α α n
20,0 2 5 ( 9 ) 1 9,0 2 3,χ?20,9 7 5 ( 9 ) 2,7 0 0,χ?11.s?
可得到 的 置信水平为 的置信区间 为1 α?
22
22
2 1 2
( 1 ) ( 1 )(,)
( 1 ) ( 1 )α α
n S n S
χ n χ n?



数理统计同学们可通过练习,掌握各种求未知参数的置信区间的具体方法,
这一讲,我们介绍了区间估计,
五、小结数理统计六、布置作业概率论与数理统计标准化作业 (六 )