1
概率论与数理统计第 22讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
区间估计
3
基本概念用点估计来估计总体参数,即使是无偏有效的估计量,也会由于样本的随机性,从一个样本算得估计量的值不一定恰是所要估计的参数真值,而且,即使真正相等,由于参数值本身是未知的,也无从肯定这种相等,到底二者相差多少呢? 这个问题换一种提法就是,根据估计量的分布,在一定的可靠程度下,指出被估计的总体参数所在的可能数值范围,这就是参数的区间估计问题,
4
区间估计的具体做法是,找两个统计量
%1%5
,,1
,
,)
,
(
1)
(
),,,(
),,(
12
21
21
21211
或通常称作检验水平为置信系数下限分别称为置信区间的上和称为置信区间区间使与
P
XXXX
n
5
区间估计示意图
1/2?/2
1 2
1为 置信系数,置信概率 或 置信度
为 检验水平
6
总体期望值 Ex的区间估计第一种情形,方差已知,对 Ex进行区间估计
7
1,总体分布未知利用切贝谢夫不等式进行估计,在第五章中,
曾提到对任何随机变量 x(不论它的分布如何 ),
只要 Ex,Dx存在,对任给的正数 e>0,满足
2
2
1)|(|
1)|(|
e
x
exx
e
x
exx
D
EP
D
EP
或
8
从总体 x中抽取样本 (X1,X2,...,Xn),
2
2
2
2
1
1)(
1)(
1)(
1)|(|
,,
1
e
x
exe
e
ee
e
ee
e
e
x
x
n
D
XEXP
XD
XXEXP
XD
XXEP
XD
XXEP
n
D
XDEXEX
n
X
n
i
i
或即则令
9
若要求
%95)
05.005.0
(
05.0
,05.0
,05.0195.01
%951)(
2
2
2
n
D
XE
n
D
XP
n
D
n
D
n
D
n
D
XEXP
x
x
x
x
e
e
x
e
x
e
x
exe
因此有解得即即
10
一般地,若要求
x
x
x
x
e?
e
x
e
x
e
x
exe
1)(
,
,11
11)(
2
2
2
n
D
XE
n
D
XP
n
D
n
D
n
D
n
D
XEXP
因此有解得即即
11
切贝谢夫区间估计示意图
1/2?/2
n
DX
x?
n
DX
x?X
12
例 1 某灯泡厂某天生产了一大批灯泡,从中抽取了 10个进行寿命试验,得数据如下 (单位,小时 ):
1050,1100,1080,1120,1200,1250,1040,1130,
1300,1200
已知其方差 Dx=8,试找出灯泡的平均寿命区间 (?=5%).
)1151,1143(
)41147,41147(
4
1005.0
8
,1147
即的置信区间为因此先算出解
x
x
E
n
D
x
13
因为切贝谢夫不等式对任何分布的随机变量都成立,所以用这种方法估计 Ex是普遍适用的,但是这种办法比较粗糙,精度不高,对某些具体类型的随机变量还可以有更精确的估计形式,下面介绍正态总体寻找置信区间的方法,
14
2,正态总体
2
1)(
1)(21)|(|
)1,0(~
/
),/,(~
),,(),,(
0
0
2
2
1
u
uuUP
u
N
n
X
U
nNX
NXX
n
使得查表可求得令则来自正态总体设样本?
15
则查表获得由公式其中的置信区间是的置信度为因此即
,2/1)(
),(
1
1)(
1)
/
(
1
//
0
uu
n
u
X
n
u
X
n
u
X
n
u
XP
u
n
X
uP
u
n
X
Pu
n
X
P
16
例如,当?=0.05时,u?=1.96,有
n
x
n
x
u
n
x
n
x
58.258.2
,58.2,01.0
96.196.1
有时当
17
查表示意图
x0
/2
1/2
u?
18
例 2 某灯泡厂某天生产了一大批灯泡,假设灯泡的寿命 x服从正态分布,x~N(?,8),从中抽取了 10个进行寿命试验,得数据如下 (单位,小时 ):
1050,1100,1080,1120,1200,1250,1040,1130,
1300,1200,试找出平均寿命区间 (?=0.05).
解 因为?=0.05,所以 u?=1.96,而 n=10,s=2.8284
)75.1148,25.1145(
95.0
)
10
96.18284.2
1147
10
96.18284.2
1147(
,1147
的置信区间为即则算出
P
x
19
例 3 已知某炼铁厂的铁水含碳量在正常生产情况下服从正态分布,其方差?2=0.1082,现在测定了 9炉铁水,其平均含碳量为 4.484,按此资料计算该厂铁水平均含碳量的置信区间,并要求有 95%的可靠性,
解 设该厂铁水平均含碳量为?,已知?=5%,所以 u?=1.96,?的置信系数为 95%的置信区间是
555.4413.4
96.1
9
108.0
484.496.1
9
108.0
484.4
即
20
3,一般总体大样本下 Ex的区间估计根据中心极限定理,对于不是正态分布的一般总体 x(Ex=?,Dx=?2),当样本容量相当大时,
渐近地服从正态分布,故大样本情况下,
对于一般总体仍可用正态总体的办法对 Ex进行较精确的区间估计,
在 n=30时,就可把 看作近似服从正态分布
N(?,?2/n),当然 n越大越好,
X
X
21
第二种情形,
方差 Dx未知,对 Ex的区间估计如果方差 Dx未知,大样本下可用 S2来作为 Dx估计值,仍可按正态分布的办法来进行区间估计
22
4,方差未知的正态总体,小样本下 Ex的区间估计设样本 (X1,...,Xn)来自正态总体 N(?,?2),由于?2
未知,则令
)1(~,
/
ntT
nS
XT 则?
1)|
/
(|
)|(|
t
nS
X
P
tTP
对于给定的?和 n?1查 t分布临界值表确定 t?使
23
即
),(
1)(
1)(
1)
/
(
1)|
/
(|
t
n
S
Xt
n
S
X
t
n
S
Xt
n
S
XP
t
n
S
Xt
n
S
P
t
nS
X
tP
t
nS
X
P
即置信区间为
24
例 4 假定初生婴儿 (男孩 )的体重服从正态分布,
随机抽取 12名婴儿,测体重为 3100,2520,3000,
3000,3600,3160,3560,3320,2880,2600,3400,
2540,试以 95%的置信系数估计新生男婴儿的平均体重 (单位,克 ).
解 设新生男婴儿体重为 x克,由于 x服从正态分布,方差?2未知,因此要查 t分布表,
对?=0.05,因样本数 n=12,则查自由度为 11的 t
分布表,得 t?(12?1)=2.201
25
再计算
32 9528 18
201.2
12
3.375
30 57201.2
12
3.375
30 57
%95,
3.375)30 57(
11
1
30 57)25 4031 00(
12
1
1
2
即的置信区间是的置信度为因此
n
i
i
xs
x?
26
(二 ) 小样本下正态总体方差?2的估计
27
设样本 (X1,...,Xn)来自正态总体 N(?,?2),则
c2=(n?1)S2/?2服从具有 n?1个自由度的 c2分布,
对于给定的?,查表可以确定 a及 b,使得
a
Sn
b
Sn
bSna
b
Sn
a
b
Sn
aPbaP
2
2
2
2
2
2
2
2
2
2
)1()1(
1
)1(
1)1(
1
)1(
)(
c
而
28
在确定 a,b时,一般是取
2
)()( 22
cc bPaP
a b
/2?/21
29
例 5 假定初生婴儿 (男孩 )的体重服从正态分布,
随机抽取 12名婴儿,测体重为 3100,2520,3000,
3000,3600,3160,3560,3320,2880,2600,3400,
2540,对婴儿体重的方差进行区间估计
(?=0.05)
解 计算可得 (n?1)s2?1549467,
=0.05,n?1=11,查附表五,得 a=3.82,b=21.9,
a,b满足
025.0
2
)(
975.0
2
1)(
2
2
c
c
bP
aP
30
因此得?2的置信区间为
4 0 5 6 2 07 0 7 5 2
82.3
1 5 4 9 4 6 7
9.21
1 5 4 9 4 6 7
2
2
即
31
作业 习题八第 164页开始
5,6,7,11,13
32
请提问
概率论与数理统计第 22讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '概率论 '子目录 )
2
区间估计
3
基本概念用点估计来估计总体参数,即使是无偏有效的估计量,也会由于样本的随机性,从一个样本算得估计量的值不一定恰是所要估计的参数真值,而且,即使真正相等,由于参数值本身是未知的,也无从肯定这种相等,到底二者相差多少呢? 这个问题换一种提法就是,根据估计量的分布,在一定的可靠程度下,指出被估计的总体参数所在的可能数值范围,这就是参数的区间估计问题,
4
区间估计的具体做法是,找两个统计量
%1%5
,,1
,
,)
,
(
1)
(
),,,(
),,(
12
21
21
21211
或通常称作检验水平为置信系数下限分别称为置信区间的上和称为置信区间区间使与
P
XXXX
n
5
区间估计示意图
1/2?/2
1 2
1为 置信系数,置信概率 或 置信度
为 检验水平
6
总体期望值 Ex的区间估计第一种情形,方差已知,对 Ex进行区间估计
7
1,总体分布未知利用切贝谢夫不等式进行估计,在第五章中,
曾提到对任何随机变量 x(不论它的分布如何 ),
只要 Ex,Dx存在,对任给的正数 e>0,满足
2
2
1)|(|
1)|(|
e
x
exx
e
x
exx
D
EP
D
EP
或
8
从总体 x中抽取样本 (X1,X2,...,Xn),
2
2
2
2
1
1)(
1)(
1)(
1)|(|
,,
1
e
x
exe
e
ee
e
ee
e
e
x
x
n
D
XEXP
XD
XXEXP
XD
XXEP
XD
XXEP
n
D
XDEXEX
n
X
n
i
i
或即则令
9
若要求
%95)
05.005.0
(
05.0
,05.0
,05.0195.01
%951)(
2
2
2
n
D
XE
n
D
XP
n
D
n
D
n
D
n
D
XEXP
x
x
x
x
e
e
x
e
x
e
x
exe
因此有解得即即
10
一般地,若要求
x
x
x
x
e?
e
x
e
x
e
x
exe
1)(
,
,11
11)(
2
2
2
n
D
XE
n
D
XP
n
D
n
D
n
D
n
D
XEXP
因此有解得即即
11
切贝谢夫区间估计示意图
1/2?/2
n
DX
x?
n
DX
x?X
12
例 1 某灯泡厂某天生产了一大批灯泡,从中抽取了 10个进行寿命试验,得数据如下 (单位,小时 ):
1050,1100,1080,1120,1200,1250,1040,1130,
1300,1200
已知其方差 Dx=8,试找出灯泡的平均寿命区间 (?=5%).
)1151,1143(
)41147,41147(
4
1005.0
8
,1147
即的置信区间为因此先算出解
x
x
E
n
D
x
13
因为切贝谢夫不等式对任何分布的随机变量都成立,所以用这种方法估计 Ex是普遍适用的,但是这种办法比较粗糙,精度不高,对某些具体类型的随机变量还可以有更精确的估计形式,下面介绍正态总体寻找置信区间的方法,
14
2,正态总体
2
1)(
1)(21)|(|
)1,0(~
/
),/,(~
),,(),,(
0
0
2
2
1
u
uuUP
u
N
n
X
U
nNX
NXX
n
使得查表可求得令则来自正态总体设样本?
15
则查表获得由公式其中的置信区间是的置信度为因此即
,2/1)(
),(
1
1)(
1)
/
(
1
//
0
uu
n
u
X
n
u
X
n
u
X
n
u
XP
u
n
X
uP
u
n
X
Pu
n
X
P
16
例如,当?=0.05时,u?=1.96,有
n
x
n
x
u
n
x
n
x
58.258.2
,58.2,01.0
96.196.1
有时当
17
查表示意图
x0
/2
1/2
u?
18
例 2 某灯泡厂某天生产了一大批灯泡,假设灯泡的寿命 x服从正态分布,x~N(?,8),从中抽取了 10个进行寿命试验,得数据如下 (单位,小时 ):
1050,1100,1080,1120,1200,1250,1040,1130,
1300,1200,试找出平均寿命区间 (?=0.05).
解 因为?=0.05,所以 u?=1.96,而 n=10,s=2.8284
)75.1148,25.1145(
95.0
)
10
96.18284.2
1147
10
96.18284.2
1147(
,1147
的置信区间为即则算出
P
x
19
例 3 已知某炼铁厂的铁水含碳量在正常生产情况下服从正态分布,其方差?2=0.1082,现在测定了 9炉铁水,其平均含碳量为 4.484,按此资料计算该厂铁水平均含碳量的置信区间,并要求有 95%的可靠性,
解 设该厂铁水平均含碳量为?,已知?=5%,所以 u?=1.96,?的置信系数为 95%的置信区间是
555.4413.4
96.1
9
108.0
484.496.1
9
108.0
484.4
即
20
3,一般总体大样本下 Ex的区间估计根据中心极限定理,对于不是正态分布的一般总体 x(Ex=?,Dx=?2),当样本容量相当大时,
渐近地服从正态分布,故大样本情况下,
对于一般总体仍可用正态总体的办法对 Ex进行较精确的区间估计,
在 n=30时,就可把 看作近似服从正态分布
N(?,?2/n),当然 n越大越好,
X
X
21
第二种情形,
方差 Dx未知,对 Ex的区间估计如果方差 Dx未知,大样本下可用 S2来作为 Dx估计值,仍可按正态分布的办法来进行区间估计
22
4,方差未知的正态总体,小样本下 Ex的区间估计设样本 (X1,...,Xn)来自正态总体 N(?,?2),由于?2
未知,则令
)1(~,
/
ntT
nS
XT 则?
1)|
/
(|
)|(|
t
nS
X
P
tTP
对于给定的?和 n?1查 t分布临界值表确定 t?使
23
即
),(
1)(
1)(
1)
/
(
1)|
/
(|
t
n
S
Xt
n
S
X
t
n
S
Xt
n
S
XP
t
n
S
Xt
n
S
P
t
nS
X
tP
t
nS
X
P
即置信区间为
24
例 4 假定初生婴儿 (男孩 )的体重服从正态分布,
随机抽取 12名婴儿,测体重为 3100,2520,3000,
3000,3600,3160,3560,3320,2880,2600,3400,
2540,试以 95%的置信系数估计新生男婴儿的平均体重 (单位,克 ).
解 设新生男婴儿体重为 x克,由于 x服从正态分布,方差?2未知,因此要查 t分布表,
对?=0.05,因样本数 n=12,则查自由度为 11的 t
分布表,得 t?(12?1)=2.201
25
再计算
32 9528 18
201.2
12
3.375
30 57201.2
12
3.375
30 57
%95,
3.375)30 57(
11
1
30 57)25 4031 00(
12
1
1
2
即的置信区间是的置信度为因此
n
i
i
xs
x?
26
(二 ) 小样本下正态总体方差?2的估计
27
设样本 (X1,...,Xn)来自正态总体 N(?,?2),则
c2=(n?1)S2/?2服从具有 n?1个自由度的 c2分布,
对于给定的?,查表可以确定 a及 b,使得
a
Sn
b
Sn
bSna
b
Sn
a
b
Sn
aPbaP
2
2
2
2
2
2
2
2
2
2
)1()1(
1
)1(
1)1(
1
)1(
)(
c
而
28
在确定 a,b时,一般是取
2
)()( 22
cc bPaP
a b
/2?/21
29
例 5 假定初生婴儿 (男孩 )的体重服从正态分布,
随机抽取 12名婴儿,测体重为 3100,2520,3000,
3000,3600,3160,3560,3320,2880,2600,3400,
2540,对婴儿体重的方差进行区间估计
(?=0.05)
解 计算可得 (n?1)s2?1549467,
=0.05,n?1=11,查附表五,得 a=3.82,b=21.9,
a,b满足
025.0
2
)(
975.0
2
1)(
2
2
c
c
bP
aP
30
因此得?2的置信区间为
4 0 5 6 2 07 0 7 5 2
82.3
1 5 4 9 4 6 7
9.21
1 5 4 9 4 6 7
2
2
即
31
作业 习题八第 164页开始
5,6,7,11,13
32
请提问