复习
极大似然估计的求法
估计量的几个评选标准
区间估计
—— 选择参数的估计量,使实验结果具有最大概率
无偏性
有效性
一致性??
?
?
?
^—— E(?)=?
—— 方差更小的无偏估计量,
? 样本 原点矩是 总体 原点矩的无偏估计量 ;
? 样本方差 是总体方差的无偏估计量 ;
? 无偏估计量的函数未必是无偏估计量
─ ? 在 ? 的所有线性无偏估计量中,样本均值 X是最有效的,
—— 置信区间
若我们根据一个实际样本
得到鱼数 N 的极大似然估计为 1000条,
若我们能给出一个区间,在此区间内我们合
理地相信 N 的真值位于其中,这样对鱼数的估计就有把握多了,
但实际上,N 的真值可能大于 1000 条,也
可能小于 1000条,
§ 4 单个正态总体均值与方差的置信区间
也就是说,我们希望确定一个 尽可能小 的区间,使我们能以
比较高 的可靠程度相信它包含真参数值,
湖中鱼数的真值
[ ]
这里所说的“可靠程度”是用概率来度
量的,称为 置信概率, 置信度 或 置信水平,
习惯上把置信水平记作 1-?,这里 ? 是一个很小的正数,
譬如,在估计湖中鱼数的问题中,
?
根据置信水平 1-?,可以
找到一个正数 ?,
例如,通常可取置信
水平 = 0.95 或 0.9 等等,
,1)( ???? ????P
根据一个实际样本,由给定的置信水平 1-?,我们求出一个的
区间,使),( ??
置信水平的大小是根据实际需要选定的,
如何寻找这种区间?
,???? ???? 1)|?|(P
使得
^我们选取未知参数的某个估计量 ?,
^只要知道 ? 的概率分布就可以确定 ?,
下面我们就来正式给出置信区间的定义,并通过例子说明求
置信区间的方法,
????? ???? ??
由不等式 ??? ?? |?|
可以解出 ?:
这个不等式就是我们所求的 置信区间,),( ??
代入样本值所得的普通区间称
为 置信区间的实现,
作区间估计,就是要设法找出两个只依赖于样本的界限 (构造
统计量 )
即要求区间置信的长度尽可能
短,或能体现该要求的其它准则,
X1,X2,?,Xn 是取自
总体 X的样本,
,???? ???? 1)(P
对给定值 0<?<1,),,,(
21 nXXX ??
),,,( 21 nXXX ??
),( ??
满足
定义 4 设 ? 是总体 X 的待估参数,
?? 和
分别称为 置信下限 和 置信上限,
一,置信区间的概念
则称随机区间 为 ?的 置信水平为 1-? 的双侧置信区间,
若统计量
和
估计的精度要尽可能的高,
要求 ?以很大的可能被包含在置信区间内,
─P(?<? <?)= 1-? 要尽可能大,
─ 即要求估计尽量可靠,
置信水平为 0.95 是指 100 组样本值所得置信区间的 实现 中,
就是说,概率
置信度 置信概率
.?? 和 ),( ?? 是随机区间,
而不是说一个 实现 以 0.95 的概率覆盖了 ?.约有 95个能覆盖 ?,
置信水平的概率意义 ;
),( ??
并非一个 实现 以 1-?的概率覆盖了 ?.
即要求置信区间的长度尽可能短,估计的精度要尽可能的高,
估计要尽量可靠,─即 P(?<? <? )=1-? 要尽可能大, ─
可靠度与精度是一对矛盾,一般是在
保证可靠度的条件下尽可能提高精度,
将样本值代入 所得的普通区间称为 置信区间的实现,
^只要知道 ?的概率分布就可以确定 ?,
如何根据实际样本,由给定的置信水平 1-?,求出一个区间,使
根据置信水平 1-?,可以
找到一个正数 ?,
二、置信区间的求法
??
?
?
?
(一 ) 单个正态总体
1,均值 ? (1)已知方差 ?2
??
?
???
??
?
1,均值 ?1-?2 (1)已知方差 ?12,?22
???(二 ) 两 个正态总体
2,方差 ? 2
(2)未知方差 ?2
????? ???? 1)(P
),( ??
,???? ???? 1)|?|(P使得
^我们选取未知参数的某个估计量 ?,
????? ???? ??由不等式 ??? ?? |?| 可以解出 ?:
这个不等式就是我们所求的置信区间,),( ??
分布的分位数
①
②
③
(1)已知均值 ?
??? (2)未知均值 ?
(2)未知方差 ?12,?22
2,方差 ?12/?22 (1)已知均值 ?1,?2
??? (2)未知均值 ?1,?2
,但相等 !
对于给定的置信水平,根据估计量 U 的分布,确定
一个区间,使得 U 取值于该区间的概率为置信水平,
─X,S2 分别是其样本
均值和样本方差,
─X ~ N(?,?2/n),
求参数 ?,? 2 的置信水平为 1-?的置信区间,
设 X1,?,Xn 是总体 X ~ N(?,?2)的样本,
n
XU
/?
????
① 确定未知参数的
估计量及其函数的分布
是 ?的无偏估计量,
② 由分布求分位数 ?
即得置信区间
(一 ) 单个正态总体置信区间的求法
(1)已知方差 ?2 时
─故可用 X 作为 EX 的一个估计量,
??? n
i
iXnX
1
1?
~ N(0,1),
对给定的置信度 1-?,
按标准正态分布的双侧 ?分位数的定义
2/2/2/|/| ???
???
?
? u
nXunXun
X ???????
,)||( 2/ ?? ?? uUP
,21)( 2/ ?? ? ??u即令 查正态分布表可得 u?/2,
③ 由 u?/2确
定置信区间
,),( 2/2/ ?? ?? unXunX ??
有了分布就可求出 U 取值于任意区间的概率
P 66
简记为
2?
? u
nX ?
由抽样分布定理知
1,均值 ? 的置信区间
2/2/ ?? ??? unXunX ????
是求什么参数的置信区间? 置信水平 1-? 是多少?
^1,寻找未知参数 ?的一个良好的点估计量 ?(X1,X2,?,Xn );
^确定待估参数估计量 函数 U(?)的分布 ;
求置信区间首先要明确问题:
2,对于给定的置信水平 1-?,由概率
─(?,? ) 就是 ?的 100(1-?)% 的置信区间,
─
一般步骤如下,
─3,由分位数 |U|?x
? 确 定置信区间 (?,?).─
,)||( ?? ?? xUP
?? ?? )||( 2/uUP21)( 2/ ?? ? ??u
),( 2/2/ ?? ?? unXunX ??
查表求出分布的分位数 x?,
)1,0(~/ NnXU ? ???
??? ni iXnX 11
总体分布的形式是否已知,是怎样
的类型,至关重要,
某乡农民在联产承包责任制前人均纯收入 X(单位,元 ),
求 ?的置信水
平为 0,95 的置信区间,
推行联产承包责任制后,在该乡抽得
n=16 的样本,
且 X ~ N (300,252),
解 由于 ? =0.05,查正态分布表得
例 1
─得 x =325元,假设 ?2 = 25 2 没有变化,
2/|/| ??
? u
n
X ?? 96.1|
16/25
325| ??? ? 96.1162532596.11625325 ????? ?
即得置信区间 (312,75,337,25).
同一置信水平下的置信区间不唯一,
如在上例中取 ? =0,01+ 0,04,
)(1)(104.001.0 04.010.0 uu ?? ?????
75.1,33.2 04.001.0 ?? uu
由正态分布上侧分位数定义知
)(1 01.004.0 uUuP ?????
)()(1 04.010.0 uu ??? ??
查表知 75.1
16
2532533.2
16
25325 ????? ?
u0,025 =1,96,
当然区间长度越短的估计,精度就越高,
其长度也不相等,
区间长度为 24.25
长度为 25.5
谁是精度最高的?
由于标准正态分布密度函数的图形是单峰且对称的,
x? x
在保持面积不变的条件下,以对称区间的长度为最短 ! !
但
的长度是最短的,
l 与 n,? 的关系,),(
2/2/ ?? ?? unXunX ??
可知,
置信区间的长度 l 为,,2
2/?? unl ?
由置信区间公式
l 随着 ? 的减小而增大 ;
20 若给定 ?,l 随着 n 的增大而减小 ;
21)( 2/ ?? ? ??u
)(x?
同一置信水平下的置信区间不唯一, 其长度也不相等,
),( 2/2/ ?? ?? unXunX ??
故我们总取它作为置信水平为 1-?的置信区间,
若给定 n,
且由于 l 与 成反比,n 减小的速度并不快,
例如,n 由 100 增至 400 时,l 才能减小一半,
则 u?/2 越大,l 就越大,这时 ?就越小,
10
?(u?/2)就越大,
一般地,在概率密度为单峰且对称的情形下,a =-b 对应的
置信区间的长度为最短,
故不能采用已知方差
的均值估计方法
由于 与 ? 有关,
但其解决的思路一致,
nS
X ??
由于 S2是 ?2的无偏估计量,
查 t 分布表确定上侧 ?/2分位数
令,?? ???? 1})1(||{ 2 ntTP
T =
(2)未知方差
),( 2/2/ ?? ?? unXunX ??
n
XU
/?
???—— 用 分布的分位数求 ?的置信区间,
故可用 S替代 ?的估计量,
S
~ t(n-1),
)( )1(,)1( 22 ???? ntnSXntnSX ?? 即为 ?的置信度为 1-?的区间估计,
)1()1( 22 ??????? ntnSXntnSX ?? ?
? 2 时
由抽样分布定理知
—— 实用价值更大 !!
)1(|| 2/ ??? ntnSX ??
t?/2(n-1),
测定总体服从正态分布,
求总体均值 ?的置信水平为 0,95 的置信区间,
解 由于 ?/2=0.025,查 t分布表得
例 2 为确定某种溶液中甲醛浓度,
─ 且其 4个独立测量值的平均值 x=8,34%,样本标准差 s=0.03%,
2/|/| ?
? t
nS
X ??
182.3|4/03.0 34.8| ?? ?
%)182.3403.034.8(%)182.3403.034.8( ??????? ?
即得置信区间
自由度 n-1=3,t0,025=3.182,
─ 将 x =8,34% 代入 得
?????? ???? %)182.3403.034.8(,%)182.3403.034.8(
.)%883.8,%2 9 2.8(即
,)1(~)1( 22 2 ?? nSn ??
(2)? 未知时
???? ?? ??????? 1})1()1({ 2 222 21 nnP
,)1( )1()1( )1( 2
21
22
2 2
2
?
???
?
??
? n
Sn
n
Sn
?? ?
??
所以 ?2的置信水平为 1-?的区间估计为
因为 ?2 的无偏估计为 S2,
2,方差 ?2 的 置信区间的求法
由抽样分布定理知
?2 =
由
确定 ?2 分布的上侧 ?/2 分位数
.))1( )1(,)1( )1(( 2
21
2
2 2
2
?
?
?
?
? n
Sn
n
Sn
?? ??
找一个含 ?与 S,但不含 ?,
且分布已知的统计量
为了计算简单,在概率密度不对称的情形下,如 ?2 分布,F 分布,
习惯上仍取 对称的分位点 来计算未知参数的置信区间,
并不是最短的置信区间
?/2 ?/2
)1()1()1( 2 22 22 21 ?????? nSnn ?? ???
,)1(2 2 ?n??
,)1(2 21 ?? n??
测定总体服从正态分布,
求总体均值 ?的置信水平为 0,95 的置信区间,
解 由于 ?/2=0.025,
查 ?2 分布表得
例 3 为确定某种溶液中甲醛浓度,
─ 且其 4个独立测量值的平均值 x=8,34%,样本标准差 s=0.03%,
故 ?2 的置信区间为
自由度 n-1=3,
得
将 s 2 = 0.0009代入
,)%0 1 2 5.0,%0 0 0 2 9.0(
.)%1 1 2.0,%0 1 7.0(
求总体方差 ?2和标准差 ?的置信水平为 0,95 的置信区间,
,3 4 8.9)3(2 0 2 5.0 ??
,)1()1()1( 2 22 22 21 ?????? nSnn ?? ???
,2 1 6.0 0 0 0 9.033 4 8.9 0 0 0 9.03 2 ???? ?
故 ?的置信区间为
,216.0)3(2 025.01 ???
设 X1,?,Xm分别是总体 X ~ N(?1,?12)的样本,Y1,?,Yn分别
是总体 Y ~ N(?2,?22)的样本,─ ─X,Y 分别是总体 X和 Y的样本均值,
求参数 ?1-?2和 ?12/?22 的
置信水平为 1-?的置信区间,
─ ─由于 X,Y 分别是 ?
1,?2的无偏估计量,
即得置信区间
(二 ) 两个正态总体
(1)已知方差 ?12,?22 时
─ ─故可用 X -Y 作为 ?
1-?2的一个估计量,
~ N(0,1),
对给定的置信度 1-?,
nuYXmuYXuU
22
2/21
21
2/2/||
????
??? ?????????
,21)( 2/ ?? ? ??u令 查正态分布表可得 u?/2,
由抽样分布定理知
1,均值 ?1-?2 的置信区间
SX2,SY2分别是总体 X和 Y的样本方差,
置信区间的求法
nm
YXU
2
2
2
1
21 )(
??
??
?
????
),( 222/212/ nuYXmuYX ?? ?? ????
设 X1,?,Xm分别是总体 X ~ N(?1,?12)的样本,Y1,?,Yn分别
是总体 Y ~ N(?2,?22)的样本,─ ─X,Y 分别是总体 X和 Y的样本均值,
求参数 ?1-?2和 ?12/?22 的
置信水平为 1-?的置信区间,
即得置信区间
(二 ) 两个正态总体置信区间的求法
(2)未知方差 ?12,?22,但 ?12 = ?22 = ?2时
─ ─仍用 X-Y 作为 ?
1-?2的一个估计量,~
t(n+m-2),
对给定的置信度 1-?,
,1111)2(|| 2/212/2/ nmStYXnmStYXmntT ????????????? ????? ??
查 t 分布表可得
由抽样分布定理知
1,均值差 ?1-?2 的置信区间
SX2,SY2分别是总体 X和 Y的样本方差,
nmS
YXT
11
)( 21
?
????
?
??
2
)1()1( 22
??
???
nm
SnSm YX
)1111( 2/2/ nmStYXnmStYX ?????? ????,
t?/2(n+m-2),
且它们
的方差相同 (这两种仪器的测量精度相同 ),
例 4 用甲、乙两种仪器测量两测地站 A,B之间的直线距离 (单
位, 米 ),用仪器甲独立地测量 m=10次,得测量值的平均值
试求这两种仪器的平均
测量之差 的置信水平为 0,99 的置信区间,
解 设 X ~ N(?1,?12),Y ~ N(?2,?22),
查 t分布表得
─ y=45479,398,假定这两种仪器的测量值都服从正态分布,
,0440.01 ??? xm ms X
所以 ?1-?2 的置信区间 (-0.009,0.075 ).
?/2=0.005,m+n-2=23,
t0,005(23)=2.8073,
将条件 代入分别得
─x =45479,431,用仪器乙独立地测量 n=15次,得测量值的平均值
,0 3 0 8.01 ??? yn ns Y
,036.02 )1()1(
22
??? ???? nm SnSmS YX?
,1111 2/212/ nmStYXnmStYX ????????? ???? ???
设同上,求参数 ?12/?22 的置信水平为 1-?的置信区间,
即得 ?12/?22 的置信区间
(二 ) 两个正态总体置信区间的求法
(2)未知 ?1,?2时
~ F(m-1,n-1),
对给定的置信度 1-?,
,)11( 1)11( 1)1,1(||
2/1
22
21
22
21
2/
22
21
2/ ????????????
? n,mFS
S
n,mFS
SnmFF
??
? ?
?
查 F分布表可得上侧分位数
由抽样分布定理知
2,方差比 ?12/?22 的置信区间
2
2
2
2
1
2
?
?
Y
X
S
SF ?
))11( 1,)11( 1(
2/1
22
21
2/
22
21
?????? ? n,mFS
S
n,mFS
S
??
F?/2(m-1,n-1),F1-?/2(m-1,n-1),
求两总体方差比
?12/?22 的 置信水平为 0,90 的置信区间,
称重后所的样本方差分别为 sx2=0.0125,sy2=0,01,
假定所
装番茄酱的重量 X与 Y 分别服从正态分布 N(?1,?12)和 N(?2,?22),
解 由于 ?/2=0.05,
查 F分布表得
例 5 某厂用两条流水线生产番茄酱小包装,
现从两条流水线上各随机抽取样本容量分别为 m=6,n=7 的样本,
将条件代入得 ?12/?22 的置信区间为 (0,2847,6.1875).
自由度 m-1=5,n-1=6,
,39.4)6,5(05.0 ?F,
954.
1)
5,6(
1)6,5(
05.0
05.01 ??? FF
,)11( 1)11( 1
2/1
22
21
22
21
2/
22
21
???????? ? n,mFS
S
n,mFS
S
?? ?
?
主要根据
抽样分布 Th
(二 )两 个总体
^② 由 ? 的概率分布和置信水平 1-?,确定其相应的 分位数 x?/2 ;
小结 —— 正态总体置信区间的求法
?
?
?
??
?
? (一 )单个总体
均值 ? 已知方差 ?
2
??
???
??
?
??
?
?
?
均值差 ?1-?2
已知方差 ?12,?22
??
???
方差 ?2
未知方差 ?2
.),( ??解得 所求的置信区间
^① 根据未知参数的无偏估计量,确定其某个估计量 ? ;
③ 由不等式,|?|
??? x??
已知均值 ?
??? 未知均值 ?
未知方差 ?12,?22
方差比 ?12/?22 已知均值 ?1,?2
??? 未知均值 ?1,?2
但相等 !;),(~ 2nNX ??
.)1(~1 222 ?? nSn ??
)1(~ ?? ntnSX ?;)1,0(~
)(
)(
212221
21 N
nm
YX
??
??
?
???
,)1,1(~2
22
212 ?? nmF
SS YX ?
?
,)2(~
)11(
)(
2
1
21 ??
?
??? nmt
nmS
YX
?
??
X1,?,Xn 是取自 X
的样本,
─则称随机区间 (-?,? )为 ?的 置信水平为 1-? 的单侧置信区间,
但有些实际问题,人们关
心的只是参数在一个方向的界限,
这时,可将置信上限取为 +∞,而只着眼于置
信下限,
上述置信区间中置信限都是双侧的,
例如对于设备、元件的使用寿命来说,平均寿命过长没什么问
题,过短就有问题了,
三、单侧置信区间
定义
满足
这样求得的置信区间叫 单侧置信区间,
,??? ??? 1)(P
对给定值 0<?<1,
),,( 1 nXX ?? 满足
设 ?是总体 X 的待估参数,
称 ?为 单侧置信下限 ; ─
则称随机区间 (?,+?)为 ?的 置信水平为 1-?的单侧置信区间,─
─称 ? 为 单侧置信上限,
若统计量
若统计量
),,( 1 nXX ??
,??? ??? 1)(P
求单侧置信区间的思路完全同于双侧的情形
记录其磨坏时所行驶路程 (单位,公里 ),
问该种轮胎平均行驶路程至少是多少 (?=0.05)?
解 由于 ? 2 未知,
查 t 分布表可得满足条件 的上侧分位数
例 6 从一批汽车轮胎中随机地取 16只作磨损试验,
─ 算得样本均值 x= 41116,
2// ?
? t
nS
X ??,7 5 3 1.1
16/6 3 4 6
4 1 1 1 6 ?? ?
7531.116634641116 ????即得置信度为 0.95 的单侧置信下限
t0,05(15)=1.7531,
─ 将 x =41116,s=6346 代入 得
设此样本来自正态总体 N(?,? 2),?,?均未知,
nS
XT ??? ~ t(n-1),
由抽样分布定理知 随机变量
样本标准差 s=6346,
05.0))116(( 05.0 ??? tTP
= 38334,
故该种轮胎平均行驶路程不少于 38334公里,其置信概率为 0.95.
P241 例 22,请自读,
P243 附表
—— 随机变量 ?
?
? n
i i
XY
1
2
一、自由度为 n 的 ? 2 分布 Y ~?2 (n)
所服从的分布 (诸 Xi 独立且都服从 N(0,1))
20+30 若 Y ~?2 (n),则 EY= n,DY= 2n ;
设 X1,?,Xn 相互独立,且都服从正态分布 N(?,? 2),则
当 n 充分大时,;)(~)(1 2
1
2
2 nXY
n
i i
??? ?
?
??
近似服从 N(0,1),
n
nY
2
?
40
?2 分布的 上侧 ?分位数,)())(( )(2 2 ?? ??? ??? ? ?? xdxfnXP n
n ? 45 时,
n>45 时,.)12(
21 22 ??? nu ???
??
?;)(~ 221 nmYY ?? ?则
10 可加性 —— 设 Y1~?2 (m),Y2 ~?2 (n),且 Y1,Y2独立,
即 n充分大时,t分布近似 N(0,1),
T 的密度函数为 偶函数;
(其中 X~ N(0,1),Y~ ?2 (n),X 与 Y 相互独立 )nY
XT ? 所服从的分布,
二、自由度为 n 的 t 分布 T ~ t (n)
数学期望 E(T)= 0,
—— 随机变量
,21)(lim 2
2x
n exf
?
?? ? ?
方差 D(T)= n/(n-2),(n> 2).
t 分布的尾部比标准正态分布的尾部具有更大的概率
但 n 较小时,t 分布与 N(0,1)分布相差很大
查附表求 P(T > t?(n))=?
,?? ut ?
t 分布的 上侧 ?分位数 n ? 45 时,n > 45 时,
???
(随机变量 X与 Y独立,且 Y~ ?2 (m),Y~ ?2 (n) )
所服从的分布
nY
mXF ?
三,第一自由度为
数学期望,2,
2)( ??? nn nXE
—— 统计量
F 分布的性质, 10 若 X ~F(m,n),则 1/X ~F(n,m),
20 若 X ~ t (n),则 X 2 ~ F(1,n);
不依赖于第一自由度
.),( 1),(1 mnFnmF ?? ??
查 F 分布 附表可求 P(F >F?(m,n) )= ?,
F 分布 上侧 ? 分位数的性质
m,第二自由度为 n的 F 分布 F ~ F(m,n)
正态分布
非正态分布
?
?
?
?
?
?
?
来自一个总体
来自两个总体;),(~)1( 2nNX ??,)1(~)(1)2( 2
1
22 ???
?
nXXn
i i
??
)1(~1)3( ????? ntnS XnSX
n
??
?
?
?
?
?;)1,0(~)(
2
2
2
1
21 N
nm
YX
??
??
?
???不同方差
同 方 差
,)1,1(~2
22
212 ?? nmF
S
S
Y
X
?
?
,)2(~
11
)( 21 ??
?
??? nmt
nmS
YX
?
??
.)1,1(~22 ?? nmFSS
Y
X
Th1&Th2
Th3&Th4
当 n充分大时,近似地有;),(~)1( 2nNX ??,)1,0(~)2( NnSX ??
独立同分布中心极限定理
抽样定理
将样本值 x1,x2,? xn 代入最大值点的表达式
中,就得未知参数的 极大似然估计值, ??
—— 把自变量 x看
成常数,把未知参数 ?=(?1,?2,?,?l)看成自变量 ;
—— 可 转化为求 ln L(?)的最大
值点,
① 由总体分布建立 似然函数 L(?)
② 求似然函数 L(?)的最大值点
求极大似然估计的一般步骤是:
③ 将样本 X1,X2,? Xn 代入最大值点的表达式中,就得未知参数
的 极大似然估计量,??
??? ni ixf1 );( ?
即 1
0 建立 似然方程组:
,)21(0)(ln l,,,iL
i
????? ? ?
20 解 似然方程组 得到 L(?)的最大值点 ;,0
)(ln ?
? ?d Ld
? 是实数时,似然方程组就是方程
极大似然估计的求法
估计量的几个评选标准
区间估计
—— 选择参数的估计量,使实验结果具有最大概率
无偏性
有效性
一致性??
?
?
?
^—— E(?)=?
—— 方差更小的无偏估计量,
? 样本 原点矩是 总体 原点矩的无偏估计量 ;
? 样本方差 是总体方差的无偏估计量 ;
? 无偏估计量的函数未必是无偏估计量
─ ? 在 ? 的所有线性无偏估计量中,样本均值 X是最有效的,
—— 置信区间
若我们根据一个实际样本
得到鱼数 N 的极大似然估计为 1000条,
若我们能给出一个区间,在此区间内我们合
理地相信 N 的真值位于其中,这样对鱼数的估计就有把握多了,
但实际上,N 的真值可能大于 1000 条,也
可能小于 1000条,
§ 4 单个正态总体均值与方差的置信区间
也就是说,我们希望确定一个 尽可能小 的区间,使我们能以
比较高 的可靠程度相信它包含真参数值,
湖中鱼数的真值
[ ]
这里所说的“可靠程度”是用概率来度
量的,称为 置信概率, 置信度 或 置信水平,
习惯上把置信水平记作 1-?,这里 ? 是一个很小的正数,
譬如,在估计湖中鱼数的问题中,
?
根据置信水平 1-?,可以
找到一个正数 ?,
例如,通常可取置信
水平 = 0.95 或 0.9 等等,
,1)( ???? ????P
根据一个实际样本,由给定的置信水平 1-?,我们求出一个的
区间,使),( ??
置信水平的大小是根据实际需要选定的,
如何寻找这种区间?
,???? ???? 1)|?|(P
使得
^我们选取未知参数的某个估计量 ?,
^只要知道 ? 的概率分布就可以确定 ?,
下面我们就来正式给出置信区间的定义,并通过例子说明求
置信区间的方法,
????? ???? ??
由不等式 ??? ?? |?|
可以解出 ?:
这个不等式就是我们所求的 置信区间,),( ??
代入样本值所得的普通区间称
为 置信区间的实现,
作区间估计,就是要设法找出两个只依赖于样本的界限 (构造
统计量 )
即要求区间置信的长度尽可能
短,或能体现该要求的其它准则,
X1,X2,?,Xn 是取自
总体 X的样本,
,???? ???? 1)(P
对给定值 0<?<1,),,,(
21 nXXX ??
),,,( 21 nXXX ??
),( ??
满足
定义 4 设 ? 是总体 X 的待估参数,
?? 和
分别称为 置信下限 和 置信上限,
一,置信区间的概念
则称随机区间 为 ?的 置信水平为 1-? 的双侧置信区间,
若统计量
和
估计的精度要尽可能的高,
要求 ?以很大的可能被包含在置信区间内,
─P(?<? <?)= 1-? 要尽可能大,
─ 即要求估计尽量可靠,
置信水平为 0.95 是指 100 组样本值所得置信区间的 实现 中,
就是说,概率
置信度 置信概率
.?? 和 ),( ?? 是随机区间,
而不是说一个 实现 以 0.95 的概率覆盖了 ?.约有 95个能覆盖 ?,
置信水平的概率意义 ;
),( ??
并非一个 实现 以 1-?的概率覆盖了 ?.
即要求置信区间的长度尽可能短,估计的精度要尽可能的高,
估计要尽量可靠,─即 P(?<? <? )=1-? 要尽可能大, ─
可靠度与精度是一对矛盾,一般是在
保证可靠度的条件下尽可能提高精度,
将样本值代入 所得的普通区间称为 置信区间的实现,
^只要知道 ?的概率分布就可以确定 ?,
如何根据实际样本,由给定的置信水平 1-?,求出一个区间,使
根据置信水平 1-?,可以
找到一个正数 ?,
二、置信区间的求法
??
?
?
?
(一 ) 单个正态总体
1,均值 ? (1)已知方差 ?2
??
?
???
??
?
1,均值 ?1-?2 (1)已知方差 ?12,?22
???(二 ) 两 个正态总体
2,方差 ? 2
(2)未知方差 ?2
????? ???? 1)(P
),( ??
,???? ???? 1)|?|(P使得
^我们选取未知参数的某个估计量 ?,
????? ???? ??由不等式 ??? ?? |?| 可以解出 ?:
这个不等式就是我们所求的置信区间,),( ??
分布的分位数
①
②
③
(1)已知均值 ?
??? (2)未知均值 ?
(2)未知方差 ?12,?22
2,方差 ?12/?22 (1)已知均值 ?1,?2
??? (2)未知均值 ?1,?2
,但相等 !
对于给定的置信水平,根据估计量 U 的分布,确定
一个区间,使得 U 取值于该区间的概率为置信水平,
─X,S2 分别是其样本
均值和样本方差,
─X ~ N(?,?2/n),
求参数 ?,? 2 的置信水平为 1-?的置信区间,
设 X1,?,Xn 是总体 X ~ N(?,?2)的样本,
n
XU
/?
????
① 确定未知参数的
估计量及其函数的分布
是 ?的无偏估计量,
② 由分布求分位数 ?
即得置信区间
(一 ) 单个正态总体置信区间的求法
(1)已知方差 ?2 时
─故可用 X 作为 EX 的一个估计量,
??? n
i
iXnX
1
1?
~ N(0,1),
对给定的置信度 1-?,
按标准正态分布的双侧 ?分位数的定义
2/2/2/|/| ???
???
?
? u
nXunXun
X ???????
,)||( 2/ ?? ?? uUP
,21)( 2/ ?? ? ??u即令 查正态分布表可得 u?/2,
③ 由 u?/2确
定置信区间
,),( 2/2/ ?? ?? unXunX ??
有了分布就可求出 U 取值于任意区间的概率
P 66
简记为
2?
? u
nX ?
由抽样分布定理知
1,均值 ? 的置信区间
2/2/ ?? ??? unXunX ????
是求什么参数的置信区间? 置信水平 1-? 是多少?
^1,寻找未知参数 ?的一个良好的点估计量 ?(X1,X2,?,Xn );
^确定待估参数估计量 函数 U(?)的分布 ;
求置信区间首先要明确问题:
2,对于给定的置信水平 1-?,由概率
─(?,? ) 就是 ?的 100(1-?)% 的置信区间,
─
一般步骤如下,
─3,由分位数 |U|?x
? 确 定置信区间 (?,?).─
,)||( ?? ?? xUP
?? ?? )||( 2/uUP21)( 2/ ?? ? ??u
),( 2/2/ ?? ?? unXunX ??
查表求出分布的分位数 x?,
)1,0(~/ NnXU ? ???
??? ni iXnX 11
总体分布的形式是否已知,是怎样
的类型,至关重要,
某乡农民在联产承包责任制前人均纯收入 X(单位,元 ),
求 ?的置信水
平为 0,95 的置信区间,
推行联产承包责任制后,在该乡抽得
n=16 的样本,
且 X ~ N (300,252),
解 由于 ? =0.05,查正态分布表得
例 1
─得 x =325元,假设 ?2 = 25 2 没有变化,
2/|/| ??
? u
n
X ?? 96.1|
16/25
325| ??? ? 96.1162532596.11625325 ????? ?
即得置信区间 (312,75,337,25).
同一置信水平下的置信区间不唯一,
如在上例中取 ? =0,01+ 0,04,
)(1)(104.001.0 04.010.0 uu ?? ?????
75.1,33.2 04.001.0 ?? uu
由正态分布上侧分位数定义知
)(1 01.004.0 uUuP ?????
)()(1 04.010.0 uu ??? ??
查表知 75.1
16
2532533.2
16
25325 ????? ?
u0,025 =1,96,
当然区间长度越短的估计,精度就越高,
其长度也不相等,
区间长度为 24.25
长度为 25.5
谁是精度最高的?
由于标准正态分布密度函数的图形是单峰且对称的,
x? x
在保持面积不变的条件下,以对称区间的长度为最短 ! !
但
的长度是最短的,
l 与 n,? 的关系,),(
2/2/ ?? ?? unXunX ??
可知,
置信区间的长度 l 为,,2
2/?? unl ?
由置信区间公式
l 随着 ? 的减小而增大 ;
20 若给定 ?,l 随着 n 的增大而减小 ;
21)( 2/ ?? ? ??u
)(x?
同一置信水平下的置信区间不唯一, 其长度也不相等,
),( 2/2/ ?? ?? unXunX ??
故我们总取它作为置信水平为 1-?的置信区间,
若给定 n,
且由于 l 与 成反比,n 减小的速度并不快,
例如,n 由 100 增至 400 时,l 才能减小一半,
则 u?/2 越大,l 就越大,这时 ?就越小,
10
?(u?/2)就越大,
一般地,在概率密度为单峰且对称的情形下,a =-b 对应的
置信区间的长度为最短,
故不能采用已知方差
的均值估计方法
由于 与 ? 有关,
但其解决的思路一致,
nS
X ??
由于 S2是 ?2的无偏估计量,
查 t 分布表确定上侧 ?/2分位数
令,?? ???? 1})1(||{ 2 ntTP
T =
(2)未知方差
),( 2/2/ ?? ?? unXunX ??
n
XU
/?
???—— 用 分布的分位数求 ?的置信区间,
故可用 S替代 ?的估计量,
S
~ t(n-1),
)( )1(,)1( 22 ???? ntnSXntnSX ?? 即为 ?的置信度为 1-?的区间估计,
)1()1( 22 ??????? ntnSXntnSX ?? ?
? 2 时
由抽样分布定理知
—— 实用价值更大 !!
)1(|| 2/ ??? ntnSX ??
t?/2(n-1),
测定总体服从正态分布,
求总体均值 ?的置信水平为 0,95 的置信区间,
解 由于 ?/2=0.025,查 t分布表得
例 2 为确定某种溶液中甲醛浓度,
─ 且其 4个独立测量值的平均值 x=8,34%,样本标准差 s=0.03%,
2/|/| ?
? t
nS
X ??
182.3|4/03.0 34.8| ?? ?
%)182.3403.034.8(%)182.3403.034.8( ??????? ?
即得置信区间
自由度 n-1=3,t0,025=3.182,
─ 将 x =8,34% 代入 得
?????? ???? %)182.3403.034.8(,%)182.3403.034.8(
.)%883.8,%2 9 2.8(即
,)1(~)1( 22 2 ?? nSn ??
(2)? 未知时
???? ?? ??????? 1})1()1({ 2 222 21 nnP
,)1( )1()1( )1( 2
21
22
2 2
2
?
???
?
??
? n
Sn
n
Sn
?? ?
??
所以 ?2的置信水平为 1-?的区间估计为
因为 ?2 的无偏估计为 S2,
2,方差 ?2 的 置信区间的求法
由抽样分布定理知
?2 =
由
确定 ?2 分布的上侧 ?/2 分位数
.))1( )1(,)1( )1(( 2
21
2
2 2
2
?
?
?
?
? n
Sn
n
Sn
?? ??
找一个含 ?与 S,但不含 ?,
且分布已知的统计量
为了计算简单,在概率密度不对称的情形下,如 ?2 分布,F 分布,
习惯上仍取 对称的分位点 来计算未知参数的置信区间,
并不是最短的置信区间
?/2 ?/2
)1()1()1( 2 22 22 21 ?????? nSnn ?? ???
,)1(2 2 ?n??
,)1(2 21 ?? n??
测定总体服从正态分布,
求总体均值 ?的置信水平为 0,95 的置信区间,
解 由于 ?/2=0.025,
查 ?2 分布表得
例 3 为确定某种溶液中甲醛浓度,
─ 且其 4个独立测量值的平均值 x=8,34%,样本标准差 s=0.03%,
故 ?2 的置信区间为
自由度 n-1=3,
得
将 s 2 = 0.0009代入
,)%0 1 2 5.0,%0 0 0 2 9.0(
.)%1 1 2.0,%0 1 7.0(
求总体方差 ?2和标准差 ?的置信水平为 0,95 的置信区间,
,3 4 8.9)3(2 0 2 5.0 ??
,)1()1()1( 2 22 22 21 ?????? nSnn ?? ???
,2 1 6.0 0 0 0 9.033 4 8.9 0 0 0 9.03 2 ???? ?
故 ?的置信区间为
,216.0)3(2 025.01 ???
设 X1,?,Xm分别是总体 X ~ N(?1,?12)的样本,Y1,?,Yn分别
是总体 Y ~ N(?2,?22)的样本,─ ─X,Y 分别是总体 X和 Y的样本均值,
求参数 ?1-?2和 ?12/?22 的
置信水平为 1-?的置信区间,
─ ─由于 X,Y 分别是 ?
1,?2的无偏估计量,
即得置信区间
(二 ) 两个正态总体
(1)已知方差 ?12,?22 时
─ ─故可用 X -Y 作为 ?
1-?2的一个估计量,
~ N(0,1),
对给定的置信度 1-?,
nuYXmuYXuU
22
2/21
21
2/2/||
????
??? ?????????
,21)( 2/ ?? ? ??u令 查正态分布表可得 u?/2,
由抽样分布定理知
1,均值 ?1-?2 的置信区间
SX2,SY2分别是总体 X和 Y的样本方差,
置信区间的求法
nm
YXU
2
2
2
1
21 )(
??
??
?
????
),( 222/212/ nuYXmuYX ?? ?? ????
设 X1,?,Xm分别是总体 X ~ N(?1,?12)的样本,Y1,?,Yn分别
是总体 Y ~ N(?2,?22)的样本,─ ─X,Y 分别是总体 X和 Y的样本均值,
求参数 ?1-?2和 ?12/?22 的
置信水平为 1-?的置信区间,
即得置信区间
(二 ) 两个正态总体置信区间的求法
(2)未知方差 ?12,?22,但 ?12 = ?22 = ?2时
─ ─仍用 X-Y 作为 ?
1-?2的一个估计量,~
t(n+m-2),
对给定的置信度 1-?,
,1111)2(|| 2/212/2/ nmStYXnmStYXmntT ????????????? ????? ??
查 t 分布表可得
由抽样分布定理知
1,均值差 ?1-?2 的置信区间
SX2,SY2分别是总体 X和 Y的样本方差,
nmS
YXT
11
)( 21
?
????
?
??
2
)1()1( 22
??
???
nm
SnSm YX
)1111( 2/2/ nmStYXnmStYX ?????? ????,
t?/2(n+m-2),
且它们
的方差相同 (这两种仪器的测量精度相同 ),
例 4 用甲、乙两种仪器测量两测地站 A,B之间的直线距离 (单
位, 米 ),用仪器甲独立地测量 m=10次,得测量值的平均值
试求这两种仪器的平均
测量之差 的置信水平为 0,99 的置信区间,
解 设 X ~ N(?1,?12),Y ~ N(?2,?22),
查 t分布表得
─ y=45479,398,假定这两种仪器的测量值都服从正态分布,
,0440.01 ??? xm ms X
所以 ?1-?2 的置信区间 (-0.009,0.075 ).
?/2=0.005,m+n-2=23,
t0,005(23)=2.8073,
将条件 代入分别得
─x =45479,431,用仪器乙独立地测量 n=15次,得测量值的平均值
,0 3 0 8.01 ??? yn ns Y
,036.02 )1()1(
22
??? ???? nm SnSmS YX?
,1111 2/212/ nmStYXnmStYX ????????? ???? ???
设同上,求参数 ?12/?22 的置信水平为 1-?的置信区间,
即得 ?12/?22 的置信区间
(二 ) 两个正态总体置信区间的求法
(2)未知 ?1,?2时
~ F(m-1,n-1),
对给定的置信度 1-?,
,)11( 1)11( 1)1,1(||
2/1
22
21
22
21
2/
22
21
2/ ????????????
? n,mFS
S
n,mFS
SnmFF
??
? ?
?
查 F分布表可得上侧分位数
由抽样分布定理知
2,方差比 ?12/?22 的置信区间
2
2
2
2
1
2
?
?
Y
X
S
SF ?
))11( 1,)11( 1(
2/1
22
21
2/
22
21
?????? ? n,mFS
S
n,mFS
S
??
F?/2(m-1,n-1),F1-?/2(m-1,n-1),
求两总体方差比
?12/?22 的 置信水平为 0,90 的置信区间,
称重后所的样本方差分别为 sx2=0.0125,sy2=0,01,
假定所
装番茄酱的重量 X与 Y 分别服从正态分布 N(?1,?12)和 N(?2,?22),
解 由于 ?/2=0.05,
查 F分布表得
例 5 某厂用两条流水线生产番茄酱小包装,
现从两条流水线上各随机抽取样本容量分别为 m=6,n=7 的样本,
将条件代入得 ?12/?22 的置信区间为 (0,2847,6.1875).
自由度 m-1=5,n-1=6,
,39.4)6,5(05.0 ?F,
954.
1)
5,6(
1)6,5(
05.0
05.01 ??? FF
,)11( 1)11( 1
2/1
22
21
22
21
2/
22
21
???????? ? n,mFS
S
n,mFS
S
?? ?
?
主要根据
抽样分布 Th
(二 )两 个总体
^② 由 ? 的概率分布和置信水平 1-?,确定其相应的 分位数 x?/2 ;
小结 —— 正态总体置信区间的求法
?
?
?
??
?
? (一 )单个总体
均值 ? 已知方差 ?
2
??
???
??
?
??
?
?
?
均值差 ?1-?2
已知方差 ?12,?22
??
???
方差 ?2
未知方差 ?2
.),( ??解得 所求的置信区间
^① 根据未知参数的无偏估计量,确定其某个估计量 ? ;
③ 由不等式,|?|
??? x??
已知均值 ?
??? 未知均值 ?
未知方差 ?12,?22
方差比 ?12/?22 已知均值 ?1,?2
??? 未知均值 ?1,?2
但相等 !;),(~ 2nNX ??
.)1(~1 222 ?? nSn ??
)1(~ ?? ntnSX ?;)1,0(~
)(
)(
212221
21 N
nm
YX
??
??
?
???
,)1,1(~2
22
212 ?? nmF
SS YX ?
?
,)2(~
)11(
)(
2
1
21 ??
?
??? nmt
nmS
YX
?
??
X1,?,Xn 是取自 X
的样本,
─则称随机区间 (-?,? )为 ?的 置信水平为 1-? 的单侧置信区间,
但有些实际问题,人们关
心的只是参数在一个方向的界限,
这时,可将置信上限取为 +∞,而只着眼于置
信下限,
上述置信区间中置信限都是双侧的,
例如对于设备、元件的使用寿命来说,平均寿命过长没什么问
题,过短就有问题了,
三、单侧置信区间
定义
满足
这样求得的置信区间叫 单侧置信区间,
,??? ??? 1)(P
对给定值 0<?<1,
),,( 1 nXX ?? 满足
设 ?是总体 X 的待估参数,
称 ?为 单侧置信下限 ; ─
则称随机区间 (?,+?)为 ?的 置信水平为 1-?的单侧置信区间,─
─称 ? 为 单侧置信上限,
若统计量
若统计量
),,( 1 nXX ??
,??? ??? 1)(P
求单侧置信区间的思路完全同于双侧的情形
记录其磨坏时所行驶路程 (单位,公里 ),
问该种轮胎平均行驶路程至少是多少 (?=0.05)?
解 由于 ? 2 未知,
查 t 分布表可得满足条件 的上侧分位数
例 6 从一批汽车轮胎中随机地取 16只作磨损试验,
─ 算得样本均值 x= 41116,
2// ?
? t
nS
X ??,7 5 3 1.1
16/6 3 4 6
4 1 1 1 6 ?? ?
7531.116634641116 ????即得置信度为 0.95 的单侧置信下限
t0,05(15)=1.7531,
─ 将 x =41116,s=6346 代入 得
设此样本来自正态总体 N(?,? 2),?,?均未知,
nS
XT ??? ~ t(n-1),
由抽样分布定理知 随机变量
样本标准差 s=6346,
05.0))116(( 05.0 ??? tTP
= 38334,
故该种轮胎平均行驶路程不少于 38334公里,其置信概率为 0.95.
P241 例 22,请自读,
P243 附表
—— 随机变量 ?
?
? n
i i
XY
1
2
一、自由度为 n 的 ? 2 分布 Y ~?2 (n)
所服从的分布 (诸 Xi 独立且都服从 N(0,1))
20+30 若 Y ~?2 (n),则 EY= n,DY= 2n ;
设 X1,?,Xn 相互独立,且都服从正态分布 N(?,? 2),则
当 n 充分大时,;)(~)(1 2
1
2
2 nXY
n
i i
??? ?
?
??
近似服从 N(0,1),
n
nY
2
?
40
?2 分布的 上侧 ?分位数,)())(( )(2 2 ?? ??? ??? ? ?? xdxfnXP n
n ? 45 时,
n>45 时,.)12(
21 22 ??? nu ???
??
?;)(~ 221 nmYY ?? ?则
10 可加性 —— 设 Y1~?2 (m),Y2 ~?2 (n),且 Y1,Y2独立,
即 n充分大时,t分布近似 N(0,1),
T 的密度函数为 偶函数;
(其中 X~ N(0,1),Y~ ?2 (n),X 与 Y 相互独立 )nY
XT ? 所服从的分布,
二、自由度为 n 的 t 分布 T ~ t (n)
数学期望 E(T)= 0,
—— 随机变量
,21)(lim 2
2x
n exf
?
?? ? ?
方差 D(T)= n/(n-2),(n> 2).
t 分布的尾部比标准正态分布的尾部具有更大的概率
但 n 较小时,t 分布与 N(0,1)分布相差很大
查附表求 P(T > t?(n))=?
,?? ut ?
t 分布的 上侧 ?分位数 n ? 45 时,n > 45 时,
???
(随机变量 X与 Y独立,且 Y~ ?2 (m),Y~ ?2 (n) )
所服从的分布
nY
mXF ?
三,第一自由度为
数学期望,2,
2)( ??? nn nXE
—— 统计量
F 分布的性质, 10 若 X ~F(m,n),则 1/X ~F(n,m),
20 若 X ~ t (n),则 X 2 ~ F(1,n);
不依赖于第一自由度
.),( 1),(1 mnFnmF ?? ??
查 F 分布 附表可求 P(F >F?(m,n) )= ?,
F 分布 上侧 ? 分位数的性质
m,第二自由度为 n的 F 分布 F ~ F(m,n)
正态分布
非正态分布
?
?
?
?
?
?
?
来自一个总体
来自两个总体;),(~)1( 2nNX ??,)1(~)(1)2( 2
1
22 ???
?
nXXn
i i
??
)1(~1)3( ????? ntnS XnSX
n
??
?
?
?
?
?;)1,0(~)(
2
2
2
1
21 N
nm
YX
??
??
?
???不同方差
同 方 差
,)1,1(~2
22
212 ?? nmF
S
S
Y
X
?
?
,)2(~
11
)( 21 ??
?
??? nmt
nmS
YX
?
??
.)1,1(~22 ?? nmFSS
Y
X
Th1&Th2
Th3&Th4
当 n充分大时,近似地有;),(~)1( 2nNX ??,)1,0(~)2( NnSX ??
独立同分布中心极限定理
抽样定理
将样本值 x1,x2,? xn 代入最大值点的表达式
中,就得未知参数的 极大似然估计值, ??
—— 把自变量 x看
成常数,把未知参数 ?=(?1,?2,?,?l)看成自变量 ;
—— 可 转化为求 ln L(?)的最大
值点,
① 由总体分布建立 似然函数 L(?)
② 求似然函数 L(?)的最大值点
求极大似然估计的一般步骤是:
③ 将样本 X1,X2,? Xn 代入最大值点的表达式中,就得未知参数
的 极大似然估计量,??
??? ni ixf1 );( ?
即 1
0 建立 似然方程组:
,)21(0)(ln l,,,iL
i
????? ? ?
20 解 似然方程组 得到 L(?)的最大值点 ;,0
)(ln ?
? ?d Ld
? 是实数时,似然方程组就是方程