设 X,X1,X2,…,Xn
1,
2.若 X~N( 0,1),则知识回顾
Xi ~N( μ,σ2)(1)
(2)
(3)
3,若 X~N( μ,σ2),
则 与 s2 相互独立,
Y ~ N (μ2,σ2 2),Y1,Y2,…,Y n2,它们相互独立,
则若 X ~ N (μ1,σ12),X1,X2,…,X n1( 1)
( 2) 当 σ12 =σ22 =σ2时,
4,两个正态总体
( 3)
二、估计量的评选标准一,参数的点估计第七章参数估计三、参数的区间估计思考题用 X表示概率统计课程的考试成绩,假定现在抽查了 5位同学的试卷,成绩分别为 90,70,72
,60,50,根据以上条件,考虑下一份试卷得分在 60
~ 80之间的概率?
第七章 参数估计
待解问题,若总体 X的分布函数 F(x)的类型已知,但它的一个或多个参数未知,如何估计总体的未知参数?
大概思路,通过用 X的一组样本观察值( x1,x2,…,xn)
建立起来计算参数的公式,用来估计总体中未知参数的值,
即用 样本统计量的值 估计 总体中未知参数的值。
参数的点估计:指用样本统计量的值估计未知参数的值。
估计量:设 θ 为总体 X的未知参数,用样本( X1,X2,…,Xn)
构成的一个统计量 来估计 θ 的真值,称 为 θ 的估计量。
估计值:对应于样本的一组观测值( x1,x2,…,xn),
估计量 的值 ( x1,x2,…,xn)称为 θ 的估计值,
仍记作 。
参数估计是对已知 分布类型的总体,
参数估计点 估 计区间估计矩 估 计极大似然估计参数估计可作如下划分利用样本 对其未知参数作出估计矩估计的基本原理
K,1 9 2 0矩 法 估 计 皮 尔 逊 在 世 纪 末 世 纪 初一 系 列 论 文 中 提 出 的这 个 方 法 的 思 想 很 直 观,
1(,,)
m
mkx f x d x
12 k依 赖 于 参 数,
= ( )mEX
1(,,),kfx设 总 体 分 布 则 它 的 矩
,,另 一 方 面 由 大 数 定 理
1
1
1(,) n m
m m n i
i
X
n
1,2,,mk?取 并 让 上 面 的 近 似 等 式 改 为 等 式就 得 到 方 程 组
12,(,)i i i nX X X i解 出 做 为 的 估 计
( )m mEX
1
1 n m
i
i
Xn
,n在 样 本 容 量 较 大 时矩估计的基本过程
1 1 2( ) = (,) EX
2 2 1 2( ) (,) EX
例 1 设某炸药厂一天中发生着火现象的次数 X服从
参 数 为 的 泊 松 分 布,未 知,有 以 下 样 本 值 ;
试 估 计 参 数 ( 用 矩 法 ) 。
25012622549075
6543210
knk
k
次着火天数发生着火的次数
11
1
1 n
i
i
EX A X X
n
解,=,X?令
1? ( 0 7 5 1 9 0 6 1 ) 1,2 2
250x则
=,1,2 2 X所 以 估 计 值 。
12,~ [,],,,,nX U a b a b X X例 设 总 体 未 知 ; 是 一 个样 本 ;的矩估计量。求,ba,
1,2
abEX解,
1
1
1
2
n
i
i
ab AX
n?
令
22
2
2
1
( ) ( ) 1
1 2 4
n
i
i
b a a b AX
n?
22
22
2
( ) ( ) ( )
1 2 4
b a a bE X D X E X
2
1 2 12,1 2 ( ) a b A b a A A即
22
2 2 1
1
3? 3 ( ) ( ) n
i
i
a A A A X X X
n?
解 得,
22
1 2 1
1
3? 3 ( ) ( ) n
i
i
b A A A X X X
n?
2
2
1
3,0,
,,n
X
XX
例 设 总 体 的 均 值,方 差 都 存 在,且但,未 知,又 设 是 一 个 样 本 ;
2,求,的 矩 估 计 量 。
1,
EX解,
1 1 2 2,,AA令 2212,,AA即
1?,AX所 以
2 2 2 2 2
21
11
11? ( ) nn
ii
ii
A A X X X X
nn
2 2 2 22 ( )E X D X E X
22 X ~ N (,),,特 别,若 未 知 ;
22
1
1,( ) n
i
i
X X X
n
则
.0,;,
θ
1
)(
)/(
x
xe
xf
x
其中 θ> 0,μ与 θ是未知参数,X1,X2,…,X n,是
X 的一组样本,求 μ与 θ的矩估计量,
dxeXE
x
x θ
θ
)(解
,θ)(0 θ1
dyey
y
例 2,设总体 X的概率密度为令
.θ
,μθ
2
2 M
X
注意到 D(X)=E(X2)- [E(X)]2=θ2
μ
θ
μ
θ
2 e)( 2 dxXE
x
x
0
22θ2
θ
1 2θ2)( dyey
y
=θ2+(θ+μ)2
,)(?
1
21
2
n
i
in XXM
.MXμ? 2
几个常用统计量二、估计量的评选标准一,参数的点估计第七章参数估计三、参数的区间估计思考题问题:现有一名射击运动员,他的命中率可用其击中的概率表示,假定其命中率要么是 0.8,要么是 0.2,现试射击一次,结果命中,命中率是 0.8还是 0.2?
问题:如果射击 5次,仅前三次命中,p有又该取多少呢?
合理的答案是,0.8
如果没有命中率可选项,取多少合理呢?
合理的答案是,p=1
分析
32( ) ( 1 ) P A p p
小概率事件在一次试验中应该不发生概率试验中某事件发生了,我们就有理由认为,
该事件发生的概率应该是大的,
常理:
根据这一思路进行参数估计的方法称为极大似然估计极大似然估计法
( 1 ),{ } ( ; ),X P X x p x若 总 体 属 离 散 型,其 分 布 律
11,,,,nnx x X X又 设 是 的 一 个 样 本 值 ;
11,,,,nnX X x x易 知 样 本 取 的 概 率,亦 即 事 件
的 形 式 为 已 知,为 待 估 参 数,是 可 能 取 值 的 范 围 。
11{,,} nnX x X x 发 生 的 概 率 为,
1
1
( ) (,,; ) ( ; ),,( 1,1 )
n
ni
i
L L x x p x
1
1
( ) (,,; ) ( ; ),,( 1,1 )
n
ni
i
L L x x p x
( ) L它 是 的 函 数 。 称 为 样 本 的 似 然 函 数 。
1
1
,,;
(,,; )
n
n
xx
L x x
,固 定 挑 选 使 概 率达 到 最 大 值 的 参 数,作 为 的 估 计 值,
即 取极 大 似 然 估 计 法使 得,
11?(,,; ) m a x (,,; ) ( 1,2) nnL x x L x x
11
,,(,,) ;
nnx x x x
与 有 关,记 为称 其 为 参 数 的 极 大 似 然 估 计 值 。
1? (,,) nXX 称 为 参 数 的 极 大 似 然 估 计 量 。
( 2 ),( ; ),;
X f x
若 总 体 属 连 续 型,其 概 率 密 度的 形 式 已 知,为 待 估 参 数
11
11
1
,,,,
(,,) (,,)
,,
nn
nn
n
x x X X
X X x x
d x d x n
设 是 相 应 的 一 个 样 本 值,则 随机 点 落 在 的 邻 域 ( 边 长 分 别 为的 维 立 方 体 ) 内 的 概 率 近 似 为,
1
( ; ) ( 1,3 )
n
ii
i
f x d x?
( 1,3 )我 们 取 的 估 计 值,使 概 率 取 到 最 大 值 。
i
i
dx但 不 随 而 变,故 只 需 考 虑,
1
1
( ) (,,; ) ( ; ),( 1,4 )
n
ni
i
L L x x f x
( ) L?的 最 大 值,这 里 称 为 样 本 的 似 然 函 数 。
11
(,,; ) m a x (,,; )
nnL x x L x x若
1? (,,) nxx则 称 为 的 极 大 似 然 估 计 值 。
1? (,,) nXX称 为 的 极 大 似 然 估 计 量 。
1
1
( ) (,,; ) ( ; ),
n
ni
i
L L x x f x
11
(,,; ) m a x (,,; )
nnL x x L x x若
1? (,,) nxx则 称 为 的 极 大 似 然 估 计 值 。
1? (,,) nXX称 为 的 极 大 似 然 估 计 量 。
( ; ),( ; )
()
0,
p x f x
dL
d
一 般,关 于 可 微,故 可 由 下 式 求 得,
1
1
( ) (,,; ) ( ; ),
n
ni
i
L L x x p x
似 然 函 数定义归纳
( ) ln ( )
ln ( ) 0,( 1.5 )
LL
d
L
d
又 因 与 在 同 一 处 取 到 极 值,因 此 的 极大 似 然 估 计 也 可 从 下 述 方 程 解 得,
若 母 体 的 分 布 中 包 含 多 个 参 数,
ln0,1,,,0,1,,,
ii
LL i k i k
即 可 令 或
1,,kk解 个 方 程 组 求 得 的 极 大 似 然 估 计 值 。
问题分析设 X的分布律 x
Y
1 2 3
θ θ 1-2θθ >0
今有样本 1,1,1,3,2,1,3,2,2,1
2,2,3,1,1,2
求 θ 的矩估计和最大似然估计解,( ) 1 2 ( 1 2 ) 3 3 3 E
1 2 8( 1 + 1 + 1 + 3 + 2 + 1 + 3 + 2 + 2 + 1 + 2 + 2 + 3 + 1 + 1 + 2 ) =
1 6 1 6X?
28( ) 3 3
16E X X令 即 - =
20
48?=
问题分析(续)
16
1
( ) ( ) i
I
L P X x?
1 3 3( 1 2 ) ( 1 2 ) ( 1 2 )
12 3 13 1213 ( 1 2 ),3.( 1 2 ) ( 2)dL
d
1 1 30 0
2 3 2
dL
d令 得 到 = 或 者 = 或 者 =
13
32?显 然 仅 有 = 适 合 题 意
11,~ ( 1,) ;,,nX B p X X X例 设 是 来 自 的 一 个 样 本,
试求参数 p的极大似然估计量。
概率分布的表示方法
X
P
0 1
1-P P
1{ } ( 1 ),0,1 ; xxP X x p p x
11,~ ( 1,) ;,,nX B p X X X例 设 是 来 自 的 一 个 样 本,
试求参数 p的极大似然估计量。
1,,nx x X解,设 是 一 个 样 本 值 。 的 分 布 律 为,
1{ } ( 1 ),0,1 ; xxP X x p p x
故似然函数为
111
1
( ) ( 1 ) ( 1 ),
nn
ii
i i i i
n x n x
xx
i
L p p p p p
[ ( ]
11
ln ( ) ( ) ln ( ) ln( 1 ),
nn
ii
ii
L p x p n x p
而
11ln ( ) 0,
1
nn
ii
ii
x n x
d
Lp
d p p p
令
1
1
p
n
n
i
i
p
xx
解 得 的 极 大 似 然 估 计 值
1
1
p
n
n
i
i
p
XX
的 极 大 似 然 估 计 量 为
-------它与矩估计量是相同的。
22
12,~ (,) ;,,,nX N x x
X
例 设 为 未 知 参 数,
是 来 自 的 一 个 样 本 值,
2,求,的 极 大 似 然 估 计 量 。
X解,的 概 率 密 度 为,
22
2
11( ;,) e x p { ( ) }
22
f x x
似然函数为,
22
2
1
11(,) e x p { ( ) }
22
n
i
i
Lx
[ ]
22
2
1
1ln ln( 2 ) ln( ) ( )
2 2 2
n
i
i
nnLx
2
1
2
2 2 22
1
1ln
[ ] 00
n1ln
- ( ) 00
2 ( 2 )
n
i
i
n
i
i
L
xn
L
x
令 即,
1
22
1
1
1
( )
n
i
i
n
i
i
xx
n
XX
n
解 得,
休息片刻
)0(
,0
0,
1
);(,
e l s e
xe
xfX
x
今取得一组样本数据如下,问如何估计 θ?
16 29 50 68 100 130 140 270 280
340 410 450 520 620 190 210 800 1100
某厂生产的电子管的使用寿命 X (小时 ) 服从指数分布例 4 指数分布的点估计分析 可用两种方法:矩法估计 和极大似然估计,
1)矩法估计
θe
θ
1
)( 0 θ
dxxXE
x
X θ θ θ X,令 则 可 得 的 矩 法 估 计 量 为,
θ 代 入 具 体 数 值 可 得 的 估 计 值 为,
1
11 5 7 2 3 3 1 8 ( ),
18
n
i
i
xn
小 时
2)极大似然估计
1,构造似然函数当 xi>0,( i=1,2,…,n) 时,似然函数为
1
1
1(,..,,; ) in x
n
i
L x x e
()
n
i
ixnL
1
1lnln2,取对数
3,建立似然方程,01ln
12
n
i
ix
n
d
Ld
1
1 n
i
i
x
n e
5,得 M.L.E量,,1?
1
XX
n
n
i
i
代 入 具 体 数 值 可 得 的 估 计 值 为,
4,求解得 M.L.E值,1?
1
xx
n
n
i
i
).(3 1 85 7 2 3
18
11
1
小时
n
i
ixn
求极大似然估计的 一般步骤,
1.写出似然函数
1 2 1 2
1
(,,.,,,; ) ( ;,,.,,,)
n
n i m
i
L x x x f x
12
1
ln ln ( ;,,..,,)
n
im
i
L f x
2,对似然函数取对数
)m,...,,j(,Lln
j
210
3,对?j (j =1,…,m)分别求偏导,建立似然方程 (组 )
m?,..., 1
解得 m,.,,, 1
易出错点:似然函数的构造过程中,连乘号的运用分别作为 的极大估计值,
13,~ [,] ;,,,nX U a b a b x x例 设 未 知,是 一 个 样 本 值,
,ab求,的 极 大 似 然 估 计 量 。
( 1 ) 1 ( ) 1m i n (,,),m a x (,,),n n nx x x x x x解,设
X的概率密度为:
1
,;
( ;,)
0,
a x b
f x a b ba
其 它
1 ( 1 ) ( ),,,,,nna x x b a x x b因 为 等 价 于
( 1 ) ( )
1
,,;
()(,)
0,
nn
a x b x
baL a b
其 它
( 1 ) ( ),,na x b x a b对 于 满 足 的 任 意 有
( ) ( 1 )
11(,)
( ) ( )nn n
L a b
b a x x
( 1 ) ( ) ( ) ( 1 )(,),( ) nnnL a b a x b x x x即,在 时,取 最 大 值
,ab故 的 极 大 似 然 估 计 值 为,
( 1 ) ( ) m i n,m a x,i n ia x x b x x
,ab故 的 极 大 似 然 估 计 量 为,
m i n,m a x,iia X b X
例 5 矩估计与似然估计不等的例子设总体概率密度为
.,0;10,)1(
),(
其他
xx
xf
求参数 θ的极大似然估计,并用矩法估计 θ.
解 1) 极大似然估计法
1,构造似然函数
θ
11
( θ 1 ),0 1 ;
(,..,,; θ )
0,
n
n
ii
in
xx
L x x?
其 它
n
i
ixnL
1
ln)1l n (ln
2,取对数,当 0<xi<1,(i=1,2,…,n) 时
3,建立似然方程
,0ln
1
ln
1
n
i
ix
n
d
Ld
4,求解得 M.L.E,值为,1
ln
1
n
i
ix
n
5,M.L.E,量为,1
ln
1
n
i
iX
n
21
1
00
1( ) ( 1 ) ( 1 ),
22
xE X x x d x
2) 矩估计法
θ 1 X,θ
θ 2
令 可 得 的 矩 法 估 计 量 为
1 2 1?θ 2,
11
X
XX
( ),
( ) ( )
uu
u u u
性 质,设 的 函 数 具 有 单 值 反 函 数,
是 的 极 大 似 然 估 计 ;
则 是 的 极 大 似 然 估 计 。
2 2 2
1
1 ( ) n
i
i
XX
n
例,是 的 极 大 似 然 估 计
2 2 2 2( ),( 0) u u u u有 单 值 反 函 数
22
1
1
( )
n
i
i
XX
n
故是 的 极 大 似 然 估 计返回主目录由得例 8 X~B( N,p),
例题 9
()
X
1
,
( ; ; )
0,
,
x
ex
fx
设 随 机 变 量 的 密 度 函 数其 他求 的 极 大 似 然 估 计 量
1
( ) /,L ( ;,)
n
i
i
xnxe
解
1,2,x x x n?当 取 定 时 的 值 在( 1 ) 1 2? = m i n (,)nx x x x
,L = m ax L (,)时?
例题续
,,代 入 似 然 函 数 并 取 对 数 得 到
( 1 )
1
1l n (,) l n ( )n
i
i
L n x x
( 1 )2
1
ln 1,( ) 0n
i
i
Ln xx
求 偏 导 数 并 令
( 1 )? = xx解 得
( 1)
( 1)
=X
= X - X
的 极 大 似 然 估 计 量 为的 极 大 似 然 估 计 量 为例题 10 ||
X
1
( ),- <
2
(,),
xf x e x?
设 随 机 变 量 的 密 度 函 数是 未 知 参 数 求 的 极 大 似 然 估 计 量
||
1
1,L(,)
2
i
n x
i
xe
解 1
||1
2
n
i
i
x
n e
1
ln L(,) ln 2 | |
n
i
i
x n x
1
| |,
n
i 1 2 n
i
x x,x,x?
要 使 达 到 最 小 将 从 小 到 大 排 列
( 1 ) ( 2 ) ( )x x x n
续
( 1 )
1
2 1,| |
n
ki
i
n k x x
当 时 使 最 小
( 1 )X k 为 的 极 大 似 然 估 计 量( ) ( 1 )
1
2,[,]
||
kk
n
i
i
n k x x
x?
当 时 上 的 任 何 值使 最 小
( 1 ),X k所 以 为 的 极 大 似 然 估 计
7.2 估计量的评选标准对总体 X的同一个参数,可以用不同的方法进行估计。
例如 估计总体 X的数学期望 EX= μ,
可以用估计量还可以用加权平均对总体 X的方差 DX= σ 2 作估计时可用样本方差也可以用样本二阶矩对于待定参数既然有多种估计,就应该有一个评价优劣的标准理想的估计,应该满足两点,
一是:估计值在真值附近波动,平均值最好就是真值二是,在满足第一条的情况下,方差最小而它的期望值等于未知参数的真值,
.
真值
无偏性估计量是随机变量,对于不同的样本值会得到不同的估计值,我们希望估计值在未知参数真值附近摆动,
这个标准,
这就导致无偏性定义则称 为 的无偏估计,
设 是未知参数 的估计量,若用,不会产生系统偏差,
无偏性是对估计量的一个常见而重要的要求,
从数学期望的意义知:若 满足无偏性,那么虽然
的取值由于随机性而偏离参数 的真值,?
差随机地在 θ 的周围波动,
但这种偏对同一统计问题大量重复使关于系统性偏差,可以借助于超市的称来说明例 设总体 X的数学期望 μ,方差 σ 2 >0 存在存在,
12,,,nX X X是 X的样本,求证,
12
11
1,( = 1 ) nn k k k
kk
X X w w
均为 μ 的无偏估计。
21?.2 S 为 σ
2 的无偏估计量
2
1
)(
1
1?
n
k
k XXn
2
2?3 D。
2
1
)(1?
n
k
k XXn
不是 σ 2 的无偏估计量证
n
n
XE
n
XEE
n
k
k
1
1
1)(1)?(.1?
2
11
( ) ( ) ( )
nn
k k k k
kk
E E X w E X w?
1
n
kk
k
w EX
1
n
k
k
w EX
1
n
k
k
E X w E X?
12
1
1,n kk
k
X X w
均为 μ 的无偏估计。
2
1
)(.2?
n
k
k XX?
n
k
k XnX
1
22
)( 2SE ])(
1
1[ 2
1
n
k
k XXnE
)(
1
1
1
22?
n
k
k XnXEn
)]()([
1
1
1
22?
n
k
k XnEXEn
21?2,S 为 σ 2 的无偏估计量 2
1
1 ( )
1
n
k
k
XXn
证明,
]})([])([{
1
1
1
22?
n
k
kk XEXDnEXDXn
22
2
22 )]([
1
1
n
nnn
n
用 D2来估计 σ 2有系统偏差。
2
1
2 )(1?
n
k
k XXnD
2
1
)(
1
11?
n
k
k XXnn
n
21 S
n
n
)( 2DE )1( 2S
n
nE? )(1 2SE
n
n 21?
n
n 2
2
23? D。
2
1
)(1?
n
k
k XXn
不是 σ 2 的无偏估计量例题分析例题分析例 3 设 ),,,(
21 mXXX? 是总体 X 的一个样本,
X~ B(n,p) n > 1,求 p 2 的无偏估计量,
解 由于样本矩是总体矩的无偏估计量以及数学期望的线性性质,只要将未知参数表示成总体矩的线性函数,然后用样本矩作为总体矩的估计量,
这样得到的未知参数的估计量即为无偏估计量,
令因此,p 2 的无偏估计量为故例 4 设总体 X 的密度函数为为常数为 X 的一个样本证明 与 都是? 的无偏估计量证故是? 的无偏估计量,
令即故 n Z 是? 的无偏估计量,
所以无偏估计以方差小者为好,这就引进了有效性的大小来决定二者谁更优,和一个参数往往有不止一个无偏估计,若 和都是参数 的无偏估计量,我们可以比较由于这一概念,
有效性都是总体参数? 的无偏估计量,且则称 比 更有效,
定义 设有效性所以,比 更有效,
是?的无偏估计量,问哪个估计量更有效?
由例 4可知,与 都为常数例 5 设总体 X 的密度函数为解,
定义 设 是未知参数 θ 的估计量,),...,,(
21 nn XXX
1}?{lim nn P
相合性 (一致性)
则称 为 θ 的 相合估计量,
若对任意的 ε >0,有一致性估计量仅在样本容量
n 足够大时,才显示其优越性,
例题
2
1 2 1 1 1
2
1 2 2 2 2
22
12
2 2 2
12
,~ (,)
,~ (,),
,,
,
,D ( ),
n
n
X X X X N
Y Y Y X N
SS
a,b ( a + b = 1) Z aS bS
a b z
设 为 的 一 个 样 本为 的 一 个 样 本 相 互 独 立分 别 是 他 们 的 样 本 方 差 证 明 对 于 任 意 常 数都 是 的 无 偏 估 计并 确 定 使 得 达 到 最 小解答
44
22
12
22 + ( 1 - )
11aann
44
22
12
12
22( ),( )
11D S D Snn
2 2 2 212( ),( ) E S E S
22( ) ( )E Z a b
2212( ) ( )D Z D a S b S
12
1 2 1 2
11,
22
nnab
n n n n
估计量的标准的总结补充题 设总体 X ~ N (?,? 2),
为 X 的一个样本,常数 k 取何值可使 为? 的无偏估计量作业,p209 7,10,11,12
§ 7.3 参数的区间估计前面,我们讨论了参数点估计,它是用样本算得的一个值去估计未知参数,
可以想象,这个估计值正好为真值的可能性几乎为零这里就有两个问题,
1、估计值和真值的差距有多大?
2、能不能找一个区间,使它包含真值?
,只能是以较高的可靠程度包含真值,
希望确定一个区间,使其包含真值。
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平,
习惯上把置信水平记作1
这里 是一个很小 的正数,
但是,区间也不可能完全肯定包含真值
),,,,( 2111 nXXX ),,,( 2122 nXXX
)( 21
设 是 一个待估参数,给定,0
若由样本 X1,X2,… Xn确定的两个统计量
7.3 置信区间概念
]?,?[ 21则称 为 的随机区间?
1}{ 21P若满足为 的置信区间,1
21 和置信上限(双侧置信区间),
7.3 置信区间概念的置信水平(置信度)
分别称为置信下限和
为显著水平1 为置信度,
则称区间 是]?,?[ 21
说明,(1)式表示(,)包含未知参数 θ 的真值概率为 1- α,如 α =0.05时,若从总体中抽得容量相同的
100个样本,则在确定的 100个置信区间中将有 95个包含 θ
的真值,不包含 θ 真值的区间只有 5个。
显然,置信区间不唯一。
有点象套圈游戏几个常用统计量复习正态总体均值和方差的区间估计设
nXXX,,,21?
为总体 ),(~ 2NX 的样本,
2,SX 分别是样本均值和样本方差。
一,数学期望的置信区间
1、已知 σ 2时,μ 的置信区间设 ),(~ 2NX
2
~ (,) XN n
则随机变量
2
~ ( 0,1 ) XZN
n
对于任意给定的 α,我们的任务是通过样本寻找一个区间,
它以 1- α 的概率包含总体 X的数学期望 μ 。
令
2
2
{ } 1 XPZ
n
2
2
z
2
2
z?
22{ } 1 P X z X znn
22[,] X z X znn
置信区间也可简记为 ][
2?
z
n
X?
于是得到随机区间它以 1- α 的概率包含总体 X的数学期望 μ 。
其置信度为 1- α 。
置信下限
2?
z
n
X? 置信上限
2?
z
n
X?
0,0 5 1 0,9 5 1 1 6n如 取查表得 96.1025.0
2
ZZ?
若由一个样本值算得样本均值的观察值 20.5?x
则得到一个区间 )69.5,71.4()49.020.5(
(4.71,5.69) 包含 μ 的可信程度 为 0.95.
注,μ 的置信水平 1- α 的置信区间不唯一。
上例中同样给定 05.0 可以取标准正态分布上
α 分位点- Z0.04 和 Z0.01,则又有
0,0 4 0,0 12{ } 0,9 5
XP Z Z
n
0,0 1 0,0 4{ } 0,9 5 P X Z X Znn
则 μ 的置信度为 0.95的置信区间为
0,0 1 0,0 4[,] X Z X Znn
与上一个置信区间比较,同样是 95.01
其区间长度不一样,上例 98.0
4
192.32
025.0 Zn
比此例 02.1
4
108.4)(
4
1
01.004.0 ZZ
短。
01.0
01.0z
04.0
04.0z?
置信区间短表示估计的精度高,第一个区间为优像 N(0,1)分布那样概率密度 的图形是单峰且对称的情况。
当 n固定时以 ][
2?
z
n
X? 的区间长度为最短,
我们一般选择它。
若以 L为区间长度,则
2
2
z
n
L?
可见 L随 n 的增大而减少( α 给定时),
随机地抽查了 9人,其高度分别为:
0 7 9 5 %假 设 标 准 差,置 信 度 为 ;
试 求 总 体 均 值 的 置 信 区 间 。
0 7,9,0,0 5,n解,已 知 由 样 本 值 算 得,
.1 1 5)1 1 01 2 01 1 5(91x
2
1,9 6 Z查 正 态 分 布 表 得 临 界 值,由 此 得 置 信 区 间,
57.119,43.1109/796.1115,9/796.1115
例 2 已知幼儿身高服从正态分布,现从 5~ 6岁的幼儿中
115,120,131,115,109,115,115,105,110cm;
二、未知 σ 2时,μ 的置信区间当总体 X的方差未知时,容易想到用样本方差?2代替 σ 2。
已知 2
~ ( 1 ) XT t n
s
n
则对给定的 α,令
2
2
{ ( 1 ) } 1 XP t n
s
n
查 t 分布表,可得 )1(
2
nt? 的值。
则 μ 的置信度为 1- α 的置信区间为
22{ ( 1 ) ( 1 ) } 1
ssP X t n X t n
nn
22[ ( 1 ),( 1 ) ]
ssX t n X t n
nn
例 3
解 本题是在 σ 2未知的条件下求正态总体参数 μ 的置信区间。 由公式知 μ 的置信区间为查表则所求 μ 的置信区间为为了估计一批钢索所能承受的平均张力(单位
kg/cm2),
设钢索所能承受的张力 X,
分别估计这批钢索所能承受的平均张力的范围与所能承受的平均张力。
随机选取了 9个样本作试验,
即则钢索所能承受的平均张力为 6650.9 kg/cm2
由试验所得数据得例 4
解由置信区间的概念,所求 μ 的 0.99的 置信区间为在交通工程中需要测定车速(单位 km/h),由以往
2、现在作了 150次观测,试问平均测量值的误差在的经验知道,
即测量值为 X,
测量值的误差在 之间。
1、至少作多少次观测,才能以 0.99的可靠性保证平均之间的概率有多大?
由题意要求用平均测量值 来估计 μ
其误差由题意知令至少要作 86次观测,
57.286 0 0 5.0 zn
才能以 0,99的可靠性保持平均测量误差在 之间。1?
58.31 5 0.2n
}1{XP }{
n
n
X
P?
1)(2n
1)4 2 1.3(2 9994.019997.02
思考题 1:
思考题 2,
在 μ 的区间估计中所起的重要作用称为枢轴量三、正态总体方差的区间估计下面我们将根据样本找出 σ 2 的置信区间,
已知总体对于给定的即则得到 σ 2随机区间以 的概率包含未知方差 σ 2,这就是 σ 2的置信度为
1- α 的置信区间。
例 5 某自动车床加工零件,抽查 16个测得长度(毫米)
01.1203.1216.1209.1208.1201.1212.1215.12
怎样估计该车床加工零件长度的方差。
解 先求
06.1201.1208.1211.1207.1213.1206.1215.12
)05.0(
075.12]6.012.015.0[16112x
])075.1206.12()075.1215.12[(15 1 222Sσ 2的估计值
0 0 2 4.0]5.7161215[151 0 0 0 01 222
或
2 2 2 2
11
11( ) [ ]
11
nn
ii
ii
s x x x nxnn
查表所求 σ 2的置信度为 0.95的 置信区间所求标准差 σ 的置信度为 0.95的 置信区间由得得例 6 为了估计灯泡使用时数(小时)的均值 μ 和解查表测试了 10个灯泡得方差 σ 2,
若已知灯泡的使用时数为 X,
求 μ 和 σ 2的置信区间。
由公式知 μ 的置信区间为
μ 的置信区间为查表即由公式知 σ 2的置信区间为
σ 2的置信区间为例题 7
2
,2N (,)
对 于 正 态 总 体 假 设 已 知求 的 区 间 估 计解,选 取 枢 轴 统 计 量
2
2 1
2
()
n
i
i
X?
2~ ( )n?
2? 的 置 信 区 间 为,
1.?1-?2 的估计四、两个正态总体
X~N(?1,?12),Y~N(?2,?22)
1) 已知?12 和?22
枢轴变量取
12
22
12
12
( ) ( )
XY
U
nn
12
22
12
12
( ) ( )
XY
U
nn
N (0,1 )~
22
12
22
12
12
( ) ( )
{ } 1
XY
P u u
nn
22
2 2 2 2
1 2 1 2
1 2 1 2
[,] X Y u X Y u
n n n n
2)?12 和?22 未知,?12 =?22 =?2
2,的区间估计枢轴变量选择1) 已知?
1 与?2
2)未知?1,?2
2 2 2 2
1 1 2 1
122 2 2 2
2 2 1 2
~ ( 1,1 ) SSF F n n
22
21( ) ( )
1 2 1 2221
1222
{ 1,1 1,1 } 1SP F n n F n n
S
甲 140 137 136 140 145 148 140 135 144 141
乙 135 118 115 140 128 131 130 115 121 125
例 8 甲、乙两种稻种分别种在 10块试验田中,每块田中甲、乙稻种各种一半。假设两种稻种产量 X,Y 服从正态分布,且方差相等,10块田中的产量如下表 (单位:公斤 ),求 两稻种产量的期望差?1-?2 的置信区间 (α =0.05).
解 设 X~N(?1,?12),Y~N(?2,?22),?12 =?22 =
2,要估计?1-?2,取统计量
),2(~
11
)()(
21
21
21
nnt
nn
S
YX
T
w
2
1)(1)(
21
2
22
2
11
nn
SnSn
S W其中由样本表可计算得
,10,956.71,8.126
,10,933.16,6.140
2
2
2
1
2
1
nsy
nsx
,667.6
18
956.719933.169
wS从而查 t 分布表得,t0.025(18)= 2.1009
两稻种产量期望差的置信度为 95%的置信区间为
12
2 12
11
( 2 ) ][ wX Y n n S
nnt
]10 2667.61009.28.1266.140,10 2667.61009.28.1266.140[
].0 6 4.20,5 3 6.7[即
12
2
12
12
2
12
11
( 2 ),
11
( 2 )
[
]
w
w
X Y n n S
nn
X Y n n S
nn
t
t
单正态总体的区间估计
),(~ 2NX 1221 uWuP
被估参数条件 统计量
(枢轴变量 )
置信区间
μ
已知
σ 2
μ
未知
σ 2
)1,0(~ NnXU
)1(~ ntnSXT
22
,unXunX
)1(,)1(
22
ntnSXntnSX
被估参数条件 统计量
(枢轴变量 )
置信区间
σ 2
已知
μ
σ 2
未知
μ
)(~ 2
1
2
nX
n
i
i
)1(~)1( 22
2
nSn
)(
)(
,
)(
)(
2
21
1
2
2
2
1
2
n
X
n
X
n
i
i
n
i
i
)1(
)1(,
)1(
)1(
2
21
2
2
2
2
n
Sn
n
Sn
被估参数 条件统计量
(枢轴变量 )
已知 σ 12
与 σ 22
未知 σ 12
和 σ 22
未知 μ 1
和 μ 2
)1,0(~
2
2
2
1
2
1
21 N
nn
YX
U
)2(~
11 21
21
21
nnt
nn
S
YX
T
w
)1,1(~ 212
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1 nnF
S
S
S
SF
21
21
2
2
2
1
双正态总体的区间估计
1,
2.若 X~N( 0,1),则知识回顾
Xi ~N( μ,σ2)(1)
(2)
(3)
3,若 X~N( μ,σ2),
则 与 s2 相互独立,
Y ~ N (μ2,σ2 2),Y1,Y2,…,Y n2,它们相互独立,
则若 X ~ N (μ1,σ12),X1,X2,…,X n1( 1)
( 2) 当 σ12 =σ22 =σ2时,
4,两个正态总体
( 3)
二、估计量的评选标准一,参数的点估计第七章参数估计三、参数的区间估计思考题用 X表示概率统计课程的考试成绩,假定现在抽查了 5位同学的试卷,成绩分别为 90,70,72
,60,50,根据以上条件,考虑下一份试卷得分在 60
~ 80之间的概率?
第七章 参数估计
待解问题,若总体 X的分布函数 F(x)的类型已知,但它的一个或多个参数未知,如何估计总体的未知参数?
大概思路,通过用 X的一组样本观察值( x1,x2,…,xn)
建立起来计算参数的公式,用来估计总体中未知参数的值,
即用 样本统计量的值 估计 总体中未知参数的值。
参数的点估计:指用样本统计量的值估计未知参数的值。
估计量:设 θ 为总体 X的未知参数,用样本( X1,X2,…,Xn)
构成的一个统计量 来估计 θ 的真值,称 为 θ 的估计量。
估计值:对应于样本的一组观测值( x1,x2,…,xn),
估计量 的值 ( x1,x2,…,xn)称为 θ 的估计值,
仍记作 。
参数估计是对已知 分布类型的总体,
参数估计点 估 计区间估计矩 估 计极大似然估计参数估计可作如下划分利用样本 对其未知参数作出估计矩估计的基本原理
K,1 9 2 0矩 法 估 计 皮 尔 逊 在 世 纪 末 世 纪 初一 系 列 论 文 中 提 出 的这 个 方 法 的 思 想 很 直 观,
1(,,)
m
mkx f x d x
12 k依 赖 于 参 数,
= ( )mEX
1(,,),kfx设 总 体 分 布 则 它 的 矩
,,另 一 方 面 由 大 数 定 理
1
1
1(,) n m
m m n i
i
X
n
1,2,,mk?取 并 让 上 面 的 近 似 等 式 改 为 等 式就 得 到 方 程 组
12,(,)i i i nX X X i解 出 做 为 的 估 计
( )m mEX
1
1 n m
i
i
Xn
,n在 样 本 容 量 较 大 时矩估计的基本过程
1 1 2( ) = (,) EX
2 2 1 2( ) (,) EX
例 1 设某炸药厂一天中发生着火现象的次数 X服从
参 数 为 的 泊 松 分 布,未 知,有 以 下 样 本 值 ;
试 估 计 参 数 ( 用 矩 法 ) 。
25012622549075
6543210
knk
k
次着火天数发生着火的次数
11
1
1 n
i
i
EX A X X
n
解,=,X?令
1? ( 0 7 5 1 9 0 6 1 ) 1,2 2
250x则
=,1,2 2 X所 以 估 计 值 。
12,~ [,],,,,nX U a b a b X X例 设 总 体 未 知 ; 是 一 个样 本 ;的矩估计量。求,ba,
1,2
abEX解,
1
1
1
2
n
i
i
ab AX
n?
令
22
2
2
1
( ) ( ) 1
1 2 4
n
i
i
b a a b AX
n?
22
22
2
( ) ( ) ( )
1 2 4
b a a bE X D X E X
2
1 2 12,1 2 ( ) a b A b a A A即
22
2 2 1
1
3? 3 ( ) ( ) n
i
i
a A A A X X X
n?
解 得,
22
1 2 1
1
3? 3 ( ) ( ) n
i
i
b A A A X X X
n?
2
2
1
3,0,
,,n
X
XX
例 设 总 体 的 均 值,方 差 都 存 在,且但,未 知,又 设 是 一 个 样 本 ;
2,求,的 矩 估 计 量 。
1,
EX解,
1 1 2 2,,AA令 2212,,AA即
1?,AX所 以
2 2 2 2 2
21
11
11? ( ) nn
ii
ii
A A X X X X
nn
2 2 2 22 ( )E X D X E X
22 X ~ N (,),,特 别,若 未 知 ;
22
1
1,( ) n
i
i
X X X
n
则
.0,;,
θ
1
)(
)/(
x
xe
xf
x
其中 θ> 0,μ与 θ是未知参数,X1,X2,…,X n,是
X 的一组样本,求 μ与 θ的矩估计量,
dxeXE
x
x θ
θ
)(解
,θ)(0 θ1
dyey
y
例 2,设总体 X的概率密度为令
.θ
,μθ
2
2 M
X
注意到 D(X)=E(X2)- [E(X)]2=θ2
μ
θ
μ
θ
2 e)( 2 dxXE
x
x
0
22θ2
θ
1 2θ2)( dyey
y
=θ2+(θ+μ)2
,)(?
1
21
2
n
i
in XXM
.MXμ? 2
几个常用统计量二、估计量的评选标准一,参数的点估计第七章参数估计三、参数的区间估计思考题问题:现有一名射击运动员,他的命中率可用其击中的概率表示,假定其命中率要么是 0.8,要么是 0.2,现试射击一次,结果命中,命中率是 0.8还是 0.2?
问题:如果射击 5次,仅前三次命中,p有又该取多少呢?
合理的答案是,0.8
如果没有命中率可选项,取多少合理呢?
合理的答案是,p=1
分析
32( ) ( 1 ) P A p p
小概率事件在一次试验中应该不发生概率试验中某事件发生了,我们就有理由认为,
该事件发生的概率应该是大的,
常理:
根据这一思路进行参数估计的方法称为极大似然估计极大似然估计法
( 1 ),{ } ( ; ),X P X x p x若 总 体 属 离 散 型,其 分 布 律
11,,,,nnx x X X又 设 是 的 一 个 样 本 值 ;
11,,,,nnX X x x易 知 样 本 取 的 概 率,亦 即 事 件
的 形 式 为 已 知,为 待 估 参 数,是 可 能 取 值 的 范 围 。
11{,,} nnX x X x 发 生 的 概 率 为,
1
1
( ) (,,; ) ( ; ),,( 1,1 )
n
ni
i
L L x x p x
1
1
( ) (,,; ) ( ; ),,( 1,1 )
n
ni
i
L L x x p x
( ) L它 是 的 函 数 。 称 为 样 本 的 似 然 函 数 。
1
1
,,;
(,,; )
n
n
xx
L x x
,固 定 挑 选 使 概 率达 到 最 大 值 的 参 数,作 为 的 估 计 值,
即 取极 大 似 然 估 计 法使 得,
11?(,,; ) m a x (,,; ) ( 1,2) nnL x x L x x
11
,,(,,) ;
nnx x x x
与 有 关,记 为称 其 为 参 数 的 极 大 似 然 估 计 值 。
1? (,,) nXX 称 为 参 数 的 极 大 似 然 估 计 量 。
( 2 ),( ; ),;
X f x
若 总 体 属 连 续 型,其 概 率 密 度的 形 式 已 知,为 待 估 参 数
11
11
1
,,,,
(,,) (,,)
,,
nn
nn
n
x x X X
X X x x
d x d x n
设 是 相 应 的 一 个 样 本 值,则 随机 点 落 在 的 邻 域 ( 边 长 分 别 为的 维 立 方 体 ) 内 的 概 率 近 似 为,
1
( ; ) ( 1,3 )
n
ii
i
f x d x?
( 1,3 )我 们 取 的 估 计 值,使 概 率 取 到 最 大 值 。
i
i
dx但 不 随 而 变,故 只 需 考 虑,
1
1
( ) (,,; ) ( ; ),( 1,4 )
n
ni
i
L L x x f x
( ) L?的 最 大 值,这 里 称 为 样 本 的 似 然 函 数 。
11
(,,; ) m a x (,,; )
nnL x x L x x若
1? (,,) nxx则 称 为 的 极 大 似 然 估 计 值 。
1? (,,) nXX称 为 的 极 大 似 然 估 计 量 。
1
1
( ) (,,; ) ( ; ),
n
ni
i
L L x x f x
11
(,,; ) m a x (,,; )
nnL x x L x x若
1? (,,) nxx则 称 为 的 极 大 似 然 估 计 值 。
1? (,,) nXX称 为 的 极 大 似 然 估 计 量 。
( ; ),( ; )
()
0,
p x f x
dL
d
一 般,关 于 可 微,故 可 由 下 式 求 得,
1
1
( ) (,,; ) ( ; ),
n
ni
i
L L x x p x
似 然 函 数定义归纳
( ) ln ( )
ln ( ) 0,( 1.5 )
LL
d
L
d
又 因 与 在 同 一 处 取 到 极 值,因 此 的 极大 似 然 估 计 也 可 从 下 述 方 程 解 得,
若 母 体 的 分 布 中 包 含 多 个 参 数,
ln0,1,,,0,1,,,
ii
LL i k i k
即 可 令 或
1,,kk解 个 方 程 组 求 得 的 极 大 似 然 估 计 值 。
问题分析设 X的分布律 x
Y
1 2 3
θ θ 1-2θθ >0
今有样本 1,1,1,3,2,1,3,2,2,1
2,2,3,1,1,2
求 θ 的矩估计和最大似然估计解,( ) 1 2 ( 1 2 ) 3 3 3 E
1 2 8( 1 + 1 + 1 + 3 + 2 + 1 + 3 + 2 + 2 + 1 + 2 + 2 + 3 + 1 + 1 + 2 ) =
1 6 1 6X?
28( ) 3 3
16E X X令 即 - =
20
48?=
问题分析(续)
16
1
( ) ( ) i
I
L P X x?
1 3 3( 1 2 ) ( 1 2 ) ( 1 2 )
12 3 13 1213 ( 1 2 ),3.( 1 2 ) ( 2)dL
d
1 1 30 0
2 3 2
dL
d令 得 到 = 或 者 = 或 者 =
13
32?显 然 仅 有 = 适 合 题 意
11,~ ( 1,) ;,,nX B p X X X例 设 是 来 自 的 一 个 样 本,
试求参数 p的极大似然估计量。
概率分布的表示方法
X
P
0 1
1-P P
1{ } ( 1 ),0,1 ; xxP X x p p x
11,~ ( 1,) ;,,nX B p X X X例 设 是 来 自 的 一 个 样 本,
试求参数 p的极大似然估计量。
1,,nx x X解,设 是 一 个 样 本 值 。 的 分 布 律 为,
1{ } ( 1 ),0,1 ; xxP X x p p x
故似然函数为
111
1
( ) ( 1 ) ( 1 ),
nn
ii
i i i i
n x n x
xx
i
L p p p p p
[ ( ]
11
ln ( ) ( ) ln ( ) ln( 1 ),
nn
ii
ii
L p x p n x p
而
11ln ( ) 0,
1
nn
ii
ii
x n x
d
Lp
d p p p
令
1
1
p
n
n
i
i
p
xx
解 得 的 极 大 似 然 估 计 值
1
1
p
n
n
i
i
p
XX
的 极 大 似 然 估 计 量 为
-------它与矩估计量是相同的。
22
12,~ (,) ;,,,nX N x x
X
例 设 为 未 知 参 数,
是 来 自 的 一 个 样 本 值,
2,求,的 极 大 似 然 估 计 量 。
X解,的 概 率 密 度 为,
22
2
11( ;,) e x p { ( ) }
22
f x x
似然函数为,
22
2
1
11(,) e x p { ( ) }
22
n
i
i
Lx
[ ]
22
2
1
1ln ln( 2 ) ln( ) ( )
2 2 2
n
i
i
nnLx
2
1
2
2 2 22
1
1ln
[ ] 00
n1ln
- ( ) 00
2 ( 2 )
n
i
i
n
i
i
L
xn
L
x
令 即,
1
22
1
1
1
( )
n
i
i
n
i
i
xx
n
XX
n
解 得,
休息片刻
)0(
,0
0,
1
);(,
e l s e
xe
xfX
x
今取得一组样本数据如下,问如何估计 θ?
16 29 50 68 100 130 140 270 280
340 410 450 520 620 190 210 800 1100
某厂生产的电子管的使用寿命 X (小时 ) 服从指数分布例 4 指数分布的点估计分析 可用两种方法:矩法估计 和极大似然估计,
1)矩法估计
θe
θ
1
)( 0 θ
dxxXE
x
X θ θ θ X,令 则 可 得 的 矩 法 估 计 量 为,
θ 代 入 具 体 数 值 可 得 的 估 计 值 为,
1
11 5 7 2 3 3 1 8 ( ),
18
n
i
i
xn
小 时
2)极大似然估计
1,构造似然函数当 xi>0,( i=1,2,…,n) 时,似然函数为
1
1
1(,..,,; ) in x
n
i
L x x e
()
n
i
ixnL
1
1lnln2,取对数
3,建立似然方程,01ln
12
n
i
ix
n
d
Ld
1
1 n
i
i
x
n e
5,得 M.L.E量,,1?
1
XX
n
n
i
i
代 入 具 体 数 值 可 得 的 估 计 值 为,
4,求解得 M.L.E值,1?
1
xx
n
n
i
i
).(3 1 85 7 2 3
18
11
1
小时
n
i
ixn
求极大似然估计的 一般步骤,
1.写出似然函数
1 2 1 2
1
(,,.,,,; ) ( ;,,.,,,)
n
n i m
i
L x x x f x
12
1
ln ln ( ;,,..,,)
n
im
i
L f x
2,对似然函数取对数
)m,...,,j(,Lln
j
210
3,对?j (j =1,…,m)分别求偏导,建立似然方程 (组 )
m?,..., 1
解得 m,.,,, 1
易出错点:似然函数的构造过程中,连乘号的运用分别作为 的极大估计值,
13,~ [,] ;,,,nX U a b a b x x例 设 未 知,是 一 个 样 本 值,
,ab求,的 极 大 似 然 估 计 量 。
( 1 ) 1 ( ) 1m i n (,,),m a x (,,),n n nx x x x x x解,设
X的概率密度为:
1
,;
( ;,)
0,
a x b
f x a b ba
其 它
1 ( 1 ) ( ),,,,,nna x x b a x x b因 为 等 价 于
( 1 ) ( )
1
,,;
()(,)
0,
nn
a x b x
baL a b
其 它
( 1 ) ( ),,na x b x a b对 于 满 足 的 任 意 有
( ) ( 1 )
11(,)
( ) ( )nn n
L a b
b a x x
( 1 ) ( ) ( ) ( 1 )(,),( ) nnnL a b a x b x x x即,在 时,取 最 大 值
,ab故 的 极 大 似 然 估 计 值 为,
( 1 ) ( ) m i n,m a x,i n ia x x b x x
,ab故 的 极 大 似 然 估 计 量 为,
m i n,m a x,iia X b X
例 5 矩估计与似然估计不等的例子设总体概率密度为
.,0;10,)1(
),(
其他
xx
xf
求参数 θ的极大似然估计,并用矩法估计 θ.
解 1) 极大似然估计法
1,构造似然函数
θ
11
( θ 1 ),0 1 ;
(,..,,; θ )
0,
n
n
ii
in
xx
L x x?
其 它
n
i
ixnL
1
ln)1l n (ln
2,取对数,当 0<xi<1,(i=1,2,…,n) 时
3,建立似然方程
,0ln
1
ln
1
n
i
ix
n
d
Ld
4,求解得 M.L.E,值为,1
ln
1
n
i
ix
n
5,M.L.E,量为,1
ln
1
n
i
iX
n
21
1
00
1( ) ( 1 ) ( 1 ),
22
xE X x x d x
2) 矩估计法
θ 1 X,θ
θ 2
令 可 得 的 矩 法 估 计 量 为
1 2 1?θ 2,
11
X
XX
( ),
( ) ( )
uu
u u u
性 质,设 的 函 数 具 有 单 值 反 函 数,
是 的 极 大 似 然 估 计 ;
则 是 的 极 大 似 然 估 计 。
2 2 2
1
1 ( ) n
i
i
XX
n
例,是 的 极 大 似 然 估 计
2 2 2 2( ),( 0) u u u u有 单 值 反 函 数
22
1
1
( )
n
i
i
XX
n
故是 的 极 大 似 然 估 计返回主目录由得例 8 X~B( N,p),
例题 9
()
X
1
,
( ; ; )
0,
,
x
ex
fx
设 随 机 变 量 的 密 度 函 数其 他求 的 极 大 似 然 估 计 量
1
( ) /,L ( ;,)
n
i
i
xnxe
解
1,2,x x x n?当 取 定 时 的 值 在( 1 ) 1 2? = m i n (,)nx x x x
,L = m ax L (,)时?
例题续
,,代 入 似 然 函 数 并 取 对 数 得 到
( 1 )
1
1l n (,) l n ( )n
i
i
L n x x
( 1 )2
1
ln 1,( ) 0n
i
i
Ln xx
求 偏 导 数 并 令
( 1 )? = xx解 得
( 1)
( 1)
=X
= X - X
的 极 大 似 然 估 计 量 为的 极 大 似 然 估 计 量 为例题 10 ||
X
1
( ),- <
2
(,),
xf x e x?
设 随 机 变 量 的 密 度 函 数是 未 知 参 数 求 的 极 大 似 然 估 计 量
||
1
1,L(,)
2
i
n x
i
xe
解 1
||1
2
n
i
i
x
n e
1
ln L(,) ln 2 | |
n
i
i
x n x
1
| |,
n
i 1 2 n
i
x x,x,x?
要 使 达 到 最 小 将 从 小 到 大 排 列
( 1 ) ( 2 ) ( )x x x n
续
( 1 )
1
2 1,| |
n
ki
i
n k x x
当 时 使 最 小
( 1 )X k 为 的 极 大 似 然 估 计 量( ) ( 1 )
1
2,[,]
||
kk
n
i
i
n k x x
x?
当 时 上 的 任 何 值使 最 小
( 1 ),X k所 以 为 的 极 大 似 然 估 计
7.2 估计量的评选标准对总体 X的同一个参数,可以用不同的方法进行估计。
例如 估计总体 X的数学期望 EX= μ,
可以用估计量还可以用加权平均对总体 X的方差 DX= σ 2 作估计时可用样本方差也可以用样本二阶矩对于待定参数既然有多种估计,就应该有一个评价优劣的标准理想的估计,应该满足两点,
一是:估计值在真值附近波动,平均值最好就是真值二是,在满足第一条的情况下,方差最小而它的期望值等于未知参数的真值,
.
真值
无偏性估计量是随机变量,对于不同的样本值会得到不同的估计值,我们希望估计值在未知参数真值附近摆动,
这个标准,
这就导致无偏性定义则称 为 的无偏估计,
设 是未知参数 的估计量,若用,不会产生系统偏差,
无偏性是对估计量的一个常见而重要的要求,
从数学期望的意义知:若 满足无偏性,那么虽然
的取值由于随机性而偏离参数 的真值,?
差随机地在 θ 的周围波动,
但这种偏对同一统计问题大量重复使关于系统性偏差,可以借助于超市的称来说明例 设总体 X的数学期望 μ,方差 σ 2 >0 存在存在,
12,,,nX X X是 X的样本,求证,
12
11
1,( = 1 ) nn k k k
kk
X X w w
均为 μ 的无偏估计。
21?.2 S 为 σ
2 的无偏估计量
2
1
)(
1
1?
n
k
k XXn
2
2?3 D。
2
1
)(1?
n
k
k XXn
不是 σ 2 的无偏估计量证
n
n
XE
n
XEE
n
k
k
1
1
1)(1)?(.1?
2
11
( ) ( ) ( )
nn
k k k k
kk
E E X w E X w?
1
n
kk
k
w EX
1
n
k
k
w EX
1
n
k
k
E X w E X?
12
1
1,n kk
k
X X w
均为 μ 的无偏估计。
2
1
)(.2?
n
k
k XX?
n
k
k XnX
1
22
)( 2SE ])(
1
1[ 2
1
n
k
k XXnE
)(
1
1
1
22?
n
k
k XnXEn
)]()([
1
1
1
22?
n
k
k XnEXEn
21?2,S 为 σ 2 的无偏估计量 2
1
1 ( )
1
n
k
k
XXn
证明,
]})([])([{
1
1
1
22?
n
k
kk XEXDnEXDXn
22
2
22 )]([
1
1
n
nnn
n
用 D2来估计 σ 2有系统偏差。
2
1
2 )(1?
n
k
k XXnD
2
1
)(
1
11?
n
k
k XXnn
n
21 S
n
n
)( 2DE )1( 2S
n
nE? )(1 2SE
n
n 21?
n
n 2
2
23? D。
2
1
)(1?
n
k
k XXn
不是 σ 2 的无偏估计量例题分析例题分析例 3 设 ),,,(
21 mXXX? 是总体 X 的一个样本,
X~ B(n,p) n > 1,求 p 2 的无偏估计量,
解 由于样本矩是总体矩的无偏估计量以及数学期望的线性性质,只要将未知参数表示成总体矩的线性函数,然后用样本矩作为总体矩的估计量,
这样得到的未知参数的估计量即为无偏估计量,
令因此,p 2 的无偏估计量为故例 4 设总体 X 的密度函数为为常数为 X 的一个样本证明 与 都是? 的无偏估计量证故是? 的无偏估计量,
令即故 n Z 是? 的无偏估计量,
所以无偏估计以方差小者为好,这就引进了有效性的大小来决定二者谁更优,和一个参数往往有不止一个无偏估计,若 和都是参数 的无偏估计量,我们可以比较由于这一概念,
有效性都是总体参数? 的无偏估计量,且则称 比 更有效,
定义 设有效性所以,比 更有效,
是?的无偏估计量,问哪个估计量更有效?
由例 4可知,与 都为常数例 5 设总体 X 的密度函数为解,
定义 设 是未知参数 θ 的估计量,),...,,(
21 nn XXX
1}?{lim nn P
相合性 (一致性)
则称 为 θ 的 相合估计量,
若对任意的 ε >0,有一致性估计量仅在样本容量
n 足够大时,才显示其优越性,
例题
2
1 2 1 1 1
2
1 2 2 2 2
22
12
2 2 2
12
,~ (,)
,~ (,),
,,
,
,D ( ),
n
n
X X X X N
Y Y Y X N
SS
a,b ( a + b = 1) Z aS bS
a b z
设 为 的 一 个 样 本为 的 一 个 样 本 相 互 独 立分 别 是 他 们 的 样 本 方 差 证 明 对 于 任 意 常 数都 是 的 无 偏 估 计并 确 定 使 得 达 到 最 小解答
44
22
12
22 + ( 1 - )
11aann
44
22
12
12
22( ),( )
11D S D Snn
2 2 2 212( ),( ) E S E S
22( ) ( )E Z a b
2212( ) ( )D Z D a S b S
12
1 2 1 2
11,
22
nnab
n n n n
估计量的标准的总结补充题 设总体 X ~ N (?,? 2),
为 X 的一个样本,常数 k 取何值可使 为? 的无偏估计量作业,p209 7,10,11,12
§ 7.3 参数的区间估计前面,我们讨论了参数点估计,它是用样本算得的一个值去估计未知参数,
可以想象,这个估计值正好为真值的可能性几乎为零这里就有两个问题,
1、估计值和真值的差距有多大?
2、能不能找一个区间,使它包含真值?
,只能是以较高的可靠程度包含真值,
希望确定一个区间,使其包含真值。
这里所说的“可靠程度”是用概率来度量的,
称为置信概率,置信度或置信水平,
习惯上把置信水平记作1
这里 是一个很小 的正数,
但是,区间也不可能完全肯定包含真值
),,,,( 2111 nXXX ),,,( 2122 nXXX
)( 21
设 是 一个待估参数,给定,0
若由样本 X1,X2,… Xn确定的两个统计量
7.3 置信区间概念
]?,?[ 21则称 为 的随机区间?
1}{ 21P若满足为 的置信区间,1
21 和置信上限(双侧置信区间),
7.3 置信区间概念的置信水平(置信度)
分别称为置信下限和
为显著水平1 为置信度,
则称区间 是]?,?[ 21
说明,(1)式表示(,)包含未知参数 θ 的真值概率为 1- α,如 α =0.05时,若从总体中抽得容量相同的
100个样本,则在确定的 100个置信区间中将有 95个包含 θ
的真值,不包含 θ 真值的区间只有 5个。
显然,置信区间不唯一。
有点象套圈游戏几个常用统计量复习正态总体均值和方差的区间估计设
nXXX,,,21?
为总体 ),(~ 2NX 的样本,
2,SX 分别是样本均值和样本方差。
一,数学期望的置信区间
1、已知 σ 2时,μ 的置信区间设 ),(~ 2NX
2
~ (,) XN n
则随机变量
2
~ ( 0,1 ) XZN
n
对于任意给定的 α,我们的任务是通过样本寻找一个区间,
它以 1- α 的概率包含总体 X的数学期望 μ 。
令
2
2
{ } 1 XPZ
n
2
2
z
2
2
z?
22{ } 1 P X z X znn
22[,] X z X znn
置信区间也可简记为 ][
2?
z
n
X?
于是得到随机区间它以 1- α 的概率包含总体 X的数学期望 μ 。
其置信度为 1- α 。
置信下限
2?
z
n
X? 置信上限
2?
z
n
X?
0,0 5 1 0,9 5 1 1 6n如 取查表得 96.1025.0
2
ZZ?
若由一个样本值算得样本均值的观察值 20.5?x
则得到一个区间 )69.5,71.4()49.020.5(
(4.71,5.69) 包含 μ 的可信程度 为 0.95.
注,μ 的置信水平 1- α 的置信区间不唯一。
上例中同样给定 05.0 可以取标准正态分布上
α 分位点- Z0.04 和 Z0.01,则又有
0,0 4 0,0 12{ } 0,9 5
XP Z Z
n
0,0 1 0,0 4{ } 0,9 5 P X Z X Znn
则 μ 的置信度为 0.95的置信区间为
0,0 1 0,0 4[,] X Z X Znn
与上一个置信区间比较,同样是 95.01
其区间长度不一样,上例 98.0
4
192.32
025.0 Zn
比此例 02.1
4
108.4)(
4
1
01.004.0 ZZ
短。
01.0
01.0z
04.0
04.0z?
置信区间短表示估计的精度高,第一个区间为优像 N(0,1)分布那样概率密度 的图形是单峰且对称的情况。
当 n固定时以 ][
2?
z
n
X? 的区间长度为最短,
我们一般选择它。
若以 L为区间长度,则
2
2
z
n
L?
可见 L随 n 的增大而减少( α 给定时),
随机地抽查了 9人,其高度分别为:
0 7 9 5 %假 设 标 准 差,置 信 度 为 ;
试 求 总 体 均 值 的 置 信 区 间 。
0 7,9,0,0 5,n解,已 知 由 样 本 值 算 得,
.1 1 5)1 1 01 2 01 1 5(91x
2
1,9 6 Z查 正 态 分 布 表 得 临 界 值,由 此 得 置 信 区 间,
57.119,43.1109/796.1115,9/796.1115
例 2 已知幼儿身高服从正态分布,现从 5~ 6岁的幼儿中
115,120,131,115,109,115,115,105,110cm;
二、未知 σ 2时,μ 的置信区间当总体 X的方差未知时,容易想到用样本方差?2代替 σ 2。
已知 2
~ ( 1 ) XT t n
s
n
则对给定的 α,令
2
2
{ ( 1 ) } 1 XP t n
s
n
查 t 分布表,可得 )1(
2
nt? 的值。
则 μ 的置信度为 1- α 的置信区间为
22{ ( 1 ) ( 1 ) } 1
ssP X t n X t n
nn
22[ ( 1 ),( 1 ) ]
ssX t n X t n
nn
例 3
解 本题是在 σ 2未知的条件下求正态总体参数 μ 的置信区间。 由公式知 μ 的置信区间为查表则所求 μ 的置信区间为为了估计一批钢索所能承受的平均张力(单位
kg/cm2),
设钢索所能承受的张力 X,
分别估计这批钢索所能承受的平均张力的范围与所能承受的平均张力。
随机选取了 9个样本作试验,
即则钢索所能承受的平均张力为 6650.9 kg/cm2
由试验所得数据得例 4
解由置信区间的概念,所求 μ 的 0.99的 置信区间为在交通工程中需要测定车速(单位 km/h),由以往
2、现在作了 150次观测,试问平均测量值的误差在的经验知道,
即测量值为 X,
测量值的误差在 之间。
1、至少作多少次观测,才能以 0.99的可靠性保证平均之间的概率有多大?
由题意要求用平均测量值 来估计 μ
其误差由题意知令至少要作 86次观测,
57.286 0 0 5.0 zn
才能以 0,99的可靠性保持平均测量误差在 之间。1?
58.31 5 0.2n
}1{XP }{
n
n
X
P?
1)(2n
1)4 2 1.3(2 9994.019997.02
思考题 1:
思考题 2,
在 μ 的区间估计中所起的重要作用称为枢轴量三、正态总体方差的区间估计下面我们将根据样本找出 σ 2 的置信区间,
已知总体对于给定的即则得到 σ 2随机区间以 的概率包含未知方差 σ 2,这就是 σ 2的置信度为
1- α 的置信区间。
例 5 某自动车床加工零件,抽查 16个测得长度(毫米)
01.1203.1216.1209.1208.1201.1212.1215.12
怎样估计该车床加工零件长度的方差。
解 先求
06.1201.1208.1211.1207.1213.1206.1215.12
)05.0(
075.12]6.012.015.0[16112x
])075.1206.12()075.1215.12[(15 1 222Sσ 2的估计值
0 0 2 4.0]5.7161215[151 0 0 0 01 222
或
2 2 2 2
11
11( ) [ ]
11
nn
ii
ii
s x x x nxnn
查表所求 σ 2的置信度为 0.95的 置信区间所求标准差 σ 的置信度为 0.95的 置信区间由得得例 6 为了估计灯泡使用时数(小时)的均值 μ 和解查表测试了 10个灯泡得方差 σ 2,
若已知灯泡的使用时数为 X,
求 μ 和 σ 2的置信区间。
由公式知 μ 的置信区间为
μ 的置信区间为查表即由公式知 σ 2的置信区间为
σ 2的置信区间为例题 7
2
,2N (,)
对 于 正 态 总 体 假 设 已 知求 的 区 间 估 计解,选 取 枢 轴 统 计 量
2
2 1
2
()
n
i
i
X?
2~ ( )n?
2? 的 置 信 区 间 为,
1.?1-?2 的估计四、两个正态总体
X~N(?1,?12),Y~N(?2,?22)
1) 已知?12 和?22
枢轴变量取
12
22
12
12
( ) ( )
XY
U
nn
12
22
12
12
( ) ( )
XY
U
nn
N (0,1 )~
22
12
22
12
12
( ) ( )
{ } 1
XY
P u u
nn
22
2 2 2 2
1 2 1 2
1 2 1 2
[,] X Y u X Y u
n n n n
2)?12 和?22 未知,?12 =?22 =?2
2,的区间估计枢轴变量选择1) 已知?
1 与?2
2)未知?1,?2
2 2 2 2
1 1 2 1
122 2 2 2
2 2 1 2
~ ( 1,1 ) SSF F n n
22
21( ) ( )
1 2 1 2221
1222
{ 1,1 1,1 } 1SP F n n F n n
S
甲 140 137 136 140 145 148 140 135 144 141
乙 135 118 115 140 128 131 130 115 121 125
例 8 甲、乙两种稻种分别种在 10块试验田中,每块田中甲、乙稻种各种一半。假设两种稻种产量 X,Y 服从正态分布,且方差相等,10块田中的产量如下表 (单位:公斤 ),求 两稻种产量的期望差?1-?2 的置信区间 (α =0.05).
解 设 X~N(?1,?12),Y~N(?2,?22),?12 =?22 =
2,要估计?1-?2,取统计量
),2(~
11
)()(
21
21
21
nnt
nn
S
YX
T
w
2
1)(1)(
21
2
22
2
11
nn
SnSn
S W其中由样本表可计算得
,10,956.71,8.126
,10,933.16,6.140
2
2
2
1
2
1
nsy
nsx
,667.6
18
956.719933.169
wS从而查 t 分布表得,t0.025(18)= 2.1009
两稻种产量期望差的置信度为 95%的置信区间为
12
2 12
11
( 2 ) ][ wX Y n n S
nnt
]10 2667.61009.28.1266.140,10 2667.61009.28.1266.140[
].0 6 4.20,5 3 6.7[即
12
2
12
12
2
12
11
( 2 ),
11
( 2 )
[
]
w
w
X Y n n S
nn
X Y n n S
nn
t
t
单正态总体的区间估计
),(~ 2NX 1221 uWuP
被估参数条件 统计量
(枢轴变量 )
置信区间
μ
已知
σ 2
μ
未知
σ 2
)1,0(~ NnXU
)1(~ ntnSXT
22
,unXunX
)1(,)1(
22
ntnSXntnSX
被估参数条件 统计量
(枢轴变量 )
置信区间
σ 2
已知
μ
σ 2
未知
μ
)(~ 2
1
2
nX
n
i
i
)1(~)1( 22
2
nSn
)(
)(
,
)(
)(
2
21
1
2
2
2
1
2
n
X
n
X
n
i
i
n
i
i
)1(
)1(,
)1(
)1(
2
21
2
2
2
2
n
Sn
n
Sn
被估参数 条件统计量
(枢轴变量 )
已知 σ 12
与 σ 22
未知 σ 12
和 σ 22
未知 μ 1
和 μ 2
)1,0(~
2
2
2
1
2
1
21 N
nn
YX
U
)2(~
11 21
21
21
nnt
nn
S
YX
T
w
)1,1(~ 212
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1 nnF
S
S
S
SF
21
21
2
2
2
1
双正态总体的区间估计