返回
第四章 统计估计
?第 4.1节 数理统计学中的基本概念
?第 4.2节 分布密度的近似求法
?第 4.3节 期望与方差的点估计
?第 4.4节 期望、方差的区间估计及 Excel实现
?第 4.5节 点估计法
返回
返回
数理统计学的任务 观察现象,收集资料,创建方法,
分析推断。
统计推断 伴随着一定概率的推测。其特点是,由“部分”
推断“整体”。
总体 研究对象的全体 (整体 )X。
个体 每一个研究对象。实际上是对总体的一次观察。
?
有限总体
无限总体
1.基本概念
样本 由部分个体构成的集合。经常说,来自 (或取自 )
某总体的样本。
第 4.1节 数理统计学中的基本概念
返回
注 (1)样本具有 二重性,
在抽样前,它是随机变量,用 X1,X2,…,X n表示 ;
在抽样后,它是 n个样本值 (随机变量的取值 )x1,x2,…,x n.
(2)样本选择方式,有放回抽样,
特别,样本容量 <<总体数量时,无放回抽样可近似看作有放
回抽样,
简单随机样本 (s.r.s) 具有两个特点的样本, 代表性 (组成样
本的每个个体与总体同分布 ),独立性 (组成样本的个体间
相互独立 )。
样本容量 样本中所含个体的数目 n.
注意,样本是一组独立同总体分布的随机变量,
返回
例如 检验一批灯泡的质量,从中选择 100只,则
总体 这批灯泡 (有限总体 )
个体 这批灯泡中的每一只
样本 抽取的 100只灯泡 (简单随机样本 )
样本容量 100
样本值 x1,x2,…,x 100
显然,可以选择“样本的函数”, ?
?
?
n
1i
iXn
1X
作为灯泡质量的一个衡量指标,
返回
总体 选择个体 样本 观测样本 样本观察值 (数据 )
数据处理 样本有关结论
推断总体性质统计 量
为了集中简单随机样本所带来的总体信息,考虑样本的函
数,且不含任何未知参数,这样的, 不含 未知 参数的样本的
函数, 称为 统计量 。
统计量的分布成为 抽样分布,
统计的一般步骤
返回
(2) 样本均值
(4) 样本方差
(5) 样本标准差
(3) 样本 k阶中心矩
?
?
?
n
1i
iXn
1X
?
?
???
n
1i
2
i
2 )XX(
1n
1S
?
?
???
n
1i
2
i )XX(1n
1S
),2,1()(1
1
???? ?
?
iXXnB
n
i
k
ik
(1) 样本 k阶原点矩 ),2,1(1
1
??? ?
?
iXnA
n
i
k
ik
注 2
1
2
1
2)( XnXXX
n
i
i
n
i
i ??? ??
??
常用统计量
返回
未知,则 ( )不是统计量。
是来自总体例 4.1.1 设
nXXX,,,21 ? ),( 2??N
? ?的 s.r.s,其中 已知,
n21
22
2
2
1
n
1i
2
σ
μX
n
1
n
1i
2
in
1
n
1i
2
in
1
n
1i
in
1
...XXX[ 6 ] 2σX[ 5 ] X)([ 4 ]
)X(X[ 3 ])(X[ 2 ]X[ 1 ]
i ?
?
??
??
?
???
?
?
???
解, [4],[5]
返回
设总体 X~N(μ,σ2),X1,X2,…,X n为取自该总体 X的样本,
(1)四大分布及其分位数
① 标准正态分布及其上侧分位数
若 P(Z>zα)=α,
则称 zα为标准正态分布
的 上侧 α分位数,
?? ??? 1)( z
zα
α
X
φ(x)
其中
n
XZ
?
???定义 设 X~N(μ,σ2),则 ~N(0,1),对任意 0<α<1,
2.正态总体下的常用统计量及其分布
返回
即, n 个相互独立同标准正态分布的随机变量的平方
和 X的分布为自由度为 n 的 分布,2?
)(~ 2 nmYX ?? ?
性质
X1,X2,…X n独立,Xi~N(0,1),(i=1,2,…,n),则
)(~ 2
1
2 nXX n
i
i ??
?
?
定义
分布具有 可加性,
即 X,Y独立,X~ (m),Y~ (n),则
2?
2? 2?
分布及其上侧分位数2?②
返回
的密度曲线)(2 n?
X
f(x)
n=1
n=4
n=10
随着 n的增大,密度曲线逐渐趋于平缓,对称,
返回
分布的上侧分位数
2?
X
f(x)
?
)(2 n??
(1)若 P(X>λ)=α,则
)(2 n??? ?
(1)若 P(X<λ)=α,则
)(21 n??? ??
例 4.1.2 设 X~ (10),P(X>λ1)=0.025,P(X<λ2)=0.05,求 λ1,λ2.
2 ?
解 )10(2
0 2 5.01 ?? ? )10(2 95.02 ?? ?
定义 设,对于给定的 α(0<α<1),
若 P(X> )=α,则称 为自由度为 n的 分布
的 上侧 α分位数,
)n(~X 2?
2?)(2 n
?? )(2 n??
返回
例 4.1.3 设 是取自总体 N(0,4)的简单随
机样本
当 a=,b= 时,).2(~ 2?X
243221 )43()2( XXbXXaX ????
4321,,,XXXX
解 由题意得
??
?
?
?
?
?
)1,0(N~)X4X3(b
)1,0(N~)X2X(a
43
21
??
?
?
?
??
??
1)]X4X3(b[D
1)]X2X(a[D
43
21
?
a =1/20
b=1/100
返回
设随机变量,随机变量 Y,且
它们互相独立,则称随机变量 的分布为自由度
是 n 的 t 分布,记作
)1,0(~ NX )(~ 2 n?
nYXT /?
).(~ ntT
定义
t分布的密度曲线,
X
f(x)
特点 关于 y轴对称 ;随着自由度的逐渐增大,
密度曲线逐渐接近于标准正态密度曲线,
③ t分布及其上侧分位数
返回
服从 ( )分布,参数为 ( ).
例 4.1.4 设随机变量 X 和 Y 相互独立且都服从
正态分布,而 和
分别是来自总体 X 和 Y 的 s.r.s,则统计量
)9,0(N 91,,XX ? 91,,YY ?
2
9Y
2
1Y
9X1XU
??
??
?
?
?
t 9
解 ),1,0(N~X
9
1X 9
1i
i?
?
? )1,0(N~3
Y i
故 )9(~
9
1)
3(
~ 29
1
2
9
1
2 ???
??
??
i
i
i
i YYY 与 独立,YX ~
所以 )9(~
9/~
t
Y
XU ?
返回
t分布的上侧分位数
例 4.1.5 设 tα(n)为 t(n)的上侧 α分位数则 P(T< tα(n))=,
P(T<- tα(n))=,P(|T|> tα(n))=,
)n(t? X
f(x)
α
1-α
2αα
设 X~t(n),对于给定 α(0<α<1),若 P(t(n)> )=α,
则称 为 t(n)分布的 上侧 α分位数,
)(nt?
)(nt?
返回
定义 设随机变量 随机变量 且
它们相互独立,则称随机变量 的分布为自
由度是 的 F 分布。记作
),(~ 12 nX ? ),(~ 22 nY ?
2
1
/
/
nY
nXF ?
),( 21 nn
),(~ 21 nnFF
性质
),(~1),,(~)1( 1221 nnFXnnFX 则若
④ F分布及其性质
返回
F分布的密度曲线
F分布的上侧分位数
X
f(x)
?
)n,n(F 21?
上侧分位数的计算
(1)若 P(F>λ)=α,则 )n,n(F
21?? ?
(2)若 P(F>λ)=1-α,则 P(1/F<1/λ)=1-α,P(1/F>1/λ)=α,
)],(~[ 21 nnFF
),(1 12 nnF ?? ? 故 ),( 1),(
12
211 nnFnnF
?
? ??
设 X~,对于给定
α(0<α<1),若
P(X > )=α,
则称 为 F分布的
上侧 α分位数,
)n,n(F 21
),( 21 nnF?
),( 21 nnF?
返回
设 X~N(μ1,σ12),Y~ N(μ2,σ22),从中分别抽取容量为 n1,n2的样
本,且两组样本独立,样本均值和样本方差分别记为
.S,Y;S,X 2221
)
n
,(N~Y),
n
,(N~X
2
2
2
2
1
2
1
1
????
,)YX(E 21 ?? ???
2
2
2
1
2
1
nn
YDXD)YX(D ?? ?????
)
nn
,(N~YX
2
2
2
1
2
1
21
???? ???
)1,0(N~
nn
)()YX(
2
2
2
1
2
1
21
??
??
?
???
返回
)2nn(t~
n
1
n
1
S
)(YX
21
21
p
21 ??
?
??? ??
另外还可证明
当 时,记2221 ?? ?
2
)1()1(
21
2
22
2
112
??
????
nn
SnSnS
p
则可证明
)1,1(~
/
/
212
2
2
2
2
1
2
1 ?? nnF
S
S
?
?
返回
例 4.1.6 在总体 X~N(12,4)中抽取容量为 5的样本 X1,X2,…,X 5,
求下列概率,
).10),,( m i n ()3();15),,( m a x ()2(
);1|12(|)1(
5151 ??
??
XXPXXP
XP
??
(1)因为 ),
5
4,12(~ NX ),(所以 10~
5
4
12
N
X ?
)1|12(| ??XP
??
?
?
?
?
?
??
?
?
?
?
?
?
?
?
5
4
1
5
4
12X
P
=2Φ(1.118)-1
=0.7364
解
返回
例 4.1.6 在总体 X~N(12,4)中抽取容量为 5的样本 X1,X2,…,X 5,
求下列概率,
).10),,( m i n ()3();15),,( m a x ()2(
);1|12(|)1(
5151 ??
??
XXPXXP
XP
??
解
)15),,( m a x ()2( 51 ?XXP ? )15),,( m a x (1 51 ??? XXP ?
)15,,15(1 51 ???? XXP ?
)15()15(1 51 ???? XPXP ?
5)]15([1 ??? XP 5)]
2
1215([1 ????
5)]5.1([1 ??? =0.2923
返回
例 4.1.6 在总体 X~N(12,4)中抽取容量为 5的样本 X1,X2,…,X 5,
求下列概率,
).10),,( m i n ()3();15),,( m a x ()2(
);1|12(|)1(
5151 ??
??
XXPXXP
XP
??
解
)10),,( m in ()3( 51 ?XXP ?
)10()10( 51 ??? XPXP ?
5)]10([ ?? XP 5)]10(1[ ??? XP
5)]1(1[ ????
=0.4215
5)]1([??
返回
例 4.1.7 设 X1,X2,…,X 25是取自总体 X~N(3,100)的样本,
求概率,
)73.1 5 17.57,60( 2 ???? SXP
解, )73.1 5 17.57,60( 2 ???? SXP
)73.1517.57()60( 2 ????? SPXP
)4 1 5 2.36100 24848.13()5.12 35.1( 2 ??????? SPXP
)]4152.36()848.13([
]1)5.1(2[
C H I D I S TC H I D I S T
N O R M S D I S T
?
??
=0.7798
注 CHIDIST返回的是 分布区间概率值,2?
返回
Step1 在数据编辑窗口中,建立数据文件 ;
Step2 计算样本均值 —— 调用 AVERAGE函数:
Step3 计算样本方差 —— 调用 VAR函数 ;
Step4 计算样本标准差 —— 调用 STDEV函数,
(1) 利用 Excel计算样本均值、样本方差、样本标准差
3.Excel实现
返回
)1( ?? ?? N O R M S I NVz
),()(2 nC H I I N Vn ?? ? ?
)n,2(T I N V)n(t ?? ?
)n,n,(F I N V)n,n(F 2121 ?? ?
Step1 计算标准正态分布的上侧 α分位数
Step2 计算 的上侧 α分位数分布)(2 n?
Step3 计算 的上侧 α分位数分布)(nt
Step4 计算 的上侧 α分位数分布),( 21 nnF
(2) 利用 Excel计算四大分布的分位数
返回
1,频率柱形图 (frequency histogram)
Step1 对样本值 升序排列为
称 为样本极差 ;
nxxx,,,21 ? ??? ??? nxxx ?21
?? ?? 1xxR n
Step2 选取 a(略小于 )和 b(略大于 ),分区间 (a,b]为 m等份,
称每一等份的长度为组距,
*1x *nx
bcacmicc mii ??? ?? 111,,,,2,1],,( ?
Step3 统计样本值落入各等份的频数,并求出频率 ;
Step4 以“组序号”为横轴,以频率为纵轴画柱形图,即得
频率柱形图, 画平滑直线图即得到总体 X的密度近似曲线,
第 4.2节 分布密度的近似求法
返回
2.Excel实现
Step1 样本值输入 Excel数据编辑窗口,并升序排列 ;
Step2 确定 a,b,m,h,并将 a输入单元格 B1,选定单元格 B1:Bm,
依次单击“编辑”、“填充”、“序列”指令,在步长框
输入 h,单击“确定” ;
Step3 选定单元格 C1:Cm+1,输入频数分布公式,计算得
C1:Cm+1结果 ;;nCD ii ?Step4 计算 D1:Dm+1,计算公式为
Step5 选定 B1:Dm+1,按“图形向导”工具,逐步完成 ;
Step6 按“图形向导”工具,选“自定义类型”、“平滑直
线图”、
,下一步,,, 系列,,通过删除或填加直到满意
后
返回
?
X~P(λ),X~E(λ),X~N(μ,σ2)
用所获得的样本值去估计参数取值称为 参数估计,
参
数
估
计
?
点估计
区间估计
用某一数值作为
参数的近似值
?
在要求的精度范围内
指出参数所在的区间
数理统计的主要任务之一是依据样本推断总体,推
断的基本内容包括两个方面,一是依据样本寻找总
体未知参数的近似值和近似范围 ;二是依据样本对
总体未知参数的某种假设作出真伪判断,本章先介
绍求近似值和近似范围的方法,
1,参数估计的基本思想
第 4.3节 期望与方差的点估计
返回
定义 设总体 X分布函数为 F(x;θ 1,θ 2,… θ m),θ i为未知
参数 (i=1,2,…,m),X1,X2,…,Xn为来自该总体的 s.r.s,若以
统计量 =θ i(x1,x2,…,xn)作为 θ i的近似值,则称 为 θ i
的 估计值 (抽样后 ),也称 为 θ i的 估计量 (抽样前 ).
i?? i??
i??
即,
选择统计量
估计量 带入样本值 估计值
X分布为 F(x;θ )[θ 待估 ]
2,点估计的评价标准
返回
容易明白,对同一个未知参数,采用不同的
方法找到的点估计可能不同,那么,自然要问,究
竟是用哪一个更“好”些呢?这里介绍三个评
价标准,
标准一, 无偏性
设 为 θ的一个点估计,若
则称 为 θ的一个 无偏估计,
??
??
,)?(E ?? ?
注意 无偏估计若存在,则可能不唯一,
标准二, 有效性
设 和 是 的两个无偏估计,若
称 比 更 有效
?2?? )?()?( 21 ?? DD ?
1??
1??
2??
返回
例 4.3.1 设 X1,X2,X3为来自总体 X的简单随机样
本,EX=μ,DX=σ2,验证下列 μ的估计量哪个更有效,
32133212211 X3
1X
3
2X
2
1?,X
3
1X
3
1X
3
1?,X
2
1X
2
1? ???????? ???
解
]X21X21[E?E 211 ???
?? 65EX65EX31EX32EX21?E 3213 ?????
,EXEX31EX31EX31?E 3212 ?? ?????
2EX2
1EX
2
1 ?? =EX=μ
]X21X21[D?D 211 ??? 21 DX41DX41 ?? =DX/2=σ2/2
同理
,3/DX91DX91DX91?D 23212 ?? ????
所以
21,??
?? 为无偏估计量,,DD
21 ??
?? ?
2?
? 更有效,
返回
s.r.s,试证, 为
的无偏估计,且 比 更有效,
)nk(,X?,X?
k
1i
ik
1
21 ??? ?
?
?? ??)( XE
1?? 2??
例 4.3.2 设总体 X的方差存在 是来自 X的
nXX,,1 ?
证明, ?
?
??
n
1i
i1 )Xn
1(EXEE ??
inE Xn
1? ??
?
?
?
k
1i
i2 )Xk
1(EE ??
ik E Xk
1? ??
?
?
??
n
1i
i1 )Xn
1(DXDD ??
inD Xn 2
1?
n
2?
?
?
?
?
k
1i
i2 )Xk
1(DD ??
ik D Xk 2
1?
k
2?
?,21 DD ?? ?? ?
样本容量越大,样本均值估计值越精确,
返回
例 4.3.3 验证, 是总体 X方差的
一个无偏估计 ; 不是方差的无偏估计,
?
?
???
n
1i
2
i
2 )XX(
1n
1S
?
?
??
n
i
i XXnB
1
2
2 )(
1
解
)]X(nE)X(E[1n 1ES 2
n
1i
2
i
2 ?
?? ??
?
?
?
n
1i
2
i )XX( ??
???
n
1i
2
i
2
i )XXX2X(
2
n
1i
i
n
1i
2
i XnXX2X ??? ??
??
2
n
1i
2
i Xn?? ?
?
)X(E1n nEX1n n 22 ????
])XE(XD)EX(DX[1n n 22 ?????
]XDDX[1n n ??? ]nDXDX[1n n ??? =DX
所以,S2为 DX的无偏估计量,
ES2=DX,,1 2
2 Sn
nB ??
故
2
2
1 ES
n
nEB ??
DXn 1n ??
所以,不是 DX的无偏估计量,2B
返回
0
)],(ln[
1
)()?(
2
0 ?
?
?
??
?
?
??
XfnE
DD
其中,称为方差的下界, )(0 ?D
)()?( 0 ?? DD ?当 时,为 的有效估计量,?? ?
实际应用时,常用 Rao-Cramer(罗 -克拉美 )不等式来证
明无偏估计量是有效估计量,
即, 若 是 的无偏估计量,则?? ?
返回
例 4.3.4 设总体 X~P(λ),X1,X2,…,X n为取自该总体的样本,
试证, 为 λ的有效估计量,X???
为 λ的无偏估计量,X???证明 由 知,?? ?? )()?( XEE
又因为,
!),(,)()
?( ????? ???? e
xxfnXDD
x
)!l n (ln)],(l n [ xxxf ???? ???
所以
??????
1)(1])(1[)],(l n [[
2
2
2
2 ????
?
? XDXEXfE
由 Rao-Cramer不等式得
.)()?(
)],(ln[
1)(
2
0 nXDD
XfnE
D ??
?
?
? ???
?
??
X??? 为 λ的有效估计量,
返回
标准三, 相合性 (一致性 )
例 4.3.5设 X1,X2,…,X n为取自总体 X的样本,E(X)=μ,D(X)=σ2,
则 是总体均值 E(X)= μ的相合估计量,X
证明 利用切比雪夫不等式,
n
XDXP
2
2
2
)()||(
?
?
??? ????
所以,0)||(lim ???
?? ??XPn
即 是总体均值 E(X)= μ的相合估计量,X
设统计量 是未知参数 的点估计量,样本容量为 n,
若对任意
则称 为 的 相合估计,又称 一致估计,
?? ?
? ? 1?lim ????? ???pn,0??
?? ?
? ? )0?lim( ????? ???pn或
返回
在实际中,常常以样本均值作为总体均值的
点估计,以样本方差作为总体方差的点估计,
期望的点估计
选择估计量 ?
?
?
n
1i
iXn
1X
?
(1)无偏性
(2)样本容量越大,估计值 越有效
方差的点估计
选择估计量 ?
?
???
n
1i
2
i
2 )XX(
1n
1S (无偏估计量 )
注意 ?
?
??
n
i
i XXnB
1
2
2 )(
1 (非无偏估计量 )
3.数学期望和方差的点估计
返回
例 4.3.6 设总体 X~U(a,b),X1,X2,…,X n为取自该总体的样本,
求 a,b的估计量,
解 因为
12
)(,
2
2ab
DXbaEX ????
所以令 2,SDXXEX ??
得方程组
?
?
?
??
?
?
?
?
?
?
2
2
12
)(
2
S
ab
X
ba
解得 SXbSXa 3?,3? ????
返回
点估计有使用方便、直观等优点,但他并没有提
供关于估计精度的任何信息,为此提出了未知参
数的区间估计法,
例 对明年小麦的亩产量作出估计为,
即 若设 X表示明年小麦亩产量,则估计结果为
P(800≤X≤1000)=80%
明年小麦亩产量八成为 800-1000斤,
区间估计
第 4.4节 期望、方差的区间估计及 Excel实现
返回
设总体分布中含有未知参数,根据来自该总体的 s.r.s,
如果能够找到两个统计量,使得随机区间
包含 达到一定的把握,那么,便称该随机区间为未知参
数的 区间估计,即
当 成立时,
称概率 为 置信度 或 置信水平 或 置信系数 ;
称区间 是 的置信度为 的 置信区间 ;
分别称为 置信下限 和 置信上限,
?
21 ?,? ?? )?,?( 21 ??
?
,1}??{ 21 ???? ????P )10( ?? ?
??1
)?,?( 21 ?? ? ??1
21 ?,? ??
区间估计的定义
返回
① 选择包含 μ的分布已知函数,
② 构造 Z的 一个 1-α区间,
?
?
?
?? ???
??? 1)
/
(
22
z
n
XzP
n
XZ
/?
??? )1,0(N~
③ μ的 1-α置信区间, ),(
22 n
zX
n
zX ?? ?? ??
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
(1) σ2已知,求 μ的置信度为 1-α置信区间
]
2
1)([
2
?
? ??? z
???? ?? ?????? 1)(
22 n
zXnzXP
即
1.单正态总体数学期望的区间估计
返回
α/2α/2
X
φ(x)
1-α
zα/2
P(|Z|<λ)=1-α
置信区间不是唯一的,对于同一个置信度,可以
有不同的置信区间,置信度相同时,当然置信区间越短越
好,一般来说,置信区间取成 对称区间或概率对称区间,
注意
1-α
返回
注意 以上 Z具有三个特点,
(1) 样本的函数 ;
(2) 含且仅含待估未知参数 μ;
(3) 其分布与待估未知参数 μ无关,
可称 Z为 枢轴变量,
返回
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
(2)σ2未知,求 μ的置信度为 1-α置信区间
① 从点估计着手构造枢轴变量,
② 构造 T的 一个 1-α区间,
③ μ的 1-α置信区间,
nS
XT
/
??? )1n(t~ ?
)1n(t 2/ ?? X
f(x)
α/2α/2 ?? ???? 1))1(|(| 2/ ntTP
?
?
?
?
????
????
1}
n
S
)1n(tX
n
S
)1n(tX{P
2/
2/
)nS)1n(tX,nS)1n(tX( 2/2/ ???? ??
1-α
返回
Excel求置信区间使用 CONFIDENCE函数,其语法格式如下,
CONFIDENCE(α,σ,n) =
置信下限为, CONFIDENCE(α,σ,n)
置信上限为, CONFIDENCE(α,σ,n)
2
?
? z
n
?X
?X
例 4.4.1 设正态总体的方差为 1,根据取自该总体的容
量为 100的样本计算得到样本均值为 5,求总体均值的
置信度为 0.95的置信区间,
解 已知 σ2=1,α=0.05,求 μ的 1-α置信区间:
返回
例 4.4.2 某种零件的重量服从正态分布, 现从中抽取
容量为 16的样本,其观测到的重量 (单位, 千克 )分别
为 4.8,4.7,5.0,5.2,4.7,4.9,5.0,5.0,4.6,4.7,5.0,5.1,
4.7,4.5,4.9,4.9,需要估计零件平均重量,求平均重量
的区间估计,置信系数是 0.95.
解 未知 σ2,α=0.05,求 μ的 1-α置信区间,
应用 t分布,需要计算 SX和
返回
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
(1) 总体均值 已知?
① 构造枢轴变量 )(~? 2
2
2
nnQ ?
?
??
其中,)(? 2
1
212 的无偏估计为 ??? ?
?
??
n
i
in X
② 取 1-α置信区间为 ???
?? ????? 1))()((
22
1 22 nQnP
③ 解不等式得到 σ2的 1-α置信区间,
?
?
?
?
?
?
?
?
?
?
?
?
??
?
??
??
)n(
)X(
,
)n(
)X(
2
1
n
1i
2
i
2
n
1i
2
i
22
?? ?
?
?
?
2.单正态总体方差的区间估计
返回
X
f(x)
① 构造枢轴变量,
② 构造 Q的 一个 1-α区间,
③ 解不等式得到 σ2的 1-α置信区间,
2
2)1(
?
SnQ ?? )1n(~ 2 ??
??? ???? 1}{ 21 QP
α/2α/2
1-α
λ1 λ2
1-α/2
)1(2
2
?n??)1(2
21
?
?
n??
??
?
?
?
?
????
?
??
?
1)}1(
)1(
)1({
2
2
2
2
2
2
1
n
Sn
nP
)
)1(
)1(
,
)1(
)1(
( 2
2
1
2
2
2
2
?
?
?
?
?
n
Sn
n
Sn
?? ??
(2) 总体均值 未知?
返回
例 4.4.3 投资的回收利用率常常用来衡量投资的风险,
随机地调查了 26个年回收利润率 (%),标准差 S(%),设回
收利润率为正态分布,求它的方差的区间估计 (置信系数
为 0.95).
解 总体均值 未知,α=0.05,方差的区间估计,?
返回
(1) σ12,σ22已知,μ1- μ2的 1-α置信区间
)1,0(~
//
)()(
2
2
21
2
1
21 N
nn
YXZ
??
??
?
????
① 相对 μ1- μ2,构造枢轴变量,
② 构造 Z的 一个 1-α区间,
③ 概率恒等变形,得到 μ1- μ2的 1-α置信区间,
??? ????? 1)(
22
zZzP
))(,)((
2
2
2
1
2
1
22
2
2
1
2
1
2 nn
zYX
nn
zYX ???? ?? ??????
]21)([ ?? ??? z
设 X~N(μ1,σ12),Y~ N(μ2,σ22),从中分别抽取容量为 n1,n2的样
本,且两组样本独立,样本均值和样本方差分别记为
.S,Y;S,X 2221
3.两个正态总体均值差的区间估计
返回
(2) σ12=σ22=σ2,σ2未知,μ1- μ2的 1-α置信区间
)2(~
/1/1
)()(
21
21
21 ??
?
???? nnt
nnS
YXT
P
??
① 对于 μ1- μ2,构造枢轴变量,
② 构造 T的 一个 1-α区间,
③ 变形得到 μ1- μ2的 1-α置信区间,
)
11
)2()(
,
11
)2()((
21
21
2
21
21
2
nn
SnntYX
nn
SnntYX
P
P
?????
?????
?
?
?? ????? 1))2(|(| 21
2
nntTP
返回
(3) σ12,σ22均未知,n1=n2=n,μ1-μ2的 1-α置信区间
令 则
iii YXZ ?? ),(~ 222121 ???? ??NZ i
将 视为取自总体 nZZZ,,,21 ? ),(~ 222121 ???? ??NZ
的样本,由单正态总体方差未知时总体均值的区间估计
方法得置信区间为
))1n(t
n
SZ),1n(t
n
SZ(
22
zz ????
??
其中 ?
?
? ????
n
i
inz ZZSYXZ
1
2
1
12 )(,
返回
(4) σ12,σ22均未知,n1,n2均很大 (一般均大于 50),μ1-μ2的 1-α
近似置信区间
))(,)((
2
2
2
1
2
1
22
2
2
1
2
1
2 n
S
n
S
zYX
n
S
n
S
zYX ?????? ??
返回
例 4.4.4 某工厂利用两条自动化流水线罐装番茄酱,
分别从两条流水线上抽取随机样本,
和,计算出 (克 ),(克 ),
,假设这两条流水线上罐装番茄酱
的重量都服从正态分布,其总体均值分别为,
且有相同的总体方差, 试求总体均值差 的
区间估计,置信系数为 0.95,
1221,,,XXX ?
1721,,,YYY ? 6.10?X 5.9?Y
7.4,4.2 2221 ?? SS
21,??
21 ?? ?
解 σ12=σ22=σ2,σ2未知,μ1- μ2的 0.95置信区间,
返回
(1)对于 σ12/σ22,构造枢轴变量,
(2)构造 F的 一个 1-α区间,
(3)解不等式得 σ12/σ22 的 1-α置信区间,
)1,1(~
/
/
212
2
2
2
2
1
2
1 ??? nnF
S
SF
?
?
)1n,1n(F 21
21
??? ?
X
f(x)
α/ α/2
)1n,1n(F 21
2
???
λ1 λ2
1-α
P(λ1<F< λ2)=1-α
)1n,1n(F
1
122/ ???
)
S
S
)1n,1n(F,
S
S
)1n,1n(F
1
( 2
2
2
1
12
2
2
2
2
1
21
2
??
?? ??
4.两个正态总体方差比 σ12/σ22的 1-α置信区间
返回
例 4.4.5 为了比较用两种不同方法生产的某种产品的寿命
而进行一项试验, 试验中抽选了由方法一生产的 16个产品
组成一随机样本,其方差为 1200小时 ; 又抽选了由方法二
生产的 21个产品组成另一随机样本,得出的方差为 800
小时, 试以 95%的可靠性估计两总体方差之比的置信区间,
解 设方法一生产的产品的寿命为
方法二生产的产品的寿命为
要求 的置信度为 95%的置信区间,
Y~ N(μ2,σ22),
X~N(μ1,σ12),
σ12/σ22
返回
由上述方法求得的总体均值差或总体方差比的置信区间,
我们在实际中通常有下列结论,
(1) 若 的置信区间的下限大于零,则可认为 ;
若 的置信区间的上限小于零,则可认为 ;
若 的置信区间包含零,则可认为
21 ?? ?
21 ?? ?
21 ?? ?
21 ?? ?
.21 ?? ?
21 ?? ?
(2) 若 的置信区间的下限大于 1,则可认为
若 的置信区间的上限小于 1,则可认为 ;
若 的置信区间包含 1,则可认为σ12/σ22
σ12/σ22
σ12/σ22
σ12>σ22
σ12<σ22
σ12=σ22.
返回
1.矩估计法
将总体的各阶原点矩用相应阶的样本原点矩替代,布
列方程或方程组,所得到的解,作为总体未知参数的点估计
的方法,
例 4.5.1 设总体,为取自该总体的样本,
求未知参数 θ的矩估计量,
),0(~ ?UX nXXX,,,21 ?
解 XEX ??
2
?
X2??所以
参数 θ的矩估计量为 X2? ??
第 4.5节 点估计法
返回
例 4.5.2 设总体的概率密度函数为
为取自该总体的样本,
??
?
?
? ???
?
其它,0
0,
)(6
)( 3 ??
?
x
xx
xf
nXXX,,,21 ?
求 (1)未知参数 的矩估计量 ;(2)?? ).?(?D?
解 (1) XEX ??
2
? X2??所以
参数 θ的矩估计量为 X2? ??
XDXDD 4)2(?)2( ??? ])([44 22 EXEX
nn
DX ????
nn 5])2(20
6[4 222 ??? ???
返回
(1) 似然函数 (样本的联合密度函数 )
设总体 X为连续型,X~ f(x;θ1,θ2,…θ m),θi为待估
参数 (i=1,2,…,m),X 1,X2,…,X n为来自该总体的 s.r.s,则
Xi~ f(xi;θ1,θ2,…θ m),(i=1,2,…,m)
( X1,X2,…,X n) 的联合密度函数为
?
?
?
n
i
mimn xfxxxL
1
212121 ),...,,;(),...,,;,...,,( ??????
(似然函数 )
例 X~E(λ),即
??
?
?
?? ?
0x0
0xe);x(f~X x???则
?
?
?
?
?? ?
0x0
0xe);x(f~X
i
i
x
ii
i??
?
?
?
?
n
1i
in21 ),x(f);x,.,.,x,x(L ???
?
?
?
?
???
? ??
?
其它,0
0,.,.,0,0,21
1
n
n
i
x xxxe i??
2 最大似然估计法
返回
设总体 X为 离散型,P(X=x)=P(x;θ1,θ2,…θ m),θi为待
估参数 (i=1,2,…,m),X 1,X2,…,X n为来自该总体的 s.r.s,则
P(Xi=xi)=P(xi;θ1,θ2,…θ m),(i=1,2,…,m)
( X1,X2,…,X n) 的联合概率函数为
?
?
?
n
1i
m21im21n21 ),...,,;x(P),...,,;x,...,x,x(L ??????
(似然函数 )
例 X~P(λ),即 ?? ??? e
kkXP
k
!)(
?? ??? e
!x)xX(P
x
?
?
?
n
1i
in21 ),x(P);x,.,.,x,x(L ??
??? ?? e
!x
);x(P
i
x
i
i
?
?
??
n
1i i
x
e!x
i
??
返回
(2) 基本思想,
如:甲,乙两人比较射击技术,分别射击目标一次,甲中
而乙未中,则可以认为,甲射击技术优于乙射击技术,
又如:事件 A发生的概率为 0.1或 0.9,观察一次,事件 A发
生了,则可以认为,事件 A发生的概率为 0.9.
实际问题 (医生看病、公安人员破案、技术人员进行质
量检验等 )尽管千差万别,但他们具有一个共同的规律,即
在获得了观察资料之后,给参数选取一个数值,使得前面的
观察结果出现的可能性最大,
最大似然估计就是通过样本值 来求得总体的
分布参数,使得 取值为 的概率最大,
nXX,,1 ?
nxx,,1 ?
nxx,,1 ?
返回
样本观察值出现可能性的大小跟似然函数在该样本值处的
函数值有关,L越大,样本观察值越可能出现,所以,
若似然函数 在
取到最大值,则称 分别为 的
最大似然估计,
),...,,;x,...,x,x(L m21n21 ??? m21,...,,??? ???
m21,...,,???
???
m21,...,,???
最大似然估计,
返回
(3) 方法与步骤,
设总体的分布密度 (或概率密度 )
其中 是待估参数,
),,;x(f m1 ?? ?
m??,,1 ?
① 写出似然函数 (即样本的联合密度函数 )
?
?
??
n
1i
m1im1n1 ),,;x(f),,;x,,x(LL ???? ???
② 写出对数似然函数(对似然函数取对数)
?
?
?
n
i
mixfL
1
1 ),,;(lnln ?? ?
③ 写出似然方程
mi
i
L ?,2,1,0ln ??
?
?
?
④ 求解似然方程并写出估计量 mi
i,,3,2,1,? ???
(只有一个待估参数时求 )?d Llnd
返回
例 4.5.3 求参数 为 p的 0-1分布的最大似然估计,
解 P(X=0)=1-p
P(X=1)=p P(X=m)=p
m(1-p)1-m(m=0,1)
?
P(X=x)=px(1-p)1-x ?
?
??
n
1i
x1x ii )p1(p
)p1ln ()xn(pln)x(
n
1i
i
n
1i
i ??? ??
??
?
?
?
? ??
?
n
1i
i
n
1i
i xnx
)p1(p
0
1
11 ?
?
?
?
??
??
p
xn
p
x
n
i
i
n
i
i
0)()1(
11
???? ??
??
n
i
i
n
i
i xnpxp
?)p;x,...,x,x(L n21
?Lln
?dp Llnd
解得 ?
?
?
n
i
ixnp
1
1 最大似然估计为 XX
n
1p n
1i
i ?? ?
?
?
注意, 为 p的无偏估计量,X
返回
例 4.5.4 X~N(μ,σ2),求参数 μ,σ2的最大似然估计,
解
2
2
2
)x(
2 e
2
1),,x(f ??
??
??
??
? 2
2
2
)x(
2
e
2
1 ??
??
??
?
?
?
??n
1i
2
)x(
2
2
2
i
e
2
1 ? ?
??
?),;x,...,x,x(L 2n21 ?? ?? ?
??
n
1i
2
i2 )x(2
1
n
2
e)
2
1( ??
??
?Lln ? ??
?
n
1i
2
i22 )x(2
1)
2
1ln (n ?
??? ? ???? ?
n
1i
2
i2
2 )x(
2
12ln
2
n ?
???
0)(1
1
2 ???
?
n
i
ix ??
0)x(2 12 n
n
1i
2
i42 ???? ?
?
????
??? ?Lln
??? 2Lln? ?
XXn1
n
1i
i ?? ?
?
??
??
??
????
n
i
i
n
i
i XXnXn
1
2
1
22 )(1)(1 ???
注意, 不是无偏估计,2??
返回
例 4.5.5 设 X服从 [0,θ]区间上的均匀分布,参数
θ>0,求 θ的最大似然估计,
解 由题意得,
??
?
?
? ??
?
其它0
0
1
);(~
?
??
x
xfX
?);,.,,,,( 21 ?nxxxL
??
?
?
? ??
其它0
,...,,0
1
21 ?? nn xxx
??ddL 01 ?? ?nn
?
无解,基本方法失效,
考虑 L的取值,要使 L取值最大,θ应最小,??? nxxx,.,,,,0 21
取 ),.,,,,m a x ( 21 nxxx?? 此时,L取值最大,
所以,最大似然估计为 ),.,,,,m a x (? 21 nXXX??
应用最大似然估计基本思想, L越大,样本观察值越可能出现,
返回
例 4.5.6 设总体 X~
?
?
? ?????
?
其他,0
1,10,)1()( ?? ? xxxf
解 由题意得,
?);x,...,x,x(L n21 ?
当 时,)n,...,2,1i(1x0
i ???
?Lln ]x[)1ln (
n
1i
i
n ?
?
? ?? ?
?
???
n
1i
ixln)1ln (n ??
??d Llnd 0xln
1
n n
1i
i ??? ?
??
所求最大似然估计为 ?
?
??? n
1i
iXln
n1??
?
?
?
?
?
?????
?
其它0
n,.,.,2,1i,1x0x)1( i
n
1i
i
??
?
其中 是未知参数, 是来自总体的一个容量为
n 的 s.r.s,求 的最大似然估计
? nXX,,1 ?
).(? ?1 ?? ??
n
eE及
?
?
??? n
1i
iXln
n1??
所以 n
n
n
EXXXXEeE )()()( 21?1 ???? ??
另一方面
2
1)1(1
0
1
?
???? ? ?
?
?? ? dxxEX
故 nneE )
2
1()( ?1
?
????
?
??
第四章 统计估计
?第 4.1节 数理统计学中的基本概念
?第 4.2节 分布密度的近似求法
?第 4.3节 期望与方差的点估计
?第 4.4节 期望、方差的区间估计及 Excel实现
?第 4.5节 点估计法
返回
返回
数理统计学的任务 观察现象,收集资料,创建方法,
分析推断。
统计推断 伴随着一定概率的推测。其特点是,由“部分”
推断“整体”。
总体 研究对象的全体 (整体 )X。
个体 每一个研究对象。实际上是对总体的一次观察。
?
有限总体
无限总体
1.基本概念
样本 由部分个体构成的集合。经常说,来自 (或取自 )
某总体的样本。
第 4.1节 数理统计学中的基本概念
返回
注 (1)样本具有 二重性,
在抽样前,它是随机变量,用 X1,X2,…,X n表示 ;
在抽样后,它是 n个样本值 (随机变量的取值 )x1,x2,…,x n.
(2)样本选择方式,有放回抽样,
特别,样本容量 <<总体数量时,无放回抽样可近似看作有放
回抽样,
简单随机样本 (s.r.s) 具有两个特点的样本, 代表性 (组成样
本的每个个体与总体同分布 ),独立性 (组成样本的个体间
相互独立 )。
样本容量 样本中所含个体的数目 n.
注意,样本是一组独立同总体分布的随机变量,
返回
例如 检验一批灯泡的质量,从中选择 100只,则
总体 这批灯泡 (有限总体 )
个体 这批灯泡中的每一只
样本 抽取的 100只灯泡 (简单随机样本 )
样本容量 100
样本值 x1,x2,…,x 100
显然,可以选择“样本的函数”, ?
?
?
n
1i
iXn
1X
作为灯泡质量的一个衡量指标,
返回
总体 选择个体 样本 观测样本 样本观察值 (数据 )
数据处理 样本有关结论
推断总体性质统计 量
为了集中简单随机样本所带来的总体信息,考虑样本的函
数,且不含任何未知参数,这样的, 不含 未知 参数的样本的
函数, 称为 统计量 。
统计量的分布成为 抽样分布,
统计的一般步骤
返回
(2) 样本均值
(4) 样本方差
(5) 样本标准差
(3) 样本 k阶中心矩
?
?
?
n
1i
iXn
1X
?
?
???
n
1i
2
i
2 )XX(
1n
1S
?
?
???
n
1i
2
i )XX(1n
1S
),2,1()(1
1
???? ?
?
iXXnB
n
i
k
ik
(1) 样本 k阶原点矩 ),2,1(1
1
??? ?
?
iXnA
n
i
k
ik
注 2
1
2
1
2)( XnXXX
n
i
i
n
i
i ??? ??
??
常用统计量
返回
未知,则 ( )不是统计量。
是来自总体例 4.1.1 设
nXXX,,,21 ? ),( 2??N
? ?的 s.r.s,其中 已知,
n21
22
2
2
1
n
1i
2
σ
μX
n
1
n
1i
2
in
1
n
1i
2
in
1
n
1i
in
1
...XXX[ 6 ] 2σX[ 5 ] X)([ 4 ]
)X(X[ 3 ])(X[ 2 ]X[ 1 ]
i ?
?
??
??
?
???
?
?
???
解, [4],[5]
返回
设总体 X~N(μ,σ2),X1,X2,…,X n为取自该总体 X的样本,
(1)四大分布及其分位数
① 标准正态分布及其上侧分位数
若 P(Z>zα)=α,
则称 zα为标准正态分布
的 上侧 α分位数,
?? ??? 1)( z
zα
α
X
φ(x)
其中
n
XZ
?
???定义 设 X~N(μ,σ2),则 ~N(0,1),对任意 0<α<1,
2.正态总体下的常用统计量及其分布
返回
即, n 个相互独立同标准正态分布的随机变量的平方
和 X的分布为自由度为 n 的 分布,2?
)(~ 2 nmYX ?? ?
性质
X1,X2,…X n独立,Xi~N(0,1),(i=1,2,…,n),则
)(~ 2
1
2 nXX n
i
i ??
?
?
定义
分布具有 可加性,
即 X,Y独立,X~ (m),Y~ (n),则
2?
2? 2?
分布及其上侧分位数2?②
返回
的密度曲线)(2 n?
X
f(x)
n=1
n=4
n=10
随着 n的增大,密度曲线逐渐趋于平缓,对称,
返回
分布的上侧分位数
2?
X
f(x)
?
)(2 n??
(1)若 P(X>λ)=α,则
)(2 n??? ?
(1)若 P(X<λ)=α,则
)(21 n??? ??
例 4.1.2 设 X~ (10),P(X>λ1)=0.025,P(X<λ2)=0.05,求 λ1,λ2.
2 ?
解 )10(2
0 2 5.01 ?? ? )10(2 95.02 ?? ?
定义 设,对于给定的 α(0<α<1),
若 P(X> )=α,则称 为自由度为 n的 分布
的 上侧 α分位数,
)n(~X 2?
2?)(2 n
?? )(2 n??
返回
例 4.1.3 设 是取自总体 N(0,4)的简单随
机样本
当 a=,b= 时,).2(~ 2?X
243221 )43()2( XXbXXaX ????
4321,,,XXXX
解 由题意得
??
?
?
?
?
?
)1,0(N~)X4X3(b
)1,0(N~)X2X(a
43
21
??
?
?
?
??
??
1)]X4X3(b[D
1)]X2X(a[D
43
21
?
a =1/20
b=1/100
返回
设随机变量,随机变量 Y,且
它们互相独立,则称随机变量 的分布为自由度
是 n 的 t 分布,记作
)1,0(~ NX )(~ 2 n?
nYXT /?
).(~ ntT
定义
t分布的密度曲线,
X
f(x)
特点 关于 y轴对称 ;随着自由度的逐渐增大,
密度曲线逐渐接近于标准正态密度曲线,
③ t分布及其上侧分位数
返回
服从 ( )分布,参数为 ( ).
例 4.1.4 设随机变量 X 和 Y 相互独立且都服从
正态分布,而 和
分别是来自总体 X 和 Y 的 s.r.s,则统计量
)9,0(N 91,,XX ? 91,,YY ?
2
9Y
2
1Y
9X1XU
??
??
?
?
?
t 9
解 ),1,0(N~X
9
1X 9
1i
i?
?
? )1,0(N~3
Y i
故 )9(~
9
1)
3(
~ 29
1
2
9
1
2 ???
??
??
i
i
i
i YYY 与 独立,YX ~
所以 )9(~
9/~
t
Y
XU ?
返回
t分布的上侧分位数
例 4.1.5 设 tα(n)为 t(n)的上侧 α分位数则 P(T< tα(n))=,
P(T<- tα(n))=,P(|T|> tα(n))=,
)n(t? X
f(x)
α
1-α
2αα
设 X~t(n),对于给定 α(0<α<1),若 P(t(n)> )=α,
则称 为 t(n)分布的 上侧 α分位数,
)(nt?
)(nt?
返回
定义 设随机变量 随机变量 且
它们相互独立,则称随机变量 的分布为自
由度是 的 F 分布。记作
),(~ 12 nX ? ),(~ 22 nY ?
2
1
/
/
nY
nXF ?
),( 21 nn
),(~ 21 nnFF
性质
),(~1),,(~)1( 1221 nnFXnnFX 则若
④ F分布及其性质
返回
F分布的密度曲线
F分布的上侧分位数
X
f(x)
?
)n,n(F 21?
上侧分位数的计算
(1)若 P(F>λ)=α,则 )n,n(F
21?? ?
(2)若 P(F>λ)=1-α,则 P(1/F<1/λ)=1-α,P(1/F>1/λ)=α,
)],(~[ 21 nnFF
),(1 12 nnF ?? ? 故 ),( 1),(
12
211 nnFnnF
?
? ??
设 X~,对于给定
α(0<α<1),若
P(X > )=α,
则称 为 F分布的
上侧 α分位数,
)n,n(F 21
),( 21 nnF?
),( 21 nnF?
返回
设 X~N(μ1,σ12),Y~ N(μ2,σ22),从中分别抽取容量为 n1,n2的样
本,且两组样本独立,样本均值和样本方差分别记为
.S,Y;S,X 2221
)
n
,(N~Y),
n
,(N~X
2
2
2
2
1
2
1
1
????
,)YX(E 21 ?? ???
2
2
2
1
2
1
nn
YDXD)YX(D ?? ?????
)
nn
,(N~YX
2
2
2
1
2
1
21
???? ???
)1,0(N~
nn
)()YX(
2
2
2
1
2
1
21
??
??
?
???
返回
)2nn(t~
n
1
n
1
S
)(YX
21
21
p
21 ??
?
??? ??
另外还可证明
当 时,记2221 ?? ?
2
)1()1(
21
2
22
2
112
??
????
nn
SnSnS
p
则可证明
)1,1(~
/
/
212
2
2
2
2
1
2
1 ?? nnF
S
S
?
?
返回
例 4.1.6 在总体 X~N(12,4)中抽取容量为 5的样本 X1,X2,…,X 5,
求下列概率,
).10),,( m i n ()3();15),,( m a x ()2(
);1|12(|)1(
5151 ??
??
XXPXXP
XP
??
(1)因为 ),
5
4,12(~ NX ),(所以 10~
5
4
12
N
X ?
)1|12(| ??XP
??
?
?
?
?
?
??
?
?
?
?
?
?
?
?
5
4
1
5
4
12X
P
=2Φ(1.118)-1
=0.7364
解
返回
例 4.1.6 在总体 X~N(12,4)中抽取容量为 5的样本 X1,X2,…,X 5,
求下列概率,
).10),,( m i n ()3();15),,( m a x ()2(
);1|12(|)1(
5151 ??
??
XXPXXP
XP
??
解
)15),,( m a x ()2( 51 ?XXP ? )15),,( m a x (1 51 ??? XXP ?
)15,,15(1 51 ???? XXP ?
)15()15(1 51 ???? XPXP ?
5)]15([1 ??? XP 5)]
2
1215([1 ????
5)]5.1([1 ??? =0.2923
返回
例 4.1.6 在总体 X~N(12,4)中抽取容量为 5的样本 X1,X2,…,X 5,
求下列概率,
).10),,( m i n ()3();15),,( m a x ()2(
);1|12(|)1(
5151 ??
??
XXPXXP
XP
??
解
)10),,( m in ()3( 51 ?XXP ?
)10()10( 51 ??? XPXP ?
5)]10([ ?? XP 5)]10(1[ ??? XP
5)]1(1[ ????
=0.4215
5)]1([??
返回
例 4.1.7 设 X1,X2,…,X 25是取自总体 X~N(3,100)的样本,
求概率,
)73.1 5 17.57,60( 2 ???? SXP
解, )73.1 5 17.57,60( 2 ???? SXP
)73.1517.57()60( 2 ????? SPXP
)4 1 5 2.36100 24848.13()5.12 35.1( 2 ??????? SPXP
)]4152.36()848.13([
]1)5.1(2[
C H I D I S TC H I D I S T
N O R M S D I S T
?
??
=0.7798
注 CHIDIST返回的是 分布区间概率值,2?
返回
Step1 在数据编辑窗口中,建立数据文件 ;
Step2 计算样本均值 —— 调用 AVERAGE函数:
Step3 计算样本方差 —— 调用 VAR函数 ;
Step4 计算样本标准差 —— 调用 STDEV函数,
(1) 利用 Excel计算样本均值、样本方差、样本标准差
3.Excel实现
返回
)1( ?? ?? N O R M S I NVz
),()(2 nC H I I N Vn ?? ? ?
)n,2(T I N V)n(t ?? ?
)n,n,(F I N V)n,n(F 2121 ?? ?
Step1 计算标准正态分布的上侧 α分位数
Step2 计算 的上侧 α分位数分布)(2 n?
Step3 计算 的上侧 α分位数分布)(nt
Step4 计算 的上侧 α分位数分布),( 21 nnF
(2) 利用 Excel计算四大分布的分位数
返回
1,频率柱形图 (frequency histogram)
Step1 对样本值 升序排列为
称 为样本极差 ;
nxxx,,,21 ? ??? ??? nxxx ?21
?? ?? 1xxR n
Step2 选取 a(略小于 )和 b(略大于 ),分区间 (a,b]为 m等份,
称每一等份的长度为组距,
*1x *nx
bcacmicc mii ??? ?? 111,,,,2,1],,( ?
Step3 统计样本值落入各等份的频数,并求出频率 ;
Step4 以“组序号”为横轴,以频率为纵轴画柱形图,即得
频率柱形图, 画平滑直线图即得到总体 X的密度近似曲线,
第 4.2节 分布密度的近似求法
返回
2.Excel实现
Step1 样本值输入 Excel数据编辑窗口,并升序排列 ;
Step2 确定 a,b,m,h,并将 a输入单元格 B1,选定单元格 B1:Bm,
依次单击“编辑”、“填充”、“序列”指令,在步长框
输入 h,单击“确定” ;
Step3 选定单元格 C1:Cm+1,输入频数分布公式,计算得
C1:Cm+1结果 ;;nCD ii ?Step4 计算 D1:Dm+1,计算公式为
Step5 选定 B1:Dm+1,按“图形向导”工具,逐步完成 ;
Step6 按“图形向导”工具,选“自定义类型”、“平滑直
线图”、
,下一步,,, 系列,,通过删除或填加直到满意
后
返回
?
X~P(λ),X~E(λ),X~N(μ,σ2)
用所获得的样本值去估计参数取值称为 参数估计,
参
数
估
计
?
点估计
区间估计
用某一数值作为
参数的近似值
?
在要求的精度范围内
指出参数所在的区间
数理统计的主要任务之一是依据样本推断总体,推
断的基本内容包括两个方面,一是依据样本寻找总
体未知参数的近似值和近似范围 ;二是依据样本对
总体未知参数的某种假设作出真伪判断,本章先介
绍求近似值和近似范围的方法,
1,参数估计的基本思想
第 4.3节 期望与方差的点估计
返回
定义 设总体 X分布函数为 F(x;θ 1,θ 2,… θ m),θ i为未知
参数 (i=1,2,…,m),X1,X2,…,Xn为来自该总体的 s.r.s,若以
统计量 =θ i(x1,x2,…,xn)作为 θ i的近似值,则称 为 θ i
的 估计值 (抽样后 ),也称 为 θ i的 估计量 (抽样前 ).
i?? i??
i??
即,
选择统计量
估计量 带入样本值 估计值
X分布为 F(x;θ )[θ 待估 ]
2,点估计的评价标准
返回
容易明白,对同一个未知参数,采用不同的
方法找到的点估计可能不同,那么,自然要问,究
竟是用哪一个更“好”些呢?这里介绍三个评
价标准,
标准一, 无偏性
设 为 θ的一个点估计,若
则称 为 θ的一个 无偏估计,
??
??
,)?(E ?? ?
注意 无偏估计若存在,则可能不唯一,
标准二, 有效性
设 和 是 的两个无偏估计,若
称 比 更 有效
?2?? )?()?( 21 ?? DD ?
1??
1??
2??
返回
例 4.3.1 设 X1,X2,X3为来自总体 X的简单随机样
本,EX=μ,DX=σ2,验证下列 μ的估计量哪个更有效,
32133212211 X3
1X
3
2X
2
1?,X
3
1X
3
1X
3
1?,X
2
1X
2
1? ???????? ???
解
]X21X21[E?E 211 ???
?? 65EX65EX31EX32EX21?E 3213 ?????
,EXEX31EX31EX31?E 3212 ?? ?????
2EX2
1EX
2
1 ?? =EX=μ
]X21X21[D?D 211 ??? 21 DX41DX41 ?? =DX/2=σ2/2
同理
,3/DX91DX91DX91?D 23212 ?? ????
所以
21,??
?? 为无偏估计量,,DD
21 ??
?? ?
2?
? 更有效,
返回
s.r.s,试证, 为
的无偏估计,且 比 更有效,
)nk(,X?,X?
k
1i
ik
1
21 ??? ?
?
?? ??)( XE
1?? 2??
例 4.3.2 设总体 X的方差存在 是来自 X的
nXX,,1 ?
证明, ?
?
??
n
1i
i1 )Xn
1(EXEE ??
inE Xn
1? ??
?
?
?
k
1i
i2 )Xk
1(EE ??
ik E Xk
1? ??
?
?
??
n
1i
i1 )Xn
1(DXDD ??
inD Xn 2
1?
n
2?
?
?
?
?
k
1i
i2 )Xk
1(DD ??
ik D Xk 2
1?
k
2?
?,21 DD ?? ?? ?
样本容量越大,样本均值估计值越精确,
返回
例 4.3.3 验证, 是总体 X方差的
一个无偏估计 ; 不是方差的无偏估计,
?
?
???
n
1i
2
i
2 )XX(
1n
1S
?
?
??
n
i
i XXnB
1
2
2 )(
1
解
)]X(nE)X(E[1n 1ES 2
n
1i
2
i
2 ?
?? ??
?
?
?
n
1i
2
i )XX( ??
???
n
1i
2
i
2
i )XXX2X(
2
n
1i
i
n
1i
2
i XnXX2X ??? ??
??
2
n
1i
2
i Xn?? ?
?
)X(E1n nEX1n n 22 ????
])XE(XD)EX(DX[1n n 22 ?????
]XDDX[1n n ??? ]nDXDX[1n n ??? =DX
所以,S2为 DX的无偏估计量,
ES2=DX,,1 2
2 Sn
nB ??
故
2
2
1 ES
n
nEB ??
DXn 1n ??
所以,不是 DX的无偏估计量,2B
返回
0
)],(ln[
1
)()?(
2
0 ?
?
?
??
?
?
??
XfnE
DD
其中,称为方差的下界, )(0 ?D
)()?( 0 ?? DD ?当 时,为 的有效估计量,?? ?
实际应用时,常用 Rao-Cramer(罗 -克拉美 )不等式来证
明无偏估计量是有效估计量,
即, 若 是 的无偏估计量,则?? ?
返回
例 4.3.4 设总体 X~P(λ),X1,X2,…,X n为取自该总体的样本,
试证, 为 λ的有效估计量,X???
为 λ的无偏估计量,X???证明 由 知,?? ?? )()?( XEE
又因为,
!),(,)()
?( ????? ???? e
xxfnXDD
x
)!l n (ln)],(l n [ xxxf ???? ???
所以
??????
1)(1])(1[)],(l n [[
2
2
2
2 ????
?
? XDXEXfE
由 Rao-Cramer不等式得
.)()?(
)],(ln[
1)(
2
0 nXDD
XfnE
D ??
?
?
? ???
?
??
X??? 为 λ的有效估计量,
返回
标准三, 相合性 (一致性 )
例 4.3.5设 X1,X2,…,X n为取自总体 X的样本,E(X)=μ,D(X)=σ2,
则 是总体均值 E(X)= μ的相合估计量,X
证明 利用切比雪夫不等式,
n
XDXP
2
2
2
)()||(
?
?
??? ????
所以,0)||(lim ???
?? ??XPn
即 是总体均值 E(X)= μ的相合估计量,X
设统计量 是未知参数 的点估计量,样本容量为 n,
若对任意
则称 为 的 相合估计,又称 一致估计,
?? ?
? ? 1?lim ????? ???pn,0??
?? ?
? ? )0?lim( ????? ???pn或
返回
在实际中,常常以样本均值作为总体均值的
点估计,以样本方差作为总体方差的点估计,
期望的点估计
选择估计量 ?
?
?
n
1i
iXn
1X
?
(1)无偏性
(2)样本容量越大,估计值 越有效
方差的点估计
选择估计量 ?
?
???
n
1i
2
i
2 )XX(
1n
1S (无偏估计量 )
注意 ?
?
??
n
i
i XXnB
1
2
2 )(
1 (非无偏估计量 )
3.数学期望和方差的点估计
返回
例 4.3.6 设总体 X~U(a,b),X1,X2,…,X n为取自该总体的样本,
求 a,b的估计量,
解 因为
12
)(,
2
2ab
DXbaEX ????
所以令 2,SDXXEX ??
得方程组
?
?
?
??
?
?
?
?
?
?
2
2
12
)(
2
S
ab
X
ba
解得 SXbSXa 3?,3? ????
返回
点估计有使用方便、直观等优点,但他并没有提
供关于估计精度的任何信息,为此提出了未知参
数的区间估计法,
例 对明年小麦的亩产量作出估计为,
即 若设 X表示明年小麦亩产量,则估计结果为
P(800≤X≤1000)=80%
明年小麦亩产量八成为 800-1000斤,
区间估计
第 4.4节 期望、方差的区间估计及 Excel实现
返回
设总体分布中含有未知参数,根据来自该总体的 s.r.s,
如果能够找到两个统计量,使得随机区间
包含 达到一定的把握,那么,便称该随机区间为未知参
数的 区间估计,即
当 成立时,
称概率 为 置信度 或 置信水平 或 置信系数 ;
称区间 是 的置信度为 的 置信区间 ;
分别称为 置信下限 和 置信上限,
?
21 ?,? ?? )?,?( 21 ??
?
,1}??{ 21 ???? ????P )10( ?? ?
??1
)?,?( 21 ?? ? ??1
21 ?,? ??
区间估计的定义
返回
① 选择包含 μ的分布已知函数,
② 构造 Z的 一个 1-α区间,
?
?
?
?? ???
??? 1)
/
(
22
z
n
XzP
n
XZ
/?
??? )1,0(N~
③ μ的 1-α置信区间, ),(
22 n
zX
n
zX ?? ?? ??
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
(1) σ2已知,求 μ的置信度为 1-α置信区间
]
2
1)([
2
?
? ??? z
???? ?? ?????? 1)(
22 n
zXnzXP
即
1.单正态总体数学期望的区间估计
返回
α/2α/2
X
φ(x)
1-α
zα/2
P(|Z|<λ)=1-α
置信区间不是唯一的,对于同一个置信度,可以
有不同的置信区间,置信度相同时,当然置信区间越短越
好,一般来说,置信区间取成 对称区间或概率对称区间,
注意
1-α
返回
注意 以上 Z具有三个特点,
(1) 样本的函数 ;
(2) 含且仅含待估未知参数 μ;
(3) 其分布与待估未知参数 μ无关,
可称 Z为 枢轴变量,
返回
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
(2)σ2未知,求 μ的置信度为 1-α置信区间
① 从点估计着手构造枢轴变量,
② 构造 T的 一个 1-α区间,
③ μ的 1-α置信区间,
nS
XT
/
??? )1n(t~ ?
)1n(t 2/ ?? X
f(x)
α/2α/2 ?? ???? 1))1(|(| 2/ ntTP
?
?
?
?
????
????
1}
n
S
)1n(tX
n
S
)1n(tX{P
2/
2/
)nS)1n(tX,nS)1n(tX( 2/2/ ???? ??
1-α
返回
Excel求置信区间使用 CONFIDENCE函数,其语法格式如下,
CONFIDENCE(α,σ,n) =
置信下限为, CONFIDENCE(α,σ,n)
置信上限为, CONFIDENCE(α,σ,n)
2
?
? z
n
?X
?X
例 4.4.1 设正态总体的方差为 1,根据取自该总体的容
量为 100的样本计算得到样本均值为 5,求总体均值的
置信度为 0.95的置信区间,
解 已知 σ2=1,α=0.05,求 μ的 1-α置信区间:
返回
例 4.4.2 某种零件的重量服从正态分布, 现从中抽取
容量为 16的样本,其观测到的重量 (单位, 千克 )分别
为 4.8,4.7,5.0,5.2,4.7,4.9,5.0,5.0,4.6,4.7,5.0,5.1,
4.7,4.5,4.9,4.9,需要估计零件平均重量,求平均重量
的区间估计,置信系数是 0.95.
解 未知 σ2,α=0.05,求 μ的 1-α置信区间,
应用 t分布,需要计算 SX和
返回
设总体 X~N(μ,σ2),X1,X2,…,X n 为一组样本,
(1) 总体均值 已知?
① 构造枢轴变量 )(~? 2
2
2
nnQ ?
?
??
其中,)(? 2
1
212 的无偏估计为 ??? ?
?
??
n
i
in X
② 取 1-α置信区间为 ???
?? ????? 1))()((
22
1 22 nQnP
③ 解不等式得到 σ2的 1-α置信区间,
?
?
?
?
?
?
?
?
?
?
?
?
??
?
??
??
)n(
)X(
,
)n(
)X(
2
1
n
1i
2
i
2
n
1i
2
i
22
?? ?
?
?
?
2.单正态总体方差的区间估计
返回
X
f(x)
① 构造枢轴变量,
② 构造 Q的 一个 1-α区间,
③ 解不等式得到 σ2的 1-α置信区间,
2
2)1(
?
SnQ ?? )1n(~ 2 ??
??? ???? 1}{ 21 QP
α/2α/2
1-α
λ1 λ2
1-α/2
)1(2
2
?n??)1(2
21
?
?
n??
??
?
?
?
?
????
?
??
?
1)}1(
)1(
)1({
2
2
2
2
2
2
1
n
Sn
nP
)
)1(
)1(
,
)1(
)1(
( 2
2
1
2
2
2
2
?
?
?
?
?
n
Sn
n
Sn
?? ??
(2) 总体均值 未知?
返回
例 4.4.3 投资的回收利用率常常用来衡量投资的风险,
随机地调查了 26个年回收利润率 (%),标准差 S(%),设回
收利润率为正态分布,求它的方差的区间估计 (置信系数
为 0.95).
解 总体均值 未知,α=0.05,方差的区间估计,?
返回
(1) σ12,σ22已知,μ1- μ2的 1-α置信区间
)1,0(~
//
)()(
2
2
21
2
1
21 N
nn
YXZ
??
??
?
????
① 相对 μ1- μ2,构造枢轴变量,
② 构造 Z的 一个 1-α区间,
③ 概率恒等变形,得到 μ1- μ2的 1-α置信区间,
??? ????? 1)(
22
zZzP
))(,)((
2
2
2
1
2
1
22
2
2
1
2
1
2 nn
zYX
nn
zYX ???? ?? ??????
]21)([ ?? ??? z
设 X~N(μ1,σ12),Y~ N(μ2,σ22),从中分别抽取容量为 n1,n2的样
本,且两组样本独立,样本均值和样本方差分别记为
.S,Y;S,X 2221
3.两个正态总体均值差的区间估计
返回
(2) σ12=σ22=σ2,σ2未知,μ1- μ2的 1-α置信区间
)2(~
/1/1
)()(
21
21
21 ??
?
???? nnt
nnS
YXT
P
??
① 对于 μ1- μ2,构造枢轴变量,
② 构造 T的 一个 1-α区间,
③ 变形得到 μ1- μ2的 1-α置信区间,
)
11
)2()(
,
11
)2()((
21
21
2
21
21
2
nn
SnntYX
nn
SnntYX
P
P
?????
?????
?
?
?? ????? 1))2(|(| 21
2
nntTP
返回
(3) σ12,σ22均未知,n1=n2=n,μ1-μ2的 1-α置信区间
令 则
iii YXZ ?? ),(~ 222121 ???? ??NZ i
将 视为取自总体 nZZZ,,,21 ? ),(~ 222121 ???? ??NZ
的样本,由单正态总体方差未知时总体均值的区间估计
方法得置信区间为
))1n(t
n
SZ),1n(t
n
SZ(
22
zz ????
??
其中 ?
?
? ????
n
i
inz ZZSYXZ
1
2
1
12 )(,
返回
(4) σ12,σ22均未知,n1,n2均很大 (一般均大于 50),μ1-μ2的 1-α
近似置信区间
))(,)((
2
2
2
1
2
1
22
2
2
1
2
1
2 n
S
n
S
zYX
n
S
n
S
zYX ?????? ??
返回
例 4.4.4 某工厂利用两条自动化流水线罐装番茄酱,
分别从两条流水线上抽取随机样本,
和,计算出 (克 ),(克 ),
,假设这两条流水线上罐装番茄酱
的重量都服从正态分布,其总体均值分别为,
且有相同的总体方差, 试求总体均值差 的
区间估计,置信系数为 0.95,
1221,,,XXX ?
1721,,,YYY ? 6.10?X 5.9?Y
7.4,4.2 2221 ?? SS
21,??
21 ?? ?
解 σ12=σ22=σ2,σ2未知,μ1- μ2的 0.95置信区间,
返回
(1)对于 σ12/σ22,构造枢轴变量,
(2)构造 F的 一个 1-α区间,
(3)解不等式得 σ12/σ22 的 1-α置信区间,
)1,1(~
/
/
212
2
2
2
2
1
2
1 ??? nnF
S
SF
?
?
)1n,1n(F 21
21
??? ?
X
f(x)
α/ α/2
)1n,1n(F 21
2
???
λ1 λ2
1-α
P(λ1<F< λ2)=1-α
)1n,1n(F
1
122/ ???
)
S
S
)1n,1n(F,
S
S
)1n,1n(F
1
( 2
2
2
1
12
2
2
2
2
1
21
2
??
?? ??
4.两个正态总体方差比 σ12/σ22的 1-α置信区间
返回
例 4.4.5 为了比较用两种不同方法生产的某种产品的寿命
而进行一项试验, 试验中抽选了由方法一生产的 16个产品
组成一随机样本,其方差为 1200小时 ; 又抽选了由方法二
生产的 21个产品组成另一随机样本,得出的方差为 800
小时, 试以 95%的可靠性估计两总体方差之比的置信区间,
解 设方法一生产的产品的寿命为
方法二生产的产品的寿命为
要求 的置信度为 95%的置信区间,
Y~ N(μ2,σ22),
X~N(μ1,σ12),
σ12/σ22
返回
由上述方法求得的总体均值差或总体方差比的置信区间,
我们在实际中通常有下列结论,
(1) 若 的置信区间的下限大于零,则可认为 ;
若 的置信区间的上限小于零,则可认为 ;
若 的置信区间包含零,则可认为
21 ?? ?
21 ?? ?
21 ?? ?
21 ?? ?
.21 ?? ?
21 ?? ?
(2) 若 的置信区间的下限大于 1,则可认为
若 的置信区间的上限小于 1,则可认为 ;
若 的置信区间包含 1,则可认为σ12/σ22
σ12/σ22
σ12/σ22
σ12>σ22
σ12<σ22
σ12=σ22.
返回
1.矩估计法
将总体的各阶原点矩用相应阶的样本原点矩替代,布
列方程或方程组,所得到的解,作为总体未知参数的点估计
的方法,
例 4.5.1 设总体,为取自该总体的样本,
求未知参数 θ的矩估计量,
),0(~ ?UX nXXX,,,21 ?
解 XEX ??
2
?
X2??所以
参数 θ的矩估计量为 X2? ??
第 4.5节 点估计法
返回
例 4.5.2 设总体的概率密度函数为
为取自该总体的样本,
??
?
?
? ???
?
其它,0
0,
)(6
)( 3 ??
?
x
xx
xf
nXXX,,,21 ?
求 (1)未知参数 的矩估计量 ;(2)?? ).?(?D?
解 (1) XEX ??
2
? X2??所以
参数 θ的矩估计量为 X2? ??
XDXDD 4)2(?)2( ??? ])([44 22 EXEX
nn
DX ????
nn 5])2(20
6[4 222 ??? ???
返回
(1) 似然函数 (样本的联合密度函数 )
设总体 X为连续型,X~ f(x;θ1,θ2,…θ m),θi为待估
参数 (i=1,2,…,m),X 1,X2,…,X n为来自该总体的 s.r.s,则
Xi~ f(xi;θ1,θ2,…θ m),(i=1,2,…,m)
( X1,X2,…,X n) 的联合密度函数为
?
?
?
n
i
mimn xfxxxL
1
212121 ),...,,;(),...,,;,...,,( ??????
(似然函数 )
例 X~E(λ),即
??
?
?
?? ?
0x0
0xe);x(f~X x???则
?
?
?
?
?? ?
0x0
0xe);x(f~X
i
i
x
ii
i??
?
?
?
?
n
1i
in21 ),x(f);x,.,.,x,x(L ???
?
?
?
?
???
? ??
?
其它,0
0,.,.,0,0,21
1
n
n
i
x xxxe i??
2 最大似然估计法
返回
设总体 X为 离散型,P(X=x)=P(x;θ1,θ2,…θ m),θi为待
估参数 (i=1,2,…,m),X 1,X2,…,X n为来自该总体的 s.r.s,则
P(Xi=xi)=P(xi;θ1,θ2,…θ m),(i=1,2,…,m)
( X1,X2,…,X n) 的联合概率函数为
?
?
?
n
1i
m21im21n21 ),...,,;x(P),...,,;x,...,x,x(L ??????
(似然函数 )
例 X~P(λ),即 ?? ??? e
kkXP
k
!)(
?? ??? e
!x)xX(P
x
?
?
?
n
1i
in21 ),x(P);x,.,.,x,x(L ??
??? ?? e
!x
);x(P
i
x
i
i
?
?
??
n
1i i
x
e!x
i
??
返回
(2) 基本思想,
如:甲,乙两人比较射击技术,分别射击目标一次,甲中
而乙未中,则可以认为,甲射击技术优于乙射击技术,
又如:事件 A发生的概率为 0.1或 0.9,观察一次,事件 A发
生了,则可以认为,事件 A发生的概率为 0.9.
实际问题 (医生看病、公安人员破案、技术人员进行质
量检验等 )尽管千差万别,但他们具有一个共同的规律,即
在获得了观察资料之后,给参数选取一个数值,使得前面的
观察结果出现的可能性最大,
最大似然估计就是通过样本值 来求得总体的
分布参数,使得 取值为 的概率最大,
nXX,,1 ?
nxx,,1 ?
nxx,,1 ?
返回
样本观察值出现可能性的大小跟似然函数在该样本值处的
函数值有关,L越大,样本观察值越可能出现,所以,
若似然函数 在
取到最大值,则称 分别为 的
最大似然估计,
),...,,;x,...,x,x(L m21n21 ??? m21,...,,??? ???
m21,...,,???
???
m21,...,,???
最大似然估计,
返回
(3) 方法与步骤,
设总体的分布密度 (或概率密度 )
其中 是待估参数,
),,;x(f m1 ?? ?
m??,,1 ?
① 写出似然函数 (即样本的联合密度函数 )
?
?
??
n
1i
m1im1n1 ),,;x(f),,;x,,x(LL ???? ???
② 写出对数似然函数(对似然函数取对数)
?
?
?
n
i
mixfL
1
1 ),,;(lnln ?? ?
③ 写出似然方程
mi
i
L ?,2,1,0ln ??
?
?
?
④ 求解似然方程并写出估计量 mi
i,,3,2,1,? ???
(只有一个待估参数时求 )?d Llnd
返回
例 4.5.3 求参数 为 p的 0-1分布的最大似然估计,
解 P(X=0)=1-p
P(X=1)=p P(X=m)=p
m(1-p)1-m(m=0,1)
?
P(X=x)=px(1-p)1-x ?
?
??
n
1i
x1x ii )p1(p
)p1ln ()xn(pln)x(
n
1i
i
n
1i
i ??? ??
??
?
?
?
? ??
?
n
1i
i
n
1i
i xnx
)p1(p
0
1
11 ?
?
?
?
??
??
p
xn
p
x
n
i
i
n
i
i
0)()1(
11
???? ??
??
n
i
i
n
i
i xnpxp
?)p;x,...,x,x(L n21
?Lln
?dp Llnd
解得 ?
?
?
n
i
ixnp
1
1 最大似然估计为 XX
n
1p n
1i
i ?? ?
?
?
注意, 为 p的无偏估计量,X
返回
例 4.5.4 X~N(μ,σ2),求参数 μ,σ2的最大似然估计,
解
2
2
2
)x(
2 e
2
1),,x(f ??
??
??
??
? 2
2
2
)x(
2
e
2
1 ??
??
??
?
?
?
??n
1i
2
)x(
2
2
2
i
e
2
1 ? ?
??
?),;x,...,x,x(L 2n21 ?? ?? ?
??
n
1i
2
i2 )x(2
1
n
2
e)
2
1( ??
??
?Lln ? ??
?
n
1i
2
i22 )x(2
1)
2
1ln (n ?
??? ? ???? ?
n
1i
2
i2
2 )x(
2
12ln
2
n ?
???
0)(1
1
2 ???
?
n
i
ix ??
0)x(2 12 n
n
1i
2
i42 ???? ?
?
????
??? ?Lln
??? 2Lln? ?
XXn1
n
1i
i ?? ?
?
??
??
??
????
n
i
i
n
i
i XXnXn
1
2
1
22 )(1)(1 ???
注意, 不是无偏估计,2??
返回
例 4.5.5 设 X服从 [0,θ]区间上的均匀分布,参数
θ>0,求 θ的最大似然估计,
解 由题意得,
??
?
?
? ??
?
其它0
0
1
);(~
?
??
x
xfX
?);,.,,,,( 21 ?nxxxL
??
?
?
? ??
其它0
,...,,0
1
21 ?? nn xxx
??ddL 01 ?? ?nn
?
无解,基本方法失效,
考虑 L的取值,要使 L取值最大,θ应最小,??? nxxx,.,,,,0 21
取 ),.,,,,m a x ( 21 nxxx?? 此时,L取值最大,
所以,最大似然估计为 ),.,,,,m a x (? 21 nXXX??
应用最大似然估计基本思想, L越大,样本观察值越可能出现,
返回
例 4.5.6 设总体 X~
?
?
? ?????
?
其他,0
1,10,)1()( ?? ? xxxf
解 由题意得,
?);x,...,x,x(L n21 ?
当 时,)n,...,2,1i(1x0
i ???
?Lln ]x[)1ln (
n
1i
i
n ?
?
? ?? ?
?
???
n
1i
ixln)1ln (n ??
??d Llnd 0xln
1
n n
1i
i ??? ?
??
所求最大似然估计为 ?
?
??? n
1i
iXln
n1??
?
?
?
?
?
?????
?
其它0
n,.,.,2,1i,1x0x)1( i
n
1i
i
??
?
其中 是未知参数, 是来自总体的一个容量为
n 的 s.r.s,求 的最大似然估计
? nXX,,1 ?
).(? ?1 ?? ??
n
eE及
?
?
??? n
1i
iXln
n1??
所以 n
n
n
EXXXXEeE )()()( 21?1 ???? ??
另一方面
2
1)1(1
0
1
?
???? ? ?
?
?? ? dxxEX
故 nneE )
2
1()( ?1
?
????
?
??