主讲教师:刘泽仁
制作,刘泽仁
统计推断包括参数估计和假设
检验,即通过样本统计量来估计和
检验总体的参数。统计推断的目的
在于认识未知的总体参数及其分布
特征。
第七章
抽
样
推
断
§ 1,点 估 计
一、点估计
点估计是通过计算一个统计量 (样本元素的函
数 ),将它作为未知参数的估计。
X1,…,Xn
未知参数 样本 统计量
),,( 1 nxxd ????观察值
对一次具体的抽样
?
?
参数估计有点估计和区间估计。
= d (X1,…,Xn) ? ? ?
二、估计量
1,估计量是用来估计参数的统计量
用来估计参数 ? 的估计量 记为
?
?
2,点估计量的构造方法常用的有,
矩法和极大似然法 (略 )
例,从平均值为 ?,标准差为 ?的总体中抽出样本
X1,…,Xn
XnXX =即的估计量用作若把样本平均数 ??? ??,1 i?
?? ?????? nnXEnnXEXE 1)(1)()( ii?
的无偏估计量是 ?X?
3,点估计量优劣的判别标准
衡量一个估计量好坏的标准通常有以下 3个,
(1) 无偏性,
如果一个估计量的数学期望值等于被估计
参数,则这个估计量称为被估参数的无偏估计
量。也就是说,
的无偏估计量。为则若 ???? ?? ?,)(E
222
2
i2,,
1
)(2 s
n
XXs ?
?
??? ??? 即的估计量用作若把?
)1 )(()()(
2
22
?
?????
n
XXEsEE i?由于
})]()[({11 2?? ?????? XXEn i
})]())((2])[({11 2i2i ???? ??????????? XXXXEn
]})([)](2[])([{11 2i2i ??? ????????? XnEXEXEn
]})[(])[(2{11 222 ??? ??????? XnEXnEn
]})[()])([(2)][({11 2i2i ???? ?????????? XnEXXEXEn
})({11 22 ?? ???? XnEnn
)(11
2
2
nnnn
?? ?
??
)11(11 2 nnn ???? ?
22 1
1 ?? ?
??
?? n
n
n
n
故 s2 是 ?? 的无偏估计量。
的估计量作为若用 2
2
2 )(3 ??
n
XX i ?????
]})([1{])([ 2
2
XXnEn XXE ii ??????
]21[ 22 XnnXXnXnE ii ?????
]}2[1{ 22 XXXXnE ii ??????
]21[ 222 XXXnE i ????
)1[ 22 XXnE i ???
)()(1 22 XEXEn i ???
)())(()( 22 XDXEXE ???
nnn
2
222 )(1 ???? ????
)()(1
2
222
nn
???? ?????
n
2
2 ?? ?? 21 ?
n
n ?? 2??
的无偏估计量。不是故 2
2
i )( ?
n
XX ??
) ] }())([()]())([(1[ 22 XDXEXDXEn ii ?????
(2) 一致性
若随着样本容量 n的增大,估计量的值越来越接
近于被估计的参数,则该估计量称为一致估计量。
,1)|(| ????? ? ???Pn 时,换句话说,若当
的一致估计量。为则 ???
的一致估计量就是例如,?? X??
n3?n2?n1
???? Xn 时,
X
??)( XE
n1
n2
n3
(3) 有效性
有效。比,则称换句话说,若
??
?
?
? 21
2
1 1
)(
)(
??
?
?
D
D
设 是参数 ? 的两个无偏估计量,
若 的方差比 的方差小,则称 比 有效。
1?? 2??
1?? 2?? 2??1??
??? ?? ?? )()( 21 EE
?
2?
?
??
?
1?
?
?
1?
? < ?
2?
?
4,几种总体参数的点估计量
?
?
?
??
n
iXnX
1i
1)1( ?? 的点估计量:总体平均数
估计量。的无偏、一致、有效的是可以证明 ?X
?
?
?
????
n
XXns
1i
2
i )(1
1)2( ?? 的点估计量:总体标准差
pPP ??的点估计量:总体成数)3(
例,某公司考虑购买一批减价商品,这批商品
共 2000件,其中有些是次品,但不知次品量或
次品率是多少。公司得知每件次品的修复成本
为 0.25元,并认为若总的修复成本低于 50元,购
买这批商品是有利可图的。在决定前,公司抽
取 100件商品进行调查,发现 12件次品。问你估
计这批商品的次品率为多少?你认为公司是否
可购买这一批商品?
解,设样本次品率为 p,则总体中的次品量为 NP,即
%121 0 012 ????
?
n
kpP
)( 2 4 0%122 0 0 0 件=???PN
计算结果表明:该批商品估计的次品率为
12%,次品量为 240件, 所以该品商品的修复成
本为,240?0.25=60(元 )。 由此可见, 公司不能购
买这批商品 。
§ 2,区 间 估 计
一、置信区间与置信度
???? ???? ?? 1)( ULP若 (0 ? ? ? ?)
则称 1??为置信度 (或置信水平 );
为置信区间。),( ?? UL ??
称为置信下限?L?
称为置信上限?U?
间:置信区间是双侧置信区同时具有下限和上限的
),( ????L?
??? ???? ?? 1)( LP ??? ???? ?? 1)(
UP
)( ?? UL ??,
只有一个下限值或只有一个限值的置信区间是单
侧置信区间,
),( ???? U?或
?
L?
?
U?
??
1??
置信度与置信区间的关系,
置信度越大,则置信区间越长,反之亦然。
若要同时使置信度尽可能的大和置信区间尽可能
的小,只有提高样本容量 n。
n'
n
n'>n
二、正态总体参数的区间估计
1,参数 ? 的置信区间
(1) ? 已知时,? 的置信区间
给定置信度 1??,要求 ??
UL ??,
???? ???? ?? 1)( ULP使得 ?
)1,0(~ NXZ
x
X
?
???由中心极限定理可知,
?
?? ? ????? 1)/( 21 znXzP只要使得
? 式的等式左边的括号内的不等式
21 / zn
Xz ???
?
?
XnzXnz ????? ??? 21
nzXnzX
???
12 ????
nzXnz
???
21 ???
?
?
?
? 式转化为
???? ?????? 1)( 12 nzXnzXP
由于 ? 等于 ?,所以 ?等于 ?
,故 nzXL ?? 2??
?
式中的 z1,z2是根据 1?? 的大小确定的。
?
nzXU
??
1??
?
见下图,
1??
z'2 z1 z z'1 z2
1??
? z?/2 z z?/2
2?2
?
z1= ? z?/2, z2= z?/2
因而,?的双侧置信区间的上、下限公式为,
,2/ nzXU ?? ???? nzXL ?? ? 2/??
?
同理可得 ?的单侧置信区间的上限公式或下限公式,
1??
z z
?
?
,
n
zXU ?? ???
?
?
),( ???? U?置信区间为
或另一种情形,
,
n
zXL ?? ???
?
?
),( ??? ?L?置信区间为
1??
z ?z
?
?
(2) ? 未知时,? 的置信区间 (小样本 )
)1(~
/
?? nt
ns
X ?
????? ?????
??
1)(1 ULP,使得给定置信度
??
UL ?? 和要求
)( ?? UL ???,的双侧置信区间:
,)1(2/ nsntXL ???? ?? nsntXU )1(2/ ???? ??
1?? 2?2?
)1(2/ ?? nt? )1(2/ ?nt?
同 (1)类似地,可得
的单侧置信区间:?
n
sntX
L )1( ???
?
?
??
n
sntX
U )1( ???
?
?
??
,,)( ????L?
,),( ???? U?
或
例,设在某证券交易所上市的工业类股票的日收
盘价格是下态分布随机变量,随机抽取其中 20种
股票收盘价得知样本的平均收盘价为 30元,方差
为 6.32。求该市场工业类股票的平均收盘价格的
置信区间 (?=2%)。
解,已知 n= 20,s2=6.32,
%12,30 ?? ?X
? 未知。
查表得 )1(
2 ?nt? 539.2)19(01.0 ?? t
n
sntXU
L ????
?
)1(μ 2?
20
32.6539.230 ???
=(28.57,31.43)
根据以上计算结果,我们可以说,按此区间
估计方法,将有 98%这样的置信区间包括工业
类的股票平均收盘平均收盘价格。或者说,我
们有 98%的把握说工业类的股票收盘价格界于
28.57元至 31.43元之间。
2,参数 ?2 的置信区间
)1(~)1( 22
2
?? nsn ??
????? ????? ?? 1)(1 222 ULP,使得给定置信度
?? 22
UL ?? 和要求
???? ????? 1))1(( 222
2
2
1
snP
2
22
2
2
1
)1( ?
?? ?
?? sn
2
1
2
2
2
2
2 )1()1(
???
snsn ????
2
2
2
22
2
1
)1(
1
)1( snsn ????
?
?
??
?
???? ?????? 1))1()1(( 2
1
2
2
2
2
2 snsn
P故
分布表可得:的大小查由其中 22221 1,???? ?
)1(2 2/121 ?? ? n???
)1(2 2/22 ?? n???
2
? 2?
1??
2?
)( 2?f
)1(2 2/ ?n??)1(2 2/1 ?? n??
)( 222 ?? UL ???,的双侧置信区间为:
,)1( )1( 2
2/
2
2
?
???
n
sn
L
??
? )1(
)1(
2
2
1
2
2
?
??
?
?
n
sn
U
??
?
的单侧置信区间为:2?
)( 2 ??? ?,L?
)1(
)1(
2
2
2
?
??? ?
n
sn
L
??
?
),( 2? ??? U? )1( )1( 2
1
2
2
?
??
?
?
?
n
sn
U
??
?
或
三、两个总体平均数之差 ?1- ?2的区间估计
的置信区间-已知时,,212221.1 ????
)1,0(~
)()(
2
2
2
1
2
1
2121 N
nn
XX
??
??
?
???
对于给定的 1??,使得,
要求 LCL,UCL
P(LCL<?1??2 < UCL)=1??
同理可得,
?1??2的双侧置信区间 (LCL,UCL)
2
2
2
1
2
1
2/21 )( nnzXXL C L
??
? ?????
2
2
2
1
2
1
2/21 )( nnzXXU C L
??
? ?????
?1??2的单侧置信区间
2
2
2
1
2
1
21 )( nnzXXL C L
??
? ????
?
2
2
2
1
2
1
21 )( nnzXXU C L
??
? ?????
?
),( ???L C L
),( ??? U C L
或
的置信区间未知时,212221,2 ???? ??
)2(~
11
2
)1()1(
)()(
21
2121
2
22
2
11
2121 ??
??
??
???
???
nnt
nnnn
snsn
XX ??
对于给定的 1??,使得,
要求 LCL,UCL
P(LCL<?1??2 < UCL)=1??
2121
2
22
2
11
212/21
11
2
)1()1()2()(
nnnn
snsnnntXXL C L ??
??
?????????
?
同理可得,
?1??2的双侧置信区间 (LCL,UCL)
2121
2
22
2
11
212/21
11
2
)1()1()2()(
nnnn
snsnnntXXU C L ??
??
?????????
?
?1- ?2的单侧置信区间
),( ???L C L
),( ??? U C L
2121
2
22
2
11
2121
11
2
)1()1()2()(
nnnn
snsnnntXXL C L ??
??
??????????
?
2121
2
22
2
11
2121
11
2
)1()1()2()(
nnnn
snsnnntXXU C L ??
??
??????????
?
或
四、两个总体方差之比 的区间估计 2
2
2
1
?
?
)1,1(~
/
/
/
/
212
2
2
1
2
2
2
1
2
2
2
2
2
1
2
1 ??? nnFss
s
s
???
?
?
?
?? ????? 1)(,1
2
2
2
1 UC LL C LP使得对给定的
要求 LCL,UCL
??? ?? ????????? 1))1,1(//)1,1(( 212/2
2
2
1
2
2
2
1
212/1 nnF
ssnnFP
2
? 2?
)1,1( 212/1 ??? nnF ? )1,1( 212/ ?? nnF ?
1??
F
),(2
2
2
1 U C LL C L的双侧置信区间
?
?
)1,1(
/
212/
2
2
2
1
??
?
nnF
ssL C L
?
)1,1(
/
212/1
2
2
2
1
??
?
? nnF
ssL C L
?
的单侧置信区间2
2
2
1
?
?
)???,( L C L
)1,1(
/
21
2
2
2
1
???
?
nnF
ssL C L
?
)1,1(
/
211
2
2
2
1
??
?
?
?
nnF
ssU C L
?
),( ??? U C L
或
五、总体比例 P的区间估计
)1,0(~
)1(
N
n
pP
Pp
?
?
假定 n ? 30,且 np ? 5,n(1?p) ? 5,
可近似地把 p(1?p) 替代 P(1?P)
)( ?? UL PPP,的双侧置信区间为:
,)1(2/ n ppzpP L ????
?
? n
ppzpP
U
)1(
2/
?????
?
的单侧置信区间P
n
ppzpP
L
)1( ???? ?
?
或
n
ppzpP
U
)1( ???? ?
?
)( ????,LP
),( ???? UP
六、两个总体比例之差 P1?P2的区间估计
)1,0(~
)1()1(
)()(
2
22
1
11
2121 N
n
PP
n
PP
PPpp
?
?
?
???
P1?P2的双侧置信区间 LCL,UCL
2
22
1
11
2/21
)1()1()(
n
pp
n
ppzppL C L ???????
?
2
22
1
11
2/21
)1()1()(
n
pp
n
ppzppU C L ???????
?
P1?P2的单侧置信区间
),( ???L C L
),( ??? U C L
2
22
1
11
21
)1()1()(
n
pp
n
ppzppL C L ????????
?
2
22
1
11
21
)1()1()(
n
pp
n
ppzppU C L ????????
?
或
§ 3 假设检验的一般方法
一、假设检验的基本思想
例,根据过去的测试知某种电子元件的使用寿命
服从 N (?0,?2),经过该产品技术改进后,随
机抽取了 n个产品进行使用寿命测试结果为:
X1,X2,…,Xn,得到平均寿命 。X
根据以上资料,可以进行两类统计推断,
如果要对技术改进后的产品使用寿命 ?进
行统计推断,则可在给定 1??置信度时对总体
平均值 ?作区间估计,即,
???? ?? ?????? 1)( 2/2/ nzXnzXP
???? ?? ??? 1)( 2/2/ 的概念为覆盖,这表明区间 nzXnzX
第一种,
第二种,
如果要问改进后的平均使用寿命 ?是否与
改进前的 ?0有明显的差别,则可在给定显著性
水平 ?时对 ?进行假设检验。
(表明技术改进前
后的平均使用寿
命没有明显差别 )
(表明技术改进前
后的平均使用寿命
有明显差别 )
建立 原假设,
备择假设,
H0,? = ?0
H1,? ? ?0
),( 2/2/ nzXnzX ?? ?? ??若令
02/2/ Hzzz 时接受则 ?? ???
通过置信区间构造一个水平 ?的检验,
当且仅当 ?0落在区间之内,就接受 H0。
n
Xz
?
? 0??
02/|| Hzz 时,则拒绝??
?/2
1??
?z?/2 z?/2
?/2
f (Z)
z
拒绝域 接受域 拒绝域
成立,那么置信区间如果 0H
02/2/ ),()( ?
????
?? 就应包含,nzXnzXUL ???
??
),01.0 05.0 ( 1 || 2/ 或取为一般的概率为 ??? ?? zz
),(0 ??? UL ???即
)|| 02/ ???? ULzz ?????,(,即的概率为
1?? ?
z?
也有单侧情形,
H0,? ? ?0
H1,? > ?0
或
H0,? ? ?0
H1,? < ?0 1?? ?
?z?
假设检验的基本思想,
经过抽样获取一组数据,即一个来自总体
的 (随机 )样本,如果根据样本计算的某个统计
量表明在假设成立的条件下几乎是不可能发生
的,就拒绝或否定这个假设,如果不然,则接
受这个假设。
二、两类错误
第 I类错误:原假设 H0成立,但检验结果是拒
绝 H0, 这类错误常称为, 弃
真”,P(I) = ?
第 II类错误:原假设 H0不成立,但检验结果是
接受 H0, 这类错误常称为,纳
伪”,P(II) = ?
?0 ?1 ? ?
?0 ?1 ? ?
?是可以选择的, 而 ? 一般是不能计算
的 。 因为当 H0不成立时 ? 的真值与 ?0的偏离
可能大也可能小, 若偏差大, 则 ?较小, 而当
?很接近 ?0时, ? 有可能很大 。
一个好的检验应使犯两类错误的概率都很小,
但要做到这点,除非所取的样本很大,当样本大
小 n固定时,?与 ?通常就不能兼顾,通常我们主
要考虑控制 ?,在选定 ?水平后,使 ?尽可能小。
在假设检验中,称 ?为检验数水平,也称
显著性水平。
三、假设检验的步骤
(一 ) 提出假设
H0和 H1是两个相反的假设,包括原假
设 H0和备择假设 H1。 其所有可能的结果都应
包含在这两个假设的范围内,它们的提出确
定了所要检验的对象。
(二 ) 计算检验统计量,确定 ? (显著性水平 )
下的拒绝域
构造一个检验统计量,要求这个统计量
包含着待检验的参数,除此之外,其余的参
数 (检验统计量所包含的参数 )必须是已知的,
我们可以通过检验统计量的分布在指定的 ?
下来确定拒绝域。
(三 ) 作出决策 (结论 )并加以解释
在决定是否拒绝 H0时,我们自然希望作出的
决策是正确的,尽量减少犯错误的概率,但在 n不
变的情况下,要减少 ?,必然会增加 ?,而同时减
少 ?和 ?是不可能的。因此,通常我们主要考虑控
制 ?,在选定 ?水平后,如果检验统计量的值落入
拒绝域内,我们就拒绝原假设,即因为 H0不成立,
否则就不拒绝 H0 。 必须指出,若 H0在一次检验后
没有被拒绝,我们并不能肯定 H0一定成立,我们
只能说不拒绝,习惯上称为,接受” H0 。
§ 4 参数的假设检验
一、总体均值 ?的假设检验
(一 ) 提出假设
H0,? = ?0
H1,? ? ?0
(三 ) 作出结论
若 |z| < z?/2,则,接受” H0
若 |z| ? z?/2,则拒绝 H0
(二 ) 检验统计量 (若 ?已知 )
n
Xz
?
??? 值出利用抽样结果可以计算 z
。,拒绝域可以确定出根据 22 || ??? zzz ?
例,设总体服从标准差为 50的正态分布,从该
总体抽出某容量为 25的随机样本,得出样本平
均值为 70,试以 ?=0.05的显著水平检验原假设
?0=90。
解,由题意,已知 n=25,?=50,,70?X
,05.0?? 0 2 5.0
2 ?
?
?0=90
H0,? = 90 H1,? ? 90
检验统计量,
n
Xz
σ
0???
计算
2
2550
9070 ????
查表得 96.1
025.02 ?? zz ?
拒绝域为,
2|| ?zz ?
? 计算结果为,
2?z
? 拒绝 H0,也就是说有 95%的把握否定原假定。
> =1.96 ?2 z =
关于参数 ?的假设检验表
原假设 H0 备择假设 H1 已知条件 检验统计量 拒 绝 域
? = ?0
? ? ?0
? ? ?0
? = ?0
? > ?0
? < ?0
?
已
知 n
Xz
?
? 0??
|z| ? z?/2
z ? z?
z ? –z?
? = ?0
? ? ?0
? ? ?0
? ? ?0
? > ?0
? < ?0
? 未
知小
样本 ns
Xt 0???
|t| ? t?/2(n–1)
t ? t?(n–1)
t ? –t?(n–1)
大样本
Z
n
s
Xt ??? ?
1??
?z?/2 z?/2
?
z
1?? 右侧检验 1??
?z
左侧检验 ?
二、总体方差 ?2的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
?2 = ?20
?2 ? ?20
?2 ? ?20
2
0
2
2 )1(
?
snx ??
?2 ? ?20
?2 > ?20
?2 < ?20
)1(2 212 ?? ? n???
)1(2 22 ?? n???或
)1(22 ?? n???
)1(212 ?? ? n???
1??
2
21
??? 2
2
??
? 1??
)1(2
2
?n??
1??
)1(21 ?? n??
?
三、两个总体均值之差 ?????
原假设 H0 备择假设 H1 已知条件 检验统计量 拒 绝 域
?1 = ?2
?1 ? ?2
?1 ? ?2
?1 ? ?2
?1 > ?2
?1 < ?2
2
2
2
1
2
1
21 0)(
nn
XX
z
??
?
??
?
|z| ? z?/2
z ? z?/2
z ? –z?/2
2121
2
22
2
11
21
11
2
)1()1(
nnnn
snsn
XXt
?
??
???
??
|t|?t?/2(n1+n2–2)
t ? t?(n1+n2–2)
t ? –t?(n1+n2–2)
2221,??
?1 = ?2
?1 ? ?2
?1 ? ?2
?1 ? ?2
?1 > ?2
?1 < ?2
2221 ?? ?
已知
未知小
样本
大样本时,t ? z
四、两个总体的方差比 的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
2
2
2
1
s
sF ?
)1,1( 2121 ??? ? nnFF ?
)1,1( 212 ??? nnFF ?或
)1,1( 21 ??? nnFF ?
)1,1( 211 ??? ? nnFF ?
2
2
2
1
?
?
2221 ?? ?
2221 ?? ?
2221 ?? ?
2221 ?? ?
2221 ?? ?
2221 ?? ?
五、成数 p 的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
n
PP
Pp
z
)1( 00
0
?
?
?
P = P0
P ? P0
P ? P0
P ? P0
P > P0
P < P0
|z| ? z?/2
z ? z?
z ? –z?
六、两总体成数之差的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
2
22
1
11
21
)1()1(
n
pp
n
pp
pp
z
?
?
?
?
?
P1 = P2
P1 ? P2
P1 ? P2
P1 ? P2
P1 > P2
P1 < P2
|z| ? z?/2
z ? z?
z ? –z?
(分别用 p1,p2近似代替 P1,P2)
例,某制造厂生产某装置的平均工作温度是
190?C。 今从一个由 16台装置构成的随机样本求
得的工作温度的平均数和标准差分别是 194 ?C和
8 ?C,能否说明平均工作温度比制造厂规定的要
高呢? 设 ?=0.05,并假定工作温度服从正态分布 。
解,已知 n=16,,1 9 4?X,05.0?? ?0=190
H0,? ? 190 H1,? > 190
s=8,
计算 检验统计量
n
Xz
s
0??? 2
168
1 9 01 9 4 ???
查表得 753.1)15()1(
025.0 ??? tnt ?
拒绝域为,)1(|| ?? ntt
?
? 计算结果为, )1( nt ?
?
? 拒绝 H0,也就是说,样本数据说明了平均工作
温度比制造厂规定的要高。
> =1.753 2 t =
制作,刘泽仁
统计推断包括参数估计和假设
检验,即通过样本统计量来估计和
检验总体的参数。统计推断的目的
在于认识未知的总体参数及其分布
特征。
第七章
抽
样
推
断
§ 1,点 估 计
一、点估计
点估计是通过计算一个统计量 (样本元素的函
数 ),将它作为未知参数的估计。
X1,…,Xn
未知参数 样本 统计量
),,( 1 nxxd ????观察值
对一次具体的抽样
?
?
参数估计有点估计和区间估计。
= d (X1,…,Xn) ? ? ?
二、估计量
1,估计量是用来估计参数的统计量
用来估计参数 ? 的估计量 记为
?
?
2,点估计量的构造方法常用的有,
矩法和极大似然法 (略 )
例,从平均值为 ?,标准差为 ?的总体中抽出样本
X1,…,Xn
XnXX =即的估计量用作若把样本平均数 ??? ??,1 i?
?? ?????? nnXEnnXEXE 1)(1)()( ii?
的无偏估计量是 ?X?
3,点估计量优劣的判别标准
衡量一个估计量好坏的标准通常有以下 3个,
(1) 无偏性,
如果一个估计量的数学期望值等于被估计
参数,则这个估计量称为被估参数的无偏估计
量。也就是说,
的无偏估计量。为则若 ???? ?? ?,)(E
222
2
i2,,
1
)(2 s
n
XXs ?
?
??? ??? 即的估计量用作若把?
)1 )(()()(
2
22
?
?????
n
XXEsEE i?由于
})]()[({11 2?? ?????? XXEn i
})]())((2])[({11 2i2i ???? ??????????? XXXXEn
]})([)](2[])([{11 2i2i ??? ????????? XnEXEXEn
]})[(])[(2{11 222 ??? ??????? XnEXnEn
]})[()])([(2)][({11 2i2i ???? ?????????? XnEXXEXEn
})({11 22 ?? ???? XnEnn
)(11
2
2
nnnn
?? ?
??
)11(11 2 nnn ???? ?
22 1
1 ?? ?
??
?? n
n
n
n
故 s2 是 ?? 的无偏估计量。
的估计量作为若用 2
2
2 )(3 ??
n
XX i ?????
]})([1{])([ 2
2
XXnEn XXE ii ??????
]21[ 22 XnnXXnXnE ii ?????
]}2[1{ 22 XXXXnE ii ??????
]21[ 222 XXXnE i ????
)1[ 22 XXnE i ???
)()(1 22 XEXEn i ???
)())(()( 22 XDXEXE ???
nnn
2
222 )(1 ???? ????
)()(1
2
222
nn
???? ?????
n
2
2 ?? ?? 21 ?
n
n ?? 2??
的无偏估计量。不是故 2
2
i )( ?
n
XX ??
) ] }())([()]())([(1[ 22 XDXEXDXEn ii ?????
(2) 一致性
若随着样本容量 n的增大,估计量的值越来越接
近于被估计的参数,则该估计量称为一致估计量。
,1)|(| ????? ? ???Pn 时,换句话说,若当
的一致估计量。为则 ???
的一致估计量就是例如,?? X??
n3?n2?n1
???? Xn 时,
X
??)( XE
n1
n2
n3
(3) 有效性
有效。比,则称换句话说,若
??
?
?
? 21
2
1 1
)(
)(
??
?
?
D
D
设 是参数 ? 的两个无偏估计量,
若 的方差比 的方差小,则称 比 有效。
1?? 2??
1?? 2?? 2??1??
??? ?? ?? )()( 21 EE
?
2?
?
??
?
1?
?
?
1?
? < ?
2?
?
4,几种总体参数的点估计量
?
?
?
??
n
iXnX
1i
1)1( ?? 的点估计量:总体平均数
估计量。的无偏、一致、有效的是可以证明 ?X
?
?
?
????
n
XXns
1i
2
i )(1
1)2( ?? 的点估计量:总体标准差
pPP ??的点估计量:总体成数)3(
例,某公司考虑购买一批减价商品,这批商品
共 2000件,其中有些是次品,但不知次品量或
次品率是多少。公司得知每件次品的修复成本
为 0.25元,并认为若总的修复成本低于 50元,购
买这批商品是有利可图的。在决定前,公司抽
取 100件商品进行调查,发现 12件次品。问你估
计这批商品的次品率为多少?你认为公司是否
可购买这一批商品?
解,设样本次品率为 p,则总体中的次品量为 NP,即
%121 0 012 ????
?
n
kpP
)( 2 4 0%122 0 0 0 件=???PN
计算结果表明:该批商品估计的次品率为
12%,次品量为 240件, 所以该品商品的修复成
本为,240?0.25=60(元 )。 由此可见, 公司不能购
买这批商品 。
§ 2,区 间 估 计
一、置信区间与置信度
???? ???? ?? 1)( ULP若 (0 ? ? ? ?)
则称 1??为置信度 (或置信水平 );
为置信区间。),( ?? UL ??
称为置信下限?L?
称为置信上限?U?
间:置信区间是双侧置信区同时具有下限和上限的
),( ????L?
??? ???? ?? 1)( LP ??? ???? ?? 1)(
UP
)( ?? UL ??,
只有一个下限值或只有一个限值的置信区间是单
侧置信区间,
),( ???? U?或
?
L?
?
U?
??
1??
置信度与置信区间的关系,
置信度越大,则置信区间越长,反之亦然。
若要同时使置信度尽可能的大和置信区间尽可能
的小,只有提高样本容量 n。
n'
n
n'>n
二、正态总体参数的区间估计
1,参数 ? 的置信区间
(1) ? 已知时,? 的置信区间
给定置信度 1??,要求 ??
UL ??,
???? ???? ?? 1)( ULP使得 ?
)1,0(~ NXZ
x
X
?
???由中心极限定理可知,
?
?? ? ????? 1)/( 21 znXzP只要使得
? 式的等式左边的括号内的不等式
21 / zn
Xz ???
?
?
XnzXnz ????? ??? 21
nzXnzX
???
12 ????
nzXnz
???
21 ???
?
?
?
? 式转化为
???? ?????? 1)( 12 nzXnzXP
由于 ? 等于 ?,所以 ?等于 ?
,故 nzXL ?? 2??
?
式中的 z1,z2是根据 1?? 的大小确定的。
?
nzXU
??
1??
?
见下图,
1??
z'2 z1 z z'1 z2
1??
? z?/2 z z?/2
2?2
?
z1= ? z?/2, z2= z?/2
因而,?的双侧置信区间的上、下限公式为,
,2/ nzXU ?? ???? nzXL ?? ? 2/??
?
同理可得 ?的单侧置信区间的上限公式或下限公式,
1??
z z
?
?
,
n
zXU ?? ???
?
?
),( ???? U?置信区间为
或另一种情形,
,
n
zXL ?? ???
?
?
),( ??? ?L?置信区间为
1??
z ?z
?
?
(2) ? 未知时,? 的置信区间 (小样本 )
)1(~
/
?? nt
ns
X ?
????? ?????
??
1)(1 ULP,使得给定置信度
??
UL ?? 和要求
)( ?? UL ???,的双侧置信区间:
,)1(2/ nsntXL ???? ?? nsntXU )1(2/ ???? ??
1?? 2?2?
)1(2/ ?? nt? )1(2/ ?nt?
同 (1)类似地,可得
的单侧置信区间:?
n
sntX
L )1( ???
?
?
??
n
sntX
U )1( ???
?
?
??
,,)( ????L?
,),( ???? U?
或
例,设在某证券交易所上市的工业类股票的日收
盘价格是下态分布随机变量,随机抽取其中 20种
股票收盘价得知样本的平均收盘价为 30元,方差
为 6.32。求该市场工业类股票的平均收盘价格的
置信区间 (?=2%)。
解,已知 n= 20,s2=6.32,
%12,30 ?? ?X
? 未知。
查表得 )1(
2 ?nt? 539.2)19(01.0 ?? t
n
sntXU
L ????
?
)1(μ 2?
20
32.6539.230 ???
=(28.57,31.43)
根据以上计算结果,我们可以说,按此区间
估计方法,将有 98%这样的置信区间包括工业
类的股票平均收盘平均收盘价格。或者说,我
们有 98%的把握说工业类的股票收盘价格界于
28.57元至 31.43元之间。
2,参数 ?2 的置信区间
)1(~)1( 22
2
?? nsn ??
????? ????? ?? 1)(1 222 ULP,使得给定置信度
?? 22
UL ?? 和要求
???? ????? 1))1(( 222
2
2
1
snP
2
22
2
2
1
)1( ?
?? ?
?? sn
2
1
2
2
2
2
2 )1()1(
???
snsn ????
2
2
2
22
2
1
)1(
1
)1( snsn ????
?
?
??
?
???? ?????? 1))1()1(( 2
1
2
2
2
2
2 snsn
P故
分布表可得:的大小查由其中 22221 1,???? ?
)1(2 2/121 ?? ? n???
)1(2 2/22 ?? n???
2
? 2?
1??
2?
)( 2?f
)1(2 2/ ?n??)1(2 2/1 ?? n??
)( 222 ?? UL ???,的双侧置信区间为:
,)1( )1( 2
2/
2
2
?
???
n
sn
L
??
? )1(
)1(
2
2
1
2
2
?
??
?
?
n
sn
U
??
?
的单侧置信区间为:2?
)( 2 ??? ?,L?
)1(
)1(
2
2
2
?
??? ?
n
sn
L
??
?
),( 2? ??? U? )1( )1( 2
1
2
2
?
??
?
?
?
n
sn
U
??
?
或
三、两个总体平均数之差 ?1- ?2的区间估计
的置信区间-已知时,,212221.1 ????
)1,0(~
)()(
2
2
2
1
2
1
2121 N
nn
XX
??
??
?
???
对于给定的 1??,使得,
要求 LCL,UCL
P(LCL<?1??2 < UCL)=1??
同理可得,
?1??2的双侧置信区间 (LCL,UCL)
2
2
2
1
2
1
2/21 )( nnzXXL C L
??
? ?????
2
2
2
1
2
1
2/21 )( nnzXXU C L
??
? ?????
?1??2的单侧置信区间
2
2
2
1
2
1
21 )( nnzXXL C L
??
? ????
?
2
2
2
1
2
1
21 )( nnzXXU C L
??
? ?????
?
),( ???L C L
),( ??? U C L
或
的置信区间未知时,212221,2 ???? ??
)2(~
11
2
)1()1(
)()(
21
2121
2
22
2
11
2121 ??
??
??
???
???
nnt
nnnn
snsn
XX ??
对于给定的 1??,使得,
要求 LCL,UCL
P(LCL<?1??2 < UCL)=1??
2121
2
22
2
11
212/21
11
2
)1()1()2()(
nnnn
snsnnntXXL C L ??
??
?????????
?
同理可得,
?1??2的双侧置信区间 (LCL,UCL)
2121
2
22
2
11
212/21
11
2
)1()1()2()(
nnnn
snsnnntXXU C L ??
??
?????????
?
?1- ?2的单侧置信区间
),( ???L C L
),( ??? U C L
2121
2
22
2
11
2121
11
2
)1()1()2()(
nnnn
snsnnntXXL C L ??
??
??????????
?
2121
2
22
2
11
2121
11
2
)1()1()2()(
nnnn
snsnnntXXU C L ??
??
??????????
?
或
四、两个总体方差之比 的区间估计 2
2
2
1
?
?
)1,1(~
/
/
/
/
212
2
2
1
2
2
2
1
2
2
2
2
2
1
2
1 ??? nnFss
s
s
???
?
?
?
?? ????? 1)(,1
2
2
2
1 UC LL C LP使得对给定的
要求 LCL,UCL
??? ?? ????????? 1))1,1(//)1,1(( 212/2
2
2
1
2
2
2
1
212/1 nnF
ssnnFP
2
? 2?
)1,1( 212/1 ??? nnF ? )1,1( 212/ ?? nnF ?
1??
F
),(2
2
2
1 U C LL C L的双侧置信区间
?
?
)1,1(
/
212/
2
2
2
1
??
?
nnF
ssL C L
?
)1,1(
/
212/1
2
2
2
1
??
?
? nnF
ssL C L
?
的单侧置信区间2
2
2
1
?
?
)???,( L C L
)1,1(
/
21
2
2
2
1
???
?
nnF
ssL C L
?
)1,1(
/
211
2
2
2
1
??
?
?
?
nnF
ssU C L
?
),( ??? U C L
或
五、总体比例 P的区间估计
)1,0(~
)1(
N
n
pP
Pp
?
?
假定 n ? 30,且 np ? 5,n(1?p) ? 5,
可近似地把 p(1?p) 替代 P(1?P)
)( ?? UL PPP,的双侧置信区间为:
,)1(2/ n ppzpP L ????
?
? n
ppzpP
U
)1(
2/
?????
?
的单侧置信区间P
n
ppzpP
L
)1( ???? ?
?
或
n
ppzpP
U
)1( ???? ?
?
)( ????,LP
),( ???? UP
六、两个总体比例之差 P1?P2的区间估计
)1,0(~
)1()1(
)()(
2
22
1
11
2121 N
n
PP
n
PP
PPpp
?
?
?
???
P1?P2的双侧置信区间 LCL,UCL
2
22
1
11
2/21
)1()1()(
n
pp
n
ppzppL C L ???????
?
2
22
1
11
2/21
)1()1()(
n
pp
n
ppzppU C L ???????
?
P1?P2的单侧置信区间
),( ???L C L
),( ??? U C L
2
22
1
11
21
)1()1()(
n
pp
n
ppzppL C L ????????
?
2
22
1
11
21
)1()1()(
n
pp
n
ppzppU C L ????????
?
或
§ 3 假设检验的一般方法
一、假设检验的基本思想
例,根据过去的测试知某种电子元件的使用寿命
服从 N (?0,?2),经过该产品技术改进后,随
机抽取了 n个产品进行使用寿命测试结果为:
X1,X2,…,Xn,得到平均寿命 。X
根据以上资料,可以进行两类统计推断,
如果要对技术改进后的产品使用寿命 ?进
行统计推断,则可在给定 1??置信度时对总体
平均值 ?作区间估计,即,
???? ?? ?????? 1)( 2/2/ nzXnzXP
???? ?? ??? 1)( 2/2/ 的概念为覆盖,这表明区间 nzXnzX
第一种,
第二种,
如果要问改进后的平均使用寿命 ?是否与
改进前的 ?0有明显的差别,则可在给定显著性
水平 ?时对 ?进行假设检验。
(表明技术改进前
后的平均使用寿
命没有明显差别 )
(表明技术改进前
后的平均使用寿命
有明显差别 )
建立 原假设,
备择假设,
H0,? = ?0
H1,? ? ?0
),( 2/2/ nzXnzX ?? ?? ??若令
02/2/ Hzzz 时接受则 ?? ???
通过置信区间构造一个水平 ?的检验,
当且仅当 ?0落在区间之内,就接受 H0。
n
Xz
?
? 0??
02/|| Hzz 时,则拒绝??
?/2
1??
?z?/2 z?/2
?/2
f (Z)
z
拒绝域 接受域 拒绝域
成立,那么置信区间如果 0H
02/2/ ),()( ?
????
?? 就应包含,nzXnzXUL ???
??
),01.0 05.0 ( 1 || 2/ 或取为一般的概率为 ??? ?? zz
),(0 ??? UL ???即
)|| 02/ ???? ULzz ?????,(,即的概率为
1?? ?
z?
也有单侧情形,
H0,? ? ?0
H1,? > ?0
或
H0,? ? ?0
H1,? < ?0 1?? ?
?z?
假设检验的基本思想,
经过抽样获取一组数据,即一个来自总体
的 (随机 )样本,如果根据样本计算的某个统计
量表明在假设成立的条件下几乎是不可能发生
的,就拒绝或否定这个假设,如果不然,则接
受这个假设。
二、两类错误
第 I类错误:原假设 H0成立,但检验结果是拒
绝 H0, 这类错误常称为, 弃
真”,P(I) = ?
第 II类错误:原假设 H0不成立,但检验结果是
接受 H0, 这类错误常称为,纳
伪”,P(II) = ?
?0 ?1 ? ?
?0 ?1 ? ?
?是可以选择的, 而 ? 一般是不能计算
的 。 因为当 H0不成立时 ? 的真值与 ?0的偏离
可能大也可能小, 若偏差大, 则 ?较小, 而当
?很接近 ?0时, ? 有可能很大 。
一个好的检验应使犯两类错误的概率都很小,
但要做到这点,除非所取的样本很大,当样本大
小 n固定时,?与 ?通常就不能兼顾,通常我们主
要考虑控制 ?,在选定 ?水平后,使 ?尽可能小。
在假设检验中,称 ?为检验数水平,也称
显著性水平。
三、假设检验的步骤
(一 ) 提出假设
H0和 H1是两个相反的假设,包括原假
设 H0和备择假设 H1。 其所有可能的结果都应
包含在这两个假设的范围内,它们的提出确
定了所要检验的对象。
(二 ) 计算检验统计量,确定 ? (显著性水平 )
下的拒绝域
构造一个检验统计量,要求这个统计量
包含着待检验的参数,除此之外,其余的参
数 (检验统计量所包含的参数 )必须是已知的,
我们可以通过检验统计量的分布在指定的 ?
下来确定拒绝域。
(三 ) 作出决策 (结论 )并加以解释
在决定是否拒绝 H0时,我们自然希望作出的
决策是正确的,尽量减少犯错误的概率,但在 n不
变的情况下,要减少 ?,必然会增加 ?,而同时减
少 ?和 ?是不可能的。因此,通常我们主要考虑控
制 ?,在选定 ?水平后,如果检验统计量的值落入
拒绝域内,我们就拒绝原假设,即因为 H0不成立,
否则就不拒绝 H0 。 必须指出,若 H0在一次检验后
没有被拒绝,我们并不能肯定 H0一定成立,我们
只能说不拒绝,习惯上称为,接受” H0 。
§ 4 参数的假设检验
一、总体均值 ?的假设检验
(一 ) 提出假设
H0,? = ?0
H1,? ? ?0
(三 ) 作出结论
若 |z| < z?/2,则,接受” H0
若 |z| ? z?/2,则拒绝 H0
(二 ) 检验统计量 (若 ?已知 )
n
Xz
?
??? 值出利用抽样结果可以计算 z
。,拒绝域可以确定出根据 22 || ??? zzz ?
例,设总体服从标准差为 50的正态分布,从该
总体抽出某容量为 25的随机样本,得出样本平
均值为 70,试以 ?=0.05的显著水平检验原假设
?0=90。
解,由题意,已知 n=25,?=50,,70?X
,05.0?? 0 2 5.0
2 ?
?
?0=90
H0,? = 90 H1,? ? 90
检验统计量,
n
Xz
σ
0???
计算
2
2550
9070 ????
查表得 96.1
025.02 ?? zz ?
拒绝域为,
2|| ?zz ?
? 计算结果为,
2?z
? 拒绝 H0,也就是说有 95%的把握否定原假定。
> =1.96 ?2 z =
关于参数 ?的假设检验表
原假设 H0 备择假设 H1 已知条件 检验统计量 拒 绝 域
? = ?0
? ? ?0
? ? ?0
? = ?0
? > ?0
? < ?0
?
已
知 n
Xz
?
? 0??
|z| ? z?/2
z ? z?
z ? –z?
? = ?0
? ? ?0
? ? ?0
? ? ?0
? > ?0
? < ?0
? 未
知小
样本 ns
Xt 0???
|t| ? t?/2(n–1)
t ? t?(n–1)
t ? –t?(n–1)
大样本
Z
n
s
Xt ??? ?
1??
?z?/2 z?/2
?
z
1?? 右侧检验 1??
?z
左侧检验 ?
二、总体方差 ?2的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
?2 = ?20
?2 ? ?20
?2 ? ?20
2
0
2
2 )1(
?
snx ??
?2 ? ?20
?2 > ?20
?2 < ?20
)1(2 212 ?? ? n???
)1(2 22 ?? n???或
)1(22 ?? n???
)1(212 ?? ? n???
1??
2
21
??? 2
2
??
? 1??
)1(2
2
?n??
1??
)1(21 ?? n??
?
三、两个总体均值之差 ?????
原假设 H0 备择假设 H1 已知条件 检验统计量 拒 绝 域
?1 = ?2
?1 ? ?2
?1 ? ?2
?1 ? ?2
?1 > ?2
?1 < ?2
2
2
2
1
2
1
21 0)(
nn
XX
z
??
?
??
?
|z| ? z?/2
z ? z?/2
z ? –z?/2
2121
2
22
2
11
21
11
2
)1()1(
nnnn
snsn
XXt
?
??
???
??
|t|?t?/2(n1+n2–2)
t ? t?(n1+n2–2)
t ? –t?(n1+n2–2)
2221,??
?1 = ?2
?1 ? ?2
?1 ? ?2
?1 ? ?2
?1 > ?2
?1 < ?2
2221 ?? ?
已知
未知小
样本
大样本时,t ? z
四、两个总体的方差比 的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
2
2
2
1
s
sF ?
)1,1( 2121 ??? ? nnFF ?
)1,1( 212 ??? nnFF ?或
)1,1( 21 ??? nnFF ?
)1,1( 211 ??? ? nnFF ?
2
2
2
1
?
?
2221 ?? ?
2221 ?? ?
2221 ?? ?
2221 ?? ?
2221 ?? ?
2221 ?? ?
五、成数 p 的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
n
PP
Pp
z
)1( 00
0
?
?
?
P = P0
P ? P0
P ? P0
P ? P0
P > P0
P < P0
|z| ? z?/2
z ? z?
z ? –z?
六、两总体成数之差的假设检验
原假设 H0 备择假设 H1 检验统计量 拒 绝 域
2
22
1
11
21
)1()1(
n
pp
n
pp
pp
z
?
?
?
?
?
P1 = P2
P1 ? P2
P1 ? P2
P1 ? P2
P1 > P2
P1 < P2
|z| ? z?/2
z ? z?
z ? –z?
(分别用 p1,p2近似代替 P1,P2)
例,某制造厂生产某装置的平均工作温度是
190?C。 今从一个由 16台装置构成的随机样本求
得的工作温度的平均数和标准差分别是 194 ?C和
8 ?C,能否说明平均工作温度比制造厂规定的要
高呢? 设 ?=0.05,并假定工作温度服从正态分布 。
解,已知 n=16,,1 9 4?X,05.0?? ?0=190
H0,? ? 190 H1,? > 190
s=8,
计算 检验统计量
n
Xz
s
0??? 2
168
1 9 01 9 4 ???
查表得 753.1)15()1(
025.0 ??? tnt ?
拒绝域为,)1(|| ?? ntt
?
? 计算结果为, )1( nt ?
?
? 拒绝 H0,也就是说,样本数据说明了平均工作
温度比制造厂规定的要高。
> =1.753 2 t =