分布的上侧 ?分位数
1,正态分布的上侧 ?分位数
则称
满足等式 P(X >u?)=?的数 u?为 标准正态分布的 上侧 ?分位数 ;
设 X~ N(0,1),0 < ? < 1,
称满足等式
的数 x?为 此分布的 上侧 ?分位数,
2,一般定义 设随机变量 X的密度为 f(x),对给定的 ?(0<?<1),
3,?2 分布的 上侧 ? 分位数,
??? ??? ? ?? xdxfxXP x )()(
,)())(( )(2 2 ?? ??? ??? ? ?? xdxfnXP n
)(2 n??
?2 分布函数的值可通过查表得到
?f(x)
O x)(2 n
??
则称
满足等式 P(X >u?)=?的数 u?为 标准正态分布的 上侧 ?分位数 ;
定义 4 设 X~ N(0,1),0 < ? < 1,
P(X>u?)= 1- P(X?u?)
称满足等式 P(|X|>u?/2)=?的数 u?/2为 标准正态分布的 双侧
? 分位数 ; ?(x)
O x
?
u?
?(x)
O x
?/ 2?/ 2
-u?/2 u?/2
= ?,= 1-?(u?) ? ?(u?)= 1-?,
可查表得值类似可得 ?(u?/2)= 1-?/2,
若 X~ N(?,?2)时,要求满足 P(X>x0 )= ? 的 x0,
?(u?)= 1-? ? u? ??
? ? ?? uxux ????? 00
—— 按一定规则从总体中抽取若干个体进行观察试验
所抽取的部分个体称为 样本,
总体和样本
统计量
三个常见的统计分布
复习
总体
样本
—— 研究对象的全体,总体中的每个对象称为 个体
样本矩
总体可用随机变量 X 或其分布来描述,就是一个概率分布
样本容量,样本值,简单随机样本
—— 不含任何未知参数、完全由样本决定的 样本函数
令随机变量
将样本值 x1,?,xn 按递增顺序排列顺序统计量
),,( 1 ?? nXX ? 为样本 X1,?,Xn 的 顺序统计量,
?? ?? nxx ?1
,?? ? kk xX
独立性 ;
代表性,
??
?
???
这为在不知分布的情形下,
取多次重复观测的算术平均值 作为 EX 的较为精确的估计提供
了 理论保证,
X
为评价其质量,需确
定其平均寿命 X,
具有有限
的数学期 EXi =μ,i =1,2,…, 则对 ?? > 0,
设随机变量序列 X1,X2,… 独立且同分布,
定理 (辛钦大数定律 )
.1)|1(|lim
1
????
???
??n
i in XnP 辛钦辛钦大数定律为寻找随机变量的期望值,提供了
一条实际可行的途径,
在同分布条件下大数定律的表现形式,
伯努利大数律是辛钦大数律的特例
若视 X i 为重复试验中对随机变量 X 的
第 i 次观察,则当 n → ? 时,对 X 的 n 次观察结果的算术平均值
以概率收敛于 X 的期望值 EX = ?,
X
例如,有一批产品,不知其寿命 X 的分布,
随机地从中抽取 n 件产品并测得其寿命分别为
,,,,21 nxxx ? 则可用 作为 EX 的一个估计值,?
?
n
i ixn 1
1 且 n 越大,越精确,
—— 随机变量 ?
?
? n
i i
XY
1
2
一、自由度为 n 的 ? 2 分布 Y ~?2 (n)
所服从的分布 (诸 Xi 独立且都服从 N(0,1))
20+30 若 Y ~?2 (n),则 EY= n,DY= 2n ;
设 X1,?,Xn 相互独立,且都服从正态分布 N(?,? 2),则
当 n 充分大时,;)(~)(1 2
1
2
2 nXY
n
i i
??? ?
?
??
近似服从 N(0,1),
n
nY
2
?
40
?2 分布的 上侧 ?分位数,)())(( )(2 2 ?? ??? ??? ? ?? xdxfnXP n
n ? 45 时,
n>45 时,.)12(
21 22 ??? nu ???
??
?;)(~ 221 nmYY ?? ?则
10 可加性 —— 设 Y1~?2 (m),Y2 ~?2 (n),且 Y1,Y2独立,
即 n充分大时,t分布近似 N(0,1),
T 的密度函数为 偶函数;
(其中 X~ N(0,1),Y~ ?2 (n),X 与 Y 相互独立 )nY
XT ? 所服从的分布,
二、自由度为 n 的 t 分布 T ~ t (n)
数学期望 E(T)= 0,
—— 随机变量
,21)(lim 2
2x
n exf
?
?? ? ?
方差 D(T)= n/(n-2),(n> 2).
t 分布的尾部比标准正态分布的尾部具有更大的概率
但 n 较小时,t 分布与 N(0,1)分布相差很大
查附表求 P(T > t?(n))=?
,?? ut ?
t 分布的 上侧 ?分位数 n ? 45 时,n > 45 时,
???
(随机变量 X与 Y独立,且 Y~ ?2 (m),Y~ ?2 (n) )
所服从的分布
nY
mXF ?
三,第一自由度为 m,第二自由度为 n的 F 分布 F ~ F(m,n)
数学期望,2,
2)( ??? nn nXE
—— 统计量
F 分布的性质, 10 若 X ~F(m,n),则 1/X ~F(n,m),
20 若 X ~ t (n),则 X 2 ~ F(1,n);
不依赖于第一自由度
.),( 1),(1 mnFnmF ?? ??
查 F 分布 附表可求 P(F >F?(m,n) )= ?,
F 分布 上侧 ? 分位数的性质
只是强调这一分
布是由一个统计量所产生的,
统计量是样本的函数,是依赖于样本的,
§ 3 抽样分布
抽样分布 精确抽样分布 渐近分布 —— 小 样本问题中使用—— 大 样本问题中使用
这个
分布叫做 统计量的,抽样分布,,
后者是随机变量,
所以统计量也是随机变量,因而就有它们自己一定的分布,
抽样分布就是通常的随机变量函数的分布,
研究统计量的性质和评价一个统计推断的优良性,完全取决
于其抽样分布的性质,
??
?
所以在理论上只要知道总体的分布就
可以求出统计量的分布,但实际操作一般都很难求,
重点以正态分布为背景,给出几个 常用统计量 的抽样分布,
设 X1,X2,?,Xn 是
取自 正态总体 N(?,?2)的样本,
当总体为 正态分布 时,教材上给出了 4 个重要的抽样分布定理,
一、正态总体的抽样分布定理
定理 1
则;),(~)1( 2nNX ??
?? ??? ni i XXSn 1 222 2 )(1)1()2( ??
.)3( 2 相互独立和 SX
? ?
EX=?,DX=? 2/n
正态分布的线性组合仍服从正态分布
2
2
? nSn? ;)1(~
2 ?n?
—— 样本均值、方差的分布
不妨假
定取自不同总体的样本总是独立的,
但实际中,我们还经常需要考察来自不同的正态总体样本,
设 X1,X2,?,Xn 是取自正态总体 N(?,?2)的样本,则
)1(~1 ??? ntnS X
n
?
定理 2—— 样本均值和方差标准化的抽样分布
?? nSX ?
?
?
?
n
i i
XX
1
2)(
证 由定理 1的 (1)知,),(~ 2
nNX ??,)1,0(~ NnX?
???
由定理 1的 (3)与 (2)知
n
X
?
??
2
2)1(
?
Sn ?与 相互独立,且
,)1(~)1( 22 2 ?? nSn ?? 由 T 分布定义知,)1(~
2
2
?
?
nt
S
n
X
?
?
?
??nSX ?
上述两个定理中所涉及到的样本均是来自同一个正态总体,
Y1,Y2,?,Yn
是取自正态总体 N(?2,?22)的样本,
相互独立,
,)1,1(~)3( 2
22
212
?? nmFSS
Y
X
?
?

定理 3 —— 两个正态总体的抽样分布
其中 SX2,SY2 分别是这两个样本的样本方差,
设 X1,X2,?,Xm 是取自正态总体 N(?1,?12)的样本,;),(~
)(
)(
)2(
2
2
1
2
2
2
1
1
2
1
nmF
nY
mX
n
i
i
m
i
i
??
??
?
?
?
?
?
?
)( YXE ?
)( YXD ?独立正态分布 的连续函数
证 (2) 由 ?2 分布的定义知,)1,0(~
1
1 NX i? ???
同理,;)(~)(1 221 121 mXmi i ??? ?? ?
证 (3),
)1()1(
)1()1(
222
212
222
212
??
???
nSn
mSm
S
S
Y
X
Y
X
?
?
?
?
?? ??? mi iX XXSm 1 22
121
2 )(1)1(
??
同理,;)1(~)1( 2
22
2 ?? nSn Y ?
?;)(~)(1 221 22
2
nYn
i i
??? ?
?
?;)1(~ 2 ?m?Th1(2)
由 F分布定义知 (3)成立,;)1,0(~)()1(
2
2
2
1
21 N
nm
YX
??
??
?
???
由 F分布的定义知
定理 4
Y1,Y2,?,Yn
是取自正态总体 N(?2,?2)的样本,
,)2(~
11
)()1( 21 ??
?
??? nmt
nmS
YX
?
??
其中 SX2,SY2分别是这两个样本的样本方差,
则有
—— 两同方差正态总体的抽样分布
证 (1)
设 X1,X2,?,Xm 是取自正态总体 N(?1,?2)的样本,;)2 )1()1(( 22 ?? ???? nm SnSmS YX?,)1,1(~22 ?? nmFSS
Y
X
)2(
Th3(3)的特例
由两异方差总体的抽样定理之 (1),;)1,0(~
11
)( 21 N
nm
YX
?
???
?
??
,)1(~)1( 22
2
?? mSm X ?? ;)1(~)1( 22
2 ?? nSn Y ?
?
且相互独立,由 ?2 分布 的可加性知 ;)2(~)1()1( 2
2
22
????? nmSnSm YX ??
由 t分布 的定义知,)2(~
11
2
)1()1(
)(
22
21 ??
??
??
???
??? nmt
nmnm
SnSm
YX
YX
??
二、非正态总体的抽样分布定理
设 X1,?,Xn 是取自
均值为 ?,方差为 ?2的总体的一个样本,
定理 5
则当 n充分大时,近似地有;),(~)1( 2nNX ??,)1,0(~)2( NnSX ??
—— 样本均值、方差的分布 (P200 Th6)
独立同分布
中心极限定理 独立同分布中心极限定理
我们已介绍了总体、样本、简单随机样本、统计量
和抽样分布的概念,给出了几个
重要的抽样分布定理, 它们是进一步学习统计推断的基础,
小结
介绍了统计中常用的三大分布,
正态分布
非正态分布
?
?
?
?
?
?
?抽样定理
来自一个总体
来自两个总体;),(~)1( 2nNX ??,)1(~)(1)2( 2
1
22 ???
?
nXXn
i i
??
)1(~1)3( ????? ntnS XnSX
n
??
?
?
?
?
?;)1,0(~)( 2
2
2
1
21 N
nm
YX
??
??
?
???不同方差
同 方 差
,)1,1(~2
22
212 ?? nmF
S
S
Y
X
?
?
,)2(~
11
)( 21 ??
?
??? nmt
nmS
YX
?
??
.)1,1(~22 ?? nmFSS
Y
X
Th1&Th2
Th3&Th4
当 n充分大时,近似地有;),(~)1( 2nNX ??,)1,0(~)2( NnSX ??
独立同分布中心极限定理
来估
计总体的某些参数或者参数的某些函数,
参数估计问题就是利用从总体抽样得到的信息,
参 数 估 计
估计废品率
估计新生儿的平均体重
估计湖中鱼数
… … 估计平均降雨量
在参数估计问题中,假定总体分布形式已知,
未知的仅仅是一个或几个参数,
现在进入对统计推断的研究, 先介绍一类重要的统计推断问题,
§ 1 参数估计问题
例 已知某地区新生婴儿的体重 X ~ N(?,?2),
?,? 2未知,随机抽查 100个婴儿,得 100个体重数据
10,7,6,6.5,5,5.2,?
如何据此估计 ?和 ? 2呢? 全部信息就是这 100 个数,
一、点估计
为估计 ?的值,我们需要构造出适当的样本的函数 ?(X1,X2,? Xn ),^
使用什么样的统计量去估计?
也可用样本中位数等,
问题是,
即得到 ? 的一个 估计值,
对于确定的一组样本值,代入函数 ?(X1,X2,? Xn )中算出一个值 ?,^ ^
对于待估参数 ?,对于待估参数 ?:
可用样本方差等,,1)||(lim ????? ??XPn
可用样本均值 ;
点 估 计
x1,x2,? xn
是其一组样本值,
定义 1 设 X1,X2,? Xn 是来自总体 X的样本,
如果总体的分布类型已知,? 是总体的未知参数,
则称用以估计 参数 ? 的 统计量 ?(X1,X2,? Xn )为参数 ? 的 点估计量,^
简称 估计量, ?(x1,x2,? xn )称为 ? 的 点估计值,^ 或 估计值, i
i
i
i
i i
i = 1,2,?,l, 参数取值范围 —— 参数空间, ?,
寻求估计量的方法 矩估计法
极大似然法
最小二乘法
贝叶斯方法 ……
这里我们主要介绍前面两种方法,
这就是相应多维参数空间的一个区域,
为参
数 ?的 区间估计,
使待估参
数以较大的概率含于其内,
二,区间估计
区间估计 —— 设法得到参数空间 ?的一个取值范围,
例如要估计一个参数 ?,就是要建立两个统计量
??? ?),(
),,,(),,,,( 2121 nn XXXXXX ?? ???? ??
使得待估参数 ?以较大概率被 区间 覆盖,
若待估参数 ?是多维的,
则称 ),( ??
例如,正态分布的未知参数 ?= (?,?2 ),
? ={(?,?2)||?|< +?,? >0 }
—— 置信区间的方法,
先介绍进行 点估计 的重要方法:
进而由此确定待定
参数的 估计值,
一, 矩估计法
其基本思想是用样本矩估计总体矩,
理论依据?
它是基于一种简单的,替换,思想建立起来的一
种估计方法,是英国统计学家 K,皮尔逊最早提出的,
—— 辛钦大数定律
§ 2 矩估计法和极大似然估计法
.1)|1(|lim
1
????
???
??n
i in
XnP
kiX? 仍是独立同分布的,
k 阶原点矩 Ak
.1)|)(1(|lim
1
???? ?
???
?kn
i
k
in XEXnP
采用相应的样本矩作为总体矩的 估计量,
这种用相应的 样本矩 去估计 总体矩 的估计方法就称为 矩估计法
由此所得估计量称为 矩估计量
即可得诸 E(X k)的
矩估计量,
求矩估计量的具体步骤
且总体的前 l 阶原点
矩 E(X k)(k=1,2,?,l )存在,
设总体 X 的分布函数 F(x; ?1,?2,?,?l )中含有 l 个未知参数
?1,?2,?,?l,
则它们应是这 l 个参数的函数:
又样本 X1,X2,?,Xn 的样本 k阶原点矩为
,),,()( 1 lkk gXE ?? ?? k=1,2,?,l
从这 l 个方程中可解得 矩估计值 为:
令总体矩 E(Xk)等于其相应的样本矩 Ak,
X1,X2,?,Xn 是总体 X 的样本,
,1
1
?
?
? n
i
k
ik XnA
k=1,2,?,l
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
,
1
),,(
,
1
),,(
,
1
),,(
1
1
1
2
12
1
11
n
i
l
ill
n
i
il
n
i
il
X
n
g
X
n
g
X
n
g
??
??
??
?
??
?
?
?
?
?
?
?
?
?
?
,),,(??
,),,(??
,),,(??
1
122
111
lll
l
l
????
????
????
?
??
?
?




解 注意到只有一个未知参数,
??
?
?
? ??
?
其它,0;0,1
);(
??
?
x
xf
求 ? 的矩估计量,
只需一个方程,
xdxfxEX ? ????? );( ?,2??
例 1 设总体 X 的密度为
?为未知参数,X1,?,Xn 是总体 X 的一个样本,
由矩估计法知
,?
?
? n
i i
Xn
1
1
2
?,X2?? ?
即得 ?的矩估计量为,2? X??
数学期望是一阶原点矩
令 总体原点矩 等于 样本矩
样本矩总体矩

,EX???,22 ?? ??
解之得
若总体的一、二阶原点矩都存在,
令 总体矩 等于 样本矩
XEDXXE 22 )( ??
例 2 设总体 X 的均值和方差分别为 ?与 ?2,(均未知 ),
求 ?与 ?2 的矩估计量,
X1,X2,?,Xn 是总体 X 的样本,
需要两个方程,由矩估计法知
?
?
?
?
?
??
?
?
?
?
?
,1
,1
1
222
1
n
i
i
n
i
i
Xn
Xn
??
?
??
?
?
? ?,X?
,1
1
222 ?
?
?? n
i i
XXn?,)(1 1 2?? ?
n
i i X
Xn
??
?
?
?
??
?
?
?
,)(1?
,?
1
22 n
i
i XXn
X
?
?所以所求的矩估计量为
= B2
当 ? =1时,X 的概率密度为
xdxfxEX );( ?? ????? xdx??? ?? 1 ??

,1?? ??
解之得,
1?? X
X?
∴ ?的矩估计量为
??
?
?
?
?
??
?
,,0
,,)(1
),;(
?
??
??
?
x
xx
xF
求 ? =1时,
未知参数 ?的矩估计量,
其中参数 ?>0,?> 1,
例 3 设 X 的分布函数为
X1,X2,?,Xn 是总体 X 的样本,
??
?
?
?
?
?
? ?
,1,0
,1,
);( 1
x
xx
xf ?
?
?
,?
?
?? n
i i
Xn
1
1
1?
?
.1? ?? X X?

缺点 是, 当总体类型已知时, 没有充分利用分布提供的信
息, 一般场合下,矩估计量不具有唯一性,
其主要原因在于建立矩法方程时,选取那些总体矩用相应
样本矩代替带有一定的随意性,
矩法的 优点 是简单易行,并不需要事先知道总体是什么分布,
小结
抽样定理
参数估计
—— 两类
利用总体的抽样样本 X1,X2,?,Xn 对参数 ? 或 ?的
某已知函数 g(?)作出估计,
—— 已知含有未知参数 ?总体的分布函数为
F(x; ?),
区间估计
点估计??
??
?
—— 构造适当的统计量 ?(X1,X2,? Xn )得到 ?的估计值
—— 设法得到参数空间 ?的一个取值范围,使待估
参数以较大的概率含于其内,
矩估计法
极大似然法
—— 用 样本 矩 估计 总体矩
先求出总体 k 阶原点矩 E(Xk)
?
?
?
?
?
?
?
?
?
?
),,()(
),,()(
),,(
1
12
2
11
ll
l
l
l
gXE
gXE
gEX
??
??
??
?
??
?
?
,1
,1
,1
1
1
2
1
?
?
?
?
?
?
?
?
?
n
i
l
i
n
i
i
n
i
i
X
n
X
n
X
n
设 {Xi}是独立同分布的随机
变量序列,
? 独立同分布的中心极限定理 ——
? De Moivre-Laplas中心极限定理 ——
则 ?? >0,标准化 随机变量的
分布函数 Fn(x)满足
小结
? ?? ?? x t tde 222 ?1 )(x??
且 EXi = ?,DXi = ?2 ?0,
)(lim)(lim xnnXPxF nnn ??? ???? ? ?
设随机变量序列 Xn 相互
独立,且都 服从参数为 p(0<p<1)的二点分布,则对任意的 x,有
))1((lim xpnp pnXPn ????? tdex t?
??
?? 2 2
2
1
?
).( x??
))1(())1(()( pnp pnapnp pnbbXaP ???????? ??
n个独立同分布的随机变量,不论原来服从什么分布,当 n 充分
大时,其 和 X的标准化 X *总可近似地认为是服从 标准正态分布,
??? ni iXX 1
? ?? ?? x t tde 222 ?1
设 {Xi}是独立同分布的随机变量序列,
下面给出的独立同分布随机变量序列的中心极限定理,也称
Levy— Lindberg(列维 — 林德伯格 )定理,
定理 1(独立同分布的中心极限定理 )
)(x??
?X ~ N(0,1); ?
?
n
i i
X
1
~ N(n?,n? 2); ~ N(?,? 2/n),?
?
n
i i
Xn
1
1
n
Xn
n
i i
/
1
1
?
??
?
?
?
可近似认为,
且 EXi=?,DXi=?2 ?0,i=1,2,?
??n
i i
X
1
n2?
n???
?
n
i iXE 1
???ni iXD 1
)(lim)(lim 1 x
n
nX
PxF
n
i
i
nnn ?
?
?
?
?
???? ?
?
n
nX
X
n
i
i
?
??
??
?
? 1的分布函数 F
n(x)满足
的标准化 随机变量则 ?? >0,
n 个独立同分布的随机变量,不论原来服从什么分布,当 n 充分
大时,其 和的标准化 总可近似地认为是服从 标准正态分布,?X
正是大量随机变量服从正态分布的理论解释
反映了中心
极限定理的
客观背景
这为在不知分布的情形下,
取多次重复观测的算术平均值 作为 EX 的较为精确的估计提供
了 理论保证,
X
为评价其质量,需确
定其平均寿命 X,
具有有限
的数学期 EXi =μ,i =1,2,…, 则对 ?? > 0,
设随机变量序列 X1,X2,… 独立且同分布,
定理 3(辛钦大数定律 )
.1)|1(|lim
1
????
???
??n
i in XnP
辛钦辛钦大数定律为寻找随机变量的期望值,提供了
一条实际可行的途径,
独立同分布条件下大数定律的表现形式,
若视 X i 为重复试验中对随机变量 X 的
第 i 次观察,则当 n → ? 时,对 X 的 n 次观察结果的算术平均值
以概率收敛于 X 的期望值 EX = ?,
X
例如,有一批产品,不知其寿命 X 的分布,
随机地从中抽取 n 件产品并测得其寿命分别为
,,,,21 nxxx ? 则可用 作为 EX 的一个估计值,?
?
n
i ixn 1
1 且 n 越大,越精确,
我们已介绍了总体、样本、简单随机样本、统计量
和抽样分布的概念,给出了几个
重要的抽样分布定理, 它们是进一步学习统计推断的基础,
小结
介绍了统计中常用的三大分布,
正态分布
非正态分布
?
?
?
?
?
?
?抽样定理
来自一个总体
来自两个总体;),(~)1( 2nNX ??,)1(~)(1)2( 2
1
22 ???
?
nXXn
i i
??
)1(~1)3( ????? ntnS XnSX
n
??
?
?
?
?
?;)1,0(~)( 2
2
2
1
21 N
nm
YX
??
??
?
???不同方差
同 方 差
,)1,1(~2
22
212 ?? nmF
S
S
Y
X
?
?
,)2(~
11
)( 21 ??
?
??? nmt
nmS
YX
?
??
.)1,1(~22 ?? nmFSS
Y
X
Th1&Th2
Th3&Th4
当 n充分大时,近似地有;),(~)1( 2nNX ??,)1,0(~)2( NnSX ??
独立同分布中心极限定理
2nXD
几个常见的统计量
样本均值
样本方差
??? ni iXnX 11
?? ??? ni i XXnS 1 22 )(11
样本 k阶原点矩 样本 k阶中心矩?
?
? n
i
kik XnA
1
1 ?
?
?? n
i
kik XXnB
1
)(1 k=1,2,
?
并称他们相应的观测值仍分别为原称
样本标准差 ?
?
??? n
i i
XXnS
1
2)(
1
1
10 样本矩 ——
?? ??? ni i XnXn 1 22 )(11 ?? ??
n
i i
n XXnS
1
22 )(1
?? ?? ni in XXnS 1 2)(1
若 EX=?,DX=? 2,则
,)1( ??XE
P184 Th1,
,)()2( 22 ??SE ;22 ?? ?? PS;)(,??? ?? nX P ?
,1)( 22 ?nnSE n ??,)(22 ??? ?? nS Pn ?
样本均值、方差的期望和其以概率收敛性
22 1 SnnS n ??