1
概率论与数理统计第 10讲本文件可从网址
http://math.vip.sina.com
上下载
(单击 ppt讲义后选择 '工程数学 1'子目录 )
2
第六章 样本及抽样分布
§ 1 随机样本
3
定义 设 X是具有分布函数 F的随机变量,若
X1,X2,...,Xn是具有同一分布函数 F的,相互独立的随机变量,则称 X1,X2,...,Xn为从分布函数
F(或 总体 F,或 总体 X)得到的 容量为 n的简单随机样本,简称 样本,它们的观察值 x1,x2,...,xn称为 样本值,又称为 X的 n个 独立的观察值,
4
也可以将样本看成是一个随机向量,写成
(X1,X2,...,Xn),此时样本值应写成 (x1,x2,...,xn),若
(x1,x2,...,xn)与 (y1,y2,...,yn)都是相应于样本
(X1,X2,...,Xn)的样本值,一般说来它们是不相同的,
5
由定义得,若 X1,X2,...,Xn为 F的一个样本,则
X1,X2,...,Xn相互独立,且它们的分布函数都是 F,
所以 (X1,X2,...,Xn)的分布函数为
.)(),,(
1
21
*?
n
i
in xFxxxF?
n
i
in xfxxxf
1
21
* )(),,,(?
又若 X具有概率密度 f,则 (X1,X2,...,Xn)的概率密度为
6
§ 2 抽样分布
7
定义 设 X1,X2,...,Xn是来自总体 X的一个样本,
g(X1,X2,...,Xn)是 X1,X2,...,Xn的函数,若 g中不含未知参数,则 g(X1,X2,...,Xn)称是一 统计量,
因为 X1,X2,...,Xn都是随机变量,而统计量
g(X1,X2,...,Xn)是随机变量的函数,因此统计量是一个随机变量,设是 x1,x2,...,xn相应于样本的样本值,则称 g(x1,x2,...,xn)是 g(X1,X2,...,Xn)的观察值,
8
几个常用的统计量,
样本平均值,;
1
1
n
i
iXnX;
1
1
)(
1
1 2
1
2
1
22





XnX
n
XX
n
S
n
i
i
n
i
i
样本方差,
样本标准差,;)(
1
1
1
22?

n
i
i XXnSS
9
样本 k阶 (原点 )矩,;,2,1,
1
1

kX
n
A
n
i
k
ik
.,3,2,)(
1
1

kXX
n
B
n
i
k
ik
样本 k阶中心矩,
10
它们的观察值分别为



n
i
i
n
i
i
n
i
i
n
i
i
xx
n
s
xnx
n
xx
n
s
x
n
x
1
2
2
1
2
1
22
)(
1
1;
1
1
)(
1
1;
1
11
这些观察值仍分别称为样本均值,样本方差,
样本标准差,样本 k阶 (原点 )矩以及样本 k阶中心矩,
.,3,2,)(
1;,2,1,
1
1
1


kxx
n
b
kx
n
n
i
k
ik
n
i
k
ik
12
若总体 X的 k阶矩 E(Xk)存在,记 mk=E(Xk),则当
k
k
n
kk
kk
n
kk
n
k
P
k
XEXEXE
XXXX
XXXX
kAn
m
m


)()()(
,,,
,,,,
.,2,1,,
21
21
21
故有同分布独立且与所以同分布独立且与这是因为时
,2,1,
1
1

kX
n
A kP
n
i
k
ik m
从而由第五章的辛钦定理知
13
进而由第五章中关于依概率收敛的序列的性质知道
),,,,(),,,( 2121 kPk gAAAg mmm
其中 g为连续函数,这就是下一章要介绍的矩估计法的理论根据,
,2,1,
1
1

kX
n
A kP
n
i
k
ik m
14
经验分布函数 可以作出与总体分布函数 F(x)
相应的统计量 ----经验分布函数,它的作法为,
设 X1,X2,...,Xn是总体 F的一个样本,用 S(x),
<x<?,表示 X1,X2,...,Xn中不大于 x的随机变量的个数,定义经验分布函数 Fn(x)为
.),(
1
)( xxS
n
xF n
15
例如
(1) 设总体 F具有一个样本值 1,2,3,则经验分布函数 F3(x)的观察值为



.3,1
,32,
3
2
,21,
3
1
,1,0
)(
3
x
x
x
x
xF
若若若若
16
(2) 设总体 F具有一个样本值 1,1,2,则经验分布函数 F3(x)的观察值为

.2,1
,21,
3
2
,1,0
)(
3
x
x
x
xF
若若若
17
一般,设 x1,x2,...,xn是总体 F的一个容量为 n的样值值,先将 x1,x2,...,xn按自小到大的次序排列,
并重新编号,设为
x(1)?x(2)?...?x(n).
则经验分布函数 Fn(x)的观察值为

.,1
,,
,,0
)(
)(
)1()(
)1(
n
kkn
xx
xxx
n
k
xx
xF
若若若
18
对于经验分布函数 Fn(x),格里汶科 (Glivenko)
在 1933年证明了以下的结果,对于任一实数 x,
当 n时 Fn(x)以概率 1一致收敛于分布函数
F(x),即
.1}0|)()(|s u plim{

xFxFP n
xn
因此,对于任一实数 x当 n充分大时,经验分布函数的任一个观察值 Fn(x)与总体分布函数 F(x)
只有微小的差别,从而在实际上可以当作 F(x)
来使用,
19
对于任意固定的 x,<x<?,S(x)~b(n,F(x)),从而可知对于固定的 x,

).()]([
1
)]([
1
]/)([)(
xFxnF
n
xSE
n
nxSExFE
n
n


20
统计量的分布称为抽样分布,在使用统计量进行统计推断时常需知道它的分布,当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的,下面介绍来自正态总体的几个常用统计量的分布,
21
(一 ) c2分布 设 X1,X2,...,Xn是来自总体 N(0,1)的样本,则称统计量
)1.2(222212 nXXXc
)2.2(
.,0
,0,e
)2/(2
1
)(
2/12/
2/

其它
yy
nyf
yn
n
服从自由度为 n的 c2分布,记为 c2~c2(n).
此处,自由度是指 (2.1)式右端包含的独立变量的个数,
c2(n)分布的概率密度为
22
f(y)的图形如下,
23
现在来推求 (2.2)式由第二章 § 5例 3及第三章 § 5例 3知 c2(1)分布即为?(1/2,2)分布,现 Xi~N(0,1),由定义
Xi2~c2(1),即 Xi2~?(1/2,2),i=1,2,...,n,再由
X1,X2,...,Xn的独立性知 X12,X22,...,Xn2相互独立,
从而由?分布的可加性知
)3.2(,2,
2
~
1
22?

n
X
n
i
i?c
即得 c2的概率度如 (2.2)式所示,
24
c2分布的可加性 设 c12~c2(n1),c22~c2(n2),并且 c12,c22独立,则有
c12+c22~c2(n1+n2).
c2分布的数学期望和方差 若 c2~c2(n),则有
E(c2)=n,D(c2)=2n.
25
c2分布的分位点 对于给定的正数?,0<?<1,
称满足
.)()(
)6.2(d)()}({
22
)(
22
2
分位点分布上的为的点?cc
cc
c
nn
yyfnP
n?

c?2(n)
26
对于不同的?,n,上?分位点的值已制成表格,
可以查用 (见附表 4),
实际上许多常用的办公软件都有关于上 a分点的相应函数,例如,excel电子表格的函数
chiinv(?,n)就可以计算给定?,n值的上?分位点,
27
(二 )t分布 设 X~N(0,1),Y~c2(n),且 X,Y独立,则称随机变量
)8.2(
/ nY
Xt?
)9.2(
,1
)2/(
]2/)1[(
)(
2/)1(
2


t
n
t
nn
n
th
n

服从自由度为 n的 t分布,记为 t~t(n).
t分布又称学生氏 (Student)分布,t(n)分布的概率密度函数为
28
h(t)的图形为
29
h(t)关于 t=0对称,当 n充分大时其图形类似于标准正态变量概率密度的图形,不难证明
2/2e
2
1
)(lim t
n
th?

故当 n足够大时 t分布近似于 N(0,1)分布,但对于较小的 n,t分布与 N(0,1)分布相差较大,
30
t分布的分位点 对于给定的?,0<?<1,称满足条件
)11.2()()}({
)(

nt
dtthnttP
的点 t?(n)为 t(n)分布的上?分位点
t?(n)
31
由 t分布上?分位点的定义及 h(t)图形的对称性知
t1(n)t?(n) (2.12)
t分布的上?分位点可自附表 3查得,在 n>45时,
对于常用的?的值,就用正态近似,
t?(n)?z?,(2.13)
32
(三 )F分布 设 U~c2(n1),V~c2(n2),且 U,V独立,
则称随机变量
)14.2(
/
/
2
1
nV
nU
F?
)15.2(
.,0
,0,
)]/(1)[2/()2/(
)/](2/)[(
)( 2/)(
2121
1)2/(2/
2121
21
11

其它
y
nynnn
ynnnn
y nn
nn

服从自由度为 (n1,n2)的 F分布,记为 F~F(n1,n2).
F分布的概率密度为
33
(y)的图形
(n1,n2)=(10,40)
(n1,n2)=(11,3)
O
34
由定义可知,若 F~F(n1,n2),则
)16.2().,(~1 12 nnF
F
)17.2(d)()},({
),(21 21


nnF
yynnFFP
F分布的分位点 对于给定的?,0<?<1,称满足条件的点 F?(n1,n2)为 F(n1,n2)分布的上?分位点,此分位点有表格可查 (见附表 5),在 Excel软件中的函数 FINV可以查出 F分布的分布函数逆函数,也就容易查出上?分位点,
35
F-分布的上?分布的示意图
O F?(n1,n2)
36
若 F~F(n1,n2),按定义
)2(.),(
1
),(~
1
)1(.
),(
11
),(
11
1
),(
11
1
),(
11
)},({1
1212
211
211211
211
211





nnF
F
PnnF
F
nnFF
P
nnFF
P
nnFF
P
nnFF
PnnFFP
知再由于是
37
由 (1),(2)式可得 F分布的上?分位点满足,
)18.2(,),( 1),(
12
211 nnFnnF

.357.0
80.2
1
)12,9(
1
)9,12(
05.0
95.0 FF
(2.18)式常用来求 F分布表中未列出的常用的上?分位点,例如
38
(四 )正态总体的样本均值与样本方差的分布设总体 X(不管服从什么分布,只要均值和方差存在 )的均值为 m,方差为 s2,X1,X2,...,Xn是来自
.
1
),,(~
)20.2()(
)19.2(./)(,)(
,,,
1
2
22
2
2
也服从正态分布则进而设总有则是样本均值和样本方差的一个样本

n
i
i
X
n
X
NX
SE
nXDXE
SXX
sm
s
sm
39
E(S2)=s2的证明,
.
)/()(
1
1
)()(
1
1
1
1
)(
2
22
1
22
2
1
2
2
1
22
s
msms

nn
n
XnEXE
n
XnX
n
ESE
n
i
n
i
i
n
i
i
40
定理一 设 X1,X2,...,Xn是来自总体 N(m,s2)的样本,`X是样本均值,则有
)./,(~ 2 nNX sm
.)2(
)21.2();1(~
)1(
)1(
2
2
2
2
独立与 SX
n
Sn
c
s
定理二 设 X1,X2,...,Xn是来自总体 N(m,s2)的样本,`X和 S2是样本均值和样本方差,则有
41
注意
)1(~
)(
),(~
)(
,)(
)()()(
)()1(
)(
1
1
2
2
1
2
2
2
1
2
22
2
2
1
1
22
1
22





n
XX
n
X
XEX
XXXXXX
XXSn
XX
n
S
n
i
i
n
i
i
i
n
n
i
i
n
i
i
c
s
c
s
m
m
但则换成如果将上式的因此
42
定理三 设 X1,X2,...,Xn是来自总体 N(m,s2)的样本,`X和 S2是样本均值和样本方差,则有
)22.2().1(~
/
nt
nS
X m
),1(~)1(),1,0(~
/
2
2
2
nSnN
n
X c
ss
m
证 由定理一,定理二且两者独立,由 t分布定义 知
).1(~
)1(
)1(
/
2
2

nt
n
Sn
n
X
ss
m
43
定理四
.
)(
1
1
,)(
1
1;
1
,
1
.
,),(),(
,,,,,,
1
2
2
2
2
1
2
1
2
1
1
2
1
1
2
22
2
11
2121
21
21
方差分别是两个样本的样本值分别是这两个样本的均设样本相互独立且这两个的样本和态总体分别是来自正与设






n
i
i
n
i
i
n
i
i
n
i
i
nn
YY
n
SXX
n
S
Y
n
YX
n
X
NN
YYYXXX
smsm

44
则有
.,
2
)1()1(
),2(~
11
)()(
,)2(
);1,1(~)1(
2
21
2
22
2
112
21
21
21
22
2
2
1
212
2
2
1
2
2
2
1
www
w
SS
nn
SnSn
S
nnt
nn
S
YX
nnF
SS






其中时当
mm
sss
ss
45
证 (1)由定理二
)1(~
)1(
),1(~
)1(
2
2
2
2
2
22
1
2
2
1
2
11 nSnnSn c
s
c
s
).1,1(~
),1,1(~
)1(
)1(
)1(
)1(
212
2
2
1
2
2
2
1
212
22
2
22
2
11
2
11


nnF
SS
nnF
n
Sn
n
Sn
ss
ss
即由假设 S12,S22独立,则由 F分布的定义 知
46
易知
.
).2(~
)1()1(
),1(~
)1(
),1(~
)1(
).1,0(~
11
)()(
21
2
2
2
22
2
2
11
2
2
2
2
22
1
2
2
2
11
21
21
相互独立与 VU
nn
SnSn
V
n
Sn
n
Sn
N
nn
YX
U


c
ss
c
s
c
s
s
mm
47
则按 t分布的定义 可知
).2(~
11
)()(
)2(
).2(~
)1()1(
).1,0(~
11
)()(
21
21
21
21
21
2
2
2
22
2
2
11
21
21





nnt
nn
S
YX
nnV
U
nn
SnSn
V
N
nn
YX
U
w
mm
c
ss
s
mm
48
作业 第六章 习题第 174页第 1,4题
49
请提问