第六章 样本及抽样分布
随机样本
抽样分布
常用统计量
常用统计量的分布
§ 6.1 随机样本一、总体与样本
总体:研究对象的全体。
通常指研究对象的某项数量指标。
个体,组成总体的元素(每个可能的观察值)
总体容量:总体中包含的个体个数
有限总体,无限总体。
从本质上讲,总体就是所研究的随机变量或随机变量的分布。
总体中的每一个个体是随机试验的的一个观察值,
因此它是某一随机变量X的值一个总体对应于一个随机变量X。
总体的分布函数:X的分布函数,
总体的期望、方差:X的期望、方差。
对总体的研究方法:从总体中抽取一部分个体,根据获得的数据对总体的分布做出推断。
被抽出的部分个体叫做总体的一个样本。
从总体中抽取一个个体,就是对X进行一次观察并纪录其结果。
将结果记为X
1
,X
1
符合随机变量的三个特征。
X
1
是一个随机变量。X
1
与X同分布。
抽取n次,就是进行n次重复、独立的观察。
得到结果X
1
,X
2
,…,X
n

X
1
,X
2
,…,X
n
每个都是随机变量。每个都与X具有相同的分布。
简单随机样本:X
1
,X
2
,…,X
n
相互独立,
与总体X具有相同分布。
当n次观察一经完成,我们就得到一组实数
x
1
,x
2
,…,x
n
,它们是随机变量X
1
,X
2
,…,X
n
的观察值,
称为样本值。
n为样本容量。
简单随机样本定义:p158
放回式抽样与不放回式抽样:p158
来自总体X的随机样本 X
1
,

,X
n
可记为
),...(),(~,,
1
xFxfXXX
iid
n
或L
样本联合分布函数或密度函数为

=
=
n
i
in
xFxxxF
1
21
*
)(),,,( L

=
=
n
i
in
xfxxxf
1
21
*
)(),,,( L

3.总体、样本、样本观察值的关系总体理论分布样本观察值样本统计是从手中已有的资料——样本观察值,去推断总体的情况——总体分布。样本是联系两者的桥梁
。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体
§ 6.2 抽样分布一、统计量
定义( p159),设 X
1
,

,X
n
是来自总体 X的一个样本,g(X
1
,

,X
n
)是 X
1
,

,X
n
的函数,若 g(X
1
,

,
X
n
)不含未知参数,则称 g(X
1
,

,X
n
)是一个统计量。
g(x
1
,…,x
n
)是 g(X
1
,…,X
n
)的观察值
统计量是 X
1
,…,X
n
的函数,所以它是一个随机变量二、几个常用的统计量(P160):
,
1
.1
1

=
=
n
i
i
X
n
X样本均值
,)(
1
1
)(
1
1
.2
2
1
2
2
1
22
SS
XnX
n
XX
n
S
n
i
i
n
i
i
=
=?
=
∑∑
==
标准差样本均方差样本方差


=
=
=
=
n
i
k
i
k
n
i
k
i
k
XX
n
B
X
n
A
1
1
,)(
1
1
中心矩原点矩3.样本k阶矩经验分布函数 p161
S(x):
n
XXX,,,
21
L
中不大于x的随机变量的个数
∞<<?∞= xxS
n
xF
n
),(
1
)(
经验分布函数
)(1)(n xFxF
n
一致收敛于以概率时,当∞→
三、统计中常用的分布统计量的分布称为抽样分布。数理统计中常用到如下三个分布:
χ
2
—分布,t —分布,F—分布。
(一) χ
2
—分布
.
).(~),1,0(~,,.1
2
2
1
22
1
分布的称为自由度为则设构造
=

=
χ
χχ
n
nXNXX
n
i
i
iid
n
L
2.χ
2
—分布的密度函数f(y)曲线

>
=

Γ
0y,0
0y,ey
)y(f
2
y
1
2
n
)2/n(2
1
2/n
3,分位点:设 X~ χ
2
(n),对于给定的 α(0<α<1),
称满足 αχ
α
=≥ )}({
2
nXP
)(
2
n
α
χ
)(
2

的点为分布的上 α分位点。
α
)(
2
n
α
χ
查表可得复习p61
4.性质:(p164)
(1) χ
2
分布的可加性若X ~ χ
2
(n
1
),Y~ χ
2
(n
2
),
X,Y独立,则X+Y~ χ
2
(n
1
+n
2
)
(2) 期望与方差若X~ χ
2
(n),
则E(X)= n,D(X)=2n
(二) t—分布
1.构造若X~N(0,1),Y~χ
2
(n),X与Y独立,则
).(~
/
nt
nY
X
T =
t(n)称为自由度为n的t—分布。
t(n) 的概率密度为(p165)
∞<<∞?+
Γ
+
Γ
=
+
t
n
t
n
n
n
th
n
,)1(
)
2
(
)
2
1
(
)(
2
1
2
π
2.基本性质,
(1) h(t)关于t=0(纵轴)对称。
(2) h(t)的极限为N(0,1)的密度函数,即
3.分位点设 T~ t(n),对给定的
α(0<α<1),称满足
P{T≥t
α
(n)}=α的点 t
α
(n)为
t(n)的上 α分位点.
∞<<?∞==
∞→
xetth
t
n
,
2
1
)()(lim
2
2
π
)(nt
α
)()(
1
ntnt
αα
=
注:
)(
1
nt
α?
)(nt
α
可以查表得到,
当n>45 时,
)(nt
α
αα
znt ≈)(
(三) F—分布 
1.构造若U~ χ
2
(n
1
),V~ χ
2
(n
2
),U,V独立,则
).,(~
/
/
21
2
1
nnF
nV
nU
F =
称为第一自由度为n
1
,第二自由度为n
2
的F —
分布,其概率密度为

>
+ΓΓ
+
Γ
=
+
0y,0
0y,
)y
n
n
1)(
2
n
()(
y)n/n)(
2
nn
(
)y(h
2/)nn(
2
12
2
n
1
2
n
2/n
21
21
211
1
1
2,F—分布的分位点对于给定的 α( 0<α<1),称满足 P{ F≥F
α
(n
1
,n
2
)}=α
的点 F
α
(n
1
,n
2
)为 F(n
1
,n
2
)的上 α分位点。
),(
21
nnF
α
),(
1
),(
12
211
nnF
nnF
α
α
=
注:
α
α
=≥
1)},({
211
nnFFP
α
α
=≤
1}
),(
11
{
211
nnFF
P
),(~
1
12
nnF
F
α
α
=>
}
),(
11
{
211
nnFF
P
α
α
=> )},(
1
{
12
nnF
F
P
*证明,设 F~F(n
1
,n
2
),则得证!
351.0
85.2
1
)10,15(
1
)15,10(
05.0
95.0
===
F
F例例
),1(~)(~
2
nFXntX,求证已知证明:
.,1~
/
1/
/
)1(~
)(~)1,0(~
.
/
),(~
2
22
222
2
)(分布的定义,由
,而

nFXF
nY
Z
nY
Z
XZ
nYNZ
nY
Z
XntX

==
=∴
χ
χ
Q
四,与 的数值特征与分布X
2
S

=
=
n
i
i
XX
n
S
1
22
)(
1
1

=
=
n
i
i
X
n
X
1
1
(一)无论总体X服从何种分布,设E(X)、D(X)存在
μ== )()(.1 XEXE
n
XD
n
XD
2
)(
1
)(.2
σ
==
证明:见 P145,line 3
22
)()(.3 σ== XDSE
证明:见 P168(2.20)式。
(二)当总体服从正态分布时,与 的分布有以下结论。
2
S
X
),(~),,(~,,.1
2
2
1
n
NXNXX
iid
n
σ
μσμ则若定理L
证明:

=
=
n
i
i
X
n
X
1
1
是n 个独立的正态随机变量的线性组合,故服从正态分布
n
XD
2
)(
σ
=
μ=)(XE
),(~
2
n
NX
σ
μ∴
)1,0(~
/
N
n
X
σ
μ?
*注,对于一般的总体,由独立同分布中心极限定理,可以证明(p148):
当n充分大时,
)1,0(~
/
N
n
X
σ
μ?
近似地
),(~
2
n
NX
σ
μ
近似地复习,已知 X~N(0,1),求各个概率值
1,P{X<a}= Φ(a)。 a>0,直接查正态分布表
a<0,Φ(a)= 1- Φ(- a);
2,P{a<X<b}= Φ(b)- Φ(a),P{X>b}=1- Φ(b)。
3,P{|X|<a}=2 Φ(a)-1。
解,
)1,0(~
/5
40
N
n
X?
X
例,设总体 X~N(40,25),(1)抽取容量为 36的样本,
求样本均值在 38与 43之间的概率。 (2)抽取多少样本,
才能使 P{| --40|<1}达到 95%?
(1) n=36
99164.0)9918.01(99984.0
)4.2()6.3(
6/5
4043
6/5
40
6/5
4038
}4338{
==
Φ?Φ=

<
<
=
<<
X
P
XP
(2) n未知
)1,0(~
/5
40
N
n
X?
95.01
/5
1
2
/5
1
/5
40
}1|40{|
≥?
Φ=
<
=<?
n
nn
X
PXP
96.1
/5
1

n
975.0
/5
1
≥?
Φ
n
9704.96 =?≥ nn;)1(
),,(~,,.2
2
2
1
相互独立与则若定理
SX
NXX
iid
n
σμL
);1(~
)1(
)2(
2
2
2
2
= n
Sn
χ
σ
χ
*例:在正态总体之中抽取20个样本,求
≤?≤

=
6.38)(
1
7.11
20
1
2
2
i
i
XXP
σ
2
2
20
1
2
2
)1(
)(
1
σσ
Sn
XXY
i
i
=?=

=
解:设
.895.0005.09.0
}6.38{}7.11{
}6.387.11{
).120(~
2
=?=
≥?≥=
≤≤
YPYP
YP
Y χ
).1(~
/
nt
nS
X μ
则若定理),,(~,,.3
2
1
σμNXX
iid
n
L
)1,0(~
/
N
n
X
U
σ
μ?
=Q
证明:
);1(~
)1(
2
2
2
= n
Sn
V χ
σ
且U与V独立,根据t分布的构造
)1(~
)1(
nt
n
V
U
得证!
);1,1(~
/
/
)1(
.
),,(~,,),,(~,,.4
21
2
2
2
2
2
1
2
1
2
221
2
111
2
1
= nnF
S
S
F
NYYNXX
iid
n
iid
n
σ
σ
σμσμ
则且两样本独立定理LL
2
21
2
22
2
11
2
21
21
21
2
2
2
1
.
2
)1()1(
).1,1(~
/1/1
)(
,,,)2(
www
w
SS
nn
SnSn
S
nnt
nnS
YX
T
=
+
+?
=

+

=
=
其中就有假定进一步
μμ
σσ
例:设总体X~N(10,3
2
),X
1
,

,X
6
是它的一个样本

=
=
6
1i
i
XZ
(1)写出Z所服从的分布;求P(Z>11).
(2)写出 所服从的分布;求P( >11).
X X
解,(1)
).96,106(~ ××NZ
1)668.6()]668.6(1[1)668.6(1
668.6
54
60
1668.6
54
60
54
6011
54
60
}11{
≈Φ=Φ=?Φ?=

=
>
=

>
=>
Z
P
Z
P
Z
PZP
).
6
9
,10(~ NX
(2)
2106.07939.01)8165.0(1
8165.0
5.1
10
18165.0
5.1
10
5.1
1011
5.1
10
}11{
=?=Φ?=

=
>
=

>
=>
X
P
X
P
X
PXP
例:设 X
1,

X
n
是取自 N(μ,σ
2
)的样本,
*(1) 求样本方差S
2
的期望与方差。
2
2
/
/


nS
X
n
X
μ
σ
μ
的分布与求
22
//
)2(


nS
X
n
X μ
σ
μ

2
(1)
~F(1,n-1)
).1(~
/
nt
nS
X μ
)1,0(~
/
N
n
X
σ
μ?
解,(2)
*(1)
.
1
2
)(
),1(2)(
1)1(
),1(2
)1(
),1(~
)1(
4
2
2
2
22
2
2
2
2
2
2
=
=
=
=

n
SD
nSD
nSn
D
n
Sn
D
n
Sn
σ
σσ
σ
χ
σ
Q
例:考题 P126,填充题 7。
).1(~)(
,),0(~
22
21
21
2
χ
σ
XXaa
XXNX
=时,
是样本。则当常数,设解:
).1(~
2
),1,0(~
2
),2,0(~
2
2
21
21
2
21
χ
σ
σ
σ
XX
N
XX
NXX
2
2
1
σ
=∴a
*练习1:
X
)43()2(
)2,0(
2
2
43
2
21
2
4321
分布?自由度为多少服从为何值时,、当

的简单随机样本。是来自正态总体设
χba
XXbXXaX
NXXXX
+?=
*练习2:
的分布。求统计量的简单随机样本。是来自正态总体设

=
=
4
1
2
21
2
4321
)(2
))
2
1
(,0(
i
i
X
XX
Y
NXXXX
*练习 1答案:
。同理,
。得
,而由
,分布,应有要服从与总体同分布,
100
1
),1,0(~)43(
20
1
),20,0(~)2(
)20,0(~2
)1,0(~)2(
)164,00(~2),42,0(~2
)4,0(~),4,0(~
43
21
21
21
2
21
2
2
21
=?
=∴?


bNXXb
aaNXXa
NXX
NXXaX
NXXNX
NXNXX
i
χ
Q
*练习 2答案:

。。故
,。而
,,,,,对
)4(~
)(2
)4(~
2/1
2/1
0
)1,0(~
2/1
0
))
2
1
()
2
1
(,0(~)4(~
2/1
)1,0(~
2/1
0
))
2
1
(,0(~4,,1
4
1
2
21
4
1
2
21
21
22
21
4
1
2
2
2
t
X
XX
Y
t
X
XX
N
XX
NXX
X
N
X
NXiX
i
i
i
i
i
i
i
ii



=
=
=
=∴



+?
=
χ
L