第 6.1— 6.2节 数理统计学中的基本概念
数理统计的任务, 观察现象,收集资料,创
建方法,分析推断。
统计推断, 伴随着一定概率的推测。其特点
是,由“部分”推断“整体”。
总体,研究对象的全体 (整体 )。
个体,每一个研究对象 。实际上是对总体的
一次观察。
?
有限总体
无限总体
第六章 随机样本及抽样分布
总体
等同于
相应的随机变量
的全体
研究对象
体现为
量指标值的全体
研究对象的某项数
可看作
取值的全体
某个随机变量
样本, 由部分个体构成的集合。经常说,来
自 (或取自 )某总体的样本。
样本具有二重性, 在抽样前,它是随机向量,
在抽样后,它是数值向量 (随机向量的取值 )。
样本选择方式,(1)有放回抽样,(2)无放回抽样
特别,样本容量 <<总体数量时,无放回抽样可
近似看作有放回抽样,
简单随机样本 (s.r.s),具有两个特点的样本, 代表
性 (组成样本的每个个体与总体同分布 ),独立性 (组
成样本的个体间相互独立 )。
样本容量, 样本中所含个体的个数。
如,检验一批灯泡的质量,从中选择 100只,则
总体,这批灯泡 (有限总体 )
个体,这批灯泡中的每一只
样本,抽取的 100只灯泡 (简单随机样本 )
样本容量,100
样本观测值, x1,x2,…,x 100
定义,设 X为一随机变量,其分布函数为 F(x),X1,X2,…,X n是一
组 独立且与 X同分布 的随机变量,称 X为 总体 ;(X1,X2,…,X n)
为来自总体 X(或分布函数 F(x))的简单随机样本 ;n为 样本容
量 ; 在依次观测中,样本的具体观测值 x1,x2,…,x n称为 样本值
X
X1,X2,…,X 100
100
样本值
注意,样本是一组独立同总体分布相同的随机变量,
总体 选择个体 样本 观测样本 样本观察值 (数据 )
数据处理 样本有关结论
统计的一般步骤,
推断总体性质 统计 量
为了集中简单随机样本所带来的总体信息,考
虑样本的函数,且不含任何未知参数,这样的
“不含 未知 参数的样本的函数”称为统计量。
是来自总体 例 6.2.1 设
nXXX,,,21 ? ),(
2??N
未知,则 ( )不是统计量。? ?的 s.r.s,其中 已知,
n21
22
2
2
1
n
1i
2
σ
μX
n
1
n
1i
2
in
1
n
1i
2
in
1
n
1i
in
1
...XXX2[ 6]σXX[ 5])([ 4]
)X(X[ 3])(X[ 2]X[ 1]
i ???
???
?
???
?
?
???
统计量
定义,设 X1,X2,…,Xn是来自总体 X的一个样
本,g(X1,X2,…,Xn)是 n维随机变量的函数,若 g中除
样本的函数外不含任何未知参数,则称
g(X1,X2,…,Xn)为 统计量,
统计量的分布称为 抽样分布,
① 样本均值
常用统计量,
② 样本方差
③ 样本标准差
④ 样本 k阶原点矩
⑤ 样本 k阶中心矩
?
?
?
n
1i
iXn
1X
?
?
???
n
1i
2
i
2 )XX(
1n
1S
?
?
?
?
?
n
1i
2
i )XX(1n
1S
?
?
?
n
1i
k
ik Xn
1A
?
?
??
n
1i
k
ik )XX(n
1B
(6) 顺序统计量与样本分布函数
设 X1,X2,…,X n的观察值为 x1,x2,…,x n,从小到大排序得到,
x(1),x(2),…,x (n),定义 X(k)=x(k),由此得到的 (X(1),X(2),…,X (n))
或它们的函数都称为顺序统计量,显然 X(1)? X(2) ? … ? X(n)
且有 X(1)=min (X(1),X(2),…,X (n)),X(n)=max(X(1),X(2),…,X (n))
))X,,X( m i n (m a xX 1kn1
1kn1 ii)i,,i()k( ????
? ??
1) 样本中位数
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
为偶数
为奇数
n,XX
2
1
n,X
Md
1
2
n
2
n
)
2
1n
( 2) 样本极差
R= X(n)- X(1)
样本分布函数 (经验分布函数 )
?
?
?
?
?
?
?
?
????
?
?
?
?
)n(
)1k()k(
)1(
n
xx,1
)1n,,2,1k(,xxx,
n
k
xx,0
)x(F ?
}xX{Pp
),p,n(B,)x(nF n
??
?
这里
服从二项分布是一个随机变量
格里汶科定理,
设总体 X的分布是 F(x),则下式成立
10)()(s u plim ?
??
?
??
? ??
?
??
?
? ??
????????
xFxFP n
xn
第 6.3节 抽样分布
一、样本均值的分布
定理:设 X1,X2,…X n是来自总体 N(?,?2)的样本,X
是样本均值,则有
???
?
???
? ??
n,N~X
2
注,在大样本情况下,无论总体服从何种分布均有
???
?
???
? ??
n,N~X
2
二、顺序统计量的分布
1、( X( 1), X( 2) …X (n))的概率密度函数为
? ? ? ?
??
??
? ???
? ??
其它

,0
xxx,xfnx,,x,xg n21
n
1i
i
n21
??
2、样本中位数的概率密度函数为
? ? ? ?? ? ? ?? ? ? ?xfxF1xF
1]2n[n]2n[
nxf 1]
2
n[n]
2
n[
Md
???
?
?
??
?
? ??
?
!!

3、样本极差的概率密度函数为
? ? ? ? ? ? ? ?? ? ? ? ? ?
??
??? ?????? ? ?? ?
其它,0
0x,dttftxftFtxF1nnxf
0
2n
R
其中
? ? ? ?? ??? x dttfxF
??? ? )z(
z?
1-α
例 6.3.1 设 X~N(0,1),?
分别为 0.95,0.975,0.75,求 X
关于 ?的 100 ? %分位数,
X
φ(x)
三、标准正态分布及其 100 ? %分位数
定义,设 X~N(0,1),对任意 0<?<1,若 P{X<λ}= ?,则称 λ为标
准正态分布的 100 ? % 分位数,记为
??? z
解, ? =0.95时,
95.0)z( 95.0 ??
反查表得, z0.95=1.64
类似可得, z0.975=1.96,z0.75=0.69
- z?
分布及其性质 2?
1.定义, 称 n 个相互独立同标准正态分布的随机变量
的平方和 X的分布为自由度为 n的 分布,记作 2?
)n(~X 2?
(2 ) X1,X2,…X k独立,Xi~ (ni),(i=1,2,…,k),则 2?
)n...nn(~X k212
k
1i
i ?????
?
2.性质, (1) X 1,X2,…X n独立,Xi~N(0,1),(i=1,2,…,n),则
)n(~X 2
n
1i
2
i ??
?
(3) X1,X2,…X n为来自总体 N(?,?2)的简单随机样本,则
四,
? ?n~X 2n
1i
2
i ??
?
??
?
?
?
???
?
( 4) ? ? ? ? n2)n(D,n)n(E 22 ????
例 6.3.2 设 是来自总体
的 s.r.s,则 服从 ( )分布。 n
XXX,,,21 ? ),( 2??N
?
?
?
n
i
X i
1
2)(
?
?
例 6.3.3 (983) 设 是取自总体
N (0,4) 的 s.r.s,
当 a=,b= 时,).2(~ 2?X
243221 )43()2( XXbXXaX ????
4321,,,XXXX
解 (1)服从 )n(2? (2)由题意得
??
?
?
?
?
?
)1,0(N~)X4X3(b
)1,0(N~)X2X(a
43
21
??
?
?
?
??
??
1)]X4X3(b[D
1)]X2X(a[D
43
21
?
a =1/20
b=1/100
3,的密度曲线 )(2 n?
X
f(x)
n=1
n=4
n=10
随着 n的增大,密度曲线逐渐趋于平缓,对称,
4,分布的 100 ?%分位数 2
?
定义,设,对于给定的 ?(0< ? <1),若 P{X<λ}= ?,
则称 λ为自由度为 n的 分布的 100?%分位数,记为
)(~ 2 nX ?
2?
)n(2????
X
f(x)
??1
)n(2??
查表求 100?%分位数,
(1)若 P{X<λ}= ?,则
)n(2????
(1)若 P{X>λ}= ?,则
)n(21 ?????
例 6.3.4.设 X~ (10),P{X>λ1}=0.025,P{X<λ2}=0.05,求 λ1,
λ2,
2?
解, )10(29 7 5.01 ??? 查表得, 483.20
1 ??
)10(205.02 ??? 查表得, 940.32 ??
五,t 分布及其性质
1.定义 设随机变量,随机变量,Y 且
它们互相独立,则称随机变量
的分布为自由度是 n 的 t 分布,记作
)1,0(N~X )n(~ 2?
).n(t~t
n
Y/XT ?
可以证明 t分布的概率密度函数为
)t( )
n
t
1(
)
2
n
(n
2
)1n(
)t(h 2
1n2
???????
??
?
?
?
?
?
? ?
?
?
?
?
特点, 关于 y轴对称 ;随着自由度的逐渐增大,
密度曲线逐渐接近于标准正态密度曲线,
2.t分布的密度曲线,
X
f(x)
3,t分布的性质
2
t
n
2
e
2
1)t(hlim ?
?? ?
?( 1)
( 2) )2n(
2n
n)T(D,0)T(E ?
???
( 3) h(t)的图形关于 Y轴对称
)n(t?
4,t分布的 100α%分位数,
X
f(x)
对于给定 α (0< α <1),若 P{t(n) <λ}= α,则称 λ为 t分布的
100α%分位数,记为, )n(t
???
1-α
例 6.3.5,设 t~t(15),求 (1)α=0.995 (2)α=0.005的 100α%分
位数 ;
解,(1)λ=t0.995(15),查表得 λ=2.9467
(2)λ=t0.005(15),查表得 λ=-2.9467
注,
)n(t)n(t 1 ??? ??
例 6.3.6(974) 设随机变量 X 和 Y 相
互独立且都服从正态分布,而
和 分别是来自总体 X 和 Y 的 s.r.s,则

计量 服从 ( )分布,参数为 ( ),
)9,0(N 91,,XX ?
91,,YY ?
2
9
2
1
91
YY
XX
U
??
??
?
?
?
t 9
解, ),1,0(N~X
9
1X 9
1i
i?
?
? )1,0(N~3Y i
故 )9(~Y
9
1)
3
Y(Y 29
1i
2
i
9
1i
2i ??? ??
??
与 独立,YX
所以 )9(t~
9/Y
XU ?
六,F 分布及其性质
1.定义 设随机变量 随机变量 且
它们相互独立,则称随机变量 的分布为自
由度是 的 F 分布。记作
),n(~U 12? ),n(~V 22?
2
1
n/V
n/UF ?
)n,n( 21 )n,n(F~F 21
可以证明,)n,n(F 21 的概率密度函数为
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
??
?
?
0y 0,
0y,
n
yn
1)
2
n
()
2
n
(
y
n
n
2
nn
)y(
2
nn
2
121
1
2
n
2
n
2
121
21
1
1
2.F分布的概率密度曲线
3.性质, )n,n(F~
F
1),n,n(F~X)1(
1221 则若
25n,10n 21 ??
5n,10n 21 ??
yO
)y(?
则若 ),n,n(F~X)2( 21
)2n(2n n)F(E 2
2
2 ?
??
? ?
? ? ? ? )4n(4n2nn
4n2n2n)F(D
2
2
2
21
21
2
2 ?
??
???
4.F分布的 100α%分位数
X
f(x)
设 F~,对于给定
α(0<α<1),若 P{F<λ}=α,
则称 λ为 F分布的
100α%分位数,记为,
),( 21 nnF
)n,n(F 21???
??1
)n,n(F 21?
5,100α%分位数的计算
(1)若 P{F<λ}=α,则 )n,n(F
21???
(2)若 P{F<λ}=α(α比较小 ),则 P{1/F<1/λ}=1-α,
)]n,n(F~F[ 21
)n,n(F1 121 ???? 故 )n,n(F 1
121 ??
??
例 6.3.7 设 F~ F(24,15),分别求满足
.025.0}F{P)3(;95.0}F{P)2(;025.0}F{P)1(
????
??????

解 (1)λ=F0.975(24,15)
=2.29 (2) λ=F0.95(24,15)
=2.70
(3) α比较小,P{1/F<1/λ}=0.975
44.2)24,15(F1 9 7 5.0 ???
所以 λ=0.41
七、抽样分布基本定理
1、设 是来自总体 的 s.r.s,
表示样本均值,则
nXXX,,,21 ? ),( 2??N
X
),(N~X
2
?
??
)1,0(N~
n/
X
?
??
2、设 X~N(μ1,σ12),Y~ N(μ2,σ22),X,Y相互独立,从中
分别抽取容量为 n1,n2的样本,样本均值分别记为 Y,X
)
n
,(N~Y),
n
,(N~X
2
2
2
2
1
2
1
1
????
,)YX(E 21 ?????
2
2
2
1
2
1
nn
YDXD)YX(D ???????
)
nn
,(N~YX
2
2
2
1
2
1
21
???????
)1,0(N~
nn
)()YX(
2
2
2
1
2
1
21
?
?
?
?????
3,定理 6.3.3
设 X1,X2,…,X n是来自总体 ),(N 2?? 的样本,2S,X
分别是样本均值和样本方差,则有
)1n(~S)1n(.1 22 2 ????
相互独立与 2SX.2
注:由
)1n(2S)1n(D,1nS)1n(E 2
2
2
2
????
?
?
???
?
?
???
???
?
???
?
?
?
可得
? ? ? ? 1n2SD,SE 4222 ?????
4,定理 6.3.4
设 X1,X2,…,X n是来自总体 ),(N 2?? 的样本,2S,X
分别是样本均值和样本方差,则有
)1n(t~
n
S
X ???
例 6.3.8(993) 设 是来自正态总体 X
的 s.r.s,91
,,XX ?
S
)YY(2
9
7i
2
2i2
12
9873
1
2616
1
1
21Z,)YX(S
),XXX(Y),XX(Y
?
?
???
??????
?
?
证明,统计量 Z~t (2)
4,定理 6.3.5

1n21 X,,X,X ?

2n21 Y,,Y,Y ?
分别是来自总体 X,Y的样本
且这两个样本是独立的,),(N~Y),,(N~X 222211 ????

??
??
??
21 n
1i
i
2
n
1i
i
1
Yn1Y,Xn1X
? ??
?
???
1n
1i
2
i
1
2
1 XX1n
1S ? ??
?
??? 2
n
1i
2
i
2
2
2 YY1n
1S
则有
)1n,1n(F~
21S
S
2
2
2
2
2
1
2
1
??
?
?
注, 若 22221 ????? 记
2nn
S)1n(S)1n(S
21
2
22
2
112
w ??
????
则有
? ?1n,1nF~SS.1 212
2
2
1 ??
)2nn(t~
n
1
n
1
S
)()YX(
.2 21
21
w
21 ??
?
?????
3, E x c e l 实现
( 1 ) 利用 E x c e l 计算样本均值、样本方差、样本标准差
S t e p 1 在 E x c e l 数据编辑窗口中,建立数据文件
S t e p 2 计算样本平均——调用 A V E R A G E 函数:
S t e p 3 计算样本方差——调用 V A R 函数
S t e p 4 计算样本标准差——调用 S T D E V 函数:
( 2 ) 利用 E x c e l 计算四大分布的分位数
① 计算标准正态分布的上侧 ? 分位数
)1(N O R M S I NVz ?? ??
② 计算 )(2 n? 的上侧 ? 分位数
)n,(C H I I N V)n(2 ?? ? ?
③ 计算 )( nt 的上侧 ? 分位数
)n,2(T IN V)n(t ?? ?
④ 计算 ),( 21 nnF 的上侧 ? 分位数
)n,n,(F I N V)n,n(F 2121 ?? ?