§ 6.2 三大统计分布
本节介绍数理统计中的三个著名分布,
它们在参数估计和假设检验等统计推断问
题中有广泛应用,
一,X平方 -分布
定义 6.1 设随机变量 独立且服从相同
分布,则称 (6-8)
所服从的分布是 自由度为 n的 -分布,
记为,称 为 -变量, 为纪念英国著
名统计学家皮尔( K.Pearson,1857-1936)
nXXX,,,21 ?
)1,0(N ?
?
?????
n
i
nin XXXX
1
22
2
2
1
22 ??
2?
)(~ 22 nn ?? 2n? 2?
- 分布也称为皮尔逊 -分布, 这是数理统计中
一个十分重要的概率分布,
根据独立随机变量和的密度公式 (3-27)和数学
归纳法,可以证明,-分布的概率密度函
数为(详见 [5])
,( 6-9)
其中 是 -函数,定义见第四章附录 2,图
6.1是 -变量的概率密度函数 (6-9)在几种不
同参数下的图像,
2? 2?
)(2 n?
?
?
?
?
?
?
?
?
??
0,0
0,
)(Γ2
1
)(
22
2
1
2
x
xex
xf
xn
n
n
n
)(Γx Γ
2?
特别地,当 时,服从参数 的指数
分布, 此外,-分布具有以下性质:
( 1)数字特征, 若,则
,,
( 2)可加性, 若
且 与 独立,则
,(6-10)
2?n 22?
2
1??
2?
)(~ 22 nn ??
nE n ?2? nD n 22 ??
)(~ 121 nX ?
)(~ 222 nX ? 1X 2X
)(~ 21221 nnXX ?? ?
为便于今后的应用,现在我们引入 上侧分
位数 的概念, 所谓一个分布的 -上侧分位数
就是指这样一个数,它使相应分布的随机
变量不小于该数的概率为, 比如,若记 -
变量 的 -上侧分位数为,则满足(见图
6.2),
?
? 2?
2
n? ?
图 6.2
)(2 n??
?
)( xf n
x
对不太大的 n,如 60,可用附表 3查 的
值,而对较大的 n,则可用( 6-11)近似计
算
,(6-12)
其中 是标准正态分布 的 -上侧分位
数,可通过附表 2查出,
?n )(2 n??
??? Unnn 2)(
2 ??
?U )1,0(N ?
二,t -分布
定义 6.2 设,, X与 Y独立,
则称 (6-13) 所服从的分布是
自由度为 n的 t-分布,记作, t -分布
也称为 学生分布,是英国统计学家戈塞特
( Goset,1876-1937)在 1908年,Student”
的笔名首次发表的,这个分布在数理统计
中也占有重要的地位,
根据独立随机变量商的密度公式 (3-32),
可以证明(过程从略),(6-13)中的
概率密度函数为
)1,0(~ NX )(~ 2 nY ?
nY
XT
n /?
)(~ ntT n
nT
根据独立随机变量商的密度公式 (3-32),可
以证明(过程从略),(6-13)中 的概率
密度函数为
,,(6-14)
另外,t -分布具有以下性质:
( 1)(近似标准正态) 当 时,
这就是说,当 n充分大时,t -分布 近似于
标准正态分布,但如果 n较小,这两
个分布的差别还是比较大的,见图 6.3,
nT
2
1
2
2
2
1
1
)(Γ
)(Γ)(
??
?
???
?
???
? ??
n
n
n
n n
x
n
xf
?
?????? x
??n 2
2
2
1)()( x
n exxf
?
??
?
?
)(nt
)1,0(N
其中粗虚线是 的密度函数, 我们
看到,所有的 t -分布密度函数值在 附近
均未超过的值,而在两边的尾部均超过
了的值, 这就是统计学中所谓的“重尾”
( Heavy Trails)现象,
)1,0(N )(x?
0?x
)(x?
-3 -2 -1 0 1 2 3
0
0, 1
0, 2
0, 3
0, 4
N ( 0,1 )
n = 1 0
n = 5
n = 2
n = 1
图 6, 3 t - 分布的概率密度函数
)( xf n
x
( 2)(数字特征)若,,则
顺便指出,自由度为 1的 t -分布也称为 柯西
( Cauchy) 分布,它以其数学期望和方差
均不存在而闻名(见例 4.3),
记 t -分布 的 -上侧分位数为,附表 4
给出了不同 n和 所对应的 数值, 另外,
由性质( 1)知,对较大的 n(比如 60)
,可用下式近似
,(6-15)
)(~ ntT n 2 ?n
.2,0 ??? n nDTET nn
)(nt ? )(nt
?
? )(nt?
?n
?? Unt ?)(
三,F -分布
定义 6.3 设 且 X与 Y独立,则称
(6-16)
所服从的分布是 自由度为 的 F-分布,
记作,这是为纪念英国著名统计学家费歇
( R.A,Fisher,1890-1962)而命名的,F-分布也
是数理统计的一个重要分布,
注意到 (6-16)的商结构,则根据随机变量商的
密度计算公式( 3-34)可求得 F-分布
的概率密度函数为(过程从略,详见 [3,4])
)(~ ),(~ 2212 nYnX ??
2
1
/
/
nY
nXF ?
),( 21 nn
),(~ 21 nnFF
),( 21 nnF
,(6-17)
图 6.4是四组不同参数下该密度函数的图像,
?
?
?
??
?
?
?
???
?
?
??
?
?
???
?
?
??
?
?
??
?
?
??
?
?
?
?
???
0,0
0,1
)(Γ)(Γ
)(Γ
)(
2
21
2
1
21
21
21
2
1
1
2
1
2
1
22
2
,
x
xx
n
n
x
n
n
n
n
xf
nnn
nn
nn
nn
0 1 2 3 4 5
0, 0
0, 2
0, 4
0, 6
0, 8
1, 0
10,20 21 ?? nn
图 6, 4 F 分布的概率密度函数
x
10,5 21 ?? nn
5,5 21 ?? nn
5,1 21 ?? nn
另外,由定义 6.3,立即有以下结论:
若,则,
这个结论可用于计算分布 的 -上侧
分位数, 具体地说,我们有
,(6-18)
事实上,由, 以及上
侧分位数的定义可推出
),(~ 21 nnFF ),(~1 12 nnFF
),(~1 12 nnFF ?
),( 21 nnF ?
),(
1),(
121
21 nnFnnF
a?
??
),(~ 21 nnFF ),(~1 12 nnFF
?
?
?
?
?
? ??
?
?
?
?
?
? ?
?
?
),(1
),(
1
121
121
nnF
F
P
nnF
FP ?
?
?
?
?
?
?
? ???
? ),(
1
1 121 nnF
F
P ?
?? ???? )1(1
故 (6-18)式成立,
对较小的 (如 0.1,0.05,0.025等),
的数值可由附表 5查得, 但附表 5并未给出较
大时的数值,此时,可用公式 (6-18)求出
,
? ),( 21 nnF?
),( 21 nnF ?