§ 6.3 抽样分布
由于统计量是由样本决定的,而在一
次具体的抽样之前,样本中的每一个分量
都是随机变量,所以,在一次具体的抽样
之前,统计量也是随机变量,也有自己的
分布, 我们称统计量的分布为 抽样分布, 下
面,先介绍样本的频数分布,
一、样本的频数分布
将样本值中所有的不同数值由小到大排
列, 样本值中取这些值的频数分
别记为 (应有 ),这
样就可得到样本的 频数分布,
当样本容量较大时,可将样本值的范围划
分成若干个长度相等的间隔,然后计算样
本值落在这些间隔中的频数,再按上表列
出频数分布, 频数分布通常用样本 直方图
( Histogram)
??? ???
kxxx ?21
kmmm,,,21 ? nmmm k ???? ?21
除频数直方图外,有时还需考虑概率直方
图,它要求每个直方条的面积需等于相应
间隔上的样本频率,这样直方条的高度就
不再是频数了,并且所有直方条面积之和
等于 1,可见,概率直方图类似于概率密度
函数的图像, 更多的讨论这里就不再详述了,
图 6.5 样本直方图(采用 1000个模拟数据)
二、经验分布函数
对任意实数,定义
,(6-19)
则称其为样本 的 经验分布函数
( Empirical Distribution Function),
是对总体 X的分布函数 的一个经验模拟
并且可以验证它还具有分布函数的基本性
质:单调不减,右连续,,,
应当注意,当给定样本值 之后,
),( ?????x
),,,( 21 nXXX ?
)(xFn
)(xFn
0)( ???nF 1)( ???nF
),,,( 21 nxxx ?
是具有分布函数性质的普通阶梯形函数
(如图 6.6所示),但是对样本而言,它却
是与确定值 x有关的随机变量,因为对每个
给定的 x,值实际上就是在
该次抽样中事件 发生的频率(见
0
1
图 6, 6 经验分布函数
?
1x
?
2x
?
3x
?
4x ?5x
)( xF n
?
6x
}{ xX ?
( 6-19)式),它完全由样本决定,而样本
是随机的,所以,是随机变量, 的
这种双重性恰好反映了抽样前后不同的统
计观点,请注意领会, 进一步地,根据分布
函数的定义, 是事件 发
生的概率,又 恰是在 n次“试验” (抽样 )
中事件 发生的次数,这样,还有以
下结论:
( 1) ;
( 2)对任意给定的 x和任意的,有
)(xFn )(xFn
}{)( xXPxF ?? )(xF }{ xX ?
)(xnFn
}{ xX ?
))(,(~)( xFnBxFn n?
0??
,(6-20)
即,,(见定理 5.1的推论 2),
可见,当样本容量 n足够大时,事件
在一次抽样中几乎是必然发生的,根据实
际推断原理,从而抽样后得到的 一般
就可近似, 这也是 的一个重要应用,
关于 更深入的讨论见 [4],
另外,根据第三章讨论的随机变量最大值
和最小值的分布,还可获得 最大顺序
统计量和最小顺序统计量 的抽样分布,
1} |)()({|lim ????? ?xFxFP nn
)()( xFxF Pn ? ?? ??n
} |)()(| { ??? xFxF n
)(xFn
)(xF )(xFn
)(xFn
)(nX
)1(X
三、正态总体的抽样分布定理
一般地,要确定一个统计量的分布,
即抽样分布,并不是一件容易的事情, 不过,
当总体是正态总体(即总体 X服从正态分布)
时,一些常用统计量的分布却不难求
出.下面的两个抽样分布定理在数理统计
中占有极为重要的地位,必须牢固掌握.
定理 6.1(单个正态总体的抽样分布定理)
设 是取自正态总体
的
),,,( 21 nXXX ? ),( 2??N
一个样本,和 分别为样本均值和样本方
差,则
( 1) ; (6-21)
( 2) ; (6-22)
( 3) 与 相互独立; (6-23)
( 4), (6-24)
定理中的结论( 1)和( 4)可通过对比来
记忆.另外,还需强调的是,本定理只适
用于正态总体,对其它总体无效,
X 2S
)1,0(~ NnX ? ??
)1(~)1( 22
2
?? nSn ??
X 2S
)1(~ ?? ntnSX ?
定理 6.2(两个正态总体的抽样分布定理)
设 是取自总体 的样本,
是 取自总体的样本,且这两个样本
相互独立,则
( 1) ; (6-25)
( 2) 当 时,; (6-26)
( 3), (6-27)
其中 与, 与 分别为两个样本的样本
均值与样本方差,是‘合样本’
),,,( 121 nXXX ? ),(~ 211 ??NX
),,,( 221 nYYY ?
)1,0(~)()(
2
2
2
1
2
1
21 N
nn
YX
??
??
?
???
22221 ??? ??
)2(~)()( 21
21
2121 ??
?
??? nnt
nn
nn
S
YX
w
??
),1,1(~ 212
2
2
2
2
1
2
1 ?? nnF
S
S
?
?
X 21S Y 22S
wS
,,( 21 XX 1,nX? ),,,,
221 nYYY ?
的标准差,定义为
,(6-28)
2
)1()1(
21
2
22
2
11
??
???
?
nn
SnSn
S w