上一页 下一页湘潭大学数学与计算科学学院 1
§ 2.4 次序统计量及其分布
一 次序统计量
设 ? ?
n
XXX,,,
21
? 是从总体 X 中抽取的一个样本,
记 ? ?
n
xxx,,,
21
? 为样本的一个观测值,将观测值的各
个分量按由小到大的递增序列重新排列为
( 1 ) ( 2 ) ( ),nx x x? ? ?L
当 ? ?
n
XXX,,,
21
? 取值为 ? ?
n
xxx,,,
21
? 时,定义 () kX 取
值为 () ( 1,2,,),kx k n? L 由此得到的 ( 1 ) ( 2 ) ( )(,,,)nX X XL 称为
样本 ? ?
n
XXX,,,
21
? 的 次序统计量 。
上一页 下一页湘潭大学数学与计算科学学院 2
显然有
( 1 ) ( 2 ) ( )nX X X? ? ?L
其中 ( 1 )
1
m i n
i
in
XX
??
? 称为 最小次序统计量,它的值 ( 1 )x 是样本
值中最小的一个;而 ()
1
m a x
ni
in
XX
??
? 称为 最大次序统计量,
它的值 () nx 是样本值中最大的一个。
由于次序统计量的每一个分量 () kX 都是样本
? ?
n
XXX,,,
21
? 的函数,所以 ( 1 ) ( 2 ) ( ),,,nX X XL 也都是随机
变量。样本 ? ?
n
XXX,,,
21
? 是相互独立的,但其次序统
计量 ( 1 ) ( 2 ) ( )(,,,)nX X XL 一般不是独立的。
上一页 下一页湘潭大学数学与计算科学学院 3
定义 样本
n
XXX,,,
21
? 按由小到大的顺序重排为
( 1 ) ( 2 ) ( )n
X X X? ? ?L
则称 ( 1 ) ( 2 ) ( )(,,,)nX X XL 为样本 (
n
XXX,,,
21
? )的 次序统计
量, () k
X
称为样本的第 k 个次序统计量。
定理 次序统计量是充分统计量 。
证明 当给定 ( 1 ) ( 1 ) ( ) ( ),,nnX x X x?? L 时,由于 nXXX,,,21 ?
独立同分布,所以
1 ( 1 ) ( )
1(,,)
!ni i nP X x X x n? ? ?L
此条件分布与总体分布无关,故次序统计量是充分统计量。
上一页 下一页湘潭大学数学与计算科学学院 4
定理 设总体 X 的分布密度为 f ( x) ( 分布函数为 F ( x) ),
n
XXX,,,
21
? 为样本,则第 k 个次序统计量 () kX 的分布
密度为
()
1!( ) [ ( ) ] [ 1 ( ) ] ( ),1,2,,.
( 1 ) ! ( ) !k
k n k
X
nf x F x F x f x k n
k n k
??? ? ?
?? L特别,最小次序统计量
( 1 )X 和最 大次序统计量 () nX 的分布
密度为
( 1 )
()
1
1
( ) [ 1 ( ) ] ( ),
( ) [ ( ) ] ( ),
n
n
X
n
X
f x n F x f x
f x n F x f x
?
?
??
?
上一页 下一页湘潭大学数学与计算科学学院 5
定理 设总体 X 的分布密度为 f( x) ( 分布函数为 F(x) ),
n
XXX,,,
21
? 为其样本,则次序统计量的分布密度为
( 1 ) ( 2 ) ( )
(,,,)
n
X X XL
的联合分布密度为
12
112
! ( ),
(,,,)
0,
n
in
in
n f y y y y
f y y y ?
?
? ? ??
? ?
?
?
? LL
其 他
上一页 下一页湘潭大学数学与计算科学学院 6
定理 设总体 X 的分布密度为 f( x) ( 分布函数为 F(x) ),
n
XXX,,,
21
? 为其样本,则次序统计量的分布密度为
( 1 ) ( )(,)nXX 的联合分布密度为
( 1 ) ( 2 )
2
(,)
( 1 ) [ ( ) ( ) ] ( ) ( ),,(,)
0,,
n
XX
n n F y F x f x f y x yf x y
xy
?? ? ? ?
? ? ?
?
上一页 下一页湘潭大学数学与计算科学学院 7
二、样本中位数和样本极差
设( nXXX,,,21 ? )是总体 X 中的样本, ( 1 ) ( 2 ) ( )(,,,)nX X XL
为其次序统计量,则样本中位数定义为
°
1
()
2
1
( ) ( )
22
1
[]
2
n
nn
Xn
X
X X n
?
?
?
??
? ?
??
??
,奇
,偶
它的值为
%
1
()
2
1
( ) ( )
22
1
[]
2
n
nn
xn
x
x x n
?
?
?
??
? ?
??
??
,奇
,偶
上一页 下一页湘潭大学数学与计算科学学院 8
样本中位数与样本均值一样是刻划样本位置特征的量,
而且样本中位数的计算方便并不受样本异常值的影响,
所以有时比样本均值更有代表性。
样本极差 定义为
( ) ( 1 ) 11m a x m i n,n i iininR X X X X????? ? ? ?
它的值为
( ) ( 1 ) 11m a x m i n,n i iininr x x x x????? ? ? ?
样本极差与样本方差一样是反映样本值变化幅度或离
散程度的数字特征, 而且计算方便, 所以在实际中有
广泛的应用 。
上一页 下一页湘潭大学数学与计算科学学院 9
例 从总体中抽取容量为 6的样本, 测得样本值为
32,65,28,35,30,29,
由小到大排列为
28,29,30,32,35,65;
则样本中位数为:
% ( 3 ) ( 4 )1 [ ] 3 1 ;2x x x? ? ?
而样本均值为:
6
1
1 3 6,5 ;
6 iixx ????
上一页 下一页湘潭大学数学与计算科学学院 10
样本均值 x 大于样本值 6 个数中的 5 个数,这
是因为样本值 65 比其它值大许多,可见样本均值
对异常值或极端值较敏感,而样本中位数则不受异
常值影响,所以有时候估计总体均值用样本中位数
比用样本均值效果更好。
§ 2.4 次序统计量及其分布
一 次序统计量
设 ? ?
n
XXX,,,
21
? 是从总体 X 中抽取的一个样本,
记 ? ?
n
xxx,,,
21
? 为样本的一个观测值,将观测值的各
个分量按由小到大的递增序列重新排列为
( 1 ) ( 2 ) ( ),nx x x? ? ?L
当 ? ?
n
XXX,,,
21
? 取值为 ? ?
n
xxx,,,
21
? 时,定义 () kX 取
值为 () ( 1,2,,),kx k n? L 由此得到的 ( 1 ) ( 2 ) ( )(,,,)nX X XL 称为
样本 ? ?
n
XXX,,,
21
? 的 次序统计量 。
上一页 下一页湘潭大学数学与计算科学学院 2
显然有
( 1 ) ( 2 ) ( )nX X X? ? ?L
其中 ( 1 )
1
m i n
i
in
XX
??
? 称为 最小次序统计量,它的值 ( 1 )x 是样本
值中最小的一个;而 ()
1
m a x
ni
in
XX
??
? 称为 最大次序统计量,
它的值 () nx 是样本值中最大的一个。
由于次序统计量的每一个分量 () kX 都是样本
? ?
n
XXX,,,
21
? 的函数,所以 ( 1 ) ( 2 ) ( ),,,nX X XL 也都是随机
变量。样本 ? ?
n
XXX,,,
21
? 是相互独立的,但其次序统
计量 ( 1 ) ( 2 ) ( )(,,,)nX X XL 一般不是独立的。
上一页 下一页湘潭大学数学与计算科学学院 3
定义 样本
n
XXX,,,
21
? 按由小到大的顺序重排为
( 1 ) ( 2 ) ( )n
X X X? ? ?L
则称 ( 1 ) ( 2 ) ( )(,,,)nX X XL 为样本 (
n
XXX,,,
21
? )的 次序统计
量, () k
X
称为样本的第 k 个次序统计量。
定理 次序统计量是充分统计量 。
证明 当给定 ( 1 ) ( 1 ) ( ) ( ),,nnX x X x?? L 时,由于 nXXX,,,21 ?
独立同分布,所以
1 ( 1 ) ( )
1(,,)
!ni i nP X x X x n? ? ?L
此条件分布与总体分布无关,故次序统计量是充分统计量。
上一页 下一页湘潭大学数学与计算科学学院 4
定理 设总体 X 的分布密度为 f ( x) ( 分布函数为 F ( x) ),
n
XXX,,,
21
? 为样本,则第 k 个次序统计量 () kX 的分布
密度为
()
1!( ) [ ( ) ] [ 1 ( ) ] ( ),1,2,,.
( 1 ) ! ( ) !k
k n k
X
nf x F x F x f x k n
k n k
??? ? ?
?? L特别,最小次序统计量
( 1 )X 和最 大次序统计量 () nX 的分布
密度为
( 1 )
()
1
1
( ) [ 1 ( ) ] ( ),
( ) [ ( ) ] ( ),
n
n
X
n
X
f x n F x f x
f x n F x f x
?
?
??
?
上一页 下一页湘潭大学数学与计算科学学院 5
定理 设总体 X 的分布密度为 f( x) ( 分布函数为 F(x) ),
n
XXX,,,
21
? 为其样本,则次序统计量的分布密度为
( 1 ) ( 2 ) ( )
(,,,)
n
X X XL
的联合分布密度为
12
112
! ( ),
(,,,)
0,
n
in
in
n f y y y y
f y y y ?
?
? ? ??
? ?
?
?
? LL
其 他
上一页 下一页湘潭大学数学与计算科学学院 6
定理 设总体 X 的分布密度为 f( x) ( 分布函数为 F(x) ),
n
XXX,,,
21
? 为其样本,则次序统计量的分布密度为
( 1 ) ( )(,)nXX 的联合分布密度为
( 1 ) ( 2 )
2
(,)
( 1 ) [ ( ) ( ) ] ( ) ( ),,(,)
0,,
n
XX
n n F y F x f x f y x yf x y
xy
?? ? ? ?
? ? ?
?
上一页 下一页湘潭大学数学与计算科学学院 7
二、样本中位数和样本极差
设( nXXX,,,21 ? )是总体 X 中的样本, ( 1 ) ( 2 ) ( )(,,,)nX X XL
为其次序统计量,则样本中位数定义为
°
1
()
2
1
( ) ( )
22
1
[]
2
n
nn
Xn
X
X X n
?
?
?
??
? ?
??
??
,奇
,偶
它的值为
%
1
()
2
1
( ) ( )
22
1
[]
2
n
nn
xn
x
x x n
?
?
?
??
? ?
??
??
,奇
,偶
上一页 下一页湘潭大学数学与计算科学学院 8
样本中位数与样本均值一样是刻划样本位置特征的量,
而且样本中位数的计算方便并不受样本异常值的影响,
所以有时比样本均值更有代表性。
样本极差 定义为
( ) ( 1 ) 11m a x m i n,n i iininR X X X X????? ? ? ?
它的值为
( ) ( 1 ) 11m a x m i n,n i iininr x x x x????? ? ? ?
样本极差与样本方差一样是反映样本值变化幅度或离
散程度的数字特征, 而且计算方便, 所以在实际中有
广泛的应用 。
上一页 下一页湘潭大学数学与计算科学学院 9
例 从总体中抽取容量为 6的样本, 测得样本值为
32,65,28,35,30,29,
由小到大排列为
28,29,30,32,35,65;
则样本中位数为:
% ( 3 ) ( 4 )1 [ ] 3 1 ;2x x x? ? ?
而样本均值为:
6
1
1 3 6,5 ;
6 iixx ????
上一页 下一页湘潭大学数学与计算科学学院 10
样本均值 x 大于样本值 6 个数中的 5 个数,这
是因为样本值 65 比其它值大许多,可见样本均值
对异常值或极端值较敏感,而样本中位数则不受异
常值影响,所以有时候估计总体均值用样本中位数
比用样本均值效果更好。