第 6.1— 6.2节 数理统计学中的基本概念数理统计的任务,观察现象,收集资料,创建方法,分析推断。
统计推断,伴随着一定概率的推测。其特点是,由“部分”推断“整体”。
总体,研究对象的全体 (整体 )。
个体,每一个研究对象 。实际上是对总体的一次观察。
有限总体无限总体第六章 随机样本及抽样分布总体等同于相应的随机变量的全体研究对象体现为量指标值的全体研究对象的某项数可看作取值的全体某个随机变量样本,由部分个体构成的集合。经常说,来自 (或取自 )某总体的样本。
样本具有二重性,在抽样前,它是随机向量,
在抽样后,它是数值向量 (随机向量的取值 )。
样本选择方式,(1)有放回抽样,(2)无放回抽样特别,样本容量 <<总体数量时,无放回抽样可近似看作有放回抽样,
简单随机样本 (s.r.s),具有两个特点的样本,代表性 (组成样本的每个个体与总体同分布 ),独立性 (组成样本的个体间相互独立 )。
样本容量,样本中所含个体的个数。
如,检验一批灯泡的质量,从中选择 100只,则总体,这批灯泡 (有限总体 )
个体,这批灯泡中的每一只样本,抽取的 100只灯泡 (简单随机样本 )
样本容量,100
样本观测值,x1,x2,…,x 100
定义,设 X为一随机变量,其分布函数为 F(x),X1,X2,…,X n是一组 独立且与 X同分布 的随机变量,称 X为 总体 ;(X1,X2,…,X n)
为来自总体 X(或分布函数 F(x))的简单随机样本 ;n为 样本容量 ; 在依次观测中,样本的具体观测值 x1,x2,…,x n称为 样本值
X
X1,X2,…,X 100
100
样本值注意,样本是一组独立同总体分布相同的随机变量,
总体 选择个体 样本 观测样本 样本观察值 (数据 )
数据处理 样本有关结论统计的一般步骤,
推断总体性质统计 量为了集中简单随机样本所带来的总体信息,考虑样本的函数,且不含任何未知参数,这样的
“不含 未知 参数的样本的函数”称为统计量。
是来自总体例 6.2.1 设
nXXX,,,21? ),(
2N
未知,则 ( )不是统计量。?的 s.r.s,其中 已知,
n21
22
2
2
1
n
1i
2
σ
μX
n
1
n
1i
2
in
1
n
1i
2
in
1
n
1i
in
1
...XXX2[ 6]σXX[ 5])([ 4]
)X(X[ 3])(X[ 2]X[ 1]
i



统计量定义,设 X1,X2,…,Xn是来自总体 X的一个样本,g(X1,X2,…,Xn)是 n维随机变量的函数,若 g中除样本的函数外不含任何未知参数,则称
g(X1,X2,…,Xn)为 统计量,
统计量的分布称为 抽样分布,
① 样本均值常用统计量,
② 样本方差
③ 样本标准差
④ 样本 k阶原点矩
⑤ 样本 k阶中心矩
n
1i
iXn
1X

n
1i
2
i
2 )XX(
1n
1S
n
1i
2
i )XX(1n
1S
n
1i
k
ik Xn
1A

n
1i
k
ik )XX(n
1B
(6) 顺序统计量与样本分布函数设 X1,X2,…,X n的观察值为 x1,x2,…,x n,从小到大排序得到,
x(1),x(2),…,x (n),定义 X(k)=x(k),由此得到的 (X(1),X(2),…,X (n))
或它们的函数都称为顺序统计量,显然 X(1)?X(2)?…? X(n)
且有 X(1)=min (X(1),X(2),…,X (n)),X(n)=max(X(1),X(2),…,X (n))
))X,,X( m i n (m a xX 1kn1
1kn1 ii)i,,i()k(

1) 样本中位数

为偶数为奇数
n,XX
2
1
n,X
Md
1
2
n
2
n
)
2
1n
(
2) 样本极差
R= X(n)- X(1)
样本分布函数 (经验分布函数 )

)n(
)1k()k(
)1(
n
xx,1
)1n,,2,1k(,xxx,
n
k
xx,0
)x(F?
}xX{Pp
),p,n(B,)x(nF n

这里服从二项分布是一个随机变量格里汶科定理,
设总体 X的分布是 F(x),则下式成立
10)()(s u plim?






xFxFP n
xn
第 6.3节 抽样分布一、样本均值的分布定理:设 X1,X2,…X n是来自总体 N(?,?2)的样本,X
是样本均值,则有



n,N~X
2
注,在大样本情况下,无论总体服从何种分布均有



n,N~X
2
二、顺序统计量的分布
1、( X( 1),X( 2) …X (n))的概率密度函数为





其它

,0
xxx,xfnx,,x,xg n21
n
1i
i
n21

2、样本中位数的概率密度函数为
xfxF1xF
1]2n[n]2n[
nxf 1]
2
n[n]
2
n[
Md



!!

3、样本极差的概率密度函数为



其它,0
0x,dttftxftFtxF1nnxf
0
2n
R
其中
x dttfxF
)z(
z?
1-α
例 6.3.1 设 X~N(0,1),?
分别为 0.95,0.975,0.75,求 X
关于?的 100? %分位数,
X
φ(x)
三、标准正态分布及其 100? %分位数定义,设 X~N(0,1),对任意 0<?<1,若 P{X<λ}=?,则称 λ为标准正态分布的 100? % 分位数,记为
z
解,? =0.95时,
95.0)z( 95.0
反查表得,z0.95=1.64
类似可得,z0.975=1.96,z0.75=0.69
- z?
分布及其性质2?
1.定义,称 n 个相互独立同标准正态分布的随机变量的平方和 X的分布为自由度为 n的 分布,记作2?
)n(~X 2?
(2 ) X1,X2,…X k独立,Xi~ (ni),(i=1,2,…,k),则2?
)n...nn(~X k212
k
1i
i
2.性质,(1) X 1,X2,…X n独立,Xi~N(0,1),(i=1,2,…,n),则
)n(~X 2
n
1i
2
i
(3) X1,X2,…X n为来自总体 N(?,?2)的简单随机样本,则四、
n~X 2n
1i
2
i


( 4) n2)n(D,n)n(E 22
例 6.3.2 设 是来自总体的 s.r.s,则 服从 ( )分布。n
XXX,,,21? ),( 2N
n
i
X i
1
2)(
例 6.3.3 (983) 设 是取自总体
N (0,4) 的 s.r.s,
当 a=,b= 时,).2(~ 2?X
243221 )43()2( XXbXXaX
4321,,,XXXX
解 (1)服从 )n(2? (2)由题意得

)1,0(N~)X4X3(b
)1,0(N~)X2X(a
43
21



1)]X4X3(b[D
1)]X2X(a[D
43
21
a =1/20
b=1/100
3,的密度曲线)(2 n?
X
f(x)
n=1
n=4
n=10
随着 n的增大,密度曲线逐渐趋于平缓,对称,
4,分布的 100?%分位数2
定义,设,对于给定的?(0<? <1),若 P{X<λ}=?,
则称 λ为自由度为 n的 分布的 100?%分位数,记为)(~
2 nX?
2?
)n(2
X
f(x)
1
)n(2
查表求 100?%分位数,
(1)若 P{X<λ}=?,则
)n(2(1)若 P{X>λ}=?,则
)n(21
例 6.3.4.设 X~ (10),P{X>λ1}=0.025,P{X<λ2}=0.05,求 λ1,
λ2.
2?
解,)10(2
9 7 5.01 查表得,483.201
)10(205.02 查表得,940.32
五,t 分布及其性质
1.定义 设随机变量,随机变量,Y 且它们互相独立,则称随机变量的分布为自由度是 n 的 t 分布,记作
)1,0(N~X )n(~ 2?
).n(t~t
n
Y/XT?
可以证明 t分布的概率密度函数为
)t( )
n
t
1(
)
2
n
(n
2
)1n(
)t(h 2
1n2



特点,关于 y轴对称 ;随着自由度的逐渐增大,
密度曲线逐渐接近于标准正态密度曲线,
2.t分布的密度曲线,
X
f(x)
3,t分布的性质
2
t
n
2
e
2
1)t(hlim?

( 1)
( 2)
)2n( 2n n)T(D,0)T(E
( 3) h(t)的图形关于 Y轴对称
)n(t?
4,t分布的 100α%分位数,
X
f(x)
对于给定 α(0< α <1),若 P{t(n) <λ}= α,则称 λ为 t分布的
100α%分位数,记为,
)n(t
1-α
例 6.3.5,设 t~t(15),求 (1)α=0.995 (2)α=0.005的 100α%分位数 ;
解,(1)λ=t0.995(15),查表得 λ=2.9467
(2)λ=t0.005(15),查表得 λ=-2.9467
注,
)n(t)n(t 1
例 6.3.6(974) 设随机变量 X 和 Y 相互独立且都服从正态分布,而和 分别是来自总体 X 和 Y 的 s.r.s,则统计量 服从 ( )分布,参数为 ( ).
)9,0(N 91,,XX?
91,,YY?
2
9
2
1
91
YY
XX
U


t 9
解,
),1,0(N~X91X
9
1i
i?
)1,0(N~3
Y i

)9(~Y91)3Y(Y 2
9
1i
2
i
9
1i
2i

与 独立,YX
所以 )9(t~
9/Y
XU?
六,F 分布及其性质
1.定义 设随机变量 随机变量 且它们相互独立,则称随机变量 的分布为自由度是 的 F 分布。记作
),n(~U 12? ),n(~V 22?
2
1
n/V
n/UF?
)n,n( 21 )n,n(F~F 21
可以证明,)n,n(F
21
的概率密度函数为



0y 0,
0y,
n
yn
1)
2
n
()
2
n
(
y
n
n
2
nn
)y(
2
nn
2
121
1
2
n
2
n
2
121
21
1
1
2.F分布的概率密度曲线
3.性质,)n,n(F~
F
1),n,n(F~X)1(
1221 则若
25n,10n 21
5n,10n 21
yO
)y(?
则若 ),n,n(F~X)2( 21
)2n(2n n)F(E 2
2
2?


)4n(4n2nn
4n2n2n)F(D
2
2
2
21
21
2
2?


4.F分布的 100α%分位数
X
f(x)
设 F~,对于给定
α(0<α<1),若 P{F<λ}=α,
则称 λ为 F分布的
100α%分位数,记为,
),( 21 nnF
)n,n(F 21
1
)n,n(F 21?
5,100α%分位数的计算
(1)若 P{F<λ}=α,则
)n,n(F 21
(2)若 P{F<λ}=α(α比较小 ),则 P{1/F<1/λ}=1-α,
)]n,n(F~F[ 21
)n,n(F1 121 故 )n,n(F 1
121

例 6.3.7 设 F~ F(24,15),分别求满足
.025.0}F{P)3(;95.0}F{P)2(;025.0}F{P)1(


的解 (1)λ=F0.975(24,15)
=2.29(2) λ=F0.95(24,15)
=2.70
(3) α比较小,P{1/F<1/λ}=0.975
44.2)24,15(F1 9 7 5.0
所以 λ=0.41
七、抽样分布基本定理
1、设 是来自总体 的 s.r.s,
表示样本均值,则
nXXX,,,21? ),( 2N
X
),(N~X
2

)1,0(N~
n/
X

2、设 X~N(μ1,σ12),Y~ N(μ2,σ22),X,Y相互独立,从中分别抽取容量为 n1,n2的样本,样本均值分别记为 Y,X
)
n
,(N~Y),
n
,(N~X
2
2
2
2
1
2
1
1

,)YX(E 21
2
2
2
1
2
1
nn
YDXD)YX(D
)
nn
,(N~YX
2
2
2
1
2
1
21

)1,0(N~
nn
)()YX(
2
2
2
1
2
1
21

3,定理 6.3.3
设 X1,X2,…,X n是来自总体 ),(N 2 的样本,2S,X
分别是样本均值和样本方差,则有
)1n(~S)1n(.1 22 2
相互独立与 2SX.2
注:由
)1n(2S)1n(D,1nS)1n(E 2
2
2
2





可得
1n2SD,SE 4222
4,定理 6.3.4
设 X1,X2,…,X n是来自总体 ),(N 2 的样本,2S,X
分别是样本均值和样本方差,则有
)1n(t~
n
S
X
例 6.3.8(993) 设 是来自正态总体 X
的 s.r.s,91
,,XX?
S
)YY(2
9
7i
2
2i2
12
9873
1
2616
1
1
21Z,)YX(S
),XXX(Y),XX(Y


证明,统计量 Z~t (2)
4,定理 6.3.5

1n21 X,,X,X?

2n21 Y,,Y,Y?
分别是来自总体 X,Y的样本且这两个样本是独立的,),(N~Y),,(N~X 222211




21 n
1i
i
2
n
1i
i
1
Yn1Y,Xn1X


1n
1i
2
i
1
2
1 XX1n
1S
2
n
1i
2
i
2
2
2 YY1n
1S
则有
)1n,1n(F~
21S
S
2
2
2
2
2
1
2
1

注,若 22221 记
2nn
S)1n(S)1n(S
21
2
22
2
112
w

则有
1n,1nF~SS.1 212
2
2
1
)2nn(t~
n
1
n
1
S
)()YX(
.2 21
21
w
21

3,E x c e l 实现
( 1 ) 利用 E x c e l 计算样本均值、样本方差、样本标准差
S t e p 1 在 E x c e l 数据编辑窗口中,建立数据文件
S t e p 2 计算样本平均——调用 A V E R A G E 函数:
S t e p 3 计算样本方差——调用 V A R 函数
S t e p 4 计算样本标准差——调用 S T D E V 函数:
( 2 ) 利用 E x c e l 计算四大分布的分位数
① 计算标准正态分布的上侧? 分位数
)1(N O R M S I N Vz
② 计算 )(2 n? 的上侧? 分位数
)n,(C H I I N V)n(2
③ 计算 )( nt 的上侧? 分位数
)n,2(T IN V)n(t
④ 计算 ),( 21 nnF 的上侧? 分位数
)n,n,(F I N V)n,n(F 2121