1
概率论与数理统计第六章数理统计的基本概念
2
第六章 数理统计的基本概念
6.1 总体与样本
6.1.1 数理统计的基本问题
在前面的章节中,介绍了概率论的基本内容,从本章开始将介绍一些数理统计的基本知识和一些常用的数理统计方法,
概率论中许多问题的讨论,常常是从已给的随机变量 X出发来研究 X的种种性质,那里 X的概率分布都是已知的,或者假设是已知的,
3
概率论中许多问题的讨论,常常是从已给的随机变量 X出发来研究 X的种种性质,那里 X的概率分布都是已知的,或者假设是已知的,
但是在实际问题中,一般说来,人们事先并不知道随机 事件的概率,随机变量的 概率分布和数字特征,
而需要对它们进行估计或作某种推断,这就产生了数理统计的问题,
下面看两个例子,
4
例 1 从 5000个产品中随机地抽检一个产品,结果可能合格,也可能不合格,
由 概率论可知,这个现象可以用两点分布来描述:
X 0 1
P 1?p p
这里,,X= 0”表示 产品不合格,,X= 1”表示 产品不合格,p为不合格率,
但是,p等于多少是事先未知的,也就是说 0— 1分布中的参数是未知的,
5
试问
(a)如何求出或近似地求出 p的值?
(b)如果人们根据以往的生产经验提出假设:
,p<0.05”,
那么,是同意这个假设还是否定这个假设呢?应该用什么方法来检验?
6
例 2 一个工厂生产某种规格的圆柱齿轮,
由于原料和加工过程中的种种 随机因素的影响,各个 齿轮的径向综合误差 X的数值一般是不同的,因此加工出来的齿轮,它的径向综合误差 X是一 个随机变量,
但是 X的分布函数 FX(x)(或 概率密度 fX(x))是什么,
事前是 未知的,
试问
(a)如何求出或近似地求出 F(x)(或 f(x))的值?
7
试问
(a)如何求出或近似地求出 F(x)(或 f(x))的值?
(b)如果人们根据以往的生产经验提出假设:
,X服从正态分布 N(μ,σ 2)”
(μ 和 σ 2已知或未知 ),
那么,是接受这个假设还是否定这个假设呢?
应该用什么方法来判断?
(c)如果人们只需要知道 X的数学期望和 方 差,那么,
如何估计它们的数值?
8
怎样解决这些问题呢?
对例 1来说,由于产品总数是有限的,人们可以对所有产品逐个检验,求出不合格产品所占的比例,就得到概率 p;
同时,假设,p<0.05”是否成立的问题也就得到了解决,
但是,这种普查的方法是不可取的,有时也是行不通的,
因为对 5000个产品逐个检验,一般来说要耗费很多的人力、物力和时间;
特别是,当产品质量的检验是属于破坏性检验时,
根本就不可能逐个检验,
9
这时,在数理统计中通常采用的办法是:
从研究对象的全体元素中 随机地抽取一小部分进行观察 (或试验 ),
然后以 观察得到的资料 (或数据 )为出发点,以概率论的理论为基础来对上述的问题进行估计或推断,
这种方法称为 统计推断,
10
统计推断的问题可以分为两类:
一类是对未知参数以及对未知概率分布 (分布函数、
概率密度或分布列 )的估计问题,
另一类是对未知参数和概率分布的假设检验问题,
这些都是数理统计的基本问题,
当然,上述问题远未穷尽数理统计的所有基本问题,
例如,数理统计还要研究如何科学地安排试验,才能最经济、最有效地取得统计推断所必需的数据资料,
这部分内容,我们不讨论,
为了研究统计推断问题,下面依次介绍总体和样本的概念,
11
第六章 数理统计的基本概念
6.1 总体与样本
6.1.2 总体 (Population)
在 数理统计中,人们把所研究的全体元素所构成的集合称为 总体 (或 母体 ),而把组成总体的每个元素称为 个体,
如果总体包含有限个个体,则称为 有限总体 (或 具体总体 ),如果总体包含无限个个体,则称为 无限总体
(或 抽象总体 ).
12
如在例 1从 5000个产品中随机地抽检一个产品 检查是否合格的试验 中,每个产品是个体,5000个产品就是一个总体,它是有限的;
在例 2考察 齿轮的径向综合误差 的试验 中,每一件齿轮是个体,生产出来的全部齿轮是一个总体,它是无限的,
这是因为我们可以设想,工厂生产这种齿轮可以在相同的条件下无限地生产下去,
再如,某城市现有大学生组成的集合是个有限总体,
而该城市在一定条件下培养起来的大学生组成的集合是个无限总体,
13
当用数理统计方法研究总体时,人们主要关心的不是每个个体本身,而仅仅是 与 每个个体的某种数量指标 (或特征 )的有关问题,
如在例 1从 5000个产品中随机地抽检一个产品 检查是否合格的试验 中,人们关心的是刻画产品合格与否的数量指标 X的概率分布问题;
在例 2考察 齿轮的径向综合误差 的试验 中,人们关心的是齿轮的径向综合误差 X的概率分布问题,
因此,对总体的研究实际上就是对某一个 随机变量
X的概率分布的研究,
14
为了便于叙述,一旦所考察的数量指标明确以后,
就可以把总体与数量指标及相应的概率分布等同起来,也就是说,总体是一个概率分布或服从这个概率分布的 随机变量,
如在例 1从 5000个产品中随机地抽检一个产品 检查是否合格的试验 中,总体就是 0— 1分布或服从这个分布的 随机变量 X,
在例 2考察 齿轮的径向综合误差 的试验 中,总体就是描述齿轮的径向综合误差的 随机变量 X或它所服从的分布,
15
以上所考察的个体的数量指标只有一个,即只需要用一维 随机变量来描述;
如果同时要 考察的数量指标不止一个,那么就需要用多维 随机变量来描述,
例如,对上述 某城市现有大学生的 这个 总体,若要同时 考察大学生的身高 X、体重 Y和肺活量 Z,那么就需要三维 随机变量 (X,Y,Z).
同样,为了叙述方便,人们把总体与 (X,Y,Z)或 它的分布等同起来,并称这样的总体为 三维总体,
在本书中我们主要讨论一维总体,多维总体是多元统计分析主要研究的对象,
16
第六章 数理统计的基本概念
6.1 总体与样本
6.1.3 样本 (Sample)
在 6.1.1中已经说过,为了对例 1和例 2中所提出的问题作出估计或推断,就必须从所研究对象的全部元素中 随机地抽取一小部分进行观察,
所谓 随机地 是指总体中的每个个体被观察到的机会是一样的,而所谓 抽取一部分个体进行观察,其实就是对总体 X重复 进行若干次观察以获得 X的 若干个观察数值,
17
例如,若 在例 1中 随机地抽检 5个产品,结果分别是
,合格,,,不合格,,,合格,,,合格,和
,不合格,,那么就得到 X的 5个 观察值,0,1,0,
0,1.? 一般说来,从总体 X中 随机抽检 n个个体,则可以得到 的 n个观察值,x1,x2,…,xn.
为了叙述方便,人们把从总体 X中 随机抽检 (或 观察 )
n个个体的试验,称为 随机抽样 (Sampling),简称抽样,n称为 容量 (Size).
18
显然,对总体 X的任何一 次容量为 n的抽样结果
,x1,x2,…,xn”
是 n个完全确定的数值;
但由于抽样是一个随机试验,所以这 n个观察值是随每次抽样而改变的,它具有随机性,
换句话说,对具体某次抽样来说,抽样结果是 n个确定的数值:
x1,x2,…,xn;
而离开了特定的某次抽样来说,抽样结果是 n个随机变量:
X1,X2,…,Xn.
19
人们称这 n个随机变量
X1,X2,…,Xn
为来自总体 X的一个 容量为 n的 样本 (或 子样 ).

x1,x2,…,xn
称为样本的一个 观察值 (Observations),简称为 样本值,有时也称为样本的一个 实现,
容量为 n的一个样本 可以看作 n维随机变量
(X1,X2,…,Xn),
它的分布就 称为 样本的分布,
20
样本值
x1,x2,…,xn
可以看作 n维空间的一个点
(x1,x2,…,xn),
称之为 样本点,
样本点的全体称为 样本空间,它是 n维空间或 n维空间的一个子集,
21
前面把抽样结果看作 n维随机变量,并称之为样本,
这一点是很重要的,
因为只有这样才能运用概率论的理论对总体 X进行各种推断以及研究比较各种推断方法的好坏,
数理统计的主要任务之一,就是研究如何根据样本来推断总体,
样本能很好地反映总体的特性
22
为了使抽得的样本能很好地反映总体的特性,通常人们假设对总体 X的 n次观察是在相同的条件下重复进行的,
这样得到的样本 X1,X2,…,Xn满足下面的两个条件:
(1)X1,X2,…,Xn相互独立;
(2)每个 Xi(i=1,2,…,n )与 总体 X有相同的分布,
上面的两个条件,实际上就是 样本具有代表性的反映;
另外,有了独立性,就可以方便地应用概率论中有关独立随机变量的种种结果,
23
这样得到的样本 X1,X2,…,Xn满足下面的两个条件:
(1)X1,X2,…,Xn相互独立;
(2)每个 Xi(i=1,2,…,n )与 总体 X有相同的分布,
人们把满足这两个条件的抽样方法称为 简单随机抽样 (Simple random sampling),而得到的样本称为简单随机样本,
24
例如,若 在例 1从 5000个产品中随机地抽检一个产品中用有放回的 抽样方法随机地检验 n个产品,则得到的样本 X1,X2,…,Xn就是 独立的且与总体 X有相同的分布,即
Xi 0 1
P 1-p p
i=1,2,…,n.
因此,这种 抽样方法是简单随机抽样,而得到的样本是简单随机样本,
25
若将分布列写成
10,)1()( 1 或 ixxi xppxXP ii
则由独立性,样本的分布可写成




n
i
i
n
i
i
ii
xnx
n
i
xx
n
i
ii
nn
pp
ppxXP
xXxXxXP
11
)1(
)1()(
),,,(
1
1
1
2211
26




n
i
i
n
i
i
ii
xnx
n
i
xx
n
i
ii
nn
pp
pp
xXP
xXxXxXP
11
)1(
)1(
)(
),,,(
1
1
1
2211
今后,如果不作特殊的声明,所说的抽样皆为简单随机抽样,所说的的样本皆为简单随机样本,
27
最后,将前面讲的总体和样本的概念用定义的形式小结如下:
定义 6.1
(a)称 随机变量 X的概率分布为一个总体,或称 随机变量 X为一个总体,而 X的分布称为总体的分布;
(b)如果 X1,X2,…,Xn是相互独立且与总体 X有相同分布的 n个随机变量,即如果它们的联合 分布函数为
)()()(),,,( 2121* nn xFxFxFxxxF
(F(x)为 X的分布函数 ),则称 X1,X2,…,Xn为来自总体 X的一个容量为 n的简单随机样本,简称为 X的 一个样本,而 F*(x1,x2,…,xn)就是这个样本 的分布函数 (Sample distribution function);
28
(c)样本 (X1,X2,…,Xn)的每一个 观察值
(x1,x2,…,xn)
称为样本值 (或 样本的一次实现 ),样本值的集合称为 总体 X的容量为 n的样本空间,
29
为了数理统计的需要,人们引入了 标准 正态分布
N(0,1)的上侧分位数的概念,
设 X~ N(0,1),对给定的 α (0< α <1),若数 uα
u
满足条件
)( uXP

1)( u
则称 为 N (0,1)分布 的上侧分位数,其几何意义见图 3.10,?u
30
uO
φ (
u)
u
α
图 3.10
31
uO
φ (
u)
u
αα
1u
32
1uu
33
第六章 数理统计的基本概念变量
6.3?2,t和 F分布
为了本章及以后各章的需要,下面介绍数理统计中常用的三大分布,即
2,t和 F分布,
它们在数理统计中占有极重要的地位,
34
第六章 数理统计的基本概念
6.3?2,t和 F分布
6.3.1?2分布 (Chi-square distribution)
定义 6.2 设 X1,X2,…,Xn为 n个 (n ≥ 1)相互独立的随机变量,它们都服从标准正态分布 N(0,1),若
n
i
iXY
1
2
则随机变量 Y的分布称为自由度为 n的?2分布,记为
2(n).
35
任何服从?2(n)分布的随机变量 X称为自由度为 n的
2变量,简称为?2变量,并记作
X~?2(n).
36
根据 3.6节中的例 3和 4.5节中的卷积公式,用数学归纳法容易证明?2(n)的概率密度为


.0,0
,0,
)
2
(2
1
)(
2
1
2
2
x
xex
nxf
xn
n
利用 Γ 函数的定义,容易验证
1)( dxxf
37
xO
f(x)
38
定理 6.2 设随机变量 X与 Y相互独立,且 X~?2(m),
Y~?2(n),则
X+Y~?2(m+n).
证 设 X1,X2,…,Xm,Y1,Y2,…,Yn为 m+n个 相互独立的标准正态随机变量,
因 X与
m
i
iX
1
2
都服从?2(m)分布,Y与
n
i
iY
1
2
39
都服从?2(n)分布,且


n
j
j
m
i
i YX
1
2
1
2 与
相互独立,故 X+Y与


n
j
j
m
i
i YX
1
2
1
2
同 分布,
由?2分布的定义知,后者服从?2(m+n)分布,故
Z=X+Y~?2(m+n).
40
上述的定理表明?2分布关于自由度具有可加性,
本书的附表 3对某些不同的自由度 n及不同的数 α
(0<α <1)给出了满足等式
))(( 22 nP
的临界值
)(2 n
的数值 (图 6.5),式中?2 ~?2(n).
临界值
)(2 n
41
xO
f(x)
α
2 ()n

42
临界值
)(2 n
也称为?2(n)的 上侧 α 分位数,
43
xO
f(x)
α
2 ()n

α
2
1 ()n
44
由附表 3可以查得
2
0,0 5 (1 0 )
2
0.1 ( 25 )
45
由附表 3可以查得
3 0 7.18)10(2 05.0
382.34)25(2 1.0
等等,
46
第六章 数理统计的基本概念
6.3?2,t和 F分布
6.3.2 t分布 (t-distribution)
定义 6.3 设 随机变量 X,Y相互独立,且 X~N(0,1),
Y~?2(n),则称随机变量
nY
XT
/
所服从的分布为 自由度为 n的 t分布,又称 学生氏
(Student)分布,记为 t(n).
47
任何服从 t(n)分布的 随机变量 T,称为自由度为 n的 t
变量,记为
T ~ t(n).
48
根据 3.6节中的方法先求出
nYZ /?
的 概率密度,
因为 X与 Y相互独立,故 X与 Z也 相互独立,
再 利用 4.5节中的方法可得 变量 T=X/Z的 概率密度为

t
n
t
n
n
n
tf
n
2
12
)1(
)
2
(
)
2
1
(
)(
49
tO
f(t)
t(6)
t(2)
N(0,1)
50
可以证明,当 n无限增大时,t分布的极限分布就是标准正态分布,
51
本书的附表 4对某些不同的自由度 n及不同的数 α
(0<α <1)给出了满足等式
))(( ntTP
的临界值
)(nt?
的数值 (图 6.7),式中 T~t(n).
临界值
)(nt?
52
tO
f(t)
)(nt?
α
图 6.7
53
临界值
)(nt?
也称为 t(n)的 上侧 α 分位数,
由附表 4可以查得
8 1 2 5.1)10(05.0?t
6 8 1 0.2)12(01.0?t
等等,
54
tO
f(t)
)(nt?
αα
1 ()tn
55
1 ( ) ( )t n t n
56
第六章 数理统计的基本概念
6.3?2,t和 F分布
6.3.3 F分布 (t-distribution)
定义 6.4 设 随机变量 X,Y相互独立,且 X~?2(n1),
Y~?2(n2),则称随机变量
Y
X
n
n
nY
nX
F
1
2
2
1
/
/

所服从的分布为第一 自由度为 n1,第二 自由度为 n2
的 分布,记为 F~F(n1,n2).
57
任何服从 F(n1,n2)分布的 随机变量 F,称为自由度为 (n1,n2)的 F变量,简称为 F变量,记为
F~F(n1,n2).
易知 定义 6.4中的 随机变量 的 概率密度为


.0,0
,0,
)()
2
()
2
(
)
2
(
)(
2
21
1
2
2
2
2
1
21
21
21
1
21
u
u
nun
u
nn
nn
nn
uf nn
n
nn
58
本书的附表 5对某些自由度 n1,n2及不同的 α (0<α <1)
给出了满足等式
)),(( 21 nnFFP
的临界值
),( 21 nnF?
的数值 (图 6.9),式中 F~F(n1,n2).
临界值
),( 21 nnF?
也称为 F(n1,n2)的 上侧 α 分位数,
59
xO
f(x)
α
12(,)F n n?
60
xO
f(x)
α
12(,)F n n?
α
1 1 2(,)F n n
61
F分布的上侧 α 分位数具有性质:
),(
1),(
12
211 nnFnnF

事实上,若 X~?2(n1),Y~?2(n2),而且 X与 Y相互独立,则
),(~
/
/
21
2
1 nnF
nY
nX
),(~
/
/
12
1
2 nnF
nX
nY
62
于是,对任意 α (0<α <1)存在上侧 α 分位数
),( 12 nnF?
使得
)],(
/
/[
12
1
2 nnF
nX
nYP

]
),(
1
/
/[)],(
/
/[
122
1
12
1
2
nnFnY
nXPnnF
nX
nYP

63
]
),(
1
/
/
[1
]
),(
1
/
/
[
)],(
/
/
[
122
1
122
1
12
1
2
nnFnY
nX
P
nnFnY
nX
P
nnF
nX
nY
P



1]
),(
1
/
/[
122
1
nnFnY
nXP
64
由于
),(~
/
/
21
2
1 nnF
nY
nX

),(
1
12 nnF?
表示 F(n1,n2)的上侧 1?α 分位数
),( 211 nnF
65
从而
.
),(
1),(
12
211 nnFnnF

利用上式,可以从
),( 12 nnF?
求出分位数
).,( 211 nnF
66
例如
)12,8(
1)8,12(
05.0
95.0 FF?
查附表 5得
85.2)12,8(05.0?F

.35.0
85.2
1
)12,8(
1)8,12(
05.0
95.0 FF
67
第六章 数理统计的基本概念变量
6.4 统计量和抽样分布
数理统计的任务是通过样本推断总体,
68
数理统计的任务是通过样本推断总体,但样本包含了关于总体的各方面信息,在实际处理问题时,很少直接利用样本进行推断,
往往需要针对不同的问题构造出样本的某种函数
T=T(X1,X2,…,Xn),
以便把样本中所包含的有关问题的信息提取出来,
然后再利用这种信息进行推断,
这种函数仍然是随机变量,人们称之为统计量,其定义如下:
69
定义 6.5 设 X1,X2,…,Xn为 总体 X的容量为 n的样本,
T(x1,x2,…,xn)是定义在 样本空间上的不依赖于未知参数的一个连续函数,则称随机变量
T(X1,X2,…,Xn)
为一个 统计量,
例如,X1,X2,…,Xn为 总体 N(μ,σ 2)的一 个 容量为 n
的样本,且 μ 未知,σ 2已知,那么
1),,,(
/)(),,,(
1212
2
1
211


XXXXT
XXXXT
n
n
i
in

70
例如,X1,X2,…,Xn为 总体 N(μ,σ 2)的一 个 容量为 n
的样本,且 μ 未知,σ 2已知,那么
1),,,(
/)(),,,(
1212
2
1
211


XXXXT
XXXXT
n
n
i
in

都是 统计量;而

n
i
in XnXXXT
1
2
213 )(
1),,,(
不是 统计量,因为它依赖于未知参数 μ,
71
下面定义一些重要的统计量
定义 6.6 设 X1,X2,…,Xn为 总体 X的 一个 容量为 n的样本,则 统计量
n
i
iXnX
1
1
称为 样本均值,而 统计量
)(
1
1
)(
1
1
1
22
1
22
n
i
i
n
i
i
XnX
n
XX
n
S
72
22
1
22
1
22
1 1 1
22
1
1
()
1
1
[ 2 ( ) ]
1
1
[ 2 ( ) ]
1
1
()
1
n
i
i
n
ii
i
n n n
ii
i i i
n
i
i
S X X
n
X X X X
n
X X X X
n
X nX
n






73
统计量
)(
1
1
)(
1
1
1
22
1
22
n
i
i
n
i
i
XnX
n
XX
n
S
称为 样本方差,
若 x1,x2,…,xn为样本 X1,X2,…,Xn的观察值,那么代入 样本均值和样本方差的定义式,则可以得到样本均值和样本方差的 观察值,
74
1
1 n
i
i
xx
n?

22
1
22
1
1
()
1
1
()
1
n
i
i
n
i
i
s x x
n
x n x
n


75
定义 6.7 设 X1,X2,…,Xn为 总体 X的 一个样本,k为任何自然数,则 统计量
n
i
k
ik Xna
1
1

n
i
k
i XXn
1
)(
1
分别称为 样本 k阶原点矩 和 样本 k阶中心矩,
76
显然,样本均值就是样本一阶原点矩,它常用来估计总体的均值,样本方差和样本二阶中心矩有点差异,
下面用
2?S
表示 样本二阶中心矩,即

n
i
i XXnS
1
22 )(1
样本方差与样本二阶中心矩常用来估计总体的方差,
至于它们在这方面的差异,下一章将讲述,
77
设 X1,X2,…,Xn为 总体 X的一 个样本,x1,x2,…,xn为样本 的一个观察值,将它们按大小次序排列,得到
x1 ≤ x2 ≤ … ≤ xn.
y1,y2,…,yn为样本 的 另 一个观察值,将它们按大小次序排列,得到
yn≤ yn-1≤ … ≤ y1.
一组观察值
x1,x2,…,xn,
将它们按大小次序排列,得到
x(1) ≤ x(2) ≤ … ≤ x(n).
78
定义 6.8 (顺序统计量 )设 X1,X2,…,Xn为 总体 X的一个样本,x1,x2,…,xn为样本 的一个观察值,将它们按大小次序排列,得到
x(1) ≤ x(2) ≤ … ≤ x(n)
称 X(i)为 第 i个 顺序统计量,如果不论样本
X1,X2,…,Xn
取怎样一组观察值
x1,x2,…,xn,
X(i)总是取其中的 x(i)为 观察值 (i=1,2,…,n).
显然,X(1) ≤ X(2) ≤ … ≤ X(n),X(1)和 X(n)常常分别称为 最小和最大 顺序统计量,
79
由下式决定的
为偶数,当为奇数,当
nXX
nX
M
nn
n
],[
2
1
,
)1
2
()
2
(
)
2
1
(
称为 样本中位数,而将
)1()( XXR n
称为 样本极差,
80
样本中位数常用来作为对称总体均值的估计,而样本极差可用于估计总体分布的分散程度,它们的计算比较简单,但是估计结果比较粗糙,
当用统计量推断总体时,必须知道统计量的分布,
统计量的分布实际属于一种样本函数的分布,
一般说来,样本函数的分布能算出简单的表达式的情况为数不多,所幸的是当总体分布为正态分布时,
许多样本函数的分布已经得出,
下面讨论关于正态总体的几个样本函数的分布问题,
其中多数与?2,t和 F分布分布有密切的关系,
人们把样本函数的分布统称为抽样分布,
81
定理 6.2 设 X1,X2,…,Xn为 总体 N(μ,σ 2)的一 个 容量为 n的样本,则样本均值
),(~
2
n
NX
证 由 4.5节可知,几个 相互独立的正态随机变量的线性组合仍为正态变量,故
n
i
iXnX
1
1
服从 正态分布,而
82
21,
n
XDXE

),(~
2
n
NX
83
推论 设
n
i
iXnX
1
1
为正态总体 N(μ,σ 2)的 样本均值,则
)1,0(~
/
N
n
X

84
定理 6.3 (样本方差的分布 )设 X1,X2,…,Xn为 总体
N(μ,σ 2)的一 个 容量为 n的样本,则样本方差 S2与样本均值 X相互独立,且
)1(~1 222 nSn?
证明需要用到正交变换略,
85
定理 6.4 设 X1,X2,…,Xn为 总体 N(μ,σ 2)的一 个 容量为 n的样本,X与 S2分别为样本均值和样本方差,

)1(~ ntn
S
X?
其中
2SS?
称为 样本标准差,
86
证 明 由
)1,0(~
/
N
n
X


)1(~1 222 nSn?
且样本均值 X与样本方差 S2相互独立,可得
.1
/
2
2 相互独立与 S
n
n
X


87
从而 由 t分布的定义得
)1(~
)1/(
1
/
2
2
nt
nS
n
n
X
n
S
X
88
定理 6.5 设
21,,,,,,2121 nn YYYXXX 和
分别是来自总体 X~N(μ 1,σ 2)和 Y~N(μ 2,σ 2)的两个样本,它们 相互独立,则
)2(~
11
)(
21
21
21

nnt
nn
S
YX
W

其中
89
2
)1()1(
21
2
22
2
11


nn
SnSn
S W
而 S12和 S22分别为两个样本的样本方差,
证 由定理 6.2得
).,(~),,(~
2
2
2
1
2
1 nNYnNX
相互独立,故与因 YX
90
),,(~
2
2
1
2
21 nnNYX


从而
).1,0(~
11
)(
21
21 N
nn
YX


91
由定理 6.3得
),1(~
1
),1(~
1
2
22
22
2
1
22
12
1
nS
n
nS
n
又因它们二者相互独立,故由?2分布的可加性 (定理
6.1)得
).2(~
)1()1(
21
2
2
2
22
2
11 nnSnSn?
92
由定理的条件可知,式
).1,0(~
11
)(
21
21 N
nn
YX


与 式
).2(~)1()1( 2122
2
22
2
11 nnSnSn?
中的两个随机变量是相互独立的,故由 t分布的定义得
93
)2(~
)2/(
)1()1(
11
/)]([
11
)(
21
212
2
22
2
11
21
21
21
21





nnt
nn
SnSn
nn
YX
nn
S
YX
W


94
定理 6.6 设
21,,,,,,2121 nn YYYXXX 和
分别是来自总体 X~N(μ 1,σ 2)和 Y~N(μ 2,σ 2)的两个样本,它们 相互独立,则
)1,1(~
/
/
212
2
2
2
2
1
2
1 nnF
S
S
其中 S12和 S22分别为两个样本的样本方差,
95
证 明 由定理 6.3得
),1(~
1
),1(~
1
2
22
22
2
1
22
12
1
nS
n
nS
n
因为它们二者相互独立,故由 F分布的定义 得
96
)1,1(~
)1/(
)1(
)1/(
)1(
/
/
21
22
2
2
22
12
1
2
11
2
2
2
2
2
1
2
1

nnF
n
Sn
n
Sn
S
S