数理统计的基本问题请问:来了一批灯泡,检查这批灯泡是否合格?(寿命
>2000小时) (只能是抽取一部分进行检查 )
一是如何抽样?
这类问题面临的共同问题是,
这类问题是统计学要研究的问题二是,如何根据抽样推断考察问题性质第一节数理统计的几个基本概念二、样本与简单随机样本一,总体与样本
1.总体 研究对象的全体称为总体 (母体 ),
个体 ——总体中每个成员称为个体,
研究对象的某项数量指标值的全体称为总体 (母体 ),
全校同学可以看作一个总体,每一位同学就是个体对于每一位同学,由籍贯、年龄、体重身高、政治面貌等有时只需要针对某一个指标,比如身高等等进行研究每一个个体对应于一个指标值总体就由研究对象的某一个指标的所有取值组成一般,总体中的个体是人或者物学生 1 学生 2 学生 3 … 学生 n
全校学生成绩分析 具体总体
60 70 78 90
统计总体看作从某一随机变量中取出的值
1、总体可以看作是某一个随机变量
2、总体中的每一个值看作是随机变量的一个可能取值
1、总体就是一个概率分布
2、常用随机变量的记号或用其分布函数 F( X)表示总体,
如说总体 X 或总体 F( X)
关于总体的说明
3、总体服从什么分布可能永远未知,针对具体研究对象根据经验进行假定
4、直方图是研究总体的一个有效手段,见下图说明以上总体概念,归功于数理统计学最主要的奠基者,
伟大的英国统计学家 R.A费歇尔
2005 年秋线性代数成绩分布
0
50
100
150
200
4
14.47272727 24.94545455 35.41818182 45.89090909 56.36363636 66.83636364 77.30909091 87.78181818 98.25454545
接收频率频率在数理统计主要研究两个问题一是总体 X服从什么类型的分布,
二是假定总体服从某一分布,确定具体的参数。
样本中所包含的个体数目称为 样本容量,
为了推断总体分布及各种特征,
按一定的规则抽取若干个个体进行观察 和试验,
以获得有关总体的信息,
这一抽取过程称为,抽样”,
所抽取的 部分个体称为样本,
每一个个体是从总体中抽出的,它也是一个随机变量样本是由几个个体组成,可以看作是一组随机变量需要从该总体中
2,独立同分布性:
简单样本满足下面两点,
1,代表性(随机性):
并且每一个分量 Xk与总体 X具有相同的分布,
每一个个体被抽到的可能性相同。
是相互独立的随机变量,12,,,nX X X
简单随机样本(简称样本)的概念的观察值称为样本值12,,,nX X X
样本是相互独立并且与总体具有相同分布的 n个 随机变量若总体 X的分布函数为联合分布函数为若总体 X的分布密度函数为
12,,,nX X X
则其简单随机样本的则其简单随机样本的联合密度函数为总体、样本、样本值的关系?
总体和样本空间有没有区别?
思考题它把样本中所含的 ( 某一方面 ) 的信息集中起来
.
统计量与抽样分布的概念这种不含任何未知参数的样本的函数称为统计量,
§ 6.2 统计量与抽样分布由样本值去推断总体情况,需要对样本值进行
“加工,,这就要构造一些合适的依赖于样本的函数,
它是完全由样本决定的量,
定义 1 设
),,,( 21 nXXXg?
nXXX,,,21?
是来自总体 X的一个样本,
为一实值连续函数,其不包含任何未知参数,则称 ),,,( 21 nXXXg? 为一个统计量。
),,,( 21 nxxxg? 为 ),,,( 21 nXXXg?的观测值。
注,),,,( 21 nXXXg?是随机变量的函数仍为随机变量。
),,,( 21 nxxxg? 便是一个数。
例如 总体 是一个样本,
则 均为统计量。
当 未知时,均不是统计量。
当 已知时,其为统计量。
下面介绍几个常见统计量
1、样本均值
2、样本方差
n
k
kXnX
1
1

n
k
k XXnS
1
22 )(
1
1

nXXX,,,21?
是来自总体 X的一个样本,
它反映了总体 X取值的平均值的信息,常用来估计 EX.
22
1
1 ()
1
n
k
k
X n Xn

它反映了总体方差的信息。

n
i
i XXnSS
1
22 )(
1
1样本标准差:
3、样本 k 阶原点矩
4、样本 k阶中心矩
.,,2,11
1
nkXnA
n
i
k
ik
,2,1)(1
1

kXXnB
n
i
k
ik
它反映了总体 k 阶矩的信息。
它反映了总体 k 阶中心矩的信息。
n
i
ixnx
1
1
][
1
1)(
1
1
1
22
1
22


n
i
i
n
i
i xnxnxxns
它们的观察值分别为:
n
i
i xxns
1
2)(
1
1
2,1,1
1

kx
n
a
n
i
k
ik
2,1,)(1
1

kxx
n
b
n
i
k
ik
分别称为样本均值、样本方差、样本标准差、
统计量是样本的函数,它是一个随机变量,
样本 k阶矩、样本 k阶中心矩。
统计量的分布称为抽样分布。
则 2( 1 ),,E X D X
n

结论:设 为来自总体 的一个样本,
.)()2( 22SE
nXXX,,,21?
证 1,由于 是独立同分布的随机变量,
EXEX k,,,2,12 nkDXDX k

n
n
EX
n
XE
n
k
k
11
1
n
n
n
DX
n
XD
n
k
k
2
2
2
1
2
11

2
( 1 ),,E X D X n
2
1
1[ ( ) ]
1
n
k
k
E X Xn

22( 2 ) ( ),ES
22
1
1[ ( ) ]
1
n
k
k
E X nXn
22
1
1 [ ]
1
n
k
k
E X nXn

n 22
k
K = 1
1 ( E( X ) - n E( X ) )
n - 1?=
22
1
1 ( ( )
1
n
Kn

2 2( ) )n n
正态总体的抽样分布一、样本均值分布定理 设总体 是 X的样本。
样本均值
(标准化)
记为分布二、
1.定义,设随机变量 相互独立,都服从标准正态分布 N(0,1),则称统计量:
所服从的分布为自由度为 n 的 分布,
注,自由度是指 *右端所含独立的随机变量的个数。
分布的密度函数为来定义,
通过积分其中伽玛函数
2—分布的密度函数曲线


00
0
)2(2
1
);(
2
1
2
2
x
xex
nnxf
xn
n
由 分布的定义,不难得到:
且 X1,X2相互独立,
这个性质叫 分布的可加性,
(2) 设则
2,?2分布的 性质
222,2 E n D n( )
0,1,~ ( 0,1 ) i i iE X D X X N证,
2 4 2 2( ) 3 1 2,1,2,i i iD X E X E X i n
2 2 2
11
( ),
nn
ii
ii
E E X E X n?

所 以
2 2 2
11
( ) 2,
nn
ii
ii
D D X D X n?


2 1,
iEX?
2
44 21()
2
x
E X x e d x



2
3 21
2
x
x d e



22
3211 33
22
xx
x e e x d x






应用中心极限定理可得,若则当 n充分大时,
)(~ 2 nX?
n
nX
2
的分布近似正态分布 N (0,1).
(3)
对于给定的正数 称满足条件的点为 分位点,分布的 上
(4) 分布的分位点
P443 分布表供查阅。
例即对于给定的 称满足条件的点 为 分布的“上 百分位点”
上侧 分位点。
双侧 分位点。
当 时下侧 分位点双侧 分位点分布的下侧 分位点。
相互独立,都服从正态分布则问题 设为什么?
例 2 设总体 X~N( 0,0.32),n =10,求解 ∵ X/0.3~N( 0,1),

T的密度函数为:
2
12
)1(
)2(
]2)1[();(
n
n
x
nn
nnxf
记为 T~ t(n).所服从的分布为自由度为 n的 t 分布,
)(2 n?1,定义,设 X~ N(0,1),Y~
则称变量
,且 X 与 Y
相互独立,
三,t 分布
t(n) 的概率密度为
2
12
)1(
)2(
]2)1[();(
n
n
x
nn
nnxf
( 1)具有自由度为 n 的 t 分布的随机变量 T 的当 n充分大时,其图形类似于标准正态分布密度
0);( nxfL imx
( 2) t 分布的密度函数关于 x = 0 对称,且数学期望和方差为,
E( T ) = 0; D( T ) = n / ( n - 2 ),对 n > 2
函数的图形,
很大,
不难看到,当 n充分大时,t 分布近似
N (0,1)分布,但对于较小的 n,t分布与 N (0,1)分布相差
2,性质对于给定的正数 称满足条件的点 为 百分位点,。分布的,上例查 t 分布表,附表 3
3,t 分布的分位点取 当 时
分布上侧 α 分位点
分布下侧 α 分位点
分布双侧 α 分位点
t的分布的双侧 α 分位点为满足
),(~),(~ 2212 nYnX
若 X ~ F (n1,n2),X的概率密度为





00
01))((
)()(
)(
),;(
2
22
2
21
21
2
1
1
2
1
2
1
2
1
21
21
x
xxx
nnxf
nn
n
n
n
n
n
n
nn
nn n
1.定义,设 X与 Y相互独立,
则称统计量 服从自由度为 n1及 n2 的 F分布,
四,F分布
n1称为第一自由度,n2称为第二自由度,
记作 F ~F (n1,n2).
即它的数学期望并不依赖于第一自由度 n1.
(2) X的数学期望为,
2)( 2
2
n
nXE 若 n
2 > 2
(1) 由定义可见,
1
21
nX
nY
F?
~ F( n2,n1)
2,性质
(3) F 分布的分位点对于给定的正数 称满足条件的点 为 分位点。分布的上关于 F 分布的重要结论表中所给的 都是很小的数,如 0.01,0.05等当表中查不出,由性质( 2)
较大时,如 0.95,
定理 1 (样本均值的分布 )
设 X1,X2,…,Xn 是取自正态总体 ),( 2N
则有
),(~
2
nNX

的样本,
N 取不同值时样本均值 的分布X
四、几个重要的抽样分布定理
)1(~)1()1( 22
2
nSn
设 X1,X2,…,Xn 是取自正态总体 ),( 2N
2SX 和 分别为样本均值和样本方差,则有
.)2( 2 相互独立和 SX
的样本,
N 取不同值时的分布定理 2 (样本方差的分布 )
2
2
2
( 1 ) ~ ( 1 )nS n?
关 于 的 简 要 说 明
2
2
22
1
( 1 ) 1 ( )n
i
i
nS XX


X?从 以 上 两 式 子 看 出,仅 和 不 同
1
( ) 0nii
i
X X X
但 是,第 一 个 式 子,自 由,第 二 式 =
无 形 中 多 了 一 个 条 件,减 少 了 一 个 自 由 度2 ( 1 )n故 为证 明,先 证 Z ~ ( 0,1 )i N
1设 为 正 交 矩 阵,其 第 一 行 元 素 均 为
nA即 21 22 2
12
1 1 1
n
n n n n
n n n
a a aA
a a a





做 正 交 变 换 Y = A Z 服 从 正 态 分 布
1
1,2ni i j j
j
Y a Z i n

1
( ) ( ) 0,ni i j j
j
E Y E a Z

1 1 1
1(,) (,)
0
n n n
i k i j j k l l i j k j i j
j l j
ijC o v Y Y C o v a Z a Z a a
ij


两 两 不 相 关,据 此 推 出 相 互 独 立,,i j i jY Y Y Y
11
1 = =
11
nn
j j j
jj
Y a Z Z n Z n


22( ) ( ) ( )T T T T T
ii
ii
Y Y Y A Z A Z Z A A Z Z E Z Z
于 是 ( 12 2 2 2 2 2
1 1 2
1) n n ni i i
i i i
n S Z nZ Y Y Y


由 于 相 互 独 立,均 服 从12,( 0,1 )NY Y Y N
2从 而 ( ~ (21 ) 1 )n S n
1( 只 是 的 函 数,z 只 是 Y 的 函 数故 ( 与 Z 独 立
2
3
2
1 ),
1)
2Nn S Y Y Y
nS
对 于 X 2~ (,)i N
X- = ~ ( 0,1 )i
i
XZ N Z


1
2
2
2 2 2 21
22
12
()1)
n
i nn
i
ii
ii
XXnS
Y Y Y?





2( (2
2
1) ~ 1 )nS n
例题分析设 X1,X2,…,Xn 是取自正态总体 的样本,
分别为样本均值和样本方差,则有
(与样本均值和样本方差有关 的一个分布)
当则由 t-分布的定义:
且它们独立。
定理 3
Y ~ N (μ2,σ2 2),Y1,Y2,…,Y n2,它们相互独立,
则若 X ~ N (μ1,σ12),X1,X2,…,X n1( 1)
4,两个正态总体定理 4 (两总体样本均值差的分布 )
)2(~
11
2
)1()1(
)(
21
2121
2
22
2
11
21



nnt
nnnn
SnSn
YX
,,设 ),(~),(~ 2221 NYNX
YX 和 分别是这两个样本的样本且 X 与 Y 独立,
X1,X2,…,
1nX
是取自 X的样本,
取自 Y的样本,
分别是这两个样本的样本方差,均值,2221 SS 和则有
Y1,Y2,…,
2nY
是定理 5 (两总体样本方差比的分布 )
)1,1(~ 212
2
2
2
2
1
2
1 nnF
S
S
,设 ),(~),,(~ 222211 NYNX
YX 和 分别是这两个样本的且 X与 Y独立,
X1,X2,…,
1nX
是取自 X的样本,
取自 Y的样本,
分别是这两个样本的样本方差,均值,2
221 SS 和则有
Y1,Y2,…,
2nY
是样本设 X,X1,X2,…,Xn
1,
2,若 X~N( 0,1),则两个最常用统计量及三大分布的定义四 大 统 计 量
Y ~ N (μ2,σ2 2),Y1,Y2,…,Y n2,它们相互独立,
则若 X ~ N (μ1,σ12),X1,X2,…,X n1( 1)
( 2) 当 σ12 =σ22 =σ2时,
两个正态总体
( 3)
设 X1,X2,X3,X4是总体 N( 0,1)的样本,则:
请回答:
例题分析设 X1,X2,X3,X4是总体例题分析
12
12
2
2
2 ( ) /2
2
/2
YY
YY
Z
S S

( 2 )t
2 1 2 Y Y - YZZ强 调 与 独 立,与 独 立
2,( 0,)1 2 8X,X,X N?设 是 来 自 于 总 体 的 一 个 样 本例题分析
22
1 2 3 4
22
5 6 7 8
( X - X ) ( ) Y =
( ) ( )
XX
X X X X

求 的 分 布请回答
2
2
X ~ N (,),,X
,,( )
12X,X Xn

设总体 样本 来自未知则下列结论 正确
n
2 2 2
i
i=1
n
22
i
i=1
n
22
i2
i=1
n
2 2 2
i2
i=1
1
( A) S = ( X - X ) ~ ( n - 1)
1
( b ) ( X - X ) ~ ( n - 1)
1
( c ) ( X - X ) ~ ( n - 1)
1
( d ) S = ( X - X ) ~ ( n )
n - 1
n
请回答,设总体 X~N( μ,σ2),X1,X2,…,X8为一个样本,则 ( ) 成立 。
(2) ~ t (7)( 1) ~ t (8)
(4) ~ t (8)(3) ~ t (7)
请回答,设 是来自正态总体 N(μ,σ 2) 的样本,
是样本均值,记则服从自由度为 n-1 的 t 分布的随机变量是,
练习
1 2 n
X
| |,| | < 1
()
0,
X,X,X X,
xx
fx

设 总 体 的 密 度 函 数 为其 他为 取 自 的 一 个 样 本 求
2
( 1 ) ( X ),D ( X )
( 2 ) E( S )
E
练习 6
22
1 2 3 4 5 6
2
X ~ N( 0,1 ),,
Y= ( X + X + X ) ( X + X + X )
C,~
12
X,X X
cY?
设总体 样本令求常数 使 分布练习
n
2
22
1
X ~ N ( 0,1 ),,
,( )
( A ) ~ N ( 0,1 ) ( B ) n ~ ( 0,1 )
( ) ~ ( ) ( D ) X / ~ ( 1 )
12
N
i
I
X,X X
XS
X X N
C X n s t n?

设总体 样本和 为样本均值和方差则 成立练习
2X ~ ( ),Y = X?tk设 问 服从什么分布并确定其参数练习
X ~ F (,),
{ 1 } { 1 } 0,5
mm
p X p X
设随机变量 证明练习
2 2 2
2 2 2
22
X Y,
( A) X + Y
( B ) X + Y
( C) X,Y
( D) X / Y
设 随 机 变 量 和 都 服 从 标 准 正 态 分 布 则服 从 正 态 分 布服 从 分 布服 从 分 布都 服 从 F 分 布练习
2
2
X ~ N (,),,X
,
( 1) E( |X - | ) 0,1
( 2) P ( |X - | 0,1) 0,95
12
X,X Xn
n


设总体 样本 来自样本 取多大时 有
175
2,7,8,9
P作 业一、选择题
22
11 X ~ N (,),,.,,
( )
nXX,未知 已知 为样本则下式中是统计量的是
22
2
11
2
2
11
11
,( ) B,( )
11
C,( ),
nn
ii
ii
nn
ii
ii
A X X
nn
X D X
n






2
1
1
2 2 2
1
1
2 X ~ N (,),,,
1
( ) ( 1 ),( )
n
ni
i
n
i
i
X X X
n
S X X n
n


,为样本 X =
则服从 的变量为
22
22
22
11
22
( 1 )
.,
()
C,D,
nn
ii
ii
n S n S
AB
XX




2
1
1
2 2 2
1
1
3 X ~ N (,),,,
1
( ) ( )
n
ni
i
n
i
i
X X X
n
X
S X X T = n
ns


,为样本 X =
,服从的分布为( )
2,( 0,1 ) B,( 1 )
,( 1 ),( 1,1 )
A N n
C t n D F n


2
1
1
2 2 2 2
12
11
2 2 2 2
34
11
1
4 X ~ N (,),,,
11
( ) ( )
11
( ) ( )
11
n - 1 t
n
ni
i
nn
ii
ii
nn
ii
ii
X X X
n
S X X S X
nn
S X S X X
nn








,为样本 X =
则服从自由度为 的 分布的是( )
12
12
34
34
,B,
/ 1 / 1
,D,
/ / 1
XX
A T T
S n S n
XX
C T T
S n S n







设 X1,X2,X3,X4是总体 N( 0,1)的样本,则:
1 2 3 41 X X X X() 服从什么分布?
2 2 2 21 2 3 42 X X X X( ) 服从什么分布?
12
22
34
3 XX
XX
( ) 服从什么分布?
22
12
22
34
4 XX
XX
( ) 服从什么分布?
二、填空题
2 T ( ) ( tn 2、设统计量 则T )
2
1
1
2
1
3 X ~N (,),,,
)
n
ni
i
X X X
n
X

,为样本 X =
则统计量U = n ( 服从的分布为
1 2 3
2 2 2
1 2 3
4 X ~ N ( 0,4 ),,,
( ) ~ ( 2 ) a = b =
X X X
a X b X X
,为样本。
若要求 则
22
12
11
22
12
2
,(,),(,)
,,,,
1 ) ( )
~
nn
X Y X N Y N
X X Y
n S S


5,总体 相互独立,且与Y 是两总体中抽取的样本。


2
11 (,),,,
| < 0,1 ) =
nX N X X
XX


三、计算题
、设总体 是简单随机样本,
是样本均值,n = 2 5,计算P ( |
2
1
22
1
2 (,),,,
1
( ) 2 ) =
n
n
i
i
X N X X
X
n



2
、设总体 是简单随机样本,
n=25,计算P (
2
2
1
22
3 (,),,,
1 0 < a ) = 0 9 a
nX N X X
SS
、设总体 是简单随机样本,
是样本方差,n =,已知P (,求