《数理统计》
——
对随机现象进行观测、试验,
以取得有代表性的观测值
——
对已取得的观测值进行整理、
分析,作出推断、决策,从而找出所研究的对象的规律性数理统计的分类描述统计学推断统计学第六章 数理统计的基本概念数参估计 (第七章 )
假设检验 (第八章 )
回归分析 (第九章 )
方差分析 (第九章 )
推断统计学美国经济学家罗伯特 恩格尔
(Robert F,Engle 1942 ~)
英国经济学克莱夫 格兰杰
(Clive Granger 1934 ~)
共同获得
2003年诺贝尔经济学奖
20 世纪 80 年代两位获奖者发明了新的统计方法来处理许多经济时间数列中两个关键属性:
易 变 性随时间变化的非稳定性恩格尔 研究方向主要是利率、汇率和期权的金融计量分析格兰杰 的研究涉及统计和经济计量学时间序列分析、预测、金融、人口统计学、方法论等领域,
提出谱分析回归等创新性统计方法特别是总体 —— 研究对象全体元素组成的集合所研究的对象的某个 (或某些 )数量指标的全体,它是一个随机变量 (或多维随机变量 ).记为 X,
X 的分布函数和数字特征称为总体的分布函数和数字特征,
总体和样本
§ 6.1 基本概念样本 —— 从总体中抽取的部分个体,
称 为总体 X 的一个容量为 n
的样本观测值,或称样本的一个实现,
),,,( 21 nxxx?
),,,( 21 nXXX?用 表示,n 为 样本 容量,
样本空间 —— 样本所有可能取值的集合,
个体 —— 组成总体的每一个元素即总体的每个数量指标,可看作随机变量 X 的某个取值,用 表示,
iX
若总体 X 的 样本 满足,),,,( 21 nXXX?
一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替,而代替的条件是
nXXX,,,21?(1) 与 X 有相同的分布
nXXX,,,21?(2) 相互独立
),,,( 21 nXXX?则称 为 简单随机样本,
简单随机样本
N / n? 10.
总体中个体总数 样本容量设总体 X 的分布函数为 F (x),则样本
n
i
in xFxxxF
1
21 )(),,,(?总若总体 X 的密 d.f.为 f( x),则 样本
n
i
in xfxxxf
1
21 )(),,,(?总的联合 d.f.为
),,,( 21 nXXX?的联合分布函数为例如 设某批产品共有 N 个,其中的次品数为 M,其次品率为
NMp /?
若 p 是未知的,则可用抽样方法来估计它,
所取的产品不是次品所取的产品是次品
,0
,1
X
X 服从参数为 p 的 0-1分布,可用如下表示方法,1,0,)1(),( 1 xpppxf xx
从这批产品中任取一个产品,用随机变量
X来描述它是否是次品,
设有放回地抽取一个容量为 n 的样本
),,,( 21 nXXX?
),,,( 21 nXXX?的联合分布为

n
i
i
n
i
i
xnx
n
i
in
pp
xfxxxf
11 )1(
)(),,,(
1
21总
),,,( 21 nxxx?其样本值为
},,2,1,1,0),,,{( 21 nixxxx in
样本空间为若抽样是无放回的,则前次抽取的结果会影响后面抽取的结果,例如
1
1)11(
12?

N
MXXP
1
)01( 12

N
MXXP
所以,当样本容量 n 与总体中个体数目 N
相比很小时,可将无放回抽样近似地看作放回抽样,
pp N
N
N

1
1
1
pp N
N

11
设 是取自总体 X 的一个样本,
),,,( 21 nXXX?
),,,( 21 nrrrg?
),,,( 21 nxxxg?
为一实值连续函数,且不含有未知参数,
),,,( 21 nXXXg?则称随机变量 为 统计量,
),,,( 21 nxxx?若 是一个样本值,

),,,( 21 nXXXg?的 一个样本值为统计量定义统计量例 是未知参数,22,,),(~NX
若?,? 已知,则为统计量是一样本,),,,( 21 nXXX?



n
i
i
n
i
i XXnSXnX
1
22
1 1
1,1
是统计量,其中 ),(~ 2NX i
则但
n
i
iX
1
2
2
1?
不是统计量,
常用的统计量
n
i
iXnX
1
1)1(
为 样本均值


n
i
i XXnS
1
22
1
1)2( 为 样本方差

n
i
i XXnS
1
2
1
1为 样本标准差
),,,( 21 nXXX?设 是来自总体 X 的容量为 n 的样本,称统计量
n
i
k
ik XnA
1
1)3( 为 样本的 k 阶 原点矩


n
i
k
ik XXnB
1
1)4( 为 样本的 k 阶 中心矩例如
2
1
2
2
2
1
11
n
n
i
i
SXX
n
S
n
n
B
XA

(5) 顺序统计量与极差设 ),,,( 21 nXXX? 为样本,
),,,( 21 nxxx? 为样本值,且 **2*1 nxxx
当 ),,,( 21 nXXX? 取值为 ),,,( 21 nxxx? 时,
定义 r.v,nkxX
kk,,2,1,
*
)(
则称统计量 )()2()1(,,,nXXX?为 顺序统计量,
其中,}{m a x},{m i n
1)(1)1( knknknk XXXX
称 )1()( XXD nn 为 极差注 样本方差 与样本二阶中心矩 的不同2
nS2S



n
i
n
i
i
n
i
i XXXX
1
2
11
2 2 22
1
2 2 XnXnX
n
i
i
2
1
2 XnX
n
i
i
)(
2
2 XAn
故 22
2
2
1
)(
1 n
S
n
nXA
n
nS

222 XAB



n
i
ii
n
i
i XXXXXX
1
22
1
2 )2()(推导关系式 22
1 n
S
n
nS
1)
推导 设 2)(,)( XDXE 则


n
i
iXnEXE
1
1
21?nXD?
2) 22 1)(?
n
nSE
n
22 )(SE
222 )( XEEASE nXEXDXnE
n
i
i
2
1
21


2222 1 n
21?
n
n


22
1
)( nS
n
nESE 22
1

nES
n
n
例 1 从一批机器零件毛坯中随机地抽取
10件,测得其重量为 (单位,公斤 ):
210,243,185,240,215,
228,196,235,200,199
求这组样本值的均值、方差、二阶原点矩与二阶中心矩,
解 ),,,(
1021 xxx?

)199,200,235,196,228
,215,240,185,243,210(?
43.4 3 3)(
9
1 10
1
22
i
i xxs

10
1
2
2 5.4 7 5 2 210
1
i
ixA
0.3 9 0)(
10
1
10
9 10
1
22
2
i
i xxsB
19.2 1 7
)1 9 92 0 02 3 51 9 62 2 8
2 1 52 4 01 8 52 4 32 3 0(
10
1

x
则例 2 在总体 中,随机抽取一个容量为 36的样本,求样本均值 落在 50.8到 53.8
之间的概率,
)3.6,52( 2N
X

)36/3.6,52(~ 2NX故




6/3.6
528.50
6/3.6
528.53
)8.538.50( XP
8 2 3 9.0
)1 4 2 9.1()7 1 4 3.1(

例 3 设总体 X 的概率密度函数为
10
1
)(
x
xx
xf
为总体的样本,求),,,( 5021 XXX?
(1)X 的数学期望与方差 (2) )( 2SE
(3) )02.0(?XP
解 (1) 0d)()( 1
1

xxxXEXE
100
1
d2
50
1
)(
50
1
)(
50
1
)(
1
0
2
2


xxx
XEXDXD
8414.0?
)01.0,0(~ NX
近似(3) 由中心极限定理
(2),2/1)()()( 22 XEXDSE
2.0Φ12


1.0
002.0
12
)02.0(1)02.0( XPXP
作业 P,202 习题六
2 5
6 7