第五章 数理统计的基本概念数理统计──以概率论为基础,主要研究 如何 收集,整理 和 分析 实际问题的数据( 有限的资源 ),以便对所研究的问题作出 有效的 ( 精确而可靠 )结论。
☆基础──概率论
☆功能──处理数据
☆目的──作出科学推断(就概率特征)
5.1 总体与样本总体 —— 作为研究对象的随机变量
,,,,,记作 YX
样本 ——
次试验所得到的结果对总体进行 n
),,,(),,,( 2121 nn YYYXXX,,记作注意,都是随机变量,,
nn YYYXXX,,,,,2121
样本容量 ——
样本观测值 ——
n
),,(
),,(
21
21
n
n
xxx
XXX
,数值,记作的一组具体,样本
简单随机样本 —— 独立同分布,
nXXX?,,21
结论:
的一组样本,则为来自总体,设 XXXX n?,,21
的联合概率分布为,则率分布为是离散型随机变量,概若总体
nXXXxXP
X
,,},{
)1(
21?
n
i
iinn xXPxXxXxXP
1
2211 }{},,{,?
的联合概率密度为,则
)(率密度为是连续型随机变量,概若总体
nXXX
xX
,,
,)2(
21
n
i
in xxxx
1
21
* )(),,(,?
的联合分布函数为
,则的分布函数为若总体 nXXXxFX?,,),()3( 21
n
i
in xFxxxF
1
21
* )(),,(,?
用样本估计总体的分布
—— 数理统计的主要任务之一。
,)1( 是离散型的若总体 X nxxx,样本观测值为?,,21
),()(21 nmxxx m)()(
:将观测值从小到大排列的频率来估计。以用取值可的概率则由大数定理,取值
)(
)()( }{
i
ii
x
xXPx?
,)2( 是连续型的若总体 X
nxxx,样本观测值为?,,21
,,,2,1
,
],[
,,],,[
21
记频率为,
数个小区间内观察值的个观察落在第
,个小区间(一般等分)分成其中,将都包含在,使取定一适当区间
r
knk
rba
xxxba
k
n
,kh记小区间长度为频率直方图。
矩形,这样得到为高作上以在区间
k
k
kk
nh
n
aa ],(
1?
n
naa k
kk 上矩形的面积为区间 ],( 1?
的频率样本落在区间 ],( 1 kk aa
的概率总体落在区间 ],( 1 kk aa
kkaa dxx1 )(?
积。曲线下的曲边梯形的面上区间 )(],( 1 xaa kk
经验分布函数样本的分布函数)()( xF n3
将观测值从小到大排列,并写出频率分布表:
观测值频数频率
)(ix )1(x )2(x )(lx
im 1m 2m lm
n
m i
i
1? l?2?
其中,,
)()2()1( lxxx,
1
nm
l
i
i
1
1
l
i
i?
,0 当 );1(xx?
)( xF n,
)(
xx
i
i
当
);1()( ii xxx
,1 当 ).( lxx?
样本分布函数如下:
图形特点:右连续,台阶形
)( xF
n
1
i
k
k
1
21
1
)1(
x
0
)2(
x
)3(
x
)( i
x
)1(?i
x
)( l
x
x
★样本分布函数 F xn ( ) 的性质:
(1) 0 1F xn ( )
(2) F xn ( ) 是非减函数
(3) F Fn n( ),( )0 1
(4)
F x
n
( )
在每个观测点
x
i( ) 处是右连续的,点
x
i( ) 是
F x
n
( )
的跳跃间断点,
F x
n
( )
在点
x
i( ) 处的跳跃度就等于频率
i 。
★ 样本分布函数 F xn ( ) 是事件 x 的频率;
总体分布函数 F x( ) 是事件 x 的概率。
由贝努利大数定律:当 n 时,F xn ( ) 按概 率 收 敛 于 F x( ),即:
1)|)()((|lim,0
xFxFP
n
n
! 这是我们在数理统计中 用样本推断总体 的理论基础。
5。 2 统计量样本的函数 —— 统计量(不含未知参数)
为了将样本中的信息提取出来,构造则的样本为来自总体,设,,,21 Xxxx n?
统计量。,),,( 21 nxxxf?
样本是随机变量,所以统计量也是随机变量。
常用的统计量分布样本均值,?
n
i
ixnx
1
1
样本方差:
2
1
2
1
22
1
)(
1
xx
n
xx
n
s
n
i
i
n
i
i
修正样本方差:
2
1
22*
1
)(
1
1
s
n
n
xx
n
s
n
i
i
样本标准差:
n
i
i xxns
1
2)(1
修正样本标准差:
s
n
n
xx
n
s
n
i
i
1
)(
1
1
1
2*
样本 K阶原点矩,?
n
i
k
ik xnv
1
1
如:样本均值 是一阶原点矩。
n
i
ixnx
1
1
样本 k阶中心矩,?
n
i
k
ik xxnu
1
)(1
一阶中心矩总是为零,
如:样本方差 是二阶中心矩
n
i
i xxns
1
22 )(1
n
i
i xxnu
1
1 0)(
1
( 1)使用计算器计算统计量的值。
( 2)使用 EXCEL计算统计量的值。
样本均值 (AVERAGE)
样本方差( VARP)
样本标准( STDEVP)
修正样本标准差( STDEV)
修正的样本方差( VAR)
例 1.已知样本观测值为 15.8,24.2,14.5,17.4,
13.2,20.8,17.9,19.1,21.0,18.5,16.4,
22.6。 计算样本平均值、样本方差及修正样本方差。
输入观察值求样本均值
B1,B12
求样本方差
B1,B12
求样本标准差
B1,B12
求修正的样本方差
B1,B12
求修正的样本标准差
B1,B12
☆基础──概率论
☆功能──处理数据
☆目的──作出科学推断(就概率特征)
5.1 总体与样本总体 —— 作为研究对象的随机变量
,,,,,记作 YX
样本 ——
次试验所得到的结果对总体进行 n
),,,(),,,( 2121 nn YYYXXX,,记作注意,都是随机变量,,
nn YYYXXX,,,,,2121
样本容量 ——
样本观测值 ——
n
),,(
),,(
21
21
n
n
xxx
XXX
,数值,记作的一组具体,样本
简单随机样本 —— 独立同分布,
nXXX?,,21
结论:
的一组样本,则为来自总体,设 XXXX n?,,21
的联合概率分布为,则率分布为是离散型随机变量,概若总体
nXXXxXP
X
,,},{
)1(
21?
n
i
iinn xXPxXxXxXP
1
2211 }{},,{,?
的联合概率密度为,则
)(率密度为是连续型随机变量,概若总体
nXXX
xX
,,
,)2(
21
n
i
in xxxx
1
21
* )(),,(,?
的联合分布函数为
,则的分布函数为若总体 nXXXxFX?,,),()3( 21
n
i
in xFxxxF
1
21
* )(),,(,?
用样本估计总体的分布
—— 数理统计的主要任务之一。
,)1( 是离散型的若总体 X nxxx,样本观测值为?,,21
),()(21 nmxxx m)()(
:将观测值从小到大排列的频率来估计。以用取值可的概率则由大数定理,取值
)(
)()( }{
i
ii
x
xXPx?
,)2( 是连续型的若总体 X
nxxx,样本观测值为?,,21
,,,2,1
,
],[
,,],,[
21
记频率为,
数个小区间内观察值的个观察落在第
,个小区间(一般等分)分成其中,将都包含在,使取定一适当区间
r
knk
rba
xxxba
k
n
,kh记小区间长度为频率直方图。
矩形,这样得到为高作上以在区间
k
k
kk
nh
n
aa ],(
1?
n
naa k
kk 上矩形的面积为区间 ],( 1?
的频率样本落在区间 ],( 1 kk aa
的概率总体落在区间 ],( 1 kk aa
kkaa dxx1 )(?
积。曲线下的曲边梯形的面上区间 )(],( 1 xaa kk
经验分布函数样本的分布函数)()( xF n3
将观测值从小到大排列,并写出频率分布表:
观测值频数频率
)(ix )1(x )2(x )(lx
im 1m 2m lm
n
m i
i
1? l?2?
其中,,
)()2()1( lxxx,
1
nm
l
i
i
1
1
l
i
i?
,0 当 );1(xx?
)( xF n,
)(
xx
i
i
当
);1()( ii xxx
,1 当 ).( lxx?
样本分布函数如下:
图形特点:右连续,台阶形
)( xF
n
1
i
k
k
1
21
1
)1(
x
0
)2(
x
)3(
x
)( i
x
)1(?i
x
)( l
x
x
★样本分布函数 F xn ( ) 的性质:
(1) 0 1F xn ( )
(2) F xn ( ) 是非减函数
(3) F Fn n( ),( )0 1
(4)
F x
n
( )
在每个观测点
x
i( ) 处是右连续的,点
x
i( ) 是
F x
n
( )
的跳跃间断点,
F x
n
( )
在点
x
i( ) 处的跳跃度就等于频率
i 。
★ 样本分布函数 F xn ( ) 是事件 x 的频率;
总体分布函数 F x( ) 是事件 x 的概率。
由贝努利大数定律:当 n 时,F xn ( ) 按概 率 收 敛 于 F x( ),即:
1)|)()((|lim,0
xFxFP
n
n
! 这是我们在数理统计中 用样本推断总体 的理论基础。
5。 2 统计量样本的函数 —— 统计量(不含未知参数)
为了将样本中的信息提取出来,构造则的样本为来自总体,设,,,21 Xxxx n?
统计量。,),,( 21 nxxxf?
样本是随机变量,所以统计量也是随机变量。
常用的统计量分布样本均值,?
n
i
ixnx
1
1
样本方差:
2
1
2
1
22
1
)(
1
xx
n
xx
n
s
n
i
i
n
i
i
修正样本方差:
2
1
22*
1
)(
1
1
s
n
n
xx
n
s
n
i
i
样本标准差:
n
i
i xxns
1
2)(1
修正样本标准差:
s
n
n
xx
n
s
n
i
i
1
)(
1
1
1
2*
样本 K阶原点矩,?
n
i
k
ik xnv
1
1
如:样本均值 是一阶原点矩。
n
i
ixnx
1
1
样本 k阶中心矩,?
n
i
k
ik xxnu
1
)(1
一阶中心矩总是为零,
如:样本方差 是二阶中心矩
n
i
i xxns
1
22 )(1
n
i
i xxnu
1
1 0)(
1
( 1)使用计算器计算统计量的值。
( 2)使用 EXCEL计算统计量的值。
样本均值 (AVERAGE)
样本方差( VARP)
样本标准( STDEVP)
修正样本标准差( STDEV)
修正的样本方差( VAR)
例 1.已知样本观测值为 15.8,24.2,14.5,17.4,
13.2,20.8,17.9,19.1,21.0,18.5,16.4,
22.6。 计算样本平均值、样本方差及修正样本方差。
输入观察值求样本均值
B1,B12
求样本方差
B1,B12
求样本标准差
B1,B12
求修正的样本方差
B1,B12
求修正的样本标准差
B1,B12