概率与统计 咸宁职业技术学院
龚友运 等 主编
第五章
数理统计初步
概率与统计 咸宁职业技术学院
龚友运 等 主编
第一节
概率与统计 咸宁职业技术学院
龚友运 等 主编
总 体 —— 研究对象的全体
个 体 —— 组成总体的每一个对象
总体容量 —— 总体中包含个体的个数
(它可以是有限个也可以是无限多个,)
在实际检验的过程中,并不是将这 3万只灯泡全部一一进行
检验,常常是随机地抽取其中一部分来进行灯泡的寿命的检测,
事实上,通常 没有必要有时甚至不可能 对总体逐一进行检验,
如考察一批炮弹的质量,能把它们全部爆炸来进行检验吗?又
如,检验一批棉花的纤维抗拉强度也只能随机地抽取其中一部
分来进行,等等,
概率与统计 咸宁职业技术学院
龚友运 等 主编
样 本 —— 从总体中抽取的部分个体,
样本所包含个体的个数称为 样本容量,
进行抽样时,样本的选取必须是随机的,即总
体中的每个个体都有同等的机会被抽出.通常有
两种抽样方式,一是无放回抽样.二种是有放回
抽样, 无放回抽样时,每个个体最多可以被抽出
一次,而有放回抽样时,同一个个体可能被抽出
多次,在实际问题中,通常是无放回抽样, 当 总
体容量很大 时,常常又将无放回抽样近似地看成
是有放回抽样使问题简化,
概率与统计 咸宁职业技术学院
龚友运 等 主编
一般,对有限总体,有放回抽样所得
到的样本为 简单随机样本
但在实际使用中不方便,常用不放
回抽样代替,而代替的条件是
简单随机样本
N / n ? 10.
总体中个体总数 样本容量
概率与统计 咸宁职业技术学院
龚友运 等 主编
),,,( 21 n??? ?
由于总体是服从某一分布的,而抽样又是随
机的,因此简单随机样本实际上是几个 互相独
立的与总体有相同分布 的随机变量,
),,,( 21 nxxx ?
每一次具体抽样所得的数据(即观察值)称为
一个 样本值 用 表示,n 为样本 容量,
它表示某一次抽样的具体数据,有时也可以看成一个 n
元随机向量.
概率与统计 咸宁职业技术学院
龚友运 等 主编
? ???
??
?
?
??
n
i
i
n
i
i xxnSxnx
1
22
1 1
1,1
定义 4 样本 的函数
f( )称为 样本统计量
nxxx,,,21 ?
nxxx,,,21 ?
nxxx,,,21 ?
一个样本可以有多个统计量,如
),(~ 2??? N
为了便于应用,下面给出几个最常用的统计量的分布,
这些统计量都是在总体为 正态分布,即随机变量
的条件下得出的, 这里略去证明,仅给出统计量的分布,
概率与统计 咸宁职业技术学院
龚友运 等 主编
(1 ) 2? 分布
定义
n???,,,21 ?设 相互独立,
且都服从标准正态分布 N (0,1),
)(记做分布的自由度为
服从,则称随机变量设
nn
n
i
i
22
1
2
~,???
??? ?
?
?
常用的统计量的分布
概率与统计 咸宁职业技术学院
龚友运 等 主编
22
2
1
2
1
,0
2 ( )()
0,0
xn
n
n
e x x
fx
x
???
?
?
??
?
?
??
一般
其中,
? ?? ??? 0 1)( dtetx tx?
在 x > 0时收敛,称为 ?函数,具有性质
)(!)1(
)2/1(,1)1(),()1(
Nnnn
xxx
????
???????? ?
2? 的密度函数 为自由度为 n 的
概率与统计 咸宁职业技术学院
龚友运 等 主编
)(
,),(),(1
21
2
21
212
2
21
2
1
nn
nn
+~+则
相互独立,若
???
?????? ???
正态分布时,??? )(2 2 nn ??
分布的性质)(2 n?
概率与统计 咸宁职业技术学院
龚友运 等 主编
5 10 15 20 25
0.1
0.2
0.3
0.4
n=2
n = 3
n = 5
n = 10
n = 15
f( x)的图像如图,它与 n有关,当 n增大时,图形
渐渐接近正态分布,
概率与统计 咸宁职业技术学院
龚友运 等 主编
(2 ) t 分布
定义
则称 t 服从自由度为 n 的 t分布 记为 t~ t(n)
其 密度函数 为
n
t
?
?
?
)(1
2
2
1
)(
2
1
2
?????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
x
n
x
n
n
n
xf
n
?
),(~,)1,0(~ 2 nN ???设 相互独立??,
概率与统计 咸宁职业技术学院
龚友运 等 主编
t 分布的图形 (绿色的是标准正态分布 )
它与 n有关,当 n增大时,图形渐渐接近正态分布,
概率与统计 咸宁职业技术学院
龚友运 等 主编
(3) F 分布
则称 F 服从 自由度 为 n1,第二自由度 为 n2的
F 分布,
其密度函数为
定义 ),(~),(~ 2212 nn ????设
2
1
/
/
n
n
F
?
?
?

?
?
?
?
?
?
?
??
??
?
?
?
?
?
??
0)1()(
)
2
()
2
(
2
0,0
)(
2
2
1
1
22
2
1
21
21
2111
xx
n
n
x
n
n
nn

nn

x
xf
nnnn

相互独立??,
概率与统计 咸宁职业技术学院
龚友运 等 主编
f( x)的图像如图所示,它与 n1,n2 有关
概率与统计 咸宁职业技术学院
龚友运 等 主编
以上三种分布是由正态分布派生出来的
三大分布,
2?
2?
即 分布,t 分布和 F 分布,其数值可
通过查书末的相关分布表来求得, 它们在后面
的区间估计与假设检验知识中都将被用到,
概率与统计 咸宁职业技术学院
龚友运 等 主编
样本方差及其数字特征
例 1 我们抽测 100株某品种的玉米的穗位(单米),得
到如下数据:
127 118 121 113 145 125 87 94 118 111
102 72 113 76 101 134 107 118 114 128
118 114 117 120 128 94 124 87 88 105
115 134 89 141 114 119 150 107 126 95
137 108 129 136 98 121 91 111 134 123
138 104 107 121 94 126 108 114 103 129
103 127 93 86 113 97 122 86 94 118
109 84 117 112 112 125 94 73 93 94
102 108 158 89 127 115 112 94 118 114
88 111 111 104 101 129 114 128 131 142
概率与统计 咸宁职业技术学院
龚友运 等 主编
由于数据很多,按照大小顺序排列起来,进一步把它们分成一
些组,把每一组作为一个单元,在同一组内的数据都看成是相同的,
它们都等于组的两端值的平均数 —— 组中值, 然后就得到了频数、频
率, 列成表或画成图就得到了样本分布,如表
ix
组 限(厘米) 组中值 频 数 频 率( %) 累计频率( %)
70— 80
80— 90
90— 100
100— 110
110— 120
120— 130
130— 140
140— 150
150— 160
75
85
95
105
115
125
135
145
155
3
9
13
16
26
20
7
4
2
3
9
13
16
26
20
7
4
2
3
12
25
41
67
87
94
98
100
x
概率与统计 咸宁职业技术学院
龚友运 等 主编
样本密度分布直方图;
频率
概率与统计 咸宁职业技术学院
龚友运 等 主编
累计频率图 ;
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 2 随机地观察总体,得 10个数据如下:
3 2.5 4 -3 -2.5 0 3 2 2.5 4.
则其样本分布函数为
0 当 X<-4
1/10 当 -4≤X<-3
2/10 当 -3 ≤ X<-2.5
3/10 当 -2.5 ≤ X<0
4/10 当 0 ≤ X<2
5/10 当 2 ≤ X<2.5
7/10 当 2.5 ≤ X<3
9/10 当 3 ≤ X<4
1 当 X≥4
?
F10( x)=
概率与统计 咸宁职业技术学院
龚友运 等 主编
样本的数字特征
?
?
?
n
i
ixnx
1
1)1( 为 样本平均值
? ??
?
?
?
?
n
i
i xxnS
1
22
1
1)2( 为 样本方差
? ??
?
?
?
?
n
i
i xxnS
1
2
1
1 为 样本标准差
),,,( 21 nxxx ?设 是来自总体 的容量
为 n 的样本,称统计量
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
11?n
11?n
1
1
?
?
n
).2( 2
1
2
1
xnxxx
n
k
k
n
k
k ?? ??
??
)2( 22
1
2 xnxnx
n
k
k ???
?
? ? ??
?
? ?
?
n
i
i xxnS
1
22
1
1
xxx nk knk k,2 121 ?? ?? ? xnxnk 221 2 2 ???
1
1
?n
1
1
?
?
n
)( 22
1
xnxx k
n
k
k ??
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 3 从一批5万个灯泡中随机抽出10个灯泡,测得其使用
寿命如下,(单位:万小时 ):
0.1 0.5 0.35 0.15 0.1 0.2 0.05 0.1 0.2 0.2
则其样本平均数
( 0.1+0.5+0.35+0.15+0.1+0.2+0.05+0.1+0.2+0.2)
( 0.13 +0.51 +0.351 +0.151+0.23 +0.051)
= 0.195(万小时)
x
x
x
10
1?
概率与统计 咸宁职业技术学院
龚友运 等 主编
110
12
?
?s )1 9 5.0102.05.01.0( 2222 ????? ?
其 样本方差
=0,019
14.0019.0 ??s
概率与统计 咸宁职业技术学院
龚友运 等 主编
第二节
概率与统计 咸宁职业技术学院
龚友运 等 主编
什么是参数估计?
参数是刻画总体某方面概率特性的数量,
当此数量未知时,从总体抽出一个样本,
用某种方法对这个未知参数进行估计从而确
定随机变量 (总体 )的分布函数,称这类问题
为参数估计
参数估
计问题
点 估 计
区间估 计
概率与统计 咸宁职业技术学院
龚友运 等 主编
例如,
若 ?,? 2未知,通过构造样本的函数,给出
它们的估计值或取值范围就是参数估计
的内容, 点估计 区间估计
点估计 —— 估计未知参数的值
区间估计 ——
估计未知参数的取值范围,
并使此范围包含未知参数
真值的概率为给定的值,
),(~ 2??? N
概率与统计 咸宁职业技术学院
龚友运 等 主编
一,点估计
1 期望的点估计
对于随机变量 ? 其样本值为
代表随机变量取值的平均水平,把?E
样本平均值
n
xxx
x n
????
? 21
nxxx,,,21 ?
的 估计量 。?E n越大估计得越准
由于
作为
概率与统计 咸宁职业技术学院
龚友运 等 主编
注意
今后我们也是用这个办法来估计,要回答这
个问题为什么好并不容易,这是 由于本身等于多
少并不知道,只知道样本值,而样本的
具体数值有可以随机变化,所以样本平均值,也
是随机变量的取值也是偶然的,
?E
?E
),,,( 21 nxxx ?
x
概率与统计 咸宁职业技术学院
龚友运 等 主编
若估计量
?? ?)?(E满足
则称 ?? 是 ? 的无偏估计量,
无偏性
定义
我们不可能要求每一次由样本得到的
估计值与真值都相等,但可以要求这些估
计值的期望与真值相等,
定义的合理性
),,(? 21 nxxx ??
概率与统计 咸宁职业技术学院
龚友运 等 主编
??
无偏估计的定义表明,估计量
的一系列取值在参数的真值周围摆动而 无系统误差
(不具有累加性的误差称为 系统误差 ).
??
定理 1
存在,则 ?ExE ?)(设 ?E
概率与统计 咸宁职业技术学院
龚友运 等 主编
证明:事实上
?E
n
ExExEx
n
xxx
ExE nn ?
????
?
????
? 2121 )()(
的期望、方差都存在,

?
n
D
xD n
?
?)(
定理2 设
概率与统计 咸宁职业技术学院
龚友运 等 主编
2 方差的点估计
?D ?
?
?
?
?
?
n
i
i xxnS
1
22 )(
1
1用 来估计方差的小.
描叙了 取值分散程度,
概率与统计 咸宁职业技术学院
龚友运 等 主编
例1 设总体 的期望 与方差存在,的
),,,( 21 nxxx ?样本为 (n > 1),
(1) 不是 D( )的无偏估量 ;
?
?
??
n
i
in xxnS
1
22 )(1
(2) 是 D( ) 的无偏估计量, ?
?
?
?
?
n
i
i xxnS
1
22 )(
1
1
证 2
1
2
1
2 1)(1 xx
n
xx
n
n
i
i
n
i
i ??? ??
??

2)()(,)()( ???? ???? DxDExE
ii
nxDExE
2
)(,)()( ??? ???
? ?
?
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
)()(
1
)(
1 2
1
2
1
2 xExE
n
xx
n
E
n
i
i
n
i
i ???
?
?
?
?
?
? ??
??
因而
)()( 2
2
22 ???? ????
n
221 ?? ???
n
n
2
1
2)(
1
1
???
?
?
?
?
?
?
? ??
n
i
i xxnE
故 证毕,
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 1 ( )是总体中取出的一个
容量为 n的样本,则样本平均数 及样本
方差 分别为及 的无偏估计
量.
nxxx,,,21 ?
x
2s 2??和
??? ???? ??
??
n
n
E
n
x
n
ExE
n
k
k
n
k
k
11)(1
11
证明:
2
2
2
2
1
2
1
111)1()( ???
nnnDnxnDxD
n
k
k
n
k
k ???? ??
??
概率与统计 咸宁职业技术学院
龚友运 等 主编
2
1
2
1
2 )]([
1
1))(
1
1()( ??
??
????????
n
k
k
n
k
k xxEnxxnEsE ??
)])((2
])()([
1
1
1
2
1
2
??
??
???
???
?
?
?
? ?
?
?
xx
xnExE
n
n
k
k
n
k
k
])()([11 2
1
2? ?
?
?????
n
k
k xnExEn ??
2
1
2 )(
1)(1
1 ?? ?
????? ?? xEn
nx
n
n
k
k
2
2
2
11
1 ??? ?
?
?
?
?
nn
nn
n
概率与统计 咸宁职业技术学院
龚友运 等 主编
3.标准差的估计
?
?
???
n
i
i xxnS
1
2)(
1
1
)(?D
由于 是 D( ) 的无偏估计量, ?
?
?
?
?
n
i
i xxnS
1
22 )(
1
1 ?
用样本标准差来估计
作为总体 标准差 的估计量,
注意
)(?DS一般不是 的无偏估计量
概率与统计 咸宁职业技术学院
龚友运 等 主编
*二 最大似然估计
?
?nxxx,...,2,1
设 是从总体随机变量
nxxx,...,2,1
nxxx,...,2,1 ?
中抽到的样本
为总体分布中的未知参数,
现要根据 来估计 的值,
1.设 为离散型随机变量,概率密度数? ),,()( ??
ii xpxp ??
当已知样本值 时,联合分布为
概率与统计 咸宁职业技术学院
龚友运 等 主编
2.若 为连续型随机变量,),( ?xF分布函数是
其中 为参数? 由样本的独立性,则样本
nxxx ?21,
的联合概率密度函数为 当已知样本值时,
它是 的函数,?
?
),( ?? x概率密度函数是
称为 似然函数,
记为
概率与统计 咸宁职业技术学院
龚友运 等 主编
3、似然函数与极大似然估计
为总体 的 似然函 。
若 L 在 处达到最大值,则称 是 ? 最大似然函数
估计量??
对 由多元函数取
得极值的必要条件可知,当 L取得最大值时,则
似然函数 L的偏导数存在且为 0,
)( mnxxxLL ??? ?? 2121 ;?
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
..,
0
0
2
1
m
L
L
L
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
ln
..,
0
ln
0
ln
2
1
m
L
L
L
?
?
?
( lnL与 L同时取得最大值)或
于是,解以上方程组可求 ?
?
的最大似然估计值.
即有
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 1 设总体 的密度函数为
?
?
?
?
?
?
?
?
?
00
,0
1
);(
x
xe
xf
x
?
??
),,,( 21 nxxx ? 为 的一个样本值,
求 ?的 极大似然估计量,并判断它是否达到
方差下界的无偏估计量,
0?? 为常数
解 由似然函数
?
?
?
?
?
??
n
i
ix
n
eL
11
)(
?
??
?
??? ?
n
i
ix
nL 1ln)(ln
?
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
2
1)(ln
d
d
??
?
?
?
??? ?
n
i
ixn
L0令?
xx
n
n
i
i ???
? 1
1??
?的极大似然估计量为
xx
n
n
i
i ???
? 1
1??
它是 ?的无偏估计量,
n
x
n
DD
n
i
i
2
1
)1()?( ?? ?? ?
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 4 设随机变量 服从泊松分布 ??
? ?ek
k
!=k)= P(
(k=0,1,2,..,)其中 0?? 是 一未知参数,求 ?
的最大似然估计量.
nxxx ?21,n???,...,2,1设 为子样 的一组观测值

于是似然函数
??? ??? ??? e
x
e
x
e
x
nxxx
!!! 111
21
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
?? n
n
x
e
xxx
n
i
i
?
?
?
?
!!,..! 21
1
两边取对数 ??
??
????
n
i
i
n
i
i xxnL
11
)!( l nlnln ??
求关于
?
的偏导数,并使其等于 0,于是,?
01)( ln
1
?????? ?
?
n
i
ixn
L
??
所以 x?? 由 0ln
2
2
??? ? xL ??
推出 使 L达到极大,x???
从而得出 的最大似然估计量? xxxx
nL ?),...,,( 21?
概率与统计 咸宁职业技术学院
龚友运 等 主编
三 矩估计
?
?k kEE )( ?? ?
.?k?
)(? kE称 ( k=1,2,… )为
( k=1,2,… )为
定义 14
的 k
阶 原点矩, 记为 称
的 k阶 中心矩,记为
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 2 设总体 为
总体的样本值,求 ?,? 2 的矩估计量,

x???
2
1
22 1? xx
n
n
i
i ?? ?
?
矩?
nxxxN ?21
2,),,(~ ???
2
12
2
1
222
21
)(
vvv
EvEv
???
?????
??
?????
解得
???1用 ?
?
n
k
kxn
1
1
???2 21
1
2,1 vvx
n
n
k
k 分别估计 ?
?
? ?2代入上述二式可得 的 矩估计量为
?
?
?
n
k
kxn
1
1
概率与统计 咸宁职业技术学院
龚友运 等 主编
说明
对于正态分布的 参数而言,矩估
计量与最大似然估计量完全相同,但对于不少
分布它们并不一样,
通常用矩法估计参数比较方便,但样本容
量 n较大时,矩估计量的精度一般不如最大似
然估计量的精度高,
? ?2
概率与统计 咸宁职业技术学院
龚友运 等 主编
四 区间估计
用点估计法来估计总体的参数十分简单易行,但由
于样本的随机性,从一个样本算得估计量的值不一定恰
好是所要估计的参数值.那么估计量的值与参数之间到
底相差多少? 另一方面,不同的样本会得到总体的同一
参数的不同估计量,如何最后确定总体的参数值呢?
因此,我们有必要进一步介绍新的估计方法, 这种方法
是根据估计量的分布,在满足一定的可信度的条件下,
指出被估计的总体的参数的可能取值范围.这就是参数
的区间估计所要解决的问题.
概率与统计 咸宁职业技术学院
龚友运 等 主编
区间估计概念
则称区间 为 ?的 臵信度为 1??的 臵信区间
设 为一给定的很小的正数? ),...,(?),,...,(?
212211 nn xxxxxx ??
为两个统计量,
??
称为 臵信度 (也称为 臵信概率 或 臵信系数 )
定义
概率与统计 咸宁职业技术学院
龚友运 等 主编
? ?反映了估计的可信度,? 越小,越可靠,
?臵信区间的长度 反映了估计精度
21 ?? ?? ?
?越小,1- ? 越大,估计的可靠度越高,但
? ?确定后,臵信区间 的选取方法不唯一,
常选最小的一个,
几点说明
越小,估计精度越高,
21 ?? ?? ?
这时,往往增大,因而估计精度降低
通常取 ?=0.05 或 0.01
12 ?? ?? ?
概率与统计 咸宁职业技术学院
龚友运 等 主编
1.正态总体期望的区间估计
( 1)总体方差 ?2已知
nxxxN ?21
2,),,(~ ???设总体 为
总体的样本值,于是 ??)( xE
n
xD ?
2
)( ?
),(~
2
n
Nx ??

)1,0(~ N
n
xu
?
???
)96.1( ?uP
从而知
)1,0(N
由 N( 0,1)的分布规律知:
概率与统计 咸宁职业技术学院
龚友运 等 主编
%95)96.1(P ????
n
x
?
?
)96.1( ?uP
%99)576.2(P ????
n
x
?
?
)576.2( ?uP
因此,对 可作如下估计:?
时当 %5??
n
x
n
x ??? 96.196.1 ????
n
x
n
x ??? 576.2576.2 ????
时当 %5??
时当 %1??
以上两式可作为公式使用,
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 已知灯泡寿命的标准差 小时,抽出 25
个灯泡进行检验,得平均寿命
50??
500?x 小时,试
以 95%的可靠性对灯泡平均寿命进行区间估计,
解,用 表示灯泡的寿命,已知 5 0 0.50 2 ?? xD ?
n=25,由于 ?=0.05故
n
x
n
x ??? 96.196.1 ????
25
5096.1500
25
5096.1500 ???? ?即
于是,的臵信区间为
(500-44.72,500+44.72)=(455.28,544.72)
?
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
(2) 总体的方差未知
对于总体的方差未知的随机变量 ),(~ 2??? N
当 是大样本时 n≥30 时作为大样本而
n<30时作为小样本较合理),于是有
nxxx,.,.,2,1
2? s? 2
n
sx
n
sx 96.196.1 ???? ?
n
sx
n
sx 576.2576.2 ???? ?时当 %1??
时当 %5??
以上两式也可作为公式使用,
概率与统计 咸宁职业技术学院
龚友运 等 主编

cm
假设豫农 1号玉米穗位(单位,cm)是一个连
续型随机变量,现在观测 100珠玉米穗位,测得其平
均高度 3.112?x 标准差 8.308?s
试求臵信度是 0.95时关于总体期望值 的臵信区间,?
解 虽然并没说明总体 服从正态分布,但是由于样
本容量 n=100可以用大样本下一般总体的臵信区间
公式,
?
???
?
???
? ???
?
?
?
?
?? n
x
n
xI,
查标准正态分布表可得:
概率与统计 咸宁职业技术学院
龚友运 等 主编
96.1?? ? 而
1 0 0
8.3 0 8??
??
?
?? n
s
n
5.601 96,??
故所求的臵信区间为:
)8.172,8.51()5.60603.112( 3.112,5,????I (单位,cm)
说明 若已知 n较大,就可把 看作近似
的服从 若 未知,大样本下可用
来代替.
x
?
?
?
?
?
?
?
?
n
N ??
2
,)(?D S2
概率与统计 咸宁职业技术学院
龚友运 等 主编
( 3)方差未知的正态总体,小样本下 的区间估计?
2?
nxxxN ?212,),,(~ ???
设总体 为
为总体的样本值,其中 未知则
S
T n )( ?? ?? 服从自由度为 n-1的 t分布.
对于给定的 ?,可查表确定 t
?
由 故
? ? ?? ??tTP
? ? ?? ?? tTP
??? ? ????
?
?
?
?
?
?
?? 1)( tnP
S
故臵信区间为:
tnstns ?? ??? ????
概率与统计 咸宁职业技术学院
龚友运 等 主编
0095

假定初生婴儿的体重服从正态分布,随机抽取
12名新生婴儿,测其体重为
3100 2520 3000 3000 3600 3160
3560 3320 2880 2600 3400 2540,
试以 95%的臵信系数估计新生婴儿的平均体重,(单位,g)
解 设新生婴儿体重为 由于 服从正态分布且方差? ?
2? 未知, 05.0??? 12?n 查 t分布表,得
2 0 1.2)11(2/ ??t 又 3057?x ? ? 3.3 7 53 0 5 7
11
1 12
1
2 ??? ?
?i
ixS
故 的臵信区间为? 201.2
12
3.3753 0 5 7201.2
12
3.3753 0 5 7 ?????? ?
即 (2821,3293)
概率与统计 咸宁职业技术学院
龚友运 等 主编
2、正态总体方差 的区间估计2?
? ? ? ?1~1 22
2
2 ??? nsn ?
??
由于 即服从自由度为 n-1 的分布?2
对于给定的 ?,通过查附表可求出 a和 b.
由 ? ? ? ? ?
?
? ???
?
??
?
? ?????? 11 2
2
2 bsnaPbaP

? ? ? ? ?? ??
???
?
???
? ???? 111 222
a
sn
b
snP
概率与统计 咸宁职业技术学院
龚友运 等 主编
于是,的臵信区间为:2?
? ? ? ?
???
?
???
? ??
a
sn
b
sn 22 1,1
ba,
其中 的选取,一般情况下是由,ba,
? ? 222 ??? ????????? ? bPaP 而定的,
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 1 已知某种木材横纹抗压力的实验值服从正态分布,
对 10个试件作横纹抗压力试验得数据如下,
482 493 457 471 510 446 435 418 394 469
试对该木材平均横纹抗压力的方差进行区间估计,
解 ? ? 36.1 1 1 5 12.3591 22 ???? sn
? ?04.0??
? ?04.0??
? ? 98.0212 ???? ?? aP ? ? 02.0
2
2 ??? ?? bP
查表得 7.19,53.2 ?? ba
? ? ? ? 5 6 61,4 4 0 81 22 ????
b
sn
a
sn而
于是,的臵信区间为,(566,4408)2?
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 2 岩石密度的测量结果
),(~ 2??? N 现抽取 12个样品,测得
1.32
12
1
??
?i
ix 92.89
12
1
2 ??
?i
ix
( 1) 已知 7.2??
( 2) 未知?
分别对这两种情形,求 的臵信区间,?2
(提示,当 已知时,的自由度为 n;当 未知时,? ?2 ?
?2 的自由度为 n-1).
概率与统计 咸宁职业技术学院
龚友运 等 主编
解 当 已知 时
7.2?? 的臵信区间为:?2
? ? ? ?
),(
12
1
2
12
1
2
a
x
b
x
i
i
i
i ??
??
?? ??
(其中 的自由度为12 )?2
? ? 95.0212 ???? ?? aP ? ? 05.022 ??? ?? bp
查 分布表 (自由度为 12)可得,?2 03.21,23.5 ?? ba
又 ? ??
?
?
12
1
2
i
ix ? 44.212 2
12
1
2 ??? ?
?
?
i
ix
概率与统计 咸宁职业技术学院
龚友运 等 主编
于是,的臵信区间为:2? ? ?47.0,12.0
23.5
44.2,
03.21
44.2 ??
?
??
?
?
(2)当 未知时 的臵信区间为:?2
? ? ? ? ?
?
??
?
? ??? ? ?
? ?
12
1
12
1
22 1,1
i i
ii xxaxxbI
其中 ? ? 95.0
21
2 ???? ?? aP ? ? 05.0
2
2 ??? ?bxP
查 分布表 (自由度为 11 )可得?2 58.4,68.19 ?? ab

? ?? ?
? ?
????
12
1
12
1
222 05.412
i i
ii xxxx
概率与统计 咸宁职业技术学院
龚友运 等 主编
于是,的臵信区间为:2?
?????? 58.4 05.4,68.19 05.4 ? ?88.0,21.0?
概率与统计 咸宁职业技术学院
龚友运 等 主编
求正态总体参数置信区间的解题步骤:
(1) 根据实际问题构造样本的函数,要求仅含待
估参数且分布已知;
(2) 令该 函数落在由分位点确定 的区间里的概率
为 给定的臵信度 1??,要求 区间按几何对称或概率
对称;
(3) 解不等式得随机的臵信 区间;
(4) 由观测值及 ?值查表计算得所求 臵信 区间。
概率与统计 咸宁职业技术学院
龚友运 等 主编
第三节
假 设 检 验
概率与统计 咸宁职业技术学院
龚友运 等 主编
假设检验
若对
参数
有所
了解
但有怀
疑猜测
需要证
实之时
用假设
检验的
方法来
处理
若对参数
一无所知
用参数估计
的方法处理
概率与统计 咸宁职业技术学院
龚友运 等 主编
假设检验是指施加于一个或多个总体的概率
分布或参数的假设, 所作假设可以是正确的,也
可以是错误的,
为判断所作的假设 (称为原假设,记为 H 0 )是否
正确,从总体中抽取样本,根据样本的取值,按一定
原则进行检验,分析由此产生的结果, 如果结果合
理,我们就肯定原假设;如果导致一个不合理的现象出现,
则表明原假设不成立,否定 H 0 从而与之对立的结论 (称
为备选假设,记为 H 1 )成立.
何为 假设检验?
概率与统计 咸宁职业技术学院
龚友运 等 主编
假设检验所以可行,其理论背景为实际
推断原理,即, 小概率原理,
假设检验的内容
参数检验
非参数检验
总体均值,均值差的检验
总体方差,方差比的检验
假设检验的理论依据
直接对总体分布
进行假设检验
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 1 根据长期经验和资料的分析,某砖厂生
产的砖的抗断强度 ξ 服从正态分布,方差
σ 2= 1.21,从该厂产品中随机抽取 6块,测得
抗断强度如下(单位, kg/cm2 )
32.56 29.66 31.64 30.00 31.87 31.03
检验这批砖的平均抗断强度为 33.50kg/cm2是否成
立( α=0.05 ),
解 这批砖的抗断强度 ξ 服从正态分布
)21.1(,N ?
概率与统计 咸宁职业技术学院
龚友运 等 主编
假设 H0,
备选假设
5.331 ?x
即这批砖的平均抗断强度为 33.5033.50kg/cm2
即这批砖的平均抗断强度不是 33.50)
H1, 5.33
1 ?x
则应有
05.096.1 ?)( > Up 或 95.096.1 ?? )(  Up
)),((其中 10U ~N
n
x
?
???
概率与统计 咸宁职业技术学院
龚友运 等 主编
检验
n
xU
?
???
621.1
5.333.31 ?? =4.454>1.96
故概率为 0.05的事件发生了, 一般地,人
们宁可相信把握性较大的事件会发生(概率为
0.95),也不愿意相信把握性较小的事件会发生
(概率为 0.05),
因此,我们拒绝 H0,即这批砖的平均抗断强度
为 33.50kg/cm2不成立, 于是,备选假设
H1, 5.33
1 ?x
成立
概率与统计 咸宁职业技术学院
龚友运 等 主编
在统计上,通常把发生的概率小于 5%的事件称
为 小概率事件, 它在一次试验中是几乎不可能发生
的事件,这种思想称为 小概率原理,
例 1的检验就是利用了小概率原理, 其中临界值
可称为 显著性水平,通常取 5%或 1%,?
利用了小概率原理,可能犯两类错误:
第一类错误 去真错误
第二类错误 存伪错误
概率与统计 咸宁职业技术学院
龚友运 等 主编
正确
正确
假设检验的两类错误
犯第一类错误的概率通常记为 ?
犯第二类错误的概率通常记为 ?
H0 为真
H0 为假
真实情况
所作判断 接受 H
0 拒绝 H0
第一类错误 (去真 )
第二类错误 (存伪 )
概率与统计 咸宁职业技术学院
龚友运 等 主编
假设检验步骤
? 根据实际问题所关心的内容,建立 H0与 H1
?在 H0为真时,选择合适的统计量 V,由 H1确
给定显著性水平 ?,其对应的拒绝域
定拒绝域形式
? 根据样本值计算,并作出相应的判断,
概率与统计 咸宁职业技术学院
龚友运 等 主编
一,U检验
对于以下几种情形,常常使用 U检验
(1) 一个小样本是否来自某参数已知的正态总体;
(2) 一个大样本是否来自某参数已知的总体;
(3) 两个大样本间有无显著差异,
概率与统计 咸宁职业技术学院
龚友运 等 主编
???0 ???0
???0
???0
? < ?0
? > ?0
2
?zU ?
?zU ??
?zU ?
U 检验法 (?2 已知 )
原假设
H0
备择假设
H1
检验统计量及其
H0为真时的分布 拒绝域
)1,0(~
0
N
n
X
U
?
??
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
例1 设某次考试的考生成绩(单位:分)
服从正态分布 N( 70,16),从中随机地抽取
100名考生的成绩,算得平均成绩为 66.5分,若
方差不变,问当显著性水平 α=0.05 时,是否可
以认为全体考生的平均成绩仍为 70分?
解 这是一个大样本 (n=100≥30) 是否来
自某参 数已知的正态总体的问题,因此
用 U检验,
概率与统计 咸宁职业技术学院
龚友运 等 主编
假设 70:
0 ?xH
即全体考生的平均成绩仍为 70分
备选假设 70
:1 ?xH
则应有
05.096.1 ?)( > Up 95.096.1 ?? )(  Up或
),(其中 10~N
n
xU
?
???
概率与统计 咸宁职业技术学院
龚友运 等 主编
检验
n
xU
?
???
1004
705.66 ?
? =8.75>1.96
故概率为 0.05的事件发生了,
因此拒绝 H0,即全体考生的平均成绩仍为
70分不成立,
于是,接受备选假设 70:
1 ?xH
即不能认为全体考生的平均成绩仍为 70分,
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 4 某校从经常参加体育锻炼的男生中随机地选出
50名,测得平均身高 174.34厘米;从不经常参加体育锻
炼的男生中随机地选 50名,测得平均身高难度 172.42厘
米,假设两种男生的身高都服从正态分布,标准差均为
6 厘米,问该校参加体育锻炼的男生是否比不常参加
体育锻炼的男生平均身高要高些? )05.0( ??
解 这是两个大样本间有无显著差异的问题,因
此用 U检验,
假设
:0H xx 21 ? (备选假设,0H xx 21 ? )则应有,
05.096.1 ?)( > Up95.096.1 ?? )(  Up 或
概率与统计 咸宁职业技术学院
龚友运 等 主编
)或,(其中 10~
2
2
21
2
1
21 N
nsns
xxU
?
?
?
)1,0(~
11 21
21 N
nn
xxU
?
?
?
?
(由于是大样本,故 )
21 ss ?? ?
检验
96.192.3
506506
42.17234.174
2
2
21
2
1
21 ??
?
?
?
?
?
?
nsns
xxU
所以拒绝原假设 H0,接受备选假设 H1,又 xx
21 ?
故该校参加锻炼的男生比不常参加锻炼的男生平均
身高要明显地高一些,
概率与统计 咸宁职业技术学院
龚友运 等 主编
二,t 检验
对于以下几种情形,常常使用 t 检验
(1) 一个小样本是否来自某参数未知的正态总体;
(2) 两个小样本间有无显著差异,
概率与统计 咸宁职业技术学院
龚友运 等 主编
T 检验法 (?2 未知 )
???0 ???0
???0
???0
2
?tT ?
? < ?0
? > ?0
?tT ?
?tT ??
)1(~
0
?
?
?
nt
n
S
X
T
?
原假设
H0
备择假设
H1
检验统计量及其
H0为真时的分布 拒绝域
概率与统计 咸宁职业技术学院
龚友运 等 主编
例1 某地九月份气温
),( ?? 25.31~N
观察九天,算得 C30 0?x, S=0.9℃,
能否据此样本认为该地区九月份平均
气温为 31.5℃,
)05.0( ??解 这是一个小样本是否来自某参数未知的正态
总体的问题,因此用 t检验,
假设 ℃xH 5.31:
0 ?
即该地区九月份平均气温为 31.5℃
概率与统计 咸宁职业技术学院
龚友运 等 主编
备选假设 ℃xH 5.31:
1 ?
则应有
))1(( 2 ?? ??? nttP )1)1(( 2 ?? ???? nttP或
? ?
ns
xtn
tt ~
?
?
??? 1其中
检验
ns
xt ???
99.0
5.3130 ?? =5>2.306 ? ?
80 2 5.0t?
故拒绝原假设 H0、接受备选假设 H1,即不能据此样
本认为该地区九月份平均气温为 31.5℃,
概率与统计 咸宁职业技术学院
龚友运 等 主编
xi1
例 8 9名学生到英语培训班学习,培训前后各进
行了一次水平测试,成绩为
学 生 编 号 1 2 3 4 5 6 7 8 9
入学前成绩 76 71 70 57 49 69 65 26 5
入学后成绩 81 85 70 52 52 63 83 33 62
假设测试成绩服从正态分布,问在显著性水平 α=0.05
下,判断对学生的培训效果是否显著?
概率与统计 咸宁职业技术学院
龚友运 等 主编
解 这是两个小样本间有无显著差异的问题,因
此用 t检验,
假设
:0H xx 21 ? (备选假设 ):1H xx 21 ?
即培训效果不显著则应有,
? ? ?? ???? )2( 212 nnttP ? ? ?? ????? 1)2( 212 nnttP或
? ? )2~
11
2
( 21
2121
2
22
2
11
21 ??
?
?
?
?
?
?
?
??
?
?
? nnt
nnnn
snsn
xx
t ?其中
概率与统计 咸宁职业技术学院
龚友运 等 主编
)16(1199.257.0
9
1
9
1
299
25.264973.2079
6.642.60
11
2
0025.0
2121
2
22
2
11
21
t
nnnn
snsn
xx
t
???
?
?
?
?
?
?
?
??
???
?
?
?
?
?
?
?
?
?
??
?
?
?
检验
所以接受假设 H0,即对学生的培训效果不显著,
概率与统计 咸宁职业技术学院
龚友运 等 主编
*三,F检验
用 F 检验可以检验两个正态总体的标准差
是否相同,
例 1 为了考察温度对某物体断裂强力的响,在 70℃
与 80℃ 下分别重复作了 8次试验,得到断裂强力的数
据如下,(单位,kg)
70℃ 20.5 18.8 19.8 20.9 21.5 19.5 21.0 21.2
80℃ 17.7 20.3 20.0 18.8 19.0 20.1 20.2 19.1
概率与统计 咸宁职业技术学院
龚友运 等 主编
假定 70℃ 下的断裂强力 ),( 211 ??? ~N
80℃ 下的断裂强力 ),( 222 ??? ~N
取 α=0.05,试比较 ξ 和 ζ 的方差有无显著差异,
解 这是判断两个正态总体的标准差是否相同的
问题,可用 F检验,
假设 H0,ξ 和 ζ 的方差没有显著差异
备选假设 H1,ξ 和 ζ 的方差有显著差异
概率与统计 咸宁职业技术学院
龚友运 等 主编
则应有 ? ? ?
? ???? )1,1( 21 nnFFP
或 ? ? ?? ????? 1)1,1( 21 nnFFP
? ?1,1 212
2
2
1 ??? nnF~
s
sF
?其中
检验
s
sF
2
2
2
1?
780.5
720.6? =1.07<4.99
)7,7(0 2 5.0F?
故应接受假设 H0,即认为 70℃ 与 80℃ 下,
物体的断裂强力的方差无显著差异,
概率与统计 咸宁职业技术学院
龚友运 等 主编
四 * 检验
检验常用来检验方差的界限 σ 2或某理
论分布的正确性 (后者称为适合性检验 ),
例 14 已知某种子的发芽率为 0.9,现用
辐射方法处理种子后,用 500粒种子做发芽实
验,其中 469粒种子发芽,问辐射处理是否显
著改变了种子的发芽率?
2?
2?
概率与统计 咸宁职业技术学院
龚友运 等 主编
解 这是一个检验某理论分布的正确性问
题,可用 x2检验,
H0:辐射处理没有改变种子的发芽率
H1:辐射处理显著地改变了种子的发芽率
备选假设
假设
概率与统计 咸宁职业技术学院
龚友运 等 主编
则应有
? ? ?? ? ??? )1P( χ 22 n ? ? ?? ? ???? 1)1P( χ 22 n或
? ? ? ? ? ?
???? ?
?
?
nm~
pn
pnm
i i
ii 1χ 2
1
2
2 ??
其中已知理论概率分布为 ppp
m,,,?21
在 n次观测中相应的频数为 ??? m,,,?21
理论频数为 pnnpnp m,,,?21
概率与统计 咸宁职业技术学院
龚友运 等 主编
检验 如果没有改变发芽率,则 500粒种子
的理论发芽种子数及不发芽种子数应
分别为:
4509.0500 ???np
501.05 0 0 ???nq
但实测数
469?pv
31469500 ???qv
概率与统计 咸宁职业技术学院
龚友运 等 主编
022.850 )5031(450 )450469(
22
2 ??????
则 >3.841
?? 2 050。
而 )841.3( 2 ??P =0.95
这表明小概率事件发生了, 因此拒绝原
假设 H0、接受备选假设 H1,即可以认为辐射
处理种子显著地改变了种子的发芽率,
概率与统计 咸宁职业技术学院
龚友运 等 主编
第四节
回归分析简介
概率与统计 咸宁职业技术学院
龚友运 等 主编
第四节 回归分析简介
一、一元线性回归与最小二乘法
? 回归分析, 由一个 ( 或一组 ) 非随机变量来估
计 ( 或预测 ) 某一个随机变量的观测值时, 所
建 立的数学模型和所进行的统计分析,
? 线性回归分析, 如果这个模型是线性的,
? 一元回归分析, 研究两个变量的相关关系的回
归分析,
概率与统计 咸宁职业技术学院
龚友运 等 主编
?例 1,维尼纶纤维的耐热水性能好坏可以用指标
,缩醛化度, y来衡量,这个指标越高,耐热水性能
也越好,而甲醛浓度是影响缩醛化度的重要因素,
在生产中常用甲醛浓度 x( 克 /升)去控制这一指标,
为此必须找出它们之间的关系,现安排了一批试验,
获得如下数据:
甲醛浓度 x( 克 /升) 18 20 22 24 26 28 30
缩醛化度 y( 克 /升 ) 26.86 28.35 28.75 28.87
29.75 30.00 30.36
概率与统计 咸宁职业技术学院
龚友运 等 主编
? 可在直角坐标系下作图
概率与统计 咸宁职业技术学院
龚友运 等 主编
从图中我们发现随着甲醛浓度 x的增加,
缩醛化度 y也增加,且这些点
(i=1,2,…,7)近似地在一直线附近,但又不完
全在一条直线上,引起这些点
与直线偏离的原因是由于在生产过程或测试过
程中,还存在着一些不可控的因素,它们都在影
响着试验结果
.
),( ii yx
概率与统计 咸宁职业技术学院
龚友运 等 主编
这样就可以把试验结果 y看成是由两部
分叠加而成的,一部分是由 x的线性函数引
起的,记为 a+bx,另一部分是由随机因素引
起的,记为 ε,即,
(其中
),(~ 2?bxaNy ?
),(~ 2?bxaNy ?
),,(~ 2?bxaNy ?
都不依赖于 x.上式称为 一元线性回归模型,
则 其中未知参数 2,?及ba
概率与统计 咸宁职业技术学院
龚友运 等 主编
将 ),(
ii yx
的值代入上式得
?
?
?
?
?
?
?
???
???????
???
???
?
?
?
777
22
111
xbay
bay
xbay

?
?
?
?
?
?
?
???
???????
???
???
?
?
?
777
222
111
)(
)(
)(
xbay
xbay
xbay
概率与统计 咸宁职业技术学院
龚友运 等 主编
为求式( 5-8)中 ba,的估计值,?a b? 必须使
??? 2722212 ?????s 最小,记
sbxaybaL
i
ii
2
7
1
2)]([),( ???? ?
?
由最小二乘法可得
?
?
?
??
?
?
?????
?
?
?????
?
?
?
?
?
?
7
1
7
1
,0)(2
,0)(2
i
iii
i
ii
xbxay
b
L
bxay
a
L

?
?
?
?
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
?
???
??
???
??
yxbxax
ybxa
i
i
i
i
i
i
i
i
i
i
i
7
1
7
1
2
7
1
7
1
7
1
7
概率与统计 咸宁职业技术学院
龚友运 等 主编
于是可求出 a,b的估计值,?a,?b 从而得方程
xbay ?? ??
它称为 关于的 线性回归方程 或 回归方程
y
其图形称为 回归直线, 它刻划了维尼纶纤
维的耐热水性能与, 缩醛化度, 之间的关系,
x
概率与统计 咸宁职业技术学院
龚友运 等 主编
一般地,若 n个点 ),(,),,(),,( 2211 nn yxyxyx ?
近直线 bxay ??,记
,)]([),(
1
2?
?
???
n
i
ii bxaybaL
根据微积分 中的极值原理及最小二乘法,有

?
?
?
??
?
?
?????
?
?
?????
?
?
?
?
?
?
n
i
iii
n
i
ii
xbxay
b
L
bxay
a
L
1
1
0)(2
0)(2

?
?
?
??
?
?
??
??
???
??
???
??
yxbxax
ybxna
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
11
2
1
11
)()(
)(
( 5-9)
概率与统计 咸宁职业技术学院
龚友运 等 主编
解方程组( 5-9),得到
,
)(
))((
?
1
22
1
1
2
1
?
?
?
?
?
?
?
?
?
?
?
?
??
?
n
i
i
n
i
ii
n
i
i
n
i
ii
xnx
yxnyx
xx
yyxx
b
,?? xbya ?? ( 5-10)
于是得到回归直线方程为:,?? xbay ??
,?a,?b 称为 的最小二乘估计, 若将 xbya ?? ??
代入此上式,则线性回归方程变为,
)(? xxbyy ???
.
ba,
概率与统计 咸宁职业技术学院
龚友运 等 主编
这表明,对于样本观察值
),(,),,(),,( 2211 nn yxyxyx ?
),(,),,(),,( 2211 nn yxyxyx ?
回归直线通过散点图的几何中心 ).,( yx 若记
? ?
?
?
?
?
?
?
?
?
?
?????
???
???
? ?
? ??
? ??
? ?
? ?
? ?
n
i
n
i
iiiixy
n
i
n
i
iiyy
n
i
n
i
i
i
xx
yxnyxyyxxL
ynyyyL
xnxxxL
1 1
1
2
1
2
2
1
2
1
2
2
)(
)(
)(
则 ba,的估计值可写成
??
?
?
?
??
?
xbya
L
L
b
xx
xy
??
? (5-12)
概率与统计 咸宁职业技术学院
龚友运 等 主编
以下求例 1的线性回归方程,,由数据可得
7?n ?
?
?
7
1
681
i
ix 24?x ?
?
?
7
1
94.202
i
iy
99.28?y ?
?
?
7
1
2 4 1 4 4
i
ix
16.4 9 0 0
7
1
??
?i
ii yx 01.5 8 9 2
7
1
2 ??
?i
iy
112?xxL 07.9?yyL 84.29?xyL
51.22? ?a 27.0? ?b

y
x
的线性回归方程为,.27.051.22 xy ??xy对
概率与统计 咸宁职业技术学院
龚友运 等 主编
二,.非线性最小二乘拟合
在实际问题中,变量之间的关系常常不象
线性函数那样简单,未必呈线性趋势, 但是其
中有些作适当的变量代换,可使函数线性化,
从而转化为一元线性回归问题, 现将常见的可
线性化函数列于下表:
概率与统计 咸宁职业技术学院
龚友运 等 主编

号 函 数 线 性 化 方 法
线性化后所得的
线 性 函 数
1 ( c为常数且 c>0)
u=lny u=ax+lnc
( c为常数且 c<0) u=ln(-y) u=ax+ln(-c)
2 ( c>0) u=lny u=bv+lnc
3 y=bv+a
4 y=a+blnt x=lnt y=bx+a
5 y=a+bsint x=sint y= bx+a
axcey ?
axcey ?
ecy xb?,1
xv ?
xv
1?
x
bay ??
概率与统计 咸宁职业技术学院
龚友运 等 主编
6 =a+bx y= bx+a
7 (c>0) u=lny,v=lnx u=bv+lnc
8 u= v= u=
9 u=log y,v=logx u=bv+loga
10 y=a+blogx v=logx y= bv +a
11 log y=a+bx u=logy u= bx +a
)(t? )(ty ??
bcxy ?
xey ???
10
1
?? y
1
xe? v10 ?? ?
xbay lo glo glo g ??
有了这些常见的可线性化函数,利
用最小二乘法可建立经验公式,
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 2 假定对二变量 x和 y的联合观察得如下数据:
x 10 12 13 15 17 20 21 23 25 28
y 10.1 9.2 8 7.5 7.4 6.5 6.2 6.5 5.5 5.2
试求 y对 x的线性回归方程,
解 如散点图如右图
概率与统计 咸宁职业技术学院
龚友运 等 主编
随着 x的增加 y呈较快递降趋势, 会发现其
趋势象双曲函数,我们试用形如
y
xb?
baxy ?? 的函数来逼近,此函数可线性化
为,tu ?? ?? 其中 u=lny,
?
=lna,
?
?,b???
t=lnx,经计算得 ? 和
?
的最小二乘估计,
,7 0 7 2 6 3.3?ln? ?? a?,6 1 2 3.0?? ???? b?
从而,得,a
? 的估计值,
,7421.40? ?a,6123.0? ?b
于是,得回归方程,.7412.40? 6123.0
xy ??
概率与统计 咸宁职业技术学院
龚友运 等 主编
为说明回归效果,我们将回归值
与实际观测 (j=1,2,…,10)进行比较:
jy?
jy?
x 10 12 13 15 17 20 21 23 25 28
y 10.3 9.2 8.0 7.5 7.4 6.5 6.2 6.5 5.5 5.2
9.95 8.90 8.47 7.76 7.19 6.51 6.32 5.97 5.68 5.30y?
计算结果表明回归效果较好,
概率与统计 咸宁职业技术学院
龚友运 等 主编
*三、多元线性回归初步
有下列多元线性回归模型
),,0(~,2110 ??? Nxbxbby pp ????? ?
设有样本点
),2,1)(,,,( 21 nixxx ipii ?? ?

2
11
1
)]([
0 ippii
n
i
xbxbbyL ????? ?
?
?
概率与统计 咸宁职业技术学院
龚友运 等 主编
则有
?
?
?
?
?
?
?
?
?
?
?
???????
?
?
????????????????????
???????
?
?
???????
?
?
?
?
?
?
?
?
0)]([2
0)]([2
0)]([2
110
1
1110
11
110
10
ipippii
n
i
iippii
n
i
ippii
n
i
xxbxbby
bp
L
xxbxbby
b
L
xbxbby
b
L
?
?
?
整理后可得正规方程组
?
?
?
?
?
??
?
?
?
?
?????
??????????????????
?????
?????
????
????
???
????
????
???
n
i
iip
n
i
ip
n
i
iip
n
i
ip
n
i
ii
n
i
pipi
n
i
i
n
i
i
n
i
i
n
i
pip
n
i
i
yxxbxxbx
yxbxxbxbx
ybxbxbn
11
2
1
11
1
0
1
1
1
1
1
1
2
1
1
01
111
110
概率与统计 咸宁职业技术学院
龚友运 等 主编
若记
? ?? ? ????? ni ni titliltlitillt xxxxxxnxxs 1 1 ))((
? ?
? ?
?????
n
i
n
i
titliltlitillt xxxxxxnxxs
1 1
))(((l,t=1,2,…,p)
? ?
? ?
?????
n
i
n
i
itittiit yyxxyxnyxtys
1 1
))(((t=1,2,…,p)
??? ni itxnxt 11
?
?
?
n
i
itxnx t
1
1 (t =1,2,…,p)
?
?
?
n
i
ilxnx l
1
1 (l=1,2,…,p)
概率与统计 咸宁职业技术学院
龚友运 等 主编
则正规方程组可以写成形式
?
?
?
?
?
?
?
?
?
?????
?????????????
?????
?????
??????
sbsbsbs
sbsbsbs
sbsbsbs
xbxbxbyb
pyppnpp
ypn
ypn
pp
2211
22222121
11212111
22110
正规方程组若有唯一解,由最小二
pxxx,,,21 ?
的线性回归方程
为:
.???? 110 pp xbxbby ???? ?
乘法可得 y对
概率与统计 咸宁职业技术学院
龚友运 等 主编
例 3 某公司为推销商品,研究广告费用 x与获
得的纯利润 y之间的关系,以确定最佳的广告策
略,调查以往的情况,有如下数据,
x 1 1 2 2 2 3 3 4 4 4 5 5
y 14.80 15.90 20.20 20.00 18.55 22.20 20.90 21.00 18.30 20.70 16.10 14.75
画出数据散点图, 若选取模型 ????? 2210 xxy bbb
)(~ 2,0 ?? N 来拟合它,试求回归方程,
概率与统计 咸宁职业技术学院
龚友运 等 主编
解 散点图如图 5-8,
令,,221 xxxx ??
则模型可写成,
,22110 ????? xbxbby
,0 2)(, ?? N~
这是一个二元线性回
归模型,由式 (5-13)或
式 (5-14)可求得广告费用 x与获得的纯利润 y之间的
关系的回归方程是,,5 0 4.10 9 4.96 2 7.7? 2xxy ???