第一章 计量经济学的统计学
基础
——复习数理统计学
问题的提出
? 首先, 假定现在开始选学, 计量经济学, 课程的同学
们都已经学习过, 数理统计学, 了 。 即便通过了, 数
理统计, 的学分考试, 也意识到数理统计学在大学的
数学基础课教学中, 属于比较困难的一部分 。 况且,
同学们对, 数理统计, 的掌握可能不是很完备的 。
? 其次, 大多数人对数学公式, 数学符号的健忘, 也提
醒我们在进一步讨论计量经济学内容之前, 必须对数
理统计学的基本内容进行一些温习与回顾 。
解决问题的思路
? 1,恳请同学们将数理统计学的书籍拿出来进行复习 。
? 2,在老师讲授的内容的同时, 加强回顾, 多思考, 多
提问 。 一边听课一边在教科书上进行批注, 并把教科
书上的印刷错误 ( 忒多 ) 改正 。
? 3,恳请同学们到图书馆借阅计量经济学的参考书 。 计
量经济学的分类号是, F224‖,计量经济学理论基础 —
—统计学的分类号是, O212‖。
? 4,在大三下以前掌握 Windows 9x以及 Office97及其以
上的应用, 为毕业论文和大四谋业面试打下坚实的基
础 。
? 4,熟悉 Internet的使用 。, 逐步养成通过网络了解世界
与世界同步 。
主要内容
? 第一节 总体、样本和随机函数
? 第二节 对总体的描述 ——随机变量的数字特征
? 第三节 对样本的描述 ——样本分布的数字特征
? 第四节 随机变量的分布 ——总体和样本的连接点
? 第五节 通过样本,估计总体(一) ——估计量的特征
? 第六节 通过样本,估计总体(二) ——估计方法
? 第七节 通过样本,估计总体(三) ——假设检验
为什么要复习数理统计学
?假设同学们都已经学习过数理统计学。
?即便如此,数理统计学在大学数学教学
中,属于比较难的部分,而且是研修高
级课程必不可少的准备。
?而且许多同学或许对于大部分同学,他
们对于数学公式与数学符号的健忘,也
提醒我们有必要在展开计量经济学讨论
之前,对本课程中经常使用到的数理统
计学基本内容事先进行一些温习和回顾。
数理统计学在计量经济学中的
地位
?事实上不懂得数理统计学就不可能学习
和研究计量经济学。
?数理统计学是计量经济学的基础,它为
计量经济学提供了唯一而有效的方法。
?此外,从某种意义上来说,计量经济学
就是使数理统计学在建立经济模型中得
以应用的一门科学。
复习数理统计学必须注意
? 建议同学们将已经学过的, 西方经济学,,, 数理统
计学,,, 线性代数, 和, Windows 95,进行一次认
真地复习。
? 复习时,注重西方经济学的宏观部分,注重数理统计
学学科体系的逻辑结构分析、注重数理统计方法的阐
述、注重数理统计公式、定义和定理的内在涵义及其
相互关系,注重线性代数的求逆和相似形部分,注重
Windows 95的基本操作部分。
? 在今后的学习中,注意经济学基本理论及其应用,注
意数理统计学基础与计量经济学的联系与活用,注意
线性代数与统计量的计量与检验。
第一节 总体、样本和随机函数
? 四个基本定义与数理统计学的逻辑结构
? 一、随机变量的分布
? 二、二元随机变量
? 三、独立性
? 四、随机变量函数和分布
四个基本定义与数理统计学的逻辑结
构
?总体和个体
?样本和样本容量
?随机变量
?统计量
?数理统计学的逻辑结构
总体(集合)和个体(构成集
合的元素)
? 研究对象的全体称为总体或母体,组成总体的每个基
本单位称为个体。注意:
? ( 1)按组成总体个体的多寡分为:有限总体和无限总
体;
? ( 2)总体具有同质性:每个个体具有共同的观察特征,
而与其它总体相区别;
? ( 3)度量同一对象得到的数据也构成总体,数据之间
的差异是绝对的,因为存在不可消除的随机测量误差;
? ( 4)个体表现为某个数值是随机的,但是,它们取得
某个数值的机会是不同的,即它们按一定的规律取值,
即它们的取值与确定的概率相对应。
样本和样本容量
?总体中抽出若干个个体组成的集体称为
样本。样本中包含的个体的个数称为样
本的容量,又称为样本的大小。
?注意:抽样是按 随机原则 选取的,即总
体中每个个体有同样的机会被选入样本。
随机变量
? 根据概率不同而取不同数值的变量称为随机变量
( Random Variable)。
? 注意:
? ( 1)一个随机变量具有下列特性,RV可以取许多不
同的数值,取这些数值的概率为 p,p满足,0<=p<=1。
? ( 2)随机变量以一定的概率取到各种可能值,按其取
值情况随机变量可分为两类:离散型随机变量和连续
型随机变量。离散型随机变量的取值最多可列多个;
连续型随机变量的取值充满整个数轴或者某个区间。
? ( 3)本书中,随机变量用 x,y,?,?等符号表示
离散型随机变量与连续型随机
变量
10 20 30 40 50
1.0
概
率
概
率
x x
1.0
离散型随机变量 连续型随机变量
总体与随机变量的关系
? 表示总体状况的数量特征,在总体中是参差不齐的,
往往以一定的概率取不同的数值,显然对于这样的数
值我们采用一般的变量是无法加以描述的。但是。可
以采用一种特殊的变量来表示它们。这个特殊变量就
是随机变量。因为,根据随机变量的定义,随机变量
以一定的概率取许多不同的值,而且概率 p满足:
0<=p<=1。例如,一批灯泡的寿命可以取许多不同的数
值,每个灯泡的取值不一定完全相同,但它们是按一
定概率进行分布的,但它们却是以一定的概率取某个
寿命值。由此看来,随机变量并不是一个随便变的量。
? 由于我们主要研究总体的数量特征,可以直接用随机
变量来表示所研究的总体。
总体、随机变量、样本间的联系
?总体就是一个随机变量,所谓样本就是 n
个(样本容量 n)相互独立且与总体有相
同分布的随机变量 x1,……, xn。
?每一次具体抽样所得的数据,就是 n元随
机变量的一个观察值,记为( X1,……,
Xn)。
?通过总体的分布可以把总体和样本连接
起来。
从两个角度来描述总体(随机
变量)中个体的取值
?( 1)动态 ——概率 ——随机地选取一个个体
取某个具体数值的可能性;
?( 2)静态 ——分布 ——个体取某个数值,从
全局来看这个具体的数值(可能不只一个个体
取这同一个数值)出现的次数占全体个体个数
的比例,形象地说就是这个具体的数值在数轴
的这个位置上分布了多少。
?分布也好、概率也好它们在度量上是一致的。
?这只是就离散型随机变量的通俗示意。
总体分布是总体和样本的连接点
? 所谓分布,它是从全局而言的。通俗地说,分布就是
某个对象在什么地方,堆积了多少。
? 任何一个随机变量都有自己的分布,这个什么地方就
是在数轴上取什么值,堆积多少就是在那里占有的比
例是多少或者概率有多大。
? 总体可以表示为随机变量,并具有自身的分布。
? 样本则是相互独立与总体具有相同分布的 n元随机变量。
因此,总体分布是总体和样本的连接点。从而,可以
通过对样本特征的研究达到对总体进行研究的目的。
因为它们具有相同的分布。
? 须知,如果对于一个随机变量完全掌握了它的分布规
律,就完全明白无误了。
为什么样本是与所来自的总体
具有相同的分布的随机变量
? 因为样本具有二重性:
? 一是指某一次具体的抽样的具体的数值( X1,……,
Xn);
? 二是指一次抽样的可能结果,它的每一次观察都是随
机地从总体中(每一个个体有同样的机会被选入)抽
取一个,所以它是一组随机变量( x1,x2,……, xn)
? 而且,每一次抽样都来自同一总体(分布),也就是
每一次抽样都带来了与总体一样的分布信息。所以,
样本与所来自的总体分布相同。
? 由于总体分布完整的描述了总体的信息,有时我们也
直呼总体为分布,不加区别地使用总体或分布。
统计量
? 设( x1,x2,……, xn)为一组样本观察值,函数 f
( x1,x2,……, xn )若不含有未知参数,则称为统
计量。
? 统计量一般是连续函数。由于样本是随机变量,因而
它的函数也是随机变量,所以,统计量也是随机变量。
? 统计量一般用它来提取或压榨由样本带来的总体信息。
? ?
就是统计量。样本方差
1
1
2
2
?
?
? ?
?
n
i
n
i
xx
s
样本与总体之间的关系
?样本是总体的一部分,是对
?总体随机抽样后得到的集合。
?对观察者而言,总体是不
?了解的,了解的只是样本
?的具体情况。我们所要做
?的就是通过对这些具体样
?本的情况的研究,来推知整
?个总体的情况。
……
Xn+1
Xn
…
X1 样本
总体
数理统计学的逻辑结构
? ( 1)总体和样本
? 引入一个随机变量来描述总体
? ( 2)对总体的描述:随机变量的数字特征
? ( 3)对样本的描述:样本分布的数字特征
? ( 4)总体与样本的连接点:随机变量的分布
? ( 5)如何用样本的数字特征估计总体的数字特征及数
据生成过程中的各种参数
– a 估计量的优良性
– b 估计方法
– c 对估计量的检验 ——假设检验
? ? ? ?xV arxE xx ?? ?? 2方差数学期望
,描述样本的离散程度样本方差,描述样本的一般水平样本平均数 sX 2
a 估计量的优良性
?1、无偏性
?2、有效性
?3、均方误最小
?4、一致性
b 估计方法
?
?
?
?
?
?
?
矩法
最大似然法
最小二乘法
最小卡平方法 总体分布未知
正态总体
一般总体(大样)已知方差
方差未知 一般总体(大样)
正态总体
估计期
望
单个总体
两个总体 估计方差(常用小样本下,正态总体估计
其它参数)
点估计
区间估计
c 对估计量的检验 ——假设检验
? 1.对总体分布特征的假设检验
? ( 1)一个正态总体的假设检验
– a 检验均值:已知方差和未知方差
– b 检验方差:未知均值(双尾和单尾)
? ( 2)两个正态总体的假设检验
– a 检验均值:未知方差但可假设其相等
– b 检验方差:未知均值 (双尾和单尾)
? ( 3)总体分布的假设检验
– a 总体为离散型分布
– b 总体为连续型分布
? 2.对各种系数、参数估计值的假设检验
一、随机变量的分布
(一)离散型随机变量的分布
? 定义:如果随机变量 ?只取有限个或可列多个可能值,
而且 ?以确定的概率取这些值,则称 ?为离散型随机变
量。
? 通常用分布列表示离散型随机变量:
? ?的概率分布也可用一系列等式表示:
? P( ? =xi) =pi ( i=1,2,…… )称为 ?的概率函数。
注意这里 xi只出现一次。
? 显然满足概率的定义:
? 离散型随机变量的分布就是指它的分布列或概率函数。
??
??
?
?
??
?
?
?1
1
10
i i
i
p
p
X x1 x2 … …,, xi … …,,
p p1 p2 … …,, pi … …,,
离散型随机变量举例 1
?例 1 一批产品的废品率为 5%,从中任取一个进
行检验,以随机变量来描述这一试验并写出的
分布。
?以 X=0表示“产品为合格产品”,X=1表示
“产品为废品”,那么分布列如下:
?其概率函数 p( X=0) =0.95,p( X=1) =0.05,
或
? p( X=i) =( 0.05) i( 0.95) 1-i ( i = 0,1)
X 0 £¨1? ·? ??£? 1 £¨?? ??£?
P 0.95 0.05
离散型随机变量举例 2
?用随机变量 X描述掷一颗骰子的试验。
?分布的概率函数为:
?P( X=i) = 1/6( i=1,2,3,4,5,6)
X 1 2 3 4 5 6
P 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6
(二)随机变量的分布函数
? 定义:若 X是一个随机变量(可以是离散的,也可以是
非离散的),对任何实数 x,令 F( x) =P( X<=x),
称 F( x)为随机变量 X的 分布函数 。
? F( x),即事件,X<=x‖的概率,是一个实函数。
? 对任意实数 x1<x2,有
? P( x1<X<x2) =P( X<=x2) - P( X<=x1) =F( x2) - F( x1)
? 由此可知,若已知 X的分布函数,就知道 X在任何区间
上取值的概率。所以,分布函数完整的描述了随机变
量的变化情况。
x2x2
f(x)F(x)
X
x1x1
分布函数 F( x) 的性质
? ? ? ?
? ?
? ? ? ?
? ? ? ?
? ?
? ? ?
?
???
???
?
????
????
???????
x
i
x
x
x
xF
xF
xFF
xFF
xF
xFx
i
p足关系:分布函数与概率函数满
。。且在间断点上右连续至多有可列多个间断点)(
)(
为不减函数)(
,)对一切(
4
1
03
2
10,1
l i m
l i m
分布函数举例
?例 3 求例 1中的分布函数
?例 4 求例 2中的分布函数
? ? ? ?
??
?
?
?
?
??
?
??
11
1095.0
00
x
x
x
xXPxF
? ? ? ?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
??
??
?
???
61
656/5
546/4
436/3
326/2
216/1
10
x
x
x
x
x
x
x
xXPxF
0 1
F(x)
x
? ? ?
?
?
xx i ip
xF
(三)连续型随机变量的分布
? 定义:对于任何实数 x,如果随机变量 X的分布函数
? F( x)可以写成
? 概率分布密度函数的性质:
? ? ? ?
? ? ? ?
? ?。常写成概率分布密度函数,也
的为为连续型随机变量,称,则称其中
xX
XxXx
dttxF
x
?
??
?
~
0?
? ?
??
? ?
? ?
? ? ? ? ? ?
? ? ? ?。有
的连续点上,,并且在显然
)(
)(
xxF
xdxxbXaP
dxx
x
b
a
?
??
?
?
??
???
?
?
?
?
??
??
12
01
为什么 ?(x)称为概率分布密度函数
? ? ? ?
? ?
? ? ? ?
? ?
? ?
? ?
的概率大小。
附近取值在能够反映分布的密集程度。但是
点概率在值的概率,而是取不是表明
xXx
xXxXx
x
xxXxP
x
xFxxF
x
xxF
x
x
?
?
?
?
?
????
?
?
???
??
??
??
??
lim
lim
0
0
?
连续型随机变量分布函数举例
? ?
? ? ? ?
? ? ? ?
? ? ? ?
? ?
?
?
?
?
?
?
??
?
?
?
??
?
?
??
????
?
?
? ??
?
?
??
??
??
??
??
??
bx
bxa
ab
ax
ax
xF
dttxF
ab
abdxdxx
xFbaX
bxa
x
X
x
1
0
1
1
,
0
5
??
???
?
?
又因为
解
。上的均匀分布。试求服从区间则称
其它
有密度函数若例
?
a x b
a x b
?
F(x)
?(x)
(四)分布函数、概率函数、
密度函数三者的关系
?分布函数既适用于离散型也适用于连续型,是
描述各种类型随机变量最一般的共同形式。但
是,它不够直观。
?概率函数对于离散型的描述很直观。
?概率密度函数的大小能够反映 X在 x附近取值的
概率的大小,从而比分布函数更直观。
?所以,在实际应用中我们分别用概率函数和密
度函数对离散型和连续型随机变量进行描述。
二、二元随机变量
? n元随机变量的定义:每次试验同时处理 n个随机变量
( X1,X2,……, Xn),它们的取值随试验的进行而
变化。如果对任何一组实数( x1,x2,……, xn),事
件,X1?x1,X2?x2,……, Xn?xn‖有着确定的概率,
则称 n个随机变量( X1,X2,……, Xn)总体为一个 n
元随机变量。
? n元随机变量分布函数的定义,n元函数
? F( x1,x2,……, xn ) = P(X1?x1,X2?x2,……, Xn?xn)
? ( x1,x2,……, xn) 属 Rn,为 n元随机变量分布函数。
? 离散二元随机变量的定义:如果二元随机变量( X,Y)
所有可能取值为有限或可列多个,并且以确定的概率
取各个不同数值,则称 ( X,Y)为二元随机变量。
(X,Y)的 联合分布表和联合分布函数
? (X,Y)为离散型的二元随机变量,通常用联合分布函
数与联合分布表表示。
( X,Y ) μ? ·? áé ?? 2? aí
X Y y1 y2 …… yj …… X μ? a? ?é ?? 2?
x1 p11 p12 …… p1j …… p1.
x2 p21 p22 …… p2j …… p2.
…… …… …… …… …… …… ……
xi pi 1 pi 2 pi j pi,
…… …… …… …… …… …… ……
Y μ? a? ?é ?? 2? p.1 p.2 …… p.j …… 1
3? p( X =x i,Y =y j ) =pi j ( i,j =1,2,…,.) ía ( X,Y ) μ? ·? áé ?? 2?
è? é? ?2 3? ía ( X,Y ) μ? àa 1? ?? 2? ?£
离散二元分布函数的示例
? 例 6 同一品种的 5个产品中,有 2个正品,3个次品,每
次从中抽取一个进行质量检查,不放回的抽取,连续
两次。令,Xi=0‖表示第 i次抽取到正品,而,Xi=1‖表
示 第 i次抽取到次品,写出 (X1,X2)的分布。
? 解 p(X1=0,X2=0)= p(X1=0)P(X2=0)=(2/5)(1/4)=1/10
? p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10
? p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10
? p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10
( X 1,X 2) μ? ·? áé ?? 2? aí
X 1 X 2 0 1 X1 a? ?é ?? 2?
0 1/ 10 3/ 10 2/ 5
1 3/ 10 3/ 10 3/ 5
X2 a? ?é ?? 2? 2/ 5 3/ 5 1
连续二元随机变量的定义
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
?????
??
?
?
?
??
??
??
??
?? ??
b
a
d
c
x y
d xd yyxdYcbXap
dcba
d s d tts
yxyx
yx
YX
yxYX
d s d ttsyxF
yxyxFYX
yx
,,
,,
1,2
0,,1
,
,),(
,,
,),(,
,
?
?
?
?
?
?
?
有显然,对于任意实数
)(
,)对于一切实数(
的性质:
的联合密度函数。与为
称。是二元连续型随机变量则称
都有:,对于任意实数的分布函数
,使得二元变量如果存在一个非负函数
三、独立性
?(一)事件的独立性
?(二)随机变量的独立性
(一)事件的独立性
?定义 1.12事件的独立性的定义
?如果事件 A发生的可能性不受事件 B发生与否
的的影响,即 P(A/B)=P(A),则称事件 A对于事
件 B独立。
?显然,若事件 A对于事件 B独立,事件 B对于事
件 A也一定独立,我们称事件 A与事件 B相互独
立。
? A与 B独立的充分必要条件是:
? P( AB) =P( A) P( B)
(二)随机变量的独立性
?定义 1.13随机变量相互独立的定义
? 对于任何实数 x,y,如果二元随机变量 (X,Y)
的联合分布函数 F(x,y)等于 X和 Y的边际分布的
乘积,即
? F(x,y) = FX(x), FY(y)
?则称 X与 Y相互独立。
?定义 1.14边际分布的定义
?离散型二元随机变量 (X,Y)中,分量 X( 或 Y)
的概率分布称为 (X,Y)的关于 X(或 Y)的边际
分布,边际分布又称边缘分布。
四、随机变量函数的概念和分布
? 定义 1.15 随机变量函数的定义
? 设 f(x)是定义在随机变量 X的一切可能取值集合上
的函数。如果对于 X的每一个可能值 x,都有另一个随
机变量 Y的取值 y=f(x)与之相对应,则称 Y为 X的函数,
记作 Y=f(X)。
? 我们常常遇到一些随机变量,它们的分布往往难
于直接得到(例如滚珠体积的测量值等),但与它们
有关系的另一个随机变量的分布却是容易知道的(如
滚珠直径的测量值)。因此,就要研究两个随机变量
之间的关系,然后通过它们之间的关系,由已知随机
变量的分布求出与之有关的其它随机变量的分布。其
间的关系通常用函数关系表示。
第二节 对总体的描述 ——随机变量的
数字特征
?一、数学期望
?二、方差
?三、数学期望与方差的图示
一、数学期望
?研究数字特征的必要性
?两个最重要的数字特征
?( 1)数学期望
?( 2)方差
研究数字特征的必要性
? 总体就是一个随机变量。对总体的描述就是对随机变
量的描述。随机变量的分布就是对随机变量最完整的
描述。但是,
? ( 1)求出总体的分布往往不是一件容易的事情;
? ( 2)而且,在很多情况下,我们并不需要全面考察随机变量的变
化情况,只需要了解总体的一些综合指标。一般说来,常常需要
了解总体的一般水平和它的离散程度;
? ( 3)如果了解总体的一般水平和离散程度,就已经对总体有了粗
略的了解了;
? ( 4)在很多情况下,了解这两个数字特征还是深入求出总体分布
的基础和关键。
? 由此看来,研究随机变量的数字特征是十分必要的。
数学期望的定义
? 定义 2.1离散型随机变量数学期望的定义
? 假定有一个离散型随机变量 X有 n个不同的可能取值
x1,x2,……,x n,而 p1,p2,……,p n是 X取这些值相应的概率,
则这个随机变量 X的数学期望定义如下:
? 数学期望描述的是随机变量(总体)的一般水平。
? 定义 2.2连续型随机变量数学期望的定义
? ?
? ? ? ? ? ? 的数学期望。称为绝对收敛,则
,若积分有分布密度函数若连续型随机变量
XdxxxxEdxxx
xX
?? ???????? ? ??
?
? ?
? ? 平均数。的所有可能取值的加权是随机变量实际上,XXE
xE
n
i
iinn xpxpxpxp ?
?
?????
1
2211 ?
女儿期待父亲钓多少鱼回家?
?数学期望是最容易发生的,因而是可以
期待的。它反映数据集中的趋势。
éy à? ·? áé
1 0.1 0.1
2 0.1 0.2
3 0.4 1.2
4 0.2 0.8
5 0.2 1
3.3
· ??μ? ò? μ? éó Dé
éy D§?ú ì?
数学期望的性质
?( 1)如果 a,b为常数,则
? E(aX+b)=aE(X)+b
?( 2)如果 X,Y为两个随机变量,则
? E(X+Y)=E(X)+E(Y)
?( 3)如果 g(x)和 f(x)分别为 X的两个函数,则
? E[g(X)+f(X)]=E[g(X)]+E[f(X)]
?( 4)如果 X,Y是两个独立的随机变量,则
? E(X.Y)=E(X).E(Y)
求离散型随机变量数学期望举例
? 例 1 甲、乙两射手在一次射击中的得分(分别用 X,Y表示)的分
布率如下:
? 试比较两射手的射击技术水平,并计算如果二人各发一弹,他们
得分和的估计值。
? 解 EX=1?0.4+2 ? 0.1+3 ? 0.5=2.1
? EY=1 ? 0.1+2 ? 0.6+3 ? 0.3=2.2
? E(X+Y)=2.1+2.2=4.3
? EX<EY 乙射手射击水平比较高
? 二人各发一弹,得分总和最可能在 4.3分左右(即 4分或 5分)
X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3
二、方差
? 定义 2.4 离均差的定义
? 如果随机变量 X的数学期望 E(X)存在,称
? [X-E(X) ]为随机变量 X的离均差。显然,随机变量离均
差的数学期望是 0,即
? E [ X-E(X) ] = 0
? 定义 2.3 连续型随机变量的方差
? 定义 2.5 随机变量离均差平方的数学期望,叫随机变量
的方差,记作 Var(x),或 D(x)。方差的算术平方根叫标
准差。
? ? ? ?? ? ? ? dxxXV
XX
xEx ?? ?????? 2
的方差以下式给出:为连续型随机变量,则若
? ? ? ? ? ?? ? ? ??? xEExV a rxV xxExx ?? ???? 222
方差的意义
?( 1)离均差和方差都是用来描述离散程度的,
即描述 X对于它的期望的偏离程度,这种偏差
越大,表明变量的取值越分散。
?( 2)一般情况下,我们采用方差来描述离散
程度。因为离均差的和为 0,无法体现随机变
量的总离散程度。事实上正偏差大亦或负偏差
大,同样是离散程度大。方差中由于有平方,
从而消除了正负号的影响,并易于加总,也易
于强调大的偏离程度的突出作用。
方差的性质
?( 1) Var(c )=0
?( 2) Var(c+x)=Var(x )
?( 3) Var(cx)=c2Var(x)
?( 4) x,y为相互独立的随机变量,则
? Var(x+y)=Var(x )+Var(y )=Var(x-y)
?( 5) Var(a+bx)=b2Var(x)
?( 6) a,b为常数,x,y为两个相互独立的随机变
量,则 (ax+by)=a2Var(x)+b2Var(y)
?( 7) Var(x)=E(x2)-(E(x))2
例 2 计算本节例 1中甲射手的方差
?例 1 甲、乙两射手在一次射击中的得分
(分别用 X,Y表示)的分布率如下:
?E(X)=2.1
?Var(X)=( - 1.1) 2 ? 0.4+( -0.1) 2?
0.1+0.92? 0.5
? = 0.89
X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3
三、数学期望与方差的图示
? 数学期望描述随机变量的集中程度,方差描述随机变
量的分散程度。
? 1方差同、期望变大 2期望同、方差变小
5
10
5
5
第三节 对样本的描述 ——样本分布的
数字特征
? 一、样本分布函数
? 二、样本平均数
? 三、样本方差
一、样本分布函数
? ?
? ?
? ?
数。,称它们为样本分布函本容量
的个数除以样个观察值中不超过等于样本的这里
,令排列为
按大小的一组观察值,把它们为总体设
n
xnx
x
x
n
k
x
n
x
x
F
x
xx
xx
x
F
xxx
xxx
n
n
kk
n
n
n
?
?
?
?
?
?
?
?
?
?
?
?
??
??
?
?
???
?
*
*
1
*
*
2
*
1
*
1
**
2
*
1
21
1
1
0
ξ,,,
?
?
?
样本分布函数举例
ê? oò ?? 2ì ?ü ?? X 1 0 ·? éy ?Y ?? ?á ???? ? ?? X*
X 3.2 2.5 -4 2.5 0 2 3.2 2.5 4 2
X* -4 0 2 2 2.5 2.5 2.5 3.2 3.2 4
?? D? a? ?? 2? 1ˉ éy ?£
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
??
??
???
??
?
41
42.310/9
2.3310/8
35.210/7
5.2210/4
2010/2
0410/1
40
10
x
x
x
x
x
x
x
x
xF
二、样本平均数
?总体的数字特征 ——是一个固定不变的数,称
为参数;样本的数字特征 ——是随抽样而变化
的数,是一个随机变量,称为统计量。
?定义 3.1样本平均数的定义
?样本平均数用来描述样本的平均水平(一般
Common)水平。
? ?
为样本平均数。
,称对于样本
?
?
?
n
i
i
n
x
xxx
n
x
1
21
1
,,?
三、样本方差和标准差
?定义 3.2 样本方差和标准差的定义
? ?
? ?
? ?
? ?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?? ?
? ?
? ?
?
??
?
?
xxs
xxxx
xx
xxs
xxx
n
n
n
i
i
n
s
i
n
n
i
i
n
i
i
n
i
n
i
n
i
n
2
1
22
2
1
2
1
2
1
2
1
2
2
21
1
1
1
1
1
1
,,
?
?
。来描述样本离散程度的样本方差和标准差是用
差。分别为样本方差和标准以及
,称对于样本
第四节 随机变量的分布 ——总体和样
本的连接点
?一、几种重要的分布
?二、各种分布之间的联系
?三、分布是总体和样本之间的连接点
?学习的重点应放在确定 X服从什么分布,和各
种分布的联系上。
一、几种重要的分布
? 如果一个随机变量的分布已经确定,那么这个随机变
量的一切性质对于我们便都是已知的。因为随机变量
的分布是对随机变量最完整的描述。
? 例如 X是广西十万大山中树木的高度,它的分布函数
为 F(x)=P(X<=x)。此时,你对任意给定的高度 x,都确
知不超过这个高度的树木在整个十万大山中所占的比
例,你还会说整个十万大山树木高度的情况不清楚吗?
? 再如,已知 X服从数学期望和方差已知的正态分布,那
么你便了解这个 X自身的一切性质。可以通过查正态分
布表确定研究中所需的一切数据。
? 分布的数学形式和图形属“技术问题”,精力应集中
于 X究竟属于何种分布上。
1.?分布
? ( 1) ?分布的定义
? ( 2)定理 4.1 ?分布的数学期望和方差
? ? ? ?
? ?
? ?
? ?
? ? ? ? 。这个积分收敛,且有当
。这里,分布,记作服从则称
具有密度函数如果连续型随机变量
1,0
00
0,0,0
0
1
λ1
???
??
??
?
?
?
?
?
?
???
?
?
?
?
??
??
?
??
??
dxxrr
dxr
r
x
rx
r
x
ex
ex
xr
xr
r
?
??
?
?
?
?
???? 2
rV arrE ??
2,指数分布
? ( 1)指数分布的定义
? ( 2)定理 4.2 指数分布的数学期望和方差
? ?
??
?
?
?
?
?
?
??
?
00
0
11.4
λ x
x
x
x
r
e??
:指数分布的密度函数为
分布称为指数分布,此时的中如果在定义
???? 2
11 ?? V arE
3,? 2 分布
? ( 1)定义 4.3 ? 2 分布的定义
? ( 2)定理 4.3?分布的和仍然服从 ?分布
? ?
? ?
? ?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
???
??
00
0
2
1
2
1
,
2
2
1
2
2
22
2
x
x
n
x
n
nn
n
r
ex
xn
?
?
?
?? 。密度函数为分布,记作的
个自由度分布称为具有的为正整数
? ? ? ?
? ? 分布。的,服从参数为则它们的和
,,相互独立,且若
??????
??
rrxxx
rxxx
nn
iin ni
??
??
121
1
λ
,2,1λ~,,
定理 4.3推论,? 2 分布的和仍然服从 ? 2 分布
? 若 X1,X2,……,X n相互独立,且 Xi服从
具有 ni( i=1,2,……, n) 个自由度的 ?2
分布,则它们的和 X1+X2+……+X n 服从
具有 ?ni 个自由度的 ? 2 分布。
4,正态分布
? 定义 4.4正态分布的定义
? 定理 4.4 正态分布的数学期望和方差
? 定义 4.5 标准正态分布
? ?
? ?
? ?
? ?。服从正态分布,简记为则称
为常数,、
的概率密度为若连续型随机变量
???
?
?
??
?
?
2
2
,μ~
0σμσ
2
1
2
2
N
x
x e ?
?
?
?
???? 2,?? V a rE 方差,正态分布的数学期望
? ?
? ? e
x
x
N
2
2
2
2
1
1,0~
10
?
?
??
?
?
?
? ?
。密度函数为记作
正态分布,的正态分布,称为标准,当
正态分布的标准化
?定理 4.5 正态分布标准化
? ?
? ?
布,即将其标准化。
为标准正态分任何一个正态分布,化根据以上定理,可以将
。
,那么且如果
1,0~
,,~
2
N
N
?
?
??
??? ?
?
?
5,t分布
?定义 4.6 t分布的定义
? ?
? ?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
2
1
2
2
2
1
)(
2
1
x
n
n
n
n
x
nttn
x
?
?
?
??
。分布,记作个自由度的服从具有给出,则称
由下式的分布密度函数若连续型随机变量
6,F分布
?定义 4.7 F分布的定义
? ?
? ?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
00
0
2
1
nn
2
1
n
22
2
,
ξ
ξ
n
n
1
n
n
nn
nn
nn
n
2
1
2
2
21
21
21
21
21
1
1
x
x
n
x
FF
xx
n
?
。分布,简记为的
,第二自由度为服从第一自由度为出,则称
给的分布密度函数由下式若连续型随机变量
? 2 分布的图象
N=7
N=11
概
率
x
N为自由度
t分布和正态分布
概率密度
x
标准正态分布
t-分布
0
F分布的图象
x
概率密度
二、各种分布之间的联系
? 1,一般正态分布与标准正态分布的关系
? 定理 4.6 如果 X~N( ?,?2),则( X- ?) / ?~N( 0,1)
? 2,标准正态分布与 X2分布之间的关系
? 定理 4.7 如果 X~N( 0,1),则 X2~ X2 ( 1),即服从
具有 1个自由度的分布。
? 3,标准正态分布与 t分布之间的关系
? 其密度函数见定义 4.6。
? ? ? ?
? ?。分布,即个自由度的服从具有则
,,相互独立,且和设两个随机变量定理
ntTtn
n
T
nN
~
/
~1,0~8.4
2
?
?
???? ?
?
二、各种分布之间的联系
? 4,标准正态分布(分布)与 F分布之间的关系
? 5.关于正态分布的和
? ?
? ? ? ? ? ?
。定义
分布,其密度函数见的第二自由度为第一自由度为
表示。其中则有
,相互独立,且和设两个随机变量定理
7.4
,
,,~,~
~9.4
21
2121/
/
2
2
2
1
2
121
22
11
F
FF
n
n
F
nn
nnnnn
n
?
?
??
????
?
? ?
? ?
? ? 。布,且
,也服从正态分不全为则它们的线性函数
,服从正态分布相互独立,设定理
??
??
??
?
2
1
2
1
1
2
1
0
,,,10.4
i
n
i
i
n
i
ii
i
n
i
ii
iiin
aa
axa
xxx
V a rE
N
??
?
??
?
??
?
?
二、各种分布之间的联系
? 6.关于 X2分布(参阅定理 4.3推论)
? ?
? ? ? ? ? ?。相互独立,且
与它们的离均差平方和则它们的平均数
正态分布,相互独立,都服从标准设定理
。,记作个自由度的服从具有则
正态分布,相互独立,都服从标准设定理
1~
1
,12.4
,11.4
2
1
2
1
2
1
1
22
1
22
1
?
?
?
? ?? ?
?
?
??
?
?
n
ii
n
x
nn
n
i
n
i
n
i
i
n
n
i
i
n
xxxx
x
xx
x
xx
?
???
?
?
怎样记忆上述 7个定理
? ?
? ? ? ? 相互独立。且与定理
定理
定理
定理
定理
定理
),(,定理
),样本的自由度为(注意总体的自由度为
期望和方差)的线性组合,注意数学(这里是
二自由度)(注意第一自由度和第
的自由度)还要除以自由度,也是(注意
Xn
NX
F
t
X
NX
Y
XNY
XX
X
X
X
X
X
nn
X
tX
1~12.4
~11.4
~10.4
~9.4
~8.4
~7.4
10~,~6.4
22
1
2
2
2
2
2
2
2
2
2
??
?
?
?
?
?
?
?
???
? ?
?
?
?
?
?
?
?
?
?
?
三、分布是总体和样本之间的连接点
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ? ? ? ? ?11
1
,,,
1~
1
,,,14.4
1,0~
/
,~
,,,13.4
222
2
1
2
1
2
1
2
1
2
2
2
1
1
2
2
1
2
2
2
1
2
2
1
/
??????
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
? ?
?
?
?
?
? ?
? ?
?
?
?
?
? ?
?
?
? ?
?
?
?
?
? ?
? ?
? ?
? ?
?
???
?
?
nn
i
ii
i
N
i
x
n
i
N
N
n
x
n
Nx
N
n
xx
xxxx
xx
xx
xx
xx
xx
xx
n
i
n
i
n
i
n
i
n
n
i
n
i
n
n
???
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
,且相互独立取自正态总体证明
相互独立。与
的样本,则有:是取自正态总体设定理;
的样本,则有:是取自正态总体设定理
??
?
?
三、分布是总体和样本之间的连接点
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ?1~
/
/
/1
1
2
/1/
1~
1/
8.4
1~
1
14.4
10~
/
5.4
1~
/
,,,15.4
1
1
2
1
2
2
2
1
1
2
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
? ?
nt
ns
x
ns
x
s
n
x
n
i
xx
i
n
x
xx
i
n
x
T
nt
n
T
n
i
N
n
x
nt
ns
x
Tsx
N
n
n
n
i
n
n
i
xx
xx
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
而
根据定理
根据定理
,证明根据定理
。标准差,则分别是样本的平均数和、
的样本,是取自正态总体设定理 ?
三、分布是总体和样本之间的连接点
? 这是两个相互独立总体的样本平均数差数与总体数学
期望差数之间的联系的定理。
? ? ? ?
? ?
? ? ? ?
? ?
平均数和方差。分别为两个样本各自的、、、其中
的样本,则和的正态总体
立分别是来自两个相互独和设定理
ss
nn
nnnn
snsn
yyxx
yx
t
yx
T
NN
n
n
2
2
2
1
21
2121
2
22
2
11
21
2
2
2
1
1
1
2~
11
2
11
,,
,,,,16.4
??
??
??
???
???
?
??
????
??
三、分布是总体和样本之间的连接点
? 相互独立两个总体样本方差与总体方差间联系的定理。 ? ? ? ?
? ?
方差。分别为两个样本各自的、其中
的样本,则和的正态总体
立分别是来自两个相互独和设定理
ss
nn
s
s
yyxx
FF
NN
nn
2
2
2
1
212
2
2
2
2
1
2
1
2
22
2
11
11
1,1~
/
/
,,
,,,,17.4
???
?
?
????
??
相互独立两个总体样本方差与总体方
差间联系的定理的证明
? ? ? ?
? ? ? ?
? ?
? ?
? ?
? ? ? ?
? ? ? ?
? ?1,1~
/
/
/
/
1//
1//
1,1~
1/
1/
9.4
1~/
1~/14.4
16.4
212
2
2
2
2
1
2
1
2
2
2
2
2
1
2
1
2
2
2
1
2
1
2
1
1
2
21
2
2
1
2
2
2
2
2
1
2
2
1
2
2
1
1
2
1
2
1
1
1
????
?
?
?
??
?
?
??
??
???
? ?
? ?
? ?
? ?
?
?
?
?
nn
s
s
s
s
nyy
nxx
nn
n
n
nyy
nxx
F
n
i
n
i
F
FF
n
i
n
i
i
i
i
i
?
?
?
?
?
?
?
?
???
???
而
根据定理
根据定理
证明定理
总体与样本间的联系在于具有相同的
分布
? 总体就是一个随机变量,所谓样本就是 n个相互独立的
与总体具有相同分布的随机变量 x1,……,x n,即 n元随机
变量。以上的定理就是将总体与样本间的这种联系具
体化,从而为达到通过样本的特征估计和代替总体的
特征铺平道路。
? 例如,已知一个研究对象 ?的数量特征服从 N(?,?2),那
么依据定理 4.6,首先将其标准化,然后查标准正态分
布表,就可以获得所需的信息。如果,对研究对象了
解的信息并不完备,只知其属于正态分布均值为 ?,
但未知方差,则可利用定理 4.15通过 s2代替 ?2,用 t分
布来估计未知总体的数字特征。在区间估计和假设检
验中将会广泛地利用这些定理,通过样本估计总体和
检验对总体的假设。
第五节 通过样本,估计总体(一) —
—估计量的特征
?对总体的数量特征可以提出若干估计量。所谓
估计量的特性指的是衡量一个统计量用以估计
总体参数的好坏标准。我们构造一个统计量时,
它们就应当具有这些优良性,否则就不采用他
来估计总体参数。估计量的优良性可从四个方
面进行衡量:
?一、无偏性
?二、有效性
?三、均方误最小性
?四、一致性
一、无偏性
?无偏性的直观意义:
?根据样本推得的估计值和真值可能不同,然而
如果有一系列抽样依据同一估计方法就可以得
到一系列估计值,很自然会要求这些估计的期
望值与未知参数的真值相等。这就是无偏性的
概念,无偏性的直观意义是:样本估计量的数
值在真值周围摆动,即无系统误差。
定义 5.1 无偏性的定义
。的有偏估计,其偏差为,我们称如果
具有无偏性。亦称
的无偏估计,为参数成立,我们称如果定义
θ-θ?B i asθθ?θθ?
θ?
θθ?θθ?1.5
EE
E
??
?
的概率θ?的概率θ?
?的真值 ?的真值
有偏 无偏
的概率??
的真值θ
的概率??
的真值θ
有偏估计 无偏估计
例 1 ? ? ??? 222 ??? sEnxV a rxE
? ? ? ?
? ? ? ? ? ? ? ?? ?
? ? ? ?? ? ? ?
? ? ? ? ? ?
? ? ? ? ?
?
???
???
??
??
?
?
??
??
??
?????
2
2
2
2
1
2
1
222
1 1 1
22
1
2
1
2
2
2
2
2
1
2
1
11
222
1
11
1
11
1
2
1
1
2
1
1
1
1
1
1
111
111
,,,
??
?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??????
?
?
?
?
?
?
??????
?
?
?
?
?
?
????
?? ?
? ???
? ? ? ??
? ???? ?
??
??
?
?
? ? ?
??
??
??
nn
n
n
n
E
n
n
i
E
n
nn
i
E
n
x
i
E
n
i
n
E
i
n
EE
n
nV a r
n
VxV a r
n
n
E
nn
ExE
ExEVE
xx
xxx
xxx
xxxxs
n
x
n
x
xx
sxx
n
i
n
i
n
i
n
i
n
i
i
n
i
n
i
n
i
i
n
i
i
n
i
i
n
i
i
n
证明
,试证),中取一样本从总体
(
?
两个相互独立样本的合并均值与合并方差
分别是总体均值和方差的无偏估计
? 如果从总体中抽取两个相互独立的样本,一个的容量
n1,另一个容量为 n2,可以证明合并均值与合并方差是
总体均值与方差的无偏估计。
? ?
? ? ? ?
? ? ? ?2,1
1
1
2
11
1
1
2
21
21
2
22
2
11
2
2211
21
?
?
??
??
???
?
?
?
?
? ?
?
?
?
i
n
iij
n
x
i
i
j
i
i
i
j
ij
i xx
n
s
n
x
x
nn
snsn
s
xnxn
nn
其中
合并样本方差
合并样本均值
无偏性是估计量最重要的优良性,且
参数的无偏估计量不只一个
? 无偏性是对估计量最重要的要求之一,它只能保证估计量的期望
等于真值。而且,对于总体某个待定参数,其无偏估计量不只一
个。
? 例如,可以验证
? 都是总体数学期望的无偏估计量。
? 必须指出根据计算总体方差的公式计算的样本方差不是总体方差
的无偏估计量 。
? ?
? ?
?
?
???
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
????
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
??
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
in
i
i
n
i
ii
n
i
i
a
a
a
xa
a
xa
a
a
xax
E
ExE
x
n
x
1
1
1
1
1
1
1
1
11
0和
二、有效性
?总体某个参数 ?的无偏估计量往往不只一
个,而且无偏性仅仅表明 ?^的所有可能
的取值按概率平均等于 ?,它的可能取值
可能大部分与 ?相差很大。为保证 ?^的取
值能集中于 ?附近,必须要求 ?^的方差越
小越好。所以,提出有效性标准。
有效性的定义
具有有效性。的有效估计量,亦称
称为的方差达到最小,则的一切无偏估计量中,如果在
有效的估计量。是比的方差,则称的方差小于,总有
意的样本容量的无偏估计量,若对任都是和设定义
θ?θ
θ?θ?θ
θ?θ?θ?θ?
θθ?θ?2.5
??
?
n
?的真值 ?的真值
?^的概率 ?^的概率
比较总体均值两个无偏估计的有效性
? ?
? ? ? ?
? ?
? ? ? ?xV
n
n
xV
n
n
i
i
n
i
i
xV
n
i
i
xV
ExE
n
xVxE
x
n
x
n
i
i
n
i
i
n
i
i
ji
ji
n
i
i
ji
ji
n
i
i
jiji
n
i
in
i
i
n
i
iin
i
i
n
i
in
i
i
n
i
ii
n
i
i
a
a
aaaaaaaa
aaaa
a
a
a
a
xa
a
a
a
xax
????
??????
?
??
?
?
?
??
?????
?
?
?
?
?
?
????
?
?
??????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?????
?
?
?
?
?
?
??
??
?
?
??
22
1
2
1
2
1
222
1
2
1
2
2
222
2
1
2
1
2
2
1
1
2
1
1
11
1
2
1
,2
11
1
11
0
利用不等式
(证明了无偏性)
的有效性。和比较
无偏有效估计量的意义
?( 1)一个无偏有效估计量的取值在可能
范围内最密集于 ??附近。换言之,它以最
大的概率保证估计量的取值在真值 ?附近
摆动。
?( 2)可以证明,样本均值是总体数学期
望的有效估计量。
三、均方误( Mean Square Error)
最小性
?在很多情况下,我们被迫在偏差的大小与方差
的大小(即无偏与有效性)之间作出抉择。
?有时,一个方差极小的有偏估计比一个方差极
大的无偏估计可能更为我们所追求。
?此时,估计量的均方误为我们在两者之间的权
衡提供了一个有效的尺度。
均方误和均方误最小性的定义
? ?
? ?
? ?? ?
? ? ? ? ? ?? ?
? ? ? ? ? ?? ?
? ? ? ?? ?
? ?? ? ? ? ? ? 0θ-)θ?E()θ?E(-θ?2θ-)θ?E()θ?E(-θ?2
0θ
?
θ-)θ
?
E()θ
?
E(-θ
?
2
θ
?
θ
?
2
θ
?
θ
?
θ
?
θθ
θθ
?
θθ-θ
?
Eθ
?
θ3.5
θ
?
B i as
θ-)θ
?
E()θ
?
E(-θ
?
θ-)θ
?
E()θ
?
E(-θ
?
θ-θ
?
2
22
22
2
???
?????
???
??
??
?
EEE
V a r
EEE
EEM S E
B i a sV a rM S E
M S E
?
准确度精确度
)(
)()(
:的均方误可作如下分解均方误性。估计量
具有最小即的最小均方误估计量,最小的估计量,称为
均方误的一切估计量中,使其。在均方误,记作
的称为估计量,的估计量为若参数定义
均方误最小的意义
?( 1) MSE( ——误差)分解为精确度与准确
度之和。 MSE最小就是使估计量方差与估计量
偏误之和最小,给出了进行权衡的方法(见下
图)
?( 2)如果估计量为无偏估计量 Bias=0,那么
? MSE(?^)=Var(?^)
?即误差由精确度确定。
?此时,一个具有最小 MSE的估计量一定具有无
偏性和有效性,即
? MinMSE(?^)=MinVar(?^)。
运用 MSE权衡偏差与方差
?
最小均方误(有
偏,方差极小)
无偏,方差极大
?^
?^
的
概
率
准而不精 又精又准
精而不准
不精不准
重庆长安厂 4支比赛用枪的抽样结果
一次射击就是一
次抽样。试问:
哪些是无偏估计?
哪些是有偏估计?
哪些是有效估计?
哪些是无偏有效
估计?
四、一致性
?( 1)“依概率收敛”的定义
?( 2)一致性
?( 3)一致性的意义
( 1)“依概率收敛”的定义
? ?
? ? 。依概率收敛于列
则称随机变量序有
,使对于任何若存在常数定义
a
aP
a
n
n
n
?
? ?
?
,1
,04.5
lim ???
?
??
( 2)一致性
? 一致性既是从概率又是从极限性质来定义的,因此只
有样本容量较大时才起作用。
? 一致性作为评价估计量好坏的一个标准,计量经济学
家在无偏性和一致性之间更偏重选择一致性。
? 虽然一个一致估计量可能在平均意义上与真值不同,
但是当样本容量加大时,它会变得与真值十分接近,
即有偏的一致估计量具有大样本下的无偏性。同时,
根据大数定律,当 n增大时,方差会变得很小,所以一
致估计量具有大样本下的“无偏性”和“有效性”。
? ?
具有一致性。
的一致估计量,为参数,则称,若
,即任意给定依概率收敛于时,若当定义
θ?
θθ?1θθ?0
θθ?5.5
l i m
n
???
??
??
?? -P
n
( 3)一致性的意义
?显然,一个一致估计量比一个方差很大的无偏
估计量优越得多。
?由于 MSE(?^)=Var(?^)+Bias(?^)2,所以估计量
的一致性,实际上等价于当 n=> 时,
MSE(?^)=>0,亦即 Var(?^)=>0和 Bias(?^)2 =>0,
也就是随着样本加大,?^的方差变小; ?^的 偏
差接近于 0,这就是一致性描述的情况。
?事实上一致性和 MSE( ?^) =>0(当 n=> )这
两条标准在计量经济学中往往是通用的。
?
?
N小
N大
N极大小
?
?的概率
第六节 通过样本,估计总体(二) —
—估计方法
?一、点估计
?( 1)矩法
?( 2)最大似然法
?( 3)最小二乘法
?二、区间估计
?(一)对总体期望值的估计
?(二)对总体方差的估计
?(三)关于区间估计的几点说明
一、点估计
?所谓点估计就是给出被估计参数的一个特定的
估计值。
?常用的点估计方法有四种:矩法、最大似然法、
最小二乘法和 X2法。
?这四种方法分别建立在不同的原则上。
?对同一样本根据四种方法估计同一参数,所获
得的估计结果可能互不相同。
?然而由于各种建立原则的合理性,所以四种方
法在研究中都经常使用。
( 1)矩法
?矩法是求估计量最古老的方法。具体作
法是:一样本矩作为相应总体矩的估计
量;以样本矩的函数作为相应的总体矩
同样函数的估计量。
?这种方法最常见的应用是用样本平均数
估计总体数学期望。
?矩法比较直观,求估计量时有时也比较
直接,但它求出的估计量往往不够理想。
矩法点估计的例题
? 例 1某灯泡厂某天生产了一大批灯泡,从中抽取了 0个进行寿命试
验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿
命是多少?
3é D? ?? 1? 1 2 3 4 5 6 7 8 9 10
éù ?ó £¨?? éa£? 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200
?? ê? μ? D? a? ê? é? ?? ?? éy = 1 1 4 7 £? ?e ía ?ü ?? éy D§?ú ì? μ? ?? ?? ?μ
? ?
? ?
xxx
x d xdxxdxxx
x
x
x
xx n
2
?
,
2
?
202
1111
,
0
0
1
,
,2
2
00
1
????
??
??
?
??
?
???
?
?
?
?
?
??
?
?? ?
???
??
?
?
?
?
??
???
???
?
?
???
在矩法下又
是多少?问在矩法下
其它
取自均匀分布若样本例
?
?
?
( 2)最大似然法
(Maximum Likelihood Estimation)
?1、一个重要的事实
?2、最大似然法的概念
?3、似然法函数
?4、最大似然法的定义
?5、最大似然法的三个示例
1、请注意如下事实
? 不同的总体会产生不同的样本,对于某一特定的样本,
在我等不了解产生它的母体究竟为何物的观察者眼中,
它来自一些母体的可能性要比来自另一些母体的可能
性大,即一些母体更容易产生出我们所观察到的样本。
? 举例说,假定我们抽取到( x1,x2,……,x8 )我们知道它
来自正态总体,且总体的方差是了解的,但是总体的
均值未知。如下图所示。
x6 x2 x3 x4 x5 x6 x7 x8
分布 B 分布 A
概
率
x
假定样本不是来自 B就是
来自 A。如果样本来自 B,
观察到它的可能性非常
小;真正的母体若是 A,
得到样本的可能性很大。
显然我们宁愿承认样本
来自 A。是样本“替”
我们“选择”了 A。
2、最大似然法的概念
? 上述事实诱导我们宁愿作出这样的抉择:将样本最容
易来自的总体当作产生样本的总体。
? 现在要根据从总体 ?中抽取得到的样本 (x1,……,x n)对总
体中的未知数 ?进行估计。最大似然法是选择这样的估
计量 ?^作为 ?的估计值,以便使观察结果 (x1,……,x n)出
现的可能性(概率)最大。
? 对于离散型变量,就是要选择 ?^使 p(x1)p(x2)… p(xn)最大。
(连乘 ——表示一次独立地抽取各个样本观察值)
? 对于连续型变量,就是要选择 ?^使 ?(x1)?(x2)...?(xn)最大。
注意 ?(xi)是随机变量在 xi附近取值的概率,相当于离散
型的 p(xi)。
3、似然法函数
? ?
? ?
? ?
? ? ? ?
? ? ? ?
? ? ? ??
?
?
?
?
??
?
n
i
in
ii
n
n
i
in
n
xxxx
xx
xxx
xxxx
xxx
PL
PP
L
L
L
x
xF
1
21
21
1
21
21;;,
,;
,;;,
,;
??
???
?
???
???
??
?
?
?
?
则似然函数
的概率函数为离散型随机变量,它设
为样本的似然函数。的函数,称成参数
可以看是常数,所以由于每一取定的样本值
:的联合分布分布密度是样本
的独立性,则是未知参数。由于样本,其中度函数是
,分布密的分布函数是为连续型随机变量,它设
4、最大似然法的定义
? ?
的最大似然估计。是则称
处达到最大值,在如果定义
θθ?
θ?θ;,,,1.6 21 xxx nL ?
5、最大似然法的估计方法
?为了取得 ?的最大似然估计,必须使似然函数 L
达到最大值,并且把此时的 ?^作为 ?的估计量。
由于对数函数是单增的,L达到最大亦即 LnL达
到最大。
?这样使 LnL达到最大来估计 ?为计算带来了许多
方便。
?根据微分中的拉格朗日定理,对未知参数求条
件极值,令 LnL对 ? 的一阶导数等于 0,即
dLnL/d ?=0 ==>得到似然方程,我们所求的 ?^
就是似然方程中 ?的解。
5、最大似然法示例之一
? ?
? ?
? ?
的最大似然估计。是
得解似然方程
似然函数解
的最大似然估计。的一组观察值,求是
其它
的分布为:已知随机变量例
θ
1
?
0
1
1ln1
lnln
11;,,,
θξ,,,
0
00
1;~
ξ3
11
2
1
2
1
1
1
21
21
1
x
x
n
n
n
d
Ld
nL
x
x
L
x
x
n
i
i
n
i
i
n
i
i
n
i
i
n
n
i
n
n
i
xx
xx
eexxx
xxx
e
x
n
i
i
i
i
?
???????
????????
?
???
?
?
?
?
?
??
?
??
??
?
?
?
?
??
?
?
???
?
?
?
?
?
???
?
?
?
??
?
?
?
5、最大似然法示例之二
? 例 4 某电子管的寿命服从例 3中的分布(实际上多为指
数分布)抽取一组样本,其具体数值如下:
? 根据例 3的结果,在最大似然法下,指数分布中的 ?,
应用样本平均数估计。
? ?^=(16+29+…… +800+110)=318(小时)
16 29 50 68 100 130 140 270 280
340 410 450 520 620 190 210 800 1100
5、最大似然法示例之三 ——
已知 ?~N(?,?2),以一组样本观察值估计 ?的参数
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ? ? ?
型估计时也是如此。估计量,以后对线性模
差的估计往往是有偏:最大似然估计法对方意然后解似然方程组。注
,分别对不同参数求偏导估计时,应将:当不只一个参数需要注意
解得
解
2
ln1
1
1
?
0
22
0
1
22
ln1ln
2
1
ln
22
1
ln
2
ln
1
2
1
2
1
1
2
2
1
1
2
42
1
2
1
2
422
1
2
1
2
2
2
12
12
2
1
2
?
2
2
2
2
2
2
L
i
n
n
i
nn
i
nnLL
i
nn
L
e
x
L
n
i
n
i
i
n
i
n
i
i
n
i
n
i
i
n
i
n
i
x
i
n
n
i
xx
x
x
x
xx
x
e
n
i
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
????
??
????
?
?
??
?
?
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
??
??
?
?
????
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
( 3)最小二乘法 (Least Square Estimation
Method)
?最小二乘法是计量经济学中应用最广泛
的一种估计方法。
?这是本课研究的重点问题,在以后各章
中将详尽地阐述它的原理、步骤、特性
和优越处。
?这里暂时不加以讨论。
二、区间估计
?(一)对总体期望值的估计
? 1、已知方差,对数学期望 E?进行区间估计
?( 1)方差已知,估计总体数学期望
?( 2)正态总体
?( 3)一般总体大样本下数学期望的区间估计
? 2、方差未知,对对数学期望 E?进行区间估计
?(二)对总体方差的估计
?(三)关于区间估计的几点说明
区间估计的概念
? 所谓区间估计就是以一定的可靠性给出被估计参数的
一个可能的取值范围。
? 用点估计估计参数,即使是无偏有效的估计量,也会
由于样本的随机性,使得由样本计算出的估计值并不
恰恰是真值。而且即使等于真值,由于真值未知,我
们也不能肯定这种相等。那么,究竟相差多少?于是
问题等价为:在给定可靠程度下,指出被估计参数所
在的可能值的范围,就是参数的区间估计问题。
? 具体作法是找出两个统计量 ?1(x1,…,x n)与 ?2 (x1,…,x n),
使
? P(?2 < ?< ?2 )=1-?
? (?1,?2)称为置信区间,1-?称为置信系数(置信度),
?称为冒险率(测不准的概率),一般等于 5%或 1%。
对区间估计的形象比喻
? 我们经常说某甲的成绩“大概 80分左右”,可以看成
一个区间估计问题。(某甲的成绩 ?为被估计的参数 )
? P(?2 < ? < ?2 )=大概的准确程度( 1-?)
?
? 如,P(75 < ? <85 )=95%=1-5%
―大概 80分左右”
冒险率(假设检验中
叫显著水平)
下限 上限
(一)对总体期望值的估计
?1、已知方差,对总体数学期望 E?=?进行
区间估计
( 1)方差已知分布未知,估计总
体数学期望
? 对这种情况的处理,需要用到切比雪夫不等式。
?
??
?
?
?
?
和视具体情况选择适当的高(区间长度变小),
增大估计精度提有关。、、。此外,区间长度还与是
的概率含。某一个区间可能不包)个会套住(中有
个区间次抽样计算得到的。即平均套住的可能性是
被随机区间数区间。上式的意思是常个样本都会有一个置信
一本不同而不同,对于每是一个随机变量,随样这里样本均值
n
nE
EE
n
V
x
n
V
x
E
x
n
V
xE
n
V
xp
ξnαα
ξξα11 0 0
1 0 01 0 0α1
α
,
α
ξ
1
αα
?
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
????
下限 上限
电子管寿命的置信区间
? 例 6 在本节例 1中,如果已知当天生产的电子管寿命的
方差为 8,试找出电子管寿命的置信区间( ?=5%)。
? ?
? ?
的置信区间比较粗糙。
比雪夫不等式估计的分布信息,所以根据切
量的。由于没有利用随机变,
,即的置信区间为
解:
已知
ξ
11511143
41147,41147ξ
4
8%5101147
E
n
V
Vnx
???
?
????
?
?
??
( 2)正态总体
? ? ? ?
? ?
? ?
。时,。时,
。的置信区间为置信度为因此
即
即
使确定查标准正态分布表可以对给定的
可以得到:
,由定理,来自正态总体设样本
576.205.096.105.0
,α-1μ
1
1
/
1
,,
1,0~
/
13.4μ,,
01.005.0
2
1
????
?
?
?
?
?
?
??
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
???
?
?
??
??
??
??
?
?
??
??
?
?
?
?
?
?
?
?
?
?
?
??
??
??
?
n
x
n
x
n
x
n
xP
n
x
PUP
N
n
x
U
N
xx n
?
??nσ ??nσ
58.20, 0 1α
96.10, 0 5α
64.10, 1 0α
??
??
??
?
?
?
?
?
?
?/2?/2 1-?
置信区间,
上限下限
可靠程度冒险率
??
?
??
? ?
?????
?
??
??
??
??
n
σx
n
σ-x
n
σx
n
σ-x
α1--α
x
假设总体服从正态分布 N(?,8)
求 ?的 置信区间
? 例 7 本节例 1中再假设总体服从正态分布,求电子管寿
命的置信区间( ?=5%)。
置信区间精确些。切比雪夫不等式所得的
信息,比未知分布通过显然,由于利用了分布
即
置信区间为:而
解:
75.1 1 4 825.1 1 4 5
96.1
10
22
1 1 4 796.1
10
22
1 1 4 7
1 1 4 72210
96.105.0
??
??????
????
???
?
?
?
? ?
?
xn
?
( 3)一般总体大样本下数学期望
E?的区间估计
?中心极限定理指出,在很宽的条件下,无能是
否为正态总体 ?( ?,?2),当样本容量相当大
时,也有样本平均数渐进地服从正态分布。
?一般说来,在 n>=30时,就可以把样本平均数
近似地看作服从正态分布 N(?,?2/n)。
?所以,对于大样本仍可以按正态总体进行均值
?的区间估计。
2、方差未知,对对数学期望 E?进
行区间估计
? ( 1)大样本下
? 根据中心极限定理,V ?可以用 s2代替,所以仍按已知
方差正态分布的方法进行 ?的置信区间估计。
? ( 2)小样本下
? ? ? ?
? ?
??
?
?
?
?
?
?
?
??
??
?
??
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
1
1
/
,1,
15.4)1(~
/
,,,,
22
1
tt
tt
t
xx
n
s
x
n
s
xp
ns
x
pTp
tn
nt
ns
x
T
N
n
的置信区间为:因此,
即
使分布的临界值的查具有对给定的
)(由定理
未知,令由于来自正态总体设小样本 ?
例 8 新生儿体重的置信区间
? 假设新生儿(男)的体重服从正态分布。随机抽取 12
名新生儿,测得体重如下表,试以 95%的置信度估计
新生儿(男)的平均体重。
?? 1? 1 2 3 4 5 6 7 8 9 10 11 12
?á èò ?? ?? ?? 3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 2540
? ?
3 3 0 02 8 2 0
2 0 1.2
12
3.3 7 5
3 0 5 72 0 1.2
12
3.3 7 5
3 0 5 7
9 5 %μ
3.3 7 53 0 5 7
11
1
3 0 5 7
(2 0 1.21205.0
12
1
2
)112(
??
??????
???
????
? ?
?
?
?
?
?
?
即
的置信区间是置信度为
再计算
表的图有错)
i
x
t
i
sx
n?
? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ? ? ? 2/
1
11
1
1
1~
,,,,
2
2
2
1
2
1
2
111
2
2
2
2
?
?
?
?
?
?
?
?
?
?
????
??
?
?
?
?
?
?
?
? ?
??
?
???
?
?
?
?
?
??
????
??
?
?
bZpaZpba
a
n
b
n
p
b
s
ap
bZap
n
s
Z
N
ss
xxx
n
n
时,一般取和在确定
那么,
。)来自总体设样本( ?
对总体方差的区间估计
基础
——复习数理统计学
问题的提出
? 首先, 假定现在开始选学, 计量经济学, 课程的同学
们都已经学习过, 数理统计学, 了 。 即便通过了, 数
理统计, 的学分考试, 也意识到数理统计学在大学的
数学基础课教学中, 属于比较困难的一部分 。 况且,
同学们对, 数理统计, 的掌握可能不是很完备的 。
? 其次, 大多数人对数学公式, 数学符号的健忘, 也提
醒我们在进一步讨论计量经济学内容之前, 必须对数
理统计学的基本内容进行一些温习与回顾 。
解决问题的思路
? 1,恳请同学们将数理统计学的书籍拿出来进行复习 。
? 2,在老师讲授的内容的同时, 加强回顾, 多思考, 多
提问 。 一边听课一边在教科书上进行批注, 并把教科
书上的印刷错误 ( 忒多 ) 改正 。
? 3,恳请同学们到图书馆借阅计量经济学的参考书 。 计
量经济学的分类号是, F224‖,计量经济学理论基础 —
—统计学的分类号是, O212‖。
? 4,在大三下以前掌握 Windows 9x以及 Office97及其以
上的应用, 为毕业论文和大四谋业面试打下坚实的基
础 。
? 4,熟悉 Internet的使用 。, 逐步养成通过网络了解世界
与世界同步 。
主要内容
? 第一节 总体、样本和随机函数
? 第二节 对总体的描述 ——随机变量的数字特征
? 第三节 对样本的描述 ——样本分布的数字特征
? 第四节 随机变量的分布 ——总体和样本的连接点
? 第五节 通过样本,估计总体(一) ——估计量的特征
? 第六节 通过样本,估计总体(二) ——估计方法
? 第七节 通过样本,估计总体(三) ——假设检验
为什么要复习数理统计学
?假设同学们都已经学习过数理统计学。
?即便如此,数理统计学在大学数学教学
中,属于比较难的部分,而且是研修高
级课程必不可少的准备。
?而且许多同学或许对于大部分同学,他
们对于数学公式与数学符号的健忘,也
提醒我们有必要在展开计量经济学讨论
之前,对本课程中经常使用到的数理统
计学基本内容事先进行一些温习和回顾。
数理统计学在计量经济学中的
地位
?事实上不懂得数理统计学就不可能学习
和研究计量经济学。
?数理统计学是计量经济学的基础,它为
计量经济学提供了唯一而有效的方法。
?此外,从某种意义上来说,计量经济学
就是使数理统计学在建立经济模型中得
以应用的一门科学。
复习数理统计学必须注意
? 建议同学们将已经学过的, 西方经济学,,, 数理统
计学,,, 线性代数, 和, Windows 95,进行一次认
真地复习。
? 复习时,注重西方经济学的宏观部分,注重数理统计
学学科体系的逻辑结构分析、注重数理统计方法的阐
述、注重数理统计公式、定义和定理的内在涵义及其
相互关系,注重线性代数的求逆和相似形部分,注重
Windows 95的基本操作部分。
? 在今后的学习中,注意经济学基本理论及其应用,注
意数理统计学基础与计量经济学的联系与活用,注意
线性代数与统计量的计量与检验。
第一节 总体、样本和随机函数
? 四个基本定义与数理统计学的逻辑结构
? 一、随机变量的分布
? 二、二元随机变量
? 三、独立性
? 四、随机变量函数和分布
四个基本定义与数理统计学的逻辑结
构
?总体和个体
?样本和样本容量
?随机变量
?统计量
?数理统计学的逻辑结构
总体(集合)和个体(构成集
合的元素)
? 研究对象的全体称为总体或母体,组成总体的每个基
本单位称为个体。注意:
? ( 1)按组成总体个体的多寡分为:有限总体和无限总
体;
? ( 2)总体具有同质性:每个个体具有共同的观察特征,
而与其它总体相区别;
? ( 3)度量同一对象得到的数据也构成总体,数据之间
的差异是绝对的,因为存在不可消除的随机测量误差;
? ( 4)个体表现为某个数值是随机的,但是,它们取得
某个数值的机会是不同的,即它们按一定的规律取值,
即它们的取值与确定的概率相对应。
样本和样本容量
?总体中抽出若干个个体组成的集体称为
样本。样本中包含的个体的个数称为样
本的容量,又称为样本的大小。
?注意:抽样是按 随机原则 选取的,即总
体中每个个体有同样的机会被选入样本。
随机变量
? 根据概率不同而取不同数值的变量称为随机变量
( Random Variable)。
? 注意:
? ( 1)一个随机变量具有下列特性,RV可以取许多不
同的数值,取这些数值的概率为 p,p满足,0<=p<=1。
? ( 2)随机变量以一定的概率取到各种可能值,按其取
值情况随机变量可分为两类:离散型随机变量和连续
型随机变量。离散型随机变量的取值最多可列多个;
连续型随机变量的取值充满整个数轴或者某个区间。
? ( 3)本书中,随机变量用 x,y,?,?等符号表示
离散型随机变量与连续型随机
变量
10 20 30 40 50
1.0
概
率
概
率
x x
1.0
离散型随机变量 连续型随机变量
总体与随机变量的关系
? 表示总体状况的数量特征,在总体中是参差不齐的,
往往以一定的概率取不同的数值,显然对于这样的数
值我们采用一般的变量是无法加以描述的。但是。可
以采用一种特殊的变量来表示它们。这个特殊变量就
是随机变量。因为,根据随机变量的定义,随机变量
以一定的概率取许多不同的值,而且概率 p满足:
0<=p<=1。例如,一批灯泡的寿命可以取许多不同的数
值,每个灯泡的取值不一定完全相同,但它们是按一
定概率进行分布的,但它们却是以一定的概率取某个
寿命值。由此看来,随机变量并不是一个随便变的量。
? 由于我们主要研究总体的数量特征,可以直接用随机
变量来表示所研究的总体。
总体、随机变量、样本间的联系
?总体就是一个随机变量,所谓样本就是 n
个(样本容量 n)相互独立且与总体有相
同分布的随机变量 x1,……, xn。
?每一次具体抽样所得的数据,就是 n元随
机变量的一个观察值,记为( X1,……,
Xn)。
?通过总体的分布可以把总体和样本连接
起来。
从两个角度来描述总体(随机
变量)中个体的取值
?( 1)动态 ——概率 ——随机地选取一个个体
取某个具体数值的可能性;
?( 2)静态 ——分布 ——个体取某个数值,从
全局来看这个具体的数值(可能不只一个个体
取这同一个数值)出现的次数占全体个体个数
的比例,形象地说就是这个具体的数值在数轴
的这个位置上分布了多少。
?分布也好、概率也好它们在度量上是一致的。
?这只是就离散型随机变量的通俗示意。
总体分布是总体和样本的连接点
? 所谓分布,它是从全局而言的。通俗地说,分布就是
某个对象在什么地方,堆积了多少。
? 任何一个随机变量都有自己的分布,这个什么地方就
是在数轴上取什么值,堆积多少就是在那里占有的比
例是多少或者概率有多大。
? 总体可以表示为随机变量,并具有自身的分布。
? 样本则是相互独立与总体具有相同分布的 n元随机变量。
因此,总体分布是总体和样本的连接点。从而,可以
通过对样本特征的研究达到对总体进行研究的目的。
因为它们具有相同的分布。
? 须知,如果对于一个随机变量完全掌握了它的分布规
律,就完全明白无误了。
为什么样本是与所来自的总体
具有相同的分布的随机变量
? 因为样本具有二重性:
? 一是指某一次具体的抽样的具体的数值( X1,……,
Xn);
? 二是指一次抽样的可能结果,它的每一次观察都是随
机地从总体中(每一个个体有同样的机会被选入)抽
取一个,所以它是一组随机变量( x1,x2,……, xn)
? 而且,每一次抽样都来自同一总体(分布),也就是
每一次抽样都带来了与总体一样的分布信息。所以,
样本与所来自的总体分布相同。
? 由于总体分布完整的描述了总体的信息,有时我们也
直呼总体为分布,不加区别地使用总体或分布。
统计量
? 设( x1,x2,……, xn)为一组样本观察值,函数 f
( x1,x2,……, xn )若不含有未知参数,则称为统
计量。
? 统计量一般是连续函数。由于样本是随机变量,因而
它的函数也是随机变量,所以,统计量也是随机变量。
? 统计量一般用它来提取或压榨由样本带来的总体信息。
? ?
就是统计量。样本方差
1
1
2
2
?
?
? ?
?
n
i
n
i
xx
s
样本与总体之间的关系
?样本是总体的一部分,是对
?总体随机抽样后得到的集合。
?对观察者而言,总体是不
?了解的,了解的只是样本
?的具体情况。我们所要做
?的就是通过对这些具体样
?本的情况的研究,来推知整
?个总体的情况。
……
Xn+1
Xn
…
X1 样本
总体
数理统计学的逻辑结构
? ( 1)总体和样本
? 引入一个随机变量来描述总体
? ( 2)对总体的描述:随机变量的数字特征
? ( 3)对样本的描述:样本分布的数字特征
? ( 4)总体与样本的连接点:随机变量的分布
? ( 5)如何用样本的数字特征估计总体的数字特征及数
据生成过程中的各种参数
– a 估计量的优良性
– b 估计方法
– c 对估计量的检验 ——假设检验
? ? ? ?xV arxE xx ?? ?? 2方差数学期望
,描述样本的离散程度样本方差,描述样本的一般水平样本平均数 sX 2
a 估计量的优良性
?1、无偏性
?2、有效性
?3、均方误最小
?4、一致性
b 估计方法
?
?
?
?
?
?
?
矩法
最大似然法
最小二乘法
最小卡平方法 总体分布未知
正态总体
一般总体(大样)已知方差
方差未知 一般总体(大样)
正态总体
估计期
望
单个总体
两个总体 估计方差(常用小样本下,正态总体估计
其它参数)
点估计
区间估计
c 对估计量的检验 ——假设检验
? 1.对总体分布特征的假设检验
? ( 1)一个正态总体的假设检验
– a 检验均值:已知方差和未知方差
– b 检验方差:未知均值(双尾和单尾)
? ( 2)两个正态总体的假设检验
– a 检验均值:未知方差但可假设其相等
– b 检验方差:未知均值 (双尾和单尾)
? ( 3)总体分布的假设检验
– a 总体为离散型分布
– b 总体为连续型分布
? 2.对各种系数、参数估计值的假设检验
一、随机变量的分布
(一)离散型随机变量的分布
? 定义:如果随机变量 ?只取有限个或可列多个可能值,
而且 ?以确定的概率取这些值,则称 ?为离散型随机变
量。
? 通常用分布列表示离散型随机变量:
? ?的概率分布也可用一系列等式表示:
? P( ? =xi) =pi ( i=1,2,…… )称为 ?的概率函数。
注意这里 xi只出现一次。
? 显然满足概率的定义:
? 离散型随机变量的分布就是指它的分布列或概率函数。
??
??
?
?
??
?
?
?1
1
10
i i
i
p
p
X x1 x2 … …,, xi … …,,
p p1 p2 … …,, pi … …,,
离散型随机变量举例 1
?例 1 一批产品的废品率为 5%,从中任取一个进
行检验,以随机变量来描述这一试验并写出的
分布。
?以 X=0表示“产品为合格产品”,X=1表示
“产品为废品”,那么分布列如下:
?其概率函数 p( X=0) =0.95,p( X=1) =0.05,
或
? p( X=i) =( 0.05) i( 0.95) 1-i ( i = 0,1)
X 0 £¨1? ·? ??£? 1 £¨?? ??£?
P 0.95 0.05
离散型随机变量举例 2
?用随机变量 X描述掷一颗骰子的试验。
?分布的概率函数为:
?P( X=i) = 1/6( i=1,2,3,4,5,6)
X 1 2 3 4 5 6
P 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6
(二)随机变量的分布函数
? 定义:若 X是一个随机变量(可以是离散的,也可以是
非离散的),对任何实数 x,令 F( x) =P( X<=x),
称 F( x)为随机变量 X的 分布函数 。
? F( x),即事件,X<=x‖的概率,是一个实函数。
? 对任意实数 x1<x2,有
? P( x1<X<x2) =P( X<=x2) - P( X<=x1) =F( x2) - F( x1)
? 由此可知,若已知 X的分布函数,就知道 X在任何区间
上取值的概率。所以,分布函数完整的描述了随机变
量的变化情况。
x2x2
f(x)F(x)
X
x1x1
分布函数 F( x) 的性质
? ? ? ?
? ?
? ? ? ?
? ? ? ?
? ?
? ? ?
?
???
???
?
????
????
???????
x
i
x
x
x
xF
xF
xFF
xFF
xF
xFx
i
p足关系:分布函数与概率函数满
。。且在间断点上右连续至多有可列多个间断点)(
)(
为不减函数)(
,)对一切(
4
1
03
2
10,1
l i m
l i m
分布函数举例
?例 3 求例 1中的分布函数
?例 4 求例 2中的分布函数
? ? ? ?
??
?
?
?
?
??
?
??
11
1095.0
00
x
x
x
xXPxF
? ? ? ?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
??
??
?
???
61
656/5
546/4
436/3
326/2
216/1
10
x
x
x
x
x
x
x
xXPxF
0 1
F(x)
x
? ? ?
?
?
xx i ip
xF
(三)连续型随机变量的分布
? 定义:对于任何实数 x,如果随机变量 X的分布函数
? F( x)可以写成
? 概率分布密度函数的性质:
? ? ? ?
? ? ? ?
? ?。常写成概率分布密度函数,也
的为为连续型随机变量,称,则称其中
xX
XxXx
dttxF
x
?
??
?
~
0?
? ?
??
? ?
? ?
? ? ? ? ? ?
? ? ? ?。有
的连续点上,,并且在显然
)(
)(
xxF
xdxxbXaP
dxx
x
b
a
?
??
?
?
??
???
?
?
?
?
??
??
12
01
为什么 ?(x)称为概率分布密度函数
? ? ? ?
? ?
? ? ? ?
? ?
? ?
? ?
的概率大小。
附近取值在能够反映分布的密集程度。但是
点概率在值的概率,而是取不是表明
xXx
xXxXx
x
xxXxP
x
xFxxF
x
xxF
x
x
?
?
?
?
?
????
?
?
???
??
??
??
??
lim
lim
0
0
?
连续型随机变量分布函数举例
? ?
? ? ? ?
? ? ? ?
? ? ? ?
? ?
?
?
?
?
?
?
??
?
?
?
??
?
?
??
????
?
?
? ??
?
?
??
??
??
??
??
??
bx
bxa
ab
ax
ax
xF
dttxF
ab
abdxdxx
xFbaX
bxa
x
X
x
1
0
1
1
,
0
5
??
???
?
?
又因为
解
。上的均匀分布。试求服从区间则称
其它
有密度函数若例
?
a x b
a x b
?
F(x)
?(x)
(四)分布函数、概率函数、
密度函数三者的关系
?分布函数既适用于离散型也适用于连续型,是
描述各种类型随机变量最一般的共同形式。但
是,它不够直观。
?概率函数对于离散型的描述很直观。
?概率密度函数的大小能够反映 X在 x附近取值的
概率的大小,从而比分布函数更直观。
?所以,在实际应用中我们分别用概率函数和密
度函数对离散型和连续型随机变量进行描述。
二、二元随机变量
? n元随机变量的定义:每次试验同时处理 n个随机变量
( X1,X2,……, Xn),它们的取值随试验的进行而
变化。如果对任何一组实数( x1,x2,……, xn),事
件,X1?x1,X2?x2,……, Xn?xn‖有着确定的概率,
则称 n个随机变量( X1,X2,……, Xn)总体为一个 n
元随机变量。
? n元随机变量分布函数的定义,n元函数
? F( x1,x2,……, xn ) = P(X1?x1,X2?x2,……, Xn?xn)
? ( x1,x2,……, xn) 属 Rn,为 n元随机变量分布函数。
? 离散二元随机变量的定义:如果二元随机变量( X,Y)
所有可能取值为有限或可列多个,并且以确定的概率
取各个不同数值,则称 ( X,Y)为二元随机变量。
(X,Y)的 联合分布表和联合分布函数
? (X,Y)为离散型的二元随机变量,通常用联合分布函
数与联合分布表表示。
( X,Y ) μ? ·? áé ?? 2? aí
X Y y1 y2 …… yj …… X μ? a? ?é ?? 2?
x1 p11 p12 …… p1j …… p1.
x2 p21 p22 …… p2j …… p2.
…… …… …… …… …… …… ……
xi pi 1 pi 2 pi j pi,
…… …… …… …… …… …… ……
Y μ? a? ?é ?? 2? p.1 p.2 …… p.j …… 1
3? p( X =x i,Y =y j ) =pi j ( i,j =1,2,…,.) ía ( X,Y ) μ? ·? áé ?? 2?
è? é? ?2 3? ía ( X,Y ) μ? àa 1? ?? 2? ?£
离散二元分布函数的示例
? 例 6 同一品种的 5个产品中,有 2个正品,3个次品,每
次从中抽取一个进行质量检查,不放回的抽取,连续
两次。令,Xi=0‖表示第 i次抽取到正品,而,Xi=1‖表
示 第 i次抽取到次品,写出 (X1,X2)的分布。
? 解 p(X1=0,X2=0)= p(X1=0)P(X2=0)=(2/5)(1/4)=1/10
? p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10
? p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10
? p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10
( X 1,X 2) μ? ·? áé ?? 2? aí
X 1 X 2 0 1 X1 a? ?é ?? 2?
0 1/ 10 3/ 10 2/ 5
1 3/ 10 3/ 10 3/ 5
X2 a? ?é ?? 2? 2/ 5 3/ 5 1
连续二元随机变量的定义
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
?????
??
?
?
?
??
??
??
??
?? ??
b
a
d
c
x y
d xd yyxdYcbXap
dcba
d s d tts
yxyx
yx
YX
yxYX
d s d ttsyxF
yxyxFYX
yx
,,
,,
1,2
0,,1
,
,),(
,,
,),(,
,
?
?
?
?
?
?
?
有显然,对于任意实数
)(
,)对于一切实数(
的性质:
的联合密度函数。与为
称。是二元连续型随机变量则称
都有:,对于任意实数的分布函数
,使得二元变量如果存在一个非负函数
三、独立性
?(一)事件的独立性
?(二)随机变量的独立性
(一)事件的独立性
?定义 1.12事件的独立性的定义
?如果事件 A发生的可能性不受事件 B发生与否
的的影响,即 P(A/B)=P(A),则称事件 A对于事
件 B独立。
?显然,若事件 A对于事件 B独立,事件 B对于事
件 A也一定独立,我们称事件 A与事件 B相互独
立。
? A与 B独立的充分必要条件是:
? P( AB) =P( A) P( B)
(二)随机变量的独立性
?定义 1.13随机变量相互独立的定义
? 对于任何实数 x,y,如果二元随机变量 (X,Y)
的联合分布函数 F(x,y)等于 X和 Y的边际分布的
乘积,即
? F(x,y) = FX(x), FY(y)
?则称 X与 Y相互独立。
?定义 1.14边际分布的定义
?离散型二元随机变量 (X,Y)中,分量 X( 或 Y)
的概率分布称为 (X,Y)的关于 X(或 Y)的边际
分布,边际分布又称边缘分布。
四、随机变量函数的概念和分布
? 定义 1.15 随机变量函数的定义
? 设 f(x)是定义在随机变量 X的一切可能取值集合上
的函数。如果对于 X的每一个可能值 x,都有另一个随
机变量 Y的取值 y=f(x)与之相对应,则称 Y为 X的函数,
记作 Y=f(X)。
? 我们常常遇到一些随机变量,它们的分布往往难
于直接得到(例如滚珠体积的测量值等),但与它们
有关系的另一个随机变量的分布却是容易知道的(如
滚珠直径的测量值)。因此,就要研究两个随机变量
之间的关系,然后通过它们之间的关系,由已知随机
变量的分布求出与之有关的其它随机变量的分布。其
间的关系通常用函数关系表示。
第二节 对总体的描述 ——随机变量的
数字特征
?一、数学期望
?二、方差
?三、数学期望与方差的图示
一、数学期望
?研究数字特征的必要性
?两个最重要的数字特征
?( 1)数学期望
?( 2)方差
研究数字特征的必要性
? 总体就是一个随机变量。对总体的描述就是对随机变
量的描述。随机变量的分布就是对随机变量最完整的
描述。但是,
? ( 1)求出总体的分布往往不是一件容易的事情;
? ( 2)而且,在很多情况下,我们并不需要全面考察随机变量的变
化情况,只需要了解总体的一些综合指标。一般说来,常常需要
了解总体的一般水平和它的离散程度;
? ( 3)如果了解总体的一般水平和离散程度,就已经对总体有了粗
略的了解了;
? ( 4)在很多情况下,了解这两个数字特征还是深入求出总体分布
的基础和关键。
? 由此看来,研究随机变量的数字特征是十分必要的。
数学期望的定义
? 定义 2.1离散型随机变量数学期望的定义
? 假定有一个离散型随机变量 X有 n个不同的可能取值
x1,x2,……,x n,而 p1,p2,……,p n是 X取这些值相应的概率,
则这个随机变量 X的数学期望定义如下:
? 数学期望描述的是随机变量(总体)的一般水平。
? 定义 2.2连续型随机变量数学期望的定义
? ?
? ? ? ? ? ? 的数学期望。称为绝对收敛,则
,若积分有分布密度函数若连续型随机变量
XdxxxxEdxxx
xX
?? ???????? ? ??
?
? ?
? ? 平均数。的所有可能取值的加权是随机变量实际上,XXE
xE
n
i
iinn xpxpxpxp ?
?
?????
1
2211 ?
女儿期待父亲钓多少鱼回家?
?数学期望是最容易发生的,因而是可以
期待的。它反映数据集中的趋势。
éy à? ·? áé
1 0.1 0.1
2 0.1 0.2
3 0.4 1.2
4 0.2 0.8
5 0.2 1
3.3
· ??μ? ò? μ? éó Dé
éy D§?ú ì?
数学期望的性质
?( 1)如果 a,b为常数,则
? E(aX+b)=aE(X)+b
?( 2)如果 X,Y为两个随机变量,则
? E(X+Y)=E(X)+E(Y)
?( 3)如果 g(x)和 f(x)分别为 X的两个函数,则
? E[g(X)+f(X)]=E[g(X)]+E[f(X)]
?( 4)如果 X,Y是两个独立的随机变量,则
? E(X.Y)=E(X).E(Y)
求离散型随机变量数学期望举例
? 例 1 甲、乙两射手在一次射击中的得分(分别用 X,Y表示)的分
布率如下:
? 试比较两射手的射击技术水平,并计算如果二人各发一弹,他们
得分和的估计值。
? 解 EX=1?0.4+2 ? 0.1+3 ? 0.5=2.1
? EY=1 ? 0.1+2 ? 0.6+3 ? 0.3=2.2
? E(X+Y)=2.1+2.2=4.3
? EX<EY 乙射手射击水平比较高
? 二人各发一弹,得分总和最可能在 4.3分左右(即 4分或 5分)
X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3
二、方差
? 定义 2.4 离均差的定义
? 如果随机变量 X的数学期望 E(X)存在,称
? [X-E(X) ]为随机变量 X的离均差。显然,随机变量离均
差的数学期望是 0,即
? E [ X-E(X) ] = 0
? 定义 2.3 连续型随机变量的方差
? 定义 2.5 随机变量离均差平方的数学期望,叫随机变量
的方差,记作 Var(x),或 D(x)。方差的算术平方根叫标
准差。
? ? ? ?? ? ? ? dxxXV
XX
xEx ?? ?????? 2
的方差以下式给出:为连续型随机变量,则若
? ? ? ? ? ?? ? ? ??? xEExV a rxV xxExx ?? ???? 222
方差的意义
?( 1)离均差和方差都是用来描述离散程度的,
即描述 X对于它的期望的偏离程度,这种偏差
越大,表明变量的取值越分散。
?( 2)一般情况下,我们采用方差来描述离散
程度。因为离均差的和为 0,无法体现随机变
量的总离散程度。事实上正偏差大亦或负偏差
大,同样是离散程度大。方差中由于有平方,
从而消除了正负号的影响,并易于加总,也易
于强调大的偏离程度的突出作用。
方差的性质
?( 1) Var(c )=0
?( 2) Var(c+x)=Var(x )
?( 3) Var(cx)=c2Var(x)
?( 4) x,y为相互独立的随机变量,则
? Var(x+y)=Var(x )+Var(y )=Var(x-y)
?( 5) Var(a+bx)=b2Var(x)
?( 6) a,b为常数,x,y为两个相互独立的随机变
量,则 (ax+by)=a2Var(x)+b2Var(y)
?( 7) Var(x)=E(x2)-(E(x))2
例 2 计算本节例 1中甲射手的方差
?例 1 甲、乙两射手在一次射击中的得分
(分别用 X,Y表示)的分布率如下:
?E(X)=2.1
?Var(X)=( - 1.1) 2 ? 0.4+( -0.1) 2?
0.1+0.92? 0.5
? = 0.89
X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3
三、数学期望与方差的图示
? 数学期望描述随机变量的集中程度,方差描述随机变
量的分散程度。
? 1方差同、期望变大 2期望同、方差变小
5
10
5
5
第三节 对样本的描述 ——样本分布的
数字特征
? 一、样本分布函数
? 二、样本平均数
? 三、样本方差
一、样本分布函数
? ?
? ?
? ?
数。,称它们为样本分布函本容量
的个数除以样个观察值中不超过等于样本的这里
,令排列为
按大小的一组观察值,把它们为总体设
n
xnx
x
x
n
k
x
n
x
x
F
x
xx
xx
x
F
xxx
xxx
n
n
kk
n
n
n
?
?
?
?
?
?
?
?
?
?
?
?
??
??
?
?
???
?
*
*
1
*
*
2
*
1
*
1
**
2
*
1
21
1
1
0
ξ,,,
?
?
?
样本分布函数举例
ê? oò ?? 2ì ?ü ?? X 1 0 ·? éy ?Y ?? ?á ???? ? ?? X*
X 3.2 2.5 -4 2.5 0 2 3.2 2.5 4 2
X* -4 0 2 2 2.5 2.5 2.5 3.2 3.2 4
?? D? a? ?? 2? 1ˉ éy ?£
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
??
??
???
??
?
41
42.310/9
2.3310/8
35.210/7
5.2210/4
2010/2
0410/1
40
10
x
x
x
x
x
x
x
x
xF
二、样本平均数
?总体的数字特征 ——是一个固定不变的数,称
为参数;样本的数字特征 ——是随抽样而变化
的数,是一个随机变量,称为统计量。
?定义 3.1样本平均数的定义
?样本平均数用来描述样本的平均水平(一般
Common)水平。
? ?
为样本平均数。
,称对于样本
?
?
?
n
i
i
n
x
xxx
n
x
1
21
1
,,?
三、样本方差和标准差
?定义 3.2 样本方差和标准差的定义
? ?
? ?
? ?
? ?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?? ?
? ?
? ?
?
??
?
?
xxs
xxxx
xx
xxs
xxx
n
n
n
i
i
n
s
i
n
n
i
i
n
i
i
n
i
n
i
n
i
n
2
1
22
2
1
2
1
2
1
2
1
2
2
21
1
1
1
1
1
1
,,
?
?
。来描述样本离散程度的样本方差和标准差是用
差。分别为样本方差和标准以及
,称对于样本
第四节 随机变量的分布 ——总体和样
本的连接点
?一、几种重要的分布
?二、各种分布之间的联系
?三、分布是总体和样本之间的连接点
?学习的重点应放在确定 X服从什么分布,和各
种分布的联系上。
一、几种重要的分布
? 如果一个随机变量的分布已经确定,那么这个随机变
量的一切性质对于我们便都是已知的。因为随机变量
的分布是对随机变量最完整的描述。
? 例如 X是广西十万大山中树木的高度,它的分布函数
为 F(x)=P(X<=x)。此时,你对任意给定的高度 x,都确
知不超过这个高度的树木在整个十万大山中所占的比
例,你还会说整个十万大山树木高度的情况不清楚吗?
? 再如,已知 X服从数学期望和方差已知的正态分布,那
么你便了解这个 X自身的一切性质。可以通过查正态分
布表确定研究中所需的一切数据。
? 分布的数学形式和图形属“技术问题”,精力应集中
于 X究竟属于何种分布上。
1.?分布
? ( 1) ?分布的定义
? ( 2)定理 4.1 ?分布的数学期望和方差
? ? ? ?
? ?
? ?
? ?
? ? ? ? 。这个积分收敛,且有当
。这里,分布,记作服从则称
具有密度函数如果连续型随机变量
1,0
00
0,0,0
0
1
λ1
???
??
??
?
?
?
?
?
?
???
?
?
?
?
??
??
?
??
??
dxxrr
dxr
r
x
rx
r
x
ex
ex
xr
xr
r
?
??
?
?
?
?
???? 2
rV arrE ??
2,指数分布
? ( 1)指数分布的定义
? ( 2)定理 4.2 指数分布的数学期望和方差
? ?
??
?
?
?
?
?
?
??
?
00
0
11.4
λ x
x
x
x
r
e??
:指数分布的密度函数为
分布称为指数分布,此时的中如果在定义
???? 2
11 ?? V arE
3,? 2 分布
? ( 1)定义 4.3 ? 2 分布的定义
? ( 2)定理 4.3?分布的和仍然服从 ?分布
? ?
? ?
? ?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
???
??
00
0
2
1
2
1
,
2
2
1
2
2
22
2
x
x
n
x
n
nn
n
r
ex
xn
?
?
?
?? 。密度函数为分布,记作的
个自由度分布称为具有的为正整数
? ? ? ?
? ? 分布。的,服从参数为则它们的和
,,相互独立,且若
??????
??
rrxxx
rxxx
nn
iin ni
??
??
121
1
λ
,2,1λ~,,
定理 4.3推论,? 2 分布的和仍然服从 ? 2 分布
? 若 X1,X2,……,X n相互独立,且 Xi服从
具有 ni( i=1,2,……, n) 个自由度的 ?2
分布,则它们的和 X1+X2+……+X n 服从
具有 ?ni 个自由度的 ? 2 分布。
4,正态分布
? 定义 4.4正态分布的定义
? 定理 4.4 正态分布的数学期望和方差
? 定义 4.5 标准正态分布
? ?
? ?
? ?
? ?。服从正态分布,简记为则称
为常数,、
的概率密度为若连续型随机变量
???
?
?
??
?
?
2
2
,μ~
0σμσ
2
1
2
2
N
x
x e ?
?
?
?
???? 2,?? V a rE 方差,正态分布的数学期望
? ?
? ? e
x
x
N
2
2
2
2
1
1,0~
10
?
?
??
?
?
?
? ?
。密度函数为记作
正态分布,的正态分布,称为标准,当
正态分布的标准化
?定理 4.5 正态分布标准化
? ?
? ?
布,即将其标准化。
为标准正态分任何一个正态分布,化根据以上定理,可以将
。
,那么且如果
1,0~
,,~
2
N
N
?
?
??
??? ?
?
?
5,t分布
?定义 4.6 t分布的定义
? ?
? ?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
2
1
2
2
2
1
)(
2
1
x
n
n
n
n
x
nttn
x
?
?
?
??
。分布,记作个自由度的服从具有给出,则称
由下式的分布密度函数若连续型随机变量
6,F分布
?定义 4.7 F分布的定义
? ?
? ?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
00
0
2
1
nn
2
1
n
22
2
,
ξ
ξ
n
n
1
n
n
nn
nn
nn
n
2
1
2
2
21
21
21
21
21
1
1
x
x
n
x
FF
xx
n
?
。分布,简记为的
,第二自由度为服从第一自由度为出,则称
给的分布密度函数由下式若连续型随机变量
? 2 分布的图象
N=7
N=11
概
率
x
N为自由度
t分布和正态分布
概率密度
x
标准正态分布
t-分布
0
F分布的图象
x
概率密度
二、各种分布之间的联系
? 1,一般正态分布与标准正态分布的关系
? 定理 4.6 如果 X~N( ?,?2),则( X- ?) / ?~N( 0,1)
? 2,标准正态分布与 X2分布之间的关系
? 定理 4.7 如果 X~N( 0,1),则 X2~ X2 ( 1),即服从
具有 1个自由度的分布。
? 3,标准正态分布与 t分布之间的关系
? 其密度函数见定义 4.6。
? ? ? ?
? ?。分布,即个自由度的服从具有则
,,相互独立,且和设两个随机变量定理
ntTtn
n
T
nN
~
/
~1,0~8.4
2
?
?
???? ?
?
二、各种分布之间的联系
? 4,标准正态分布(分布)与 F分布之间的关系
? 5.关于正态分布的和
? ?
? ? ? ? ? ?
。定义
分布,其密度函数见的第二自由度为第一自由度为
表示。其中则有
,相互独立,且和设两个随机变量定理
7.4
,
,,~,~
~9.4
21
2121/
/
2
2
2
1
2
121
22
11
F
FF
n
n
F
nn
nnnnn
n
?
?
??
????
?
? ?
? ?
? ? 。布,且
,也服从正态分不全为则它们的线性函数
,服从正态分布相互独立,设定理
??
??
??
?
2
1
2
1
1
2
1
0
,,,10.4
i
n
i
i
n
i
ii
i
n
i
ii
iiin
aa
axa
xxx
V a rE
N
??
?
??
?
??
?
?
二、各种分布之间的联系
? 6.关于 X2分布(参阅定理 4.3推论)
? ?
? ? ? ? ? ?。相互独立,且
与它们的离均差平方和则它们的平均数
正态分布,相互独立,都服从标准设定理
。,记作个自由度的服从具有则
正态分布,相互独立,都服从标准设定理
1~
1
,12.4
,11.4
2
1
2
1
2
1
1
22
1
22
1
?
?
?
? ?? ?
?
?
??
?
?
n
ii
n
x
nn
n
i
n
i
n
i
i
n
n
i
i
n
xxxx
x
xx
x
xx
?
???
?
?
怎样记忆上述 7个定理
? ?
? ? ? ? 相互独立。且与定理
定理
定理
定理
定理
定理
),(,定理
),样本的自由度为(注意总体的自由度为
期望和方差)的线性组合,注意数学(这里是
二自由度)(注意第一自由度和第
的自由度)还要除以自由度,也是(注意
Xn
NX
F
t
X
NX
Y
XNY
XX
X
X
X
X
X
nn
X
tX
1~12.4
~11.4
~10.4
~9.4
~8.4
~7.4
10~,~6.4
22
1
2
2
2
2
2
2
2
2
2
??
?
?
?
?
?
?
?
???
? ?
?
?
?
?
?
?
?
?
?
?
三、分布是总体和样本之间的连接点
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ? ? ? ? ?11
1
,,,
1~
1
,,,14.4
1,0~
/
,~
,,,13.4
222
2
1
2
1
2
1
2
1
2
2
2
1
1
2
2
1
2
2
2
1
2
2
1
/
??????
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
? ?
?
?
?
?
? ?
? ?
?
?
?
?
? ?
?
?
? ?
?
?
?
?
? ?
? ?
? ?
? ?
?
???
?
?
nn
i
ii
i
N
i
x
n
i
N
N
n
x
n
Nx
N
n
xx
xxxx
xx
xx
xx
xx
xx
xx
n
i
n
i
n
i
n
i
n
n
i
n
i
n
n
???
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
,且相互独立取自正态总体证明
相互独立。与
的样本,则有:是取自正态总体设定理;
的样本,则有:是取自正态总体设定理
??
?
?
三、分布是总体和样本之间的连接点
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ?1~
/
/
/1
1
2
/1/
1~
1/
8.4
1~
1
14.4
10~
/
5.4
1~
/
,,,15.4
1
1
2
1
2
2
2
1
1
2
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
? ?
nt
ns
x
ns
x
s
n
x
n
i
xx
i
n
x
xx
i
n
x
T
nt
n
T
n
i
N
n
x
nt
ns
x
Tsx
N
n
n
n
i
n
n
i
xx
xx
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
而
根据定理
根据定理
,证明根据定理
。标准差,则分别是样本的平均数和、
的样本,是取自正态总体设定理 ?
三、分布是总体和样本之间的连接点
? 这是两个相互独立总体的样本平均数差数与总体数学
期望差数之间的联系的定理。
? ? ? ?
? ?
? ? ? ?
? ?
平均数和方差。分别为两个样本各自的、、、其中
的样本,则和的正态总体
立分别是来自两个相互独和设定理
ss
nn
nnnn
snsn
yyxx
yx
t
yx
T
NN
n
n
2
2
2
1
21
2121
2
22
2
11
21
2
2
2
1
1
1
2~
11
2
11
,,
,,,,16.4
??
??
??
???
???
?
??
????
??
三、分布是总体和样本之间的连接点
? 相互独立两个总体样本方差与总体方差间联系的定理。 ? ? ? ?
? ?
方差。分别为两个样本各自的、其中
的样本,则和的正态总体
立分别是来自两个相互独和设定理
ss
nn
s
s
yyxx
FF
NN
nn
2
2
2
1
212
2
2
2
2
1
2
1
2
22
2
11
11
1,1~
/
/
,,
,,,,17.4
???
?
?
????
??
相互独立两个总体样本方差与总体方
差间联系的定理的证明
? ? ? ?
? ? ? ?
? ?
? ?
? ?
? ? ? ?
? ? ? ?
? ?1,1~
/
/
/
/
1//
1//
1,1~
1/
1/
9.4
1~/
1~/14.4
16.4
212
2
2
2
2
1
2
1
2
2
2
2
2
1
2
1
2
2
2
1
2
1
2
1
1
2
21
2
2
1
2
2
2
2
2
1
2
2
1
2
2
1
1
2
1
2
1
1
1
????
?
?
?
??
?
?
??
??
???
? ?
? ?
? ?
? ?
?
?
?
?
nn
s
s
s
s
nyy
nxx
nn
n
n
nyy
nxx
F
n
i
n
i
F
FF
n
i
n
i
i
i
i
i
?
?
?
?
?
?
?
?
???
???
而
根据定理
根据定理
证明定理
总体与样本间的联系在于具有相同的
分布
? 总体就是一个随机变量,所谓样本就是 n个相互独立的
与总体具有相同分布的随机变量 x1,……,x n,即 n元随机
变量。以上的定理就是将总体与样本间的这种联系具
体化,从而为达到通过样本的特征估计和代替总体的
特征铺平道路。
? 例如,已知一个研究对象 ?的数量特征服从 N(?,?2),那
么依据定理 4.6,首先将其标准化,然后查标准正态分
布表,就可以获得所需的信息。如果,对研究对象了
解的信息并不完备,只知其属于正态分布均值为 ?,
但未知方差,则可利用定理 4.15通过 s2代替 ?2,用 t分
布来估计未知总体的数字特征。在区间估计和假设检
验中将会广泛地利用这些定理,通过样本估计总体和
检验对总体的假设。
第五节 通过样本,估计总体(一) —
—估计量的特征
?对总体的数量特征可以提出若干估计量。所谓
估计量的特性指的是衡量一个统计量用以估计
总体参数的好坏标准。我们构造一个统计量时,
它们就应当具有这些优良性,否则就不采用他
来估计总体参数。估计量的优良性可从四个方
面进行衡量:
?一、无偏性
?二、有效性
?三、均方误最小性
?四、一致性
一、无偏性
?无偏性的直观意义:
?根据样本推得的估计值和真值可能不同,然而
如果有一系列抽样依据同一估计方法就可以得
到一系列估计值,很自然会要求这些估计的期
望值与未知参数的真值相等。这就是无偏性的
概念,无偏性的直观意义是:样本估计量的数
值在真值周围摆动,即无系统误差。
定义 5.1 无偏性的定义
。的有偏估计,其偏差为,我们称如果
具有无偏性。亦称
的无偏估计,为参数成立,我们称如果定义
θ-θ?B i asθθ?θθ?
θ?
θθ?θθ?1.5
EE
E
??
?
的概率θ?的概率θ?
?的真值 ?的真值
有偏 无偏
的概率??
的真值θ
的概率??
的真值θ
有偏估计 无偏估计
例 1 ? ? ??? 222 ??? sEnxV a rxE
? ? ? ?
? ? ? ? ? ? ? ?? ?
? ? ? ?? ? ? ?
? ? ? ? ? ?
? ? ? ? ?
?
???
???
??
??
?
?
??
??
??
?????
2
2
2
2
1
2
1
222
1 1 1
22
1
2
1
2
2
2
2
2
1
2
1
11
222
1
11
1
11
1
2
1
1
2
1
1
1
1
1
1
111
111
,,,
??
?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??????
?
?
?
?
?
?
??????
?
?
?
?
?
?
????
?? ?
? ???
? ? ? ??
? ???? ?
??
??
?
?
? ? ?
??
??
??
nn
n
n
n
E
n
n
i
E
n
nn
i
E
n
x
i
E
n
i
n
E
i
n
EE
n
nV a r
n
VxV a r
n
n
E
nn
ExE
ExEVE
xx
xxx
xxx
xxxxs
n
x
n
x
xx
sxx
n
i
n
i
n
i
n
i
n
i
i
n
i
n
i
n
i
i
n
i
i
n
i
i
n
i
i
n
证明
,试证),中取一样本从总体
(
?
两个相互独立样本的合并均值与合并方差
分别是总体均值和方差的无偏估计
? 如果从总体中抽取两个相互独立的样本,一个的容量
n1,另一个容量为 n2,可以证明合并均值与合并方差是
总体均值与方差的无偏估计。
? ?
? ? ? ?
? ? ? ?2,1
1
1
2
11
1
1
2
21
21
2
22
2
11
2
2211
21
?
?
??
??
???
?
?
?
?
? ?
?
?
?
i
n
iij
n
x
i
i
j
i
i
i
j
ij
i xx
n
s
n
x
x
nn
snsn
s
xnxn
nn
其中
合并样本方差
合并样本均值
无偏性是估计量最重要的优良性,且
参数的无偏估计量不只一个
? 无偏性是对估计量最重要的要求之一,它只能保证估计量的期望
等于真值。而且,对于总体某个待定参数,其无偏估计量不只一
个。
? 例如,可以验证
? 都是总体数学期望的无偏估计量。
? 必须指出根据计算总体方差的公式计算的样本方差不是总体方差
的无偏估计量 。
? ?
? ?
?
?
???
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
????
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
??
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
in
i
i
n
i
ii
n
i
i
a
a
a
xa
a
xa
a
a
xax
E
ExE
x
n
x
1
1
1
1
1
1
1
1
11
0和
二、有效性
?总体某个参数 ?的无偏估计量往往不只一
个,而且无偏性仅仅表明 ?^的所有可能
的取值按概率平均等于 ?,它的可能取值
可能大部分与 ?相差很大。为保证 ?^的取
值能集中于 ?附近,必须要求 ?^的方差越
小越好。所以,提出有效性标准。
有效性的定义
具有有效性。的有效估计量,亦称
称为的方差达到最小,则的一切无偏估计量中,如果在
有效的估计量。是比的方差,则称的方差小于,总有
意的样本容量的无偏估计量,若对任都是和设定义
θ?θ
θ?θ?θ
θ?θ?θ?θ?
θθ?θ?2.5
??
?
n
?的真值 ?的真值
?^的概率 ?^的概率
比较总体均值两个无偏估计的有效性
? ?
? ? ? ?
? ?
? ? ? ?xV
n
n
xV
n
n
i
i
n
i
i
xV
n
i
i
xV
ExE
n
xVxE
x
n
x
n
i
i
n
i
i
n
i
i
ji
ji
n
i
i
ji
ji
n
i
i
jiji
n
i
in
i
i
n
i
iin
i
i
n
i
in
i
i
n
i
ii
n
i
i
a
a
aaaaaaaa
aaaa
a
a
a
a
xa
a
a
a
xax
????
??????
?
??
?
?
?
??
?????
?
?
?
?
?
?
????
?
?
??????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?????
?
?
?
?
?
?
??
??
?
?
??
22
1
2
1
2
1
222
1
2
1
2
2
222
2
1
2
1
2
2
1
1
2
1
1
11
1
2
1
,2
11
1
11
0
利用不等式
(证明了无偏性)
的有效性。和比较
无偏有效估计量的意义
?( 1)一个无偏有效估计量的取值在可能
范围内最密集于 ??附近。换言之,它以最
大的概率保证估计量的取值在真值 ?附近
摆动。
?( 2)可以证明,样本均值是总体数学期
望的有效估计量。
三、均方误( Mean Square Error)
最小性
?在很多情况下,我们被迫在偏差的大小与方差
的大小(即无偏与有效性)之间作出抉择。
?有时,一个方差极小的有偏估计比一个方差极
大的无偏估计可能更为我们所追求。
?此时,估计量的均方误为我们在两者之间的权
衡提供了一个有效的尺度。
均方误和均方误最小性的定义
? ?
? ?
? ?? ?
? ? ? ? ? ?? ?
? ? ? ? ? ?? ?
? ? ? ?? ?
? ?? ? ? ? ? ? 0θ-)θ?E()θ?E(-θ?2θ-)θ?E()θ?E(-θ?2
0θ
?
θ-)θ
?
E()θ
?
E(-θ
?
2
θ
?
θ
?
2
θ
?
θ
?
θ
?
θθ
θθ
?
θθ-θ
?
Eθ
?
θ3.5
θ
?
B i as
θ-)θ
?
E()θ
?
E(-θ
?
θ-)θ
?
E()θ
?
E(-θ
?
θ-θ
?
2
22
22
2
???
?????
???
??
??
?
EEE
V a r
EEE
EEM S E
B i a sV a rM S E
M S E
?
准确度精确度
)(
)()(
:的均方误可作如下分解均方误性。估计量
具有最小即的最小均方误估计量,最小的估计量,称为
均方误的一切估计量中,使其。在均方误,记作
的称为估计量,的估计量为若参数定义
均方误最小的意义
?( 1) MSE( ——误差)分解为精确度与准确
度之和。 MSE最小就是使估计量方差与估计量
偏误之和最小,给出了进行权衡的方法(见下
图)
?( 2)如果估计量为无偏估计量 Bias=0,那么
? MSE(?^)=Var(?^)
?即误差由精确度确定。
?此时,一个具有最小 MSE的估计量一定具有无
偏性和有效性,即
? MinMSE(?^)=MinVar(?^)。
运用 MSE权衡偏差与方差
?
最小均方误(有
偏,方差极小)
无偏,方差极大
?^
?^
的
概
率
准而不精 又精又准
精而不准
不精不准
重庆长安厂 4支比赛用枪的抽样结果
一次射击就是一
次抽样。试问:
哪些是无偏估计?
哪些是有偏估计?
哪些是有效估计?
哪些是无偏有效
估计?
四、一致性
?( 1)“依概率收敛”的定义
?( 2)一致性
?( 3)一致性的意义
( 1)“依概率收敛”的定义
? ?
? ? 。依概率收敛于列
则称随机变量序有
,使对于任何若存在常数定义
a
aP
a
n
n
n
?
? ?
?
,1
,04.5
lim ???
?
??
( 2)一致性
? 一致性既是从概率又是从极限性质来定义的,因此只
有样本容量较大时才起作用。
? 一致性作为评价估计量好坏的一个标准,计量经济学
家在无偏性和一致性之间更偏重选择一致性。
? 虽然一个一致估计量可能在平均意义上与真值不同,
但是当样本容量加大时,它会变得与真值十分接近,
即有偏的一致估计量具有大样本下的无偏性。同时,
根据大数定律,当 n增大时,方差会变得很小,所以一
致估计量具有大样本下的“无偏性”和“有效性”。
? ?
具有一致性。
的一致估计量,为参数,则称,若
,即任意给定依概率收敛于时,若当定义
θ?
θθ?1θθ?0
θθ?5.5
l i m
n
???
??
??
?? -P
n
( 3)一致性的意义
?显然,一个一致估计量比一个方差很大的无偏
估计量优越得多。
?由于 MSE(?^)=Var(?^)+Bias(?^)2,所以估计量
的一致性,实际上等价于当 n=> 时,
MSE(?^)=>0,亦即 Var(?^)=>0和 Bias(?^)2 =>0,
也就是随着样本加大,?^的方差变小; ?^的 偏
差接近于 0,这就是一致性描述的情况。
?事实上一致性和 MSE( ?^) =>0(当 n=> )这
两条标准在计量经济学中往往是通用的。
?
?
N小
N大
N极大小
?
?的概率
第六节 通过样本,估计总体(二) —
—估计方法
?一、点估计
?( 1)矩法
?( 2)最大似然法
?( 3)最小二乘法
?二、区间估计
?(一)对总体期望值的估计
?(二)对总体方差的估计
?(三)关于区间估计的几点说明
一、点估计
?所谓点估计就是给出被估计参数的一个特定的
估计值。
?常用的点估计方法有四种:矩法、最大似然法、
最小二乘法和 X2法。
?这四种方法分别建立在不同的原则上。
?对同一样本根据四种方法估计同一参数,所获
得的估计结果可能互不相同。
?然而由于各种建立原则的合理性,所以四种方
法在研究中都经常使用。
( 1)矩法
?矩法是求估计量最古老的方法。具体作
法是:一样本矩作为相应总体矩的估计
量;以样本矩的函数作为相应的总体矩
同样函数的估计量。
?这种方法最常见的应用是用样本平均数
估计总体数学期望。
?矩法比较直观,求估计量时有时也比较
直接,但它求出的估计量往往不够理想。
矩法点估计的例题
? 例 1某灯泡厂某天生产了一大批灯泡,从中抽取了 0个进行寿命试
验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿
命是多少?
3é D? ?? 1? 1 2 3 4 5 6 7 8 9 10
éù ?ó £¨?? éa£? 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200
?? ê? μ? D? a? ê? é? ?? ?? éy = 1 1 4 7 £? ?e ía ?ü ?? éy D§?ú ì? μ? ?? ?? ?μ
? ?
? ?
xxx
x d xdxxdxxx
x
x
x
xx n
2
?
,
2
?
202
1111
,
0
0
1
,
,2
2
00
1
????
??
??
?
??
?
???
?
?
?
?
?
??
?
?? ?
???
??
?
?
?
?
??
???
???
?
?
???
在矩法下又
是多少?问在矩法下
其它
取自均匀分布若样本例
?
?
?
( 2)最大似然法
(Maximum Likelihood Estimation)
?1、一个重要的事实
?2、最大似然法的概念
?3、似然法函数
?4、最大似然法的定义
?5、最大似然法的三个示例
1、请注意如下事实
? 不同的总体会产生不同的样本,对于某一特定的样本,
在我等不了解产生它的母体究竟为何物的观察者眼中,
它来自一些母体的可能性要比来自另一些母体的可能
性大,即一些母体更容易产生出我们所观察到的样本。
? 举例说,假定我们抽取到( x1,x2,……,x8 )我们知道它
来自正态总体,且总体的方差是了解的,但是总体的
均值未知。如下图所示。
x6 x2 x3 x4 x5 x6 x7 x8
分布 B 分布 A
概
率
x
假定样本不是来自 B就是
来自 A。如果样本来自 B,
观察到它的可能性非常
小;真正的母体若是 A,
得到样本的可能性很大。
显然我们宁愿承认样本
来自 A。是样本“替”
我们“选择”了 A。
2、最大似然法的概念
? 上述事实诱导我们宁愿作出这样的抉择:将样本最容
易来自的总体当作产生样本的总体。
? 现在要根据从总体 ?中抽取得到的样本 (x1,……,x n)对总
体中的未知数 ?进行估计。最大似然法是选择这样的估
计量 ?^作为 ?的估计值,以便使观察结果 (x1,……,x n)出
现的可能性(概率)最大。
? 对于离散型变量,就是要选择 ?^使 p(x1)p(x2)… p(xn)最大。
(连乘 ——表示一次独立地抽取各个样本观察值)
? 对于连续型变量,就是要选择 ?^使 ?(x1)?(x2)...?(xn)最大。
注意 ?(xi)是随机变量在 xi附近取值的概率,相当于离散
型的 p(xi)。
3、似然法函数
? ?
? ?
? ?
? ? ? ?
? ? ? ?
? ? ? ??
?
?
?
?
??
?
n
i
in
ii
n
n
i
in
n
xxxx
xx
xxx
xxxx
xxx
PL
PP
L
L
L
x
xF
1
21
21
1
21
21;;,
,;
,;;,
,;
??
???
?
???
???
??
?
?
?
?
则似然函数
的概率函数为离散型随机变量,它设
为样本的似然函数。的函数,称成参数
可以看是常数,所以由于每一取定的样本值
:的联合分布分布密度是样本
的独立性,则是未知参数。由于样本,其中度函数是
,分布密的分布函数是为连续型随机变量,它设
4、最大似然法的定义
? ?
的最大似然估计。是则称
处达到最大值,在如果定义
θθ?
θ?θ;,,,1.6 21 xxx nL ?
5、最大似然法的估计方法
?为了取得 ?的最大似然估计,必须使似然函数 L
达到最大值,并且把此时的 ?^作为 ?的估计量。
由于对数函数是单增的,L达到最大亦即 LnL达
到最大。
?这样使 LnL达到最大来估计 ?为计算带来了许多
方便。
?根据微分中的拉格朗日定理,对未知参数求条
件极值,令 LnL对 ? 的一阶导数等于 0,即
dLnL/d ?=0 ==>得到似然方程,我们所求的 ?^
就是似然方程中 ?的解。
5、最大似然法示例之一
? ?
? ?
? ?
的最大似然估计。是
得解似然方程
似然函数解
的最大似然估计。的一组观察值,求是
其它
的分布为:已知随机变量例
θ
1
?
0
1
1ln1
lnln
11;,,,
θξ,,,
0
00
1;~
ξ3
11
2
1
2
1
1
1
21
21
1
x
x
n
n
n
d
Ld
nL
x
x
L
x
x
n
i
i
n
i
i
n
i
i
n
i
i
n
n
i
n
n
i
xx
xx
eexxx
xxx
e
x
n
i
i
i
i
?
???????
????????
?
???
?
?
?
?
?
??
?
??
??
?
?
?
?
??
?
?
???
?
?
?
?
?
???
?
?
?
??
?
?
?
5、最大似然法示例之二
? 例 4 某电子管的寿命服从例 3中的分布(实际上多为指
数分布)抽取一组样本,其具体数值如下:
? 根据例 3的结果,在最大似然法下,指数分布中的 ?,
应用样本平均数估计。
? ?^=(16+29+…… +800+110)=318(小时)
16 29 50 68 100 130 140 270 280
340 410 450 520 620 190 210 800 1100
5、最大似然法示例之三 ——
已知 ?~N(?,?2),以一组样本观察值估计 ?的参数
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ? ? ?
型估计时也是如此。估计量,以后对线性模
差的估计往往是有偏:最大似然估计法对方意然后解似然方程组。注
,分别对不同参数求偏导估计时,应将:当不只一个参数需要注意
解得
解
2
ln1
1
1
?
0
22
0
1
22
ln1ln
2
1
ln
22
1
ln
2
ln
1
2
1
2
1
1
2
2
1
1
2
42
1
2
1
2
422
1
2
1
2
2
2
12
12
2
1
2
?
2
2
2
2
2
2
L
i
n
n
i
nn
i
nnLL
i
nn
L
e
x
L
n
i
n
i
i
n
i
n
i
i
n
i
n
i
i
n
i
n
i
x
i
n
n
i
xx
x
x
x
xx
x
e
n
i
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
????
??
????
?
?
??
?
?
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
??
??
?
?
????
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
( 3)最小二乘法 (Least Square Estimation
Method)
?最小二乘法是计量经济学中应用最广泛
的一种估计方法。
?这是本课研究的重点问题,在以后各章
中将详尽地阐述它的原理、步骤、特性
和优越处。
?这里暂时不加以讨论。
二、区间估计
?(一)对总体期望值的估计
? 1、已知方差,对数学期望 E?进行区间估计
?( 1)方差已知,估计总体数学期望
?( 2)正态总体
?( 3)一般总体大样本下数学期望的区间估计
? 2、方差未知,对对数学期望 E?进行区间估计
?(二)对总体方差的估计
?(三)关于区间估计的几点说明
区间估计的概念
? 所谓区间估计就是以一定的可靠性给出被估计参数的
一个可能的取值范围。
? 用点估计估计参数,即使是无偏有效的估计量,也会
由于样本的随机性,使得由样本计算出的估计值并不
恰恰是真值。而且即使等于真值,由于真值未知,我
们也不能肯定这种相等。那么,究竟相差多少?于是
问题等价为:在给定可靠程度下,指出被估计参数所
在的可能值的范围,就是参数的区间估计问题。
? 具体作法是找出两个统计量 ?1(x1,…,x n)与 ?2 (x1,…,x n),
使
? P(?2 < ?< ?2 )=1-?
? (?1,?2)称为置信区间,1-?称为置信系数(置信度),
?称为冒险率(测不准的概率),一般等于 5%或 1%。
对区间估计的形象比喻
? 我们经常说某甲的成绩“大概 80分左右”,可以看成
一个区间估计问题。(某甲的成绩 ?为被估计的参数 )
? P(?2 < ? < ?2 )=大概的准确程度( 1-?)
?
? 如,P(75 < ? <85 )=95%=1-5%
―大概 80分左右”
冒险率(假设检验中
叫显著水平)
下限 上限
(一)对总体期望值的估计
?1、已知方差,对总体数学期望 E?=?进行
区间估计
( 1)方差已知分布未知,估计总
体数学期望
? 对这种情况的处理,需要用到切比雪夫不等式。
?
??
?
?
?
?
和视具体情况选择适当的高(区间长度变小),
增大估计精度提有关。、、。此外,区间长度还与是
的概率含。某一个区间可能不包)个会套住(中有
个区间次抽样计算得到的。即平均套住的可能性是
被随机区间数区间。上式的意思是常个样本都会有一个置信
一本不同而不同,对于每是一个随机变量,随样这里样本均值
n
nE
EE
n
V
x
n
V
x
E
x
n
V
xE
n
V
xp
ξnαα
ξξα11 0 0
1 0 01 0 0α1
α
,
α
ξ
1
αα
?
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
????
下限 上限
电子管寿命的置信区间
? 例 6 在本节例 1中,如果已知当天生产的电子管寿命的
方差为 8,试找出电子管寿命的置信区间( ?=5%)。
? ?
? ?
的置信区间比较粗糙。
比雪夫不等式估计的分布信息,所以根据切
量的。由于没有利用随机变,
,即的置信区间为
解:
已知
ξ
11511143
41147,41147ξ
4
8%5101147
E
n
V
Vnx
???
?
????
?
?
??
( 2)正态总体
? ? ? ?
? ?
? ?
。时,。时,
。的置信区间为置信度为因此
即
即
使确定查标准正态分布表可以对给定的
可以得到:
,由定理,来自正态总体设样本
576.205.096.105.0
,α-1μ
1
1
/
1
,,
1,0~
/
13.4μ,,
01.005.0
2
1
????
?
?
?
?
?
?
??
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
???
?
?
??
??
??
??
?
?
??
??
?
?
?
?
?
?
?
?
?
?
?
??
??
??
?
n
x
n
x
n
x
n
xP
n
x
PUP
N
n
x
U
N
xx n
?
??nσ ??nσ
58.20, 0 1α
96.10, 0 5α
64.10, 1 0α
??
??
??
?
?
?
?
?
?
?/2?/2 1-?
置信区间,
上限下限
可靠程度冒险率
??
?
??
? ?
?????
?
??
??
??
??
n
σx
n
σ-x
n
σx
n
σ-x
α1--α
x
假设总体服从正态分布 N(?,8)
求 ?的 置信区间
? 例 7 本节例 1中再假设总体服从正态分布,求电子管寿
命的置信区间( ?=5%)。
置信区间精确些。切比雪夫不等式所得的
信息,比未知分布通过显然,由于利用了分布
即
置信区间为:而
解:
75.1 1 4 825.1 1 4 5
96.1
10
22
1 1 4 796.1
10
22
1 1 4 7
1 1 4 72210
96.105.0
??
??????
????
???
?
?
?
? ?
?
xn
?
( 3)一般总体大样本下数学期望
E?的区间估计
?中心极限定理指出,在很宽的条件下,无能是
否为正态总体 ?( ?,?2),当样本容量相当大
时,也有样本平均数渐进地服从正态分布。
?一般说来,在 n>=30时,就可以把样本平均数
近似地看作服从正态分布 N(?,?2/n)。
?所以,对于大样本仍可以按正态总体进行均值
?的区间估计。
2、方差未知,对对数学期望 E?进
行区间估计
? ( 1)大样本下
? 根据中心极限定理,V ?可以用 s2代替,所以仍按已知
方差正态分布的方法进行 ?的置信区间估计。
? ( 2)小样本下
? ? ? ?
? ?
??
?
?
?
?
?
?
?
??
??
?
??
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
1
1
/
,1,
15.4)1(~
/
,,,,
22
1
tt
tt
t
xx
n
s
x
n
s
xp
ns
x
pTp
tn
nt
ns
x
T
N
n
的置信区间为:因此,
即
使分布的临界值的查具有对给定的
)(由定理
未知,令由于来自正态总体设小样本 ?
例 8 新生儿体重的置信区间
? 假设新生儿(男)的体重服从正态分布。随机抽取 12
名新生儿,测得体重如下表,试以 95%的置信度估计
新生儿(男)的平均体重。
?? 1? 1 2 3 4 5 6 7 8 9 10 11 12
?á èò ?? ?? ?? 3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 2540
? ?
3 3 0 02 8 2 0
2 0 1.2
12
3.3 7 5
3 0 5 72 0 1.2
12
3.3 7 5
3 0 5 7
9 5 %μ
3.3 7 53 0 5 7
11
1
3 0 5 7
(2 0 1.21205.0
12
1
2
)112(
??
??????
???
????
? ?
?
?
?
?
?
?
即
的置信区间是置信度为
再计算
表的图有错)
i
x
t
i
sx
n?
? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ? ? ? 2/
1
11
1
1
1~
,,,,
2
2
2
1
2
1
2
111
2
2
2
2
?
?
?
?
?
?
?
?
?
?
????
??
?
?
?
?
?
?
?
? ?
??
?
???
?
?
?
?
?
??
????
??
?
?
bZpaZpba
a
n
b
n
p
b
s
ap
bZap
n
s
Z
N
ss
xxx
n
n
时,一般取和在确定
那么,
。)来自总体设样本( ?
对总体方差的区间估计