重庆工商大学：计量经济学：chp_01_01

分类：经济格式：ppt 日期：2006年05月17日

第一章计量经济学的统计学
基础
——复习数理统计学
问题的提出
? 首先, 假定现在开始选学, 计量经济学, 课程的同学
们都已经学习过, 数理统计学, 了。即便通过了, 数
理统计, 的学分考试, 也意识到数理统计学在大学的
数学基础课教学中, 属于比较困难的一部分。况且,
同学们对, 数理统计, 的掌握可能不是很完备的。
? 其次, 大多数人对数学公式, 数学符号的健忘, 也提
醒我们在进一步讨论计量经济学内容之前, 必须对数
理统计学的基本内容进行一些温习与回顾。
解决问题的思路
? 1,恳请同学们将数理统计学的书籍拿出来进行复习。
? 2,在老师讲授的内容的同时, 加强回顾, 多思考, 多
提问。一边听课一边在教科书上进行批注, 并把教科
书上的印刷错误（忒多）改正。
? 3,恳请同学们到图书馆借阅计量经济学的参考书。计
量经济学的分类号是, F224‖,计量经济学理论基础 —
—统计学的分类号是, O212‖。
? 4,在大三下以前掌握 Windows 9x以及 Office97及其以
上的应用, 为毕业论文和大四谋业面试打下坚实的基
础。
? 4,熟悉 Internet的使用。, 逐步养成通过网络了解世界
与世界同步。
主要内容
? 第一节总体、样本和随机函数
? 第二节对总体的描述 ——随机变量的数字特征
? 第三节对样本的描述 ——样本分布的数字特征
? 第四节随机变量的分布 ——总体和样本的连接点
? 第五节通过样本，估计总体（一） ——估计量的特征
? 第六节通过样本，估计总体（二） ——估计方法
? 第七节通过样本，估计总体（三） ——假设检验
为什么要复习数理统计学
?假设同学们都已经学习过数理统计学。
?即便如此，数理统计学在大学数学教学
中，属于比较难的部分，而且是研修高
级课程必不可少的准备。
?而且许多同学或许对于大部分同学，他
们对于数学公式与数学符号的健忘，也
提醒我们有必要在展开计量经济学讨论
之前，对本课程中经常使用到的数理统
计学基本内容事先进行一些温习和回顾。
数理统计学在计量经济学中的
地位
?事实上不懂得数理统计学就不可能学习
和研究计量经济学。
?数理统计学是计量经济学的基础，它为
计量经济学提供了唯一而有效的方法。
?此外，从某种意义上来说，计量经济学
就是使数理统计学在建立经济模型中得
以应用的一门科学。
复习数理统计学必须注意
? 建议同学们将已经学过的, 西方经济学,,, 数理统
计学,,, 线性代数, 和, Windows 95,进行一次认
真地复习。
? 复习时，注重西方经济学的宏观部分，注重数理统计
学学科体系的逻辑结构分析、注重数理统计方法的阐
述、注重数理统计公式、定义和定理的内在涵义及其
相互关系，注重线性代数的求逆和相似形部分，注重
Windows 95的基本操作部分。
? 在今后的学习中，注意经济学基本理论及其应用，注
意数理统计学基础与计量经济学的联系与活用，注意
线性代数与统计量的计量与检验。
第一节总体、样本和随机函数
? 四个基本定义与数理统计学的逻辑结构
? 一、随机变量的分布
? 二、二元随机变量
? 三、独立性
? 四、随机变量函数和分布
四个基本定义与数理统计学的逻辑结
构
?总体和个体
?样本和样本容量
?随机变量
?统计量
?数理统计学的逻辑结构
总体（集合）和个体（构成集
合的元素）
? 研究对象的全体称为总体或母体，组成总体的每个基
本单位称为个体。注意：
? （ 1）按组成总体个体的多寡分为：有限总体和无限总
体；
? （ 2）总体具有同质性：每个个体具有共同的观察特征，
而与其它总体相区别；
? （ 3）度量同一对象得到的数据也构成总体，数据之间
的差异是绝对的，因为存在不可消除的随机测量误差；
? （ 4）个体表现为某个数值是随机的，但是，它们取得
某个数值的机会是不同的，即它们按一定的规律取值，
即它们的取值与确定的概率相对应。
样本和样本容量
?总体中抽出若干个个体组成的集体称为
样本。样本中包含的个体的个数称为样
本的容量，又称为样本的大小。
?注意：抽样是按随机原则选取的，即总
体中每个个体有同样的机会被选入样本。
随机变量
? 根据概率不同而取不同数值的变量称为随机变量
（ Random Variable）。
? 注意：
? （ 1）一个随机变量具有下列特性,RV可以取许多不
同的数值，取这些数值的概率为 p,p满足,0<=p<=1。
? （ 2）随机变量以一定的概率取到各种可能值，按其取
值情况随机变量可分为两类：离散型随机变量和连续
型随机变量。离散型随机变量的取值最多可列多个；
连续型随机变量的取值充满整个数轴或者某个区间。
? （ 3）本书中，随机变量用 x,y,?,?等符号表示
离散型随机变量与连续型随机
变量
10 20 30 40 50
1.0
概
率
概
率
x x
1.0
离散型随机变量连续型随机变量
总体与随机变量的关系
? 表示总体状况的数量特征，在总体中是参差不齐的，
往往以一定的概率取不同的数值，显然对于这样的数
值我们采用一般的变量是无法加以描述的。但是。可
以采用一种特殊的变量来表示它们。这个特殊变量就
是随机变量。因为，根据随机变量的定义，随机变量
以一定的概率取许多不同的值，而且概率 p满足：
0<=p<=1。例如，一批灯泡的寿命可以取许多不同的数
值，每个灯泡的取值不一定完全相同，但它们是按一
定概率进行分布的，但它们却是以一定的概率取某个
寿命值。由此看来，随机变量并不是一个随便变的量。
? 由于我们主要研究总体的数量特征，可以直接用随机
变量来表示所研究的总体。
总体、随机变量、样本间的联系
?总体就是一个随机变量，所谓样本就是 n
个（样本容量 n）相互独立且与总体有相
同分布的随机变量 x1,……, xn。
?每一次具体抽样所得的数据，就是 n元随
机变量的一个观察值，记为（ X1,……,
Xn）。
?通过总体的分布可以把总体和样本连接
起来。
从两个角度来描述总体（随机
变量）中个体的取值
?（ 1）动态 ——概率 ——随机地选取一个个体
取某个具体数值的可能性；
?（ 2）静态 ——分布 ——个体取某个数值，从
全局来看这个具体的数值（可能不只一个个体
取这同一个数值）出现的次数占全体个体个数
的比例，形象地说就是这个具体的数值在数轴
的这个位置上分布了多少。
?分布也好、概率也好它们在度量上是一致的。
?这只是就离散型随机变量的通俗示意。
总体分布是总体和样本的连接点
? 所谓分布，它是从全局而言的。通俗地说，分布就是
某个对象在什么地方，堆积了多少。
? 任何一个随机变量都有自己的分布，这个什么地方就
是在数轴上取什么值，堆积多少就是在那里占有的比
例是多少或者概率有多大。
? 总体可以表示为随机变量，并具有自身的分布。
? 样本则是相互独立与总体具有相同分布的 n元随机变量。
因此，总体分布是总体和样本的连接点。从而，可以
通过对样本特征的研究达到对总体进行研究的目的。
因为它们具有相同的分布。
? 须知，如果对于一个随机变量完全掌握了它的分布规
律，就完全明白无误了。
为什么样本是与所来自的总体
具有相同的分布的随机变量
? 因为样本具有二重性：
? 一是指某一次具体的抽样的具体的数值（ X1,……,
Xn）；
? 二是指一次抽样的可能结果，它的每一次观察都是随
机地从总体中（每一个个体有同样的机会被选入）抽
取一个，所以它是一组随机变量（ x1,x2,……, xn）
? 而且，每一次抽样都来自同一总体（分布），也就是
每一次抽样都带来了与总体一样的分布信息。所以，
样本与所来自的总体分布相同。
? 由于总体分布完整的描述了总体的信息，有时我们也
直呼总体为分布，不加区别地使用总体或分布。
统计量
? 设（ x1,x2,……, xn）为一组样本观察值，函数 f
（ x1,x2,……, xn ）若不含有未知参数，则称为统
计量。
? 统计量一般是连续函数。由于样本是随机变量，因而
它的函数也是随机变量，所以，统计量也是随机变量。
? 统计量一般用它来提取或压榨由样本带来的总体信息。
? ?
就是统计量。样本方差
1
1
2
2
?
?
? ?
?
n
i
n
i
xx
s
样本与总体之间的关系
?样本是总体的一部分，是对
?总体随机抽样后得到的集合。
?对观察者而言，总体是不
?了解的，了解的只是样本
?的具体情况。我们所要做
?的就是通过对这些具体样
?本的情况的研究，来推知整
?个总体的情况。
……
Xn+1
Xn
…
X1 样本
总体
数理统计学的逻辑结构
? （ 1）总体和样本
? 引入一个随机变量来描述总体
? （ 2）对总体的描述：随机变量的数字特征
? （ 3）对样本的描述：样本分布的数字特征
? （ 4）总体与样本的连接点：随机变量的分布
? （ 5）如何用样本的数字特征估计总体的数字特征及数
据生成过程中的各种参数
– a 估计量的优良性
– b 估计方法
– c 对估计量的检验 ——假设检验
? ? ? ?xV arxE xx ?? ?? 2方差数学期望
，描述样本的离散程度样本方差，描述样本的一般水平样本平均数 sX 2
a 估计量的优良性
?1、无偏性
?2、有效性
?3、均方误最小
?4、一致性
b 估计方法
?
?
?
?
?
?
?
矩法
最大似然法
最小二乘法
最小卡平方法总体分布未知
正态总体
一般总体（大样）已知方差
方差未知一般总体（大样）
正态总体
估计期
望
单个总体
两个总体估计方差（常用小样本下，正态总体估计
其它参数）
点估计
区间估计
c 对估计量的检验 ——假设检验
? 1.对总体分布特征的假设检验
? （ 1）一个正态总体的假设检验
– a 检验均值：已知方差和未知方差
– b 检验方差：未知均值（双尾和单尾）
? （ 2）两个正态总体的假设检验
– a 检验均值：未知方差但可假设其相等
– b 检验方差：未知均值（双尾和单尾）
? （ 3）总体分布的假设检验
– a 总体为离散型分布
– b 总体为连续型分布
? 2.对各种系数、参数估计值的假设检验
一、随机变量的分布
（一）离散型随机变量的分布
? 定义：如果随机变量 ?只取有限个或可列多个可能值，
而且 ?以确定的概率取这些值，则称 ?为离散型随机变
量。
? 通常用分布列表示离散型随机变量：
? ?的概率分布也可用一系列等式表示：
? P（ ? =xi） =pi （ i=1,2,…… ）称为 ?的概率函数。
注意这里 xi只出现一次。
? 显然满足概率的定义：
? 离散型随机变量的分布就是指它的分布列或概率函数。
??
??
?
?
??
?
?
?1
1
10
i i
i
p
p
X x1 x2 … …,, xi … …,,
p p1 p2 … …,, pi … …,,
离散型随机变量举例 1
?例 1 一批产品的废品率为 5%，从中任取一个进
行检验，以随机变量来描述这一试验并写出的
分布。
?以 X=0表示“产品为合格产品”,X=1表示
“产品为废品”，那么分布列如下：
?其概率函数 p（ X=0） =0.95,p（ X=1） =0.05，
或
? p（ X=i） =（ 0.05） i（ 0.95） 1-i （ i = 0,1）
X 0 ￡¨1? ·? ??￡? 1 ￡¨?? ??￡?
P 0.95 0.05
离散型随机变量举例 2
?用随机变量 X描述掷一颗骰子的试验。
?分布的概率函数为：
?P（ X=i） = 1/6（ i=1,2,3,4,5,6）
X 1 2 3 4 5 6
P 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6 1 / 6
（二）随机变量的分布函数
? 定义：若 X是一个随机变量（可以是离散的，也可以是
非离散的），对任何实数 x，令 F（ x） =P（ X<=x），
称 F（ x）为随机变量 X的分布函数。
? F（ x），即事件,X<=x‖的概率，是一个实函数。
? 对任意实数 x1<x2，有
? P（ x1<X<x2） =P（ X<=x2） - P（ X<=x1） =F（ x2） - F（ x1）
? 由此可知，若已知 X的分布函数，就知道 X在任何区间
上取值的概率。所以，分布函数完整的描述了随机变
量的变化情况。
x2x2
f(x)F(x)
X
x1x1
分布函数 F（ x）的性质
? ? ? ?
? ?
? ? ? ?
? ? ? ?
? ?
? ? ?
?
???
???
?
????
????
???????
x
i
x
x
x
xF
xF
xFF
xFF
xF
xFx
i
p足关系：分布函数与概率函数满
。。且在间断点上右连续至多有可列多个间断点）（
）（
为不减函数）（
，）对一切（
4
1
03
2
10,1
l i m
l i m
分布函数举例
?例 3 求例 1中的分布函数
?例 4 求例 2中的分布函数
? ? ? ?
??
?
?
?
?
??
?
??
11
1095.0
00
x
x
x
xXPxF
? ? ? ?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
??
??
?
???
61
656/5
546/4
436/3
326/2
216/1
10
x
x
x
x
x
x
x
xXPxF
0 1
F(x)
x
? ? ?
?
?
xx i ip
xF
（三）连续型随机变量的分布
? 定义：对于任何实数 x，如果随机变量 X的分布函数
? F（ x）可以写成
? 概率分布密度函数的性质：
? ? ? ?
? ? ? ?
? ?。常写成概率分布密度函数，也
的为为连续型随机变量，称，则称其中
xX
XxXx
dttxF
x
?
??
?
~
0?
? ?
??
? ?
? ?
? ? ? ? ? ?
? ? ? ?。有
的连续点上，，并且在显然
）（
）（
xxF
xdxxbXaP
dxx
x
b
a
?
??
?
?
??
???
?
?
?
?
??
??
12
01
为什么 ?(x)称为概率分布密度函数
? ? ? ?
? ?
? ? ? ?
? ?
? ?
? ?
的概率大小。
附近取值在能够反映分布的密集程度。但是
点概率在值的概率，而是取不是表明
xXx
xXxXx
x
xxXxP
x
xFxxF
x
xxF
x
x
?
?
?
?
?
????
?
?
???
??
??
??
??
lim
lim
0
0
?
连续型随机变量分布函数举例
? ?
? ? ? ?
? ? ? ?
? ? ? ?
? ?
?
?
?
?
?
?
??
?
?
?
??
?
?
??
????
?
?
? ??
?
?
??
??
??
??
??
??
bx
bxa
ab
ax
ax
xF
dttxF
ab
abdxdxx
xFbaX
bxa
x
X
x
1
0
1
1
,
0
5
??
???
?
?
又因为
解
。上的均匀分布。试求服从区间则称
其它
有密度函数若例
?
a x b
a x b
?
F(x)
?(x)
（四）分布函数、概率函数、
密度函数三者的关系
?分布函数既适用于离散型也适用于连续型，是
描述各种类型随机变量最一般的共同形式。但
是，它不够直观。
?概率函数对于离散型的描述很直观。
?概率密度函数的大小能够反映 X在 x附近取值的
概率的大小，从而比分布函数更直观。
?所以，在实际应用中我们分别用概率函数和密
度函数对离散型和连续型随机变量进行描述。
二、二元随机变量
? n元随机变量的定义：每次试验同时处理 n个随机变量
（ X1,X2,……, Xn），它们的取值随试验的进行而
变化。如果对任何一组实数（ x1,x2,……, xn），事
件,X1?x1,X2?x2,……, Xn?xn‖有着确定的概率，
则称 n个随机变量（ X1,X2,……, Xn）总体为一个 n
元随机变量。
? n元随机变量分布函数的定义,n元函数
? F（ x1,x2,……, xn ） = P(X1?x1,X2?x2,……, Xn?xn)
? （ x1,x2,……, xn）属 Rn，为 n元随机变量分布函数。
? 离散二元随机变量的定义：如果二元随机变量（ X,Y）
所有可能取值为有限或可列多个，并且以确定的概率
取各个不同数值，则称（ X,Y）为二元随机变量。
(X,Y)的联合分布表和联合分布函数
? (X,Y)为离散型的二元随机变量，通常用联合分布函
数与联合分布表表示。
( X,Y ) μ? ·? áé ?? 2? aí
X Y y1 y2 …… yj …… X μ? a? ?é ?? 2?
x1 p11 p12 …… p1j …… p1.
x2 p21 p22 …… p2j …… p2.
…… …… …… …… …… …… ……
xi pi 1 pi 2 pi j pi,
…… …… …… …… …… …… ……
Y μ? a? ?é ?? 2? p.1 p.2 …… p.j …… 1
3? p( X =x i,Y =y j ) =pi j ( i,j =1,2,…,.) ía ( X,Y ) μ? ·? áé ?? 2?
è? é? ?2 3? ía ( X,Y ) μ? àa 1? ?? 2? ?￡
离散二元分布函数的示例
? 例 6 同一品种的 5个产品中，有 2个正品,3个次品，每
次从中抽取一个进行质量检查，不放回的抽取，连续
两次。令,Xi=0‖表示第 i次抽取到正品，而,Xi=1‖表
示第 i次抽取到次品，写出 (X1,X2)的分布。
? 解 p(X1=0,X2=0)= p(X1=0)P(X2=0)=(2/5)(1/4)=1/10
? p(X1=0,X2=1)=p(X1=0)P(X2=1)=(2/5)(3/4)=3/10
? p(X1=1,X2=0)=p(X1=1)P(X2=0)=(3/5)(2/4)=3/10
? p(X1=1,X2=1)=p(X1=1)P(X2=1)=(3/5)(2/4)=3/10
( X 1,X 2) μ? ·? áé ?? 2? aí
X 1 X 2 0 1 X1 a? ?é ?? 2?
0 1/ 10 3/ 10 2/ 5
1 3/ 10 3/ 10 3/ 5
X2 a? ?é ?? 2? 2/ 5 3/ 5 1
连续二元随机变量的定义
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
?????
??
?
?
?
??
??
??
??
?? ??
b
a
d
c
x y
d xd yyxdYcbXap
dcba
d s d tts
yxyx
yx
YX
yxYX
d s d ttsyxF
yxyxFYX
yx
,,
,,
1,2
0,,1
,
,),(
,,
,),(,
,
?
?
?
?
?
?
?
有显然，对于任意实数
）（
，）对于一切实数（
的性质：
的联合密度函数。与为
称。是二元连续型随机变量则称
都有：，对于任意实数的分布函数
，使得二元变量如果存在一个非负函数
三、独立性
?（一）事件的独立性
?（二）随机变量的独立性
（一）事件的独立性
?定义 1.12事件的独立性的定义
?如果事件 A发生的可能性不受事件 B发生与否
的的影响，即 P(A/B)=P(A)，则称事件 A对于事
件 B独立。
?显然，若事件 A对于事件 B独立，事件 B对于事
件 A也一定独立，我们称事件 A与事件 B相互独
立。
? A与 B独立的充分必要条件是：
? P（ AB） =P（ A） P（ B）
（二）随机变量的独立性
?定义 1.13随机变量相互独立的定义
? 对于任何实数 x,y，如果二元随机变量 (X,Y)
的联合分布函数 F(x,y)等于 X和 Y的边际分布的
乘积，即
? F(x,y) = FX(x), FY(y)
?则称 X与 Y相互独立。
?定义 1.14边际分布的定义
?离散型二元随机变量 (X,Y)中，分量 X（或 Y）
的概率分布称为 (X,Y)的关于 X（或 Y）的边际
分布，边际分布又称边缘分布。
四、随机变量函数的概念和分布
? 定义 1.15 随机变量函数的定义
? 设 f(x)是定义在随机变量 X的一切可能取值集合上
的函数。如果对于 X的每一个可能值 x，都有另一个随
机变量 Y的取值 y=f(x)与之相对应，则称 Y为 X的函数，
记作 Y=f(X)。
? 我们常常遇到一些随机变量，它们的分布往往难
于直接得到（例如滚珠体积的测量值等），但与它们
有关系的另一个随机变量的分布却是容易知道的（如
滚珠直径的测量值）。因此，就要研究两个随机变量
之间的关系，然后通过它们之间的关系，由已知随机
变量的分布求出与之有关的其它随机变量的分布。其
间的关系通常用函数关系表示。
第二节对总体的描述 ——随机变量的
数字特征
?一、数学期望
?二、方差
?三、数学期望与方差的图示
一、数学期望
?研究数字特征的必要性
?两个最重要的数字特征
?（ 1）数学期望
?（ 2）方差
研究数字特征的必要性
? 总体就是一个随机变量。对总体的描述就是对随机变
量的描述。随机变量的分布就是对随机变量最完整的
描述。但是，
? （ 1）求出总体的分布往往不是一件容易的事情；
? （ 2）而且，在很多情况下，我们并不需要全面考察随机变量的变
化情况，只需要了解总体的一些综合指标。一般说来，常常需要
了解总体的一般水平和它的离散程度；
? （ 3）如果了解总体的一般水平和离散程度，就已经对总体有了粗
略的了解了；
? （ 4）在很多情况下，了解这两个数字特征还是深入求出总体分布
的基础和关键。
? 由此看来，研究随机变量的数字特征是十分必要的。
数学期望的定义
? 定义 2.1离散型随机变量数学期望的定义
? 假定有一个离散型随机变量 X有 n个不同的可能取值
x1,x2,……,x n，而 p1,p2,……,p n是 X取这些值相应的概率，
则这个随机变量 X的数学期望定义如下：
? 数学期望描述的是随机变量（总体）的一般水平。
? 定义 2.2连续型随机变量数学期望的定义
? ?
? ? ? ? ? ? 的数学期望。称为绝对收敛，则
，若积分有分布密度函数若连续型随机变量
XdxxxxEdxxx
xX
?? ???????? ? ??
?
? ?
? ? 平均数。的所有可能取值的加权是随机变量实际上,XXE
xE
n
i
iinn xpxpxpxp ?
?
?????
1
2211 ?
女儿期待父亲钓多少鱼回家？
?数学期望是最容易发生的，因而是可以
期待的。它反映数据集中的趋势。
éy à? ·? áé
1 0.1 0.1
2 0.1 0.2
3 0.4 1.2
4 0.2 0.8
5 0.2 1
3.3
· ??μ? ò? μ? éó Dé
éy D§?ú ì?
数学期望的性质
?（ 1）如果 a,b为常数，则
? E(aX+b)=aE(X)+b
?（ 2）如果 X,Y为两个随机变量，则
? E(X+Y)=E(X)+E(Y)
?（ 3）如果 g(x)和 f(x)分别为 X的两个函数，则
? E[g(X)+f(X)]=E[g(X)]+E[f(X)]
?（ 4）如果 X,Y是两个独立的随机变量，则
? E(X.Y)=E(X).E(Y)
求离散型随机变量数学期望举例
? 例 1 甲、乙两射手在一次射击中的得分（分别用 X,Y表示）的分
布率如下：
? 试比较两射手的射击技术水平，并计算如果二人各发一弹，他们
得分和的估计值。
? 解 EX=1?0.4+2 ? 0.1+3 ? 0.5=2.1
? EY=1 ? 0.1+2 ? 0.6+3 ? 0.3=2.2
? E(X+Y)=2.1+2.2=4.3
? EX<EY 乙射手射击水平比较高
? 二人各发一弹，得分总和最可能在 4.3分左右（即 4分或 5分）
X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3
二、方差
? 定义 2.4 离均差的定义
? 如果随机变量 X的数学期望 E(X)存在，称
? [X-E(X) ]为随机变量 X的离均差。显然，随机变量离均
差的数学期望是 0，即
? E [ X-E(X) ] = 0
? 定义 2.3 连续型随机变量的方差
? 定义 2.5 随机变量离均差平方的数学期望，叫随机变量
的方差，记作 Var(x),或 D(x)。方差的算术平方根叫标
准差。
? ? ? ?? ? ? ? dxxXV
XX
xEx ?? ?????? 2
的方差以下式给出：为连续型随机变量，则若
? ? ? ? ? ?? ? ? ??? xEExV a rxV xxExx ?? ???? 222
方差的意义
?（ 1）离均差和方差都是用来描述离散程度的，
即描述 X对于它的期望的偏离程度，这种偏差
越大，表明变量的取值越分散。
?（ 2）一般情况下，我们采用方差来描述离散
程度。因为离均差的和为 0，无法体现随机变
量的总离散程度。事实上正偏差大亦或负偏差
大，同样是离散程度大。方差中由于有平方，
从而消除了正负号的影响，并易于加总，也易
于强调大的偏离程度的突出作用。
方差的性质
?（ 1） Var(c )=0
?（ 2） Var(c+x)=Var(x )
?（ 3） Var(cx)=c2Var(x)
?（ 4） x,y为相互独立的随机变量，则
? Var(x+y)=Var(x )+Var(y )=Var(x-y)
?（ 5） Var(a+bx)=b2Var(x)
?（ 6） a,b为常数,x,y为两个相互独立的随机变
量，则 (ax+by)=a2Var(x)+b2Var(y)
?（ 7） Var(x)=E(x2)-(E(x))2
例 2 计算本节例 1中甲射手的方差
?例 1 甲、乙两射手在一次射击中的得分
（分别用 X,Y表示）的分布率如下：
?E(X)=2.1
?Var(X)=（ - 1.1） 2 ? 0.4+（ -0.1） 2?
0.1+0.92? 0.5
? = 0.89
X 1 2 3
P 0.4 0.1 0.5
Y 1 2 3
P 0.1 0.6 0.3
三、数学期望与方差的图示
? 数学期望描述随机变量的集中程度，方差描述随机变
量的分散程度。
? 1方差同、期望变大 2期望同、方差变小
5
10
5
5
第三节对样本的描述 ——样本分布的
数字特征
? 一、样本分布函数
? 二、样本平均数
? 三、样本方差
一、样本分布函数
? ?
? ?
? ?
数。，称它们为样本分布函本容量
的个数除以样个观察值中不超过等于样本的这里
，令排列为
按大小的一组观察值，把它们为总体设
n
xnx
x
x
n
k
x
n
x
x
F
x
xx
xx
x
F
xxx
xxx
n
n
kk
n
n
n
?
?
?
?
?
?
?
?
?
?
?
?
??
??
?
?
???
?
*
*
1
*
*
2
*
1
*
1
**
2
*
1
21
1
1
0
ξ,,,
?
?
?
样本分布函数举例
ê? oò ?? 2ì ?ü ?? X 1 0 ·? éy ?Y ?? ?á ???? ? ?? X*
X 3.2 2.5 -4 2.5 0 2 3.2 2.5 4 2
X* -4 0 2 2 2.5 2.5 2.5 3.2 3.2 4
?? D? a? ?? 2? 1ˉ éy ?￡
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
??
??
??
??
???
??
?
41
42.310/9
2.3310/8
35.210/7
5.2210/4
2010/2
0410/1
40
10
x
x
x
x
x
x
x
x
xF
二、样本平均数
?总体的数字特征 ——是一个固定不变的数，称
为参数；样本的数字特征 ——是随抽样而变化
的数，是一个随机变量，称为统计量。
?定义 3.1样本平均数的定义
?样本平均数用来描述样本的平均水平（一般
Common）水平。
? ?
为样本平均数。
，称对于样本
?
?
?
n
i
i
n
x
xxx
n
x
1
21
1
,,?
三、样本方差和标准差
?定义 3.2 样本方差和标准差的定义
? ?
? ?
? ?
? ?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?? ?
? ?
? ?
?
??
?
?
xxs
xxxx
xx
xxs
xxx
n
n
n
i
i
n
s
i
n
n
i
i
n
i
i
n
i
n
i
n
i
n
2
1
22
2
1
2
1
2
1
2
1
2
2
21
1
1
1
1
1
1
,,
?
?
。来描述样本离散程度的样本方差和标准差是用
差。分别为样本方差和标准以及
，称对于样本
第四节随机变量的分布 ——总体和样
本的连接点
?一、几种重要的分布
?二、各种分布之间的联系
?三、分布是总体和样本之间的连接点
?学习的重点应放在确定 X服从什么分布，和各
种分布的联系上。
一、几种重要的分布
? 如果一个随机变量的分布已经确定，那么这个随机变
量的一切性质对于我们便都是已知的。因为随机变量
的分布是对随机变量最完整的描述。
? 例如 X是广西十万大山中树木的高度,它的分布函数
为 F(x)=P(X<=x)。此时，你对任意给定的高度 x，都确
知不超过这个高度的树木在整个十万大山中所占的比
例，你还会说整个十万大山树木高度的情况不清楚吗？
? 再如，已知 X服从数学期望和方差已知的正态分布，那
么你便了解这个 X自身的一切性质。可以通过查正态分
布表确定研究中所需的一切数据。
? 分布的数学形式和图形属“技术问题”，精力应集中
于 X究竟属于何种分布上。
1.?分布
? （ 1） ?分布的定义
? （ 2）定理 4.1 ?分布的数学期望和方差
? ? ? ?
? ?
? ?
? ?
? ? ? ? 。这个积分收敛，且有当
。这里，分布，记作服从则称
具有密度函数如果连续型随机变量
1,0
00
0,0,0
0
1
λ1
???
??
??
?
?
?
?
?
?
???
?
?
?
?
??
??
?
??
??
dxxrr
dxr
r
x
rx
r
x
ex
ex
xr
xr
r
?
??
?
?
?
?
???? 2
rV arrE ??
2,指数分布
? （ 1）指数分布的定义
? （ 2）定理 4.2 指数分布的数学期望和方差
? ?
??
?
?
?
?
?
?
??
?
00
0
11.4
λ x
x
x
x
r
e??
：指数分布的密度函数为
分布称为指数分布，此时的中如果在定义
???? 2
11 ?? V arE
3,? 2 分布
? （ 1）定义 4.3 ? 2 分布的定义
? （ 2）定理 4.3?分布的和仍然服从 ?分布
? ?
? ?
? ?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
??
???
??
00
0
2
1
2
1
,
2
2
1
2
2
22
2
x
x
n
x
n
nn
n
r
ex
xn
?
?
?
?? 。密度函数为分布，记作的
个自由度分布称为具有的为正整数
? ? ? ?
? ? 分布。的，服从参数为则它们的和
，，相互独立，且若
??????
??
rrxxx
rxxx
nn
iin ni
??
??
121
1
λ
,2,1λ~,,
定理 4.3推论,? 2 分布的和仍然服从 ? 2 分布
? 若 X1,X2,……,X n相互独立，且 Xi服从
具有 ni（ i=1,2,……, n）个自由度的 ?2
分布，则它们的和 X1+X2+……+X n 服从
具有 ?ni 个自由度的 ? 2 分布。
4,正态分布
? 定义 4.4正态分布的定义
? 定理 4.4 正态分布的数学期望和方差
? 定义 4.5 标准正态分布
? ?
? ?
? ?
? ?。服从正态分布，简记为则称
为常数，、
的概率密度为若连续型随机变量
???
?
?
??
?
?
2
2
,μ~
0σμσ
2
1
2
2
N
x
x e ?
?
?
?
???? 2,?? V a rE 方差，正态分布的数学期望
? ?
? ? e
x
x
N
2
2
2
2
1
1,0~
10
?
?
??
?
?
?
? ?
。密度函数为记作
正态分布，的正态分布，称为标准，当
正态分布的标准化
?定理 4.5 正态分布标准化
? ?
? ?
布，即将其标准化。
为标准正态分任何一个正态分布，化根据以上定理，可以将
。
，那么且如果
1,0~
,,~
2
N
N
?
?
??
??? ?
?
?
5,t分布
?定义 4.6 t分布的定义
? ?
? ?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
2
1
2
2
2
1
)(
2
1
x
n
n
n
n
x
nttn
x
?
?
?
??
。分布，记作个自由度的服从具有给出，则称
由下式的分布密度函数若连续型随机变量
6,F分布
?定义 4.7 F分布的定义
? ?
? ?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
00
0
2
1
nn
2
1
n
22
2
,
ξ
ξ
n
n
1
n
n
nn
nn
nn
n
2
1
2
2
21
21
21
21
21
1
1
x
x
n
x
FF
xx
n
?
。分布，简记为的
，第二自由度为服从第一自由度为出，则称
给的分布密度函数由下式若连续型随机变量
? 2 分布的图象
N=7
N=11
概
率
x
N为自由度
t分布和正态分布
概率密度
x
标准正态分布
t-分布
0
F分布的图象
x
概率密度
二、各种分布之间的联系
? 1,一般正态分布与标准正态分布的关系
? 定理 4.6 如果 X~N（ ?,?2），则（ X- ?） / ?~N（ 0,1）
? 2,标准正态分布与 X2分布之间的关系
? 定理 4.7 如果 X~N（ 0,1），则 X2~ X2 （ 1），即服从
具有 1个自由度的分布。
? 3,标准正态分布与 t分布之间的关系
? 其密度函数见定义 4.6。
? ? ? ?
? ?。分布，即个自由度的服从具有则
，，相互独立，且和设两个随机变量定理
ntTtn
n
T
nN
~
/
~1,0~8.4
2
?
?
???? ?
?
二、各种分布之间的联系
? 4,标准正态分布（分布）与 F分布之间的关系
? 5.关于正态分布的和
? ?
? ? ? ? ? ?
。定义
分布，其密度函数见的第二自由度为第一自由度为
表示。其中则有
，相互独立，且和设两个随机变量定理
7.4
,
,,~,~
~9.4
21
2121/
/
2
2
2
1
2
121
22
11
F
FF
n
n
F
nn
nnnnn
n
?
?
??
????
?
? ?
? ?
? ? 。布，且
，也服从正态分不全为则它们的线性函数
，服从正态分布相互独立，设定理
??
??
??
?
2
1
2
1
1
2
1
0
,,,10.4
i
n
i
i
n
i
ii
i
n
i
ii
iiin
aa
axa
xxx
V a rE
N
??
?
??
?
??
?
?
二、各种分布之间的联系
? 6.关于 X2分布（参阅定理 4.3推论）
? ?
? ? ? ? ? ?。相互独立，且
与它们的离均差平方和则它们的平均数
正态分布，相互独立，都服从标准设定理
。，记作个自由度的服从具有则
正态分布，相互独立，都服从标准设定理
1~
1
,12.4
,11.4
2
1
2
1
2
1
1
22
1
22
1
?
?
?
? ?? ?
?
?
??
?
?
n
ii
n
x
nn
n
i
n
i
n
i
i
n
n
i
i
n
xxxx
x
xx
x
xx
?
???
?
?
怎样记忆上述 7个定理
? ?
? ? ? ? 相互独立。且与定理
定理
定理
定理
定理
定理
），（，定理
），样本的自由度为（注意总体的自由度为
期望和方差）的线性组合，注意数学（这里是
二自由度）（注意第一自由度和第
的自由度）还要除以自由度，也是（注意
Xn
NX
F
t
X
NX
Y
XNY
XX
X
X
X
X
X
nn
X
tX
1~12.4
~11.4
~10.4
~9.4
~8.4
~7.4
10~,~6.4
22
1
2
2
2
2
2
2
2
2
2
??
?
?
?
?
?
?
?
???
? ?
?
?
?
?
?
?
?
?
?
?
三、分布是总体和样本之间的连接点
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ? ? ? ? ?11
1
,,,
1~
1
,,,14.4
1,0~
/
,~
,,,13.4
222
2
1
2
1
2
1
2
1
2
2
2
1
1
2
2
1
2
2
2
1
2
2
1
/
??????
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
? ?
?
?
?
?
? ?
? ?
?
?
?
?
? ?
?
?
? ?
?
?
?
?
? ?
? ?
? ?
? ?
?
???
?
?
nn
i
ii
i
N
i
x
n
i
N
N
n
x
n
Nx
N
n
xx
xxxx
xx
xx
xx
xx
xx
xx
n
i
n
i
n
i
n
i
n
n
i
n
i
n
n
???
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
，且相互独立取自正态总体证明
相互独立。与
的样本，则有：是取自正态总体设定理；
的样本，则有：是取自正态总体设定理
??
?
?
三、分布是总体和样本之间的连接点
? ?
? ?
? ?
? ? ? ?
? ?
? ?
? ?
? ?1~
/
/
/1
1
2
/1/
1~
1/
8.4
1~
1
14.4
10~
/
5.4
1~
/
,,,15.4
1
1
2
1
2
2
2
1
1
2
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
?
?
? ?
nt
ns
x
ns
x
s
n
x
n
i
xx
i
n
x
xx
i
n
x
T
nt
n
T
n
i
N
n
x
nt
ns
x
Tsx
N
n
n
n
i
n
n
i
xx
xx
?
?
??
?
?
?
?
?
?
?
?
?
?
?
?
?
?
而
根据定理
根据定理
，证明根据定理
。标准差，则分别是样本的平均数和、
的样本，是取自正态总体设定理 ?
三、分布是总体和样本之间的连接点
? 这是两个相互独立总体的样本平均数差数与总体数学
期望差数之间的联系的定理。
? ? ? ?
? ?
? ? ? ?
? ?
平均数和方差。分别为两个样本各自的、、、其中
的样本，则和的正态总体
立分别是来自两个相互独和设定理
ss
nn
nnnn
snsn
yyxx
yx
t
yx
T
NN
n
n
2
2
2
1
21
2121
2
22
2
11
21
2
2
2
1
1
1
2~
11
2
11
,,
,,,,16.4
??
??
??
???
???
?
??
????
??
三、分布是总体和样本之间的连接点
? 相互独立两个总体样本方差与总体方差间联系的定理。 ? ? ? ?
? ?
方差。分别为两个样本各自的、其中
的样本，则和的正态总体
立分别是来自两个相互独和设定理
ss
nn
s
s
yyxx
FF
NN
nn
2
2
2
1
212
2
2
2
2
1
2
1
2
22
2
11
11
1,1~
/
/
,,
,,,,17.4
???
?
?
????
??
相互独立两个总体样本方差与总体方
差间联系的定理的证明
? ? ? ?
? ? ? ?
? ?
? ?
? ?
? ? ? ?
? ? ? ?
? ?1,1~
/
/
/
/
1//
1//
1,1~
1/
1/
9.4
1~/
1~/14.4
16.4
212
2
2
2
2
1
2
1
2
2
2
2
2
1
2
1
2
2
2
1
2
1
2
1
1
2
21
2
2
1
2
2
2
2
2
1
2
2
1
2
2
1
1
2
1
2
1
1
1
????
?
?
?
??
?
?
??
??
???
? ?
? ?
? ?
? ?
?
?
?
?
nn
s
s
s
s
nyy
nxx
nn
n
n
nyy
nxx
F
n
i
n
i
F
FF
n
i
n
i
i
i
i
i
?
?
?
?
?
?
?
?
???
???
而
根据定理
根据定理
证明定理
总体与样本间的联系在于具有相同的
分布
? 总体就是一个随机变量，所谓样本就是 n个相互独立的
与总体具有相同分布的随机变量 x1,……,x n，即 n元随机
变量。以上的定理就是将总体与样本间的这种联系具
体化，从而为达到通过样本的特征估计和代替总体的
特征铺平道路。
? 例如，已知一个研究对象 ?的数量特征服从 N(?,?2)，那
么依据定理 4.6，首先将其标准化，然后查标准正态分
布表，就可以获得所需的信息。如果，对研究对象了
解的信息并不完备，只知其属于正态分布均值为 ?，
但未知方差，则可利用定理 4.15通过 s2代替 ?2,用 t分
布来估计未知总体的数字特征。在区间估计和假设检
验中将会广泛地利用这些定理，通过样本估计总体和
检验对总体的假设。
第五节通过样本，估计总体（一） —
—估计量的特征
?对总体的数量特征可以提出若干估计量。所谓
估计量的特性指的是衡量一个统计量用以估计
总体参数的好坏标准。我们构造一个统计量时，
它们就应当具有这些优良性，否则就不采用他
来估计总体参数。估计量的优良性可从四个方
面进行衡量：
?一、无偏性
?二、有效性
?三、均方误最小性
?四、一致性
一、无偏性
?无偏性的直观意义：
?根据样本推得的估计值和真值可能不同，然而
如果有一系列抽样依据同一估计方法就可以得
到一系列估计值，很自然会要求这些估计的期
望值与未知参数的真值相等。这就是无偏性的
概念，无偏性的直观意义是：样本估计量的数
值在真值周围摆动，即无系统误差。
定义 5.1 无偏性的定义
。的有偏估计，其偏差为，我们称如果
具有无偏性。亦称
的无偏估计，为参数成立，我们称如果定义
θ-θ?B i asθθ?θθ?
θ?
θθ?θθ?1.5
EE
E
??
?
的概率θ?的概率θ?
?的真值 ?的真值
有偏无偏
的概率??
的真值θ
的概率??
的真值θ
有偏估计无偏估计
例 1 ? ? ??? 222 ??? sEnxV a rxE
? ? ? ?
? ? ? ? ? ? ? ?? ?
? ? ? ?? ? ? ?
? ? ? ? ? ?
? ? ? ? ?
?
???
???
??
??
?
?
??
??
??
?????
2
2
2
2
1
2
1
222
1 1 1
22
1
2
1
2
2
2
2
2
1
2
1
11
222
1
11
1
11
1
2
1
1
2
1
1
1
1
1
1
111
111
,,,
??
?
???
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??????
?
?
?
?
?
?
??????
?
?
?
?
?
?
????
?? ?
? ???
? ? ? ??
? ???? ?
??
??
?
?
? ? ?
??
??
??
nn
n
n
n
E
n
n
i
E
n
nn
i
E
n
x
i
E
n
i
n
E
i
n
EE
n
nV a r
n
VxV a r
n
n
E
nn
ExE
ExEVE
xx
xxx
xxx
xxxxs
n
x
n
x
xx
sxx
n
i
n
i
n
i
n
i
n
i
i
n
i
n
i
n
i
i
n
i
i
n
i
i
n
i
i
n
证明
，试证），中取一样本从总体
（
?
两个相互独立样本的合并均值与合并方差
分别是总体均值和方差的无偏估计
? 如果从总体中抽取两个相互独立的样本，一个的容量
n1，另一个容量为 n2，可以证明合并均值与合并方差是
总体均值与方差的无偏估计。
? ?
? ? ? ?
? ? ? ?2,1
1
1
2
11
1
1
2
21
21
2
22
2
11
2
2211
21
?
?
??
??
???
?
?
?
?
? ?
?
?
?
i
n
iij
n
x
i
i
j
i
i
i
j
ij
i xx
n
s
n
x
x
nn
snsn
s
xnxn
nn
其中
合并样本方差
合并样本均值
无偏性是估计量最重要的优良性，且
参数的无偏估计量不只一个
? 无偏性是对估计量最重要的要求之一，它只能保证估计量的期望
等于真值。而且，对于总体某个待定参数，其无偏估计量不只一
个。
? 例如，可以验证
? 都是总体数学期望的无偏估计量。
? 必须指出根据计算总体方差的公式计算的样本方差不是总体方差
的无偏估计量。
? ?
? ?
?
?
???
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
????
?
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
??
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
ii
n
i
in
i
i
n
i
ii
n
i
i
a
a
a
xa
a
xa
a
a
xax
E
ExE
x
n
x
1
1
1
1
1
1
1
1
11
0和
二、有效性
?总体某个参数 ?的无偏估计量往往不只一
个，而且无偏性仅仅表明 ?^的所有可能
的取值按概率平均等于 ?，它的可能取值
可能大部分与 ?相差很大。为保证 ?^的取
值能集中于 ?附近，必须要求 ?^的方差越
小越好。所以，提出有效性标准。
有效性的定义
具有有效性。的有效估计量，亦称
称为的方差达到最小，则的一切无偏估计量中，如果在
有效的估计量。是比的方差，则称的方差小于，总有
意的样本容量的无偏估计量，若对任都是和设定义
θ?θ
θ?θ?θ
θ?θ?θ?θ?
θθ?θ?2.5
??
?
n
?的真值 ?的真值
?^的概率 ?^的概率
比较总体均值两个无偏估计的有效性
? ?
? ? ? ?
? ?
? ? ? ?xV
n
n
xV
n
n
i
i
n
i
i
xV
n
i
i
xV
ExE
n
xVxE
x
n
x
n
i
i
n
i
i
n
i
i
ji
ji
n
i
i
ji
ji
n
i
i
jiji
n
i
in
i
i
n
i
iin
i
i
n
i
in
i
i
n
i
ii
n
i
i
a
a
aaaaaaaa
aaaa
a
a
a
a
xa
a
a
a
xax
????
??????
?
??
?
?
?
??
?????
?
?
?
?
?
?
????
?
?
??????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
?????
?
?
?
?
?
?
??
??
?
?
??
22
1
2
1
2
1
222
1
2
1
2
2
222
2
1
2
1
2
2
1
1
2
1
1
11
1
2
1
,2
11
1
11
0
利用不等式
（证明了无偏性）
的有效性。和比较
无偏有效估计量的意义
?（ 1）一个无偏有效估计量的取值在可能
范围内最密集于 ??附近。换言之，它以最
大的概率保证估计量的取值在真值 ?附近
摆动。
?（ 2）可以证明，样本均值是总体数学期
望的有效估计量。
三、均方误（ Mean Square Error）
最小性
?在很多情况下，我们被迫在偏差的大小与方差
的大小（即无偏与有效性）之间作出抉择。
?有时，一个方差极小的有偏估计比一个方差极
大的无偏估计可能更为我们所追求。
?此时，估计量的均方误为我们在两者之间的权
衡提供了一个有效的尺度。
均方误和均方误最小性的定义
? ?
? ?
? ?? ?
? ? ? ? ? ?? ?
? ? ? ? ? ?? ?
? ? ? ?? ?
? ?? ? ? ? ? ? 0θ-)θ?E()θ?E(-θ?2θ-)θ?E()θ?E(-θ?2
0θ
?
θ-)θ
?
E()θ
?
E(-θ
?
2
θ
?
θ
?
2
θ
?
θ
?
θ
?
θθ
θθ
?
θθ-θ
?
Eθ
?
θ3.5
θ
?
B i as
θ-)θ
?
E()θ
?
E(-θ
?
θ-)θ
?
E()θ
?
E(-θ
?
θ-θ
?
2
22
22
2
???
?????
???
??
??
?
EEE
V a r
EEE
EEM S E
B i a sV a rM S E
M S E
?
准确度精确度
）（
）（）（
：的均方误可作如下分解均方误性。估计量
具有最小即的最小均方误估计量，最小的估计量，称为
均方误的一切估计量中，使其。在均方误，记作
的称为估计量，的估计量为若参数定义
均方误最小的意义
?（ 1） MSE（ ——误差）分解为精确度与准确
度之和。 MSE最小就是使估计量方差与估计量
偏误之和最小，给出了进行权衡的方法（见下
图）
?（ 2）如果估计量为无偏估计量 Bias=0，那么
? MSE(?^)=Var(?^)
?即误差由精确度确定。
?此时，一个具有最小 MSE的估计量一定具有无
偏性和有效性，即
? MinMSE(?^)=MinVar(?^)。
运用 MSE权衡偏差与方差
?
最小均方误（有
偏，方差极小）
无偏，方差极大
?^
?^
的
概
率
准而不精又精又准
精而不准
不精不准
重庆长安厂 4支比赛用枪的抽样结果
一次射击就是一
次抽样。试问：
哪些是无偏估计？
哪些是有偏估计？
哪些是有效估计？
哪些是无偏有效
估计？
四、一致性
?（ 1）“依概率收敛”的定义
?（ 2）一致性
?（ 3）一致性的意义
（ 1）“依概率收敛”的定义
? ?
? ? 。依概率收敛于列
则称随机变量序有
，使对于任何若存在常数定义
a
aP
a
n
n
n
?
? ?
?
,1
,04.5
lim ???
?
??
（ 2）一致性
? 一致性既是从概率又是从极限性质来定义的，因此只
有样本容量较大时才起作用。
? 一致性作为评价估计量好坏的一个标准，计量经济学
家在无偏性和一致性之间更偏重选择一致性。
? 虽然一个一致估计量可能在平均意义上与真值不同，
但是当样本容量加大时，它会变得与真值十分接近，
即有偏的一致估计量具有大样本下的无偏性。同时，
根据大数定律，当 n增大时，方差会变得很小，所以一
致估计量具有大样本下的“无偏性”和“有效性”。
? ?
具有一致性。
的一致估计量，为参数，则称，若
，即任意给定依概率收敛于时，若当定义
θ?
θθ?1θθ?0
θθ?5.5
l i m
n
???
??
??
?? -P
n
（ 3）一致性的意义
?显然，一个一致估计量比一个方差很大的无偏
估计量优越得多。
?由于 MSE(?^)=Var(?^)+Bias(?^)2，所以估计量
的一致性，实际上等价于当 n=> 时，
MSE(?^)=>0，亦即 Var(?^)=>0和 Bias(?^)2 =>0，
也就是随着样本加大,?^的方差变小； ?^的偏
差接近于 0，这就是一致性描述的情况。
?事实上一致性和 MSE（ ?^） =>0（当 n=> ）这
两条标准在计量经济学中往往是通用的。
?
?
N小
N大
N极大小
?
?的概率
第六节通过样本，估计总体（二） —
—估计方法
?一、点估计
?（ 1）矩法
?（ 2）最大似然法
?（ 3）最小二乘法
?二、区间估计
?（一）对总体期望值的估计
?（二）对总体方差的估计
?（三）关于区间估计的几点说明
一、点估计
?所谓点估计就是给出被估计参数的一个特定的
估计值。
?常用的点估计方法有四种：矩法、最大似然法、
最小二乘法和 X2法。
?这四种方法分别建立在不同的原则上。
?对同一样本根据四种方法估计同一参数，所获
得的估计结果可能互不相同。
?然而由于各种建立原则的合理性，所以四种方
法在研究中都经常使用。
（ 1）矩法
?矩法是求估计量最古老的方法。具体作
法是：一样本矩作为相应总体矩的估计
量；以样本矩的函数作为相应的总体矩
同样函数的估计量。
?这种方法最常见的应用是用样本平均数
估计总体数学期望。
?矩法比较直观，求估计量时有时也比较
直接，但它求出的估计量往往不够理想。
矩法点估计的例题
? 例 1某灯泡厂某天生产了一大批灯泡，从中抽取了 0个进行寿命试
验，获得数据如下（单位：小时），问该天生产的灯泡的平均寿
命是多少？
3é D? ?? 1? 1 2 3 4 5 6 7 8 9 10
éù ?ó ￡¨?? éa￡? 1050 1100 1080 1120 1200 1250 1040 1130 1300 1200
?? ê? μ? D? a? ê? é? ?? ?? éy = 1 1 4 7 ￡? ?e ía ?ü ?? éy D§?ú ì? μ? ?? ?? ?μ
? ?
? ?
xxx
x d xdxxdxxx
x
x
x
xx n
2
?
,
2
?
202
1111
,
0
0
1
,
,2
2
00
1
????
??
??
?
??
?
???
?
?
?
?
?
??
?
?? ?
???
??
?
?
?
?
??
???
???
?
?
???
在矩法下又
是多少？问在矩法下
其它
取自均匀分布若样本例
?
?
?
（ 2）最大似然法
(Maximum Likelihood Estimation)
?1、一个重要的事实
?2、最大似然法的概念
?3、似然法函数
?4、最大似然法的定义
?5、最大似然法的三个示例
1、请注意如下事实
? 不同的总体会产生不同的样本，对于某一特定的样本，
在我等不了解产生它的母体究竟为何物的观察者眼中，
它来自一些母体的可能性要比来自另一些母体的可能
性大，即一些母体更容易产生出我们所观察到的样本。
? 举例说，假定我们抽取到（ x1,x2,……,x8 ）我们知道它
来自正态总体，且总体的方差是了解的，但是总体的
均值未知。如下图所示。
x6 x2 x3 x4 x5 x6 x7 x8
分布 B 分布 A
概
率
x
假定样本不是来自 B就是
来自 A。如果样本来自 B，
观察到它的可能性非常
小；真正的母体若是 A，
得到样本的可能性很大。
显然我们宁愿承认样本
来自 A。是样本“替”
我们“选择”了 A。
2、最大似然法的概念
? 上述事实诱导我们宁愿作出这样的抉择：将样本最容
易来自的总体当作产生样本的总体。
? 现在要根据从总体 ?中抽取得到的样本 (x1,……,x n)对总
体中的未知数 ?进行估计。最大似然法是选择这样的估
计量 ?^作为 ?的估计值，以便使观察结果 (x1,……,x n)出
现的可能性（概率）最大。
? 对于离散型变量，就是要选择 ?^使 p(x1)p(x2)… p(xn)最大。
（连乘 ——表示一次独立地抽取各个样本观察值）
? 对于连续型变量，就是要选择 ?^使 ?(x1)?(x2)...?(xn)最大。
注意 ?(xi)是随机变量在 xi附近取值的概率，相当于离散
型的 p(xi)。
3、似然法函数
? ?
? ?
? ?
? ? ? ?
? ? ? ?
? ? ? ??
?
?
?
?
??
?
n
i
in
ii
n
n
i
in
n
xxxx
xx
xxx
xxxx
xxx
PL
PP
L
L
L
x
xF
1
21
21
1
21
21;;,
,;
,;;,
,;
??
???
?
???
???
??
?
?
?
?
则似然函数
的概率函数为离散型随机变量，它设
为样本的似然函数。的函数，称成参数
可以看是常数，所以由于每一取定的样本值
：的联合分布分布密度是样本
的独立性，则是未知参数。由于样本，其中度函数是
，分布密的分布函数是为连续型随机变量，它设
4、最大似然法的定义
? ?
的最大似然估计。是则称
处达到最大值，在如果定义
θθ?
θ?θ;,,,1.6 21 xxx nL ?
5、最大似然法的估计方法
?为了取得 ?的最大似然估计，必须使似然函数 L
达到最大值，并且把此时的 ?^作为 ?的估计量。
由于对数函数是单增的,L达到最大亦即 LnL达
到最大。
?这样使 LnL达到最大来估计 ?为计算带来了许多
方便。
?根据微分中的拉格朗日定理，对未知参数求条
件极值，令 LnL对 ? 的一阶导数等于 0，即
dLnL/d ?=0 ==>得到似然方程，我们所求的 ?^
就是似然方程中 ?的解。
5、最大似然法示例之一
? ?
? ?
? ?
的最大似然估计。是
得解似然方程
似然函数解
的最大似然估计。的一组观察值，求是
其它
的分布为：已知随机变量例
θ
1
?
0
1
1ln1
lnln
11;,,,
θξ,,,
0
00
1;~
ξ3
11
2
1
2
1
1
1
21
21
1
x
x
n
n
n
d
Ld
nL
x
x
L
x
x
n
i
i
n
i
i
n
i
i
n
i
i
n
n
i
n
n
i
xx
xx
eexxx
xxx
e
x
n
i
i
i
i
?
???????
????????
?
???
?
?
?
?
?
??
?
??
??
?
?
?
?
??
?
?
???
?
?
?
?
?
???
?
?
?
??
?
?
?
5、最大似然法示例之二
? 例 4 某电子管的寿命服从例 3中的分布（实际上多为指
数分布）抽取一组样本，其具体数值如下：
? 根据例 3的结果，在最大似然法下，指数分布中的 ?，
应用样本平均数估计。
? ?^=(16+29+…… +800+110)=318（小时）
16 29 50 68 100 130 140 270 280
340 410 450 520 620 190 210 800 1100
5、最大似然法示例之三 ——
已知 ?~N(?,?2)，以一组样本观察值估计 ?的参数
? ?
? ?
? ?
? ?
? ? ? ?
? ?
? ? ? ?
型估计时也是如此。估计量，以后对线性模
差的估计往往是有偏：最大似然估计法对方意然后解似然方程组。注
，分别对不同参数求偏导估计时，应将：当不只一个参数需要注意
解得
解
2
ln1
1
1
?
0
22
0
1
22
ln1ln
2
1
ln
22
1
ln
2
ln
1
2
1
2
1
1
2
2
1
1
2
42
1
2
1
2
422
1
2
1
2
2
2
12
12
2
1
2
?
2
2
2
2
2
2
L
i
n
n
i
nn
i
nnLL
i
nn
L
e
x
L
n
i
n
i
i
n
i
n
i
i
n
i
n
i
i
n
i
n
i
x
i
n
n
i
xx
x
x
x
xx
x
e
n
i
?
?
?
?
?
?
?
??
?
?
?
?
?
?
?
?
????
??
????
?
?
??
?
?
????
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
??
?
?
??
??
?
?
????
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
（ 3）最小二乘法 (Least Square Estimation
Method)
?最小二乘法是计量经济学中应用最广泛
的一种估计方法。
?这是本课研究的重点问题，在以后各章
中将详尽地阐述它的原理、步骤、特性
和优越处。
?这里暂时不加以讨论。
二、区间估计
?（一）对总体期望值的估计
? 1、已知方差，对数学期望 E?进行区间估计
?（ 1）方差已知，估计总体数学期望
?（ 2）正态总体
?（ 3）一般总体大样本下数学期望的区间估计
? 2、方差未知，对对数学期望 E?进行区间估计
?（二）对总体方差的估计
?（三）关于区间估计的几点说明
区间估计的概念
? 所谓区间估计就是以一定的可靠性给出被估计参数的
一个可能的取值范围。
? 用点估计估计参数，即使是无偏有效的估计量，也会
由于样本的随机性，使得由样本计算出的估计值并不
恰恰是真值。而且即使等于真值，由于真值未知，我
们也不能肯定这种相等。那么，究竟相差多少？于是
问题等价为：在给定可靠程度下，指出被估计参数所
在的可能值的范围，就是参数的区间估计问题。
? 具体作法是找出两个统计量 ?1(x1,…,x n)与 ?2 (x1,…,x n)，
使
? P(?2 < ?< ?2 )=1-?
? (?1,?2)称为置信区间,1-?称为置信系数（置信度），
?称为冒险率（测不准的概率），一般等于 5%或 1%。
对区间估计的形象比喻
? 我们经常说某甲的成绩“大概 80分左右”，可以看成
一个区间估计问题。（某甲的成绩 ?为被估计的参数）
? P(?2 < ? < ?2 )=大概的准确程度（ 1-?）
?
? 如,P(75 < ? <85 )=95%=1-5%
―大概 80分左右”
冒险率（假设检验中
叫显著水平）
下限上限
（一）对总体期望值的估计
?1、已知方差，对总体数学期望 E?=?进行
区间估计
（ 1）方差已知分布未知，估计总
体数学期望
? 对这种情况的处理，需要用到切比雪夫不等式。
?
??
?
?
?
?
和视具体情况选择适当的高（区间长度变小），
增大估计精度提有关。、、。此外，区间长度还与是
的概率含。某一个区间可能不包）个会套住（中有
个区间次抽样计算得到的。即平均套住的可能性是
被随机区间数区间。上式的意思是常个样本都会有一个置信
一本不同而不同，对于每是一个随机变量，随样这里样本均值
n
nE
EE
n
V
x
n
V
x
E
x
n
V
xE
n
V
xp
ξnαα
ξξα11 0 0
1 0 01 0 0α1
α
,
α
ξ
1
αα
?
?
?
?
?
?
?
?
?
?
??
??
?
?
?
?
?
?
?
?
????
下限上限
电子管寿命的置信区间
? 例 6 在本节例 1中，如果已知当天生产的电子管寿命的
方差为 8，试找出电子管寿命的置信区间（ ?=5%）。
? ?
? ?
的置信区间比较粗糙。
比雪夫不等式估计的分布信息，所以根据切
量的。由于没有利用随机变，
，即的置信区间为
解：
已知
ξ
11511143
41147,41147ξ
4
8%5101147
E
n
V
Vnx
???
?
????
?
?
??
（ 2）正态总体
? ? ? ?
? ?
? ?
。时，。时，
。的置信区间为置信度为因此
即
即
使确定查标准正态分布表可以对给定的
可以得到：
，由定理，来自正态总体设样本
576.205.096.105.0
,α-1μ
1
1
/
1
,,
1,0~
/
13.4μ,,
01.005.0
2
1
????
?
?
?
?
?
?
??
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
???
?
?
??
??
??
??
?
?
??
??
?
?
?
?
?
?
?
?
?
?
?
??
??
??
?
n
x
n
x
n
x
n
xP
n
x
PUP
N
n
x
U
N
xx n
?
??nσ ??nσ
58.20, 0 1α
96.10, 0 5α
64.10, 1 0α
??
??
??
?
?
?
?
?
?
?/2?/2 1-?
置信区间，
上限下限
可靠程度冒险率
??
?
??
? ?
?????
?
??
??
??
??
n
σx
n
σ-x
n
σx
n
σ-x
α1--α
x
假设总体服从正态分布 N(?,8)
求 ?的置信区间
? 例 7 本节例 1中再假设总体服从正态分布，求电子管寿
命的置信区间（ ?=5%）。
置信区间精确些。切比雪夫不等式所得的
信息，比未知分布通过显然，由于利用了分布
即
置信区间为：而
解：
75.1 1 4 825.1 1 4 5
96.1
10
22
1 1 4 796.1
10
22
1 1 4 7
1 1 4 72210
96.105.0
??
??????
????
???
?
?
?
? ?
?
xn
?
（ 3）一般总体大样本下数学期望
E?的区间估计
?中心极限定理指出，在很宽的条件下，无能是
否为正态总体 ?（ ?,?2），当样本容量相当大
时，也有样本平均数渐进地服从正态分布。
?一般说来，在 n>=30时，就可以把样本平均数
近似地看作服从正态分布 N(?,?2/n)。
?所以，对于大样本仍可以按正态总体进行均值
?的区间估计。
2、方差未知，对对数学期望 E?进
行区间估计
? （ 1）大样本下
? 根据中心极限定理,V ?可以用 s2代替，所以仍按已知
方差正态分布的方法进行 ?的置信区间估计。
? （ 2）小样本下
? ? ? ?
? ?
??
?
?
?
?
?
?
?
??
??
?
??
???
?
?
?
?
?
????
??
?
?
?
?
?
?
?
?
?
?
??
?
?
?
?
1
1
/
,1,
15.4)1(~
/
,,,,
22
1
tt
tt
t
xx
n
s
x
n
s
xp
ns
x
pTp
tn
nt
ns
x
T
N
n
的置信区间为：因此，
即
使分布的临界值的查具有对给定的
）（由定理
未知，令由于来自正态总体设小样本 ?
例 8 新生儿体重的置信区间
? 假设新生儿（男）的体重服从正态分布。随机抽取 12
名新生儿，测得体重如下表，试以 95%的置信度估计
新生儿（男）的平均体重。
?? 1? 1 2 3 4 5 6 7 8 9 10 11 12
?á èò ?? ?? ?? 3100 2520 3000 3000 3600 3160 3560 3320 2880 2600 3400 2540
? ?
3 3 0 02 8 2 0
2 0 1.2
12
3.3 7 5
3 0 5 72 0 1.2
12
3.3 7 5
3 0 5 7
9 5 %μ
3.3 7 53 0 5 7
11
1
3 0 5 7
(2 0 1.21205.0
12
1
2
)112(
??
??????
???
????
? ?
?
?
?
?
?
?
即
的置信区间是置信度为
再计算
表的图有错）
i
x
t
i
sx
n?
? ?
? ?
? ?
? ?
? ?
? ? ? ?
? ? ? ? 2/
1
11
1
1
1~
,,,,
2
2
2
1
2
1
2
111
2
2
2
2
?
?
?
?
?
?
?
?
?
?
????
??
?
?
?
?
?
?
?
? ?
??
?
???
?
?
?
?
?
??
????
??
?
?
bZpaZpba
a
n
b
n
p
b
s
ap
bZap
n
s
Z
N
ss
xxx
n
n
时，一般取和在确定
那么，
。）来自总体设样本（ ?
对总体方差的区间估计

课件简介

课件名称：	重庆工商大学：计量经济学
课件分类：	经济
课件类型：	电子教案
文件大小：	8.44MB
下载次数：	2
评论次数：	2
用户评分：	7.5

用户列表