思考
? 到目前为止,模型的参数已经估计出来了。
接下来需要考虑的问题是:
? 如何确定仅仅根据给出的 一个 样本估计出的
样本回归函数(方程) SRF确实是真实的总
体的一个好的近似呢?
? 在本章中指考虑估计出的线性模型形式是否
是总体中变量之间关系的真实反映呢?
? 进入建模的第四步 —模型的检验
§ 2.4 多元线性回归模型的统计检验
Statistical Test of Multiple
Linear Regression Model
一、拟合优度检验
二、方程显著性检验
三、变量显著性检验
说 明
? 模型的统计检验主要包含三个部分:拟
合优度检验、总体显著性检验、变量显
著性检验。
? 模型的统计检验是对由样本得到的模型
是否能准确反映总体的真实情况进行检
验。主要采用统计知识。
? 书中只以多元线性模型为例,我们先介
绍一元,再介绍多元。
一、拟合优度检验
Testing the Simulation Level
本部分重点内容
?对于一元 ——把握可决系数
?对于多元 ——把握调整 R-平方
概念
? 拟合 ——如果所有观测值都落在 SRF上,则
称为完全拟合,这种情况是罕见的。显然,
我们需要对样本点拟合得好的 SRF。
? 拟合优度检验 ——检验模型( 样本回归函数)
对样本观测值 趋势的吻合程度( 拟合程度)。
一元线性回归模型的拟合优度检验
? 问题:采用普通最小二乘估计方法,已经
保证了模型(样本回归线)在所有可能的
直线中最好地拟合了样本观测值,为什么
还要检验拟合程度?
? 原因有二:( 1) 虽然 样本回归线是 直线 中
最好地拟合了样本观测值的一条,但由普
通最小二乘法所得 直线 究竟能够对这些点
之间的关系加以反映吗?需要加以判断。
0
5
10
15
20
25
0 2 4 6 8 10 12
X
Y1
恰当的描述 不恰当的描述
0
5
10
15
20
25
30
0 2 4 6 8 10 12
X
Y2
? 原因 2:如果样本回归函数能够对这些点之
间的关系加以反映,那么,它对这些点之
间的关系或趋势反映到了何种程度?需要
加以判断。
0
5
10
15
20
25
0 2 4 6 8 10 12
X
Y1
0
5
10
15
20
25
30
0 2 4 6 8 10 12
X
Y2
SRF1 SRF2
? 上述两个原因都告诉我们必须经过某种检验
或者找出一个 指标,来检验模型对 样本观测
值 的 拟合 程度。这就是拟合优度问题。
? 拟合优度的检验分两个问题进行讨论:
1,平方和分解
2,拟合优度的指标 —决定系数
1.平方和的分解
? ( 1)总平方和、回归平方和、残差平方和
的定义
? ( 2)平方和的分解
( 1)总体平方和、残差平方和和回归平方和
的定义
总体平方和、残差平方和和回归平方和
? 定义
? TSS为总体平方和 ( Total Sum of Squares), 数值上表
现为被解释变量 y的所有 样本观测值的离差 平方和,它的
大小 度量 y自身的差异程度(变动程度),反映被解释变
量样本观测值 总体离差 的大小;
? ESS为回归平方和 ( Explained Sum of Squares), 数值
上表现为被解释变量的 所有 估计值 (拟合值) 的 离差
平方和,它的大小 度量 被解释变量 y的 估计值 (拟合值)
自身的差异程度 ;
y?
TSS y y
E S S y y
R S S y y
i
i
i i
? ?
? ?
? ?
?
?
?
( )
( ? )
( ? )
2
2
2
y?
? 定义
? RSS为残差平方和 ( Residual Sum of Squares),
数值上表现为 残差 的平方和,它的大小 度量实际值 y
与拟合值 之间的差异程度,反映 样本观测值与估计
值偏离的大小 。
TSS y y
E S S y y
R S S y y
i
i
i i
? ?
? ?
? ?
?
?
?
( )
( ? )
( ? )
2
2
2
y?
? 如何判断 SRF对 所有 样本点的拟合程度呢?
? 通过对平方和的分解完成判断。
一个有趣的现象
? 矛盾吗?可能吗?
222 )?()?()( yyyyyy iiii ????????
222 )?()?()( iiiii yyyyyy ?????
对于一个样本点
对于所有的样本点
( 2)平方和的分解
? TSS,ESS,RSS之间的关系
TSS=ESS+RSS (总体平方和=回归平方和+残差平方和)
? 恒等式表示了什么含义呢? —看图分析
? 被解释变量 y总体离差 =
? 解释变量 x所解释的那部分离差 +除 x以外 的因素 解释的那部分
离差
? y的 离差的产生可视为 y取值的一种变动 (差异 )
? 从而 TSS,ESS,RSS之间的关系可以理解为
? 被解释变量 y总的变动(差异) =
? 解释变量 x引起的变动(差异) +除 x以外 的因素引起的变动
(差异)
222 )?()?()( yyyyyy iiii ????????
yy?
yy??
yy ??
y
yy??
160
165
170
175
180
185
140 150 160 170 180 190 200
Y
X
来自样本回归线
来自残差 离差
ii xy 10 ??? ?? ??
SRF
y









yy?
yy??
yy ??
y
yy??
160
165
170
175
180
185
140 150 160 170 180 190 200
Y
X
( x,y) 离差
ii xy 10 ??? ?? ??
SRF
y









被 x解释的离差
未被 x解
释的离差
TSS=ESS+RSS
被解释变量 y总的变动 = 解释变量 x引起的变动 +除 x以
外的因素引起的变动
? 由上式不难看出,
? 如果由 x引起的被解释变量的变动在 y的总变动中占很大比
例,即 ESS在 TSS中占很大比例,那么 x很好地解释了 y的
变动,即样本回归线很好的解释了 y的变动,从而,样本
回归线很好的拟合了所有样本观测点 ;
? 若所有真实的样本观测点都落在 SRF上,即完全拟合,则
RSS=0;
? 另一方面,若 x不能很好地解释 y的变动,即样本回归线 没有
很好的拟合 样本观测点,则 RSS比 ESS大得多 ;
? 极端的情形是:样本回归线中的 x完全 不能解释 y的变动,
则 ESS= 0,而 RSS= TSS。
2.拟合优度检验统计量,可决系数 r2
? 目的:构造一个不含单位,可以相互进行比较,而且能直观判
断拟合优劣的指标。
? 可决系数的定义:
? 可决系数=回归平方和/总体平方和
? 意义:一元中的可决系数给出了 单个 解释变量对被解释变量 变
动 的 解释程度 (比例)。
? 可决系数越大,解释变量对被解释变量的解释程度越高,
样本观测点在样本回归直线附近越密集,拟合越好。
T S S
SS
T S S
SSE
T S S
ES S
T S S
RS S
ES SRS ST S S
r
2 R
???
?????
1
1
可决系数 r 2
? 取值范围,0-1
?,若 r2=1即 ESS=TSS,表示样本回归线完全解
释了 y的变动,与样本观测值完全拟合 ;
? 可决系数越接近于 1,样本回归线的拟合优度
越高 。
r E SSTSS R SSTSS2 1? ? ?
例 1:美国的咖啡消费,1970- 1980
? 资料来源:咖啡消费数据取自 1981年, 全
国咖啡饮用研究概要, 价格数据取自 1981
年, Nielsen食品指数,
? 其中 y为美国每人每日饮用咖啡的杯数,x为美国咖啡每磅
的平均真实零售价格
? 真实价格=名义价格/引来的消费者价格指数 CPI( 1967
年= 100)
? 对所估的回归结果解释如下:如果咖啡每磅平均真实零售
价格上涨 1美元,每日平均咖啡消费可望减少约半杯。
? r2的含义是,约有 66%的每人每日咖啡消费的变动可用咖
啡零售价格的变动来解释。
? 在此例中,样本回归线并未很好的拟合了样本数据。
6 6 2 8.0 4 7 9 5.0-6 9 1 1.2? 2 ?? rxy tt
注意问题 1:
什么是拟合优度高呢?
? 计量分析中,对使用时间序列数据还是使
用截面数据有着不同的标准:
? 对时间序列数据而言,r 2的值在 0.8,0.9
以上是很常见的。
? 对于截面数据而言,0.4,0.5 的 r 2值也不
能算低。
例 2:美国的凯恩斯消费函数,1980- 1991
? 根据美国 1980- 1991年间个人消费支出与国内生产总
值数据得:
? 其中 y代表以 10亿 1987年美元计的个人消费支出
( PCE),x代表以 10亿 1987年美元计的国内生产总值
( GDP)
? 结果表明:在 1980- 1991年期间,GDP每增加 1美元,
平均个人消费支出约增加 72美分,即边际消费倾向约为
0.72。从字面上解释,约为- 232的截距值表明若 GDP
为零,平均个人消费支出约为- 2320亿美元。再次说
明机械的解释截距是没有经济意义的。
9 9 0 9.0 7 1 9 4.080.2 3 1? 2 ?? rxy tt +-
? r2约为 0.99,说明 GDP解释了平均个人消费支出
变动中的 99%,因此,在此例中可以认为样本回
归线很好的拟合了样本数据。
? 尽管 r2值很高,但如此简单的一个凯恩斯消费函
数作为解释美国消费支出的模型是否适当呢?需
要考虑。这属于模型设定是否恰当的问题。
? 不过,有时非常简单的回归模型能够提供有用的
信息。根据复杂的模型作出的美国 MPC 的估计也
表明其约为 0.7左右。
9 9 0 9.0 7 1 9 4.080.2 3 1? 2 ?? rxy tt +-
注意问题 2,拟合优度是不是判断模型
质量的唯一标准呢?
? 拟合优度高固然不错,但 r 2值的大小并不是判断模型质量
的唯一标准。
? 例:中国消费基金=- 14720.13+ 68.49苏联人口数
r 2= 0.9
? 中国消费与苏联人口显然没有联系。模型中变量选择不合
理。
? 由此可以看出,r 2的值高不是判断模型质量的唯一标准,
只是可供参考的一个条件。有时为了追求模型的经济意义,
是可以牺牲一点拟合优度的。
? 切记要避免仅根据 r 2的值来选择模型。 而应将模型的经济
理论基础、预期的参数符号、参数估计量的统计显著性等
因素作为选择模型的基本准则。
扩展
1,可决系数又称为判定系数,样本可决系数;
2,TSS又称为总平方和;
3,ESS又称为解释平方和;
4,有些参考书中将回归平方和记为 RSS而将
残差平方和记为 ESS,注意区分 。
多元线性回归模型的拟合优度检验
? 引
? 在一元线性回归模型中,我们通过可决系
数来度量样本回归线( SRL)对样本数据
的拟合程度,在一元中,给出了单个解释
变量对被解释变量变动的解释程度(比例)
? 可决系数的概念可以推广到包含若干个解
释变量的 多元线性回归模型中
多元线性回归模型的拟合优度检验讨论内容:
拟合优度的指标 —可决系数及调整的可决系

多元模型拟合优度检验统计量,可决系数 r2
? 与一元线性回归模型相同,在多元线性回归模型中,仍
有如下恒等式成立:
TSS=ESS+RSS
总体平方和=回归平方和+残差平方和
? 同样的,定义可决系数度量模型对样本观测值的拟合程

? 可决系数=回归平方和/总体平方和
? 取值范围,0-1
? 可决系数越接近于 1,模型的拟合优度越高 。
222 )?()?()( yyyyyy iiii ????????
T S S
SS
T S S
SSE
T S S
ES S
T S S
RS S
ES SRS ST S S
r
2 R
???
?????
1
1
多元线性回归模型中可决系数的特点
? 多元线性回归模型包含多个解释变量,那么,被
解释变量 yi的估计值 与多个解释变量有关,从
而可决系数 r2中的 ESS与 多个 解释变量有关,而
不是只与 一个 有关。
? 于是,与一元不同:
? 多元中,可决系数的意义在于:
? 可决系数给出了 所有 解释变量 x1,x2,… xk 一起 对
被解释变量变动的解释程度(比例)。
? 可决系数越大,全体解释变量对被解释变量的解
释程度越高,模型对样本观测点的拟合越好。
iy?
需思考的问题
? 多元中可决系数的大小与解释变量的个数有没有关
系?
1,考虑残差平方和
? 在原有样本保持不变的情况下,每当模型中增加一
个解释变量,并用改变后的模型重新估计,残差平
方和会发生什么变化?
? 不会增大,可能减小。
2,此时总体平方和有什么变化?
? 在原有样本保持不变的情况下,由于 yi及其平均值
保持不变,所以 总体平方和保持不变。 y
? 可决系数=
? 1-(残差平方和/总体平方和)
? 在多元中,可决系数是一个与解释变量个数有关的量。而
且是 解释变量个数的递增函数 。
? 解释变量的个数增加 残差平方和不会增大,只会
减小 可决系数不会减小只可能增大
? 也就是说,总可以通过增加模型中解释变量的个数来增大
可决系数的值。
? 这样做好吗?
r2
解释变量个数
? 因此,在多元中,可决系数的值并不能真
实反映出 SRF对样本观测值的拟合程度。
多元模型拟合优度检验统计量 ——
调整的可决系数 R2
? 在多元中,引入一个新的拟合优度的指标,
使其能够根据模型中解释变量的个数进行
调整,消除可决系数对解释变量个数的依
赖性,合理反映出多元线性回归模型的拟
合程度 。
? 指标 —— 调整的可决系数,记为 R2
? 调整的可决系数 R2
R SS r
t
2 1? ?
S
n k
R S S
S
n
T S S
r
t
?
? ?
?
?
1
1
1
1
其中, n-k-1称为残差平方和的自由度; n-1称为总体平方和的自由

n为样本容量; k为偏回归系数的个数
自由度的含义
? 自由度 ——用于计算时,可以自由选择的数值的
个数
? 例如
? ( a+b+c) /3=4,则 3*4=12,必须是 a+b+c=12
? 其中,a,b一旦确定,c就别无选择了,在此 a、
b是可以“自由”给定的。
? 称该式的自由度为 2。
多元线性回归模型自由度的分解
? 总体平方和=回归平方和+残差平方和
? 总自由度
? dfT=n-1
? 回归自由度
? dfE=k(偏回归系数的个数 k;若为一元 k
为斜率的个数= 1)
? 残差自由度
? dfR=n-k-1
? 自由度分解
? dfT=dfE+dfR
? 调整的可决系数 R2
R SS r
t
2 1? ?
总自由度
残差自由度
T S S
T S S
1
1
R S S
R S S
1
1
?
?
?
?
??
?
n
S
kn
S
t
r
其中, n-k-1称为残差平方和的自由度; n-1称为总体平方和的自由

n为样本容量; k为偏回归系数的个数
可决系数给出了 所有 解释变量 x1,x2,… xk 一起 对被解释变量变动
的解释程度(比例)
T S S
SS
T S S
SSE
T S S
ES S
T S S
RS S
ES SRS ST S S
r
2 R
???
?????
1
1
R2
解释变量个数
对解释变量
个数增加过
度的一种惩

从另一个角度说明
模型中的解释变量
个数并非越多越好
扩展 —— R2的特点
? 若 k≥0,则 调整的可决系数 R2≤ 可决系数 r2;
? 若 k= 0,则 R2= r2;
? R2使我们可以对相同样本容量,相同被解
释变量,不同解释变量的两个多元线性回
归模型进行拟合优度的比较。但如果两个
回归模型的被解释变量不同,则不能直接
比较它们的 R2。
? 在应用软件中,可决系数 r2和调整后的可决系数
R2的计算是自动完成的
? 在消费模型中(教材 P47)
r2=0.999773
R2=0.999739
说明 SRF很好的拟合了样本观测数据。
英国对酒精饮料的需求模型
? 在英国对酒精饮料的需求一例中
根据 R2的值,SRF对样本的拟合程度并不算很好。
问题 3,R2的值不大,模型质量一定不高吗?
不尽然
689.0R
0059.0--y
2 ?
????
?
ttttt xxxx 5432 0, 6 5 7 00, 0 0 1 80, 3 5 4 00, 0 1 4 0
拟合优度总结
? 拟合优度检验 ——检验模型( 样本回归函数) 对
样本观测值 趋势的吻合程度( 拟合程度)
? 检验通过可决系数或调整的可决系数完成
r E SSTSS R SSTSS2 1? ? ?
? 多元线性回归模型
? 调整的可决系数 R2
? 可决系数给出了所有解释
变量 x1,x2,… xk 一起对
被解释变量变动的解释程

R
S
S
r
t
2 1? ?
一元线性回归模型
可决系数
可决系数给出了 单个 解
释变量 x对被解释变量
变动的解释程度
总自由度
残差自由度
T S S
T S S
1
1
R S S
R S S
1
1
?
?
?
?
??
?
n
S
kn
S
t
r
关于拟合优度的两点说明
1,在实际应用中,拟合优度达到多大才算模型通过
了拟合优度检验,没有绝对的标准,要看具体问
题而定。
2,模型的拟合优度 不是判断模型质量的唯一标准,
只是可供参考的一个条件。有时为了追求模型的
经济意义,是可以牺牲一点拟合优度的。
? 切记要避免仅根据 拟合优度 的值的高低来选择模
型。 而应将模型的经济理论基础、预期的参数符
号、参数估计量的统计显著性等因素作为选择模
型的基本准则。
? 当然在其它条件基本相似的情况下,拟合优度越
高越好。
二、方程显著性检验
Testing the Overall Significance
关于假设检验
? 1、假设检验的概念
? 2、假设检验的思想
? 3、假设检验的具体操作步骤
? 4、对于具体的统计量如何构造小概率
事件
? 引
? 案例 1:某电视台某个节目其内容是针对 18
岁青年人的,节目总监关心其节目是否为
目标观众所接受。抽样检验后,若电视节
目没有吸引预期观众,则节目将会改变。
现随机抽取 100位观众为样本,并计算样本
平均数是 17.04岁。节目是否吸引了目标观
众呢?
? 或者说观众总体的年龄是否为 18岁呢?
? 案例 2 从 1999年出生的女婴中随机地抽取
20名,测得平均体重 =3160克,根据已有
的统计资料新生女婴的体重 =3140克,问现
在与过去新生女婴的体重是否有变化?
? 在现实生活的方方面面我们都需要根据 已
有的样本信息 对各种 假设 (说法)的准确
性作出判断。
? 通常使用的方法为 假设检验。
1、假设检验 (又称显著性检验 )的概念
? 假设检验是统计推断的一个主要内容,它的基
本任务是根据 样本 所提供的信息,对 未知总体
分布的某些方面的 假设 作出 合理的判断 。
假设检验的原假设和备择假设
? 根据实际问题提出 两个互相对立 的假设
? 原假设 H0,与备择假设 H1 ——指出需要检验的
假设的具体内容;
? 注意:原假设和备择假设是两个互相对立的假设
? 案例 1中
? H0,节目观众平均年龄= 18岁
? H1,节目观众平均年龄 ≠ 18岁
? 我们进行假设检验的目的就是 判断 原假设 是否可
以被拒绝 。
? 若认为原假设 是正确的,则接受 H0 (不能拒绝
H0 );若认为原假设 是不正确的,则拒绝 H0 而
接受备择假设 H1,
? 假设检验的思想, 为了检验 H0是否正确,
先假定 H0是正确的,,看由此能推出什么
结果。如果推出一个不合理的结果,表明
H0是不正确的,从而拒绝 H0。
? 判断的根据是 小概率事件原理 ——“小概率
事件”在一次试验中该事件是几乎不可能
发生的 。
2、假设检验的思想
“小概率事件”原理
?,小概率事件”通常 指发生的概率小于 5%的事件。
? 例如:一个盒子中有 100个球,其中 98个是白球,2
个是黑球。
? 只摸一次,摸到黑球的概率 0.02—小概率事件
? 对于这类事件来说,在大量重复试验中,平均每试
验 20次以上才发生 1次,所以认为,小概率事件”在
一次试验中该事件是几乎不可能发生的 —小概率事
件原理 。
? 小概率事件发生的概率记为 α,称为显著(性)水平。
? 进行假设检验时,通常要 先规定 显著水平。常用的
显著水平为,α=0.05,0.01,0.02(还有 0.1)。
假设检验的思想 —
反证法+小概率事件原理
3、假设检验的具体操作步骤

中国民航创连续安全飞行 500万小时新纪录
? 民航总局负责人公布,截止到 11月 9日 8时,中国
民航航空运输安全飞行已连续超过 500万小时,
创造了新中国成立以来最好的安全纪录,达到国
际先进水平。
? 根据民航总局的最新统计数据,中国民航运输飞
行重大事故率已低于世界平均水平。由于中国民
航良好的安全业绩,2003年中国民航的机队保险
费用下降了 30%。
? 该消息说明,乘飞机出行是相当安全的。
? 一架机况优良的飞机,在一次飞行中,出
现空难的可能性相当小,或者说在一次飞
行中不可能出现空难。所以我们能安心的
乘飞机出行。
? 如果在其他情况正常的条件下,一架飞机
在一次飞行中发生了空难事故,有理由相
信这架飞机是一架有故障的飞机。
? 推理过程体现出假设检验的思想。
假设检验的具体操作步骤,
? 第一步:作出假设 —H0,机况正常; H1,机况不正常
? 第二步:根据有关信息,对 H0的真伪进行判断
? 在原假设成立的情况下:
? 构造一个小概率事件 —在一次飞行中,发生空难的可能性
非常小
? 根据小概率事件是否发生,作出判断
? 如果发生了空难( 小概率事件发生),有理由认为 原假设
不成立 (可以认为机况是不正常的)。
? 反之,若 小概率事件没有出现,就 没有理由拒绝 H0。
假设检验的具体操作步骤,
? 第一步:作出假设 —H0,机况正常; H1,机况不正常
? 第二步:根据有关信息,对 H0的真伪进行判断
? 在 原假设成立 的情况下,构造一个小概率事件。
? 根据小概率事件是否发生,作出判断(拒绝还是接受原
假设)
? 如果 小概率事件发生,拒绝原假设,认为原假设不成立;
? 反之,若 小概率事件没有出现,就 没有理由拒绝 H0。
对假设检验有了定性的了解后,接下来,了
解如何使用具体工具进行假设检验呢?
案例 2:现在女婴体重与过去有无差别
? 从 1999年出生的新生女婴中随机抽取 20 个,测得起平均
体重为 3160克,样本标准差为 300克,根据过去的资料,
新生女婴平均体重等于 3140 克,问现在女婴体重与过去
有无差别( ?=0.01)?
显著的差异。婴的体重与过去没有极,即认为现在的新生女不能拒绝

,即查表确定临界值,根据给定的显著水平
:;解
H
t
t
H
ns
x
0
120,01.0
0
120,01.0
10
t
8 6 1.22 9 8.0
20/3 0 0
3 1 4 03 1 6 0
/
t
8 6 1.2
3 1 4 0H3 1 4 0:
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
案例 3,1998年全国人均年消费支出为 1590元,同期
在新疆一个 25户家庭组成的样本表明,其年人均消费支出为
1450元,样本标准差为 220元。试以 0.1的显著性水平判断,
新疆的人均年消费支出是否明显地低于全国平均水平?
解:设 H0,? ≥1590 H1,? < 1590
由 ? = 0.1 有,-t?( 25-1) = -1.318
18.3
25220
15901450
??
?
?t
由于 t 值 小于 -t ?,落在拒绝域中,故
拒绝原假设,认为 新疆的人均年消费
支出明显地低于全国平均水平。
? 对于看似 完全不同 的问题,我们总可以根据问题
中各种因素体现出来的数量规律,将它们归结为
在数学上相同的问题 予以解决。
? 在计量中,不仅是模型的显著性检验部分,我们
就是采取的这种方式。
? 主要使用的工具是 统计量 以及 统计量的分布规律 。
? 就显著性检验而言,如何通过统计量进行检验呢?
对于具体的统计量如何构造小概率事件 ——
我们根据统计量的分布形式和规律来构造小
概率事件
对于统计量 F而言,当给定
显著性水平 α=0.05,
若 F的值落入阴影区域,可
认为发生了小概率事件
因为 P{F>3.29}= 0.05
显著性水平 α= 0.05
概率密度
3.29
P{F>3.29}= 0.05
例 1,F统计量服从的分布形式
?/2=0.025?/2=0.025 1-?=0.95
0 1.961.96-
P{x>1.96}= 0.025
P{x<-1.96}= 0.025
例 2,统计量 x服从的分布形式
对于 统计量 x而言,当给定显
著性水平 α=0.05,若 x的值落
入阴影区域,可认为发生了小
概率事件
因为 P{|x|<1.96}= 0.05
二、方程显著性检验
Testing the Overall Significance
本部分内容
? 1,F统计量
? 2、如何利用 F统计量进行方程显著性的 F检
验 —重点
2、方程的显著性检验
? 引
? r2 或 R2 度量了估计出的 SRF对样本观测值的拟合
程度,拟合优度高,说明给定样本下,解释变量
对被解释变量的解释程度高,SRF是对所给样本
的恰当描述,但这种在样本下成立的线性关系在
所研究问题的总体下是否还成立呢?或者说总体
中的 x和 y是否确实为线性关系呢?
? 对模型中被解释变量与解释变量之间的 线性关系
在总体上是否显著成立 作出推断的工具 —— 方程
显著性检验
2、方程的显著性检验
? 用以进行方程的显著性检验的方法主要有三种,F
检验,t检验,r检验。它们的区别在于构造的统
计量不同。
? 应用最为普遍的 F检验。
3、方程显著性的 F检验
? 方程显著性的 F检验 —— 针对整个方程(全体偏回
归系数)的检验
F检验是要检验模型中 被解释变量与全体解释变量之间的线
性关系在总体上是否显著成立,即检验方程
ikikiii xxxy ????? ?????? L22110 i=1,2,…,n
中参数(全体偏斜率系数)是否显著不为 0。
按照假设检验的原理与程序,第一步:提出原假设与备择假设
H k0 1 20 0 0:,,,? ? ?? ? ?L
1H, j? 不全为零
(总体中 y与 x之间 不 存在线性关系)
(总体中 y与 x之间存在线性关系)
F检验的思想 来自于总离差平方和的分解式:
TSS=ESS+RSS
如果 ESS/RSS的比值 越大, 则模型中的 x的全体对 y
的解释程度就 越高, 也就是说线性模型中的解释变
量对被解释变量 y越有影响, 那么, 越有理由认为
总体变量间 存在 线性关系, 反之总体上可能不存在
线性关系 。
因此,可通过该比值 ESS/RSS的大小对总体线
性关系进行推断 。
将上述理由的表述用显著性检验的语言正规化
第二步:根据有关样本信息,对 原假设 H0的真伪进行判断
根据数理统计学中的定义,如果构造一个关于 ESS和
RSS的统计量
)1( ??
?
knR S S
kE S SF
则该统计量服从自由度为( k,n-k-1)的 F分布。
F的值越大,有理由拒绝 H0,于是构造一个小概率事
件 — ( F>Fα (k,n-k-1) )
? F(k,n-k-1)
对于统计量 F而言,当给定
显著性水平 α=0.05,
若 F的值落入阴影区域,可
认为发生了小概率事件
因为 P{F>3.29}= 0.05
显著性水平 α= 0.05
概率密度
3.29
P{F>3.29}= 0.05
例 1,F统计量服从的分布形式
自由度( 7,9)
F分布
若 F统计量的值落入阴影区
域,可认为发生了小概率
事件
因为 P{F>Fα( k,n-k-1) }=α
显著性水平
给定一个显著性水平 ?,可得到一个临界值 F k n k? (,)? ?1,
根据样本在求出 F 统计量的数值后,可通过
F> F k n k? (,)? ?1
发生小概率事件,则在给定的 1- α下,拒绝 H0
或 F ? F k n k? (,)? ?1 未发生小概率事件,则在给定的 1- α下,
不能拒绝 H0
例如:当 k=10,n-k-1=15, α =0.05时,
F0.05(10,15)=2.54
? 该式表明:当 k=10,n-k-1=15, α =0.05时,
P{F> 2.54}=0.05
? 显然,F临界值与显著水平 α以及两个自由度
( k,n-k-1)均有关
? 临界值表明 —当给定显著水平和自由度时,
P{F> Fα}=α
临界值是一个关键点
F临界值与显著水平 α以及两个自由度( k,n-k-1)均
有关
掌握查 F分布表,以寻找 F临界值
方程显著性检验回顾
? 第二步:根据有关样本信息,对原假设 H0的真伪进行判断
( 1)构造 F统计量并计算在给定样本下的 F值
( 2)在给定的显著水平 α下,
查表得临界值 Fα(k,n-k-1)
第一步:提出原假设与备择假设
H k0 1 20 0 0:,,,? ? ?? ? ?L
1H, j? 不全为零
)1( ??
?
kn
R S S
k
E S S
F
( 3)比较 F值与 F ?(k,n-k-1)
F> F k n k? (,)? ?1 在给定的 1- α下,拒绝 H0
或 F ? F k n k? (,)? ?1 在给定的 1- α下,不能 拒绝 H0
案例分析
? 英国对酒精饮料的需求模型的方程显著性
检验
? 教材 P48页中国消费函数模型的方程显著性
检验
英国对酒精饮料的需求模型的方程显著性检验
? 在英国对酒精饮料的需求一例中
? 其中 ESS= 2494.18 TSS= 3620
? RSS= 3620- 2494.18= 1125.82
? K=4 ;n=20 n-k-1=15
689.0R
0059.0--y
2 ?
????
?
ttttt xxxx 5432 0, 6 5 7 00, 0 0 1 80, 3 5 4 00, 0 1 4 0
1H, j? 不全为零( j= 2,3,4,5)
? 在 H0成立的条件下,
? F=(2494.18/4)/(1125.82/15)=8.3080
? 在给定的显著水平 α= 0.05下,
? F0.05( 4,15)= 3.06
? 由于 F=8.3080>F0.05( 4,15)= 3.06
? 在 95%的水平下,拒绝 H0,认为模型的线性
关系显著成立。
0:H 54320 ???? ????
中国消费函数模型的方程显著性检验
在消费模型中,k=2,n=16,
给定 α=0.01,
查得F 0.01( 2,13)=6.70,
而F =28682.51>6.70,
所以在 0.99的水平下,该线性模型显著成
立。
补充部分
关于拟合优度检验与方程显著性检验关系的讨论
可见, F与 R2同向变化:当 R2 =0时, F=0;
当 R2=1时, F为无穷大; R2越大, F值也越大 。
R nn k kF2 1 11? ? ?? ? ?
F
E S S k
R S S n k? ? ?( )1
)1/(
)1/(12
?
????
nTS S
knR S SR
? 问题 3,R2不大,模型质量一定不高吗?
在消费模型中,只要 R2>0.432 →F>6.70→ 该线
性模型在 0.99的水平下显著成立。
有许多著名的模型,R2小于 0.5,支持了重要的
结论,例如收入差距的倒 U型规律。
再一次请注意:在应用中,不要片面追求拟合优
度,重要的是考察模型的经济关系是否合理。
三、变量显著性检验
Testing the Individual Significance
本部分内容
? 1,t统计量
? 2、如何利用 t统计量进行变量显著性的 t检
验 —重点
3、变量显著性检验 —t检验
(针对单个解释变量的检验)
? 滥竽充数
? 对于多元线性回归模型, 方程的总体线性关
系是显著的, 说明被解释变量与 全体 解释变量
之间存在线性关系 。 并不能说明 每个 解释变量
对被解释变量的影响都是显著的 。
?由于方程的显著性检验无法告诉我们每一个
单独的解释变量是否均对被解释变量有影响 。
?因此, 必须对 每个 解释变量进行显著性检验,
检验 每个 解释变量是否对被解释变量有显著影
响 。
? 变量显著性检验的目的是决定是否将其作为解释
变量保留在模型中 。
? 变量显著性检验的数理统计学基础相同于方程显
著性检验, 检验的思路与程序也与方程显著性检
验相似 。
? 用以进行变量显著性检验的方法主要有三种,F
检验, t检验, z检验 。 它们的区别在于构造的统
计量不同 。
? 应用最为普遍的 t检验 。
? 变量显著性的 t检验
t 检验是要检验模型中 具体的每一个解释变量是否对
被解释变量有显著影响
对于模型
ikikiii xxxy ????? ?????? L22110 i=1,2,…,n
从而,t检验是要检验模型中每一个 ?j是否显著不为 0。
( j=1,2,…,k)
如果解释变量 xj对 y影响显著,则模型中 xj前的系数
?j应该不为 0,反之,应该为 0。
H0,?j=0,H1,?j?0
j
S
t jj
?
??
?
? ?
?
按照假设检验的原理与程序,第一步:提出原假设与备择假设
第二步:根据有关样本信息,对 原假设 H0的真伪进行判断
构造一个关于 ?j的统计量
)1(~ ?? knt
的标准差的估计量(值)j??
教材 P50页说明
0
标准正态分布
自由度为 20
的 t分布
自由度为 10
的 t分布
t 统计量与 t 分布
大样本情况下,
( )通
常不使用 t 统
计量,而是使
用Z统计量。
30?n
? 在 H0,?j=0成立的条件下,
jj
SS
t jjj
??
???
??
??
?
?
? )1(~ ?? knt
如何在原假设成立的条件下,构造一个小概
率事件呢?
? 无论是 ?j大于或小于 0很多时,都有理由拒
绝原假设 ?j=0,因此小概率事件设在了分
布的两端。
?/2=0.025?/2=0.025 1-?=0.95
0 1.961.96-
P{x>1.96}= 0.025
P{x<-1.96}= 0.025
例 2,统计量 x服从的分布形式
对于 统计量 x而言,当给定显
著性水平 α=0.05,若 x的值落
入阴影区域,可认为发生了小
概率事件
因为 P{|x|<1.96}= 0.05
?/2?/2 1-?
0
2/t?2/t- ?
若 t 统计量的值落入阴影区
域,可认为发生了小概率
事件
因为 P{|t|>tα/2(n-k-1)}= α
若 t 统计量的值落入阴影区域,
可认为发生了小概率事件
因为 P{|t|>tα/2( n-k-1) }= α
α为 显著性水平
t 分布
给定一个显著性水平 ?,得到一个临界值 t n k?
2
1( )? ?,于是
可根据
t > t n k?
2
1( )? ?
或 t ? t n k?
2
1( )? ?
认为发生了小概率事件,
从而在给定的( 1- α)下,拒绝 H0
认为未发生了小概率事件,
从而在给定的( 1- α)下,不能拒
绝 H0
掌握查 t分布表以寻求 t临界值
变量显著性检验步骤回顾
第二步:根据有关样本信息,对原假设 H0的真伪进行判断
( 1)构造 t统计量并计算在给定样本下的 t值
( 2)在给定的显著水平 α下,
查表得临界值
第一步:提出原假设与备择假设
H0 j 0:? ?
1H, j? = 0
j
St
j
?
?
?
?
?
t n k?
2
1( )? ?
若 t > t n k?2 1( )? ?
或 t ? t n k?
2
1( )? ?
则在给定的( 1- α)下,拒绝 H0
( 3)比较 t值与 t n k?2 1( )? ?
则在给定的( 1- α)下,不能拒绝 H0
? 在消费模型中,
tc=6.412,tgdp=22.00,tcons(-1)=4.188
给定 α=0.01,查得 t0.05(13)=3.012,所以所有
变量都在 0.99的水平下显著。
对于变量显著性检验的五点说明
? 1、因为我们构造的统计量服从 t分布,所以变量的显著性
检验可称为 t检验。
? 2、关于检验标准的判断
? 关键是讲清楚在什么置信水平下显著。对于显著水平 α,
常用的有 0.05,0.01,0.02(还有 0.1)。
? 3、在一元线性回归( k=1)中,t检验与 F检验是一致的。
所以对于一元线性回归模型只进行 t检验
? 4、关于 ?0的显著性检验
? 与(偏)斜率系数类似,对截距 ?0也可以进行显著性检验。
步骤、方法完全一致。
? 5、关于通过 t 检验剔除变量的问题
? 在实际的计量经济模型中,一般情况下,
我们可以按照变量是否通过 t 检验来决定保
留还是剔除某个解释变量。
? 但在做这个决定时一定要慎重:
? 解释变量的选择并不是想研究几个就研究
几个,想选哪个就选哪个,而是要包含所
有对被解释变量有重要影响的因素。
?
? ( 1)在选择变量建立理论模型时,我们是经过慎
重考虑的。对于模型中的能够较准确反映所研究
经济现象,经济理论上对被解释变量有直接影响
并且不能够由模型中其它的变量所代替的解释变
量。即使它们未通过 t检验,也应将它们保留在模
型中。
? ( 2)若利用模型进行政策评价,而有关政策解释
变量未通过 t检验,此时也应该保留该政策变量。
? ( 3)由于经济理论的不完善,我们不能够确定某
些解释变量是否对被解释变量有重要的影响,但也
将它们包含到模型中。
? 对于这一类变量,若它的系数为通过 t检验,而且
上出这些变量并未对参数估计值和模型的检验结果
产生太大影响,则从模型中剔除这些变量可能会使
模型更好。
变量显著性检验的补充部分
? 1,OLS估计量 的标准差的估计量
? 2,t统计量
j??
j?? 分别是 i? 的线性组合,因此 j?? 的概率分
布取决于 随机误差项 ?。
因此在 ? 是正态分布的假设下,每一个 也
服从 正态分布,其分布特征 (密度函数)由其均值和方差唯
一决定。
首先,服从正态分布的随机变量的线性组合仍然
服从正态分布。
其次,
j
?? 的概率分布
j
??
1,OLS估计量标准差的估计量
( 1)
1
i
?
i
??
以一元为例:
),(~? 2
2
11 ?
i
N s??, ),(~? 22
2
00 s?? ?
?
i
i
n
xN
OLS估计量的概率分布
? 2
?
ix
1 ?
s
s
?

x?x?
0?? 和 1?? 的 标准差 分别为,
?
?
2
2
? n
0
i
i
x
x
?
ss ? =
( 2) 随机误差项 ?的方差 2s 的估计
在估计的参数 0?? 和 1?? 的方差和标准差的表达式中,都含
有随机扰动项方差 2s = )var( i? 。 2s 又称为 总体方差 。
由于 2s 实际上是未知的,因此 0?? 和 1?? 的方差与标准差实
际上无法计算。
由于随机项 i? 不可观测,只能从 i? 的估计 —— 残差 ie 出发,
对总体方差 2s 进行估计。
可以证明,总体方差 2s 的 无偏估计量 为
k-1?
2
2
??
?
n
eis n-k-1为残差的自由度
总体方差的无偏估计量
= 残差平方和/残差自由度
? 对于一元而言,总体方差的无偏估计量为
( P28页)
? 对于多元而言,总体方差的无偏估计量为
( P40页)
? k为斜率或偏斜率系数的个数。
2?
2
2
??
?
n
eis
k-1?
2
2
??
?
n
eis
在总体方差 2s 的无偏估计量 2?s 求出后,估计的参数 0?? 和 1??
的方差和标准差的估计量 就可以得出。以一元为例:
1?? 的方差:
1?? 的标准差:
0?? 的方差:
0?? 的标准差:
? 2
2
2
?
??
ix
1 ?
ss
? =
? 2
?
?
ix
S
1 ?
s
? =
?
?
2
2
22
? n??
0
i
i
x
x
?
ss ? =
?
?
2
2
? n?
0
i
i
x
x
S
?
s? =
? 2? ix1 ?
ss
? =
?
?
2
2
? n
0
i
i
x
x
?
ss ? =
2,t统计量
分布的服从自由度为
代替,则无法求出,用由于
),(服从标准正态分布
t1-k-n
?
10N
?
?
??
?
j
jj
j
S
t
S
jj
jj
?
??
?
??
s
s
??
?
?
?
一元模型中的 t统计量
)分布(的服从自由度为
代替,则无法求出,用由于
),(服从标准正态分布
1,0t2-n
?
10N
?
?
??
?
?
?
?
?
j
j
jj
j
S
t
S
jj
jj
?
??
?
??
s
s
??
0
标准正态分布
自由度为 20
的 t分布
自由度为 10
的 t分布
t 统计量与 t 分布
大样本情况下,
( )通
常不使用 t 统
计量,而是使
用Z统计量。
30?n