1
第三节异方差的后果
?1、参数 OLS估计的方差增大
?2,t检验失效,不能拒绝 H0的可能性增大,
?常常犯纳伪错误
?3、降低预测精度
3
? ?
? ? ? ?? ?? ?
? ?
? ? ? ? ? ? ? ?
? ?
? ? ? ? ?
??
2
22
'
1
11
1
1
?
?
?
???
?
XXBC o v
IUUE
XXXUUEXXXBC o v
UXXXBB
BBBBEBC o v
YXXXB
UXBY
??
??
?????
????
???
???
??
?
??
?
?
提出同方差才能将
6
第四节异方差的解决方法
?1。补救异方差的基本思路
?2。模型变换法
?3。加权最小二乘法
?4。“一般解决法 —数据变换”
8
2。模型变换法
?( 1)模型变换法的定义
?( 2)模型变换法的关键
?( 3)模型变换法的变换过程
?( 4)实际处理异方差时,f(xi)的常用形式
?( 5)常用变换举例
?( 6)利用 EViews作模型变换
17
3。加权最小二乘法
?( 1)加权最小二乘法的思路
?( 2)加权最小二乘法的机理
?( 3)加权最小二乘法的定义
?( 4) OLS是加权最小二乘法的特例
?( 5)加权最小二乘法与模型变换法所得结
果是一致
?( 6)在 EViews中实现加权最小二乘法
24
25
26
4。“一般解决法”
?在计量经济学实践中,计量经济学家偏爱
使用 对数变换 解决问题,往往一开始就把
数据化为对数形式,再用对数形式数据来
构成模型,进行回归估计与分析。
?这主要是因为对数形式可以减少异方差和
自相关的程度。
27
对数变换的效果 —— 减少差异
Log 10=1
Log 100=2
Log 1000=3
28
案例 1—— 居民储蓄模型估计
?1。问题的提出
?2。原始数据
?3。异方差检验
?4。异方差模型的估计
?加权 LS法和模型变换法
29
1。问题的提出
?储蓄是居民的 金融消费,也是满足相应收
入水平的“基本生活”以后的 扩展消费,
从具体问题的经验分析,储蓄具有异方差
特性。因此建立储蓄模型就不能使用最小
二乘法。对于这 类典型的异方差问题( 提
问:为什么是典型的? ),我们应当怎样
处理呢?( lx5\yfch)
30
2。原始数据
Y X Y X
′¢ D? ?é ?§?? ê? è? ′¢ D? ?é ?§?? ê? è?
1 264 8777 17 1578 24127
2 105 9210 18 1654 25604
3 90 9954 19 1400 26500
4 131 10508 20 1829 27670
5 122 10979 21 2200 28300
6 107 11912 22 2017 27430
7 406 12747 23 2105 29560
8 503 13499 24 1600 28150
9 431 14269 25 2250 32100
10 588 15522 26 2420 32500
11 898 16730 27 2570 35250
12 950 17663 28 1720 33500
13 779 18575 29 1900 36000
14 819 19535 30 2100 36200
15 1222 21163 31 2300 38200
16 1072 22880
obs obs
31
obs Y X obs Y X
1 264 8777 17 1578 24127
2 105 9210 18 1654 25604
3 90 9954 19 1400 26500
4 131 10508 20 1829 27670
5 122 10979 21 2200 28300
6 107 11912 22 2017 27430
7 406 12747 23 2105 29560
8 503 13499 24 1600 28150
9 431 14269 25 2250 32100
10 588 15522 26 2420 32500
11 898 16730 27 2570 35250
12 950 17663 28 1720 33500
13 779 18575 29 1900 36000
14 819 19535 30 2100 36200
15 1222 21163 31 2300 38200
16 1072 22880
32
33
-6 0 0
-4 0 0
-2 0 0
0
200
400
600
0
1000
2000
3000
5 10 15 20 25 30
R e s id u a l A c tu a l F itte d
实际值、拟和值和残差
34
- 6 0 0
- 4 0 0
- 2 0 0
0
2 0 0
4 0 0
6 0 0
0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0
R
E
S
ID
X
残差与收入 x的散点图
35
3。异方差检验
?( 1)图示法检验
?( 2) G-Q检验
36
( 1)图示法检验
?LS Y C X
?GENR E1=resid
?GENR E2=E1*E1
?SCAT E2 X
?残差平方和呈比较典型的喇叭型
37
'异方差图示法的程序
load c:\lx5\yfch.wf1
scat y x
'计算储蓄函数 chxeq
equation chxeq.ls y c x
genr e1=resid
genr e2=e1*e1
scat e2 x
LX5\YFCH.PRG的程序清单
38
残差平方与自变量呈比较典型的
喇叭型
?先请同学们看老师的演示。请同学们亲手
验证。
0
5 0 0 0 0
1 0 0 0 0 0
1 5 0 0 0 0
2 0 0 0 0 0
2 5 0 0 0 0
0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0
E2
X
39
0
50 00 0
10 00 00
15 00 00
20 00 00
25 00 00
0 10 00 0 20 00 0 30 00 0 40 00 0
R
E
S
ID
2
X
残差平方与自变量 X的散点图
40
储蓄与收入的散点图
0
1 0 0 0
2 0 0 0
3 0 0 0
0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0
Y
X
41
42
43
异方差:残差随收入增大而增大
- 2 0 0 0
- 1 0 0 0
0
1 0 0 0
2 0 0 0
5 10 15 20 25 30
R E S I D
44
( 2) G-Q检验
?1。求两个子样回归方程残差平方和
?加载 (lx4下 )yfch.wf工作文件到内存
?SORT X 按居民收入排序
?SMPL 1 12
?LS Y C X 得 ESS1
?SMPL 20 31
?LS Y C X 得 ESS2
45
加权最小二乘法估计结果
46
- 6 0 0
- 4 0 0
- 2 0 0
0
2 0 0
4 0 0
6 0 0
0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0
R
E
S
ID
X
加权最小二乘法残差与 X的散点图
47
load c:\lx5\yfch.wf1
vector(10) m ‘存放自由度、小样残差平方和、大样残差平方和、
F检验值和 F检验的概率值
SORT X '按居民收入排序
SMPL 1 12 '小数据样本
m(1)=10
equation smleq.LS Y C X
'得 ESS1
m(2)=@ssr
SMPL 20 31 '大数据样本
equation lrgeq.LS Y C X
'得 ESS2
m(3)=@ssr
m(4)=m(3)/m(2)
m(5)=@fdist(m(4),m(1),m(1))
show m
48
C1
Last updated,05/12/99 - 17:22
R1 10.00000
R2 162899.2
R3 769899.2
R4 4.726231
R5 0.010965
R6 0.000000
R7 0.000000
R8 0.000000
R9 0.000000
R10 0.000000
49
小数据组 OLS处理结果
Sample,1 12
Included observations,12
Variable Coefficient Std,Error T-Statistic Prob,
C -823.5754 169.3227 -4.863940 0.0007
X 0.095394 0.013067 7.300328 0.0000
R-squared 0.842009 Mean dependent var 382.9167
Adjusted R-squared 0.826210 S.D,dependent var 306.1590
S.E,of regression 127.6320 Akaike info criterion 9.849314
Sum squared resid 162899.2 Schwartz criterion 9.930131
Log likelihood -74.12314 F-statistic 53.29478
Durbin-Watson stat 1.055825 Prob(F-statistic) 0.000026
50
大数据组 OLS处理结果
Sample,20 31
Included observations,12
Variable Coefficient Std,Error T-Statistic Prob.
C 1141.066 709.8428 1.607491 0.1390
X 0.029409 0.021992 1.337264 0.2108
R-squared 0.151699 Mean dependent var 2084.250
Adjusted R-squared 0.066869 S.D,dependent var 287.2405
S.E,of regression 277.4706 Akaike info criterion 11.40244
Sum squared resid 769899.2 Schwartz criterion 11.48326
Log likelihood -83.44191 F-statistic 1.788274
Durbin-Watson stat 2.864726 Prob(F-statistic) 0.210758
51
( 2`) G-Q检验
?H0:σ21= σ22 HA,σ21≠ σ22
?2。计算 F统计量
?ESS1= 162899.2
?ESS2= 769899.2
?df=(31-7)/2-2=12-2=10
?F=(ESS2/df)/(ESS1/df)= 4.726231
?F > Fo.o1(10,10)则随机扰动项存在异方差
52
53
load d:\eviews\lx\lx5\yfch.wf1
'按变量 x排序
sort x
'生成递增序列 t,用以划分小样本和大样本
genr t=1
genr t=t(-1)+1
'定义存放计算结果的向量 m,m具有 10个元素
vector (10) m
'存放全部样本观察值个数 n
m(1)=@obs(x)
'按照 G-Q戈德菲尔德 -跨特法对于递增或递减型异方差抽去中间 1/4的样本
'余下的划分为小样本和大样本
'计算小样本包含的最后一个样品
m(2)=@FLOOR(3*m(1)/8)+1
'计算大样本起始的第一个样品
m(3)=@FLOOR(5*m(1)/8)+1
'指定小样本的范围
smpl if t<= m(2)
'对小样本进行最小二乘估计
equation mineqn.ls y x c
'将小样本残差平方和置入 m(4)
m(4)=@ssr
54
'指定大样本的范围
smpl if t>=m(3)
'对大样本进行最小二乘估计
equation maxeqn.ls y x c
'将打大样本残差平方和置入 m(5)
m(5)=@ssr
'计算 F统计量
m(6)=m(5)/m(4)
'查 F分布表,求出大于等于该 F的概率,若概率为小概率,拒绝 H0存在异方差,否则,为同方差
m(7)=@fdist(m(6),m(2)-1,m(2)-1)
'显示计算结果
show m
55
4。异方差模型的估计
?( 1)加权最小二乘法
?( 2)模型变换法
56
( 1)加权最小二乘法
?EViews中有加权最小二乘法的命令
?LS ( W=权数名) CHX C SHR
?本例使用命令:
?GENR SHRH=1/SHR
?LS( W=SHRH) CHX C SHR
?所得结果见操作
57
权数序列名
Proce==>Equation==>Option==>选定同方差、给出权数名 ==>OK
同质性
58
WLS处理结果
LS // Dependent Variable is CHX
Weighting series,SHRW
Sample,1 31
Included observations,31
Variable Coefficient Std,Error T-Statistic Prob,
C -571.8496 105.8066 -5.404667 0.0000
SHR 0.076623 0.006294 12.17389 0.0000
Weighted Statistics
R-squared 0.501807 Mean dependent var 877.7359
Adjusted R-squared 0.484628 S.D,dependent var 423.6204
S.E,of regression 304.1144 Akaike info criterion 11.49715
Sum squared resid 2682082,Schwartz criterion 11.58966
Log likelihood -220.1929 F-statistic 29.21043
Durbin-Watson stat 1.149682 Prob(F-statistic) 0.000008
59
WLS处理后的残差图
- 8 0 0 0
- 6 0 0 0
- 4 0 0 0
- 2 0 0 0
0
2 0 0 0
5 10 15 20 25 30
R E S I D
60
( 2)模型变换法
?GENR Y1= CH / SHR
?GENR X1= 1 / SHR
?LS Y1 C X1
?思考题
?异方差的函数形式是怎样假定的?
?比较加权最小二乘法与模型变换法结果
?解释所得模型的经济意义?
61
关于异方差的思考题
?1。举例说明经济现象中的异方差性
?2。阐述 G-Q检验的步骤,并说明构造 F检
验统计量的道理
?3。说明加权最小二乘法的基本思想
?4。如何事先假定异方差 ?2i = ?2 f(xi)的具
体形式
62
案例 2—— 人均消费函数
?某地年人均收入 X和年人均消费 Y的资料在
LX4目录下名为 Lchf106中。要求
?( 1)用 PARK检验是否存在异方差
?( 2)用 OLS估计消费函数
?( 3)用 WLS估计消费函数
?( 4)比较两种方法得到的结果
63
- 1,0
- 0,5
0,0
0,5
1,0
20 40 60 80 1 0 0 1 2 0 1 4 0
R
E
S
ID
X
残差自变量散点图 —— 纺锤型
64
案例 3—— 分组资料 ——
lx4\yfch2.wf1
?9组不同就业规模雇员的平均劳动生产率 Y
及其标准差 X的资料在 LX4目录下名为
Lchf107_1中。要求(提示:以 1/x/x为权
数)
?( 1)绘制散点图,并判断 Y关于 X的线性模
型拟的优劣?
?( 2)检验是否存在异方差?
?( 3)若存在异方差,从经济意义上分析产
生异方差的原因?如何采取补救措施?
65
obs GRSH GLRY obs GRSH GLRY
1 294 30 15 615 100
2 247 32 16 999 109
3 267 37 17 1022 114
4 358 44 18 1015 117
5 423 47 19 700 106
6 311 49 20 850 128
7 450 56 21 980 130
8 534 62 22 1025 160
9 438 68 23 1021 97
10 697 78 24 1200 180
11 688 80 25 1250 112
12 630 84 26 1500 210
13 709 88 27 1650 135
14 627 97
Lx4\Yfch2.wf1原始数据
66
67
- 6 0
- 4 0
- 2 0
0
20
40
0 5 0 0 1 0 0 0 1 5 0 0 2 0 0 0
R
E
S
ID
G R S H
68
平方项极显著,所以用平方项的倒数作权数
69
- 6 0
- 4 0
- 2 0
0
20
40
0 5 0 0 1 0 0 0 1 5 0 0 2 0 0 0
R
E
S
ID
G R S H
残差与自变量散点图
70
权数 QSH=1/GRSH^2
71
分组资料,N每组户数,Y平均支出,X平均收入
请用 LS和加权 LS拟合模型,并作对比。
72
?? ×é ?§êy ?? ?ù ?§3? ?? ?ù ê? è?
N Y X
1 5 14 16
2 10 15 20
3 20 17 22
4 15 22 25
5 5 25 30
6 10 28 33
7 6 30 36
8 9 35 43
9 6 39 48
10 14 45 55
obs
73
74
75
- 8 0
- 6 0
- 4 0
- 2 0
0
20
40
0 5 0 0 1 0 0 0 1 5 0 0 2 0 0 0
R
E
S
ID
G R S H
76
案例 4—— 我国北方农业产出模型
?85年我国北方 12个省市的农业总产值 Y、农业
劳动力 X1、灌溉面积 X2、化肥 X3、户均固定资
产原值 X4、农机动力 X5的资料在 LX4目录下名
为 Lchf107_2中。要求
?( 1)建立我国北方农业产出模型
?( 2)用解析法判断是否存在异方差
?( 3)若存在异方差,采用适当方法估计模型
参数