第五章练习题参考解答练习题
5.1 设消费函数为
式中,为消费支出;为个人可支配收入;为个人的流动资产;为随机误差项,并且(其中为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
5.2 根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。例如,设模型为,对该模型中的变量取对数后得如下形式
(1)如果要有零期望值,的分布应该是什么?
(2)如果,会不会?为什么?
(3)如果不为零,怎样才能使它等于零?
5.3 由表中给出消费Y与收入X的数据,试根据所给数据资料完成以下问题:
(1)估计回归模型中的未知参数和,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性;
(3)选用合适的方法修正异方差。
Y
X
Y
X
Y
X
55
80
152
220
95
140
65
100
144
210
108
145
70
85
175
245
113
150
80
110
180
260
110
160
79
120
135
190
125
165
84
115
140
205
115
180
98
130
178
265
130
185
95
140
191
270
135
190
90
125
137
230
120
200
75
90
189
250
140
205
74
105
55
80
140
210
110
160
70
85
152
220
113
150
75
90
140
225
125
165
65
100
137
230
108
145
74
105
145
240
115
180
80
110
175
245
140
225
84
115
189
250
120
200
79
120
180
260
145
240
90
125
178
265
130
185
98
130
191
270
5.4 由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:
试建立我国北方地区农业产出线性模型;
选用适当的方法检验模型中是否存在异方差;
如果存在异方差,采用适当的方法加以修正。
地区
农业总产值
农业劳动力
灌溉面积
化肥用量
户均固定
农机动力
(亿元)
(万人)
(万公顷)
(万吨)
资产(元)
(万马力)
北京
19.64
90.1
33.84
7.5
394.3
435.3
天津
14.4
95.2
34.95
3.9
567.5
450.7
河北
149.9
1639,0
357.26
92.4
706.89
2712.6
山西
55.07
562.6
107.9
31.4
856.37
1118.5
内蒙古
60.85
462.9
96.49
15.4
1282.81
641.7
辽宁
87.48
588.9
72.4
61.6
844.74
1129.6
吉林
73.81
399.7
69.63
36.9
2576.81
647.6
黑龙江
104.51
425.3
67.95
25.8
1237.16
1305.8
山东
276.55
2365.6
456.55
152.3
5812.02
3127.9
河南
200.02
2557.5
318.99
127.9
754.78
2134.5
陕西
68.18
884.2
117.9
36.1
607.41
764
新疆
49.12
256.1
260.46
15.1
1143.67
523.3
5.5 表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)。试根据资料建立一个回归模型,运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。
单位:百万美元工业群体
销售量X
R&D费用Y
利润Z
1.容器与包装
6375.3
62.5
185.1
2.非银行业金融
11626.4
92.9
1569.5
3.服务行业
14655.1
178.3
276.8
4.金属与采矿
21869.2
258.4
2828.1
5.住房与建筑
26408.3
494.7
225.9
6.一般制造业
32405.6
1083
3751.9
7.休闲娱乐
35107.7
1620.6
2884.1
8.纸张与林木产品
40295.4
421.7
4645.7
9.食品
70761.6
509.2
5036.4
10.卫生保健
80552.8
6620.1
13869.9
11.宇航
95294
3918.6
4487.8
12.消费者用品
101314.3
1595.3
10278.9
13.电器与电子产品
116141.3
6107.5
8787.3
14.化工产品
122315.7
4454.1
16438.8
15.五金
141649.9
3163.9
9761.4
16.办公设备与电算机
175025.8
13210.7
19774.5
17.燃料
230614.5
1703.8
22626.6
18.汽车
293543
9528.2
18415.4
5.6 由表中给出的收入和住房支出样本数据,建立住房支出模型。
住房支出
收入
1.8
5
2
5
2
5
2
5
2.1
5
3
10
3.2
10
3.5
10
3.5
10
3.6
10
4.2
15
4.2
15
4.5
15
4.8
15
5
15
4.8
20
5
20
5.7
20
6
20
6.2
20
假设模型为,其中为住房支出,为收入。试求解下列问题:
(1)用OLS求参数的估计值、标准差、拟合优度
(2)用Goldfeld-Quandt方法检验异方差(假设分组时不去掉任何样本值)
(3)如果模型存在异方差,假设异方差的形式是,试用加权最小二乘法重新估计和的估计值、标准差、拟合优度。
5.7 表中给出1969年20个国家的股票价格(Y)和消费者价格年百分率变化(X)的一个横截面数据。
国家
股票价格变化率%Y
消费者价格变化率%X
1.澳大利亚
5
4.3
2.奥地利
11.1
4.6
3.比利时
3.2
2.4
4.加拿大
7.9
2.4
5.智利
25.5
26.4
6.丹麦
3.8
4.2
7.芬兰
11.1
5.5
8.法国
9.9
4.7
9.德国
13.3
2.2
10.印度
1.5
4
11.爱尔兰
6.4
4
12.以色列
8.9
8.4
13.意大利
8.1
3.3
14.日本
13.5
4.7
15.墨西哥
4.7
5.2
16.荷兰
7.5
3.6
17.新西兰
4.7
3.6
18.瑞典
8
4
19.英国
7.5
3.9
20.美国
9
2.1
试根据资料完成以下问题:
(1)将Y对X回归并分析回归中的残差;
(2)因智利的数据出现了异常,去掉智利数据后,重新作回归并再次分析回归中的残差;
(3)如果根据第1条的结果你将得到有异方差性的结论,而根据第2条的结论你又得到相反的结论,对此你能得出什么样的结论?
5.8 表中给出的是1998年我国重要制造业销售收入与销售利润的数据资料
行业名称
销售收入
销售利润
行业名称
销售收入
销售利润
食品加工业
187.25
3180.44
医药制造业
238.71
1264.10
食品制造业
111.42
1119.88
化学纤维制造
81.57
779.46
饮料制造业
205.42
1489.89
橡胶制品业
77.84
692.08
烟草加工业
183.87
1328.59
塑料制品业
144.34
1345.00
纺织业
316.79
3862.90
非金属矿制品
339.26
2866.14
服装制造业
157.70
1779.10
黑色金属冶炼
367.47
3868.28
皮革羽绒制品
81.73
1081.77
有色金属冶炼
144.29
1535.16
木材加工业
35.67
443.74
金属制品业
201.42
1948.12
家具制造业
31.06
226.78
普通机械制造
354.69
2351.68
造纸及纸制品
134.40
1124.94
专用设备制造
238.16
1714.73
印刷业
90.12
499.83
交通运输设备
511.94
4011.53
文教体育用品
54.40
504.44
电子机械制造
409.83
3286.15
石油加工业
194.45
2363.80
电子通讯设备
508.15
4499.19
化学原料制品
502.61
4195.22
仪器仪表设备
72.46
663.68
试完成以下问题:
(1)求销售利润岁销售收入的样本回归函数,并对模型进行经济意义检验和统计检验;
(2)分别用图形法、Glejser方法、White方法检验模型是否存在异方差;
(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.9 下表所给资料为1978年至2000年四川省农村人均纯收入和人均生活费支出的数据。
四川省农村人均纯收入和人均生活费支出 单位:元/人时间
农村人均纯收入X
农村人均生活费支出Y
时间
农村人均纯收入X
农村人均生活费支出Y
1978
127.1
120.3
1990
557.76
509.16
1979
155.9
142.1
1991
590.21
552.39
1980
187.9
159.5
1992
634.31
569.46
1981
220.98
184.0
1993
698.27
647.43
1982
255.96
208.23
1994
946.33
904.28
1983
258.39
231.12
1995
1158.29
1092.91
1984
286.76
251.83
1996
1459.09
1358.03
1985
315.07
276.25
1997
1680.69
1440.48
1986
337.94
310.92
1998
1789.17
1440.77
1987
369.46
348.32
1999
1843.47
1426.06
1988
448.85
426.47
2000
1903.60
1485.34
1989
494.07
473.59
数据来源:《四川统计年鉴》2001年。
(1)求农村人均生活费支出对人均纯收入的样本回归函数,并对模型进行经济意义检验和统计检验;
(2)选用适当的方法检验模型中是否存在异方差;
(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.10 在题5.9中用的是时间序列数据,而且没有剔除物价上涨因素。试分析如果剔除物价上涨因素,即用实际可支配收入和实际消费支出,异方差的问题是否会有所改善?由于缺乏四川省从1978年起的农村居民消费价格定基指数的数据,以1978年—2000年全国商品零售价格定基指数(以1978年为100)代替,数据如下表所示,
年份
商品零售价格指数
年份
商品零售消费价格指数
年份
商品零售消费价格指数
1978
100
1986
135.8
1994
310.2
1979
102
1987
145.7
1995
356.1
1980
108.1
1988
172.7
1996
377.8
1981
110.7
1989
203.4
1997
380.8
1982
112.8
1990
207.7
1998
370.9
1983
114.5
1991
213.7
1999
359.8
1984
117.7
1992
225.2
2000
354.4
1985
128.1
1993
254.9
数据来源:《中国统计年鉴2001》
练习题参考解答
练习题5.1 参考解答
(1)因为,所以取,用乘给定模型两端,得
上述模型的随机误差项的方差为一固定常数,即
(2)根据加权最小二乘法及第四章里(4.5)和(4.6)式,可得修正异方差后的参数估计式为
其中
练习题5.3参考解答
(1)该模型样本回归估计式的书写形式为
(2)首先,用Goldfeld-Quandt法进行检验。
a.将样本按递增顺序排序,去掉1/4,再分为两个部分的样本,即。
b.分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
求F统计量为
给定,查F分布表,得临界值为。
c.比较临界值与F统计量值,有=4.1390>,说明该模型的随机误差项存在异方差。
其次,用White法进行检验。具体结果见下表
White Heteroskedasticity Test:
F-statistic
6.301373
Probability
0.003370
Obs*R-squared
10.86401
Probability
0.004374
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/05/05 Time,12:37
Sample,1 60
Included observations,60
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
-10.03614
131.1424
-0.076529
0.9393
X
0.165977
1.619856
0.102464
0.9187
X^2
0.001800
0.004587
0.392469
0.6962
R-squared
0.181067
Mean dependent var
78.86225
Adjusted R-squared
0.152332
S.D,dependent var
111.1375
S.E,of regression
102.3231
Akaike info criterion
12.14285
Sum squared resid
596790.5
Schwarz criterion
12.24757
Log likelihood
-361.2856
F-statistic
6.301373
Durbin-Watson stat
0.937366
Prob(F-statistic)
0.003370
给定,在自由度为2下查卡方分布表,得。
比较临界值与卡方统计量值,即,同样说明模型中的随机误差项存在异方差。
(2)用权数,作加权最小二乘估计,得如下结果
Dependent Variable,Y
Method,Least Squares
Date,08/05/05 Time,13:17
Sample,1 60
Included observations,60
Weighting series,W1
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
10.37051
2.629716
3.943587
0.0002
X
0.630950
0.018532
34.04667
0.0000
Weighted Statistics
R-squared
0.211441
Mean dependent var
106.2101
Adjusted R-squared
0.197845
S.D,dependent var
8.685376
S.E,of regression
7.778892
Akaike info criterion
6.973470
Sum squared resid
3509.647
Schwarz criterion
7.043282
Log likelihood
-207.2041
F-statistic
1159.176
Durbin-Watson stat
0.958467
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared
0.946335
Mean dependent var
119.6667
Adjusted R-squared
0.945410
S.D,dependent var
38.68984
S.E,of regression
9.039689
Sum squared resid
4739.526
Durbin-Watson stat
0.800564
其估计的书写形式为
练习题5.5参考解答
(1)建立样本回归模型。
(2)利用White检验判断模型是否存在异方差。
White Heteroskedasticity Test:
F-statistic
3.057161
Probability
0.076976
Obs*R-squared
5.212471
Probability
0.073812
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/08/05 Time,15:38
Sample,1 18
Included observations,18
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
-6219633.
6459811.
-0.962820
0.3509
X
229.3496
126.2197
1.817066
0.0892
X^2
-0.000537
0.000449
-1.194942
0.2507
R-squared
0.289582
Mean dependent var
6767029.
Adjusted R-squared
0.194859
S.D,dependent var
14706003
S.E,of regression
13195642
Akaike info criterion
35.77968
Sum squared resid
2.61E+15
Schwarz criterion
35.92808
Log likelihood
-319.0171
F-statistic
3.057161
Durbin-Watson stat
1.694572
Prob(F-statistic)
0.076976
给定和自由度为2下,查卡方分布表,得临界值,而White统计量,有,则不拒绝原假设,说明模型中不存在异方差。
(3)有Glejser检验判断模型是否存在异方差。经过试算,取如下函数形式
得样本估计式
由此,可以看出模型中随机误差项有可能存在异方差。
(4)对异方差的修正。取权数为,得如下估计结果
练习题5.7参考解答
(1)求回归估计式。
作残差的平方对解释变量的散点图
由图形可以看出,模型有可能存在异方差。
(2)去掉智利的数据后,回归得到如下模型
作残差平方对解释变量的散点图
从图形看出,异方差的程度降低了。
(3)比较情况(1)和情况(2),实际上根据所给的数据,我们发现情况(1)的异方差性比情况(2)的异方差性要低。
练习题5.9参考解答
(1)建立样本回归函数。
从估计的结果看,各项检验指标均显著,但从残差平方对解释变量散点图可以看出,模型很可能存在异方差。
(2)用White检验判断是否存在异方差。
White Heteroskedasticity Test:
F-statistic
9.509463
Probability
0.001252
Obs*R-squared
11.21085
Probability
0.003678
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/08/05 Time,17:04
Sample,1978 2000
Included observations,23
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
-2319.690
2268.373
-1.022623
0.3187
X
10.85979
6.644388
1.634430
0.1178
X^2
-0.002560
0.003247
-0.788315
0.4398
R-squared
0.487428
Mean dependent var
3337.769
Adjusted R-squared
0.436171
S.D,dependent var
5013.402
S.E,of regression
3764.490
Akaike info criterion
19.42572
Sum squared resid
2.83E+08
Schwarz criterion
19.57383
Log likelihood
-220.3958
F-statistic
9.509463
Durbin-Watson stat
1.552514
Prob(F-statistic)
0.001252
由上表可知,,给定,在自由度为2下,查卡方分布表,得临界值为,显然,>,则拒绝原假设,说明模型存在异方差。
进一步,用ARCH检验判断模型是否存在异方差。经试算选滞后阶数为1,则ARCH检验结果见下表
ARCH Test:
F-statistic
9.394796
Probability
0.006109
Obs*R-squared
7.031364
Probability
0.008009
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/08/05 Time,17:11
Sample(adjusted),1979 2000
Included observations,22 after adjusting endpoints
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
1676.876
1086.874
1.542843
0.1385
RESID^2(-1)
0.588797
0.192098
3.065093
0.0061
R-squared
0.319607
Mean dependent var
3457.332
Adjusted R-squared
0.285588
S.D,dependent var
5097.707
S.E,of regression
4308.730
Akaike info criterion
19.66118
Sum squared resid
3.71E+08
Schwarz criterion
19.76037
Log likelihood
-214.2730
F-statistic
9.394796
Durbin-Watson stat
1.874793
Prob(F-statistic)
0.006109
由上表可知,,在和自由度为1下,查卡方分布表,得临界值为,显然,>,则说明模型中随机误差项存在异方差。
(3)修正异方差。取权数为,得如下估计结果
经检验异方差的表现有明显的降低。
5.1 设消费函数为
式中,为消费支出;为个人可支配收入;为个人的流动资产;为随机误差项,并且(其中为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
5.2 根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。例如,设模型为,对该模型中的变量取对数后得如下形式
(1)如果要有零期望值,的分布应该是什么?
(2)如果,会不会?为什么?
(3)如果不为零,怎样才能使它等于零?
5.3 由表中给出消费Y与收入X的数据,试根据所给数据资料完成以下问题:
(1)估计回归模型中的未知参数和,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性;
(3)选用合适的方法修正异方差。
Y
X
Y
X
Y
X
55
80
152
220
95
140
65
100
144
210
108
145
70
85
175
245
113
150
80
110
180
260
110
160
79
120
135
190
125
165
84
115
140
205
115
180
98
130
178
265
130
185
95
140
191
270
135
190
90
125
137
230
120
200
75
90
189
250
140
205
74
105
55
80
140
210
110
160
70
85
152
220
113
150
75
90
140
225
125
165
65
100
137
230
108
145
74
105
145
240
115
180
80
110
175
245
140
225
84
115
189
250
120
200
79
120
180
260
145
240
90
125
178
265
130
185
98
130
191
270
5.4 由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:
试建立我国北方地区农业产出线性模型;
选用适当的方法检验模型中是否存在异方差;
如果存在异方差,采用适当的方法加以修正。
地区
农业总产值
农业劳动力
灌溉面积
化肥用量
户均固定
农机动力
(亿元)
(万人)
(万公顷)
(万吨)
资产(元)
(万马力)
北京
19.64
90.1
33.84
7.5
394.3
435.3
天津
14.4
95.2
34.95
3.9
567.5
450.7
河北
149.9
1639,0
357.26
92.4
706.89
2712.6
山西
55.07
562.6
107.9
31.4
856.37
1118.5
内蒙古
60.85
462.9
96.49
15.4
1282.81
641.7
辽宁
87.48
588.9
72.4
61.6
844.74
1129.6
吉林
73.81
399.7
69.63
36.9
2576.81
647.6
黑龙江
104.51
425.3
67.95
25.8
1237.16
1305.8
山东
276.55
2365.6
456.55
152.3
5812.02
3127.9
河南
200.02
2557.5
318.99
127.9
754.78
2134.5
陕西
68.18
884.2
117.9
36.1
607.41
764
新疆
49.12
256.1
260.46
15.1
1143.67
523.3
5.5 表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量(X)。试根据资料建立一个回归模型,运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。
单位:百万美元工业群体
销售量X
R&D费用Y
利润Z
1.容器与包装
6375.3
62.5
185.1
2.非银行业金融
11626.4
92.9
1569.5
3.服务行业
14655.1
178.3
276.8
4.金属与采矿
21869.2
258.4
2828.1
5.住房与建筑
26408.3
494.7
225.9
6.一般制造业
32405.6
1083
3751.9
7.休闲娱乐
35107.7
1620.6
2884.1
8.纸张与林木产品
40295.4
421.7
4645.7
9.食品
70761.6
509.2
5036.4
10.卫生保健
80552.8
6620.1
13869.9
11.宇航
95294
3918.6
4487.8
12.消费者用品
101314.3
1595.3
10278.9
13.电器与电子产品
116141.3
6107.5
8787.3
14.化工产品
122315.7
4454.1
16438.8
15.五金
141649.9
3163.9
9761.4
16.办公设备与电算机
175025.8
13210.7
19774.5
17.燃料
230614.5
1703.8
22626.6
18.汽车
293543
9528.2
18415.4
5.6 由表中给出的收入和住房支出样本数据,建立住房支出模型。
住房支出
收入
1.8
5
2
5
2
5
2
5
2.1
5
3
10
3.2
10
3.5
10
3.5
10
3.6
10
4.2
15
4.2
15
4.5
15
4.8
15
5
15
4.8
20
5
20
5.7
20
6
20
6.2
20
假设模型为,其中为住房支出,为收入。试求解下列问题:
(1)用OLS求参数的估计值、标准差、拟合优度
(2)用Goldfeld-Quandt方法检验异方差(假设分组时不去掉任何样本值)
(3)如果模型存在异方差,假设异方差的形式是,试用加权最小二乘法重新估计和的估计值、标准差、拟合优度。
5.7 表中给出1969年20个国家的股票价格(Y)和消费者价格年百分率变化(X)的一个横截面数据。
国家
股票价格变化率%Y
消费者价格变化率%X
1.澳大利亚
5
4.3
2.奥地利
11.1
4.6
3.比利时
3.2
2.4
4.加拿大
7.9
2.4
5.智利
25.5
26.4
6.丹麦
3.8
4.2
7.芬兰
11.1
5.5
8.法国
9.9
4.7
9.德国
13.3
2.2
10.印度
1.5
4
11.爱尔兰
6.4
4
12.以色列
8.9
8.4
13.意大利
8.1
3.3
14.日本
13.5
4.7
15.墨西哥
4.7
5.2
16.荷兰
7.5
3.6
17.新西兰
4.7
3.6
18.瑞典
8
4
19.英国
7.5
3.9
20.美国
9
2.1
试根据资料完成以下问题:
(1)将Y对X回归并分析回归中的残差;
(2)因智利的数据出现了异常,去掉智利数据后,重新作回归并再次分析回归中的残差;
(3)如果根据第1条的结果你将得到有异方差性的结论,而根据第2条的结论你又得到相反的结论,对此你能得出什么样的结论?
5.8 表中给出的是1998年我国重要制造业销售收入与销售利润的数据资料
行业名称
销售收入
销售利润
行业名称
销售收入
销售利润
食品加工业
187.25
3180.44
医药制造业
238.71
1264.10
食品制造业
111.42
1119.88
化学纤维制造
81.57
779.46
饮料制造业
205.42
1489.89
橡胶制品业
77.84
692.08
烟草加工业
183.87
1328.59
塑料制品业
144.34
1345.00
纺织业
316.79
3862.90
非金属矿制品
339.26
2866.14
服装制造业
157.70
1779.10
黑色金属冶炼
367.47
3868.28
皮革羽绒制品
81.73
1081.77
有色金属冶炼
144.29
1535.16
木材加工业
35.67
443.74
金属制品业
201.42
1948.12
家具制造业
31.06
226.78
普通机械制造
354.69
2351.68
造纸及纸制品
134.40
1124.94
专用设备制造
238.16
1714.73
印刷业
90.12
499.83
交通运输设备
511.94
4011.53
文教体育用品
54.40
504.44
电子机械制造
409.83
3286.15
石油加工业
194.45
2363.80
电子通讯设备
508.15
4499.19
化学原料制品
502.61
4195.22
仪器仪表设备
72.46
663.68
试完成以下问题:
(1)求销售利润岁销售收入的样本回归函数,并对模型进行经济意义检验和统计检验;
(2)分别用图形法、Glejser方法、White方法检验模型是否存在异方差;
(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.9 下表所给资料为1978年至2000年四川省农村人均纯收入和人均生活费支出的数据。
四川省农村人均纯收入和人均生活费支出 单位:元/人时间
农村人均纯收入X
农村人均生活费支出Y
时间
农村人均纯收入X
农村人均生活费支出Y
1978
127.1
120.3
1990
557.76
509.16
1979
155.9
142.1
1991
590.21
552.39
1980
187.9
159.5
1992
634.31
569.46
1981
220.98
184.0
1993
698.27
647.43
1982
255.96
208.23
1994
946.33
904.28
1983
258.39
231.12
1995
1158.29
1092.91
1984
286.76
251.83
1996
1459.09
1358.03
1985
315.07
276.25
1997
1680.69
1440.48
1986
337.94
310.92
1998
1789.17
1440.77
1987
369.46
348.32
1999
1843.47
1426.06
1988
448.85
426.47
2000
1903.60
1485.34
1989
494.07
473.59
数据来源:《四川统计年鉴》2001年。
(1)求农村人均生活费支出对人均纯收入的样本回归函数,并对模型进行经济意义检验和统计检验;
(2)选用适当的方法检验模型中是否存在异方差;
(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.10 在题5.9中用的是时间序列数据,而且没有剔除物价上涨因素。试分析如果剔除物价上涨因素,即用实际可支配收入和实际消费支出,异方差的问题是否会有所改善?由于缺乏四川省从1978年起的农村居民消费价格定基指数的数据,以1978年—2000年全国商品零售价格定基指数(以1978年为100)代替,数据如下表所示,
年份
商品零售价格指数
年份
商品零售消费价格指数
年份
商品零售消费价格指数
1978
100
1986
135.8
1994
310.2
1979
102
1987
145.7
1995
356.1
1980
108.1
1988
172.7
1996
377.8
1981
110.7
1989
203.4
1997
380.8
1982
112.8
1990
207.7
1998
370.9
1983
114.5
1991
213.7
1999
359.8
1984
117.7
1992
225.2
2000
354.4
1985
128.1
1993
254.9
数据来源:《中国统计年鉴2001》
练习题参考解答
练习题5.1 参考解答
(1)因为,所以取,用乘给定模型两端,得
上述模型的随机误差项的方差为一固定常数,即
(2)根据加权最小二乘法及第四章里(4.5)和(4.6)式,可得修正异方差后的参数估计式为
其中
练习题5.3参考解答
(1)该模型样本回归估计式的书写形式为
(2)首先,用Goldfeld-Quandt法进行检验。
a.将样本按递增顺序排序,去掉1/4,再分为两个部分的样本,即。
b.分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
求F统计量为
给定,查F分布表,得临界值为。
c.比较临界值与F统计量值,有=4.1390>,说明该模型的随机误差项存在异方差。
其次,用White法进行检验。具体结果见下表
White Heteroskedasticity Test:
F-statistic
6.301373
Probability
0.003370
Obs*R-squared
10.86401
Probability
0.004374
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/05/05 Time,12:37
Sample,1 60
Included observations,60
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
-10.03614
131.1424
-0.076529
0.9393
X
0.165977
1.619856
0.102464
0.9187
X^2
0.001800
0.004587
0.392469
0.6962
R-squared
0.181067
Mean dependent var
78.86225
Adjusted R-squared
0.152332
S.D,dependent var
111.1375
S.E,of regression
102.3231
Akaike info criterion
12.14285
Sum squared resid
596790.5
Schwarz criterion
12.24757
Log likelihood
-361.2856
F-statistic
6.301373
Durbin-Watson stat
0.937366
Prob(F-statistic)
0.003370
给定,在自由度为2下查卡方分布表,得。
比较临界值与卡方统计量值,即,同样说明模型中的随机误差项存在异方差。
(2)用权数,作加权最小二乘估计,得如下结果
Dependent Variable,Y
Method,Least Squares
Date,08/05/05 Time,13:17
Sample,1 60
Included observations,60
Weighting series,W1
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
10.37051
2.629716
3.943587
0.0002
X
0.630950
0.018532
34.04667
0.0000
Weighted Statistics
R-squared
0.211441
Mean dependent var
106.2101
Adjusted R-squared
0.197845
S.D,dependent var
8.685376
S.E,of regression
7.778892
Akaike info criterion
6.973470
Sum squared resid
3509.647
Schwarz criterion
7.043282
Log likelihood
-207.2041
F-statistic
1159.176
Durbin-Watson stat
0.958467
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared
0.946335
Mean dependent var
119.6667
Adjusted R-squared
0.945410
S.D,dependent var
38.68984
S.E,of regression
9.039689
Sum squared resid
4739.526
Durbin-Watson stat
0.800564
其估计的书写形式为
练习题5.5参考解答
(1)建立样本回归模型。
(2)利用White检验判断模型是否存在异方差。
White Heteroskedasticity Test:
F-statistic
3.057161
Probability
0.076976
Obs*R-squared
5.212471
Probability
0.073812
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/08/05 Time,15:38
Sample,1 18
Included observations,18
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
-6219633.
6459811.
-0.962820
0.3509
X
229.3496
126.2197
1.817066
0.0892
X^2
-0.000537
0.000449
-1.194942
0.2507
R-squared
0.289582
Mean dependent var
6767029.
Adjusted R-squared
0.194859
S.D,dependent var
14706003
S.E,of regression
13195642
Akaike info criterion
35.77968
Sum squared resid
2.61E+15
Schwarz criterion
35.92808
Log likelihood
-319.0171
F-statistic
3.057161
Durbin-Watson stat
1.694572
Prob(F-statistic)
0.076976
给定和自由度为2下,查卡方分布表,得临界值,而White统计量,有,则不拒绝原假设,说明模型中不存在异方差。
(3)有Glejser检验判断模型是否存在异方差。经过试算,取如下函数形式
得样本估计式
由此,可以看出模型中随机误差项有可能存在异方差。
(4)对异方差的修正。取权数为,得如下估计结果
练习题5.7参考解答
(1)求回归估计式。
作残差的平方对解释变量的散点图
由图形可以看出,模型有可能存在异方差。
(2)去掉智利的数据后,回归得到如下模型
作残差平方对解释变量的散点图
从图形看出,异方差的程度降低了。
(3)比较情况(1)和情况(2),实际上根据所给的数据,我们发现情况(1)的异方差性比情况(2)的异方差性要低。
练习题5.9参考解答
(1)建立样本回归函数。
从估计的结果看,各项检验指标均显著,但从残差平方对解释变量散点图可以看出,模型很可能存在异方差。
(2)用White检验判断是否存在异方差。
White Heteroskedasticity Test:
F-statistic
9.509463
Probability
0.001252
Obs*R-squared
11.21085
Probability
0.003678
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/08/05 Time,17:04
Sample,1978 2000
Included observations,23
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
-2319.690
2268.373
-1.022623
0.3187
X
10.85979
6.644388
1.634430
0.1178
X^2
-0.002560
0.003247
-0.788315
0.4398
R-squared
0.487428
Mean dependent var
3337.769
Adjusted R-squared
0.436171
S.D,dependent var
5013.402
S.E,of regression
3764.490
Akaike info criterion
19.42572
Sum squared resid
2.83E+08
Schwarz criterion
19.57383
Log likelihood
-220.3958
F-statistic
9.509463
Durbin-Watson stat
1.552514
Prob(F-statistic)
0.001252
由上表可知,,给定,在自由度为2下,查卡方分布表,得临界值为,显然,>,则拒绝原假设,说明模型存在异方差。
进一步,用ARCH检验判断模型是否存在异方差。经试算选滞后阶数为1,则ARCH检验结果见下表
ARCH Test:
F-statistic
9.394796
Probability
0.006109
Obs*R-squared
7.031364
Probability
0.008009
Test Equation:
Dependent Variable,RESID^2
Method,Least Squares
Date,08/08/05 Time,17:11
Sample(adjusted),1979 2000
Included observations,22 after adjusting endpoints
Variable
Coefficient
Std,Error
t-Statistic
Prob,
C
1676.876
1086.874
1.542843
0.1385
RESID^2(-1)
0.588797
0.192098
3.065093
0.0061
R-squared
0.319607
Mean dependent var
3457.332
Adjusted R-squared
0.285588
S.D,dependent var
5097.707
S.E,of regression
4308.730
Akaike info criterion
19.66118
Sum squared resid
3.71E+08
Schwarz criterion
19.76037
Log likelihood
-214.2730
F-statistic
9.394796
Durbin-Watson stat
1.874793
Prob(F-statistic)
0.006109
由上表可知,,在和自由度为1下,查卡方分布表,得临界值为,显然,>,则说明模型中随机误差项存在异方差。
(3)修正异方差。取权数为,得如下估计结果
经检验异方差的表现有明显的降低。