第九章练习题参考解答:
练习题
9.1 设真实模型为无截距模型:
回归分析中却要求截距项不能为零,于是,有人采用的实证分析回归模型为:
试分析这类设定误差的后果。
9.2 资本资产定价模型 现代投资理论中的资本资产定价模型(CAPM)设定,一定时期内的证券平均收益率与证券波动性(通常由贝塔系数度量)有以下关系
(1)
其中,,,;
由于不可直接观测,通常采用下式进行估算:
(2)
其中,,(通常是某个股票市场的综合指数的收益率),;是真正系数的一个估计值,且有,是观测误差。
在实际的分析中,我们采用的估计式不是(1)而是:
(3)
(1)观测误差对的估计会有什么影响?
(2)从(3)估计的会是真正的一个无偏估计吗?若不是,会是真正的一致性估计吗?
9.3 1978年-2003年的全国居民消费水平与国民收入的数据如下。
年 份
国民总收入
(GNI)
国内生产总值(GDP)
全国居民消费水平(CT)
农村居民消费水平(CN)
城镇居民消费水平(CC)
1978
3624.1
3624.1
184
138
405
1979
4038.2
4038.2
207
158
434
1980
4517.8
4517.8
236
178
496
1981
4860.3
4862.4
262
199
562
1982
5301.8
5294.7
284
221
576
1983
5957.4
5934.5
311
246
603
1984
7206.7
7171.0
327
283
662
1985
8989.1
8964.4
437
347
802
1986
10201.4
10202.2
485
376
805
1987
11954.5
11962.5
550
417
1089
1988
14922.3
14928.3
693
508
1431
1989
16917.8
16909.2
762
553
1568
1990
18598.4
18547.9
803
571
1686
1991
21662.5
21617.8
896
621
1925
1992
26651.9
26638.1
1070
718
2356
1993
34560.5
34634.4
1331
855
3027
1994
46670.0
46759.4
1746
1118
3891
1995
57494.9
58478.1
2236
1434
4874
1996
66850.5
67884.6
2641
1768
5430
1997
73142.7
74462.6
2834
1876
5796
1998
76967.2
78345.2
2972
1895
6217
1999
80579.4
82067.5
3138
1927
6796
2000
88254.0
89468.1
3397
2037
7402
2001
95727.9
97314.8
3609
2156
7761
2002
103935.3
105172.3
3818
2269
8047
2003
116603.2
117251.9
4089
2361
8471
若依据弗里德曼的持久收入假设,消费函数的真正模型应为
(1)试用Eviews软件,采用两种以上检验方法对实证分析模型
进行变量设定检验;
(2)若。
试用Eviews软件,采用两种以上检验方法对实证分析模型
进行测量误差检验。
9.4 考虑真正的Cobb-Douglas生产函数:
其中,,,,;
若在对横截面数据进行的实证分析中,采用的回归模型是:
试问:
(1)表达式和成立吗?
(2)若已经知道是生产函数中的一个无关变量,(1)中答案是否也成立?
9.5 假设制造业企业工人的平均劳动生产率(Y)与工人的平均培训时间(t)和平均能力(X)之间存在依存关系,可建立如下的的回归模型:
若政府给那些工人能力低的企业以政府培训补助,则平均培训时间就和工人平均能力负相关。现在考虑这个因素,采用如下模型进行回归:
问由此获得的会有怎样的偏误。
练习题参考解答
练习题9.1参考解答:
实证分析回归模型中的估计为:
于是,有:
从参数估计的方差看:
,
注意到:
故有:
记,则有:
。
显然,,即不是的无偏估计,同时,。
同理,可对进行类似的讨论。
练习题9.3 参考解答:
一、变量设定误差检验对进行回归(用EViews运行过程及结果略),有:
( 0.0011)
t=( 3.8252) (71.0331)
DW=0.6402 F=5045.703
1、DW检验对于模型,在回归之后,若将差值GNI-GDP认为是一个变量,则在Eviews的命令行键入GENR z=GNI-GDP,生成遗漏变量z。遗漏变量z和残差序列如表所示。
表 遗漏变量z和残差
obs
GNI
GDP
Z
E
1978
3624.100
3624.100
0.000000
-90.42379
1979
4038.200
4038.200
0.000000
-92.93858
1980
4517.800
4517.800
0.000000
-67.43820
1981
4860.300
4862.400
-2.100000
-27.66375
1982
5301.800
5294.700
7.100000
-46.56363
1983
5957.400
5934.500
22.90000
-68.25517
1984
7206.700
7171.000
35.70000
-103.3581
1985
8989.100
8964.400
24.70000
-99.84359
1986
10201.40
10202.20
-0.800000
-191.0455
1987
11954.50
11962.50
-8.000000
-41.01189
1988
14922.30
14928.30
-6.000000
75.27798
1989
16917.80
16909.20
8.600000
61.52297
1990
18598.40
18547.90
50.50000
54.81085
1991
21662.50
21617.80
44.70000
60.17826
1992
26651.90
26638.10
13.80000
109.1118
1993
34560.50
34634.40
-73.90000
171.5590
1994
46670.00
46759.40
-89.40000
112.7944
1995
57494.90
58478.10
-983.2000
203.9509
1996
66850.50
67884.60
-1034.100
44.07581
1997
73142.70
74462.60
-1319.900
-90.53827
1998
76967.20
78345.20
-1378.000
34.97917
1999
80579.40
82067.50
-1488.100
330.6961
2000
88254.00
89468.10
-1214.100
373.4786
2001
95727.90
97314.80
-1586.900
135.3110
2002
103935.3
105172.3
-1237.000
-176.6785
2003
116603.2
117251.9
-648.7000
-671.9880
为了将残差序列e按照遗漏变量z值的递增次序排序,首先用GENR命令生成z1和e1,然后在只有残差序列e1和遗漏变量z1的Workfile画面中,点击,进入下一画面,点击Yes进入另一画面后,在sort keys的选项中键入z1,并点击OK,则对e1按z1值的递增次序进行了排序。
按z1值的递增次序排序后的残差序列e1为
obs
Z1
E1
1
-1586.900
135.3110
2
-1488.100
330.6961
3
-1378.000
34.97917
4
-1319.900
-90.53828
5
-1237.000
-176.6785
6
-1214.100
373.4786
7
-1034.100
44.07581
8
-983.2000
203.9509
9
-648.7000
-671.9880
10
-89.40000
112.7944
11
-73.90000
171.5590
12
-8.000000
-41.01189
13
-6.000000
75.27798
14
-2.100000
-27.66375
15
-0.800000
-191.0455
16
0.000000
-90.42379
17
0.000000
-92.93858
18
0.000000
-67.43820
19
7.100000
-46.56363
20
8.600000
61.52297
21
13.80000
109.1118
22
22.90000
-68.25517
23
24.70000
-99.84358
24
35.70000
-103.3581
25
44.70000
60.17826
26
50.50000
54.81085
按照公式计算d。即命令行键入 genr d1=(e1-e1(-1))^2,genr d2=e1^2,分别生成公式中的分子分母求和号内的变量,然后,按图示操作,可得到分子分母的均值:
D1
D2
Mean
86102.02
36954.69
Median
13523.33
8417.380
Maximum
767269.0
451567.9
Minimum
6.324169
765.2828
Std,Dev.
193771.0
90754.84
Skewness
2.726692
3.937520
Kurtosis
9.141260
18.21725
Jarque-Bera
70.26507
318.0461
Probability
0.000000
0.000000
Sum
2152550.
960822.0
Sum Sq,Dev.
9.01E+11
2.06E+11
Observations
25
26
这时有:,或者,。
查表,在显著水平下,和时,有,4-1.461= 2.539,即=。落在无自相关区,表明遗漏变量现象在统计意义上不显著。
2、LM检验
LM检验步骤为:
(1)对存在遗漏变量设定偏误的模型进行回归,得残差序列;
(2)用残差序列对全部的解释变量(包括遗漏变量)进行回归,得可决系数;
(3)设定,,构造检验统计量
其中:约束个数是中设定存在遗漏变量的个数。
(4)进行显著性检验的判断:若,则拒绝,否则,接受。
用残差序列对全部的解释变量(包括遗漏变量)进行回归,有:
Dependent Variable,E
Method,Least Squares
Date,05/22/05 Time,17:04
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
51.31219
53.85473
0.952789
0.3506
GDP
-0.005020
0.002026
-2.477589
0.0210
GNI-GDP
-0.347207
0.123961
-2.800940
0.0101
R-squared
0.254343
Mean dependent var
-8.75E-15
Adjusted R-squared
0.189503
S.D,dependent var
196.0431
S.E,of regression
176.4929
Akaike info criterion
13.29261
Sum squared resid
716444.1
Schwarz criterion
13.43777
Log likelihood
-169.8039
F-statistic
3.922632
Durbin-Watson stat
0.632468
Prob(F-statistic)
0.034214
计算,查表,显然,,拒绝:存在遗漏变量的假设,接受无遗漏变量的假设。
二、测量误差的检验按照Hausman检验的步骤,有以下的Eviews计算结果:
对模型进行回归,有:
Dependent Variable,CC
Method,Least Squares
Date,05/22/05 Time,17:19
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
219.6142
57.41281
3.825177
0.0008
GDP
0.076104
0.001071
71.03311
0.0000
R-squared
0.995266
Mean dependent var
3196.615
Adjusted R-squared
0.995069
S.D,dependent var
2849.293
S.E,of regression
200.0856
Akaike info criterion
13.50917
Sum squared resid
960822.0
Schwarz criterion
13.60595
Log likelihood
-173.6192
F-statistic
5045.703
Durbin-Watson stat
0.640170
Prob(F-statistic)
0.000000
选择GNI作为GDP的工具变量,对模型进行回归,得残差序列w。
Dependent Variable,GDP
Method,Least Squares
Date,05/22/05 Time,17:30
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
-147.6039
84.78554
-1.740909
0.0945
GNI
1.014609
0.001602
633.2945
0.0000
R-squared
0.999940
Mean dependent var
39117.38
Adjusted R-squared
0.999938
S.D,dependent var
37350.59
S.E,of regression
294.8823
Akaike info criterion
14.28483
Sum squared resid
2086934.
Schwarz criterion
14.38161
Log likelihood
-183.7028
F-statistic
401062.0
Durbin-Watson stat
0.799209
Prob(F-statistic)
0.000000
在Eviews命令行键入GENR w=resid,生成了残差序列w,对模型进行回归,有:
Dependent Variable,CC
Method,Least Squares
Date,05/22/05 Time,17:36
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
220.4152
50.64390
4.352256
0.0002
GDP
0.076084
0.000945
80.50439
0.0000
W
0.342208
0.122176
2.800940
0.0101
R-squared
0.996470
Mean dependent var
3196.615
Adjusted R-squared
0.996163
S.D,dependent var
2849.293
S.E,of regression
176.4929
Akaike info criterion
13.29261
Sum squared resid
716444.1
Schwarz criterion
13.43777
Log likelihood
-169.8039
F-statistic
3246.340
Durbin-Watson stat
0.632468
Prob(F-statistic)
0.000000
注意到,表明工具变量w的系数显著地不为0,故解释变量GDP的确存在观测误差。
练习题9.5参考解答:
在这种情况下,若采用以下模型进行回归:
由此获得的会有向下的偏差。
练习题
9.1 设真实模型为无截距模型:
回归分析中却要求截距项不能为零,于是,有人采用的实证分析回归模型为:
试分析这类设定误差的后果。
9.2 资本资产定价模型 现代投资理论中的资本资产定价模型(CAPM)设定,一定时期内的证券平均收益率与证券波动性(通常由贝塔系数度量)有以下关系
(1)
其中,,,;
由于不可直接观测,通常采用下式进行估算:
(2)
其中,,(通常是某个股票市场的综合指数的收益率),;是真正系数的一个估计值,且有,是观测误差。
在实际的分析中,我们采用的估计式不是(1)而是:
(3)
(1)观测误差对的估计会有什么影响?
(2)从(3)估计的会是真正的一个无偏估计吗?若不是,会是真正的一致性估计吗?
9.3 1978年-2003年的全国居民消费水平与国民收入的数据如下。
年 份
国民总收入
(GNI)
国内生产总值(GDP)
全国居民消费水平(CT)
农村居民消费水平(CN)
城镇居民消费水平(CC)
1978
3624.1
3624.1
184
138
405
1979
4038.2
4038.2
207
158
434
1980
4517.8
4517.8
236
178
496
1981
4860.3
4862.4
262
199
562
1982
5301.8
5294.7
284
221
576
1983
5957.4
5934.5
311
246
603
1984
7206.7
7171.0
327
283
662
1985
8989.1
8964.4
437
347
802
1986
10201.4
10202.2
485
376
805
1987
11954.5
11962.5
550
417
1089
1988
14922.3
14928.3
693
508
1431
1989
16917.8
16909.2
762
553
1568
1990
18598.4
18547.9
803
571
1686
1991
21662.5
21617.8
896
621
1925
1992
26651.9
26638.1
1070
718
2356
1993
34560.5
34634.4
1331
855
3027
1994
46670.0
46759.4
1746
1118
3891
1995
57494.9
58478.1
2236
1434
4874
1996
66850.5
67884.6
2641
1768
5430
1997
73142.7
74462.6
2834
1876
5796
1998
76967.2
78345.2
2972
1895
6217
1999
80579.4
82067.5
3138
1927
6796
2000
88254.0
89468.1
3397
2037
7402
2001
95727.9
97314.8
3609
2156
7761
2002
103935.3
105172.3
3818
2269
8047
2003
116603.2
117251.9
4089
2361
8471
若依据弗里德曼的持久收入假设,消费函数的真正模型应为
(1)试用Eviews软件,采用两种以上检验方法对实证分析模型
进行变量设定检验;
(2)若。
试用Eviews软件,采用两种以上检验方法对实证分析模型
进行测量误差检验。
9.4 考虑真正的Cobb-Douglas生产函数:
其中,,,,;
若在对横截面数据进行的实证分析中,采用的回归模型是:
试问:
(1)表达式和成立吗?
(2)若已经知道是生产函数中的一个无关变量,(1)中答案是否也成立?
9.5 假设制造业企业工人的平均劳动生产率(Y)与工人的平均培训时间(t)和平均能力(X)之间存在依存关系,可建立如下的的回归模型:
若政府给那些工人能力低的企业以政府培训补助,则平均培训时间就和工人平均能力负相关。现在考虑这个因素,采用如下模型进行回归:
问由此获得的会有怎样的偏误。
练习题参考解答
练习题9.1参考解答:
实证分析回归模型中的估计为:
于是,有:
从参数估计的方差看:
,
注意到:
故有:
记,则有:
。
显然,,即不是的无偏估计,同时,。
同理,可对进行类似的讨论。
练习题9.3 参考解答:
一、变量设定误差检验对进行回归(用EViews运行过程及结果略),有:
( 0.0011)
t=( 3.8252) (71.0331)
DW=0.6402 F=5045.703
1、DW检验对于模型,在回归之后,若将差值GNI-GDP认为是一个变量,则在Eviews的命令行键入GENR z=GNI-GDP,生成遗漏变量z。遗漏变量z和残差序列如表所示。
表 遗漏变量z和残差
obs
GNI
GDP
Z
E
1978
3624.100
3624.100
0.000000
-90.42379
1979
4038.200
4038.200
0.000000
-92.93858
1980
4517.800
4517.800
0.000000
-67.43820
1981
4860.300
4862.400
-2.100000
-27.66375
1982
5301.800
5294.700
7.100000
-46.56363
1983
5957.400
5934.500
22.90000
-68.25517
1984
7206.700
7171.000
35.70000
-103.3581
1985
8989.100
8964.400
24.70000
-99.84359
1986
10201.40
10202.20
-0.800000
-191.0455
1987
11954.50
11962.50
-8.000000
-41.01189
1988
14922.30
14928.30
-6.000000
75.27798
1989
16917.80
16909.20
8.600000
61.52297
1990
18598.40
18547.90
50.50000
54.81085
1991
21662.50
21617.80
44.70000
60.17826
1992
26651.90
26638.10
13.80000
109.1118
1993
34560.50
34634.40
-73.90000
171.5590
1994
46670.00
46759.40
-89.40000
112.7944
1995
57494.90
58478.10
-983.2000
203.9509
1996
66850.50
67884.60
-1034.100
44.07581
1997
73142.70
74462.60
-1319.900
-90.53827
1998
76967.20
78345.20
-1378.000
34.97917
1999
80579.40
82067.50
-1488.100
330.6961
2000
88254.00
89468.10
-1214.100
373.4786
2001
95727.90
97314.80
-1586.900
135.3110
2002
103935.3
105172.3
-1237.000
-176.6785
2003
116603.2
117251.9
-648.7000
-671.9880
为了将残差序列e按照遗漏变量z值的递增次序排序,首先用GENR命令生成z1和e1,然后在只有残差序列e1和遗漏变量z1的Workfile画面中,点击,进入下一画面,点击Yes进入另一画面后,在sort keys的选项中键入z1,并点击OK,则对e1按z1值的递增次序进行了排序。
按z1值的递增次序排序后的残差序列e1为
obs
Z1
E1
1
-1586.900
135.3110
2
-1488.100
330.6961
3
-1378.000
34.97917
4
-1319.900
-90.53828
5
-1237.000
-176.6785
6
-1214.100
373.4786
7
-1034.100
44.07581
8
-983.2000
203.9509
9
-648.7000
-671.9880
10
-89.40000
112.7944
11
-73.90000
171.5590
12
-8.000000
-41.01189
13
-6.000000
75.27798
14
-2.100000
-27.66375
15
-0.800000
-191.0455
16
0.000000
-90.42379
17
0.000000
-92.93858
18
0.000000
-67.43820
19
7.100000
-46.56363
20
8.600000
61.52297
21
13.80000
109.1118
22
22.90000
-68.25517
23
24.70000
-99.84358
24
35.70000
-103.3581
25
44.70000
60.17826
26
50.50000
54.81085
按照公式计算d。即命令行键入 genr d1=(e1-e1(-1))^2,genr d2=e1^2,分别生成公式中的分子分母求和号内的变量,然后,按图示操作,可得到分子分母的均值:
D1
D2
Mean
86102.02
36954.69
Median
13523.33
8417.380
Maximum
767269.0
451567.9
Minimum
6.324169
765.2828
Std,Dev.
193771.0
90754.84
Skewness
2.726692
3.937520
Kurtosis
9.141260
18.21725
Jarque-Bera
70.26507
318.0461
Probability
0.000000
0.000000
Sum
2152550.
960822.0
Sum Sq,Dev.
9.01E+11
2.06E+11
Observations
25
26
这时有:,或者,。
查表,在显著水平下,和时,有,4-1.461= 2.539,即=。落在无自相关区,表明遗漏变量现象在统计意义上不显著。
2、LM检验
LM检验步骤为:
(1)对存在遗漏变量设定偏误的模型进行回归,得残差序列;
(2)用残差序列对全部的解释变量(包括遗漏变量)进行回归,得可决系数;
(3)设定,,构造检验统计量
其中:约束个数是中设定存在遗漏变量的个数。
(4)进行显著性检验的判断:若,则拒绝,否则,接受。
用残差序列对全部的解释变量(包括遗漏变量)进行回归,有:
Dependent Variable,E
Method,Least Squares
Date,05/22/05 Time,17:04
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
51.31219
53.85473
0.952789
0.3506
GDP
-0.005020
0.002026
-2.477589
0.0210
GNI-GDP
-0.347207
0.123961
-2.800940
0.0101
R-squared
0.254343
Mean dependent var
-8.75E-15
Adjusted R-squared
0.189503
S.D,dependent var
196.0431
S.E,of regression
176.4929
Akaike info criterion
13.29261
Sum squared resid
716444.1
Schwarz criterion
13.43777
Log likelihood
-169.8039
F-statistic
3.922632
Durbin-Watson stat
0.632468
Prob(F-statistic)
0.034214
计算,查表,显然,,拒绝:存在遗漏变量的假设,接受无遗漏变量的假设。
二、测量误差的检验按照Hausman检验的步骤,有以下的Eviews计算结果:
对模型进行回归,有:
Dependent Variable,CC
Method,Least Squares
Date,05/22/05 Time,17:19
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
219.6142
57.41281
3.825177
0.0008
GDP
0.076104
0.001071
71.03311
0.0000
R-squared
0.995266
Mean dependent var
3196.615
Adjusted R-squared
0.995069
S.D,dependent var
2849.293
S.E,of regression
200.0856
Akaike info criterion
13.50917
Sum squared resid
960822.0
Schwarz criterion
13.60595
Log likelihood
-173.6192
F-statistic
5045.703
Durbin-Watson stat
0.640170
Prob(F-statistic)
0.000000
选择GNI作为GDP的工具变量,对模型进行回归,得残差序列w。
Dependent Variable,GDP
Method,Least Squares
Date,05/22/05 Time,17:30
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
-147.6039
84.78554
-1.740909
0.0945
GNI
1.014609
0.001602
633.2945
0.0000
R-squared
0.999940
Mean dependent var
39117.38
Adjusted R-squared
0.999938
S.D,dependent var
37350.59
S.E,of regression
294.8823
Akaike info criterion
14.28483
Sum squared resid
2086934.
Schwarz criterion
14.38161
Log likelihood
-183.7028
F-statistic
401062.0
Durbin-Watson stat
0.799209
Prob(F-statistic)
0.000000
在Eviews命令行键入GENR w=resid,生成了残差序列w,对模型进行回归,有:
Dependent Variable,CC
Method,Least Squares
Date,05/22/05 Time,17:36
Sample,1978 2003
Included observations,26
Variable
Coefficient
Std,Error
t-Statistic
Prob.
C
220.4152
50.64390
4.352256
0.0002
GDP
0.076084
0.000945
80.50439
0.0000
W
0.342208
0.122176
2.800940
0.0101
R-squared
0.996470
Mean dependent var
3196.615
Adjusted R-squared
0.996163
S.D,dependent var
2849.293
S.E,of regression
176.4929
Akaike info criterion
13.29261
Sum squared resid
716444.1
Schwarz criterion
13.43777
Log likelihood
-169.8039
F-statistic
3246.340
Durbin-Watson stat
0.632468
Prob(F-statistic)
0.000000
注意到,表明工具变量w的系数显著地不为0,故解释变量GDP的确存在观测误差。
练习题9.5参考解答:
在这种情况下,若采用以下模型进行回归:
由此获得的会有向下的偏差。