§ 3.2 多元线性回归模型的估计估计方法,OLS,ML或者 MM
一、普通最小二乘估计
*二、最大或然估计
*三、矩估计四、参数估计量的性质五、样本容量问题六、估计实例一、普通最小二乘估计对于随机抽取的 n组观测值 kjniXY jii,2,1,0,,,2,1),,(
如果 样本函数 的参数估计值已经得到,则有:
Kikiiii XXXY 22110i=1,2…n
根据 最小二乘原理,参数估计值应该是下列方程组的解
0
0
0
0
2
1
0
Q
Q
Q
Q
k
其中 2
11
2 )?(
n
i ii
n
i i
YYeQ
2
1 22110
))((?
n
i kikiii
XXXY
于是得到关于待估参数估计值的 正规方程组,
kiikikikii
iiikikiii
iiikikii
ikikii
XYXXXX
XYXXXX
XYXXXX
YXXX
)(
)(
)(
)(
22110
2222110
1122110
22110
解该 ( k + 1 )个方程组成的线性代数方程组,即可得到
(k + 1 ) 个待估参数的估计值?,,,,,? j j k? 0 1 2? 。
正规方程组 的 矩阵形式
nknkk
n
kkiikiki
kiiii
kii
Y
Y
Y
XXX
XXX
XXXX
XXXX
XXn
2
1
21
112111
0
2
1
1
2
11
1 111
即
YXβX)X(
由于 X’X满秩,故有
YXXXβ 1)(?
将上述过程用 矩阵表示 如下:
即求解方程组:
0)?()?( βXYβXYβ
0)( βXXββXYYXβYYβ
0)2( βXXββXYYYβ
0 βXXYX
得到:
YXXXβ 1)(?
βXXYX
于是:
例 3.2.1,在 例 2.1.1的 家庭收入 -消费支出 例中,
5 3 6 5 0 0 0 02 1 5 0 0
2 1 5 0 010
1
1
1
111
)( 22
1
21 ii
i
n
n XX
Xn
X
X
X
XXX
XX '
3 9 4 6 8 4 0 0
1 5 6 7 4111 2
1
21 ii
i
n
n YX
Y
Y
Y
Y
XXX
YX
可求得
0735.10003.0
0003.07226.0)( 1
EXX
于是
7 7 7 0.0
172.103
3 9 6 4 8 4 0 0
1 5 6 7 4
0735.10 0 0 3.0
0 0 0 3.07 2 2 6.0
2
1
E?
β
正规方程组 的另一种写法对于 正规方程组
βXXYX
βXXeXβXX
于是
0eX
或?
0ie
0
i iji
eX
(*)或( **)是多元线性回归模型 正规方程组 的另一种写法
(*)
(**)
样本回归函数的离差形式
ikikiii exxxy 2211?
i=1,2…n
其 矩阵形式 为
eβxy
其中,
ny
y
y
2
1
y
knnn
k
k
xxx
xxx
xxx
21
22212
12111
x
k?
2
1
β
在离差形式下,参数的最小二乘估计结果为
Yxxxβ 1)(?
kk XXY 110
随机误差项?的方差?的无偏估计可以证明,随机误差项?的方差的无偏估计量为
11?
2
2
knkn
e i ee?
*二、最大或然估计对于多元线性回归模型
ikikiii XXXY 22110
易知 ),(~ 2?βX iNY i
Y的随机抽取的 n组样本观测值的联合概率
)?()?(
2
1
))((
2
1
21
2
2
2
2
22110
2
2
)2(
1
)2(
1
),,,(),?(
βXYβXY
β
e
e
YYYPL
n
XXXY
n
n
n
kikiii
n
即为变量 Y的 或然函数对数或然函数为
)?()?(
2
1)2(
)(
2
*
βXYβXY
n L n
LLnL
对对数或然函数求极大值,也就是对
)?()?( βXYβXY
求极小值。
因此,参数的 最大或然估计 为
YXXXβ 1)(?
结果与参数的普通最小二乘估计相同
*三、矩估计 ( Moment Method,MM)
OLS估计是通过得到一个关于参数估计值的 正规方程组
YXβX)X(
并对它进行求解而完成的。
该 正规方程组 可以从另外一种思路来导,
μX βY
μXX βXYX
μXX β(YX )
求期望,0X βYX )((E
0X βYX )((E
称为原总体回归方程的一组 矩条件,表明了原总体回归方程所具有的内在特征。
0)?1 βX(YXn
由此得到 正规方程组
YX'βXX'
解此正规方程组即得参数的 MM估计量。
易知 MM估计量 与 OLS,ML估计量等价 。
矩方法 是 工具变量方法 (Instrumental Variables,IV)
和 广义矩估计方法 (Generalized Moment Method,
GMM)的基础
在 矩方法 中关键是利用了
E(X’?)=0
如果某个解释变量与随机项相关,只要能找到 1
个工具变量,仍然可以构成一组矩条件。这就是
IV。
如果存在> k+1个变量与随机项不相关,可以构成一组包含> k+1方程的矩条件。这就是 GMM。
四、参数估计量的性质在满足基本假设的情况下,其结构参数?的 普通最小二乘估计,最大或然估计 及 矩估计 仍具有:
线性性,无偏性,有效性 。
同时,随着样本容量增加,参数估计量具有:
渐近无偏性、渐近有效性、一致性 。
1、线性性
CYYXXXβ 1)(?
其中,C=(X’X)-1 X’ 为一仅与固定的 X有关的行向量
2、无偏性
β
μXXXβ
μX βXXX
YXXXβ
1
1
)()(
))()((
))(()?( 1
E
E
EE
这里利用了假设,E(X’?)=0
3、有效性(最小方差性)
其中利用了
YXXXβ 1)(?
μXXXβ
μX βXXX
1
1
)(
)()(
和 Iμμ
2)(E
五、样本容量问题所谓,最小样本容量,,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。
⒈ 最小样本容量样本最小容量必须不少于模型中解释变量的数目(包括常数项),即
n? k+1
因为,无多重共线性要求:秩 (X)=k+1
2、满足基本要求的样本容量从统计检验的角度,
n?30 时,Z检验才能应用;
n-k?8时,t分布较为稳定一般经验认为,
当 n?30或者至少 n?3(k+1)时,才能说满足模型估计的基本要求。
模型的良好性质只有在大样本下才能得到理论上的证明六、多元线性回归模型的参数估计实例例 3.2.2 在例 2.5.1中,已建立了 中国居民人均消费 一元线性模型。这里我们再考虑建立多元线性模型。
解释变量,人均 GDP,GDPP
前期消费,CONSP(-1)
估计区间,1979~2000年
Eviews软件估计结果
L S / / De p e n d e n t V a r i a b le is C ON S
S a m p le( a d ju s te d ),1 9 7 9 2 0 0 0
I n c l u d e d o b s e r v a t io ns,2 2 a f te r a d j u s ti n g e n d p o i n t s
V a r i a b le C o e f f i c i e n t S t d,E r r o r t - S t a ti s ti c P r o b,
C 1 2 0,7 0 0 0 3 6,5 1 0 3 6 3,3 0 5 9 1 2 0,0 0 3 7
GD P P 0,2 2 1 3 2 7 0,0 6 0 9 6 9 3,6 3 0 1 4 5 0,0 0 1 8
C ON S P ( - 1) 0,4 5 1 507 0,1 7 0 3 0 8 2,6 5 1 1 2 5 0,0 1 5 8
R - s q u a r e d 0,9 9 5 4 0 3 Me a n d e p e n d e n t v a r 9 2 8,4 9 4 6
Ad j u s te d R - s q u a r e d 0,9 9 4 9 2 0 S,D,d e p e n d e n t v a r 3 7 2,6 4 2 4
S,E,o f r e g r e s s io n 2 6,5 6 0 7 8 Ak a i k e i n f o c r it e r i o n 6,6 8 4 9 9 5
S u m s q u a r e d r e s i d 1 3 4 0 4,0 2 S c h war z c r it e r i o n 6,8 3 3 7 7 4
L o g l i k e li h o o d - 1 0 1,7 5 1 6 F - s t a t is t i c 2 0 5 7,2 7 1
D u r b i n - W a t s o n s t a t 1,2 7 8 5 0 0 P r o b ( F - s t a t is ti c ) 0,0 0 0 0 0 0
一、普通最小二乘估计
*二、最大或然估计
*三、矩估计四、参数估计量的性质五、样本容量问题六、估计实例一、普通最小二乘估计对于随机抽取的 n组观测值 kjniXY jii,2,1,0,,,2,1),,(
如果 样本函数 的参数估计值已经得到,则有:
Kikiiii XXXY 22110i=1,2…n
根据 最小二乘原理,参数估计值应该是下列方程组的解
0
0
0
0
2
1
0
Q
Q
Q
Q
k
其中 2
11
2 )?(
n
i ii
n
i i
YYeQ
2
1 22110
))((?
n
i kikiii
XXXY
于是得到关于待估参数估计值的 正规方程组,
kiikikikii
iiikikiii
iiikikii
ikikii
XYXXXX
XYXXXX
XYXXXX
YXXX
)(
)(
)(
)(
22110
2222110
1122110
22110
解该 ( k + 1 )个方程组成的线性代数方程组,即可得到
(k + 1 ) 个待估参数的估计值?,,,,,? j j k? 0 1 2? 。
正规方程组 的 矩阵形式
nknkk
n
kkiikiki
kiiii
kii
Y
Y
Y
XXX
XXX
XXXX
XXXX
XXn
2
1
21
112111
0
2
1
1
2
11
1 111
即
YXβX)X(
由于 X’X满秩,故有
YXXXβ 1)(?
将上述过程用 矩阵表示 如下:
即求解方程组:
0)?()?( βXYβXYβ
0)( βXXββXYYXβYYβ
0)2( βXXββXYYYβ
0 βXXYX
得到:
YXXXβ 1)(?
βXXYX
于是:
例 3.2.1,在 例 2.1.1的 家庭收入 -消费支出 例中,
5 3 6 5 0 0 0 02 1 5 0 0
2 1 5 0 010
1
1
1
111
)( 22
1
21 ii
i
n
n XX
Xn
X
X
X
XXX
XX '
3 9 4 6 8 4 0 0
1 5 6 7 4111 2
1
21 ii
i
n
n YX
Y
Y
Y
Y
XXX
YX
可求得
0735.10003.0
0003.07226.0)( 1
EXX
于是
7 7 7 0.0
172.103
3 9 6 4 8 4 0 0
1 5 6 7 4
0735.10 0 0 3.0
0 0 0 3.07 2 2 6.0
2
1
E?
β
正规方程组 的另一种写法对于 正规方程组
βXXYX
βXXeXβXX
于是
0eX
或?
0ie
0
i iji
eX
(*)或( **)是多元线性回归模型 正规方程组 的另一种写法
(*)
(**)
样本回归函数的离差形式
ikikiii exxxy 2211?
i=1,2…n
其 矩阵形式 为
eβxy
其中,
ny
y
y
2
1
y
knnn
k
k
xxx
xxx
xxx
21
22212
12111
x
k?
2
1
β
在离差形式下,参数的最小二乘估计结果为
Yxxxβ 1)(?
kk XXY 110
随机误差项?的方差?的无偏估计可以证明,随机误差项?的方差的无偏估计量为
11?
2
2
knkn
e i ee?
*二、最大或然估计对于多元线性回归模型
ikikiii XXXY 22110
易知 ),(~ 2?βX iNY i
Y的随机抽取的 n组样本观测值的联合概率
)?()?(
2
1
))((
2
1
21
2
2
2
2
22110
2
2
)2(
1
)2(
1
),,,(),?(
βXYβXY
β
e
e
YYYPL
n
XXXY
n
n
n
kikiii
n
即为变量 Y的 或然函数对数或然函数为
)?()?(
2
1)2(
)(
2
*
βXYβXY
n L n
LLnL
对对数或然函数求极大值,也就是对
)?()?( βXYβXY
求极小值。
因此,参数的 最大或然估计 为
YXXXβ 1)(?
结果与参数的普通最小二乘估计相同
*三、矩估计 ( Moment Method,MM)
OLS估计是通过得到一个关于参数估计值的 正规方程组
YXβX)X(
并对它进行求解而完成的。
该 正规方程组 可以从另外一种思路来导,
μX βY
μXX βXYX
μXX β(YX )
求期望,0X βYX )((E
0X βYX )((E
称为原总体回归方程的一组 矩条件,表明了原总体回归方程所具有的内在特征。
0)?1 βX(YXn
由此得到 正规方程组
YX'βXX'
解此正规方程组即得参数的 MM估计量。
易知 MM估计量 与 OLS,ML估计量等价 。
矩方法 是 工具变量方法 (Instrumental Variables,IV)
和 广义矩估计方法 (Generalized Moment Method,
GMM)的基础
在 矩方法 中关键是利用了
E(X’?)=0
如果某个解释变量与随机项相关,只要能找到 1
个工具变量,仍然可以构成一组矩条件。这就是
IV。
如果存在> k+1个变量与随机项不相关,可以构成一组包含> k+1方程的矩条件。这就是 GMM。
四、参数估计量的性质在满足基本假设的情况下,其结构参数?的 普通最小二乘估计,最大或然估计 及 矩估计 仍具有:
线性性,无偏性,有效性 。
同时,随着样本容量增加,参数估计量具有:
渐近无偏性、渐近有效性、一致性 。
1、线性性
CYYXXXβ 1)(?
其中,C=(X’X)-1 X’ 为一仅与固定的 X有关的行向量
2、无偏性
β
μXXXβ
μX βXXX
YXXXβ
1
1
)()(
))()((
))(()?( 1
E
E
EE
这里利用了假设,E(X’?)=0
3、有效性(最小方差性)
其中利用了
YXXXβ 1)(?
μXXXβ
μX βXXX
1
1
)(
)()(
和 Iμμ
2)(E
五、样本容量问题所谓,最小样本容量,,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。
⒈ 最小样本容量样本最小容量必须不少于模型中解释变量的数目(包括常数项),即
n? k+1
因为,无多重共线性要求:秩 (X)=k+1
2、满足基本要求的样本容量从统计检验的角度,
n?30 时,Z检验才能应用;
n-k?8时,t分布较为稳定一般经验认为,
当 n?30或者至少 n?3(k+1)时,才能说满足模型估计的基本要求。
模型的良好性质只有在大样本下才能得到理论上的证明六、多元线性回归模型的参数估计实例例 3.2.2 在例 2.5.1中,已建立了 中国居民人均消费 一元线性模型。这里我们再考虑建立多元线性模型。
解释变量,人均 GDP,GDPP
前期消费,CONSP(-1)
估计区间,1979~2000年
Eviews软件估计结果
L S / / De p e n d e n t V a r i a b le is C ON S
S a m p le( a d ju s te d ),1 9 7 9 2 0 0 0
I n c l u d e d o b s e r v a t io ns,2 2 a f te r a d j u s ti n g e n d p o i n t s
V a r i a b le C o e f f i c i e n t S t d,E r r o r t - S t a ti s ti c P r o b,
C 1 2 0,7 0 0 0 3 6,5 1 0 3 6 3,3 0 5 9 1 2 0,0 0 3 7
GD P P 0,2 2 1 3 2 7 0,0 6 0 9 6 9 3,6 3 0 1 4 5 0,0 0 1 8
C ON S P ( - 1) 0,4 5 1 507 0,1 7 0 3 0 8 2,6 5 1 1 2 5 0,0 1 5 8
R - s q u a r e d 0,9 9 5 4 0 3 Me a n d e p e n d e n t v a r 9 2 8,4 9 4 6
Ad j u s te d R - s q u a r e d 0,9 9 4 9 2 0 S,D,d e p e n d e n t v a r 3 7 2,6 4 2 4
S,E,o f r e g r e s s io n 2 6,5 6 0 7 8 Ak a i k e i n f o c r it e r i o n 6,6 8 4 9 9 5
S u m s q u a r e d r e s i d 1 3 4 0 4,0 2 S c h war z c r it e r i o n 6,8 3 3 7 7 4
L o g l i k e li h o o d - 1 0 1,7 5 1 6 F - s t a t is t i c 2 0 5 7,2 7 1
D u r b i n - W a t s o n s t a t 1,2 7 8 5 0 0 P r o b ( F - s t a t is ti c ) 0,0 0 0 0 0 0