§ 3.2 多元线性回归模型的估计
估计方法,OLS,ML或者 MM
一、普通最小二乘估计
*二、最大或然估计
*三、矩估计
四、参数估计量的性质
五、样本容量问题
六、估计实例
一、普通最小二乘估计
对于随机抽取的 n组观测值 kjniXY jii ??,2,1,0,,,2,1),,( ??
如果 样本函数 的参数估计值已经得到,则有:
Kikiiii XXXY ???? ????? 22110 ????? ?i=1,2…n
根据 最小二乘原理,参数估计值应该是下列方程组的解
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
?
0
?
0
?
0
?
2
1
0
Q
Q
Q
Q
k
??
?
??
?
??
?
??
?
?
其中 2
11
2 )?(??
??
??? n
i ii
n
i i
YYeQ
2
1 22110
))????((?
?
?????? n
i kikiii
XXXY ???? ?
于是得到关于待估参数估计值的 正规方程组,
?
?
?
?
?
?
?
?
?
???????
???????
???????
???????
kiikikikii
iiikikiii
iiikikii
ikikii
XYXXXX
XYXXXX
XYXXXX
YXXX
)????(
)????(
)????(
)????(
22110
2222110
1122110
22110
????
????
????
????
?
?
?
?
?
解该 ( k + 1 )个方程组成的线性代数方程组,即可得到
( k + 1 ) 个待估参数的估计值 ?,,,,,? j j k? 0 1 2 ? 。
正规方程组 的 矩阵形式
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
???
??
nknkk
n
kkiikiki
kiiii
kii
Y
Y
Y
XXX
XXX
XXXX
XXXX
XXn
?
?
????
?
?
?
?
????
?
?
2
1
21
112111
0
2
1
1
2
11
1 111
?
?
?
?
?
?
即
YXβX)X( ??? ?
由于 X’X满秩,故有
YXXXβ ??? ? 1)(?
将上述过程用 矩阵表示 如下:
即求解方程组:
0)?()?(? ???? βXYβXYβ??
0)????(? ???????????? βXXββXYYXβYYβ
0)???2(? ????????? βXXββXYYYβ
0? ????? βXXYX
得到:
YXXXβ ??? ? 1)(?
βXXYX ????
于是:
例 3.2.1,在 例 2.1.1的 家庭收入 -消费支出 例中,
??
?
?
??
?
?
???
?
?
??
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
?
?
??
?
?
?
??
?
5 3 6 5 0 0 0 02 1 5 0 0
2 1 5 0 010
1
1
1
111
)( 22
1
21 ii
i
n
n XX
Xn
X
X
X
XXX ???
?
XX '
??
?
?
??
?
?
???
?
?
?
?
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
?
?
??
?
?
??
?
?
3 9 4 6 8 4 0 0
1 5 6 7 4111 2
1
21 ii
i
n
n YX
Y
Y
Y
Y
XXX ??
?
YX
可求得
???????? ??
??? ?
0735.10 0 0 3.0
0 0 0 3.07 2 2 6.0)( 1
EXX
于是
????????
??
???????????????? ??
??
???
?
???
??
7 7 7 0.0
1 7 2.1 0 3
3 9 6 4 8 4 0 0
1 5 6 7 4
0735.10 0 0 3.0
0 0 0 3.07 2 2 6.0
?
??
2
1
E?
?β
?正规方程组 的另一种写法
对于 正规方程组
βXXYX ????
βXXeXβXX ?? ?????
于是
0eX ??
或 ?
? 0ie
0??
i iji
eX
(*)或( **)是多元线性回归模型 正规方程组 的另一
种写法
(*)
(**)
?样本回归函数的离差形式
ikikiii exxxy ????? ??? ??? 2211 ?
i=1,2…n
其 矩阵形式 为
eβxy ?? ?
其中,
??
?
?
?
?
?
??
?
?
?
?
?
?
ny
y
y
?
2
1
y
??
?
?
?
?
?
??
?
?
?
?
?
?
knnn
k
k
xxx
xxx
xxx
?
????
?
?
21
22212
12111
x
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
k?
?
?
?
?
?
? 2
1
?
β
在离差形式下,参数的最小二乘估计结果为
Yxxxβ ??? ? 1)(?
kk XXY ??? ??? 110 ???? ?
?随机误差项 ?的方差 ?的无偏估计
可以证明,随机误差项 ?的方差的无偏估计量为
11?
2
2
??
??
???
?
knkn
e i ee?
*二、最大或然估计
对于多元线性回归模型
ikikiii XXXY ????? ????????? 22110
易知 ),(~ 2?βX iNY i
Y的随机抽取的 n组样本观测值的联合概率
)?()?(
2
1
))????((
2
1
21
2
2
2
2
22110
2
2
)2(
1
)2(
1
),,,(),?(
βXYβXY
β
????
???????
?
?
?
?
????
?
??
??
?
e
e
YYYPL
n
XXXY
n
n
n
kikiii
n
?
?
即为变量 Y的 或然函数
对数或然函数为
)?()?(
2
1)2(
)(
2
*
βXYβXY ?????
?
?
??n L n
LLnL
对对数或然函数求极大值,也就是对
)?()?( βXYβXY ???
求极小值。
因此,参数的 最大或然估计 为
YXXXβ 1 ??? ?)(?
结果与参数的普通最小二乘估计相同
*三、矩估计 ( Moment Method,MM)
OLS估计是通过得到一个关于参数估计值的 正
规方程组
YXβX)X( ??? ?
并对它进行求解而完成的。
该 正规方程组 可以从另外一种思路来导,
μX βY ??
μXX βXYX ?????
μXX β(YX ???? )
求期望, 0X βYX ??? )((E
0X βYX ??? )((E
称为原总体回归方程的一组 矩条件,表明了原总
体回归方程所具有的内在特征。
0)?1 ??? βX(YXn
由此得到 正规方程组
YX'βXX' ??
解此正规方程组即得参数的 MM估计量。
易知 MM估计量 与 OLS,ML估计量等价 。
矩方法 是 工具变量方法 (Instrumental Variables,IV)
和 广义矩估计方法 (Generalized Moment Method,
GMM)的基础
? 在 矩方法 中关键是利用了
E(X’?)=0
? 如果某个解释变量与随机项相关,只要能找到 1
个工具变量,仍然可以构成一组矩条件。这就是
IV。
? 如果存在> k+1个变量与随机项不相关,可以构
成一组包含> k+1方程的矩条件。这就是 GMM。
四、参数估计量的性质
在满足基本假设的情况下,其结构参数 ?的 普通
最小二乘估计, 最大或然估计 及 矩估计 仍具有:
线性性, 无偏性, 有效性 。
同时,随着样本容量增加,参数估计量具有:
渐近无偏性、渐近有效性、一致性 。
1、线性性
CYYXXXβ ???? ? 1)(?
其中,C=(X’X)-1 X’ 为一仅与固定的 X有关的行向量
2、无偏性
β
μXXXβ
μX βXXX
YXXXβ
1
1
?
????
????
???
?
?
?
)()(
))()((
))(()?( 1
E
E
EE
这里利用了假设, E(X’?)=0
3、有效性(最小方差性)
其中利用了
YXXXβ ??? ? 1)(?
μXXXβ
μX βXXX
????
????
?
?
1
1
)(
)()(
和
Iμμ 2)( ???E
五、样本容量问题
所谓, 最小样本容量,,即从最小二乘原理
和最大或然原理出发,欲得到参数估计量,不管
其质量如何,所要求的样本容量的下限。
⒈ 最小样本容量
样本最小容量必须不少于模型中解释变量
的数目(包括常数项),即
n ? k+1
因为,无多重共线性要求:秩 (X)=k+1
2、满足基本要求的样本容量
从统计检验的角度,
n?30 时,Z检验才能应用;
n-k?8时,t分布较为稳定
一般经验认为,
当 n?30或者至少 n?3(k+1)时,才能说满足
模型估计的基本要求。
模型的良好性质只有在大样本下才能
得到理论上的证明
六、多元线性回归模型的参数估计实例
例 3.2.2 在例 2.5.1中,已建立了 中国居
民人均消费 一元线性模型。这里我们再考
虑建立多元线性模型。
解释变量,人均 GDP,GDPP
前期消费,CONSP(-1)
估计区间, 1979~2000年
Eviews软件估计结果
L S / / De p e n d e n t V a r i a b le is C ONS
S a m p le ( a d ju s te d ), 1 9 7 9 2 0 0 0
I n c l u d e d o b s e r v a t io ns, 2 2 a f te r a d j u s ti n g e n d p o i n t s
V a r i a b le C o e f f i c i e n t S t d, E r r o r t - S t a ti s ti c P r o b,
C 1 2 0, 7 0 0 0 3 6, 5 1 0 3 6 3, 3 0 5 9 1 2 0, 0 0 3 7
GDP P 0, 2 2 1 3 2 7 0, 0 6 0 9 6 9 3, 6 3 0 1 4 5 0, 0 0 1 8
C ONS P (- 1) 0, 4 5 1507 0, 1 7 0 3 0 8 2, 6 5 1 1 2 5 0, 0 1 5 8
R - s q u a r e d 0, 9 9 5 4 0 3 M e a n d e p e n d e n t v a r 9 2 8, 4 9 4 6
Ad j u s te d R- s q u a r e d 0, 9 9 4 9 2 0 S, D,d e p e n d e n t v a r 3 7 2, 6 4 2 4
S, E, o f r e g r e s s io n 2 6, 5 6 0 7 8 Ak a i k e i n f o c r ite r i o n 6, 6 8 4 9 9 5
S u m s q u a r e d r e s i d 1 3 4 0 4, 0 2 S c h wa r z c r ite r i o n 6, 8 3 3 7 7 4
L o g l i k e li h o o d - 1 0 1, 7 5 1 6 F - s t a t is t i c 2 0 5 7, 2 7 1
D u r b i n- W a t s o n s t a t 1, 2 7 8 5 0 0 P r o b ( F - s t a t is ti c ) 0, 0 0 0 0 0 0
估计方法,OLS,ML或者 MM
一、普通最小二乘估计
*二、最大或然估计
*三、矩估计
四、参数估计量的性质
五、样本容量问题
六、估计实例
一、普通最小二乘估计
对于随机抽取的 n组观测值 kjniXY jii ??,2,1,0,,,2,1),,( ??
如果 样本函数 的参数估计值已经得到,则有:
Kikiiii XXXY ???? ????? 22110 ????? ?i=1,2…n
根据 最小二乘原理,参数估计值应该是下列方程组的解
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
?
0
?
0
?
0
?
2
1
0
Q
Q
Q
Q
k
??
?
??
?
??
?
??
?
?
其中 2
11
2 )?(??
??
??? n
i ii
n
i i
YYeQ
2
1 22110
))????((?
?
?????? n
i kikiii
XXXY ???? ?
于是得到关于待估参数估计值的 正规方程组,
?
?
?
?
?
?
?
?
?
???????
???????
???????
???????
kiikikikii
iiikikiii
iiikikii
ikikii
XYXXXX
XYXXXX
XYXXXX
YXXX
)????(
)????(
)????(
)????(
22110
2222110
1122110
22110
????
????
????
????
?
?
?
?
?
解该 ( k + 1 )个方程组成的线性代数方程组,即可得到
( k + 1 ) 个待估参数的估计值 ?,,,,,? j j k? 0 1 2 ? 。
正规方程组 的 矩阵形式
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
???
???
??
nknkk
n
kkiikiki
kiiii
kii
Y
Y
Y
XXX
XXX
XXXX
XXXX
XXn
?
?
????
?
?
?
?
????
?
?
2
1
21
112111
0
2
1
1
2
11
1 111
?
?
?
?
?
?
即
YXβX)X( ??? ?
由于 X’X满秩,故有
YXXXβ ??? ? 1)(?
将上述过程用 矩阵表示 如下:
即求解方程组:
0)?()?(? ???? βXYβXYβ??
0)????(? ???????????? βXXββXYYXβYYβ
0)???2(? ????????? βXXββXYYYβ
0? ????? βXXYX
得到:
YXXXβ ??? ? 1)(?
βXXYX ????
于是:
例 3.2.1,在 例 2.1.1的 家庭收入 -消费支出 例中,
??
?
?
??
?
?
???
?
?
??
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
?
?
??
?
?
?
??
?
5 3 6 5 0 0 0 02 1 5 0 0
2 1 5 0 010
1
1
1
111
)( 22
1
21 ii
i
n
n XX
Xn
X
X
X
XXX ???
?
XX '
??
?
?
??
?
?
???
?
?
?
?
?
?
?
??
?
?
?
?
?
??
?
?
?
?
?
??
?
?
??
?
?
??
?
?
3 9 4 6 8 4 0 0
1 5 6 7 4111 2
1
21 ii
i
n
n YX
Y
Y
Y
Y
XXX ??
?
YX
可求得
???????? ??
??? ?
0735.10 0 0 3.0
0 0 0 3.07 2 2 6.0)( 1
EXX
于是
????????
??
???????????????? ??
??
???
?
???
??
7 7 7 0.0
1 7 2.1 0 3
3 9 6 4 8 4 0 0
1 5 6 7 4
0735.10 0 0 3.0
0 0 0 3.07 2 2 6.0
?
??
2
1
E?
?β
?正规方程组 的另一种写法
对于 正规方程组
βXXYX ????
βXXeXβXX ?? ?????
于是
0eX ??
或 ?
? 0ie
0??
i iji
eX
(*)或( **)是多元线性回归模型 正规方程组 的另一
种写法
(*)
(**)
?样本回归函数的离差形式
ikikiii exxxy ????? ??? ??? 2211 ?
i=1,2…n
其 矩阵形式 为
eβxy ?? ?
其中,
??
?
?
?
?
?
??
?
?
?
?
?
?
ny
y
y
?
2
1
y
??
?
?
?
?
?
??
?
?
?
?
?
?
knnn
k
k
xxx
xxx
xxx
?
????
?
?
21
22212
12111
x
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
k?
?
?
?
?
?
? 2
1
?
β
在离差形式下,参数的最小二乘估计结果为
Yxxxβ ??? ? 1)(?
kk XXY ??? ??? 110 ???? ?
?随机误差项 ?的方差 ?的无偏估计
可以证明,随机误差项 ?的方差的无偏估计量为
11?
2
2
??
??
???
?
knkn
e i ee?
*二、最大或然估计
对于多元线性回归模型
ikikiii XXXY ????? ????????? 22110
易知 ),(~ 2?βX iNY i
Y的随机抽取的 n组样本观测值的联合概率
)?()?(
2
1
))????((
2
1
21
2
2
2
2
22110
2
2
)2(
1
)2(
1
),,,(),?(
βXYβXY
β
????
???????
?
?
?
?
????
?
??
??
?
e
e
YYYPL
n
XXXY
n
n
n
kikiii
n
?
?
即为变量 Y的 或然函数
对数或然函数为
)?()?(
2
1)2(
)(
2
*
βXYβXY ?????
?
?
??n L n
LLnL
对对数或然函数求极大值,也就是对
)?()?( βXYβXY ???
求极小值。
因此,参数的 最大或然估计 为
YXXXβ 1 ??? ?)(?
结果与参数的普通最小二乘估计相同
*三、矩估计 ( Moment Method,MM)
OLS估计是通过得到一个关于参数估计值的 正
规方程组
YXβX)X( ??? ?
并对它进行求解而完成的。
该 正规方程组 可以从另外一种思路来导,
μX βY ??
μXX βXYX ?????
μXX β(YX ???? )
求期望, 0X βYX ??? )((E
0X βYX ??? )((E
称为原总体回归方程的一组 矩条件,表明了原总
体回归方程所具有的内在特征。
0)?1 ??? βX(YXn
由此得到 正规方程组
YX'βXX' ??
解此正规方程组即得参数的 MM估计量。
易知 MM估计量 与 OLS,ML估计量等价 。
矩方法 是 工具变量方法 (Instrumental Variables,IV)
和 广义矩估计方法 (Generalized Moment Method,
GMM)的基础
? 在 矩方法 中关键是利用了
E(X’?)=0
? 如果某个解释变量与随机项相关,只要能找到 1
个工具变量,仍然可以构成一组矩条件。这就是
IV。
? 如果存在> k+1个变量与随机项不相关,可以构
成一组包含> k+1方程的矩条件。这就是 GMM。
四、参数估计量的性质
在满足基本假设的情况下,其结构参数 ?的 普通
最小二乘估计, 最大或然估计 及 矩估计 仍具有:
线性性, 无偏性, 有效性 。
同时,随着样本容量增加,参数估计量具有:
渐近无偏性、渐近有效性、一致性 。
1、线性性
CYYXXXβ ???? ? 1)(?
其中,C=(X’X)-1 X’ 为一仅与固定的 X有关的行向量
2、无偏性
β
μXXXβ
μX βXXX
YXXXβ
1
1
?
????
????
???
?
?
?
)()(
))()((
))(()?( 1
E
E
EE
这里利用了假设, E(X’?)=0
3、有效性(最小方差性)
其中利用了
YXXXβ ??? ? 1)(?
μXXXβ
μX βXXX
????
????
?
?
1
1
)(
)()(
和
Iμμ 2)( ???E
五、样本容量问题
所谓, 最小样本容量,,即从最小二乘原理
和最大或然原理出发,欲得到参数估计量,不管
其质量如何,所要求的样本容量的下限。
⒈ 最小样本容量
样本最小容量必须不少于模型中解释变量
的数目(包括常数项),即
n ? k+1
因为,无多重共线性要求:秩 (X)=k+1
2、满足基本要求的样本容量
从统计检验的角度,
n?30 时,Z检验才能应用;
n-k?8时,t分布较为稳定
一般经验认为,
当 n?30或者至少 n?3(k+1)时,才能说满足
模型估计的基本要求。
模型的良好性质只有在大样本下才能
得到理论上的证明
六、多元线性回归模型的参数估计实例
例 3.2.2 在例 2.5.1中,已建立了 中国居
民人均消费 一元线性模型。这里我们再考
虑建立多元线性模型。
解释变量,人均 GDP,GDPP
前期消费,CONSP(-1)
估计区间, 1979~2000年
Eviews软件估计结果
L S / / De p e n d e n t V a r i a b le is C ONS
S a m p le ( a d ju s te d ), 1 9 7 9 2 0 0 0
I n c l u d e d o b s e r v a t io ns, 2 2 a f te r a d j u s ti n g e n d p o i n t s
V a r i a b le C o e f f i c i e n t S t d, E r r o r t - S t a ti s ti c P r o b,
C 1 2 0, 7 0 0 0 3 6, 5 1 0 3 6 3, 3 0 5 9 1 2 0, 0 0 3 7
GDP P 0, 2 2 1 3 2 7 0, 0 6 0 9 6 9 3, 6 3 0 1 4 5 0, 0 0 1 8
C ONS P (- 1) 0, 4 5 1507 0, 1 7 0 3 0 8 2, 6 5 1 1 2 5 0, 0 1 5 8
R - s q u a r e d 0, 9 9 5 4 0 3 M e a n d e p e n d e n t v a r 9 2 8, 4 9 4 6
Ad j u s te d R- s q u a r e d 0, 9 9 4 9 2 0 S, D,d e p e n d e n t v a r 3 7 2, 6 4 2 4
S, E, o f r e g r e s s io n 2 6, 5 6 0 7 8 Ak a i k e i n f o c r ite r i o n 6, 6 8 4 9 9 5
S u m s q u a r e d r e s i d 1 3 4 0 4, 0 2 S c h wa r z c r ite r i o n 6, 8 3 3 7 7 4
L o g l i k e li h o o d - 1 0 1, 7 5 1 6 F - s t a t is t i c 2 0 5 7, 2 7 1
D u r b i n- W a t s o n s t a t 1, 2 7 8 5 0 0 P r o b ( F - s t a t is ti c ) 0, 0 0 0 0 0 0