Chapter 9
虚拟变量回归模型主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006 Wuhan
University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
9.1 虚拟变量的性质
回归分析中,被解释变量不仅常受一些比率尺度变量 (如收入、产量、价格、成本、高度和温度 )的影响,而且还受 定性性质变量 (也被称为 名义尺度变量,如性别、种族、肤色、宗教、国籍、战争 )的影响。
为了在模型中能够反映这些定性性质变量的影响,并提高模型的精度,需要将它们“量化” 。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
如何量化?
这种“量化”通常是通过引入“虚拟变量”
来完成的。根据这些因素的属性类型,构造只取,0”或,1”的人为变量,通常称为 虚拟变量 ( dummy variables),记为 D。
例如,反映性别的虚拟变量可取为,
1,男
D=
0,女
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
9.2 ANOVA模型
方差分析 ( ANOVA,analysis of
variance) 模型 定义
– 回归模型中解释变量都是虚拟变量的模型
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
如,一个以性别为虚拟变量考察高校教授薪金的模型其中,Yi为高校教授的薪金
Di=1,若是男性; Di=0,若是女性
12i i iY D u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
在该模型中,如果仍假定?满足经典线性回归模型的假定,则
女教授的平均薪金为:
男教授的平均薪金为:
1( 0 )iiE Y D
12( 1 )iiE Y D
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
9.3 ANCOVA模型
ANOVA模型常见于社会学、心理学、教育学和市场调研等领域中;
在经济学中并不那么常见。在大多数经济研究中,典型的情形是:一个回归模型既含有一些定量的又含有一些定性的解释变量;
兼含有定量和定性变量的回归模型叫做协方差分析 (ANCOVA,analysis of covariance)模型。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
在看以性别为虚拟变量考察高校教授薪金的模型其中,Yi为高校教授的薪金,Xi为高校教授的工龄
Di=1,若是男性; Di=0,若是女性
1 2 3i i i iY D X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
同样地,如果仍假定?满足经典线性回归模型的假定,则
女教授的平均薪金为:
男教授的平均薪金为:
13( 0 )i i iE Y D X
1 2 3( 1 )i i iE Y D X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
假定?2>0,则两个函数有相同的斜率,
但有不同的截距。意即,男女教授平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差?2。
可以通过传统的回归检验,对?2的统计显著性进行检验,以判断男女教授的平均薪金水平是否有显著差异。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
11
年薪 Y 男教授女教授工龄 X
1
2
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
12
9.4 虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
– 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少 1
– 即如果某一定性变量有 m个类别,只在模型中引入 m-1个虚拟变量
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
13
9.5 虚拟变量引入的方式
虚拟变量做为解释变量引入模型有三种基本方式:
– 加法方式
– 乘法方式
– 混合方式
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
14
加法方式
加法方式引入虚拟变量,为的是考察 截距的不同
1 2 3i i i iY D X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
15
乘法方式
斜率的变化可通过以乘法的方式引入虚拟变量来测度
例,根据消费理论,消费水平 C主要取决于收入水平 Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
16
ttttt XDXC 210
这里,虚拟变量 D以与 X相乘的方式引入了模型中,
从而可用来考察消费倾向的变化。
假定 E(?i)= 0,上述模型所表示的函数可化为:
正常年份:
tttt XDXCE )()1,|( 210
反常年份:
tttt XDXCE 10)0,|(
如,设
0
1
tD 反常年份正常年份 消费模型可建立如下:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
17
混合方式
混合方式
– 当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
18
9.6 结构性检验
回顾邹检验的可能结果:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
19
邹检验的可能结果
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
20
虚拟变量法
1 2 1 2
()
1 19 82 ~ 19 95
D=
0 19 70 ~ 19 82
t t t t t i
t
Y D X D X u
Y
X
t
储 蓄收 入时 间
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
21
1970~1981储蓄函数的均值:
1982~1995储蓄函数的均值:
11( 0,)t t t tE Y D X X
1 2 1 2( 1,) ( ) ( )t t t tE Y D X X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
22
虚拟变量法相对于邹检验的优势
工作量小
– 只需做一个回归,便可得多个方程
可用于检验各种假设
– 截距、斜率
可明确告知什么导致了结构化变化
提高了估计的精度
– 数据混合,自由度增加
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
23
9.7 使用虚拟变量的交互效应
见 p286(第四版)
1 2 2 3 3
2
3
1
D=
0
1
D=
0
i i i i i
Y D D X u
Y
X
小 时 工 资受 教 育 水 平 ( 读 书 年 数 )
女 性男 性非 白 人 且 非 西 班 牙 人其 他
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
24
交互效应
1 2 2 3 3 4 2 3
2
3
()
1
D=
0
1
D=
0
i i i i i i i
Y D D D D X u
Y
X
小 时 工 资受 教 育 水 平 ( 读 书 年 数 )
女 性男 性非 白 人 且 非 西 班 牙 人其 他
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
25
23
1 2 3 4
2
3
4
( 1,1,)
()
i i i i
i
E Y D D X
X
女 性 的 级 差 效 应非 白 人 且 非 西 班 牙 人 的 级 差 效 应非 白 人 且 非 西 班 牙 人 女 性 的 级 差 效 应
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
26
9.8 季节分析中虚拟变量的使用
经济数据一般都具有季节性效应;
从时间序列数据中去除季节成分的过程被称为季节调整(除季节性);
虚拟变量是方法之一。
见 p288
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
27
9.9 分段线性回归
考虑某一公司薪酬结构,
– 若销售量低于某一水平 X*,采用一种薪酬结构 ;
– 若销售量高于某一水平 X*,采用另一种薪酬结构 ;
分段线性回归
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
28
*
1 1 2
*
i
*
i
()
1 X > X
D=
0 X X
i i i i i
Y X X X D u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
29
见 P294 图 9.6
*
11( 0,,)i i i iE Y D X X X
**
1 2 1 2( 1,,) ( ) ( )i i i iE Y D X X X X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
30
习题
9.9
9.10
9.12
9.24
虚拟变量回归模型主讲:彭红枫武汉大学经济与管理学院金融系
Copyright? Hongfeng Peng 2006 Wuhan
University
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
2
9.1 虚拟变量的性质
回归分析中,被解释变量不仅常受一些比率尺度变量 (如收入、产量、价格、成本、高度和温度 )的影响,而且还受 定性性质变量 (也被称为 名义尺度变量,如性别、种族、肤色、宗教、国籍、战争 )的影响。
为了在模型中能够反映这些定性性质变量的影响,并提高模型的精度,需要将它们“量化” 。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
3
如何量化?
这种“量化”通常是通过引入“虚拟变量”
来完成的。根据这些因素的属性类型,构造只取,0”或,1”的人为变量,通常称为 虚拟变量 ( dummy variables),记为 D。
例如,反映性别的虚拟变量可取为,
1,男
D=
0,女
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
4
9.2 ANOVA模型
方差分析 ( ANOVA,analysis of
variance) 模型 定义
– 回归模型中解释变量都是虚拟变量的模型
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
5
如,一个以性别为虚拟变量考察高校教授薪金的模型其中,Yi为高校教授的薪金
Di=1,若是男性; Di=0,若是女性
12i i iY D u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
6
在该模型中,如果仍假定?满足经典线性回归模型的假定,则
女教授的平均薪金为:
男教授的平均薪金为:
1( 0 )iiE Y D
12( 1 )iiE Y D
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
7
9.3 ANCOVA模型
ANOVA模型常见于社会学、心理学、教育学和市场调研等领域中;
在经济学中并不那么常见。在大多数经济研究中,典型的情形是:一个回归模型既含有一些定量的又含有一些定性的解释变量;
兼含有定量和定性变量的回归模型叫做协方差分析 (ANCOVA,analysis of covariance)模型。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
8
在看以性别为虚拟变量考察高校教授薪金的模型其中,Yi为高校教授的薪金,Xi为高校教授的工龄
Di=1,若是男性; Di=0,若是女性
1 2 3i i i iY D X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
9
同样地,如果仍假定?满足经典线性回归模型的假定,则
女教授的平均薪金为:
男教授的平均薪金为:
13( 0 )i i iE Y D X
1 2 3( 1 )i i iE Y D X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
10
假定?2>0,则两个函数有相同的斜率,
但有不同的截距。意即,男女教授平均薪金对教龄的变化率是一样的,但两者的平均薪金水平相差?2。
可以通过传统的回归检验,对?2的统计显著性进行检验,以判断男女教授的平均薪金水平是否有显著差异。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
11
年薪 Y 男教授女教授工龄 X
1
2
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
12
9.4 虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
– 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少 1
– 即如果某一定性变量有 m个类别,只在模型中引入 m-1个虚拟变量
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
13
9.5 虚拟变量引入的方式
虚拟变量做为解释变量引入模型有三种基本方式:
– 加法方式
– 乘法方式
– 混合方式
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
14
加法方式
加法方式引入虚拟变量,为的是考察 截距的不同
1 2 3i i i iY D X u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
15
乘法方式
斜率的变化可通过以乘法的方式引入虚拟变量来测度
例,根据消费理论,消费水平 C主要取决于收入水平 Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
16
ttttt XDXC 210
这里,虚拟变量 D以与 X相乘的方式引入了模型中,
从而可用来考察消费倾向的变化。
假定 E(?i)= 0,上述模型所表示的函数可化为:
正常年份:
tttt XDXCE )()1,|( 210
反常年份:
tttt XDXCE 10)0,|(
如,设
0
1
tD 反常年份正常年份 消费模型可建立如下:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
17
混合方式
混合方式
– 当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
18
9.6 结构性检验
回顾邹检验的可能结果:
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
19
邹检验的可能结果
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
20
虚拟变量法
1 2 1 2
()
1 19 82 ~ 19 95
D=
0 19 70 ~ 19 82
t t t t t i
t
Y D X D X u
Y
X
t
储 蓄收 入时 间
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
21
1970~1981储蓄函数的均值:
1982~1995储蓄函数的均值:
11( 0,)t t t tE Y D X X
1 2 1 2( 1,) ( ) ( )t t t tE Y D X X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
22
虚拟变量法相对于邹检验的优势
工作量小
– 只需做一个回归,便可得多个方程
可用于检验各种假设
– 截距、斜率
可明确告知什么导致了结构化变化
提高了估计的精度
– 数据混合,自由度增加
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
23
9.7 使用虚拟变量的交互效应
见 p286(第四版)
1 2 2 3 3
2
3
1
D=
0
1
D=
0
i i i i i
Y D D X u
Y
X
小 时 工 资受 教 育 水 平 ( 读 书 年 数 )
女 性男 性非 白 人 且 非 西 班 牙 人其 他
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
24
交互效应
1 2 2 3 3 4 2 3
2
3
()
1
D=
0
1
D=
0
i i i i i i i
Y D D D D X u
Y
X
小 时 工 资受 教 育 水 平 ( 读 书 年 数 )
女 性男 性非 白 人 且 非 西 班 牙 人其 他
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
25
23
1 2 3 4
2
3
4
( 1,1,)
()
i i i i
i
E Y D D X
X
女 性 的 级 差 效 应非 白 人 且 非 西 班 牙 人 的 级 差 效 应非 白 人 且 非 西 班 牙 人 女 性 的 级 差 效 应
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
26
9.8 季节分析中虚拟变量的使用
经济数据一般都具有季节性效应;
从时间序列数据中去除季节成分的过程被称为季节调整(除季节性);
虚拟变量是方法之一。
见 p288
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
27
9.9 分段线性回归
考虑某一公司薪酬结构,
– 若销售量低于某一水平 X*,采用一种薪酬结构 ;
– 若销售量高于某一水平 X*,采用另一种薪酬结构 ;
分段线性回归
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
28
*
1 1 2
*
i
*
i
()
1 X > X
D=
0 X X
i i i i i
Y X X X D u
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
29
见 P294 图 9.6
*
11( 0,,)i i i iE Y D X X X
**
1 2 1 2( 1,,) ( ) ( )i i i iE Y D X X X X
2009-7-27 Hongfeng Peng Department of
Finance,Wuhan University
30
习题
9.9
9.10
9.12
9.24