§ 9.2 离散被解释变量数据计量经济学
模型(二) — 多元选择模型
Models with Discrete Dependent
Variables—Multiple Choice Model
一、多元离散选择模型的经济背景
二、一般多元离散选择 Logit模型
三、嵌套多元离散选择模型
四、排序多元离散选择模型
一、多元离散选择模型的经济背景
1、经济生活中的多元选择问题
? 一般的多元选择问题
? 排序选择问题
– 将选择对象按照某个准则排队,由决策者从中
选择 。
– 决策者对同一个选择对象的偏好程度。
? 嵌套选择问题
2、社会生活中的多元选择问题
? 一般的多元选择问题
? 排序选择问题
? 嵌套选择问题
二、一般多元离散选择 Logit模型
说明
? 在多元离散选择模型中,因为 Probit模型需要对
多元正态分布的整体进行评价,所以它的应用受
到限制。
? 逻辑分布更适合于效用最大化时的分布选择,所
以应用最多的多元离散选择模型是 Logit模型。
? Logit模型的似然函数能够快速可靠地收敛,当方
案或者决策个体数量较大时,计算比较简便。
? Logit模型计算的简便性是有条件的。即选择方案
是不相关的,具体包括:
– Uij=Vij+ε ij,ε i是独立的;
– Pi/Pk与其它选择方案的属性无关,与选择方案的个数
无关;
– Pi关于其它选择方案属性的弹性是不变的,与 i无关。
? 上述条件只有在选择方案的差异相同的情况下才
能得到满足。
? 在相关文献中有数学证明。
⒈ 一般多元选择 Logit模型的思路
? 如果决策者 i在( J+1)项可供选择方案中选择了
第 j项,那么其效用模型为:
U ij ? ?X ij ij? ?
P U U k J k jij ik( ),,,,? ? ?0 1 2 ?
P y j
e
e
i
j
J
( )? ?
?
?
X
X
ij
ij
?
?
0
如果( J+1)个随机误
差项互不相关,并且
服从 Weibull分布
F eij ij( )? ?? ?
? 效用模型的解释变量中包括所有影响选择的因素,
既包括决策者所具有的属性,也包括备选方案所
具有的属性。
? 备选方案所具有的属性是随着方案的变化而变化
的。
? 决策者所具有的属性中一部分是随着方案的变化
而变化的,而一部分是不随着方案的变化而变化
的。
? 用 Zij表示随着方案的变化而变化的那部分解释变
量,Wi表示不随着方案的变化而变化的那部分解
释变量。
P y j
e
e
e e
e e
i
j
J
j
J
( )? ? ?
?
?
? ?
? ?
Z W
Z W
Z W
Z W
ij i
ij i
ij i
ij i
? ?
? ?
? ?
? ?
0 0
P y j
e e
e e
e
e
i
j
J
j
J
( )? ? ?
? ?
? ?
Z W
W Z
Z
Z
ij i
i ij
ij
ij
? ?
? ?
?
?
0 0
? 实用的一般多元 Logit选择模型又分 3种情况。
? 一是研究选择某种方案的概率与决策者的特征变
量之间的关系;
? 二是研究选择某种方案的概率与决策者的特征变
量以及方案的特征变量之间的关系;
? 三是考虑到不同方案之间的相关性的情况。
Multinomial Logit Model
多项式 Logit模型
名义 Logit模型
Conditional Logit Model
条件 Logit模型
Nested Logit模型
嵌套模型
⒉ 多元名义 Logit离散选择模型及其参数估计
P y j
e
e
i
j
J
j
j
( )? ?
?
?
X
X
i
i
?
?
0
X中未包含备选方案所具有的
属性变量,而参数向量 B对不
同的选择方案(即不同的方程)
是不同的。
P y j
e
e
i
k
J
j
k
( )? ?
?
?
?
X
X
i
i
?
?1
1
P y
e
i
k
J
k
( )? ?
?
?
?
0
1
1
1
X i ?
令 B0=0,j=1,2,…, J
多元名义 L ogit 离散选择模型的参数估计并不复杂。对于第 i 个决策者,如果
选择了第 j 个备选方案,令
d ij ? 1;如果没有选择第 j 个备选方案,令
d ij ? 0

同时,对于第 i 个决策者,在( J+1 )个备选方案中,只能选择 其中之一,即只
能存在 1 个
d ij ? 1
。于是,可以写出
y i n j Jij (,,,;,,,,)? ?1 2 0 1 2? ?
的联合概率函
数,由联合概率函数导出似然函数,进而得到对数似然函数为,
ln ln ( )L d P y jij i
j
J
i
n
? ?
??
??
01
由对数似然函数最大化的一阶条件,利用 Newton
迭代方法可以迅速地得到方程组的解,得到模型
的参数估计量。
?
?
ln ( ),,,L d P j J
ij ij
i? j
iX? ? ?? 1 2 ?
?
? ?
2
1
ln
( ( ) )
L
P j l Pij il i i
i
n
? ?j l 1 X X? ? ? ? ? ???
1 ( )j l j lj l? ? ????
?
1
0
如果
如果
另一种估计方法
? 可以计算得到相对于基准方案的对数概率比为:
l n( )PP ij
i 0
? X i j?
l n ( ) ( )
P
P
ij
ik
? ?X i j k? ?
? 两点注意:
假设了原模型中( J+1)个随机误差项互不相关。
对估计结果的解释不同。
例题
? 农村异地转移劳动力的迁移目标研究。
? 被解释变量,迁移目标,即小城镇、县级市、地级市、省
级城市和超大城市,依次取值 1,2,3,4,5。
? 解释变量,个人特征和目前所在地属性 。 连续变量 包括受
教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、
原有收入、现有收入,目前所在地属性中的所在地农村人
口、国内生产总值、城乡居民储蓄余额、粮食产量、中学
生在校人数、小学生在校人数等。 离散变量 包括性别、婚
姻状况、收入稳定与否,目前所在地所属级别与家乡所在
地所属级别等。
? 虽然作为被解释变量的城市规模本身是有序的,但是对于
农村劳动力来说,选择进入哪一个级别的城市,本身是无
序的,因此对于城市化迁移目标构造 多元名义 logit离散选
择模型 。
? 调查样本,有效样本 303份。
? 用 SAS统计软件进行估计与分析。
? 首先将定义的全部变量放进模型中进行估计,并通过比较
各个变量的 P值来考虑具体剔除哪些变量以及对哪些变量
考虑将其交互影响的效应放进模型中去。
? 小城镇、县级市、地级市、省级城市和超大城市依次取值
1,2,3,4,5。
? 由于得到了频数,可以采用“对数概率模型”进行估计。
迁移目标 频数 百分比 累计频数 累计百分比
小城镇 15 4.95 15 4.95
县级市 62 20.46 77 25.41
地级市 84 27.72 161 53.14
省级城市 72 23.76 233 76.90
超大城市 70 23.10 303 100.00
? 最终模型的估计结果(部分)
变量 模型序号 系数估计 标准差 P 值
1 1.2137 1.4518 0.4032
2 ** 2.7685 1.0998 0.0118
3 ** 2.3962 0.9351 0.0104
常数项
4 *** 3.6742 1.0665 0.0006
1 ** - 0.2475 0.1050 0.0184
2 *** - 0.2800 0.0727 0.0001
3 * - 0.1136 0.0660 0.0852
教育程度
4 - 0.0856 0.0696 0.2184
1 - 0.1299 0.1084 0.2310
2 * - 0.0943 0.0552 0.0877
3 - 0.0337 0.0452 0.4556
家庭情况
4 *** - 0.1578 0.0586 0.0071
*代表的是 90
%的显著性水
平,
**代表的是 95
%的显著性水
平,
***代表的是
99%的显著性
水平。
? 将模型的结果整理出来,并对每个解释变量进行分析。
? 例如:教育程度、家庭情况及现有收入对迁移目标的影响:
因变量 教育程度 家庭情况 现有收入
l og ( 1 / 5 ) - 0.2475 ** - 0.1299 - 0.00144 *
l og ( 2 / 5 ) - 0.2800 *** - 0.0943 * - 0.00032 **
l og ( 3/ 5 ) - 0.1136 * - 0.0337 - 0.00028 **
l og ( 4 / 5 ) - 0.0856 - 0.1578 *** - 0.00030 **
? 从教育程度来看,所有系数都是负值,教育程度越高的农
村劳动力越愿意进入规模较大的城市;从显著性水平来看,
相对于超大城市来说,县级市被选择的可能性最小,其次
是小城镇,然后是地级城市,而教育程度相似的农村劳动
力在省级城市与超大城市之间的选择没有明显的差异。
? 从家庭情况来看,所有系数都是负值,也就是说家庭情况
越好的农村劳动力越愿意进入规模较大的城市;从显著性
水平来看,相对于超大城市来说,省级城市最不容易被选
中,其次是县级市,而小城镇与地级市之间没有明显区
别 。
? 从现有收入来看,所有系数都是负值,也就是说目前收入
越高的农村劳动力越愿意进入规模较大的城市;再从显著
性水平来看,所有系数都是显著的,这说明相对于任何级
别的城市而言,农村劳动力都更倾向于超大城市。
⒊ 多元条件 Logit离散选择模型及其参数估计
? 选择某种方案的概率不仅与决策者的特征变量有
关,而且也与方案的特征变量有关,模型为:
P y j
e
e
i
j
J
j j
j j
( )? ?
?
?
X
X
i
i
?
?
1
区别在于
X的下标
ln ln ( )L d P y jij i
j
J
i
n
? ?
??
??
11
? 由对数似然函数最大化的一阶条件,利用
Newton 迭代方法可以迅速地得到方程组的解,
得到模型的参数估计量。
?
?
ln
( )
L
d ij
j
J
i
n
ij i? ? ?
??
??
11
X X
?
? ?
2
11
ln
( )( )
L
P ij
j
J
ij i ij i
i
n
? ? ? ? ? ? ? ??? ?? X X X X
X Xi ij
j
J
ijP?
?
?
1
三、嵌套多元离散选择模型
1、问题的提出
? (J+1)个不同的选择方案之间具有相关性,而且必
须考虑这种相关性,表现为模型随机误差项相关。
? 可行的思路是将( J+1)个选择方案分为 L组,在
每组内部的选择方案之间不具有相关性,而组间
则具有相关性。
? 就是将条件 Logit模型中隐含的齐次方差性条件放
松,允许方差在组间可以不同,但在组内仍然是
同方差的。
? 这样的模型被称为 Nested Logit模型。
1,Nested Logit模型
P j l P
e
e
jl
j
J
l
L l
(,) ? ?
?
?
??
??
X Z
X Z
j l l
j l l
? ?
? ?
11
表示对选择第 l组产
生影响的变量
表示在第 l组内对
选择第 j种方案产
生影响的变量
P P P
e
e
e
e
e e
e
jl j l l
j
J
l
L
j
J
l
L
j
J
l
Ll
l
l
? ?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
? ?
? ?
?
??
? ?
? ?
??
X
X
Z
Z
X Z
X Z
j l
j l
l
l
j l l
j l l
?
?
?
?
? ?
? ?
1 1
1 1
11
? 定义第 l组的“内值”( Inclusive Value)
I el
j
J l
?
?
?ln X j l ?
1
P
e
e
j l
j
J l?
?
?
X
X
j l
j l
?
?
1
P
e
e
l
l
L
l
l
?
?
?
?
?
Z I
Z I
l l
l l
? ?
? ?
1
3、估计方法
? 两阶段最大似然法,是一种有限信息估计方法。
其具体步骤是:
– 在组内,作为一个简单的条件 Logit模型,估计参数;
– 计算每组的“内值”;
– 将每组看成是一种选择方案,再进行简单的条件 Logit
模型的估计,得到参数 Γ和 T的估计量。此时用到的贡
献变量是 Zl和 Il。
? 完全信息最大似然法 。将对数似然函数写为:
ln ln ( )L P Pj l l i
i
n
? ?
?
?
1
四、排序多元离散选择模型
Multivariate Choice Model
for Ordered Dada
1、问题的提出
? 作为被解释变量的( J+1)个选择结果本身是排
序的,J优于( J- 1),2优于 1,1优于 0。
? 决策者选择不同的方案所得到的效用也是排序的。
? 一般多元离散选择模型中的效用关系不再适用。
2、效用关系
? 选择不同方案的效用关系:
y y
y u
u y u
J u y
J
? ?
? ? ?
? ? ?
? ?
?
0 0
1 0
2
1
1 2
1
如果
如果
如果
如果
*
*
*
*
?
3、模型
为了保证所有的概率都是正的,必须有,
y * ? ?X ? ?
P y
P y u
P y u u
P y J u
J
( ) ( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( )
? ? ?
? ? ? ? ?
? ? ? ? ?
? ? ? ?
?
0
1
2
1
1
2 1
1
? ?
? ? ? ?
? ? ? ?
? ?
X
X X
X X
X
?
假定 μ服从正
态分布,并且
标准化为服从
期望为 0、方
差为 1的正态
分布。那么可
以得到选择各
个方案的概率
Φ为正态分布
的概率函数
0 1 2 1? ? ? ? ?u u u J?
4、估计
? 可以看作二元 Probit模型的推广;
? 采用最大似然法估计。