第十二章 群决策与社会选择 Group Decision-making and Social Choice Theory 主要参考文献 56,118,169,185 §12-1概述 一、为什么要研究群决策 在现实生活中 ●任何决策会影响一群人,因此在公正、民主的社会中, 重大的决策应尽量满足受该决 策影响的群众的愿望和要求. 群众通过代表反映愿望和要求,代表们构成各种委员会. ●行政机构中的领导班子 ●社会发展→信息和知识的积累及更新速度加快,领导个人难以在掌和应付→智囊团和咨询机构应运而生并广泛存在,作用加强. 委员会、代表大会、议会、协会、俱乐部, 领导班子、组织, 智囊团等等都是群,群中的成员各有偏好, 要形成集体意见需要研究群决策和社会选择理论. 世界上矛盾无处不在, 人与人、组织与组织、国与国之间的矛盾如何解决,如何避免冲突升级,需要研究协商、谈判、仲裁、调解、合作对策等冲突分析方法, 因而冲突分析也是群决策的主要研究内容. 二、分类 涉及内容及解决办法 投票表决 社会选择 社会选择函数 社会福利函数 委员会 激发创造性 集 专家判断 采集意见 体 和 系统结构的探索 决 群体参与 仿真 策 Team theory 实施与管理 群 一般均衡理论 递阶优化 决 组织机构决策 组织决策 策 管理 | 正规型 多 一般对策论 扩展型 人 特征函数 决 Nash 策 冲 协商与谈判 K-S 突 Mid-mid 分 均衡增量 析 主从对策与激励 强制仲裁 仲裁与调解 最终报价仲裁 亚对策论 组合仲裁 三、社会选择的定义与方式 定义: ( Luce & Raiffa ) 社会选择就是根据社会中各成员的价值观及其对不同方案的选择产生社会的决策;即把社会中各成员对各种状况的偏好序集结成为单一的社会偏好模式… 社会选择的常用方式: 惯例、常规、宗教法规、职权、独裁者的命令、投票表决和市场机制. 其中: 投票: 少数服从多数, 大多用于解决政治问题; 市场机制:本质是用货币投票, 大多用于经济决策; 独裁: 根据个人意志进行(取代)社会选择; 传统:以惯例、常规、宗教法规等代替社会中各成员的意志. 传统到独裁的演变 : 传统(无论惯例、常规还是宗教法规)在开始时是社会上大部分公民或成员认可的规则(以及规定、法规), 随着社会的发展, 总有新的问题、新情况是原来的规则(以及规定、法规)所无法解决的,解决这些新的问题、新情况的新规则就要由社会上比较有威望的某些人制订, 这些人在解决新问题、新情况时就代替整个社会进行了选择. 只要这些人不是以民主方式选举产生的, 他们的权力就会逐渐增大, 成为代替社会进行决策的小团体. 这个小团体中最强有力的人物最终也就有可能成为独裁者. §12.2 投票表决(选举)(Voting) 投票表决可分成两步: 1.投票,应简单易行 计票,应准确有效 一、非排序式投票表决(Non-ranked Voting Systems) (一)只有一人当选 候选人只有两个时: 计点制(Spot vote) 投票: 每人一票;计票: 简单多数票(simple plurality)法则(即相对多数). 2. 候选人多于两个时 ① 简单多数(相对多数) ②过半数规则(绝对多数Majority) 第一次投票无人获得过半数选票时, a.二次投票,如法国总统选举. 反复投票: i.候选人自动退出,如美国两党派的总统候选人提名竞选; 得票最少的候选人的强制淘汰,如奥运会申办城市的确定. 1 由11个成员组成的群, 要在a、b、c、d 四个候选人中选举一人.设各成员心目 中的偏好序如下: 成员 i 1 2 3 4 5 6 7 8 9 10 11 排序 第一位 a a a b b b b c c c d 第二位 c c c a a a a a a a a 第三位 d d d c c c c d d d c 第四位 b b b d d d d b b b b 按简单多数票法则, b得4票 当选. 实际上,虽然有4人认为b最好,但是有7人认为b最差; 虽然只有3人认为a最好,但是其余8人认为a是第二位的; 所以,由a当选为宜. 2 设各成员心目中的偏好序如下: 成员 i : 1 2 3 4 5 6 7 8 9 10 11 排序 第一位 b b b b b b a a a a a 第二位 a a a a a a c c c d d 第三位 c c c d d d d d d c c 第四位 d d d c c c c b b b b 按简单多数票法则或过半数规则, b得6票当选. 实际上,虽然有6人认为b最好,但是有5人认为b最差; 虽然只有5人认为a最好,但是其余6人认为a是第二位的; 所以,由b当选未必合适. 3 设各成员心目中的偏好序如下: 成员 i : 1 2 3 4 5 6 7 8 9 10 11 排序 第一位 b b b c c c c d d a a 第二位 a a a a a a a a a b d 第三位 d c d b b b d c b d c 第四位 c d c d d d b b c c b 按过半数规则, 第一次投票无人获得过半数选票, c、 b得票多,第二投票时,6人认为c比b优, c当选. 而在该问题中没有人认为a处于第二位以下,却有4 人认为 c 最差. 由上面三个例子可知, 无论简单多数票法则、过半数规则 还是二次投票,都有不尽合理之处. (二). 同时选出二人或多人 单一非转移式 投票表决(Single nontransferable voting) 投票人每人一票, 得票多的候选人当选. 如:日本议员选举采用选区制,每选区当选人数超过2个, 1890年起即用此法. 复式选举(Multiple voting) 每个投票人可投票数=拟选出人数 但对每个候选人只能投一票 弊端: 在激烈的党派竞争中,实力稍强的党派将拥有全部席位.因此该方法只能用于存在共同利益的团体、组织内部, 如党团组织和班干部的选举. 受限的选举(Limited voting) 每个投票人可投票数<拟选出人数 对每个候选人只能投一票 弊端: 同上. 1868年英国议会选举采用此法, 1885年即取消. 4. 累加式选举(Cumulate voting) 每个投票人可投票数=拟选出人数.这些选票由选举人自由支配,可投同一候选人若干票 利: 可切实保证少数派的利益. 大多用于学校董事会的选举,例:英国 (1870-1902).(注意: 公司董事会的选举与此不同.) 5. 名单制(List system) 由各党派团体开列候选人名单, 投票人每人一票, 投给党团. 此法于1899年用于比利时, 以后被荷兰、丹麦、挪威和瑞典等国采用. 计票分两种: ⑴. 最大均值法; ⑵. 最大余额法 4 24000人投票,选举5人, A、B、C、D四个党派分别得8700、6800、5200、3300票, 如何分配议席? (1)最大均值法: A 党首先分得第一席.第二席分给各党派时, 各党派每一议席的均值如下: 党派 得票 除数 均值(每一议席的得票均值) A 8700 2 4350 B 6800 1 6800 C 5200 1 5200 D 3300 1 3300 由于B党的均值最大B党得第二席.分第三席时 各党派每一议席的均值如下: 党派 得票 除数 均值 A 8700 2 4350 B 6800 2 3400 C 5200 1 5200 D 3300 1 3300 C 党得第三席, 分第四席时各党派每一议席的均值如下: 党派 得票 除数 均值 A 8700 2 4350 B 6800 2 3400 C 5200 2 2600 D 3300 1 3300 由于A党的均值最大, A党得第四席.分第五席时各党派每一议席的均值如下: 党派 得票 除数 均值 A 8700 3 2900 B 6800 2 3400 C 5200 2 2600 D 3300 1 3300 B党的均值最大B 党得第五席. 最后A B各得2席 , C得1席. ⑵. 最大余额法: 首先计算Q=N/K的值 : Q=24000/5=4800, 用各党派得票数除以Q并计算余数: 党派 得票 除数 分得席位 余额 A 8700 4800 1 3900 B 6800 4800 1 2000 C 5200 4800 1 400 D 3300 4800 0 3300 按每4800票得一席,A、B、C党各得一席, 剩余2席,因为A、D两党的余额大,最后A党得2席, B、C和D党各得一席. 可以证明, 最大均值法对大党有利; 最大余额法对小党有利. 6. 简单可转移式选举(Single nontransferable voting) 常常用于3-6个席位的选区.投票人每人一票. 现况值Q=N/(K+1), 得票数大于Q的候选人人选,得票最少的候选人被淘汰, 由未被淘汰的未当选候选人在下一轮中竞争剩余席位. 仍以例12.4说明. N=24000, K=5, 故Q=N/(K+1)=24000/6=4000, 设各党派候选人的第一次投票得票数为: 候选人: A A A B B C C D 得票数: 4100 4100 500 4100 2700 4050 1150 3300 其中, A,A, B, C第一次投票后可入选, A被淘汰, B, C, D 通过第二次投票 竞争最后一席.这时 Q=24000/2=12000. 支持A 党的可转移投票方向, 他们在让谁入选上有 决定性影响. 7. 认可选举( Approval vote ) 每个投票人可投任意张选票, 但他对每个候选人只能投一张票. 得票最多的前K个候选人当选. 如职称评定, 评奖, 评先进等. (三). 其它投票表决(选举)方法 资格认定 候选人数M= 当选人数K 即等额选举, 用于不存在竞争或不允许竞争的场合. 不限定入选人数 如学位点评审,职称评定, 评奖等. 目的不是排序.而是按某种标准来衡量被选对象. 2. 非过半数规则 ⑴2/3多数, 例美国议会推翻总统否决需要2/3多数. ⑵2/3多数(60%多数, 例如希腊议会总统选举,第一次需要2/3多数,第二次要60% 多数. ⑶3/4多数, 美国宪法修正案需要3/4州议会的批准. ⑷过半数支持, 反对票少于1/3. 例如1993年前我国博士生导师的资格认定. ⑸一票否决, 安理会常任理事国的否决权. 二、偏好选举与投票悖论 ( Paradox of voting ) 记号 N={ 1, 2,… ,n } 表示群,即投票人的集合; A={ a, … ,a} 备选方案(候选人)集合; ( , ~ 成员(投票人) i的偏好; ~, ( 群的排序. n 或 N(a ( a) 群中认为 a优于a 的成员数 采用上述记号, 过半数规则可以表示为: 对 a,a∈A 若 n>n 则 a ( a; 若 n=n 则 a~ a Borda法( 1770年提出) 由每个投票人对m 个候选人排序, 排在第一位的得m-1分, 排在第二位的得m-2分,… 根据各候选人所得总分多少确定其优劣. 3. Condorcet原则( 1785年提出) 对候选人进行成对比较, 若某个候选人能按过半数规则击败其它所有候选人, 则称为Condorcet候选人; 若存在Condorcet候选人,则由其当选. 用上述记号表示,即: 若 n>n ∨ a∈A\{ a}, 则a当选. 5 群由60个成员组成, A={ a, b, c }, 群中成员的态度是: 23人认为 a (c (b (即a优于c ,c优于b, a也优于b) 19 人认为 b (c (a 16人认为 c (b (a 2人认为 c (a (b a与b相比 N(a (b)=25, N(b (a)=35 因此有b ( a a与c相比 N(a (c)=23, N(c (a)=37 因此有c ( a b与c相比 N(b (c)=19, N(c (b)=41 因此有c ( b 由于候选人c能分别击败a与b, 所以c是Condorcet候选人,由c当选. 但是,常常不存在Condorcet候选人. 多数票循环(投票悖论) 6 若群中60个成员的态度是: 23人认为 a (b (c 17 人认为 b (c (a 2人认为 b (a (c 8人认为 c (b (a 10人认为 c (a (b 由于 N(a (b)=33, N(b (a)=27 因此有a ( b N(b (c)=42, N(c (a)=18 因此有b ( c N(a (c)=25, N(c (a)=35 因此有c ( a 每个成员的偏好是传递的, 但是按过半数原则集结得到的群的排序并不传递,出现多数票循环,这种现象称作 Condorcet效应(也叫投票悖论) 5. 出现 Condorcet效应的概率 成员数N : 3 5 7 11 15 25 ∞ 方案数 m= 3 .0556 .0694 .0750 .0798 .082 .0843 .0877 4 .111 .14 .15 .1755 5 .16 .20 .22 .2513 6 .20 .25 .27 .3152 8 .4152 10 [1] .4887 15 .6087 20 .6811 30 .7914 .8405 三、策略性投票(操纵性) 小集团控制群 例: 百人分蛋糕 谎报偏好而获益 例12.7 群由30个成员组成, A={ a, b, c }, 群中成员的态度是: 14 认为 a (b (c 4 人认为 b (a (c 4人认为 b (c (a 8人认为 c (b (a 根据Borda法和Condorcet原则,都应由b当选, 但是, 若认为 a (b (c的14人中有8人撒谎, 称他们认为 a (c (b , 则按Borda法, 将由a当选. 3. 程序(议程)问题 例12.6所述问题: 后参加表决的方案获胜. 四、衡量选举方法优劣的标准 ①能否充分利用各成员的偏好信息 ②若存在Condorcet候选人,应能使其当选. ③能防止策略性投票 §12.3 社会选择函数 一、引言 1. 仍以例12.5 为例:群由60个成员组成, A={ a, b, c }, 群中成员的态度是: 23人认为 a (c (b 19 人认为 b (c (a 16 人认为 c (b (a 2人认为 c (a (b 根据Condorcet原则 c当选 根据简单多数规则 a当选 根据过半数(二次投票)规则 b当选 该例中一共只有三个候选人, 采用不同选举方法时, 这些候选人都有可能当选. 那么这些方法中究竟何者合理?据何判断选举方法的合理性? 2例12.6表明多数票循环不可避免, 问题是: 出现多数票循环时该谁当选? 研究社会选择问题的理论家提出:应该采用某种与群中成员偏好有关的数量指标来反映群(即社会)对各方案的总体评价. 这种数量指标称为社会选择函数. 二、社会选择函数的几个性质 0. 记号 在对x,y比较时 1 若 x (y D= 0 若 x ~y -1 若 y (x 群中各成员的偏好分布 D = ( D,…,D) 偏好分布的集合 ( = { -1, 0, 1 } 社会选择函数 F(D) = f( D,…,D)  D ∈ ( 即 F : { -1, 0, 1 } → { -1, 0, 1 } 1. 明确性 (Decisiveness) D≠0 → F(D) ≠0 2. 中性 (Neutrality)又称对偶性 对侯选人的公平性 f( -D,…,-D) = - f( D,…,D) 3. 匿名性 (Anonymity) 又称平等原则 各成员的权力相同 f( D,…,D) = f( D,…,D) 其中σ是 (1, …,n)的新排列 4. 单调性 (Monotonicity)又称正的响应 若 D ≥D’ 则F ( D )≥F ( D’ ) 5. 一致性 (Unanimity)又称Weak Pareto性 f ( 1, 1,…, 1) = 1 or f ( -1, -1,…, -1) = -1 6. 齐次性(Homogeneity) 对任意正整 数m F ( mD ) = F ( D ) Pareto性 D∈ { 1, 0 } for all I and D = 1 for some k → F ( D ) = 1 D= 0 for all I → F ( D ) = 0 三、社会选择函数 Condorcet-函数 f(x) =  N( x (y ) f( .) 值愈大愈优. 6 群中60个成员的态度是: 23人认为 a (b (c 17 人认为 b (c (a 2人认为 b (a (c 8人认为 c (b (a 10人认为 c (a (b N(a (b)=33, N(a (c)=25 因此f( a ) = 25 N(b (a)=27, N(b (c)=42, 因此f( b ) = 27 N(c (a)=18, N(c (a)=35, 因此f( c ) = 18 ∴ b ( a ( c Condorcet-函数值还可以用下法求得: 根据各方案成对比较结果列出表决矩阵 -- 33 25 矩阵中各行最小元素: 25 ( = 27 -- 42 27 35 18 -- 18 即Condorcet-函数值. Condorcet-函数满足性质1~6. Borda-函数 f (x) =  N( x (y ) f (x) 即表决矩阵中x各元素之和, f ( .) 值愈大愈优. 6中方案a ,b ,c的Borda-函数值分别是58, 69, 53, ∴ b ( a ( c Borda-函数满足性质1~6. 3. Copeland-函数 根据各方案两两比较的胜负次数的差来定 f(x) = M{y: y ∈A且 x (y}- M{y: y ∈A且y (x} f( .) 值愈大愈优. 例12.6中方案a ,b ,c的Copeland函数值均为0, 三者平局. Copeland-函数满足性质1~6. Nanson函数 用Borda-函数求解, 每次淘汰Borda-函数值最小的方案: 即: A = A , A = A\{ x∈A; f (x) ≤f (y),且对某些y f (x) <f (y) } 直到 A = A 为止. 6中f (c) 的Borda-函数值最小, ∴A = A \{ c } = { a, b } A = A\{ b } = { a } ∴ a ( b ( c Nanson函数不满足性质(4). Dodgson函数(C.J.Dodgson, 英,1832— 1898) 使某个候选人成为Condorcet候选人需要N中成员改变偏好的总选票数. N个成员,m个候选人 记 n = N (a ( a) n为偶数时 =n/2 n为奇数时 =(n+1)/2 n = 0 f (a) =  j=1,…,m 例12.6中, a,b,c的Dodgson函数值分别为5, 3, 12, ∴ b ( a ( c Dodgson函数不满足 (4). 6.Kemeny函数 使社会排序与各成员对方案的偏好序有最大的一致性. 首先定义: ①社会选择排序矩阵 L = {l} ( 1 a ( a l=( 0 a~ a ( -1 a ( a A 上的每一线性序都对应一个L 记  = N (a ( a)  = N (a ( a)  = N (a~ a) ②比例矩阵 M = {m} m = (+/2)/n ③投票矩阵 E = M-M e =  定义 < E·L > =  e l 即, 群中认为 a ( a 的成员的比例与群的排序l的内积, 它反映群的排序与成员排序的一致性. Kemeny函数 f= max < E·L > 。 Cook-Seiford函数 设成员i 把方案j 排在 r位, 方案j的群体序为K 则成员I与群体序的总偏差 : | r-K | 各成员排序与群体序的总偏差 d= | r-K | 数学规划 min d p t.  p = 1  p = 1 的解中 p = 1 表示方案j的群体序为K 本征向量函数 Dodgson矩阵 D = [ d] 其中: d= n/n, 显然d = 1/d , 但是d≠djl * dlk , 可由 (D - mI) W = 0 求得 W 后.按各分量的大小排相应方案的次序. 9. Bernardo函数 上述各种方法只根据各成员对各方案的总体优劣集结成群体序.对某些多人多准则问题, 尤其是实际工程问题, 应该根据每个准则下各方案的优劣次序集结成群体序. 一般的多准则社会选择问题可以表述为: 对有限方案集A={ a, … ,a}, 由委员 会 N={ 1, 2,… ,n } 根据准则集(即评价指标体系) C={c1, c1, …,cr} 来确定各方案的优先次序. 在求解问题时, 首先要根据r种不同的准则中的每一种准则,分别描述各方案aj的优劣. 为了集结各成员的意见,可以用协商矩阵∏表示委员会对各方案优劣的总体感觉. ∏是m×m方阵, 其元素表示将方案aj排在第k位的成员人数. 为了反映各准则的重要性, 可以对各准则加权. 权向量W={w1, w2, …, wr}. 设根据准则cl, 有位成员将aj 排在第k位, 则=. , Bernardo定义一个0-1矩阵P, 其每行、每列只有一个元素为1,余者均为0. 使 极大, 即 max  s.t. =1 k=1,2, …,m =1 j=1,2, …,m ∈ {0,1} P中的非0元素=1表示方案aj应该排在k位. §12.4 社会福利函数(Social Welfare Function) 一、社会福利(Social Welfare) 1. 福利经济学是经济学中的一个学派,主要研究社会的福利与福利的判断问题; 2. 福利经济学家(例Bergson, Samulson等)认为: 社会福利是一种可以测度的量,人们可据以判断一种社会状况是优于,无差异于还是劣于另一种社会状况。即可以用 Social welfare function来度量社会福利。 定义: SWF是社会状态x的实值函数,是社会福利的测度,记作W(x)=G(w (x),…,w (x)) Note: ①社会福利是社会中各成员所享受福利的综合,而非总和; ②个人的福利wi(x)与该成员对社会的贡献、地位、个人的兴趣、爱好等多种因素 有关. 3. 若用u(x)表示社会状态x带给成员i的福利,则W(x)=G(u (x),…,u(x)), 在相互效用独立时G可表示为加性,即W(x)=  但是,由于存在不确定性, 设导致x的自然状态θ的概率为π(θ) 故应有:max{ E[W(x)] = }, 所以社会福利的判断极其复杂. 即使对确定性的x a)各成员间的效用并不独立:不患寡而患不均; b)两个人的福利相加并无意义(一个人享受双分福利与二人各享受一份绝不等价), 所以加性社会福利函数并无实际意义. 而且使用SWF存在如下问题: ①各成员的福利(效用)函数如何确定? ②人与人间的福利函数如何校定基准值与比例尺,即如何进行效用的人际比较? ③由谁评价? 怎样评价? 即个人的诚实性与评价的公平性如何检验? 社会福利函数的实质:是一种规则,是潜在的群决策过程, 是从个人对社会状况的排序得出社会总体排序的方法. 二、偏好断面(profile of preference ordering)(偏好分布) 1可能的偏好序 (1) 二个方案 x ( y , x ( y , x (y 三个方案 R: x ( y ( z , R: x ( z ( y , … , R: x ( y ( z 记各方案间可能的偏好序集合 ( = { R, R,…, R},则可能的偏好序种类S为: 方案数 m 2 3 4 5 7 8 只考虑强序时 m! 2 6 24 120 720 5040 全部 S 3 13 75 541 4386 46033 2偏好断面: 记成员i的排序为Oi , Oi∈( 偏好断面P = ( O1,O2, …,On) P ∈( 社会福利函数f : P →( 3. 可能的社会福利函数 2个成员, 2个方案成员的偏好序S=3时,f的定义域即偏好分布有3= 9种, f的值域即群的排序为3, 因此, f的可能形式有3=19683种. 3个成员, 2个方案时, f的可能形式有3=7.6256×10种. 2个成员, 3 个方案时, f的可能形式有13=1.8×10种. 3个成员, 3个方案, 只考虑强序时, f的可能形式有6=1.2×10种. 在这许多可能形式中,哪些比较合理呢? K. J. Arrow研究了社会福利函数应当满足的条件. 三、Arrow的条件(即社会福利函数应当具有的性质) 条件1. 完全域(广泛性) Universality a). m ≥3 b). N ≥2 c). 社会福利函数定义在所有可能的个偏好分布上; 条件2. 社会与个人价值的正的联系(Positive association of social and individual value) 若对特定P,①原来有x (G y,则在P作如下变动后仍有有x (G y i. 对除x以外的方案成对比较时偏好不变 ii. x与其他方案比较时或者偏好不变,或者有利于x。 (有利于x是指 x (i y →x (i y或者y (i x→ x ( i y或 x (i y) ②原来有x ( G y, 则在P作如上变动后仍有x ( G y或x (G y 条件3 无关方案独立性(Independence of Irrelevant Alternatives) i. A1(A , A1∪ = A 对 中方案的偏好变化不影响A1中方案的排序,换言之 ii. x , y的优劣不因z 的加入而改变. 条件4. 非强加性(公民主权Citizen’ sovereignty) 总要有某些成员认为x (i y时,才能有x (G y. 条件5. 非独裁性( Non-Dictatorship ) 群中任一成员 i都没有这样的权力: x (i y→x (G y 此外,个人和群的优先序应满足连通性(可比性),传递性. 条件2加条件4即Pareto条件. 四、Arrow 的可能性定理 定理1(m=2 的可能性定理) 若方案总数为2,过半数决策方法是一种满足条件1~5的社会选择函数,它能对每一偏好分布产生一个社会排序。 定理2 (一般可能性定理)即Arrow不可能定理 若m≥3,社会中的成员可以对方案以任何方式自由排序,则满足条件2和3且所产生的社会排序满足连通性和传递性的社会福利函数就必定是,要么是独裁的,要么是强加的。 Arrow不可能定理的本质是Condorcet 效应(投票悖论)的公理化描述. 另一种表述法*: 满足(U.P.I)的防投票策略性选举都可能产生一个独裁者,即没有一种选举方法是非独裁的且是防投票策略的. 五、单峰偏Black好与Coombs条件 要使Arrow的不可能定理成为某种可能性定理, 必须放松Arrow的条件1、 2 、3. 首先放松条件1(完全域). 1. 单峰偏好 背景: 在议会中,通常可根据各党团的政治倾向从左到右(或从激进到保守)依次排列.此时议员对各党派(以及该党派的议案或候选人)的排序就和这些党派的政治倾向与议员本人的政治观点 的距离有关, 即满足单峰偏好约束. 2. Coombs条件 背景: 给aj赋值π(aj), 成员i的理想点为Ii, 方案 aj 的优劣与 | π(aj)- Ii | 的大小成反 比例. Coombs条件与单峰偏好的区别:Coombs条件要求对称于Ii . 多样性程度(不考虑~, 只考虑强序) Fb(m) = 2 Fc (m ) = +1 m 3 4 5 7 10 Fb(m)/m! 2/3 8/24 16/120 .013 1.41×10 Fc (m )/m! 2/3 7/24 11/120 .004 1.27×10 使过程多数规则具有传递性的偏好断的规模 < 华中理工大学学报> 22(8) 六、SCF与SWF的比较 ·同异:· 均为集结方法采用数学的投表决法(排序)以方案成对比较作基础 ·SWC的方案可以无限,SCF中方案有限 ·性质与条件:2 →单调性 2+4→Pareto最优(一致性) (3),5→匿性性 1b中性 自反连道←明确性 §12.5群效用函数 一、导致Arrow不可能定理的原因 ①否认效用的基数性; ②否认效用的人际比较的可能性 ·以咖啡或茶待客问题为例: 甲认为 咖啡(茶 乙认为 茶(咖啡 由甲乙构成的群不能作结论 但若抛开无关方案独立性条件: 甲认为 咖啡(茶(牛奶(汽水(可乐(啤洒 乙认为 茶(牛奶(汽水(啤洒(可乐(咖啡 则似以茶待客为宜. 但是,若甲乙表达的对饮料的偏好强度如下  则仍以咖啡待客为宜. 即:若各成员的偏好可比强度可测,则集结成员偏好序就成了集地各成员的基数效用. 这一效用函数满足两个公理和五个条件,阿罗的不可能定理就成为可能定理. 二、群效用函数与多目标效用函数的比较 形式相同: 对方案的评价都涉及多个准则 实则不同:MAUF是由一个决策人作判断的,只要量化他对各属性的偏好(即可以由他一个人对各属性值作权衡)这种量化是可以实现的; GUF要考虑群中各成员的偏好,再设法集结,由于a+ui(x) 仍是成员i的效用,如何确定各成员的a(a为效用基准)、b(b为比例尺度), 使群中各成员的效用可比, 这是很难(如果不是不可能!)实现的. 有人提出: 集结群体效用应该找一个超脱于各成员之外, 公正无私的人, 他要想象自己处于群种各个成员的客观地位且具有其相同的主观爱好, 去估计各种社会状况对群中各成员的效用, 再据以集结成群的效用. 但是,在现实生活中, 不可能找到这样的人. 三、群决策提法本身存在缺陷 在第一章中,我们指出: 决策是自由意志行动. 因此,个人能决策; 群不是统一实体,不具备自己意志,不能决策,群是社会的作用:群中成员只能决定: 如何投票;是否接受他人意见;是否要提反对意见…… §12.6 谈判与仲裁 §12.6.1引言 一、群决策的分类 Harsanyi根据群中成员的行为准则把群决策分为两大类: ①从伦理道德出发,追求群作为整体的利益,属于集体决策,即社会选择问题 例如:委员会,董事会,智囊团所作的决策; ②追求自身利益及与他人对立的价值,是对策即博奕问题,谈判可以归入这一类. 二、研究沿革 ①1994 Von-Neumann-Morgensterm, 用数学模型研究谈判问题 ②Nash(1950)谈判问题(Bargaining Problem) ③Luce, R.D & Raifa, H(1957), Games and Decision ④Raiffa, H.(1982):The art and Science of Negotiation §12-6-2 Nash谈判模型 一、问题表述: 甲、乙两个谈判者, 效用分别为u1(·)和u2(·); 可行域为R,现况点为(,) Pareto最优边界QP的子集MN较现况点占优势, MN称为谈判集(见下图).  图12.2 二、基本假设 1.每个人都指望对方是合乎理性的; 2.谈判双方的效用函数u1(·)和u2(·)能足够精确地反映各自的偏好; 任何协议一经达成就具有强制性,不得违约. 三、Nash提出的四条公理——为了预先求得谈判结果 公理一 后果限于谈判集内 谈判双方一致达成的协议点( )是谈判集中的点,是可行的, Pareto最优的,不劣于现况点的值。 公理二 对称性 如果可行域是对称的,现况点是对称的(即①若(x,y)∈R,则(y,x)∈R;② = ), 则达成的协议点也是对称的(即  )。 即双方均合乎理性,策略互为镜象对称协议点 公理三 策略上等价表示的不变性 由 u1(·)( u1’(·)= α1 u1(·)+ β1 u2(·)( u2’(·)= α2 u2(·)+ β2 构成新问题, 若() 是原问题的协议点, 则 ( ,)是新问题的协议点. 由此公理,在求解谈判问题时不必对双方的偏好强度作人际比较, 且可以对谈判问题进行座标变换使之规范化再求解。 公理四 无关方案独立性 有二个谈判问题, 若R2(R1 ; 两个问题的现况点相同,且 (,)∈ R2,且第一个谈判问题的协议点()∈ R2, 则 ()也是谈判问题二的协议点. 四、定理 若公理一到四成立,且R中存在x≥, y≥的点, 则()唯一,它使定义在R上的函数(x-)( y-) 取极大值. 更一般的,对n≥2的多人谈判问题, Nash-Harsanyi谈判模型为: max t. xi≥ci I=1,2,…,n (∈R 其中 Ci为判谈人i的现况值, xi 为判谈人i的后果, ( =(x1,x2, …,xn), R为(的可行域 五、评注: 对实际的谈判问题: ①Pareto边界于复杂,难以求得; ②效用难以设定(足够准确); ③公理四的合理性可疑 例: 1 y 1 y (.5, .5) R2’ (.5, .5) R1 R2 x x a 1 b 1 图12.3 图12.3之a所示为谈判问题一,现况点为(0,0), 由于可行域的对称性, 以(0.5, 0.5)作为协议点是谈判双方都可以接受的; 根据公理四, 在R1中去掉无关方案R2’, 得到新的谈判问题二,可行域为R2,见图12.3之b. 问题二的协议点仍为(0.5, 0.5). 在问题一中,谈判双方各得最大可能值的一半, 双方都能接受; 问题二中, 甲方只得最大可能值的一半,而乙方得到了最大可能值,即在谈判中乙方未作任何让步, 甲对此肯定难以接受. 事实上, 可行域反映了谈判人的实力地位, 没有什么’无关方案’. §12-6-3 其他谈判模型 一、等效用法(即K-S法) ①规范化问题: 1 A 图12.3之b所示的 谈判问题二可以规范化 D 如右图. G B 0.5 1.0 12-16 取直线x=y与谈判集AB的交点C , 使u1=u2 即 x=y x+y/2=1 的解 y=x=2/3 为谈判问题的解 ②非规范化问题, 现况点为(,), 谈判集为x=g(y)时, 协议点为 x -= (y-) x = g(y) 的解. 对图12.3之b所示的谈判问题 x=2y x+y=1 的解为(2/3, 1/3) 二、中间——中间法 谈判双方各得最大效用的一半,再得潜在增量之半,如此继续, 直到到达谈判集中的某一点. (潜在增量:在不损害对方利益的情况下,某个谈判人可以获得的利益) 例(同上图) 双方先达到G(0.5, 0.5)处,这时 x 的潜在增量为0.25, y的潜在增量为0.5; 各得一半到达D(0.625, 0.75). 因为D点在谈判集上, D点就是协议电. 一般的, 记 (x0,y0)为现况点,(X0,Y0)为谈判集中最大值, 可以按下列步骤求得协议点: 第一步 新的临时协议点为: xi+1=0.5(Xi+xi) yi+1=0.5(Yi+yi) 第二步 检验 (xi+1, yi+1) 是否在谈判集上,若是, 终止 否则 令 Xi+1 = g(yi+1) Yi+1 = f (xi+1) 转第一步 这种方法的不足之处:在x’处y取得极大值时,x<x’ 处的可行域形状与后果无关; 即: 在x<g(ymax)处可行域的变化不影响谈判结果. 三、均衡增量法 选足够大的N, 谈判双方各得潜在增量的1/N,得到新的临地协议点; 从新的临地协议点出发, 重复上述步骤, 逐步进行达到谈判集为止. (注意初始点的选定问题) 记现况点为(x0,y0), 选择足够大的正整数N, 令: xi+1=1/N[g(yi)-xi]+ xi yi+1=1/N[f(xi)-yi]+ yi I=0,1,2,… 反复迭代, 直至产生协议点. §12-6-4 谈判问题与效用 一、谈判问题建立在效用空间上的必要性 由于相同的实物对不同的人有不同效用, 在就有必要引入效用; 由于策略表示的等价性,可避免效用的人际比较的困难. 二、使用效用存在的问题: ① 如何获得足够精确的效用函数, ②鼓励说谎: 效用函数越凸的谈判者好处越大, 例:谈判双方要分配100元, 达不成协议时双方的收入均为0. 设甲乙双方均为风险厌恶的, 他们关于货币x的效用函数均为ln(1+x); 设甲得y元, 则乙得(100-y)元, 他们的效用函数分别为 u1=ln(1+y) u2=ln(1+100-y)=ln(101-y) 据此可得表12.1(表中u1’为规范化的效用值)及图12.5 表12.1 货币与效用对照表 y 1 2 5 10 20 30 40 50 60 70 80 90 95 100  ln(1+y) .69 1.1 1.74  2.4 3.04 3.43 3.71 3.93 4.11 4.26 4.39 4.51 4.56 4.62  u1’ .15 .238 .388 .52 .66 .74 .81 .85 .89 .92 .95 .98 .99 1.0    由于谈判问题的对称性, 无论采用哪一种方法求解, 协议点均在点B(.85, .85)处, 折合成货币, 双方各得50元. 但是,如果谈判人甲谎称自己是风险中立的, 即效用函数是货币x的线性函数: u1=x (这比甲的真实效用函数凸), 而谈判人乙真实地宣布自己的效用函数为 ln(1+x). 设甲分得z元, 则有: u1=z u2=ln(101-z) 据此可得表12.2和规范化的谈判问题如图12.6所示. z 0 10 20 30 40 50 60 70 80 90 95 100  u1’ 0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .95 1.0  u2 4.62 4.51 4.40 4.26 4.11 3.93 3.71 3.44 3.04 2.40 1.77 0  u2’ 1.0 .98 .95 .92 .89 .85 .81 .79 .66 .52 .39 0  由于这时的谈判可行域不对称,采用不同的谈判模型得到的协议点各不相同. 采用Nash模型求得的协议点为B (0.77, 0.69); 采用等效用法、中间-中间法和均衡增量法求得的协议点分别为C(0.72, 0.72)、D(0.75, 0.71)和E(0.76, 0.70). 由于规范化后的谈判模型种的谈判集比较对称, 这几种方法求解的结果差异并不大.但是, 无论用哪种方法, 谎报效用函数的谈判 人甲将得到72元或更多的实际收入, 而真实地宣布其效用函数的谈判人乙却只能获得不足30元. 可以证明效用函数越凸的谈判人获得的实际利益越大.因此, 建立在效用基础上的谈判模型有鼓励说谎的倾向, 而这正是采用效用函数的谈判模型的致命弱点. §12-6-4 仲裁与调解(Arbitration & Mediation) 仲裁及调解与谈判(协商)紧密相关。 在实际生活中,虽然谈判双方都知道达成协议对大家都有好处, 但是由于种种原因会使谈判处于僵持状态. 由于谈判双方认识到谈判集中的任何一点都比现况点好, 因此他们有可能请第三方进行仲裁来打破僵局解决争端. 若仲裁人认为Nash谈判模型是合理的, 他可以用Nash谈判模型求得的(x,y)作为仲裁依据, 这种仲裁叫Nash仲裁. 一般的,仲裁有如下三类. 一、强制性仲裁(Binding Arbitration) 由仲裁人根据自己的判断, 选择一个自认为对双方公平的解决办法,即协议点. 仲裁人提出的解决办法对双方都有约束力. 由于这种解决办法不是由当事人中的一方或双方共同提出的, 这种仲裁方法对缓和双方矛盾改善双方关系十分不利. 二、最终报价仲裁(Final-offer Arbitration) 1966, Steuens, C.M.提出. 它规定首先由谈判双方提出各自对谈判问题解决办法的结论性意见,这种意见称作最终报价(Final-offer), 由仲裁人在这两个最终报价中选择一个作为解决办法. 这种使当事双方在提供最终报价时十分谨慎: 如果要价太高, 与仲裁人心目中的公平的解决办法(仲裁值)相差太大,仲裁人将选择对方的最终报价作为解决办法, 导致自己更大的损失. 因此, 这种方法可以促使当事人双方的报价尽可能’合理’,即尽量接近仲裁人的意见. 在当事双方均为风险厌恶时,该方法甚至可以引导双方在进行仲裁之前自己达成协议, 例如美国职业棒球联盟工资争端的解决. 美国有许多州采用此法作为解决劳资争端的仲裁方法. 三、复合仲裁法(Combination arbitration) FOA在促使谈判双方达成一致意见方面比BA有效, 但是FOA仍有一定程度的鼓励双方采用与对方保持一定距离的策略性报价的倾向. 为此, Brams F.J. 提出了把BA和FOA结合起来的复合仲裁法(CA). CA的具体做法是: ①仲裁人预想的公平解决落在争执区之外时用BA; ②两个最终报价汇集到一点时, 选择该点作为协议点; ③仲裁人预想的公平解决落在争执区之内时,用FOA. 四、调解 调解与仲裁类似但有区别. 调解与仲裁最根本的区别在于仲裁有强制性, 调解人的意见没有强制性, 调解人的意见只是一种建议. 然而调解与仲裁的区别有时并不明显, 强有力的调解人不但可以建议某种解决方案, 还可以利用其威信促使双方接受. 在调解过程中, 调解人应该考虑什么是公平的解决办法, 并据以确定调解时的所作所为. 有时, 调解人并不是由当事人邀请来参加争端的调解, 而是主动提出为双方进行调解的. 有时双方的争吵会愈演愈烈而形成僵局, 即使双方都明白谈判达成协议有比僵持好, 也会由于主动提出谈判会被对方认为是软弱的表现而拒绝谈判. 有眼力的善意的局外人可以发现问题的症结, 邀请当事人参加谈判. 调解人的作用可弱可强, 可以弱到仅仅作为会议召集人或中立的谈判主持人, 也可以强到与仲裁人相当. §12-7 n人合作对策 一、术语: ·参与对策的称局中人 i=1,…,n 全体局中人N ·后果又称收入x=(x,…,x) ·N的子集S(S(N)又称联盟(Coalition) N为总体联盟 用以描述每一种可能的联盟的收入的叫特征函数, 记作V. 通常 ① V(0)=0 ②若R,S ( N R∩S=0 则V(R∪S)≥V(R)+V(S) ……超可加性 ·分配:满足①个体合理性 xi≥V(i) ②群体合理性  的解 ·核:非被控的分配的集合. 二、Nash-Harsanyi谈判模型 max   为现况点  s.t.   在谈判中首先作出让步的是最不愿意冒发生冲突风险的局中人. 三、Shapley值  它是满足下述三条公理的唯一解: ① 团体有效性  ②对称性 ③加性  (V+W)=  (V)+  (W) 四、例一(存在核) 联盟方式 收入 1.甲、乙、丙均独立 甲 32 乙 23 丙 6 2. 两家合作,第三家独立 甲乙合作 59 即 x + y≥59 (4) 丙独立 5 z≥5 甲丙合作 45 x + z≥45 (5) 乙独立 22 y≥22 乙丙合作 39 y + z≥39 (6) 甲独立 30 x≥30 三家合作 77 x + y + z = 77 (7) 用多人合作对策求解,可以得下图, 其中阴影区为分配的集合,即核.  ①用Nash-Harsanyi谈判模型求解 a. 以32, 23, 6为现况点, 求得: x=37 , y=28 , z=11 ; b. 以30, 22, 5为现况点, 求得: x=36 , y=28 , z=11 ; ②Racffa的裁决: 起始的两方联盟 收益的分配 A B C A B 32 23 5 (*) 2 2 (**) 3.25 3.25 6.5 (***) A C 32 20 6 3.5 3.5 3 6 3 B C 30 22 6 5.5 5.5 4 2 2 总计 109.75 83.75 37.5 平均 36.58 27.92 12.5 (*)在AB首先结盟时,C单干的收益为5; A与B共计59; 由于A B C均单干时A B分别得32与23, 故A B C的分配基数分别为32, 23, 5. (**) A与B结盟后的收益为59, A与B的分配基数之和为55, 两者之差4由A由B均分, 各得2. (***)由于C的加盟,A B C的总收益可达77, 比AB结盟C单干的收益(59+5=64)增加13, 这增加的部分由C得一半6.5,A由B分另一半. ③Shapley值: Shapley值的计算是根据结盟的次序计算各成员的收益,例如A B C, A单干时得32, B与A结盟收益为59, 增加的27是B加盟的结果, 故B得27; C加入A B联盟后,总收益为77, 增加的18全归C. 再根据结盟次序的全排列,计算各种结盟情况的收益之和的平均值. 结盟的次序 收益 A B C ABC 32 27 18 ACB 32 32 13 BAC 36 23 18 BCA 38 23 16 CAB 39 32 6 CBA 38 33 6 -------------------- 总计 215 170 77 平均 35.83 28.33 12.83 五、例二(不存在核的情况) A单独 0 即 x≥0 B单独 0 y≥0 C单独 0 z≥0 A,B合作 118 x + y = 118 (4) A,C合作 84 x + z = 84 (5) B,C合作 50 y + z = 50 (6) A,B,C联盟 121 x + y+ z = 121 (7) 由于不存在核Nash-Harsanyi模型不适用 ① Shapley值 选手结成联盟的顺序 每一局中人带来的增量 A B C A B C 0 118 3 A C B 0 37 84 B A C 118 0 3 B C A 71 0 50 C A B 84 37 0 C B A 71 50 0 ------------------------- 总计 344 242 140 平均数 57.33 40.33 23.33 即 x=57.33 y=40.33 z=23.33 ②Raiffa的裁决 在本例中, (4)+(5)+(6) 得: x + y + z = 126 (8) 由(8)-(6) 得 x = 76 , 由(8)-(5) 得 y = 42 , 由(8)-(4)得 z = 3 起始的两方联盟 “合理的”收益 A B C 合计 A B 76 42 - 118 合作收益分配 0.75 0.75 1.5 3 小计 76.75 42.75 1.5 121 A C 76 - 8 84 合作收益 9.25 18.5 9.25 37 小计 85.25 18.5 17.25 121 B C - 42 8 50 合作收益 35.5 17.75 17.75 71 小计 35.5 59.75 25.75 121 平均数 65.85 40.33 14.83 即 x=65.85, y=40.33 z=14.83 §12-7 投资分摊与协调规划法 综合利用工程涉及多个部门, 工程的总投资如何在各受益部门之间进行分摊可以作为成本对策问题求解. 成本对策问题的特征函数必须满足: 次可加性: C(S)+C(T)≥C(S∪T) ( S,T ( N , S∩T = 0 个体合理性: X(i)≤C(i) 团体合理性:  X(i)≤C(S) 记M为原则集,M={1,2,…,m} 则:协调规划法为: min  t. X(i)≤C(i)  X(i)≤C(S)  X(i)≤C(N) 其中, : 根据原则j, 部门i分摊的投资的参数指标 : 根据原则j, 部门i分摊的投资的理想值  :原则j的权重