1
东北财经大学 数量经济系刘德海 ldhai2001@163.com
博弈论前沿专题
( Advances in Game Theory)
2
[资料夹 ]宇宙的演化
——上帝的第一推动力?星云演化?
1754年,康德发表了论文,论地球自转是否变化和地球是否要衰老,,对? 宇宙不变论? 大胆提出怀疑。 1755年,康德发表,自然通史和天体论,一书,首先提出关于太阳系起源的通过万有引力作用逐渐形成的康德 ——拉普拉斯星云说,? 太阳系是由一团星云演变来的。这团星云由大小不等的固体微粒组成,天体在吸引力最强的地方开始形成,引力最强的中心部分吸引的微粒最多,首先形成太阳 ……”
,有两种东西,我对它们的思考越是深沉和持久,它们在我心灵中唤起的惊奇和敬畏就会日新月异,不断增长,这就是我头上的星空和心中的道德定律。,
——这是人类思想史上最气势磅礴的名言之一,它刻在康德的墓碑上,出自康德的,实践理性批判,最后一章。
+
康德( Immanuel Kant,1724-1804),德国哲学家、天文学家、星云说的创立者之一、
德国古典唯心主义创始人
3
恒星的演化新恒星的诞生
一颗恒星从诞生到死亡,要经过几百万年甚至上百亿年的时间。
恒星是太空星云在引力作用下坍缩而成,坍缩使内部变热,温度升高直到发生核聚变反应,释放热能并产生向外的压力以支持恒星对抗进一步坍缩。一颗恒星一旦开始燃烧核燃料 (将氢转变为氦 )称为 主序星,
往后的生命历程 (它的 ‘ 演化 ’ )就由质量惟一地决定。转化由爱因斯坦质量能量方程描述,△ E=△ m·c2。
恒星烧完中心区的氢后,核心主要由氦构成,恒星开始收缩。如果质量足够大,内部温度升高到开氏 1亿度,致使氦原子核开始聚变为碳。
恒星再次稳定下来,但现在它有了一个氦燃烧核心,周围是一个氢燃烧壳层,再外面是一个巨大的外包层;它已经成了一颗 红巨星 。
主序星(太阳) 红巨星
4
根据恒星演化理论,如果有 12%的质量损失,恒星将离开主星序。天文学上将恒星在主星序停留的时间作为他的寿命。
我们的太阳是宇宙中第二代恒星。也就是说我们是某个超新星的灰烬。
太阳是 50亿年前由星际云瓦解后的一团小云塌缩而成的,它的寿命约为 100亿年。
太阳至少还能活 50亿年!当太阳变成红巨星时,大气将膨胀,直到直径大于水星轨道为止 (有些关于太阳 ‘ 未来史 ’ 错误地得出,红巨星阶段的太阳将吞没地球;其忽略了到太阳变成红巨星之前,它将通过向太空喷射物质损失掉大约 1/4的质量 )。
大小比较:红巨星和太阳
5
新恒星诞生 白矮星大小:红巨星 /太阳 /白矮星
恒星作为相对稳定的红巨星的寿命比它在主序耽搁的时间短得多 ——大约是作为单纯氢燃烧恒星寿命的 5% -20%。
( 1)低质量恒星的演化终点没有直接观察到。宇宙的年龄被认为是一百多亿年,不足以使得这些恒星耗尽核心的氢。当前的理论都是基于计算机模型。
( 2)在包括太阳在内的小质量恒星(质量小于 1.44个太阳质量)
中,活跃的生命期行将结束时,将脱掉它的外层以形成 行星状星云,剩下一个致密的碳物质核(钻石!),其中一切聚变反应均已熄灭,这就是 白矮星 。白矮星将在数百万年内缓慢地将它的热量辐射到太空中去,最后变成 黑矮星 ;
主序星 红巨星
6
(3)大质量恒星的氢燃烧在几干万年甚至更短时间内就结束,进入氦燃烧后,演化为 超巨星 。星核因收缩而温度极高,极短时间内依次点燃:碳燃烧 → 氖燃烧 → 氧燃烧 → 硅燃烧 → 最后点燃铁燃烧。
铁燃烧对于恒星来说是灾难性的,因为这种核反应不但不放出热量,反而要吸收热量,使得星核突然冷却下来。于是支撑星核的压力几乎消失,星核坍缩。在其中心产生强大的压力,质子与电子结合成中子,中子不带电荷,可以挤压到非常近的距离。于是演化成了一颗超密、超强磁场、体积很小、自转极快的 中子星 。
新恒星的诞生 蟹状星云中心有颗中子星主序星 超巨星大小比较:
白矮星和中子星
7
在中子星形成后,星核的中心就成为不可压缩的,可是外部的物质继续在快速下落,于是发生反弹。在反弹的过程中,蓄积着的由引力势能转化而来的大量能量释放出来,通过壮观的 超新星 爆发结束其一生
中子星的质量有一个上限,如果坍缩后的星体质量超过这个上限,
那么连中子也会被压碎,星体就会继续坍缩下去,成为一个 黑洞 。
新恒星的诞生 主序星 超巨星 蟹状星云中心有颗中子星超新星爆发大熊座星系中央黑洞
8
[资料夹 ]生命的演化
——达尔文进化论伟大的生物学家、进化论的创立者查理 ·达尔文,生于 1809年,
英国人。达尔文在剑桥大学获得学位后年仅 22岁便乘?贝格尔?
号随船考察。 1859年,达尔文出版,物种起源,。
9
[资料夹 ]社会的演化
——马克思主义玛雅文化,失落的高度文明
“太阳神鸟”金饰,2001年出土于成都金沙遗址的古蜀文明,成为中国文化遗产标志
“马踏飞燕”铜奔马,1969年出土于甘肃武威雷台一座东汉墓,成为中国旅游标志。
10
思考:
经济学为什么不是一门演化的学问?
——1898年凡伯伦提出这个问题。后来发展出演化经济学。
博弈论为什么不是一门演化的学问?
——90年代以来国际上兴起演化博弈理论( evolutionary game):社会制度不是少数人理性设计结果,而是不断适应环境和外部变化的适应性进化过程。
第二篇 演化博弈理论的基本知识第三章 演化博弈理论的基本知识
11
第七章 演化博弈理论及其应用本节课程内容概述:
第一节 传统博弈理性假设的局限
第二节 演化博弈理论的兴起
第三节 演化博弈理论的有限理性假设和基本分析过程
第四节 演化博弈理论的不同动态模仿模型
第五节 演化博弈理论的均衡分析方法
第六节 演化博弈理论的最新进展和局限性
第七节 演化博弈理论在经济管理问题中的应用
12
博弈理论的研究对象,参与者互动过程中冲突与合作问题;
分析思路,
第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性大量情绪、直觉、性格、感觉等 非理性 的主观心理行为知识的未知状态、
不可预测性和多样性等造成不同层次的 有限理性实际行为方式的无序化为了对人们的互动行为加以模型化分析,
必须进行合理的理论抽象产生了博弈论的
,完全理性,概念
13
传统博弈理论的分析过程,参与者?完全理性?假设下,通过推理演绎达到均衡化过程。
人们行为在完全理性假设下,其行为类比于按照既定程序运行的计算机
(即在完全理性假设下,人们的行为严格执行几种可行的策略选择方案),没有非理性的冲动、情绪因素,不会犯错误(有限理性)。
第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性中国象棋大师许银川
PK
浪潮天梭服务器
2006年 08月 15日,浪潮杯,中国象棋人机大战再次展开,两场对决中,均战成平局。
14
作为一种数学分析方法,传统博弈对参与者的? 理性? 要求非常苛刻:
目标理性 (主观理性 ):参与者追求自身利益的最大化 (经济学理性的内涵 )
过程理性(具有理性的能力),给定参与者对外部环境的信念后最大化自己的报酬,即? 前后一致的? 做出选择,可以分为两个推理步骤:
认知理性( cognitive) ——参与者对相关环境可获得的信息与形成的信念之间的一致性,即参与者具有对相关环境形成信念的能力;
具体要求:参与者了解博弈的结构和规则、以及理性的,共同知识,
(递推归纳法的基础)、作为不完全信息博弈均衡求解基础的贝叶斯理性(参与者对不确定性事物具有事前概率分布的判断,在动态过程中进行更新的贝叶斯决策)。
工具理性( instrumental) ——参与者对外部给定的机遇与固定的偏好之间的一致性,即参与者具有从既定的信念推导出采取相应策略的能力。
具体要求:参与者具有计算推理、预见、记忆、分析判断的能力(例:
求解动态博弈均衡的递推归纳法),不会犯错误(例:颤抖手均衡要求犯错误时仍具有稳健性)等。
第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性信念 采取相应策略 最大化目标相关环境 认知理性 工具理性 目标理性
15
第七章 演化博弈理论及其应用第一节传统博弈理性假设的局限性来自实验博弈的证据:
蜈蚣博弈 ( Rosenthal,1981),
理论分析结果:根据理性的共同知识假设,每个参与者能够正确理解参与者之间的相互作用,因此做出正确的预期。均衡结果( 1,1)。
实验结果:在一定阶段内存在合作。对偏离均衡路径的解释:合作意图。
最后通谍博弈 ( Roth et al,1991),
100¥在两个人中分摊,其中一人首先提出方案,对方不接受则双方为 0。
理论分析结果:首先提出的人选择 99¥。
实验结果:美国、南斯拉夫选 50:50,日本、以色列选 60:40。考虑了公平等社会文化规范。
总结:与理性原则下演绎推理不同的上述实验结果,反映出传统博弈的强理性假设过于严格。
A B A B … B A B (100,100)
(1,1) (0,3) (2,2) (1,4) (97,100) (99,99) (98,101)
16
理性主义分析思路存在的问题:
强理性假设受到 Binmore,Simon等许多学者的批评
,全知全能的荒谬理性无异于奥林匹亚山上无知不晓的神,——西蒙
思考 1:自然演化形成的生物种群处于稳定状态,其互动的机理?
第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性各个植物种群分别占据不同的空间,
使群落具有稳定的结构。
各动物种群位于食物链的不同位置,
形成稳定的金字塔型生态结构。
17
第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性
思考 2:现实中大量的人们行为,表现出来与完全理性假设不符的非理性和有限理性特征,人类社会因此永远处于不可预知的无序冲突中?
沈阳 918事变博物馆学习能力 ——20世纪上半叶人类经历两次大战后,吸取教训,建立磋商、合作、谈判机制,维护了世界整体和平与稳定。
,火与冰 ——核冬天,
作者:迈克尔 ·罗文 —罗宾森理性预期能力 ——核武器的出现,使得人类第一次具有毁灭自己的能力,反而维持了恐怖的核平衡。
18
第七章 演化博弈理论及其应用第一节 传统博弈理性假设的局限性
Nash在其博士论文? Non-cooperative games”( 1950年)给出 Nash均衡的两种解释,
一种是完全理性的解释 ——均衡是通过理性的参与者进行严密的逻辑演绎推理得到的,对参与者的理性能力有较高要求(传统博弈分析)。
一种是基于群体行为的解释 ——参与者?有限理性?假设下,通过归纳学习的时间消耗实现均衡化过程。
当时没有很好的方法对演化主义均衡实现过程构建数学模型,国际上 90年代兴起演化博弈理论。
19
几个基本概念辨析,
演化? 与? 革命?,演化是指渐进的发展变化过程;革命是指破坏性的激进的变化。
演化? 与? 进化?,系统的演化包括退化、进化和停滞等多种不同的发展前景,而进化仅仅特指单线式直线发展。
第七章 演化博弈理论及其应用第二节 演化博弈理论的兴起停泊在涅瓦河上的,阿芙乐尔,号巡洋舰 白金汉宫是英国的王宫
20
思想渊源,
达尔文创立的生物进化论,提出在生存环境压力下生物种群特征产生适应性进化的?自然选择?基本思想,成为理论滥觞。
经济学的演化理论可追溯到古典学派。 1898年,凡伯伦就向经济学家们提出了,?经济学为什么不是一门进化的科学?
20世纪初马歇尔宣称,经济学家的麦加在经济生物学。
“经济学的分析目标应当在于经济生物学,而不是经济力学。但是,生物学概念比力学的概念更复杂” ——,经济学原理,序言
经济演化思想见于马克思、熊彼特、哈耶克等大师门的论著。
凡勃伦以后,数理经济学的巨大进展上使经济演化理论难以对经济学产生影响。 演化经济学作为一门独立学科出现,则是 20
世纪 80年代。 1982年,美国经济学家纳尔逊和温特出版了,经济变迁的演化理论,一书,分析了企业惯例发生演化的过程。
第七章 演化博弈理论及其应用第二节 演化博弈理论的兴起
21
[资料夹 ]现代微观经济学体系奠基人阿尔弗雷德 ·马歇尔 (Alfred Marshall)
英国著名经济学家马歇尔( 1842-1924),现代微观经济学体系(即剑桥学派、新古典学派)的奠基人。
标志现代经济学形成的里程碑著作,经济学原理,出版于 1890年。
书中继承了 19 世纪以来英国古典经济学的传统,兼收并蓄,融合了供求论、生产费用论、边际效用论、边际生产力论,建立以完全竞争为前提、以?均衡价格论?为核心的相当完整的经济学体系。当前大多数学院派经济学理论都建立马歇尔提出的概念上,这套理论的核心观点是,我们应该相信市场能解决经济运行中的问题。
一方面:马歇尔的工作是开创性的,以前经济学家还不懂得形式化斯密理论的办法。由于他的工作,一个新的经济学时代到来了,数学被广泛运用于经济学研究中,经济学的知识积累变得十分迅速。
另一方面:马歇尔意识到,经济学流行的静态分析将被生物学概念的动态分析所取代。但是他所支配的数学工具使得经济学理论分析走上了静态均衡分析的数理化道路。
22
[资料夹 ]20世纪伟大的经济学家约瑟夫 ·熊彼特
熊彼特 ( Joseph Alois Schumpeter,1883- 1950)生于维也纳,年轻时进入维也纳大学,专业经济学与法律。当时的维也纳群星荟萃,
门格尔的经济学,弗洛伊德的心理学,克林姆的建筑学,斯特劳斯的人类学,无不是人类精神的高峰。
熊彼特认为,资本主义是? 一个进化过程?,? 非连续历史跳跃?
过程。创新是? 企业家对生产要素的新的组合?,是一个? 创造性毁灭? 的过程。实质性的市场竞争不是价格竞争,而是创新竞争。
熊彼特的理论是经济学重要遗产,他首先提出现代创新理论,不但是知识经济的先驱者,其思想更是 21世纪的主流思潮,到今天仍默默地支配着人心。他是 20世纪最受推崇的经济学家之一,在经济学史上卓越地位与亚当?斯密、马歇尔、凯恩斯等宗师同列。
代表作:
,经济发展理论,,资本主义、社会主义和民主,,经济分析史,管理大师德鲁克说:,熊彼特智慧深邃、历久弥新。,
23
Richard R,Nelson Sidney G,Winter
[资料夹 ]演化经济学创始者纳尔逊和温特
纳尔逊和温特的,经济变迁的演化理论,是现代演化经济学的奠基之作,提出动态演化的企业和作为自然选择的市场机制是影响经济变迁的两个关键机制。
在书中对新古典经济学两大理论支柱 —— 最大化计算理性和经济均衡分析方法进行替代性的否证。他们重新整拾起凡勃伦、哈耶克所采用的演化主义分析传统,
采纳了西蒙关于有限理性的立场,将达尔文生物遗传变异的演化机理移植到经济过程。认为经济决策和行为选择是通过不断,试错,寻求,满意,的适应性过程,而不是依靠精确算计对最大效用值的决断。企业一般是按照,惯例,从事生产,惯例是由既有的制度、技术、知识综合构成的企业内在的稳定结构,当企业对惯例下的利润水平不满意时,则会通过,外部搜寻,或,内部搜寻,来改变惯例。
运用生物学理论解释经济现象,纳尔逊指出了两点问题:一是在理解经济变迁和技术变迁的时候,找不到和生物基因机制对应的经济机制;二是来自制度方面的挑战。生物的进化有个相对隔离的环境,而演化经济学研究技术创新时,不能够忽略制度对技术变迁以及创新的影响。
24
演化博弈理论的诞生,
起源于 80年代演化生物学研究:梅纳德 ·史密斯( Maynard Simth)
等研究生物种群演化现象,在 1982年,演化与博弈论,一书提出。
其他演化博弈理论学者 Price,Weibull,Levine,Friedman、
Binmore等。
早期一些演化生物学文献:
——Maynard Smith & Price( 1973,1981)提出 ESS均衡概念 ;
—— Taylor & Jonker(1978)和 Weibull (1995)提出模仿者动态模型;
国际期刊,Journal of Evolutionary Economics;
Journal of Economic Theory;
Games and Economic Behavior;
Journal of Mathematical Biology
第七章 演化博弈理论及其应用第二节 演化博弈理论的兴起
25
John Maynard Smith(1920—2004) 。
演化生物学家,英国 Sussex大学生物学教授;
1982年与 Price一起提出了?演化稳定策略 ESS”均衡概念,成为演化博弈理论的一个基本概念。他发起设立了许多奖项,包括欧洲演化生物学会
(European Society for Evolutionary Biology)建立的 John Maynard Smith
Prize,面向演化生物学界杰出的年轻学者。
代表作:
( 1) John Maynard Smith (1982) Evolution and the Theory of Games
(Cambridge Univ,Press,Cambridge),
( 2) The Theory of Evolution (Cambridge University Press 1993)
[资料夹 ] 梅纳德 ·史密斯与演化博弈理论,
http://www.edge.org/3rd_culture/maynard_smith04/may
nard_smith04_index.html
26
Maynard Smith(1982)等研究生物种群竞争现象,构造了基本分析框架。
每个参与者代表一个种群,随机组合匹配,进行预先规定好收益的要素博弈;
少部分参与者的策略产生 突变 (试错法);大部分参与者根据不同的学习规则进行模仿,其中最有效率的参与者经 选择 过程得以大量复制;
(物演天择,适者生存)
演化主义基于群体行为的均衡 判断标准:
当不同策略的分布构成发生一个很小的变化后,仍能维持原稳定构成。含义:击退那些突变的入侵策略。
演化博弈理论成为 90年代以来博弈论最为活跃的一个领域之一,并应用在经济社会体制的起源和多样性、互补性演化研究中。
[资料夹 ]演化博弈理论的生物学起源:
27
Following the tradition of Joseph A,Schumpeter,it
is designed to focus on original research with an
evolutionary conception of the economy,The
journal will publish articles with a strong emphasis
on dynamics,changing structures (including
technologies,institutions,beliefs and behaviours)
and disequilibrium processes with an evolutionary
perspective (innovation,selection,imitation,etc.),It
favours interdisciplinary analysis and is devoted to
theoretical,methodological and applied work.
Editors,H,Hanusch,S,Klepper
Email,helpdesk@link.springer.de
Publisher,Springer Berlin/Heidelberg
[资料夹 ] 国际期刊,Journal of Evolutionary Economics
28
“有限 理性 ( bounded rationality)?的概念,
Herbet Simon提出?有限理性?概念:参与者具有目标的理性,但是由于面对复杂的、多元化的、不确定性的社会现实,其认知能力的有限性造成参与者在决策时只能达到满意解,即缺少理性的能力。
奈特的不确定性观点:有限理性是由于 Knight提出的内在的不确定性造成的,即非线性系统固有的不可预知性。
★ 对于具体的社会经济问题,应抽象出有限理性的具体行为特征。
第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程非理性 有限理性 完全理性一个类比:理性的光谱分析
29
第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程演化博弈理论群体参与者的? 有限理性? 内涵,
惯例行为 ( inertia):由于参与者变更策略存在着成本,因此大多数人按惯例采取行动,被锁定在已有策略中。(调整需要时间)
决策上的?近似眼? (myopia):当少部分参与者变更策略时,总是以现有策略状态作为已知条件进行分析,而不具有预测能力(由于群体人数较多,因此无法预测,也无法影响其他个体的决策)。
试错法的尝试行为 (trial and experiments):少部分具有冒险精神的参与者并不拘泥于最优策略,而是尝试采取 其它各种策略(产生包括生物学上遗传变异机制、社会新生代出现等)。
资料:试错法行为 ——“懒蚂蚁,的实验
30
日本北海道大学农学研究生院的进化生物研究小组对三个分别由 30只蚂蚁组成的日本黑蚁群的活动进行了观察。
发现大约 80%的蚂蚁从事某种工作,例如清理蚁穴垃圾或收集食物,很少停下来休息; 20%的工蚁则整日无所事事。
生物学家在这些?懒蚂蚁?身上做了标记,并且断绝了蚂蚁的食物来源,
那些平时工作很勤快的蚂蚁一筹莫展,而?懒蚂蚁?则?挺身而出?,
带领众伙伴向它早已侦察到的新的食物源转移。
生物学家又把?懒蚂蚁?全部抓走放在一起,神奇的是:结果其中 80%
的?懒蚂蚁?变成了勤劳蚂蚁,仍然有 20%的蚂蚁?懒惰?依旧。它们原来所在蚁群中的所有蚂蚁都停止了工作,乱作一团,直到把那些?懒蚂蚁?放回去后,整个蚁群才恢复繁忙有序的工作。
点评:“懒蚂蚁”总能看到组织的薄弱之处,拥有让蚂蚁群在困难时刻仍然存活的本领,可以避免把全部蚁力投入到搬运食物的劳作中,总是可以保持对新的食物的探索状态,可以保证群体不断得到新的食物。
[资料夹 ]试错法行为 ——来自蚂蚁种群的实验
31
演化博弈理论的分析对象,
社会经济系统中有限理性的群体参与者通过各种具体的动态学习模仿过程,如何达到稳定的均衡状态。
演化博弈理论主要解决的问题,
( 1)构建体现不同理性要求的动态学习模型;
( 2)运用 稳定性理论,分析学习调整过程中均衡的稳定性,判断动态模型是否收敛到的 Nash均衡(或者演化稳定均衡 ESS、演化均衡
EE等均衡概念)。
第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程
32
演化博弈的基本分析过程,
随机组合博弈,生物系统或社会经济系统中存在着许多参与者(可以分为同类群体和不同类群体),通过随机抽样选出的参与者(代表某一特定的群体)进行预先规定好的要素博弈,获得相应收益;
——要素博弈( factor game)反映任一时点上各群体可行的策略集和相应的收益,可用策略式或扩展式博弈表示。
有限理性的行为,根据惯性行为的假设,参与者群体通过选取要素博弈的不同策略,形成了选取不同策略的比例分布。
动态演化方程,在动态模仿过程中,上述比例分布是不断变化的。
根据不同的理性水平,分为不同的动态演化过程。
均衡的稳定性,根据比例分布的动态演化方程,分析演化过程的稳定性。
第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程
33
演化博弈理论的基本要素,
群体( populations):生物系统或社会经济系统中存在着许多参与者,
可以分为同类群体和不同类群体,k?1 。每个群体都有自己的行动集合。
支付函数 (payoff function):某种行动对应的收益。对于策略式博弈表示的要素博弈,又称为适应度函数 (fitness function),与参与者选择的策略及其当前不同策略的比例分布有关。
动态( dynamics):反映群体参与者的学习、模仿过程,常见模仿者动态模型;
均衡 (equilibrium):反映演化的收敛稳定状态,包括静态的 ESS、动态的 EE等概念。
举例:鹰-鸽博弈 。
第七章 演化博弈理论及其应用第三节 演化博弈理论的有限理性假设和基本分析过程
34
梅纳德 ·史密斯( Maynard Smith)以鹰鸽博弈( hawk-dove game)
开始,成为生物学讨论演化稳定性的标准模式。
该博弈并不是表述老鹰和鸽子两种物种的个体之间对抗,而是同一物种中不同行为类型的个体间的竞争关系:人类作为一个种群,
具有鹰派好斗( hawkish)和 鸽派柔弱( dovish)的两面性,
如图所示,争夺一种资源,其价值是 v。如果鹰进攻而鸽默许,前者得到资源后者一无所获( v,0)。如果双方都进攻或都被动,
则各方获得资源的机会均等。同时进攻,导致双方受伤,各自的成本为 c,c > v,概率是 1/2。上述即为单一种群的策略式要素博弈。
种群的支付取决于选择鹰鸽策略分别在群体中所占的比例。
[资料夹 ]鹰-鸽博弈
1/2(v-c),1/2(v-c) v,0
0,v v/2,v/2
鹰 鸽鹰鸽伊拉克战争期间拉姆斯菲尔德为首的鹰派和鲍威尔为首的鸽派之间的分歧
35
演化博弈模型的动态演化机理,
演化博弈两个基本过程是选择过程( selection)和突变过程
(mutation),其在生物学和社会学中分别有着不同的演化机理:
( 1)生物学的基因遗传变异机制;
( 2)社会新生代的出现;
( 3)市场竞争的进入和退出机制;
( 4)个体经验积累的学习机制;
。。。。。
第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型
36
( 1)生物种群的演化机理 ——基因遗传变异机制,
个体层次上看:基因遗传决定了个体的行为类型。基于自然选择机制的演化博弈理论具有个体行为停滞的特点,无法进行个体理性的选择。
,种瓜得瓜,种豆得豆,。 ——与达尔文进化论一致的
群体层次上看:在种群繁衍过程中,某种行为类型的适应度不仅依赖于自然环境的选择,而且依赖于社会环境(即群体中不同行为类型所占的比例)。当个体的某种行为类型的适应度高于群体加权平均水平时,其繁殖生存率更高。在群体层次上产生了种群演化的复制动力学。
缺陷:生物种群的基因遗传变异机制中,个体不具备理性选择能力,
演化体现为代际繁殖率,进程缓慢。
第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型
37
[资料夹 ]地球生物的演化 ——达尔文进化论伟大的生物学家、进化论的创立者查理 ·达尔文,生于 1809年,
英国人。达尔文在剑桥大学获得学位后年仅 22岁便乘?贝格尔?
号随船考察。 1859年,达尔文出版,物种起源,。
38
( 2)社会经济系统的演化机理,
问题提出:基于基因遗传的演化机制过于缓慢,人类社会通过有限理性的学习过程,能够实现行为的更快收敛。
( 1)个体层次上的经验学习机制,如虚拟行动模型,个体贝叶斯决策 ;
( 2)企业层次的市场进入和退出机制;
( 3)社会群体层次上的模仿行为;
( 4)社会新生代的出现(代际演化,其与生物学机理相同)。
第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型
39
[资料夹 ]人类社会进步的时钟比喻美国传播学者弗德瑞克 ·威廉斯把人类从开始使用语言到公元 2000年大约 360个世纪形象地浓缩为 1天的 24小时,大致框定各种传媒在这个? 时钟? 上的位臵:
子夜 12点,人类开始使用 34000年前发明的语言,揭开口头传播的序幕;
上午 8点,洞窟壁画出现,人类使用线条化符号传递信息由此开始;
时钟? 飞快走过 12个小时,到了晚上的 8点 40分,埃及像形文字问世了;
9点 28分,成熟的字母出现;
当? 时钟? 接近又一个子夜前的 11点 38分,谷登堡的印刷机制造成功;
在最后几分钟科学技术突飞猛进,11点 53分以蒸汽为动力的印刷术告成;
此后,发展以秒为计:
人类进入 20世纪最后几十年。在这? 一天? 的最后 2分钟内,记录着这样一些重大的发明创造:
11点 53分 24秒发明电报;
11点 54分 38秒架设第一条横跨大西洋的有线电缆,
11点 55分 02秒有了电话:
11点 55分 47秒,无线电报、电影摄影机出现;
11点 56分 48秒,商业广播问世;
11点 57分 04秒,有声电影来到人间;
11点 57分 40秒,最早的电子计算机诞生。
倒数 108秒,彩色电影生产开始;
倒数 101秒,立体声广播开播;
倒数 92秒,第一颗商用卫星升天;
倒数 87秒,分时电脑问世;
倒数 49秒,时近 1981年,“哥伦比亚,号太空船巡航成功
。。。。。
40
演化博弈的动态模型,
演化博弈基本的选择动态( selection dynamics)表述为:
其中 θ i(t)表示在 t时刻选择策略 i的个体在群体中所占比例;
函数 gi(θ) 表示某种具体选择过程,不同学习机制对应不同函数,
选择动态的基本特征:当初始状态下没有人采取某一纯策略 i时,则永远不会被采用;参与者只能模仿那些已经存在的策略。即没有反映出突变机制 。
)()()( iii gtt
( ) 0 ( ) 0iitt
第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型
41
演化博弈最常见的动态模型:模仿者动态( replicator dynamics)
是最常见的一种动态过程 Taylor & Jonker (1978),Weibull (1995),
每一个参与者只代表某一特定的同类群体,其长期坚持采用某种纯策略 si,采用某种策略的群体比例 θi的增长率 d θi /dt是此策略效用
u(si)与群体平均效用差的严格增函数:
注意:模仿者动态模型具有很好的生物学解释基础;一些学者对其社会经济的解释基础展开研究 ( Binmore&Samuelson,1995;
Blume&Easley,1992; B?rgers&Sarin,1993),如进入退出机制、随机突变和行为模仿等。
来自蚁群的一个实例
titii usutt )()(
第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型
42
[资料夹 ]模仿者动态 ——一个来自蚁群的实例
科学证明在现代人类还未出现的数百万年前,蚂蚁就在进行着许多社会革新:分工合作、耕种甚至是奴隶制。这种能力的获得与它们数千万年的发展历史不无关系。
生物学家研究发现,蚂蚁通过杂交繁殖实现一个相互依赖的组织系统。而蚂蚁这种相互依赖的组织系统在执行具体任务中过程又是怎样实施的呢?
科学家通过研究后对此作出解释说,蚂蚁在所到之处都会留下一种被称为外激素的化学物质,其他蚂蚁可以利用这些化学物质判断自己的路线是否正确,因为这种物质的浓度越大就表明走过的蚂蚁越多,也就说明是一条比较合理的路线。
titii usutt )()(
43
其它各种选择动态,
收益正性动态( payoff-positive dynamics):所有超出平均收益的纯策略都具有正的增长率,而所有低于平均收益的纯策略都具有负的增长率。如模仿者动态模型
凸单调动态( convex-monotone dynamics):如果某一种纯策略(或混合策略)的收益高于另一种纯策略,那么相应的其具有更高的比例增长率。
弱收益正性动态( weakly payoff-positive dynamics):如果存在一种超出平均收益的纯策略,那么至少有一种这样的纯策略的比例是增长的。显然,这种动态过程包含了前两种。
第七章 演化博弈理论及其应用第四节 演化博弈理论的动态演化机理和各种动态模型
44
思考,
对于一个生物种群,纳什均衡的概念能否反映出其群体行为的稳定状态?如果不能,需要怎样定义新的均衡?
回顾人类进化史:森林古猿的树栖行为是纳什均衡;气候变化后一个小种群改变为下地直立行走的行为,进化为猿人。
新的均衡定义需要在一个群体处于 Nash均衡状态下,能够成功地抵御入侵策略,使得种群的原均衡保持不变。
第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法
45
演化稳定策略 ESS的概念,
演化稳定策略 ( ESS,evolutionary strategy stable,Maynard Smith and Price
(1973,1981) ) 是演化博弈的一个核心概念,其反映了均衡解的稳定性状态(另一个是模仿者动态,一种最常用的动态收敛过程)。
ESS定义:对于非常小的正数 ε,所有的 σ≠σ*,满足:
即对于群体中很小比例 ε的突变行为 σ,采取 σ *策略将获得更高收益,σ *策略即为演化稳定策略。
附注:突变策略是群体参与者的策略集合中不同于现有实施策略的一种策略。其中,策略集合包括所有的纯策略和相应的混合策略。
ESS定义的涵义:在一个群体处于 Nash均衡状态 (σ*,σ*)下,当少数变异者持有变异策略 σ入侵时,侵略将被击退,原均衡 (σ*,σ*)保持不变,
))1(,())1(,( uu
第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法
46
举例,单一群体的鹰鸽博弈 ESS分析(该博弈有 3个纳什均衡)
设群体中采取鹰策略的比率为 p,采取鸽策略的比率为 (1-p),
采取鹰策略的收益,EU= p(V-C)/2+ (1-p)V;
采取鸽策略的收益,ED= V(1-p)/2。
由于 V<C,当 EU= ED时为混合均衡,p*= V/C。
如图所示,
当 p> p*时,采取鸽策略收益更高,(1-p)比率增加;
当 p< p*时,采取鹰策略收益更高,p比率增加。
最终群体比率的稳定均衡状态为 p= p*,
即混合均衡为唯一的 ESS。
第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法
1/2(v-c),1/2(v-c) v,0
0,v v/2,v/2
鹰 H 鸽 D

H

D
EU
ED
V/2
V
EU、
ED
1
p
P *
(V-C)/2
47
ESS是 NE的一个精练概念:
ESS定义的等价表述:
条件 1,对所有的,,即严格 Nash均衡;
条件 2,当 时,则 。
思考,ESS与动态模仿过程是否相关?
ESS均衡概念的局限性:其可以通过分析要素博弈的收益值 u判断出来,是一个静态的均衡概念,没有考虑到的动态演化过程。 演化过程的稳定均衡概念应该与具体的演化过程有关。
第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法
),(),( uu
),(),( uu ),(),( uu
48
演化均衡 EE (evolutionary equilibrium)的概念,
不同于静态的 ESS均衡概念,演化均衡 EE为动态演化方程的稳定性概念,即:动态演化方程具有局部渐进稳定的均衡点。
局部渐进稳定的定义:某一状态 s如果满足在 s的每一个开邻域 N内,
每一条初始路径都充分接近于 N内部的一点 s,并渐进收敛到 s。
EE的分析方法:根据动态方程稳定性分析理论,分析雅克比
Jacobian矩阵特征值,判断稳定性。
各种稳定性概念的关系:动态方程的不动点( NP),Nash均衡点
(NE)、演化均衡点 (EE)和演化稳定策略 (ESS)之间具有如下关系:
注:第一个关系仅适用于马尔萨斯动力系统等某些系统的对称博弈。
NPNEEEE S S
第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法
49
演化博弈理论的演化均衡 EE分析过程,
针对具体社会经济群体互动现象,建立起具体的系统动态演化方程后,如何分析其均衡的稳定性?
( 1)第一步:先在要素博弈中找出所有的 Nash均衡解;
( 2)第二步:然后判断这些 Nash均衡解是否满足 EE稳定性条件:根据稳定性判据的特征根法,分析动力系统在平衡点处 Jacobian特征方程式的根的正负,当所有的根小于零时,
系统在平衡点处于稳定状态。
第七章 演化博弈理论及其应用第五节 演化博弈理论的均衡分析方法
50
动态方程在平衡点的稳定性:分析动力系统在平衡点处特征方程式的根,
当所有的根小于零时,系统在平衡点处于稳定状态。
对于一维动力系统(同类群体 2× 2博弈),特征根为:
对于二维动力系统(同类群体 3× 3博弈,或不同类群体 2× 2博弈),其雅可比矩阵为为,,
其中,矩阵的迹为,
行列式为 。
当 D > 0,T < 0时,系统处于渐进稳定;
其中若,则为稳定焦点; 若,则为稳定结点。
[资料夹 ] 动态系统在平衡点的稳定性判别方法:
)()( ft ddf )(?

)(
)(
22
11


G
F
202
10121
21







GG
FFJ
21
21 202
101)(




GFT
21
1221 202 101
)(






GFGFD
DT 42? DT 42?
51
Dan Friedman( 2000) 在 Santa Fe Institute Workshop(圣塔菲学术机构)
作的演讲? Economics (and Finance) as an Evolutionary Game” 介绍的一些前沿进展,
Stochastic learning in games
Quantal responses,QRE
smoothed fictitious play
KMR,Young variants
Extensive form stage games
Sophisticated learning,rule learning,teaching
Local interaction
Evolution of institutions
Biological-cultural coevolution
behavioral economics
第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性
52
圣塔菲研究所号称世界复杂系统研究的?圣地?。 1984年,在诺贝尔物理学奖获得?夸克之父? 盖尔曼 (Murray GellMann,)、安德逊 (Philip
Anderson)和诺贝尔经济学奖获得者阿罗 (Kenneth Arrow)等人的支持下,
在美国新墨西哥州首府圣塔菲市,成立了一个把复杂性作为研究中心议题的研究所,这就是著名的圣塔菲研究所,并将研究复杂系统的这一学科称为复杂性科学 (Complexity Seience)。
十多年来该所吸引了各国各学科领域的许多著名科学家前去进行学术访问,在美国,科学,杂志发表了大量复杂性科学论文,使研究所赢得了世界范围的声望,同时也掀起了世界范围内研究复杂系统的热潮。
圣塔菲研究所提倡不同学科的交流,在这儿你根本看不到闲人,大家都行色匆匆,即使在吃饭还是茶点这些空闲时间,也不乏精彩热烈的讨论
圣塔菲历来是美国有名的旅游和避暑胜地,研究所坐落在风景秀丽的半山腰上,四周蓝天白云,绿树掩映,如果不注意,你真看不出研究所和其他的建筑有什么区别。研究所门前空地上一位白发苍苍的老人正在散步,那就是盖尔曼。
[资料夹 ]美国圣塔菲研究所( Santa Fe Institute,简称 SFI )
http://www.santafe.edu/index.php
53
54
演化博弈理论的应用范围,
适用于分析有限理性的群体行为,尤其是多样化社会经济体制的自发演化现象。
不同于主流经济学强调资源(要素禀赋)、技术(生产函数)、偏好(效用函数)的作用,其更强调时间(路径依赖)、环境(促使均衡发生改变)和制度(博弈规则)的作用。
第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性
55
演化博弈理论的研究现状,
国际上 90年代以来,演化博弈理论收到越来越多经济学者的重视。
国外理论研究中着重于不同的具体学习过程构建模型,一般化模型、基于案例分析的模型等,分析其均衡的稳定性;
另一个方向是解决多变的演化环境下,博弈中创新行为的产生机理;
应用研究上:钱颖一、格雷夫( Greif)、青木昌彦等人运用于演化博弈理论分析了不同经济体制的多样性共生和自发演化现象。
国内研究:尚处于理论介绍阶段。
第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性
56
演化博弈运用社会经济现象分析时存在的问题,
演化博弈起源于生物种群演化现象分析,应用于社会经济问题分析时,面临着一些基础性的理论工作,例如:
生物种群按照预先规定好的要素博弈展开生存竞争。但是对于人类社会,要素博弈的结构如何确定?既然大家都是有限理性,那由谁来规定要素博弈的结构和规则(是外生的人为设计,还是历史过程中自发演化形成的)?
现有生物学习模型未必符合社会群体的理性水平,社会群体学习的演化机理?
理论分析工具上,对于超出 2维空间的动态系统以及非线性系统难于进行稳定性分析(恰好体现了人的认知能力有限理性)。
第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性
57
传统博弈和演化博弈的各自适用范围,
传统(古典)博弈
( 1)基本特点:假定参与者在信息收集、预期形成、后果推断和决策上是完全理性的,但是这种共同预期是如何形成的未加说明。
( 2) 适用范围:侧重于人类的演绎推理能力,可分析规则的人为设计(如机制设计理论)。
演化博弈
( 1)基本特点:假定参与者理性是非常有限的,在行动上被惯例的惰性和简单模仿所驱使,但是无法保证均衡结果的收敛。
( 2)适用范围:侧重于人类以观察为基础的归纳能力,可以分析以惯例、习俗体现的规则的自发演化。
第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性
58
现实中社会经济体制的变迁过程是人为设计与自发演化互相交织在一起的,体现为人类的理性能力并不是完全理性的,也不是停留在生物种群生存本能的较低层次上,而是复杂多样、丰富多彩的。
( 1)观点 1:现有两种理论截然分开的现实表明:目前人类的认识水平,
还无法揭示出社会变迁规律的整个面貌。
( 2)观点 2:波普尔的证伪主义科学哲学认为,科学本身是人类对自然界和人类社会的认识过程,是不断地向前发展的,永远没有止境。因此,
任何一个科学理论都无法永远被证明为真,科学知识的发展才永远没有最终极的顶点。
传统博弈和演化博弈面临的共同挑战:如何解释人类的创新行为???
(突变不同于渐变)
跳出三界外,不在五行中第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性
59
主要中文翻译的参考书目青木昌彦,经济体制变迁的演化分析,,
,比较制度分析,;
Fudenberg & Levine,? The Theory of Learning
in Games”,博弈学习理论,;
W,Weibull,? Evolutionary Game Theory”,演化博弈论,
理论介绍性的外文文献,
D,Fudenberg,“On economic applications of
evolutionary game theory” Journal of
Evolutionary Economics,(1998)8:15-43,
第七章 演化博弈理论及其应用第六节 演化博弈理论的最新进展和局限性