博 弈 论主讲教师 翟凤勇所在院系 管理学院
Email,fyzhai@hit.edu.cn
GAME THEORY
多算胜,少算不胜,
何况于无算乎?
—— 摘自,孙子兵法,
绪 论 内 容 提 要本门课的说明什么是博弈论(说明性定义)
几个博弈简例博弈的基本要素博弈论相关背景知识课程主要内容推荐参考文献博弈论讲义——
绪论部分本课程的说明
为什么开设博弈论
“如果你想成为一个有文化的人,你必须对博弈论有个大致了解” ——萨缪尔森。
博弈论是自然科学与社会科学完美渗透的结晶。
加入世贸的中国(世界竞争)与缺乏现代科学理论、方法的中国的矛盾。
博弈论讲义——
绪论部分本课程的说明
课程的讲授风格
文理学生兼顾
不损失博弈论的理论严密特点
一定程度上反映博弈论的人文学科特点
力求不同专业的学生都有所收益
体现博弈论的博大
博弈论多学科、多领域交叉性明显
力求理论与实际的融合博弈论讲义——
绪论部分本课程的说明
学习方法
尽可能多读些推荐的参考著作
与日常实践相联系
由于博弈论涉及知识较多,因此一些相关数学、经济学知识需要课后阅读。
博弈论讲义——
绪论部分本课程的说明
考核方式
完成小论文(占 60%),每人至少写 1篇布置的或自己感兴趣的小论文,或写一篇发表的国内外相关文献读后感(不少于 3000
字)
平时作业(占 40%)
博弈论讲义——
绪论部分推荐书目( 1)
1,张维迎著 博弈论与信息经济学,上海三联书店,上海人民出版社,1996年 8月,
2,[美 ]迪克西特,奈尔伯夫著,王尔山译,策略思维,中国人民大学出版社,2003,
3,L.C,Thomas,Games,Theory and
Applications,Ellis Horwood Limited 1983.
( 有中译本 ),
以上书目文理科学生可选读,尤其是 [1],[3]
博弈论讲义——
绪论部分推荐书目( 2)
4,[美 ]迈尔森 (Myerson,R,B.)著,于寅,费剑平译,博弈论 —— 矛盾冲突分析,经济出版社,2002
5,[加 ]马丁 J.奥斯本,[美 ]阿里尔,鲁宾斯坦,当代经济学教科书译丛,博弈论教程,中国社会科学出版社,
2000.
6,[美 ]朱,富登博格 /Drew Fudenberg/,[法 ]让,梯若尔
/Jean Tirole/.博弈论,中国人民大学出版社 (一本翻译的较差的博弈论名著 )。
以上书目推荐有兴趣的理科学生选读 。
博弈论讲义——
绪论部分什 么 是 博 弈 论
是 Game Theory的翻译
研究具有 独立行为能力 的多个决策主体
彼此具有冲突与合作关系
具有交互性的决策行为
以数学模型为主要分析方法博弈论讲义——
绪论部分什 么 是 博 弈 论
博弈理论的两个假设
每个决策者追逐一个具有“良好定义的”
外生目标 (exogenous objective)
在决策中,要考虑其他决策者的行为,可利用该决策者的知识或对其他决策者行为的估计
下面介绍几个简单博弈例子博弈论讲义——
绪论部分
全班范围内,请在 0~99这 100个整数中,
选择一个数字。获胜的条件是,如果你选择的数字,满足:
1,不超过所有回答数字的平均值的 2/3;
2,在满足 1.的前提下,你所猜得的数字为最大。
请问你选择的数字是什么?
简例一:猜数问题博弈论讲义——
绪论部分
警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们。如果其中至少有一人供认犯罪,
就能确定罪名成立。
警察将这两名罪犯分别关押以防止他们结成攻守同盟,并给他们同样的选择机会:如果二人都拒不认罪,则他们会被判以 1年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放,而另一人被判 8年;如果两人同时坦白认罪,则他们将各被判
5年。
如果你是囚徒之一,你将怎样决策?
简例二:囚徒困境 (Prisoners’
Dilemma)
博弈论讲义——
绪论部分
如果把,被判 1年,记为 -1,,被判 8年,记为 -8,
,被判 5年,记为 -5,立即释放记为 0
可用图 0-1表示两个囚徒在不同的策略组合下,双方各自的状况。
坦 白 不坦白坦 白 (-5,-5) (0,-8)
不坦白 (-8,0) (-1,-1)
图 0-1 囚徒问题的矩阵表示囚徒
1
囚徒 2
简例二:囚徒困境 (Prisoner’s
Dilemma)
博弈论讲义——
绪论部分
两个人同时发现 1头鹿和 2只兔子,如果两人合力抓鹿,则可以把这头价值 10单位的鹿抓住,兔子则跑掉;如果两个人都去抓兔子,则各可以抓到 1
只价值 3单位的兔子,鹿就会跑掉;但如果一个人选择了抓兔子而另一个人选择了抓鹿,那么选择抓兔子的能抓到 1只兔子,选择抓鹿的人则一无所获。
假定两个人来不及商量,较优策略应是怎样的呢?
可用类似囚徒困境问题的矩阵形式表示猎鹿问题,
见图 0-2。
简例三:猎鹿问题 (Stag hunt)
博弈论讲义——
绪论部分抓鹿 抓兔抓鹿 (5,5) (0,3)
抓兔 (3,0) (3,3)
图 0-2 猎鹿问题的矩阵表示猎人
1
猎人 2
简例三:猎鹿问题 (Stag hunt)
博弈论讲义——
绪论部分
竞赛规则为
两人进行交替地在若干堆火柴中拿火柴
对拿火柴的要求是:拿火柴方可任意选择一个火柴堆。选定后,对拿火柴的根数的要求是:至少拿一根,至多拿走该堆的所有火柴;
胜负的判别规则是:判最后拿走火柴的参赛者为负。
简例四:拿火柴游戏 (Nim)
博弈论讲义——
绪论部分
与前三个问题相比,这个问题相对复杂
为简便计,两个游戏者分别记为 1,2
特别地,我们分析只有两堆火柴的情况
图 0-3通过图形,直观地表示了在( 2,
2)组合下,不同局势、不同策略下的决策结果。
简例四:拿火柴游戏 (Nim)
博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
火柴分布只要形成
(2,1),(2,0)
(1,1)组合博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
先拿火柴方必将获胜博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
(2,2)组合下先拿者必败博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
对于更为复杂情形博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
能否归纳出面对任何情形的最优策略博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
可以将局势尽可能向有利局势转化博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
古诺模型在博弈论中具有重要意义
通过多个厂商产量确定的交互分析,描述了市场均衡局势的确定过程
存在多个版本
连续型
离散型
这里介绍离散产量的三厂商古诺博弈。
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
几个需要解释的概念
市场出清价格 (clearing price):在某一个市场上,刚好能将某种商品全部销售出去的价格,被称为“市场出清价格”。
市场出清价格是投放到该市场上商品数量的函数。
假定厂商利润主要由市场出清价格决定。
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
假设:
三个厂商在同一个市场上生产销售完全相同商品
三个厂商的产量分别用 q1,q2,q3表示,
且假定产量只能取非负整数值。
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
设市场出清价格 P是市场总产量 Q= q1+ q2 +
q3的函数,假设函数形式为
20,0
20),(2020)( 321
Q
QqqqQQPP
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
假设:
各厂商生产都无成本(为便于分析)
三个厂商同时决定各自的产量
问
三个厂商应该怎样选择生产量?或者说整个市场的均衡产量和价格是什么?
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
分析
先剔除三厂商不可能选择的产量区域
每个厂商最大产量不可能超过 20
三个厂商各自的产量实际上也不可能超过 10
(请思考)
20,0
20),(20)( 321
Q
QqqqQP
博弈论讲义——
绪论部分
由于已经假设产量只取正整数,因此可能产量组合数目是有限的
假设三个厂商总产量始终不会大于 20,这时厂商 i的利润函数为
iii qqqqqP )](20[ 321?
简例 5:古诺 (Cournot)模型
该式表明三个厂商间产量与利润的相互依存关系博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
根据上面的价格函数和利润公式,很容易计算出在产量组合
比如,当三厂商的产量组合为 (4,8,6)时,市场出清价格为 2,三厂商的利润分别为 8,16和 12。
将它们列在表 1的第一行
20,0
20),(20)( 321
Q
QqqqQP
iii qqqqqP )](20[ 321?
博弈论讲义——
绪论部分
121682684
π3π2π 1Pq3q2q1
表 1
简例 5:古诺 (Cournot)模型该产量分布状态稳定吗?
博弈论讲义——
绪论部分
121682684
π3π2π 1Pq3q2q1
表 1
简例 5:古诺 (Cournot)模型如果厂商 2产量下调
54 6
博弈论讲义——
绪论部分
121682684
π3π2π 1Pq3q2q1
表 1
简例 5:古诺 (Cournot)模型将会发现所有厂商的产量将会增加
54 6 5 2520 30
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
简例 5:古诺 (Cournot)模型表 1
可验算厂商 2,3会满意该结果 …
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
简例 5:古诺 (Cournot)模型表 1
但厂商 1愿意提高产量 1单位 …
5 5 6 4 20 20 24
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
5 5 6 4 20 20 24
表 1
简例 5:古诺 (Cournot)模型此时厂商 1,2对该市场格局感到满意 …
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
5 5 6 4 20 20 24
表 1
简例 5:古诺 (Cournot)模型但厂商 3可削减产量,
实现利润的增长
555 5 252525
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
5 5 6 4 20 20 24
5 5 5 5 25 25 25
5 5 4 6 30 30 24
简例 5:古诺 (Cournot)模型表 1
此时,产量组合 (5,5,5)已经达到稳定状态,
可通过对厂商 3的分析得出该结论 …
博弈论讲义——
绪论部分 但与相对帕雷托较优产量组合( 3,3,3)
相比,市场均衡产量组合 (5,5,5)无疑是低效率的。但这个较优帕雷托产量组合是不稳定的。
简例 5:古诺 (Cournot)模型
5 5 5 5 25 25 25
表 2
q1 q2 q3 P π 1 π2 π3
3 3 3 11 33 33 33
博弈论讲义——
绪论部分因为,任何一个厂商都有增加产量的内在动力,如。
简例 5:古诺 (Cournot)模型
5 5 5 5 25 25 25
表 2
q1 q2 q3 P π 1 π2 π3
3 3 3 11 25 25 25
6 3 3 8 48 24 24
博弈论讲义——
绪论部分
思考题:古诺模型带给我们的启示有那些?
简例 5:古诺 (Cournot)模型博弈论讲义——
绪论部分上述问题都有如下共同点
都有若干决策者,我们称之为 参与人 (players)
N-人博弈问题的决策者集合,习惯上也用
N表示
针对具体问题,参与人可以是
个人
一个政府
公司的整个董事会博弈的基本要素博弈论讲义——
绪论部分
参与人都存在若干 策略 (strategies)或行动( actions)
参与人 i的策略用 si表示,参与人 i的所有策略构成的集合称为 策略集,记为 Si,si∈ Si
注意行动与策略的区别(考虑拿火柴游戏)
博弈的基本要素博弈论讲义——
绪论部分
支付 (payoff)
各参与人对所有参与人不同策略组合
(strategy profile),构成了博弈的 一个局势 。
记为 s = (si,s-i)
参与人 i (i∈ N)对局势 s = (si,s-i)有一个主观的偏好,可用一个函数表示这种偏好,这个偏好函数称为参与人 i 的 支付博弈的基本要素博弈论讲义——
绪论部分
参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。
博弈的基本要素博弈论讲义——
绪论部分
补充说明
参与人必须是有独立决策能力,并能承担博弈结果的一个决策体(以田忌赛马为例)
参与人不必是有“故意行为”的主体
可以是动物
可以是植物博弈的基本要素博弈论讲义——
绪论部分
博弈思想自古有之
2000年前中国著名的“田忌赛马”
1500年前 巴比伦犹太法典的,婚姻合同问题,
1838年的古诺 (Cournot)模型,被看成是早期博弈研究的起点
1883年伯特兰德 (Bertrand)提出的通过价格进行博弈的寡头竞争模型与古诺模型有异曲同工之妙。
艾奇沃斯 (Edgeworth)提出的,契约曲线,则是后来合作博弈论重要概念,核,的特例。
博弈论相关背景知识博弈论讲义——
绪论部分
博弈论的诞生
von Neumann和 Morgenstern合著的,博弈论和经济行为,(The Theory of Games
and Economic Behavior)的诞生( 1944)
该书首创的博弈一些术语,表示形式,至今仍在使用
提出了 v-N-M效用,用以表示博弈的支付
使博弈论从数学家的圈子中走出,建立了数学与经济学间的桥梁博弈论相关背景知识博弈论讲义——
绪论部分
John von Neumann 生平
8岁就掌握了微积分,19岁发表了第一篇学术论文
30岁成为最年轻的普林斯顿数学学院 6名教授之一 (Einstein was
one of the others)( 1933年)
1903-1957
博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 40年代开始转向应用数学领域
1943年为 Manhattan项目的顾问 (atomic bomb)
1944年第一台计算机的诞生,
他作了主要贡献
1944年与摩根斯坦合作的博弈论第一部著作
1957年英年早逝(纯粹数学、应用数学、物理学,polymath)
1903-1957
博弈论相关背景知识博弈论讲义——
绪论部分
首部博弈论专著出现的历史背景
普林斯顿大学汇集了当时最一流的著名科学家
数学在物理学的成功应用激发了 von
Neumann等博弈论先驱,采用数学对冲突局势下人们的思维、行为过程的数学描述的想象力博弈论相关背景知识博弈论讲义——
绪论部分
John Nash Jr.与 Nash均衡
1950年纳什在普林斯顿的博士论文
(27pages),首次提出了纳什均衡、并证明了纳什定理
“这是对博弈论高度的原创性和重要的贡献” —— Tucker
30岁后,曾陷于精神疾病数十年
1994与 Harsanyi,Selten共获诺贝尔奖
纳什与爱因斯坦、冯诺依曼的轶事
1928-
博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 50年代是博弈论的第一个研究高潮
Nash均衡理论的建立
理论与实验并行的博弈研究方式
1950年兰德公司的囚徒问题的实验
合作博弈论的第一次鼎盛时期
,40年代末 50年代初是博弈论历史上令人振奋时期,原理已经破茧而出,正在试飞它们的双翅,
活跃着一批巨人。”( Aumann,1985)
博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 50年代中后期到 70年代的兴盛期
博弈研究成果不断丰富
1965年则而滕与海萨尼的博弈的精炼理论
进化博弈 (evolutionary game,1972)的出现
“共同知识 (common knowledge)”假设的建立博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 80~90年代的成熟期
Kohlberg的前向归纳法 (forward induction,
1981)
Kreps和 Wilson的 sequential equilibrium
( 1982)
Smith的,Evolutionary and The Theory of
Games” (1982)
博弈学习理论 (learning theory)的完善博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 80~90年代的成熟期
博弈论几乎涉及经济学所有领域,改变了微观经济学的理论基础
博弈论在心理学、行为科学、认知科学等人文科学都取得了成功应用
博弈论在生物学、智能技术、计算机科学等也都有着应用
多名博弈论专家获得诺贝尔经济学奖博弈论相关背景知识博弈论讲义——
绪论部分
“for their pioneering analysis of equilibria in the
theory of non-cooperative games,
博弈论讲义——
绪论部分
"for their fundamental contributions to the economic
theory of incentives under asymmetric information"
博弈论讲义——
绪论部分
"for their analyses of markets with asymmetric
information"
博弈论讲义——
绪论部分
博弈论与微观决策实践活动,制设计理论、实践的诞生
著名的 FCC频谱拍卖
TCPA (tradeable carbon permit auctions)
格鲁夫斯机制的建立
企业的日常决策行为博弈论相关背景知识博弈论讲义——
绪论部分课程主要内容
完全信息静态博弈
完全信息动态博弈
不完全信息静态博弈
Cooperative Games (in English)
博弈论与人文科学
Email,fyzhai@hit.edu.cn
GAME THEORY
多算胜,少算不胜,
何况于无算乎?
—— 摘自,孙子兵法,
绪 论 内 容 提 要本门课的说明什么是博弈论(说明性定义)
几个博弈简例博弈的基本要素博弈论相关背景知识课程主要内容推荐参考文献博弈论讲义——
绪论部分本课程的说明
为什么开设博弈论
“如果你想成为一个有文化的人,你必须对博弈论有个大致了解” ——萨缪尔森。
博弈论是自然科学与社会科学完美渗透的结晶。
加入世贸的中国(世界竞争)与缺乏现代科学理论、方法的中国的矛盾。
博弈论讲义——
绪论部分本课程的说明
课程的讲授风格
文理学生兼顾
不损失博弈论的理论严密特点
一定程度上反映博弈论的人文学科特点
力求不同专业的学生都有所收益
体现博弈论的博大
博弈论多学科、多领域交叉性明显
力求理论与实际的融合博弈论讲义——
绪论部分本课程的说明
学习方法
尽可能多读些推荐的参考著作
与日常实践相联系
由于博弈论涉及知识较多,因此一些相关数学、经济学知识需要课后阅读。
博弈论讲义——
绪论部分本课程的说明
考核方式
完成小论文(占 60%),每人至少写 1篇布置的或自己感兴趣的小论文,或写一篇发表的国内外相关文献读后感(不少于 3000
字)
平时作业(占 40%)
博弈论讲义——
绪论部分推荐书目( 1)
1,张维迎著 博弈论与信息经济学,上海三联书店,上海人民出版社,1996年 8月,
2,[美 ]迪克西特,奈尔伯夫著,王尔山译,策略思维,中国人民大学出版社,2003,
3,L.C,Thomas,Games,Theory and
Applications,Ellis Horwood Limited 1983.
( 有中译本 ),
以上书目文理科学生可选读,尤其是 [1],[3]
博弈论讲义——
绪论部分推荐书目( 2)
4,[美 ]迈尔森 (Myerson,R,B.)著,于寅,费剑平译,博弈论 —— 矛盾冲突分析,经济出版社,2002
5,[加 ]马丁 J.奥斯本,[美 ]阿里尔,鲁宾斯坦,当代经济学教科书译丛,博弈论教程,中国社会科学出版社,
2000.
6,[美 ]朱,富登博格 /Drew Fudenberg/,[法 ]让,梯若尔
/Jean Tirole/.博弈论,中国人民大学出版社 (一本翻译的较差的博弈论名著 )。
以上书目推荐有兴趣的理科学生选读 。
博弈论讲义——
绪论部分什 么 是 博 弈 论
是 Game Theory的翻译
研究具有 独立行为能力 的多个决策主体
彼此具有冲突与合作关系
具有交互性的决策行为
以数学模型为主要分析方法博弈论讲义——
绪论部分什 么 是 博 弈 论
博弈理论的两个假设
每个决策者追逐一个具有“良好定义的”
外生目标 (exogenous objective)
在决策中,要考虑其他决策者的行为,可利用该决策者的知识或对其他决策者行为的估计
下面介绍几个简单博弈例子博弈论讲义——
绪论部分
全班范围内,请在 0~99这 100个整数中,
选择一个数字。获胜的条件是,如果你选择的数字,满足:
1,不超过所有回答数字的平均值的 2/3;
2,在满足 1.的前提下,你所猜得的数字为最大。
请问你选择的数字是什么?
简例一:猜数问题博弈论讲义——
绪论部分
警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们。如果其中至少有一人供认犯罪,
就能确定罪名成立。
警察将这两名罪犯分别关押以防止他们结成攻守同盟,并给他们同样的选择机会:如果二人都拒不认罪,则他们会被判以 1年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放,而另一人被判 8年;如果两人同时坦白认罪,则他们将各被判
5年。
如果你是囚徒之一,你将怎样决策?
简例二:囚徒困境 (Prisoners’
Dilemma)
博弈论讲义——
绪论部分
如果把,被判 1年,记为 -1,,被判 8年,记为 -8,
,被判 5年,记为 -5,立即释放记为 0
可用图 0-1表示两个囚徒在不同的策略组合下,双方各自的状况。
坦 白 不坦白坦 白 (-5,-5) (0,-8)
不坦白 (-8,0) (-1,-1)
图 0-1 囚徒问题的矩阵表示囚徒
1
囚徒 2
简例二:囚徒困境 (Prisoner’s
Dilemma)
博弈论讲义——
绪论部分
两个人同时发现 1头鹿和 2只兔子,如果两人合力抓鹿,则可以把这头价值 10单位的鹿抓住,兔子则跑掉;如果两个人都去抓兔子,则各可以抓到 1
只价值 3单位的兔子,鹿就会跑掉;但如果一个人选择了抓兔子而另一个人选择了抓鹿,那么选择抓兔子的能抓到 1只兔子,选择抓鹿的人则一无所获。
假定两个人来不及商量,较优策略应是怎样的呢?
可用类似囚徒困境问题的矩阵形式表示猎鹿问题,
见图 0-2。
简例三:猎鹿问题 (Stag hunt)
博弈论讲义——
绪论部分抓鹿 抓兔抓鹿 (5,5) (0,3)
抓兔 (3,0) (3,3)
图 0-2 猎鹿问题的矩阵表示猎人
1
猎人 2
简例三:猎鹿问题 (Stag hunt)
博弈论讲义——
绪论部分
竞赛规则为
两人进行交替地在若干堆火柴中拿火柴
对拿火柴的要求是:拿火柴方可任意选择一个火柴堆。选定后,对拿火柴的根数的要求是:至少拿一根,至多拿走该堆的所有火柴;
胜负的判别规则是:判最后拿走火柴的参赛者为负。
简例四:拿火柴游戏 (Nim)
博弈论讲义——
绪论部分
与前三个问题相比,这个问题相对复杂
为简便计,两个游戏者分别记为 1,2
特别地,我们分析只有两堆火柴的情况
图 0-3通过图形,直观地表示了在( 2,
2)组合下,不同局势、不同策略下的决策结果。
简例四:拿火柴游戏 (Nim)
博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
火柴分布只要形成
(2,1),(2,0)
(1,1)组合博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
先拿火柴方必将获胜博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
(2,2)组合下先拿者必败博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
对于更为复杂情形博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
能否归纳出面对任何情形的最优策略博弈论讲义——
绪论部分
=,=
=,–
1 picks one
=,
1 picks two
=,
–,–
–,
2 picks
2 picks
2 picks
–,
–,
1 picks
1 picks
1 picks
–,
2 picks
2 picks
(-1,1)
2 picks
2 picks
(1,-1)
(1,-1)
(-1,1)1 picks
(-1,1)1 picks
(1,-1)
图 0-3 Nim
可以将局势尽可能向有利局势转化博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
古诺模型在博弈论中具有重要意义
通过多个厂商产量确定的交互分析,描述了市场均衡局势的确定过程
存在多个版本
连续型
离散型
这里介绍离散产量的三厂商古诺博弈。
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
几个需要解释的概念
市场出清价格 (clearing price):在某一个市场上,刚好能将某种商品全部销售出去的价格,被称为“市场出清价格”。
市场出清价格是投放到该市场上商品数量的函数。
假定厂商利润主要由市场出清价格决定。
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
假设:
三个厂商在同一个市场上生产销售完全相同商品
三个厂商的产量分别用 q1,q2,q3表示,
且假定产量只能取非负整数值。
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
设市场出清价格 P是市场总产量 Q= q1+ q2 +
q3的函数,假设函数形式为
20,0
20),(2020)( 321
Q
QqqqQQPP
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
假设:
各厂商生产都无成本(为便于分析)
三个厂商同时决定各自的产量
问
三个厂商应该怎样选择生产量?或者说整个市场的均衡产量和价格是什么?
博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
分析
先剔除三厂商不可能选择的产量区域
每个厂商最大产量不可能超过 20
三个厂商各自的产量实际上也不可能超过 10
(请思考)
20,0
20),(20)( 321
Q
QqqqQP
博弈论讲义——
绪论部分
由于已经假设产量只取正整数,因此可能产量组合数目是有限的
假设三个厂商总产量始终不会大于 20,这时厂商 i的利润函数为
iii qqqqqP )](20[ 321?
简例 5:古诺 (Cournot)模型
该式表明三个厂商间产量与利润的相互依存关系博弈论讲义——
绪论部分简例 5:古诺 (Cournot)模型
根据上面的价格函数和利润公式,很容易计算出在产量组合
比如,当三厂商的产量组合为 (4,8,6)时,市场出清价格为 2,三厂商的利润分别为 8,16和 12。
将它们列在表 1的第一行
20,0
20),(20)( 321
Q
QqqqQP
iii qqqqqP )](20[ 321?
博弈论讲义——
绪论部分
121682684
π3π2π 1Pq3q2q1
表 1
简例 5:古诺 (Cournot)模型该产量分布状态稳定吗?
博弈论讲义——
绪论部分
121682684
π3π2π 1Pq3q2q1
表 1
简例 5:古诺 (Cournot)模型如果厂商 2产量下调
54 6
博弈论讲义——
绪论部分
121682684
π3π2π 1Pq3q2q1
表 1
简例 5:古诺 (Cournot)模型将会发现所有厂商的产量将会增加
54 6 5 2520 30
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
简例 5:古诺 (Cournot)模型表 1
可验算厂商 2,3会满意该结果 …
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
简例 5:古诺 (Cournot)模型表 1
但厂商 1愿意提高产量 1单位 …
5 5 6 4 20 20 24
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
5 5 6 4 20 20 24
表 1
简例 5:古诺 (Cournot)模型此时厂商 1,2对该市场格局感到满意 …
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
5 5 6 4 20 20 24
表 1
简例 5:古诺 (Cournot)模型但厂商 3可削减产量,
实现利润的增长
555 5 252525
博弈论讲义——
绪论部分
q1 q2 q3 P π 1 π2 π3
4 8 6 2 8 16 12
4 5 6 5 20 25 30
5 5 6 4 20 20 24
5 5 5 5 25 25 25
5 5 4 6 30 30 24
简例 5:古诺 (Cournot)模型表 1
此时,产量组合 (5,5,5)已经达到稳定状态,
可通过对厂商 3的分析得出该结论 …
博弈论讲义——
绪论部分 但与相对帕雷托较优产量组合( 3,3,3)
相比,市场均衡产量组合 (5,5,5)无疑是低效率的。但这个较优帕雷托产量组合是不稳定的。
简例 5:古诺 (Cournot)模型
5 5 5 5 25 25 25
表 2
q1 q2 q3 P π 1 π2 π3
3 3 3 11 33 33 33
博弈论讲义——
绪论部分因为,任何一个厂商都有增加产量的内在动力,如。
简例 5:古诺 (Cournot)模型
5 5 5 5 25 25 25
表 2
q1 q2 q3 P π 1 π2 π3
3 3 3 11 25 25 25
6 3 3 8 48 24 24
博弈论讲义——
绪论部分
思考题:古诺模型带给我们的启示有那些?
简例 5:古诺 (Cournot)模型博弈论讲义——
绪论部分上述问题都有如下共同点
都有若干决策者,我们称之为 参与人 (players)
N-人博弈问题的决策者集合,习惯上也用
N表示
针对具体问题,参与人可以是
个人
一个政府
公司的整个董事会博弈的基本要素博弈论讲义——
绪论部分
参与人都存在若干 策略 (strategies)或行动( actions)
参与人 i的策略用 si表示,参与人 i的所有策略构成的集合称为 策略集,记为 Si,si∈ Si
注意行动与策略的区别(考虑拿火柴游戏)
博弈的基本要素博弈论讲义——
绪论部分
支付 (payoff)
各参与人对所有参与人不同策略组合
(strategy profile),构成了博弈的 一个局势 。
记为 s = (si,s-i)
参与人 i (i∈ N)对局势 s = (si,s-i)有一个主观的偏好,可用一个函数表示这种偏好,这个偏好函数称为参与人 i 的 支付博弈的基本要素博弈论讲义——
绪论部分
参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。
博弈的基本要素博弈论讲义——
绪论部分
补充说明
参与人必须是有独立决策能力,并能承担博弈结果的一个决策体(以田忌赛马为例)
参与人不必是有“故意行为”的主体
可以是动物
可以是植物博弈的基本要素博弈论讲义——
绪论部分
博弈思想自古有之
2000年前中国著名的“田忌赛马”
1500年前 巴比伦犹太法典的,婚姻合同问题,
1838年的古诺 (Cournot)模型,被看成是早期博弈研究的起点
1883年伯特兰德 (Bertrand)提出的通过价格进行博弈的寡头竞争模型与古诺模型有异曲同工之妙。
艾奇沃斯 (Edgeworth)提出的,契约曲线,则是后来合作博弈论重要概念,核,的特例。
博弈论相关背景知识博弈论讲义——
绪论部分
博弈论的诞生
von Neumann和 Morgenstern合著的,博弈论和经济行为,(The Theory of Games
and Economic Behavior)的诞生( 1944)
该书首创的博弈一些术语,表示形式,至今仍在使用
提出了 v-N-M效用,用以表示博弈的支付
使博弈论从数学家的圈子中走出,建立了数学与经济学间的桥梁博弈论相关背景知识博弈论讲义——
绪论部分
John von Neumann 生平
8岁就掌握了微积分,19岁发表了第一篇学术论文
30岁成为最年轻的普林斯顿数学学院 6名教授之一 (Einstein was
one of the others)( 1933年)
1903-1957
博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 40年代开始转向应用数学领域
1943年为 Manhattan项目的顾问 (atomic bomb)
1944年第一台计算机的诞生,
他作了主要贡献
1944年与摩根斯坦合作的博弈论第一部著作
1957年英年早逝(纯粹数学、应用数学、物理学,polymath)
1903-1957
博弈论相关背景知识博弈论讲义——
绪论部分
首部博弈论专著出现的历史背景
普林斯顿大学汇集了当时最一流的著名科学家
数学在物理学的成功应用激发了 von
Neumann等博弈论先驱,采用数学对冲突局势下人们的思维、行为过程的数学描述的想象力博弈论相关背景知识博弈论讲义——
绪论部分
John Nash Jr.与 Nash均衡
1950年纳什在普林斯顿的博士论文
(27pages),首次提出了纳什均衡、并证明了纳什定理
“这是对博弈论高度的原创性和重要的贡献” —— Tucker
30岁后,曾陷于精神疾病数十年
1994与 Harsanyi,Selten共获诺贝尔奖
纳什与爱因斯坦、冯诺依曼的轶事
1928-
博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 50年代是博弈论的第一个研究高潮
Nash均衡理论的建立
理论与实验并行的博弈研究方式
1950年兰德公司的囚徒问题的实验
合作博弈论的第一次鼎盛时期
,40年代末 50年代初是博弈论历史上令人振奋时期,原理已经破茧而出,正在试飞它们的双翅,
活跃着一批巨人。”( Aumann,1985)
博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 50年代中后期到 70年代的兴盛期
博弈研究成果不断丰富
1965年则而滕与海萨尼的博弈的精炼理论
进化博弈 (evolutionary game,1972)的出现
“共同知识 (common knowledge)”假设的建立博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 80~90年代的成熟期
Kohlberg的前向归纳法 (forward induction,
1981)
Kreps和 Wilson的 sequential equilibrium
( 1982)
Smith的,Evolutionary and The Theory of
Games” (1982)
博弈学习理论 (learning theory)的完善博弈论相关背景知识博弈论讲义——
绪论部分
20世纪 80~90年代的成熟期
博弈论几乎涉及经济学所有领域,改变了微观经济学的理论基础
博弈论在心理学、行为科学、认知科学等人文科学都取得了成功应用
博弈论在生物学、智能技术、计算机科学等也都有着应用
多名博弈论专家获得诺贝尔经济学奖博弈论相关背景知识博弈论讲义——
绪论部分
“for their pioneering analysis of equilibria in the
theory of non-cooperative games,
博弈论讲义——
绪论部分
"for their fundamental contributions to the economic
theory of incentives under asymmetric information"
博弈论讲义——
绪论部分
"for their analyses of markets with asymmetric
information"
博弈论讲义——
绪论部分
博弈论与微观决策实践活动,制设计理论、实践的诞生
著名的 FCC频谱拍卖
TCPA (tradeable carbon permit auctions)
格鲁夫斯机制的建立
企业的日常决策行为博弈论相关背景知识博弈论讲义——
绪论部分课程主要内容
完全信息静态博弈
完全信息动态博弈
不完全信息静态博弈
Cooperative Games (in English)
博弈论与人文科学