博弈论基础
一,什么是博弈论
二,博弈的基本概念
三,占优策略均衡和纳什均衡
四,重复博弈一、什么是博弈论
博弈 即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,
同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
博弈论 就是描述和研究行为者之间的策略相互依存和相互作用的一种决策理论。
二、博弈的基本概念
1,参与人 ( players):一个博弈中独立决策、
独立承担结果的主体。
2,行动 ( actions or moves):参与人在博弈的某个时点的决策变量。
3,策略 ( strategies):参与人在给定信息集的情况下的行动规则
4,得益 ( pay off)(或支付、报酬):指在一个特定的策略组合下参与人得到的确定效用水平,或者是指参与人得到的期望效用水平。
“囚犯的困境”博弈中的,报酬矩阵,( Payoff Matris)
嫌犯 B
坦白 不坦白坦白 -10,-10 0,20
嫌犯 A
不坦白 -20,0 -1,-1
三、占优策略均衡和纳什均衡
(一) 占优策略均衡
(二) 纳什均衡
(三) 占优策略均衡和纳什均衡比较
(一)占优策略均衡
占优策略( Dominant Strategies):不论其他参与人选择什么策略,某参与人的最优策略是唯一的,这样的唯一的最优战略被称为,占优策略,;
,博弈均衡,指博弈中的所有参与人都不想改变自己的策略的这样一种状态。
(一)占优策略均衡
在一个博弈中,如果每个参与人都有一个占优策略,且每个参与人都采取占优策略,那么由所有参与人的(占优)策略组合所构成的均衡就是 占优策略均衡 。
占优策略均衡的求解:
常用方法 ——划线法
(一)占优策略均衡划线法求解,囚犯困境,,
嫌犯 B
坦白 不坦白坦白 -10,-10 0,-20
嫌犯 A
不坦白 -20,0 -1,-1
(一)占优策略均衡例:卡特尔组织的博弈乙合作 不合作合作 10,10 4,4
甲不合作 12,6 8,8
(二)纳什均衡例:智猪博弈小猪按 等待按 5,1 4,4
大猪等待 9,-1 0,0
(二)纳什均衡
在一个纳什均衡里,如果其他参与人不改变策略,任何一个参与人都不会改变自己的策略。
(二)纳什均衡例:斗鸡博弈
B
进 退进 -3,-3 2,0
A
退 0,2 0,0
(三)占优策略均衡与纳什均衡比较
占优策略均衡 要求任何一个参与人对于其他参与人的 任何策略 选择来说,其最优的策略都是唯一的。
纳什均衡 只要求任何一个参与人在其他参与人的 策略选择给定 的条件下,其选择的策略是最优的。
占优策略均衡一定是纳什均衡,但纳什均衡不一定就是占优策略均衡。
(三)占优策略均衡与纳什均衡比较例:广告博弈一厂商 B
做广告 不做广告做广告 10,5 15,0
厂商 A
不做广告 6,8 10,2
(三)占优策略均衡与纳什均衡比较例:广告博弈 2
厂商 B
做广告 不做广告做广告 10,5 15,0
厂商 A
不做广告 6,8 20,2
(三)占优策略均衡与纳什均衡比较例:市场进入博弈在位者默许 斗争进入 40,50 -10,0
进入者不进入 0,300 0,300
四、重复博弈
静态博弈,每个参与者只参与了一个策略的选择,一旦每个参与者的策略选定,
整个博弈结局也就决定了,每个参与者不可能对博弈的过程施加什么影响。
重复博弈 是动态博弈的一种特殊情况,
指的是一个基本博弈重复进行构成的博弈过程。
四、重复博弈
重复博弈类型:
无限次重复博弈
有限次重复博弈(有明确重复次数或结束时间)
重复次数虽然有限但博弈结束的时间却是不确定的四、重复博弈无限期重复博弈,
厂商 2
低价 高价低价 10,10 100,-50
厂商 1
高价 -50,100 50,50
四、重复博弈
无限期博弈的最好策略 ——,以牙还牙,
策略;
有限期博弈 —— 采用逆推法:类似静态博弈结果;
重复次数虽然有限但博弈结束的时间却是不确定的一种博弈 —— 囚犯困境的纳什均衡合作解可以存在。