第四讲 纳什均衡 上海财经大学 经济学院 1
第三讲 纳什均衡 1. 纳什均衡 2. 纳什均衡:信念的协调 3. 古诺均衡 4. 对称博弈
1. 纳什均衡 投资博弈 每个人同时决定 “投资10元” 或 “不投资” 如果选择“不投资”:支付为0 如果选择“投资”: 当超过90%的人选择了也“投资”,那么会得到5元的利润(即得到本利15元); 当选择“投资”的人数低于90%,那么就会失去10元的本金,即亏10元。 3
投资博弈:N=2 参与者: 甲和乙 策略: 投资或不投资 支付矩阵: 乙 投资 不投资 甲 (5, 5) (-10, 0) (0, -10) (-10, 0) (0, -10) (0, 0) 4
投资博弈:N=2 策略组合 (投资,投资) 策略组合 (不投资,不投资)也具有这个性质 乙 投资 不投资 甲 (5, 5) (-10, 0) 每个人的选择都是对他人选择的最优反应 给定别人的策略选择,没有一方愿意做出改变 策略组合 (不投资,不投资)也具有这个性质 双方协商一致后,没有背叛激励 乙 投资 不投资 甲 (5, 5) (-10, 0) (0, -10) (0, 0) 5
投资博弈:N=2 称策略组合 (投资,投资)、 (不投资,不投资)为纳什均衡 乙 投资 不投资 甲 (5, 5) (-10, 0) 没有单方偏离激励,具有自我实施性质 乙 投资 不投资 甲 (5, 5) (-10, 0) (0, -10) (0, 0) 6
定义:纳什均衡 策略组合 s*=(s*1, s*2)是纳什均衡,如果 参与者的策略互为最优反应 u1 (s*1, s*2) ≥ u1 (s1, s*2) 任意 s1 S1 s*1=b1(s*2) u2 (s*1, s*2) ≥ u2 (s*1, s2) 任意 s2 S2 s*2=b2(s*1) 1994年度的诺贝尔经济学奖,授予美国普林斯顿大学数学系的纳什教授等三位对博弈论作出奠基性贡献的学者。好莱坞大制作《美丽心灵》A Beautiful Mind说的就是纳什的故事。 写的是一个叫纳什的天才。纳什在三十岁之前就已经成为数学界响当当的人物,可是却在三十岁之后得上了严重的精神分裂症。这时学界开始出现了一大堆以纳什命名的术语,什么纳什均衡、纳什程序、纳什谈判解、纳什嵌入等,可是这时的纳什已经从学界消失,所以引用他文章的青年数学家、经济学家都以为他已经死了。他当然没有死,他只是得了精神分裂,整天在普林斯顿闲逛,在黑板上写一些奇怪的符号,偶尔也会露一露天才的本相,或者发布他收到的外星智慧发给他的最新密码。 由于纳什夫人的爱心的呵护,他的病情终于逐渐逐渐好转,最后于1994年获得诺贝尔奖。本演讲是影片中纳什领取诺贝尔奖时候的致辞。 7
1.2 纳什均衡与占优 占优策略组合:(坦白,坦白) 例:囚徒困境 乙 坦白 沉默 甲 (-10,-10) (0, -15) (-15,0) 是纳什均衡 例:囚徒困境 乙 坦白 沉默 甲 (-10,-10) (0, -15) (-15,0) (-5,-5)
1.2. 纳什均衡与占优 是 纳什均衡 例:成绩博弈:互利者 VS 自利者 2r 1r 重复剔除严格劣策略得到的唯一策略组合: (X,X) 别人(自利) X Y 自己(互利) (2.7,2.7) (2, 2) (-1, 4) (3, 3) 1r 2r 9 9
1.2. 纳什均衡与占优 例:成绩博弈:互利者 VS 互利者 纳什均衡 别人(自利) X Y 自己(互利) (2.7, ) (2, ) (2.7, ) (2, ) (-1, ) (3, ) 10 10
1.2 纳什均衡性质 自我实施性 信念与行动一致 没有单方偏离激励 每个人对他人策略选择有着正确的信念 参与者 2 X Y Z 参与者 1 L 1, 0 2, 2 0, 1 F 0, 3 2, 1 T 0, 0 1, 2 并不是所有博弈都可以通过占优方法得到均衡
2. 信念的协调 例:投资博弈 乙 投资 不投资 甲 (5, 5) (-10, 0) (0, -10) ( 0, 0) 12 12
2. 信念的协调 对称的共赢协调博弈(Ranked Coordination) 投资博弈 : c=投资, d=不投资 …… 参与者 2 c d 参与者 1 (5, 5) (-10, 0) (0, -10) (0, 0) 协调的关键:信心 (信任)
2. 信念的协调 非对称共赢协调问题 性别战(约会博弈): c=足球, d=音乐会 标准竞争 乙 c d 甲 (5, 2) (0, 0) (0, 0) (2, 5)
案例:56k调制解调器技术标准竞争 90年代中期,调制解调器主导标准:V.34,28.8kbs/秒 1996年Rockwell、US Robotics、朗讯和摩托罗拉相继向市场投放下一代调制解调器:56kbs/秒,但分为两大阵营 Rockwell、朗讯、摩托罗拉: K56Flex标准 US Robotics: X2标准 双方互不兼容,并拒绝了国际电讯联盟的标准化协调 US Robotics K56Flex X2 Rockwell (10,2) (0, 0) (2, 10) 15
案例:56k调制解调器技术标准竞争 洛克威尔,US Robotics 的56k调制解调器 3Com公司(Rockwell的支持者)收购 US Robotics,打破僵局 1997年,国际通讯联盟推出 V90标准,解决两者之间的差异,市场迅速扩大。
2. 信念的协调 冲突协调 斗鸡博弈(Chicken) 消耗战 (War of Attrition) 乙 c d 甲 (0, 0) (-1, 2) (2, -1) (-10,-10)
例:分饼博弈 给定有100元钱,由两个人分享。规则要求每个人同时提出自己想要的份额si,如果s1 + s2 100,那么按各自索要的份额分配,如果, s1 + s2 >100,那么每个人都得到0。请求解纳什均衡。 参与者: I={1,2} 策略集 si=[0, 100], i=1,2 s=(s1, s2) 支付函数 18
例:分饼博弈 给定策略组合(si sj ), 参与者的 i 支付 Max ui(si,sj) 100-sj Bi (sj)= [0, 100] 如果 sj =100
例:分饼博弈 100-sj 如果 0 sj <100 NE Bi (sj)= [0, 100] 如果 sj =100 协调 s2 s*1 B1(s*2); s*2 b2(s*1) (x, 100- x) 其中 x[0,100]; (100, 100) 协调 文化:公平价值观 聚点均衡: (50,50) Bi (sj)= 100-sj 如果 0 sj <100 [0, 100] 如果 sj =100 s2 B1 (s2) 100 70 B2 (s1) 30 100 s1
分饼博弈:Nash谈判解 双边谈判问题 纳什谈判解 (Nash, 1950) 总剩余: R 可行分配集 F={(x1,x2) : x1,0, x2 0, x1+x2R} 保留支付 : (r1, r2) 威胁点 纳什谈判解 (Nash, 1950) Max (x1-r1)·(x2-r2) (x1,x2) F v1 = r1+ (R - r1 - r2) /2 v2= r2+ (R - r1 -r2) /2 21
讨论 如果你是甲,会如何选择 纳什均衡: (A, X) 批评一:为什么不是(C,Z) 乙 X Y Z 甲 A 2, 2 3, 1 0, 2 3, 1 0, 2 B 1, 3 3, 2 C 2, 0 2, 3 2, 2
讨论 乙有占优策略:X 所以甲最优反应是C。 但是事实上,许多人会选择A,为什么? 乙 X Z 甲 A 9, 10 8, 9.9 C 8, 9.9 C 10, 10 -1000, 9.9 担心对方的理性或不确定对方的支付 但这本身不对博弈论构成批评,而是过于简单的运用博弈论、既然 甲对乙的支付或理性不确定,那么就应该在博弈论模型构建时把这一因素考虑进去,比图设一个概率分布 类似的,上面一个例子中也一样,你不确定对反理性程度,不知道对方能否像你一样推理,那么在建模时就要把这种不确定刻画出来:即博弈参与者知道些什么?
小结:纳什均衡 纳什均衡 纳什均衡的推理 没有单方偏离激励 一致信念:每个人对他人策略选择有着正确的信念 方法一:按“没有单方偏离激励”标准检验每个策略组合 方法二:找出每个参与者的最优反应函数 bi(s- i) ,然后求解方程组: s*i = bi(s*-i) i=1,2,3,…,N