第十章 管理系统博弈 II 管理系统工程精要 (Management Systems Engineering)

Slides:



Advertisements
Similar presentations
第二章 导数与微分 习题课 主要内容 典型例题 测验题. 求 导 法 则求 导 法 则 求 导 法 则求 导 法 则 基本公式 导 数 导 数 微 分微 分 微 分微 分 高阶导数 高阶微分 一、主要内容.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
§3.4 空间直线的方程.
3.4 空间直线的方程.
第三节 寡头垄断市场 oligopoly market
证券投资技术分析.
第十章 博弈论初步.
10.2 立方根.
第二节 纳什均衡 §2.1 纳什均衡的概念 §2.2 纳什均衡的求解 §2.3 混合策略和混合纳什均衡 精品课程《运筹学》
《高等数学》(理学) 常数项级数的概念 袁安锋
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
Examples for transfer function
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
探索三角形相似的条件(2).
3.解:连续掷同一枚硬币4次的基本事件总数为 ,
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
面向对象建模技术 软件工程系 林 琳.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
使用矩阵表示 最小生成树算法.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
6.4不等式的解法举例(1) 2019年4月17日星期三.
相似三角形 石家庄市第十中学 刘静会 电话:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
Three stability circuits analysis with TINA-TI
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
用计算器开方.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
第四章 一元函数的变化性态(III) 北京师范大学数学学院 授课教师:刘永平.
物理化学 复旦大学化学系 范康年教授 等 2019/5/9.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第4课时 绝对值.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
HULUO Finance and Economics College
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第十七讲 密码执行(1).
第十二讲 密码执行(上).
国 际 法 第 一 讲 主讲人: 兰州大学法学院李晓静.
位似.
《偏微分方程》第一章 绪论 第一章 绪论 1.1.
一元一次方程的解法(-).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Sssss.
Presentation transcript:

第十章 管理系统博弈 II 管理系统工程精要 (Management Systems Engineering) Copyright © 2015-2019 蒋忠中, All Rights Reserved Email: zzjiang@mail.neu.edu.cn Homepage: http://faculty.neu.edu.cn/zzjiang

第二章 完全信息静态博弈 本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。

本章主要内容 2.1 基本分析思路和方法 2.2 纳什均衡 2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡 2.1 基本分析思路和方法 2.2 纳什均衡 2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡 2.5 纳什均衡的存在性 2.6 纳什均衡的选择和分析方法扩展

2.1 基本分析思路和方法 2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法

2.1.1 上策均衡(dominant-strategy equilibrium) 例:囚徒的困境中的“坦白”;双寡头削价中“低价”。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。 上策均衡不是普遍存在的 例:齐威王田忌赛马,古诺产量决策模型

2.1.2 严格下策反复消去法(iterated elimination of strictly dominated strategies) 严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略。 严格下策反复消去法: 1,0 1,3 0,1 0,4 0,2 2,0 左 中 右 上 下 1,0 1,3 0,4 0,2 左 中 1,0 1,3 左 中 不能应用上策均衡 1,3 中

严格下策反复消去法的局限性 问题:猜硬币,齐威王田忌赛马,石头·剪子·布能不能应用严格下策反复消去法? 答:否! 原因:在典型的博弈问题中,博弈方之间普遍存在策略依存的特征,即一个博弈方的不同策略之间,往往不存在绝对的优劣关系,而只存在相对的,有条件的优劣关系,因此利用策略之间的绝对优劣关系分析筛选的严格下策反复消去法,不可能成为博弈分析的一般方法。 适应性较强的博弈分析方法,必然是以策略之间相对 优劣关系,而不是绝对优劣关系为基础的。

2.1.3 划线法 上策均衡分析和严格下策反复消去法都有局限性,不能满足博弈的需要,必须进一步寻找更普遍适用的博弈分析方法。 如何寻找? 适应性较强的博弈分析方法,必然是以策略之间的相对优劣关系,而不是绝对优劣关系为基础。

2.1.3 划线法 通过在每个博弈方对其它博弈方每个策略的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。 1, 0 1, 3 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 上 下 左 中 右 博弈方1 博弈方2 1, 3 通过在每个博弈方对其它博弈方每个策略的最佳对策对应的得益下划线,分析博弈的方法称为“划线法”。

事实上,许多博弈根本不存在确定性的结果,当然也就无法用划线法找出这种结果。 -5, -5 0, -8 -8, 0 -1, -1 坦 白 不坦白 囚徒 2 囚 徒 1 划线法分析囚徒的困境 事实上,许多博弈根本不存在确定性的结果,当然也就无法用划线法找出这种结果。 -5,-5 2, 1 0, 0 1, 3 划线法分析夫妻之争(Battle of sex) 时装 足球 妻子 丈夫 -1, 1 1, -1 猜 硬 币 没有完全 解决问题 划线法分析猜硬币博弈

2.1.4 箭头法 基本思路:对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。 -5, -5 0, -8 -8, 0 -1, -1 前头法分析囚徒的困境 坦 白 不坦白 囚 徒 1 囚徒 2 -5,-5

2.1.4 箭头法 博弈方2 左 中 右 博弈方1 上 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 下 夫 妻 之 争 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 下 夫 妻 之 争 2, 1 0, 0 0, 0 1, 3 猜 硬 币 -1, 1 1, -1 1, -1 -1, 1

2.1.4 箭头法 博弈方2 左 中 右 博弈方1 上 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 下 2, 1 0, 0 1, 0 1, 3 0, 1 0, 4 0, 2 2, 0 下 2, 1 0, 0 1, 3 夫 妻 之 争 -1, 1 1, -1 猜 硬 币

2.2 纳什均衡 2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法

1928年出生 美国约翰·纳什在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,从而获得1994年诺贝尔经济学奖。

约翰·纳什生平简介 1928年6月13日出生于西弗吉尼亚布卢菲尔德。 1947年3月,纳什遭遇了一生中首次重大失败。威廉·洛厄尔·帕特南数学竞赛 。卡内基大学 。 1948年,纳什从数学系毕业,并得到了去哈佛、普林斯顿、芝加哥和密歇根深造的机会。 1949年纳什开始研究被当时数学界人士认为是丑姑娘的对策理论。 1950年,纳什进入兰德研究所工作,这是中央情报局设在圣莫尼卡的一个战略研究机构,雇佣数学家推行冷战时代的对策理论。 1954年,纳什失去了他在兰德的工作 。 埃莉诺·施蒂尔 。 1957 ,艾丽西亚.拉尔德 。 纳什30岁,即将成为麻省理工学院高级教授的时候,他的脑子出现了可怕的问题,经医生诊断,纳什得了妄想型精神分裂症。 1994年获得诺贝尔经济学奖。

2.2.1 纳什均衡(Nash Equilibrium)的定义 策略空间: 博弈方 的第 个策略: 博弈方 的得益: 博弈: (n个博弈方的博弈) 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略 ,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡。

2.2.2 纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能.

2.2.3 纳什均衡与严格下策反复消去法 上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡。 命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡。 命题2.2: 在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的。

分析完全信息静态博弈的关键是找出其中的纳什均衡。 划线法和箭头法就是找纳什均衡的方法,但他们的适用范围只是通过策略之间的两两比较进行分析的有限策略博弈。 纳什均衡概念的有效性却并不因为策略数量的增加而受到影响。

2.3 无限策略分析和反应函数 2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性

2.3.1 古诺的寡头模型 寡头产量竞争——以两厂商产量竞争为例。 设一市场有1,2两厂家生产同样的产品。如果厂商1的产量为 q1 ,厂商2的产量为 q2 ,则市场总产量为 。设市场出清价格P是市场总产量的函数 。再设两厂商的生产都无固定成本,且每增加一单位产量的边际成本相等 c1=c2=2 。同时决定各自的产量。

直接根据纳什均衡的定义求解 如果假设策略组合 是本博弈的纳什均衡,那么 必须是最大值问题 的解。 令 如果假设策略组合 是本博弈的纳什均衡,那么 必须是最大值问题 的解。 令 市场价格为4,双方各自得益4,厂商利润总和为8。 求解

效率评价 首先根据市场条件实现总得益(总利润)最大的总产量。设总产量为Q, 总得益 总产量 最大总得益 在独立决策、缺乏协调机制的两个企业之间,上述合作的结果并不容易实现,即使实现了也往往是不稳定的。

两寡头间的囚徒困境博弈 以自身最大利益为目标:各生产2单位产量,各自得益为4.以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5。 厂商2 突破 不突破 不突破 4.5,4.5 3.75,5 厂 商 1 5,3.75 4,4 突破 自由竞争的经济同样存在低效率问题,放任自流也不是最好的政策。

2.3.2 反应函数 古诺模型的反应函数(reaction function) 古诺模型的反应函数图示 q2 反应函数法 R1(q2) (0,6) (0,3) (6,0) (3,0) q1 q2 (2,2) R1(q2) R2(q1) 古诺模型的反应函数图示

2.3.3 伯特兰德(Bertrand)寡头模型(1883年) 价格竞争寡头的博弈模型 产品有一定差别,消费者对价格不十分敏感(有很强的替代性,但又不是完全替代) 各自的需求函数 各自的得益函数 两厂商对对方策略的反应函数

纳什均衡必须是两反应函数的交点,即必须满足 解此方程得:

2.3.4 公共资源问题 公共资源的利用 公共设施的提供 公共环境的保护 存在众多的博弈问题。

2.3.4 公共资源问题 公共资源:没有哪个人、企业或组织拥有所有权;大家都可以自由利用。 公共草地养羊问题: 设农户决定养羊的数量是同时做出的。农户清楚这片公共草地最多能养多少只羊和羊只总数的不同水平下每只羊的产出。 羊只总数: 每只羊的产出: 假设购买和照料每只羊的成本对每个农户都是相同的 不变常数c,则农户i养qi只羊的得益函数为:

公共草地养羊问题 以三农户为例 n=3,c=4 每只羊的产出函数设 三农户的得益函数

公共草地养羊问题 三个反应函数的交点 就是博弈的纳什均衡。 解上述反应函数的联立方程式得: 三个反应函数的交点 就是博弈的纳什均衡。 解上述反应函数的联立方程式得: 效率评价(讨论总体利益最大的最佳羊只数量) 此即三农户独立同时决定在公共草地放羊数量时所能得到的利益。 三农户独立决策时实际上使草地处于过度放牧的情况,浪费了资源,农户也没有获得最好的效益。囚徒的困境。

2.3.5 反应函数的问题和局限性 在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。

2.4 混合策略和混合策略纳什均衡 2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数

2.4.1 严格竞争博弈和混合策略的引进 一、猜硬币博弈 (1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 -1, 1 1, -1 正 面 反 面 猜硬币方 盖 硬 币 方 (1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念

二、混合策略(Mix strategies)、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 . 纯策略也可以看作混合策略(为什么?) 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。

三、一个数值例子 该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析 博弈方1的混合策略 博弈方2的混合策略 2, 3 5, 2 3, 1 1, 5 C D A B 博弈方2 博 弈 方 1 博弈方1的混合策略 博弈方2的混合策略 策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6

四、齐威王田忌赛马 齐威王的期望得益1;田忌的期望得益-1。 齐威王 田忌 3,-3 1,-1 -1,1 上中下 上下中 中上下 中下上 下上中 下中上 上 中 下 田 忌 齐 威 王 得益矩阵 齐威王的期望得益1;田忌的期望得益-1。 齐威王 田忌

在社会治安领域,“严打”和“司法、公安自身建设谁更重要”?

五、小偷和守卫的博弈 加重对守卫的处罚:短期中的效果是使守卫真正尽职在 长期中并不能使守卫更尽职,但会降低盗窃发生的概率! V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 - D 守卫 得益((睡) Pt 小偷 偷的概率 S 1 - D’ 加重对守卫的处罚:短期中的效果是使守卫真正尽职在 长期中并不能使守卫更尽职,但会降低盗窃发生的概率!

五、小偷和守卫的博弈 加重对小偷的处罚:短期内能抑制盗窃发生率长期并不 能降低盗窃发生率,但会导致守卫更多的偷懒 V,-D -P,0 0,S 0,0 睡 不睡 偷 不偷 守卫 小 - P 小偷 得益(偷) V Pg 守卫 睡的概略 1 - P’ 加重对小偷的处罚:短期内能抑制盗窃发生率长期并不 能降低盗窃发生率,但会导致守卫更多的偷懒

激励的悖论! 降低犯罪率,重要的是加强司法和公安系统的自身建设!

这个结果显然不如夫妻双方交流协商时,任何一方迁就另一方的得益好,因为这时任何一方的得益都至少为1。 2.4.2 多重均衡博弈和混合策略 一、夫妻之争的混合策略纳什均衡 2, 1 0, 0 1, 3 时 装 足 球 时装 足球 丈 夫 妻 子 夫妻之争 妻子的混合策略 丈夫的混合策略 这个结果显然不如夫妻双方交流协商时,任何一方迁就另一方的得益好,因为这时任何一方的得益都至少为1。 夫妻之争博弈的混合策略纳什均衡 策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75

二、制式问题 制式问题混合策略纳什均衡 A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296 1, 3 0, 0 2, 2 A B 厂商2 厂 商 1 制式问题 制式问题混合策略纳什均衡 A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296 独自选择制式的方法是不理想的。因为如果它们通过协商,共同决定采用两个纯策略纳什均衡中的任意一个,双方的得益都比混合策略的期望得益更高。

三、市场机会博弈 市场机会博弈混合策略纳什均衡 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0 进 不进 得益 -50,-50 100,0 0,100 0,0 进 不 进 不进 厂商2 厂 商 1 市场机会 市场机会博弈混合策略纳什均衡 进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0

2.4.3 混合策略和严格下策反复消去法 任何博弈方都不会采用任何下策,不管它们是纯策略还是混合策略; 严格下策反复消去法不会消去任何纳什均衡; 如果经过反复消去后留下的策略组合是唯一的,那么一定是纳什均衡。 3, 1 0, 2 3, 3 1, 3 1, 1 L R U M D 博弈方2 博 弈 方 1 如果我们只考虑纯策略,那么两个博弈方都没有任何严格下策,因此严格下策反复消去法就无从运用

允许采取混合策略 1.博2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益 3, 1 0, 2 3, 3 1, 3 1, 1 L R U M D 博弈方2 博 弈 方 1 允许采取混合策略 1.博2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益 2.博2采用纯策略R时,博弈方1采用上述策略的得益 3.博2采用混合策略(q,1-q)时,博弈方1采用上述策略的得益 D策略相当 于混合策略 是严格下策

允许采取混合策略 3,3 3, 1 0, 2 3, 3 1, 3 1, 1 L R U M D 博弈方2 博 弈 方 1 3, 1 0, 2 3, 1 0, 2 3, 3 1, 3 1, 1 L R U M D 博弈方2 博 弈 方 1 3, 1 0, 2 3, 3 L R U M 博弈方2 博 弈 方 1 0, 2 3, 3 R U M 博弈方2 博 弈 方 1 3,3

(r,1-r):盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布 2.4.4 混合策略反应函数 猜硬币博弈 -1, 1 1, -1 正 面 反 面 猜硬币方 正面 反面 猜硬币博弈 盖 硬 币 方 r q 1 1/2 (r,1-r):盖硬币方选择正反面的混合策略概率分布 (q,1-q):猜硬币方选择正反面的混合策略概率分布

夫妻之争博弈 (r,1-r):妻子的混合策略概率分布 (q,1-q):丈夫的混合策略概率分布 r 1 3/4 2, 1 0, 0 1, 3 时装 足球 丈夫 妻 子 夫妻之争 1 3/4 两个纯策略纳什均衡和一个混合策略纳什均衡 q 1/3 1

2.5 纳什均衡的存在性 纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。 “每个有限博弈都至少有一个混合策略纳什均衡” 主要根据是布鲁威尔(Brouwer)和角谷(Kakutani)的不动点定理。 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。

布鲁威尔不动点定理 如果 是定义域和值域都是闭区间 的连续函数,则在 至少存在一点 ,满足 。我们称 为 函数 的一个不动点。

角谷的不动点定理,实际上就是关于一维空间上映射(也就是一元函数)的布鲁威尔不动点定理,在n维空间映射上的推广,其意义是在n维空间的有界闭凸集上的连续映射,至少存在一个不动点,即影像与原像是同一点。

2.6 纳什均衡的选择和分析方法扩展 2.6.1 多重纳什均衡博弈的分析 2.6.2 共谋和防共谋均衡

2.6.1 多重纳什均衡博弈的分析 一个博弈中存在的纳什均衡不止一个时,就是一个多重纳什均衡的博弈问题; 对大多数多重纳什均衡博弈来说,引进混合策略并没有解决问题,因为混合策略本身并不比纯策略更好,而且对确定哪个纯策略更好也没有作用。 帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡

一、帕累托上策均衡 有些博弈中存在多个纳什均衡,但可能这些纳什均衡有明显的优劣差异,所有博弈方都偏好其中同一个纳什均衡。 (鹰鸽博弈) 这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。 -5, -5 -10, 8 8, -10 10, 10 战争 和平 国家2 国 家 1 战争与和平 -5,-5 10,10

二、风险上策均衡 考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。 9, 9 8, 0 0, 8 7, 7 L R 博弈方2 U D 博 弈 方 1 风险上策均衡(D,R) 书是1753年卢梭应法国第戎科学院的征文而写的论文。文中提出了私有制的出现是人类不平等的起源这一光辉思想。在性质上,这是一部阐发政治思想的著作,其重要性仅次于1762年卢梭的《社会契约论》;而在思想体系上,本书可视为《社会契约论》的基础和绪论。恩格斯对此书评价很高,认为它是十八世纪中辩证法的杰作。    让·雅各·卢梭(Jean-Jacques Rousseau,1712—1778)是法国杰出的启蒙思想家、资产阶级民主主义者。是18世纪法国资产阶级民主主义者,他比他同时代的、代表资产阶级利益的百科全书派人物,更富有激进性。恩格斯曾在《反杜林论》中指出卢梭此书和狄德罗的《拉摩的侄儿》同是18世纪中辩证法的杰作。当卢梭同时代的一些哲学家把人类的进步设想为一个不断上升的过程时,卢梭却已经发现人类历史发展本身所具有的两面性(进步与落后)和所包含的内在矛盾。他认为贫困和奴役:,亦即人与人之间的不平等的产生是随着私有制而来的,是建立在私有制确立的唯一基础上的。人在未开化的自然状态中,本来是平等的;可是当人们力求生活完善化,争取科学技术和文化发展时,人类则既在进步,又在退步,因为文明向前进一步,不平等也就向前进一步。到了专制暴君统治之下,不平等就发展到极端,到达顶点;这个顶点同时就将成为转向新的平等的起因和基础。这种新的平等,按照卢梭的看法,是更高级的、基于社会公约的平等。这些思想是可贵的。但卢梭的这些可贵的民主思想和辩证思想始终是与他的唯心主义观点和形而上学的思想方法结合在一起的。本书的写作,就是他隐避森林深处沉思默想之所得。   本书1755年出版后,很快就有了两种德文译本。1756年和1761年又有了两种英文译本。1770年有了俄文译本。在我国,直到解放以后才有了两种译本。一是1957年吴绪译,三联书店出版,自1959年改由本馆出版的本子。这个本子是根据1915年英国剑桥大学出版的《卢梭政治著作集》译出。另一是1958年李常山译,东林校,法律出版社出版的本子,译名为《论人类不平等的起源和基础》。这个本子是根据法国巴黎社会出版社1954年出版的勒赛克尔评注的版本译出,其中除了评注以外,还收有勒赛克尔所撰《让-雅克·卢梭》一文,对卢梭的生平、著作和思想有较详细的介绍。 (D,R)在帕累托效率意义上不如(U,L),但在风险较小的意义上却优于(U,L)

Stag hunt 18世纪法国伟大的启蒙思想家卢梭(Rousseau)的著作《论人类不平等的起源和基础》 请举一个类似于猎鹿博弈的例子。 5, 5 3, 0 0, 3 3, 3 鹿 兔子 猎人2 猎 人 1 猎鹿(stag-hunting)博弈 风险上策均衡(兔子,兔子) 这项研究发现了一个令人担忧的结果:人们很难从低信任度局面(即每位猎人各自追赶自己的兔子)转移至高信任度局面(即两人合力猎杀鹿)。任何向高信任度均衡的转变都需要自身的合作尝试(代价可能会很高)。 人类社会充满了猎鹿博弈,但富裕程度更高的社会已经开始非常善于促成合作局面! 制度极大地扩展了我们与近邻之外的人进行互动的能力。 18世纪法国伟大的启蒙思想家卢梭(Rousseau)的著作《论人类不平等的起源和基础》 请举一个类似于猎鹿博弈的例子。

三、聚点均衡(Focal point equilibrium) 在多重纳什均衡的博弈中,双方同时选择一个聚点构成的纳什均衡称为“聚点均衡”。 利用博弈设定以外的信息和依据选择的均衡 文化、习惯或者其他各种特征都可能是聚点均衡的依据 城市博弈( (cities game)城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子

四、相关均衡(Correlated equilibrium) 人们在现实中遇到选择困难时,特别是在长期中反复遇到相似的选择难题时,常会收集更多信息,形成特定的机制和规则,也就是某种形式的制度安排等主动寻找出路。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 U D 博 弈 方 1 相关均衡例子 三个纳什均衡: (U,L)、(D,R) 和混合策略均衡[(1/2,1/2),(1/2,1/2)] 结果都不理想,不如(D,L)。 可利用聚点均衡(天气,抛硬币),但仍不理想。

四、相关均衡(Correlated equilibrium) 相关装置: 1、各1/3概率A、B、C 2、博弈方1看到是否A,博弈方2看到是否C 3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。 5, 1 4, 4 0, 0 1, 5 L R 博弈方2 U D 博 弈 方 1 相关均衡例子 相关均衡 双方根据上述相关装置选择策略构成的纳什均衡为“相关均衡” 要点: 1、构成纳什均衡;2、有人忽略不造成问题

2.6.2 共谋和防共谋均衡(Coalition-proof equilibrium) 一、多人博弈中的共谋问题 本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B) 前者帕累托优于后者。博弈的结果会是什么呢? (U,L,A)有共谋 (Coalition)问题:博弈方1和2同时偏离。 -2,-2,0 -5,-5,0 -1,-1,5 L R U D 博弈方2 博 弈 方 1 博弈方3——B 0,0,10 -5,-5,0 1,1,-5 L R U D 博弈方2 博 弈 方 1 博弈方3——A

二、防共谋均衡 如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为“防共谋均衡”。 前面例子中:(D,R,B) 是防共谋均衡 (U,L,A)不是防共谋均衡

第二章结束! 谢谢!