第二节 纳什均衡 §2.1 纳什均衡的概念 §2.2 纳什均衡的求解 §2.3 混合策略和混合纳什均衡 精品课程《运筹学》

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
一、会求多元复合函数一阶偏导数 多元复合函数的求导公式 学习要求: 二、了解全微分形式的不变性.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
3.4 空间直线的方程.
第三章 函数逼近 — 最佳平方逼近.
第十章 博弈论初步.
期末考试 考试时间:2016年6月21日周二下午2点至3点半 考试地点:3511 考试范围:期中考试之后的内容。
《高等数学》(理学) 常数项级数的概念 袁安锋
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
余角、补角.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第六章 寡头市场与博弈 第一节 寡头市场的特征与优缺点 第二节 寡头市场的基本模型 第三节 博弈论的基本概念.
探索三角形相似的条件(2).
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
扩展型博弈和策略型博弈.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
本节内容 平行线的性质 4.3.
28.1 锐角三角函数(2) ——余弦、正切.
2.1.2 空间中直线与直线 之间的位置关系.
第一章 函数与极限.
数列.
6.4不等式的解法举例(1) 2019年4月17日星期三.
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§8.3 不变因子 一、行列式因子 二、不变因子.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第四章 第四节 函数图形的描绘 一、渐近线 二、图形描绘的步骤 三 、作图举例.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
1.2 子集、补集、全集习题课.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
2.2矩阵的代数运算.
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
轴对称在几何证明及计算中的应用(1) ———角平分线中的轴对称.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
高中数学必修 平面向量的基本定理.
§2 方阵的特征值与特征向量.
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
三角 三角 三角 函数 余弦函数的图象和性质.
位似.
§4.5 最大公因式的矩阵求法( Ⅱ ).
第十章 管理系统博弈 II 管理系统工程精要 (Management Systems Engineering)
5.1 相交线 (5.1.2 垂线).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

第二节 纳什均衡 §2.1 纳什均衡的概念 §2.2 纳什均衡的求解 §2.3 混合策略和混合纳什均衡 精品课程《运筹学》

第二节 纳什均衡 纳什均衡是对策 论中一个重要的概念。尤其在非合作对策分析中具有十分关键的作用。通过对经典对策模型的分析知道:对于对策中的每一个局中人,真正成功的措施应该是针对其他局中人所采取的每次行动,相应地采取有利于自己的策略。于是,每一个局中人应采取的策略必定是他对其他局中人策略的预测的最佳反应。Nash均衡正是体现这一基本原则。 精品课程《运筹学》

第二节 纳什均衡 §2.1 纳什均衡的概念 用 表示一个对策,若一个对策中有 个局中人,每个局中人可选策略的集合分别用 用 表示一个对策,若一个对策中有 个局中人,每个局中人可选策略的集合分别用 表示; 表示局中人 的第 个策略,其中 可取有限个值、也可取无限个值;对策方 的得益用 表示; 是各对策方策略的多元函数, 个局中人的对策 常写成 = 精品课程《运筹学》

第二节 纳什均衡 定义8.2.1 在对策 = 中,如果有由各个对策方的各选取一个策略组成的某个策略组合 中,任一对策方 的策略为 ,都是对其余策略方策略的组合 的最佳策略,即 对任意 都成立则称 为一个纯策略纳什均衡。 精品课程《运筹学》

第二节 纳什均衡 例8.2.1 “囚徒的困境” 警察抓住了两个罪犯,但是警察局缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判8年徒刑;如果两人都坦白认罪,则他们将被各判5年监禁。 精品课程《运筹学》

第二节 纳什均衡 局中人为两个囚徒,两个人都有两种策略(坦白、不坦白),两人的策略集共有四个 元素。我们用-1、-5、-8分别表示被判刑的得益,用0表示被释放的得益,则可由下面的得益矩阵将此对策予以表示:表8.2.1 策略 坦白 不坦白 (-5,-5) (0,-8) (-8,0) (-1,-1) 囚 徒 1 2 精品课程《运筹学》

第二节 纳什均衡 对囚徒l来说,囚徒2有坦白和不坦白两种选择,假设囚徒2选择的不坦白,则对囚徒l来说,不坦白得益为一l,坦白得益为O,应该选择坦白;假设囚徒2选择的是坦白,则囚徒1不坦白得益为一8,坦白得益为一5,他更应该选择坦白。囚徒2唯一的选择也是坦白。 例8.2.2 设某村庄有3个农户,该村有一片大家都可自由牧羊的公共草地。由于这片草地的面积有限,草的数量只能让数量有限的羊吃饱,如果在此草地上放牧的羊的实际数量超 精品课程《运筹学》

第二节 纳什均衡 过这个限度,每只羊都无法吃饱,从而羊的产出就会减少,甚至只能勉强存活或要饿死。假设这些农户只有夏天才到公共草地放羊,而每年春天决定养羊的数量,各农户在决定自己养羊的数量时是不知道其他农户的养羊数量的,各农户养羊数的决策是同时作出的。假设下面信息知道的:每只羊的产出(价格)是羊只总数的减函数, , , 为第 个农户饲养羊的数量,每只羊的饲养成本为8元。 精品课程《运筹学》

第二节 纳什均衡 第一个农户是这样决策的: 自己养羊的得益为 = - 8 = -8 自己养羊的得益为 = - 8 = -8 为方便起见,设羊数量是可分的。不管其他农户数量如何,第一人总希望自己收益最大。 由此得出: 每个农户都得出与此相同的结论 : 精品课程《运筹学》

第二节 纳什均衡 三条曲线的交点( )就是纳什均衡。联立解之: (只) 三条曲线的交点( )就是纳什均衡。联立解之: (只) 此为三农户同时独立决定数量时所获得的稳定结果。任何单方面的擅自改变会使自己受损。各自得益为784,三农户总收益为2352。 从总体利益的角度来考察公共草地上羊的最佳数量。设羊的总数为 ,则总得益为: = =112 - 精品课程《运筹学》

第二节 纳什均衡 =3136。这说明纳什均衡常是低效的。 §2.2 纳什均衡的求解 由 ,解之得 =56(只),总收益 =3136。这说明纳什均衡常是低效的。 §2.2 纳什均衡的求解 1.箭头法:纳什均衡是最优的,任何单方面的改变都将使改变者自己受损。这是箭头法的基础。箭头法对每个策略组合判断,看各博弈方能否通过改变自己的策略而改善其得益,如能,则从所考察的策略组合引一箭头到改变后的策略组合。对每个可能的策略组合进行判断 精品课程《运筹学》

第二节 纳什均衡 求得最优解。 如在囚徒的困境博弈中有,可从任一策略组合开始考察。先看策略组合(不坦白,不坦白),在该策略组合时,囚徒l和囚徒2都会发觉,如果自己单独改变策略就能增加自己的得益(从一1到O),因此囚徒1原来的(不坦白,不坦白)变为(坦白,不坦白),囚徒2也有同样 的结论。 精品课程《运筹学》

第二节 纳什均衡 (图8.2.1) 2.严格下策反复消去法 不管其他人策略如何变化,自己某一策略带 精品课程《运筹学》 (-5,-5) (0,-8) (-8,0) (-1,-1) 不坦白 坦白 囚徒2 囚徒1 (图8.2.1) 2.严格下策反复消去法 不管其他人策略如何变化,自己某一策略带 精品课程《运筹学》

第二节 纳什均衡 来的收益总被其他某些策略带来的收益要小,称这某一策略为相对于其他某些策略的严格下策策略。决策者是不可能选择任何严格下策的。如果发现某策略是相对于其他某些策略的严格下策,就可以将它从对策方的策略空间中去掉,这样就只需要在剩下的较小的策略空间中进行分析了。 例8.2.3这是一个抽象对策问题: 精品课程《运筹学》

第二节 纳什均衡 参 左 中 右 与 上 人 下 1 图8.2.2 参 参与人2 与 左 中 人 上 1 下 图8.2.3 (1,0) 参 左 中 右 与 上 人 下 1 图8.2.2 参 参与人2 与 左 中 人 上 1 下 图8.2.3 (1,0) (1,2) (0,1) (0,3) (2,0) (1,0) (1,2) (0, 3) (0,1) 精品课程《运筹学》

第二节 纳什均衡 参与人2 左 中 1 上 图8.2.4 对参与人2,左又成为严格劣战略,仅剩的(上,中)就是此博弈的结果 。通过上面的讨论可以看出,严格下策反复消去法与纳什均衡之间有密切的关系。下面的两个定理就是表明这种关系的 。 (1,0) (1,2) 精品课程《运筹学》

第二节 纳什均衡 定 理8.2.1 在个博弈方的博弈在对策 = 中,如果严格下策反复消去法排除了 以外的所有策略组合,则一定 定 理8.2.1 在个博弈方的博弈在对策 = 中,如果严格下策反复消去法排除了 以外的所有策略组合,则一定 是G的唯一的纳什均衡。 定理8.2.2 在个博弈方的博弈 = 中,如果 是G的一个纳什均衡,则严格下策反复消去法一定不会将它消去。 3.反应函数法 (适应于变量为产量等这样连续变化的情况) 精品课程《运筹学》

第二节 纳什均衡 例8.2.4(古诺的两寡头模型)设市场有1、2两家厂商,他们生产相同的产品。设厂商1的产量为 ,厂商2的产量为 ,则市场总产量为 。 为市场的出清价格 (可以将产品全部卖出去的价格), =100- 。再假设两厂商的生产无固定成本,两厂家边际生产成本相等, ,两厂家同时决定各自产量,使利润最大。 设第个厂商的利润为 = 精品课程《运筹学》

第二节 纳什均衡 反应函数的概念:对厂商1来说,给定厂商2的任意产量 ,厂商1的最佳反应为 反应函数的概念:对厂商1来说,给定厂商2的任意产量 ,厂商1的最佳反应为 即厂商1的最佳产量为厂商2的产量的连续函数,称此函数为厂商1对厂商2的产量的反应函数记为 。同理,厂商2对厂商1的产量的反应函数记为 。 用反应函数表示两厂商之间的产量关系为 精品课程《运筹学》

第二节 纳什均衡 与 在双方反应函数 对应直线交点上,才是双方都满意的最佳反应组合,此时, 。 图8.2.5 精品课程《运筹学》 在双方反应函数 对应直线交点上,才是双方都满意的最佳反应组合,此时, 。 (0,49) 图8.2.5 精品课程《运筹学》

第二节 纳什均衡 将上面模型略作修改,即为斯塔克博格模型。两个厂商中,一方较强,一方较弱。强的一方领先行动,而较弱的一方则跟在较强的一方之后行动 。设厂商1是领头厂商先行选择,厂商2追随其后,其他条件不变。 厂商1的产量 为已经确定,厂商2为使利润最大,应选择 ,厂商1知道厂商2的决策思路 = 求其最大得: 精品课程《运筹学》

第二节 纳什均衡 当然并非所有的对策都有纳什均衡,如石头、剪子、布就没有均衡。 §2.3 混合策略和混合纳什均衡 与古诺模型相比,此时总产量 > ,此时价格更低,利润更少。这说明垄断的效果不如自由竞争。 当然并非所有的对策都有纳什均衡,如石头、剪子、布就没有均衡。 §2.3 混合策略和混合纳什均衡 定义8.2.2 在对策 = 中,局中人的策略集为 ,则他以概率分布 随机在其 个可选策略中选择的“策略”称为一个混合策略,其中 精品课程《运筹学》

第二节 纳什均衡 O≤ ≤1对 =1,…, 都成立,且 =1。 由定义可以看出,纯策略也可看作混合策略。定义8.2.3 如果一个策略 = 中,参与者 的策略集为 ,如果由各个对策方的策略组成策略集合 式中 都是对其余对策方策略组合的最佳策略,即 精品课程《运筹学》

第二节 纳什均衡 对任意 都成立,则称 为 的一个混合策略纳什均衡。 精品课程《运筹学》