第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
校第六届“新天瑞”杯创业计划大奖赛 赛前培训
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
第九章 博弈论-无处不在的游戏 第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学)
《高等数学》(理学) 常数项级数的概念 袁安锋
四种命题 2 垂直.
常用逻辑用语复习课 李娟.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
Dynamic Games of Complete Information
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
Harvard ManageMentor®
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
Online job scheduling in Distributed Machine Learning Clusters
博弈与社会 第一至七章 期中考前习题课 TA: 雍家胜 北京大学光华管理学院
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
解决变化问题的自底向上 流程建模方法 严志民 徐玮.
线段的有关计算.
线性规 Linear Programming
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
复习.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
信号量(Semaphore).
Harvard ManageMentor®
第三单元 第2课 实验 一元函数的积分 实验目的:掌握matlab求解有关不定积分和定积分的问题,深入理解定积分的概念和几何意义。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.2 子集、补集、全集习题课.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
1.非线性规划模型 2.非线性规划的Matlab形式
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
基于列存储的RDF数据管理 朱敏
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
金融支持精准扶贫 基于激励机制的一个设计 李鑫 刘乾坤 中国人民银行绵阳市中心支行.
第十七讲 密码执行(1).
《偏微分方程》第一章 绪论 第一章 绪论 1.1.
第十章、核銷系統操作之注意事項.
第十章 管理系统博弈 II 管理系统工程精要 (Management Systems Engineering)
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。

3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 本章分六节 3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论

3.1 动态博弈的表示法和特点 3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点

3.1.1 阶段和扩展性表示 阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈 A B 不制止 制止 (-2,5) (2,2) (10,4) (5,5) 不仿冒 (0,10) 仿冒

3.1.2 动态博弈的基本特点 策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一条路径 得益对应每条路径,而不是对应每步选择、行为 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优势”。

3.2 可信性和纳什均衡的问题 3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法

3.2.1 相机选择和策略中的可信性问题 不同版本的开金矿博弈——分钱和打官司的可信性 乙 甲 (0,4) (2,2) (1,0) 不借 借 不分 开金矿博弈 不借 乙 甲 借 不分 分 (1,0) 不打 打 (0,4) (2,2) 有法律保障的开金矿博弈 ——分钱打官司都可信 乙 甲 打 (2,2) 不分 分 不借 借 (0,4) (-1,0) 不打 (1,0) 法律保障不足的开金矿博弈 ——分钱打官司都不可信

3.2.2 纳什均衡的问题 第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。 结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。 根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题

3.2.3 逆推归纳法 定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。 逆推归纳法是动态博弈分析最重要、基本的方法。 乙 不借 借 甲 不分 分 (0,4) (2,2) (1,0)

3.3 子博弈和子博弈完美纳什均衡 3.3.1 子博弈 3.3.2 子博弈完美纳什均衡

3.3.1 子博弈 定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。 乙 甲 不借 借 不分 分 (1,0) (0,4) (2,2) (-1,0)

3.3.2 子博弈完美纳什均衡 定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。

3.4 几个经典动态博弈模型 3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论

3.4.1 寡占的斯塔克博格模型 6 q - = 先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。 先行优势 产量 得益 厂商1 3单位 4.5 厂商2 1.5单位 2.25

3.4.2 劳资博弈 先由工会决定工资率,再由厂商决定雇用多少劳动力 W 斜率为W R R(L) W L L L 工会的误差异曲线 W L 厂商的反应函数 R(L) 斜率为W L W 工会的误差异曲线

3.4.3 讨价还价博弈 三回合讨价还价 1 2 不接受,出S 接受 不接受,出S2 出S1

三回合讨价还价博弈结果的讨论

无限回合讨价还价

3.4.4 委托人—代理人理论 一、委托人——代理人关系 经济活动和社会活动中有很多委托人——代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。 委托人——代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性 委托人——代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等

二、无不确定性的委托人—代理人模型 代理人的选择 激励相容约束: w(E)-E> w(S)-S w(E)> w(S)+E-S 1 2 偷懒 努力 拒绝 接受 不委托 委托 代理人的选择 激励相容约束: w(E)-E> w(S)-S w(E)> w(S)+E-S [R(0),0] [R(0),0] [R(E)-w(E), w(E)-E] [R(S)-w(S), w(S)-S]

参与约束: 接受:w(E)-E>0 接受:w(S)-S>0 2 参与约束 [R(E)-w(E), w(E)-E] 拒绝 接受 [R(S)-w(S), w(S)-S] 接受:w(E)-E>0 接受:w(S)-S>0 参与约束

委托人的选择 1 不委托 委托 [R(S)-w(S), w(S)-S] [R(0),0] [R(E)-w(E), w(E)-E] 委托: R(E)-w(E) > R(0) 不委托: R(E)-w(E) < R(0) 委托: R(S)-w(S) > R(0) 不委托: R(S)-w(S) < R(0)

数值例子 1 E=2, S=1, W(E)=4, w(S)=2 2 接受 偷懒 努力 拒绝 不委托 委托 [0,0] [0,0] [7,1] [12, 2]

三、有不确定性但可监督的 委托人—代理人博弈 三、有不确定性但可监督的 委托人—代理人博弈 因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。 1 2 [0,0] [10-w(S), w(S)-S] [20-w(S), w(S)-S] [10-w(E), w(E)-E] [20-w(E), w(E)-E] 不委托 高产 (0.1) 低产 (0.9) 努力 偷懒 接受 拒绝 委托 努力 委托: 0.9*[20-w(E)]+0.1*[10-w(E)]>0 不委托: 0.9*[20-w(E)]+0.1*[10-w(E)]<0 偷懒: 委托: 0.1*[20-w(S)] +0.9*[10-w(S)]>0 不委托: 0.1*[20-w(S)] +0.9*[10-w(S)]<0

四、有不确定性且不可监督的 委托人—代理人博弈 四、有不确定性且不可监督的 委托人—代理人博弈 只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。 1 2 [0,0] [10-w(S), w(10)-S] [20-w(20), w(20)-S] [10-w(10), w(10)-E] [20-w(20), w(20)-E] 不委托 高产 (0.1) 低产 (0.9) 努力 偷懒 接受 拒绝 委托

促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件 努力: 0.9*[w(20)-E]+0.1*[w(10)-E] >0.1*[w(20)-S]+0.9*[w(10-S)] 参与约束 接受: 0.9*[w(20)-E]+0.1*[w(10)-E]>0 委托: 0.9*[20-w(20)]+0.1*[10-w(10)]>0 对于委托人来说,就是要根据上述两个条件,以及 E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20) -w(10)

五、选择报酬和连续努力水平的 委托人—代理人博弈 五、选择报酬和连续努力水平的 委托人—代理人博弈 R, C C(e) + R(e) 委托人希望的代理人努力水平 (满足参与约束)

店主和店员的问题 商店的利润 , 是均值为0的随机变量 店员的负效用 , 是店员的努力 机会成本为1 店主采用的报酬计算公式 店员的得益 店员期望得益为 店主的得益为

参与约束: 当店员风险中性时 符合其最大利益 店主选择下限 代入得益公式得: ,期望得益为 ,易求得 令 得 ,再代入参与约束得 , 求数学期望得 解得 , 则店主的最优激励工资计算公式是

3.5 有同时选择的动态博弈模型 3.5.1 标准模型 3.5.2 间接融资和挤兑风险 3.5.3 国际竞争和最优关税 3.5.4 工资奖金制度

3.5.1 标准模型 博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4 第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合 和 中分别选择 和 第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择 和 以后,同时在各自的可选策略(行为)集合 和 中分别选择 和 各博弈方的得益都取决于所有博弈方的策略 即博弈方i的得益是各个博弈方所选择策略的多元函数

3.5.2 间接融资和挤兑风险 1, 1 不 存 存 款 客户2 不存 存款 客 户 1 第一阶段 0.8,0.8 0.6,1 1,0.6 1.2,1.2 提 前 到 期 客户2 提前 到期 客 户 1 第二阶段 第二阶段 下一阶段 1.2,1.2 (到期,到期) (存款,存款) 建立信贷保证、保险制度, 对存款进行保护、保险的原因 (提前,提前) (不存,不存)

非法集资问题 现代更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金,信用差、管理差而且缺乏保险措施,引起金融风险并引发社会问题的可能性要大得多。

3.5.3 国际竞争和最优关税 厂商的得益函数为: 第二阶段厂商选择:

第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化: 政府的得益函数; 第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:

3.5.4 工资奖金制度 模型假设: 1.雇员i(i=1,2)的产出函数为 , 为雇员努力水平, 为随机扰动。 服从分布密度 ,均值为0的随机变量。 雇员努力的负效用函数为 ,且 。 2.产量高的雇员得到高工资 ,产量低的得到低工资 。 3.两雇员在已知雇主宣布的工资奖金制度下,同时独立选择各自的努力程度。

雇员选择 雇主决定了工资以后,雇员同时决定努力程度: 一阶条件 这是雇员所选择努力程度必须满足的基本条件。

利用条件概率的贝叶斯法则: 代入得: 两雇员情况一样,对努力程度的选择也相同,即: ,这样就得到: 这就是两雇员之间的静态博弈纳什均衡。 两雇员情况一样,对努力程度的选择也相同,即: ,这样就得到: 这就是两雇员之间的静态博弈纳什均衡。 若进一步假设 ,那么

雇主选择 由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都是0.5,假设雇能得到其他工作机会提供的得益是 ,则保证雇员接受工作的基本条件是: 此即“参与约束”。 由于在雇员接受工作的前提下,雇主必然尽可能压低工资,因此约束条件可取等号: 于是得到: 设上述参与约束条件满足,雇主的利润函数为

上述雇主决策可转化为促使雇员的努力程度满足: 雇主的期望利润为 ,因此雇主有如下的最优化问题: 上述雇主决策可转化为促使雇员的努力程度满足: 一阶条件为: 代入两雇员的最优努力水平决定公式得到:

3.6 动态博弈分析的问题和扩展讨论 3.6.1 逆推归纳法的问题 3.6.2 颤抖手均衡和顺推归纳法 3.6.3 蜈蚣博弈问题

3.6.1 逆推归纳法的问题 逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱实际的可能 逆推归纳法也不能分析比较复杂的动态博弈 在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难 对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”

3.6.2 颤抖手均衡和顺推归纳法 颤抖手均衡 1 2 L (0, 0) N T V R M (1, 2) (1, 1) S U (2, 1) 10, 0 10, 1 2, 0 6, 2 L R U D 博弈方2 博 弈 方 1 9, 0 (2, 3) (3, 3)

顺推归纳法 0,0 1,3 3,1 s w R D (2, 2) 2 1 Van Damme 博弈 3,1 0,0 2,2 1,3 Ds R Dw 博 弈 方 1 博弈方2 Van Damme 博弈策略形

3.6.3 蜈蚣博弈问题 该博弈是说明逆推归纳法和博弈分析困难的经典博弈 1 2 R (98,98) (97,100) d r (99,99) D (98,101) (100,100) (0,3) (2,2) (1,1)