第九章 博弈论-无处不在的游戏 第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学)

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
信息经济学 ( Information Economics) 主讲人:张成科 博士 广东工业大学经济管理学院
专题六 语文课程标准修订对“实验稿”作了哪些修改和调整
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
第三章 教育与人的发展.
博弈论 Game Theory 范如国 教授 武汉大学经济与管理学院.
惠阳区2012年青年干部培训班 博弈的实践应用与思考 中共惠阳区委党校教研室 肖达雪 2012年11月.
第三节 寡头垄断市场 oligopoly market
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第三章 完全且完美信息动态博弈 本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。
对外经济贸易大学金融学院副院长 中国人民大学商学院客座教授 邹亚生博士
第八章 垄断竞争与寡头垄断 垄断竞争厂商决策规则 寡头垄断市场
微观经济学 主讲教师:吴义凤.
第十章 博弈论初步.
博弈论初步 第1课时 乐清中学 施克满.
非合作博弈及其应用 郑臻一.
第9讲 策略思考的数学模型 —博弈论模型.
《高等数学》(理学) 常数项级数的概念 袁安锋
浅谈博弈论 (game theory) 国际经济与贸易 姚恒元.
西方经济学简明教程 第八章 博弈论和信息经济学.
会计学专业基础课堂之 基础会计(初级会计) 安徽财经大学会计学院.
第三章 决策 管理就是决策 ——赫伯特·西蒙.
第四讲 纳什均衡 上海财经大学 经济学院 1.
第三篇 组织工作.
第三部分 博弈论 §3.1实验二:双方信任博弈 例如:一厂商支付给一名工人高于均衡水平的工资,并且期望这名工人能够回报以相应的更多的劳动。主动方厂商出于对被动方的信任,率先背离了标准的不合作博弈论所阐述的最优选择,若工人也提供了回报,则双方得到一个合作的结果。在现实中,这样的例子很多,比如酒店会给熟客赊账,而客人也不会赖账,我们将这一类建立在信任基础上的合作波已称为双方信任博弈。
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第六章 寡头市场与博弈 第一节 寡头市场的特征与优缺点 第二节 寡头市场的基本模型 第三节 博弈论的基本概念.
C++中的声音处理 在传统Turbo C环境中,如果想用C语言控制电脑发声,可以用Sound函数。在VC6.6环境中如果想控制电脑发声则采用Beep函数。原型为: Beep(频率,持续时间) , 单位毫秒 暂停程序执行使用Sleep函数 Sleep(持续时间), 单位毫秒 引用这两个函数时,必须包含头文件
在PHP和MYSQL中实现完美的中文显示
③如何进行行为安全观察.
第一节 旅游规划的意义和种类 第二节 旅游规划的内容 第三节 旅游规划的编制 第四节 旅游景区规划
Dynamic Games of Complete Information
Harvard ManageMentor®
       博弈论 Game Theory Game Theory--Chapter 1.
第七章 不完全竞争市场理论 第一节 垄断市场 第二节 垄断竞争市场 第三节 寡头垄断市场.
Bayesian Nash Equilibrium
Online job scheduling in Distributed Machine Learning Clusters
一、寡头(Oligopoly)市场概述 1、含义:寡头市场又称为寡头垄断市场。它是指少数几家厂商控制绝大部分市场乃至整个市场的产品的生产和销售的这样一种市场组织。 2、成因: (1)某些产品的生产必须在相当大的生产规模上进行才能达到最好的经济效益; (2)行业中几家企业对生产所需的基本生产资源的供给的控制;
博弈与社会 第一至七章 期中考前习题课 TA: 雍家胜 北京大学光华管理学院
使用矩阵表示 最小生成树算法.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
第一章 函数与极限.
顺序表的删除.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
Harvard ManageMentor®
WPT MRC. WPT MRC 由题目引出的几个问题 1.做MRC-WPT的多了,与其他文章的区别是什么? 2.Charging Control的手段是什么? 3.Power Reigon是什么东西?
1.2 有理数 第1课时 有理数 伏家营中学 付宝华.
6 市场理论 6.1 市场类型 6.2 完全竞争市场 6.3 垄断市场 6.4 垄断竞争市场 6.5 寡头市场 安徽工业经济职业技术学院
第六章 寡头市场与博弈 第一节 寡头市场的特征与优缺点 第二节 寡头市场的基本模型 第三节 博弈论概述 第四节 不同市场之间经济效率的比较
Harvard ManageMentor®
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
对策论(一) 刘志新
1.非线性规划模型 2.非线性规划的Matlab形式
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
2019/5/20 第三节 高阶导数 1.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第二章 完全信息静态信息博弈-纳什均衡 一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
基于列存储的RDF数据管理 朱敏
第5课 美妙的万花筒世界 ——如何实现LOGO重复命令的嵌套.
第四章 UNIX文件系统.
使用Fragment 本讲大纲: 1、创建Fragment 2、在Activity中添加Fragment
§4.5 最大公因式的矩阵求法( Ⅱ ).
最小生成树 最优二叉树.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

第九章 博弈论-无处不在的游戏 第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学) 第九章 博弈论-无处不在的游戏 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”。 —保罗·萨缪尔森 第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学)

第一节 博弈论的基本概念与分类 一、博弈论的基本概念 1、定义:博弈论(game theory),又称对策论,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。

续上页 通俗地讲,博弈论是一种“游戏理论”。其准确的定义是:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

附:纳什其人 2、博弈论的演进 (1)早期博弈论的萌芽(田忌赛马) (2)合作型博弈(冯·诺依曼与摩根斯特恩于1944年合著《博弈论和经济行为》); (3)非合作博弈(纳什均衡); (4)20世纪50年代以后,泽尔腾、海萨尼等人对博弈论作了进一步的完善,使之更为实用。

3、博弈论模型简介——博弈论模型可以用五个方面来描述 G={P,A,S,I,U} P(player): 为局中人,博弈的参与者,也称为“博弈方”,局中人以最终实现自身利益最大化为目标。 A(action) :为各局中人的所有可能的策略或行动的集合。根据该集合是有限还是无限,可分为有限博弈和无限博弈。 S(strategies) :博弈的进程,也是博弈进行的次序。静态博弈与动态博弈。

I(information) :博弈信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈。反之为不完全信息博弈。 U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。

二、博弈的分类 1、按照参与人之间是否合作进行分类,博弈可分为合作博弈和非合作博弈。 合作博弈是指参与人之间有着一个对各方具有约束力的协议,参与人在协议范围内进行的博弈。反之,就是非合作博弈。 前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性。

2、在非合作博弈中,按照参与人的先后顺序进行分类,又可分为静态博弈和动态博弈。 静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。

第一节 博弈论的基本概念与分类 3、按照参与人对其他参与人的了解程度进行分类,博弈可分为完全信息博弈和不完全信息博弈。 完全信息博弈是指:在每个参与人对所有其他参与人的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。 如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下进行的博弈就是不完全博弈。

第一节 博弈论的基本概念与分类 博弈的分类及对应的均衡概念 行动顺序 动 态 静 态 信 息 完全信息动态博弈 完全信息静态博弈 完全信息 动 态 静 态 信 息 完全信息动态博弈 完全信息静态博弈 完全信息 子博弈精炼纳什均衡 纳什均衡 不完全信息静态博弈 不完全信息动态博弈 不完全信息 贝叶斯纳什均衡 精炼贝叶斯纳什均衡

第二节 完全信息博弈 一、完全信息静态博弈 二、完全信息动态博弈

一、完全信息静态博弈:纳什博弈论的原理与应用 1、占优策略均衡——无论其他参与人如何选择自己的策略,该参与人的最优策略选择是惟一的。 (1)经典案例:囚徒困境 “囚犯困境”讲的是两个同案犯罪嫌疑犯(囚徒)被警方拘捕后,为防其相互间串供,而分别拘捕、隔离审问时,两疑犯所面临的认罪策略选择的问题。

囚徒B 坦白 抵赖 囚徒A -8,-8 -1,-10 -10, -1 -2 ,-2 在博弈中,如果所有的参与人都有占优战略存在,因而博弈将在所有参与人的占优战略的基础上达到均衡。这种均衡称为占优战略均衡。在上表中的“A坦白,B也坦白”就是占优战略均衡 (2)条件:占优策略虽然要求每个参与人是理性的,但并不要求每个参与人知道其他参与人也是理性的。

其次可悟出一条真理:合作是有利的“利己策略”。 (3) “囚犯困境”的意义: 首先对亚当·斯密的“看不见的手”的原理提出挑战。—个人理性与集体理性的冲突。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。从“纳什均衡”引出一个悖论:从利己目的出发,结果损人不利己。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石 。 其次可悟出一条真理:合作是有利的“利己策略”。

(4)应用: 奥尔森的《集体行动的逻辑》——多人囚犯两难博弈 (n-person prisoner's dilemma games),成为非合作博弈论的一个重要分支。

第二节 完全信息博弈 2.重复剔除的占优策略均衡 (1)智猪博弈 按按钮对于吃食量的影响 按按钮的猪 吃到的猪食数量 大猪 小猪 4单位 7单位 1单位 两猪同时 5单位 3单位

第二节 完全信息博弈 智猪博弈 小猪 按按钮 等待 大猪 3, 1 2,4 7,-1 0,0

第二节 完全信息博弈 重复剔除的占优策略均衡——首先找出某参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下惟一的参与人策略组合为止。剩下的这个惟一的参与人组合,就是这个博弈的均衡解。 严格劣策略:是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。 (2)应用:集体行动出现的条件之一是集体成员的「不对称」。

第二节 完全信息博弈 3.纳什均衡 ——在这一均衡中,每个参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。纳什均衡是完全信息静态博弈解的一般情况。

第二节 完全信息博弈 性 别 战 女方 看足球 逛商场 男方 3,1 0,0 1,3

第二节 完全信息博弈 一、完全信息动态博弈: 1、子博弈精练纳什均衡 房地产开发博弈(静态) B 开发 不开发 A 开发 不开发 开发 不开发 A 开发 不开发 -3,-3 1,0 0, 1 0,0

第二节 完全信息博弈 在行动开始前的A看来,如果不计得失,B有四种战略可选择。 第一,无论A是否开发,B都要开发。

第二节 完全信息博弈 先行动者A对B预测结果的收益矩阵 B A -3,-3 -3, -3 1, 0 1,0 开发,开发 开发,不开发 不开发,开发 不开发,不开发 A 开 发 不开发 -3,-3 -3, -3 1, 0 1,0 0, 1 0, 0 0, 1 0,0

第二节 完全信息博弈 只有当某一战略组合在每一个子博弈上都构成一个纳什均衡,这一战略组合才是子博弈精练纳什均衡。

第二节 完全信息博弈 2、重复博弈 (1)定义:是指同样结构的博弈重复许多次,其中每次博弈称为阶段博弈。 (2)影响重复博弈均衡结果的主要因素:博弈重复的次数和信息的完备性。 (3)博弈重复次数为无限次与冷酷策略 博弈重复次数为有限次时每个阶段博弈的均衡解都是一次性博弈的纳什均衡解。

第二节 完全信息博弈 3、 动态博弈战略行动 在动态博弈中,参与人为了使得其他参与人的选择对自己有利,往往采取一些行动来影响其他参与人对于自己行为的预期。这些行为称为战略行动。它主要包括: (1)先行优势 (2)确信威胁(承诺行动) 它是指博弈的参与人通过某种行动改变自己的支付函数,从而使自己的威胁显得可信。参与人为改变博弈结果而采取的措施称为承诺。