非合作博弈及其应用 郑臻一.

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

因数与倍数 2 、 5 的倍数的特征
摆一摆,想一想. 棋子个数数的个数 摆出的数 、 10 2 、 11 、 20 3 、 12 、 21 、 30 4 、 13 、 22 、 31 、 40 5 、 14 、 23 、 32 、 41 、
质数和合数 2 的因数( ) 6 的因数( ) 10 的因数 ( ) 12 的因数 ( ) 14 的因数 ( ) 11 的因数 ( ) 4 的因数( ) 9 的因数( ) 8 的因数( ) 7 的因数( ) 1 、 2 、 3 、 4 、 6 、 12 1 、 11 1 、 2 、 5 、 10.

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
因数与倍数 2 、 5 的倍数的特征 绿色圃中小学教育网 扶余市蔡家沟镇中心小学 雷可心.
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
3.5 元 / 千克 2.6 元 / 千克 买 3 千克 要多少钱? = (元)
人教版五年级数学上册. 因数 因数 5555 积 75 结论:一个因数不变,另一个因数扩大 (或缩小) 10 倍、 100 倍、 1000 倍,积 也扩大(或缩小) 10 倍、 100 倍、 1000 倍。 仔细观察,看能得出什么结论?
第四单元 100 以内数的认识
做个百数表. 把表格填完整,仔细观察,你还有什么新发现 ?
第四单元 100 以内数的认识
重庆市九龙坡区走马小学 邓华. 一、复习导入,揭示课题 下面哪些数是 2 的倍数?哪些数是 5 的倍数? 2,5的倍数的特征:只看个位上数就能进行判断。 2的倍数:个位上是0,2,4,6,8的数。
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
大洋洲.
当代 国 际 关 系(案例6) 冷战时期美苏关系的演变.
惠阳区2012年青年干部培训班 博弈的实践应用与思考 中共惠阳区委党校教研室 肖达雪 2012年11月.
手太阳小肠经.
游泳四式技術分析暨初級教法.
证券投资技术分析.
在文章中插入图片 What to do? 任务一(1):请你在“愤怒的小鸟”这个文档中插入“红色小鸟”的图片。 要求:1、自学课本45-47页“做一做”的内容,找到在文档中插入图片的方法后,就动手试一试吧。 哪一小组最先完成,会加平时成绩10分噢,加油吧!
第九章 博弈论-无处不在的游戏 第一节 博弈论的基本概念与分类 第二节 完全信息博弈 第三节 不完全信息博弈(自学)
微观经济学 主讲教师:吴义凤.
第十章 博弈论初步.
博弈论初步 第1课时 乐清中学 施克满.
第二节 纳什均衡 §2.1 纳什均衡的概念 §2.2 纳什均衡的求解 §2.3 混合策略和混合纳什均衡 精品课程《运筹学》
战 后 国 际 关 系 专题五:冷战时期美苏关系的演变 政治学与行政管理系.
《高等数学》(理学) 常数项级数的概念 袁安锋
常用逻辑用语复习课 李娟.
西方经济学简明教程 第八章 博弈论和信息经济学.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
3.解:连续掷同一枚硬币4次的基本事件总数为 ,
手术部位感染目标性监测存在的问题及对策探讨
拓展 问题 探究 练习 北师大版 五年级上册 第五单元 分数的意义 绿色圃中小学教育网
Bayesian Nash Equilibrium
Windows网络操作系统管理 ——Windows Server 2008 R2.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
博弈与社会 第一至七章 期中考前习题课 TA: 雍家胜 北京大学光华管理学院
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
28.1 锐角三角函数(2) ——余弦、正切.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
计算.
顺序表的删除.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
Harvard ManageMentor®
⑴当∠MBN绕点B旋转到AE=CF时(如图1),比较AE+CF与EF的大小关系,并证明你的结论。
Game Theory 5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城,他们决定这分: 1. 抽签决定自己的号码(1,2,3,4,5) 2. 首先,由1号提出分配方案,然后大家5人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。 3. 如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。
复习.
用计算器开方.
淘气的猴子.
小数的大小比较 仙岩镇第二小学 陈曼丽.
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第4课时 绝对值.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
我们能够了解数学在现实生活中的用途非常广泛
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
一元一次方程的解法(-).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Sssss.
Presentation transcript:

非合作博弈及其应用 郑臻一

博弈(game) 什么是博弈? 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。

博弈的分类 博弈的三要素 参与人或者局中人(players); 他们可选择的行动(actions)或策略(strategies); 当事人能否公然串通、合谋:合作博弈和非合作博弈 完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈 博弈的三要素 参与人或者局中人(players); 他们可选择的行动(actions)或策略(strategies); 所有可能的对局的结果,支付(payoffs)

“看不见的手”的原理:在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。 亚当·斯密 《非合作博弈》 《n人中的博弈均衡点》 约翰·纳什

话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们3年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你1年的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判1年的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”

囚徒困境 个人利益的最大化不一定会导致团体利益的最大化

纳什均衡 在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。 如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。

多次囚徒困境博弈 双方均保持沉默,即会建立互信的关系,最终导致,二人同服刑半年。 如果假设,两个囚徒均欲利用此策略,并将局数推演为十次,那么就会出现如下的情况:在第一局到第九局的过程中双方均会保持沉默,以期望建立互信关系,并在第十局指控对方,这将最终导致,二人同服刑5年。 再一次假设,双方都明确对方会使用与自己同样的策略,即知道对方会在第十局中指控自己,这样,在第九局时两者间的信任关系的建立即是没有意义的,如此类推,第八局到第一局中信任关系的建立也是没有意义的,即是十局都会互相背叛,也就是纳什均衡。也可推论,在如此的情况下,只有在囚徒困境的局数在不肯定的情况下(即双方均不知道进行的局数),才会出现互相保持沉默以获得信任关系的现象。

现实中的囚徒困境 贸易壁垒 军备竞赛 价格大战 囚徒困境的解决之道 多次博弈; 设立规章制度,惩罚违规者; 思想教育(效果待定)。

设对手选择A的概率为p,则 自己选择A的支付的期望为y=5p 选择B的支付的期望为y=4-3p 选择C的支付的期望为y=2+2p

其他的非合作博弈问题 每位学生从1-100中选择一个数字。选择到最接近全班平均数的2/3的学生为胜利者。在所有学生都理性的情况下,他们会选择哪一个数字?

由于平均数不可能大于100,因而无人会选择大于66的数 在剔除了66以上的数后,所有人的平均数不可能会大于44 以此类推,所有人最后选择的数字都会是数字1 前提:所有人都是理性的

两个政治候选人,为了选举须确定自己的政治立场。共有10个立场: 1、2、3、4、5、6、7、8、9、10。 第个立场都有10%选票。两个候选人要在一系列的政治主张中选择一个,已知每个立场的选民会把自己的票投给与自己立场最接近的候选人,问如果你是其中一个候选人,且想要最大化地获得选票,应当选择哪一个立场

当2号候选人选择1号策略S1时 U1(1、1)[表示2号候选人选择S1,1号候选人选择S1]为50% < U1(2、1)[表示2号候选人选择S1,1号候选人选择S1]为90% 当2号候选人选择2号策略S2时 U1(1,2)=10% < U1(2,2)=50% 当2号候选人选择3号策略S3时 U1(1,3)=15% < U1(2,3)=20% 当2号候选人选择4号策略S4时 U1(1,4)=20% < U1(2,4)=25%

剔除劣势策略S1,S10 U1(2,2)=50% < U1(3,2)=80% 当2号候选人选择3号策略S3时

5个海盗抢到了100颗宝石,每一颗都一样的大小和价值连城。 他们决定这么分: 1、抽签决定自己的号码(1,2,3,4,5)  2、首先,由1号提出分配方案,然后大家5人进行表决,当且仅当半数和超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。  3、如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当半数和超过半数的人同意时,按照他的提案进行分配,否则将被扔入大海喂鲨鱼。  4。以次类推...... 条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择。 问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化