策略型博弈 案例:艺术品拍卖的策略型 占优策略解 案例研究续:拍卖中的占优策略

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

1 、谁能说说什么是因数? 在整数范围内( 0 除外),如果甲数 能被乙数整除,我们就说甲数是乙数的 倍数,乙数是甲数的因数。 如: 12÷4=3 4 就是 12 的因数 2 、回顾一下,我们认识的自然数可以分 成几类? 3 、其实自然数还有一种新的分类方法, 你知道吗?这就是我们今天这节课的学.
因数与倍数 2 、 5 的倍数的特征
质数和合数 2 的因数( ) 6 的因数( ) 10 的因数 ( ) 12 的因数 ( ) 14 的因数 ( ) 11 的因数 ( ) 4 的因数( ) 9 的因数( ) 8 的因数( ) 7 的因数( ) 1 、 2 、 3 、 4 、 6 、 12 1 、 11 1 、 2 、 5 、 10.

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
重庆市九龙坡区走马小学 邓华. 一、复习导入,揭示课题 下面哪些数是 2 的倍数?哪些数是 5 的倍数? 2,5的倍数的特征:只看个位上数就能进行判断。 2的倍数:个位上是0,2,4,6,8的数。
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
北师大版四年级数学下册 天平游戏(二).
3.4 空间直线的方程.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
22.3实际问题与一元二次方程 探究1:有一人患了流感,经过两轮传染后共有121人患了流感,每轮传染中平均一个人传染了几个人? 吉水三中王鹏.
2.2.1 等比数列的概念和通项公式.
《高等数学》(理学) 常数项级数的概念 袁安锋
常用逻辑用语复习课 李娟.
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
余角、补角.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
探索三角形相似的条件(2).
3.解:连续掷同一枚硬币4次的基本事件总数为 ,
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
扩展型博弈和策略型博弈.
元素替换法 ——行列式按行(列)展开(推论)
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
Harvard ManageMentor®
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
28.1 锐角三角函数(2) ——余弦、正切.
1.2子集、全集、补集(二) 楚水实验学校高一数学备课组.
宁波市高校慕课联盟课程 与 进行交互 Linux 系统管理.
第一章 函数与极限.
数列.
Partial Differential Equations §2 Separation of variables
6.4不等式的解法举例(1) 2019年4月17日星期三.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
三角函数诱导公式(1) 江苏省高淳高级中学 祝 辉.
复习.
用计算器开方.
第九节 赋值运算符和赋值表达式.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
4) 若A可逆,则 也可逆, 证明: 所以.
第4课时 绝对值.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
空间平面与平面的 位置关系.
上杭二中 曾庆华 上杭二中 曾庆华 上杭二中 曾庆华.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
高中数学必修 平面向量的基本定理.
§2 方阵的特征值与特征向量.
2.3.运用公式法 1 —平方差公式.
9.5空间向量及其运算 2.共线向量与共面向量 淮北矿业集团公司中学 纪迎春.
找 因 数.
3.2 平面向量基本定理.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
位似.
使用Fragment 本讲大纲: 1、创建Fragment 2、在Activity中添加Fragment
§4.5 最大公因式的矩阵求法( Ⅱ ).
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
第三章 图形的平移与旋转.
学习目标 1、什么是列类型 2、列类型之数值类型.
Presentation transcript:

策略型博弈 案例:艺术品拍卖的策略型 占优策略解 案例研究续:拍卖中的占优策略 第2章 策略型博弈 策略型博弈 案例:艺术品拍卖的策略型 占优策略解 案例研究续:拍卖中的占优策略

策略型博弈 博弈的策略型由三项内容所确定: 1. 博弈中局中人的名单. 2. 每个局中人可使用的策略集. 博弈的策略型由三项内容所确定:  1. 博弈中局中人的名单. 2. 每个局中人可使用的策略集. 3. 与任何策略组合(每个局中人一个 策略)相对应的盈利.

盈利是冯诺依曼-摩根斯坦效用。最简单的 博弈类型是两个局中人有两个策略的博弈。 策略型 : 局中人2 北 南 局中人1 高 π1 , π2 π1 , π2 (高,北), (高,北) (高,南),(高,南) 低 π1 , π2 π1 , π2 (高,北), (高,北) (高,南), (高,南)

当局中人多于两个,以及每个局中人有两个以上的策略时,对策略型的三个分量使用下述符号: 局中人将标记为1,2,…,N。一个局中人代表将表示为第i个局中人。 局中人i的策略通常表示为si,一个特定的策略表示si*或si#。除了局中人i以外的所有其它局中人的策略选择记为s-i。 πi 将表示局中人i的盈利(或冯诺依曼-摩根斯坦效用)函数。对于策略组合,s1*,s2*,…,sN*,其中每一个局中人相应于一个策略,局中人i的盈利将表示为πi (s1*,s2*,…,sN*)。

囚徒困境 (c = 认罪,nc = 拒绝认罪) 性别争端(F = 足球,O = 歌剧) 卡尔文\克雷 c nc c 0, 0 7, -2

抛硬币打赌(Matching pennies) ( h = 正面, t = 反面) 局中人1\局中人2 正面 反面 正面 1,-1 -1,1 反面 -1,1 1,-1 鹰-鸽(或懦夫博弈) (t = 强硬, c = 退让) 局中人1\局中人2 t c t -1, -1 10, 0 c 0, 10 5, 5

投票 对每一个投票者,在这个博弈中的策略有三个部分:在 第一轮中如何投票和第二轮中如何投票,而在第二轮 中的投票本身有两个分量。第一个分量是,如果议案 A在第一阶段通过后在第二轮中投票人如何投票,第 二分量是,如果(在第一轮中)议案B通过后,该投 票人又将如何投票。特别地,每个投票人有下述8个 策略可供选择*。 AAN; AAB; ANB; ANN; BAN; BAB; BNB; BNN; *当然,投票人知道她在第一轮中自己是怎样投票的。原则上,她的策略也可 以根据这个信息。目前我们将略去这种复杂性,因为这样的话,每一个策 略中分量的个数将增加到5——替代原来的3。(为什么?)

与展开型的等价性 两种表示博弈的方式是等价的:每一个展开 型博弈可以写成策略型且反之亦然。

案例:艺术品拍卖的策略型 艺术品拍卖:描述 假如我们被带入位于纽约洛克菲勒中心的索士比派克伯尼特的 大型拍卖场之一。拍卖商站在房间前面的讲台上。她的旁边有 一对随从举着待拍卖物件的影像。设想待拍卖的物件是雷诺伊 (Renoir, 1841—1919)的一组绘画;你很想拥有标号为 “#264”的那件可爱的咖啡吧景色。你必须开始做如下的事。 注册:如果你打算投标,必须在商品展销室的入口处注册。那 里你将得到一块写有编号的拍卖牌。(为了注册,恐怕你需要 一张信用卡。) 出价程序:一旦轮到标号#264,“你出价所必须做的就是举起你 的拍卖牌并等待拍卖商理会你,你不必叫出你出价的数——通 常由拍卖商以10%的增量自动确定高一些的出价。你不必坐的 毕恭毕敬;抓耳挠腮不能算作为一个出价(除非你与拍卖商事 先就做了安排)。如果没有人超过你的出价,就是说,没有其 他的拍卖牌举起,那么拍卖商敲下小木槌以结束拍卖。”

艺术品拍卖:策略型 局中人:注册的那些人 策略:考虑局中人策略的一个简单方 法是认定局中人愿意举牌的最高价。 结局:最后一个举牌的拍卖者赢得雷 诺依作品(抓耳挠腮者不能得到)。 盈利:赢者将付多少钱?

占优策略解 定义. 如果不管其他局中人选择什么样的 策略,局中人i的策略si的盈利严格地大 于他的所有其他策略的盈利,换言之, πi (si, s-i) >πi (si, s-i) 对一切si和s-i成立 其中s-i是除了局中人i以外的其他局中人 选择的策略向量。那么我们称策略si强优 于局中人i的所有其他策略.

考虑局中人1,我们称该局中人的策略b——记作s1b——优于其他策略——s1a,意指针对局中人2的两个策略来说,s1b比s1a 更好一些;于是 π1(s1b , s2b) >π1(s1a , s2b)   第一个不等式指出了,如果局中人2采用了他的第一个策略,那么s1b比s1a 产生较高一些的盈利;第二个不等式指出了即使局中人2选择他的第二个策略,同样的事实也成立。

定义. 如果局中人i的策略si,对于其他局中人的 每一个策略来说,至少与他的另一个策略s#i一样 地好,而对于其他局中人的某个策略来说,si严 格地好于s#i,即 在这种情况,我们称s#i为劣策略。如果si弱占优 于其他任何一个策略si,那么si被称为弱占优策 略*。 * 同样的定义应用于强优。如果公式3.1中令si =si#,称策略 si强优于策略。于是策略si#称作强劣的。

占优策略解 当每一个局中人都有占优策略时,博弈就有一个 占优策略解。 一个策略的组合,如果每一个局中人的策略都是 占优策略,那称这个策略的组合为占优策略解。 例如,囚徒困境中(认罪,认罪)构成了一个占 优策略解。 左 右 顶 7, 3 5, 3 底 7, 0 3, -1

案例研究续:拍卖中的占优策略 竞拍人以她对雷诺依作品的真实估价作为她的最高叫价的 策略是一个占优策略。不管其他竞拍人怎样叫价,你所 能做得最好的办法是,以你认为画所值的价格作为叫价 来。从不同的方式讲,如果你认为画值3000美元,你最 好的办法是闭上你的眼睛,举着你的拍卖牌直到听到拍 卖商宣布的叫价高于3000美元为止 为什么它是个占优策略,与其他几个策略作比较。假使你 决定“节省你的出价”,并且在2500美元处放下拍卖牌。 有两种可能的情况。一种情况是,还有某些人最高叫价 超过3000美元,其次,若最高叫价——即赢得雷诺依作 品的叫价——是2700美元。现在,你感觉自己象个傻瓜! 你失去了一幅估价为3000美元的画,而你用(稍高于 2700美元)就可以拥有它。3000美元的最高叫价比起 2500美元的叫价来决不会差些——而有时候严格地更好 一些。

总 结 策略型博弈由局中人的名单,每个局中人可使用的策略,和关于任何策略组合(一个策略对应于一个局中人)的盈利来描述。 策略型博弈由局中人的名单,每个局中人可使用的策略,和关于任何策略组合(一个策略对应于一个局中人)的盈利来描述。  每当博弈中有两个局中人,策略型可以很方便地表达为盈利矩阵。对于更多的局中人情况,符号表示式更方便一些。  每一个展开型博弈可以表示成策略型。每一个策略型博弈至少有一种展开型表示。 不管其他局中人如何做,占优策略比其他每一个策略给出较高的盈利。  当每一个局中人都有占优策略时,博弈存在占优策略解。  艺术品拍卖可以建模为策略型博弈,真实地叫价是该博弈的占优策略解。

概念 劣与非劣策略 累次剔除劣策略 案例研究:选举联合国秘书长 更正式的定义 讨论 第三章 占优可解性 概念 劣与非劣策略 累次剔除劣策略 案例研究:选举联合国秘书长 更正式的定义 讨论

概念 1. 劣与非劣策略 定义。 策略s#i 劣于另一个策略s-i,如果对于其他局中人的每一个策略,后者与s#i 至少一样好,而对于其他局中人的某些策略,si严格地好于s#i,以致 如果一个策略不劣于任何其他策略,则称它为非劣策略。将劣策略认为“坏”策略,而将非劣策略认为“好”策略

3 .更多例题 2. 累次剔除劣策略 局中人2 左 (L) 右 (R) 上 (U) 1, 1 0, 1 中 (M) 0, 2 1, 0 局中人1 局中人2 左 (L) 右 (R) 上 (U) 1, 1 0, 1 中 (M) 0, 2 1, 0 下 (D) 0, -1 0, 0 3 .更多例题

例1: 伯川德(价格)竞争 假设双寡垄断市场中的两个公司都可以开出三个价格中的任一个——高,中或低。 进一步假设不管哪个公司开价较低的话就可以得到整个市场。 如果两个公司开价相同,他们将平分市场。这些假设——和任何的价格对——转换成两个公司的收益水平。 例如,对于公司1,只有当它的价格不高于公司2的价格,才能有所收益。

假定收益由如下盈利矩阵给出 公司1\公司2 高 中 低 高 6,6 0,10 0,8 中 10,0 5,5 0,8 公司1\公司2 高 中 低 高 6,6 0,10 0,8 中 10,0 5,5 0,8 低 8,0 8,0 4,4 剔除“高”策略后,留给我们如下盈利矩阵  公司1\公司2 中 低 中 5,5 0,8 低 8,0, 4,4

例3:投票博弈 投票博弈:采用多数规则,三个投票人挑 选两个议案A或B中的一个。通过了第Ⅰ 轮的方案再面临与维持原状N(“都 不”)进行决赛。三个投票人的真实偏 爱如下:  投票人1: 投票人2: 投票人3: 

每一个策略有三个分量:策略A(后面跟)AN是指 “投A的票而反对B,然后在第Ⅱ轮中投A的票(反对 N),或投N的票(反对B)。”至于盈利,让我们使 用约定,如果他最愿意的方案通过,则获盈利1,第二 喜欢的通过,盈利为0,如果第三喜欢(即,最不喜欢) 方案通过,则他的盈利为-1。 在第Ⅱ轮中真实地投票优于非真实性投票;于是,对 投票人1来说,AAN优于ANN, ANB,和AAB。类似地, BBN优于BNN, BNB, 和BAB。由同样的逻辑推理,对 于局中人2,作为第Ⅱ轮中的投票策略,AB优于NB, NN, 和AN;对局中人3,第Ⅱ轮的投票策略NN优于 其他策略。可以看到如果投票人在第Ⅱ轮中真实地投 票,那么在那个阶段,A击败N,而B输给N。

剔除了(第Ⅱ轮非真实的)劣策略后,策略型如下 投票人3采用ANN 投票人1\投票人2 AAB BAB AAN 1, 0, 0 1, 0, 0 剔除了(第Ⅱ轮非真实的)劣策略后,策略型如下  投票人3采用ANN 投票人1\投票人2 AAB BAB AAN 1, 0, 0 1, 0, 0 BAN 1, 0, 0 0, -1, 1 投票人3采用BNN AAN 1, 0, 0 1, -1, 1 BAN 0, -1, 1 0, -1, 1 现在看到,对局中人1,AAN优于BAN,对局中人2AAB优于 BAB,而对局中人3,BNN优于ANN。从而,我们得到了 IEDS结局为:投票人1取AAN,投票人2取AAB,投票人3 取BNN,A(以2票)赢得第Ⅰ轮,而在决赛中继续击败N。

案例研究:选举联合国秘书长 考虑有两个投票人的选举——假如为美国与非洲。 投票人1——美国——首先投票并着手否决三个 候选人A(安南),B(加利),和H(布鲁特 莱特)中的一个。然后,投票人2——非洲—— 否决两个余下的候选人中的一位。假如美国和 非洲关于三个候选人的中意顺序如下:  美国: 非洲:

在一轮剔除之后,实际上的博弈成为: 美国\非洲 HHA A -1, 1 B 0, 0 H -1, 1 非洲 HAA HHA HAB HHB BAA BHA BAB BHB 美国  A -1, 1 -1, 1 -1, 1 -1, 1 1, -1 1, -1 1, -1 1, -1 B 1, -1 0, 0 1, -1 0, 0 1, -1 0, 0 1, -1 0, 0 H -1, 1 -1, 1 0, 0 0, 0 -1, 1 -1, 1 0, 0 0, 0 在一轮剔除之后,实际上的博弈成为: 美国\非洲 HHA A -1, 1 B 0, 0 H -1, 1

占优可解性的更正式的定义 考虑有N个局中人的策略型博弈;局中人i的策略用si来表示;令Si表示局中人i的策略集。 在第Ⅰ轮,局中人i的劣策略集表示为 Di(I),换言之, Di(I) = siSi: si是劣策略 理性的局中人不会采用劣策略。就是说,不启用 Di(I)中的策略,这对i = 1, 2, …, N均成立。 进入第Ⅱ轮,局中人i可以在留给自己的策略集 Si  Di(I)中作进一步的决定,看看它们当中是否又有哪些现在成为劣策略了。一个策略si# 现在成为劣的,是指:假定每一个其他局中人也都在第Ⅰ轮中剔除了劣策略之后,在Si  Di(I)中存在另外一个,它始终至少与si#一样地好,而在某些时候严格地好于si#。

于是, 其中,S-i  D-i(I)是除了局中人i以外的所有局中人的非劣策略组合的集合 [1] 。记局中人i在第Ⅰ轮中或者在第Ⅱ轮中为劣的所有策略的全体为Di (Ⅱ)。一旦知道了没有一个局中人会采用属于Di (Ⅱ)中的策略,继续剔除任何这样的步骤,现在又成为劣的那些策略。通过这种做法,又建立了一个在前三轮中为劣策略的集合;称这个集合为Di (Ⅲ)。如此等等。 [1] 尤其S-i – D-i(I)包含了策略向量(s1, …, si – 1, si + 1, …, sN),其中每一个策略sj都是非劣的。

假如我们最终达到这样一个状态,剩给每一个局中人的只有一个策略,即,假定经过T轮剔除之后,剩下的集合Si  Di(T),恰好包含了一个策略,并且这一事实对i = 1, 2,…, N都成立。在那种情况,这些每个人剩下的单一策略构成的向量称为累次剔除劣策略(IEDS)的结局,该博弈则称为占优可解的。假如这样的情况不发生——如果在某一轮,对某些局中人,尽管仍然留下多个策略,但是没有更多的策略可以被剔除——博弈就称为没有IEDS解。

理性的层次 没有人会采用劣策略是合理的假设。没有局中人会采用,那些一旦其他的劣策略被剔除之后成为了劣策略的策略,这件事看来也是合理的。没有一个局中人会采用只是在15轮剔除劣策略之后才转变成的劣策略,这件事似乎就不太合理。这是因为它假定,每个人都同意在连续(14次)高次数地剔除行动中所有的人都是理性的。如果其他局中人某一次理性的“失误”可能代价昂贵的话,这尤其成问题。考虑下述博弈:  1\2 左 中心 右 顶 4,5 1,6 5,6 中间 3,5 2,5 5,4 底 2,5 2,0 7,0

剔除的顺序(和非唯一的结局) 当策略是劣的但不是强劣的,剔除的 顺序就要紧了。考虑下面的博弈。 顶 0,0 0,1 底 1,0 0,0 当策略是劣的但不是强劣的,剔除的 顺序就要紧了。考虑下面的博弈。  1\2 左 右 顶 0,0 0,1 底 1,0 0,0

不存在性。 不是所有的博弈都是占优可解的。例如,在性别 争端、扔硬币打赌和布鲁特上校中,不存在劣 策略,因而,不存在IEDS结局。在以下博弈中, 每一个局中人都有一个劣策略——“差”—— 可是在剔除那个策略后留下来的是一个只有非 劣策略的2×2博弈。  1\2 左 中 差 顶 1,-1 -1,1 0,-2 中 -1,1 1,-1 0,-2 差 -2,0 -2,0 -2,-2

总 结 1. 没有一个理性的局中人会采用劣策略,他宁 愿采用一个非劣的策略。而且一个理性的局 中人不认为他的对手会采用劣策略。 1. 没有一个理性的局中人会采用劣策略,他宁 愿采用一个非劣的策略。而且一个理性的局 中人不认为他的对手会采用劣策略。  2. 劣策略的剔除可以导致一系列连锁反应,逐 步缩小一组局中人采取行动的范围。如果存 在一个最终唯一预测,则称它为IEDS解。  3. 当在IEDS解中包含有许多轮次的剔除时, 有理由去关心其预测的合理性。