扩展型博弈和策略型博弈.

Slides:



Advertisements
Similar presentations
高三英语有效复习策略 程国学. 一、高考备考的方向把握 1. 认真研究普通高中《英语课程标准》和《福建 省考试说明》关注高考命题原则和发展方向,定 准复习教学起点 1. 认真研究普通高中《英语课程标准》和《福建 省考试说明》关注高考命题原则和发展方向,定 准复习教学起点 一是明确高考英语可能考什么,我们应该怎样准.
Advertisements

考纲研读 语言知识要求 语言运用能力 附录 1: 语音项目表 附录 2: 语法项目表 附录 3: 功能意念项目表 附录 4: 话题项目表 附录 5: 词汇表 听力 阅读 写作 口语.
100 學年度 勞委會就業學程 國際企業管理學系-物業管理學程介紹. 何謂物業管理? 以台灣物業管理學會 所述,物業管理區分為 「物」、「業」、「人」三區塊。台灣物業管理學會 「物」係指傳統的建物設備、設施 「業」為不動產經營的資產管理 「人」則以生活服務、商業服務為主,並以人為 本位連結物與業,形成今日物業管理三足鼎立新.
图书馆管理实务.
信号与系统 第三章 傅里叶变换 东北大学 2017/2/27.
行政命令.
共产党领导的多党合作和政治协商制度: 中国特色的政党制度.
主讲:材料工程学院党总支宣传委员、党务秘书 教工党支部书记 王国志 2015年12月7日
普通高中新课程实验 若干问题 广东省教育厅教研室 吴惟粤 2004年4月29日 广州.
前言 採購程序每一環節所涉及人員,無論是訂定招標文件、招標、審標、決標、訂約、履約管理、驗收及爭議處理,如缺乏品德操守,有可能降低採購效率與品質,影響採購目標之達成,甚有違法圖利情事發生,致阻礙政府政策之推動並損害公共利益。因此,較之一般公務人員,採購人員更需遵循較高標準之道德規範。 主講人:林中財.
欢迎新同学.
2015年新课标高考历史试题分析 暨考试方向研判 李树全 西安市第八十九中学.
课题四 以天池、博斯腾湖 为重点的风景旅游区
“健康的基督徒” 入门.
南台科技大學電子工程系 指導老師:楊榮林 老師 學生姓名:蔡博涵 巨物索餌感測裝置(第II版)
手太阳小肠经.
2015年汕头一模质量分析会 34(1)题分析 濠江区河浦中学 詹金锋 34(2)题分析 汕头市实验学校 董友军
士師逐個捉(II) 石建華牧師 24/07/2016.
宣讲数学课程标准 增强课程改革意识.
高考地理全国卷和安徽卷 的对比分析及备考策略
快乐生活,快乐学习 《中国古代诗歌散文欣赏》.
班級經營之再思 香港班級經營學會 黃鳳意
佛法原典研習 五陰誦 (II) 2007/5/13 整理此報告的方式 : 主要節錄 果煜法師說法之重點.
游泳四式技術分析暨初級教法.
2014年度合肥市中小学生学业质量 绿色指标测试相关情况说明及考务工作要求
普通高中课改方案介绍.
曾一 陈策 重庆大学计算机学院基础科学系 重庆
第十章 博弈论初步.
第七章 机械加工工艺规程的制定.
家庭教育與服務學習.
期末考试 考试时间:2016年6月21日周二下午2点至3点半 考试地点:3511 考试范围:期中考试之后的内容。
普通高中课程改革的方案与推进策略 安徽省教育厅 李明阳.
機械工程學系課程地圖 先進材料與精密製造組 設計分析組 校訂共同必修課程 機械系訂 必修課程 組訂 必修課程 畢業專題 工學院訂必修課程
普通高中校本课程开发与实施 崔允漷 教授、博导 普通高中新课程国家级通识研修专题之一 华东师范大学课程与教学研究所副所长
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
*§8 反常二重积分 与反常定积分相同, 二重积分亦有推广到积分区域是无界的和被积函数是无界的两种情形, 统称为反常二重积分.
口腔衞生.
摩西五經系列:申命記.
口腔卫生.
檢調機關函調、搜索、約談訊問之認識 (含教師因公涉訟輔助)
强连通分量 无向图 1、任意两顶点连通称该图为连通图 2、否则将其中的极大连通子图称为连通分量 A D C B E 有向图
高级微观经济学 东北大学工商管理学院 向涛.
使用矩阵表示 最小生成树算法.
2.1.2 空间中直线与直线 之间的位置关系.
第六章 假設檢定 6.1 假設檢定概論 6.2 檢定統計量 6.3 假設檢定的形式與步驟 6.4 單一樣本之假設檢定
第一章 函数与极限.
第三章 指數與對數 3-2 指數函數及其圖形.
数列.
线段的有关计算.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
策略型博弈 案例:艺术品拍卖的策略型 占优策略解 案例研究续:拍卖中的占优策略
复习.
第六节 边际与弹性 一、边际的概念 二、经济学中常见的边际函数 三、弹性的概念 四、经济学中常见的弹性函数 五、小结 思考题.
6.4 你有信心吗?.
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1.2 空间向量的数量积运算 1.了解空间向量夹角的概念及表示方法. 2.掌握空间向量数量积的计算方法及应用.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
O x y i j O x y i j a A(x, y) y x 5.4 平面向量的坐标运算 5.4 平面向量的坐标运算 5.4 平面向量的坐标运算 5.4 平面向量的坐标运算 5.4 平面向量的坐标运算 5.4 平面向量的坐标运算 5.4 平面向量的坐标运算.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
导 言 经济学的基本问题 经济学的基本研究方法 需求和供给.
桃園市108學年度國民中學資賦優異學生鑑定家長說明會
§2 方阵的特征值与特征向量.
基于列存储的RDF数据管理 朱敏
3.2 平面向量基本定理.
八、工程督導 8.1.監辦 8.2.審計機關之稽察 8.3.相關機關之查核 8.4.施工查核小組 8.5.採購稽核小組 8.6.工程督導小組
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

扩展型博弈和策略型博弈

扩展性博弈和策略型博弈 [一个简单例子] 厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000, 概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000, 边际成本是5;厂商2的固定成本是60000, 边际成本是3。

扩展性博弈和策略型博弈 [一个简单例子] 厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000, 概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000, 边际成本是5;厂商2的固定成本是60000, 边际成本是3。

图I.4: 博弈树 (讲义)

基本定义 一个扩展型博弈包含一个局中人集I,一个节点集T,一个有向线段集E,和一个赢得向量集V。 每个有向线段的两个端点都是节点,依方向顺序一个叫始点,一个叫终点。 如果从节点t始,经过一个接一个的有向线段可以连接到节点t’,就称t’为t的后继点 (或t是t’的先行点)。 每个节点或是一个或多个有向线段的始点,并且/或者是一个有向线段的终点。 不作为任何有向线段终点的节点叫做博弈始点,不作为任何有向线段始点的节点叫做博弈终点。

基本定义 将博弈始点通过一个接一个的有向线段连接到某个博弈终点,就得到一条博弈路径。每个博弈终点附上一个赢得向量,第i个分量表示局中人i的赢得。 节点集T可以划分为两两不相交的若干个子集:其中每个局中人有一个,叫做他的决策节点集;自然界有一个(如果信息不完全),叫做机会节点集;还有一个子集包含所有的博弈 终点。 每个局中人的决策节点集可以进一步划分为若干个两两不相交的信息集,每个信息集的节点用气球括起来或者用虚线连在一起,表示该局中人决策时不知道自己在那个节点上。

基本定义 从某局中人一个信息集的节点引出的每个有向线段表示他的“一着”,选定一着表示他在同一个信息集的所有节点选定同一个行动。 一个局中人在每一个信息集都选定一着,就选定他的一个纯策略;即一个纯策略是一个完整的行动计划。局中人i的纯策略集用Si表示。 每个局中人都选定一个纯策略,就构成一个策略横断面s (strategy profile);这时可以算出博弈的一个赢得向量或者一个期望赢得向量。全体纯策略横断面的集合记为S。

基本定义 不管博弈的动态过程,仅着眼于局中人,各人的纯策略和赢得,就得到博弈的策略型[I,S,V]。 一个策略横断面s*=(s*1,…,s*n)叫做Nash均衡,如果对每个局中人i, 他选定的策略s*i都是对所有其它局中人选定的策略s*-i的最优回应:pi(s*)pi(s*|si), siSi, iI。 一个博弈不一定有纯策略Nash均衡;如果有,则不一定唯一。

二人策略型博弈Nash均衡的计算 可以按照定义找出所有的纯策略Nash均衡; 如果策略型博弈比较复杂,可以用策略间的“优”, “劣”关系化简,然后再寻找均衡。称i的一个策略si劣于si (或si优于si),如果不管其他人选定什么策略,si都比si使i得到更小的赢得。如果存在一个si,它优于i的任何其他策略,就称si为i的最优策略。显然,劣策略不可能构成Nash均衡。所以,寻找Nash均衡时可以把劣策略划掉以简化策略型博弈。

混合策略Nash均衡 当一个博弈没有纯策略Nash均衡时,人们考虑计算所谓混合策略Nash均衡。 局中人的一个混合策略是指他按照某个概率分布随机地选用各个纯策略;如果他有K个纯策略,那么他的一个混合策略可以表示为i=(pi1,…,piK),其中pik是他选用第k个纯策略的概率。 当局中人使用混合策略时,各人的期望赢得等于他在每一个纯策略横断面上的赢得与该策略横断面出现的概率的乘积之总和。为简便计,i的期望赢得函数仍然用i表示。

混合策略Nash均衡 局中人i的全体混合策略的集合记为i;注意一个纯策略也可以看作一个特殊的混合策略。 如果每个局中人都选用一个混合策略,就得到一个混合策略横断面。全体混合策略横断面的集合记为。 一个混合策略横断面*=(*1,…, *n)叫做混合策略Nash均衡,如果如果对每个局中人i, 他选定的混合策略*i都是对所有其它局中人选定的混合策略*-i的最优回应:pi(*)pi(*|i), *ii, iI。

混合策略Nash均衡 Nash定理:任何有限的策略型博弈(局中人数目有限,每人的纯策略数目有限)至少存在一个混合策略Nash均衡(可能是纯策略Nash均衡)。 一个博弈叫做有完整记忆的,如果每个局中人不会忘记他知道的信息和他曾经选用的着。因为有完整记忆的有限扩展型博弈都能化为有限策略型博弈,所以Nash定理的结果也适用于有完整记忆的有限扩展型博弈。

混合策略Nash均衡 无区别原则:如果*=(*i,*-i)是个混合策略Nash均衡并且i(*i,*-i) =M,那么对*i中局中人i以正概率选用的每一个纯策略si都有i(si,*-i) =M。换句话说, *-i使得局中人i对于他实际采用的每个纯策略无区别。 根据无区别原则,通常可以求解一个利用优劣关系简化后得到的KK双矩阵博弈。