对策论(一) 刘志新 2003.10.21.

Slides:



Advertisements
Similar presentations
四川财经职业学院会计一系会计综合实训 目录 情境 1.1 企业认知 情境 1.3 日常经济业务核算 情境 1.4 产品成本核算 情境 1.5 编制报表前准备工作 情境 1.6 期末会计报表的编制 情境 1.2 建账.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
复习: :对任意的x∈A,都有x∈B。 集合A与集合B间的关系 A(B) A B :存在x0∈A,但x0∈B。 A B A B.
3.4 空间直线的方程.
第五章 二次型 §5.1 二次型的矩阵表示 §5.2 标准形 §5.3 唯一性 §5.4 正定二次型 章小结与习题.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第三章 函数逼近 — 最佳平方逼近.
《高等数学》(理学) 常数项级数的概念 袁安锋
§1 线性空间的定义与性质 ★线性空间的定义 ★线性空间的性质 ★线性空间的子空间 线性空间是线性代数的高等部分,是代数学
常用逻辑用语复习 知识网络 常用逻辑用语 命题及其关系 简单的逻辑联结词 全称量词与存在量词 四种命题 充分条件与必要条件 量词 全称量词 存在量词 含有一个量词的否定 或 且 非或 并集 交集 补集 运算.
常用逻辑用语复习课 李娟.
第二节 微积分基本定理 一、积分上限函数及其导数 二、积分上限函数求导法则 三、微积分基本公式.
恰当方程(全微分方程) 一、概念 二、全微分方程的解法.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
定积分习题课.
第十八章 含参变量的反常积分 教学目标: 1°使学生掌握含参变量反常积分概念; 2°使学生学会用定义证明含参变量反常积分收敛性。
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第2章 Z变换 Z变换的定义与收敛域 Z反变换 系统的稳定性和H(z) 系统函数.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第二章 矩阵(matrix) 第8次课.
!!! 请记住:矩阵是否等价只须看矩阵的秩是否相同。
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
使用矩阵表示 最小生成树算法.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
第二十二章 曲面积分 §1 第一型曲面积分 §2 第二型曲面积分 §3 高斯公式与斯托克斯公式.
实数与向量的积.
线性代数 第二章 矩阵 §1 矩阵的定义 定义:m×n个数排成的数表 3) 零矩阵: 4) n阶方阵:An=[aij]n×n
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
第十章 双线性型 Bilinear Form 厦门大学数学科学学院 网址: gdjpkc.xmu.edu.cn
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
§8.3 不变因子 一、行列式因子 二、不变因子.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.2 子集、补集、全集习题课.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
4) 若A可逆,则 也可逆, 证明: 所以.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第五章 相似矩阵及二次型.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
A经有限次初等变换化为B,称A与B等价,记作A→B.
《离散结构》 二元运算性质的判断 西安工程大学计算机科学学院 王爱丽.
§2 方阵的特征值与特征向量.
9.5空间向量及其运算 2.共线向量与共面向量 淮北矿业集团公司中学 纪迎春.
定义21.17:设P1=P(Y1)和P2=P(Y2),其个体变元与个体常元分别为X1,C1和 X2,C2,并且或者C1=或者C2。一个半同态映射(,):(P1,X1∪C1)→(P2,X2∪C2)是一对映射: P1→P2; : X1∪C1→X2∪C2,它们联合实现了映射p(x,c)→(p)((x),
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
基于列存储的RDF数据管理 朱敏
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第四章 函数的 积分学 第七节 定积分的换元积分法     与分部积分法 一、定积分的换元积分法 二、定积分的分部积分法.
§4.5 最大公因式的矩阵求法( Ⅱ ).
第三章 线性方程组 §4 n维向量及其线性相关性(续7)
最小生成树 最优二叉树.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
1.2.2 充要条件 高二数学 选修 1-1 第一章 常用逻辑用语.
Presentation transcript:

对策论(一) 刘志新 2003.10.21

主要内容 1.基本概念 2.二人零和有限对策 3.二人非零和有限对策 4.二人零和无限对策

基本概念 1.对策论 2.局中人:决策的主体 3.支付:局中人从对策中获得的利益 4.行动:局中人在某时点上的决策变量 5.战略:局中人的行动规则 6.支付函数

基本概念 7.合作对策&非合作对策 8.两人对策&多人对策 9.零和对策&常和对策&变和对策 10.静态对策&动态对策&重复对策 11.完全信息对策&不完全信息对策

一个例子 囚徒困境

研究对策论常用的两种模型 (一)展开型 (二)正规型

展开型对策 例:

展开型对策 定义1:有n个局中人的对策树是指具有以下性质的三元组 ,使得: 为树,且 为一映射, 为局中人的集合 为一映射

展开型对策 定义2:设 为对策树,称 为由 产生的n人对策,对策 也称为展开型对策. 定义3:在对策 中,设有策略组 定义2:设 为对策树,称 为由 产生的n人对策,对策 也称为展开型对策. 定义3:在对策 中,设有策略组 使对于任何的 及 均有: ,则称 为对策 的一个平衡点. .

展开型对策 定理:设 为对策树,则 有一个平衡点

正规型对策 定义1:给定三元组 其中 均为集合,而 是定义在 上的实值函数,则称 为一个对策. 定义2:若有策略 ,使 定义1:给定三元组 其中 均为集合,而 是定义在 上的实值函数,则称 为一个对策. 定义2:若有策略 ,使 称 为甲的保守策略..

正规型对策 定义3:若有 满足: 则称策略对 为对策的非合作平衡解. 定义4:对于对策对 ,若不存在策略对 ,同时有 , 定义3:若有 满足: 则称策略对 为对策的非合作平衡解. 定义4:对于对策对 ,若不存在策略对 ,同时有 , 则称为对策的Pareto最优

二人零和有限对策 策略的表示:(矩阵)

二人零和有限对策 保守解策略是如下的策略 , 一般的

二人零和有限对策 我们希望 定义:在二人零和有限对策 中,若甲的支付函数为 ,设有值 则称对策 有鞍点,公共值 称为对策的值,相应的策略对 为对策的鞍点.

二人零和有限对策 有些时候鞍点是不存在的.例:

混合策略 引入混合策略 记 考虑期望收益

定义:对于 , 若有策略对 满足 , 其中 ,则称 为 的鞍点.

混合对策的存在性定理 定理:设 都是紧的,且 上连续,对于 ,有 (方法1:用凸集分离定理 方法2:用Kakutani不动点原理 定理:设 都是紧的,且 上连续,对于 ,有 (方法1:用凸集分离定理 方法2:用Kakutani不动点原理 方法3: )

优策略 定义:对于值为 而支付函数为 的对策,凡使 的策略 称为甲的优策略.而使 的策略 称为乙的优策略.

优策略的性质 性质1:每个局中人的优策略集是一个凸集. 性质2:若 是乙的优策略,并设 则对甲的任何优策略 ,必有: 性质2:若 是乙的优策略,并设 则对甲的任何优策略 ,必有: 其中 表示甲取策略 ,乙取策略 时的支付.

优策略的性质 性质3:设 为对策值, 为甲的任何优策略,有若对某个 ,有 则对乙的任何优策略 必有 性质3:设 为对策值, 为甲的任何优策略,有若对某个 ,有 则对乙的任何优策略 必有 性质4:设 为对策值,若对乙的任何优策略 有 则甲必有一个优策略 ,使得:

优策略的性质 性质5:若矩阵 可写作分块矩阵 若 中的每一列严格超出 中列的凸组合,又设 中的每一行严格的被 中行的某个凸组合超出,则 , , 均可删去而不影响甲乙的优策略集.

优策略的计算 定理:设对策值为 , 支付矩阵为 的对策 其优策略 为端点优策略的充要条件是存在 的子方阵 ,使得: 式中 表示 的伴随矩阵.

优策略的计算 例: 可取 可得:

二人一般和有限对策 双矩阵对策: 定义:在对策 中,若有策略对 ,使得: 则称 为 的一个非合作平衡点

存在性定理 定理:对每个双矩阵对策 至少存在一个非合作平衡点. 对 作改进:

判断平衡点 为平衡点

平衡点的Lemke_Howson算法 定理:当对策 为非退化时,对策肯定存在平衡点. (矩阵A非退化是指: 每个方 定理:当对策 为非退化时,对策肯定存在平衡点. (矩阵A非退化是指: 每个方 子阵都是非奇异的(除去最后的零矩阵))

平衡点的Lemke_Howson算法 例: 选取

谈判问题 可行集 谈判的基点(各自的保守收益) 谈判的结果找 ,使得双方都满意即存在映射 ,使得 .

Nash的谈判公理体系 公理1(个体合理性): 公理2(可行性): 公理3(Pareto最优性)若 且 则 . 则 . 公理4(无关方案的独立性):若 , 且 ,则 .

Nash的谈判公理体系 公理5(线性变换的无关性)设T是由S经如下线性变换 而得到的,如果 则必有 其中 为正常数, 为常数. 而得到的,如果 则必有 其中 为正常数, 为常数. 公理6(对称性) :若S是对称的,即若 有 ,且若 ,则有 .

谈判定理 定理:对于所有的谈判问题 ,存在唯一的满足以上公理的 .

“恐吓”问题 考虑以下的双矩阵对策: 都有独立的恐吓策略,谈判的基点:

二人零和无限对策 问题的描述: 定义:在二人零和无限对策中,若存在 使得对所有 都成立 ,则称 ( ) 为鞍点. 使得对所有 都成立 ,则称 ( ) 为鞍点. 在无限对策中,鞍点不一定存在.

鞍点 定义:在对策 ,点 称为 鞍点,若下式对任意的 都成立,

无限对策中的混合扩张 定义: :集合X的子集的 代数 y:集合Y的子集的 代数 : ,y上所有的概率测度组成的集合 称 为对策 的混合扩张, 称 为对策 的混合扩张, 其中

混合扩张的平衡点 定义: 为二人零和无限对对策, 为对策的混合扩张,若存在 使得对所有的 都有: 称 为对策的混合扩张的平衡点.

具连续支付函数的对策 定理:二人零和无限对策 中,X,Y为紧集,H为一连续函数,则存在混合策略对 使得 对任意的 都成立.此时有

凸策略与凹策略 定义:设X,Y为紧集,并且Y为凸集,支付函数 是连续的,且对任意固定的 ,H(x,y)关于y是凸的,则对策 称为凸对策. 当X为凸集,支付函数H是连续的,且对任意固定的 ,H(x,y)关于x是凹的,则称对策为凹对策

凸策略与凹策略 定理:设对策 为凸对策,则对局中人来说都存在一个最优存策略,且策略的值为 .

Thank You