引例囚徒困境：甲、乙两个人一起携枪准备作案，被警察发现抓了起来。如果两个人都不坦白，警察会以非法携带枪支罪而将二人各判1年；如果其中一人招供而另一人不招，坦白者作为证人将不会被起诉，另一人将会被重判15年；如果两人都招供，则两人都会因罪名各判10年。这两个囚犯该怎么办？斗鸡博弈：两只斗鸡遇到一起，每只斗鸡都有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来，则双方打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败

Slides:

Advertisements

Similar presentations

第二节各种标本采集技术一、痰标本采集技术二、咽拭子标本采集技术三、呕吐物标本采集技术四、血标本采集技术五、尿标本采集技术六、粪便标本采集技术.

Advertisements

中医护理 —— 鱼腥草护理 1334 班小组成员：郭丽丹 43 杨专 39 张建 35 李晓敏 27 陈燕红 25 张良州 8 分工合作：收集整理 43 郭丽丹 35 张建 27 李晓敏讲解 39 杨专 25 陈燕红 8 张良洲.

手工加工全框眼镜技术前调整确定加工基准制作模板割边磨边磨安全角（抛光）装配后调整检测.

融资融券业务的保证金与保证金比例光大证券 · 信用业务管理总部 2015 年 12 月 ★融资融券业务投资者教育活动材料★

第四章基础护理操作技术中国医科大学朱闻溪中国医科大学朱闻溪中国医科大学朱闻溪中国医科大学朱闻溪.

道家養生保健長壽藥膳藥膳應用原則：天人相應，道法自然藥膳有兩個職能：一是保健增壽，一是治療疾病。 ◎ 黃蕙棻.

金門神鵰俠侶風獅爺與大樹之風中傳奇風獅爺與大樹之風中傳奇  104 年 6 月 17 日報告人：鍾佳玫.

《公路纵断面设计》 —— 纵断面设计的要求道桥系二○○七年五月. 纵断面设计的一般要求 1 ．纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 ．为保证汽车能以一定的车速安全舒顺地行驶，纵坡应具有 — 定的平顺性，起伏不宜过大及过于频繁。尽量避免采用极限纵坡值．缓和坡段应自然地配合地形设置，在连续采用极限长度的.

第二节脉搏的评估及异常时的护理. 教学目标  1 、解释有关名词  2 、说出脉搏、呼吸的正常值  3 、叙述脉搏、呼吸的测量方法；识别脉搏、呼吸的异常变化  4 、叙述测量脉搏、呼吸的注意事项  5 、正确记录脉搏、呼吸，做到认真负责，实事求是。

年輕駕駛交通工具考上駕照的 18 歲，正好是高中畢業，離家工作、上大學的時候。年輕人對新環境的好奇及生疏，以及尚未養成良好駕駛習慣，造成意外的產生。

项目四、腻子的施工　一、准备工作　二、安全与卫生　三、板件表面的处理　四、准备腻子　五、刮腻子　六、腻子的干燥　七、腻子的打磨　结束.

第一章有理数一.本章学习目标 1.理解有理数的意义，能用数轴上的点表示有理数，能比较有理数的大小.

胸部主要骨骼标志胸骨上切迹胸骨柄胸骨角肋骨肋间隙剑突肩胛骨肋脊角. 胸部主要骨骼标志胸骨上切迹胸骨柄胸骨角肋骨肋间隙剑突肩胛骨肋脊角.

体体育育保保健健学学实实验验主讲人：王会凤黄淮学院体育系.

工程优化硕士研究生课程教材：《最优化计算方法》陈开周参考书：《最优化理论与算法》陈宝林任课教师：叶峰时间：周2, 5晚

個人理財規劃第八章投資規劃.

举国上下抗击风雪灾害专刊温暖行动灾情告急年关近万众一心齐抗灾可歌可泣留千古温暖行动遍人间导读提示阳关雨露出版社

第7章隔离技术厦门医学高等专科学校基础护理教研室.

保育员工作职责.

开天门梅州市中医医院郑雪辉.

小儿斜颈的诊断与治疗.

生活护理技术项目一医院感染的预防与控制项目二排泄护理技术项目三促进呼吸功能护理项目一冷热疗法项目二标本采集项目三

政府採購法規概要報告人：杜國正行政院公共工程委員會企劃處.

中式面点技艺长春市商业职业技术学校王成贵中式面点技艺长春市商业职业技术学校授课教师：王成贵.

作文选刊作文之窗

水钟古代计时器陈宁心.

“淡雅浓香中国风尚” 山东低度浓香白酒整合传播侧记

之魔析妖鬼解怪大沈家仪小组出品.

快乐假期 2010年第6期总第54期贝尔芬主编暑期作文专刊《快乐假期》杂志社出版.

第四章运筹学模型本章重点：线性规划基础模型、目标规划模型、运输模型及其应用、图论模型、最小树问题、最短路问题.

每週一書好書報報抱抱好書林蕙蘭.

青铜器的器型炊食器：炊具：鼎、鬲、甗等食器：豆、簋、敦、盨、簠等酒器：饮酒器：爵、角、觚、觯等温酒器：斝

情緒與壓力管理─背部舒緩指導老師：彭易璟第六組組員：會資三乙 499A0047 謝宛霖會資三乙 499A0019 吳汶諭

老师：如何撰写教研文章？主讲：石修银谨以此赠与孜孜追求的老师谨以此赠与改变人生的老师.

排球竞赛规则与裁判法.

依“标”据“本”，命制考题发表于《数学教学》2006年第9期（华东师大核心“CN”刊物）

12星座对于星座，你又知道多少呢？第一刊.

推行使用散装预拌砂浆全面贯彻落实禁现政策

均相反应动力学单一反应动力学方程.

二、汽化和液化.

第九章长期资产及摊销 2017/3/21.

第九章病人卧位与安全的护理.

粪便检查主讲老师：沈萍.

看图找关系.

数学通报简介 ——如何写稿及投稿数学通报郑亚利 2014年8月.

第十八章药物疗法与过敏试验法郭三花岳月梅忻州职院护理系.

行為改變技術班級：幼保二甲組員： 4A10H081 蘇靖婷 4A1I0014 陳佳瑩 4A1I0023 尤秀惠 4A1I0074 邱乃晏指導老師：楊淑娥老師.

外科基本换药 2004届外科住院医师汪晓东.

盆腔炎的护理梅剑娟.

第1节人体内物质的运输人体的组织细胞每时每刻都需要营养物质和氧，并不断产生二氧化碳、尿素等废物。这些物质在人体内运输主要依靠系统。人体的血液循环系统由、和组成。血液循环血管心脏血液.

项目九猪的一般饲养管理.

慈禧药方（人参健脾丸）【简介】：清代太医院的设制基本上沿袭了明朝的旧制，顺治1644年设太医院为独立的中央医事机构，为帝后及宫内人员诊视疾病、配制药物，也担负其他医药事务。此为宫廷处方，内容如下：老佛爷人参健脾丸党参七钱白术二钱怀山药七钱炒薏米五钱六分欠实五钱六分广皮一钱.

推进《玻璃钢制品工》国家职业资格证书制度的建设

本期导读：１版习惯２版的十个做人的好习惯３版力４版量５版６版７版 8版

新课标高考考试大纲解读及备考建议西安高新一中郭小平

体育选项课件健美操理论课任课教师：黄明礼湄洲湾职业技术学院.

第2章线性规划与单纯形法第3章对偶理论与灵敏度分析第4章运输问题第5章目标规划

反比例函数 2018/11/20.

数据、模型与决策汕头大学商学院林佳丽.

排列组合 1. 两个基本原理分类加法计数原理分步乘法计数原理.

網路遊戲版幸福農場168號.

第三节　常见天气系统.

统筹安排　　成本最低.

统筹安排　　成本最低.

第3章运输问题 3 内容提要  运输问题模型的特点  产销平衡运输问题的表上作业法  产销不平衡运输问题的转化

§4 连续型随机变量.

第三章线性规划问题的计算机求解.

欢迎乘座远航号！让我们一起去知识的海洋寻宝吧！

6.1.1 平方根.

Presentation transcript:

引例囚徒困境：甲、乙两个人一起携枪准备作案，被警察发现抓了起来。如果两个人都不坦白，警察会以非法携带枪支罪而将二人各判1年；如果其中一人招供而另一人不招，坦白者作为证人将不会被起诉，另一人将会被重判15年；如果两人都招供，则两人都会因罪名各判10年。这两个囚犯该怎么办？斗鸡博弈：两只斗鸡遇到一起，每只斗鸡都有两个行动选择：一是退下来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，这只公鸡则很丢面子；如果对方也退下来，则双方打个平手；如果自己没退下来，而对方退下来，自己则胜利，对方则失败；如果两只公鸡都前进，那么则两败俱伤。这两只公鸡该怎么办？

引例在社会生活中，经常碰到各种各样具有竞争或利益相对抗的活动，如下棋、打扑克、为争夺市场开展的广告战、军事斗争中双方兵力的对垒等，竞争的各方总是希望击败对手，取得尽可能好的结果。竞争各方都想用自己最好的战术去取胜，这就是对策现象。对策现象实际上是一类特殊的决策，在不确定型的决策分析中，决策者的对手是“大自然”，它对决策者的各种策略不产生反应，更没有报复行为。但在对策现象中，代替“大自然”的是有理智的人，因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应。我国历史上齐王和田忌赛马的故事，生动的说明研究对策问题的意义。

产生与发展 1944年，冯诺依曼与曼彻斯特发表了题为《对策论和经济行为》。 50年代是对策论发展的鼎盛时期，纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时，非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章，图克于1950年定义了“囚徒困境”问题。 60年代，泽尔腾(1965)引入动态分析，提出“精练纳什均衡”概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。

对策的基本要素局中人：在一个对策行为中，有权决定自己行动方案的对策参加者。它可是一个人，也可以是一个集团局中人必须是有决策权的主体，而不是参谋或从属人员局中人可以有两方，也可以有多方当存在多方的情况下，局中人之间可以有结盟和不结盟之分

对策的基本要素策略：在一局对策中，把局中人的一个可行方案称为它的一个策略，把局中人的策略全体叫做策略集。这个方案必须是一个独立的完整的行动，而不能是若干相关行动中的某一步；一个局中人可以拥有多个策略；一个局中人所拥有的策略的总和构成该局中人的策略集。

对策的基本要素局势：当每个局中人从自己的策略集中选择了一个策略组成的策略组就称为一个局势。支付(赢得)：局势出现后，对策的结果也就确定了，对任一局势，任一局中人都有一个支付值。显然，支付是局势的函数，该函数称为支付函数或赢得函数。当各局中人得失的总和为零时，称这类对策为零和对策，否则称为非零和对策。零和对策中存在两个局中人，其中一个局中人的支出或损失恰好等于另一局中人的收入或赢得。二人零和对策双方的得失用矩阵形式表示，通常称为支付矩阵，二人零和对策也被习惯地称为矩阵对策。

对策问题举例市场购买力竞争问题销售竞争问题费用分摊问题拍卖问题

矩阵对策数学模型矩阵对策就是二人有限零和对策，指的是参加对策的局中人只有两方，每个局中人都只有有限个策略可供选择。在任一局势下，两个局中人的赢得之和总是零，即一方局中人的收入总等于另一方的支付，这表明双方的利益是激烈对抗的。用甲、乙表示局中人双方。假设局中人甲有m个策略(纯策略)，分别以α1，α2，…… αm表示，局中人乙有n个策略(纯策略) ，分别以表β1，β2 ，…… βn示，则局中人甲乙的策略集分别为： S甲={α1，α2，……，αm} S乙={β1，β2 ，…… ，βn }

矩阵对策数学模型当局中人甲选定策略αm和局中人乙选定策略βn后，就形成了一个纯局势(αi，βj)。对任一纯局势(αi，βj)，记局中人甲的赢得值为aij ，并称 ú û ù ê ë é = mn m n a A L M 2 1 22 21 12 11 为局中人甲的赢得矩阵(或为局中人乙的支付矩阵)。当局中人甲、乙和策略集S甲、 S乙及局中人的赢得矩阵A确定后，一个矩阵对策也就给定了。通常将一个矩阵对策记成： G={甲，乙； S甲， S乙；A}或G={S甲， S乙；A}

矩阵对策数学模型齐王赛马中齐王的赢得如下表 α1(上,中,下) α2(上,下,中) α3 (中,上, 下) α4 (中,下,上) 田忌策略齐王策略 [β1] (上,中,下) [β2] (上,下,中) [β3] (中,上, 下) [β4] (中,下,上) [β5] (下,中,上) [β6] (下,上,中) α1(上,中,下) 3 1 -1 α2(上,下,中) α3 (中,上, 下) α4 (中,下,上) α5 (下,中,上) α6 (下,上,中) ú û ù ê ë é - = 3 1 A

矩阵对策的解与对策值设有一矩阵对策G={S甲，S乙；A}，其中S甲={α1，α2，α3，α4}， S乙={β1 ， β2 ， β3 } ú û ù ê ë é - = 6 3 10 1 9 4 2 8 A

矩阵对策的解与对策值 1.求对策问题的解是建立在以下假设基础上每个局中人对双方拥有的全部策略及当各自采取某一策略时的相互得失有充分了解；对策的双方是理智的，他们参与对策的目的是力图扩大自己的收益，因而总是采取对自己有利的策略；双方在相互保密的情况下选择自己的策略，并不允许存在任何协议。

矩阵对策的解与对策值 2.对策问题中，任何一方对对方在下次行动中准备采取的策略可以说是一无所知，双方处于完全对抗的环境中，因而各自都采取保守的态度，从最坏处着眼，并力争较好的结局。 3.对策问题的解：对策双方遵循的对局中人A是最大最小准则，对局中人B则是最小最大准则，相应于这种准则下的对策双方各自采取的策略，称为对策问题的解。 4.对策值：双方采取上述策略，连续重复进行对策，其输赢的平均值称为相应对策问题的对策值，通常用v表示。

最大最小和最小最大准则局中人A策略有:a1,a2,…,am,局中人B策略有:b1,b2,…,bn。当A采取策略ai(i=1,2,…,m)，而B采取策略bj(j=1,2,…,n)时，A的赢得(或B的损失)值为 cij 。 b1 b2 … bn a1 c11 c12 c1n a2 c21 c22 c2n am cm1 cm2 cmn

最大最小和最小最大准则 V c Min Max = }} { V c Max Min = }} { £ V 即选择策略ai时，得到的收入为 } { ij j c Min 再从以上各个最坏结局中找出一个最好的 a j i ij V c Min Max = 1 }} { 2.最小最大准则:当B依据最小最大准则选择策略时，他总考虑不管选哪一个策略都将得到最坏结局，即选择策略bj时，付出的支出为 } { ij i c Max 再从以上各个最坏结局中找出一个最好的 b j i ij V c Max Min = 2 }} { b a V £

具有鞍点的对策鞍点：在矩阵对策中，若有ci1j2=ci2j2=ci’j’时，则ci’j’的值既是在同行中最小又是同列中的最大的，就像一个马鞍的骑坐点所处的位置，故称为鞍点。具有鞍点的对策：如果对策问题具有鞍点，称相应对策为具有鞍点的对策。定义1：设G={S甲，S乙；A}为矩阵对策，其中S甲={α1，α2，…，αm}， S乙={β1 ，β2，…，βn }，A=(aij) m×n。若等式 * max min j i ij a = 成立，记VG=ai*j*。则称VG为对策G的值，称使上式成立的纯局势(αi*, βj*)为G在纯策略下的解(或平衡局势)， αi*和 βj*分别称为局中人甲乙的最优纯策略。

矩阵对策数学模型 ú û ù ê ë é - = 5 3 1 16 4 2 8 7 A min a max 例6-1：求解矩阵对策G={S甲，S乙；A}，其中 ú û ù ê ë é - = 5 3 1 16 4 2 8 7 A ij i a max 5 -3 α4 -1 16 α3 4 2 3 α2 -8 1 -7 α1 β3 β2 β1 j min -8 2 -3 -3 16 2 5

矩阵对策数学模型定理1：矩阵对策G={S甲，S乙；A}在纯策略意义下有解的充分必要条件是存在纯局势(αi*, βj*)，使得对一切i=1,2,… ,m， j=1,2,… ,n均有 j i ij a * £ 定义2：设f (x，y)为一个定义在x∈A及y∈B上的实值函数，如果存在x*∈A， y * ∈B，使得对一切x∈A及y∈B有： ) , ( * y x f £ 则称 (x*，y*)为函数的一个鞍点。

矩阵对策的混合策略 ú û ù ê ë é = 4 5 6 3 A 这时双方若仍使用纯策略，就会出现不稳定状态. 1 2 * 4 5 , max min v a j i ij = > 这时双方若仍使用纯策略，就会出现不稳定状态. 出现双方都不能连续不变地使用某种纯策略，都必须考虑如何随机使用自己的策略，使对方捉摸不到自己使用何种策略。这就是使用混合策略的对策。

矩阵对策的混合策略 å å å ³ Î y E S } 1 , 2 { L = y x a Ay E ) , ( 定义3：矩阵对策G={S甲，S乙；A}，其中S甲={α1，α2，…，αm}， S乙={β1 ，β2，…，βn }，A=(aij) m×n。 å = ³ Î m i x E S 1 * 甲 } , 2 { L å = ³ Î n j y E S } 1 , 2 { * 乙 L 则S1*和S2*分别称为局中人甲和乙的混合策略集；x∈S甲*和y∈S乙*分别称为局中人甲和乙的混合策略；对x∈S甲*，y∈S乙*，称(x，y)为一个混合局势，局中人甲的赢得函数记成 å = i j ij T y x a Ay E ) , ( 这样得到的新的对策记为G*={S甲*,S2*,E},称G*为对策G的混合扩充。

矩阵对策的混合策略 ) , ( y x E Min ) , ( y x E Min Max v = ) , ( y x E Max Min * 2 y x E Min S Î 因此居中人甲应选取x∈S1*,使得上式取极大值(最不利当中的最有利情形)，即局中人甲可保证自己的赢得期望值不少于 ) , ( * 2 1 y x E Min Max v S Î = 同样局中人乙可保证自己的赢得期望值不多于 ) , ( * 1 2 y x E Max Min v S Î = ) , ( * 2 1 y x E Min Max S = Î ) , ( * 1 2 y x E Max Min S = Î 2 * ) , ( v y x E Max Min = £

矩阵对策的混合策略定义4：设G*={S甲*，S乙*；A}是矩阵对策G={S甲，S乙；A}的混合扩充，若 ) , ( * 1 2 y x E Max Min S Î = 记其值为VG。则VG称为对策G*的值，称使上式成立的混合局势(x *, y *)为G在混合策略意义下的解， x *和 y *分别称为局中人甲和乙的最优混合策略。定理2：矩阵对策G={S甲，S乙；A}在混合策略意义下有解的充分必要条件是存在x* ∈S甲*和y* ∈S乙*，使(x *, y * )为函数E(x，y)的一个鞍点，即： ) , ( * y x E £

2×2对策的公式法 ú û ù ê ë é = a A ï î í ì = + 1 ) 2 ( y v a x 2×2对策是指局中人甲的赢得矩阵为2×2阶的，即： ú û ù ê ë é = 22 21 12 11 a A 最优混合策略可通过下列方程求得： ï î í ì = + 1 ) 2 ( 22 21 12 11 y v a x 上述方程组一定有严格非负解： ) ( 21 12 22 11 * 2 1 a V y x G + - =

2×n或m×2对策的图解法 ú û ù ê ë é = 2 5 7 11 3 A ú û ù ê ë é = 2 11 6 7 A ú û 4 5 6 3 A ú û ù ê ë é = 2 5 7 11 3 A ú û ù ê ë é = 2 11 6 7 A

m×n对策的解法定义5：设有矩阵对策G={S甲,S乙；A}，其中S甲={α1,α2,…,αm}， S乙={β1 ,β2,…,βn }，A=(aij) m×n。如果对于一切j=1,2, …,n，都有aij≥ akj ，即矩阵A的第i行元素均不小于第k行的对应元素，则称局中人甲的纯策略αi优超于αk ；同样对于一切i=1,2, …,m，都有aij≤ ail，即矩阵A的第j列元素均不大于第l列的对应元素，则称局中人乙的纯策略βj优超于βl 定理5：设有矩阵对策G={S甲,S乙；A}，其中S甲={α1,α2,…,αm}， S乙={β1 ,β2,…,βn }，A=(aij)m×n。如果纯策略α1被其余纯策略α2,…,αm中之一优超,由可得到一个新的矩阵对策G’={S甲’,S乙；A’}则有： (1)V G= V G’ (2) G’中局中人乙的最优策略就是其在中的最优策略 (3)若(x2*,…xm*)T是G’中局中人甲的最优策略，则x*= (0,x2*, …xm*)便是其在G中的最优策略

m×n对策的解法例3：设赢得矩阵为A，求解这个矩阵对策 ú û ù ê ë é = 3 8 6 5 . 7 4 9 2 A

m×n对策的解法定理4：设x*∈S*甲， y*∈S*乙，则(x*, y*)为矩阵对策G 的解充要条件是：存在数v使得分别是不等式组(1)(2)的解，且v=VG ï î í ì = ³ £ å n j y m i v a x ij , 2 1 ) ( L 定理5：任一矩阵对策G={S甲，S乙，A}，一定存在混合策略意义下的解。

m×n对策的解法 å å å å m i v x , 2 1 L = n j v y , 2 1 L = ï î í ì = ³ m i x ' L = n j v y , 2 1 ' L = ï î í ì = ³ å m i x v n j a ij , 2 1 ' L ï î í ì = £ å n j y v m i a ij , 2 1 ' L ï î í ì = ³ å m i x n j a z P ij , 2 1 min ) ( ' L ï î í ì = £ å n j y m i a z D ij , 2 1 max ) ( ' L

m×n对策的解法例：利用线性规划方法求解赢得矩阵为A的矩阵对策 ú û ù ê ë é = 8 16 4 2 6 12 A