Presentation is loading. Please wait.

Presentation is loading. Please wait.

引例 囚徒困境: 甲、乙两个人一起携枪准备作案,被警察发现抓了起来。如果两个人都不坦白,警察会以非法携带枪支罪而将二人各判1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。这两个囚犯该怎么办? 斗鸡博弈: 两只斗鸡遇到一起,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,则双方打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败

Similar presentations


Presentation on theme: "引例 囚徒困境: 甲、乙两个人一起携枪准备作案,被警察发现抓了起来。如果两个人都不坦白,警察会以非法携带枪支罪而将二人各判1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。这两个囚犯该怎么办? 斗鸡博弈: 两只斗鸡遇到一起,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,则双方打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败"— Presentation transcript:

1 引例 囚徒困境: 甲、乙两个人一起携枪准备作案,被警察发现抓了起来。如果两个人都不坦白,警察会以非法携带枪支罪而将二人各判1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。这两个囚犯该怎么办? 斗鸡博弈: 两只斗鸡遇到一起,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,则双方打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。这两只公鸡该怎么办?

2 引例 在社会生活中,经常碰到各种各样具有竞争或利益相对抗的活动,如下棋、打扑克、为争夺市场开展的广告战、军事斗争中双方兵力的对垒等,竞争的各方总是希望击败对手,取得尽可能好的结果。竞争各方都想用自己最好的战术去取胜,这就是对策现象。 对策现象实际上是一类特殊的决策,在不确定型的决策分析中,决策者的对手是“大自然”,它对决策者的各种策略不产生反应,更没有报复行为。但在对策现象中,代替“大自然”的是有理智的人,因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应。我国历史上齐王和田忌赛马的故事,生动的说明研究对策问题的意义。

3 产生与发展 1944年,冯诺依曼与曼彻斯特发表了题为《对策论和经济行为》。
50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时,非合作对策也开始创立。 纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了“囚徒困境”问题。 60年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼( )则把不完全信息引入对策论的研究。

4 对策的基本要素 局中人:在一个对策行为中,有权决定自己行动方案的对策参加者。 它可是一个人,也可以是一个集团
局中人必须是有决策权的主体,而不是参谋或从属人员 局中人可以有两方,也可以有多方 当存在多方的情况下,局中人之间可以有结盟和不结盟之分

5 对策的基本要素 策略:在一局对策中,把局中人的一个可行方案称为它的一个策略,把局中人的策略全体叫做策略集。
这个方案必须是一个独立的完整的行动,而不能是若干相关行动中的某一步; 一个局中人可以拥有多个策略; 一个局中人所拥有的策略的总和构成该局中人的策略集。

6 对策的基本要素 局势:当每个局中人从自己的策略集中选择了一个策略组成的策略组就称为一个局势。
支付(赢得):局势出现后,对策的结果也就确定了,对任一局势,任一局中人都有一个支付值。显然,支付是局势的函数,该函数称为支付函数或赢得函数。 当各局中人得失的总和为零时,称这类对策为零和对策,否则称为非零和对策。 零和对策中存在两个局中人,其中一个局中人的支出或损失恰好等于另一局中人的收入或赢得。 二人零和对策双方的得失用矩阵形式表示,通常称为支付矩阵,二人零和对策也被习惯地称为矩阵对策。

7 对策问题举例 市场购买力竞争问题 销售竞争问题 费用分摊问题 拍卖问题

8 矩阵对策数学模型 矩阵对策就是二人有限零和对策,指的是参加对策的局中人只有两方,每个局中人都只有有限个策略可供选择。在任一局势下,两个局中人的赢得之和总是零,即一方局中人的收入总等于另一方的支付,这表明双方的利益是激烈对抗的。 用甲、乙表示局中人双方。假设局中人甲有m个策略(纯策略),分别以α1,α2,…… αm表示,局中人乙有n个策略(纯策略) ,分别以表β1,β2 ,…… βn示,则局中人甲乙的策略集分别为: S甲={α1,α2,……,αm} S乙={β1,β2 ,…… ,βn }

9 矩阵对策数学模型 当局中人甲选定策略αm和局中人乙选定策略βn后,就形成了一个纯局势(αi,βj)。对任一纯局势(αi,βj),记局中人甲的赢得值为aij ,并称 ú û ù ê ë é = mn m n a A L M 2 1 22 21 12 11 为局中人甲的赢得矩阵(或为局中人乙的支付矩阵)。 当局中人甲、乙和策略集S甲、 S乙及局中人的赢得矩阵A确定后,一个矩阵对策也就给定了。通常将一个矩阵对策记成: G={甲,乙; S甲, S乙;A}或G={S甲, S乙;A}

10 矩阵对策数学模型 齐王赛马中齐王的赢得如下表 α1(上,中,下) α2(上,下,中) α3 (中,上, 下) α4 (中,下,上)
田忌策略 齐王策略 [β1] (上,中,下) [β2] (上,下,中) [β3] (中,上, 下) [β4] (中,下,上) [β5] (下,中,上) [β6] (下,上,中) α1(上,中,下) 3 1 -1 α2(上,下,中) α3 (中,上, 下) α4 (中,下,上) α5 (下,中,上) α6 (下,上,中) ú û ù ê ë é - = 3 1 A

11 矩阵对策的解与对策值 设有一矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,α3,α4}, S乙={β1 , β2 , β3 } ú û ù ê ë é - = 6 3 10 1 9 4 2 8 A

12 矩阵对策的解与对策值 1.求对策问题的解是建立在以下假设基础上 每个局中人对双方拥有的全部策略及当各自采取某一策略时的相互得失有充分了解;
对策的双方是理智的,他们参与对策的目的是力图扩大自己的收益,因而总是采取对自己有利的策略; 双方在相互保密的情况下选择自己的策略,并不允许存在任何协议。

13 矩阵对策的解与对策值 2.对策问题中,任何一方对对方在下次行动中准备采取的策略可以说是一无所知,双方处于完全对抗的环境中,因而各自都采取保守的态度,从最坏处着眼,并力争较好的结局。 3.对策问题的解:对策双方遵循的对局中人A是最大最小准则,对局中人B则是最小最大准则,相应于这种准则下的对策双方各自采取的策略,称为对策问题的解。 4.对策值:双方采取上述策略,连续重复进行对策,其输赢的平均值称为相应对策问题的对策值,通常用v表示。

14 最大最小和最小最大准则 局中人A策略有:a1,a2,…,am,局中人B策略有:b1,b2,…,bn。当A采取策略ai(i=1,2,…,m),而B采取策略bj(j=1,2,…,n)时,A的赢得(或B的损失)值为 cij 。 b1 b2 bn a1 c11 c12 c1n a2 c21 c22 c2n am cm1 cm2 cmn

15 最大最小和最小最大准则 V c Min Max = }} { V c Max Min = }} { £ V
即选择策略ai时,得到的收入为 } { ij j c Min 再从以上各个最坏结局中找出一个最好的 a j i ij V c Min Max = 1 }} { 2.最小最大准则:当B依据最小最大准则选择策略时,他总考虑不管选哪一个策略都将得到最坏结局, 即选择策略bj时,付出的支出为 } { ij i c Max 再从以上各个最坏结局中找出一个最好的 b j i ij V c Max Min = 2 }} { b a V

16 具有鞍点的对策 鞍点:在矩阵对策中,若有ci1j2=ci2j2=ci’j’时,则ci’j’的值既是在同行中最小又是同列中的最大的,就像一个马鞍的骑坐点所处的位置,故称为鞍点。 具有鞍点的对策:如果对策问题具有鞍点,称相应对策为具有鞍点的对策。 定义1:设G={S甲,S乙;A}为矩阵对策,其中S甲={α1,α2,…,αm}, S乙={β1 ,β2,…,βn },A=(aij) m×n。若等式 * max min j i ij a = 成立,记VG=ai*j*。则称VG为对策G的值,称使上式成立的纯局势(αi*, βj*)为G在纯策略下的解(或平衡局势), αi*和 βj*分别称为局中人甲乙的最优纯策略。

17 矩阵对策数学模型 ú û ù ê ë é - = 5 3 1 16 4 2 8 7 A min a max
例6-1:求解矩阵对策G={S甲,S乙;A},其中 ú û ù ê ë é - = 5 3 1 16 4 2 8 7 A ij i a max 5 -3 α4 -1 16 α3 4 2 3 α2 -8 1 -7 α1 β3 β2 β1 j min -8 2 -3 -3 16 2 5

18 矩阵对策数学模型 定理1:矩阵对策G={S甲,S乙;A}在纯策略意义下有解的充分必要条件是存在纯局势(αi*, βj*),使得对一切i=1,2,… ,m, j=1,2,… ,n均有 j i ij a * 定义2:设f (x,y)为一个定义在x∈A及y∈B上的实值函数,如果存在x*∈A, y * ∈B,使得对一切x∈A及y∈B有: ) , ( * y x f 则称 (x*,y*)为函数的一个鞍点。

19 矩阵对策的混合策略 ú û ù ê ë é = 4 5 6 3 A 这时双方若仍使用纯策略,就会出现不稳定状态.
1 2 * 4 5 , max min v a j i ij = > 这时双方若仍使用纯策略,就会出现不稳定状态. 出现双方都不能连续不变地使用某种纯策略,都必须考虑如何随机使用自己的策略,使对方捉摸不到自己使用何种策略。这就是使用混合策略的对策。

20 矩阵对策的混合策略 å å å ³ Î y E S } 1 , 2 { L = y x a Ay E ) , (
定义3:矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,…,αm}, S乙={β1 ,β2,…,βn },A=(aij) m×n。 å = Î m i x E S 1 * } , 2 { L å = Î n j y E S } 1 , 2 { * L 则S1*和S2*分别称为局中人甲和乙的混合策略集;x∈S甲*和y∈S乙*分别称为局中人甲和乙的混合策略;对x∈S甲*,y∈S乙*,称(x,y)为一个混合局势,局中人甲的赢得函数记成 å = i j ij T y x a Ay E ) , ( 这样得到的新的对策记为G*={S甲*,S2*,E},称G*为对策G的混合扩充。

21 矩阵对策的混合策略 ) , ( y x E Min ) , ( y x E Min Max v = ) , ( y x E Max Min
* 2 y x E Min S Î 因此居中人甲应选取x∈S1*,使得上式取极大值(最不利当中的最有利情形),即局中人甲可保证自己的赢得期望值不少于 ) , ( * 2 1 y x E Min Max v S Î = 同样局中人乙可保证自己的赢得期望值不多于 ) , ( * 1 2 y x E Max Min v S Î = ) , ( * 2 1 y x E Min Max S = Î ) , ( * 1 2 y x E Max Min S = Î 2 * ) , ( v y x E Max Min =

22 矩阵对策的混合策略 定义4:设G*={S甲*,S乙*;A}是矩阵对策G={S甲,S乙;A}的混合扩充,若
) , ( * 1 2 y x E Max Min S Î = 记其值为VG。则VG称为对策G*的值,称使上式成立的混合局势(x *, y *)为G在混合策略意义下的解, x *和 y *分别称为局中人甲和乙的最优混合策略。 定理2:矩阵对策G={S甲,S乙;A}在混合策略意义下有解的充分必要条件是存在x* ∈S甲*和y* ∈S乙*,使(x *, y * )为函数E(x,y)的一个鞍点,即: ) , ( * y x E

23 2×2对策的公式法 ú û ù ê ë é = a A ï î í ì = + 1 ) 2 ( y v a x
2×2对策是指局中人甲的赢得矩阵为2×2阶的,即: ú û ù ê ë é = 22 21 12 11 a A 最优混合策略可通过下列方程求得: ï î í ì = + 1 ) 2 ( 22 21 12 11 y v a x 上述方程组一定有严格非负解: ) ( 21 12 22 11 * 2 1 a V y x G + - =

24 2×n或m×2对策的图解法 ú û ù ê ë é = 2 5 7 11 3 A ú û ù ê ë é = 2 11 6 7 A ú û
4 5 6 3 A ú û ù ê ë é = 2 5 7 11 3 A ú û ù ê ë é = 2 11 6 7 A

25 m×n对策的解法 定义5:设有矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,…,αm}, S乙={β1 ,β2,…,βn },A=(aij) m×n。如果对于一切j=1,2, …,n,都有aij≥ akj ,即矩阵A的第i行元素均不小于第k行的对应元素,则称局中人甲的纯策略αi优超于αk ;同样对于一切i=1,2, …,m,都有aij≤ ail,即矩阵A的第j列元素均不大于第l列的对应元素,则称局中人乙的纯策略βj优超于βl 定理5:设有矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,…,αm}, S乙={β1 ,β2,…,βn },A=(aij)m×n。如果纯策略α1被其余纯策略α2,…,αm中之一优超,由可得到一个新的矩阵对策G’={S甲’,S乙;A’}则有: (1)V G= V G’ (2) G’中局中人乙的最优策略就是其在中的最优策略 (3)若(x2*,…xm*)T是G’中局中人甲的最优策略,则x*= (0,x2*, …xm*)便是其在G中的最优策略

26 m×n对策的解法 例3:设赢得矩阵为A,求解这个矩阵对策 ú û ù ê ë é = 3 8 6 5 . 7 4 9 2 A

27 m×n对策的解法 定理4:设x*∈S*甲, y*∈S*乙,则(x*, y*)为矩阵对策G 的解充要条件是:存在数v使得分别是不等式组(1)(2)的解,且v=VG ï î í ì = å n j y m i v a x ij , 2 1 ) ( L 定理5:任一矩阵对策G={S甲,S乙,A},一定存在混合策略意义下的解。

28 m×n对策的解法 å å å å m i v x , 2 1 L = n j v y , 2 1 L = ï î í ì = ³ m i x
' L = n j v y , 2 1 ' L = ï î í ì = å m i x v n j a ij , 2 1 ' L ï î í ì = å n j y v m i a ij , 2 1 ' L ï î í ì = å m i x n j a z P ij , 2 1 min ) ( ' L ï î í ì = å n j y m i a z D ij , 2 1 max ) ( ' L

29 m×n对策的解法 例:利用线性规划方法求解赢得矩阵为A的矩阵对策 ú û ù ê ë é = 8 16 4 2 6 12 A


Download ppt "引例 囚徒困境: 甲、乙两个人一起携枪准备作案,被警察发现抓了起来。如果两个人都不坦白,警察会以非法携带枪支罪而将二人各判1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。这两个囚犯该怎么办? 斗鸡博弈: 两只斗鸡遇到一起,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,则双方打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败"

Similar presentations


Ads by Google