Presentation is loading. Please wait.

Presentation is loading. Please wait.

第十章 博弈论初步.

Similar presentations


Presentation on theme: "第十章 博弈论初步."— Presentation transcript:

1 第十章 博弈论初步

2 博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。
2017年3月16日星期四 第一节 博弈论和策略行为 1.博弈论的含义 博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。 策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。

3 三个基本要素,即参与人、参与人的策略和参与人的支付。
2017年3月16日星期四 2.博弈的三个基本要素 三个基本要素,即参与人、参与人的策略和参与人的支付。 所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付则是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。

4 2017年3月16日星期四 3.博弈的简单分类 根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。

5 假定在某个寡头市场上,只有甲、乙两个厂商。每个厂商都有两个可供选择的策略,即合作和不合作。两个厂商各自选择的策略共形成四个组合。
2017年3月16日星期四 第二节 同时博弈:纯策略均衡 一、例子:寡头博弈 假定在某个寡头市场上,只有甲、乙两个厂商。每个厂商都有两个可供选择的策略,即合作和不合作。两个厂商各自选择的策略共形成四个组合。

6 使用支付矩阵来描述和分析只有两人参加且两人同时进行决策的简单博弈。
2017年3月16日星期四 二、支付矩阵 1.支付矩阵 使用支付矩阵来描述和分析只有两人参加且两人同时进行决策的简单博弈。 矩阵的左边表示甲厂商的策略,上边表示乙厂商的策略;矩阵中四个单元格里的数字组合分别表示博弈的四个结果即支付,其中每一个数字组合的第一个数字是甲厂商得到的支付,第二个数字是乙厂商得到的支付。

7 2017年3月16日星期四 2.子矩阵 支付矩阵可以一分为二,即拆成两个“小”的子支付矩阵。其中,一个为甲厂商的支付矩阵,由原矩阵每一单元格中的第一个数字组成;另一个为乙厂商的支付矩阵,由原矩阵每一单元格中的第二个数字组成。

8 把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。
2017年3月16日星期四 三、条件策略和条件策略组合 1.甲厂商的条件策略和条件策略组合 把甲厂商在乙厂商选择合作条件下的最优策略即合作叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。 把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。 甲厂商分别有两个条件策略和条件策略组合。

9 把乙厂商在甲厂商选择合作条件下的最优策略即合作叫做乙厂商的条件优势策略或相对优势策略,简称条件策略。
2017年3月16日星期四 2.乙厂商的条件策略和条件策略组合 把乙厂商在甲厂商选择合作条件下的最优策略即合作叫做乙厂商的条件优势策略或相对优势策略,简称条件策略。 把与乙厂商的条件策略相联系的策略组合叫做乙厂商的条件优势策略组合或相对优势策略组合,简称条件策略组合。 乙厂商也分别有两个条件策略和条件策略组合。

10 当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。
2017年3月16日星期四 四、纳什均衡 1.博弈均衡的概念 当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。 博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。

11 2017年3月16日星期四 2.纳什均衡的概念 第一,纳什均衡的概念 所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

12 一是“单独改变策略”是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列。
2017年3月16日星期四 2.纳什均衡的概念 第二,对纳什均衡的理解 一是“单独改变策略”是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列。 二是“不会得到好处” 是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。

13 五、寻找纳什均衡的方法——条件策略下划线法
2017年3月16日星期四 五、寻找纳什均衡的方法——条件策略下划线法 1.基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均衡(就是找到在两个数字之下都划线的单元格即可,与这些单元格相对应的策略组合就是所要求的均衡策略组合)。

14 第一,把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵
2017年3月16日星期四 2.条件策略下划线方法的五步法 第一,把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵

15 第二,在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能不只一个),并在其下划线
2017年3月16日星期四 第二,在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能不只一个),并在其下划线

16 第三,在乙厂商的支付矩阵中,找出每一行的最大者(每行的最大者也可能不只一个),并在其下划线
2017年3月16日星期四 第三,在乙厂商的支付矩阵中,找出每一行的最大者(每行的最大者也可能不只一个),并在其下划线

17 第四,将已经划好线的甲厂商的支付矩阵和乙厂商的支付矩阵再合并起来,得到整个的有下划线的支付矩阵
2017年3月16日星期四 第四,将已经划好线的甲厂商的支付矩阵和乙厂商的支付矩阵再合并起来,得到整个的有下划线的支付矩阵

18 第五,在带有下划线的整个的支付矩阵中,找到两个数字之下均划有线的支付组合,则由该支付组合代表的策略组合就是均衡的策略组合
2017年3月16日星期四 第五,在带有下划线的整个的支付矩阵中,找到两个数字之下均划有线的支付组合,则由该支付组合代表的策略组合就是均衡的策略组合

19 2017年3月16日星期四 3.总结 在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略的动机。

20 在同时博弈中,(纯策略的)纳什均衡既可能存在,也可能不存在。
2017年3月16日星期四 六、纳什均衡的存在性、唯一性和最优性 1.存在性 在同时博弈中,(纯策略的)纳什均衡既可能存在,也可能不存在。

21 在纳什均衡存在的条件下,它既可能是唯一的,也可能不唯一。
2017年3月16日星期四 2.唯一性 在纳什均衡存在的条件下,它既可能是唯一的,也可能不唯一。

22 如果纳什均衡存在,则它既可能是最优的,也可能不是最优的。
2017年3月16日星期四 3.最优性 如果纳什均衡存在,则它既可能是最优的,也可能不是最优的。

23 A的支付矩阵有9种可能,B的支付矩阵也有9种可能,因此,整个博弈(亦即A与B两人合在一起)的支付矩阵总共就有9×9=81种可能。
2017年3月16日星期四 七、二人同时博弈的一般理论 1.81种可能的支付矩阵 A的支付矩阵有9种可能,B的支付矩阵也有9种可能,因此,整个博弈(亦即A与B两人合在一起)的支付矩阵总共就有9×9=81种可能。

24 2017年3月16日星期四 2.纳什均衡的五种类型 全部的纳什均衡可分为五种类型,分别有四个均衡(包括1种情况)、三个均衡(包括12种情况)、两个均衡(包括38种情况) 、一个均衡(包括28种情况)和零个均衡(包括2种情况)。

25 第三节 同时博弈:混合策略均衡 一、不存在纯策略均衡时的混合策略均衡 1.混合策略 第一,“确定性”选择
2017年3月16日星期四 第三节 同时博弈:混合策略均衡 一、不存在纯策略均衡时的混合策略均衡 1.混合策略 第一,“确定性”选择 在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是“确定”的,即某参与人在选择某个策略的时候,他不能再同时选择其他的策略,此时相应的条件策略也是“确定”的;最后,当参与人的条件策略是“确定”的时候,最终的博弈均衡(如果有的话)也是“确定”的。

26 在现实生活中,人们对策略的选择常常并不像前面所说的那样“非此即彼”,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。
2017年3月16日星期四 第二,“混合性”选择 在现实生活中,人们对策略的选择常常并不像前面所说的那样“非此即彼”,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。

27 把甲厂商和乙厂商原来的策略叫做“纯”策略,把赋予这些纯策略的概率向量叫做“混合”策略。
2017年3月16日星期四 第三,“混合”策略的概念 把甲厂商和乙厂商原来的策略叫做“纯”策略,把赋予这些纯策略的概率向量叫做“混合”策略。

28 参与人的混合策略组合是一个概率向量组合,其中,每一个概率向量是相应参与人的一个混合策略。
2017年3月16日星期四 2.混合策略组合 参与人的混合策略组合是一个概率向量组合,其中,每一个概率向量是相应参与人的一个混合策略。

29 2017年3月16日星期四 3.期望支付 在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。不过,由于现在每个参与人都是以一定的概率来选择其纯策略的,故相应的支付也就成了所谓的“期望支付”,即支付的期望值。

30 利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略)。
2017年3月16日星期四 4.条件混合策略 利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略)。

31 参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进一步来确定混合策略的纳什均衡。
2017年3月16日星期四 5.混合策略的纳什均衡 参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进一步来确定混合策略的纳什均衡。

32 图10—1 混合策略的纳什均衡(一)

33 2017年3月16日星期四 二、存在纯策略均衡时的混合策略均衡 求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况,而且也适用于纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均衡之中。

34 使用与纯策略博弈的一般均衡相对应的混合策略博弈的一般模型进行分析。
2017年3月16日星期四 三、混合策略博弈的一般理论 1.模型 使用与纯策略博弈的一般均衡相对应的混合策略博弈的一般模型进行分析。

35 图10—2 混合策略的纳什均衡(二)

36 两个参与人的全部策略分别包括了各自的两个纯策略。
2017年3月16日星期四 2.混合策略与混合策略组合 两个参与人的全部策略分别包括了各自的两个纯策略。

37 运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。
2017年3月16日星期四 3.期望支付 运用两个参与人的混合策略组合,可以分别表示出两个参与人得到的支付。

38 根据A的期望支付公式,可以确定其条件混合策略。
2017年3月16日星期四 4.参与人A的条件混合策略 根据A的期望支付公式,可以确定其条件混合策略。

39 图10—3 A的条件混合策略(一)

40 图10—4 A的条件混合策略(二)

41 图10—4 A的条件混合策略(二)

42 图10—5 A的条件混合策略(三)

43 图10—6 A的条件混合策略(四)

44 根据B的期望支付公式,可以确定其条件混合策略。
2017年3月16日星期四 5.参与人B的条件混合策略 根据B的期望支付公式,可以确定其条件混合策略。

45 2017年3月16日星期四 6.纳什均衡 第一,混合策略纳什均衡的决定 给定A的一个支付矩阵,就有A的一个条件混合策略曲线,给定B的一个支付矩阵,又有B的一个条件混合策略曲线。如果把这两个条件混合策略曲线放在同一个图中,则其交点就决定了相应情况下的混合策略纳什均衡。

46 第二,A与B的条件混合策略的81种“搭配”可能
2017年3月16日星期四 第二,A与B的条件混合策略的81种“搭配”可能 A的条件混合策略曲线有9种情况,B的条件混合策略曲线也有9种情况,因此,A与B的条件混合策略曲线之间的两两“搭配”共有9×9=81种可能,并最终形成混合策略纳什均衡的7种类型的“集合”,即“单位平面”、三条线段、两条线段、一条线段、三个点、两个点和一个点。

47 在该博弈中,两个参与者是竞争者和垄断者。
2017年3月16日星期四 第四节 序贯博弈 一、例子:竞争者—垄断者博弈 1.两个参与者 在该博弈中,两个参与者是竞争者和垄断者。

48 竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根据竞争者的行动决定对其“容忍” 还是“抵抗” 。
2017年3月16日星期四 2.两个参与者的决策顺序及其策略 竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根据竞争者的行动决定对其“容忍” 还是“抵抗” 。 竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗两个策略。因此,总共有四个策略组合。 每一策略组合中,第一项是先行动者即竞争者的策略,第二项是后行动者即垄断者的策略。

49 “起点”又叫做“初始决策点”,通常只有一个。起点是博弈树的“根”,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。
2017年3月16日星期四 二、博弈树 1.博弈树的起点 “起点”又叫做“初始决策点”,通常只有一个。起点是博弈树的“根”,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。

50 图10—7 竞争者—垄断者博弈

51 从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。
2017年3月16日星期四 2.博弈树的线段 从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。

52 中间点又叫做“中间决策点”,通常至少应有两个。通常在这些中间决策点的旁边标上另一参与人,表示中间点是另一参与人做决策的地方。
2017年3月16日星期四 3.博弈树的中间点 中间点又叫做“中间决策点”,通常至少应有两个。通常在这些中间决策点的旁边标上另一参与人,表示中间点是另一参与人做决策的地方。

53 与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。
2017年3月16日星期四 4.博弈树的终点 第一,终点不是决策点 终点是博弈结束的地方。 与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。

54 一是代表博弈的一个策略组合——从起点开始导向某个终点的所有线段按先后秩序排列的一个组合。
2017年3月16日星期四 第二,终点的两层含义 一是代表博弈的一个策略组合——从起点开始导向某个终点的所有线段按先后秩序排列的一个组合。 二是代表与某一个策略组合相对应的一个支付组合——在每一个终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行动者的支付,第二个数字是后行动者的支付。

55 2017年3月16日星期四 三、纳什均衡 1.序贯博弈中的纳什均衡 在竞争者—垄断者博弈中,第一个终点,即旁边标有支付组合(1,4)所代表的策略组合(进入,容忍)是一个纳什均衡。因为在该策略组合上,没有哪个参与人愿意单独改变自己的策略。

56 2017年3月16日星期四 2.序贯博弈中的纳什均衡也可能不止一个 比如,在情侣博弈中,有两个纳什均衡,一个是(足球,足球),即男方先选择足球,女方然后也选择足球;另一个是(芭蕾,芭蕾),即男方先选择芭蕾,女方然后也选择芭蕾。

57 图10—8 情侣博弈

58 第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈;
2017年3月16日星期四 四、纳什均衡的精炼:逆向归纳法 1.逆向归纳法的两个步骤 第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈; 第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解。

59 2.逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也是逆向归纳策略
2017年3月16日星期四 2.逆向归纳策略总是纳什均衡,尽管纳什均衡并不一定也是逆向归纳策略

60 图10—9 简化的情侣博弈(1)

61 图10—10 简化的情侣博弈(2)

62 从情侣博弈的例子中可以看到所谓的“先动优势”——先行动者的得益大于后行动者的得益。
2017年3月16日星期四 3.先动优势 从情侣博弈的例子中可以看到所谓的“先动优势”——先行动者的得益大于后行动者的得益。 比如,男方先动,逆向归纳的结果就是对男方更加有利的纳什均衡(足球,足球;如果情侣博弈改为女方先行动,则逆向归纳的结果就是对女方更加有利的纳什均衡(芭蕾,芭蕾)。

63 图10—11 情侣博弈:女方先动

64 图10—12 简化的竞争者—垄断者博弈(1)

65 图10—13 简化的竞争者—垄断者博弈(2)

66 2017年3月16日星期四 4.序贯博弈与同时博弈的一个重要区别 当博弈是“同时”的时候,如果出现多重纳什均衡,常常无法确定最终实现的是哪一个纳什均衡,但是,当博弈是“序贯”的时候,即使纳什均衡是多重的,往往能够从中确定一个最终的均衡。这是因为,与同时博弈相比,序贯博弈提供了更多的信息——关于参与人决策秩序的信息。


Download ppt "第十章 博弈论初步."

Similar presentations


Ads by Google