Presentation is loading. Please wait.

Presentation is loading. Please wait.

博弈论及其应用 第3章 纳什均衡的扩展与精炼 《博弈论及其应用》 (汪贤裕).

Similar presentations


Presentation on theme: "博弈论及其应用 第3章 纳什均衡的扩展与精炼 《博弈论及其应用》 (汪贤裕)."— Presentation transcript:

1 博弈论及其应用 第3章 纳什均衡的扩展与精炼 《博弈论及其应用》 (汪贤裕)

2 第3章 纳什均衡的扩展与精炼 主要内容 §3.1 不完全信息的静态博弈 §3.2 完全且完美信息动态博弈 §3.3 重复博弈
§3.2 完全且完美信息动态博弈 §3.3 重复博弈 §3.4 不完全信息的动态博弈

3 §3.1 不完全信息的静态博弈 §3.1.1 不完全信息博弈与海萨尼转换 §3.1.2 规范式表述和贝叶斯纳什均衡
§3.1.3 贝叶斯静态博弈的典型模型

4 §3.1.1 不完全信息博弈与海萨尼转换 ※ 不完全信息的含义与形式 ※ 海萨尼转换 ※ 例 不完全信息的行业博弈

5 不完全信息的含义与形式 不完全信息博弈中的不完全信息专指一种博弈局势中局中人对其他局中人与该种博弈局势有关的事前信息了解不充分,而不是博弈中产生的与局中人实际策略选择有关的信息。 这里所谓的事前信息是指关于在博弈实际开始之前局中人所处地位或者状态的信息,这种地位与状态对于博弈局势会产生影响。

6 不完全信息的含义与形式 博弈中的不完全信息具有多种形式,如局中人对其他局中人(或自己)所掌握的自然资源、人力资源、商业经验、决策能力的了解不充分,对其他局中人偏好与品位的了解不完全,对其他局中人可用策略的了解不完全。对处于同一种博弈局势的局中人的具体数目了解不完全,等等。 这些不完全信息情形在博弈论分析中可以统归为一种不完全信息:局中人对其他局中人的支付函数的不完全了解。

7 海萨尼转换 在静态博弈中,我们把各种不完全信息归结为局中人的各种不同的类型。若局中人对参加博弈的每一个局中人的类型都了解,则对各个局势(即策略组合)下的收益(支付函数)就知道了。 对这种设想,我们引入海萨尼转换。

8 海萨尼转换 (1)引入一个虚拟的局中人——“自然”(nature)或者说是“上帝”(God) ,他不考虑自己的得失,仅赋予博弈中各局中人的类型向量 ,其中 ti 属于第i个局中人的可行类型空间 Ti 。 (Ti 为局中人i 的特征的完备描述); (2)自然只把局中人 i 的真实的类型Ti 告诉局中人 i 本人,却不让其他局中人知道。但“自然”将把在 上的概率分布 告诉每一个局中人;

9 海萨尼转换(续) (3)所有局中人同时行动,局中人 i 从自己的策略空间 S i 中选择策略s i ;其中局中人 i 的策略空间 S i 与局中人i 的类型ti 有关,一般记为 Si ( ti ) ; (4)各局中人 i 除“自然”外的支付函数为: ui ( s1,s2,…,si,…,sn,ti ) 。

10 例 不完全信息的行业博弈 行业内有一个在位者(局中人1)和一个潜在的进入者(局中人2)。局中人1 决定是否在某地建立一个新工厂,同时局中人2 决定是否在该地进入该行业。局中人2不知道局中人1建厂的成本是高还是低,但局中人1自己知道。这个博弈的收益如下表所示。

11 例 不完全信息的行业博弈(续) 表 不完全信息的行业博弈规范式

12 例 不完全信息的行业博弈(续) 在该例中,进入者似乎是在与两个不同的在位者博弈,一个是高成本的在位者,另一个是低成本的在位者。一般地,如果在位者有T种可能的不同成本函数,进入者就似乎是在与T个不同的在位者博弈。 在1967年以前,博弈论专家认为这样的不完全信息博弈是没法分析的,因为当—个局中人并不知道他在与谁博弈时,博弈的规则是没有定义的。直到1967年,海萨尼提出了海萨尼转换解决了这个问题。

13 例 3.1.1 不完全信息的行业博弈(续) 在该例中,自然决定了局中人Ⅰ有“高成本”和“低成本”两种类型,局中人Ⅱ只有一种类型。
若局中人Ⅰ属于“高成本”类型,则构成表3.1.1中左边一个标准的完全信息下的静态博弈。若局中人Ⅰ属于“低成本”类型,则构成表3.1.1中右边一个标准的完全信息下的静态博弈。 局中人Ⅰ知道自己的类型,局中人Ⅱ不知道局中人Ⅰ的类型,但两个局中人对“自然”给与局中人Ⅰ的类型的概率分布具有一致的判断。不妨设 , 。下节讨论

14 §3.1.2 规范式表述和贝叶斯纳什均衡 ※ 定义3.1.1 不完全信息的静态博弈 ※ 定义3.1.2 贝叶斯纳什均衡
※ 定义 不完全信息的静态博弈 ※ 定义 贝叶斯纳什均衡 ※ 贝叶斯纳什均衡与一般纳什均衡的区别 ※ 贝叶斯纳斯均衡的存在性

15 定义3.1.1 不完全信息的静态博弈 不完全信息静态博弈包括如下4个要素。 局中人集合 。 每个局中人有个类型空间 。以及在全体类型空间
局中人集合 。 每个局中人有个类型空间 。以及在全体类型空间 上的概率分布 。 每个局中人有(与自身的类型 相关的)策略集 且策略集 与其它局中人的类型无关 。 每一个局中人都有其收益函数 ,即收益函数不仅依赖于策略组合 ,也依赖于自身的类型 。

16 定义3.1.1 不完全信息的静态博弈(续) 满足以上4个要素都是共同知识的博弈称为不完全信息的静态博弈,也称为贝叶斯静态博弈,记为
当局中人 自身的类型为 时,他选择策略 的期望收益为: (3.1.2)

17 定义3.1.2 贝叶斯纳什均衡 在贝叶斯静态博弈 中,若 是一个策略组合,且对每一个 和 都有: (3.1.3)
定义 贝叶斯纳什均衡 在贝叶斯静态博弈 中,若 是一个策略组合,且对每一个 和 都有: (3.1.3) 则称策略组合 是一个贝叶斯纳什均衡。

18 (2)贝叶斯纳什均衡研究的是局中人的策略选择,并且这种策略选择依赖于自身的类型。
贝叶斯纳什均衡与一般纳什均衡的不同点 (1)贝叶斯纳什均衡用贝叶斯公式得到的,以概率分布作为依据,考虑其它局中人不同类型下的期望收益。 (2)贝叶斯纳什均衡研究的是局中人的策略选择,并且这种策略选择依赖于自身的类型。

19 贝叶斯纳什均衡存在性 一个凹函数一定是拟凹函数。 (3.1.4)

20 贝叶斯纳什均衡存在性(续) (3.1.5)

21 贝叶斯纳什均衡存在性(续)

22 贝叶斯纳什均衡存在性(续)

23 贝叶斯纳什均衡存在性(续) 比较定理3.1.2和定理2.2.3,显然定理3.1.2的条件更强些。其原因在于在贝叶斯博弈中,局中人 的收益是纯策略下的期望收益(式3.1.2)或局中人 的收益函数 可以随着类型的变化而变化。当 是 的凹函数,则其凸组合 也是 的凹函数,这就保证了贝叶斯纳什均衡点的存在。但是若 是拟凹函数,则它的凸组合不能保证是拟凹函数。

24 贝叶斯纳什均衡存在性(续)

25 贝叶斯纳什均衡存在性(续) 在贝叶斯静态博弈 中,若 是一个混合策略组合,且对每一个 和对 任意的 都有
在贝叶斯静态博弈 中,若 是一个混合策略组合,且对每一个 和对 任意的 都有 则称混合策略组合 是一个混合策略下的贝叶斯纳什均衡。这里的 E 是指对混合策略 下局中人 的收益 期望。 (3.1.6)

26 贝叶斯纳什均衡存在性(续) 定理3.1.3 在贝叶斯静态博弈 中,
定理 在贝叶斯静态博弈 中, 是 的一个混合策略下的贝叶斯纳什均衡的充分必要条件是:对每一个局中人和每一个纯策略 有: 其中 是局中人i的一个纯策略,即特殊的混合策略(0,…,0,1,0,…,0)。 定理 在贝叶斯静态博弈中,必有混合策略下的贝叶斯纳什均衡。 (3.1.7)

27 例3.1.1 不完全信息的行业博弈(续) 采用定义3.1.4和定理3.1.3对例3.1.1进行进行如下的详细求解讨论。
在位者(局中人1)有两种类型 , 代表高成本, 代表低成本及潜在进入者(局中人2)只有1种类型, 。自然决定了局中人类型上的概率分布为:

28 例 不完全信息的行业博弈(续) 设在高成本时局中人1的策略集为 。 代表建厂, 表示不建厂。局中人1此时采用 策略的概率为 ( ),采用策略 概率为 。在低成本时局中人1的策略集为 , 代表建厂, 代表不建厂。局中人1此时采用策略 的概率 ( ),采用策略策略 的概率为 。 局中人2只有一种类型,则其策略集 , 代表进入, 代表不进入。局中人2此时采用策略 的概率为 ( ),采用策略 的概率为 。

29 例 不完全信息的行业博弈(续) 局中人1在高成本时期望收益记为 ,在低成本时的期望收益为 ,局中人2的期望收益记为 。

30 例 不完全信息的行业博弈(续) 设 是混合策略下的贝叶斯纳什均衡,由定理3.1.3,应满足下列不等式 化简

31 例 不完全信息的行业博弈(续) 由以化简所得不等式可进一步得其等价关系为:

32 例 不完全信息的行业博弈(续) 由以上不等式组(I),只能得到 。将 带入不等式组 有:

33 例 3.1.1 不完全信息的行业博弈(续) 为求解不等式组 和 类似双矩阵博弈的求解方法 可以作图: 在图3.1.1中,满足不等式组 和
为求解不等式组 和 类似双矩阵博弈的求解方法 可以作图: 在图3.1.1中,满足不等式组 和 不等式组 的解为A点和BC线段。 因此,原博弈的贝叶斯纳什均衡集为: 图3.1.1 行业博弈的贝叶斯纳斯均衡求解

34 例 3.1.1 不完全信息的行业博弈(续) 以上混合策略贝叶斯纳什均衡包含两个纯策略贝叶斯纳什均衡。
(1)在位者为高成本和低成本都不建厂,而进入者建厂。 (2)在位者为高成本时不建厂,为低成本时建厂,而进入者不建厂。 (3)另有无穷多个组合策略下的贝叶斯纳什均衡:在位者为高成本时不建厂,为低成本时建厂,进入者以 ( ) 的概率进入,以 的概率不进入。 以上的贝叶斯纳什均衡与只考虑在位者是低成本与进入者之间的双矩阵博弈纳什均衡是有差异的,源于威慑作用。

35 §3.1.3 贝叶斯静态博弈的应用 ※ 例3.1.2不完全信息下的古诺模型 ※ 例3.1.3 酒商与顾客的博弈
※ 例3.1.2不完全信息下的古诺模型 ※ 例3.1.3 酒商与顾客的博弈 ※ 例3.1.4独立私人价值下的一级密封拍卖 ※ 例3.1.5双向拍卖

36 市场上有两个厂商生产同一种产品。厂商1、2生产的商品的数量分别为 和 。他们的边际成本不同。厂商1的边际成本为
例3.1.2 不完全信息下的古诺模型 市场上有两个厂商生产同一种产品。厂商1、2生产的商品的数量分别为 和 。他们的边际成本不同。厂商1的边际成本为 ,厂商2有两种边际成本,低成本为 高成本为 。即厂商2有自己成本的私人信息。厂商1对厂商2的成本是高还是低有一个判断信念,即高成本的可能性为 ,低成本的可能性为 ,这里假定 。这个判断信念得到厂商1和厂商2的共同认同。同时,市场的逆需求函数 。 是大于边际成本的一个常数,这里取 。两个厂商在没有任何协议和约定的情况下,同时分别决定生产产量,以追求市场利润最大化。

37 例3.1.2 不完全信息下的古诺模型(续) 按照对不完全信息博弈海萨尼转换的方法,可以视为“自然”决定厂商类型,厂商1有1种类型,厂商2有两种类型 , 表示低成本, 表示高成本。自然将厂商2的类型通知了厂商2,并且给出了在类型空间上的概率分布: 。 是一个确定常数,这里取 。

38 例3.1.2不完全信息下的古诺模型(续) 这时厂商2在低成本类型下生产 时的收益函数为: (3.1.18)
这时厂商2在低成本类型下生产 时的收益函数为: (3.1.18) 厂商2在高成本类型 生产 时的收益函数为: (3.1.19) 厂商1只有一种类型,而对厂商2的两种类型,它生产的期望收益为: (3.1.20)

39 例3.1.2不完全信息下的古诺模型(续) 都是凹函数,分别求 、 并令为0,有: 求解有:
(3.1.22) 显然,上述三个函数对自身变量 都是凹函数,分别求 、 并令为0,有: 求解有: 即厂商1生产产量为 ,厂商2在低成本类型时生产产量为 ,在高成本类型时生产产量为 。

40 例3.1.2不完全信息下的古诺模型(续) 将题中给的具体数字 : 代入(3.1.22)式 有:
代入(3.1.22)式 有: 再代回到(3.1.18)(3.1.19)和(3.1.20)式 有

41 例3.1.3 酒商与顾客的博弈 一商人到某城镇去卖酒。该商人可能是诚实的,卖好酒。也可能是不诚实的,卖假酒。他有加强宣传卖高价和一是一般卖出只卖低价两个策略。而该城镇中的消费者也有两类,有饮酒的嗜好的和无此嗜好的。消费者有买酒和不买酒两个策略。 商人不知道来买酒的消费者是有嗜好还是无嗜好的;而消费者也不知道商人是诚实还是不诚实的。

42 例3.1.3 酒商与顾客的博弈(续) 消 费 者 有 嗜 好(B 1) 无 嗜 好(B 2) 买酒 不买酒 酒 商 诚实 (A 1) 高价
各种情况下商人和消费者的效用值如下表: 消 费 者 有 嗜 好(B 1) 无 嗜 好(B 2) 买酒 不买酒 诚实 (A 1) 高价 3,3 -4,-2 3,2 -4,0 低价 2,5 -2,-4 2,4 不诚实 (A 2) 4,-3 -3,0 -3,1 1,0 -1,1 -1,0 表 商人和消费者博弈规范式

43 例3.1.3 酒商与顾客的博弈(续) 显然商人的类型有两种 ,诚实记为 ,不诚实记为 ,而消费者类型也有两种 ,有嗜好的消费者记为
显然商人的类型有两种 ,诚实记为 ,不诚实记为 ,而消费者类型也有两种 ,有嗜好的消费者记为 ,无嗜好的消费者记为 。 并记商人的策略集为 ,高价卖酒记为 ,低价卖酒记为 ,并记消费者的策略集为 买酒记为 不买酒记为 。

44 例3.1.3 酒商与顾客的博弈(续) 根据该城镇历年来的记载有如下的情况: 嗜酒者遇到诚实商人的概率为0.2:
嗜酒者遇到不诚实商人的概率为0.4: 不嗜酒者遇到诚实商人的概率为0.1: 不嗜酒者遇到不诚实商人的概率为0.3: 那么商人和消费者各自采取什么策略呢?

45 例3.1.3 酒商与顾客的博弈(续) 根据贝叶斯法则 同理有

46 例3.1.3 酒商与顾客的博弈(续) 设酒商在类型为 时混合策略为 设消费者在类型为 时的混合策略为
设酒商在类型为 时混合策略为 设消费者在类型为 时的混合策略为 从表3.1.2可知,酒商为类型 时,面对两种类型的消费者,其收益矩阵分别是:

47 例3.1.3 酒商与顾客的博弈(续) 在上述规定下的混合策略,酒商为类型 时的期望收益为:
在上述规定下的混合策略,酒商为类型 时的期望收益为: 由定理3.1.3, 是贝叶斯纳什均衡的充分必要条件为:

48 例3.1.3 酒商与顾客的博弈(续) 上面两个不等式的等价不等式组为 酒商为类型 时,面对两种类型消费者,其收益矩阵分别是:

49 例3.1.3 酒商与顾客的博弈(续) 在上述规定的混合策略下,酒商为类型 时的期望收益: 由定理3.1.3, 是贝叶斯纳什均衡的充分必要条件
在上述规定的混合策略下,酒商为类型 时的期望收益: 由定理3.1.3, 是贝叶斯纳什均衡的充分必要条件 为:

50 例3.1.3 酒商与顾客的博弈(续) 上面两个不等式的等价不等式组为 消费者为类型 时,面对两种类型的酒商,其收益矩阵分别为:

51 例3.1.3 酒商与顾客的博弈(续) 在上述规定的混合策略下,消费者为类型 时的期望收益 是贝叶斯纳什均衡的充分必要条件为

52 例3.1.3 酒商与顾客的博弈(续) 上面两个不等式的等价不等式组为: 消费者类型为 时,面对两种类型的酒商,其收益矩阵分别是:

53 例3.1.3 酒商与顾客的博弈(续) 在上述规定的混合策略下,消费者为类型 的期望收益 是贝叶斯纳什均衡的充分必要条件为

54 例3.1.3 酒商与顾客的博弈(续) 上面两个不等式的等价不等式组为
若 是该博弈的贝叶斯纳什均衡,其充分必要条件是满足由(I)、(II)、(III)和 (IV)组成的不等式组。对应这4个不等式组联合求解,可以采取如下方法进行。

55 例3.1.3 酒商与顾客的博弈(续) 可能的9种组合情况分别如下:
分别讨论这9种组合情况是否有符合不等式组(I)、(II)、(III)和(IV)都成立的共同解。

56 例3.1.3 酒商与顾客的博弈(续) 以上9种组合情况中,1、3、4、5、6、7、8都可以排除。
对第(1)种组合情况: 。此时由不等式组(III)和(IV)可知,只有 ,但 不满足不等式组(I)中:当 排除第(1)种组合情况。 对第(5)种组合情况: 这时由不等式组(I)和(II),要求 和 满足 但上面方程组解为: 。显然不符合要求。 排除第(5)种组合情况。 以上9种组合情况中,1、3、4、5、6、7、8都可以排除。

57 例3.1.3 酒商与顾客的博弈(续) 考察组合情况(2): 由不等式组(III)和(IV),只能是 综合考察 , ,
综合考察 , , 对不等式组(I)、(II)、(III)和(IV)都满足。 因此,由 和 可以组成贝叶斯纳什均衡。

58 例3.1.3 酒商与顾客的博弈(续) 考察组合情况(9): 由不等式组(IV)可知
再返回到不等式组(I),只有 和 满足不等式组(I)和(II) 再将 和 放到不等式组(III)中,则要求 综合考察: 对不等式组(I)、(II)、(III)和(IV)均满足, 因此 可以组成贝叶斯纳什均衡。

59 例3.1.3 酒商与顾客的博弈(续) 综上所述,该博弈的贝叶斯纳什均衡为: 即酒商为诚实时,将以概率 卖高价, 的概率卖低价, 。
即酒商为诚实时,将以概率 卖高价, 的概率卖低价, 当酒商为不诚实时,一定采用卖高价策略。 消费者中对酒有嗜好的将买酒,而无嗜好的将不买酒。

60 例3.1.4 独立私人价值下的一级密封拍卖 考虑有两个竞标人的情况,竞标人1和竞标人2,即 。令竞标人 对拍卖物的估价为 ,出价为 , 。只有竞标人 自己知道 是多少。 为投标人的策略,即 。这里“自然”确定了投标人 的类型 ,并给出了 的概率分布。 并假定 都是[0,1]上的独立均匀分布。上述情况都是共同知识。

61 例3.1.4 独立私人价值下的一级密封拍卖 竞标人 的收益函数如下: 竞标人 在自己的类型为 ,出价为 的情况下,其期望收益为:
竞标人 的收益函数如下: 竞标人 在自己的类型为 ,出价为 的情况下,其期望收益为: (3.1.39) (3.1.40)

62 例3.1.4 独立私人价值下的一级密封拍卖 为了讨论方便,我们对局中人的策略作如下规定: , 为常数,
, 为常数, 这里 可视为竞标人 的最低标价。局中人 的策略为 (3.1.41) 在上述规定下, 也是一个均匀分布的随机变量,则对任意常数 。这样我们在3.1.40式中后两项均为0,不予以考虑。

63 例3.1.4 独立私人价值下的一级密封拍卖 当竞标人 在估价 时,其出价 的多少由(3.1.40)~(3.1.42)式有:
当竞标人 在估价 时,其出价 的多少由(3.1.40)~(3.1.42)式有: 比较(3.1.44)与(3.1.41),有: , , 即: (3.1.44) (3.1.45) (3.1.43)

64 例3.1.4 独立私人价值下的一级密封拍卖 (3.1.45) 两个竞标人的出价都为自己估价的一半。 若有 个人参加竞标,可以类似的分析得到
(3.1.45) 两个竞标人的出价都为自己估价的一半。 若有 个人参加竞标,可以类似的分析得到 ,   (3.1.46) 投标人越多,卖者能得到的价格就越高;当投标人趋于无穷时,卖者几乎得到买者价值的全部。

65 例3.1.5 双向拍卖 双向拍卖规则:卖方确定一个卖价 ,买方同时给出一个买价 。如果 ,则交易以 的价格进行,如果 ,则不发生交易。
例 双向拍卖    双向拍卖规则:卖方确定一个卖价  ,买方同时给出一个买价 。如果 ,则交易以  的价格进行,如果  ,则不发生交易。    下面我们考虑买方和卖方对自己的估价都存在私人信息的情况,分析双向拍卖的博弈。

66 例3.1.5 双向拍卖(续) 买方的效用函数 卖方的效用函数
买方对标的商品的估价为 ,卖方的估价为 ,双方的估价都是私人信息,并且服从[0,1]区间的均匀分布。效用函数如下: 买方的效用函数 0, 卖方的效用函数 0,

67 例3.1.5 双向拍卖(续) 这是一个不完全信息的静态博弈。“自然”给出买卖双方的类型,并分别通知双方。双方对对方的类型是不知道的。买卖双方的出价策略  和  分别依赖于其类型  和  。 如果以下的两个条件成立,策略组合   即为博弈的贝叶斯纳什均衡。

68 例3.1.5 双向拍卖(续) (1)对于买方在区间 内的每一估价 ,其出价 应满足 (2)对于卖方在区间 内的每一估价 ,其出价 应满足
(1)对于买方在区间 内的每一估价  ,其出价    应满足 (2)对于卖方在区间 内的每一估价 ,其出价 应满足 (3.1.47) (3.1.48)

69 例3.1.5 双向拍卖(续) (3.1.49) (3.1.50) 假设卖方 和买方 的出价均是自己的估价的线性函数,即采用线性策略出价。设
假设卖方 和买方 的出价均是自己的估价的线性函数,即采用线性策略出价。设 考虑前面假设 和 都是 上均匀分布,则对  (3.1.47)和(3.1.48)式中各项概率和数学期望可以计算: (3.1.49) (3.1.50)

70 例3.1.5 双向拍卖(续)

71 例3.1.5 双向拍卖(续) 将上面4个关系式代入到(3.1.47)和(3.1.48)式有: 求解(3.1.49)和(3.1.50)式,分别有: (3.1.51) (3.1.52) (3.1.53) (3.1.54)

72 例3.1.5 双向拍卖(续) 比较(3.1.51)与(3.1.48),(3.1.52)与(3.1.47)有: (3.1.55)
(3.1.56) (3.1.55) 线性策略假定下 的贝叶斯纳什均衡

73 例3.1.5 双向拍卖(续) 分析在卖方和买方均采用线性策略出价时的交易效率:
卖方和买方之间交易发生的条件是    ,结合( )和(3.1.56)式,等价情况是: 因此,双方采用线性策略出价的交易可能性在下图3.1.1中为三角形  。 (3.1.57)

74 例3.1.5 双向拍卖(续) 三角形中ABC的交易有可能发生,而四边形ODBA中却不发生交易。因此交易的效率为:
图3.1.1 买方与卖方线性策略出价 三角形中ABC的交易有可能发生,而四边形ODBA中却不发生交易。因此交易的效率为:

75 例3.1.5 双向拍卖(续) 这里介绍的是线性策略出价,也有其他更复杂的出价策略,这里不详细讨论。
双向拍卖模型在经济活动中有非常广泛的应用。任何一种信息不对称的双方交易都可看作是双向拍卖,既有对实物的双向拍卖,也有对非实物的双向拍卖。

76 §3.2 完全且完美信息动态博弈 §3.2.1 动态博弈的特征 §3.2.2 子博弈与子博弈完美纳什均衡
§3.2 完全且完美信息动态博弈 §3.2.1 动态博弈的特征 §3.2.2 子博弈与子博弈完美纳什均衡 §3.2.3 完全且完美信息的动态博弈的案例 §3.2.4 完全不完美信息的两阶段博弈

77 §3.2.1 动态博弈的特征 ※ 动态博弈的特征 ※ 纳什均衡的可信性与不可信性

78 动态博弈的特征 动态博弈有以下区别于静态博弈的特征 : 1. 阶段 2. 行动与策略 3. 行动组合和策略组合 4. 收益函数 5. 信息
1. 阶段 2. 行动与策略 3. 行动组合和策略组合 4. 收益函数 5. 信息 6. “自然” (本节中是完全且完美信息,故不考虑“自然”。)

79 动态博弈的特征 二人取数游戏 游戏分三步:(1)局中人1在{0,1}中取一个数记为 ,并告知局中人2;(2)局中人2也在{0,1}中取一个数记为 , 但不告知局中人1;(3)局中人1再次取数,若局中人1在第一步中取0,则可在{0,1}中取一个数,若局中人1在第一步中取1,则可以在{0,1,2}中取一个数,记第三步局中人1取得数为 。三步后取数结束。现记 。若 S 为偶数,则局中人1赢 S记分点,局中人2输 S 记分点。若S 为奇数,则局中人1输 S记分点,局中人2赢 S 记分点。 在这个游戏中,两个局中人各自采取什么行动?若你参加,你愿意当局中人1还是局中人2 。

80 动态博弈的特征 二人取数游戏经过简单计算,可以用下面的树形图表示:

81 动态博弈的特征——阶段和行动顺序 动态博弈中,局中人是依照一定的约定规则依次进行行动。每个阶段至少有一个局中人要进行行动的,这里允许一个阶段中有多人行动(可见§ 3.2.3中的两阶段博弈)。在二人取数 游戏中有三个阶段,分别有局中人 1或局中人2行动。

82 动态博弈的特征——行动与策略 局中人行动集一般记为 。在不同的状态下和不同的阶段,局中人的行动集可能不一样。
局中人行动集一般记为 。在不同的状态下和不同的阶段,局中人的行动集可能不一样。 动态博弈的策略是指局中人在这个博弈前对自己各阶段行动的一个计划。 在静态博弈中,只有一个阶段,局中人的策略集与行动集是一致的。但动态博弈中策略集与行动集是不同的。

83 动态博弈的特征——行动组合和策略组合 动态博弈中,每个局中人在每个阶段选出一个行动构成一个行动组合。 每个局中人出一个策略则构成策略组合。
行动组合是策略组合的一种 “精炼”的表述。行动组合 的个数小于策略组合的个数。

84 动态博弈的特征——收益函数 在动态博弈中,为了分析方便,局中人的收益函数是所有行动组合到实数集的映射。如果博弈的局中人为n个人,则每个行动组合对应一个n维实数向量。但若动态博弈是用策略式表示,其收益函数 仍是策略组合到实数集的映射。 在完全信息动态博弈中,博弈的 收益函数是一个共同知识。

85 动态博弈的特征——信息 在动态博弈中,当每个局中人行动时,它对此前各局中人的行动组合是完全了解和知道的,称为有完美信息博弈,反之,则称为不完美信息博弈。 在取数游戏中的博弈是不完美信息博弈。

86 纳什均衡的可信性与不可信性 例3.2.1 借债与还债问题 该博弈有三个阶段:
例3.2.1 借债与还债问题 该博弈有三个阶段: (1)局中人2向局中人1借款2万元,并承诺一年后还连本带息共3万元。局中人1面临借还是不借钱给局中人2。 (3)这时局中人1是将局中人2告上法庭还是不告上法庭。 (2)局中人2靠这笔钱共赚到4万元。他面临着到底履行诺言还是不履行诺言。 博弈结束,收益见表3.2.1 在这个博弈中,局中人1和局中人2分别应采取什么策略呢?

87 纳什均衡的可信性与不可信性 这是一个完全且完美信息的动态博弈。 该博弈用规范式表示为:
用第二章的划线法可知,有三个纯策略纳什均衡(这里暂不考虑混合策略),分别是((借,上告),履行诺言),((不借,上告),不履行诺言),((不借,不告),不履行诺言)。

88 纳什均衡的可信性与不可信性 下面对这三个纯策略纳什均衡 可信性和不可信性进行分析。 为了可以有更直观的认识, 其扩展式如右所示:
显然,纳什均衡((不借,上告),不履行诺言)和((不借,不告),不履行诺言)是不可信任的纳什均衡。 图3.2.1 借债与还债博弈扩展式 在动态博弈中,采用静态博弈的方法求出来的纳什均衡,并不一定是可信的。

89 §3.2.2 子博弈与子博弈完美纳什均衡 ※ 动态博弈的扩展型表述 ※ 子博弈与子博弈完美纳什均衡 ※ 子博弈完美纳什均衡的逆向归纳法

90 动态博弈的扩展型表述 (由于本节仅研究完全信息下的动态博弈,因而未考虑“自然”对类型的赋予,以及对类型的概率分布的赋予。)
定义3.2.1 一个动态博弈的扩展式包括: (1)博弈中的局中人,必要时包括“自然”局中人; (2)局中人的行动顺序; (3)局中人的行为空间,若“自然”局中人的行动,即它赋予其它局中人不同类型,则同时应给出不同行动的概率分布; (4)每次轮到某一局中人行动时,他所了解的信息; (5)对局中人可能选择的每一行动组合相对应的各局中人的收益。 (由于本节仅研究完全信息下的动态博弈,因而未考虑“自然”对类型的赋予,以及对类型的概率分布的赋予。)

91 动态博弈的扩展型表述 上述定义中,(2)、(3)和(4)是博弈规范式表示在动态博弈中的具体体现。以上各要点均是共同知识。
本大节讨论的完全且完美信息的动态博弈,无“自然”局中人。 对于博弈的扩展式描述,我们通过树形图来表示,也称博弈树。

92 动态博弈的扩展型表述 扩展式表示的一个例子 在扩展式表示的博弈中,我们更多关心的是各局中人在阶段中的
行动,因此也称其为行为博弈。对应地,将使用行动、行动组合、行动组合上的收益函数等概念。

93 子博弈与子博弈完美纳什均衡 扩展式博弈中,满足下面三个条件的博弈,称为该博弈的一个子博弈:
(1)始于单结点信息集的决策结点n(但不包括博弈的第一个决策结点); (2)包含博弈树中n之下所有的决策结点和终结点(但不在n下面的除外); (3)没有对任何信息集形成分割。(即如果博弈树中n之下有一个决策结点n′,则和n′处于同一信息集的其他决策结点也必须在n之下,从而也必须包含于该子博弈中。)

94 子博弈与子博弈完美纳什均衡 该博弈只有一个子博弈,它始于局中人1选择R,局中人2选择R′之后局中人3最右边一个决策点。
图3.2.3 存在着信息集分割的博弈树

95 子博弈与子博弈完美纳什均衡 定义3.2.3 在完全且完美信息动态博弈中,如果局中人的策略组合或行动组合在其每一个子博弈中都构成了纳什均衡,则称纳什均衡是子博弈精炼的,并称为原博弈的子博弈完美纳什均衡。

96 子博弈与子博弈完美纳什均衡 子博弈完美纳什均衡两点说明:
关于行动组合的纳什均衡未直接给出定义。行动组合的纳什均衡和策略组合的纳什均衡没有本质差异。动态博弈既可以用策略式表示也可以用扩展式表示,因此该定义中既包含策略组合又包含行动组合。 关于在每一个子博弈中构成纳什均衡未直接给出定义。子博弈所组成的纳什均衡是原博弈某个行动组合的纳什均衡的一个子集;原博弈该行动组合的纳什均衡为子博弈完美纳什均衡。

97 子博弈完美纳什均衡的逆向归纳法 完全且完美信息动态博弈的主要特点: 行动是顺序发生的; 下一步行动选择之前,所有以前的行动都可以被观察到;
每个可能的行动组合下局中人的收益是共同知识。

98 子博弈完美纳什均衡的逆向归纳法 我们对这类动态博弈只有两阶段时进行讨论。这时的博弈为: 局中人1从可行集 中选择一个行动 ;
局中人1从可行集 中选择一个行动 ; 局中人2观察到 之后从可行集 中选择一个行动 两人的收益分别为 和 。

99 子博弈完美纳什均衡的逆向归纳法 使用逆向归纳法求解此类博弈问题。 第二阶段局中人2面临的决策: 是局中人2对局中人1的行动的最优反应。
第一阶段局中人1面临的决策: 是局中人1的最有策略。 将 带入 ,称 是这个博弈的逆向归纳解。

100 §3.2.3 完全且完美信息的 动态博弈的案例 ※ 例 斯塔克尔贝格双寡头竞争模型 ※ 例 劳资博弈 ※ 例 序贯谈判 ※ 例 制造商与销售商的博弈 ※ 例 承包基数博弈

101 例 斯塔克尔贝格双寡头竞争模型 斯塔克尔贝格(Stackelberg,1934)提出了双寡头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行动。根据斯塔克尔贝格的假定,模型中企业分先后选择其产量。 在这个博弈中,首先,企业1选择产量 ;然后,企业2可以观测到 ,并选择产量 ;此时,企业 的收益函数为: 这里 是市场上总产量, 是市场出清价格,c 是生产的边际成本,为一常数(令固定成本为0)。

102 例3.2.2 斯塔克尔贝格双寡头竞争模型 该博弈是完全且完美信息两阶段博弈,逆向归纳法求解。
例 斯塔克尔贝格双寡头竞争模型 该博弈是完全且完美信息两阶段博弈,逆向归纳法求解。 假设企业1有产量 ,我们首先计算企业2对企业1任意产量的最优反应 应满足

103 例3.2.2 斯塔克尔贝格双寡头竞争模型 由于企业1考虑到当它产量为 时,企业2的最优反应为 ,则在博弈的第一阶段,企业1的问题可表示为
例 斯塔克尔贝格双寡头竞争模型 由于企业1考虑到当它产量为 时,企业2的最优反应为 ,则在博弈的第一阶段,企业1的问题可表示为 由上式可得 及 是斯塔克尔贝格双寡头垄断博弈的逆向归纳解, 也是该博弈的子博弈完美纳什均衡。

104 例 劳资博弈 在里昂惕夫(1946)模型中,讨论了一个企业主和一个垄断的工会组织(即作为企业劳动力惟一供给者的工会组织)的相互关系:工会对工人的工资水平提出要求,但企业主却可以自主决定就业人数。 工会的效用函数为 ,其中 为工会向企业提出的工资水平; 为就业人数。假定 是 和 的增函数。企业主的利润函数为 为企业雇佣 名工人可以取得的收入(在最优的生产和产品市场决策下),假定 是增函数,并且为凹函数(concave)。

105 例3.2.3 劳资博弈 假定博弈的时序为: (1)工会提出需要的工资水平; (2)企业主得到工会要求工资 后,选择雇佣人数 ;
例 劳资博弈 假定博弈的时序为: (1)工会提出需要的工资水平; (2)企业主得到工会要求工资 后,选择雇佣人数 ; (3)收益分别为 和 。 那么,工会要提出什么样的工资要求,而企业主又应雇用多少工人? 因为没有假定 和 的具体的表达式,从而无法明确解出该博弈的子博弈完美纳什均衡的表达式,我们只对解的主要特征进行讨论。

106 例 劳资博弈 首先,对工会在第一阶段提出的任意一个工资水平 ,我们能够分析在第二阶段企业主最优反应 的特征。给定 ,企业选择 满足下式: 一阶条件为 (3.2.1) 为保证 有解,假定 且 , 如右图所示。

107 例3.2.3 劳资博弈 对(3.2.1)式,可以将 表示为 的函数。从图中可见,当工资要求越高, 时,企业主雇用工人会减 少, 。
例 劳资博弈 对(3.2.1)式,可以将 表示为 的函数。从图中可见,当工资要求越高, 时,企业主雇用工人会减 少, 。 若 ,从上面一阶条件有 。对此式再对 求导,有: 。 由前面假设, 是 的凹函数,即 ,则必有:

108 例3.2.3 劳资博弈 工会在第一阶段的问题可以表示为 (3.2.2) 求解(3.2.2)式,由一阶条件有 (3.2.3)
例 劳资博弈 工会在第一阶段的问题可以表示为 (3.2.2) 求解(3.2.2)式,由一阶条件有 (3.2.3) 由前面假设, 是 的增函数,于是可以求出工会提出的工资水平 ,进而可由 求出企业主对雇用工人的人数 。

109 例3.2.4 序贯谈判 我们首先分析一个三阶段谈判模型。其博弈顺序的详细描述为:
例 序贯谈判 我们首先分析一个三阶段谈判模型。其博弈顺序的详细描述为: (1a)在第一阶段开始时,局中人1建议他分走1美元的 ,留给局中人2的份额为 ; (1b)局中人2或者接受这一条件(这种情况下,博弈结束,局中人1的收益为 ,局中人2的收益为 ,都可立刻拿到),或者拒绝这一条件(这种情况下,博弈将继续进行,进入第二阶段);

110 例 序贯谈判 (2a)在第二阶段的开始,局中人2提议局中人1分得1美元的 ,留给局中人2的份额为 。考虑收益的时间价值,每期的贴现因子为 , 。实际上第二阶段局中人1可得的收益为 ,局中人2可得的收益为 。 (2b)局中人1或者接受条件(这种情况下,博弈结束,局中人1的收益 和局中人2的收益 都可立刻拿到),或者拒绝这一条件(这种情况下,博弈继续进行,进入第三阶段);

111 例 序贯谈判 (3)在第三阶段的开始,局中人1提出局中人1得到1美元的 ,局中人2得到 , ,局中人2必须接受。同样考虑收益的时间价值,此时局中人1实际上得到收益 ,局中人2可得的收益为 。这时,局中人2无提出新的分配方案的权利。博弈结束。 下面,我们就三阶段谈判博弈分析并讨论其子博弈完美纳什均衡。

112 例 序贯谈判 该博弈的扩展型如下: 图3.2.7 序贯谈判示意图

113 例3.2.4 序贯谈判 按照逆向归纳法的思想,我们从第三阶段逐步逆向倒推。
例 序贯谈判 按照逆向归纳法的思想,我们从第三阶段逐步逆向倒推。 第三阶段,局中人1出任何价,局中人2都必须接受。双方收益各为 和 。一般来说,局中人1会出价 ,则局中人2所得为0。 第二阶段,局中人2出价 ,但必须让局中人1接受,但也没有必要让局中人1获得更多,因此局中人2的出价应满足 ,并取等号,即出价 。 在这种出价下,局中人2所得比进入第三阶段好,因为:

114 例 序贯谈判 第一阶段,局中人1出价 ,但必须让局中人2接受,但没有必要让局中人2获得更多。因此,局中人1的出价应满足 ,并取等号。考虑到 ,则出价为 。 在这种出价下,局中人1所得比进入到第二阶段好,因为 。

115 例3.2.4 序贯谈判 该博弈的逆向归纳解为:第一阶段局中人1出价 ,局中人2接受,对方的收益分别为 和 。
例 序贯谈判 该博弈的逆向归纳解为:第一阶段局中人1出价 ,局中人2接受,对方的收益分别为 和 。 图3.2.8 局中人1的收益与贴现的关系 据左图可知,当 时,局中人1的收入最少 。

116 例3.2.4 序贯谈判 接下来,我们将这种谈判问题可扩展到有无限个阶段,即只要有局中人拒绝,博弈就可以一直进行下去。
例 序贯谈判 接下来,我们将这种谈判问题可扩展到有无限个阶段,即只要有局中人拒绝,博弈就可以一直进行下去。 具体讲,博弈的顺序为:奇数阶段由局中人1出价 ,局中人2面对出价 决定接受还是不接受;在偶数阶段,由局中人2出价 ,局中人1面对 ,决定接受还是不接受。若在任何一种情况下,有局中人对对方的出价接受,博弈中止。 这时我们看到,由于没有一个最后回合作为逆向归纳法的起始点,因此在有无限多阶段的动态博弈中,逆向归纳法失败。

117 例3.2.4 序贯谈判 进一步分析,这种博弈从第一阶段开始和从第三阶段开始其本质是一样的。
例 序贯谈判 进一步分析,这种博弈从第一阶段开始和从第三阶段开始其本质是一样的。 若从第一阶段开始的无限阶段贯序谈判中,局中人1可以获得的收益为 ,那么从第三阶段开始的无限阶段贯序谈判中,局中人1可以获得的收益亦为 。考虑上面在三阶段谈判模型中,局中人1在第一阶段的收益 (即出价)与第三阶段的收益 (即出价)满足 ,因而若令 ,则有: ,则 。

118 例3.2.4 序贯谈判 该博弈在纳什归纳解下的结果为: 。
例 序贯谈判 该博弈在纳什归纳解下的结果为: 。 很显然,在这种无穷阶段的谈判博弈中,先出价者具有优先权。并且局中人1在三阶段谈判博弈中的收益比无限阶段谈判博弈中所获更多,因为局中人1在三阶段谈判博弈中具有终止权。

119 例3.2.5 制造商与销售商的博弈 有一个由制造商和销售商组成的二级供应链,为市场提供某种商品,该商品的市场需求函数设为 。其中 为商品的价格, 为市场对商品需求数量, 为一常数,其经济意义是商品的最高需求量。制造商提供给销售商的批发价为每件 元。制造商和销售商都有不变的边际成本 和 。 制造商和销售商的博弈顺序规定如下:制造商先确定产品的批发价 ,根据制造商的批发价销售商确定商品的定价 。 制造商如何确定批发价 ,销售商如何确定产品的销售价 ,以实现各自的利润最大?

120 例3.2.5 制造商与销售商的博弈 这是一个两阶段的完全且完美信息下的动态博弈。
例3.2.5 制造商与销售商的博弈 这是一个两阶段的完全且完美信息下的动态博弈。 局中人1是制造商先行动,其行动空间是 。局中人2是销售商后行动,其行动空间 。 两个局中人的收益函数分别是 和 。 (3.2.3)     (3.2.4)

121 例3.2.5 制造商与销售商的博弈 采用逆向递推法的思想求解问题。 销售商定价应满足: 即 (3.2.5)
例3.2.5 制造商与销售商的博弈 采用逆向递推法的思想求解问题。 销售商定价应满足: 即      (3.2.5) 制造商知道销售商将采用(3.2.5)式的定价策略,则他的定价应满足:

122 例3.2.5 制造商与销售商的博弈 解得制造商和销售商最优定价分别为: 制造商和销售商最大利润分别为:

123 例3.2.6 承包基数博弈 承包基数的确定过程,实际上是发包人与承包人的博弈过程。
基数确定过程中的一个难题是,委托人(指发包人或董事会)从自己利益最大化角度考虑,总想提高基数;而代理人(指承包人或总经理)则是为自身利益的实现总想降低基数。对方对此僵持不下,进行一系列的讨价还价。

124 例3.2.6 承包基数博弈 从博弈的角度分析该问题,可视为这是一个两阶段动态博弈。
在第一阶段,委托人对承包基数提出了一个要求数D和一个收益分配方案。 在第二阶段,代理人在明确基数要求数D和收益分配方案后,对承包基数给出一个自报数S。 两阶段完成后,进入承包期,并在承包期后按照事先规定的方案进行收益分配。

125 例3.2.6 承包基数博弈 委托人是一个主动方,代理人是一个从动方。从最终利益分配出发采用逆向归纳法的思想进行分析:
(1)假定代理人实际完成的结果是A,委托人会提出承包基数的要求数D,满足D<A; (2)假设承包基数合同为C,委托人会对代理人完成的超额部分(A-C)进行分成奖励,而对不完成合同(C-A)进行惩罚以鼓励代理人去努力完成和超额完成 (3)假定承包人有意压低对基数的自报数S,也应给予惩罚,即在S<A 时,应对代理人给以一个少报惩罚。

126 例3.2.6 承包基数博弈 委托人在进行上述分析后,在博弈的第一阶段提出了如下基本要 求数D和分配方案:
(2)委托人与代理人共同确定承包基数C。若委托人对基数的要求数是D,代理人对承包基数的自报数是S,则: 。可见 是一个权重,不妨取 。但规定合同基数C全部归委托人,也即“基数全交”。

127 例3.2.6 承包基数博弈 (3)对期末实际完成数A超过合同基数C时,超过部分以 的比例作为奖励给代理人,若不能完成合同基数C时,不足部分同样以 比例由代理人补足。其中 ,不妨取 (4)对期末完成数A超过代理人对承包基数的自报数S时,将向代理人收取“少报罚金”。因为自报数S较小时,基数合同C也较小,损害了委托人的利益。少报罚金的数量为 。其中 ,不妨取

128 例3.2.6 承包基数博弈 委托人在第一阶段不仅提出了承包基数的要求数D,也从(2)建立了基数合同规定,并从(3)的(4)以基数合同规范了期末的双方收益分配规则。 代理人在第二阶段如何对承包基数给出自己的自报数呢?我们从下面一个具体数据实例来说明。 假设委托人估计实际完成数A=80,则承包基数的要求数D=60,尚有一定余地给代理人。各参数值分别为: , , 。代理人策略选择和可能的结果见下表(单位万元):

129 例3.2.6 承包基数博弈

130 例3.2.6 承包基数博弈 根据上表从委托人的角度,通过逆向归纳法思想,对代理人收益已建立了一个收益函数: (3.2.8)
因此,委托人在第一阶段对承包基数和分配方案确定时,必须满足满足 。 代理人在第二阶段时只能诚实地报出自报数S就是可能的完成数A。

131 例3.2.7 代理工资结构确定 在企业中,企业董事会给总经理的报酬使用得更多的是 “基本工资+业绩奖励”。那么,基本工资和业绩奖励又应如何确定呢? 设想一个企业主派出一名部门经理去一个新地区拓展业务。企业主当然希望该经理要努力地去工作。作为该经理,他也希望经过自己的努力工作,创造一个好的业绩。但该地区人生地不熟,又有许多不可预见的外来因素。这些不可预见的因素可能在其成功与否中占据重要作用。作为企业主,他不知道经理是努力了还是没有努力,外来的不可预见因素是有利还是不利,只知道最后的业绩表现。这构成了一般委托——代理关系的研究。

132 例3.2.7 代理工资结构确定 假设该经理的努力可以度量化为 ,其外来不可预见因素为随机变量 , 服从均值为0,方差为 的某一分布函数。经理人的业绩为: 若企业主是风险中性的,而经理人是风险规避的,有不变的风险规避度 。经理经过努力 以后,有一个负的努力效用 ( 是一个正常数)。 企业主和经理之间进行下面所述的(委托——代理关系)动态博弈。其中,企业主为委托人,经理为代理人。 (3.2.9)

133 例3.2.7 代理工资结构确定 (3.2.10) 第一阶段,委托人对代理人提出了一个“基本工资+业绩奖励”的工资结构合同:
第二阶段,代理人决定接受合同还是不接受合同。 第三阶段,代理人在接受合同后决定对工作的投入量 。 在这个动态博弈中,委托人要确定的是工资结构合同中的数 和 ,而代理人要确定在接受工资合同后的努力 的大小。 (3.2.10)

134 例3.2.7 代理工资结构确定 (3.2.11) (3.2.12) (3.2.13) (3.2.14) 委托人的收益函数 为: 期望收益为:
委托人的收益函数 为: 期望收益为: 代理人的等价收益函数为:实际收入减去风险贴水。其确定性等价收益为: 设代理人的保留效用为 ,则代理人接受工资合同的充分条件为: (3.2.11) (3.2.12) (3.2.13) (3.2.14)

135 例3.2.7 代理工资结构确定 (3.2.15) 下面,采用逆向归纳法思想分析该动态博弈。
在第三阶段,代理人的努力水平选择是使 最大化。由一阶条件 ,即: 。 在第二阶段,假定委托人给了足够的工资,以保障代理人接受工资合同。同时,委托人又不会给代理人过多的报酬,只需在(3.2.14)式中取等号。 (3.2.15)

136 例3.2.7 代理工资结构确定 在第一阶段,我们将(3.2.14)式中取等号和(3.2.15)式都带入(3.2.12)式,即求: 求解有:
(3.2.16) 业绩奖励系数 (3.2.17) 工作投入量 基本工资 (3.2.18) (3.2.19) 和 为该博弈的逆向归纳解。

137 §3.2.3 完全不完美信息的两阶段博弈 ※ 完全不完美信息的两阶段博弈 ※ 完全不完美信息的两阶段博弈求解思路 ※ 例 关税和国际市场的不完全竞争

138 完全不完美信息的两阶段博弈 我们将分析以下类型的简单博弈,并称其为完全非完美信息两阶段博弈:
第一阶段,局中人1和2同时从各自的可行集 和 中选择行动 和 ; 第二阶段,局中人3 和4 观察到第一阶段的结果,并可推断出( , ),然后同时从可行集 和 中选择行动 和 ; 两阶段结束后,每个局中人的收益为

139 完全不完美信息的两阶段博弈求解思路 假设博弈第一阶段有静态博弈的纳什均衡( , )。
假设博弈第一阶段有静态博弈的纳什均衡( , )。 (1)第二阶段:局中人3和局中人4以这一假定的纳什均衡( , )为参数,进行二人完全信息静态博弈 G2= N2,{A3,A4}, {u3,u4}  ,其中 N2 = {3,4} ,从而得到纳什均衡 (3.2.20) 均衡结果 (3.2.21) (2)第一阶段,局中人1和局中人2以(3.2.21)结果作为收益函数进行二人完全信 息下的静态博弈G1= N1,{A1,A2}, {u1,u2}  ,其中N1 = {1 ,2} , u1,u2由(3.2.21) 给出,从而得到纳什均衡 (3.2.22) 均衡结果 : (3.2.23) (3)将(3.2.22)结果代回到(3.2.20)和(3.2.21)中,可得该博弈的子博弈完美纳什均衡 和对应的均衡结果

140 例 关税和国际市场的不完全竞争 考虑两个完全相同的国家,分别用表示 。每个国家政府负责确定关税税率,一个企业制造产品供给本国的消费者以及出口,以及一群消费者在国内市场购买本国企业和外国企业生产的产品。这里假定,分属两个国家的两个企业生产的是相同产品。如果国家 的市场上产品总量为 ,则市场出清价格为 国家 中的企业(称企业 )为国内市场生产 并出口 ,则 。企业的边际成本都为常数 (不考虑固定成本)。从而,企业 的总生产成本为 。另外,产品出口时企业 还要承担关税成本,即如果政府 制定的关税税率为 ,企业 还要向国家 对出口产品 支付关税 给政府 。这里假定,国家 将不对本国企业 生产的产品征收出口税。

141 例3.2.8 关税和国际市场的不完全竞争 第一阶段,两个政府同时选择关税税率 ;
例 关税和国际市场的不完全竞争 博弈的时间顺序如下: 第一阶段,两个政府同时选择关税税率 ; 第二阶段,企业观察到关税税率,并同时选择其提供国内消费和出口的产量 和 ; 两个阶段结束后,企业 的收益为其利润额 ,政府 的收益则为本国总的福利 ,其中国家 的总福利是国家享受的消费者剩余、企业 获得的利润以及政府 从企业 收取的关税收入之和,分别表示为: (3.2.24) (3.2.25)

142 例3.2.8 关税和国际市场的不完全竞争 下面,我们按照逆向归纳法进行对博弈的求解。
例 关税和国际市场的不完全竞争 下面,我们按照逆向归纳法进行对博弈的求解。 (1)假设政府已选定的税率分别为 ,先进行第二阶段计算,如果 为企业1和2的博弈的纳什均衡,对每个企业, 必须满足 由于 如(3.2.24)所述, 则分别求一阶条件: …… (3.2.26) ……(3.2.27) ……(3.2.28) ……(3.2.29)

143 例3.2.8 关税和国际市场的不完全竞争 求解(3.2.26)、(3.2.27)、(3.2.28)、(3.2.29)组成的方程组有:
例 关税和国际市场的不完全竞争 求解(3.2.26)、(3.2.27)、(3.2.28)、(3.2.29)组成的方程组有: (3.2.30) (3.2.31) (3.2.32) 在上面(3.2.30)、(3.2.31)、(3.2.32)式中 , 。

144 例3.2.8 关税和国际市场的不完全竞争 (2)现进行第一阶段的博弈分析: 对 i 国家,其收益函数如(3.2.32)式所示,求解一阶条件
例 关税和国际市场的不完全竞争 (2)现进行第一阶段的博弈分析: 对 i 国家,其收益函数如(3.2.32)式所示,求解一阶条件 (3.2.33) 可得: (3.2.34)

145 例 关税和国际市场的不完全竞争 (3)将(3.2.34)式代回(3.2.30)、(3.2.31)和(3.2.32)式,有该博弈的子博弈完美纳什均衡: 以及对应的纳什均衡结果 (3.2.36) 在子博弈精炼解中,每个市场上的总量为 , 。 (3.2.35) 0关税税率


Download ppt "博弈论及其应用 第3章 纳什均衡的扩展与精炼 《博弈论及其应用》 (汪贤裕)."

Similar presentations


Ads by Google