Presentation is loading. Please wait.

Presentation is loading. Please wait.

扩展型博弈和策略型博弈.

Similar presentations


Presentation on theme: "扩展型博弈和策略型博弈."— Presentation transcript:

1 扩展型博弈和策略型博弈

2 扩展性博弈和策略型博弈 [一个简单例子] 厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000, 概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000, 边际成本是5;厂商2的固定成本是60000, 边际成本是3。

3 扩展性博弈和策略型博弈 [一个简单例子] 厂商1和2同时各自考虑是否引进产品A和B(替代产品)。对这类产品的市场需求情况如下:每阶段总需求量为20000或6000, 概率各为0.4和0.6,如果两厂商同时生产,每个占一半市场销售额;完全垄断时价格为12,双头垄断时价格为10,价格上调时需求弹性极大,价格下调时需求弹性极小。厂商1的固定成本是40000, 边际成本是5;厂商2的固定成本是60000, 边际成本是3。

4 图I.4: 博弈树 (讲义)

5 基本定义 一个扩展型博弈包含一个局中人集I,一个节点集T,一个有向线段集E,和一个赢得向量集V。
每个有向线段的两个端点都是节点,依方向顺序一个叫始点,一个叫终点。 如果从节点t始,经过一个接一个的有向线段可以连接到节点t’,就称t’为t的后继点 (或t是t’的先行点)。 每个节点或是一个或多个有向线段的始点,并且/或者是一个有向线段的终点。 不作为任何有向线段终点的节点叫做博弈始点,不作为任何有向线段始点的节点叫做博弈终点。

6 基本定义 将博弈始点通过一个接一个的有向线段连接到某个博弈终点,就得到一条博弈路径。每个博弈终点附上一个赢得向量,第i个分量表示局中人i的赢得。 节点集T可以划分为两两不相交的若干个子集:其中每个局中人有一个,叫做他的决策节点集;自然界有一个(如果信息不完全),叫做机会节点集;还有一个子集包含所有的博弈 终点。 每个局中人的决策节点集可以进一步划分为若干个两两不相交的信息集,每个信息集的节点用气球括起来或者用虚线连在一起,表示该局中人决策时不知道自己在那个节点上。

7 基本定义 从某局中人一个信息集的节点引出的每个有向线段表示他的“一着”,选定一着表示他在同一个信息集的所有节点选定同一个行动。
一个局中人在每一个信息集都选定一着,就选定他的一个纯策略;即一个纯策略是一个完整的行动计划。局中人i的纯策略集用Si表示。 每个局中人都选定一个纯策略,就构成一个策略横断面s (strategy profile);这时可以算出博弈的一个赢得向量或者一个期望赢得向量。全体纯策略横断面的集合记为S。

8 基本定义 不管博弈的动态过程,仅着眼于局中人,各人的纯策略和赢得,就得到博弈的策略型[I,S,V]。
一个策略横断面s*=(s*1,…,s*n)叫做Nash均衡,如果对每个局中人i, 他选定的策略s*i都是对所有其它局中人选定的策略s*-i的最优回应:pi(s*)pi(s*|si), siSi, iI。 一个博弈不一定有纯策略Nash均衡;如果有,则不一定唯一。

9 二人策略型博弈Nash均衡的计算 可以按照定义找出所有的纯策略Nash均衡;
如果策略型博弈比较复杂,可以用策略间的“优”, “劣”关系化简,然后再寻找均衡。称i的一个策略si劣于si (或si优于si),如果不管其他人选定什么策略,si都比si使i得到更小的赢得。如果存在一个si,它优于i的任何其他策略,就称si为i的最优策略。显然,劣策略不可能构成Nash均衡。所以,寻找Nash均衡时可以把劣策略划掉以简化策略型博弈。

10 混合策略Nash均衡 当一个博弈没有纯策略Nash均衡时,人们考虑计算所谓混合策略Nash均衡。
局中人的一个混合策略是指他按照某个概率分布随机地选用各个纯策略;如果他有K个纯策略,那么他的一个混合策略可以表示为i=(pi1,…,piK),其中pik是他选用第k个纯策略的概率。 当局中人使用混合策略时,各人的期望赢得等于他在每一个纯策略横断面上的赢得与该策略横断面出现的概率的乘积之总和。为简便计,i的期望赢得函数仍然用i表示。

11 混合策略Nash均衡 局中人i的全体混合策略的集合记为i;注意一个纯策略也可以看作一个特殊的混合策略。
如果每个局中人都选用一个混合策略,就得到一个混合策略横断面。全体混合策略横断面的集合记为。 一个混合策略横断面*=(*1,…, *n)叫做混合策略Nash均衡,如果如果对每个局中人i, 他选定的混合策略*i都是对所有其它局中人选定的混合策略*-i的最优回应:pi(*)pi(*|i), *ii, iI。

12 混合策略Nash均衡 Nash定理:任何有限的策略型博弈(局中人数目有限,每人的纯策略数目有限)至少存在一个混合策略Nash均衡(可能是纯策略Nash均衡)。 一个博弈叫做有完整记忆的,如果每个局中人不会忘记他知道的信息和他曾经选用的着。因为有完整记忆的有限扩展型博弈都能化为有限策略型博弈,所以Nash定理的结果也适用于有完整记忆的有限扩展型博弈。

13 混合策略Nash均衡 无区别原则:如果*=(*i,*-i)是个混合策略Nash均衡并且i(*i,*-i) =M,那么对*i中局中人i以正概率选用的每一个纯策略si都有i(si,*-i) =M。换句话说, *-i使得局中人i对于他实际采用的每个纯策略无区别。 根据无区别原则,通常可以求解一个利用优劣关系简化后得到的KK双矩阵博弈。


Download ppt "扩展型博弈和策略型博弈."

Similar presentations


Ads by Google