Presentation is loading. Please wait.

Presentation is loading. Please wait.

博弈论 主讲 施锡铨 2004年3月.

Similar presentations


Presentation on theme: "博弈论 主讲 施锡铨 2004年3月."— Presentation transcript:

1 博弈论 主讲 施锡铨 2004年3月

2 第一章 引论 应用及例题 基本理论

3 博弈论关注的是互相依存(interdependence)
每一个体猜测其他个体的选择是什么? 每个人将采取什么样的行动?(当最优的行动依赖于 其他人的所作所为时,这个问题尤其令人关注。)  这些行动产生什么样的结局?对于整个群体,这个 结局好吗? 如果群体不止一次地互相作用,会有任何差异吗? 如果每一个体对群体内其他个体的特性没有把握, 答案将发生怎样的变化?

4 取自经济学,政治学,财政金融,法律,甚至日常生活中的若干相互依存性事例
艺术品拍卖 (诸如在克里斯蒂(Christie) 或索士比(Sotheby)拍卖行,那里待售出 自布拉克(Braque)直至维罗内塞 (Veronese)的艺术品)和债券拍卖(美国 财政部为筹措联邦预算支出,以这种方式 出售政府公债) 。 联合国的选举( 例如,选举新的联合国秘 书长) 。

5 动物争斗(争夺良好的栖息地以及种类中 稀少的发情期雌性动物,等等)。
自然资源的可持续使用(像石油那样的可 耗尽资源或像森林那样的可重建资源的提 取形式) 。 运动会和工作场所的随机药物检测(选取 少量运动员和工作人员进行核实使用违禁 药物的测试) 。 破产法(详细说明在什么时候和有多少债 权人可以从已破产的公司那儿收账) 。

6 “毒药”条款(该条款给予管理部门一定的权限 以抵制不受欢迎者试图接管或兼并他们的公司)
R&D开支(譬如,制药公司的研究开发费用) 第一次世界大战的壕沟战(在法德之间的边界 地区,当军队连续数月地互相对峙时,掘进到 敌方的战壕里去) OPEC(石油卡特尔,控制着世界石油产量的 一半,因此,在决定人们支付油价方面拥有重 要的发言权 群体项目(诸如为你们的博弈论课程准备案例 研究)

7 分析在一群举止行为颇具 策略的理性人之间的相互 作用的正规方法。
博弈论—— 分析在一群举止行为颇具 策略的理性人之间的相互 作用的正规方法。

8 博弈论是考虑以下每一项条款的正规方法: 群体——在任何博弈中有不止一个决策者; 每一个决策者称为局中人
相互作用——任何单个局中人的行为直接 影响到群体内至少一个其他的局中人。 策略——单个局中人在决定自己所取的行 动时,会考虑到相互依存性。 理性——在考虑到这种相互依存性时,每 一个局中人会选择自己的最优行动。

9 来自日常生活中的例子 致力于一项群体项目,为博弈论课程准备 案例研究:“群体”包括一起做案例的学 生。他们之间的“相互作用”来自于这样 的事实:为了写一篇论文,需要付出一定 的工作量;因此,如果一个学生偷懒,另 外的某个人在论文到期前的夜晚不得不投 入额外的几个小时。“策略”运用包含了 估计群体内总想占别人便宜者的可能性, “理性”参与需要对较好分数的好处与额 外工作的成本仔细地进行比较。

10 (奥林匹克运动会中)中随机药物检测: “群体”由比赛运动员和国际奥林匹克委员 会(IOC)组成。“相互作用”是两方面的, 一方面是运动员之间的相互作用——他们做 出在训练安排中和不管什么情况下一样服禁 药的决策;另一方面是在运动员与IOC之间的 相互作用,后者需要维护运动的声誉。“理 性策略”的应用需要运动员根据获胜的机会 以及如果服用了兴奋剂之后被逮到的机会之 间进行比较而作出决策。类似地,它要求IOC 根据检测成本和清白声誉的价值而制定药物 检测的程序和相应的惩罚措施。

11 经济与财政金融的例子 制药公司的R&D效果:某些评估表明,研究与 开发(R&D)经费支出占美国制药公司年销售 额的20%之多。以及平均来说,一种新药的开 发成本大约为3亿5千万美元。公司自然关心诸 如资金投入哪一条生产线,新药定价应多高, 如何缩减与新药开发相伴的风险,等等问题。 在这个例子中,“群体”是药物公司全体组成 的集合。“相互作用”起因于药的最先开发者 将获得最大的收益(由于专利权的缘故)。如 果R&D经费的选取大小使得在确知竞争者对这 条新药生产线进行投资的前提下能最大化从新 药开发中得到收益,那么 “R&D” 经费是策略 性的和是理性的。

12 债券拍卖:正常情况下,美国财政部通过拍卖形式处 理政府证券
债券拍卖:正常情况下,美国财政部通过拍卖形式处 理政府证券*。主要的投标人是投资银行,如莱曼兄 弟(Lehman Brothers) 或摩里尔林奇(Merrill Lynch)等(他们转而将证券出售给他们的客户)。 因此,“群体”就是投资银行组成的集合。(实际上, 从一次拍卖到又一次拍卖,这些投标人极少发生改 变。)他们“互相作用和影响”着,因为其他人的标 价决定了一个投标人是否分配到任何债券,也可能决 定了投标人支付的价钱。如果投标基于可能的竞争上 和在支付太多与得不到任何债券的风险之间达到适当 的平衡,那么,“出价”是“理性的”和“策略的”。 * 这些证券是公债和国库债券,以及公共部门(或者他们的代理人,例 如共同基金信托公司或养老基金等)所拥有的准金融债券。这些证券 承诺在一个固定的周期(譬如,三个月,一年,或五年)后支付一笔 钱。另外,他们也可能承诺在证券有效期内定期地支付固定额的钱款。

13 来自生物学与法律方面的例子 动物习性:刚过去的25年里,博弈论更吸引人的应用 之一已经深入生物学领域,特别是关于动物之间争斗 和竞争的分析。通常野生动物不得不为了稀少资源 (诸如具繁殖能力的雌性动物或者动物的尸体)而竞 争;于是,为了发现这些资源——或者为了从发现者 那儿夺取资源,它们会有所付出。问题在于这种做法 会导致代价昂贵的争斗。这里,“局中人群体”是眼 睛盯着同一猎物的所有动物。由于资源的有限性,它 们互相影响着。假如它们考虑竞争对手做出反应,选 择就是“策略”,如果由于这种“策略”满足了它们 的短期目标,譬如解决了饥饿,或者满足了它们的长 期目标,譬如保持了物种的繁衍不绝,这样的选择是 “理性的”。

14 破产法:在美国,一旦公司宣告破产,它的 财产不再由单独的债权人扣押,而代之以安 全保管,直至公司与它的债权人达成某种程 度的谅解。但是,债权人可以在破产宣告之 前促使法庭去收帐 (虽然通过这种做法债权人 可能逼迫公司陷入破产)。这里,债权人“群 体”内的“相互作用”来自于这样的事实: 个别债权人能够成功地依法占有的钱就不再 可能属于其他任何一个人。“策略”的选取 需要估计其他债权人可能有多大耐心,而 “理性的”选择包含了在早收账与逼迫公司 不必要的破产之间的权衡。

15 例题 1. 拿子游戏 (Nim和Marienbad)
这是两个室内游戏,玩法如下。有两堆火柴,和两 个局中人。游戏从局中人1开始,此后局中人轮 流行动。在每个局中人的轮次里,他可以从两 堆火柴的任一堆中拿走任何数量的火柴。只要 任何一堆中尚有剩余的火柴,则要求每个局中 人拿走一定数量且不能空手而返,但每个轮次 只能从一堆中取火柴。 在“拿子游戏”Nim中,无论那个局中人,取走最 後火柴者算赢。而在Marienbad,谁拿走最后 的火柴,那么这个局中人就算输。

16 2. 投票 假设有两个竞争议案,这里表示为A与B,3个议员, 投票人1,2和3,他们投票决定是否通过这些议案。 结局可能会是两种中的某一个:要么通过A和B中的 一个,要么议员们没有通过任何一项议案(延缓而以 原来法律代替)。投票过程如下:首先,让议案A与 议案B互相竞争;然后,竞争的获胜方与原来法律互 相竞争,为简便起见,我们将原法律称为“都不赞成” (或者N)。在两轮投票中的每一轮,获多数票的法 案算胜出。三个议员在可适用的选择中有如下偏好:  投票人1: 投票人2: 投票人3: (这里, 表示“喜欢议案A甚于喜欢议案B”)

17 3. 囚徒困境 克雷\卡尔文 认罪 不认罪 认罪 5,5 0,15 不认罪 15,0 1,1

18 总 结 博弈论是研究相互依存性的。它研究局中人群体中 的互相作用,这些局中人根据策略地分析群体内其他 人可能做什么而进行理性的选择。
博弈论可以应用于诸如自然资源的使用,选取联合 国秘书长,动物习性,和OPEC的生产策略等广泛不 同的问题。 博弈论的创建追溯到150年前。但是,学科的主要 发展是近代的,大约在最近50年期间,使得博弈论成 为经济学与数学范围内最年轻的学科之一。 如拿子游戏和囚徒困境这种博弈的策略分析可以揭 示理性局中人将达到的结局。对于整个局中人群体来 说,这些结局并不总是称心的。

19 博弈的规则: “谁”(Who)在参与——策略地互相作用的局 中人群体。
每个博弈通过一组规则进行,规则必须说明四件事: “谁”(Who)在参与——策略地互相作用的局 中人群体。   他们以“什么”(What)来参与——每个局中人 可使用的策略供替代的行动或选择。          每个局中人“何时”(When)行动(以什么顺序) 从参与博弈所作的选择中,他们得到(或失去) “多少”(How much) 关于规则的共同知识 每一个局中人知道博弈的规则,并且这一现象是众所 周知的。

20 “谁”,“什么”,和“何时”:展开型 展开型 规则的一种图形表示式。主要的画图形式称 为博弈树,是由一个根和若干枝依次排列 组成。

21 信息集和策略 信息集 决策结的集合,局中人不能区分这些决策结 在展开型里怎样表示同时行动 策略
局中人的策略是指在局中人需要做出选择的信息集处可采取的行动。 在展开型里怎样表示同时行动 局中人1 局中人2 c n 策略是行动的蓝图,在每一个决策结告诉局中人如何去选择。由于局中人在任何一个信息集里不能区分决策结,策略详细说明了在每一个结所做的行动。

22 正则(或策略)型 博弈规则中另一种表示方式称为正则型或策略型 策略型
有关“局中人,他们每一个人可使用的策略,和每人 的得益”的完整的一览表。 sss ssb ssc bbs … ccb ccs ccc b N, T N, T N, T T, N N, T N, T N, T c T, N T, N T, N T, N T, N T, N T, N s T, N T, N N, T T, N T, N T, N N, T 局中人2 局中人1

23 冯诺伊曼——摩根斯坦效用函数 拿子游戏 Nim
假设在一堆中有2根火柴,在另一堆中有1根火柴。记这 个布局为(2,1)。与赢相联的盈利数必定高于对应 于输的盈利数;假设这些数分别为1与-1。 局中人1 1, -1 -1, 1 局中人2 (0, 0) (2, 1) (0, 1) l (1, 0) (1, 1) (2, 0) r L u R d m

24 策略型表示式如下: 1 / 2 lL lR rL rR u 1, -1 1, -1 1,-1 1, -1
m -1, 1 -1, 1 -1, 1 -1, 1 d 1, -1 -1, 1 1, -1 -1, 1

25 投票博弈 假如一个投票人所赞成的议案通过,她得到的盈 利为1。如果她的第二个选择通过,则盈利为0, 如果她最不赞同的抉择通过,此时她的盈利是-1。 投票人3 A 投票人3 N A 投票人2 B B A A 投票人2 1, 0, 0 N A B B 投票人1 投票人1 A B A A B N A 0, -1, 1 B

26 囚徒困境 c -5, -5 0, -15 n -15, 0 -1, -1 博弈的展开型 1 \ 2 c n 局中人2 n c -5, -5
局中人1 c -15, 0 n n 策略型 1 \ c n c -5, -5 0, -15 n -15, 0 -1, -1 -1, -1

27 总 结 1.博弈规则必须明确说明局中人是“谁”,每个局中人 可使用的选择是“什么”,和从局中人群体所作的一组选 择中,每个局中人得到“多少”。 2.博弈规则有两种主要的表示式,展开型和策略型。  3.展开型是博弈的图形表示,它明确地说明了局中人选 择的顺序,每个局中人有多少次选择(以及每次她可适用 的选择),和对于任何选择序列每个局中人最终的盈利。  4.策略型是这样的表示式,其中明确地说明了局中人的 选择(策略)和每组选择集带来的的盈利。你可以把策略 型视为博弈型式,局中人对所有的策略只做一次选择的。  5.博弈中的盈利应当被视为冯诺伊曼-摩根斯坦效用。对 于不确定情况,盈利应当在不确定性的所有可能解上取期 望值而计算得到。


Download ppt "博弈论 主讲 施锡铨 2004年3月."

Similar presentations


Ads by Google