博弈论 主讲 施锡铨 2004年3月.

Slides:



Advertisements
Similar presentations
讀經教育  第一組:吳碧霞、陳鍾仁  第二組:吳雪華、謝濰萁  第三組:邱國峰、林佳玫. 不論上智下愚 成功的教育 讓每個孩子 都能成為最優秀的人才.
Advertisements

护理部教学管理 南医大二附院 张淑芬. 护理部主要工作:  培训  质量  教学科研 临床教学的秘诀 What – 需要的、喜欢的 Who – 教师的角色 – 学生的程度、学习方式 How – 教学方法.
何仕仁 主任. 國立彰化高中數理資優班 柯承翰、柯宗賢、曾品祥 國立彰化高中數理實驗班 柯宗逸、辛百弘 國立彰化女中數理資優班 姚彤錦 國立彰化女中語文資優班 陳思穎 國立彰化女中數理實驗班 姚曉蓉.
第五冊第一章 西亞 班級 : 國三丁班. 簡介 西亞與中亞氣候 乾燥,傳統上是 游牧民族重要的 生活空間,而今 日當地盛產的石 油、複雜的民族 紛爭與特殊的地 理位置,緊密地 牽動全球的經濟 與政治情勢變化, 成為國際關注的 焦點之一。
補救教學理念與實施分享 新豐國中姜瑞玉. Why ─ 為何要實施補救教學 各國老年人口變化圖 國中在學階段 2 大重點 1. 國中教學正常化及 學力品質確保 2. 國中適性輔導 適時進行校、班本位 診斷性測驗及 補救教學.
公民與社會總複習(二) 師大附中 魏嘉美.
新闻写作基础知识 一. 新闻导语 二.新闻主体 三.新闻结构 四.角度选择.
人力资源管理师辅导讲座 ——案例分析及解题要点
第一部分 考试总体分析 第二部分 命题思路与答题方法 技巧分析
企业培训师培训(上) 王 囤 副教授.
外贸公社海关数据系统介绍 ——中国外贸营销新思路-主动出击.
對於學習不力學生的學習輔導經驗分享 張其清 新北市立新北高工 主任輔導教師.
公文寫作 演講人 高 文 民.
應用寫作與口語表達之一 報 導 文 學.
使用說明 高年級 破解賽恩思 (Science)密碼 編輯群 明湖國小 吳立明 老師 李惠雯 老師 林宜璇 老師.
第六章 顾客购买行为分析 学习目标 了解顾客购买行为分析的模式 理解消费者购买行为的特征和类型 掌握影响消费者购买行为的因素
推論與自我提問 閱讀教學師資培訓研習營.
要SHOW才會贏 教你在生活中學企劃 救國團總團部活動處 文耀忠.
防災教育管理與資源整合 主講者:康麗娟.
加油添醋話擴寫 日新國小 鄒彩完.
【家庭生活記趣 】 ▲幫忙製作相關標題 有▲記號,請美編設計找圖案.
聰明小紅帽~ 自我身體保護 救國團新竹張老師 李 清 垣.
社区营养管理与干预 第四军医大学唐都医院 叶琳 Tel: ,
課程設計者:新北市育林國中 林憶辰老師 分享者:林慧娟
大家好!.
十二年國民基本教育 高雄區入學方式說明 報告人:中山工商 楊薇主任.
屏東區 十二年國民基本教育 「入學方式」宣導講綱
屏東區 十二年國民基本教育宣導 「入學方式」 屏東縣十二年國教宣導種子講師 飛夢林學園 黃豊欽.
數學解題王 ~從閱讀策略談起 分享者:吳祥銘老師.
思维,决定一切 -公司战略、企业文化与人力资源的思辨
第四讲 组织结构与人员配置 复旦大学管理学院 芮明杰教授
研究結果的呈現.
案例研究报告撰写.
資2-6-3 能發現並討論問題 教育部增置國小圖書教師輔導與教育訓練計畫 圖書資訊利用教育教學綱要及教學設計小組
拉萨属高原温带半干旱季风气候,平均海拔3658米,年日照3000多小时,素有“日光城”、“太阳城”的美誉。年最高气温29℃,最低气温零下16
项 目 一 统计调查的设计与实施 ——统计数据的搜集.
培训师培训 —龙程酒业管理模式实施准备 北京光起管理模式设计有限公司 徐新陶.
101學年度大學校院協助高中高職優質精進計畫/子計畫「產學創業企劃實務」
南山区自主创新产业发展专项资金 文化产业发展政策解读 南山区政府文化产业发展办公室 李斌.
1、什么是工具?你能给“工具”下个定义吗? 2、您在工作、学习中都使用哪些工具? 3、您知道(或使用)的第一本工具书是什么?
國語演說的指導訓練與實務分享 桃園縣中原國小 王宣驊.
讀 報 活 動 報紙版面知多少.
第五章 医药营销团队建设 医药营销技术.
社團企劃書撰寫暨實際演練 巫正淵 (商務科技管理系秘書).
第六次人口普查工作过程 人口普查方案设计 入户登记调查和复查 资料分析和公布 资料整理汇总.
第三章 描述和分析问题.
義工訓練 程序設計須知.
新闻写作刍议.
新疆自治区“十二五”科技发展 规划编制工作
湖南农业大学 通讯的采写.
Human Resource Management
离职流程精细化标准推进材料 人事行政处.
沿途风光讲解 全国职业教育数字化资源共建共享 旅游服务与管理 W-1.
新聞報導 一、什麼是新聞? 1、狗咬人不是新聞,人咬狗才是新聞 2、大眾關切的事 3、讀者有興趣知道的事 4、接近性.
教案名稱: 社群網站的益處 本教案製作者:毛俞婷
加油添醋話擴寫 鄒彩完.
校園小記者.
預備主的道路 (馬太福音3:1-12).
107學年度高雄區國中技藝技能 優良學生甄審入學說明會
107學年度高雄區 實用技能學程輔導分發 五福國中說明會
102-2金融法規(2~4) ~03..
南投縣106年度 結合家長會防制學生藥物濫用宣導
南投縣106年度 結合家長會防制學生藥物濫用宣導
面試Cosplay 2015/03/31 by江宜倩.
108學年度高雄區國中技藝技能 優良學生甄審入學說明會
2019年“国科大杯”创新创业大赛参赛项目 商业计划书PPT模板
轴无处不在.
构件图和部署图.
活動主題:能「合」才能「作」 指導教授:張景媛教授 設 計 者:協和國小團隊 李張鑫 × 陳志豪.
第一节 计划的概念及其性质 第二节 计划的类型 第三节 计划编制过程
Presentation transcript:

博弈论 主讲 施锡铨 2004年3月

第一章 引论 应用及例题 基本理论

博弈论关注的是互相依存(interdependence) 每一个体猜测其他个体的选择是什么? 每个人将采取什么样的行动?(当最优的行动依赖于 其他人的所作所为时,这个问题尤其令人关注。)  这些行动产生什么样的结局?对于整个群体,这个 结局好吗? 如果群体不止一次地互相作用,会有任何差异吗? 如果每一个体对群体内其他个体的特性没有把握, 答案将发生怎样的变化?

取自经济学,政治学,财政金融,法律,甚至日常生活中的若干相互依存性事例 艺术品拍卖 (诸如在克里斯蒂(Christie) 或索士比(Sotheby)拍卖行,那里待售出 自布拉克(Braque)直至维罗内塞 (Veronese)的艺术品)和债券拍卖(美国 财政部为筹措联邦预算支出,以这种方式 出售政府公债) 。 联合国的选举( 例如,选举新的联合国秘 书长) 。

动物争斗(争夺良好的栖息地以及种类中 稀少的发情期雌性动物,等等)。 自然资源的可持续使用(像石油那样的可 耗尽资源或像森林那样的可重建资源的提 取形式) 。 运动会和工作场所的随机药物检测(选取 少量运动员和工作人员进行核实使用违禁 药物的测试) 。 破产法(详细说明在什么时候和有多少债 权人可以从已破产的公司那儿收账) 。

“毒药”条款(该条款给予管理部门一定的权限 以抵制不受欢迎者试图接管或兼并他们的公司) R&D开支(譬如,制药公司的研究开发费用) 第一次世界大战的壕沟战(在法德之间的边界 地区,当军队连续数月地互相对峙时,掘进到 敌方的战壕里去) OPEC(石油卡特尔,控制着世界石油产量的 一半,因此,在决定人们支付油价方面拥有重 要的发言权 群体项目(诸如为你们的博弈论课程准备案例 研究)

分析在一群举止行为颇具 策略的理性人之间的相互 作用的正规方法。 博弈论—— 分析在一群举止行为颇具 策略的理性人之间的相互 作用的正规方法。

博弈论是考虑以下每一项条款的正规方法: 群体——在任何博弈中有不止一个决策者; 每一个决策者称为局中人 相互作用——任何单个局中人的行为直接 影响到群体内至少一个其他的局中人。 策略——单个局中人在决定自己所取的行 动时,会考虑到相互依存性。 理性——在考虑到这种相互依存性时,每 一个局中人会选择自己的最优行动。

来自日常生活中的例子 致力于一项群体项目,为博弈论课程准备 案例研究:“群体”包括一起做案例的学 生。他们之间的“相互作用”来自于这样 的事实:为了写一篇论文,需要付出一定 的工作量;因此,如果一个学生偷懒,另 外的某个人在论文到期前的夜晚不得不投 入额外的几个小时。“策略”运用包含了 估计群体内总想占别人便宜者的可能性, “理性”参与需要对较好分数的好处与额 外工作的成本仔细地进行比较。

(奥林匹克运动会中)中随机药物检测: “群体”由比赛运动员和国际奥林匹克委员 会(IOC)组成。“相互作用”是两方面的, 一方面是运动员之间的相互作用——他们做 出在训练安排中和不管什么情况下一样服禁 药的决策;另一方面是在运动员与IOC之间的 相互作用,后者需要维护运动的声誉。“理 性策略”的应用需要运动员根据获胜的机会 以及如果服用了兴奋剂之后被逮到的机会之 间进行比较而作出决策。类似地,它要求IOC 根据检测成本和清白声誉的价值而制定药物 检测的程序和相应的惩罚措施。

经济与财政金融的例子 制药公司的R&D效果:某些评估表明,研究与 开发(R&D)经费支出占美国制药公司年销售 额的20%之多。以及平均来说,一种新药的开 发成本大约为3亿5千万美元。公司自然关心诸 如资金投入哪一条生产线,新药定价应多高, 如何缩减与新药开发相伴的风险,等等问题。 在这个例子中,“群体”是药物公司全体组成 的集合。“相互作用”起因于药的最先开发者 将获得最大的收益(由于专利权的缘故)。如 果R&D经费的选取大小使得在确知竞争者对这 条新药生产线进行投资的前提下能最大化从新 药开发中得到收益,那么 “R&D” 经费是策略 性的和是理性的。

债券拍卖:正常情况下,美国财政部通过拍卖形式处 理政府证券 债券拍卖:正常情况下,美国财政部通过拍卖形式处 理政府证券*。主要的投标人是投资银行,如莱曼兄 弟(Lehman Brothers) 或摩里尔林奇(Merrill Lynch)等(他们转而将证券出售给他们的客户)。 因此,“群体”就是投资银行组成的集合。(实际上, 从一次拍卖到又一次拍卖,这些投标人极少发生改 变。)他们“互相作用和影响”着,因为其他人的标 价决定了一个投标人是否分配到任何债券,也可能决 定了投标人支付的价钱。如果投标基于可能的竞争上 和在支付太多与得不到任何债券的风险之间达到适当 的平衡,那么,“出价”是“理性的”和“策略的”。 * 这些证券是公债和国库债券,以及公共部门(或者他们的代理人,例 如共同基金信托公司或养老基金等)所拥有的准金融债券。这些证券 承诺在一个固定的周期(譬如,三个月,一年,或五年)后支付一笔 钱。另外,他们也可能承诺在证券有效期内定期地支付固定额的钱款。

来自生物学与法律方面的例子 动物习性:刚过去的25年里,博弈论更吸引人的应用 之一已经深入生物学领域,特别是关于动物之间争斗 和竞争的分析。通常野生动物不得不为了稀少资源 (诸如具繁殖能力的雌性动物或者动物的尸体)而竞 争;于是,为了发现这些资源——或者为了从发现者 那儿夺取资源,它们会有所付出。问题在于这种做法 会导致代价昂贵的争斗。这里,“局中人群体”是眼 睛盯着同一猎物的所有动物。由于资源的有限性,它 们互相影响着。假如它们考虑竞争对手做出反应,选 择就是“策略”,如果由于这种“策略”满足了它们 的短期目标,譬如解决了饥饿,或者满足了它们的长 期目标,譬如保持了物种的繁衍不绝,这样的选择是 “理性的”。

破产法:在美国,一旦公司宣告破产,它的 财产不再由单独的债权人扣押,而代之以安 全保管,直至公司与它的债权人达成某种程 度的谅解。但是,债权人可以在破产宣告之 前促使法庭去收帐 (虽然通过这种做法债权人 可能逼迫公司陷入破产)。这里,债权人“群 体”内的“相互作用”来自于这样的事实: 个别债权人能够成功地依法占有的钱就不再 可能属于其他任何一个人。“策略”的选取 需要估计其他债权人可能有多大耐心,而 “理性的”选择包含了在早收账与逼迫公司 不必要的破产之间的权衡。

例题 1. 拿子游戏 (Nim和Marienbad) 这是两个室内游戏,玩法如下。有两堆火柴,和两 个局中人。游戏从局中人1开始,此后局中人轮 流行动。在每个局中人的轮次里,他可以从两 堆火柴的任一堆中拿走任何数量的火柴。只要 任何一堆中尚有剩余的火柴,则要求每个局中 人拿走一定数量且不能空手而返,但每个轮次 只能从一堆中取火柴。 在“拿子游戏”Nim中,无论那个局中人,取走最 後火柴者算赢。而在Marienbad,谁拿走最后 的火柴,那么这个局中人就算输。

2. 投票 假设有两个竞争议案,这里表示为A与B,3个议员, 投票人1,2和3,他们投票决定是否通过这些议案。 结局可能会是两种中的某一个:要么通过A和B中的 一个,要么议员们没有通过任何一项议案(延缓而以 原来法律代替)。投票过程如下:首先,让议案A与 议案B互相竞争;然后,竞争的获胜方与原来法律互 相竞争,为简便起见,我们将原法律称为“都不赞成” (或者N)。在两轮投票中的每一轮,获多数票的法 案算胜出。三个议员在可适用的选择中有如下偏好:  投票人1: 投票人2: 投票人3: (这里, 表示“喜欢议案A甚于喜欢议案B”)

3. 囚徒困境 克雷\卡尔文 认罪 不认罪 认罪 5,5 0,15 不认罪 15,0 1,1

总 结 博弈论是研究相互依存性的。它研究局中人群体中 的互相作用,这些局中人根据策略地分析群体内其他 人可能做什么而进行理性的选择。 博弈论可以应用于诸如自然资源的使用,选取联合 国秘书长,动物习性,和OPEC的生产策略等广泛不 同的问题。 博弈论的创建追溯到150年前。但是,学科的主要 发展是近代的,大约在最近50年期间,使得博弈论成 为经济学与数学范围内最年轻的学科之一。 如拿子游戏和囚徒困境这种博弈的策略分析可以揭 示理性局中人将达到的结局。对于整个局中人群体来 说,这些结局并不总是称心的。

博弈的规则: “谁”(Who)在参与——策略地互相作用的局 中人群体。 每个博弈通过一组规则进行,规则必须说明四件事: “谁”(Who)在参与——策略地互相作用的局 中人群体。   他们以“什么”(What)来参与——每个局中人 可使用的策略供替代的行动或选择。          每个局中人“何时”(When)行动(以什么顺序) 从参与博弈所作的选择中,他们得到(或失去) “多少”(How much) 关于规则的共同知识 每一个局中人知道博弈的规则,并且这一现象是众所 周知的。

“谁”,“什么”,和“何时”:展开型 展开型 规则的一种图形表示式。主要的画图形式称 为博弈树,是由一个根和若干枝依次排列 组成。

信息集和策略 信息集 决策结的集合,局中人不能区分这些决策结 在展开型里怎样表示同时行动 策略 局中人的策略是指在局中人需要做出选择的信息集处可采取的行动。 在展开型里怎样表示同时行动 局中人1 局中人2 c n 策略是行动的蓝图,在每一个决策结告诉局中人如何去选择。由于局中人在任何一个信息集里不能区分决策结,策略详细说明了在每一个结所做的行动。

正则(或策略)型 博弈规则中另一种表示方式称为正则型或策略型 策略型 有关“局中人,他们每一个人可使用的策略,和每人 的得益”的完整的一览表。 sss ssb ssc bbs … ccb ccs ccc b N, T N, T N, T T, N N, T N, T N, T c T, N T, N T, N T, N T, N T, N T, N s T, N T, N N, T T, N T, N T, N N, T 局中人2 局中人1

冯诺伊曼——摩根斯坦效用函数 拿子游戏 Nim 假设在一堆中有2根火柴,在另一堆中有1根火柴。记这 个布局为(2,1)。与赢相联的盈利数必定高于对应 于输的盈利数;假设这些数分别为1与-1。 局中人1 1, -1 -1, 1 局中人2 (0, 0) (2, 1) (0, 1) l (1, 0) (1, 1) (2, 0) r L u R d m

策略型表示式如下: 1 / 2 lL lR rL rR u 1, -1 1, -1 1,-1 1, -1 m -1, 1 -1, 1 -1, 1 -1, 1 d 1, -1 -1, 1 1, -1 -1, 1

投票博弈 假如一个投票人所赞成的议案通过,她得到的盈 利为1。如果她的第二个选择通过,则盈利为0, 如果她最不赞同的抉择通过,此时她的盈利是-1。 投票人3 A 投票人3 N A 投票人2 B B A A 投票人2 1, 0, 0 N A B B 投票人1 投票人1 A B A A B N A 0, -1, 1 B

囚徒困境 c -5, -5 0, -15 n -15, 0 -1, -1 博弈的展开型 1 \ 2 c n 局中人2 n c -5, -5 局中人1 c -15, 0 n n 策略型 1 \ 2 c n c -5, -5 0, -15 n -15, 0 -1, -1 -1, -1

总 结 1.博弈规则必须明确说明局中人是“谁”,每个局中人 可使用的选择是“什么”,和从局中人群体所作的一组选 择中,每个局中人得到“多少”。 2.博弈规则有两种主要的表示式,展开型和策略型。  3.展开型是博弈的图形表示,它明确地说明了局中人选 择的顺序,每个局中人有多少次选择(以及每次她可适用 的选择),和对于任何选择序列每个局中人最终的盈利。  4.策略型是这样的表示式,其中明确地说明了局中人的 选择(策略)和每组选择集带来的的盈利。你可以把策略 型视为博弈型式,局中人对所有的策略只做一次选择的。  5.博弈中的盈利应当被视为冯诺伊曼-摩根斯坦效用。对 于不确定情况,盈利应当在不确定性的所有可能解上取期 望值而计算得到。