賽局理論 Game Theory.

Slides:



Advertisements
Similar presentations
课程:博弈论 教材:《经济博弈论》 《经济博弈论习题指南》 复旦大学出版社. 第一章 导论 博弈论定义 经典博弈模型 博弈结构与分类 博弈论历史与发展 博弈论在中国的发展.
Advertisements

博弈论 经济管理实验班专业课程. 博弈论 任课教师: 刘辛 上课时间:周一第九、十节 周三第五、六节 联系方式: Tel: A 区经管学院 838.
我的 动 堂天 漫 制作人: 13312—22 青春 情感 悬疑推理 魔 法 系 列 动 漫系 列 动 漫 之.

Chater 4 土地資源的經濟報酬 — 地租(上). 地租的意義 使用土地從事生產所產生或所應生產的經濟報 酬( economic return )。 經濟報酬包括使用土地本身及改良物 ( improvements )。 又可分為建地租( ground rents )與位置地租 ( site rents.
集 合 执教: 韩青霞 义务教育课程标准实验教科书《小学数学》三年级下册 —— 数学广角 两个妈妈和两个女儿去看电 影,每人买一张票,却只买 了三张票就顺利进入了电影 院,为什么? 妈妈 女儿.
博弈论与经济学思维.
第七章 保险.
计算机组成原理.
通識教育理念 李澎蓉 (高師大通識教育中心) 2017/2/26.
Beautiful 男人女人大不同 溝通的障礙在那裡?.
社会主义的核心价值观 和构建和谐社会 —关于民生问题的思考
十八世紀歐洲人發現澳洲之前, 相信所有的天鵝都是白的。 在過去, 「天鵝=白色」的這個想法無懈可擊, 因為這和實證現象完全吻合。
A 費 百 袋 之 曼 夢 寶 別鬧了! 陳依琳 Mickey 許巧柔 Cathy 王思涵 Vera 林佳靜 Levita
怎样学得更好? --漫谈学习策略与学习效率 浙江大学心理系教授 曹立人 博士.
基督教伦理价值 2015年美东南华人基督徒夏令会专题讲座.
主講人 育達商業技術學院 學生輔導與諮商中心主任 簡宏江
許久以前,那是一個常常鬧鬼的時代,有一個南陽郡人,名叫宗定伯,生來大膽,喜歡走夜路,朋友都勸他小心,別惹到了鬼,他總是笑一笑。
第 7 章 馬可夫鏈與賽局理論.
以賽局角度探討企業經營策略 張宮熊 中華民國青年企業研究社2009理事長; 青年企業管理評論總編輯; 國立屏東科技大學企管系暨財金所教授;
第九章 寡头垄断市场的价格与产量决定.
第十章 小粒子和大宇宙.
公民與社會(第三冊) 政府與民主政治.
任 务 描 述 工 作 情 境 某 小李是大一计算机系新生,需要配备一台电脑用于学习,他为了配置到最具有学习价值的电脑,决定从计算机的基础知识开始,认识计算机。 计 算 机 释 义 计算机(Computer)是一种能够按照事先存储的程序,自动、高速地进行大量数值计算和各种信息处理的现代化智能电子设备。
實體配送期中分組報告 長尾理論 The Long Tail: Why the future of business is selling Less of More. 指導老師:鍾明志 班級:專二技流通四甲 組員:王嘉禎、康依臻 宓哲華、吳俊賢 黃聖傑、吳進財 張凱程.
0806班 全卷100分 语言基础与阅读60分 作文40分 赵宇成 高 洁 李欣然 龚妙岚 唐紫晔 石峰源 王俊然 游景稀 雷力行 卢倩雯
法国资产阶级共和制度的确立.
第三章 学习理论 主讲人 李 荟 平顶山学院.
1 組織、理論與管理.
继往开来,规范、高效 开创海珠教育科研新局面
第12讲 计算机仿真模型.
口腔衞生.
經濟體系與資源配置.
第三部分 博弈论 §3.1实验二:双方信任博弈 例如:一厂商支付给一名工人高于均衡水平的工资,并且期望这名工人能够回报以相应的更多的劳动。主动方厂商出于对被动方的信任,率先背离了标准的不合作博弈论所阐述的最优选择,若工人也提供了回报,则双方得到一个合作的结果。在现实中,这样的例子很多,比如酒店会给熟客赊账,而客人也不会赖账,我们将这一类建立在信任基础上的合作波已称为双方信任博弈。
湖北武当山.
科普 美丽的金属凝固组织 材料加工模拟研究部 王佳琪 2012年5月.
1-3 賽局論.
閱讀金庸小說結合寫作教學 教學者:蔡佩紋.
口腔卫生.
7 不完全競爭市場.
第十六章 賽局理論 Game Theory 作業研究 二版 2009 © 廖慶榮.
7 不完全競爭市場.
第三章 宪法.
伊斯兰信徒归信基督的十大原因 Joseph Wong.
長尾理論─打破80/20法則的新經濟學 Chris Anderson
HOW TO DO INVESTIGATION
Introduction to Game Theory
经济学原理 Principles of Economics 复旦大学经济学院 冯剑亮
博弈论及其应用 第4 章 协调与谈判 《博弈论及其应用》 (汪贤裕).
獨占市場的特徵 只有一家廠商 這家廠商可能販賣貨物 (如自來水公司),也可能提供服務 (如台灣證券交易所)。 產品無近似替代品
題目:喜樂爸爸的歷練 經文:創世記三十一章36-44節.
營建自動化 -Q.C.C品管圈 授課老師:劉俊杰 副教授 中華民國89年9月27日.
關心社會—向政府表達意見的渠道與方法.
以斯拉記3至6章.
城镇化与农民进城 主讲:就业指导中心 唐媚媚.
第七章 機率與賽局理論.
政治大學公企中心財經學分班 課程名稱:管理經濟學 MANAGERIAL ECONOMICS
學習目標 瞭解什麼是賽局 知道賽局是如何發展成一們重要的學科 瞭解賽局的本質 熟悉賽局組成的要素 OBJECTIVES.
Topic 8 賽局理論(Ch5).
學生:吳星龍 班級:資管二乙 指導老師:劉書彥
品質管理 章首個案:摩托羅拉 13.1 引言 13.2 品質管理的範疇與演進歷程 13.3 全面品質管理
社會關懷 關於同性婚姻合法化議題.
第10章 開放經濟的總體政策.
第12章 全球製造與物料管理.
此作品代表作者的观点与意见,与主办单位无关
政策利害關係 為何要探討政策利害關係 1.此為公共政策理論的基礎,任何一項公共政策的制訂,都涉及或多或少的利害關係有些人受益、有些人受害,有些人無任何實質影響。 2.就政策形成而言,好的政策方案必然是讓多數人受益,極少數人受害且能得到適當的物質補償或精神與道德的慰藉 因為,公共政策是以最大多數人的最大福利的賽局。
企業倫理道德結合大學課程之相關探討 Terrence R. Bishop 王稚翔 林孟葦 楊凡瑩.
創意的發生.
Blockly Game 遊戲中學程式設計.
CH7 城市體系與城市土地使用.
Presentation transcript:

賽局理論 Game Theory

賽局理論 現今激烈競爭的環境中,賽局理論 (Game Theory) 因應而生。其理論為開始於策墨洛(Zermelo,1913)、波雷爾(Borel,1921)及最重要是匈裔美籍數學家馮諾曼(Von Neumann John)(1903-1957)於1928年所奠基。當時馮諾曼的研究並不受到重視,直到1944年《Theory of games and economic behavior》一書問世才受到廣泛注目。那麼,賽局理論到底是什麼?

分家產 從前、從前有一戶人家因為分家產,老大與老二鬧的很不愉快,而告上衙門,如果你是知縣大人,你要如何解決這場紛爭? 這就是一個經典運用賽局理論的例子讓兩個人都得到他們理想中的家產。

知縣大人判決 知縣大人判決是讓老大來分家產,而讓老二先挑選自己的那一份。

分析判決 在這個判決中,由於老大負責分家產,而老大已經知道老二可以先挑選一份家產,在這個前提下,老大相信老二會挑走老二認為比較大的那一份,所以老大要怎樣才可以把損失降到最低呢? 那就是老大將兩份家產分的越平均越好;而老二知道自己可以先挑,於是就先保障了自己的權益了,自然不會反對知縣大人的判決。 

有錢出錢,有力出力 有一堆垃圾,規定要由張王李三戶人家清理。張戶人家因要事外出沒能參加,留下1800元錢做為代勞費。王戶人家上午起早清理了5小時,李戶人家下午接著清理了4小時剛好清理完畢。假設每小時工作量一樣,請問王戶人家和李戶人家應怎樣分配這1800元錢?

21顆石頭 假設有二十一顆石頭,有兩個玩家輪流撿石頭,每一個玩家每次最少要撿一顆石頭,最多可以撿3顆石頭,而撿到最後一顆石頭的玩家獲勝。 你若是其中一位玩家,你的策略是如何?

賽局理論 賽局理論又稱「博奕論」、「對策論」,為應用數學的一個分支,目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究一群決策者在決策時,所面臨的問題與戰略行為,所進行的一套有系統強有力的策略式互動行為 (interactive behavior) 分析工具方法。

多人決策 賽局理論是一種策略思考,提供了一套系統設定的數理分析方法,尋求在利害衝突競爭中,尋取自己的最大勝算或利益,必須做出最適當的選擇策略,透過策略推估,從而在競爭中求生存。  「我的計算必須考慮你的計算,而你的計算也考慮了我的計算」,為一門研究 「多人決策」之間的問題。賽局中的每一個人的決策會受到賽局中其他人的影響。

零和 賽局理論發展係馮諾曼首先證明基本的「壞中取小」定理,才被確立,此定理適用於設定只敵我兩方對峙競爭的「零和」(zero-sum)賽局,在此情形下所獲得的利益值,恰為對方所獲負數之虧損值,而對峙雙方所各獲得之值相加,則等於零。  「零和」舉個例子就是在一場比賽中,若甲輸了10元,乙就賺了10元。

馮諾曼 1944年這位 “數學家兼電腦的發明人” 馮諾曼著的「賽局理論與經濟行為」問世,進一步闡釋他的「零和理論」,才正式奠定了現代賽局理論的基礎而發揚光大,馮諾曼可堪稱為「賽局理論」發明人。

雙贏 由於經常需要所有參賽者齊心協力經營這場賽局,才能增加整體賽局的價值,並使每一個參賽者獲得較大的報酬。 因此當一場賽局的獎賞,要靠其他參賽者的配合才能獲得,則就比較會採行合作雙贏的策略。 

正常生產或山寨貨 若有N人都從事同一產品正常生產,則每人可得5N元。 若其中恰K人轉做山寨貨,則得5(N-K)+50元,但其他人得5(N-K)元。 請問你的決策是正常生產或做山寨貨? 何時N人所賺得錢最多?

美麗境界 在電影「美麗境界」(A Beautiful Mind) 中的男主角-納許(John Forbes Nash Jr.) ,被譽為是20世紀下半葉「最傑出的數學家」,他在美國普林斯頓大學提出的「 Non-cooperative Games 」博士論文,以研究設定「多人非合作」之賽局為論述,後來被稱「納許平衡」(Nash Eqilibrium)的概念,為日後「非合作賽局理論」 和「交易理論」 (bargaining theory)作了奠定性的貢獻。 

諾貝爾經濟學獎 雖然納許後來患了精神分裂症,經過了許多困擾和曲折,終於在1994年與加州柏克萊大學的哈桑尼(J.C.Harsanyi)及德國波恩大學的賽爾登(R.Selton)等賽局理論研究者共同獲得諾貝爾經濟學獎。

納許平衡 「納許平衡」的涵義表示在多人競爭的情況裡,有些參賽者會結盟以對抗他人,有些賽局可能有無限多種策略,還有非零和賽局。從這些賽局的數學分析可以得到混合策略的組合的平衡解,假設每位參賽者都堅持其平衡方式,每位參賽者都有一個解,每人都沒有理由偏離這組解。數學家納許證明,多人、非合作、有限策略的賽局都有至少一組平衡解。

配對成十 兩位同學在紙上寫下零到十之中的任何一個數字,然後跟另外一位同學配對,如果數字剛好等於十,兩個人就可以拿到寫下數字的錢,如果數字和不等於十,兩個人都拿不到錢。 請問你選哪一數字?

囚犯困境 囚犯困境是警方描述抓到兩位囚犯,然而因為證據不足,所以就把這兩位囚犯分開到不同的房間偵訊,並且分別和他們說,如果提供對方犯罪的證據,而對方保持緘默的話,對方要做10年的牢,而你可以無罪釋放。若你提供證據,對方也提供證據,那麼你們兩個會各坐5年的牢。但如果你們兩個都保持緘默,那麼因為證據不足,你們兩個分別坐牢6個月(半年)。 請問囚犯會如何提供口供?

「雙贏」或「雙輸」 「囚犯困境」(Prisoner’s dilemma),係由弗拉德(Merrill Flood )和德雷希爾(Melvin Dresher)在1951年所提出,之後由塔克(Albert W.Tucker)加以明確公式化和命名。所謂「囚犯困境」,是說遊戲雙方可能合作,但也可能不合作,描述真實世界是既競爭又合作的常態,證明以個人自我利益為出發點的最後結局,可能是「雙贏」或「雙輸」。

囚犯困境 囚徒困境假定每個囚犯都是利己的,即各自都尋求最大自身利益,而不關心另一囚犯的利益。警察隔離審訊兩名共犯案例,警察審訊囚犯採取抗拒從嚴,坦白從寬的策略,因囚犯被隔離時,多害怕對方招了而自己沒招時,會使自己刑責加重,對方則無罪開釋,結果囚犯雙方最後皆採取認罪策略而雙雙被關進牢裡。納許以此證明人性在被隔離的限制因素下,產生的各謀自己利益的謀略,形成「囚犯困境」現象,反而造成雙輸的局面。 

選擇背叛 二個囚犯面對的情況都一樣,所以二人的理性思考都會得出相同的結論—選擇背叛。 背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納許平衡,就是雙方參與者都背叛對方,結果二人同樣服刑5年。 這場賽局的納許平衡,顯然不是顧及團體利益的帕累托最優解決方案。

雙贏 「囚犯困境」是「非零和博弈」中具代表性的例子 。 製造雙贏是大家最樂見的情況,如果彼此都做出讓對方有利的策略,會得到更好的結果。但若因彼此雙方不信任,各懷鬼胎,有時可能會走入「囚犯困境」。

國際談判 「囚犯困境」理論應用到國際間談判,談判結果達成雙輸或雙贏取決在兩方能否掌握充分資訊,瞭解敵情及互信的基礎。 雙贏與雙輸其實在一線之隔,「納許平衡」提醒競爭者彼此之間培養相互信賴、溝通、合作的重要性。 這種賽局雖然每個賽局者有一種 “優勢” 的策略可以在抵抗對方可能的反制策略下,使自己獲得最大效益。可是如果雙方皆採 "劣勢" 的妥協策略,則每一方都可以獲得較好的效益。

固定局數的囚徒困境 試想像囚徒困境的情況總共進行十次。 由最後一局—第十局逆推,因為十局已經完結,囚徒沒有必要為維持互信的關係而沉默(沒有第十一局),所以第十局囚徒一定會背叛對方的,理由和只有一局的囚徒困境一樣,那在往前推第九局、、、。 只有在囚徒困境的局數大家都不肯定的情況下,上述的推論才不會發生,才會出現互相保持沉默的現象。

納許平衡 納許證明在每個參與賽局者都只有有限策略選擇,並允許混合策略的前提下,「納許平衡」一定存在。 如在商場競爭,對方不改變價格的條件下,既不能漲價,否則會進一步喪失市場,也不能降價,因會出現賠本情況。於是兩家公司可以改變原先的利益格局,通過「談判」尋求新的利評估分攤方案,也就是所謂「納許均衡」。 

損人不利己 「納許平衡」也意味著兩敗俱傷的可能性,沒有一位參賽者能單方面背離該策略而獲利,在互不合作的前提下打價格戰,打到最後,出現一個均衡的結局是「無利潤」,這是「非合作的博弈均衡」,大家互相擠壓、排斥,誰都想獲得最大的利益,但是最後誰都沒有獲得利益,指出從利己的角度出發,最後達到的結果卻是損人不利己。 

平均數的一半 每一同學在1至100中選一個數字,再將所有參加同學選的數字求平均,最接近平均的一半的人為贏家。 請問你選哪一數字?

其他例子 軍備競賽 、關稅戰爭、廣告戰、自行車賽 、自行取報放錢、「認罪減刑」不可行 、公共用品的悲劇 (公海捕魚)、、、。

帕累托最優 帕累托最優(Pareto Optimality),也稱為帕累托效率,是義大利經濟學家維弗雷多·帕雷托(1848~1923)的名字命名的,是經濟學中的重要概念,並且在賽局理論 、 工程學和社會科學中有著廣泛的應用。 經濟學理論認為,如果市場是完備的和充分競爭的,市場交換的結果一定是帕累托最優的。

帕累托最優 帕累托最優是指資源分配的一種理想狀態。假定固有的一群人和可分配的資源,如果從一種分配狀態到另一種狀態的變化中,在沒有使任何人境況變壞的前提下,使得至少一個人變得更好,這就是帕累托改善。帕累托最優的狀態就是不可能再有更多的帕累托改善的狀態;換句話說,不可能再改善某些人的境況,而不使任何其他人受損。 帕累托改善要求在提高某些人福利的時候不能減少任何一個人的福利,而功利主義則允許為了提高福利總和而減少一些人的福利。

八二法則 帕累托法則(Pareto principle),也稱為八二法則,則是由約瑟夫·朱蘭(Joseph M. Juran)根據帕雷托當年對義大利20%的人口擁有80%的財產的觀察而得推論出來的,此法則指在眾多現象中,80%的結果取決於20%的原因,而這一法則在很多方面被廣泛的應用。 帕雷托法則在品質控制上有很多的應用,它是全面品質管理、六標準差(Six Sigma)的關鍵工具 。

長尾效應 長尾(或長尾效應, The Long Tail)一詞最初由Chris Anderson發表在2004年的《連線雜誌》中, 用來描述諸如亞馬遜和Netflix Real.com Rhapsody 之類網站的商業和經濟模式。是指那些原來不受到重視的銷量小,種類多的產品或服務由於總量巨大,累積起來的總收益超過主流產品的現象。在網際網路領域,長尾效應尤為顯著。

長尾定論與八二法則 向來被商業界視為鐵律「八二法則」,其內涵認為企業界80%的業績來自20%的產品,就此看法,商業經營看重的是銷售曲線左端的少數暢銷商品,曲線右端的多數冷門商品,被該定律定義為不具銷售力且無法獲利的區塊。但長尾定論卻認為,網際網路的崛起已打破這項鐵律,廣泛的銷售層面,讓99%的產品都有機會銷售,而這些具有長尾特性商品將具有增長企業營利空間的價值。不但如此,長尾商品的規模還大得驚人,其商品的總值甚至可與暢銷商品抗衡。

參考資料 無所不在的數學現象,朴景美著,王海娟譯,晨星出版社。 賽局淺說 ,姚景星、劉睦雄 ,數學傳播第一卷第三期。 鴨寮,http://www.ducknest.com/essey/recipe/gametheory.htm 維基百科