賽局理論 Game Theory.

賽局理論 Game Theory

賽局理論現今激烈競爭的環境中，賽局理論 (Game Theory) 因應而生。其理論為開始於策墨洛(Zermelo，1913)、波雷爾(Borel，1921)及最重要是匈裔美籍數學家馮諾曼（Von Neumann John）（）於1928年所奠基。當時馮諾曼的研究並不受到重視，直到1944年《Theory of games and economic behavior》一書問世才受到廣泛注目。那麼，賽局理論到底是什麼？

分家產從前、從前有一戶人家因為分家產，老大與老二鬧的很不愉快，而告上衙門，如果你是知縣大人，你要如何解決這場紛爭？
這就是一個經典運用賽局理論的例子讓兩個人都得到他們理想中的家產。

知縣大人判決知縣大人判決是讓老大來分家產，而讓老二先挑選自己的那一份。

分析判決在這個判決中，由於老大負責分家產，而老大已經知道老二可以先挑選一份家產，在這個前提下，老大相信老二會挑走老二認為比較大的那一份，所以老大要怎樣才可以把損失降到最低呢？那就是老大將兩份家產分的越平均越好；而老二知道自己可以先挑，於是就先保障了自己的權益了，自然不會反對知縣大人的判決。

有錢出錢，有力出力有一堆垃圾，規定要由張王李三戶人家清理。張戶人家因要事外出沒能參加，留下1800元錢做為代勞費。王戶人家上午起早清理了５小時，李戶人家下午接著清理了４小時剛好清理完畢。假設每小時工作量一樣，請問王戶人家和李戶人家應怎樣分配這1800元錢?

21顆石頭假設有二十一顆石頭，有兩個玩家輪流撿石頭，每一個玩家每次最少要撿一顆石頭，最多可以撿3顆石頭，而撿到最後一顆石頭的玩家獲勝。
你若是其中一位玩家，你的策略是如何？

賽局理論賽局理論又稱「博奕論」、「對策論」，為應用數學的一個分支，目前在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。主要研究一群決策者在決策時，所面臨的問題與戰略行為，所進行的一套有系統強有力的策略式互動行為 (interactive behavior) 分析工具方法。

多人決策賽局理論是一種策略思考，提供了一套系統設定的數理分析方法，尋求在利害衝突競爭中，尋取自己的最大勝算或利益，必須做出最適當的選擇策略，透過策略推估，從而在競爭中求生存。「我的計算必須考慮你的計算，而你的計算也考慮了我的計算」，為一門研究「多人決策」之間的問題。賽局中的每一個人的決策會受到賽局中其他人的影響。

零和賽局理論發展係馮諾曼首先證明基本的「壞中取小」定理，才被確立，此定理適用於設定只敵我兩方對峙競爭的「零和」（zero-sum）賽局，在此情形下所獲得的利益值，恰為對方所獲負數之虧損值，而對峙雙方所各獲得之值相加，則等於零。「零和」舉個例子就是在一場比賽中，若甲輸了10元，乙就賺了10元。

馮諾曼 1944年這位 “數學家兼電腦的發明人” 馮諾曼著的「賽局理論與經濟行為」問世，進一步闡釋他的「零和理論」，才正式奠定了現代賽局理論的基礎而發揚光大，馮諾曼可堪稱為「賽局理論」發明人。

雙贏由於經常需要所有參賽者齊心協力經營這場賽局，才能增加整體賽局的價值，並使每一個參賽者獲得較大的報酬。
因此當一場賽局的獎賞，要靠其他參賽者的配合才能獲得，則就比較會採行合作雙贏的策略。

正常生產或山寨貨若有N人都從事同一產品正常生產，則每人可得5N元。
若其中恰K人轉做山寨貨，則得5（N-K）＋50元，但其他人得5（N-K）元。請問你的決策是正常生產或做山寨貨？何時N人所賺得錢最多？

美麗境界在電影「美麗境界」(A Beautiful Mind) 中的男主角-納許(John Forbes Nash Jr.) ，被譽為是20世紀下半葉「最傑出的數學家」，他在美國普林斯頓大學提出的「 Non-cooperative Games 」博士論文，以研究設定「多人非合作」之賽局為論述，後來被稱「納許平衡」(Nash Eqilibrium)的概念，為日後「非合作賽局理論」和「交易理論」 (bargaining theory)作了奠定性的貢獻。

諾貝爾經濟學獎雖然納許後來患了精神分裂症，經過了許多困擾和曲折，終於在1994年與加州柏克萊大學的哈桑尼(J.C.Harsanyi)及德國波恩大學的賽爾登(R.Selton)等賽局理論研究者共同獲得諾貝爾經濟學獎。

納許平衡「納許平衡」的涵義表示在多人競爭的情況裡，有些參賽者會結盟以對抗他人，有些賽局可能有無限多種策略，還有非零和賽局。從這些賽局的數學分析可以得到混合策略的組合的平衡解，假設每位參賽者都堅持其平衡方式，每位參賽者都有一個解，每人都沒有理由偏離這組解。數學家納許證明，多人、非合作、有限策略的賽局都有至少一組平衡解。

配對成十兩位同學在紙上寫下零到十之中的任何一個數字，然後跟另外一位同學配對，如果數字剛好等於十，兩個人就可以拿到寫下數字的錢，如果數字和不等於十，兩個人都拿不到錢。請問你選哪一數字？

囚犯困境囚犯困境是警方描述抓到兩位囚犯，然而因為證據不足，所以就把這兩位囚犯分開到不同的房間偵訊，並且分別和他們說，如果提供對方犯罪的證據，而對方保持緘默的話，對方要做10年的牢，而你可以無罪釋放。若你提供證據，對方也提供證據，那麼你們兩個會各坐5年的牢。但如果你們兩個都保持緘默，那麼因為證據不足，你們兩個分別坐牢6個月(半年)。請問囚犯會如何提供口供？

「雙贏」或「雙輸」「囚犯困境」(Prisoner’s dilemma)，係由弗拉德（Merrill Flood ）和德雷希爾（Melvin Dresher）在1951年所提出，之後由塔克（Albert W.Tucker）加以明確公式化和命名。所謂「囚犯困境」，是說遊戲雙方可能合作，但也可能不合作，描述真實世界是既競爭又合作的常態，證明以個人自我利益為出發點的最後結局，可能是「雙贏」或「雙輸」。

囚犯困境囚徒困境假定每個囚犯都是利己的，即各自都尋求最大自身利益，而不關心另一囚犯的利益。警察隔離審訊兩名共犯案例，警察審訊囚犯採取抗拒從嚴，坦白從寬的策略，因囚犯被隔離時，多害怕對方招了而自己沒招時，會使自己刑責加重，對方則無罪開釋，結果囚犯雙方最後皆採取認罪策略而雙雙被關進牢裡。納許以此證明人性在被隔離的限制因素下，產生的各謀自己利益的謀略，形成「囚犯困境」現象，反而造成雙輸的局面。

選擇背叛二個囚犯面對的情況都一樣，所以二人的理性思考都會得出相同的結論—選擇背叛。
背叛是兩種策略之中的支配性策略。因此，這場博弈中唯一可能達到的納許平衡，就是雙方參與者都背叛對方，結果二人同樣服刑5年。這場賽局的納許平衡，顯然不是顧及團體利益的帕累托最優解決方案。

雙贏「囚犯困境」是「非零和博弈」中具代表性的例子。
製造雙贏是大家最樂見的情況，如果彼此都做出讓對方有利的策略，會得到更好的結果。但若因彼此雙方不信任，各懷鬼胎，有時可能會走入「囚犯困境」。

國際談判「囚犯困境」理論應用到國際間談判，談判結果達成雙輸或雙贏取決在兩方能否掌握充分資訊，瞭解敵情及互信的基礎。
雙贏與雙輸其實在一線之隔，「納許平衡」提醒競爭者彼此之間培養相互信賴、溝通、合作的重要性。這種賽局雖然每個賽局者有一種 “優勢” 的策略可以在抵抗對方可能的反制策略下，使自己獲得最大效益。可是如果雙方皆採 "劣勢" 的妥協策略，則每一方都可以獲得較好的效益。

固定局數的囚徒困境試想像囚徒困境的情況總共進行十次。
由最後一局—第十局逆推，因為十局已經完結，囚徒沒有必要為維持互信的關係而沉默(沒有第十一局)，所以第十局囚徒一定會背叛對方的，理由和只有一局的囚徒困境一樣，那在往前推第九局、、、。只有在囚徒困境的局數大家都不肯定的情況下，上述的推論才不會發生，才會出現互相保持沉默的現象。

納許平衡納許證明在每個參與賽局者都只有有限策略選擇，並允許混合策略的前提下，「納許平衡」一定存在。
如在商場競爭，對方不改變價格的條件下，既不能漲價，否則會進一步喪失市場，也不能降價，因會出現賠本情況。於是兩家公司可以改變原先的利益格局，通過「談判」尋求新的利評估分攤方案，也就是所謂「納許均衡」。

損人不利己「納許平衡」也意味著兩敗俱傷的可能性，沒有一位參賽者能單方面背離該策略而獲利，在互不合作的前提下打價格戰，打到最後，出現一個均衡的結局是「無利潤」，這是「非合作的博弈均衡」，大家互相擠壓、排斥，誰都想獲得最大的利益，但是最後誰都沒有獲得利益，指出從利己的角度出發，最後達到的結果卻是損人不利己。

平均數的一半每一同學在1至100中選一個數字，再將所有參加同學選的數字求平均，最接近平均的一半的人為贏家。請問你選哪一數字？

其他例子軍備競賽、關稅戰爭、廣告戰、自行車賽、自行取報放錢、「認罪減刑」不可行、公共用品的悲劇（公海捕魚）、、、。

帕累托最優帕累托最優（Pareto Optimality），也稱為帕累托效率，是義大利經濟學家維弗雷多·帕雷托（1848～1923）的名字命名的，是經濟學中的重要概念，並且在賽局理論、工程學和社會科學中有著廣泛的應用。經濟學理論認為，如果市場是完備的和充分競爭的，市場交換的結果一定是帕累托最優的。

帕累托最優帕累托最優是指資源分配的一種理想狀態。假定固有的一群人和可分配的資源，如果從一種分配狀態到另一種狀態的變化中，在沒有使任何人境況變壞的前提下，使得至少一個人變得更好，這就是帕累托改善。帕累托最優的狀態就是不可能再有更多的帕累托改善的狀態；換句話說，不可能再改善某些人的境況，而不使任何其他人受損。帕累托改善要求在提高某些人福利的時候不能減少任何一個人的福利，而功利主義則允許為了提高福利總和而減少一些人的福利。

八二法則帕累托法則（Pareto principle），也稱為八二法則，則是由約瑟夫·朱蘭（Joseph M. Juran）根據帕雷托當年對義大利20%的人口擁有80%的財產的觀察而得推論出來的，此法則指在眾多現象中，80%的結果取決於20%的原因，而這一法則在很多方面被廣泛的應用。帕雷托法則在品質控制上有很多的應用，它是全面品質管理、六標準差(Six Sigma)的關鍵工具。

長尾效應長尾（或長尾效應, The Long Tail）一詞最初由Chris Anderson發表在2004年的《連線雜誌》中，用來描述諸如亞馬遜和Netflix Real.com Rhapsody 之類網站的商業和經濟模式。是指那些原來不受到重視的銷量小，種類多的產品或服務由於總量巨大，累積起來的總收益超過主流產品的現象。在網際網路領域，長尾效應尤為顯著。

長尾定論與八二法則向來被商業界視為鐵律「八二法則」，其內涵認為企業界80%的業績來自20%的產品，就此看法，商業經營看重的是銷售曲線左端的少數暢銷商品，曲線右端的多數冷門商品，被該定律定義為不具銷售力且無法獲利的區塊。但長尾定論卻認為，網際網路的崛起已打破這項鐵律，廣泛的銷售層面，讓99%的產品都有機會銷售，而這些具有長尾特性商品將具有增長企業營利空間的價值。不但如此，長尾商品的規模還大得驚人，其商品的總值甚至可與暢銷商品抗衡。

參考資料無所不在的數學現象，朴景美著，王海娟譯，晨星出版社。賽局淺說，姚景星、劉睦雄，數學傳播第一卷第三期。
鴨寮，維基百科

賽局理論 Game Theory.

Similar presentations

Presentation on theme: "賽局理論 Game Theory."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

賽局理論 Game Theory.

Similar presentations

Presentation on theme: "賽局理論 Game Theory."— Presentation transcript:

Similar presentations

About project

反馈