1-3 賽局論
Hello, everybody! I want to play a game.
兩難困境 你的母親和你的另一半被我捉住了, 綁在椅子上動彈不得,分別有一把槍 對準她們。 在你面前有個按鈕:如果你按下按鈕, 你的母親將被射殺;如果你在六十分 鐘內沒按下按鈕,你的另一半將沒命。 你該怎麼辦?
另一個兩難困境 你和你深愛的人分別關在兩個房間中, 面前各有一個按鈕。 雙方都知道誰在六十分鐘之內先按下 按鈕,誰就會先死,但另一個人就會 活下來。但如果六十分鐘之內沒人按 下按鈕的話,兩個人都得死。 你該怎麼辦? 這就是個賽局問題。
沙灘賣冰 在佈滿泳客的沙灘上,假設每個地方 泳客密度均相同。 現在有兩家冰店準備在這片沙灘上開 店,請問,開在哪裡會比較好。 將整片沙灘視為 0 到 1 的線段。
理論上,兩家店會開在1/4、3/4這兩點 (各佔掉二分之一的顧客) 實際上,兩家店會相鄰地開在1/2這一點 因此,在一些城市中會有一些相同性質的 店開在同一條街上,或者都連在一起。
何謂賽局論? 賽局論又稱對局論、或搏奕理論,英 文名稱為 game theory. 賽局論為一種策略思考,透過策略推 估,尋求自己最大的勝算或利益,從 而在競爭中求生存。
賽局論的基本元素 參賽者 (players) 策略 (strategies) 結果 (results) 參賽者的策略會影響到結果。但對手 的策略也很重要。當然,資料與資訊 的分佈也是重要的因素。
賽局論的基本假設 所有的人都知道遊戲規則。 所有的參賽者會理智地做決定。 在賽局論的模型中,大多有一套數學 模型在裡面。在這門課程中我們將介 紹一些有關賽局論的基本理論。 我們底下舉一些對局論的例子。
實例
猜拳 依一般猜拳的規則。 參賽者:所有猜拳的人 策 略:剪刀ヽ石頭ヽ布 結 果:贏、輸、平手
橋牌 橋牌為最明顯的賽局論的一個例子, 在橋牌中有東西南北四家。東西家為 一國,南北家為另一國。而叫牌,打 牌的過程即為應用賽局論的表現之一。 參賽者:東西南北四家 結 果:某兩人輸, 某兩人贏
其他著名的Games Prisoner’s Dilemma (囚犯困境) Traveler’s Dilemma (旅行者困境) Volunteer’s Dilemma (自願者難題) Matching Pennies Battle of the Sexes Dollar auction Chicken (膽小鬼難題)
Decision and Uncertainty
Preference order Numerical representation Expected utility Von Neumann-Morgenstern expected utility function
Games in Normal Form (Pure Strategy)
囚犯困境 (Prisoner’s Dilemma) 賽局論中最典型的例子。 假設有A,B兩個銀行搶匪因小案子被 警察抓到了,為避免串供,將之分開 來審問,並訂定了底下的規則:
如果A、B兩人同時否認,則只關一年。 如果A、B兩人同時承認,則關八年。 若A、B兩人中一人承認,一人否認,則本著`` 坦白從寬,抗拒從嚴”的原則:承認的人無罪 釋放(自首無罪),否認的人則會被關上十二 年。 我們可用個表格來表示這個情況 右上角表示的是 A 的刑罰,而左下角則表示 B 的刑罰。
A B 承認 否認 -8 -12 -1
結果 若A、B有辦法互通訊息的話,則兩人 當然會同時否認犯案。 若A、B都不知道對方會做出何種決定 時,則平衡點為,即兩人均承認。 此點為優勢策略均衡。
旅行者困境(Traveler's Dilemma) 航空公司弄丟了兩名旅客的行李。假設這 兩名旅客的行李箱、內容物均相同。 賠償的原則如下: 賠償最低金額為$2,最高金額為$100。 兩人分別寫下行李的價值。若兩人提出的 賠償金額相同,則依所提金額賠償。 若兩人提出的賠償金額不同,則兩人均依 所提金額較低者賠償。只是為獎勵金額較 低者,將由提出金額較高者的賠償金中撥 提$2給他,以資鼓勵。
F(x,y) = min{x,y} + 2 sign(y-x). 也就是説,第一位旅客的 payoff function 為 F(x,y) = min{x,y} + 2 sign(y-x). 假設此兩名旅客處於競爭狀況。 有沒有均衡點? 其納許均衡點為 (2,2) 。.
Games in Normal Form (Mixed Strategy)
混合策略 由策略的角度來看,賽局論的理論和機率 論有相當大的關聯。 策略依其採行的方式可分成兩種: 純粹策略(pure strategy): 執行某策略的 機率為1。 混合策略(mixed strategy): 以機率分布來 執行策略。
再舉一個例子: 猜拳。 A B 剪刀 石頭 布 1 -1
很顯然,沒有個單一的純粹策略會達到均衡。 這時候我們應將各個純粹策略混合使用。 例如,我們可用 1/3 的機率出剪刀,1/3 的機 率出石頭,1/3 的機率出布的策略。 如何找出合適的機率分布是很重要的。
Information
資訊的不對稱性 利用資訊的不對稱性可得到底下的結 果。 贏者的詛咒: 在拍賣場中, 買到物品 的那一剎那便會後悔。 奧斯卡定理: