學習目標 瞭解什麼是賽局 知道賽局是如何發展成一們重要的學科 瞭解賽局的本質 熟悉賽局組成的要素 OBJECTIVES
學習目標 知道賽局有幾種方法 如何解一個簡單的賽局 賽局的一些應用方式 OBJECTIVES
11.1 賽局的發展歷程 賽局理論(Game Theory) 研究決策主體的行為發生直接相互作用時的決策,以及此種相互決策間的均衡問題 個人的決策目標函數中,不僅考慮自身的選擇,而且與他人的選擇息息相關
11.2 賽局的基本概念 本質 賽局即一些人、團隊或其他組織,面對一定的環境條件,在某些既定的規則下,同時或有先後順序,進行一次或重複多次從各自具備的條件範圍所允許的選擇行為或策略中進行選擇並付諸行動,在各自的行動相互影響中各自取得與之對應結果的一種過程
11.2 賽局的基本概念 一個人之行為的互動者可分為: 明確的他人 賽局的策略本質有所區隔,互動者可能是單一的、少數的或多數的 不知身分的他人 可謂之自然(nature),對此根本難以確定互動者下的決策行為,可簡稱為決策(decision)
11.2 賽局的基本概念 賽局的結果不同程度的取決於運氣(chance)、技能(skill)與策略(strategy) 在先天條件完全平等的賽局中,策略的選擇成為賽局勝負結果的唯一決定因素
11.2 賽局的基本概念 賽局與對策 賽局稱之為策略性賽局(strategic game),參與者之間存在策略性互動的比賽 策略性的思考(strategic thinking) 一參與者在決定自己的決策或行為時,會將其他參與者(對手)的反應考慮進來
11.2 賽局的基本概念 對策在實務上常用來表示具體的應對方案,而決策問題是有開始、有結束、有結果的過程 決策問題的研究是要分析在這些決策過程中參與賽局各方相互制約、相互作用的規律,導出合理的結果並用以說明相對應的實際問題
11.2 賽局的基本概念 休息站的決策樹 旺季 0.7 10 維持原價 50% 自然 4 淡季 0.3 王大嬸 投資 旺季 0.7 -10 低價競爭 50% 旺季 0.7 林老伯 -10 自然 不投資 淡季 0.3 -16
11.2 賽局的基本概念 休息站的決策樹 以決策樹作分析,林老伯認為王大嬸各有一半的機率會採用原價或低價,所以若投資新的休息站會產生1萬8,000元的虧損
11.2 賽局的基本概念 休息站的賽局樹 旺季 0.7 10, 10 自然 維持原價 淡季 0.3 4, 4 王大嬸 旺季 0.7 投資 -10, -5 自然 低價競爭 淡季 0.3 林老伯 -16, -11 旺季 0.7 0, 30 維持原價 自然 不投資 王大嬸 淡季 0.3 0, 24 旺季 0.7 0, 5 自然 低價競爭 淡季 0.3 0, -1
11.2 賽局的基本概念 休息站的賽局樹 以賽局樹作分析,王大嬸不論林老伯是否投資新休息站,都會採用原價策略,所林老伯以新休息站進駐時的期望報酬為8萬2,000
11.3 賽局的要素 參與者指的是一個賽局中的決策主體,其目的是藉由選擇行動以最大化自己的償付水準 參與者(players) 自然(nature)的虛擬參與者(pseudo-player) 客觀的外在環境是由「自然」經過機率分配決定其所面臨的外在環境參數
11.3 賽局的要素 行動(actions or moves) 是參與者在賽局的某個時點的決策變量 行動的順序(the order of play) 同樣的參與者,同樣的行動集合,行動的順序不同,每個參與者的最適選擇就不同,賽局的結果就不同
11.3 賽局的要素 償付(payoff) 是指在一個特定的策略組合下參與者得到的確定效用水準,或者是指參與者得到的期望效用水準 一個參與者的償付不僅取決於自己的策略選擇,而且取決於所有其他參與者的策略選擇
11.3 賽局的要素 訊息(information) 是參與者關於賽局的知識,特別是有關「自然」的選擇、其他參與者的特徵和行動的知識 訊息集(information set) 是賽局理論中描述參與者訊息特徵的一個基本概念
11.3 賽局的要素 訊息(information) 完美訊息(perfect information) 指一個參與人對其他參與者(包括虛擬參與者「自然」)的行動選擇有準確瞭解的情況 完全訊息(complete information) 指「自然」不首先行動或「自然」的初始行動被所有參與者準確觀察到的情況
11.3 賽局的要素 訊息(information) 共同知識(common knowledge) 是「所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道」的知識
11.3 賽局的要素 策略(strategies) 是參與者在給定訊息集的情況下的行動規則 策略是行動的規則而不是行動本身。在靜態賽局中,策略和行動是相同的
11.3 賽局的要素 結果(outcome) 泛指分析賽局所感興趣的所有東西,包括了均衡策略組合、均衡行動組合、均衡償付組合等
11.3 賽局的要素 均衡(equilibrium) 是所有參與者的最適策略的組合 一個賽局可能有多個均衡存在,缺乏「唯一性」的均衡是賽局理論的一個主要問題
11.3 賽局的要素 參與者具工具理性(instrumental rationality)的基本假設 參與者在策略性互動的情況下,總想知道何人在何時會選擇何種行動
11.3 賽局的要素 工具理性指一個體之偏好滿足: 完整性(completeness) 反身性(reflexivity) 遞移性(transitivity) 連續性(continuity)
11.4 賽局的分類 依各參與者的行動是同時或依序 同時賽局(simultaneous game) 各參與者同時行動、或各參與者之行動雖有前後但彼此的行動是無法觀察到彼此行動的前後 序貫賽局(sequential game) 各參與者之行動有一定的前後順序,後行動者能在觀察先行動者的行動後,再採取行動
11.4 賽局的分類 依各參與者的利益是相衝突或互利 常數和賽局(constant-sum game) 各參與者之償付的總和為某一定常數,此常數可為正、負或零 零和賽局 (zero-sum game) 參與者之償付的總和為零,表示參與者之間利益完全衝突
11.4 賽局的分類 依賽局是否重複 一次性賽局(one-shot game) 各參與者只互動一次的賽局,亦即只進行一次的賽局 重複賽局(repeat game) 此一賽局依同一模式進行若干回合
11.4 賽局的分類 依各參與者所擁有的信息是否完整或相同 傳訊(signals)策略 發生訊息優勢者刻意採取散布訊息的行動 篩選(screening) 由訊息劣勢者所採取研判被散布出的訊息真偽的策略
11.4 賽局的分類 從參與者行動的先後順序 靜態賽局(static game) 參與者同時行動或雖非同時但後行動者並不知道先行動者的具體行動 動態賽局(dynamic game) 參與者的行動有先後順序,且後行動者能觀察到先行動者的行動,並藉以擬訂策略採取行動
11.4 賽局的分類 從參與者是否瞭解賽局要素所包括的所有知識 完全訊息賽局 不完全訊息賽局
11.4 賽局的分類 將兩種因素合併考慮,賽局可分為 完全訊息靜態賽局 完全訊息動態賽局 不完全訊息靜態賽局 不完全訊息動態賽局
11.4 賽局的分類 四種均衡概念 納許均衡(Nash Equilibrium) 子賽局完美納許均衡(Subgame Perfect Nash Equilibrium) 貝氏納許均衡(Bayesian Nash Equilibrium) 完美貝氏納許均衡(Perfect Bayesian Nash Equilibrium)
11.4 賽局的分類 賽局的分類與對應之均衡
11.5 賽局中的均衡概念 優勢策略 不管對手採取之策略為何,當某參與者採取某策略的償付較其他策略皆大,此策略謂之該參與者的優勢策略 並不是所有賽局都存在優勢策略均衡解
11.5 賽局中的均衡概念 兩家汽車公司的促銷策略償付矩陣
11.5 賽局中的均衡概念 納許均衡(Nash equilibrium) 當參與者間的策略互動狀況達到任一改變策略者自身會有損失時,則原狀態謂之納許均衡
11.5 賽局中的均衡概念 兩家鮮乳公司的促銷策略償付矩陣
空巴與波音的空中大戰 核心概念 寡占 賽局 策略 全球視野
11.6 賽局理論的應用 囚犯兩難(Prisoner's Dilemma) 各參與者皆由極大化一己之利的角度出發進行互動的整體結果,低於彼此合作互動後的整體結果
11.6 賽局理論的應用 囚犯兩難償付矩陣
11.6 賽局理論的應用 囚犯兩難賽局囚犯兩難賽局(續) 參與者:A、B兩個嫌犯 行動(或策略)的集合:(坦承,抵賴)
11.6 賽局理論的應用 囚犯兩難賽局囚犯兩難賽局(續) 結果:A、B分別做出策略選擇後,此策略組合產生的刑期組合 均衡:A、B為追求最佳策略,必須考慮對方的可能反應;(A坦承,B坦承)的組合是一個優勢策略均衡也是納許均衡
11.6 賽局理論的應用 重複賽局 多次重複同一賽局稱為重複賽局 寡占市場下廠商勾結的卡特爾組織,伯川(Bertrand)價格競爭模型及報復策略都是一種重複賽局
11.6 賽局理論的應用 卡特爾組織的償付矩陣
11.6 賽局理論的應用 序貫賽局(sequential game) 動態賽局中還有非同步行動的一次賽局,參與者有的先行動,有的後行動
11.6 賽局理論的應用 史塔貝克(Stackelberg)模型為一序貫賽局 狡猾的廠商知道天真的廠商會依照庫諾模型決定產量,因此狡猾的廠商先根據利潤最大化原則,決定自己的產出水準,天真的廠商再依照庫諾模型決定其產量
11.6 賽局理論的應用 史塔貝克模型的償付矩陣
11.6 賽局理論的應用 史塔貝克模型的賽局 此為史塔貝克模型序貫賽局的解
驚爆13天 核心概念 賽局策略 時間讀解