統計學: 應用與進階 第9 章: 貝氏統計學.

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
撲克牌 的 機率. 一副撲克牌共 52 張,取 5 張 求各種 「牌型」 出現的 機率 先來複習一下 n 個相異物中,取出 k 個,所有可能 的方法共有多少種? 還記得為什麼吧!
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
單元九:單因子變異數分析.
窦娥冤 关汉卿 感天动地 元·关汉卿.
知其不可而为之.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
音樂之旅 第一冊 單元二 音名、唱名.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
遞迴關係-爬樓梯.
汉字的构造.
诵读欣赏 古代诗词三首.
創新 1994, 從我的第一個網頁說起 國立中興大學資管系 呂瑞麟教授
物價膨脹與通貨緊縮 物價膨脹.
條件機率 機率概念與應用網路學習研究.
贴近教学 服务师生 方便老师.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
六年级 语文 下册 第四单元 指尖的世界.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
主題五 CPU Learning Lab.
Chapter 5 迴圈.
第零章 統計學概論 0.1 統計學的定義 0.2 敘述統計學與推論統計學 0.3 測量尺度 0.4 資料、資訊與因果關係 ©2009 陳欣得
正反器 一、循序邏輯電路 二、動作情形:用時序(timing),其次輸出( )是由外界輸入與( )所共同決定。
計數值抽樣檢驗計劃 (MIL-STD-105E)
Chapter 17 投資決策經濟分析.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
Pull-down assay (His-Tag or GST-Tag)
一、運算放大器簡介 Introduction to Operational Amplifiers
第 一 單 元 不定積分.
1.3 在整除性問題之應用 附加例題 3 © 文達出版 (香港 )有限公司.
統計學: 應用與進階 第5 章: 常用的離散隨機變數.
使用者經驗設計 User Experience Design
第一章 敘述統計學 1.1 原始資料 1.2 統計表 1.3 統計圖 1.4 統計量值 一些經驗法則 44 ©2009 陳欣得
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
BCY行動研究2011之後 上課日誌 隔週上課前兩天以 時間: 年 月 日  紀錄者: 檔案名: 上課日期+學生名字
第二次電腦實習課 說明者:吳東陽 2003/10/07.
第十章補充 允收抽樣.
學習單元:N6 數的性質 學習單位:N6-3 用短除法求H.C.F. 和 L.C.M. 學習重點 : 1. 複習因數分解法求
網頁資料知多少? 事 實 ? 謠言?.
劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國家衛生研究院生物統計與生統資訊組
Definition of Trace Function
新高中 通識教育科 教案設計分享會 沙田循道衛理中學 許文忠老師 2019/4/25.
微積分網路教學課程 應用統計學系 周 章.
挑戰C++程式語言 ──第8章 進一步談字元與字串
英 文 報 告 第三組 姓名 財金二A 傅佳文 財金二A 彭雅安 財金二C 許倩蓉
機會成本知多少 機會成本的定義 1.
機會成本知多少 機會成本的定義 1.
Ogive plot example 說明者:吳東陽 2003/10/10.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
10328: Coin Toss ★★★☆☆ 題組:Problem Set Archive with Online Judge
統計學: 應用與進階 第3 章: 隨機變數.
1757: Secret Chamber at Mount Rushmore
Toss a Name Game.
4-1 變數與函數 第4章 一次函數及其圖形.
第十四章:工作抽查 工作抽查:係在隨機時間進行大量觀測以分析工作的方法;其結果可用來有效訂定各操作的適當寬放、衡量機器和人員的操作情形及建立生產的標準時間;其數據的準確性,視觀測次數及隨機觀測所涵蓋的期間而定。 工作抽查的優點:p524。 工作抽查的理論:係依據機率的基本法則;公式如p 及例題14-1。。
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
有趣的計算 如果令A、B、C、D……X、Y、Z這26個英文 字母,分别等於百分之1、2、3、4……24、
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
7. 三角學的應用 正弦公式 餘弦公式 a2 = b2 + c2 - 2bc cos A b2 = a2 + c2 - 2ac cos B
第十七講 重積分 應用統計資訊學系 網路教學課程 第十七講.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

統計學: 應用與進階 第9 章: 貝氏統計學

貝氏統計學與古典統計學 主觀機率與客觀機率的關連性 貝氏統計與古典統計之比較

貝氏統計學 在統計學中存在兩大派別, 一派稱作古典統計學, 另一派稱作貝氏統計學 古典統計學立基於客觀機率, 而貝氏統計學則仰賴於主觀機率

客觀機率vs. 主觀機率 客觀機率: 銅板的物理性質。亦即, 如果我們把這 枚銅板送到實驗室作檢驗, 確定這枚銅板是完全對 稱的(perfectly balanced), 根據物理性質,出現正面或 反面的機會將會是一半一半, 這就是所謂的客觀機 率 主觀機率代表我們個人主觀的「信念」, 我們「相 信」這枚銅板出現正面或反面的機會是一半一半 。因此, 主觀機率又可以稱作個人機率(personal probability)

客觀機率vs. 主觀機率 也許你會認為, 客觀機率不涉及個人主觀判斷,應該是一個對於機率較佳的詮釋。然而, 問題是我們並無法總是有機會獲知任何一枚特定銅板的物理特性。相反的, 姑且不論個人判斷能力的好壞, 我們總是能夠胡謅一個機率值出來

客觀機率vs. 主觀機率 一般而言, 客觀機率與主觀機率並不相等, 然而,在某些特殊的情形下, 客觀機率會等於主觀機率 舉例來說, 在美國拉斯維加斯的賭場中, 所有的賭具都受到政府法令嚴格的控管, 因此, 如果我們要去玩美式輪盤, 我們主觀的信念是, 小球落入輪盤中任何一個的機率為1/38, 而客觀機率值也是1/38

客觀機率vs. 主觀機率 客觀機率 主觀機率 物理性質 可用統計工具驗證 一般而言未知 個人主觀信念 不需(也不能) 被驗證 總是能夠胡謅

客觀機率vs. 主觀機率 我們以 代表客觀機率, 以 代表主觀機率 如果我們投擲一枚不公正的銅板, 其偏誤率(出現正面機率) 為 我們以 代表客觀機率, 以 代表主觀機率 如果我們投擲一枚不公正的銅板, 其偏誤率(出現正面機率) 為 令Xi = 1 代表出現正面, Xi = 0 代表出現反面顯而易見地, ~Bernoulli( ) 令 代表投擲n 次中, 出現正面的次數。試問 既然我們可以從兩種角度來詮釋機率, 對於這個問題自然可以有兩種答案

1. 客觀見解: 根據物理性質 每次試驗有兩種可能性(正面或反面) I i , j = 1, . . . , n {Xi} 為i.i.d. 因此, 根據 我們知道 為二項分配: 是故

2. 主觀見解: 根據個人信念 每次試驗有兩種可能性(正面或反面) 每次試驗應具有相同的機率值: 每次試驗是否獨立?假設我們原有的信念為 為了暸解這枚銅板, 我們將其投擲100 次, 結果發現, 出現75 次正面。這個發現將讓我們相信這枚銅板出現正面的機率較大因此,

2. 主觀見解: 根據個人信念 因此,根據 並非二項分配(not binomially distributed) 根據 , 由於{Xi} 為i.i.d., 我們可以得到 亦即, 在客觀機率的概念下, 即使我們已經觀察到75 次的正面, 第101 次出現正面的機率依舊是1/2

古典統計學vs. 貝氏統計學 古典統計學: 立基於未知的客觀機率 且其每次試驗為i.i.d.。雖然我們不知道 , ,但是整個古典統計學仰賴此未知的客觀機率與i.i.d.的假設 貝氏統計學: 據主觀機率(信念) , 且在主觀信念下, 每次試驗並非獨立。既然每次試驗並非獨立, 我們可以藉由過去經驗再塑(update) 我們對於下次試驗的信念

貝氏統計學的一般性原則 對於所關心的隨機事件建構一個適當的客觀機率模型, 其中包含了我們所關心的未知參數 對所關心的未知參數形成主觀的信念亦即, 對未知參數形成先驗機率 在觀察樣本後, 根據貝氏法則再塑我們的信念,形成事後機率 根據事後機率作出決策

例子 在我們以下的討論中, 為了避免符號的繁瑣, 我們將不區分 與 , 一律以P(·) 示之 至於所應用的機率概念為客觀機率或是主觀機率, 則視討論時的上下文而定

例子 記憶體製造廠以一特定機器製造DRAM。製造出來的DRAM 品質或為良品, 或為不良品 假設由物理性質觀之, 此機器以一i.i.d. 的隨機過程製造DRAM, 該機器每製造一個DRAM,有 的機率會製造出不良品(不良率 為一未知的參數) 最近工廠添購一台新機器, 根據我們過去的經驗, 對於同型的機器我們已有相當的認識。假設我們知道該型機器有三種可能的不良率: 1%(優), 3%(普通), 以及5% (劣)

例子 且根據經驗, 機器為優, 普通以及劣的可能性分別為0.65, 0.30 以及0.05。亦即, 有65% 的機率我們會買到優質機器, 其餘依此類推 在機器試用期, 為了決定是否要留下此機器, 或是要退貨, 身為經理人的你先對機器進行測試。結果發現, 在100 個DRAM 中有6 個不良品。試問, 在觀察到這組樣本後, 你對這台新機器的評價為何?

步驟1. 建構一個適當的客觀機率模型 令隨機變數Xi = 1 代表該機器所製造出的第i個DRAM 為不良品, 則對於這個隨機事件的客觀機率模型為: 未知 令 根據我們所觀察到的樣本,100 個DRAM 中有6 個不良品, 亦即 6 這樣的結果似乎暗示著該機器為劣質機器(不良率為0.05)

步驟2. 對未知參數形成先驗機率 將我們對於未知參數(未知不良率) 的信念以一個隨機變數B 來表示 敘述先驗分配於下表: b P(B = b) 優 0.01 0.65 普通 0.03 0.30 劣 0.05

步驟3. 觀察樣本後計算事後機率 根據條件機率, 我們可以算出對於任一b 值的事後機率為: 我們必須求出: 以及

步驟3. 觀察樣本後計算事後機率 來自我們的先驗分配 ? 別忘了一旦我們確定知道這是台機器的不良率, 則此時主觀機率與客觀機率一致 每次試驗將視為獨立。無論看到多少不良品, 都不會改變我們的信念 因此, 給定B = b, 為二項分配b(100, b) 譬如說, B = 0.01,

步驟3. 觀察樣本後計算事後機率 計算 根據總機率法則,

步驟3. 觀察樣本後計算事後機率

先驗機率與事後機率 在觀察到樣本 後, 我們評估新機器是普通品質的可能性約略兩倍於它是劣質機器的可能性

先驗機率與事後機率 既然樣本呈現100 個DRAM 中有6 個不良品,其樣本不良率為6%, 已然非常接近劣質機器的不良率5%, 為什麼我們的信念依然認為新機器是普通品質的可能性較高? 理由: 我們先驗上的信念認為新機器是劣質的可能性非常低(P(B = 0.05) = 0.05)。即使我們觀察到的樣本似乎暗示它是劣質機器, 由於原有的信念, 我們不會馬上修正到相信它就是劣質機器 貝氏統計推論講求在(1) 個人先驗信念與(2)觀察到的樣本之間取得一個平衡點

事後機率: 當樣本數增加 This suggests a process of learning.

貝氏統計推論 根據貝氏統計推論, 我們對於第i 個製造出來的DRAM 是不良品的機率評估, P(Xi = 1), 將會因為觀察到樣本後有所不同 在觀察到樣本之前, 我們根據先驗機率:

貝氏統計推論 在觀察樣本發現 後, 若令 代表給定 下的事後機率: 則可以得到

貝氏統計推論 亦即, 也就是說, 在觀察到100 個DRAM 中發現6 個不良品後, 我們對於第i 個製造出來的DRAM是不良品的機率評估增加了

敞開心胸的信念(open-minded beliefs) 其機率密度函數恆不為零 雖然我們在DRAM 廠的例子中, 將B 設為間斷的隨機變數(B = 0.01, 0.03 或0.05), 然而, 一般而言, 我們如果沒有任何理由排除某一特定不良率, 以連續隨機變數來刻畫信念是一個比較好的選擇

兩個敞開心胸信念的例子

貝氏極限定理 當先驗的信念是敞開心胸的, 則 當先驗信念是敞開心胸的, 主觀機率會隨著樣本增加而趨近於客觀機率 此外, 我們之前就已經討論過, 當我們知道真實的參數時, 主觀機率與客觀機率將會一致:

貝氏統計與古典統計之比較 貝氏統計與古典統計各有其適用之處 一般的看法是: 個人決策時適用貝氏統計, 提供他人諮詢時, 適用古典統計 貝氏統計強調個人的主觀信念, 而個人的主觀信念則反映其過去的經驗累積。因此, 當你在做決策時需要參考過去經驗時, 貝氏統計是一個不錯的選擇 相對的, 如果別人不認同你的先驗主觀信念, 即使之後的分析再精妙, 依然無法使人認同。因此,如果運用統計學的目的是為了提供他人諮詢, 或是要據此說服別人, 則古典統計就是一個較佳的選擇

貝氏統計與古典統計之不同 貝氏統計 古典統計 基本觀察 μ 未知。根據我的主觀機率評估, 一連串的試驗並非獨立, 亦即觀察到的樣本不是i.i.d. 樣本。 μ 未知但是依據客觀機率,一連串的試驗為i.i.d.。 基本原理 將我對未知參數μ 的信念以隨機變數B 來表示。以我的觀察信念作為統計分析的基礎。 統計分析立基於以上的客觀, 不帶任何主觀信念。 機率性質 主觀機率 客觀機率 統計分析 首先將我的主觀信念以隨機變數B 來表示, 形成先驗分配。 觀察樣本後, 以貝氏法則再塑我對B分配的信念,形成事後分配。 (c) 最後, 利用B 的事後 分配做統計分析。 由於一連串的試驗i.i.d., 方式即使我不知道μ, 只要我觀察的樣本夠多, WLLN 提供我猜測μ 的準度。 主要應用 個人決策 提供諮詢, 說服他人