4. Probability Theory & Probability Distribution

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
西安交通大学 1. 2 概述 筛检和诊断试验的评价 提高筛检效率方法 西安交通大学 3 筛查起源于 19 世纪的结核病预防。一直 以来广泛运用于慢性病的早期诊断。从疾病 防治的过程来看,它属于一级和二级预防; 从对象和目的来看,它具有突出的公共卫生 意义;从实施来看,它要求检测方法快速、 简便、经济、安全。
概率论与数理统计 主讲:统计学院 任俊柏.
Keller: Stats for Mgmt & Econ, 7th Ed 機率
單元九:單因子變異數分析.
Experiment and random phenomenon
2.3.1条件概率.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
2.2.1 条件概率 临沂第二十四中学高二数学备课组
第五章 機率論.
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
機率的意義 機率運算法則 機率分佈 二項分佈 卜瓦松分佈
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
第七章 筛检 Screening.
第 6 章 連續機率分配.
商用統計學 Chapter 5 機率分配.
樣本空間與事件 餘事件:不在A中的樣本所構成的事件,即A′.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
第5章 間斷機率分佈.
第5章 間斷機率分佈.
第一部分:概率基础 对应教材Chp1-5 可能需要复习本科概率论的相应内容 课堂上讲述会较快,将知识点串起来,建议大家通读教材
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
三、機率(Probability) (Chapter 4)
學校教職員退休條例修正草案重點報告 報告人:徐創晃.
预防医学系 吉林大学公共卫生学院.
風險值 Value at Risk (VaR) 區國強.
單一分配 Uniform distribution
Experiment 定義 An experiment is any activity from which an outcome, measurement, or result is obtained. 任何求結果的過程或活動皆可稱為「試驗」。 When the outcomes cannot be.
第一章 直角坐標系 1-1 數系的發展.
第7章 機率分配 離散型機率分配 連續型機率分配.
第一章.
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
Chapter 3 Conditional Probability and Independence
Ch 6 實習.
第 4 章 機率導論.
第四章 機率概論.
第四章 機率概論.
概率论与数理统计 2019/4/9 1.
第一章 直角坐標系 1-3 函數圖形.
機率論 機率的描述 機率論簡介 條件機率及獨立 貝氏定理.
第六章 連續型隨機變數及其常用的機率分配.
劉仁沛教授 國立台灣大學農藝學研究所生物統計組 國家衛生研究院生物統計與生統資訊組
实验数据处理方法 第一部分:概率论基础 第二章 概率的基本概念.
7-2 抽樣分配(sampling distribution)
第5章 集合與機率.
Some Important Probability Distributions
Review of Statistics.
 多項式的除法 x3 + 2x2 – 5x + 6 = (x – 1)(x2 + 3x – 2) + 4 被除式 除式 商式 餘式
三種基本類型的問題 當我們說某件事情的機率是0.50、0.78,或0.24時,是什麼意思? 機率的數值該如何決定?在現實生活中如何測量?
第五章 離散型隨機變數及其常用的機率分配.
Introduction to Probability Theory ‧1‧
概率论与数理统计 2019/5/11 1.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
遗传病的分析2 Bayes法在遗传咨询中的应用.
粒子物理与核物理实验中的数据分析 杨振伟 清华大学 第一讲:基本概念 24/05/2019.
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
Introduction to Probability
隨機變數與機率分配 間斷機率分配 聯合機率分配 期望值與變異數 共變異數與相關係數
第一章 直角坐標系 1-3 函數及其圖形.
Probability Statistics p65 ~ 85 & p119~ /6/7
課程五 機率.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
機率分配.
機率論(Probability) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/12/10.
Presentation transcript:

4. Probability Theory & Probability Distribution 四、機率論與機率分布 4. Probability Theory & Probability Distribution

定義 樣本點 樣本空間 事件 Event 隨機實驗的每個可能的結果 隨機實驗中所有可能的的樣本點的集合 樣本空間的部份集合 可以是空集合,也可以等於樣本空間

定義 聯合事件Joint Event 補集Complement 交集Intersection 事件A與事件B的交集,指事件A與事件B同時發生的事件,以 A∩B表示 聯集Union 事件A與事件B的聯集,指事件A及事件B任一或二發生的事件,以 A∪B 表示 補集Complement 事件A的補集,指事件A沒有發生,以AC 或Ā表示

Venn diagram 以陰影部份表示事件  A∩B  A∪B  AC

機率理論的種類 古典機率理論 頻率機率理論 主觀機率理論 機率的公理

古典機率理論 古典機率理論又稱為先驗機率理論 假定有N種互斥且出現機率相等的樣本點,若定義事件A包括了nA個樣本點,則事件A發生的機率為 P(A) = nA / N

頻率機率理論 又稱為相對次數理論 指在長期重複的隨機實驗中,某事件出現的機率為該事件出現的次數除以實驗總次數 機率乃是長期實驗的結果,因此又稱為後天機率

主觀機率理論 事件發生的機率乃是反映人們對此事件的相信程度 針對一些尚未發生又無法以客觀機率表示的事件

機率的公理 機率附合以下三公理 任一事件A發生的機率為實數,且 0 ≦ P(A) ≦1 若S為樣本空間,則 P(S) = 1 設A1, A2, …, Ak為互斥事件,則 P(A1∪A2∪…∪Ak)=P(A1)+P(A2)+…+P(Ak)

Conditional Probability 條件機率 P(B|A) 乘法原則Multiplicative rule of probability P(A∩B) = P(A) P(B|A) = P(B) P(A|B) 若已知 P(A) ≠0,P(B|A) = P(A∩B) / P(A) 若已知 P(B) ≠0,P(A|B) = P(A∩B) / P(B)

Independent 獨立 獨立事件是指一事件發生的機率不受其他事件發生與否的影響 若A與B兩事件符合下列任一條件,則A與B互為獨立 P(A|B) = P(A) P(B|A) = P(B) P(A∩B) = P(A) P(B)

Bayes’ Theorem 貝氏定理 以新獲得的資訊修正事前機率,而得到事後機率的方法。

例:貝氏定理 掌上癌細胞檢測儀 20分鐘驗出是否罹癌 檢測五十八個用針孔穿刺取下的細胞樣本,病理診斷確認出十五例癌細胞,而掌上癌細胞檢測儀總共挑出包含確認病例在內的廿個「可疑」細胞 假設58個重覆實驗可稱為足夠大的數字 以滿足頻率機率理論的要求 問1: 已知一被檢者細胞被掌上癌細胞檢測儀列為「可疑」,請問該被檢者真患有癌症的機率為? (predictive value) 假設病理診斷為真

P(檢測發現可疑 ∩ 有癌症) = 15/58 P(檢測發現可疑 ) = 20/58 P(有癌症 |檢測發現可疑 ) = P(檢測發現可疑∩有癌症) / P(檢測發現可疑) = 15/20 = 75% 問2: 已知一被檢者並無癌症,請問該被檢者細胞被掌上癌細胞檢測儀列為「可疑」的機率為?

P(test + | No cancer) = P(test+∩No cancer) / P(No cancer) = 5/43 = 0 Frequency count Cancer No Cancer 加總 Test + 15 5 20 Test - 38 43 58

Disease Yes No Diagnosis + A B - C D A: True Positive B: False Positive C: False Negative D: True Negative

例2: 子宮塗片檢測 vs. 子宮頸癌 Frequency counts D+ D- T+ T- 70 186385 186455 T- 13 813532 813545 83 999917 1000000 Sensitivity 敏感性 P(T+|D+) = 70/83 =0.8434 Specificity 特異性 P(T-|D-) = 813532/999917 =0.8136 Positive Predictive value, PPV P(D+|T+) = 70/186455 = 0.000375 Negative Predictive value, NPV P(D-|T-) = 813532/813545 = 0.99998 D+:有病 D-:沒病 T+:檢測異常 T-:檢測無異常

事前機率Prior probability 事後機率Posterior probability P(D+) 事後機率Posterior probability P(D+|T+)

隨機變數 其變數的發生是隨機的(服從某一機率) 也就是說,此變數值是無法事先確定的 但在大量的資料中,其發生的形態會呈現某一規則

間斷性機率分布 間斷隨機變數的各個變亮的發生機率的分布情形 美國兒童的出生排行

伯努利分布 Bernoulli distribution 伯努利分布 二分隨機變數 通常用”成功”與”失敗”, 或 0 and 1來分類 Mutually exclusive and exhaustive 通常用”成功”與”失敗”, 或 0 and 1來分類 例:設 Y為一隨機變數以表示一成年人的吸菸狀態,Y = 1 表示一成人目前為菸民,Y = 0表示目前非菸民 臺灣 (2004): P(Y=1) = 0.24 P(Y=0) = 1 - 0.24 = 0.76 Y~Bern(0.24): Y 為服從伯努利分布的隨機變數 p = 0.24 Source: http://tobacco.bhp.doh.gov.tw:8080/doc/94statistics.xls

二項分布Binomial distribution 每一次試行是獨立的 每次試行中的p(成功機率)是相同的 此分布之隨機變數定義為n次試行中的成功次數 n為一時,即為伯努利分布

二項式分布的平均數 Bin(n, p) is np 二項式分布的變異數 Bin(n, p) is np(1-p) 標準差

Binomial distribution (cont.) 二項式機率分布 組合Combination 階乘:n! = n(n-1)(n-2)…(3)(2)(1) 0!=1

卜瓦松分布Poisson Distribution 在一定的連續時間或空間中,某些事件發生的可能性是彼此獨立的 事件發生次數的期望值與區間大小成正比 若將區間切割至極小時,在此極小的區間中事件只發生一次或是不發生 若隨機變數X是指在上述的情形下某一連續區間內的事件發生次數,此變數便服從卜瓦松分布 當事件發生的機率極小,區間極多時,二項式分布會趨近卜瓦松分布

卜瓦松分布的參數以λ (lambda)表示 X~Poi(λ) 國立臺灣大學 統計教學中心 初等統計學教材 卜瓦松分布的參數以λ (lambda)表示 X~Poi(λ) 設 X~Bin(10000, 0.00024) – 在一萬人口中每年有多少人發生過交通意外 趨近: X~Poi(10000*0.00024) = Poi(2.4) e: exponent 指數/自然數? Ln 自然對數

Poisson Distribution (cont.) 卜瓦松分布的平均數, Poi(λ) is λ 卜瓦松分布的變異數, Poi(λ) is λ 標準差

連續性機率分布 由於連續隨機變數可以在無限多的值中發生,因此 任何特定值的機率為0 在 x1 與x2 之間的機率等於其曲線在此兩個數值中的面積

常態分布 常態分布是一個對稱,單峰及鐘型的曲線。 社會及自然界的現象以常態分配最為普遍,因此是推論統計的基本模式 大樣本推論統計的基礎 間斷機率分布在某些條件下可以利用常態分布求近似值

μ (mu)平均數,決定常態分布的位置。σ2 (sigma square)變異數,決定常態分布的分散程度。 令 X~Normal(μ,σ2) -∞< x < ∞

將任一數值減去平均數後再除以標準差的過程叫做標準化 標準常態分布 在μ= 0 及 σ2 = 1的情形下,此常態分布稱為標準常態分布 標準常態分布通常以 Z 表示 Z~Norm(0,1) 將任一數值減去平均數後再除以標準差的過程叫做標準化