主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士 主題三 機率分佈簡介 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士 2017/3/1 政治學研究方法班
講授主題 壹 幾個基本概念 貳 機率模型 參 複合事件 肆 條件機率 伍 獨立事件 陸 貝氏定理 柒 間斷與連續事件的機率分佈 捌 常態分佈 玖 樣本平均數的抽樣分佈 拾 母體、樣本資料與樣本分佈 政治學研究方法班 2017/3/1
2008年選舉結果 馬約得765.9萬票/謝約得544.5萬票 馬勝221萬票 馬得票率佔有效票58.45% 投票率76.33% 如果用出口名調,得到比例會是多少? 政治學研究方法班 2017/3/1
壹 幾個基本概念 A.隨機實驗 (Random Experiment) B.基本結果(Elementary Outcome) C.樣本空間(Sample Space) D.事件(Event Set) 政治學研究方法班 2017/3/1
A.隨機實驗 (Random Experiment) 這是一種過程,你會知道有幾種特定的結果會出現,不過,不能確定哪一個結果會出現,也無法精確預測。 隨機實驗可以重複進行,經過累積一定的觀察數量後,可以找出一些統計規則。 例如,你擲一個骰子,你不確定會出現幾點,但是,你知道其中一些基本原則。同理,可以推論到擲兩顆骰子或是抽一張撲克牌。 政治學研究方法班 2017/3/1
B.基本結果(Elementary Outcome) 隨機實驗可能出現的結果。 例如,擲一個骰子的基本結果是從1到6。 政治學研究方法班 2017/3/1
C.樣本空間(Sample Space) 列出隨機實驗中的所有可能結果。例如,擲一個骰子的樣本空間是 S={1,2,3,4,5,6} 政治學研究方法班 2017/3/1
D. 事件(Event Set) 樣本空間的部分集合稱之為事件。 事件可以只包括一個基本結果(簡單事件simple event)或是兩個或兩個以上的基本結果(混合事件composite event)。 政治學研究方法班 2017/3/1
貳 機率模型 家中小孩男女的組合: 生男生女是一個很平常卻很有趣的問題。當一個家庭有三個小孩,你會猜他們的男女組合是?GBG?BBB?GGB?BGB? G-Girl B-Boy 政治學研究方法班 2017/3/1
例題4.1-4.2 4.1 一對夫妻有三個小孩,他們都是男的,機率是多少? 4.2. 都是女的機率是多少? 政治學研究方法班 2017/3/1
樹狀圖 政治學研究方法班 2017/3/1
各種男女組合出現機率 政治學研究方法班 2017/3/1
各種男女組合出現機率(解答) 政治學研究方法班 2017/3/1
參、複合事件(Compound Event) (1)交集與聯集 (2)互斥事件 (3)互補事件 政治學研究方法班 2017/3/1
複合事件例題4.3 一個三個小孩家庭中的女生至少兩個且全部性別都相同的機率是多少? 這是交集?還是聯集?/包含哪些結果(outcome)?/機率是多少? 政治學研究方法班 2017/3/1
複合事件例題4.3解答 一個三個小孩家庭中的女生至少兩個且全部性別都相同的機率是多少? 至少二女P(E):{e1,e2,e3,e5} 相同性別P(H):{e1,e8} 是交集 政治學研究方法班 2017/3/1
複合事件例題4.4 一個三個小孩家庭中的女生至少兩個或是全部性別都相同的機率是多少? 這是交集?還是聯集?/包含哪些結果(outcome)?/機率是多少? 政治學研究方法班 2017/3/1
複合事件例題4.4解答 一個三個小孩家庭中的女生至少兩個或是全部性別都相同的機率是多少? 至少二女:{e1,e2,e3,e5} 是聯集 政治學研究方法班 2017/3/1
互斥事件 就是兩個事件基本上是沒有交集的 例如: 沒有女兒P(I) {e8} 至少兩個女兒P(E) {e1,e2,e3,e5} 政治學研究方法班 2017/3/1
互補事件 彼此戶斥卻又窮盡所有結果(outcome): P(G)少於二女:{e4,e6,e7,e8} P(K)少於二子:{e1,e2,e3,e5} 政治學研究方法班 2017/3/1
肆 條件機率 設定條件之後,再看機率發生情況: 你快樂嗎? 政治學研究方法班 2017/3/1
婚姻與快樂 政治學研究方法班 2017/3/1
各種機率 P(未婚) P(很快樂)+P(不很快樂) P(已婚且很快樂)=P(已婚)*P(已婚中很快樂) P(M)=1-P(M) P(H∪N)= P(H)+P(N)如果兩個事件獨立 P(M∩H)= P(M)*P(H|M) 政治學研究方法班 2017/3/1
各種比例:總比例 政治學研究方法班 2017/3/1
直欄百分比 政治學研究方法班 2017/3/1
橫列百分比 政治學研究方法班 2017/3/1
各種概念 交集: P(A∩B) 聯集:P(A∪B) 條件機率: P(A|B) 政治學研究方法班 2017/3/1
伍、獨立事件 政治學研究方法班 2017/3/1
獨立事件例題 如果我們隨機選一個受訪者,他支持人工流產的機率是多少? P(F) 如果我們選中一位白人,則他支持人工流產的機率是多少?P(F|W)? 政治學研究方法班 2017/3/1
統計上的獨立事件 如果事件A統計上獨立於事件B之外,則P(A|B)=P(A) 上述的例子告訴我們,受訪者的族裔背景,會不會影響他們對人工流產的態度? 政治學研究方法班 2017/3/1
統計上獨立的兩個事件之間的機率關係: 統計上獨立的兩個事件之間的機率關係: P(A∩B) = P(B) * P(A|B) 這表示 P(B|A) = P(B) 政治學研究方法班 2017/3/1
兩事件互為獨立時的關係 當事件A是獨立於事件B之外時,則事件B一定獨立於事件A之外. 政治學研究方法班 2017/3/1
幾個重要公式 政治學研究方法班 2017/3/1
陸、貝氏定理 貝氏定理是估計一個事件發生的條件機率的方式,它使用事前機率導出事後機率。我們可以看一下以下的例子。 公式是: 政治學研究方法班 2017/3/1
一群人不相同生日機率 大家生日皆不同的機率:Pn=exp((-n*(n-1))/730) 政治學研究方法班 2017/3/1
柒、間斷與連續變數的機率分佈 間斷變數與連續變數之區別 政治學研究方法班 2017/3/1
一、間斷變數的機率分佈 P(4)=? 政治學研究方法班 2017/3/1
二、連續機率分佈圖 政治學研究方法班 2017/3/1
二、連續機率分佈 P(y<10)=? P(30<y<60)=? 政治學研究方法班 2017/3/1
機率分佈的母數(parameter) 如果表4.1的機率分佈是母體值(母數),我們反覆抽樣的結果,會知道 家中理想子女數為1的機率是:P(y=1)=? 對機率的兩個重要的描述母數(參數)為 平均數 標準差 政治學研究方法班 2017/3/1
間斷變數的平均數計算方式 此一數值又稱為期望值,以E(y)表示 變異數計算公式 政治學研究方法班 2017/3/1
捌、常態機率分佈 政治學研究方法班 2017/3/1
常態分佈的幾個特性 1.平均數、中位數與眾數是同值,而將常態曲線分成對稱的兩個部分,各佔總分布的一半。 2.分布是對稱的,一旦將本分布從中間對折,兩邊會彼此重疊。 3.分布的兩端(尾巴),離平均數愈遠,會接近X-軸,不過,不會接觸到X-軸---總是會有發生的機率,不過,機率很低就是了。 政治學研究方法班 2017/3/1
常態分佈的幾個特性 當觀察值為常態分佈時,在平均數 正負一個標準差的區間之內,涵蓋了68%的所有觀察值 正負兩個標準差的區間之內,包括了95%的所有觀察值, 正負三個標準差的區間之內,包括了99.7%的所有觀察值。 政治學研究方法班 2017/3/1
兩個常態分佈圖 政治學研究方法班 2017/3/1
運用常態分配表(p.592) 政治學研究方法班 2017/3/1
運用常態分配表(區域C的比例) 政治學研究方法班 2017/3/1
運用常態分配表(區域C的比例) 政治學研究方法班 2017/3/1
找出以下區域的百分比 P(-1.96<Z<1.96) P (Z<1.645) P(-3>Z) 政治學研究方法班 2017/3/1
標準常態分佈 所有常態分佈,都可以轉換成標準常態分數。他的平均數是0,標準差是1。 我們可以先知道標準分數,然後找出比這個分數高/低者,佔所有分布的比例 另外一個是,我們知道一定的比例後,要找出這個標準化分數 我們將標準常態分布的整個區域,定為1或是100%,一半就是0.5或是50% 政治學研究方法班 2017/3/1
標準常態分佈圖 政治學研究方法班 2017/3/1
玖、樣本平均數的抽樣分佈 我們想知道每年家庭食品支出花費 政治學研究方法班 2017/3/1
食品支出的實例 政治學研究方法班 2017/3/1
食品支出的實例(N=25) 政治學研究方法班 2017/3/1
食品支出的實例(N=100) 政治學研究方法班 2017/3/1
樣本數對抽樣分佈與精確度的影響一 政治學研究方法班 2017/3/1
樣本數對抽樣分佈與精確度的影響二 政治學研究方法班 2017/3/1
標準誤(standard error) 平均數抽樣分佈的標準差稱之 政治學研究方法班 2017/3/1
抽樣分佈:常態分佈與中央極限定理 在統計上有個中央極限定理,它的內容是:在樣本數足夠大的情況下,如果把這K個平均數排起來,它們會形成常態分布,而這些樣本平均數的平均數會等於μ,這些樣本平均數的標準差會等於 政治學研究方法班 2017/3/1
不同母體分佈的抽樣分佈 不論母體的原始分佈如何,當樣本數趨近無限大,樣本平均數的平均數分佈會趨近常態分佈。 樣本平均數抽樣分佈的標準誤 母體平均數的左右三個標準誤內包含樣本平均數 政治學研究方法班 2017/3/1
拾、母體、樣本資料與樣本分佈 母體分佈:據以抽樣的對象,通常是未知 樣本分佈:可觀察的抽樣結果 可計算樣本平均數與標準差 樣本愈大,樣本平均數會愈接近母體平均數 抽樣分佈:描述固定樣本數下,反覆抽樣下的樣本分佈情況 樣本數大小:n≧30 統計推論中抽樣分佈的關鍵角色 政治學研究方法班 2017/3/1
本章小結 機率分佈:區間、總和、符號 機率分佈的平均數、標準差 常態分佈與標準常態分佈 標準化分數 抽樣分佈 抽樣平均數的平均數分佈,也有標準差 中央極限定理 政治學研究方法班 2017/3/1
提問時間 電子郵件 chenluhu@nccu.edu.tw chen.luhuei@gmail.com 政治學研究方法班 2017/3/1