主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心 主題五.1、估計 主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心 2019/1/14 公共管理與政治學研究方法研討班
講授主題 壹、估計的基本概念 貳、比例的信賴區間 參、平均數的信賴區間 公共管理與政治學研究方法研討班 2019/1/14
幾個估計圖形 公共管理與政治學研究方法研討班 2019/1/14
三種騙子 (一)騙子 (二)大騙子 (三)…… 公共管理與政治學研究方法研討班 2019/1/14
壹、估計的基本概念 一、樣本與母體 二、無偏估計與效率 三、偏差估計與無偏估計的效率 四、一致性估計 五、區間估計 公共管理與政治學研究方法研討班 2019/1/14
一、樣本與母體 (一)推論統計所使用的三種方法 (二)推論統計的主題 (三)評估估計式好壞的標準 公共管理與政治學研究方法研討班 2019/1/14
(一)推論統計所使用的三種方法 母數統計Parametric statistics 無母數統計Nonparametric statistics 貝氏統計學Bayesian Statistics 公共管理與政治學研究方法研討班 2019/1/14
(二)推論統計的主題 統計估計 假設檢定 公共管理與政治學研究方法研討班 2019/1/14
統計估計的兩個類型 點估計 區間估計 公共管理與政治學研究方法研討班 2019/1/14
家庭食品年度支出(母體) 公共管理與政治學研究方法研討班 2019/1/14
家庭食品年度支出(N=100) 公共管理與政治學研究方法研討班 2019/1/14
樣本大小與中央趨勢估計二 公共管理與政治學研究方法研討班 2019/1/14
(三)評估估計式好壞的標準 計算的成本(computational cost) 最小平方(least squares) 無偏(unbiasedness) 效率(efficiency) 大樣本不偏性(asymptotic properties) 公共管理與政治學研究方法研討班 2019/1/14
二、無偏估計與效率 (一)、無偏 (二)、效率 公共管理與政治學研究方法研討班 2019/1/14
(一)無偏(unbiased) 當一個樣本的期望值等於他要推論的母體值時,我們就稱此估計式為無偏估計。用統計符號表示就是: 就是樣本的期望值,而 是母體值。 公共管理與政治學研究方法研討班 2019/1/14
隨機樣本:母體參數與樣本估計 公共管理與政治學研究方法研討班 2019/1/14
(一)無偏的圖形 公共管理與政治學研究方法研討班 2019/1/14
(二)效率(efficient) 有效較高的估計量是估計值較集中的估計法,也就是變異數較小的估計量。(請參考下圖) 假設有兩個估計量,他們的變異數分別是V與W,則相對有效性的計算方式為: V相對於W的效率程度= 公共管理與政治學研究方法研討班 2019/1/14
效率的圖形 公共管理與政治學研究方法研討班 2019/1/14
三、偏差估計與無偏估計的效率 同時考慮無偏與效率: 平均誤差平方(Mean Squared Error, MSE) : 公共管理與政治學研究方法研討班 2019/1/14
MSE的圖形 公共管理與政治學研究方法研討班 2019/1/14
四、一致性估計(consistent) 大樣本不偏性: 當樣本增至無限大時,估計的誤差為零。 當樣本趨近於無限大時,一致性的估計量所給我們的估計誤差,趨近於零,而且,該估計式的變異數也趨近於零。 大樣本不偏性: 當樣本增至無限大時,估計的誤差為零。 公共管理與政治學研究方法研討班 2019/1/14
一致性估計的圖形 公共管理與政治學研究方法研討班 2019/1/14
五、區間估計 經過一般隨機抽樣程序所獲得的代表性樣本的相關資訊以及初步統計出來的有關母體的分布,只是根據樣本資訊來推估母體參數值的點估計,我們在解讀的時候,還必須將抽樣誤差一併呈現,這樣的推論才會較為合理。 公共管理與政治學研究方法研討班 2019/1/14
信賴區間(confidence interval) 對一個母體參數的信賴區間是指該母體參數應該會落在此一區間。如果母體參數落在此一區間的可能性用機率表示,則此機率稱之為信心水準。信心水準通常接近1,一般是0.95,所以我們通常說95%的信心水準。 一個區間估計而達到95%的信心水準時,我們會說此一區間估計,有95%的機會,會涵蓋母體參數。 公共管理與政治學研究方法研討班 2019/1/14
1.單一樣本的區間估計 為了讓我們的估計更有信心,我們會以區間估計(interval estimate)也就是考慮抽樣誤差後加入一定信賴區間(confidence interval)來做成我們的估計。所以 = 抽樣誤差 (6.6) 公共管理與政治學研究方法研討班 2019/1/14
百分之九十五的信心水準 一般而言,我們做區間估計時,以95%的信心水準為原則。 在雙尾檢定時,整個分佈的左右兩邊各佔所有分布的2.5%。用標準常態分布表可以發現其z值為1.96。所以,我們可以說,這一個點估計的上下各1.96個標準誤(standard error,或是SE)之下,是我們在95%信心水準之下的區間估計。也就是 「當我們運用以下區間估計 時,有95%的機會, 會落在以下的區間中。」 公共管理與政治學研究方法研討班 2019/1/14
百分之九十五的信心水準 公共管理與政治學研究方法研討班 2019/1/14
百分之九十五的信心水準二 公共管理與政治學研究方法研討班 2019/1/14
貳、比例的信賴區間 類別資料中,我們想知道特定類別發生的機率 例如: 1.台灣民眾自認自己國民黨支持者的比例 2.中國大陸民眾支持人工流產的比例 3.美國民眾具有健保的比例 公共管理與政治學研究方法研討班 2019/1/14
一、樣本的比例與標準誤(公式) 公共管理與政治學研究方法研討班 2019/1/14
一、影響樣本標準誤的因素 什麼因素會影響樣本的標準誤大小 1. 2. 公共管理與政治學研究方法研討班 2019/1/14
二、大樣本下比例的區間估計 依據中央極限定理: 當樣本趨近無限大時,樣本比例趨近常態分佈且其平均值的平均值為母體的平均值。 95%信心水準下比例區間估計的 公共管理與政治學研究方法研討班 2019/1/14
例題5.1 佛州一次民調中隨機抽樣1200位受訪者,其中396位支持人工流產。請估計在95%信心水準下,佛州民眾支持人工流產的比例。 公共管理與政治學研究方法研討班 2019/1/14
例題5.2 佛州一次民調中隨機抽樣1200位受訪者,其中396位贊成人工流產。請估計在99%信心水準下,佛州民眾對人工流產贊成的比例。 公共管理與政治學研究方法研討班 2019/1/14
三、樣本數、信心水準與區間估計 當信心水準愈高,估計的區間愈寬?還是愈窄? 當樣本愈小,估計的區間愈寬?還是愈窄?(如果樣本數為300,百分之九十五的區間估計?) 想一下當樣本數變為400,900,1600的變化 公共管理與政治學研究方法研討班 2019/1/14
四、錯誤機率 錯誤機率=1-信心水準=1-95%=α=顯著程度 信心水準=1- α 雙尾檢定,兩邊的機率為0.05,所以: α/2=0.025 z=1.96 如果是單尾檢定,95%的估計下,z值是多少? 公共管理與政治學研究方法研討班 2019/1/14
公共管理與政治學研究方法研討班 2019/1/14
百分之九十五的信心水準 公共管理與政治學研究方法研討班 2019/1/14
參、平均數的信賴區間 一、平均數的區間估計 二、小樣本的區間估計 公共管理與政治學研究方法研討班 2019/1/14
一、平均數的區間估計 介紹完母體比例的區間估計之後 我們看平均數的區間估計 點估計±誤差 公共管理與政治學研究方法研討班 2019/1/14
樣本平均數的標準誤 樣本平均數的標準誤公式: 公共管理與政治學研究方法研討班 2019/1/14
平均數的區間估計範例 例5.3 我們隨機抽樣231位美國20多歲女性詢問她們交過的男友數目。她們的4.96位。假設我們知道這群的女性交往男友數目分佈的標準差是6.81。請以95%信心水準估計美國20多歲女性的男友數目,請問,會落在哪一個區間? 如果以99%信心水準呢? 公共管理與政治學研究方法研討班 2019/1/14
二、小樣本的區間估計 我們通常對母體標準差一無所知 樣本標準差用於計算標準誤的可能問題 運用t-分佈 公共管理與政治學研究方法研討班 2019/1/14
t-分佈的特性 鐘型、對稱的分佈,平均數為0 標準差略大於1。具體數值依自由度而定。 估計母體時,自由度計算方式為n-1。 公共管理與政治學研究方法研討班 2019/1/14
t-分佈與標準常態分佈的差異 公共管理與政治學研究方法研討班 2019/1/14
附表E 公共管理與政治學研究方法研討班 2019/1/14
小樣本的估間估計公式 公共管理與政治學研究方法研討班 2019/1/14
5.4 飲食失調女生的體重變化 公共管理與政治學研究方法研討班 2019/1/14
信心水準與樣本大小的影響 95% 99% 自我練習 樣本減少成11 樣本增加到無限大 公共管理與政治學研究方法研討班 2019/1/14
假設違反與估計穩定(robustness) 對於平均數信賴區間的估計有兩個假設: 1.隨機抽樣 2.母體分佈為常態分佈 t-分佈與母體分佈非常態分佈 t-分佈與非隨機抽樣 公共管理與政治學研究方法研討班 2019/1/14
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 主題五.2 統計推論:顯著性檢定 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 2019/1/14 公共管理與政治學研究方法研討班
講授主題 一、顯著性檢定(假設檢定)五要素 二、平均數的顯著性檢定 三、比例的顯著性檢定 四、選擇錯誤類型進行檢定 五、顯著性檢定的限制 六、計算p值 七、小樣本比例檢定 八、本章小結 公共管理與政治學研究方法研討班 2019/1/14
導論 現實世界各種「差異」問題意識 研究「假設」(hypothesis) 描述變數之間關係的一個敘述 統計「假設」 對母體的一個描述。通常是以特定數值或是區間預測母體參數。 顯著性檢定 用資料來檢定(統計)假設正確性。 公共管理與政治學研究方法研討班 2019/1/14
例題5.4 挑選儲備經理的性別差異 很多大賣場都被人指出:參加儲備經理訓練者,以男性為多。 我們希望蒐集資料並透過一定程序檢視 例題5.4 挑選儲備經理的性別差異 很多大賣場都被人指出:參加儲備經理訓練者,以男性為多。 我們希望蒐集資料並透過一定程序檢視 參加儲備經理訓練是否存在性別差異 公共管理與政治學研究方法研討班 2019/1/14
一、顯著性檢定(假設檢定)五要素 (一)假定(assumptions) (二)假設(hypotheses) (三)檢定的統計數值(test statistic) (四)p值(p-value) (五)檢定結果(conclusion) 公共管理與政治學研究方法研討班 2019/1/14
(一)假定 假設檢定是建立在以下的假定之上: 1.資料類型:檢定可運用在類別資料與數字資料上 2.隨機性:資料透過隨機方式取得 3.母體分佈:有些檢定對母體分佈有特定假定 4.樣本大小:隨樣本增加檢定結果改進 公共管理與政治學研究方法研討班 2019/1/14
(二)(統計檢定)假設 所有統計檢定都一定有兩個(統計)假設 1.虛無假設(null hypothesis) 2.對立假設(alternative hypothesis) 公共管理與政治學研究方法研討班 2019/1/14
虛無假設與對立假設 2.先將我們希望見到的,設為對立假設 3.通常我們的研究問題,就是對立假設 4.我們不希望看到的,設為虛無假設 表達方式 1.彼此互斥,集體窮盡 2.先將我們希望見到的,設為對立假設 3.通常我們的研究問題,就是對立假設 4.我們不希望看到的,設為虛無假設 表達方式 公共管理與政治學研究方法研討班 2019/1/14
儲備經理的虛無假設與對立假設 公共管理與政治學研究方法研討班 2019/1/14
假設檢定的邏輯 間接反證的方式 無罪推定原則: 要將嫌疑犯定罪,需要「證據」才能繩之以法 統計的對立假設有時稱為研究假設 公共管理與政治學研究方法研討班 2019/1/14
(三)檢定的統計數值 假設檢定會設定母體參數為特定值(假定值) 檢定的統計數值就看特定值與觀察值之差異 (在考量一定的抽樣誤差之後) 公共管理與政治學研究方法研討班 2019/1/14
(四)p值 簡單理解為「描述虛無假設正確的機率」 當數值愈低,表示對立假設(研究假設) 正確的可能性愈高 公共管理與政治學研究方法研討班 2019/1/14
(五)檢定結果 我們根據相關的資訊,決定要不要 無法拒絕虛無假設 拒絕虛無假設 通常,p<0.05即拒絕虛無假設 以下進一步說明運用方式 公共管理與政治學研究方法研討班 2019/1/14
二、平均數的顯著性檢定 (一)假定 (二)假設 (三)檢定的統計數值 (四)p值 (五)檢定結果 公共管理與政治學研究方法研討班 2019/1/14
5.4 飲食失調女生的體重變化 公共管理與政治學研究方法研討班 2019/1/14
步驟 (一)假定 因為是數字資料,會假定為常態分佈 (二)統計假設:範例5.4(p.120)-雙尾 公共管理與政治學研究方法研討班 2019/1/14
步驟 (三)檢定的統計數值(p.148) (四)p-value 算出t值大小,查表得p值可知樣本平均數偏離虛無假設的情況(虛無假設正確機率) (五)檢定結果 具體操作 公共管理與政治學研究方法研討班 2019/1/14
例題5.5.美國黑人是否更為極端? 1.假定1~7為數字資料,隨機抽出186位黑人 2.因為1(自由)~7(保守)中,4代表「中庸」路線 設定虛無假設與對立假設 3.統計計算 n=186, 平均=4.075,s=1.512套用公式 4.計算p值 5.檢定結果 公共管理與政治學研究方法研討班 2019/1/14
另一種假設檢定:單尾檢定 p值: 公共管理與政治學研究方法研討班 2019/1/14
例5.4飲食失調 (單尾檢定) 在此一研究中,我們希望檢視:經過飲食治療後,體重是否會增加。所以,我們研究是希望看到:體重增加 1.假定:隨機樣本,數字資料 2.設定統計假設 公共管理與政治學研究方法研討班 2019/1/14
例5.5飲食失調 2.設定統計假設 3.統計計算 4.得到p值 5.結論 公共管理與政治學研究方法研討班 2019/1/14
虛無假設與對立假設(單尾檢定) 2.先將我們希望見到的,設為對立假設 3.通常問的研究問題,就是對立假設 4.我們不希望看到的,設為虛無假設 1.彼此互斥,集體窮盡 2.先將我們希望見到的,設為對立假設 3.通常問的研究問題,就是對立假設 4.我們不希望看到的,設為虛無假設 5.進行假設檢定 6.p值是虛無假設的正確機率 公共管理與政治學研究方法研討班 2019/1/14
單尾檢定程序 計算z值或是t值,轉為p值 p值說明了觀察資料與Ho的一致性 p<0.05表示Ho正確機率小於0.05 如果y-bar愈接近μo 則p值就愈大 公共管理與政治學研究方法研討班 2019/1/14
雙尾檢定還是單尾檢定 通常使用雙尾檢定,因為 1.不預設立場 2.最常用也較嚴格 3.區間估計合理 4.如果真要選單尾,看研究問題或是考題 5.記得虛無假設與對立假設要寫對 公共管理與政治學研究方法研討班 2019/1/14
顯著程度 “百分之五的顯著程度” 與 “百分之九十五的信心水準” “5 % significance level” V.S. “95% confidence level” *: 95%; p < .05(α<0.05) **: 99%; p < .01(α<0.01) ***: 99.9% ; p < .001(α<0.001) 公共管理與政治學研究方法研討班 2019/1/14
三、比例的顯著性檢定 (一)假定 (二)假設 (三)檢定的統計數值 (四)p值 (五)檢定結果 公共管理與政治學研究方法研討班 2019/1/14
程序 (一)假定 隨機抽樣、樣本數不小 (二)假設 公共管理與政治學研究方法研討班 2019/1/14
步驟 (三)檢定的統計數值 (四)p值 (五)檢定結果 公共管理與政治學研究方法研討班 2019/1/14
例題5.6 減少服務還是增加賦稅 2006年訪問1200位佛羅里達成年人 52%支持增加賦稅,48%支持減少服務 1.假定(大樣本) 例題5.6 減少服務還是增加賦稅 2006年訪問1200位佛羅里達成年人 52%支持增加賦稅,48%支持減少服務 1.假定(大樣本) 2.統計假設 公共管理與政治學研究方法研討班 2019/1/14
例題6.6(續) 3.統計的檢定數值 4.計算p值 5.統計檢定結果 公共管理與政治學研究方法研討班 2019/1/14
一個提醒 絕對不要用「接受虛無假設」 他是不是沒罪你不知,只是無法證明他有罪 「無法拒絕虛無假設」 公共管理與政治學研究方法研討班 2019/1/14
四、選擇錯誤類型進行檢定 通常我們的顯著程度設定為0.05 統計決策 公共管理與政治學研究方法研討班 2019/1/14
兩種統計決策(從一而終) 公共管理與政治學研究方法研討班 2019/1/14
兩種統計決策與兩種統計錯誤類型 公共管理與政治學研究方法研討班 2019/1/14
幾個重要觀念 1.信心水準:(1-α)*100% 2.顯著程度:α 3.檢定力:(1-β) 4.第一型錯誤:H0為真,我們卻拒絕H0 5.第二型錯誤:Ha為真,我們卻拒絕Ha 公共管理與政治學研究方法研討班 2019/1/14
假設檢定與區間估計 一、區間估計 1.樣本平均數(比例)、標準誤、顯著程度 2.計算出區間估計 二、假設檢定 1.樣本平均數(比例)、標準誤、母體參數 2.計算出p值或是顯著程度 重要的串連 公共管理與政治學研究方法研討班 2019/1/14
假設檢定與區間估計的串連 從假設檢定談區間估計 H0: μ= μ0 從區間估計看假設檢定 當我們以95%信心水準對μ做的區間估計,包括μ0時,表示我們在0.05的顯著程度時,無法拒絕H0 。 公共管理與政治學研究方法研討班 2019/1/14
報告統計檢定結果還是p值 古典假設檢定的方式: 設定統計上的虛無假設以及對立假設,並確定樣本數(例如, N=100)、標準差(σ)以及顯著程度(Significance level /α=0.05)。 利用上述資訊找出決定值(critical value)以及拒絕虛無假設的區域 如果我們觀察的樣本平均數落在拒絕的區域,我們就拒絕虛無假設;否則,就不拒絕虛無假設。 公共管理與政治學研究方法研討班 2019/1/14
報告p值 R. A. Fisher建議: 報告p值,運用相關資訊說明虛無假設能否被拒絕的情況。 先進統計軟體都會報告p值,此一方式漸熱門 公共管理與政治學研究方法研討班 2019/1/14
五、顯著性檢定的限制 兩種顯著 統計的顯著:p值是否小於0.05(拒絕虛無假設) 實質的顯著:差異或是效果,在理論上的重要性 公共管理與政治學研究方法研討班 2019/1/14
例題5.7 美國人意識型態的區間估計 1.假定1-7為數字資料,隨機抽出1331位 2.因為1-7中,4代表「中庸」路線 設定虛無假設與對立假設 3.統計計算 n=1331, 平均=4.12,s=1.38套用公式 4.計算p值 5.檢定結果 如果範例5.5的樣本數增加到18,600人的結果 公共管理與政治學研究方法研討班 2019/1/14
討論兩種顯著 統計的顯著 實質的顯著/理論的顯著 公共管理與政治學研究方法研討班 2019/1/14
假設檢定與區間估計那個較佳 美國人意識型態的分佈(H0:μ=4.0) 4.12±1.96(0.038)or (4.05,4.20), p<0.05 6.12±1.96(0.038)or (6.05,6.20), p<0.05 公共管理與政治學研究方法研討班 2019/1/14
假設檢定的誤解 1.不要只有顯著才發表結果—影響政策 2.得到顯著的結果也許只是機率的問題 3.不要將p值詮釋為虛無假設正確機率 4.實際的效果也許是較小的 公共管理與政治學研究方法研討班 2019/1/14
SPSS的具體操作:獨立樣本T檢定 我們要檢視不同性別對兩個政黨喜好程度是否存在顯著差異 TEDS2008PE 對國民黨喜好程度N2 對民進黨喜好程度N2A 性別S18 政黨喜好重新編碼成0~10(其他設為遺漏值) 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異 對國民黨喜好程度N2N 對民進黨喜好程度N2AN 假設此兩個變數為數字資料 性別S18:1男性;2女性 Analyze Compare Means Independent-Samples T-Test 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異KMT 統計的假設: 你的研究假設? 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異KMT Levene's Test for Equality of Variances 虛無假設:變異數相等 對立假設:變異數不相等 Sig<0.05看第二行資訊 Sig>0.05看第一行資訊 Sig, p值與統計的虛無假設 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異KMT 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異KMT 統計說明: 從表一的資訊中我們發現:t值為-1.864自由度為1,759,查表得知p>0.05,所以無法拒絕虛無假設,男性與女性對國民黨的評價並不具備統計上的顯著差異。 論文描述: 表一中我們發現:男性對於國民黨的評價分數為4.97,低於女性的5.20。不過,經過統計上的檢定我們得知,兩者並不具備統計上的顯著差異。本研究假設並未驗證。 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異DPP 研究假設: 統計的虛無假設與對立假設 公共管理與政治學研究方法研討班 2019/1/14
性別與主要政黨喜好差異DPP 統計說明: 從表二的資訊中我們發現:t值為2.034自由度為1,744,查表得知p<0.05,所以拒絕虛無假設,男性與女性對民進黨的評價具備統計上的顯著差異。 論文描述: 表二中我們發現:男性對於民進黨的評價分數為4.68,低於女性的4.43,且經過統計上的檢定我們得知,兩者具備統計上的顯著差異。本研究假設主張男性對民進黨的評價分數較女性為高,獲得支持。 公共管理與政治學研究方法研討班 2019/1/14
SPSS的具體操作:配對樣本T檢定 我們要檢視民眾對兩個政黨喜好程度是否存在顯著差異 Analyze Compare Means Paired-Samples T-Test 公共管理與政治學研究方法研討班 2019/1/14
民眾對兩個主要政黨喜好的差異 統計的假設: 你的研究假設? 公共管理與政治學研究方法研討班 2019/1/14
民眾對兩個主要政黨喜好的差異 公共管理與政治學研究方法研討班 2019/1/14
民眾對兩個主要政黨喜好的差異 統計說明: 從表三的資訊中我們發現:t值為5.007自由度為1,742,查表得知p<0.001,所以拒絕虛無假設,民眾對國民黨與民進黨的評價具備統計上的顯著差異。 論文描述: 表三中我們發現:民眾對於國民黨的評價分數為5.07,高於對民進黨的4.56,且經過統計上的檢定我們得知,兩者具備統計上的顯著差異。本研究假設主張:因為扁家弊案與國民黨勝選,使得民眾對國民黨的評價分數較民進黨顯著為高,此一主張獲得支持。 公共管理與政治學研究方法研討班 2019/1/14
我們要檢視民眾對政黨喜好程度與特定數值是否存在顯著差異 SPSS的具體操作:單一樣本T檢定 我們要檢視民眾對政黨喜好程度與特定數值是否存在顯著差異 Analyze Compare Means One-Samples T-Test 公共管理與政治學研究方法研討班 2019/1/14