課程七 假設檢定
簡介 利用抽樣分配判斷某個樣本統計值是否為0,或是大於或小於特定的值。 以p值=0.05做為標準 可檢驗連續變數與二分變數
假設 虛無假設(Null hypothesis)是我們想要檢定的假設,而對立假設(Alternative hypothesis)則是與虛無假設相反的敘述。 檢定的目的是確認虛無假設是否成立。如果虛無假設不成立,只表示虛無假設的陳述並不為真,但是並不表示接受對立假設。
檢定統計 為了檢定虛無假設,我們從資料計算檢定值。 檢定統計是虛無假設內的母體參數的點估計,可說是我們的猜測。
p值 p值代表檢定統計值為真的機率,或者是與虛無假設相反的值出現的機率 如果p<= α,我們則否定H0 可以是單尾或雙尾檢定。
p值的前提 先確定是連續變數還是類別變數 樣本數多於30,中央極限定理才成立 隨機抽樣
α 值 跟信賴區間一樣,以α值表示誤差 通常用0.01或是0.05做為標準 α =0.05時等於是20次錯1次。 雙尾檢定時t值查表對應的p值必須乘2,也就是說p值可能更接近0.01或0.05的α 值。
模擬 假定n=900,而母體比例為0.5,想找出機率值為30%, 45%, 56%, 68%, 95%, 97.5%, 99.9%, 99.99%的樣本平均值。 分別計算t值得到-0.5246, -0.1257, 0.1510 0.4679, 1.6466, 1.9626, 3.0993, 3.7344 對應的樣本平均值分別為0.491, 0.497, 0.502, 0.527, 0.532, 0.551, 0.562
模擬 由上圖可發現,p值越小,也就是t值越大,樣本平均值離0.5越來越遠,表示越能拒絕虛無假設。
檢定的程序 先決定虛無假設H0: μ=μ0以及對立假設 然後找出母體標準誤 因為t分佈接近常態分佈,故計算t值=π-hat-π0/σ(π0)或是y-bar-μ0/σ(μ0) 對應p值。如果是雙尾檢定則p值再乘以2 根據p與α的大小判斷
單尾檢定的例子 已知29位女同學之中,體重變化的平均數為3.007,標準誤1.357。 H0: μ=0 計算t=3.007-0/1.357=2.22 對應右尾機率,p值介於2.5%及1%之間。單尾機率約1.7%,雙尾機率約為3.5%。 因此樣本統計值3.007顯著大於0
雙尾檢定的例子 Florida民意調查顯示,1200名受訪者中,有804人反對限制墮胎,π=0.67。如果反對的真實比例為60%,樣本比例是否等於0.6? H0: μ=0.6 標準誤(s.e.)為√(0.6)(1-0.6)/ √ 1200=0.014 t=0.67-0.6/se=4.94。P<0.001。
第一型與第二型誤差 第一型誤差(Type I error)指拒絕了一個正確的虛無假設,第二型誤差(Type II error)指的是沒有拒斥一個錯誤的虛無假設。 如果虛無假設來自於α=0.05,我們犯錯(例如得到很高的t值)而認為H0應該是錯的,第一型誤差機率即為5%。 但是我們不確定真實的參數為何,所以如果真實參數越接近H0,也就是p值容易大於α 值,犯Type II error的機率越大。
二元分佈 如果母體成二元分佈,且確定每個事件都是獨立的,可計算出現事件數的機率。例如,丟n=10個銅板,出現0~10個正面等事件X的機率,而且假設母體機率為π。
二元分佈特性 當n越大,二元分佈(pmf)越會呈對稱的鐘形 μ= nπ ;σ=√nπ(1- π) Q:扭蛋機裡有多啦A夢跟其它的公仔,假如多啦A夢佔20%,請問如果扭20個扭蛋,平均會得到多少個多啦A夢?A: 20*0.2=4 20個扭蛋中抽到4個多啦A夢扭蛋機率?P(X=4)=0.218
二元分佈檢定 因為二元變數的抽樣分配成常態分佈,我們便可以根據公式計算平均值及標準差,並推算平均值加減若干個標準差的區間。 也可以檢定樣本平均值假設。假設一半人口以米飯為主食,但是某大學的10名學生之中有3名吃米飯,可檢定樣本的吃米飯比例顯著不等於0.5。因為P(X<=3)=0.17,無法拒斥α=0.05時,π=0.5的虛無假設。
總結 瞭解假設檢定的基本原則 注意單尾及雙尾檢定之差異 瞭解二元分佈之平均值與標準差計算方式