相關統計觀念復習 Review II
The Key Concepts Statistical Inference Parameter Estimation Hypothesis Testing Point Estimation vs. Interval Estimation Confidence Interval Confidence coefficient and level of significance Properties of Point Estimator BLUE (線性最佳不偏估計式) Consistency
The Key Concepts Hypothesis Testing The Confidential Interval Approach The Test of Significance Approach Type I Error( ) and Type II Error ( ) t test and the p value
I. Estimation of Parameters The meaning of statistical inference (統計推論) 簡單地說,就是根據樣本來推論母體. Statistical inference is the study of the relationship between a population and a sample drawn from that population.
I. Estimation of Parameters Two branches of statistical inference Estimation(估計):我們可能對母體的某些特徵有興趣,這些母體特徵稱之為參數(parameter).欲利用樣本推論母體,第一步必須先對參數作估計,估計時需要估計式(estimator),估計式必須具有什麽特性才算是 “好”的估計式呢? Hypothesis testing(假說檢定):我們對母體參數值可能有一些事前的判斷或預期,而根據樣本所得到的估計值(在統計上)支持或不支持原來的假說呢?這是統計推論的第二步。
I. Estimation of Parameters 估計母體參數值(以母體 的估計為例) Point estimation(點估計) 計算樣本平均數的公式 稱為點估計式(point estimator). Interval estimation(區間估計) 根據估計式的抽樣分配可以建立 的區間估計:在給定之機率下, 會落於的區間為何?假設給定機率為95%,如何建立區間估計呢?
I. Estimation of Parameters 已知 ,假設母體 未知,以樣本變異數 取代,根據Review I 的說明,可知 為自由度n-1的t分配隨機變數,故可由t分配表建立區間估計.假設自由度=27 (圖1) (*) 上式即為 的interval estimator.
I. Estimation of Parameters Figure 1 The t distribution for 27 d.f.
I. Estimation of Parameters 統計上稱(*)式為 的95%信賴區間(confidence interval),而95%為信賴水準或信賴係數(confidence coefficient).(*)式的意義為: “ the probability is 0.95 that the random interval contains the true (該隨機區間包含母體真值的機率是95%) .”(the interval is random because it is based on and , which will vary from sample to sample). 當信賴水準提高,信賴區間變大.而(1-信賴水準)稱為顯著水準(significant level),習慣上以 來表示.
I. Estimation of Parameters Figure 2 (a) 95% and (b) 99% confidence intervals for μx for 27 d.f.
II. Properties of Point Estimator 為何採用樣本平均 作為母體期望值 的估計式呢?這是因為此估計式擁有一些統計上的良好性質. 性質1:Linearity 指估計式為樣本觀察值的線性函數. 顯然 為 的線性函數,符合性質1. 性質2:Unbiasedness(不偏) 指重覆隨機抽樣下,該估計式的期望值等於真實的母體參數值,以樣本平均為例,即 .
II. Properties of Point Estimator 性質3:Efficiency(效率性) If we consider only unbiased estimators of a parameter, the one with the smallest variance is called the best, or efficient estimator. Minimum-variance estimator的意義 比較兩個估計式:樣本平均和樣本中位數(median),兩者皆為母體期望值的不偏估計式,但樣本平均優於中位數,因前者估計式的變異數較後者為小. BLUE (best linear unbiased estimator):指所有線
II. Properties of Point Estimator An example of an efficient estimator (sample mean).
II. Properties of Point Estimator 性,不偏估計式中變異數最小者. 性質4:Consistency(一致性) 此為大樣本下(n大)的性質,正式的定義如下:令母體參數為 ,估計式為 ,則若下式成立,該估計式符合一致性 表示當樣本數趨近於無窮大時,該估計式等於母體參數(即估計式變異數趨近於零).以下圖來說,該估計式在小樣本下並非不偏,但隨著樣本數增加,趨近於不偏,且變異數減少.
II. Properties of Point Estimator The property of consistency. The behavior of the estimator X* of population mean μx as the sample size increases .
III. Hypothesis Testing 接著討論假說檢定,假設樣本數為28,樣本均數值23.25,樣本標準差1.7934, 如何根據28筆樣本資料進行檢定呢? 令欲檢定的虛無假說(null hypothesis)為 虛無假設之檢定乃相對於對立假設(alternative hypothesis),其形態為下列三種之一: , (one-tailed) (composite, two-tailed)
IV. Hypothesis Testing 檢定方法一:confidence interval approach 根據信賴區間部份的說明,可知在95%信賴水準之下, 的信賴區間為 ,不包含18.5,故拒絕虛無假設. 準則:信賴區間為acceptance region(接受域),若虛無假設之值落於信賴區間,則無法拒絕虛無假設;信賴區間以外為critical region, or the region of rejection(拒絕域),若虛無假設之值落於信賴區間以外,則拒絕虛無假設. 根據檢定結果,拒絕了 的虛無假設,這是否
IV. Hypothesis Testing 表示樣本一定不是來自期望值為18.5的母體呢?由於信賴水準為95%,我們並無法確定,也就是說,有可能母體期望值為18.5,而我們錯誤地拒絕了,此種錯誤地拒絕為真虛無假設(the error of rejecting a hypothesis)稱為型一誤差(type I error).反之若虛無假設為 ,則無法拒絕,此時同樣有可能樣本並非來自期望值為21的母體,此種錯誤地接受了非真虛無假設(the error of accepting a false hypothesis)稱為型二誤差(type II error).
IV. Hypothesis Testing 在樣本數給定之下,我們無法同時降低型一與型二誤差發生的機率,古典統計學假設型一誤差相對嚴重,因此檢定時,係在給定相當低的型一誤差水準(通常是1%或5%)之下來進行,此給定的型一誤差水準就是顯著水準 (例中=5%).故前例中我們有5%的機會錯誤地拒絕了 . 倘若將顯著水準降低(如由5%降為1%),則犯型一誤差的機率下降(信賴區間變大了),但同時錯誤地接受非真之虛無假設的機率(即型二誤差)也提高了.例如前例在1%顯著水準下,信賴區間 ,無法拒絕 .
III. Hypothesis Testing Example D.3. 樣本數20,樣本平均數6.5,樣本標準差2,顯著水準1%,檢定 against . 檢定方法二:Test of significance approach 直覺:已知 為自由度n-1的t分配隨機變數,根據樣本可計算出 和 ,再將虛無假設的數值(此例為18.5)代入 ,即可計算出t值.直覺上,若 愈接近於虛無假設數值(絕對差愈小), 愈小,愈傾向不拒絕虛無假設,反之若樣本平均值與虛無假設數值差距愈大, 愈大,愈傾向於拒絕虛無假設,那麼差異要多大(或 要多大)才夠顯著而拒絕虛無假設呢?這取決於所設定的顯著水準.
III. Hypothesis Testing 檢定量(test statistic):此例以t 檢定量 來檢定 ,倘若虛無假設為真,檢定量t值為2.6486.而在5%顯著水準下,critical t值為-2.052與2.052,此例t值大於2.052,表示拒絕虛無假設而犯型一誤差的真實機率小於5%,因此拒絕虛無假設.(換言之,若虛無假設為真,會得到t值2.6486的機率小於2.5%,即小於所設定的顯著水準,故拒絕虛無假設). p值的意義: ,the exact significance level of the test statistics. The smaller the p value, the stronger the evidence against .
III. Hypothesis Testing The t test of significance: (a) Two-tailed; (b) right-tailed; (c) left-tailed
III. Hypothesis Testing A summary of the t test.