Presentation is loading. Please wait.

Presentation is loading. Please wait.

相關統計觀念復習 Review II.

Similar presentations


Presentation on theme: "相關統計觀念復習 Review II."— Presentation transcript:

1 相關統計觀念復習 Review II

2 The Key Concepts Statistical Inference Parameter Estimation
Hypothesis Testing Point Estimation vs. Interval Estimation Confidence Interval Confidence coefficient and level of significance Properties of Point Estimator BLUE (線性最佳不偏估計式) Consistency

3 The Key Concepts Hypothesis Testing The Confidential Interval Approach
The Test of Significance Approach Type I Error( ) and Type II Error ( ) t test and the p value

4 I. Estimation of Parameters
The meaning of statistical inference (統計推論) 簡單地說,就是根據樣本來推論母體. Statistical inference is the study of the relationship between a population and a sample drawn from that population.

5 I. Estimation of Parameters
Two branches of statistical inference Estimation(估計):我們可能對母體的某些特徵有興趣,這些母體特徵稱之為參數(parameter).欲利用樣本推論母體,第一步必須先對參數作估計,估計時需要估計式(estimator),估計式必須具有什麽特性才算是 “好”的估計式呢? Hypothesis testing(假說檢定):我們對母體參數值可能有一些事前的判斷或預期,而根據樣本所得到的估計值(在統計上)支持或不支持原來的假說呢?這是統計推論的第二步。

6 I. Estimation of Parameters
估計母體參數值(以母體 的估計為例) Point estimation(點估計) 計算樣本平均數的公式 稱為點估計式(point estimator). Interval estimation(區間估計) 根據估計式的抽樣分配可以建立 的區間估計:在給定之機率下, 會落於的區間為何?假設給定機率為95%,如何建立區間估計呢?

7 I. Estimation of Parameters
已知 ,假設母體 未知,以樣本變異數 取代,根據Review I 的說明,可知 為自由度n-1的t分配隨機變數,故可由t分配表建立區間估計.假設自由度=27 (圖1) (*) 上式即為 的interval estimator.

8 I. Estimation of Parameters
Figure 1 The t distribution for 27 d.f.

9 I. Estimation of Parameters
統計上稱(*)式為 的95%信賴區間(confidence interval),而95%為信賴水準或信賴係數(confidence coefficient).(*)式的意義為: “ the probability is 0.95 that the random interval contains the true (該隨機區間包含母體真值的機率是95%) .”(the interval is random because it is based on and , which will vary from sample to sample). 當信賴水準提高,信賴區間變大.而(1-信賴水準)稱為顯著水準(significant level),習慣上以 來表示.

10 I. Estimation of Parameters
Figure 2 (a) 95% and (b) 99% confidence intervals for μx for 27 d.f.

11 II. Properties of Point Estimator
為何採用樣本平均 作為母體期望值 的估計式呢?這是因為此估計式擁有一些統計上的良好性質. 性質1:Linearity 指估計式為樣本觀察值的線性函數. 顯然 為 的線性函數,符合性質1. 性質2:Unbiasedness(不偏) 指重覆隨機抽樣下,該估計式的期望值等於真實的母體參數值,以樣本平均為例,即

12 II. Properties of Point Estimator
性質3:Efficiency(效率性) If we consider only unbiased estimators of a parameter, the one with the smallest variance is called the best, or efficient estimator. Minimum-variance estimator的意義 比較兩個估計式:樣本平均和樣本中位數(median),兩者皆為母體期望值的不偏估計式,但樣本平均優於中位數,因前者估計式的變異數較後者為小. BLUE (best linear unbiased estimator):指所有線

13 II. Properties of Point Estimator
An example of an efficient estimator (sample mean).

14 II. Properties of Point Estimator
性,不偏估計式中變異數最小者. 性質4:Consistency(一致性) 此為大樣本下(n大)的性質,正式的定義如下:令母體參數為 ,估計式為 ,則若下式成立,該估計式符合一致性 表示當樣本數趨近於無窮大時,該估計式等於母體參數(即估計式變異數趨近於零).以下圖來說,該估計式在小樣本下並非不偏,但隨著樣本數增加,趨近於不偏,且變異數減少.

15 II. Properties of Point Estimator
The property of consistency. The behavior of the estimator X* of population mean μx as the sample size increases .

16 III. Hypothesis Testing
接著討論假說檢定,假設樣本數為28,樣本均數值23.25,樣本標準差1.7934, 如何根據28筆樣本資料進行檢定呢? 令欲檢定的虛無假說(null hypothesis)為 虛無假設之檢定乃相對於對立假設(alternative hypothesis),其形態為下列三種之一: , (one-tailed) (composite, two-tailed)

17 IV. Hypothesis Testing 檢定方法一:confidence interval approach
根據信賴區間部份的說明,可知在95%信賴水準之下, 的信賴區間為 ,不包含18.5,故拒絕虛無假設. 準則:信賴區間為acceptance region(接受域),若虛無假設之值落於信賴區間,則無法拒絕虛無假設;信賴區間以外為critical region, or the region of rejection(拒絕域),若虛無假設之值落於信賴區間以外,則拒絕虛無假設. 根據檢定結果,拒絕了 的虛無假設,這是否

18 IV. Hypothesis Testing 表示樣本一定不是來自期望值為18.5的母體呢?由於信賴水準為95%,我們並無法確定,也就是說,有可能母體期望值為18.5,而我們錯誤地拒絕了,此種錯誤地拒絕為真虛無假設(the error of rejecting a hypothesis)稱為型一誤差(type I error).反之若虛無假設為 ,則無法拒絕,此時同樣有可能樣本並非來自期望值為21的母體,此種錯誤地接受了非真虛無假設(the error of accepting a false hypothesis)稱為型二誤差(type II error).

19 IV. Hypothesis Testing 在樣本數給定之下,我們無法同時降低型一與型二誤差發生的機率,古典統計學假設型一誤差相對嚴重,因此檢定時,係在給定相當低的型一誤差水準(通常是1%或5%)之下來進行,此給定的型一誤差水準就是顯著水準 (例中=5%).故前例中我們有5%的機會錯誤地拒絕了 倘若將顯著水準降低(如由5%降為1%),則犯型一誤差的機率下降(信賴區間變大了),但同時錯誤地接受非真之虛無假設的機率(即型二誤差)也提高了.例如前例在1%顯著水準下,信賴區間 ,無法拒絕

20 III. Hypothesis Testing
Example D.3. 樣本數20,樣本平均數6.5,樣本標準差2,顯著水準1%,檢定 against 檢定方法二:Test of significance approach 直覺:已知 為自由度n-1的t分配隨機變數,根據樣本可計算出 和 ,再將虛無假設的數值(此例為18.5)代入 ,即可計算出t值.直覺上,若 愈接近於虛無假設數值(絕對差愈小), 愈小,愈傾向不拒絕虛無假設,反之若樣本平均值與虛無假設數值差距愈大, 愈大,愈傾向於拒絕虛無假設,那麼差異要多大(或 要多大)才夠顯著而拒絕虛無假設呢?這取決於所設定的顯著水準.

21 III. Hypothesis Testing
檢定量(test statistic):此例以t 檢定量 來檢定 ,倘若虛無假設為真,檢定量t值為 而在5%顯著水準下,critical t值為-2.052與2.052,此例t值大於2.052,表示拒絕虛無假設而犯型一誤差的真實機率小於5%,因此拒絕虛無假設.(換言之,若虛無假設為真,會得到t值2.6486的機率小於2.5%,即小於所設定的顯著水準,故拒絕虛無假設). p值的意義: ,the exact significance level of the test statistics. The smaller the p value, the stronger the evidence against .

22 III. Hypothesis Testing
The t test of significance: (a) Two-tailed; (b) right-tailed; (c) left-tailed

23 III. Hypothesis Testing
A summary of the t test.


Download ppt "相關統計觀念復習 Review II."

Similar presentations


Ads by Google