第 10 章 單組樣本的假設檢定.

Slides:



Advertisements
Similar presentations
工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
第 11 章 假設檢定的介紹.
單元九:單因子變異數分析.
實驗規劃--實驗因子設定, 效標選定與受測者選定
第9章 假設檢定.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
第 9 章 假設檢定 Part A ( ).
第 9 章 假設檢定 Part A ( ).
第 8 章 一組樣本 單變項推論方法.
第 10 章 假設檢定的介紹與單一母體的介紹.
判斷步驟 Step 1 :判斷是否為常態分配 Step 2 :如果是常態分配,用「假設檢定」,如果不是請看 Step 3
17 類別資料的分析  學習目的.
第 7 章  連續型的機率分配.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
估計.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
假設檢定.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
商用統計學 Chapter 8 假設檢定.
型II誤差機率的計算 Calculating Type II Error Probabilities
Sampling Theory and Some Important Sampling Distributions
兩獨立母體成功比例差- Z檢定(大樣本):說明
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
第 7 章 抽樣與抽樣分配.
第 7 章 抽樣與抽樣分配 Part B ( ).
One-Sample Tests of Hypothesis
Chapter 17 投資決策經濟分析.
The Runs Test : A Test for Randomness
教材 P.264 Point Estimation To estimate the value of a population parameter, we compute a corresponding characteristic of the sample, referred to as a sample.
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
Inferences Based on a Single Sample: Tests of Hypothesis Chapter 9
估計(estimation) 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2018/12/27.
主講人 陳陸輝 特聘研究員兼主任 政治大學 選舉研究中心
Hypothesis testing 假設檢定
七. 假說檢定Ⅰ (Hypothesis Testing Ⅰ) (Chapter 7)
第 9 章 假設檢定 Part B ( ).
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第 13 章 實驗設計與變異數分析 Part A ( ).
第十章補充 允收抽樣.
第 7 章 推論方法.
估計與假設檢定.
國立台灣體育學院 體育學系暨體育研究所 高明峰
第七章 假設檢定.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Review of Statistics.
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27.
Introduction to Basic Statistics
Parameter Estimation and Statistical Inference
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
Chapter 8 假設檢定.
R教學 t檢定R指令與範例 羅琪老師.
第 11 章 假設檢定的介紹.
第 12 章  變異數分析.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
第 零 章 假 設 檢 定.
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
政治大學財政所與東亞所選修--應用計量分析--中國財政研究 黃智聰
假說檢定程序 3.1 定義 3.2 假說檢定程序 3.3 檢定的種類與方法 3.4 統計檢定精神 個案:假說建立
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第 10 章 單組樣本的假設檢定

目標 定義假設與假設檢定。 描述假設檢定的 5 個步驟。 區別單尾檢定與雙尾檢定間的不同。 進行母體平均數的假設檢定。 進行母體比例的假設檢定。 定義型 I 與型 II 誤差。

何謂假設? 假設是一個關於母體參數的陳述,之後則使用資料與計算機率驗證這個陳述是否合理。 母體參數的假設例子為: 對於系統分析師的平均月收入為 $3,625。 Bovine’s Chop House 約有 20% 的顧客會在一個月內來用餐兩次。

何謂假設檢定? 假設檢定(hypothesis testing):基於樣本證據與機率理論來判斷假設是否合理而要接受,或是假設不合理而要拒絕的過程。

假設檢定的五個步驟

步驟 1:建立虛無假設與對立假設 虛無假設(null hypothesis)H0 :關於母體參數值的假設性敘述。 對立假設(alternate hypothesis)H1 :當樣本資料提供足夠證明虛無假設不為真時,接受的對立敘述就是對立假設。

母體平均數的假設檢定有三種情形 1. 2. 3. 記得虛無假設始終包含等式

定義 型 I 誤差(type I error): 當虛無假設 H0 為真時卻被拒絕, 用 表示。 型 II 誤差(type II error): 當虛無假設不正確時卻被接受, 用 表示。

步驟 2:選擇顯著水準

單尾檢定 當對立假設 H1 ,表示一個方向時,即為單尾檢定,例如: H1:行駛在 I-95 公路上的卡車時數每小時小於 60 英里。(µ < 60) H1:對於加油的顧客,付現的人數少於 20 %。(µ < 20)

在 0.05 顯著水準與右尾檢定下的 z 統計量抽樣分配

雙尾檢定 如果對立假設並沒有指出一個方向時,我們使用雙尾檢定。 例如: H1:Georgetown 城沃爾瑪百貨每位顧客的平均消費金額不等於 $25。(µ ≠ $25) H1:每加侖汽車售價不等於 $1.54。(µ ≠ $1.54)

雙尾檢定的不拒絕域與拒絕域,顯著水準為 0.05

步驟 3:決定檢定統計量 檢定統計量(test statistic):一個由樣本資訊所計算出來的統計值,用來決定是否要拒絕這個虛無假設。

母體平均數檢定,其中母體標準差已知 在大樣本與母體標準差已知的情形下,母體平均數的檢定統計量為:

步驟 4:制訂決策法則 臨界值(critical value):介於虛無假設拒絕域與接受域間的分隔點。

範例 位在紐約州西部的 Jamestown 鋼鐵公司,主要製造及組裝書桌或其他辦公室設備。在 Fredonia分廠中,每週生產的 A325 型號書桌數量服從常態分配,其平均數為 200 張、標準差為 16 張書桌。最近由於市場需求增加,該工廠引進新的生產方式並雇用了新的員工。公司副總裁想要調查 A325 型號書桌在引進新的生產方式後,產量是否有改變。換句話說,在 0.01 的顯著水準下,Fredonia 分廠的平均書桌產量是否為 200張?

範例 continued H0: μ = 200;H1: μ≠ 200 步驟 1:建立虛無假設與對立假設。 步驟 2:選擇顯著水準。 如題目所述,使用 0.01 的顯著水準。 步驟 3:選擇樣本統計量。 母體服從常態分配,且母體標準差σ已知,使用 z分配做為檢定統計量。

範例 continued 步驟 4:決定決策法則。 決策法則的制定,是先從附錄 B.1 中找出 z 的臨界值。由於這個範例是雙尾檢定,因此在兩尾內的機率是 0.01 的一半,即 0.005。在左右兩尾之間的面積 0.99 即為不拒絕 H0 的機率。因為附錄 B.1 基於曲線下右半邊的面積,也就是 0.5;再由0.5-0.005 = 0.495,得出在 0 至臨界值間的面積是 0.495;查表得出最接近 0.495的機率值是 0.4951,而其相對應的 z 值為 2.58。

範例 continued 顯著水準為 0.01 的決策法則

範例 continued 決定決策法則。 若 z > 2.58或 z < -2.58,則拒絕 H0 步驟 5:做決策。

範例 continued 計算結果是 1.55 未落在拒絕域內,因此不拒絕 H0。結論是母體平均數與 200 張書桌沒有差異,因此根據樣本證據顯示:Fredonia 分廠的每週產量與原先的平均產量 200 張書桌沒有顯著的不同,而母體平均週產量與去年週產量間的差距 3.5 單位,可能導因於抽樣誤差。

假設檢定的 p- 值法 此方法在於計算樣本統計量的值至少與實際觀測值一樣大的機率(假設虛無假設為真),其檢定程序是將機率值,稱為 p 值,與顯著水準進行比較。

假設檢定的 p- 值法 如果 p-值比顯著水準小,則拒絕 H0;如果 p- 值比顯著水準大,則不拒絕H0。

P- 值計算 單尾檢定: p- 值= P{z ≥ 檢定統計量} 雙尾檢定: p- 值= P{z ≥ 檢定統計量的絕對值} = 2(0.5-0.4251) = 0.1498。 因為 0.1498 > 0 .05,所以不拒絕 H0。

p值假設檢定 - Example H1:  > 200 拒絕 H0 若f Z > Z 上個問題,利用p值檢定: 其中 Z = 1.55 and Z =2.33 拒絕H0 若 p-value <  0.0606 不小於 0.01 結論: 不能拒絕 H0

p值小於 之意義? =0.10,具有一些證據證明 H0 不真。 = 0.05,具有較強證據證明H0 不真。

母體平均數檢定:大樣本與母體標準差已知 因為母體標準差σ已知,且樣本個數 n大於 30,計算公式如下所示:

母體平均數檢定:大樣本與母體標準差未知 因為母體標準差未知,因此使用樣本標準差來估計σ。同樣的,若樣本個數 n 大於 30,可以使用 s 來代替σ,計算公式如下所示:

母體平均數檢定:小樣本與母體平均數未知 必須使用 t 分配取代標準常態分配。 其檢定統計量為:

範例 在 0.01 的顯著水準下,可以說處理理賠案件的平均成本低於 $60 嗎? McFarland保險公司處理一件理賠案件需要花費 $60。與其他保險公司比較,McFarland 保險公司處理理賠案件的成本比其他公司高,因此該公司進行了降低成本的計畫。為了評估降低成本計畫的成效,McFarland 保險公司隨機抽選最近的 26 件理賠案件,其樣本資料如下所示: 在 0.01 的顯著水準下,可以說處理理賠案件的平均成本低於 $60 嗎?

範例 continued 步驟 1:建立虛無假設與對立假設。 H0: µ ≥ 60;H1: µ < 60 步驟 2:選擇顯著水準。 其為 0.01

範例 continued 步驟 3: 計算檢定統計量。 檢定統計量是 t 分 配。 因為樣本數小於 30。 我們可以合理地假設每件理賠案件的平均成本服從常態分配。

範例 continued 步驟 4:陳述決策法則。 附錄 B.2 表格最左邊的那一行標示為 df(自由度),即樣本內觀測資料數量減去樣本的組數,寫成 n-1。此範例的樣本數量是 26,組數是 1 組,所以自由度是26-1 = 25,在表格中找到自由度是 25 的那一列。此範例為單尾檢定,因此在表格中找到標示單尾部分,找出顯著水準 0.01 的那一行,再從左邊找到自由度為 25 的那一列,交叉點是 2.485,也就是所計算之檢定統計量值。此外,又因本例為單尾檢定且拒絕域在左邊,所以臨界值為負數(-2.485)。而決策法則是如果t值小於-2.485,就必須拒絕H0。

範例 continued 步驟 5:做決策。 26 個樣本的平均成本是 $56.42,樣本標準差是 $10.04。把這些值代入公式 [10-2] 中,計算出 t 值: 因為-1.818 落在臨界值- 2.485 的右邊,所以在 0.01 顯著水準下,不能拒絕虛無假設。這表示降低成本計畫,並沒有將平均處理成本降至 $60 以下。也就是樣本平均數 $56.42與母體平均數 $60 之間的差距 $3.58,可能源自抽樣誤差。

t-Distribution Table (portion)

範例 continued t 分配的拒絕域,顯著水準為 0.01

範例 一個小型平衡錘的平均長度是 43 公釐。生產主管認為調整後的機器所生產之平衡錘的長度已經改變,他要求工程部門進行調查。工程部門選取了 12 個平衡錘的樣本進行測量。其測量結果如下表所示: 可以說平衡錘的平均長度已經改變了嗎?請使用 0.02 顯著水準。

範例 continued 先建立虛無假設與對立假設。 H0:μ = 43 H1:μ≠ 43 本例為雙尾檢定,且其自由度是 n-1 = 12-1 = 11。根據以上資料,從附錄B.2中的雙尾檢定,使用 0.02 顯著水準找出 t 值是2.718。 決策法則是:如果檢定統計量 t 落在-2.718的左邊或是 2.718 的右邊,則拒絕虛無假設。我們將上述資訊整理成圖10-7。

範例 continued t 分配雙尾檢定的拒絕域,其中α= 0.02

範例 continued 使用公式 [10-2] 計算 t 值:

Population Standard Deviation- Example 2 continued

母體比例的檢定 比例的定義是成功次數與觀測資料總數量的比例。

母體比例的檢定 計算樣本比例 p 的公式為

假設檢定,單一比例 π: 為母體比例 p :為樣本比例

範例 在前一次的印地安那州長選舉顯示,如果候選人要當選,那麼至少要在北區贏得 80% 的選票。現任州長想要了解繼續連任的機會有多大,他計畫在本州北區隨機抽選 2,000 位合格選民進行調查。 使用假設檢定的步驟,了解現任州長連任機會。

範例 continued 州長選舉的情形符合二項分配的條件,但這個範例可以使用常態分配去近似二項分配,因為nπ與 n(1-π) 皆超過 5。 n = 2,000,π= 0.8(π是在本州北區的得票率,也就是 80%),所以 nπ = 2,000  0.8 = 1,600與 n(1-π) = 2,000  (1-0.8) = 400 都大於 5,可以進行母體比例的檢定。

範例 continued 步驟 1:建立虛無假設與對立假設。 H0: π≥ 0.8;H1: π< 0.8 步驟 2:選擇顯著水準。 其為 0.05

範例 continued 步驟 3:選擇檢定統計量。 使用 z 統計量,

範例 continued 步驟 4:建立決策法則。 顯著水準是 0.05,這機率是左尾拒絕域的面積。因此,z 值介於 0與臨界值之間的機率是0.5-0.05 = 0.45。再參考附錄 B.1 中面積接近0.45所相對應的 z 值是 1.65。所以在左尾的臨界值是-1.65。因此決策法則是:如果透過樣本計算出來的檢定統計量小於-1.65時,必須拒絕虛無假設,並接受對立假設;反之,則不得拒絕虛無假設 H0。

範例 continued 步驟 5:做決策。 抽選 2,000 位合格選民進行調查,其中指出有1,550 位選民打算投給現任州長。樣本比例是1,550/2,000 = 0.775。

範例 continued z 值-2.8落在拒絕域中,因此在顯著水準0.05 下,拒絕虛無假設。 這表示在樣本比例 77.5% 與假設母體比例 80% 間,2.5%的差距在統計上是顯著的,因此差距可能不是抽樣誤差所引起的。換句話說,樣本證據無法支持現任州長會繼續連任的說法。

範例 continued p-值為計算 z 值小於-2.8的機率。從附錄 B.1 找出介於 0 至- 2.8 範圍內 z 值的機率是 0.4974,由此可知 p- 值是0.5-0.4974 = 0.0026。此 p- 值小於顯著水準 0.05,這表示州長要連任的機率非常小。

範例 continued 顯著水準 0.05 與單尾檢定的拒絕域