第十二章 單因子變異數分析.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

單元九:單因子變異數分析.
單元十四、平均數檢定 國立高雄餐旅學院 沈瑞棋.
第十一章 假設檢定.
單元九、平均數檢定 國立高雄餐旅學院 沈瑞棋.
實驗規劃--實驗因子設定, 效標選定與受測者選定
2 基本資料分析.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
第9章 假設檢定.
變異數分析 ANalysis Of VAriance ANOVA
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
第七章 平均數比較分析 第一節 平均數比較檢定原理 第二節 One-Way ANOVA檢定原理 第三節 SPSS的Means分析
第 10 章 單組樣本的假設檢定.
第 8 章 一組樣本 單變項推論方法.
第十三章 相關.
第五章 平均數檢定:多組樣本.
判斷步驟 Step 1 :判斷是否為常態分配 Step 2 :如果是常態分配,用「假設檢定」,如果不是請看 Step 3
17 類別資料的分析  學習目的.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
Chap3 Descriptive statistics -numerical measures Minitab & Excel
商用統計學 Chapter 8 假設檢定.
第3章 資料的整理與表現- 統計表與統計圖.
兩獨立母體成功比例差- Z檢定(大樣本):說明
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
Ch7:一般線性模式 GLM.
Using EXCEL for ANOVA.
變異數分析 12.1基本概念 12.2一因子變異數分析(完全隨機化設計) 12.3數個平均數的多重比較
統計學: 應用與進階 第14 章: 變異數分析.
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
第十章 單因子變異數分析.
第四章 樣本大小.
第 9 章 假設檢定 Part B ( ).
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第十章 估計.
第 13 章 實驗設計與變異數分析 Part A ( ).
第 7 章 推論方法.
估計與假設檢定.
國立台灣體育學院 體育學系暨體育研究所 高明峰
小學四年級數學科 8.最大公因數.
CH1 我的第一個App與變數宣告.
16 複迴歸分析與相關分析  學習目的.
第十四章 迴歸.
田口方法應用於語音辨識 報告者:李建德.
挑戰C++程式語言 ──第8章 進一步談字元與字串
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Ogive plot example 說明者:吳東陽 2003/10/10.
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27.
Introduction to Basic Statistics
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
二項分配-Binomial 伯努利試驗(Bernoulli Trial) 每一次試驗皆僅有兩種可能結果,不是成功(S),就是失敗(F)。
R教學 t檢定R指令與範例 羅琪老師.
Commando War ★★☆☆☆ 題組:Problem Set Archive with Online Judge
第 12 章  變異數分析.
百分數認識.
Chapter 3 相關與變異數分析. Chapter 3 相關與變異數分析 變數的內涵 屬量變數 屬質變數 當一個變數可以量化、計算,而且其值的大小可以做有意義的比較時,則稱為屬量變數 當一個變數的內容是屬於敘述性的(如:快樂/憂鬱、男/女),則即使我們可以將其量化,這些量化之後的數值不但在邏輯上不能運算,其大小的比較也沒有意義,這種變數即稱為屬質變數.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
第一章 直角坐標系 1-3 函數及其圖形.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
String類別 在C語言中提供兩種支援字串的方式 可以使用傳統以null結尾的字元陣列 使用string類別
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

第十二章 單因子變異數分析

F分配FDIST() FDIST(F,分子的自由度,分母的自由度) FDIST(x,degrees_freedom1,degrees_freedom2) F為用來求算此函數的F值。由於F值是兩個均方相除: 故其自由度有兩個,一為分子的自由度;另一個為分母的自由度。且 因分子分母均為正值(均方),故其分配僅在0之右側而已。 本函數在求:於某兩個自由度下之F分配中,求自右尾累計到F值的總 面積(機率)。即傳回F分配之右尾累計機率值(下圖之陰影部份):

F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12 F分配之圖形及機率值,將隨自由度不同而略有不同。範例Ch12.xlsx 『FDIST』工作表,為自由度(2,10)與(3,15)之情況下,不同F值所求得之 右尾累計機率:

F分配反函數FINV() FINV(左尾機率,分子的自由度,分母的自由度) FINV(probability,degrees_freedom1,degrees_freedom2) 本函數用以於已知自由度之F分配中,求某累計機率所對應之F值。 由於F分配之圖形及機率值,將隨自由度不同而略有不同。範例 Ch12.xlsx『FINV』工作表,是以自由度為(2,10)之情況下,所求得 之結果: 有了此函數,即可省去查『附錄五 F分配的臨界值』F分配表之麻煩。

馬上練習 查兩個自由度(d.f.)分別為1~10之情況下,單尾機率為5%之F值: (詳範例Ch12.xlsx『F分配的臨界值』工作表)

F檢定FTEST() 各樣本之母群體為常態分配(normality) 各樣本之母群體為獨立(independence) 變異數分析(Analysis-of-Variance簡稱ANOVA),為統計學家費雪 (Fisher,R.A.)首創,最常被用來檢定兩常母體之變異數是否相等(即, 變異數同質性的檢定)與檢定多組(大於兩組)母群平均數是否相等? (若為兩組則採用t檢定或z檢定) 要使用變異數分析的基本假設為: 各樣本之母群體為常態分配(normality) 各樣本之母群體為獨立(independence) 各組樣本之母群體變異數相同(homogeneity-of-variance)

兩常態母體之變異數檢定 FTEST(範圍1,範圍2) FTEST(array1,array2) 可傳回兩組資料(樣本數允許不同),變異數是否存有顯著差異的F檢 定之右尾機率值(P值)。判斷檢定結果時很簡單,只須看此P值之二 分之一是否小於所指定顯著水準之α值。(按理,係雙尾檢定,但通常 會將數字大者當分子,故只須看右尾之臨界值即可) 本函數,可用來測試兩組樣本的變異數是否相同?即變異數同質性的 檢定,其虛無假設與對立假設分別為: H0:σ12=σ22(兩變異數相等) H1:σ12≠σ22(兩變異數不等)

假定,要檢定甲乙兩班之母體變異數是否相同(α=0. 05)?隨機抽得範例 Ch12 假定,要檢定甲乙兩班之母體變異數是否相同(α=0.05)?隨機抽得範例 Ch12.xlsx『F-TEST1』工作表之資料,以 =FTEST(B2:B10,C2:C11)/2 求得其右尾機率(P值)並將其除以2,其值為0.043<α=0.05,故應棄卻兩變 異數相等之虛無假設:

同樣之例子,若使用『資料分析』增益集。其處理步驟為:(詳範例 Ch12.xlsx『F-TEST2』工作表) 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕(#圖Ch12- DataAnalysis), 於『分析工具』處選選「F-檢定:兩個常態母體變異數的 檢定」 續 鈕

於『變數1的範圍』與『變數2的範圍』處,設定兩組資料之範圍(B1:B10與 C1:C11) 點選「標記(L)」(因兩組資料均含『甲班』、『乙班』之字串標記) α維持0.05 設定輸出範圍,本例安排於目前工作表之E2位置

依此結果:自由度為(8,9),F值3. 4192>臨界值3. 2296(F10處之P值0. 0426<α=0 依此結果:自由度為(8,9),F值3.4192>臨界值3.2296(F10處之P值0.0426<α=0.05,同於B15之值;E15處以FINV所算得之F值為3.419,同於F9之值),故可知甲乙班之變異數有顯著差異。(應棄卻兩變異數相等之虛無假設) 按 鈕結束,即可獲致檢定結果

FTEST()函數實際上是以 計算求得F值,再代入FDIS()以(n1-1,n2-1)為自由度,求得其右尾機率。如以 前面例子n1=9、n2=10、 、 此值恰等於詳範例Ch12.xlsx『F-TEST3』工作表中,B16以FINV()函數所計 算之結果。將其代入FDIS()以(8,9)為自由度,求得其右尾機率為0.0426,恰 等於B15以FTEST()函數所計算之結果(該值係將雙尾機率除以2):

先檢定變異數再進行均數檢定 當以t檢定,進行兩獨立樣本(小樣本)均數檢定時,將視其變異數相 同或不同,而使用不同之計算方法。實務上,很多知名的統計套裝軟 體(如:SPSS、SAS),就先以F檢定,判斷其變異數是否相同?然 後再進行適當之t檢定。 如,要對範例Ch12.xlsx『F&T』工作表之資料,進行兩班抽樣成績 之均數檢定:

以前,我們是假設變異數相等(或不等)後,才來進行t檢定。但這種假設合 理否?誰都不知道!所以,就先以F檢定,判斷其變異數是否相同: 由其F10處之P值為0.27>α=0.05,故無法棄卻兩變異數相等之虛無假設。

由於,F檢定之結果顯示甲乙兩班之變異數相等。故可使用『t檢定:兩個母 體平均數差異檢定,假設變異數相等』之方法進行檢定。假定,要判斷在 α=0.05之顯著水準下,乙班之平均成績是否高過甲班?由於是變異數相同,t 檢定之類型為2。且虛無假設與對立假設分別為: H0:μ1≧μ2 H1:μ1<μ2 故此類檢定為單尾檢定。所以,以 =TTEST(C2:C11,B2:B10,1,2) 或以『資料分析』之「t檢定:兩個母體平均數差異檢定,假設變異數相等」 增益集:

均可進行檢定: 無論由B16或F27之單尾P值來看,均顯示其值0.1856>α=0.05,故仍無法棄 卻兩班之均數相等的虛無假設,所以並無法證明乙班之平均成績會高過甲班。

馬上練習 以範例Ch12.xlsx『F&T馬上練習』工作表,利用F檢定,判斷北區與 南區給予剛畢業之大學生的薪資變異數是否相等(α=0.05)?續以適 當之t檢定,判斷北區給剛畢業之大學生的平均薪資是否高過南區 (α=0.05)?

由其G10處之P值為0.17>α=0.05,故無法棄卻兩變異數相等之虛無假設,故得使用兩個母體變異數相等之均數檢定:

單因子變異數分析(ANOVA) 變異數分析的另一種用途,是用來檢定多組(>2)母群平均數是否相 等?亦即,Z與t檢定是用於兩組資料比較平均數差異時;而比較二組 以上的平均數是否相等時,就須使用到變異數分析。其虛無假設與對 立假設為: H0:μ1=μ2=…=μk(每組之均數相等) H1:至少有兩個平均數不相等 假定,範例Ch12.xlsx『ANOVA』工作表資料,為調查各地區對政府 施政的整體滿意程度(滿分為100分),試以α=0.01之顯著水準,檢 定各地區之滿意程度是否存有顯著差異?

本例,以使用『資料分析』進行處理最為便捷。其步驟為: 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』 處選「單因子變異數分析」 續按 鈕

於『輸入範圍』處,設定三組資料之範圍,選取可包括所有資料之最小範圍 即可(本例為B2:D12,別管其內可能仍含有空白儲存格) 將『分組方式』安排為「逐欄(C)」 點選「類別軸標記在第一列上(L)」(因各組資料均含標題之字串標記) α設定為0.01 設定輸出範圍,本例安排於目前工作表之G2位置

按 鈕結束,即可獲致單因子變異數分析之ANOVA表 依此結果:自由度為(2,24),F值10.79886>臨界值5.61(L13處之P值 0.00045<α=0.01),故可知三個地區之整體滿意度存有顯著差異。南區的滿意 度86.5要比其餘兩區(66.30與79.89)來得高。

馬上練習 某公司於報紙上進行廣告,範例Ch12.xlsx『廣告ANOVA』工作表, 為不同方式廣告當天所獲得之回應人數: 試以α=0.05之顯著水準,檢定不同方式廣告之回應人數是否存有顯著 差異?

答案:F=6. 56,d. f. =3,19,P-值=0. 00,不同方式廣告之回應人數間存有顯著 差異。全版與半版廣告之回應人數(1173

馬上練習 答案:F=0.46,d.f.=2,32,P-值=0.64,大學生每月刷卡金額並不會因其零用金來源不同而存有顯著差異。 依範例Ch12.xlsx『信用卡刷卡金額』工作表 試以α=0.05之顯著水準,檢定大學生每月刷卡金額是否隨零用金來源 不同而存有顯著差異?

馬上練習 將範例Ch12.xlsx『手機平均月費』工作表之內容 將其整理成僅剩有手機者(刪除無手機者),並以居住狀況分組:

試以α=0.05之顯著水準,檢定大學生每月手機月費是否隨其居住狀況不同而 存有顯著差異? 答案:F=6.887,d.f.=2,116,P-值=0.001<α=0.05,故大學生每月手機月費將隨其居住狀況不同而存有顯著差異,住家裡最高(572.36)、其次為住校外(447.59),最後為住學校宿舍(319.43)。這可能與住學校者較為節儉有關。

量表的檢定—多組 對於如: 等之評價量表,我們也經常得進行分組檢定。看對某一屬性之注重程 度,是否會因組別不同而有顯著差異?

若僅分兩組,係以『資料分析』之「Z檢定:兩個母體平均數差異檢定」來進 行檢定。若組數為兩組以上,則以『資料分析』之「單因子變異數分析」來進 行檢定。 以範例Ch12.xlsx『擁有手機時間長短X附屬功能多屬性』工作表,其內僅安 排一個『附屬功能多』評價項目(非常重要-5、……、非常不重要-1)及擁有 手機之時間長短資料(1.未滿六個月、2.六個月至一年、3.一年~一年半、4.一 年半以上):

由於分組結果超過兩組,故得以『附屬功能多』之「單因子變異數分析」來進 行檢定。先將其資料整理成:

然後,以『資料分析』之「單因子變異數分析」來進行檢定

其檢定結果為:

由於本例之虛無假設及對立假設為: H0:μ1=μ2=…=μk(每組之均數相等) H1:至少有兩個平均數不相等 α=0.05 依此結果:F=2.9767,d.f.=3,115,P-值=0.0345<α=0.05,故大學生對『附 屬功能多』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。 擁有手機時間一年~一年半者的注重程度(2.79),低於其他各組(3.45以 上)。

馬上練習 依範例Ch12.xlsx『擁有手機時間長短X雙頻手機屬性』工作表內容 將其資料整理成:

然後,以『資料分析』之「單因子變異數分析」來進行檢定大學生對『雙頻手 機』評價項目的注重程度,是否隨其擁有手機時間長短而存有顯著差異? 依此結果:F=2.747,d.f.=3,115,P-值=0.046<α=0.05,故大學生對『雙頻手機』評價項目的注重程度,將隨其擁有手機時間長短而存有顯著差異。擁有手機時間一年半以上者的注重程度(4.2),高於其他各組。

於報告上量表檢定的寫法-多組 通常,我們問卷上的評價量表,絕不會是少數的幾個評價項目而已。 以『資料分析』之「單因子變異數分析」來進行檢定,也是得一個一 個進行檢定,其過程相當辛苦。這也是沒辦法的事,主要是Excel並不 是專門的統計軟體,能做到這樣也算是不錯的了。 最後,將其彙總成下表:(詳範例Ch12.xlsx『手機屬性-ANOVA』工 作表)

檢定結果顯著者,於其P值後加註"*"(表其<α=0.05),並於報告中對其詳 將解釋;檢定結果不顯著者,則僅解釋其重要程度之排序即可。如: 根據調查解果,受訪者較注重之手機屬性,依序為:『收訊狀況佳』、『電磁 波的傷害』、『待機時間長』、『大小適中』與『重量輕巧』。 經逐一以F檢定,以擁有手機時間長短分組,對其注重程度進行檢定,發現有 『附屬功能多』與『雙頻手機』等屬性之注重程度會隨擁有手機時間長短不同, 而有顯著差異(P<α=0.05)。這些項目,均是『一年~一年半』組的著重程度 較低,可能是剛開始有手機者,會較注重這些項目,隨時間增長,慢慢地發現 其實這些項目也沒多大重要性;至於,『一年半以上』者,可能或真正發現沒 這些功能的不便性,或許也開始考慮要換手機,故其注重程度又明顯的高於其 他各組。

第十二章 結束 謝謝!