變異數分析 ANalysis Of VAriance ANOVA

Slides:



Advertisements
Similar presentations
1 SPSS 軟體與變異數分析 南台科技大學企管系呂金河. 2 變異數分析 §1 變異數分析的基本概念 目的:變異數分析的作用在於分析各種變異的來源, 並進而加以比較,以瞭解不同的實驗變數所造成的 結果是否有顯著的差異,它的虛無和對立假設如下 : 在進行 ANOVA 及 MANOVA 變異數分析時,必.
Advertisements

第二週課程介紹 第三週 單因子實驗統計原理 與實務案例 第四週 單因子實驗人工統計實作 與 SPSS 操作 第五週 學習成效及時檢測 ( 紙筆測驗與上機測驗 ) 第六週 雙因子實驗統計原理 與實務案例 第七週 雙因子實驗人工統計實作 與 SPSS 操作 第八週 學習成效及時檢測 ( 紙筆測驗與上機測驗.
單元九:單因子變異數分析.
變異數分析 Analysis of Variance
實驗規劃--實驗因子設定, 效標選定與受測者選定
第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
第九章平均數的差異考驗 Z與t考驗.
第七章 平均數比較分析 第一節 平均數比較檢定原理 第二節 One-Way ANOVA檢定原理 第三節 SPSS的Means分析
變異數分析 (Analysis-of-Variance簡稱ANOVA)
第五章 平均數檢定:多組樣本.
17 類別資料的分析  學習目的.
單元九、spss與平均數差異檢定 沈瑞棋.
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
第九章 方差分析 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析
單因子實驗 設計 (Single­factor experiments)
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
共變數分析(ANCOVA) 賴弘基講授.
Analysis of Variance 變異數分析
實 驗 研 究 法 多因子實驗設計 指導老師:黃萬居教授 學生:陳志鴻 m
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
Ch7:一般線性模式 GLM.
Using EXCEL for ANOVA.
Analysis of Variance (一)
用于计算智能研究 和人类主观测试的 统计检验 Hideyuki TAKAGI 日本 九州大学
課程九 迴歸與相關2.
變異數分析 12.1基本概念 12.2一因子變異數分析(完全隨機化設計) 12.3數個平均數的多重比較
第 13 章 實驗設計與變異數分析.
統計學: 應用與進階 第14 章: 變異數分析.
ANOVA簡介 許晉誠
統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計
Test for difference among the means: t Test
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
十、變方分析 (Analysis of Variance) (Chapter 10)
實驗設計 邱皓政,量化研究方法(一),2005,雙葉 任課教授 任維廉 教授
自我介紹  黃郁哲 (Jeff) (阿哲)  高雄人  求學經歷 逢甲大學運管系畢業 交通大學運管系碩一 交通大學逕博生  興趣 吃遍美食、看歷史劇  許巧鶯老師研究室(許lab)  未來研究方向 海運業產業結構動態變化 各產業結構貨運量預測.
複習-常見的假設檢定寫法
第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
指導老師:蘇明俊 組員: 陳柔安 潘依蓮 張壹凱
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 4 主讲人 陶育纯 医学统计学方法 4 主讲人 陶育纯 流行病与卫生统计学教研室
相關統計觀念復習 Review II.
第 7 章 推論方法.
國立台灣體育學院 體育學系暨體育研究所 高明峰
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
Review of Statistics.
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27.
Introduction to Basic Statistics
第八章 均值比较与检验 2019/5/10.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
第八章 方差分析(analysis of variance)
Chapter 3 相關與變異數分析. Chapter 3 相關與變異數分析 變數的內涵 屬量變數 屬質變數 當一個變數可以量化、計算,而且其值的大小可以做有意義的比較時,則稱為屬量變數 當一個變數的內容是屬於敘述性的(如:快樂/憂鬱、男/女),則即使我們可以將其量化,這些量化之後的數值不但在邏輯上不能運算,其大小的比較也沒有意義,這種變數即稱為屬質變數.
Multiple Regression: Estimation and Hypothesis Testing
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
Part 3 初等統計與理論.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
SAS 統計程序實作 PROC GLM 變異數分析 (PROC ANOVA)
实习二 方差分析 流行病与卫生统计学系
SAS 統計程序實作 PROC NPAR1WAY 無母數檢定
Presentation transcript:

變異數分析 ANalysis Of VAriance ANOVA 謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw

自變數 依變數 統計分析方法 類別 交叉表 連續 t-test:1~2個樣本 ANOVA:2個(含)以上樣本 相關分析 迴歸分析

基本概念 ANOVA的目的 檢定平均數之間是否有顯著差異 (significant differences) 如果只比較兩組平均數,那麼ANOVA的結果和獨立樣本 t檢定(比較兩個不同群體)或是成對樣本t檢定(比較一組觀察值的兩個變數),是一樣的

T檢定可以用來檢驗兩個獨立樣本的平均數差異是否達到所謂的「顯著水準」。那麼,超過兩個以上的獨立樣本需要比較其間的平均數差異時,該如何進行呢? 兩兩比較 1923年R.A. Fisher創用了變異數分析(analysis of variance, ANOVA)來檢驗兩個以上獨立樣本的平均數間的差異情形是達到預設的顯著水準 是社會科學研究最常用的統計分析方法之一

您是怎麼泡茶的? 牛奶加進茶裏? 茶加進牛奶裏?

淑女與下午茶 「把茶倒進牛奶中」和「把牛奶倒進茶中」,喝起來是不一樣的?! 1920年代40歲的小鬍子Sir Ronald A. Fisher, (1890-1962,英國統計學家)的實驗 The Design of Experiments, 1935 變異數分析(analysis of vairance)是在費雪的<作物收成變化研究II>論文(1942)中首次出現 3種不同的人工肥料 10種馬鈴薯 4塊土地/土壤 <作物收成變化研究IV>共變分析(analysis of covariance)

為什麼叫ANOVA 明明是比較平均數的統計程序,為什麼要取名變異數分析(analysis of variance) 因為,事實上檢定平均數的統計顯著性時,我們真正比較(或分析)的是變異數( variances )

變異數的拆解 同時處理多個平均數的比較時,主要原理是將全體樣本在依變項的得分的變異情形,就「源自於自變項影響的變異」和「源自於誤差的變異」兩個部份分別計算。 也就是把總變異量拆解成自變項效果(組間效果)和誤差效果,兩個部份,再加以比較。

(2-4)2+ (3-4)2+ (1-4)2+ (6-4)2+ (7-4)2+ (5-4)2=28 Group 1 Group 2 Observation 1 Observation 2 Observation 3 2 3 1 6 7 5 Mean Sums of Squares (SS) 2 2 6 2 Overall Mean Total Sums of Squares  4 28 (2-2)2+ (3-2)2+ (1-2)2=2 (2-4)2+ (3-4)2+ (1-4)2+ (6-4)2+ (7-4)2+ (5-4)2=28 total SS (28) 可以分成兩部份 一為組內變異(within-group variability) (2+2=4) 二為平均數不同所造成的變異 (28-(2+2)=24). MAIN EFFECT SS  df  MS F p Effect Error 24.0 4.0 1 4 24.0 1.0 24.0   .008

SS Error and SS Effect the within-group variability (SS) is usually referred to as Error variance. This term denotes the fact that we cannot readily explain or account for it in the current design. the SS Effect we can explain. Namely, it is due to the differences in means between the groups. Put another way, group membership explains this variability because we know that it is due to the differences in means.

ANOVA comparison of the variance between- groups variability (called Mean Square Effect, or MSeffect) within- group variability (called Mean Square Error, or Mserror) the null hypothesis:that there are no mean differences between groups in the population compare those two estimates of variance via the F test, which tests whether the ratio of the two variance estimates is significantly greater than 1.

T test vs. anova total variance T test: experiment or gender   Experimental Group 1 Experimental Group 2 Males     2 3 1 6 7 5 Mean 2 6 Females     4 5 3 8 9 7 4 8 total variance error (within-group) variability variability due to experimental group membership variability due to gender T test: experiment or gender Anova: experiment x gender interaction

Main effects, two-way interaction   Achievement- oriented Achievement- avoiders Challenging Test Easy Test 10 5 5 10 challenging tests make students work harder? achievement-oriented students work harder than achievement- avoiders? challenging tests make only achievement-oriented students work harder, while easy tests make only achievement- avoiders work harder Main Effects Interaction Effects

Higher order interactions Females Achievement- oriented Achievement- avoiders Challenging Test Easy Test 10 5 5 10 Males 1 6 6 1

檢定平均數間之差異顯著性 因自變項(類別變項)和水準(level)的多寡,而有不同型式之平均數檢定 所謂「因子」指的是自變項

變異數分析家族 自變項的多寡(因子數) 如果研究者所關的是一個自變項(類別變項)對依變項平均數的影響時,所進行的是單因子變異數分析,不管該因子的內含水準有多少個,仍舊稱為單因子變異數分析(one way ANOVA) 如果研究者同時考慮兩個自變項(類別變項),檢定平均數的差異,則稱為二因子變異數分析(two way ANOVA) 如果研究者同時考慮多個自變項(類別變項),同時檢定多個平均數的差異,則稱為多因子變異數分析(factorial analysis of ANOVA)

變異數分析家族 樣本設計 獨立樣本 相依樣本

研究設計 自變項 變異數分析方法 單因子設計 one way ANOVA 二因子設計 two way ANOVA 完全獨立樣本 完全相依樣本 1個 One way ANOVA 相依樣本 (配對樣本或重複量數) 二因子設計 two way ANOVA 完全獨立樣本 2個 two way ANOVA 完全相依樣本 相依與獨立混合 1個獨立,1個相依 two way ANOVA mixed design

多因子變異數分析 研究設計 自變項 變異數分析方法 多因子設計 Factorial ANOVA 完全獨立樣本 完全相依樣本 相依與獨立混合 3個 3 way ANOVA 完全相依樣本 相依與獨立混合 多個獨立,1個相依 3 way ANOVA mixed design

共變分析 ANCOVA Analysis of Covariance 研究者控制某一個連續變項,去除第三變項的混淆效果,以了解自變項對特定連續變項的效果 同樣考慮 自變項多寡(類別變項) 單因子 多因子 樣本設計 獨立 相依

多因子共變設計 Factorial ANCOVA 完全獨立樣本 完全相依樣本 相依與獨立混合 研究設計 自變項 變異數分析方法 單因子共變設計 one way ANCOVA 獨立樣本 1個自變項 1個或多個共變項 One way ANCOVA 相依樣本 1個 (配對樣本或重複量數) 多因子共變設計 Factorial ANCOVA 完全獨立樣本 多個自變項 factorial ANCOVA 完全相依樣本 相依與獨立混合 factorial ANCOVA mixed design

多變量變異數分析,MANOVA Multivariate analysis of variance 依變項數目增加時 一個自變項(類別變項),單因子多變量分析 多個自變項(類別變項),多因子多變量分析

單因子多變量設計 one way MANOVA 獨立樣本 相依樣本 二因子多變量設計 two way MANOVA 完全獨立樣本 研究設計 自變項 變異數分析方法 單因子多變量設計 one way MANOVA 獨立樣本 1個 One way MANOVA 相依樣本 (配對樣本或重複量數) 二因子多變量設計 two way MANOVA 完全獨立樣本 2個 two way MANOVA 完全相依樣本

多因子多變量設計 Factorial MANOVA 完全獨立樣本 Factorial MANOVA 完全相依樣本 研究設計 自變項 變異數分析方法 多因子多變量設計 Factorial MANOVA 完全獨立樣本 3個 Factorial MANOVA 完全相依樣本

多變項共變分析 MANCOVA Multivariate Analysis of Covariance

單因子變異數分析 one-Way ANOVA

單因子變異數分析 檢定數個獨立群體之平均數是否相等的統計方法 單因子變異數分析(one-way ANOVA),是指只有一個自變項的變異數分析。 例如:利用web、email、DM三種廣告方法分析進行新產品的促銷,而分析三種廣告方法的差異(response rate) 廣告方法:自變項,操縱因素

例:甜甜圈在調理過程中,使用不同的食用油,是否會使甜甜圈吸收不等量的油脂? 食用油:花生油、葵花油、豬油(類別) 不飽和脂肪(花生油、葵花油) 飽和脂肪(豬油) 油脂吸收量(連續) 例2:不同學域的學生對資訊素養目標之看法(Q10) 學域:人文、社會、自然、工程、醫學(5 level 類別) 資訊素養目標(量尺 連續)

單因子變異數分析 變異數分析所檢驗的虛無假設是:所有樣本所來自之母群體之平均數都相等。 虛無假設: H0:1=2=3=……=k 對立假設: 1、2 、 3 、 …… 、 k 至少有一個不等 拒絕虛無假設,則表示對立假設可以成立,換句話說,至少有一個平均數是和其他平均數有顯著差異。至於顯著差異狀況到底存在於那些平均數之間,這是變異數分析完成之後,需要進一步進行事後追蹤的。

組間變異 vs. 組內變異 變異數分析的根據是將實驗處理中所獲得的資料的變異狀況,分為兩個來源 組間的變化 組內的變化 Variance between/among groups的 組間變異數:組與組之間有系統差異,是可以用實驗處理效果來解釋的 Web組與DM組對廣告效果的影響 組內的變化 Variance within groups 組內變異數:是個體之間的隨機差異,是與實驗處理無關的,而且事實上一定會存在的,即使完全沒有做任何實驗處理,隨機取樣所得到的組內單位個體之間仍然會有差異存在。 樣本組間變異數愈大大(相對於組內變異數),拒絕虛無假設的機率也愈高。所以變異數分析是利用樣本組間與組內的變異數的比值來做為拒絕虛無假設與否的根據。

Xij= +j+ij 每個觀察值Xij可分成3個來源 Xij :在第j組內的第I個人的資料數值 j:是Xij所在j組的平均數與全體平均數之差異部份,即j= j- ,代表組與全體之間的平均數之差異量,一般通稱為特殊效果(special effect)或是實驗處理效果( treatment effect),凡在該組內的個體都有接受到此項效果。但是,並不是所有接受到該組特殊效果的個體所得到的觀察值都完全相同,在同一組內的個體仍有實驗處理效果所無法完全解釋的個別差異因素存在,即為第3部分:

因此, Xij的總變異來源可以分割為兩部份: ij:該組內的隨機個別差異,亦即Xij異於j的部份,即ij = Xij - j 因此, Xij的總變異來源可以分割為兩部份: 各組平均數與總平均數之間的變異組內隨機差異的變異

單因子ANOVA的類型 獨立樣本 相依樣本 統計檢定時需考慮是否為平衡設計 平衡設計:各組觀察值均相等 例:web、email、DM各找100位受試者

ANOVA的假設 在線性模式中的ij為常態分配 各組之ij所來自之母群體中變異數均相等 殘差(residual )分配 可用下列方式判斷殘差值是否為一常態分配中所得之樣本 將殘差值歸類,使用2適合度檢定 SAS PROC Univariate之plot和normal兩個選項 各組之ij所來自之母群體中變異數均相等 變異數同質性檢定

輕微至中等程度地違反常態分配假設並無顯著影響,但會影響統計檢定力。 在平衡設計中,變異數不同,也不會顯著影響統計推論 若樣本數目有顯著差別時,違反變異數同質性的檢定,對實驗處理結果會有重大的影響

單因子變異數分析 程序1 程序2 分析 比較平均數法單因子變異數分析(one-way ANOV) 單因子變異數分析 分析一般線性模式單變量 單因子變異數分析 +多因子變數分析、迴歸分析、共變量分析

上述ANOVA表顯示,檢定組別平均數之p-value=. 435,因此在=

學院 vs. 利用圖書館網站頻率 分析比較平均數單因子變數分析

變異數分析的每個組別都是取自常態母群體的獨立隨機樣本。雖然資料應該是對稱的,但是變異數分析不受偏離常態性的影響。但是各組別應該來自具相等變異數的母群體。若要檢定這個設設,可使用 Levene 的變異數同質性檢定。 顯著,表示變異數不同質,後續Post-hoc 檢定時,應選擇適當的分析程序

上述變異數分析表顯示,檢定組別平均數之F值為5. 192, p值為. 000,因此在顯著水準為. 05的情形下,顯著性為. 000< 使用者的學院別對圖書館網站利用頻率有顯著差異(F=5.192, df=11, p<.001)

顯著檢視平均數,了解變異來源 Post-hoc test 變異數同質:假設相同的變異數 變異數不同質:未假設相同的變異數

Post-hoc test 當變異數分析,判斷平均數之間的確存有差異之後,post hoc 全距檢定和成對多重比較可以決定到底是那些平均數不一樣。 全距檢定:判斷那些是等值平均數的均勻子集 成對多重比較:檢定每對平均數之間的差異,並且產生一個矩陣。 該矩陣以星號代表顯著不同的組別平均數,其 alpha 水準為 .05。

Post-hoc多重比較檢定方法 Tukey Bonferroni t procedure Scheffe檢驗法 是最誠實顯著性差異檢定 僅適用於各組樣本數均相等時 Bonferroni t procedure 各組樣本數相等或不相等時,均可使用 又稱Dunn’s procedure Scheffe檢驗法 極端保守,一般咸信,只要經過Scheffe法檢驗出的顯著效果,這樣的效果一定存在。 社會科學的研究經常使用 由於此法極度保守(統計檢定力極低),一般僅在比較數目龐大時使用,若僅為二、三個平均數比較,使用Scheffe法來做檢驗並非明智之舉

Post-hoc多重比較檢定方法 Dunnett 事前比較法 研究目的是要將各種不同的實驗處理組與控制組做配對比較,例web、email、DM三種廣告方法和控制組,若欲將控制組以外的三種廣告方法兩兩比較

由事後檢定可知,文學院與社科院和管院有顯著差異,到底差在那裏呢?由描述性統計量可知,社科院和管院之平均數均比文院高,顯示社科院和管院學生利用圖書館網站頻率顯著高於文院。

平均數圖

ANOVA 平均數有顯著差異差在那裏(事後檢定組別) 差多少(描述性統計) 多組類別變數與連續變數之平均數差異 程序:分析比較平均數單因子變異數分析選項:描述性統計量+變異數同質性檢定 顯著事後檢定 視變異數同質性顯著與否,選用不同檢定方法 界定顯著組別 顯著描述統計量之平均數顯著趨勢 平均數有顯著差異差在那裏(事後檢定組別) 差多少(描述性統計)

ANOVA結果呈現 如果只要呈現單一變項的分析,不需要製作統計表,只要在正文中說明平均數、標準差和ANOVA檢定結果即可。 One-way ANOVA同時檢定多項自變項時,始需製作表格 “Play It Safe” Table Degree of freedom Sums of squares Mean squares F ratios

Example 1 Independent variable Dependent variable 每組各40名員工 Coworker program:由同事上3天課,加上手冊 Consultant program:由外聘講師上3天課,加上手冊 Self-program:給手冊自學3天 Dependent variable Job performance:7點量表,由員工上司評分 每組各40名員工

表中畫底線的部分,應該用斜體

Example 2 Independent variable 每組各3000名員工 Dependent variable:7 Coworker program:由同事上3天課,加上手冊 Consultant program:由外聘上3天課,加上手冊 Self-program:給手冊自學3天 每組各3000名員工 Dependent variable:7 Job performance:7點量表,由員工上司評分 Organizational commitment Job commitment Job satisfaction Turnover intention Job stress Role ambiguity

先呈現平均數和標準差

彙整7項ANOVA檢定 是”Play It Safe” table

與前一張表之差異在:省略自由度一欄,與F值合併呈現 彙整7項ANOVA檢定 是”Play It Safe” table

結合描述性統計與ANOVA F ratios