Analysis of Variance (二)

Slides:



Advertisements
Similar presentations
20-Opening 統計學 授課教師:楊維寧 10Simple-R-Commands.
Advertisements

第二週課程介紹 第三週 單因子實驗統計原理 與實務案例 第四週 單因子實驗人工統計實作 與 SPSS 操作 第五週 學習成效及時檢測 ( 紙筆測驗與上機測驗 ) 第六週 雙因子實驗統計原理 與實務案例 第七週 雙因子實驗人工統計實作 與 SPSS 操作 第八週 學習成效及時檢測 ( 紙筆測驗與上機測驗.
單元九:單因子變異數分析.
實驗規劃--實驗因子設定, 效標選定與受測者選定
第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
关于中文字体辨识度的探究实验 让你看清楚PPT 钱翔、王洋、冒星阳、张芸、刘娜、郭艾利.
Measures of location and dispersion
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
變異數分析 (Analysis-of-Variance簡稱ANOVA)
医学统计学 Medical Statistics.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第三章 隨機變數.
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
Chapter 8 Liner Regression and Correlation 第八章 直线回归和相关
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
單因子實驗 設計 (Single­factor experiments)
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
Analysis of Variance 變異數分析
Population proportion and sample proportion
Descriptive statistics
型II誤差機率的計算 Calculating Type II Error Probabilities
第 14 章 複迴歸與相關分析.
實 驗 研 究 法 多因子實驗設計 指導老師:黃萬居教授 學生:陳志鴻 m
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
Using EXCEL for ANOVA.
Analysis of Variance (一)
第七章 SPSS的非参数检验.
Continuous Probability Distributions
第 5 章 樣本資料的數值分布.
Properties of Continuous probability distributions
Sampling Theory and Some Important Sampling Distributions
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
簡單迴歸模型的基本假設 用最小平方法(OLS-ordinary least square)找到一個迴歸式:
用于计算智能研究 和人类主观测试的 统计检验 Hideyuki TAKAGI 日本 九州大学
變異數分析 12.1基本概念 12.2一因子變異數分析(完全隨機化設計) 12.3數個平均數的多重比較
第 13 章 實驗設計與變異數分析.
統計學: 應用與進階 第14 章: 變異數分析.
Test for difference among the means: t Test
Interval Estimation區間估計
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
十、變方分析 (Analysis of Variance) (Chapter 10)
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
方差分析 方差分析的概念 单因素方差分析 有交互作用的双因素方差分析 无交互作用的双因素方差分析.
第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析.
抽樣分配 Sampling Distributions
相關統計觀念復習 Review II.
Design and Analysis of Experiments Final Report of Project
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
自我介紹 羅啟倫 學歷: 經歷: 東華大學 電機工程系
第八章 均值比较与检验 2019/5/10.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第7章 基本统计分析 2019/5/14.
何正斌 博士 國立屏東科技大學工業管理研究所 教授
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
SAS 統計程序實作 PROC GLM 變異數分析 (PROC ANOVA)
实习二 方差分析 流行病与卫生统计学系
Gaussian Process Ruohua Shi Meeting
SAS 統計程序實作 PROC MEANS (一個母體)
Presentation transcript:

Analysis of Variance (二) 變異數分析(二) Analysis of Variance (二)

學習目標 1. 因子實驗設計(factorial design) 2. 解說因子間的交互作用項 2. 解說因子間的交互作用項 3. 兩因子變異數分析analysis of variance (ANOVA) 4. ANOVA假設之檢驗 常態分配之檢驗 變異數一致性之檢驗 As a result of this class, you will be able to ...

實驗設計與資料分析 實驗設計: 由研究者設定條件後, 執行實驗以觀察結果是否受該條件之影響 設定條件稱為「處理」方式(treatments) 同類型處理方式稱為一個「因子」(factor) 每因子內之處理方式亦稱為「水準」(levels) 變異數分析: 檢定不同處理對實驗結果產生的差異或效應

各種實驗設計

實驗設計專有名詞 1. 實驗單位(experimental units/subjects) 2. 處理(treatments): 實驗中所設定或選取之條件 3. 控制因子(factors): 由數種處理或水準組成 4. 處理效應(effect): 每一種處理對實驗結果產生之影嚮 5. 觀測結果(observations)

實驗設計三原則 1. 隨機(randomization)取樣 2. 複製(replications)樣本 3. 區集(blocking)技巧 不同實驗模型,設計不同隨機方式取得樣本 2. 複製(replications)樣本 在相同處理下, 重複實驗以取得的重複樣本 3. 區集(blocking)技巧 在不同處理下選取同質性高之實驗單位 實驗中,僅處理方式不同外,其它因素無法影嚮實驗結果

多因子實驗設計 1.實驗中使用兩個或以上的因子(factors) 2. 實驗單位隨機指派到不同處理 每一個因子有2個以上的水準(levels) 2. 實驗單位隨機指派到不同處理 任何水準之組合(level combination)成為一個處理 3. 主效應(main effect)﹕各別因子之效應 4. 交互(interact)效應﹕因子之間交互效應 5. 使用ANOVA分析檢定交互效應及主效應之不同與否

多因子實驗設計的優點 1. 節省時間並可了解每單一因子的主要影響或主要效應(main effects) 2. 引進多因子變數模型,可控制混淆影響(confounding effects) 3. 可檢測各個因子之間的交互作用(interaction effects)

兩因子實驗設計範例 J J J J J J L L L L L L 因子2 ( 訓練方式) 因子 Level 1 Level 2 水準 J J J Level 1 19 hr. 20 hr. 22 hr. (高) J J J 因子 1 11 hr. 17 hr. 31 hr. ( 動機 ) L L L Level 2 27 hr. 25 hr. 31 hr. (低) L L L 29 hr. 30 hr. 49 hr.

兩因子變異數分析 Two-Way ANOVA 9 17

圖示兩因子反應變數圖 第一種狀況 兩條反應線重疊且平行於X軸 A因子對於反應變數無效應 B因子對於反應變數無效應

圖示兩因子反應變數圖(續) 第二種狀況 兩條反應線平行且平行於X軸 A因子對於反應變數有效應 B因子對於反應變數無效應

圖示兩因子反應變數圖(續) 第三種狀況 兩條反應線重疊但不平行於X軸 A因子對於反應變數無效應 B因子對於反應變數有效應

圖示兩因子反應變數圖(續) 第四種狀況 兩條反應線平行但不平行於X軸 A因子對於反應變數有效應 B因子對於反應變數有效應

圖示兩因子反應變數圖(續) 第四種狀況 兩條反應線平行但不平行於X軸 A因子對於反應變數有效應 B因子對於反應變數有效應

圖示兩因子反應變數圖(續) 第四種狀況 兩條反應線平行但不平行於X軸 A因子對於反應變數有效應 B因子對於反應變數有效應

圖示兩因子反應變數圖(續) 第五種狀況 兩條反應線不平行 A B兩因子間有交互作用 A因子對於反應變數有效應 B因子對於反應變數有效應

什麼是交互作用項? 欲解釋A因子的效應需透過B因子的水準 如:在B1下A2-A1=2 在B2下A2-A1=5 在B3下A2-A1=8

圖示兩因子反應變數圖(續) 第五種狀況 兩條反應線不平行 A B兩因子間有交互作用 A因子對於反應變數有效應 B因子對於反應變數有效應

圖示兩因子反應變數圖(續) 第五種狀況 兩條反應線不平行 A B兩因子間有交互作用 A因子對於反應變數有效應 B因子對於反應變數有效應

圖示兩因子反應變數圖(續) 第五種狀況 兩條反應線不平行 A B兩因子間有交互作用 A因子對於反應變數有效應 B因子對於反應變數有效應

Xijk 兩因子實驗資料列表 因素 B 因素A 1 2 ... c 1 X X ... X X X ... X 2 X X ... X X 111 121 1c1 X X ... X 112 122 1c2 因素A之水準 i 2 X X ... X 211 221 2c1 X X ... X 212 222 2c2 因素B之水準 j : : : : : r X X ... X r11 r21 rc1 X X ... X r12 r22 rc2 水準組合稱為Cell

兩因子ANOVA之理論 xijk代表觀測值必須是連續變數 xijk = µ + Ai + Bj + ABij + Ijk 1. 模式(model) ﹕ xijk代表觀測值必須是連續變數 x值=總平均+A因素主效應+B因素主效應+交互效應+誤差項 xijk = µ + Ai + Bj + ABij + Ijk (A因子水準 i=1, …,r ﹔B因子水準 j=1, …, c ; 樣本數 k=1, …,n’ )

Xijk 兩因子實驗資料列表 因素 B 因素A 1 2 ... c 1 X X ... X X X ... X 2 X X ... X X 111 121 1c1 X X ... X 112 122 1c2 因素A之水準 i 2 X X ... X 211 221 2c1 X X ... X 212 222 2c2 因素B之水準 j : : : : : r X X ... X r11 r21 rc1 X X ... X r12 r22 rc2 水準組合稱為Cell

兩因子ANOVA之理論(續) ijk ~ N(0, 2) , ijk independent ijk 2. 假設條件(assumptions)﹕ 誤差項為常態機率分配,期望值為0 ﹔誤差值之間獨立 ijk ~ N(0, 2) , ijk independent ijk 2須要估計 誤差項以上的假設條件, 必須正式以統計量檢定, 或以殘差分析檢查其是否符合

兩因子變異數分析 總變異量的分割 Total Variation 總變異量SS(Total) 因為A因子水準間差異所產生的變異量Variation due to Treatment A (SSA) 因為B因子水準間差異所產生的變異量Variation due to Treatment B(SSB) 因為A、B因子水準間交互所產生的變異量 Variation due to AB Interaction (SSAB) 因為隨機樣本取樣間差異所產生的變異量Variation due to Random Sampling (SSE)

Two-Way ANOVA Total Variation Partitioning

Total Variation

Factor A Variation Sum of Squares Due to Factor A = the difference among the various levels of factor A and the grand mean

Factor B Variation Sum of Squares Due to Factor B = the difference among the various levels of factor B and the grand mean

Interaction Variation Sum of Squares Due to Interaction between A and B = the effect of the combinations of factor A and factor B

Random Error Sum of Squares Error = the differences among the observations within each cell and the corresponding cell means

兩因子ANOVA表 Same as other designs Source of Degrees of Sum of Mean F Variation Freedom Squares Square A 因子 r - 1 SS(A) MS(A) MS(A) (Row) MSE B 因子 c - 1 SS(B) MS(B) MS(B) (Column) MSE AB 交互作用 (r-1)(c-1) SS(AB) MS(AB) MS(AB) (Interaction) MSE Error 誤差 N - rc SSE MSE Same as other designs C. Total 總和 N - 1 SS(Total)

兩因子變異數分析檢定假設 1. A和B因素間無交互作用 H0: ABij = 0 for any (i, j) 1. A和B因素間無交互作用 H0: ABij = 0 for any (i, j) 2. 因素A各水準間平均數無差異 H0: m1.. = m2.. =... = mr.. 3. 因素B各水準間平均數無差異 H0: m.1. = m.2. =... = m.c.

Two-Way ANOVA: The F Test Statistic F Test for Factor A Main Effect H0: 1 .= 2 . = ••• = r . H1: Not all i . are equal Reject if F > FU F Test for Factor B Main Effect H0: 1 = . 2 = ••• =  c H1: Not all . j are equal Reject if F > FU F Test for Interaction Effect H0: ij = 0 (for all i and j) H1: ij  0 Reject if F > FU

總是使用單尾檢定呦Always One-Tail! F-檢定 統計量之臨界值 若是各處理母體間平均數差異大, 則F = MST / MSE » 1. Reject H a Do Not Reject H F F a ( p - 1 , n - p ) 總是使用單尾檢定呦Always One-Tail!

例題﹕店面大小和架上位置的周銷售額 你是銘傳行銷公司的分析師,你想要了解產品在架上不同位置會對產品的銷售產生何種的影響。今隨機抽選了三種大小的店面、配合了四種不同的架位。並選取架位配合店面大小各重複兩店。使用 a = .05,檢定所有各種效應並下結論。 VO-5 SUAVE PERT Alone Group Class

例題 (續二) - 資料展示 83

平均銷售量之交互作用圖

例題 (續三) - ANOVA表(僅展示部份) Source of Degrees of Sum of Mean F Variation Freedom Squares Square A 1,828.09 (店面大小) B 367.447 17.09 (擺設位置) AB 88.91 (交互作用) Error(誤差) 12 21.500 C. Total 3,277.34

例題 (續四) - ANOVA表 Source of Degrees of Sum of Mean F Variation Freedom Squares Square A 3 - 1 = 2 1,828.09 914.045 42.51 (Store size) B 4 - 1 = 3 1,102.34 367.447 17.09 (Shelf loc.) AB 6 88.91 14.818 0.69 (Interaction) Error 12 258.00 21.500 C. Total 23 3,277.34

例題 (續五) - 交互作用(店面與架位) F MS(AB) F* = = 0.69 MSE 1. H0: ABij = 0 (交互效應) 2. Ha: ABij ≠0 3. a = .05 n1 = 6 n2 = 12 4. Critical Value(s): 5. 在Ho的 test statistic: 6. Decision: MS(AB) F* = = 0.69 MSE 在 a = .05下 不拒絕Ho a = .05 結論:並無證據顯示店面與架位有交互作用 F 3.00

例題 (續六) - 主效應(店面) F MS(A) F* = = 42.51 MSE 1. H0: m1.. = m2.. = m3.. 2. Ha: Not all equal 3. a = .05 n1 = 2 n2 = 12 4. Critical Value(s): 5. 在Ho的 test statistic: 6. Decision: MS(A) F* = = 42.51 MSE 在 a = .05下 拒絕Ho a = .05 結論:有充分證據顯示店面大小會影響銷售額 F 3.89

例題 (續七) - 主效應(架位) F MS(B) F* = = 17.09 MSE 1. H0: m.1. = m.2. = m.3. 2. Ha: Not all equal 3. a = .05 n1 = 3 n2 = 12 4. Critical Value(s): 5. 在Ho的 test statistic: 6. Decision: MS(B) F* = = 17.09 MSE 在 a = .05下 拒絕Ho a = .05 結論:有充分證據顯示架位不同會影響銷售額 F 3.49

兩因子ANOVA分析 利用EXCEL 工具 | 資料分析 | 雙因子變異數分析:重複試驗 Example in excel spreadsheet

例題二 J J J J J J L L L L L L 因子2 ( 訓練方式) 因子 Level 1 Level 2 Level 3 水準 19 hr. 20 hr. 22 hr. (高) J J J 因子 1 11 hr. 17 hr. 31 hr. ( 動機 ) L L L Level 2 27 hr. 25 hr. 31 hr. (低) L L L 29 hr. 30 hr. 49 hr.

兩因子ANOVA分析 利用EXCEL 工具 | 資料分析 | 雙因子變異數分析:重複試驗 Example in excel spreadsheet

變異數分析假設之檢定— 殘差分析 Residual analysis

變異數分析的假設 1. 常態假設 (normality) 2. 變異數為同質(homogeneity) 3. 觀測值及誤差項為隨機且獨立的 各母體均為常態分配 2. 變異數為同質(homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立

The Normal Distribution “Bell shaped” Symmetrical Mean, median and mode are equal Interquartile range equals 1.33 s Random variable has infinite range f(X) X  Mean Median Mode

The Mathematical Model

Many Normal Distributions There are an infinite number of normal distributions By varying the parameters  and , we obtain different normal distributions

常態分配之評估 Not all continuous random variables are normally distributed It is important to evaluate how well the data set seems to be adequately approximated by a normal distribution

常態分配之評估(續) (continued) 利用圖表 小中樣本:莖葉圖, 箱型圖 大樣本:直方圖, 折線圖 最常用:常態機率繪圖

常態分配之評估(續) 常態機率繪圖 先將資料排序 計算相對應的標準常態分配的 quantile 值 將相對應的值畫散佈圖 評估是否為一條直線 (continued) 常態機率繪圖 先將資料排序 計算相對應的標準常態分配的 quantile 值 將相對應的值畫散佈圖 評估是否為一條直線

Normal Probability Plot for Normal Distribution 常態分配之評估(續) (continued) Normal Probability Plot for Normal Distribution 90 X 60 30 Z -2 -1 1 2 Look for Straight Line!

常態機率繪圖之狀況 Left-Skewed Right-Skewed Rectangular U-Shaped X X Z Z X X Z 90 90 X 60 X 60 30 Z 30 Z -2 -1 1 2 -2 -1 1 2 Rectangular U-Shaped 90 90 X 60 X 60 30 Z 30 Z -2 -1 1 2 -2 -1 1 2

例題 (續八) – 殘差資料 83

例題 (續九) – 殘差排序 -4.5, -4.0, -3.5, -3.5, -3.5, -3.5, -3.5, -3.0, -3.0, -2.5, -2.5, -1.5, +1.5, +2.5, +2.5, +3.0 +3.0, +3.5, +3.5, +3.5, +3.5, +3.5, +4.0, +4.5

例題 (續十) – quantile 值 求p(N(0,1)<Qi)=i/(N+1) 之Qi 值 -1.7, -1.4, -1.175, -0.95, -0.84, -0.705, -0.58, -0.47, -0.2, -0.1, 0, 0.1, 0.2, 0.47, 0.58, 0.705, 0.84, 0.95, 1.175, 1.4,1.7

例題 (續十一) – 相對應值 -4.5, -4.0, -3.5, -3.5, -3.5, -3.5, -3.5, -3.0, -3.0, -2.5, -2.5, -1.5, +1.5, +2.5, +2.5, +3.0 +3.0, +3.5, +3.5, +3.5, +3.5, +3.5, +4.0, +4.5 -1.7, -1.4, -1.175, -0.95, -0.84, -0.705, -0.58, -0.47, -0.2, -0.1, 0, 0.1, 0.2, 0.47, 0.58, 0.705, 0.84, 0.95, 1.175, 1.4,1.7

例題 (續十二) – 繪圖

常態機率繪圖 利用EXCEL PHStat | Probability Distributions | Normal Probability Plot… Example in excel spreadsheet

例題二 J J J J J J L L L L L L 因子2 ( 訓練方式) 因子 Level 1 Level 2 Level 3 水準 19 hr. 20 hr. 22 hr. (高) J J J 因子 1 11 hr. 17 hr. 31 hr. ( 動機 ) L L L Level 2 27 hr. 25 hr. 31 hr. (低) L L L 29 hr. 30 hr. 49 hr.

例題二:殘差

變異數分析的假設 1. 常態假設 (normality) 2. 變異數為同質(一致性homogeneity) 各母體均為常態分配 2. 變異數為同質(一致性homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立

變異數為同質之檢定 Hartley F-max test Battlet’s test Box subsample test Levene’s test

Hartley F-max test 2 2 Fmax=Smax/Smin Smax 最大的樣本變異數 Smin 最小的樣本變異數 2 2 Fmax=Smax/Smin 2 Smax 最大的樣本變異數 Smin 最小的樣本變異數 F-max分配, 第一自由度 c (處理數) , 第二自由度 n-1(樣本數)

F-max 分配之部份表格 n-1/c 2 3 4 5 6 7 8 9 39.0 87.5 142 202 266 333 403 475 15.4 27.8 39.2 50.7 62.0 72.9 83.5 93.9 9.60 15.5 20.6 25.2 29.5 33.6 37.5 41.1 7.15 10.8 13.7 16.3 18.7 20.8 22.9 24.7 5.82 8.38 10.4 12.1 15.0 17.5

機器裝填的例子 Machine1 Machine2 Machine3 25.40 23.40 20.00 26.31 21.80 22.20 24.10 23.50 19.75 23.74 22.75 20.60 25.10 21.60 20.40 請檢定各個機器的變異數是否相同?

機器裝填的例子(續) 計算結果 機器一之樣本變異數 1.0648 機器二之樣本變異數 0.778 機器三之樣本變異數 0.9205 Fmax=1.0648/0.778=1.1568 C=3, n=5, 查表 Fmax(0.05,3,4)=15.5 ∵1.1568<15.5 ∴不拒絕 H0

變異數分析的假設 1. 常態假設 (normality) 2. 變異數為同質(一致性homogeneity) 各母體均為常態分配 2. 變異數為同質(一致性homogeneity) 各母體的變異數皆相等 3. 觀測值及誤差項為隨機且獨立的 隨機樣本抽選時亦為獨立

獨立性之檢定 必須知道資料觀察的先後順序 用時間序列的方式檢查殘差是否有自我相關性或偏自我相關性 最常用Durbin Watson’s test 無母數方法—利用 Run test 來檢驗獨立性 請參考更深入的變異數分析方法之書籍

違背ANOVA假設之處理 當違背ANOVA假設時 通常會將反應變數做轉換 經常使用的轉換函數為 √, ln, 1/x 或 Box-Cox 轉換 牽涉較深的統計方法 不多述

結論 1. 因子實驗設計(factorial design) 2. 解說因子間的交互作用項 2. 解說因子間的交互作用項 3. 兩因子變異數分析analysis of variance (ANOVA) 4. ANOVA假設之檢驗 常態分配之檢驗 變異數一致性之檢驗

關於本課程... 請你靜下來想一想並回答下列問題: 1. 你此堂課學到的最重要的觀念為何? 2. 是否還有相關問題與疑問? 1. 你此堂課學到的最重要的觀念為何? 2. 是否還有相關問題與疑問? 3. 如何改善今後的學習? As a result of this class, you will be able to... 70