Presentation is loading. Please wait.

Presentation is loading. Please wait.

第 13 章 實驗設計與變異數分析.

Similar presentations


Presentation on theme: "第 13 章 實驗設計與變異數分析."— Presentation transcript:

1 第 13 章 實驗設計與變異數分析

2 本章內容 13.1 實驗設計與變異數分析介紹 13.2 變異數分析與完全隨機設計 13.3 多重比較程序 13.4 隨機區集設計
13.1 實驗設計與變異數分析介紹 13.2 變異數分析與完全隨機設計 13.3 多重比較程序 13.4 隨機區集設計 13.5 因子實驗

3 13.1 實驗設計與變異數分析介紹 資料蒐集 變異數分析的假設 變異數分析:觀念簡介 第13章 實驗設計與變異數分析 第 頁

4 實驗設計與變異數分析介紹 統計研究可分為實驗型或觀察型兩類。
在實驗型統計研究中,須先界定感興趣之變數,而 後控制研究中另一個或更多個其他因素,即可獲得 這些因素如何影響欲探討變數之資料。 在觀察型的研究中,則不需控制實驗,而是從實地 訪查中取得資料。 在觀察型的研究中,要建立因果關係是有困難的。 實驗型研究則較為容易。 第13章 實驗設計與變異數分析 第 頁

5 實驗設計與變異數分析介紹 因素 (factor) 是一個調查研究中可被實驗者選擇的 變數。
處理 (treatment) 是每一因素的對應方式。 實驗單位 (experimental units) 是實驗中感興趣的主 題。 完全隨機設計 (completely randomized design) 是指 處理被隨機指派的一種實驗設計。 第13章 實驗設計與變異數分析 第457頁

6 實驗設計實例 Chemitech 公司發展出一套新的自來水過濾系統。 該系統的零件必須向數個供應商購買,Chemitech 公司將在位於南卡羅來納州哥倫比亞市的工廠組裝 這些零件。工業工程部門須負責決定此套新過濾系 統的最佳組裝方法。在考慮很多可行的組裝方法後 ,工業工程部門選出三種較佳的方法:方法 A、方 法 B 及方法 C。這些方法在組裝產品的先後順序上 會有所差異。Chemitech 公司的經理希望知道何種 組裝方法可在每週生產數量最多。 第13章 實驗設計與變異數分析 第457頁

7 實驗設計實例 在公司的實驗中,組裝方法被視為是一個自變數或 因素 (factor),因為此因素包含三種組裝方法,我 們稱此實驗有三個處理,每一個處理 (treatment) 對應一種組裝方法。 Chemitech 公司之問題是有關類別因素 (組裝方法) 的單因素實驗(single-factor experiment) 的實例。 其他更複雜的實驗可能包含多個因素,其中有些是 類別因素,有些則是定量因素。 第13章 實驗設計與變異數分析 第457頁

8 實驗設計實例 這三種組裝方法 (或處理) 定義了此次 Chemitech 實 驗中的三個研究母體:第一個母體是使用方法 A 的 所有員工、第二個母體為使用方法 B 的所有員工、 第三個母體則為使用方法 C 的所有員工。對每一個 母體而言,應變數或反應變數 (response variable) 為每週組裝的過濾系統數目。而此次實驗的目的則 是決定三個母體 (方法) 每週之平均產量是否相等。 第13章 實驗設計與變異數分析 第457頁

9 實驗設計實例 假設我們從 Chemitech 公司的所有裝配工人中,任 意選取 3 名員工組成一組隨機樣本,這 3 名員工稱 為實驗單位 (experimental units)。 在 Chemitech 公司之問題中,使用的實驗設計稱為 完全隨機設計 (completely randomized design) 。此 種設計方式要求 3 個實驗單位 (即裝配工人) 均被隨 機指派一種組裝方法 (或處理)。 例如,第二個工人被指定以方法 A 組裝,第一個工 人被指定方法 B,第三個工人則採用方法 C。此例 子中的隨機化 (randomization) 概念是所有實驗設計 的重要原則。 第13章 實驗設計與變異數分析 第457頁

10 實驗設計實例 值得注意的是,在該實驗中,一個處理將只含一個 測量值 ( 即組裝的產品數量) 。為了獲得更多資料 ,我們必須重複上述實驗程序。例如,我們不要一 次只隨機選取 3 名員工,而改為選取 15 名員工, 然後各隨機指派 5 名員工採用某種組裝方式。既然 每種組裝方式都有 5 名員工,我們即可說:重複 5 次實驗。這種重複(replication) 的過程為實驗設計 的另一重要原則。 圖 13.1 說明此次 Chemitech 實驗的完全隨機設計。 第13章 實驗設計與變異數分析 第457頁

11 實驗設計實例 第13章 實驗設計與變異數分析 第458頁

12 實驗設計實例 在 Chemitech 公司的例子中,我們須先指導員工如 何執行所被指派的組裝方法,而後令其使用此種組 裝方法開始組裝新的過濾系統。1 星期內每名員工 組裝的數量、各種組裝方式所生產的產品數量的樣 本平均數、樣本變異數與樣本標準差等如表13.1。 其中使用方法 A的樣本平均數為 62,方法 B 為 66 ,方法 C 則為 52。 就上述資料而言,方法 B 的生產率似乎高於其他兩 種方法。 第13章 實驗設計與變異數分析 第458頁

13 實驗設計實例 第13章 實驗設計與變異數分析 第458頁

14 實驗設計實例 真正的問題是,這三個樣本平均數之差異是否大到 可以使我們下結論,即三種組裝方法之產量不同。 為了以統計名詞表達此問題,我們先介紹下列符號 : μ1=方法 A 平均每週產量 μ2=方法 B 平均每週產量 μ3=方法 C 平均每週產量 雖然我們不可能知道 μ1、μ2 及 μ3真正的值,但我們 可使用樣本平均數檢定下列的假設: H0:μ1= μ2=μ Ha:所有母體平均數不全相等 第13章 實驗設計與變異數分析 第 頁

15 變異數分析介紹 變異數分析 (ANOVA) 能用來分析得自觀察型研究的 資料,以檢定三個或三個以上的母體平均數是否相等。
在分析同時包含實驗型及觀察型資料之迴歸分析結果 時,ANOVA 扮演重要角色。 我們可以使用這些樣本資料的結果進行下列假設檢定: H0: 1=2=3= = k Ha: 所有母體平均數不全相等 第13章 實驗設計與變異數分析 第 頁

16 變異數分析介紹 H0: 1=2=3=. . . = k Ha: 所有母體平均不全相等
第13章 實驗設計與變異數分析 第 頁

17 變異數分析的假設 1. 每個母體之反應變數均呈常態分配。 2. 所有母體反應變數的變異數 σ2 均相等。
3. 由每個母體抽取之樣本必須互為獨立。 第13章 實驗設計與變異數分析 第459頁

18 變異數分析介紹 第13章 實驗設計與變異數分析 第460頁

19 變異數分析介紹 第13章 實驗設計與變異數分析 第460頁

20 變異數分析介紹 每一組樣本之樣本內差異也將影響變異數分析的結 論。當由每個母體中抽取一組隨機樣本時,每一組 的樣本變異數均應為共同變異數 σ2 的不偏估計值。 因此,我們將結合共同變異σ2 的每個個別估計值, 成為一個總樣本估計值。以此方式獲得的母體變異 數 σ2 的估計值稱為 σ2 之混合或處理內估計值 (pooled or within-treatments estimate)。 由於 σ2 之處理內估計值乃是每組樣本組內變異所 計算而得的樣本變異數,故不受母體平均數是否相 等之影響。當樣本大小相等時,σ2 之處理內估計值 可由計算各個樣本變異數之平均數而得。 第13章 實驗設計與變異數分析 第 頁

21 變異數分析實例 在 Chemitech公司的例子中,我們可得
σ2 的處理間估計值 (260) 遠大於處理內估計值 (28.33),事實上,這兩個估計值之比為 260/28.33 =9.18。 第13章 實驗設計與變異數分析 第461頁

22 變異數分析介紹 只有當虛無假設為真時,處理間估計值方為 σ2 的 一個好的估計值;若虛無假設為偽,處理間估計值 將高估 σ2 。但處理內估計值則不論在何種情況下, 均為共同母體變異數 σ2 的良好估計值。因此,若 虛無假設為真,此兩個估計值應極為接近,它們的 比也應接近 1;如果虛無假設為偽,處理間估計值 應大於處理內估計值,且它們的比應該較大。 第13章 實驗設計與變異數分析 第461頁

23 變異數分析介紹 ANOVA 背後的邏輯乃基於共同母體變異數σ2 的兩 種獨立估計方式發展而成。一種 σ2 的估計方式係 基於各種樣本平均數間之差異計算而得,另一種方 式則由每組樣本的組內變異數計算而得。藉由比較 上述兩個 σ2 的估計值,我們將可決定母體平均數 是否相等。 第13章 實驗設計與變異數分析 第461頁

24 評註 實驗設計的隨機化與觀察型研究之機率抽樣在本 質上是相似的。
在許多醫藥實驗中,雙盲實驗設計可消除許多潛 在誤差。在此類設計中,醫生與病患均不知用了 何種處理。此類設計亦適用於許多其他類型的實 驗。 第13章 實驗設計與變異數分析 第461頁

25 評註 本節中,我們介紹在完全隨機實驗設計中,如何 使用變異數分析進行 k 個母體平均數是否相等的 檢定,這些程序亦可適用在觀察型或非實驗型的 研究上。 在 10.1 節及 10.2 節中,我們曾介紹用以檢定兩 母體平均數相等之假設的統計方法。ANOVA 亦 可用來檢定兩母體平均數相等之假設。然而,在 實務運用上,變異數分析通常只用來檢定三個或 三個以上母體平均數相等的假設。 第13章 實驗設計與變異數分析 第461頁

26 13.2 變異數分析與完全隨機設計 母體變異數之處理間估計值 母體變異數之處理內估計值 比較變異數之估計值:F 檢定 ANOVA 表
變異數分析之電腦結果 檢定 k 個母體平均數是否相等:一個觀察型的實例 第13章 實驗設計與變異數分析 第 頁

27 變異數分析 變異數分析可以用來檢定 k 個母體平均數是否相等。 其假設檢定之一般形式為 H0: 1=2=. . . = k
Ha: 所有母體平均數不全相等 其中 j = 第 j 個母體平均數 第13章 實驗設計與變異數分析 第461頁

28 變異數分析 樣本資料 = 第 j 個處理的第 i 個觀察值 = 第 j 個處理的觀察值個數 = 第 j 個處理的樣本平均數
第13章 實驗設計與變異數分析 第462頁

29 變異數分析 第 j 個處理的樣本平均數公式: 第 j 個處理的樣本變異數公式: 第13章 實驗設計與變異數分析 第462頁

30 變異數分析 總樣本平均數 其中 nT = n1 + n2 +. . . + nk 如果每組樣本數均為 n,則 n = kn
第13章 實驗設計與變異數分析 第462頁

31 檢定 k 個母體平均數是否相等 (Chemitech公司實例)
第13章 實驗設計與變異數分析 第462頁

32 母體變異數之處理間估計值 處理間平方和 (sum of squares due to treatments),記 作 SSTR。
處理間均方 (mean square due to treatments),記作 MSTR。 第13章 實驗設計與變異數分析 第463頁

33 母體變異數之處理間估計值 2 的處理間估計值,稱為處理間均方 (mean square due to treatments),記作 MSTR,計算 MSTR 的公式如下: 處理間平方和(sum of squares between treatments或sum of squares due to treatments),記作 SSTR k − 1 為 SSTR 的自由度 第13章 實驗設計與變異數分析 第463頁

34 母體變異數之處理間估計值 (Chemitech 公司實例)
若 H0 為真,則 MSTR 為 σ2 的不偏估計值。 當 k 個母體平均數不相等時,MSTR 將不再是 σ2 的不偏估 計值。事實上,此時 MSTR 將高估 σ2 。 由表 13.1 Chemitech 公司的資料,我們可得到下列的結果。 第13章 實驗設計與變異數分析 第463頁

35 母體變異數之處理內估計值 誤差平方和 (sum of squares due to error),記作 SSE。
誤差均方 (mean square due to error),記作 MSE。 分母 nT − k 為SSTR 的自由度 第13章 實驗設計與變異數分析 第463頁

36 母體變異數之處理內估計值 (Chemitech 公司實例)
MSE 來自於每個處理內的差異,它不會受虛無假設是否為 真的影響。因此,MSE 恆為 σ2 的一不偏估計值。 由表 13.1 Chemitech 公司的資料,我們可以得到下列的結果。 第13章 實驗設計與變異數分析 第 頁

37 比較變異數之估計值:F 檢定 若虛無假設為真且 ANOVA 之假設均成立, MSTR/MSE 的抽樣分配將會服從分子自由度為 k − 1,分母自由度為nT − k 的 F 分配。換言之, 若虛無假設為真,MSTR/MSE 的值會是從此 F 分 配抽樣而得的結果。 若虛無假設為假,則因 MSTR 高估 σ2, MSTR/MSE 的值將提高。 因此,當 MSTR/MSE 的值太大,使其不似來自分 子自由度為 k − 1,分母自由度為nT − k 的 F 分配時 ,我們將拒絕 H0。 第13章 實驗設計與變異數分析 第464頁

38 比較變異數之估計值:F 檢定 假設檢定 檢定統計量 H0: 1=2=. . . = k Ha: 所有母體平均數不全相等
F = MSTR/MSE 第13章 實驗設計與變異數分析 第 頁

39 比較變異數之估計值:F 檢定 拒絕法則 p 值法: 絕對值法: 若 p 值 ≤ α,則拒絕 H0 若 F ≥ Fα,則拒絕 H0
其中 Fα 值係由分子自由度 k − 1 ,分母自由度 nT – k 之 F 分配查表而得。 第13章 實驗設計與變異數分析 第 頁

40 比較變異數之估計值:F 檢定 (Chemitech 公司實例)
若使用顯著水準 α =0.05 來進行假設檢定,則檢定 統計量的值 其分子自由度為 k − 1=3 − 1=2,分母自由度為 nT − k=15 − 3=12。由於我們只在檢定統計量的值夠 大時,才會拒絕虛無假設,因此 p 值為 F 分配在檢 定統計量 F=9.18 的右尾區域的面積值。 圖13.4為 F=MSTR/MSE 的抽樣分配、檢定統計量 的值及此假設檢定右尾區域的 p 值。 第13章 實驗設計與變異數分析 第464頁

41 比較變異數之估計值:F 檢定 (Chemitech 公司實例)
第13章 實驗設計與變異數分析 第465頁

42 比較變異數之估計值:F 檢定 (Chemitech 公司實例)
查附錄 B 的表 4,分子自由度為 2、分母自由度為 12的 F 分配,其右尾區域的範圍如下。 由於 F=9.18 大於 6.93,因此 F=9.18的右尾面積會小於 0.01,亦即 p 值小於 0.01。因為 p 值 ≤ α=0.05,所以拒絕 H0。 此檢定提供充分的證據顯示三個母體平均數不相等。換言 之,變異數分析支持 Chemitech 公司三種組裝方法每周產量 的母體平均數不全相等之結論。 第13章 實驗設計與變異數分析 第 頁

43 比較變異數之估計值:F 檢定 (Chemitech 公司實例)
我們也可以使用臨界值法進行此假設檢定的程序。 假設 α=0.05,在自由度為 2 與 12 的 F 分配,其右 尾區域的面積為 0.05 處,可找到臨界 F 值,查 F 分配表,可得 F0.05=3.89。因此,Chemitech 公司 的例子,其右尾拒絕法則為 若 F ≥ 3.89,則拒絕 H0 由於 F=9.18,因此拒絕 H0,結論為三個母體的平 均數不全相等。 第13章 實驗設計與變異數分析 第465頁

44 ANOVA表 變異數 平方和 自由度 均方 F p 值 處理 誤差 總和 SSTR SSE SST k − 1 nT − k nT − 1
MSTR MSE MSTR/MSE SST 的自由度可分解為 SSTR 的自由度與 SSE 的自由度 SST 可以分解為 SSTR 與 SSE 第13章 實驗設計與變異數分析 第 頁

45 ANOVA表 SST 可分解為兩個平方和:處理間平方和與誤差平 方和。SST 之自由度 nT − 1 亦可分解為 SSTR 之自由 度 k − 1 與 SSE 之自由度 nT − k。 若將所有觀察值視為同一組樣本,則總平方和 SST 之計算公式為 第13章 實驗設計與變異數分析 第466頁

46 ANOVA表 我們可將變異數分析視為分割 (partitioning) 總平方和 與自由度為兩種不同來源:處理與誤差的一個過程。
將平方和除以相對應之自由度即為變異數之估計值。 由此得到的 F 值與 p 值可用以檢定母體平均數是否相 等之假設。 第13章 實驗設計與變異數分析 第466頁

47 ANOVA表 (Chemitech 公司實例)
第13章 實驗設計與變異數分析 第466頁

48 變異數分析之電腦結果 第13章 實驗設計與變異數分析 第494頁

49 評註 總樣本平均數可由 k 個樣本平均數之加權平均計 算而得:
若已知各樣本平均數,則使用上述公式計算總樣 本平均數,將較使用式 (13.3) 來得簡單。 第13章 實驗設計與變異數分析 第468頁

50 評註 如果每組樣本均含 n 個觀察值,則式 (13.6) 可改 寫為
我們在 13.1 節介紹 σ2 之處理間估計值的概念時, 亦得到上述的結果。式 (13.6) 乃是將此一結果推 廣至樣本大小不相等的情形。 第13章 實驗設計與變異數分析 第468頁

51 評註 如果每組樣本均含 n 個觀察值,則 nT = kn;故 nT-k = k(n-1),則式 (13.9) 可改寫
換言之,若每組樣本大小相同,則MSE即為k個樣本 變異樹之平均值。我們在13.1節介紹σ2之處理估 計值時,亦得到此結果。 第13章 實驗設計與變異數分析 第468頁

52 13.3多重比較程序 費雪 LSD 型 I 誤差率 第13章 實驗設計與變異數分析 第 頁

53 多重比較程序 假設變異數分析已提供拒絕母體平均數相等之虛 無假設的統計證據。
費雪最低顯著差異 (least significant difference, LSD) 程序可用以決定哪些母體平均數間存在差異。 第13章 實驗設計與變異數分析 第471頁

54 費雪 LSD 程序 假設檢定 檢定統計量 第13章 實驗設計與變異數分析 第 頁

55 費雪 LSD 程序 拒絕法則 其中 tα/2 值係查自由度為 nT – k 之 t 分配表而得。 p 值法: 絕對值法:
若 p 值 ≤ α,則拒絕 H0 絕對值法: 若 t ≤ -tα/2 或 t ≥ tα/2,則拒絕H0 其中 tα/2 值係查自由度為 nT – k 之 t 分配表而得。 第13章 實驗設計與變異數分析 第 頁

56 費雪 LSD 程序實例 利用費雪 LSD 程序檢定在 α=0.05 的顯著水準下,母體 1 (方法A) 與母體 2 (方法B) 之平均數間是否存在顯著差異。 由表 13.1 得知,方法 A 之樣本平均數是 62,方法 B 之樣本 平均數為 66。 表 13.3 則顯示母體變異數之估計值,即 MSE,為 28.33, 其為 σ2 之估計值且對應之自由度為 12。根據 Chemitech 公 司的資料,檢定統計量的值為 第13章 實驗設計與變異數分析 第472頁

57 費雪 LSD 程序實例 查附錄 B 的表 2 可知,自由度 12 的 t 分配表如下所示:
T 分配表只有正的 t 值,但 t 分配是左右對稱,我們可以找 t= 1.19 右尾的面積,此面積的 2 倍即是 t=-1.19 對應的 p 值。當 t =1.19,其面積介於 0.20 與 0.10 之間,將之乘以 2,可知 p 值一 定介於 0.40 與 0.20 之間。 利用 Minitab 或 Excel 可以算出 p 值為0.2571。由於 p 值大於 α = 0.05,我們不能拒絕虛無假設,因此不能下結論為方法 A 母體的 每週平均產量與方法 B 母體的每週平均產量不相等。 第13章 實驗設計與變異數分析 第472頁

58 以檢定統計量 為基礎 之費雪 LSD 程序 檢定統計量 拒絕法則 若 > LSD,拒絕 H0 其中
第13章 實驗設計與變異數分析 第 頁

59 費雪 LSD 程序實例 就 Chemitech 公司之例子而言,LSD 之值為
當樣本大小均相同時,我們只需計算一個 LSD 值。 在此情況下,我們僅需將兩樣本平均數之差異值與 LSD 值進行比較。 第13章 實驗設計與變異數分析 第473頁

60 費雪 LSD 程序實例 例如,母體 1 (方法A) 與母體 3 (方法C) 之平均數 差為 62 − 52=10。由於此值大於 LSD = 7.34,我 們可以拒絕方法 A 與方法 C 之母體每週平均產量 相等之假設。同樣地,由於母體 2 與母體 3 的樣本 平均數差為 66 − 52=14 > 7.34,我們也拒絕方法B 與方法 C 之母體平均數相等之假設。事實上,我們 的結論是方法 A 、方法 B 與方法 C 存在差異。 第13章 實驗設計與變異數分析 第473頁

61 費雪 LSD 程序 使用費雪 LSD 程序估計兩母體平均數差之信賴區 間 其中 ta/2 係查自由度為 nT – k 之 t 分配表而得。
信賴區間包含 0 在內,我們將無法拒絕兩母體平均 數相等之假設。當信賴區間不含 0 時,我們可得到 兩母體平均數確實存在差異之結論。 第13章 實驗設計與變異數分析 第473頁

62 費雪 LSD 程序實例 在Chemitech 公司的例子中,LSD=7.34 (對應 t0.025 =2.179)。
因此,母體 1、母體 2 之平均數差的 95% 信賴區間 估計值為:62 − 66 ± 7.34=−4 ± 7.34= −11.34到 3.34。 由於此一信賴區間包含 0,故無法拒絕此兩母體平 均數相等之假設。 第13章 實驗設計與變異數分析 第473頁

63 型 I 誤差率 比較的型 I 誤差率 (comparisonwise Type I error rate) 即是進行單一的一對母體平均數比較時的顯 著水準。 實驗的型 I 誤差率 (experimentwise Type I error rate) 表示為αEW。 當檢定問題所牽涉之母體數愈多時,實驗的型 I 誤 差率將愈大。 aEW = 1 – (1 – a)(k – 1)! 第13章 實驗設計與變異數分析 第474頁

64 13.4 隨機區集設計 飛航航管員壓力測試 ANOVA 程序 計算與結論 第13章 實驗設計與變異數分析 第477頁

65 隨機區集設計 為檢定不同處理之平均數間是否存在差異,我們使 用下列比率計算 F 值。
當外在因素 (extraneous factors) (非實驗欲探討之變 數) 產生之差異引起上述比率之 MSE 變大時,將會 產生問題。在此情形下,F 值將會變小,故即使處 理間存在差異,亦可能得到處理間沒有顯著差異之 結論。 第13章 實驗設計與變異數分析 第477頁

66 隨機區集設計 隨機區集設計 (randomized block design),此設計 的目的在於藉由控制某些外在的變異來源,消除 MSE 項之誤差。隨機區集設計可提供真正的誤差 變異數之較佳估計值,使假設檢定在探查處理平均 數差異時,變得更具檢定力。 當實驗單位的性質相類似時,可以使用完全隨機的 設計。如果實驗單位的性質互異,則可以區集 (blocking)的方法使其同質化。 第13章 實驗設計與變異數分析 第477頁

67 飛航航管員壓力測試 一項測量飛航航管員的疲累與壓力的研究,建議應 修改並重新設計航管員的工作站。在考量數個工作 站的設計案後,我們選出其中三個可降低航管員壓 力的較佳方案。現在面對的主要問題為:這三個方 案對航管員壓力的影響程度為何?為解答此問題, 我們需先設計一個實驗,以測量在三個設計案下, 航管員的壓力。 第13章 實驗設計與變異數分析 第477頁

68 飛航航管員壓力測試 在完全隨機設計中,我們各指派一組隨機樣本之航 管員至三個不同的工作站設計案。然而,航管員處 理壓力之能力各有差異,對某個航管員而言為高壓 力,對另一個航管員可能只是中度甚至輕度之壓力 。因此,在測量群體內之變異來源 (MSE) 時,我 們必須瞭解此變異可能包含隨機誤差與個別航管員 之差異兩部分。事實上,航管員之個別差異可能是 構成 MSE 之主要部分。 第13章 實驗設計與變異數分析 第 頁

69 飛航航管員壓力測試 分離出航管員個別差異的一種方法即為隨機區集設 計。此設計乃先界定航管員個人差異造成之變異, 而後設法將其自 MSE 項中分離出來。隨機區集設 計乃先隨機抽取一組樣本,然後將樣本內每位航管 員均置於三個工作站設計案中各做一次測試。以實 驗設計之術語而言,工作站被稱為欲探討之因素 (factor of interest),航管員則稱為區集 (blocks),工 作站因素的三個處理 ( 母體) 即對應至三個工作站 設計案。為了簡化起見,我們稱三個工作站設計案 為系統 A、系統 B 及系統 C。 第13章 實驗設計與變異數分析 第478頁

70 飛航航管員壓力測試 隨機區集設計中,隨機 (randomized) 一詞意指航管 員樣本以「隨機次序」被安排至不同處理 (系統)。 如果每個航管員均依照相同次序分別在三個系統進 行測試,則觀察到的差異可能並非因系統差異所致, 而係導因於受測次序。 為得到所需資料,我們在俄亥俄州克利夫蘭控制中 心設置三種不同的工作站。並隨機選取 6 名航管員, 均輪流至三個工作站工作。我們以追蹤訪談 (follow-up interview) 及醫學檢驗方式測量 6 名航管 員在每個系統的壓力值,所得到的資料如表 所示。 第13章 實驗設計與變異數分析 第478頁

71 飛航航管員壓力測試 第13章 實驗設計與變異數分析 第478頁

72 飛航航管員壓力測試 表 13.6 為壓力資料之彙整。表中包含行總和 (處理) 與列總和 ( 區集),以及有助 ANOVA 程序中平方和 計算之樣本平均數。壓力值愈低愈好,樣本資料顯 示系統 B 較佳,因其平均壓力值僅 13 。然而,我 們的問題依然是:這些抽樣結果可使我們得到三個 系統之平均壓力值存在差異之結論嗎?亦即,這些 差異具統計上的顯著性嗎?我們曾在完全隨機設計 中使用的變異數分析可用以回答此一統計問題。 第13章 實驗設計與變異數分析 第478頁

73 飛航航管員壓力測試 第13章 實驗設計與變異數分析 第478頁

74 ANOVA 程序 隨機區集設計之 ANOVA 程序將總平方和 (SST) 分 割為三部分:處理間平方和、區集造成的平方和及 誤差平方和,公式如下: ANOVA 表亦顯示總自由度 nT − 1 為處理之自由度 k − 1、區集之自由度 b − 1 及誤差項之自由度 (k − 1)(b − 1) 之和。 SST = SSTR + SSBL + SSE 第13章 實驗設計與變異數分析 第479頁

75 ANOVA 程序 第13章 實驗設計與變異數分析 第479頁

76 計算與結論 為計算用以檢定隨機區集設計中處理平均數間差異 的 F 統計量,我們需先計算 MSTR 與 MSE。為得 MSTR 與 MSE,則必須先計算 SSTR 與 SSE,然而 算出SSTR 與 SSE 前尚須計算 SSBL、SST。 除先前定義的 k、b、nT 外,我們再使用下列符號 : = 區集 i 中第 j 個處理的觀察值 = 第 j 個處理的樣本平均數 = 第 i 個區集的樣本平均數 = 總樣本平均數 第13章 實驗設計與變異數分析 第479頁

77 計算與結論 為簡化起見,我們分四步驟執行上列計算。 步驟1. 計算總平方和 (SST) 步驟2. 計算處理間平方和 (SSTR)
第13章 實驗設計與變異數分析 第 頁

78 計算與結論 為簡化起見,我們分四步驟執行上列計算。 步驟3. 計算區集造成的平方和 ( SSBL )
步驟4. 計算誤差平方和 ( SSE )  第13章 實驗設計與變異數分析 第480頁

79 隨機區集設計實例 就表 13.6 中飛航航管員之資料而言,上述步驟所 得之值如下:
步驟1. SST = (15-14)2+(15-14)2 +(18-14)2 + ··· +(13-14)2 = 70 步驟2. SSTR = 6[(13.5-14)2 +(13.0-14)2 +(15.5-14)2] = 21 步驟3. SSBL = 3[(16-14)2 + (14-14)2 +(12-14)2 + (14-14)2 + (15-14)2 + (13-14)2 ] = 30 步驟4. SSE = 70-21-30 = 19 第13章 實驗設計與變異數分析 第480頁

80 隨機區集設計實例 上述之平方和各除以對應之自由度,則得表 的均方值。 第13章 實驗設計與變異數分析 第480頁

81 評註 隨機區集設計會因 b 個區集而失去 b − 1 個自由度 ,此導致其誤差的自由度會比完全隨機設計時的自 由度來得少。當 n 小時,區集的潛在效果會因誤差 自由度的失去而被掩蓋;當 n 大時,此效果會最小 。 第13章 實驗設計與變異數分析 第481頁

82 13.5因子實驗 ANOVA 程序 計算與結論 第13章 實驗設計與變異數分析 第 頁

83 因子實驗 一些實驗中,我們需對一個以上的變數或因素做出 統計結論。
當我們要同時對兩個或兩個以上因素做出結論時, 因子實驗 (factorial experiments) 及其對應的 ANOVA 計算程序將為極具價值的設計。 我們之所以使用因子 (factorial) 一詞乃因實驗條件 包含這些因素之所有可能的組合。 例如,若因素 A 含 a 個水準 (level),因素 B 含 b 個 水準,則此實驗即需要蒐集 ab 個處理組合之資料。 第13章 實驗設計與變異數分析 第483頁

84 因子實驗實例 以管理碩士入學測驗 (Graduate Management Admissions Test, GMAT) 之研究為例,說明兩因素之因子實驗。 GMAT 之分數由 200 分至 800 分,分數愈高表示才能 愈佳。 為了提高學生的 GMAT 成績,一所德克薩斯州的大學 正考慮開設以下三種 GMAT 準備課程。 針對 GMAT 之考題類型的 3 小時複習課程。 包含複習相關考試內容與模擬測驗,為期 1 天的課程。 針對各個學生的缺點,設計 10 週的密集加強課程。 第13章 實驗設計與變異數分析 第483頁

85 因子實驗實例 因此,此研究的一個因素是「GMAT 準備課程」, 其中包含 3 個處理:3 小時複習、1 天課程及 10 週 課程。在選擇該採用何種準備課程前,我們須做進 一步研究,以確定不同課程是否會影響 GMAT 成 績。 接受 GMAT 測驗之學生通常來自商學院、工學院 與文理學院等三個學院。因此,此實驗第二個欲探 討的因素為學生就讀的大學學院是否會影響 GMAT 成績。所以第二個因素是「大學學院」,亦有 3 個 處理:商、工及文理。 第13章 實驗設計與變異數分析 第4484頁

86 因子實驗實例 該實驗之因子設計包含因素 A:準備課程的 3 個處 理;及因素 B:大學學院的 3 個處理,共有3 × 3 = 9 個處理組合,這些處理組合或實驗條件彙整於表 13.9。 第13章 實驗設計與變異數分析 第484頁 86

87 因子實驗實例 假設表 13.9 中的 9 個處理組合均含 2 個學生組成 之隨機樣本:即商學院學生中有 2 個接受 3 小時複 習課程,2 個接受 1 天課程,另外 2 個接受 10 週 課程。此外,這三種課程中的每一種課程亦各有 2 個工學院學生及 2 個文理學院學生接受測試。 以實驗設計的術語而言,每個處理組合均含兩個觀 察值之樣本稱為有兩個重複數 (replications) 。我們 亦可選擇更多重複數及更大的樣本數,但為了簡化 範例的計算過程,現在只選擇兩個重複數。 第13章 實驗設計與變異數分析 第484頁

88 因子實驗實例 在實驗設計中,我們各從三個學院計劃申請商學研究所的 所有學生中隨機選取 6 個學生。而後每個學院各隨機指派 2 名學生參與每一個準備課程,故整個研究共有 18 個學生樣 本。 假設這些被隨機選取的學生已經參與準備課程,並參加 GMAT 考試,所得分數列於表 13.10。 第13章 實驗設計與變異數分析 第484頁

89 因子實驗實例 利用表 13.10 之資料,經由變異數分析計算程序可提供下列 問題的答案。
主效果 (因素 A):這些準備課程對提高 GMAT 成績之效果是否不同? 主效果 (因素 B):大學學院是否會影響 GMAT 成績? 交互作用效果 (因素 A 與因素 B):是否有些學院學生適用某些準備課 程,而另一學院之學生則適用另一種準備課程? 交互作用 (interaction) 一詞是指在因子實驗中出現之新效果 。若此交互作用效果對 GMAT 成績有顯著影響,則我們可 得到「準備課程之效果視學生大學學院而異」之結論。 第13章 實驗設計與變異數分析 第 頁

90 ANOVA 程序 兩因素因子實驗之 ANOVA 程序與完全隨機實驗及隨機 區集實驗類似。
我們均須將總平方和 (SST) 與自由度分割成不同來源 ,公式如下。 ANOVA表亦顯示總自由度 nT − 1 為被自由度為處理 (a – 1) 之因素 A 與自由度為 (b – 1) 之因素 B 所分割、區 集之自由度 b − 1 、交互作用之自由度為 (a – 1)(b – 1) 及誤差項之自由度 ab(r – 1) 之和。 SST = SSA + SSB + SSAB + SSE 第13章 實驗設計與變異數分析 第485頁

91 兩因素因子實驗 第13章 實驗設計與變異數分析 第485頁

92 兩因素因子實驗 步驟1. 計算總平方和 步驟2. 計算因素A之平方和 步驟3. 計算因素 B 之平方和
第13章 實驗設計與變異數分析 第486頁

93 兩因素因子實驗 步驟4. 計算交互作用之平方和 步驟5. 計算誤差造成的平方和 SSE = SST – SSA – SSB - SSAB
第13章 實驗設計與變異數分析 第486頁

94 兩因素因子實驗實例 表 為此次實驗之資料蒐集及相關的平方和。利用式 (13.26) 至式 (13.30),可得 GMAT 兩因素因子實驗之平方和 如下: 步驟1. SST = (500-515)2+(580-515)2 +(540-515)2 + ··· +(410 -515)2 = 82,450 步驟2. SSA =(3)(2)[(493.33-515)2 +(513.33-515)2 +( -515)2] = 6100 步驟3. SSB = (3)(2)[(540-515)2 + (560-515)2 + (445-515)2 ] = 45,300 步驟4. SSAB = 2[(540-493.33-540+515)2 + (500-493.33-560+515)2 + ··· + (445-538.33-445+515)2 ] = 11,200 步驟4. SSE = 82,540 -6100 -45,300 -11,200 = 19,850 上述平方和除以對應之自由度可得檢定兩個主效果 (準備課 程與學院別) 及交互作用之均方值。 第13章 實驗設計與變異數分析 第486頁

95 兩因素因子實驗實例 若使用顯著水準 α=0.05 來進行兩因素 GMAT 的假 設檢定,由於計算過程中,可能涵蓋一般甚至大型 的因子實驗問題,我們必須使用電腦來進行上述之 變異數分析及用來做假設檢定決策的 p 值計算。 第13章 實驗設計與變異數分析 第486頁

96 兩因素因子實驗實例 表13.16 為 GMAT 兩因素因子實驗變異數的 Minitab 輸出結 果。檢定三個準備課程 (因素 A) 是否有顯著差異的 p 值為 ,由於 p 值=0.299 大於 α=0.05,可知三個準備課程 的 GMAT 平均測驗成績沒有顯著的差異。 然而,就學院效果而言,p 值=0.005小於 α=0.05,意即三 個不同學院的 GMAT 平均測驗成績存有顯著的差異。最後, 交互效果的 p 值為 0.350,大於α=0.05,亦即沒有顯著的交 互作用效果。因此,我們沒有理由相信三個準備課程對來 自三個不同學院的學生準備 GMAT 考試的效果會有不同的 差異。 第13章 實驗設計與變異數分析 第486頁

97 兩因素因子實驗實例 第13章 實驗設計與變異數分析 第487頁

98 End of Chapter 13


Download ppt "第 13 章 實驗設計與變異數分析."

Similar presentations


Ads by Google