Presentation is loading. Please wait.

Presentation is loading. Please wait.

統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計

Similar presentations


Presentation on theme: "統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計"— Presentation transcript:

1 統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計
第十章 實驗設計與變異數分析 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計 10-6 隨機區集設計的變異數分析 10-3 變異數分析的基本概念 10-7 拉丁方格設計的變異數分析(選讀) 10-4 完義隨機的變異數分析 10-8 二因子設計的變異數分析(選讀) 書號:512282 編著 江建良 普林斯頓國際有限公司

2 10-1 實驗法與實驗設計 實驗法的意義: 實驗法的要件:
係指在控制的情境之下,實驗者有系統的操弄 (manipulate) 實驗變數 ( 又稱實驗因子或自變數 ),以觀察其對實驗結果 (又稱反應變數、依變數) 的影響之研究程序。 實驗法的要件: 實驗單位 (experimental unit): 即被實驗的對象,如:單位或人 (受測者、受試者)。 實驗變數 (experimental variable): 即實驗者所操弄的變數,一般稱為自變數 (independent variable) 或實驗因子 (factor)。表示實驗因子的狀態,稱為水準 (level),而因子水準的特定組合,稱為處理 (treatment)。 P366

3 10-1 實驗法與實驗設計 實驗法的要件: 反應變數(response variable):
即實驗結果的變數,一般稱為依變數 (dependent variable)。 實驗設計(experimental design): 即能增加實驗效果精確度的一些方法,如控制在干擾變數等方法。 變異數分析(ANOVA; analysis of variance): 即衡量自變數對依變數影響效果的統計方法。 (p. 366 例10-1) P366

4 實驗法的要件 例:某連銷超商經理想了解行銷部所提出的三種不同促銷方案,對營業額的增加效果是否相同,此時就需要透過實驗法的方式來進行了。在實驗法中,促銷手法稱為因子(factor),三種不同的行銷手法就為處理(treatment)或水準(level),而營業額就稱之為反應變數(response variable)或依變數(dependent variable),實施促銷手法的超商就稱為實驗單位(experiment unit)。由於我們的目的是要了解不同的促銷手法對營業額的效果是否相同,因此,變異數分析也可以用來回答這樣的問題。 另外,由於只考慮一個因子,因此也稱為一因子變異數分析(one-way ANOVA)。

5 10-1 實驗法與實驗設計 實驗設計的意義與類型: 實驗設計的意義:
狹義的實驗設計:利用某些技巧 (如隨機性、重複性、區集性等) 使實驗變數能充分發揮其對反應變數的影響,並能牌除實驗變數以外的干擾變數,以純粹觀察實驗變數對反應變數的影響效果,而能提高實驗分析的精確度。 (2) 廣義的實驗設計:泛指在進行實驗設計之前,對實驗如何進行所做的計畫。如擬定實驗假設、決定自變數與依變數、考慮如何控制外來干擾變數、如何減少實驗誤差、如何抽樣及選擇適當的統計方法,甚至利用實驗結果加以推論等均是。 P367

6 10-1 實驗法與實驗設計 實驗設計的意義與類型: 實驗設計的類型: (1) 因子設計:係指對實驗因子 (即實驗變數) 作適當處理
的設計,使其能充分顯示出實驗因子對 反應變數的影響情形。 (2) 區集設計:係指依據某一外在影響變數,將實驗單位 區分為若干區集,然後再觀察實驗因子對 反應變數的影響效果。 例:價格對銷售量的影響 (p. 368) P367

7 10-1 實驗法與實驗設計 實驗設計的意義與類型: 一因子設計 因子設計 二因子設計 實驗設計 一區集設計(簡單區集設計) 區集設計
二區集設計(拉丁方格設計) 一因子設計 二因子設計 因子設計 區集設計 實驗設計 P369

8 10-2 統計的實驗設計 完全隨機設計: 係指沒有區集設計的一因子實驗設計,
通稱為一因子分類 (one-way classification) 的實驗設計, 這是較簡單的實驗設計。 (p. 370 例10-2) 假設檢定的寫法: H0:價格差異,銷售量並無顯著差異。 H0:μ1=μ2=μ3 H1:價格差異,銷售量有顯著差異。 H1: μ1≠μ2≠μ3 上述等號至少有一個不成立 P369

9 10-2 統計的實驗設計 隨機區集設計: 係指一區集設計的一因子設計之實驗設計。
其特色乃依某一外在變數將實驗單位劃分為若干區集 (block),使區集變數能吸收反應變數的某些變異, 而減少抽樣所造成的誤差。屬於二因子分類 (two-way classification) 的實驗設計。 (p. 371 例10-3) 假設檢定的寫法: (1) H0:價格差異,銷售量並無顯著差異。 H0:μ1=μ2=μ3 H1:價格差異,銷售量有顯著差異。 H1: μ1≠μ2≠μ3 (2) H΄0:不同商店類型,銷售量並無顯著差異。 H΄0:μ΄1=μ΄2=μ΄3 H΄1:不同商店類型,銷售量有顯著差異。 H΄1: μ΄1≠μ΄2≠μ΄3 P370

10 10-2 統計的實驗設計 二因子設計: 二因子設計之特點: 是指二個實驗因子的實驗設計 (區集設計可依實際需要加入 或不加入 )。
假設二因子為A與B因子,各有a與b個水準,稱為a×b的二因子設計。於實驗設計中,共有a×b個處理水準( 即a×b個方格),A與B因子中之水準可為重覆或不重複。 二因子設計之特點: 可衡量各個實驗因子的個別效果,稱為主要效果 (main effects)。 在重覆的實驗單位下,可衡量兩實驗因子間是否發生交互作用 (interaction effects,又稱為互動效果 )。 (交互作用係指當一個實驗因子與反應變數之關係,依另一實驗因子的不同水準而顯著改變;此為二因子變異數分析之主要目的) P373

11 10-2 統計的實驗設計 二因子設計: (p. 374 例10-5) 獨立樣本二因子變異數分析 假設檢定的寫法:
(2) 實驗因子A之影響效果 H0:價格差異,銷售量並無顯著差異。 H0:μ1=μ2=μ3 H1:價格差異,銷售量有顯著差異。 H1: μ1≠μ2≠μ3 (3) 實驗因子B之影響效果 H΄0:包裝差異,銷售量並無顯著差異。 H΄0:μ΄1=μ΄2=μ΄3 H΄1:包裝差異,銷售量有顯著差異。 H΄1: μ΄1≠μ΄2≠μ΄3 (1) A與B因子之交互作用 H˝0:價格與包裝無交互作用。 H˝0:μ˝1=μ˝2=μ˝3 H˝1:價格與包裝有交互作用。 H˝1: μ˝1≠μ˝2≠μ˝3 (即價格對銷售量的影響受包裝的影響) P373

12 10-2 統計的實驗設計 拉丁方格設計: 係指二區集設計的一因子設計之實驗設計。 其特色為一種雙向區集設計,包括行區集設計、列區集設計。
拉丁方格的特色是若實驗因子有K個水準,則外在變數須分為K類,實驗單位須有K×K 個,並以隨機方式將實驗因子的水準分派到各個實驗單位,且同行或同列不得出現相同的處理水準(把實驗因子所造成的效果加以平衡,以看出實驗處理效果之差異)。(p. 372 例10-4) 當有三個因子,而每個因子的水準數都相等,且這三個因子之間並無交互作用存在時,可用拉丁方格實驗設計來代替三因子變異數分析的實驗設計。 假設檢定的寫法: (1) H0:價格差異,銷售量並無顯著差異。 H0:μ1=μ2=μ3 H1:價格差異,銷售量有顯著差異。 H1: μ1≠μ2≠μ3 (2) H0:不同商店類型,銷售量並無顯著差異。 H΄0:μ΄1=μ΄2=μ΄3 H1:不同商店類型,銷售量有顯著差異。 H΄1: μ΄1≠μ΄2≠μ΄3 (3) H0:商店地點不同,銷售量並無顯著差異。 H˝0:μ˝1=μ˝2=μ˝3 H1:商店地點不同,銷售量有顯著差異。 H˝1: μ˝1≠μ˝2≠μ˝3 P370

13 實驗設計 實驗設計之實施步驟 找出並詳細說明問題所在 決定影響之因子與其水準數和範圍 選擇應變變數 尋找適當之實驗設計 進行實驗 統計分析
做出結論與建議

14 10-3 變異數分析的基本概念 變異數分析的意義: 係指將實驗的結果 (即反應變數) 按變異發生的原因,
區分為實驗變數所造成的變異 (即已知原因所造成) 及 外在干擾變數 (即實驗因子以外的因素) 所造成的變異 [通稱為實驗誤差 (如:抽樣與非抽樣誤差)], 再配合這兩類變異的自由度取成變異數,再轉換成分配, 用分配來檢定各變異是否有顯著差異,以判斷變異發生的原因,是否顯著的統計方法。 變異數分析(analysis of variance) : 用來檢定三個或三個以上母體平均數,是否有顯著性差異的方法。 P376

15 變異數分析的意義、原理 變異數分析的意義 統計學家R.A. Fisher(1890~1962)首創變異數分析(Analysis of Variance,ANOVA),在相同的顯著水準下,同時(simultaneously)檢定k個母體平均數是否相等的方法,謂之。 一因子ANOVA(one-way ANOVA):以一個解釋變數來解釋反應變數變異來源的一種分析方法。 二因子ANOVA(two-way ANOVA):以兩個解釋變數來解釋反應變數變異來源的一種分析方法。 多因子ANOVA:按兩個以上因子分類分析。

16 考慮因素 因子ANOVA 小麥品種 1因子ANOVA 小麥品種 + 肥料 2因子ANOVA 小麥品種 + 肥料 + 土壤 3因子ANOVA ……………… …………… 機  器 機器 + 操作人員 機器 + 操作人員 + 原料

17 10-3 變異數分析的基本概念 變異數分析的基本假設: 每個處理水準 (即依實驗因子的準分組之各組樣本資料) 的母體,均為常態分配。
每個處理水準的母體之變異數相等。 抽自各母體的各組隨機樣本互為獨立。 實驗結果的變異可區分為實驗因子所造成的變異,加上實驗因子以外的因素所造成的變異。 P377

18 變異數分析基本觀念 變異數分析既然是以變異數為名,自然地它的基本觀念自是源自資料的變異,而其想法是利用全部資料的變異,也就是指所有資料與其平均數差的平方和,然後再考慮個別母體間的變異與個別母體內的變異,再由其間的差異來做比較。 因此變異數分析的基本觀念在虛無假設的成立下,亦即假設所有母體的平均數均相等的情況下,將所有樣本資料混合的變異分成兩部分:一部分為各母體內的變異,另一部分為各母體間的變異。然後再去比較這兩個部分的變異比值,是否足以支持虛無假設成立的假說。

19 變異數分析基本觀念 變異數分析中虛無假設成立的狀況

20 變異數分析基本觀念簡介 變異數分析中對立假設成立的狀況
ANOVA方法是透過對變異數的分析來同時檢定k個母體之平均數 i,i = 1, 2, …, k是否相等。即檢定,H0:1 = 2 =…= k,H1:至少有二平均數不等。

21 ANOVA的步驟是將樣本各觀測值之總變異(total of variation)分解為組間變異(between of variation)與組內變異(within of variation)。
組內變異:由各組本身資料的分佈情形去觀察資料本身內部的變異。 組間變異:由各組平均數的分佈情形去觀察各組平均數之間的變異。

22 變異數分析基本觀念 總變異(sum of squares due to total,SSt) :混合後資料的變異。
處理間變異(sum of square between treatment, SSb ) 處理內變異 (sum of square due to error,SSE; sum of square within treatment; SSw) 總變異=處理間變異+處理內變異 SS (sum of square): 平方和

23 變異數分析基本觀念 單因子變異數分析標準資料表 其中,yij代表第i水準下第j個觀測值。

24 變異數分析基本觀念 母體間的變異:各組組平均與總平均數間之變異總和 離均差 (deviation):任一樣本觀察值yi與其平均數 的差,即
母體內的變異:各組內離均差平方和之總和 總變異:各個數值與總平均數之差的平方和 離均差 (deviation):任一樣本觀察值yi與其平均數 的差,即 變異(variation):離均差的平方,即 離均差平方和 (sum of square for deviation) :所有變異相加,即

25 變異數的估計 變異數 (variance) 或均方(mean of square): 離均差平方和除以自由度,即 變異數分析中的一個假設條件是隨機樣本,因此MSb和MSw是獨立的,所以MSb與MSw的比值將是一個分子自由度為,分母自由度為的F分配。

26 10-4 完全隨機的變異數分析 變異數分析(摘要)表:
實驗因子有 k 個水準處理,每個處理之實驗單位相同(即分為 k 組,每組樣本大小 n 相等): 獨立樣本單因子變異數分析表 ( 樣本大小相同 ) 變異來源 平方和 SS 自由度 df 均方 MS F 處 理 SSB k - 1 誤 差 SSE (SSW) k (n – 1) 總 和 SST nk - 1 MSB SSB = - k 1 MSE SSE n ( ) F P382

27 10-4 完全隨機的變異數分析 å n 1 - 變異數分析表: MSB F = MSE
實驗因子有 k 個水準處理,每個處理之實驗單位不同(即分為 k 組,每組樣本大小 n 不同): 獨立樣本單因子變異數分析表 (樣本大小不等) 變異來源 平方和 SS 自由度 df 均方 MS F 組間 (處 理) SSB k - 1 組內 (誤 差) SSE 總 和 SST F = MSB MSE n 1 i k - å SSB SSE P383

28 SSw.s (2) =SSres (3) +SSb.t (4); SSt (5) =SSb.s (1) +SSw.s (2)
10-4 完全隨機的變異數分析 變異數分析表: 實驗因子有 k 個水準處理,每個處理之實驗單位重覆 相依樣本時,除了將MSw( 組內變異數估計值) 改為MSres( 殘餘誤差)(SSres=SSw-SSb. treatment),將dfw 改為dfres=(k-1)(n-1) 之外,其他都與獨立樣本時的算法一樣。 相依樣本單因子變異數分析表 (樣本大小必定相等) 變異來源 平方和 SS 自由度 df 均方 MS F 受試者間 SSb.subject (1) (n – 1) 受試者內 SSw. subject (2) n (k-1) 處 理 SSb.treatment (3) k - 1 殘 差 SSres (4) (k-1) (n – 1) 總 和 SSt (5) nk - 1 MSB SSb.t = - k 1 MSres SSres (k-1) n ( ) F MSb.t P382 SSw.s (2) =SSres (3) +SSb.t (4); SSt (5) =SSb.s (1) +SSw.s (2)

29 10-4 完全隨機的變異數分析 變異數分析的步驟: 將總變異區分為實驗因子變異(處理變異、可解釋變異)與誤差變異(未解釋變異)。
決定各變異對應之自由度。 將變異平方和除以自由度,化為變異數 ( 即均方 )。 求算 F 統計量。 F f > - ( : ) 1 2 α 時,放棄 H0。 p P383

30 關聯強度 變異數分析的結果若F值達到顯著水準,即可說自變項與依變相之間有關聯存在,其關聯強度 (strength of association) ω2為: SSb-(k-1)MSw SSt+MSw 即自變項所能解釋依變項的總變異百分比。 當F值達到顯著水準時ω2將會是正值,若為負值則要解釋為”0” 當樣本數很大而使MSw變得很小時,F值很容易達到顯著。此時若ω2很小,即使在統計上有意義,實際應用上仍然沒意義。

31 10-5 多重比較 事後比較:當變異數分析的F值達到顯著水準後才須尋找到底哪些對平均數之間有顯著差異。 事後比較:共有 對平均數比較使用
檢定。 當變異數分析達顯著水準,才 可實施。 C F k 2 多重比較 任取一對或某些對作平 均數比較 個別 之估計。 m i t 檢定 事前比較 事後比較:當變異數分析的F值達到顯著水準後才須尋找到底哪些對平均數之間有顯著差異。 P390

32 10-5 事後比較 杜凱氏HSD 法(Tukey’s Honestly Significant Difference):HSD 法係由J.W. Tukey 於1953 年發展而成,此法適用於當各組樣本數相等時,比較兩組平均數相互之間的差異(q值之差距考驗)。 q值:差距與標準誤的比值 查表值 當二平均數的差值大於HSD者,該對平均數之差即達到顯著水準

33 10-5 事後比較 紐曼-科爾氏法(Newman-Keuls method; N-K法):此法同HSD法,適用於每組人數相等時的差距考驗,而其最大特色,係依平均數之大小依序使用不同的臨界q值 (依相差等級數r而異),而HSD法,則不管平均數之大小次序,都使用同一個臨界q值。 查表值 等級數 (rank) :二個平均數在平均數排列次序中相差的等級

34 10-5 事後比較 薛費法(Scheff ’e method):係H.Scheffe’於1959 年所發展而成,無論各組樣本人數相等或不相等均可適用。常用於人數不相等時多組平均數間的比較。 HSD法與N-K法均只適用於各組人數相等時,以及比較一對二個平均數之間的差異時。當各組人數不相等或者想要進行複雜的比較 (每次比較包含二個以上平均數的差異) 時,則可使用此方法。 查表值

35 10-5 事後比較 費雪爾氏LSD法(Fisher’s Least Significant Difference):LSD係由R.A Fisher於1914 年發展而成,此法適用於一組K個平均數間的成對比較。 查表值

36 10-5 事後比較 鄧肯氏法(Duncan’s method):此法與Newman-Keuls法的系列檢定程序類似,但需採用特別的臨界值。
龐費洛尼t 考驗法(Bonferroni procedure):此法亦稱為杜恩氏多重比較法(Dunn’s multiple comparison procedure),係利用LSD法加以修正而成,故又稱為修正的LSD法(modified LSD),其特色是將α依比較數加以分割。 R-E-G-W F 值是以 F 檢定為基礎,而 R-E-G-W Q 值則以 Studentized 全距為基礎。這些檢定,比 Duncan 多重全距檢定和 Student-Newman-Keuls 法都更有效,但在細格大小不相等的時候,建議最好別用。

37 10-5 事後比較 Duncan 多重範圍檢定、Student-Newman-Keuls 法 (S-N-K) 和 Tukey-b 檢定,都是全距檢定,它們會將組別平均數分等級,並計算全距值。 Hochberg GT2 檢定,跟 Tukey 最誠實顯著性差異檢定很像,但是它使用Studentized 最大模數。通常,Tukey檢定比較有效。再者,Gabriel 成對比較檢定,也使用 Studentized 最大模數,而且當細格大小不等的時候,通常會比 Hochberg GT2 檢定有效。當細格大小變化很大時,Gabriel 檢定可能會變成開放式的。 Waller-Duncan t 檢定,乃是使用 Bayesian 作法。這個全距檢定在樣本大小不相等的時候,會使用樣本大小的調和平均數。

38 10-5 事後比較 Dunnett 成對多重比較 t 檢定,會把一組處理方式,與單一控制平均數做比較。其中最後一個類別,是預設的控制類別。此檢定法可以選擇雙邊或單邊檢定。若要檢定因子在任何水準 (除了控制類別) 的平均數,是否不等於控制類別的平均數,使用雙邊檢定。若要檢定因子在任何水準的平均數,是否小於控制類別的平均數,則選取「< 控制」。同樣地,若要檢定因子在任何水準的平均數,是否大於控制類別的平均數,可選取「> 控制」。

39 10-5 事後比較 當我們在選擇事後比較方法時,應該考慮研究的性質再作決定。
若研究屬於初步的探索性研究,則應該考慮強調統計的強韌性,盡量找出可能的差異出來;若是較接近驗證性研究,則應該考慮強調保守性,除非二組間平均數差異真的是非常顯著,否則寧可接受虛無假設。

40 10-4 完全隨機的變異數分析 單因子變異數分析 (p.385例題10-7) Excel法:用單因子變異數分析 (適用於獨立樣本) 變源
SS 自由度 MS F P-值 臨界值 組間 3 組內 18 總和 21

41 10-4 完全隨機的變異數分析 獨立樣本單因子變異數分析 (p.385例題10-7) SPSS法:one-way ANOVA

42 10-4 完全隨機的變異數分析 相依樣本單因子變異數分析 SPSS法:GLM-Repeated Measures

43 10-4 完全隨機的變異數分析 相依樣本單因子變異數分析 SPSS法:GLM-Repeated Measures

44 10-4 完全隨機的變異數分析 相依樣本單因子變異數分析 SPSS法:GLM-Repeated Measures 六種事後比較
離差(Deviation) :每一組皆與其餘組做比較。 簡單(Simple) :每一組皆與參考組做比較。 差分(Difference) :除第一組外,每一組皆與其前面各組的平均數做比較。 Helmert:除最後一組外,每一組皆與其後面各組的平均數做比較。 重覆(Repeated) :除第一組外,每一組皆與其前一組做比較。 多項式(Polynomial) :進行多項式比較。 相依樣本變異數分析中不能採用離差(Deviation) 、簡單(Simple)及重覆(Repeated) 這三種

45 10-4 完全隨機的變異數分析 單因子變異數分析之預檢資料 (p.385例題10-7) SPSS法:one-way ANOVA
變異數分析須符合常態分配、變異數同質的條件,故應預檢資料是否成常態分配、變異數同質。 P383

46 10-9 t檢定與F檢定的再說明 二組樣本用t檢定,三組以上的樣本用F檢定。二組樣本用t檢定的結果與用變異數分析之F檢定的結果是一樣的;t2=F。 (p. 415 例10-17獨立樣本、 p. 417 例10-18相依樣本) P415

47 作業 請自訂一研究主題,後進行四種實驗設計的方法安排設計內容。


Download ppt "統 計 學 第十章 實驗設計與變異數分析 編著 江建良 10-1 實驗法與實驗設計 10-5 多重比較 10-2 統計的實驗設計"

Similar presentations


Ads by Google