Presentation is loading. Please wait.

Presentation is loading. Please wait.

F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計

Similar presentations


Presentation on theme: "F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計"— Presentation transcript:

1 F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計
F-Distribution and Analysis of Variance F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計

2 10.1 F分布 兩個族群變方的比值稱為F值 即 若F=1,即表示兩族群變方相等 。 而由F值所組成之次數分布即為F分布。
F分布為紀念 R.A. Fisher 而命名,故又稱費氏F分布(Fisher’s F distribution)。 若族群變方未知,而以樣品均方( )作為變方的估值,則F值亦可以兩樣品均方之比值表示為:

3 F分布 F分布曲線是根據 自由度 及 之自由度 而定的一條分布曲線,故F分布曲線依 及 之不同而異。

4 F分布 通常計算F值時,常把較大的均方放於分子,而較小的均方放於分母,因此F值均大於1,故F值也就採用右單尾檢定。但若欲計算左單尾F值所發生的機率,可採用 換算。

5 10.2 兩族群變方相等性檢定 例子10.2 設下列為人工與儀器測定成年人血液中尿酸含量之記錄,是檢定兩種測定法之變異是否相同。
n1=8 4.5 5.6 6.5 7.5 8.6 9.8 10.7 12 儀器 n2=8 6 6.8 7.6 8 8.5 9 9.5 mg% / ml mg% / ml (1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算 ,若 表示兩變方不相等。

6 例子10.2 今實測 ,故拒絕H0的假設,表示兩種尿酸測定法之變方不相等。

7 10.4 變方分析 (Analysis of Variance:ANOVA)
針對數個樣品(處理)均值之比較檢定法,雖然也可以採用兩樣品均值差異的t檢定(兩兩成對比較),但此種方式結果犯第一型錯誤機率,要比我們設定的顯著水準(0.05)高很多,也就是可靠性會降低。 假設有四個樣品均值要互相比較,則共有 對樣品均值差異的比較檢定,若設每對比較檢定的顯著水準為 ,即其信賴水準為 。 故6對樣品均值差異獨立比較結果之正確率為: ,犯第一型錯誤率為 。

8 變方分析(ANOVA) 而採用變方分析法,可維持在 的顯著水準下,同時比較數個樣品均值的相等性問題。 應用變方分析的前提:
而採用變方分析法,可維持在 的顯著水準下,同時比較數個樣品均值的相等性問題。 應用變方分析的前提: 各樣品(處理)互相獨立。 各處理之試驗誤差應獨立 各處理之試驗誤差應同質(homogeneity)。 並且服從常態分佈。

9 變方分析之原理 一般試驗結果難免會發生誤差(error),有些誤差是可以控制,而有些則是不明原因所造成的。
我們以下面的例子來說明試驗資料之成因、試驗誤差以及變方分析之原理。 假設有一老祖父過96歲生日,他將美金96元分給12位孫子當零用錢,為求公平所以每人得8元,不過分配後祖父覺得這樣不妥,因為12位孫子中,四位為研究生、四位為大學生、另四位為中學生,根據不同年齡層消費會不同,因此祖父決定再重新分配,如下表所示:

10 觀測值 組別(處理) 最初所得 再分配所得 再分配得失 賭博後所得 賭博時得失 最後與最初所得之差 學(A) 8 6 -2 7 3 10 4 +1 -3 +4 -1 -5 +2 -4 學(B) +3 究(C) 11 14 9 +6 合計 96 0,0,0

11 今以三種飼料12隻天竺鼠增重比較試驗結果代替
總平均值 處理平均值 處理 效應 觀測 試驗 誤差 差異 A 8 6 -2 7 3 10 4 +1 -3 +4 -1 -5 +2 -4 B +3 C 11 14 9 +6 合計 96 0,0,0

12 (treatment sum of squares)
平方和劃分 兩邊取平方後總和為: + 總平方和 (total sum of squares) = 處理平方和 (treatment sum of squares) 誤差平方和 (error sum of squares)

13 各項平方和其均方之求法 總均方 處理均方 誤差均方

14 變因(Source of Variation)
變方分析表 變因(Source of Variation) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 理論F值 處理(t) 誤差(E) m-1 m(n-1) SSt SSE MSt MSE F=Mst /MSE 總和(T) mn-1 SST 實測F值是以處理均方(MSt)除以誤差均方(MSE)而得,根據自由度 及 查得顯著水準 為0.05或0.01之F值,若實測 則表示處理均值不相等,處理效應存在,反之則不存在。或以P值表示,若P小於0.05或0.01,則處理效應存在。

15 處理均方期望值與誤差均方期望值之比值 若F=1, 若F>1, 至少有一對處理平均值不等

16 例子10.3 假設有A、B、C三種食品進行天竺鼠飼養,每種食品飼養四隻,經過兩週後每隻之增重(克)如下記錄,試以變方分析法檢定三種食品品質是否有差異。
平均值 A B C 24 28 44 6 7 11 96

17 影響天竺鼠2週增重變異的原因(變因) 已知變因(Known Variation) 飼料品牌 未知變因(Unknown Variation)
試驗誤差(Experimental Error) 其他所有可能的原因 天竺鼠起始體重 測量誤差 試驗環境

18 (1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算F值 首先求各效應平方和:

19 實測 ,故接受H0的假設,表示三種食品品質相同。
三種食品對天竺鼠增重檢定變方分析表 變因 (S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 食品(t) 誤差(E) 3-1=2 11-2=9 56 64 28 7.11 3.9375 總和(T) 12-1=11 120 實測 ,故接受H0的假設,表示三種食品品質相同。

20 例子10.4 假設有A、B、C三種食品進行天竺鼠飼養,每種食品飼養四隻,經過兩週後每隻之增重(克)如下記錄,試以變方分析法檢定三種食品品質是否有差異。
平均值 A B C 24 28 44 6 7 11 96

21 (1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算F值 首先求各效應平方和:

22 三種食品對天竺鼠增重檢定變方分析表 變因 (S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 食品(t) 誤差(E) 3-1=2 11-2=9 56 26 28 2.9 9.6923** 總和(T) 12-1=11 82 實測 ,故拒絕H0的假設,表示三種食品品質不完全相同。記兩個星號**通常表示處理均值間之差異達1%顯著水準,一個星號*表示處理均值間之差異達5%顯著水準。

23 10.4.6 成對處理均值間差異比較 一般Fisher 的最小顯著差異法(LSD) Duncan 的多變域檢定法(DMRT)
Scheffe 的S值檢定法等多種 Scheffe 之臨界值比LSD或DMRT都大,兩處理均值比較時,其差異值較不易達顯著水準,適合於較嚴格之比較測驗。 S>DMRT>LSD

24 1. Fisher’s 最小顯著差異(Least Significance Difference, LSD)
若實測處理i與i´之間的差異比理論的LSD大,表示處理i與i´之平均值間有顯著差異

25 例:飼料與天竺鼠兩週增重 處理 均值 實測差異值 C 11 - B 7 4* - A 6 5*

26 鄧氏新多變域測驗法 Duncan’s New Multiple Range Test(DMRT)
其臨界值之計算式如下:(見附表8) r=2, r=3,

27 處理 均值 實測差異值 C B * - A * *號表示兩處理均值間的差異達到5%顯著水準

28 雪菲S法(Scheffe’s S Method)
兩處理均值差之臨界值計算式:

29 處理 均值 實測差異值 C B * - A *

30 Bonferroni多重比較方法 顯著水準:α,兩兩比較個數:k 調整顯著水準: α*=α/k Bonferroni(1-α)%信賴區間
決策方法:若處理i與i´之Bonferroni(1-α)%信賴區間不包括0  處理i與i´之平均值間有顯著差異

31 例:飼料與天竺鼠兩週增重 比較 A VS. B (-5.73,3.73) A VS. C (-9.73,-0.27)* B VS. C
(-8.73,0.73)

32 Tukey忠誠顯著差異值 (Honest Significance Distance,HSD)
Qα, m, dfE 決策方法:若處理i與i´之HSD不包括0  處理i與i´之平均值間有顯著差異

33 例:飼料與天竺鼠兩週增重 比較 HSD A VS. B (-7.26,5.26) A VS. C (-11.26,1.26) B VS. C
(-10.26,2.26)

34 一個好的研究必須要有嚴謹的設計 ,客觀的試驗過程及合理的推論。因此試驗時必須遵守下列三個原則
10.5 試驗設計(experimental design) 一個好的研究必須要有嚴謹的設計 ,客觀的試驗過程及合理的推論。因此試驗時必須遵守下列三個原則 設置重複(set up replication) 隨機排列(random arrangement) 誤差控制(error control)

35 設置重複 同一處理(如食品、藥品、療法、品種)所使用的試驗單位數即為重複。 主要作用是估算試驗誤差以備統計推論之用。
若試驗只做一次(重複一次),則無法估算試驗誤差,也就無法做統計推論。 重複次數愈多,理論上試驗誤差愈小,試驗結果會愈準確可靠。 一般來說,計量資料,如果誤差控制得好,設計均衡,10~20次即可,甚至還可小一些;而計數資料,即使誤差控制得好,也需要30-100次左右。

36 隨機排列 哪一個處理被安排於哪個試驗單位要機會均等,不能有人為的主觀偏見。
隨機排列與重複相結合,試驗數據就能估算無偏的(unbiased)試驗誤差,統計推論才合理可靠。 隨機法有:拋硬幣,擲骰子,抽籤,利用隨機數字表

37 系統誤差(systematic error) (知道原因的誤差,有方向) 隨機誤差(random error) (不知道原因的誤差)
誤差控制 誤差來源有兩種(見2.7節) 系統誤差(systematic error) (知道原因的誤差,有方向) 隨機誤差(random error) (不知道原因的誤差)

38 10.5.1 完全隨機設計(CRD) (one-way ANOVA)
採用本設計的條件(本設計只有隨機誤差) 各處理(如以A、B、C代表三種食品、藥品)所使用的試驗材料要同質(或同時或同環境)進行試驗 各處理要隨機排列如圖: 本設計之優點:試驗最簡單,試驗結果效力最高,適合任意處理數及重複數的試驗。

39 [例] 設今有A,B,C三種營養食品,以老鼠為試驗材料,每種食品飼養4隻老鼠(4重複),其試驗設計圖及一個月後之增重(克)如下圖

40 資料整理 ---------------------------------------------- 處理 觀測值 處理 和 處理均值
處理 觀測值 處理 和 處理均值 A B C 25.2

41 各種平方和之計算 SST= SSt= SSE=SST-SSt= =.72

42 變方分析表 變 因 自由度 平方和 均方 實測F值 理論F值(0.05)
食品(t) 3-1= 誤差(E) 11-2= 總計(T) 12-1= 三種參試食品品質間有顯著差異

43 處理均值間比較 比較結果C與B,B與A無差異,但C與A則有差異 處理 均值 實測差異值
處理 均值 實測差異值 C B A 比較結果C與B,B與A無差異,但C與A則有差異

44 10.5.2 隨機完全區集設計(RCBD) (two-way ANOVA)
採用本設計條件 試驗材料為異質(或異時或異環境),但可明顯分成幾組,每組集合數個性質相同的試驗單位而成一區集(block)。 各區集內之試驗單位數必須等於處理數 在各區集內參試處理要隨機排列,形成同源配對

45 隨機完全區集設計(RCBD) 本設計優點: 可剔除試驗材料(或時間或環境)不同時之系統誤差,以減小試驗誤差。 任意處理數及區集數均可。
本設計缺點: 若試驗材料為同質,其試驗效果不如完全隨機設計(CRD)。 試驗結果資料有缺值時,資料分析比較複雜。

46 例子10.7假設有A、B、C、D四種血液凝結處理方法,如選取五位健康成人,每人抽血後分成四份,並隨機分配四種凝血處理方法,所得血液凝固時間如下圖,試比較何種處理方法較佳。
試驗設計圖 B C A C D 9.5 A D 14.4 C 10.2 B B 9.2 D 12.2 A 10.8 D 12.0 A 8.4 C B 15.2 D A C 8.5

47 資料整理 區集 處理 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 處理和 A B C D 45.0 53.4 47.3 57.9 區集和 203.6=

48 (1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算F值 首先求各效應平方和:

49 雙向 變方分析表 實測 ,故拒絕H0的假設,表示四種凝血處理方法有差別。 變因 自由度(DF) 平方和(SS) 均方 實測F值 F值機率
(S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 區集(B) 處理(t) 誤差(E) 5-1=4 4-1=3 19-7=12 31.427 20.604 16.641 7.8568 6.8680 1.3868 * * 4.9524* 總和(T) 20-1=19 68.672 實測 ,故拒絕H0的假設,表示四種凝血處理方法有差別。

50 成對處理均值間差異比較 處理均值間差異比較表 處理 均值 實測差異值 D與B,A與C無差異,但D與B比A與C,血液凝固時間長
處理 均值 實測差異值 D B C A D與B,A與C無差異,但D與B比A與C,血液凝固時間長

51 若改為單向 變方分析(CRD) 實測 ,故接受H0的假設,表示四種凝血處理方法無差別,其原因是誤差均方太大之故。 變因 自由度(DF)
(S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 處理(t) 誤差(E) 4-1=3 19-7=16 20.604 48.068 6.8680 2.2861 總和(T) 20-1=19 68.672 實測 ,故接受H0的假設,表示四種凝血處理方法無差別,其原因是誤差均方太大之故。

52 10.6 族群容許區間(Tolerance Interval)
範圍 信賴水準 (μ-1.645σ, μ+1.645σ) 90% (μ-1.96σ, μ+1.96σ) 95% (μ-2.58σ, μ+2.58σ) 99% 族群中95%的觀測值會落在(μ-1.96σ, μ+1.96σ)之間

53 族群均值及變方未知之容許區間 μ及σ2未知時必須修正為κ值,替代標準常態百分位
κ值隨樣品大小,信心水準(1-γ)與包含率(1-α)而異,見P 附表13 所得的容許區間: 吾人有(1-γ)%信心水準,族群中(1-α)%觀測值介於       之間 應用於品管方面: (1-γ)%信心保證(1-α)%產品會在       之間  應用於生物特性正常值範圍

54 例:某醫院30位新生兒血液中含鈣量(mg%)
[例10.12]

55 ~本章結束~


Download ppt "F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計"

Similar presentations


Ads by Google