F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計

Slides:



Advertisements
Similar presentations
1 SPSS 軟體與變異數分析 南台科技大學企管系呂金河. 2 變異數分析 §1 變異數分析的基本概念 目的:變異數分析的作用在於分析各種變異的來源, 並進而加以比較,以瞭解不同的實驗變數所造成的 結果是否有顯著的差異,它的虛無和對立假設如下 : 在進行 ANOVA 及 MANOVA 變異數分析時,必.
Advertisements

第 9 课 激素调节 浙教版科学总复习 考试内容考试要求 生命活动的调节生命活动的调节 1 、植物的感应性 1 )列举植物的感应性现象 a 2 )描述植物生长素发现的历史, 体验科学发现的过程 a 2 、人体生命活动的调节 列举激素对人体生命活动调节 的作用 a.
 學生氏 t 分布  單一樣品均值推論  兩樣品均值差之分布  兩樣品非成對 t 值檢定  兩樣品成對 t 值檢定  二項分佈均值差推論 第八章. 樣品均值比較問題 The Comparison Problem of Sample Mean.
單元九:單因子變異數分析.
實驗規劃--實驗因子設定, 效標選定與受測者選定
第6章 方差分析与试验设计 会计学2011级 主讲:王红娜.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
Chapter 15 複迴歸.
生物統計與SAS軟體課程教學(三) 雙變項統計分析(一)
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
變異數分析 (Analysis-of-Variance簡稱ANOVA)
17 類別資料的分析  學習目的.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
八、假說檢定 Ⅱ (Hypothesis Testing Ⅱ) (Chapter 8)
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
第九章 方差分析 讲授内容 方差分析的基本思想及应用条件 完全随机设计资料的方差分析 随机区组设计资料的方差分析 重复测量资料的方差分析
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
Analysis of Variance 變異數分析
試驗設計學 第一章至第九章精華篇 試驗研究五步驟: 1. 嚴謹設計 2. 資料搜集 3. 資料整理 4. 統計分析 5. 合理推論.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
第13章變異數分析與多變數分析  本章的學習主題 
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
Analysis of Variance (一)
用于计算智能研究 和人类主观测试的 统计检验 Hideyuki TAKAGI 日本 九州大学
課程九 迴歸與相關2.
變異數分析 12.1基本概念 12.2一因子變異數分析(完全隨機化設計) 12.3數個平均數的多重比較
第 13 章 實驗設計與變異數分析.
統計學: 應用與進階 第14 章: 變異數分析.
Chapter 14 Simple Linear Regression
ANOVA簡介 許晉誠
第13章變異數分析與多變數分析  本章的學習主題  1. 變異數分析的應用時機 2. 變異數分析的假設前提
Test for difference among the means: t Test
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
十、變方分析 (Analysis of Variance) (Chapter 10)
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
方差分析 方差分析的概念 单因素方差分析 有交互作用的双因素方差分析 无交互作用的双因素方差分析.
第 13 章 實驗設計與變異數分析 Part A ( ).
指導老師:蘇明俊 組員: 陳柔安 潘依蓮 張壹凱
一個基于相鄰區塊相似性和動態次編碼簿的低位元率向量量化 圖像壓縮法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 4 主讲人 陶育纯 医学统计学方法 4 主讲人 陶育纯 流行病与卫生统计学教研室
系 別:國企四乙 指導老師:蘇明俊 教授 學生姓名: 陳映雯
國立台灣體育學院 體育學系暨體育研究所 高明峰
第一章.
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Ogive plot example 說明者:吳東陽 2003/10/10.
一個基于相鄰區塊相似性和動態次編碼簿的低位元率向量量化 圖像壓縮法
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第八章 銷售預測(2).
第 12 章  變異數分析.
( )下列何者正確? (A) 7< <8 (B) 72< <82 (C) 7< <8 (D) 72< <82 C 答 錯 對.
第四章 多组资料均数的比较 七年制医疗口腔《医学统计学》
第八章 方差分析(analysis of variance)
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
一個基于相鄰區塊相似性和動態次編碼簿的低位元率向量量化 圖像壓縮法
在直角坐標平面上兩點之間 的距離及平面圖形的面積
第十四章:工作抽查 工作抽查:係在隨機時間進行大量觀測以分析工作的方法;其結果可用來有效訂定各操作的適當寬放、衡量機器和人員的操作情形及建立生產的標準時間;其數據的準確性,視觀測次數及隨機觀測所涵蓋的期間而定。 工作抽查的優點:p524。 工作抽查的理論:係依據機率的基本法則;公式如p 及例題14-1。。
完全随机设计多样本资料的方差分析 赵耐青.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計 F-Distribution and Analysis of Variance F分布 兩族群變方相等性檢定 變方分析(ANOVA) 試驗設計

10.1 F分布 兩個族群變方的比值稱為F值 即 若F=1,即表示兩族群變方相等 。 而由F值所組成之次數分布即為F分布。 F分布為紀念 R.A. Fisher 而命名,故又稱費氏F分布(Fisher’s F distribution)。 若族群變方未知,而以樣品均方( )作為變方的估值,則F值亦可以兩樣品均方之比值表示為:

F分布 F分布曲線是根據 自由度 及 之自由度 而定的一條分布曲線,故F分布曲線依 及 之不同而異。

F分布 通常計算F值時,常把較大的均方放於分子,而較小的均方放於分母,因此F值均大於1,故F值也就採用右單尾檢定。但若欲計算左單尾F值所發生的機率,可採用 換算。

10.2 兩族群變方相等性檢定 例子10.2 設下列為人工與儀器測定成年人血液中尿酸含量之記錄,是檢定兩種測定法之變異是否相同。 n1=8 4.5 5.6 6.5 7.5 8.6 9.8 10.7 12 儀器 n2=8 6 6.8 7.6 8 8.5 9 9.5 mg% / ml mg% / ml (1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算 ,若 表示兩變方不相等。

例子10.2 今實測 ,故拒絕H0的假設,表示兩種尿酸測定法之變方不相等。

10.4 變方分析 (Analysis of Variance:ANOVA) 針對數個樣品(處理)均值之比較檢定法,雖然也可以採用兩樣品均值差異的t檢定(兩兩成對比較),但此種方式結果犯第一型錯誤機率,要比我們設定的顯著水準(0.05)高很多,也就是可靠性會降低。 假設有四個樣品均值要互相比較,則共有 對樣品均值差異的比較檢定,若設每對比較檢定的顯著水準為 ,即其信賴水準為 。 故6對樣品均值差異獨立比較結果之正確率為: ,犯第一型錯誤率為 。

變方分析(ANOVA) 而採用變方分析法,可維持在 的顯著水準下,同時比較數個樣品均值的相等性問題。 應用變方分析的前提: 而採用變方分析法,可維持在 的顯著水準下,同時比較數個樣品均值的相等性問題。 應用變方分析的前提: 各樣品(處理)互相獨立。 各處理之試驗誤差應獨立 各處理之試驗誤差應同質(homogeneity)。 並且服從常態分佈。

變方分析之原理 一般試驗結果難免會發生誤差(error),有些誤差是可以控制,而有些則是不明原因所造成的。 我們以下面的例子來說明試驗資料之成因、試驗誤差以及變方分析之原理。 假設有一老祖父過96歲生日,他將美金96元分給12位孫子當零用錢,為求公平所以每人得8元,不過分配後祖父覺得這樣不妥,因為12位孫子中,四位為研究生、四位為大學生、另四位為中學生,根據不同年齡層消費會不同,因此祖父決定再重新分配,如下表所示:

觀測值 組別(處理) 最初所得 再分配所得 再分配得失 賭博後所得 賭博時得失 最後與最初所得之差 中 學(A) 生 8 6 -2 7 3 10 4 +1 -3 +4 -1 -5 +2 -4 大 學(B) +3 研 究(C) 11 14 9 +6 合計 96 0,0,0

今以三種飼料12隻天竺鼠增重比較試驗結果代替 處 理 總平均值 處理平均值 處理 效應 觀測 值 試驗 誤差 總 差異 A 飼 料 8 6 -2 7 3 10 4 +1 -3 +4 -1 -5 +2 -4 B +3 C 11 14 9 +6 合計 96 0,0,0

(treatment sum of squares) 10.4.3 平方和劃分 兩邊取平方後總和為: + 總平方和 (total sum of squares) = 處理平方和 (treatment sum of squares) 誤差平方和 (error sum of squares)

各項平方和其均方之求法 總均方 處理均方 誤差均方

變因(Source of Variation) 變方分析表 變因(Source of Variation) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 理論F值 處理(t) 誤差(E) m-1 m(n-1) SSt SSE MSt MSE F=Mst /MSE 總和(T) mn-1 SST 實測F值是以處理均方(MSt)除以誤差均方(MSE)而得,根據自由度 及 查得顯著水準 為0.05或0.01之F值,若實測 則表示處理均值不相等,處理效應存在,反之則不存在。或以P值表示,若P小於0.05或0.01,則處理效應存在。

處理均方期望值與誤差均方期望值之比值 若F=1, 若F>1, 至少有一對處理平均值不等

例子10.3 假設有A、B、C三種食品進行天竺鼠飼養,每種食品飼養四隻,經過兩週後每隻之增重(克)如下記錄,試以變方分析法檢定三種食品品質是否有差異。 1 2 3 4 和 平均值 A B C 7 3 10 4 4 10 6 8 10 14 9 11 24 28 44 6 7 11 96

影響天竺鼠2週增重變異的原因(變因) 已知變因(Known Variation) 飼料品牌 未知變因(Unknown Variation) 試驗誤差(Experimental Error) 其他所有可能的原因 天竺鼠起始體重 測量誤差 試驗環境 …

(1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算F值 首先求各效應平方和:

實測 ,故接受H0的假設,表示三種食品品質相同。 三種食品對天竺鼠增重檢定變方分析表 變因 (S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 0.05 0.01 食品(t) 誤差(E) 3-1=2 11-2=9 56 64 28 7.11 3.9375 4.26 8.02 總和(T) 12-1=11 120 實測 ,故接受H0的假設,表示三種食品品質相同。

例子10.4 假設有A、B、C三種食品進行天竺鼠飼養,每種食品飼養四隻,經過兩週後每隻之增重(克)如下記錄,試以變方分析法檢定三種食品品質是否有差異。 1 2 3 4 和 平均值 A B C 7 8 5 4 9 8 6 5 10 13 11 10 24 28 44 6 7 11 96

(1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算F值 首先求各效應平方和:

三種食品對天竺鼠增重檢定變方分析表 變因 (S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 0.05 0.01 食品(t) 誤差(E) 3-1=2 11-2=9 56 26 28 2.9 9.6923** 4.26 8.02 總和(T) 12-1=11 82 實測 ,故拒絕H0的假設,表示三種食品品質不完全相同。記兩個星號**通常表示處理均值間之差異達1%顯著水準,一個星號*表示處理均值間之差異達5%顯著水準。

10.4.6 成對處理均值間差異比較 一般Fisher 的最小顯著差異法(LSD) Duncan 的多變域檢定法(DMRT) Scheffe 的S值檢定法等多種 Scheffe 之臨界值比LSD或DMRT都大,兩處理均值比較時,其差異值較不易達顯著水準,適合於較嚴格之比較測驗。 S>DMRT>LSD

1. Fisher’s 最小顯著差異(Least Significance Difference, LSD) 若實測處理i與i´之間的差異比理論的LSD大,表示處理i與i´之平均值間有顯著差異

例:飼料與天竺鼠兩週增重 處理 均值 實測差異值 C 11 - B 7 4* - A 6 5* 1 -

鄧氏新多變域測驗法 Duncan’s New Multiple Range Test(DMRT) 其臨界值之計算式如下:(見附表8) r=2, r=3,

處理 均值 實測差異值 --------------------------------------- C 11 - B 7 4* - A 6 5* 1 - ---------------------------------------- *號表示兩處理均值間的差異達到5%顯著水準

雪菲S法(Scheffe’s S Method) 兩處理均值差之臨界值計算式:

處理 均值 實測差異值 --------------------------------------- C 11 - B 7 4* - A 6 5* 1 - ----------------------------------------

Bonferroni多重比較方法 顯著水準:α,兩兩比較個數:k 調整顯著水準: α*=α/k Bonferroni(1-α)%信賴區間 決策方法:若處理i與i´之Bonferroni(1-α)%信賴區間不包括0  處理i與i´之平均值間有顯著差異

例:飼料與天竺鼠兩週增重 比較 A VS. B (-5.73,3.73) A VS. C (-9.73,-0.27)* B VS. C (-8.73,0.73)

Tukey忠誠顯著差異值 (Honest Significance Distance,HSD) Qα, m, dfE 決策方法:若處理i與i´之HSD不包括0  處理i與i´之平均值間有顯著差異

例:飼料與天竺鼠兩週增重 比較 HSD A VS. B (-7.26,5.26) A VS. C (-11.26,1.26) B VS. C (-10.26,2.26)

一個好的研究必須要有嚴謹的設計 ,客觀的試驗過程及合理的推論。因此試驗時必須遵守下列三個原則 10.5 試驗設計(experimental design) 一個好的研究必須要有嚴謹的設計 ,客觀的試驗過程及合理的推論。因此試驗時必須遵守下列三個原則 設置重複(set up replication) 隨機排列(random arrangement) 誤差控制(error control)

設置重複 同一處理(如食品、藥品、療法、品種)所使用的試驗單位數即為重複。 主要作用是估算試驗誤差以備統計推論之用。 若試驗只做一次(重複一次),則無法估算試驗誤差,也就無法做統計推論。 重複次數愈多,理論上試驗誤差愈小,試驗結果會愈準確可靠。 一般來說,計量資料,如果誤差控制得好,設計均衡,10~20次即可,甚至還可小一些;而計數資料,即使誤差控制得好,也需要30-100次左右。

隨機排列 哪一個處理被安排於哪個試驗單位要機會均等,不能有人為的主觀偏見。 隨機排列與重複相結合,試驗數據就能估算無偏的(unbiased)試驗誤差,統計推論才合理可靠。 隨機法有:拋硬幣,擲骰子,抽籤,利用隨機數字表

系統誤差(systematic error) (知道原因的誤差,有方向) 隨機誤差(random error) (不知道原因的誤差) 誤差控制 誤差來源有兩種(見2.7節) 系統誤差(systematic error) (知道原因的誤差,有方向) 隨機誤差(random error) (不知道原因的誤差)

10.5.1 完全隨機設計(CRD) (one-way ANOVA) 採用本設計的條件(本設計只有隨機誤差) 各處理(如以A、B、C代表三種食品、藥品)所使用的試驗材料要同質(或同時或同環境)進行試驗 各處理要隨機排列如圖: 本設計之優點:試驗最簡單,試驗結果效力最高,適合任意處理數及重複數的試驗。

[例] 設今有A,B,C三種營養食品,以老鼠為試驗材料,每種食品飼養4隻老鼠(4重複),其試驗設計圖及一個月後之增重(克)如下圖

資料整理 ---------------------------------------------- 處理 觀測值 處理 和 處理均值 處理 觀測值 處理 和 處理均值 ----------------------------------------------- A 1.4 1.9 2.0 1.5 6.8 1.7 B 2.0 2.4 1.8 2.2 8.4 2.1 C 2.6 2.8 2.5 2.1 10.0 2.5 -------------------------------------------------- 25.2

各種平方和之計算 SST= SSt= SSE=SST-SSt=2.00-1.28=.72

變方分析表 變 因 自由度 平方和 均方 實測F值 理論F值(0.05) ------------------------------------------------- 食品(t) 3-1=2 1.28 6.4 8.0 4.26 誤差(E) 11-2=9 .72 .8 總計(T) 12-1=11 2.00 三種參試食品品質間有顯著差異

處理均值間比較 比較結果C與B,B與A無差異,但C與A則有差異 處理 均值 實測差異值 處理 均值 實測差異值 ------------------------------------ C 2.5 - B 2.1 .4 - A 1.7 .8 .4 - 比較結果C與B,B與A無差異,但C與A則有差異

10.5.2 隨機完全區集設計(RCBD) (two-way ANOVA) 採用本設計條件 試驗材料為異質(或異時或異環境),但可明顯分成幾組,每組集合數個性質相同的試驗單位而成一區集(block)。 各區集內之試驗單位數必須等於處理數 在各區集內參試處理要隨機排列,形成同源配對

隨機完全區集設計(RCBD) 本設計優點: 可剔除試驗材料(或時間或環境)不同時之系統誤差,以減小試驗誤差。 任意處理數及區集數均可。 本設計缺點: 若試驗材料為同質,其試驗效果不如完全隨機設計(CRD)。 試驗結果資料有缺值時,資料分析比較複雜。

例子10.7假設有A、B、C、D四種血液凝結處理方法,如選取五位健康成人,每人抽血後分成四份,並隨機分配四種凝血處理方法,所得血液凝固時間如下圖,試比較何種處理方法較佳。 試驗設計圖 B 9.4 C 9.9 A 8.6 C 8.9 D 9.5 A 8.4 D 14.4 C 10.2 B 9.8 B 9.2 D 12.2 A 10.8 D 12.0 A 8.4 C 9.8 B 15.2 D 9.8 A 8.8 C 8.5

資料整理 區集 處理 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 處理和 A B C D 8.4 10.8 8.6 8.8 8.4 9.4 15.2 9.8 9.8 9.2 9.8 9.8 10.2 8.9 8.5 12.2 14.4 9.8 12.0 9.5 45.0 53.4 47.3 57.9 區集和 39.8 50.3 38.4 39.5 35.6 203.6=

(1)虛無假設 (2)對立假設 (3)設定顯著水準 (單尾) (4)計算F值 首先求各效應平方和:

雙向 變方分析表 實測 ,故拒絕H0的假設,表示四種凝血處理方法有差別。 變因 自由度(DF) 平方和(SS) 均方 實測F值 F值機率 (S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 0.05 0.01 區集(B) 處理(t) 誤差(E) 5-1=4 4-1=3 19-7=12 31.427 20.604 16.641 7.8568 6.8680 1.3868 5.665 4* * 4.9524* 3.26 5.41 3.49 5.95 總和(T) 20-1=19 68.672 實測 ,故拒絕H0的假設,表示四種凝血處理方法有差別。

成對處理均值間差異比較 處理均值間差異比較表 處理 均值 實測差異值 D與B,A與C無差異,但D與B比A與C,血液凝固時間長 處理 均值 實測差異值 ----------------------------------------------------- D 11.58 - B 10.68 0.90 - C 9.46 2.12 1.22 - A 9.00 2.58 1.68 0.46 - ------------------------------------------------------ D與B,A與C無差異,但D與B比A與C,血液凝固時間長

若改為單向 變方分析(CRD) 實測 ,故接受H0的假設,表示四種凝血處理方法無差別,其原因是誤差均方太大之故。 變因 自由度(DF) (S.V.) 自由度(DF) 平方和(SS) 均方 (MS) 實測F值 F值機率 0.05 0.01 處理(t) 誤差(E) 4-1=3 19-7=16 20.604 48.068 6.8680 3.00425 2.2861 3.24 5.29 總和(T) 20-1=19 68.672 實測 ,故接受H0的假設,表示四種凝血處理方法無差別,其原因是誤差均方太大之故。

10.6 族群容許區間(Tolerance Interval) 範圍 信賴水準 (μ-1.645σ, μ+1.645σ) 90% (μ-1.96σ, μ+1.96σ) 95% (μ-2.58σ, μ+2.58σ) 99% 族群中95%的觀測值會落在(μ-1.96σ, μ+1.96σ)之間

族群均值及變方未知之容許區間 μ及σ2未知時必須修正為κ值,替代標準常態百分位 κ值隨樣品大小,信心水準(1-γ)與包含率(1-α)而異,見P.490-492 附表13 所得的容許區間: 吾人有(1-γ)%信心水準,族群中(1-α)%觀測值介於       之間 應用於品管方面: (1-γ)%信心保證(1-α)%產品會在       之間  應用於生物特性正常值範圍

例:某醫院30位新生兒血液中含鈣量(mg%) [例10.12]

~本章結束~