R教學 t檢定R指令與範例 羅琪老師.

Slides:



Advertisements
Similar presentations
20-Opening 統計學 授課教師:楊維寧 10Simple-R-Commands.
Advertisements

第 11 章 假設檢定的介紹.
單元九:單因子變異數分析.
假设检验.
單元十四、平均數檢定 國立高雄餐旅學院 沈瑞棋.
單元九、平均數檢定 國立高雄餐旅學院 沈瑞棋.
實驗規劃--實驗因子設定, 效標選定與受測者選定
第9章 假設檢定.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
第九章平均數的差異考驗 Z與t考驗.
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
第 10 章 單組樣本的假設檢定.
第 9 章 假設檢定 Part A ( ).
第 9 章 假設檢定 Part A ( ).
第 8 章 一組樣本 單變項推論方法.
第 10 章 假設檢定的介紹與單一母體的介紹.
第 13 章 兩個母體比較的推論.
判斷步驟 Step 1 :判斷是否為常態分配 Step 2 :如果是常態分配,用「假設檢定」,如果不是請看 Step 3
17 類別資料的分析  學習目的.
假設檢定.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
商用統計學 Chapter 8 假設檢定.
Sampling Theory and Some Important Sampling Distributions
兩獨立母體成功比例差- Z檢定(大樣本):說明
平均值檢定 4.1 檢定之原理 4.2 各種平均值之檢定 商管研究資料分析SPSS的應用 Chapter 4 平均值檢定.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
第十章 兩母體之假設檢定 Inferences Based on Two-Samples:
第 7 章 抽樣與抽樣分配 Part B ( ).
One-Sample Tests of Hypothesis
量化研究與統計分析 比較平均數 Test 謝寶煖 台灣大學圖書資訊學系 2006年4月1日.
11.1單一母體變異數的推論 前幾章中,我們以樣本變異數
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
Inferences Based on a Single Sample: Tests of Hypothesis Chapter 9
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
七. 假說檢定Ⅰ (Hypothesis Testing Ⅰ) (Chapter 7)
第 9 章 假設檢定 Part B ( ).
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
高中英语课堂教学目标 与任务设计的研究 结题报告 南京市教研室.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
搭配頁數 P.35 比例式 1.比的前項、後項與比值:    .
第 13 章 實驗設計與變異數分析 Part A ( ).
第十章補充 允收抽樣.
第 7 章 推論方法.
估計與假設檢定.
國立台灣體育學院 體育學系暨體育研究所 高明峰
第七章 假設檢定.
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
Some Important Probability Distributions
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27.
Introduction to Basic Statistics
Parameter Estimation and Statistical Inference
假 設 檢 定.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
Chapter 8 假設檢定.
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
第 11 章 假設檢定的介紹.
第 12 章  變異數分析.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
第 零 章 假 設 檢 定.
政治大學財政所與東亞所選修--應用計量分析--中國財政研究 黃智聰
假說檢定程序 3.1 定義 3.2 假說檢定程序 3.3 檢定的種類與方法 3.4 統計檢定精神 個案:假說建立
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

R教學 t檢定R指令與範例 羅琪老師

z檢定 (母體標準差σ已知) t檢定 (母體標準差σ未知) 大樣本z檢定 (母體標準差未知,大樣本) 一個母體平均數的檢定 z檢定 (母體標準差σ已知) t檢定 (母體標準差σ未知) 大樣本z檢定 (母體標準差未知,大樣本)

z檢定(母體標準差σ已知) 母體平均數的單尾檢定 (one-tailed tests) 有以下兩種形式: 左尾檢定 右尾檢定 2019/5/24 z檢定(母體標準差σ已知) 母體平均數的單尾檢定 (one-tailed tests) 有以下兩種形式: 左尾檢定 右尾檢定

當H0 為真時,我們期望差距會很小,若差距很大時,一定是假設錯誤,所以要拒絕H0 但差距多大才是很大? 2019/5/24 母體平均數假設檢定的檢定統計量:σ 已知 z值在測量樣本平均數 與假設值 的差距 當H0 為真時,我們期望差距會很小,若差距很大時,一定是假設錯誤,所以要拒絕H0 但差距多大才是很大?

樣本平均數 的抽樣分配是常態分配,則Z服從標準常態分配 2019/5/24 若樣本是一隨機樣本來自常態分配且σ 已知 樣本平均數 的抽樣分配是常態分配,則Z服從標準常態分配

單尾檢定的 p 值法 p值是機率,以檢定統計量計算而得,用以衡量樣本資料支持 (或不支持) 虛無假設H0的程度。 2019/5/24 單尾檢定的 p 值法 p值是機率,以檢定統計量計算而得,用以衡量樣本資料支持 (或不支持) 虛無假設H0的程度。 p 值愈小,愈不支持虛無假設H0。較小的 p 值表示,虛無假設H0為真時,得到此種樣本是較不尋常的。 若 p 值 < α,則拒絕 H0。

單尾檢定的臨界值法 在 σ 已知時,檢定統計量 z 的抽樣分配是標準常態分配。 2019/5/24 單尾檢定的臨界值法 在 σ 已知時,檢定統計量 z 的抽樣分配是標準常態分配。 我們可以用標準常態機率分配表以得到對應於左尾(或右尾)面積為 α 時的 z 值。 假設檢定量的值建立在拒絕域稱為檢定之臨界值的決策法則為: 左尾檢定:若 z < - zα,則拒絕H0 右尾檢定:若 z > zα,則拒絕 H0

2019/5/24 母體平均數的檢定:σ 已知 (實例) 美國聯邦貿易委員會 (FTC) 定期檢驗製造商的宣稱或保證。例如,Hilltop 咖啡在其大罐裝咖啡上標示每罐內容物有 3 磅,FTC 瞭解 Hilltop 咖啡的製程不可能讓每罐咖啡恰好重 3 磅。但是,只要母體的平均重量至少 3 磅,消費者權益即受到保障。因此,FTC 將 Hilltop 在咖啡罐上的標籤所提供的訊息視為 Hilltop 的宣稱,即母體的平均裝填重量為每罐至少 3 磅。我們將說明 FTC 如何進行左尾檢定,以檢驗 Hilltop 的宣稱。

2019/5/24 步驟 1. 建立適當的虛無和對立假設。 如果咖啡的母體平均裝罐重量大於 3 磅,則 Hilltop 的聲稱是正確的,這是虛無假設;但如果母體平均的裝罐重量小於 3 磅,則 Hilltop 的聲稱就不正確,這是對立假設。以 μ 代表母體的平均重量,則虛無與對立假設可表示為 H0 : μ ≥ 3 H1 : μ < 3

2019/5/24 步驟 2. 確認顯著水準 α FTC的主管選擇以 0.01 為檢定的顯著水準。α=0.01表示FTC的主管願意接受 0.01 的機率在虛無假設的等號(μ0= 3)成立時,拒絕虛無假設。 步驟 3. 蒐集樣本資料、計算統計檢定量的值 檢定統計量 樣本資料

2019/5/24 p 值法 步驟 4. 運用檢定統計量的值求得 p 值 運用標準常態分配表可以發現,介於平均數0及 z=-2.67 之間的面積是0.4962。因此,p 值是 0.5000-0.4962=0.0038。 步驟 5. 若 p值 < α=0.01,則拒絕 H0 p 值是 0.0038,因此拒絕虛無假設。

2019/5/24

運用標準常態分配表可以看到,對應於左尾面積 α =0.01 的 - zα =-2.33 2019/5/24 臨界值法 步驟 4. 運用顯著水準決定臨界值與決策法則。 運用標準常態分配表可以看到,對應於左尾面積 α =0.01 的 - zα =-2.33

步驟 5. 運用檢定統計量的值與決策法則判定是否拒絕 H0。 2019/5/24 步驟 5. 運用檢定統計量的值與決策法則判定是否拒絕 H0。 檢定統計量若小於-2.33,對應的 p 值將小於 0.01,我們就拒絕 H0。所以,Hilltop 咖啡研究中,顯著水準為 0.01 時的拒絕法則是 若 z <-2.33,則拒絕 H0 Hilltop 咖啡的例子中, =2.92,檢定統計量 z=-2.67,因為 z=-2.67 < -2.33,我們可以拒絕 H0,得到的結論是 Hilltop 咖啡有偷斤減兩的問題。

z檢定 (母體標準差σ已知) > xbar<-2.92 > mu<-3 > sigma<-0.18 > n<-36 > z<-(xbar-mu)/(sigma/sqrt(n)) > z [1] -2.666667 > zcrit<-qnorm(0.01,0 ,1) # 標準常態分配的z0.01臨界值 > zcrit [1] -2.326348 因為 z=-2.67 < -2.33,我們可以拒絕 H0,得到的結論是 Hilltop 咖啡有偷斤減兩的問題。

z檢定 (母體標準差σ已知) > xbar<-2.92 > mu<-3 > sigma<-0.18 > n<-36 > z<-(xbar-mu)/(sigma/sqrt(n)) > z [1] -2.666667 > if (z>0) zpvalue=1-pnorm(z,0,1) else zpvalue=pnorm(z,0,1) > zpvalue [1] 0.003830381 因為 p-value=0.0038< 0.01,我們可以拒絕 H0,得到的結論是 Hilltop 咖啡有偷斤減兩的問題。

2019/5/24 雙尾假設檢定 假設檢定中,母體平均數的雙尾檢定 (two-tailed test) 之一般形式如下:

雙尾假設檢定的 p 值法 雙尾檢定的 p 值計算過程簡化為以下三個步驟 1.計算檢定統計量 z 的值。 2019/5/24 雙尾假設檢定的 p 值法 雙尾檢定的 p 值計算過程簡化為以下三個步驟 1.計算檢定統計量 z 的值。 2.如果檢定統計量的值在右尾 (z > 0) ,求出標準常態曲線下方,在 z 值以右的面積。如果檢定統計量的值在左尾 (z < 0),求出標準常態曲線下方,在 z 值以左的面積。 3.將步驟 2 得到的面積 (即機率) 乘以 2,即為 p 值。 決策法則是: 若 p 值 < α,則拒絕H0

雙尾假設檢定的臨界值法 利用比較檢定統計量 z 與臨界值,以進行雙尾檢定。 2019/5/24 雙尾假設檢定的臨界值法 利用比較檢定統計量 z 與臨界值,以進行雙尾檢定。 查標準常態分配表可知檢定統計量的臨界值是 -zα/2 與 zα/2。(位於分配表兩尾臨界值以外,由 α/2 所對應的 z 值) 決策法則是: 若 z < -zα/2 或 z > zα/2,則拒絕 H0

2019/5/24 雙尾假設檢定:σ 已知(實例) 美國高爾夫協會 (USGA) 為高爾夫球具擬定製造規格,所有球具、裝備皆需符合規格,才能在 USGA 舉辦的賽事中使用,MaxFlight 公司運用高科技製程生產高爾夫球,高爾夫球的平均移動距離是 295 碼。有時因製程調整不當,平均移動距離與 295 碼有所出入。 如果低於 295 碼,將與廣告所宣稱的不符,MaxFlight 擔心會失去訂單,不利銷售。 如果超過 295 碼,MaxFlight 的高爾夫球將被拒於 USGA 的賽事以外。

MaxFlight 的品質管制計畫會定期抽取 50 個高爾夫球為樣本以監控製程。對每組樣本而言,假設檢定的目的在於決定是否要調整製程。 2019/5/24 MaxFlight 的品質管制計畫會定期抽取 50 個高爾夫球為樣本以監控製程。對每組樣本而言,假設檢定的目的在於決定是否要調整製程。 我們要建立虛無假設與對立假設,首先假定製程正常,即高爾夫球的平均移動距離是 295 碼。此即為虛無假設,對立假設則是平均距離不等於 295 碼。

假設值 μ0=295,MaxFlight 假設檢定的虛無假設與對立假設分別是: H0 : μ = 295 H1 : μ ≠ 295 2019/5/24 步驟 1. 假設值 μ0=295,MaxFlight 假設檢定的虛無假設與對立假設分別是: H0 : μ = 295 H1 : μ ≠ 295 步驟 2. 品管小組選擇 α =0.05為檢定的顯著水準。

樣本資料:σ = 12 ,樣本大小 n =50, = 297.6 碼,因此統計檢定量是 2019/5/24 步驟 3. 統計檢定量 樣本資料:σ = 12 ,樣本大小 n =50, = 297.6 碼,因此統計檢定量是

雙尾檢定的 p 值是 P(z ≤ -1.53) + P(z ≥ 1.53)= 2(0.0630) = 0.1260 2019/5/24 p 值法 步驟 4. 雙尾檢定的 p 值是 P(z ≤ -1.53) + P(z ≥ 1.53)= 2(0.0630) = 0.1260 步驟 5. 比較 p 值與顯著水準,以判斷是否拒絕虛無假設,顯著水準 α = 0.05,因為 p 值=0.1260 > 0.05,所以不拒絕 H0。由於不拒絕虛無假設,MaxFlight無須對製程進行調整。

2019/5/24

顯著水準 α =0.05,位於兩尾的臨界值以外的面積各為 α /2=0.05/2=0.025。 2019/5/24 臨界值法 步驟 4. 顯著水準 α =0.05,位於兩尾的臨界值以外的面積各為 α /2=0.05/2=0.025。 查標準常態分配表可知,檢定統計量的臨界值是-z0.025=-1.96 與 z0.025=1.96。

2019/5/24

步驟 5. 因此,運用臨界值法雙尾檢定的決策法則是 若 z <-1.96 或 z >1.96,則拒絕H0 2019/5/24 步驟 5. 因此,運用臨界值法雙尾檢定的決策法則是 若 z <-1.96 或 z >1.96,則拒絕H0 由於 MaxFlight 問題的假設檢定量為 z=1.53,表示在 0.05 的顯著水準下,沒有足夠證據顯示高爾夫球的平均移動距離不是 295 碼。

z檢定 (母體標準差σ已知) > xbar<-297.6 > mu<-295 > sigma<-12 > n<-50 > z<-(xbar-mu)/(sigma/sqrt(n)) > z [1] 1.532065 > zcrit<-qnorm(c(0.025, 0.975) ,0 ,1) > zcrit [1] -1.959964 1.959964 因為-1.96 < z=1.53 < 1.96,我們不拒絕 H0,得到的結論沒有足夠證據顯示高爾夫球的平均移動距離不是 295 碼。

z檢定 (母體標準差σ已知) > xbar<-297.6 > mu<-295 > sigma<-12 > n<-50 > z<-(xbar-mu)/(sigma/sqrt(n)) > z [1] 1.532065 > if (z>0) zpvalue=2*(1-pnorm(z,0,1)) else zpvalue=2*pnorm(z,0,1) > zpvalue [1] 0.1255065 因為 p-value=0.126> 0.05,所以不拒絕 H0。由於不拒絕虛無假設,MaxFlight無須對製程進行調整。

t檢定(母體標準差σ未知) 母體標準差σ未知,用樣本標準差s估計 檢定統計量:σ未知 2019/5/24 t檢定(母體標準差σ未知) 母體標準差σ未知,用樣本標準差s估計 檢定統計量:σ未知 檢定統計量 t 的機率分配是自由度為 n - 1 的 t 分配。

若t < -tα/2 或 t > tα/2,則拒絕 H0 2019/5/24 決策法則: p 值法 若 p 值 < α ,則拒絕 H0 決策法則: 臨界值法 H0:  H1: < 若t < -tα,則拒絕 H0 H0:  H1: > 若t > tα ,則拒絕 H0 H0:  H1:   若t < -tα/2 或 t > tα/2,則拒絕 H0

2019/5/24 t檢定R範例(σ未知, 單尾檢定) 某品牌寶特瓶汽水標示重量為1000公克,消費者覺得標示有問題,他隨機挑選10瓶汽水,測量汽水淨重,根據下表數據,請問該品牌寶特瓶汽水重量標示是否不實 H0 : μ > 1000 檢定統計量是 H1 : μ < 1000 編號 1 2 3 4 5 6 7 8 9 10 淨重 985 928 950 1010 945 989 965 1005 968 1015

t檢定 (σ未知, 單尾檢定) > softdrink<-read.csv("c:/RData/softdrink.csv“, header=T) > softdrink number net.weight 1 1 985 2 2 928 3 3 950 4 4 1010 5 5 945 6 6 989 7 7 965 8 8 1005 9 9 968 10 10 1015

t檢定 (σ未知, 單尾檢定) > attach(softdrink) > t.test(net.weight, alternative="less", mu=1000) # Ho: mu=1000 One Sample t-test data: net.weight t = -2.5626, df = 9, p-value = 0.01528 alternative hypothesis: true mean is less than 1000 95 percent confidence interval: -Inf 993.1679 sample estimates: mean of x 976 t值為-2.5626,自由度=n-1=10-1=9 因為 p-value=0.01528 < α =0.05 所以拒絕H0,即該品牌寶特瓶汽水重量標示不實;同時從樣本平均數的大小(976公克)可知,其重量低於標示值1000公克。

2019/5/24 t檢定R範例(σ未知, 雙尾檢定) 教育部在全國性調查中得知國小三年級學童之平均體重為32公斤,某位國小老師想了解該校三年級學童之體重狀況,在該年級隨機抽取20名,測量得重量如下表所示,請問該位老師如何解釋該校三年級學童之體重發展? H0 : μ = 32 檢定統計量是 H1 : μ  32 編號 1 2 3 4 5 6 7 8 9 10 重量 30 31 35 27 28 36 33 編號 11 12 13 14 15 16 17 18 19 20 重量 34 29 27 28 26 33 36

t檢定 (σ未知, 雙尾檢定) > student<-read.csv("c:/RData/weight.csv", header=T) > student number weight 1 1 30 2 2 31 3 3 35 4 4 27 5 5 28 6 6 36 7 7 35 8 8 31 9 9 30 10 10 33 11 11 34 12 12 29 13 13 27 14 14 28 15 15 26 16 16 34 17 17 33 18 18 36 19 19 34 20 20 29

t檢定 (σ未知, 雙尾檢定) > attach(student) > t.test(weight, alternative="two.sided", mu=32) One Sample t-test data: weight t = -0.9644, df = 19, p-value = 0.347 alternative hypothesis: true mean is not equal to 32 95 percent confidence interval: 29.7808 32.8192 sample estimates: mean of x 31.3 > detach(student) t值為-0.9644,自由度=19, 雙尾檢定的 p-value = 0.347 因為p值>0.05,所以不拒絕H0。結論: 沒有足夠證據顯示該校三年級學童之體重發展不同於全國三年級學童之體重發展。

z檢定(母體標準差未知,大樣本) 母體標準差σ未知,用樣本標準差s估計 檢定統計量:σ未知,n>30 2019/5/24 z檢定(母體標準差未知,大樣本) 母體標準差σ未知,用樣本標準差s估計 檢定統計量:σ未知,n>30 檢定統計量 z 的機率分配是近似標準常態分配。

若z < -zα/2 或 z > zα/2,則拒絕 H0 2019/5/24 決策法則: p 值法 若 p 值 < α ,則拒絕 H0 決策法則: 臨界值法 H0:  H1: < 若z < -zα,則拒絕 H0 H0:  H1: > 若z > zα ,則拒絕 H0 H0:  H1:   若z < -zα/2 或 z > zα/2,則拒絕 H0

兩個母體平均數的檢定 當兩樣本獨立時 Student t test (獨立樣本t檢定) 當兩樣本相依(不獨立)時 Paired t test (配對t檢定)(相依樣本t檢定)

獨立樣本t檢定 μ1= 母體 1 的平均數 μ2= 母體 2 的平均數 兩母體間平均數之差即為 μ1-μ2 虛無假設 對立假設 2019/5/24 獨立樣本t檢定 μ1= 母體 1 的平均數 μ2= 母體 2 的平均數 兩母體間平均數之差即為 μ1-μ2 虛無假設 對立假設 兩個母體平均數不同 第1個母體平均數小於 第2個母體平均數 第1個母體平均數大於 第2個母體平均數

獨立樣本t檢定資料滿足下面假設 設X1,X2,……,Xn1,是樣本大小為 n1,且取自平均數μ1,標準差σ1的常態母體1之隨機樣本。 2019/5/24 獨立樣本t檢定資料滿足下面假設 來自兩個母體之兩組獨立的隨機樣本,其資料結構與特性說明如下: 設X1,X2,……,Xn1,是樣本大小為 n1,且取自平均數μ1,標準差σ1的常態母體1之隨機樣本。 設Y1,Y2,……,Yn2,是樣本大小為 n2,且取自平均數μ2,標準差σ2的常態母體2之隨機樣本。 此兩組隨機樣本為獨立的。 兩母體的變異數相等,即σ12=σ22=σ2

2019/5/24 彙總統計量數 樣本 樣本平均數 樣本變異數 X1,X2,…,Xn1 取自母體1 Y1,Y2,…,Yn2 取自母體2

的抽樣分配 母體1與2皆為常態,而兩組隨機樣本皆為小樣本,且兩母體標準差皆為未知但相等(亦即σ1=σ2=σ,但σ未知),則統計量 2019/5/24 的抽樣分配 母體1與2皆為常態,而兩組隨機樣本皆為小樣本,且兩母體標準差皆為未知但相等(亦即σ1=σ2=σ,但σ未知),則統計量 Pooled variance 合併的變異數的估計值

母體1與2皆為常態,而兩組隨機樣本皆為小樣本,且兩母體標準差σ1與σ2皆未知亦不相等,則統計量 2019/5/24 母體1與2皆為常態,而兩組隨機樣本皆為小樣本,且兩母體標準差σ1與σ2皆未知亦不相等,則統計量

若t < -tα/2 或 t > tα/2,則拒絕 H0 2019/5/24 決策法則: p 值法 若 p 值 < α ,則拒絕 H0 決策法則: 臨界值法 若t < -tα,則拒絕 H0 若t > tα ,則拒絕 H0 若t < -tα/2 或 t > tα/2,則拒絕 H0

2019/5/24 獨立樣本t檢定範例 某老師想了解該校三年級男、女生英文成績是否有差異?因此於考試後,隨機抽取20位男生與19位女生,其測得之數據如下表,請問該校三年級男、女生英文成績是否有差異? No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 男生 80 75 79 86 68 72 84 78 85 76 81 77 90 89 87 74 女生 92 95 96

若t < -tα/2 =-t0.025=-2.026 或 t > tα/2 =t0.025=2.026 , 則拒絕 H0 2019/5/24 三年級男、女生英文成績沒有差異 三年級男、女生英文成績有差異 若t < -tα/2 =-t0.025=-2.026 或 t > tα/2 =t0.025=2.026 , 則拒絕 H0 因為t=-2.8274<-2.026,所以拒絕H0 ,所以三年級男、女生英文成績有顯著差異

sex english 1 1 80 2 1 75 3 1 79 4 1 86 5 1 68 6 1 72 7 1 84 8 1 86 9 1 78 10 1 85 11 1 76 12 1 81 13 1 77 14 1 90 15 1 89 16 1 90 17 1 87 18 1 81 19 1 86 20 1 74 21 2 78 22 2 92 23 2 75 24 2 84 25 2 79 26 2 75 27 2 90 28 2 84 29 2 86 30 2 95 31 2 85 32 2 89 33 2 87 34 2 92 35 2 90 36 2 89 37 2 96 38 2 95 39 2 92 獨立樣本t檢定 > english<-read.csv("c:/RData/english.csv", header=T) > english sex english 1 1 80 2 1 75 3 1 79 4 1 86 5 1 68 6 1 72 7 1 84 8 1 86 9 1 78 10 1 85 11 1 76 12 1 81 13 1 77 14 1 90 15 1 89 16 1 90 17 1 87 18 1 81 19 1 86 20 1 74 21 2 78 22 2 92 23 2 75 24 2 84 25 2 79 26 2 75 27 2 90 28 2 84 29 2 86 30 2 95 31 2 85 32 2 89 33 2 87 34 2 92 35 2 90 36 2 89 37 2 96 38 2 95 39 2 92

兩母體變異數相等的F檢定 檢驗兩母體之變異數是否相同 > var.test(english$english[english$sex==1], english$english[english$sex==2], ratio=1, alternative = "two.sided", conf.level = 0.95) F test to compare two variances data: english$english[sex == 1] and english$english[sex == 2] F = 0.92906, num df = 19, denom df = 18, p-value = 0.8726 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3606021 2.3651257 sample estimates: ratio of variances 0.9290642 檢驗兩母體之變異數是否相同 F值為0.92906,自由度=19, 18, 雙尾檢定的 p-value = 0.8726 因為p值>0.05,未達顯著水準,故應接受H0 。即兩母體之變異數無顯著差異。

兩母體變異數相等的F檢定 > var.test(english$english~english$sex, ratio = 1, alternative = "two.sided", conf.level = 0.95) F test to compare two variances data: english$english by english$sex F = 0.92906, num df = 19, denom df = 18, p-value = 0.8726 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3606021 2.3651257 sample estimates: ratio of variances 0.9290642 檢驗兩母體之變異數是否相同 F值為0.92906,自由度=19, 18, 雙尾檢定的 p-value = 0.8726 因為p值>0.05,未達顯著水準,故應接受H0 。即兩母體之變異數無顯著差異。

獨立樣本t檢定 檢驗兩母體之平均數是否相同 > t.test(english$english[english$sex==1], english$english[english$sex==2], var=T, alternative = "two.sided", conf.level = 0.95) Two Sample t-test data: english$english[sex == 1] and english$english[sex == 2] t = -2.8273, df = 37, p-value = 0.007532 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -9.956634 -1.643366 sample estimates: mean of x mean of y 81.2 87.0 檢驗兩母體之平均數是否相同 雙尾檢定,t值為-2.8273,自由度=37, p-value = 0.007532<0.05,拒絕H0。 即男生與女生的英文成績,有顯著的差異。

獨立樣本t檢定 > t.test(english$english~english$sex, var=T, alternative = "two.sided", conf.level = 0.95) Two Sample t-test data: english$english by english$sex t = -2.8273, df = 37, p-value = 0.007532 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -9.956634 -1.643366 sample estimates: mean in group 1 mean in group 2 81.2 87.0 檢驗兩母體之平均數是否相同 雙尾檢定,t值為-2.8273,自由度=37, p-value = 0.007532<0.05,拒絕H0。 即男生與女生的英文成績,有顯著的差異。

相依樣本t檢定(配對t檢定) 相依樣本設計 2019/5/24 相依樣本t檢定(配對t檢定) 相依樣本設計 重複量數設計(repeated measure design):同一個樣本的同一群人重複測量2次的結果 例如: 某班學生的期中考與期末考的成績 同一組人減肥前與減肥後的體重 配對樣本設計(matched sample design): 有配對關係的兩個樣本 例如: 夫妻兩人的薪資多寡 雙胞胎兄弟的學業成就

成對樣本 Before After 差異Di=Before-After 1 X1 Y1 D1=X1–Y1 2 X2 Y2 D2=X2–Y2 2019/5/24 成對樣本 Before After 差異Di=Before-After 1 X1 Y1 D1=X1–Y1 2 X2 Y2 D2=X2–Y2 ⁞ n Xn Yn Dn=Xn–Yn

設差異Di=Xi–Yi,假設差異D1,D2,…,Dn是取自N(μD,σD2)分配的一組隨機樣本,令 2019/5/24 設差異Di=Xi–Yi,假設差異D1,D2,…,Dn是取自N(μD,σD2)分配的一組隨機樣本,令 差異的平均數 差異的變異數

檢定統計量與抽樣分配 檢定統計量: 檢定統計量 t 的機率分配是自由度為 n - 1 的 t 分配。 2019/5/24 檢定統計量與抽樣分配 檢定統計量: 檢定統計量 t 的機率分配是自由度為 n - 1 的 t 分配。 μD= μ1- μ2 即表示兩種處理效果(前後)差異之平均數 若μD= 0 則表示兩種處理方式是相等的(前後沒有差異),若為正數則表示處理1平均反應值大於處理2(前>後)

決策法則 決策法則: p 值法 若 p 值 < α ,則拒絕 H0 決策法則: 臨界值法 若t < -tα,則拒絕 H0 2019/5/24 決策法則 決策法則: p 值法 若 p 值 < α ,則拒絕 H0 決策法則: 臨界值法 H0: D0 H1: D<0 若t < -tα,則拒絕 H0 H0: D0 H1: D>0 若t > tα ,則拒絕 H0 H0: D0 H1: D 0 若t < -tα/2 或 t > tα/2,則拒絕 H0

2019/5/24 相依樣本t檢定範例 某研究員想了解自我導向學習是否有助於學生數學成績之進步,隨機抽取20受測者,讓其接受三個月之訓練,並收集學習前與學習後之成績,其測得數據如下表,請問該研究員如何解釋數據結果 ? No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 學習前 75 88 70 82 76 67 73 80 85 68 72 71 77 87 86 74 79 學習後 78 92 84 90 89 83 差異 -3 -4 -5 -2 -8 -7 -1 -18 -9

因為t=-5.490<-1.7247,所以拒絕H0 ,所以自我導向學習有助於學生數學成績之進步 2019/5/24 自我導向學習無助於學生數學成績之進步 自我導向學習有助於學生數學成績之進步 若t < -tα =-t0.05=-1.7247 ,則拒絕 H0 因為t=-5.490<-1.7247,所以拒絕H0 ,所以自我導向學習有助於學生數學成績之進步

相依樣本t檢定(配對t檢定) 左尾檢定,t值為-5.4902,自由度=19, p-value = 0.000<0.05,故應拒絕H0。 > t.test(before, after, alternative = "less" ,mu=0, paired=T) Paired t-test data: before and after t = -5.4902, df = 19, p-value = 1.346e-05 alternative hypothesis: true difference in means is less than 0 95 percent confidence interval: -Inf -3.322485 sample estimates: mean of the differences -4.85 左尾檢定,t值為-5.4902,自由度=19, p-value = 0.000<0.05,故應拒絕H0。 即訓練前與訓練後的成績,有顯著的差異。所以自我導向學習有助於學生數學成績之進步

付出最多的人,也是收穫最多的人 ~共勉之~