第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
6-1 平均數比較 (各種T Test的應用) 平均數比較(Compare Means)是常用的統計分析,也就是各種T Test的應用, SPSS提供5種平均數比較的方法如下: Means平均數分析 One-Sample T Test單一樣本T檢定 Independent-Sample T Test 獨立樣本T檢定 Paired-Samples T Test成對樣本T檢定 One-Way ANOVA單因子變異數分析 使用時機的整理: 不同類別變數組合下, 連續變數在各組的平均數, 標準差, 次數等:使用平均數 單一變數的平均數作檢定:單一樣本T檢定 兩組平均數差異的檢定(獨立樣本):獨立樣本T檢定 兩組平均數差異的檢定(相依樣本):成對樣本T檢定 多個母體平均數差異的檢定:One-Way ANOVA 單因子變異數分析 ( ANOVA於 第十章再詳細介紹) 說明: 1. 獨立樣本:兩個來自於獨立, 没有相關的樣本 2. 成對樣本:兩個平均數來自於同一個樣本, 有關係的樣本
6-2 Means 平均數分析 Means 平均數分析是用在不同類別變數組合下, 連續變數在各組的統計量, 例如:平均數, 中位數, 標準差, 總合, 最小值, 最大值, 範圍, 峰度, 偏態…等等, 也可以勾選Anova table and eta, 進行單因子變異數分析和Test for linearity 線性檢定 範例: 我們以大學生為例, 抽樣調查12個大學生的No 編號,Sex 性別(1 男性,2 女性) , Score 學期成績, Cost 每月花費,Income 家庭收入 (1 低收入,2 高收入), Location 區域 (1北部,2 中部,3 南部) 如下: No Sex Score Cost Income Location 1 2 79.00 8500.00 2 2 2 1 88.00 4800.00 1 3 3 1 72.00 9200.00 1 1 4 2 76.00 12000.00 1 1 5 2 85.00 15000.00 2 1 6 1 81.00 7200.00 1 2 7 2 76.00 6800.00 1 2 8 2 72.00 8000.00 2 3 9 2 70.00 9500.00 2 1 10 1 65.00 5000.00 2 3 11 1 75.00 6000.00 1 2 12 1 66.00 7000.00 2 3 我們在不同類別變數組合下,進行Means 平均數分析。
實務操作: 1. 開啟範例檔 cost.sav 2. 按 Analyze Compare Mean Means 3. 在 Means 視窗,選取 Score 和 Cost 變數 4. 在 Means 視窗,按 > , 將Score 和 Cost 變數選入 Dependent List,再選取Sex,Income,Location變數 5. 在 Means 視窗,按 > , 將Sex,Income,Location變數選入 Independent List 6. 按Options , 將需要的統計量選入 Cell Statistics,預設有 Mean平均數, Number of case , Standard Deviation 標準 差,選取Anova table and eta 和 test for linearity 7. 按 Continue,回到 Means 視窗 8. 按 OK,出現報表結果
報表分析結果如下: Means Case Processing Summary 各種變數的組合,有樣本的 Included 包含有,Excluded 排除 和 Total 總共。
ANOVA Table(a,b) a With fewer than three groups, linearity measures for Score * Sex cannot be computed. b With fewer than three groups, linearity measures for Cost * Sex cannot be computed. 在不同性別下, Score 學期成績的 Sig. P=0.673 未達顯著水準,在不同性別下,Cost 每月花費的 Sig. P=0.035 達顯著水準。
ANOVA Table(a,b) a With fewer than three groups, linearity measures for Score * Income cannot be computed. b With fewer than three groups, linearity measures for Cost * Income cannot be computed. 在不同家庭收入下, Score 學期成績的 Sig. P=0.219 未達顯著水準,在不同家庭收入下,Cost 每月花費的 Sig. P=0.517 未達顯著水準。
ANOVA Table 在 Location 區域 和 Score 學期成績的 ANOVA分析 Sig. P=0.645 未達顯著水準,在 Location 區域和Cost 每月花費的ANOVA分析 Sig. P=0.008 達顯著水準。
總結: Mears平均數分析在一般情形下較為少用, 原因是Mears平均數提供的各種統計量, 都較其它的功能不足, 我們整理如下: 一般敍述性統計:一般用Descriptives取代 ANOVA檢定:一般用One-Way ANOVA取代 關聯分析:一般用相關分析Correlate取代
6-3 單一樣本 T檢定 單一樣本 T檢定 (One-Sample T Test)是適用於用單一變數的平均數作檢定, 也就是說, 檢定樣本數中某一個變數的平均數是否與母體的平均數有無顯著的不同, 條件是母體的平均數為必須為己知, 研究假設如下: 虛無假設 H0: = 0 (無顯著差異) 對立假設 H1: 1 (有顯著差異) 單一樣本T檢定的統計量: t = = 樣本平均數 u = 母體的平均數 s = 樣本的標準差 N = 樣本數 自由度 df = N-1 注意: 在常態分配下, 平均數比較中, 母體平均數u 的檢定是與母體操準差 (已知, 未知) 和樣本數N(大, 小)有關, 檢定的方式有Z值, Z分配和t值(t分配)兩種, 分別如下: Z = , t = ,
我們整理檢定方式中Z值與t值的適用方式, 如下: 在母體的標準差未知, 小樣本N<30的情形下:使用t值 在母體的標準差未知, 大樣本的情形下:使用Z值 有趣的是當樣本數增大時, t分配會趨近Z分配, 也就是可以使用t值來替代Z值的判定, 在實務上, 我們大多都是用樣本推論母體, 母體提供t檢定, 而無Z檢定 範例: 我們以大學生的生活花費為例, 在不考慮租屋費用和課業花費的情況下, 根據調查, 家長給大學生每個月的平均生活花費為$6000, 我們抽樣12個大學生每個月的花費如下:
研究假設如下: 虛無假設H0:u = 6000元, 無顯著差異 H1:u 6000元, 有顯著差異 小樣本, 母體常態且變異數未知, 所以, 適用t分配來檢定母體平均數 Total cost= 99000 樣本平均數 = 99000/12 = 8250 = 樣本變異數S2= = (8500-8250)2 = = 8591818 樣本標準差 = S = = = 2931
查表: t = t = 2.201 >t 結論: 檢定統計量t = 2.659, >t , 拒絕虛無假設 在 = 0.05水準下, 大學生的花費和家長給的生活有顯著的差異, 因此, 可以解釋為許多大學生為了生活費, 而不得不外出打工
實務操作: 1. 開啟範例檔 cost.sav 2. 按 Analyze Compare Mean One-Sample T Test 3. 在One-Sample T Test 視窗,選取Cost 4. 在One-Sample T Test 視窗,按 > 將Cost 變數選入 Test Variable,在 Test Value 輸入6000 5. 按 Options,出現One-Sample T Test Options視窗,使 用預設值 6. 按 Continue,回到 One-Sample T Test 7. 按 OK,出現報表結果
報表分析結果如下: T-Test One-Sample Statistics 顯示 Cost 每月花費的 N 樣本數, Mean平均數 每月花費8250元,Std. Deviation 標準差和 Std. Error Mean 標準差平均數。 One-Sample Test Cost 每月花費: 檢定統計量t = 2.659, Sig. P=0.022 <0.05, 拒絕虛無假設 在 = 0.05水準下, 大學生的平均每月花費8250元和家長給的平均生活費 6000元 有顯著的差異, 因此, 可以解釋為許多大學生為了生活費, 而不得不外出打工。
6-4 獨立樣本T檢定 獨立樣本T檢定(Independent-Sample T Test),獨立樣本是受測者隨機分派至不同組別,各組別的受測者没有任何關係, 也稱為完全隨機化設計。T Test (T檢定)是用來檢定2 個獨立樣本的平均數差異是否達到顯著的水準。也就是說這二個獨立樣本可以透過分組來達成,計算t檢定時,會需要2個變數,我們會將自變數x分為2個組別,檢定2個獨立樣本的平均數是否有差異(達顯著水準)得考慮從2個母體隨機抽樣本後,計算其平均數u差異的各種情形。 研究假設如下: 虛無假設 H0: = (無顯著差異) 對立假設 H1: (有顯著差異)
實務操作: 1. 開啟範例檔 cost.sav 2. 按 Analyze Compare Mean Independent-Samples T Test 3. 在 Independent-Samples T Test 視窗,選取Score和Cost 變數 4. 在 Independent-Samples T Test 視窗,按 > 將Score 和 Cost 變數 選入 Test Variable,在選取 Sex 變數 5. 按 > 將Sex變數選入 Grouping Variable 6. 按 Define Groups,出現Define Groups 視窗,在 group1 輸入1, group2輸入2 7. 按 Continue,回到 Independent-Samples T Test 視窗 8. 按 OK,出現報表結果
報表分析結果如下: T-Test Group Statistics 以Sex 性別(1 男性,2 女性) 做分組,顯示 1 男性,2 女性在 Score 學期成績, Cost 每月花費的四個統計量 N樣本數,Mean平均數, Std. Deviation 標準差和 Std. Error Mean 標準誤差平均數。
Independent Samples Test 以Sex 性別(1 男性,2 女性) 做分組,顯示在 Score 學期成績,檢定統計量 t = -.434, Sig. P=0.673 >0.05, 接受虛無假設,在 = 0.05水準下, 大學生男女性別的Score 學期成績 平均數 是ㄧ樣的,沒有顯著的差異。 在Cost 每月花費,檢定統計量 t = -2.445, Sig. P=0.035 <0.05, 拒絕虛無假設,在 = 0.05水準下, 大學生男女性別的Cost 每月花費 平均數 是不ㄧ樣的,有顯著的差異, 女生平均每月花費9966元比男生平均每月花費6533元較高。
6-5 成對樣本T檢定 成對樣本T檢定 (Paired-Sample T test),成對樣本T檢定是使用於相依樣本, 最常用在相依樣本下的重複量測設計(repeated measure design), 也就是同一個樣本, 前後量測二次, 例如, 消費者對於使用筆記型電腦前和使用筆記型電腦後, 態度是否有差異。 研究假設如下: 虛無假設 H0:u1= u2 (無顯著差異) 對立假設 H1:u1 u2 (有顯著差異) 成對樣本T檢定的統計量: t = 成對差D:施測前後的差值 (X1-X2) 成對差D的平均數 = 成對差D的變異數:S 自由度df = N-1
範例: 大學生使用某品牌筆記型電腦前和使用後的印象分數如下: 研究假設 :虛無假設 H0:uD= 0 (無顯著差異) 大學生使用某品牌筆記型電腦前和使用後的印象分數如下: 研究假設 :虛無假設 H0:uD= 0 (無顯著差異) 對立假設 H1:uD> 0 (有顯著差異)
樣本成對差 D的平均數 = 樣本成對差 D的變異數 SD = = =3.286 N < 30 為小樣本, 成對差母體為常態, 變異數未知, 所以, 使用t分配,檢定標準 = 0.05 自由度df = n-1 = 4 t = 2.132 結論: t = 6.396 t = 2.132 t > t , 拒絶虛無假設 因此, 我們可以解釋大學生對於使用某種品牌筆記型電腦前和使用後的印象有顯著的差異, 也就是使用後的印象較使用前的印象差。
實務操作: 1. 開啟範例檔 pair.sav 2. 按 Analyze Compare Mean Paired-Samples T test 3. 在 Paired-Samples T Test 視窗,選取 Before 和 After 變數 4. 按 > 將Before 和 After 變數選入 Paired Variables 5. 按 Options,出現 Paired-Samples T Test Options視窗, 使用預設值 6. 按 Continue,回到 Paired-SamplesT Test 7. 按 OK,出現報表結果
報表分析結果如下: T-Test Paired Samples Statistics 顯示 Before 使用前的印象分數和 After使用後印象分數 的四個統計量 N樣本數,Mean平均數, Std. Deviation 標準差和 Std. Error Mean 標準誤差平均數。 Paired Samples Correlations 顯示 Before 使用前的印象分數和 After使用後印象分數 的相關係數 0.997,P=0.004 達顯著水準 。
Paired Samples Test 從表中,我們可以看出 t = 6.396,Sig. P=0.004 達顯著水準,拒絶虛無假設。顯示大學生對於使用某種品牌筆記型電腦前和使用後的印象分數不同, 因此, 我們可以解釋大學生對於使用某種品牌筆記型電腦前和使用後的印象有顯著的差異, 也就是使用後的印象較使用前的印象差。