Download presentation
Presentation is loading. Please wait.
Published byΈλλη Θεοτόκης Modified 5年之前
1
平均數檢定與變異數分析 莊文忠 副教授 世新大學行政管理學系 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
2
課程大綱 假設檢定(hypothesis test)的基本概念 雙母體的假設檢定 1.獨立樣本t檢定 2.相依樣本t檢定
單因子變異數分析(0ne-way ANOVA) 雙因子變異數分析(Two-way ANOVA) SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
3
假設檢定(hypothesis test)的基本概念
SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
4
假設檢定的意義 統計推論是從演繹的邏輯(logic of deduction)出發,先 提出有待檢證的「假設」(hypothesis),再蒐集證據 來支持此一假設,蒐集到愈多的證據,此一假設成 立的機率愈高,此時是運用歸納的邏輯(logic of induction)。 統計上,「假設」是有關母體特徵的陳述,通常是 以某一特定的數值或數值範圍來預測母體的參數 (Agresti & Finlay, 2009: 143)。 假設檢定是對母體特性(母體參數)提出「假設」或 「主張(claim)」,根據樣本中所獲得的樣本統計量, 在某些決策法則之下,「檢定」母體特性是否符合 此一假設,以決定接受或拒絕此一假設。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
5
假設檢定的意義 假設檢定的基礎是機率(probability),與假設一致 的情形發生的機會愈大時,我們就愈有信心說 假設為真;反之,當與假設不一致的情形發生 的機會愈大時,我們就愈傾向不接受原來的假 設。 統計顯著(statistical significance):指某個變數的變 異程度已經大到某種程度,由於偶然機遇 (chance)造成這種結果的機率是非常小時,稱此 一結果已達統計上的顯著性。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
6
假設檢定的步驟 設立兩個假設 選擇檢定統計量 選擇顯著水準及決定決策法則 計算信賴區間(confidence interval) 下結論
SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
7
設立兩個假設 提出虛無(null)假設和對立(alternative)假設
1.虛無假設:對母體參數的值提出一個主張其為真 實(除非證明其為非真)的假設,通常以H0表示之。 虛無假設對母體參數的猜測值必須包含等號。 2.對立假設:相對於虛無假設而對母體參數的值提 出另一個相反的主張或假設,通常以H1或Ha表示之。 三種可能的假設形式: H0: θ = θ0,H1: θ ≠ θ0形式 → 雙尾檢定 H0: θ ≧ θ0,H1: θ < θ0 → 單尾檢定(左尾檢定) H0: θ ≦ θ0,H1: θ > θ → 單尾檢定(右尾檢定) SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
8
兩種可能的決策錯誤 型I錯誤(type I error)—又稱為α錯誤或α風險 α=P(拒絕H0|H0為真)
型II錯誤(type II error)—又稱為β錯誤或β風險 β=P(不拒絕H0|H0不為真)=P(拒絕H1|H1為真) 接受H0 拒絕H0 H0為真 正確 機率=1-α 型I錯誤 機率=α H0不為真 型II錯誤 機率=β 機率=1-β SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
9
Example:新藥物是否具有療效 接受H0 拒絕H0 藥物無效 (H0為真) 正確決策 機率=1-α 錯誤決策 機率=α 藥物有效
機率=β 機率=1-β SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
10
選擇檢定統計量 決定拒絕或接受虛無假設的標準或法則,即在 某一區域內接受虛無假設,某一區域以外拒絕 虛無假設,統計學上稱此一接受域或拒絕域的 分界點為臨界點(critical point)。 檢定公式: SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
11
選擇顯著水準及決定決策法則 P-value H0: θ = θ0 ,P = 雙尾機率 H0: θ ≧ θ0,P = 左尾機率
一般所採用的顯著水準α為0.05(即容許犯型I錯 誤的機率為0.05),再根據α水準來決定臨界值。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
12
H0:μ≧3的拒絕域與接受域 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
13
計算信賴區間(confidence interval)
若θ的1-α信賴區間包含虛無假設H0:θ=θ0,則在 顯著水準α下可接受H0;反之,若該信賴區間不包 含θ=θ0,則拒絕H0。 決策法則: 1.左尾檢定(H0: θ ≧ θ0)時,求最高限值區間 2.右尾檢定(H0: θ ≦ θ0)時,求最低限值區間 3.雙尾檢定(H0: θ = θ0)時,求兩端的區間 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
14
假設檢定與信賴區間 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
15
下結論 P-value愈小,有愈強烈的證據拒絕H0,支 持H1。 判斷標準:P
根據決策法則,若落在接受域,則接受 虛無假設;若落在拒絕域,則拒絕虛無 假設。 解釋假設成立或不成立的可能原因。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
16
Example:認知療法對治療厭食症的效果
受試者 體重增加(磅) 1 1.7 16 -9.1 2 0.7 17 2.1 3 -0.1 18 1.4 4 -0.7 19 -0.3 5 -3.5 20 -3.7 6 14.9 21 -1.4 7 3.5 22 -0.8 8 17.1 23 2.4 9 -7.6 24 12.6 10 1.6 25 1.9 11 11.7 26 3.9 12 6.1 27 0.1 13 1.1 28 15.4 14 -4.0 29 15 20.9 H0:μ 0 H1:μ > 0 Source: Agresti & Finlay(2009), p.120. SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
17
Example:增加保費或減少服務 贊成調高保費的比例是否佔多數? 調高保費 減少服務 樣本數 52% 48% 1200 H0:=0.5
SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
18
統計檢定力(power) β減低,當: (1) 估計值遠離H0 (2) 樣本數增加 (3) α增加
power=1-β 當H0為假,並正確拒絕H0的機率 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
19
統計檢定力(power) H0: 1/3 H1: > 1/3 n=116 SPSS統計應用分析研習(莊文忠副教授)
2019/4/27
20
雙母體的假設檢定 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
21
雙母體的差異比較(difference)
目的:利用顯著性檢定或信賴區間來比較平均 數(數字變數)或比例(類別變數)。 Group 1 Group 2 估計 母體平均數 μ1 μ2 母體比例 1 2 H0:μ2-μ1=0 H1:μ2-μ1≠0 H0: 2- 1=0 H1: 2- 1≠0 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
22
獨立樣本 vs. 相依樣本 獨立樣本(independent sample):隨機將一群 樣本分為二組,分別進行測量後比較, 例如男性和女性、實驗組和控制組。 相依樣本(dependent sample):針對同一群 樣本進行前測和後測的測量,例如期中 考和期末考的比較、減肥前和減肥後的 比較。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
23
獨立樣本t檢定 (for μ) 差異(difference)的標準誤(n ≧30, CLT ): 信賴區間(CI)— if 95%
t-value SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
24
Example:女性做家事的時間是否高於男性
性別 樣本數 平均數 標準差 男性 1219 23 32 女性 733 37 16 Source: Agresti & Finlay(2009), p.183. SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
25
獨立樣本t檢定 (for ) 差異(difference)的標準誤(n ≧30, CLT ): 信賴區間(CI)— if 95%
t-value SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
26
Example:禱告是否和手術併發症的發生有關
沒有併發症 樣本數 有 315 289 604 沒有 304 293 597 Source: Agresti & Finlay(2009), p.187. SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
27
相依樣本t檢定 (for μ) 差異(difference)的標準誤(n ≧30, CLT ): 信賴區間(CI)— if 95%
t-value SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
28
Example: 開車使用手機與否的反應時間
受試者 未使用 使用 差距 1 604 636 32 17 525 626 101 2 556 623 67 18 508 501 -7 3 540 615 75 19 529 574 45 4 522 672 150 20 470 468 -2 5 459 601 142 21 512 578 66 6 544 600 56 22 487 560 73 7 513 542 29 23 515 10 8 554 84 24 499 647 148 9 543 -13 25 448 456 531 520 -11 26 558 688 130 11 599 609 27 589 679 90 12 537 559 28 814 960 146 13 619 595 -24 519 39 14 536 565 30 462 482 15 573 31 521 527 16 467 87 Source: Agresti & Finlay(2009), p.194. SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
29
SPSS統計應用分析研習(莊文忠副教授)
2019/4/27
30
若兩群體的變異量相等 If σ1= σ2 → pooled estimate 信賴區間(CI)— if 95% t-value
SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
31
Ex:認知療法對治療厭食症的效果 組別 樣本數 平均數 標準差 認知療法 29 3.01 7.31 傳統療法 26 -0.45 7.99
Source: Agresti & Finlay(2009), p.198. SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
32
單因子變異數分析(0ne-way ANOVA)
SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
33
基本概念 變異數分析的主要是用來檢定3個或3個以上的 母體平均數是否相等的統計方法。 資料:依變數Y是數字資料;自變數X是類別資 料。
由於變異數分析主要是應用在實驗設計之中, 故要求每一個組合的樣本數相等,且至少要有2 個個案,才能計算變異量,而這個要求在社會 科學中較不可能,故通常只能用迴歸方法執行 變異數分析。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
34
變異的來源 若Y為績效分數,X為A、B、 C等部門,則 Y1,Y2,Y3,Y4,Y5,…,Yn → 可依部門分為
A部門:Y11,Y12,Y13,Y14,Y15,…,Yn1 → B部門:Y21,Y22,Y23,Y24,Y25,…,Yn2 → C部門: Y31,Y32,Y33,Y34,Y35,…,Yn3 → SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
35
變異的來源 總變異量: 組內變異量: 組間變異量: 自由度(degrees of freedom)的計算 SST = SSW + SSB
df (n-1) = (n-r) + (r-1) SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
36
單因子變異數分析模型 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
37
單因子變異數分析的基本假定 個案的獨立性(independence):各組的樣本應該 是獨立取樣而來。
分布的常態性(normality):在樣本數足夠大的情 形下,大部分都會符合此一假定。 變異數同質性(homogeneity of variance):指不同組 間依變數的變異數要相等,即 誤差為隨機常態分布,即 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
38
單因子變異數分析表 Source of Variation Sun Square df Mean Square F-ratio SSB
MSB=SSB/r-1 SSW N-r MSW=SSW/n-r SST N-1 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
39
單因子變異數分析結果的解釋 解釋變異量 用F-ratio來檢定各組的平均數是否相等,即 H0: μ1=μ2=…=μr
F值介於0至+∞之間,F值愈大(通常P值小於0.05 即為顯著),表示這個自變數對依變數產生作用; 若F檢定沒有拒絕H0,表示此一分類完全無效。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
40
Example:不同通路的藥品銷售量 X=1(藥局) X=2(診所) X=3(醫院) Case1 2 10 Case2 3 8 13
7 14 Case4 5 Case5 6 15 總和 =20 =40 =65 =125 樣本數 n1=5 n2=5 n3=5 nT=15 平均數 =4.0 =8.0 =13.0 =8.33 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
41
事後(post hoc)多重比較的概念 多重兩組差平均數比較的變異數: 多重兩組差平均數比較的(1-α)聯合信賴區間為
m為比較組別數 聯合信賴區可用來同時檢定H0: μ1=μ2=…=μr 。若 有任一兩組平均數差的聯合信賴區間不包含0,則 拒絕H0 ;反之,若每一組均包含0,則接受H0 。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
42
事後(post hoc)多重比較的方法 Tukey method—檢定所有兩兩相比的多重比較。假設 每一組的樣本數相等,但Tukey證明樣本數不相等時 亦可使用,只是power會打些折扣。 Scheffe method—檢查所有組合相比的多重比較,沒 有任何條件假設,不論各組的樣本數是否相等均可 使用,適用在任何狀況。 LSD(Least Significant Difference)—適用於一組k個平均 數間的成對比較。需指定哪種組合的比較,挑選差 異最小,以Z值估計區間,較精確。 Bonferroni method—利用LSD修正而成。可用在兩兩 相比或多組相比,但需指定比較的組合方式,可提 高信賴度的估計,是介於Tukey和Scheffe之間的方法。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
43
雙因子變異數分析(Two-way ANOVA)
SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
44
基本概念 雙因子變異數分析模型的基本條件是每一組的樣本 數相等,此條件在社會科學不太可能成立。一般而 言,在樣本數不相等時,雙因子變異數分析通常會 改用迴歸方法處理。 交互作用(interaction effect)—指一項因素對Y的影響 要視另一項因素而定。 1.就理論而言,若 H0:μij= μ+i+j成立,則不存在 交互作用;若 H0不成立,則有交互作用存在。 2.就圖形而言,若2個自變數和Y所畫出的圖形是相 互平行,即表示2個自變數之間沒有交互作用存在。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
45
雙因子ANOVA(無交互作用) Source of Variation Sum Square df Mean Square F-ratio
SSA r-1 SSB c-1 SSWithin (r-1)(c-1) SST (r×c)-1 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
46
Ex:性別與機器廠牌對產量的影響 機器 機器一 機器二 機器三 性 別 男性 28.0 36.0 47.0 =37.0 女性 20.0
29.0 38.0 =29.0 =24.0 =32.5 =42.5 =33.0 Source:林惠玲、陳正倉(2003),頁512。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
47
SPSS統計應用分析研習(莊文忠副教授)
2019/4/27
48
雙因子ANOVA(有交互作用) Source of Variation Sun Square df Mean Square F-ratio
S.S.Between rc-1 SSA r-1 SSB c-1 SSAB (r-1)(c-1) SSWithin rc(n-1) SST nrc-1 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
49
Ex:運動時段、運動強度對睡眠時間的影響
和緩 中度 激烈 運動時段 早上 Case1 6.5 7.4 8.0 Case2 7.3 6.8 7.7 Case3 6.6 6.7 7.1 Case4 7.6 Case5 7.2 Case6 晚上 8.2 7.9 8.1 8.5 9.5 8.7 7.5 9.6 9.4 Source:潘中道、郭俊賢譯(2005),頁491。 SPSS統計應用分析研習(莊文忠副教授) 2019/4/27
50
SPSS統計應用分析研習(莊文忠副教授)
2019/4/27
51
提問與心得分享 計量分析一(莊文忠副教授) 2019/4/27
Similar presentations