Presentation is loading. Please wait.

Presentation is loading. Please wait.

Part 3 初等統計與理論.

Similar presentations


Presentation on theme: "Part 3 初等統計與理論."— Presentation transcript:

1 Part 3 初等統計與理論

2 閱讀範圍 邱皓政著 量化研究與統計分析 陳景堂著 統計分析SPSS for Windows入門與應用
邱皓政著 量化研究與統計分析 Chapter 8 類別資料的分析─卡方檢定 Chapter 9 平均數差異假設檢定─t檢定 Chapter 10 平均數變異分析─ANOVA Chapter12 線性關係的分析─相關 陳景堂著 統計分析SPSS for Windows入門與應用 卡方檢定練習(Chapter 9) 平均數差異假設檢定 (Chapter 10、 12~13) ANOVA (Chapter 14)

3 1.類別資料的分析(交叉分析) 卡方檢定

4 類別資料的分析 類別資料的產生 類別資料的處理型態: 次數與百分比
原發性類別資料:當被測定的變項的本質是名義性的屬性, 例如性別資料、宗教信仰等 等距尺度或比例尺度所測得知資料(如分數、身高、體重等),常常為簡化資料起見,常以分組方式化簡為類別變項,例如將身高分為低、中、高三組 類別資料的處理型態: 次數與百分比 類別資料的呈現: 次數分配表(frequency table)與列聯表(contingency table) 類別資料的分析: 卡方檢定與其他關聯性分析法

5 列聯表範例 變項 學歷 總和 國中/小 高中/職 大專 研究所以上 性別 男 12 28 40 6 86 女 16 25 45 4 90
53 85 10 176

6 類別變項的檢定類型 適合度檢定(Goodness of fit test) 某一個變項是否與某個理論分配或母群分配相符合
檢定的內容僅涉及一個變項,是一種單因子檢定, (例如:某校學生性別比是否為1:1? 即 H0: P男= P女 = ½) 適合度檢定之目的,在於檢定某單一變數(X)之實際觀察次數分配與某理論分配是否符合? 變項分配 H0: P1=p1, P2=p2, …… Pk=pk 理論分配

7 類別變項的檢定類型 獨立性檢定 (independence test) H0: X變項與Y變項互相獨立
同時檢測兩個類別變項﹙X與Y﹚之間的關係時,其目的在於檢定從樣本得到的兩個變項(X與Y)的觀察值,是否具有特殊的關聯 (例如: 一群人中學歷分佈與性別分佈的關係)。 獨立性檢定之目的,檢測同一個樣本的兩個變項的關聯情形,若兩個類別變項沒有互動關係(即卡方值不顯著),則稱兩變項之間互相獨立。相反的,則具有關聯性 H0: X變項與Y變項互相獨立

8 類別變項的檢定類型 同質性檢定 (Homogeneity test) 檢定不同人口母群體,在某一個變項的反應是否具有顯著差異。
同質性檢定之目的,檢測雙樣本(兩個不同之母體)在單一變項的分佈情形 (例如:公 私立大學性別分佈之比較)。若甲乙兩樣本沒有差異,我們稱此兩個母體是同質的。 H0: 甲母體與乙母體為同質的 獨立性檢定:同一母體之樣本的兩個不同變項之關聯情形之檢定 同質性檢定:兩個不同之母體樣本在同一變項之分布狀況之檢定

9 類別變項的檢定類型 多重列聯表分析 以卡方檢定進行多重列聯表分析 ,缺乏統一指標來檢定變項關聯強度,因此可以使用G2統計法
探討三個或以上類別變項之間是否具有關聯(非獨立)或無關(獨立)。 三個類別變項關係之探討,須將其中一個設為控制變項,而另外兩個變項便形成列聯表(例如:不同性別(男、女),婚姻狀況(未婚、已婚)與生活滿意度(刺激、規律或無聊)三種變項關係之討論) 以卡方檢定進行多重列聯表分析 ,缺乏統一指標來檢定變項關聯強度,因此可以使用G2統計法

10 卡方檢定的統計原理 卡方檢定所檢定的是樣本觀察次數﹙或百分比﹚與理論或母群體次數﹙或百分比﹚的差異性。
理論或母群體的分配狀況,可以統計的期望值來表現 卡方的統計原理,取觀察值與期望值相比較。卡方值越小,表示檢定之結果未達顯著差異(Do not reject H0);相反的,卡方值越大,代表統計量與理論值的差異越大,一旦卡方值大於某一個臨界值,即可獲得顯著的統計結論 (Reject H0 ) 其中 Degree of freedom = R+C-1

11 列聯表的期望值的計算 小於5知之處理方法 細格合併法 卡方列聯表統計中, 各細格之期望次數﹙或理論次數﹚不得小於5。 增加樣本數 去除樣本法
變項 X變項 列總和 類別一 類別二 Y變項或 不同母體樣本 類別一 (樣本一) NA1*NB1/Ntotal NA1*NB2/Ntotal NA1 類別二 (樣本二) NA2*NB1/Ntotal NA2*NB2/Ntotal NA2 行總和 NB1 NB2 Ntotal 小於5知之處理方法 細格合併法 增加樣本數 去除樣本法 使用Yate’s校正公式 卡方列聯表統計中, 各細格之期望次數﹙或理論次數﹚不得小於5。

12 列聯表範例之觀察值與期望值 觀察值fo 期望值fe 學歷 總和 國中/小 高中/職 大專 研究所以上 性別 男 12 28 40 6 86
16 25 45 4 90 53 85 10 176 期望值fe 學歷 總和 國中/小 高中/職 大專 研究所以上 性別 86*28/176 86*53/176 86*85/176 86*10/176 86 90*28/176 90*53/176 90*85/176 90*10/176 90 28 53 85 10 176

13 關聯係數 卡方檢定值之範圍由0到無限大,除檢定顯著性外,卡方值的大小無法比較關聯性之大小 關聯係數可以改善卡方檢定的缺點。
關聯係數:以0至1的係數來反應類別變項之間的的關聯情形,數值越接近1表兩變項之關聯越強。 Phi(φ)係數:2*2列聯表的卡方值的轉換 C列聯係數: 2*2以上的列聯表卡方值的轉換 Cramer’s V係數:當樣本數較大時,可減緩列聯係數萎縮的問題。

14 關聯係數 Lambda(λ)係數係以削減誤差比(proportioned reduction in error; PRE)來計算關聯係數, Lambda越高,表示以某一變項去解釋另一個變項可以有效消除誤差的比率越高, PRE指以某一個類別變項去預測另一個類別變項時,能夠減少的誤差所佔的比例,比例越大,兩個變項的關聯性越強。 對稱形式λ(symmetrical):無特定預測關係 非對稱形式λy.x(asymmetrical) :有因果性預測關係 Tau係數的計算考慮了所有的次數,因此敏感度較Lambda係數為高,分析不對稱關係時,宜採用Tau係數。 E1為以未知X時預測Y時所產生的誤差(期望誤差) E2為以已知X時預測Y時所產生的誤差(觀察誤差)

15 SPSS的卡方檢驗 類別變項的分析,SPSS視窗版提供了無母數統計﹙NPAR﹚、對數模式﹙LOGLINEAR﹚與交叉列聯表﹙CROSSTAB﹚三種模式來進行卡方檢定。 適合度檢定:在無母數統計與對數模式中進行卡方檢定。 雙母群卡方檢定(獨立性檢定與同質性檢定)可在一般的交叉列聯表、無母數統計、對數模式三種分析中得到卡方統計量。 多重列聯表分析,需使用對數模式中的模式選擇→對數線性分析,該選項能夠分析多因子的交叉表列(列聯表),計算G2統計量,將不同控制水準下的交叉表進行整體性檢定,以找出哪些類別變數具有關聯。

16 適合度檢定操作程序 輸入資料 選取分析→無母數檢定 →卡方分配 選擇要分析之變數 輸入期望值的比值 進入選項設定統計量與遺漏值 按確定執行

17 適合度檢定(1)-期望次數相等 某教育學者想了解老師對學校實施評鑑制度之看法,出了5個選項的單選題,共調查242位教師,結果如下表所示,請問這些老師所勾選的結果是否有顯著的不同? 選項 很不重要 1 不重要 2 無意見 3 重要 4 很重要 5 人次 45 60 20 35 82 H0: P1= P2 = …… =P5=1/5 適合度檢定(1)範例解析

18 適合度檢定(2)-期望次數不相等 某教育學者想了解學生家長對校務評鑑之看法是否與三年前有所差異,因此隨機抽樣500位家長,調查結果如下表所示,請問此教育學者如何解釋此結果? 很重要 1 重要 2 不重要 3 很不重要 4 總數 三年前 150 (比重0.3) 75 (比重0.15) 200 (比重0.4) 500 今年 250 125 100 25 H0: 學生家長對校務評鑑之今年的看法與三年前無顯著差異 適合度檢定(2)範例解析 or H0: P1=0.3, P2=0.15, P3=0.4,P4=0.15

19 獨立性檢定操作程序 以加權方式輸入資料,並將觀察值以次數變項加權 選取分析→敘述性統計→交叉表 選擇要檢定之可能相關變數於列、直行中
按統計量鈕 勾選卡方統計量、相關等選項及其他關聯係數→再按繼續 按格鈕 勾選觀察值、期望、橫列、直行等選項→再按繼續 按確定執行

20 獨立性檢定 某教育學者想了解國小退休教師社會參與率與退休後生活滿意度之關係。因此隨機抽樣1077位教師,結果如下表所示,請問此教育學者如何解釋此結果? 社會參與 時常參加 偶而參加 很少參加 生活滿意 很滿意 350 150 48 無意見 120 102 88 不滿意 30 87 H0: 退休教師的社會參與率與退休後生活滿意度無顯著關係 獨立性檢定範例解析

21 獨立性檢定範例輸出結果(1) 此細格中, 實際觀察值=350 理論期望次數=254.4 佔橫列之百分比=350/548=63.9%
佔縱行之百分比=350/500=70.0% 佔總有效樣本之百分比=350/1077

22 獨立性檢定範例輸出結果(2) 卡方值= 207.329 自由度=4
P-value = .000<.05, 達到0.05之顯著水準,應棄卻H0表示退休教師的社會參與率與退休後生活滿意度有顯著相關性 生活滿意列之Lamda值=0.102,表示「當已知樣本的社會參與頻率資訊下,可增加預測樣本生活滿意度之正確性達10.2%之多」

23 同質性檢定操作程序 以加權方式輸入資料,並將觀察值以次數變項加權 選取分析→敘述性統計→交叉表 選擇要檢定之可能相關變數於列、直行中
按統計量鈕 勾選卡方統計量 在「名義的」方盒中,選擇相關之關聯係數,如列聯係數、Phi 與 Cramer’s V係數→再按繼續 按格鈕 勾選觀察值、期望、橫列、直行等選項→再按繼續 按確定執行 (註:與獨立性檢定之步驟相同)

24 同質性檢定範例(1) 填表人身分 學校辦理營養午餐問卷調查? 意見 學生 1 教師 2 家長 3 贊成 1 反對 2
贊成 1 反對 2 H0:不同身分對象對學校辦理營養午餐所持意見之無顯著差異 同質性檢定(1)範例解析

25 同質性檢定範例(1)輸出結果 卡方統計量數又稱為Pearson卡方 p-value=0.002<0.05
Reject H0,代表不同對象所持意見之百分比有顯著不同 對數線性模式中之統計檢定數稱為概似比

26 同質性檢定範例(2) 某教育學者想了解學生家長對校務評鑑之看法是否與三年前有所差異,因此隨機抽樣500位家長,調查結果如下表所示,請問此教育學者如何解釋此結果? 很重要 1 重要 2 不重要 3 很不重要 4 總數 三年前 150 75 200 500 今年 250 125 100 25 H0: 學生家長對校務評鑑之今年的看法與三年前無顯著差異 同質性檢定(2)範例解析

27 同質性檢定範例(2)輸出結果 此細格中, 實際觀察值=150 理論期望次數=200 佔橫列之百分比=150/500=30.0%
佔縱行之百分比=150/400=37.5% 佔總有效樣本之百分比=150/1000=15.0%

28 同質性檢定範例(2)輸出結果 對稱性量表為顯示關聯強度係數,其中
Cramer’s V係數=.310, p-value=0.000<0.05 列聯係數=.296 , p-value=0.000<0.05 均達到顯著水準,代表兩組受測者與選項變項二者之間有某種程度的關聯存在 p-value=0.000<0.05 Reject H0,代表不同年度家長所持意見之百分比有顯著不同

29 多重列聯表分析 男性 甲品牌 乙品牌 丙品牌 低社會地位 20 8 7 高社會地位 5 24 某人想了解不同性別下,社會地位與手機品牌使用上是否有顯著的關係,試將多重列聯表分析範例之數據,分析社會地位與手機品牌是否有顯著的關係? 女性 甲品牌 乙品牌 丙品牌 低社會地位 10 5 7 高社會地位 11 8 H0:社會地位與手機品牌無顯著差異

30 多重列聯表分析

31 p-value=0.003<0.05 Reject H0,代表男性中社會地位與手機品牌有顯著不同 p-value=0.234>0.05 Do not reject H0,代表女性中社會地位與手機品牌無顯著不同

32

33 上機練習 1 .交叉分析練習 (陳景堂著 課本第九章) 以學生成績(exdata1.sav)為例。
1 .交叉分析練習 (陳景堂著 課本第九章) 以學生成績(exdata1.sav)為例。 【問題1】用交叉分析法分析男女學生之資料庫課程的分數比例。(see p.9-9~9-17) 【問題2】試檢定資料庫課程的分數與性別之間是否有關聯? (獨立性檢定) (see p.9-20~9-23)

34 2.平均數的差異假設檢定 Z與t檢定

35 連續變項的分析 基本特性:變項「數值」的無限性。 一個連續變項的基本定義,即是在一定的數線範圍之中,具有一定的單位,而可能存在無限數值
具有數學運算的基本功能 連續性測量資料在進行統計分析之前,除了必須以次數分配的形式來歸類整理之外,同時必須以描述統計的集中趨勢量數與離散量數來加以描繪該變項的觀察特性 統計的檢定圍繞在樣本的統計數 單一變項的檢定:平均數與標準差(或變異數)來進行 多變項的檢定:T或Z檢定

36 單母群與多母群檢定 單一母體檢定。 多個母體檢定
一個連續變數的得分可以計算出一個平均數,如果研究者僅對單一變項的平均數加以檢驗,不考慮其他變項的影響,稱為單一母體的平均數檢定。 多個母體檢定 如果研究者想同時考慮不同情況之下的平均數是否有所差異,例如男生與女生的平均數的比較,此時即牽涉到多個平均數的檢定;不同的平均數,代表背後具有多個母數的存在,因此被稱為多母數的平均數檢定。

37 單尾與雙尾檢定 平均數差異檢定在檢驗兩個平均數大於、小於與不等於等不同形式的研究假設。形成有特定方向的檢定或無方向性的檢定兩種不同模式。
單尾檢定(one-tailed test) 當研究者只關心單一一個方向的比較關係時(例如檢定男生的數學成績X1是否優於女生X2),平均數的檢定僅有一個拒絕區 H0:  1   2 H1:  1 >  2   1與 2與分別示男生與女生數學成績的平均數 雙尾檢驗(two-tailed test) 當研究者並未有特定方向的設定(例如檢定男生的智商與女生的智商是否有所不同),假設檢定在兩個極端的情況皆有可能發生,而必須設定兩個拒絕區 H0:  1 =  2 H1:  1   2

38 獨立樣本與相依樣本 不同的平均數可能計算自不同的樣本,亦有可能計算自同一個樣本的同一群人,或是具有配對關係的不同樣本。 獨立樣本設計
不同平均數來自於獨立沒有關連的不同樣本 根據機率原理,當不同的平均數來自於不同的獨立樣本,兩個樣本的抽樣機率亦相互獨立, 相依樣本設計 重複量數設計(repeated measure design):不同的平均數來自於同一個樣本的同一群人(例如某班學生的期中考與期末考成績)重複測量的結果 配對樣本設計(matched sample design): 不同的平均數來自具有配對關係的不同樣本(例如夫妻兩人的薪資多寡,同一個人穿的左右腳之鞋子等)樣本抽取的機率是為非獨立、相依的情況。因此必須特別考量到重複計數或相配對的機率,以供不同的公式。

39 單母群平均數檢定 當研究者關心某一個連續變項的平均數,是否與某個理論值或母群平均數相符合之時,稱為單母群平均數檢定。
例如某大學一年級新生的平均年齡19.2歲是否與全國大一新生的平均年齡18.7歲相同。研究假設H1為樣本平均數與母群體(或理論值)平均數不同,或H1 :μ≠μ0。 當母群的標準差已知,抽樣分配的標準誤可依中央極限定理求得,且無違反常態假設之虞,可使用Z分配來進行檢定 若母群的標準差未知,則需使用樣本標準差的不偏估計數來推估母群標準差。因此,須使用t分配來進行檢定

40 雙母群平均數檢定 當研究者關心兩個平均數的差異是否存在之時,是為雙母群平均數檢定的問題,研究假設( H1 )為樣本一平均數與樣本二平均數具有差異,或H1 : μ1≠μ2。 當雙母群平均數檢定所使用的樣本是獨立樣本時,使用獨立樣本平均數檢定,例如某大學一年級新生男生的平均年齡μ1 =21.1歲,是否與女生的平均年齡μ2 = 19.7歲相同。公式如下:

41 雙母群平均數檢定 (Pair-wise t test)
當雙母群平均數檢定所使用的樣本是相依樣本時,使用相依樣本平均數檢定,例如某一群受試者參加自我效能訓練方案前後的兩次得分的自我效能平均數的比較。

42 t檢定的基本假設 常態性假設 變異數同質性假設(homogeneity of variance)
雙樣本平均數檢定中,兩個平均數來自於兩個樣本,除了樣本本身的抽樣分配需為常態化之外,兩個平均數的差的抽樣分配也必須符合常態分配的假設(normality) 變異數同質性假設(homogeneity of variance) 平均數差異檢定中,每一個常態化樣本的平均數要能夠相互比較,除了需符合常態分配假設外,必須具有相似的離散狀況,也就是樣本的變異數必須具有同質性(1≈ 2) 如果樣本的變異數不同質,表示兩個樣本在平均數差異之外,另外存有差異的來源,致使變異數呈現不同質的情況。變異數同質性假設若不能成立,會使得平均數的比較存有混淆因素。 兩個獨立樣本變異數同質性假設是否違反,可以利用Levene’s test of homogeneity,以變異數分析(F檢定)的概念,計算兩個樣本變異數的比值。若F檢定達到顯著水準,表示兩個樣本的變異數不同質,此時需使用校正公式來計算t值。

43 SPSS操作方式 單一樣本t檢定 獨立樣本t檢定 配對樣本t檢定
是用來檢定單一變數的平均數,是否跟指定的常數不一樣。例如研究人員可能想檢定某一群學生的平均IQ是否為不同於一般學生。或者,統一麵包店老闆想看看熱狗的重量,是否為原訂的50克。 獨立樣本t檢定 是用來比較兩組獨立之不同樣本測量值的平均數。 配對樣本t檢定 是用來比較單一樣本或配對樣本在兩個變數的平均數的差異。其原理是計算每個觀察者在兩個變數值之間的差異,以及檢定平均是否為0。

44 單一樣本t檢定操作程序 輸入資料 選取分析→比較平均數法 →單一樣本T檢定 選擇要檢定之變數 輸入檢定值
進入選項設定信賴區間與遺漏值,再按繼續 按確定執行

45 單一樣本t檢定 (1)-母體未知和單尾檢定
某教育學者認為小學生書包重量偏重,因此由國小學童中隨機抽取15名,測量書包重量如下表所示,若已知小學生書包適宜之重量為5.3公斤,請問教育學者之論點是否可以得到支持? num 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 重量 6.5 4.8 5.1 7.2 4.9 8.1 5.8 7.5 6.8 5.9 6.3 6.6 H0:  1   =5.3 H1:  1 >  =5.3 單一樣本t檢定 母體未知和單尾範例

46 單一樣本t檢定範例(1)輸出結果 表中在雙側檢定時,t值為3.413,自由度=14, p-value = 0.004,但由於本例題為單尾檢定,此部份之結果不符合題目原意,故可捨棄不看。 或者將p-value/2=0,002<0.05 (亦可判斷) 單尾檢定時,可察看差異值的95%信賴區間數值, 95%信賴區間為[.3269,1.4331],未包含0,且大於0,故可棄卻H0 。 即教育學者認為小學生書包重量偏重之論點可以得到支持。

47 單一樣本t檢定(2)-母體未知和雙尾檢定
教育部在全國性調查中得知國小三年級學童之平均體重為32公斤,某位國小老師想了解該校三年級學童之體重狀況,在該年級隨機抽取20名,測量得重量如下表所示,請問該位老師如何解釋該校三年級學童之體重發展? num 1 2 3 4 5 6 7 8 9 10 重量 30 31 35 27 28 36 33 num 11 12 13 14 15 16 17 18 19 20 重量 34 29 27 28 26 33 36 H0:  1 =32 H1:  1  32 單一樣本t檢定 母體未知和雙尾範例

48 單一樣本t檢定範例(2)輸出結果 此例之95%信賴區間為
表中在雙側檢定時,t值為-.964,自由度=19, p-value = 0.347>0.05,故應接受H0 。 此例之95%信賴區間為 [-2.292,.8192],區間包含0,故應接受H0 。 即該校三年級學童之體重發展與全國三年級學童之體重發展無顯著差異。

49 相依樣本t檢定操作程序 輸入資料 選取分析→比較平均數法 →成對樣本T檢定 選擇要配對檢定之ㄧ對變數(變數1減去變數2)
注意: 不需要輸入檢定值,因系統是檢定值=0 進入選項設定信賴區間與遺漏值,再按繼續 按確定執行

50 相依樣本t檢定範例(3) H0:  1 -  2=0 H1:  1 - 2 0
某研究員想了解自我導向學習是否有助於學生數學成績之進步,隨機抽取20受測者,讓其接受三個月之訓練,並收集學習前與學習後之成績,其測得數據如下表請問該研究員如何解釋數據結果 ? num 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 學習前 75 88 70 82 76 67 73 80 85 68 72 71 77 87 86 74 79 學習後 78 92 84 90 89 83 H0:  1 -  2=0 H1:  1 - 2 0 相依樣本t檢定範例

51 相依樣本t檢定範例(3)輸出結果 此例之[訓練前 - 訓練後]之95%信賴區間為 [ , ],區間不包含0,故應棄卻H0 。 即訓練前與訓練後的成績間,有顯著關係存在,且訓練後的成績顯著高於訓練前的成績。 表中在雙尾檢定時,t值為-5.409,自由度=19, p-value = 0.000<0.05,故應棄卻H0 。 即訓練前與訓練後的成績,有顯著的差異。

52 獨立樣本t檢定操作程序 輸入資料 選取分析→比較平均數法 →獨立樣本T檢定 於檢定變數方格內選定欲檢定之目標變數
選取分組變數後,按「定義組別」鈕,依組別定義對應數值 進入選項設定信賴區間,再按繼續 按確定執行

53 獨立樣本t檢定範例(4) H0:  1 -  2=0 H1:  1 - 2 0
某老師想了解該校三年級男、女生英文成績是否有差異?因此於考試後,隨機抽取20位男生與19位女生,其測得之數據如下表,請問該校三年級男、女生英文成績是否有差異? num 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 男生 80 75 79 86 68 72 84 78 85 76 81 77 90 89 87 74 女生 92 95 96 H0:  1 -  2=0 H1:  1 - 2 0 獨立樣本t檢定範例

54 獨立樣本t檢定範例(4)輸出結果 變異數相等的 Levene 檢定,檢驗兩母體之變異數是否相同(即H0 :X1=X2)
可以假設變異數相等 變異數相等的 Levene 檢定,檢驗兩母體之變異數是否相同(即H0 :X1=X2) 經Levene 檢定F值為0.002, p-value = 0.969>0.05,未達顯著水準,故應接受H0 。即兩母體之變異數無顯著差異。

55 獨立樣本t檢定範例(4)輸出結果 此例之[male –female]之95%信賴區間為 [-9.956, ],區間不包含0,故應棄卻H0 。 即男生與女生的英文成績,有顯著差異,且女生的成績顯著高於男生的英文成績。 表中在雙尾檢定時,t值為-2.827,自由度=37, p-value = 0.008<0.05,故應棄卻H0 。 即男生與女生的英文成績,有顯著的差異。

56 上機練習 1 .均數差異分析練習 (陳景堂著 課本第十二、十三章) 以第十一章的問卷資料檔(quena-1.sav)為例。
1 .均數差異分析練習 (陳景堂著 課本第十二、十三章) 以第十一章的問卷資料檔(quena-1.sav)為例。 【問題1】用第十一章的問卷資料檔為例,分析男女兩性對工作變化性的感受是否有差異? (獨立樣本t檢定) (see p.12-11~12-20) 【問題2】用第十一章的問卷資料檔為例,分析人員對工作變化之實際感受與期望是否相同? (相依樣本t檢定) (see p.13-10~13-14)

57 3.平均數的變異分析 ANOVA與F檢定

58 變異數分析的基本原理 變異數分析(單因子)是一種用以檢定幾組獨立群體之期望值是否相等的一種統計分析方法。
H0:  1 =  2=3 = ….=  k H1: H0不成立

59 單因子變異數分析資料實例 H1:μ1≠μ2≠μ3。
可以計算出四個平均數,即三個組平均數與一個總平均數(grand mean)。變異數分析檢驗的就是這三個組平均數是否具有顯著的差異 研究假設為:高、中、低三種不同運動量的受測者,其睡眠時間不同 H1:μ1≠μ2≠μ3。 總平均數

60 變異數分析的基本原理 平均數差異檢定:基本原理是計算兩個數值(平均數)之間的差異,適用t或Z檢定。
平均數變異分析:若檢定之母題超過兩個,需要一個能同時對兩個以上樣本平均數差異進行檢定之方法,稱為變異數分析(Analysis of Variance),簡稱ANOVA。其原理乃是以平均數間的變異數(組間變異)除以隨機變異(組內變異)得到的比值(F值)作檢定。當F值越大,表示組間變異的平均數的分散情形較組內變異或誤差變異來得大,若大於所設定的臨界值,即可獲得拒絕虛無假設、接受對立假設的結論。

61 變異數的計算與拆解 變異數分析的主要原理係將全體樣本在依變項的得分的變異情形,就「導因於自變項影響的變異(組間變異)」與「導因於誤差的變異(組內變異) 」兩個部份加以分別計算。 將總離散量數拆解成自變項效果(組間效果)與誤差效果(組內效果)兩個部份,再加以比較。

62 變異數分析摘要表 變異來源 平方和 自由度 (Degree of Freedom) 均方 (Mean Square) F-值 (組間)
單因子變異數分析表 變異來源 平方和 自由度 (Degree of Freedom) 均方 (Mean Square) F-值 (組間) SSB k-1 MSB=SSB/k-1 F=MSB/MSW 殘差 (組內) SSW N-k MSW=SSW/N-k 總和 SST N-1 其中 K 為總組數,N為總樣本數

63 變異數分析摘要表 其中 k 為總組數,p為受試者總數,總樣本數為N=pk

64 ANOVA的基本假設 (一)常態性假設 變異數分析需處理超過三個以上的平均數,須假設樣本是抽取自常態化母群體,當樣本數越大,常態化的假設越不易違反。 (二)變異數同質性假設 多個樣本平均數的比較,必須建立在樣本的其他參數保持恆定的基礎上,如果樣本的變異數不同質,將造成推論上的偏誤。也就是樣本變異數同質性假設(homogeneity of variance)。 (三)可加性假設 變異數分析牽涉到變異量的拆解,因此,各種變異來源的變異量須相互獨立,且可以進行累積與加減,稱為可加性(additivity)假設。 (四)球面性假設(sphericity) 適用於相依樣本的變異數分析,係指不同水準的同一組樣本,在依變項上的得分,兩兩配對相減所得的差的變異數必須相等(同質)。也就是說,不同的受試者在不同水準間配對或重複測量,其變動情形應具有一致性。

65 整體檢定與多重比較 H0:  1 =  2=3 = ….=  k H1:  i  i
整體檢定(overall test): 當變異數分析F檢定值達顯著水準,即推翻了平均數相等的虛無假設,亦即表示至少有兩組平均數之間有顯著差異存在,表示多個平均數整體效果(overall effect)達顯著水準 當整體檢定顯著後必須檢驗哪幾個平均數之間顯著有所不同,即進行多重比較(multiple comparison)來檢驗。 多重比較在進行F檢定之前進行,稱為事前比較(priori comparisons),在獲得顯著的F值之後所進行的多重比較,稱為事後比較(posteriori comparisons)。 H0:  1 =  2=3 = ….=  k H1:  i  i 1   2 or  24…..

66 事前比較 又稱為計畫比較(planned comparison),是指在進行研究之前,研究者即基於理論的推理或個人特定的需求,事先另行建立研究假設,以便能夠進行特定的兩兩樣本平均數的檢定,而不去理會所有平均數整體性的比較。 事前比較應用t檢定的原理,針對特定的水準,進行平均數差異檢定。 進行事前比較需在研究進行之初即應先行提出特殊的研究假設 在統計軟體中可以利用對比(contrast),設定特殊的線性組合模式,來檢定特定因子水準平均數之間的差異。

67 事後比較 符合基本假設 未符合基本假設 (1)所有成對之比較檢定 假設變異數相同 未假設變異數相同Dunnett’s T3
Turkey Fisher-Hayter REGW F值, REGW Q檢定 假設變異數相同 Turkey-Kramer 未假設變異數相同Dunnett’s T3 Dunnett’s C Games-Howell (GH) (2)所有可能之比較定 Scheffe 2)所有可能之比較定 Brown-Forsythe

68 Kleinbaum等人提出之多重比較方法

69 單因子變異數分析(獨立樣本)操作程序 輸入資料 選取分析→比較平均數法 →單因子變異數分析 自方格內選擇因子(即自變數)與依變數清單變數
按「Post Hoc檢定」鈕,選取「事後比較」之 多重檢定統計方法,再按繼續。 進入「選項」設定描述性統計量與變異數同質性,再按繼續 按確定執行

70 單因子變異數分析範例(1)-獨立樣本 H0:  1 =  2=3 H1:  i  I , 至少兩種家庭狀況之數學平均成績不相等
試以變異數分析(單因子獨立樣本).sav檔案為例,要分析不同家庭狀況之學童在數學成績之表現上是否有顯著差異? 欄位名稱 編碼 ses(家庭狀況 ) 1=雙親家庭 2=他人照顧 3=單親家庭 1 =雙親家庭學童之數學平均成績 2=他人照顧學童之數學平均成績 3 =單親家庭學童之數學平均成績 math(數學成績) H0:  1 =  2=3 H1:  i  I , 至少兩種家庭狀況之數學平均成績不相等

71 單因子變異數分析-獨立樣本 範例(1)輸出結果
變異數相等的 Levene 檢定,檢驗三個母體之變異數是否相同(即H0 :X1=X2 =X3) 經Levene 檢定值為1.293, p-value = 0.291>0.05,未達顯著水準,故應接受H0 。即可以假設母體之變異數相同。 k-1 N-k 經ANOVA 檢定F值為10.293, p-value = 0.001<0.05,已達顯著水準,故應棄卻H0 。 即三種家庭狀況之學童數學成績有顯著差異。

72 單因子變異數分析-獨立樣本 範例(1) Post Hoc 檢定
Tukey HSD方法之檢定結果認為家庭狀況為1(雙親)與3(單親)之成績呈現顯著差異 ,家庭狀況為1與2,或2與3則無顯著差異 假設母體變異數相同之多重檢定 Scheffe法或Dunnett T3方法之檢定結果亦呈現類似結果 假設母體變異數不相同之多重檢定

73 單因子變異數分析(相依樣本)操作程序 輸入資料 選取分析→ㄧ般線性模式 →重複量數 自「受試者內因子的名稱」右邊方格內給定自變項名稱
自「水準個數」右邊方格內給定自變項水準數 按「新增」鈕,中間方格中將出現因子名稱與水準數 按「定義」鈕,選取「重複量數」之的水準變項名稱至右邊受試者內變數之方格中 按「選項」鈕,設定如勾選顯示平均數、比較主效應、 敘述統計等選項,再按繼續。 按確定執行

74 單因子變異數分析範例(2)-相依樣本 H0:  1 =  2=3 =4
某老師想探究不同壓力情境下,學生對於解題能力是否有所不同?因此自其任教班級中隨機抽樣15人,分別在不同壓力情境下,回答一份標準化之試題,在變異數分析(單因子相依樣本).sav檔案中列出其實驗之結果,試由其抽樣結果分析說明學生解題能力是否會因為在不同情境壓力中而有所不同? 欄位名稱 編碼 subj(學生編號 ) 1 =情境1下平均答對之題數 2= 情境2下平均答對之題數 3 =情境3下平均答對之題數 4 =情境4下平均答對之題數 situ1~ situ4 (情境1~情境4) 答對之題數 H0:  1 =  2=3 =4 H1:  i  I , 至少兩種情境之平均答對之題數不相等 變異數分析(單因子相依樣本)範例

75 單因子變異數分析-相依樣本 範例(2)輸出結果
上表為自變項名稱及處理水準數 自變項名稱為SITU 四個處理水準名稱SITU1~ SITU4 上表為四個處理水準數的敘述統計量

76 單因子變異數分析-相依樣本 範例(2)輸出結果
k-1 N-k 上表為多變量檢定結果,共有四種多變量變異數分析,以單因子相依樣本變異數分析中,此部份之檢定結果無實質存在意義,可以省略。

77 單因子變異數分析-相依樣本 範例(2)輸出結果
此二指標若小於0.75,表示假設可能違反,須進行修正。 此二指標若小於0.75,表示假設可能違反,須進行修正。 Mauchly 檢定值因近似卡方分配, 由計算所得之卡方值之顯著性= 0.287, 未達顯著水準,表示資料符合球面性假設。 上表檢定相依樣本變異數分析是否違反球形檢定,常用有 Mauchly, Greenhouse-Geisser, Huynh-Feldt之ε檢定法。 ε =1,表完全符合球面性假設。 ε之下限=1/(自變數水準數-1)

78 單因子變異數分析-相依樣本 範例(2) Post Hoc 檢定
此表為相依樣本事後比較,平均數差異值若達到顯著水準,則會在差異值右邊加上星號(*) 由此數據可以發現學生在壓力情境二的情況下,數學解題能力顯著高於壓力情境一 由此數據可以發現學生在壓力情境三與情境四的情況下,數學解題能力顯著高於壓力情境一與情境二

79 上機練習 【問題1】 獨立樣本單因子變異數分析:以 範例10.1(邱皓政 p.10-22)為例 (請下載ANOVA(indep)(2).sav資料檔) 。 試分析不同婚姻狀態的人,其生活滿意度是否有所不同? 【問題2】相依樣本單因子變異數分析:以 範例10.2(邱皓政 p.10-26)為例 (請下載ANOVA(dep)(2).sav資料檔) 。 試分析人類注意力是否與工作時間有關?

80 4.線性關係的分析: 相關CORRELATION

81 線性關係的分析原理 基本條件: 連續變項之間的關係
線性關係 linear relationship ,指兩個變項的關係可以被一條最具代表性的直線來表達之時,所存在的關連情形。 該直線之方程式為Y=bx+a,b為斜率(即Δy/Δx,每單位的X變動時,在Y軸上所變動的量) 線性關係可以散佈圖的方式來表現

82 線性關係與相關 相關(correlation)是用以檢驗兩個變項線性關係的技術。
兩個連續變項的關聯情形,除了用散佈圖的方式來表達,尚須建立一套統計的運算檢驗模式來進行精確的分析,也即是建立一個用以描述相關情形的量數,即相關係數(coefficient of correlation)。 線性關係中的斜率並不足以說明兩個變項觀察值的分佈情形。相關係數要能反應兩個變數的配對觀察值的分佈,其運算必須考慮到兩個變數各自的集中與分散狀況,以及配對分數的集中與分散狀況,將所有觀察值的分佈情形納入考慮,以共變數的概念進行。 相關係數是一個標準化的關聯係數。其原理是先計算出兩個變項的共變量,再除去兩個變項的不同分散情形與單位差異(即標準差),加以標準化,得到的一個去除單位的標準化分數。

83 相關分析的圖示

84 相關係數的特質 隨著共變數的大小與正負向,相關係數可以分為正相關(完全正相關)、負相關(完全負相關)、零相關五種情形。
相關的大小需經顯著性檢定來證明是否顯著(是否有統計上的意義)。 相關係數介於-1至1之間。 相關情形的大小非與r係數大小成正比 相關並不等於因果 相關係數沒有單位, 可以進行跨樣本的比較

85 相關係數的強度大小與意義

86 其他類型相關分析 史比爾曼等級相關(Spearman rank order correlation coefficient, Rho;rs)
應用於順序變項線性關係之描述。當兩個變數中,有任一變數為順序變項時 點二系列相關(point-biserial correlation) 當X與Y兩個變項中,一為連續變項,另一為二分類別變項(如性別),兩個變項的相關係數稱為點二系列相關

87 淨相關與部份相關 線性關係的統計控制 淨相關
如果兩個連續變項之間的關係,可能受到其他變項的干擾之時,或研究者想要把影響這兩個變項的第三個變項效果排除,可以利用控制的方式,將第三變項的效果進行統計的控制。 淨相關 在計算兩個連續變項X1與X2的相關之時,將第三變項(X3)與兩個相關變項的相關r13與r23予以排除之後的純淨相關,以r12.3來表示。

88 淨相關與部份相關 部份相關 計算X1與X2的單純相關,如果在計算排除效果之時,僅處理第三變項與X1與X2當中某一個變項的相關之時,所計算出來的相關係數,稱之為部份相關,或稱為半淨相關(semipartial correlation)

89 相關係數的統計控制圖示 r12.3 r1(2.3) 部份相關

90 Pearson 與 Spearman相關係數範例(1)
某研究所10名學生修習統計學課程,期中考與期末考成績如下表,試問這兩次考試成績,是否有相關?試問這兩次考試的名次,是否有相關? num 1 2 3 4 5 6 7 8 9 10 期中考 78 80 90 70 88 82 74 65 85 期末考 84 83 89 87 H0:ρ=0 H1:ρ≠0 相關係數範例(1)

91 相關係數操作程序 輸入資料 選取分析→相關→雙變數 選擇欲分析之兩個變項 勾選所需的相關係數 按「選項」鈕,設定統計量等選項,再按繼續。
按確定執行

92 Pearson 與 Spearman相關係數範例(2)
某研究所10名學生修習統計學課程,期中考與期末考成績以及學生的學習焦慮分數,如下表, 試問期中考與期末考成績的相關為何? 若控制了學習焦慮的影響,兩者的淨相關與部分相關為何? H0:ρ=0 H1:ρ≠0 num 1 2 3 4 5 6 7 8 9 10 期中考 78 80 90 70 88 82 74 65 85 期末考 84 83 89 87 學習焦慮分數 相關係數範例(2)

93 淨相關操作程序 輸入資料 選取分析→相關→偏相關 選擇欲分析之兩個變項與控制變項 按「選項」鈕,設定統計量、零階相關等選項,再按繼續。
選擇欲分析之兩個變項與控制變項  按「選項」鈕,設定統計量、零階相關等選項,再按繼續。 按確定執行 輸入資料 選取分析→相關→偏相關 選擇欲分析之兩個變項與控制變項  按「選項」鈕,設定統計量、零階相關等選項,再按繼續。 按確定執行 輸入資料 選取分析→相關→偏相關 選擇欲分析之兩個變項與控制變項  按「選項」鈕,設定統計量、零階相關等選項,再按繼續。 按確定執行

94 淨相關係數- P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S
Zero Order Partials(零階相關係數) MIDTERM FINAL ANXIETY MIDTERM 自由度 ( 0) ( 8) ( 8) 雙尾顯著性 P= P= P= .004 FINAL 自由度 ( 8) ( 0) ( 8) 雙尾顯著性 P= P= P= .063 ANXIETY 自由度 ( 8) ( 8) ( 0) 雙尾顯著性 P= P= P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed 零階相關係數 即為Pearson相關,期中考與期末考成績的相關性仍為0.822 零階相關係數 而焦慮與期中考與期末考成績的顯著性均達到顯著,分別為-0.815與

95 淨相關係數 - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S Controlling for.. ANXIETY (控制焦慮變項) MIDTERM FINAL MIDTERM 自由度 ( 0) ( 7) 雙尾顯著性 P= P= .032 FINAL 自由度 ( 7) ( 0) 雙尾顯著性 P= P= . (Coefficient / (D.F.) / 2-tailed Significance) " . " is printed if a coefficient cannot be computed 偏相關係數 在控制焦慮變項之下,期中考與期末考成績的相關係數將低為 , P= .032 ,仍達顯著

96 部份相關操作程序 輸入資料 選取分析→迴歸方法→線性 選擇一變數移入一變項,其他變項與控制變項為自變項
選擇一變數移入一變項,其他變項與控制變項為自變項  按「選項」鈕,設定統計量選擇部分與淨相關選項,再按繼續。 按確定執行

97 值得注意: 焦慮與期末成績的相關顯著性(p-value = 0.622), 而焦慮與期中成績的相關顯著性(p-value = 0.032,應採用部份相關為宜。(即將焦慮因素由期中成績去除再求與期末考成績的相關性) 由零階、偏相關到部份相關 ,係數逐漸降低 係數估計 係數估計值。包含部份相關與淨(偏相關)部份相關=0.711 (期中考分數在排除焦慮後與期末考的相關性) 淨(偏相關)=0.566(控制焦慮因素下,期中考分數與期末考的相關性

98 第二次作業(陳景堂,第五版) 1 . 課本第十二章(p. 12-22)、第2~12小題 2 . 課本第十三章(p.13-16)、第2~6小題


Download ppt "Part 3 初等統計與理論."

Similar presentations


Ads by Google