Download presentation
Presentation is loading. Please wait.
1
第七章 交叉分析表
2
交叉分析表 市場調查或民意調查,常利用交叉分析表來探討兩個類別變數間之關聯性(如:地區別與某政策之贊成與否、性別與偏好政黨、教育程度與使用品牌、品牌與購買原因、所得與是否有數位相機、……)。
3
建立交叉分析表 茲以『SPSS範例\Ch07\政黨傾向.sav』為例,進行說明建立交叉分析表之過程,該表有1000筆受訪者之資料,『政黨傾向』變數欄內之代碼意義為:(執行「公用程式(U)/變數(R)…」即可查得)
4
『居住地區』變數欄內之代碼意義為:
5
擬建立『政黨傾向』對『居住地區』之交叉分析表,其處理步驟為:
執行「分析(A)/描述性統計(E)/交叉表(C)…」
6
選『政黨傾向』,按 鈕,將其送到右側之『列(O)』方塊
選『居住地區』,按 鈕,將其送到右側之『直行(C)』方塊
7
按 鈕,設定要顯示「觀察值(O)」及「直行(C)」之百分比(縱向總計為分母之百分比)
8
按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,獲致
9
由表上之資料可看出:整體言,受訪者中,以無政黨傾向者居最(28. 1%)。有明顯政黨傾向之受訪者中,以民進黨的支持率最高(22
由表上之資料可看出:整體言,受訪者中,以無政黨傾向者居最(28.1%)。有明顯政黨傾向之受訪者中,以民進黨的支持率最高(22.8%),其次依序為國民黨(20.4%)、親民黨(19.6%)、台聯(5.5%)、新黨(3.6%)。 經由與地區別交叉分析後,可發現:北區主要是支持國民黨與親民黨(22.4%與20.2%),中區是親民黨(22.5%)與民進黨(21.5%)略勝於國民黨(18.5%),南區是民進黨獨大(31.7%),東區則還是國民黨(30.0%)與親民黨的天下(20.0%)。不過,由於未進行獨立性檢定,我們還不能斷下結論。(有關獨立性檢定之作法,詳本章下文『卡方檢定』之說明。)
10
馬上練習 針對『SPSS範例\Ch07\政黨傾向.sav』,求『政黨傾向』對『性別』之交叉分析表,同時顯示人數及縱向之直行百分比,並解釋其結果。
11
可約略看出,無論男女,均以『無政黨傾向』居最多數(28. 7%與27. 5%),支持度第二之政黨,在男性為民進黨(27
可約略看出,無論男女,均以『無政黨傾向』居最多數(28.7%與27.5%),支持度第二之政黨,在男性為民進黨(27.5%);在女性則為國民黨(24.4%)。此外,就相對程度來看,支持民進黨者中,男性比例明顯超過女性(27.5%對18.4%);支持國民黨者中,女性之比例明顯超過男性(24.4%對16.1%)。不過,由於未進行獨立性檢定,我們還不能斷下結論。
12
馬上練習 針對『SPSS範例\Ch07\品牌偏好原因.sav』,求『品牌』對『偏好原因』之交叉分析表(數值標籤已標示於檔案內)。
13
於表中同時顯示人數及縱向之直行百分比,並解釋其結果
14
由表上之資料可看出:整體上消費者偏好其使用品牌的主要原因,依序為『價格便宜』(36.0%)、『外型美觀』(34.0%)與『品質優良』(30.0%)。另由交叉分析,可看出:A牌之使用者,主要是因『價格便宜』(64.7%)而使用A牌產品。B牌之使用者,主要是因『品質優良』(72.7%)而使用B牌產品。C牌之使用者,主要是因『外型美觀』(50.0%)而使用C牌產品。
15
將分析結果轉入Word 以SPSS雖可求得交叉表,但SPSS畢竟不適合用來撰寫報告,通常,還是以Word來處理。故而,得學會如何自SPSS取得交叉分析表結果,並將其轉換成Word文件之內容。 假定,要將先前『馬上練習』中『偏好原因*品牌交叉表』,轉到Word文件。其處理步驟為: 以滑鼠右鍵點選輸出結果之交叉表,將出現一選單,選取「複製(C)」,記下交叉表內容
16
轉到Excel之空白工作表,按 『貼上』鈕,將選取內容複製過來
17
雙按B欄之標題按鈕右側,將其調整為最適欄寬,以便顯示完整文字
於G3輸入『合計』字串 將C5、C7、C9與C11之『品牌內的 %』改為『%』 將C10之『個數』改為『樣本數』 將所有百分比均改為只留一位小數,並加上『%』
18
選取B3:G11之內容 按 『複製』鈕,記下所選取之內容
19
再轉到Word文件,停於要插入交叉表之位置。按 『貼上』鈕,將選取內容複製過來
20
將表格安排成置中格式,將其外框安排為雙線、內框為單線之表格,修飾一下表格之對齊方式
21
往後,即可於表格之下,輸入分析結果的文字內容:
22
百分比 交叉表的百分比有三種:
23
橫列(R) 求以橫向總計為分母之百分比
24
直行(C) 求以縱向總計為分母之百分比
25
總和(T) 求以總樣本數為分母之百分比
26
此三種選擇,甚至可同時並存:
27
不過,為方便撰寫報告,通常僅選取所要之一種即可。有時,由於解釋時,通常以百分比進行說明,故也經常省略其「觀察值(O)」,只顯示某一百分比而已。如:
28
以前文所述之操作步驟,將其轉到Word,於撰寫報告時,再配合上最底下所加入之該欄總樣本數,也可約略判讀出各儲存格內之樣本數:
29
卡方檢定--傳統作法 對於單選題之交叉表,通常得進行卡方獨立性檢定。以前文政黨傾向交叉地區別資料為例,其虛無假設(H0)與對立假設(H1)為: H0:政黨傾向與地區別無關 H1:兩者有關 α=0.05 傳統之作法為,先計算卡方值,其運算公式為:
30
即讓每一格觀察值減去其期望值,求平方,再除以其期望值,將這些值逐一加總,即為卡方值:
其內之每一格期望值的算法為: 欄% ×列% × 總樣本數 以第一列第一欄為例,其期望值為: 45% ×22.8% × 1000=102.6
31
計算出卡方值為32.743後,再計算自由度: (r-1)*(c-1) r為列數、c為欄數。本例之自由度為3×5=15。 最後,依自由度查『附錄一 卡方分配的臨界值』,比較所計算之卡方值,是否超過所指定顯著水準(α=0.05)的臨界值?若超過,則應棄卻欄變數與列變數並無關聯之虛無假設。反之,則否。 查『附錄一 卡方分配的臨界值』,於自由度15、α=0.05,其臨界值為25.00。而我們所求算出之卡方值32.743>25.00,故應棄卻政黨傾向與地區別無關之虛無假設。也就是說,政黨支持率會隨地區別不同而有顯著差異。
32
卡方檢定--利用SPSS 利用SPSS則不必那麼辛苦,不僅會算出卡方值,還顯示出此卡方值之顯著性,不用經過查表即可判斷出檢定結果。只須於建立過程之『交叉表』對話方塊:
33
按 鈕,選擇要求得「卡方統計量(H)」
34
按〔繼續〕鈕,回上一層對話方塊。再按〔確定〕鈕,則除了顯示原交叉表外
還可獲致卡方檢定之結果:其卡方值為32.743,顯著性(雙尾)為0.005。
35
判斷檢定結果時很簡單,只須看此顯著性是否小於所指定顯著水準之α值。若是,即表示交叉表兩個變項間存有顯著關聯,可省去查表之麻煩。
本例,由於其顯著性0.005<α=0.05,所以應棄卻政黨傾向與地區別無關之虛無假設。故而,我們判定政黨支持率與居住地區存有顯著關聯。
36
判讀並解釋 判讀表內那一個百分比較值得注意並解釋,於求縱向百分比之表內,應以橫向進行觀察。可拿一把尺來一橫,找出該列幾個較高之百分比即可。若該列之總百分比太低,也可以不予分析:
37
分析時,先就最右側之總百分比,做一概述:
整體言,受訪者中,以無政黨傾向者居最高(28.1%)。有明顯政黨傾向之受訪者中,以民進黨的支持率最高(22.8%),其次依序為國民黨(20.4%)、親民黨(19.6%)、台聯(5.5%)、新黨(3.6%)。 然後,對各欄之數字高低,依序說明一下: 經由卡方檢定,其顯著性0.005<α=0.05,應棄卻政黨傾向與地區別無關之虛無假設。亦即,政黨支持率與居住地區存有顯著關聯。以地區別來看,北區主要是支持國民黨與親民黨(22.4%與20.2%),中區是親民黨(22.5%)與民進黨(21.5%)略勝於國民黨(18.5%),南區是民進黨獨大(31.7%),東區則還是國民黨(30.0%)與親民黨的天下(20.0%)。
38
最後,才對以橫向進行觀察,所標出之各該列的幾個較高之百分比進行說明:
以所支持之政黨別來看,民進黨之支持者主要集中於南區;國民黨與親民黨等泛藍政黨之支持者主要集中於北區與東區。而值得注意的是:居最多數之無政黨傾向者,也是以北部多於中區與南區,這些人才是將來各黨要爭取之主要對象。
39
應注意下列事項 卡方檢定僅適用於類別資料(名目變數,如:性別、地區、政黨傾向、宗教信仰、是否有手機、……)。
各儲存格之期望次數不應少於5。通常要有80%以上的儲存格期望次數≧5,否則會影響其卡方檢定的效果。若有期望次數小於5時,可將其合併。
40
由於,各儲存格之期望次數不應少於5。通常要有80%以上的儲存格期望次數≧5,否則會影響其卡方檢定的效果。故而,SPSS之卡方檢定結果,會於最底下計算期望值<5之儲存格比例:
41
本例,期望值(個數)<5之儲存格比例,僅8.3%而已,故並無需進行任何調整。
萬一,本例發生有期望值<5之儲存格比例達20%以上之情形,要進行合併時,也應將政黨性質相近者進行合併。如,將台聯併入民進黨組成一新的集合:泛綠;而將國民黨、親民黨與新黨組成一新的集合:泛藍。 另外一種,避免期望值<5之儲存格比例達20%以上的處理方法為:將樣本數比較少之『台聯』與『新黨』排除於分析之外。但這樣的作法較受爭議,因為無法表示出這兩黨之支持者的現象!
42
縮減組數--組距分組 無論是文字或數字,於交叉表中,均是將不重複出現之內容視為一個類別,去求算交叉表之相關統計數字。當碰上重複性較低之數字,很可能每一個數值均是唯一,而產生幾乎無法縮減其類別之情況。 如,『SPSS範例\Ch07\運動時間.sav』資料:
43
以「分析(A)/描述性統計(E)/交叉表(C)…」求性別對運動時間之交叉表:
44
其結果,有很多種運動時間係獨立存在,產生一列內容。由於組數太多,於資料分析時並無多大作用:
45
較理想之方式為:將毎次運動時間分組,以縮減其組數。若以「轉換(T)/重新編碼(R)/成不同變數(D)…」,將毎次運動時間分為0~30、31~60、61~90、91~120與121~五組:
46
將『重新編碼』結果安排到『時間分組』:
47
續以『時間分組』與『性別』重建一次交叉表:
48
即可得到經縮減組數後之交叉表:
49
期望值個數<5之儲存格比例為10%,並未超過20%。表格無須再行合併以縮減組別。
卡方值為11.312,自由度為4,其顯著水準0.023<α=0.05。所以,應棄卻運動時間長短與性別無關之虛無假設。
50
由表可知,全體受訪者運動時間主要以91~120分鐘居多30. 4%。交叉分析後,可發現男性之運動時間主要以91~120分鐘居多(33
由表可知,全體受訪者運動時間主要以91~120分鐘居多30.4%。交叉分析後,可發現男性之運動時間主要以91~120分鐘居多(33.9%);而女性之運動時間主要以0~30分鐘居多(33.9%)。 就相對比例言,在較長之運動時間部份(31~60、91~120分鐘與120分鐘~)的比例,男性明顯高過女性;而女性則在較短之運動時間部份(0~31與61~90分鐘)的比例,明顯高過男性。可見男性之運動時間普遍較女性來得長一點!
51
馬上練習 針對『SPSS範例\Ch07\手機月費.sav』。注意,『有手機』欄若為2,即表示未使用手機,其『月費』當然為0,並不必將其納入交叉表。以「轉換(T)/重新編碼(R)/成不同變數(D)…」,將月費分為0~200、201~400、401~600、601~四組。求手機月費對性別交叉表,並以卡方檢定兩者是否存有顯著關聯?
52
縮減類別 進行交叉分析表時,通常要有80%以上的儲存格期望次數≧5,否則會影響卡方檢定的效果。若有期望次數小於5時,可將其合併。如,『SPSS範例\Ch07\手機.sav』之資料:
53
以『手機廠牌』交叉『性別』後,其結果為將無手機者(其『手機廠牌』=0)均納入分析,故資料並不正確;且一些廠牌的出現次數並不高。
54
此外,其卡方檢定之結果顯示期望次數<5者有50%,超過20%,故得將組數進行縮減。
55
首先,執行「轉換(T)/重新編碼(R)/成不同變數(D)…」,先將答案為5~9者合併為『9
56
以縮減其組數,並將『廠牌分組』答案為0設定為遺漏值,將其排除掉:
57
續以『廠牌分組』與『性別』重建一次交叉表:
58
即可得到經縮減組數後之交叉表:
59
期望值個數<5之儲存格比例為0%,表格無須再行合併以縮減組別。本例之卡方值為6. 033,自由度為4,其顯著水準0. 197>α=0
期望值個數<5之儲存格比例為0%,表格無須再行合併以縮減組別。本例之卡方值為6.033,自由度為4,其顯著水準0.197>α=0.05。所以,無法棄卻使用之手機廠牌與性別無關之虛無假設。
60
撰寫報告時,對於卡方檢定結果顯示兩變數間無關之交叉分析表,僅須就其最右側之欄百分比進行解釋即可:
整體言,受訪(者所使用之手機廠牌,主要以Nokia為最高(42.9%),其次為Motorola(20.2%);再其次為SAGEN(12.6%)與ERICSSON(11.8%)。 由於兩者無關,就不必再對交叉結果進行說明了!(通常,於報告中也會將此交叉表省略,以縮減篇幅。僅敘述一下其檢定結果並不顯著即可)
61
長條圖 於執行交叉表分析之同時,亦可繪製長條圖。只須於建立過程之『交叉表』對話方塊,選擇「顯示集群長條圖(B)」:
62
則可另顯示一長條圖,以方便判讀分析結果:
63
第七章 結束 辛苦啦!
Similar presentations