第七章交叉分析表.

第七章交叉分析表

交叉分析表市場調查或民意調查，常利用交叉分析表來探討兩個類別變數間之關聯性（如：地區別與某政策之贊成與否、性別與偏好政黨、教育程度與使用品牌、品牌與購買原因、所得與是否有數位相機、……）。

建立交叉分析表茲以『SPSS範例\Ch07\政黨傾向.sav』為例，進行說明建立交叉分析表之過程，該表有1000筆受訪者之資料，『政黨傾向』變數欄內之代碼意義為：（執行「公用程式(U)/變數(R)…」即可查得）

『居住地區』變數欄內之代碼意義為：

擬建立『政黨傾向』對『居住地區』之交叉分析表，其處理步驟為：
執行「分析(A)/描述性統計(E)/交叉表(C)…」

選『政黨傾向』，按鈕，將其送到右側之『列(O)』方塊
選『居住地區』，按鈕，將其送到右側之『直行(C)』方塊

按鈕，設定要顯示「觀察值(O)」及「直行(C)」之百分比（縱向總計為分母之百分比）

按〔繼續〕鈕，回上一層對話方塊按〔確定〕鈕，獲致

由表上之資料可看出：整體言，受訪者中，以無政黨傾向者居最（28. 1%）。有明顯政黨傾向之受訪者中，以民進黨的支持率最高（22
由表上之資料可看出：整體言，受訪者中，以無政黨傾向者居最（28.1%）。有明顯政黨傾向之受訪者中，以民進黨的支持率最高（22.8%），其次依序為國民黨（20.4%）、親民黨（19.6%）、台聯（5.5%）、新黨（3.6%）。經由與地區別交叉分析後，可發現：北區主要是支持國民黨與親民黨（22.4%與20.2%），中區是親民黨（22.5%）與民進黨（21.5%）略勝於國民黨（18.5%），南區是民進黨獨大（31.7%），東區則還是國民黨（30.0%）與親民黨的天下（20.0%）。不過，由於未進行獨立性檢定，我們還不能斷下結論。（有關獨立性檢定之作法，詳本章下文『卡方檢定』之說明。）

馬上練習針對『SPSS範例\Ch07\政黨傾向.sav』，求『政黨傾向』對『性別』之交叉分析表，同時顯示人數及縱向之直行百分比，並解釋其結果。

可約略看出，無論男女，均以『無政黨傾向』居最多數（28. 7%與27. 5%），支持度第二之政黨，在男性為民進黨（27
可約略看出，無論男女，均以『無政黨傾向』居最多數（28.7%與27.5%），支持度第二之政黨，在男性為民進黨（27.5%）；在女性則為國民黨（24.4%）。此外，就相對程度來看，支持民進黨者中，男性比例明顯超過女性（27.5%對18.4%）；支持國民黨者中，女性之比例明顯超過男性（24.4%對16.1%）。不過，由於未進行獨立性檢定，我們還不能斷下結論。

馬上練習針對『SPSS範例\Ch07\品牌偏好原因.sav』，求『品牌』對『偏好原因』之交叉分析表（數值標籤已標示於檔案內）。

於表中同時顯示人數及縱向之直行百分比，並解釋其結果

由表上之資料可看出：整體上消費者偏好其使用品牌的主要原因，依序為『價格便宜』（36.0%）、『外型美觀』（34.0%）與『品質優良』（30.0%）。另由交叉分析，可看出：A牌之使用者，主要是因『價格便宜』（64.7%）而使用A牌產品。B牌之使用者，主要是因『品質優良』（72.7%）而使用B牌產品。C牌之使用者，主要是因『外型美觀』（50.0%）而使用C牌產品。

將分析結果轉入Word 以SPSS雖可求得交叉表，但SPSS畢竟不適合用來撰寫報告，通常，還是以Word來處理。故而，得學會如何自SPSS取得交叉分析表結果，並將其轉換成Word文件之內容。假定，要將先前『馬上練習』中『偏好原因*品牌交叉表』，轉到Word文件。其處理步驟為：以滑鼠右鍵點選輸出結果之交叉表，將出現一選單，選取「複製(C)」，記下交叉表內容

轉到Excel之空白工作表，按『貼上』鈕，將選取內容複製過來

雙按B欄之標題按鈕右側，將其調整為最適欄寬，以便顯示完整文字
於G3輸入『合計』字串將C5、C7、C9與C11之『品牌內的 %』改為『%』將C10之『個數』改為『樣本數』將所有百分比均改為只留一位小數，並加上『%』

選取B3:G11之內容按『複製』鈕，記下所選取之內容

再轉到Word文件，停於要插入交叉表之位置。按『貼上』鈕，將選取內容複製過來

將表格安排成置中格式，將其外框安排為雙線、內框為單線之表格，修飾一下表格之對齊方式

往後，即可於表格之下，輸入分析結果的文字內容：

百分比交叉表的百分比有三種：

橫列(R) 求以橫向總計為分母之百分比

直行(C) 求以縱向總計為分母之百分比

總和(T) 求以總樣本數為分母之百分比

此三種選擇，甚至可同時並存：

不過，為方便撰寫報告，通常僅選取所要之一種即可。有時，由於解釋時，通常以百分比進行說明，故也經常省略其「觀察值(O)」，只顯示某一百分比而已。如：

以前文所述之操作步驟，將其轉到Word，於撰寫報告時，再配合上最底下所加入之該欄總樣本數，也可約略判讀出各儲存格內之樣本數：

卡方檢定--傳統作法對於單選題之交叉表，通常得進行卡方獨立性檢定。以前文政黨傾向交叉地區別資料為例，其虛無假設（H0）與對立假設（H1）為： H0：政黨傾向與地區別無關 H1：兩者有關 α=0.05 傳統之作法為，先計算卡方值，其運算公式為：

即讓每一格觀察值減去其期望值，求平方，再除以其期望值，將這些值逐一加總，即為卡方值：
其內之每一格期望值的算法為：欄% ×列% × 總樣本數以第一列第一欄為例，其期望值為： 45% ×22.8% × 1000＝102.6

計算出卡方值為32.743後，再計算自由度： (r-1)*(c-1) r為列數、c為欄數。本例之自由度為3×5＝15。最後，依自由度查『附錄一卡方分配的臨界值』，比較所計算之卡方值，是否超過所指定顯著水準（α=0.05）的臨界值？若超過，則應棄卻欄變數與列變數並無關聯之虛無假設。反之，則否。查『附錄一卡方分配的臨界值』，於自由度15、α=0.05，其臨界值為25.00。而我們所求算出之卡方值32.743＞25.00，故應棄卻政黨傾向與地區別無關之虛無假設。也就是說，政黨支持率會隨地區別不同而有顯著差異。

卡方檢定--利用SPSS 利用SPSS則不必那麼辛苦，不僅會算出卡方值，還顯示出此卡方值之顯著性，不用經過查表即可判斷出檢定結果。只須於建立過程之『交叉表』對話方塊：

按鈕，選擇要求得「卡方統計量(H)」

按〔繼續〕鈕，回上一層對話方塊。再按〔確定〕鈕，則除了顯示原交叉表外
還可獲致卡方檢定之結果：其卡方值為32.743，顯著性（雙尾）為0.005。

判斷檢定結果時很簡單，只須看此顯著性是否小於所指定顯著水準之α值。若是，即表示交叉表兩個變項間存有顯著關聯，可省去查表之麻煩。
本例，由於其顯著性0.005<α=0.05，所以應棄卻政黨傾向與地區別無關之虛無假設。故而，我們判定政黨支持率與居住地區存有顯著關聯。

判讀並解釋判讀表內那一個百分比較值得注意並解釋，於求縱向百分比之表內，應以橫向進行觀察。可拿一把尺來一橫，找出該列幾個較高之百分比即可。若該列之總百分比太低，也可以不予分析：

分析時，先就最右側之總百分比，做一概述：
整體言，受訪者中，以無政黨傾向者居最高（28.1%）。有明顯政黨傾向之受訪者中，以民進黨的支持率最高（22.8%），其次依序為國民黨（20.4%）、親民黨（19.6%）、台聯（5.5%）、新黨（3.6%）。然後，對各欄之數字高低，依序說明一下：經由卡方檢定，其顯著性0.005<α=0.05，應棄卻政黨傾向與地區別無關之虛無假設。亦即，政黨支持率與居住地區存有顯著關聯。以地區別來看，北區主要是支持國民黨與親民黨（22.4%與20.2%），中區是親民黨（22.5%）與民進黨（21.5%）略勝於國民黨（18.5%），南區是民進黨獨大（31.7%），東區則還是國民黨（30.0%）與親民黨的天下（20.0%）。

最後，才對以橫向進行觀察，所標出之各該列的幾個較高之百分比進行說明：
以所支持之政黨別來看，民進黨之支持者主要集中於南區；國民黨與親民黨等泛藍政黨之支持者主要集中於北區與東區。而值得注意的是：居最多數之無政黨傾向者，也是以北部多於中區與南區，這些人才是將來各黨要爭取之主要對象。

應注意下列事項卡方檢定僅適用於類別資料（名目變數，如：性別、地區、政黨傾向、宗教信仰、是否有手機、……）。
各儲存格之期望次數不應少於5。通常要有80%以上的儲存格期望次數≧5，否則會影響其卡方檢定的效果。若有期望次數小於5時，可將其合併。

由於，各儲存格之期望次數不應少於5。通常要有80％以上的儲存格期望次數≧5，否則會影響其卡方檢定的效果。故而，SPSS之卡方檢定結果，會於最底下計算期望值＜5之儲存格比例：

本例，期望值（個數）＜5之儲存格比例，僅8.3%而已，故並無需進行任何調整。
萬一，本例發生有期望值＜5之儲存格比例達20%以上之情形，要進行合併時，也應將政黨性質相近者進行合併。如，將台聯併入民進黨組成一新的集合：泛綠；而將國民黨、親民黨與新黨組成一新的集合：泛藍。另外一種，避免期望值＜5之儲存格比例達20%以上的處理方法為：將樣本數比較少之『台聯』與『新黨』排除於分析之外。但這樣的作法較受爭議，因為無法表示出這兩黨之支持者的現象！

縮減組數--組距分組無論是文字或數字，於交叉表中，均是將不重複出現之內容視為一個類別，去求算交叉表之相關統計數字。當碰上重複性較低之數字，很可能每一個數值均是唯一，而產生幾乎無法縮減其類別之情況。如，『SPSS範例\Ch07\運動時間.sav』資料：

以「分析(A)/描述性統計(E)/交叉表(C)…」求性別對運動時間之交叉表：

其結果，有很多種運動時間係獨立存在，產生一列內容。由於組數太多，於資料分析時並無多大作用：

較理想之方式為：將毎次運動時間分組，以縮減其組數。若以「轉換(T)/重新編碼(R)/成不同變數(D)…」，將毎次運動時間分為0~30、31~60、61~90、91~120與121~五組：

將『重新編碼』結果安排到『時間分組』：

續以『時間分組』與『性別』重建一次交叉表：

即可得到經縮減組數後之交叉表：

期望值個數＜5之儲存格比例為10%，並未超過20%。表格無須再行合併以縮減組別。
卡方值為11.312，自由度為4，其顯著水準0.023<α=0.05。所以，應棄卻運動時間長短與性別無關之虛無假設。

由表可知，全體受訪者運動時間主要以91~120分鐘居多30. 4%。交叉分析後，可發現男性之運動時間主要以91~120分鐘居多（33
由表可知，全體受訪者運動時間主要以91~120分鐘居多30.4%。交叉分析後，可發現男性之運動時間主要以91~120分鐘居多（33.9%）；而女性之運動時間主要以0~30分鐘居多（33.9%）。就相對比例言，在較長之運動時間部份（31~60、91~120分鐘與120分鐘~）的比例，男性明顯高過女性；而女性則在較短之運動時間部份（0~31與61~90分鐘）的比例，明顯高過男性。可見男性之運動時間普遍較女性來得長一點！

馬上練習針對『SPSS範例\Ch07\手機月費.sav』。注意，『有手機』欄若為2，即表示未使用手機，其『月費』當然為0，並不必將其納入交叉表。以「轉換(T)/重新編碼(R)/成不同變數(D)…」，將月費分為0~200、201~400、401~600、601~四組。求手機月費對性別交叉表，並以卡方檢定兩者是否存有顯著關聯？

縮減類別進行交叉分析表時，通常要有80％以上的儲存格期望次數≧5，否則會影響卡方檢定的效果。若有期望次數小於5時，可將其合併。如，『SPSS範例\Ch07\手機.sav』之資料：

以『手機廠牌』交叉『性別』後，其結果為將無手機者（其『手機廠牌』=0）均納入分析，故資料並不正確；且一些廠牌的出現次數並不高。

此外，其卡方檢定之結果顯示期望次數＜5者有50%，超過20%，故得將組數進行縮減。

首先，執行「轉換(T)/重新編碼(R)/成不同變數(D)…」，先將答案為5~9者合併為『9

以縮減其組數，並將『廠牌分組』答案為0設定為遺漏值，將其排除掉：

續以『廠牌分組』與『性別』重建一次交叉表：

即可得到經縮減組數後之交叉表：

期望值個數＜5之儲存格比例為0%，表格無須再行合併以縮減組別。本例之卡方值為6. 033，自由度為4，其顯著水準0. 197>α=0
期望值個數＜5之儲存格比例為0%，表格無須再行合併以縮減組別。本例之卡方值為6.033，自由度為4，其顯著水準0.197>α=0.05。所以，無法棄卻使用之手機廠牌與性別無關之虛無假設。

撰寫報告時，對於卡方檢定結果顯示兩變數間無關之交叉分析表，僅須就其最右側之欄百分比進行解釋即可：
整體言，受訪（者所使用之手機廠牌，主要以Nokia為最高（42.9%），其次為Motorola（20.2%）；再其次為SAGEN（12.6%）與ERICSSON（11.8%）。由於兩者無關，就不必再對交叉結果進行說明了！（通常，於報告中也會將此交叉表省略，以縮減篇幅。僅敘述一下其檢定結果並不顯著即可）

長條圖於執行交叉表分析之同時，亦可繪製長條圖。只須於建立過程之『交叉表』對話方塊，選擇「顯示集群長條圖(B)」：

則可另顯示一長條圖，以方便判讀分析結果：

第七章結束辛苦啦！

第七章交叉分析表.

Similar presentations

Presentation on theme: "第七章交叉分析表."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第七章 交叉分析表.

Similar presentations

Presentation on theme: "第七章 交叉分析表."— Presentation transcript:

Similar presentations

About project

反馈

第七章交叉分析表.

Presentation on theme: "第七章交叉分析表."— Presentation transcript: