第七章 交叉分析表
交叉分析表 市場調查或民意調查,常利用交叉分析表來以探討兩個類別變數間之 關聯性(如:地區別與某政策之贊成與否、性別與偏好政黨、教育程 度與使用品牌、品牌與購買原因、所得與是否有數位相機、……)。 於Excel中,交叉分析表係利用『樞紐分析表』或『假設狀況分析/資 料表』來建立。不過,還是以前者較為簡單。所以,我們就僅介紹 『樞紐分析表』。
建立樞紐分析表 茲以範例Ch07.xlsx『政黨傾向與地區別』工作表為例,進行說明建立 交叉分析表之過程,該表有1000筆受訪者之資料,各欄內之代碼意義 請參見表內文字說明。
以滑鼠單按問卷資料之任一儲存格 切換到『插入』索引標籤,按『表格』群組『樞紐分析表』鈕, 轉入『建立樞紐分析表』對話方塊
於上半部,選「選取表格或範圍(S)」,其內所顯示者恰為薪資資料之範圍 (Excel會自動判斷正確範圍,若有不適,仍可自行輸入或重選正確之範圍) 於下半部,選「已經存在的工作表(E)」項,續選按L3儲存格。表欲將樞紐分 析表安排於目前工作表之L3處
按 鈕,續利用捲動軸,轉到可以看見L3儲存格之位置,可發現 已有一空白的樞紐分析表,且右側也有一個『樞紐分析表欄位清單』窗格
於右側『樞紐分析表欄位清單』窗格上方之『選擇要新增到報表的欄位:』 處,以拖曳之方式,將『□ 居住地區』拉到『欄標籤』方塊;將『□ 政黨傾 向』項拉到『列標籤』方塊;將『□ 性別』拉到『Σ值』方塊,可求得初始 樞紐分析表,表內所求算之統計量,其預設值為求算選取欄位(性別)之加 總。因為,係要求人數(即項目個數),故將那一個欄位拖曳到『Σ值』方塊, 均不影響本例之求算動作。
於『Σ值』方塊,單按『加總-性別』項右側之向下箭頭,續選「值欄位設定 (N)…」,轉入『值欄位設定』對話方塊
於『摘要值欄位方式(S)』處將其改為「項目個數」,以求算出現次數(即記 錄數);續於上方『自訂名稱(C)』處,將原內容改為『人數』
按 鈕,L3儲存格處之樞紐分析表已改為人數
利用捲動軸按鈕,將表格調往螢幕左上角,以節省畫面空間。點按M3儲存格, 將其『欄標籤』字串改為『居住地區』;點按L4儲存格,將其『列標籤』字 串改為『政黨傾向』,於M4:P4輸入各數字所對應之居住地區,於L5:L10輸 入各數字所對應之政黨名稱,以利閱讀 輸入時,得逐格輸入,無法一次複製多格內容。
按 或 之向下箭頭,可就如下式之選單:
選擇要保留或取消那一類別之資料,續按 鈕,樞紐分析表可立 即改成最新之交叉結果:(假定,取消政黨傾向為「無」之類別)
馬上練習 針對範例Ch07.xlsx之『政黨傾向與性別』工作表,求政黨傾向交叉性 別之樞紐分析表。
馬上練習 針對範例Ch07.xlsx『品牌交叉偏好原因』工作表,求品牌交叉偏好原 因之樞紐分析表。
加入百分比 總百分比 各儲存格之數字除以總樣本數 欄百分比 各欄內之儲存格數字除以該欄總樣本數 列百分比 各列內之儲存格數字除以該列總樣本數 就算求得前述之樞紐分析表,我們也不太會分析。得再加入百分比資 料,才方便解釋。於表中可加入三種百分比: 總百分比 各儲存格之數字除以總樣本數 欄百分比 各欄內之儲存格數字除以該欄總樣本數 列百分比 各列內之儲存格數字除以該列總樣本數 假定,欲於原建立之『政黨傾向交叉居住地區』交叉表內,加入欄百 分比。其操作步驟為:(詳範例Ch07.xlsx『加入欄百分比』工作表) 以滑鼠單按樞紐分析表內任一儲存格
於右側『樞紐分析表欄位清單』窗格上方之『選擇要新增到報表的欄位』處, 以滑鼠拖曳『□ 性別』欄位。將其拉到右下方之『Σ值』方塊內,『人數』 項目之下。所增加之內容,目前係加於原各欄之右側
以滑鼠拖曳『欄標籤』方塊內『Σ值』項目,將其拉到『列標籤』方塊內, 『政黨傾向』項目之下
按右下方『Σ值』方塊內,『加總-性別』項右側之向下箭頭,續選「值欄位 設定(N)…」,轉入『值欄位設定』對話方塊,於『摘要值欄位方式(S)』處 將其改為「項目個數」,以求算出現次數,另於『自訂名稱(C)』處,將原內 容『加總-性別』改為『%』
切換到『值的顯示方式』標籤
按『值的顯示方式(A)』下方之向下箭號,選取使用「總欄數的百分比」 按 鈕,獲致含人數及縱向百分比之交叉分析表
馬上練習 針對範例Ch07.xlsx『政黨傾向與性別之欄百分比』工作表,求政黨傾 向交叉性別之樞紐分析表,同時顯示人數及其縱向之欄百分比,並解 釋其結果。
馬上練習 針對範例Ch07.xlsx『品牌交叉偏好原因之欄百分比』工作表,求品牌 交叉偏好原因之樞紐分析表。於表中同時顯示人數及其縱向之欄百分 比,並解釋其結果。
加入篩選依據 樞紐分析表內,尚允許加入分頁項目(如:性別),作為交叉表的上 一層分組依據,以便查閱不同性別,各地區的政黨傾向。 假定,欲續於前文之樞紐分析表內再加入『性別』作為分頁依據。其 處理步驟為:(詳範例Ch07.xlsx『加入篩選依據』工作表) 以滑鼠單按樞紐分析表內任一儲存格 於右側『樞紐分析表欄位清單』窗格上方之『選擇要新增到報表的欄 位』處,以滑鼠拖曳『性別』欄位。將其拉到『報表篩選』方塊內, 即可完成加入篩選依據之設定,獲致新的樞紐分析表
以「性別」為篩選依據之樞紐分析表,會於上方加有一下拉式選擇表 目前其上顯示「(全部)」,故樞紐分析表內,所顯示者為全部資料的交叉表 分析結果。欲查閱不同性別資料時,可單按右側之向下箭頭,將顯示各性別之 內容以供選擇: 選妥後,按 鈕,樞紐分析表內容將轉為僅顯示該性別之內容而已。 如,僅過濾出「1」(男性)之資料而已:
馬上練習 為範例Ch07.xlsx『加入地區別篩選』工作表中之交叉表,加入以『居 住地區』當篩選依據,僅顯示居住地區為『南區』(3)之結果,並加 以解釋。
變更樞紐分析表的版面配置 欲變更樞紐分析表的版面配置,如:將樞紐分析表資料進行轉軸(移 轉欄列方向)或移動資料項位置,均可以直接拖放欄位方式,來更改 樞紐分析表資料的版面配置。當重新組織樞紐分析表的資料時,它會 自動重新計算,且不影響來源資料。
欄列位置互換 欲將樞紐分析表進行轉軸(移轉欄列方向),其處理步驟為:(詳範 例Ch07.xlsx『欄列位置互換』工作表) 以滑鼠單按樞紐分析表內任一儲存格
於右側『樞紐分析表欄位清單』窗格,以滑鼠拖曳方式,將『欄標籤』與 『列標籤』之內容互換位置,欄/列內容即已互換:(目前L5:L8之欄標籤內 容為各地區別,只是L4之標題仍為"政黨傾向";M4:R4之列標籤內容為各政 黨別,只是M3之標題仍為"居住地區")
將L4之標題改為"居住地區",M3之標題改為"政黨傾向",使標題與其內容相 符
移動樞紐分析表資料項目 移動樞紐分析表資料項目位置,當然可於『樞紐分析表欄位清單』窗 格之『Σ值』方塊,以拖曳方式進行移動位置。但也可以於樞紐分析表 上,直接以滑鼠進行拖曳! 於範例Ch07.xlsx『移動資料項目』工作表之樞紐分析表,若欲將『人 數』與『%』兩資料項,進行互換位置:
以滑鼠單按L6之『人數』標題 將滑鼠移往『人數』標題之上緣框邊,指標將由空心十字轉為四向箭頭,按 住滑鼠拖曳,拖到『%』標題之下,再鬆開滑鼠,將可獲致已移妥資料項目 的新樞紐分析表
區間分組 無論是文字、日期或數字,於樞紐分析表中,均是將不重複出現之內 容視為一個類別,去求算交叉表之相關統計數字。當碰上重複性較低 之日期或數字,很可能每一個數值均是唯一,而產生幾乎無法縮減其 類別之情況。 如,範例Ch07.xlsx『運動時間未分組』工作表,性別交叉每次運動時 間之結果,有很多種時間係獨立存在產生一列內容,由於組數太多, 於資料分析時並無多大作用:
較理想之方式為將毎次運動時間分組,以縮減其組數。假定,要將毎次運動時 間分為0~30、31~60、61~90、91~120與121~五組。可於資料表尾部,新增 一『時間分組』欄以 =IF(C2<=30,1,IF(C2<=60,2,IF(C2<=90,3,IF(C2<=120,4,5)))) 之運算式,將其分為六組。重建一次樞紐分析表,即可得到經縮減組數後之交 叉表:(詳範例Ch07.xlsx『性別交叉運動時間-分組』工作表)
將F5:F9時間分組與G4:H4性別之數字改為字串,將更易判讀樞紐分析表之內 容: 當然,也可以前文之技巧,一次即求出人數及縱向百分比:(詳範例 Ch07.xlsx『性別交叉運動時間-分組加上%』工作表)
馬上練習 依範例Ch07.xlsx『年齡分組交叉性別』工作表之性別與年齡資料,將 年齡分為『~35』與『36~』兩組,建立性別交叉年齡之筆數與縱向百 分比:
馬上練習 依範例Ch07.xlsx『性別交叉所得』工作表資料,將所得分為 『~40000』、『40001~50000』與『50001~』三組,建立性別交叉 所得之筆數與縱向百分比:
僅取部分資料區間分組 不過,問卷上常有答了A題,才可續答B題之情況。如:有使用手機者 才須要問其平均月費。因此,其資料就得略加整理才能進行後續之交 叉分析。 如範例Ch07.xlsx『手機平均月費』工作表內,B欄若為2,即表示未 使用手機,當然不必將其手機月費納入樞紐分析表:
停於B欄,切換到『資料』索引標籤,按『排序與篩選』群組之 『從最小 到最大排序』鈕,使該欄資料為1者,排於前面。如此,可將有手機者集中在 一起 假定,要將手機月費分為~200、201~400、401~600、601~等四組。於E2輸 入 =IF(C2<=200,1,IF(C2<=400,2,IF(C2<=600,3,4))) 並將其抄給E2:E120,即抄給有使用手機者而已:
點按A1:E120之任一儲存格,切換到『插入』索引標籤,按『表格』群 組『樞紐分析表』鈕,轉入『建立樞紐分析表』對話方塊,重選 A1:E120當來源範圍(此範圍即為有手機者之資料)
往後之操作步驟,即同於前文各節。假定,將其安排為性別交叉手機月費分 組資料,並求其欄百分比
取得樞紐分析表內容GETPIVOTDATA() GETPIVOTDATA(data_field,pivot_table,field1,item1,field2, item2,...) GETPIVOTDATA(欄位名稱,樞紐分析表,欄位1,項目1,…) 欄位名稱為用雙引號括起來的文字串或以文字型態存放之儲存格內容, 用來指明要在樞紐分析表取得何種標籤文字下所對應之資料。如:"人 數"、"%"。 樞紐分析表可以是表中的一個儲存格或是儲存格範圍,或是樞紐分析 表上方的一個標籤。 欄位1,項目1,…為1到126組成對的欄位名稱與項目名稱,用以標明要 擷取的資料,其配對組合可依任何順序排列。
茲以範例Ch07.xlsx『GETPIVOTDATA』工作表政黨傾向交叉地區別之資料 為例,若要以下表取得居住於『北區』政黨傾向『民進黨』之觀察値(人數), 可使用 =GETPIVOTDATA("人數",$L$3,"政黨傾向","民進黨","居住地區","北區") 表示要於L3這個樞紐分析表中,取得『人數』列(第6、第9、…第21)之內 容,其對應位置為:『政黨傾向』為「民進黨」、『居住地區』為「北區」。 取得此一公式甚為簡單,於U5先輸入=號再點選M6即可:
由於其欄位與項目之配對組合可依任何順序排列,故公式也可輸入成: =GETPIVOTDATA(“人數”,$L$3,“居住地區”,“北區”,“政黨傾向”,“民進黨”) 但這種公式,所有內容均為常數,不適合抄給別的儲存格。故將其改為 =GETPIVOTDATA("人數",$L$3,"政黨傾向",$T5,"居住地區",U$4) 並抄給U5:X10,即可取得各地區不同政黨傾向之觀察值:
當然,您也會認為:為何不直接於『北區』欄使用 =M6 =M9 … =M21 來取得,續再將U5:U10抄給U5:X10?(詳範例Ch07.xlsx『不使用 GETPIVOTDATA』工作表)
其理由有二: 由於列間夾有『%』資料,輸入公式=M6、=M9、=M12、……時,無法使用 複製方式進行,得逐一輸入 若樞紐分析表之篩選標準一旦改變,如以 將樞紐分析表改為不顯示『北區』之資料。我們將很容易發現,因樞紐分析表 欄數變少了,導致U5:X10所取得之觀察值均向左遞移一欄,而取得錯誤資料。 以『東區』之資料為例,其資料係原總計欄之人數:
但若改為使用GETPIVOTDATA()函數,則無論樞紐分析表如何改變,均不會 有前述之缺點發生: 『北區』欄目前顯示參照錯誤『#REF
馬上練習 針對範例Ch07.xlsx『性別交叉運動時間之觀察值』工作表內容,求其 觀察值之範圍:
卡方分配CHIDIST() CHIDIST(x,自由度) CHIDIST(x,degrees_freedom) 自由度(d.f.)將隨所使用之適合度檢定、獨立性檢定或同質性檢定而 不同。適合度檢定之自由度為組數減1(k-1)、獨立性檢定或同質性 檢定之自由度均為(列數-1)×(行數-1)即(r-1)*(c-1)。 本函數在求:於某一自由度下之卡方分配中,求x值以外之右尾的總面 積(機率)。即傳回卡方分配之右尾累計機率值(下圖之陰影部份):
卡方分配之圖形及機率值,將隨自由度不同而略有不同。以自由度為10與20 之情況下,不同卡方值所求得之單尾累計機率分別為:(詳範例Ch07 卡方分配之圖形及機率值,將隨自由度不同而略有不同。以自由度為10與20 之情況下,不同卡方值所求得之單尾累計機率分別為:(詳範例Ch07.xlsx 『CHIDIST』工作表)
卡方分配反函數CHIINV() CHIINV(累計機率,自由度) CHIINV(probability,degrees_freedom) 於已知自由度之卡方分配中,求某累計機率所對應之卡方值。此卡方 值為依單尾累計機率所求。 由於卡方分配之圖形及機率值,將隨自由度不同而略有不同。下表是 以自由度為10之情況下,所求得之結果:(詳範例Ch07.xlsx 『CHIINV』工作表)有了此函數,即可省去查卡方分配表之麻煩。 (卡方分配的臨界值詳附錄三)
馬上練習 以範例Ch07.xlsx『以CHIINV查卡方值』工作表,求自由度(d.f.) 為1~15之情況下,單尾機率為25%、10%、5%、2.5%、1%與0.5%之 卡方值:
不過,要特別注意的是:若卡方分配反函數CHIINV()內之累計機率太小,通 常於非常顯著之情況,其P值已為0值,則本函數之結果將為#NUM 不過,要特別注意的是:若卡方分配反函數CHIINV()內之累計機率太小,通 常於非常顯著之情況,其P值已為0值,則本函數之結果將為#NUM!之錯誤。 如,下表之B8內容:(詳範例Ch07.xlsx『CHIINV之缺點』工作表) 如此,將使得我們於已知P值與自由度時,想逆向求其卡方值,會發生無法求 算其卡方值之窘境,僅能取得#NUM!之錯誤(當P值已為0值時)。此時,只 好利用下文『傳統計算方式』之方式來求算卡方值。
卡方檢定CHITEST() CHITEST(觀察值範圍,期望值範圍) CHITEST(actual_range,expected_range) 本函數將依觀察值範圍與期望值範圍計算其卡方值,再傳回該值於卡方分 配之右尾機率(P)。判斷檢定結果時很簡單,只須看此P值是否小於所指 定顯著水準之α值。若是,即表示要棄卻交叉表之兩個變項間無任何關聯的 虛無假設,也就是說交叉表之兩個變項間存有顯著關聯。 觀察值範圍為交叉表之實際資料,期望值範圍則為依各欄列之機率所計算 而得之期望值。 卡方之運算公式為: 讓觀察值範圍的每一格減去期望值範圍對應位置之每一格的值,求平方, 再除以期望值範圍對應位置之每一格的值,將這些值逐一加總,即為卡方 值: 然後,計算自由度(r-1)*(c-1),r為列數、c為欄數,並查表算出此一卡方值 於卡方分配之右尾機率(P)。
傳統計算方式 茲以範例Ch07.xlsx『卡方-傳統計算』工作表之政黨傾向交叉地區別 資料為例:
說明如何進行卡方檢定,以判斷政黨支持率之高低,會不會因地區別不同而 有顯著差異,也就是要進行其獨立性檢定。其虛無假設(H0)與對立假設 (H1)為: α=0.05 其操作步驟為: 輸入標題
於U5輸入=,續點選樞紐分析表之M6,可取得 =GETPIVOTDATA(“人數”,$L$3,“政黨傾向”,“民進黨”,“居住地區”,“北區”) 將其改為 =GETPIVOTDATA("人數",$L$3,"政黨傾向",$T5,"居住地區",U$4)
續將其抄給U5:U10,再將U5:U10抄給U5:X10,取得各儲存格之觀察値 選取U5:Y11,切換到『常用』索引標籤,按『編輯』群組之『加總』鈕,取 得欄/列之加總
期望值範圍處,第一欄第一列第一欄(AB5)之期望值應為樞紐分析表之: 第一欄% × 第一列% × 總樣本數 450/1000 × 228/1000 × 1000 可簡化成 第一欄% × 第一列總計 450/1000 × 228 或 第一欄總計 × 第一列% 450 × 228/1000 以U5:Y10之觀察值範圍之內容來表示,其公式將為 =U$11*$Y5/$Y$11
續將其抄給AB5:AB10,再將AB5:AB10抄給AB5:AE10,取得各儲存格之期 望値 接著,來計算每格之 假定,要將其安排於U13:X18。U13處之公式應為: 即 =(U5-AB5)^2/AB5
將U13:X18之值加總,即卡方值32. 74: 傳統之作法,是査附錄三卡方分配的臨界值,於自由度15((4-1)
但由於有CHIDIST()函數,只須將卡方值與自由度,代入CHIDIST()函數 =CHIDIST(U20,U21) 即可求得其右尾之機率(P值,卡方獨立性檢定的顯著水準) 判斷檢定結果時很簡單,只須看此P值是否小於所指定顯著水準之α值。若是, 即表示交叉表之兩個變項間存有顯著關聯,故可省去查表之麻煩。本例,由 於其P值0.005<α=0.05,所以應棄卻政黨傾向與地區別無關之虛無假設,其 結論同於先前查表之結果
應注意下列事項 使用卡方檢定進行分析時,應注意下列事項: 卡方檢定僅適用於類別資料(名目變數,如:性別、 地區、政黨傾向、宗教信仰、是否有手機、……)。 各細格之期望次數不應少於5。通常要有80%以上的 期望次數≧5,否則會影響其卡方檢定的效果。若有 期望次數小於5時,可將其合併。如:原所得以
分成五組,於卡方檢定時,發現有太多細格之期望次數小 於5,可將其合併成: 縮減成三組,使每組人數變大後,可望消除部份期望次數 小於5之情況。 由於,各細格之期望次數不應少於5。通常要有80%以上 的期望次數≧5,否則會影響其卡方檢定的效果。故而,我 們於AE13以 =COUNTIF(AB5:AE10,"<5")/COUNT(AB5:AE10) 計算期望值<5之儲存格比例,發現僅8.3%而已,故並無 需進行任何調整:
利用CHITEST() 同樣之例子,於求得觀察值範圍(U5:X10)與其期 望值範圍(AB5:AE10)後,即可直接以 =CHITEST(U5:X10,AB5:AE10) 利用CHITEST()函數,求得其檢定結果(P值): (詳範例Ch07.xls『卡方-CHITEST』工作表)
當然,也可以透過顯著水準之P值與自由度,利用 CHIINV()函數,以 =CHIINV(X13,X15) 逆向求得其卡方值32.74:
馬上練習 針對範例Ch07.xlsx『卡方-性別交叉運動時間』工作 表之交叉表,以卡方檢定運動時間與性別是否存有顯 著之關聯(α=0.05):
馬上練習 針對範例Ch07.xlsx『卡方-手機平均月費交叉性別』 工作表之交叉表,以卡方檢定手機月費與性別是否存 有顯著之關聯:
複選題 複選題雖可多獲得幾個答案,但於分析時,卻多了很 多限制。即便是使用SPSS或SAS統計套裝軟體,複 選題也只能進行次數分配與交叉分析而已,且還無法 進行卡方檢定。若無法檢定,將會使我們寫報告時, 寫得非常沒有信心。更何況,Excel是無法直接處理 複選題的,得加上許多額外步驟。所以,應儘量避免 將問題設計成複選題! 假定,要處理
其資料列於範例Ch07.xlsx『上網原因交叉性別』工作表 ,本資料是針對107位大學生進行調查而得,常上網者有 104筆資料:
停於B欄,切換到『資料』索引標籤,按『排序與篩選』 群組之 『從最小到最大排序』鈕,將其遞增排序,使 常上網者之樣本集中在前面 切換到『插入』索引標籤,按『表格』群組『樞紐分析 表』鈕,轉入『建立樞紐分析表』對話方塊,將滑鼠移 回工作表上,重新選取A1:F105當來源範圍(此範圍即為 常上網者之資料)
往後之操作步驟即同於前文各節。由於複選題有三個答案 ,故先求性別交叉第一個上網原因之答案數(項目個數) 及其欄百分比,將其安排於H3。我們使用『答案數』而不 使用『人數』,是因為本題係複選題,其答案數會大於樣 本數,為避免混淆而不使用『人數』。獲致性別交叉第一 個上網原因之答案數及其欄百分比
由於複選題有三個答案,故回原問卷之資料的任一儲存 格,再仿前文操作步驟,於H31求性別交叉第二個上網 原因之答案數及其欄百分比
仿前文之作法,於H61求性別交叉第三個上網原因之答 案數及其欄百分比
於N5右下輸妥標題、答案、性別內容及其對應編號 雖然,前面幾個交叉表中,有答案0之情況,那只是受訪者未填答之現象,如:可複選三項,但受訪者僅填兩項原因而已。故於最後之總表,並未列出答案為0之編號,是要將0排除出去。
停於Q8,先輸入=號,續以滑鼠點選I6,取得第一個原因之第 一列第一欄內容,公式轉為 =GETPIVOTDATA(“答案數”,$H$3,“原因1”,1,“性別”,“男“) 補上+號,續以滑鼠點選I34,取得第二個原因之第一列第一欄 內容,公式轉為 =GETPIVOTDATA(”答案數”,$H$3,“原因1”,1,“性別”,“男 ”)+GETPIVOTDATA(“答案數”,$H$31,“原因2”,2,“性別”,“男“) 補上+號,續以滑鼠點選I64,取得第三個原因之第一列第一欄 內容,公式轉為 =GETPIVOTDATA("答案數",$H$3,"原因1",1,"性別","男 ")+GETPIVOTDATA("答案數",$H$31,"原因2",2,"性別","男 ")+GETPIVOTDATA("答案數",$H$61,"原因3",0,"性別","男") 按Enter鈕結束,取得三個原因表之第一列第一欄的答案數加 總 不過,應注意的的是:第一個表之第一列第一欄為原因答1之 答案數、第二個表之第一列第一欄為原因答2之答案數,第三 個表之第一列第一欄為原因答0之答案數,故其加總之數字並 非原因答1之答案數總計!
將公式改為 =GETPIVOTDATA(“答案數”,$H$3,“原因1”,$N8,“性別 ”,Q$7)+GETPIVOTDATA(“答案數”,$H$31,“原因 2”,$N8,“性別”,Q$7)+GETPIVOTDATA(“答案數 ”,$H$61,“原因3”,$N8,“性別”,Q$7) 以加總三個表中之性別為男(Q$7)、原因答1($N8) 之人數加總。但卻獲致#REF!之錯誤: 此乃第二、三個原因之交叉表上,並無填答第1個原因『 方便與家人聯絡』之故。
將公式改為先以ISERROR()判斷GETPIVOTDATA()是 否無資料?若無資料(ISERROR()成立),安排0以免 取得#REF 將公式改為先以ISERROR()判斷GETPIVOTDATA()是 否無資料?若無資料(ISERROR()成立),安排0以免 取得#REF!錯誤;反之,若有資料(ISERROR()不成立 ),則取該函數之結果: =IF(ISERR(GETPIVOTDATA("答案數",$H$3,"原因 1",$N8,"性別",Q$7)),0,GETPIVOTDATA("答案數 ",$H$3,"原因1",$N8,"性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("答案數 ",$H$31,"原因2",$N8,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$31,"原因 2",$N8,"性別",Q$7))+IF(ISERR(GETPIVOTDATA("答 案數",$H$61,"原因3",$N8,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$61,"原因 3",$N8,"性別",Q$7)) 方可取得正確之結果7:
將公式以拖曳方式向下抄給Q9,取得 =IF(ISERR(GETPIVOTDATA("答案數",$H$3,"原因 1",$N9,"性別",Q$7)),0,GETPIVOTDATA("答案數 ",$H$3,"原因1",$N9,"性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("答案數 ",$H$31,"原因2",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$31,"原因 2",$N9,"性別",Q$7))+IF(ISERR(GETPIVOTDATA("答 案數",$H$61,"原因3",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("答案數",$H$61,"原因 3",$N9,"性別",Q$7)) 之公式
停於該格(Q9),切換到『常用』索引標籤,按『編輯 』群組『尋找及選取』鈕續選「取代(R)…」,進入『尋 找及取代』對話方塊,於『尋找目標』輸入『答案數』 ;於『取代成』輸入『%』
按【取代】鈕,可將公式內之『答案數』全改為『%』, 按【關閉】鈕結束,公式改為: =IF(ISERR(GETPIVOTDATA("%",$H$3,"原因 1",$N9,"性別",Q$7)),0,GETPIVOTDATA("%",$H$3,"原 因1",$N9,"性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("%",$H$31,"原 因2",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("%",$H$31,"原因2",$N9," 性別 ",Q$7))+IF(ISERR(GETPIVOTDATA("%",$H$61,"原 因3",$N9,"性別 ",Q$7)),0,GETPIVOTDATA("%",$H$61,"原因3",$N9," 性別",Q$7)) 加總出三個表中之性別為男(Q$7)、上網原因答1( $N9)之%加總:
將Q9之格式安排為百分比樣式 選取Q8:Q9,將兩個公式以拖曳方式向下抄給Q10:Q27 ,可求得男性受訪者之複選題各答案數及其百分比。
於Q8:Q27尚呈選取狀態下,以拖曳方式向右抄給R8:R27 可求得男/女受訪者之複選題各答案數及其百分比,即常 上網原因交叉性別之結果及其欄百分比
以SUM()求算Q28:R29之總計,Q28儲存格之公式為: =SUM(Q8,Q10,Q12,Q14,Q16,Q18,Q20,Q22,Q24,Q26) 抄給Q29後,將格式改為百分比格式。選取兩格,將其抄 到R28:R29:
以COUNTIF()求Q30:R30之樣本數,Q30儲存格之公式 為: =COUNTIF($F$2:$F$105,Q6) 可求得男性樣本數(Q6之內容為1),續將其抄給R30, 可求得女性樣本數:
S30儲存格之公式為: =SUM(Q30:R30) 為經常上網者之總樣本數
以SUM()求算S欄之加總,S8儲存格之公式為: =SUM(Q8:R8) S9儲存格之公式為: =S8/$S$30 將格式改為百分比格式。選取S8:S9兩格,將其抄到S29 。S29儲存格之數字代表:每一位受訪者,平均填答了幾 個上網原因(2.952),其數字為307/104。
最後,將整個表匯集出來,可發現:整體言,大學生常上 網之主要原因為:『親人提供』佔49. 0%、『追求流行』 佔46 最後,將整個表匯集出來,可發現:整體言,大學生常上 網之主要原因為:『親人提供』佔49.0%、『追求流行』 佔46.2%與『同儕間比較的心理』佔40.4%: 交叉分析後,可看出:男同學常上網之主要原因為:『親人提供』佔50.0%與『同儕間比較的心理』佔44.8%。而女同學常上網之主要原因為:『追求流行』佔56.5%與『親人提供』佔47.8%。可見常上網原因,除了係因為家中之親人已提供了上網的設備外,男生是因為與同儕比較,認為不會上網會輸給別人而去上網居多;而女生則是因為追求流行而去上網居多。
馬上練習 假定,要處理
之問卷內容,其資料安排於範例Ch07.xlsx『常用飲料交 叉性別』工作表,求常用飲料交叉性別之複選結果,並加 以解釋:
馬上練習 假定,要處理 之問卷內容,其資料安排於範例Ch07.xlsx『未購買 數位相機原因交叉性別』工作表:
求未購買數位相機原因交叉性別之複選結果,並加以解釋:
重點整理 建立樞紐分析表、百分比、篩選 變更樞紐分析表的版面配置 區間分組、僅取部分資料區間分組 取得樞紐分析表內容 GETPIVOTDATA(欄位名稱,樞紐分析表,欄位1,項目1,…) 卡方分配基本定義(補充) 卡方分配CHIDIST(卡方值x,自由度),傳回右尾的機率P CHIINV(累計機率,自由度),傳回卡方值 傳統方法計算卡方檢定 卡方檢定CHITEST(觀察值範圍,期望值範圍) P<α,即表示兩個變項間存有顯著關聯、 期望次數不應少於5 複選題處理步驟(選讀)
第七章 結束 謝謝!