第十六章 集群分析
概念 集群分析(cluster analysis)之目的,在將事物按其特性分成幾個集群,使同一集群內之事物具有高度相似性(homogeneity);不同集群之事物則具有高度之異質性(heterogeneity)。 對於衡量相似性,有使用距離(如:歐幾里德距離、馬氏距離、……)或使用配合係數與相似比。
層次集群法(hierarchical method) 對於建立集群的方法,可分為: 層次集群法(hierarchical method) 此法先將每一事物當成一個點,計算每一點間之距離(或相適度),將最接近的兩個點其合併成一個群體,少了一個點之後,再重新計算每一點間之距離(或相適度),再將最接近的兩個點其合併成一個群體。如此,逐次縮減點數,直至所有點均合併成一個群體為止。層次集群法最大的缺點就是執行速度較慢 。 非層次集群法(non-hierarchical method) 最常被用的方法為K平均數法(K-means method),K即其組數。此法最大的優點是執行速度較快;但最大的問題在如何決定其K(組數),以及如何安排其種子點?通常是以隨機方式安排,如果不小心將種子點安排的太接近,很可能使各群之差異變得不明顯。
二階段集群法(two-stage clustering approach) 由M. Anderberg在1973年提出,以層次集群法(最好是華德法或平均連鎖法)取得集群數目,計算出各群之重心。再以各群之重心為種子點,投入K平均數法進行重新分群。 要解釋集群分析之處理步驟及過程,最好是不要有太多樣本點及變數。如此,才能繪出圖形並判讀其樹狀結構圖。所以,我們先以一個簡單之實例進行解說,然後再以正常之問卷調查結果來進行分析。
於十三章,我們曾針對『SPSS範例\Ch13\洗髮精購買考慮因素 於十三章,我們曾針對『SPSS範例\Ch13\洗髮精購買考慮因素.sav』,將訪者對:價格、去頭皮屑、保濕、熱油護髮、防止掉髮、止癢、避免抗藥性、天然成分、香味、防止分岔、柔順、整體綜合效果、包裝、口碑、方便購買、知名度、流行與廣告促銷等,十八項洗髮精購買考慮因素的注重程度,以主成份分析濃縮成:『行銷因素』、『功效因素』、『護髮因素』、『香味因素』與『價格因素』等五個主成份因素。 隨後,我們也曾以單因子變異數分析,檢定濃縮後之主成份因素的重要程度,是否隨其使用品牌不同而存有顯著差異?在當時可取得各品牌的因素分數之均數(詳第十三章):
茲將其資料輸入於『SPSS範例\Ch16\洗髮精品牌集群分析.sav』,並以這組資料來進行下文之各種集群分析:
階層化集群分析--最近鄰法 SPSS之『最近鄰法』集群分析,即是使用最小距離之單一連鎖法(simple linkage)。其處理步驟為: 開啟『SPSS範例\Ch16\洗髮精品牌集群分析.sav』 執行「分析(A)/分類(Y)/階層集群分析法(H)…」
於左側選取『行銷因素』與『功效因素』,按 於左側選取『行銷因素』與『功效因素』,按 鈕,將其送到右側之『變數(V)』方塊(本來應選取『行銷因素』~『價格因素』等五個因素,但為了方便解釋與繪圖,故僅選兩個變數)
於左側選取『品牌』,按 鈕,將其送到右側之『觀察值標示註解依據(C)』方塊(此項並非必須,若無此資料,將會依序顯示其列號,如第一筆資料其編號為1)
『集群』處,選「觀察值(E)」 『顯示』處,選「統計量(S)」與「圖形(L)」 按 鈕
選「群數凝聚過程(A)」,希望看到集群的每一步驟(若樣本很多,其實也可以不要此一內容,否則也只是浪費報表而已) 『各集群組員』處,可選「集群個數範圍(R)」,要求列出分為幾群時,其內各包括那些樣本點(本例選2~5群)(其實,這也不重要,等確定要分為幾群後,再要求將其分群結果儲存起來即可)
按〔繼續〕鈕,回上一層對話方塊 按 鈕 選「樹狀圖(D)」(本圖較容易判讀),方向改為「水平(H)」(本例仍選有「冰柱圖」,純是為了看一下它有多麼不容易判讀而以已。往後,可考慮選「無(N)」將其取消)
按〔繼續〕鈕,回上一層對話方塊 按 鈕 『集群方法』處,選「最近鄰法」;『測量』處,選「歐基里得直線距離平方」
按〔繼續〕鈕,回上一層對話方塊 若確定要分為幾群,可按 鈕,選擇要將分群結果儲存下來。會於各樣本之最後增加新欄位,並於每列標示該樣本係分在第幾群?本例先不儲存,等確定要分為幾群後,再重作一次,並要求將其分群結果儲存起來即可(選「單一集群(S)」並輸入集群數)。
按〔確定〕鈕,獲致 本部份說明其觀察值個數與使用之方法。
本部份標示其群數凝聚過程,如:第一階段將第2個觀察值(飛柔)與第6個觀察值(其他)合併為一群(代碼為2)。其後『下一階段』欄處之4,表本群(代碼為2)下一個步驟將跳到第四階段。
第二階段,將第1個觀察值(海倫仙度絲)與第5個觀察值(多芬)合併為一群。其後『下一階段』欄處之3,表本群(代碼為1)下一個步驟將跳到第三階段。 第三階段,將代碼為1之群(內含第1、5個觀察值,海倫仙度絲與多芬),與第3個觀察值(mod's hair)合併為一群。其後之『下一階段』欄處之4,表本群(代碼為1)下一個步驟將跳到第四階段。
第四階段,將代碼為1之群(內含第1、3、5個觀察值,海倫仙度絲、mod's hair與多芬),與代碼為2之群(內含第2、6個觀察值,飛柔與其他)合併為一群。其後之『下一階段』欄處之5,表本群(代碼為1)下一個步驟將跳到第五階段。 最後,第五階段,將代碼為1之群(內含第1、2、3、5、6個觀察值,海倫仙度絲、飛柔、mod's hair、多芬與其他)與第4個觀察值(麗仕)合併為一群。至此,全部觀察值合為一群,即結束集群。 這樣的判讀報表,並不容易,若樣本很多,更加困難。故我們通常並不會要求印出此一內容,免得浪費報表!
此部份是顯示,分為幾群時,各觀察值是被分到第幾群?如,『3集群』時,第1群內含第1、3、5個觀察值(海倫仙度絲、mod's hair與多芬);第2群為第2、6個觀察值(飛柔與其他);第3群為第4個觀察值(麗仕)。
此是水平之冰柱圖,較不容易判讀。如:『集群個數』為1時,是將第6、2、3、5、1個觀察值(其他、飛柔、mod's hair、多芬與海倫仙度絲)與第4個觀察值(麗仕)合併為一群。
此是集群的樹狀圖,較容易判讀(但樣本數若很多,實也不易判讀)。其橫軸是距離,以距離10向下拉一條線,恰可分為三群,第1群為第2、6個觀察值(飛柔與其他);
第2群內含第1、5、3個觀察值(海倫仙度絲、多芬與mod‘s hair); 第3群為第4個觀察值(麗仕)。 以距離15向下拉一條線,恰可分為二群,第1群為第2、6、1、5、3個觀察值(飛柔、其他、海倫仙度絲、多芬與mod's hair);第2群為第4個觀察值(麗仕)。
問題來了,到底應分為幾群才是最恰當?並無一個適當的衡量標準,通常是由研究者主觀判定。其判斷原則是:群數不要太多,群內樣本不可太少。
重心集群法 SPSS之『重心集群法』集群分析,即是使用平均距離的平均連鎖法(average linkage,或稱重心連鎖法)。其處理步驟同於前文之『最近鄰法』,只差於步驟15,得選「重心集群法」之『集群方法』而已:
茲僅列出其集群的樹狀圖:可發現,本例若分為兩群,其結果並不同於使用『最近鄰法』。以距離15向下拉一條線,恰可分為兩群,第1群為第2、6、4個觀察值(飛柔、其他與麗仕)。第2群內含第1、5、3個觀察值(海倫仙度絲、多芬與mod's hair)
但若分為三群,以距離10向下拉一條線,則其分群結果同於使用『最近鄰法』。第1群為第2、6個觀察值(飛柔與其他),第2群為第4個觀察值(麗仕),第3群內含第1、5、3個觀察值(海倫仙度絲、多芬與mod's hair)。 問題還是一樣,到底應分為幾群才是最恰當?
華德法 SPSS之『Ward's法』集群分析,即是使用最小變異法(minimum variance method),是由J. E. Ward所提出,故又稱之為華德法(Ward's method)。其處理步驟同於前文之『最近鄰法』,只差於步驟15,得選「Ward's法」之『集群方法』而已:
此法是利用何時使總變異產生最大增量來決定應分為幾群才是最恰當?由於有一個明確的判斷方法,故較常被使用!如,將其群數凝聚過程:
整理成下表:(遞增量是將前後兩階段之係數相減)可發現其總變異的最大遞增量是在群數為2變為1時,故應以分為2群時,最為恰當。
其集群的樹狀圖為: 可發現,本例之分群結果完全同於『重心集群法』。以分為兩群為例,以距離10向下拉一條線,恰可分為兩群,第1群為第2、6、4個觀察值(飛柔、其他與麗仕)。第2群內含第1、5、3個觀察值(海倫仙度絲、多芬與mod's hair)。(亦可由橫軸距離間隔最大處,向下拉一垂直線,即是最適當之分群數)
由於,已確定要分為2群,故再重新執行一次,過程中加按 鈕,選擇要將分群為2時之結果儲存下來。選「單一集群(S)」並輸入集群數2:
會於各樣本之最後增加新欄位(clus2_1),並於每列標示該樣本係分在第幾群:
繪製圖形 若只有兩個變數,就可以繪製其圖形。將可更容易看出各觀察值之樣本點位置,並檢查集群結果。若將『SPSS範例\Ch16\洗髮精品牌集群分析.sav』之資料轉到Excel,存於『SPSS範例\Ch16\洗髮精品牌集群分析.xls』:
利用其繪圖功能,可繪出如下之集群結果:將更容易比較出各品牌之優勢為何?左上角海倫仙度絲、多芬與mod's hair等三品牌係以功能因素(『防止掉髮』、『止癢』、『避免抗藥性』、『去頭皮屑』、與『天然成分』)取勝;右下角飛柔、其他與麗仕等三品牌,係以行銷因素(『流行』、『廣告促銷』、『知名度』、『包裝』、『方便購買』與『口碑』)取勝。
若將『SPSS範例\Ch16\洗髮精品牌集群分析.sav』,以下示步驟進行繪圖,亦可繪出其資料點的散佈圖: 執行「統計圖(G)/散佈圖(S)…」 選「簡單」,續按 鈕
選『行銷因素』,按 鈕,將其送到右側之『X軸(X)』方塊 選『功效因素』,按 鈕,將其送到右側之『Y軸(Y)』方塊 選『品牌』,按 鈕,將其送到右側之『設定標記依據(S)』方塊
按 鈕,於『標題』之第1行輸入『洗髮精之市場區隔』當其大標題
按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,獲致
此圖當然也不是很好,若將其轉貼到『小畫家』稍加修飾,即可獲致下圖,將更容易比較出各品牌之優勢為何:
非階層化集群分析 SPSS提供之非階層化集群分析法為『K平均數集群法』(K-means method),K即其組數,若未曾以前文之階層化集群分析法進行過分群,只好是憑研究者自己主觀判斷應分為幾群? 假定有K組,就得先安排K個種子點(seed point,SPSS稱之為中心點)才能進行K平均數集群法。其種子點可以由電腦隨機決定,也可以由我們自行輸入儲存於檔案,讓SPSS去讀取。 為方便與階層化集群分析法進行比較,底下仍使用『SPSS範例\Ch16\洗髮精品牌集群分析.sav』進行『K平均數集群法』之分析。
隨機種子點 『K平均數集群法』,得先安排K個種子點(中心點)才能進行K平均數集群法。SPSS預設狀況是隨機取K個觀察值當種子點(中心點)。假定,我們也剛好決定要將先前『SPSS範例\Ch16\洗髮精品牌集群分析.sav』資料分為兩個集群。其處理步驟為: 開啟『SPSS範例\Ch16\洗髮精品牌集群分析.sav』 執行「分析(A)/分類(Y)/K平均數集群(K)…」
於左側選取『行銷因素』與『功效因素』,按 鈕,將其送到右側之『變數(V)』方塊(為了方便與前文之結果比較) 於左側選取『品牌』,按 鈕,將其送到右側之『觀察值標示註解依據(B)』方塊(此項並非必須) 於『集群個數(U)』處輸入要分為幾群?(本例為2) 按 鈕
選「將最後中心點寫成(W)」,並按其後之 〔檔案〕鈕 選妥儲存位置,輸妥檔名,將存為SPSS之資料檔(本例將其命名為『K平均數之結果-隨機種子點』)
按 鈕,回上一層對話方塊(步驟7~9並非必須,只是要看其內資料欄位如何安排而已)
按 鈕 加選「各觀察值的集群資訊(C)」(若樣本較多,則不用)
按〔繼續〕鈕,回上一層對話方塊 若要將分群之結果儲存下來,可按 鈕,進行儲存設定(選「各集群組員(C)」,會於各樣本之最後增加新欄位,並於每列標示該樣本係分在第幾群) (本例暫不想儲存分群之結果)
按〔確定〕鈕,獲致 本部份是最初之集群的中心點(種子點),若回原資料檢視,可發現是第1筆之『海倫仙度絲』與第4筆之『麗仕』資料。
本部份是各集群內分別包含那幾個觀察值?可看出第1群內含第1、3、5個觀察值(海倫仙度絲、mod's hair與多芬);第2群內含第2、4、6個觀察值(飛柔、麗仕與其他)。此一結果與先前之『重心集群法』及『Ward's法』完全相同。
本部份是分群後,各集群之中心。與最初之集群的中心點比較,可發現中心已不是原來之種子點。可見,於分群過程中會不斷重算新的集群中心。
由於,我們先前設定要將此一結果儲存到『SPSS範例\Ch16\K平均數之結果-隨機種子點 由於,我們先前設定要將此一結果儲存到『SPSS範例\Ch16\K平均數之結果-隨機種子點.sav』。執行後,開啟該檔,可看到分群後集群之中心資料: 其第一欄欄名為『cluster_』,後接用來分群之依據的欄名。下節,我們就可以仿此資料之安排方式。自行輸入『K平均數法』所需要之K個種子點。
以階層化集群分析取得種子點 『K平均數法』也允許使用者自行決定種子點之資料。M. Anderberg在1973年提出之二階段集群法(two-stage clustering approach),建議以層次集群法(最好是華德法或平均連鎖法)取得集群數目,計算出各群之重心。再以各群之重心為種子點,投入K平均數法進行重新分群。 所以,我們就以『Ward's法』之結果來算其各群之重心(中心)當種子點。此分群資料目前已存於各樣本最後之新欄位(clus2_1):
接著,以下示步驟先求算各群之重心(即求算各變數之均數): 執行「分析(A)/比較平均數法(M)/平均數(E)…」
於左側,選取『行銷因素』與『功效因素』,按 鈕,將其送到右側之『依變數清單(D)』方塊 於左側,選取『Ward Method』(此係其註解,原欄名為clu2_1),按 鈕,將其送到右側之『自變數清單(I)』方塊
按〔確定〕鈕,獲致兩群體之中心(平均數)
接著,將兩群體之中心(平均數)資料輸入到『SPSS範例\Ch16\以華德法之結果當種子點 接著,將兩群體之中心(平均數)資料輸入到『SPSS範例\Ch16\以華德法之結果當種子點.sav』,擬作為下階段『K平均數集群法』之起始種子點。第一欄之欄名為『cluster_』,後接用來分群之依據的欄名:
然後,再以下示步驟進行『K平均數集群』: 開啟『SPSS範例\Ch16\洗髮精品牌集群分析.sav』 執行「分析(A)/分類(Y)/K平均數集群(K)…」
於左側,選取『行銷因素』與『功效因素』,按 鈕,將其送到右側之『變數(V)』方塊(為了方便與前文之結果比較) 於左側,選取『品牌』,按 鈕,將其送到右側之『觀察值標示註解依據(B)』方塊(此項並非必須)
於『集群個數(U)』處輸入要分為幾群?(本例為2) 按 鈕
選「起始中心點讀入來源(E)」,並按其後之〔檔案〕鈕。找出『SPSS範例\Ch16\以華德法之結果當種子點.sav』當起始種子點
按 鈕,回上一層對話方塊
按 鈕,加選「各觀察值的集群資訊(C)」(若樣本較多,則不用) 按〔繼續〕鈕,回上一層對話方塊
按〔確定〕鈕,獲致 此即由『SPSS範例\Ch16\以華德法之結果當種子點.sav』所讀入之起始種子點。
本部份是各集群內各包含那幾個觀察值?可看出第1群內含第1、3、5個觀察值(海倫仙度絲、mod's hair與多芬);第2群為第2、4、6個觀察值(飛柔、麗仕與其他)。此一結果與先前之『重心集群法』、『Ward's法』,以及第一次以隨機取得種子點之『K平均數法』,分群結果完全相同。(若樣本較多,則可能會有不同)
本部份是分群後,各集群之中心。與最初之集群的中心點比較,可發現根本就是原來所輸入之種子點,此乃是由於其分群結果完全相同的原因所致。
馬上練習 以『SPSS範例\Ch16\洗髮精品牌集群分析.sav』之內容,改採使用『行銷因素』、『功效因素』、『護髮因素』、『香味因素』與『價格因素』等五個因素,進行二階段之集群分析。第一階段以華德法取得集群數目,計算出各群之重心。再以各群之重心為種子點,投入K平均數法進行第二階段重新分群。
信用卡消費者之市場區隔 於十三章,我們曾針對『SPSS範例\Ch13\申請信用卡考慮因素.sav』,將受訪者對申請信用卡重要考慮因素:『年費』、『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失『卡風險負擔』、『24小時免付費專線』、『道路救援服務』、『旅遊保險』、『發卡銀行知名度』、『專業形象』、『卡片設計美觀』與『贈品』等15個變數,以主成份分析濃縮成:『知名與專業因素』、『功能因素』、『信貸因素』、『促銷因素』與『費用因素』等五個主成份因素。
本章,先將這些資料及其因素分數,以及受訪者的基本資料、是否有信用卡、主要使用之信用卡、每月刷卡金額、……等資料,轉存到『SPSS範例\Ch16\信用卡市場區隔.sav』:
底下,就利用經主成份分析所濃縮成之『知名與專業因素』、『功能因素』、『信貸因素』、『促銷因素』與『費用因素』等五個主成份因素,針對受訪者進行二階段集群分析,將其分群找出信用卡市場區隔。於以判別分析驗證其分群之適當性後,再針對市場區隔進行描述其特性。
第一階段-華德法集群分析 第一階段先以『華德法』集群分析,判斷應分為幾群?其處理步驟為: 開啟『SPSS範例\Ch16\信用卡市場區隔.sav』 執行「分析(A)/分類(Y)/階層集群分析法(H)…」
於左側,選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素,按 鈕,將其送到右側之『變數(V)』方塊
按 鈕,於『集群方法』處,選「Ward's法」;『測量』處,選「歐基里得直線距離平方」
按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,獲致將91個樣本,由91群合併到成為1群的凝聚過程
將最後幾個凝聚過程彙總到下表,並計算其總變異的遞增量:可發現總變異的最大遞增量是在群數為2變為1時,故應以分為2群,最為恰當。
確定要分為2群後,再重新執行一次前面的『華德法』集群分析,但得按 鈕,選擇要將分群為2之結果儲存下來: 可將分群結果儲存於『clus2_1』:
接著,以下示步驟先求算各群之重心(即求算各變數之均數): 執行「分析(A)/比較平均數法(M)/平均數(E)…」 於左側,選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素,按 鈕,將其送到右側之『依變數清單(D)』方塊
於左側,選取『Ward Method』(此係其註解,原欄名為clu2_1),按 鈕,將其送到右側之『自變數清單(I)』方塊
按〔確定〕鈕,獲致兩群體之中心(平均數)
第二階段-K平均數法集群分析 接著,將兩群體之中心(平均數)資料輸入到『SPSS範例\Ch16\信用卡分群第一階段中心.sav』,擬作為下階段『K平均數集群法』之起始種子點:(注意其欄名的安排方式,否則無法被順利讀取。第一欄為『cluster_』,其餘各欄恰與進行集群分析之五個因素分數欄同名稱)
然後,再以下示步驟進行『K平均數集群』: 開啟『SPSS範例\Ch16\信用卡市場區隔.sav』 執行「分析(A)/分類(Y)/K平均數集群(K)…」 於左側,選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素,按 鈕,將其送到右側之『變數(V)』方塊
於『集群個數(U)』處輸入要分為幾群?(本例為2) 按 鈕,選「起始中心點讀入來源(E)」,並按其後之 鈕。找出『SPSS範例\Ch16\信用卡分群第一階段中心.sav』當起始種子點
按 鈕,回上一層對話方塊
按〔儲存〕鈕,選擇要將分群結果儲存下來 按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,獲致初始集群中心
及最後之集群中心: 可發現第1群在『促銷』上之分數較高,故可將其命名為『促銷群』;而第2群在『功能』與『信貸』上之分數較高,尤其在『功能』上之差異更明顯,故將其命名為『功能群』。
兩群體分別含幾個樣本: 第1群有47個樣本;第2群有45個樣本。 並將分群結果儲存於『qcl1_1』:
比較『clu2_1』與『qcl1_1』,可發現兩次分群結果有點不一樣。由於在已知群數的情況下,『K平均數法』優於『Ward‘s法』,故我們取『qcl1_1』之結果進行後續之分析。 茲將這些資料彙總於下表:
驗證分群結果 要驗證先前之分群結果是否適當?可將分群結果(『qcl1_1』)當分組變數,將原『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素當自變數。跑一次判別分析,看其判別函數之分組準確率如何?準確率越高,表先前之分群結果越好。 其處理步驟如下: 開啟『SPSS範例\Ch16\信用卡市場區隔.sav』 執行「分析(A)/分類(Y)/判別(D)…」
左側選取『集群觀察值個數[qcl1_1]』變數(K平均數法之分群結果)
按 鈕,將其送到右側之『分組變數(G)』方塊
按 鈕,於『最小值(I)』輸入1,『最大值(A)』輸入2,定義組別的上下限 按〔繼續〕鈕,回上一層對話方塊。『分組變數(G)』方塊處,qcl1_1後之括號內會有剛剛所輸入之組別的上下限
左側選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素,按 鈕,將其送到右側之『自變數(I)』方塊
選擇「使用所有變數(E)」 按 鈕,於『顯示』處,選「摘要表(U)」,可列出一交叉表(混淆矩陣,confusion matrix),比較原組別與經過判別函數所指派之組別的正確率如何?
按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,獲致 Wilks' Lambda值0.266、卡方值115.724、自由度5、顯著性0.000<α=0.05,判別能力達顯著水準,效果非常好。
標準化後之典型判別函數,正值部分以『功能』因素之係數最高(1.060);負值部分以『促銷』因素之係數較大(-1.031)。
集群1的重心為-1. 606之負值,由於『促銷因素』之係數為負且係數較高(-1 集群1的重心為-1.606之負值,由於『促銷因素』之係數為負且係數較高(-1.031),故愈注重此因素(贈品、卡片設計美觀)之受訪者,愈可能會歸屬到集群1。 集群2的重心為1.677之正值,由於『功能因素』係數為正且較高(1.060),故而愈注重此一因素(是否受商店歡迎、失卡風險負擔、是否全球通行、循環利息、24小時免付費專線)之受訪者,愈可能會歸屬到集群2。
此一判別函數的正確判別率為100%,證明分群結果相當良好!
描述分群結果 將二階段集群分群之結果,經判別分析確認分群正確率之後,確定了應該分為兩個市場區隔後。接著即可針對這兩個市場區隔進行深入分析,如:以群別進行與基本資料之『交叉表分析』,可看出各群內之人口的性別、年齡、教育程度、職業、所得、有無信用卡、為何申請、為何不申請、所接觸之媒體、……等相關資料。 此外,也可以群別與對受訪者申請信用卡時所著重之考慮因素(進行主成份分析前之原始著重程度)、生活型態之態度量表、……等評價量表,進行『獨立樣本T檢定』(兩群體)或『單因子變異數分析』(多群體),以探討各群之考慮因素及生活型態的差異。
由於,對各群體有充份的瞭解,當業者考慮針對某一市場區隔進行重點促銷或主打某一專案時,將較能有效的深入到該群,不僅提高效果更能省下大筆經費。 首先,以群別分別與性別、家庭所得、每月零用金、分組過之刷卡金額、有無信用卡、……等資料,進行交叉表分析。其處理步驟為: 開啟『SPSS範例\Ch16\信用卡市場區隔.sav』 執行「分析(A)/描述性統計(E)/交叉表(C)…」 左側選取『集群觀察值個數[qcl1_1]』變數(K平均數法之分群結果)
按 鈕,將其送到右側之『直行(C)』方塊 選『有無信用卡[q1]』、『最常使用[q3_1]』、『性別』、『家庭所得[家庭所得]』、『可支配零用金[零用金]』、『發卡銀行』與『金額分組』變數,按 鈕,將其送到右側之『列(O)』方塊
按 鈕,選擇要求得「卡方統計量(H)」
按〔繼續〕鈕,回上一層對話方塊 按 鈕,設定要顯示「觀察值(O)」及「直行(C)」百分比
按〔繼續〕鈕,回上一層對話方塊 按〔確定〕鈕,即可獲致各交叉表及其卡方值。茲將其交叉分析之結果彙總如下,並未發現有任何顯著差異之現象。(可能是受訪者均為大學生,其齊質性太高之故)
由於,只有兩群。故接著以『獨立樣本T檢定』,檢定不同群別受訪者對:『年費』、『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失卡風險負擔』、『24小時免付費專線』、『道路救援服務』、『旅遊保險』、『發卡銀行知名度』、『專業形象』、『卡片設計美觀』與『贈品』等15個變數之著重程度。其處理步驟為: 開啟『SPSS範例\Ch16\信用卡市場區隔.sav』 執行「分析(A)/比較均數法(M)/獨立樣本T檢定(T)…」 於左側選取『年費[q6_01]』~『贈品[q6_15]』,按 鈕,將其送到右側之『檢定變數清單(T)』方塊
左側選取『集群觀察值個數[qcl1_1]』變數(K平均數法之分群結果),按 鈕,將其送到右側之『分組變數(G)』方塊
按 鈕,定義組別之代碼 按〔繼續〕鈕,回上一層對話方塊
按〔確定〕鈕結束,即可獲致其等之T檢定結果
於整體分析時,我們尚需要全體受訪者對各屬性著重程度之均數。故續以下示步驟求得: 執行「分析(A)/描述性統計(E)/描述性統計量(D)…」 於左側以滑鼠拖曵選取『年費[q6_01]』~『贈品[q6_15]』,按 鈕,將其送到右側之『變數(V)』方塊
按〔確定〕鈕,獲致全體受訪者對各屬性著重程度之均數
茲將其結果彙總如下:
可發現有:『年費』、『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失卡風險負擔』、『24小時免付費專線』、『道路救援服務』、『卡片設計美觀』與『贈品』等申請信用卡考慮因素的注重程度,隨其群別不同而存有顯著差異。 第1群(『促銷群』)較著重:『年費』、『卡片設計美觀』與『贈品』等申請信用卡考慮因素。而第2群(『功能群』)較著重:『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失卡風險負擔』、『24小時免付費專線』與『道路救援服務』等申請信用卡考慮因素。
第十六章 結束 辛苦啦!