第十六章集群分析.

Slides:

Advertisements

Similar presentations

实用农业科技写作王鹏文. 第一章导论第一节农业科技写作概述一、农业科技写作概念和分类：科技文献类、科技应用类、科技普及类、科技新闻类二、农业科技写作的意义和重要性：科技工作的重要组成部分、科学研究的手段、科技成果的反映和标志、科技交流的工具三、农业科技写作的特点 : 功利性与及时性、科学性与先进性、读者的专门性与狭隘性、

Advertisements

新课程引领实践中前行 —— 蓟县初中信息技术三年课改总结. 自从 2005 年秋季我市进入基础教育新一轮课程改革实验以来，在市教研室的正确领导下，我县初中信息技术课改工作稳步推进。三年来，取得了一些成果，也有不少体会。现将三年来的信息技术课改工作总结如下。

河南省基础教育资源网邓伟鹏二〇一二年七月内容大纲 1. 培训平台的目的 2. 培训平台介绍 3. 培训平台功能 4. 培训工作建立流程 5. 培训门户 6. 在线学习 6.1 课程学习 6.2 在线考试 7. 培训考试管理 7.1. 课程管理 7.2 必修学习班建立 7.3 在线考试管理 7.4.

猜谜语有个小娃娃，真是没礼貌。见到小树摇一摇，吓得树叶哇哇叫。见到小花逗一逗，摘去她的太阳帽。没人和它交朋友，只好自已到外处跑。

桐乡市地方税务局 2013 年度社会保险费汇算清缴有关政策及事项说明. 一、政策规定根据《中华人民共和国社会保险法》、《桐乡市社会保险费征缴管理办法》（市政府令第 42 号）、《关于完善社会保险费征缴管理有关问题的通知》（桐政办发 [2012]152 号）及《关于完善社会保险费征缴管理.

1 第 10 章品牌定位分析授課教師：. 學習目標 2 瞭解並挑選定位基礎學習建立評分表學習使用因素分析建立知覺圖瞭解知覺定位分析的內容學習使用多元尺度法建立知覺圖.

第七章交叉分析表.

中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报华中师范大学中国旅游研究院武汉分院二〇一一年十二月.

黄帝内经内经教研室王黎.

NO.005 職涯報實習徵才攻讀國立嘉義大學學生事務處學生職涯發展中心.

國中教育會考十二年國教—免試入學及意見整理.

搞好教育科研的几个重要问题山东省教育科学研究所侯光文.

第九章均數檢定.

职官与科举职官：在国家机构中担任一定职务的官吏，这里面有职官的名称、职权范围和品级地位等方面的内容。

花开有日芬芳天下 “国培计划（2012）” ——幼儿园骨干教师远程培训项目山东幼儿园教师8班第4期简报主办人：张瑞美

上海体育职业学院祁社生一、重视体育科研在提高竞技运动训练水平中的意义和作用

《卖火柴的小女孩》《海的女儿》你认识这些图片的故事吗《丑小鸭》《拇指姑娘》它们都来自于哪位作家笔下？

严格标准规范程序认真做好党员发展工作.

薪資申報系統操作說明.

商学院旅游管理专业介绍.

民主國家的政府體制我國的中央政府體制我國中央政府的功能地方政府組織與功能

　历史以人类的活动为特定的对象，它思接万载，视通万里，千恣百态，令人销魂，因此它比其他学科更能激发人们的想像力。　　　　

《数学》(华师大.八年级下册) 第二十一章数据的整理与初步处理扇形统计图的制作.

銷售與顧客關係管理巫立宇．邱志聖　著.

怎样报销劳务性费用？ ——暨薪酬发放申报系统介绍怎样报销劳务性费用？ ——暨薪酬发放申报系统介绍 (学院、部门适用)

內部審核實務新竹縣政府主計處四科王美琪

探討某醫院志工中華醫事科技大學參與服務動機影響因子指導老師：趙海倫老師班級：四醫管四 A

第三章被皮系统表皮真皮皮下组织一、皮肤 1、表皮:由大量密集排列的细胞构成，有神经分布，但无血管分布。

104學年度臺南區免試入學作業國中端說明會臺南市政府教育局 104學年度臺南區高級中等學校免試入學委員會日期：104年1月9日(五)

『臺北市營建剩餘資源管理系統』教育訓練說明臺北市政府報告人王宏正

20、豆花庄的小家伙们.

4.3 处理数据宝鸡理工学校计算机组李小保.

CH11 心理疾病李志鴻.

“三项制度+一个平台”构建省级高校教学质量监控体系

瓯海职专财经专业组简介.

国有资产清查数据填报操作规范 2016年3月25日.

华夏之祖第 3 课.

法學緒論第六單元：法律適用設計課程︰財經法律系 --楊東連法學緒論-6.

第十九章聯合分析、多元尺度方法和集群分析

上海文会会计师事务所有限公司中国注册会计师童幸义

CH1 . 集合与命题.

关于成绩的数理统计的探讨望您多多指教！多谢！！.

仓储企业岗位人员招聘第一组组员：陈娇娇祝婷婷丁元莉袁珮王慧.

人口与计划生育统计分析昌吉市计划生育委员会二○○六年三月.

Ch19　創業精神管理學：整合觀點與創新思維3/e．中山大學企管系　著．前程文化　出版.

国际关系的决定因素：国家利益江苏省震泽中学丛海啸.

以考试说明带动二轮复习福州第三中学张璐.

跨越海峡的生命桥.

2014年深圳市学生人身意外伤害保险投保工作介绍中国人民财产保险股份有限公司深圳市分公司

Ch3 指數與對數 3-5 指數與對數的應用影音錄製：陳清海老師資料提供：龍騰文化事業股份有限公司.

传媒学院2013年度团委工作总结分析报告

第十四章信度.

統計方法的概念與應用一、認識統計（statistics）、測驗（test）、測量（measurement）與評價（evaluation）

量化研究與統計分析集群分析 Cluster analysis 謝寶煖 2006年5月27日.

第17章　集群分析 本章的學習主題  1. 集群分析的概念 2. 相似性及最近距離的衡量 3. 階層分析法 4. 非階層分析法.

聚类分析电子工业出版社.

97學年度導師輔導知能研習營成果.

第17章集群分析 本章的學習主題  1. 集群分析的概念 2. 相似性及最近距離的衡量 3. 階層分析法 4. 非階層分析法

聚类分析法预测(Cluster Analysis)

地方科技基础条件资源调查管理信息系统（标准化器）操作培训 2017年7月呼和浩特

成本会计学.

集群分析(Cluster) 根據觀察值在一群變項上的測量值進行分類的多變量分析方法。在不同專業領域也稱為

项目4.4：工作表格式化项目描述能力目标与WORD一样也对EXCEL的数据单元格设置边框和底纹,使工作表更加美观漂亮;若使用条件格式还能将符合条件的单元格数据指定格式,以便更好地比较和分析数据;设置页面布局、打印范围、打印参数将工作表打印出来。掌握对单元格设置边框和底纹的基本操作与应用,

參考書籍：林惠玲與陳正倉（2002），應用統計學（第二版）。台北：雙葉書廊有限公司。

现代统计分析方法概述 2019/5/20 知识管理与数据分析实验室.

群聚分析操作介紹 -以SOM和K-means為例

認識 Excel 與SPSS.

Presentation transcript:

第十六章集群分析

概念集群分析（cluster analysis）之目的，在將事物按其特性分成幾個集群，使同一集群內之事物具有高度相似性（homogeneity）；不同集群之事物則具有高度之異質性（heterogeneity）。對於衡量相似性，有使用距離（如：歐幾里德距離、馬氏距離、……）或使用配合係數與相似比。

層次集群法（hierarchical method）對於建立集群的方法，可分為：層次集群法（hierarchical method）此法先將每一事物當成一個點，計算每一點間之距離（或相適度），將最接近的兩個點其合併成一個群體，少了一個點之後，再重新計算每一點間之距離（或相適度），再將最接近的兩個點其合併成一個群體。如此，逐次縮減點數，直至所有點均合併成一個群體為止。層次集群法最大的缺點就是執行速度較慢。非層次集群法（non-hierarchical method）最常被用的方法為K平均數法（K-means method），K即其組數。此法最大的優點是執行速度較快；但最大的問題在如何決定其K（組數），以及如何安排其種子點？通常是以隨機方式安排，如果不小心將種子點安排的太接近，很可能使各群之差異變得不明顯。

二階段集群法（two-stage clustering approach）由M. Anderberg在1973年提出，以層次集群法（最好是華德法或平均連鎖法）取得集群數目，計算出各群之重心。再以各群之重心為種子點，投入K平均數法進行重新分群。要解釋集群分析之處理步驟及過程，最好是不要有太多樣本點及變數。如此，才能繪出圖形並判讀其樹狀結構圖。所以，我們先以一個簡單之實例進行解說，然後再以正常之問卷調查結果來進行分析。

於十三章，我們曾針對『SPSS範例\Ch13\洗髮精購買考慮因素於十三章，我們曾針對『SPSS範例\Ch13\洗髮精購買考慮因素.sav』，將訪者對：價格、去頭皮屑、保濕、熱油護髮、防止掉髮、止癢、避免抗藥性、天然成分、香味、防止分岔、柔順、整體綜合效果、包裝、口碑、方便購買、知名度、流行與廣告促銷等，十八項洗髮精購買考慮因素的注重程度，以主成份分析濃縮成：『行銷因素』、『功效因素』、『護髮因素』、『香味因素』與『價格因素』等五個主成份因素。隨後，我們也曾以單因子變異數分析，檢定濃縮後之主成份因素的重要程度，是否隨其使用品牌不同而存有顯著差異？在當時可取得各品牌的因素分數之均數（詳第十三章）：

茲將其資料輸入於『SPSS範例\Ch16\洗髮精品牌集群分析.sav』，並以這組資料來進行下文之各種集群分析：

階層化集群分析--最近鄰法 SPSS之『最近鄰法』集群分析，即是使用最小距離之單一連鎖法（simple linkage）。其處理步驟為：開啟『SPSS範例\Ch16\洗髮精品牌集群分析.sav』執行「分析(A)/分類(Y)/階層集群分析法(H)…」

於左側選取『行銷因素』與『功效因素』，按於左側選取『行銷因素』與『功效因素』，按鈕，將其送到右側之『變數(V)』方塊（本來應選取『行銷因素』～『價格因素』等五個因素，但為了方便解釋與繪圖，故僅選兩個變數）

於左側選取『品牌』，按鈕，將其送到右側之『觀察值標示註解依據(C)』方塊（此項並非必須，若無此資料，將會依序顯示其列號，如第一筆資料其編號為1）

『集群』處，選「觀察值(E)」『顯示』處，選「統計量(S)」與「圖形(L)」按鈕

選「群數凝聚過程(A)」，希望看到集群的每一步驟（若樣本很多，其實也可以不要此一內容，否則也只是浪費報表而已）『各集群組員』處，可選「集群個數範圍(R)」，要求列出分為幾群時，其內各包括那些樣本點（本例選2~5群）（其實，這也不重要，等確定要分為幾群後，再要求將其分群結果儲存起來即可）

按〔繼續〕鈕，回上一層對話方塊按鈕選「樹狀圖(D)」（本圖較容易判讀），方向改為「水平(H)」（本例仍選有「冰柱圖」，純是為了看一下它有多麼不容易判讀而以已。往後，可考慮選「無(N)」將其取消）

按〔繼續〕鈕，回上一層對話方塊按鈕『集群方法』處，選「最近鄰法」；『測量』處，選「歐基里得直線距離平方」

按〔繼續〕鈕，回上一層對話方塊若確定要分為幾群，可按鈕，選擇要將分群結果儲存下來。會於各樣本之最後增加新欄位，並於每列標示該樣本係分在第幾群？本例先不儲存，等確定要分為幾群後，再重作一次，並要求將其分群結果儲存起來即可（選「單一集群(S)」並輸入集群數）。

按〔確定〕鈕，獲致本部份說明其觀察值個數與使用之方法。

本部份標示其群數凝聚過程，如：第一階段將第2個觀察值（飛柔）與第6個觀察值（其他）合併為一群（代碼為2）。其後『下一階段』欄處之4，表本群（代碼為2）下一個步驟將跳到第四階段。

第二階段，將第1個觀察值（海倫仙度絲）與第5個觀察值（多芬）合併為一群。其後『下一階段』欄處之3，表本群（代碼為1）下一個步驟將跳到第三階段。第三階段，將代碼為1之群（內含第1、5個觀察值，海倫仙度絲與多芬），與第3個觀察值（mod's hair）合併為一群。其後之『下一階段』欄處之4，表本群（代碼為1）下一個步驟將跳到第四階段。

第四階段，將代碼為1之群（內含第1、3、5個觀察值，海倫仙度絲、mod's hair與多芬），與代碼為2之群（內含第2、6個觀察值，飛柔與其他）合併為一群。其後之『下一階段』欄處之5，表本群（代碼為1）下一個步驟將跳到第五階段。最後，第五階段，將代碼為1之群（內含第1、2、3、5、6個觀察值，海倫仙度絲、飛柔、mod's hair、多芬與其他）與第4個觀察值（麗仕）合併為一群。至此，全部觀察值合為一群，即結束集群。這樣的判讀報表，並不容易，若樣本很多，更加困難。故我們通常並不會要求印出此一內容，免得浪費報表！

此部份是顯示，分為幾群時，各觀察值是被分到第幾群？如，『3集群』時，第1群內含第1、3、5個觀察值（海倫仙度絲、mod's hair與多芬）；第2群為第2、6個觀察值（飛柔與其他）；第3群為第4個觀察值（麗仕）。

此是水平之冰柱圖，較不容易判讀。如：『集群個數』為1時，是將第6、2、3、5、1個觀察值（其他、飛柔、mod's hair、多芬與海倫仙度絲）與第4個觀察值（麗仕）合併為一群。

此是集群的樹狀圖，較容易判讀（但樣本數若很多，實也不易判讀）。其橫軸是距離，以距離10向下拉一條線，恰可分為三群，第1群為第2、6個觀察值（飛柔與其他）；

第2群內含第1、5、3個觀察值（海倫仙度絲、多芬與mod‘s hair）；第3群為第4個觀察值（麗仕）。以距離15向下拉一條線，恰可分為二群，第1群為第2、6、1、5、3個觀察值（飛柔、其他、海倫仙度絲、多芬與mod's hair）；第2群為第4個觀察值（麗仕）。

問題來了，到底應分為幾群才是最恰當？並無一個適當的衡量標準，通常是由研究者主觀判定。其判斷原則是：群數不要太多，群內樣本不可太少。

重心集群法 SPSS之『重心集群法』集群分析，即是使用平均距離的平均連鎖法（average linkage，或稱重心連鎖法）。其處理步驟同於前文之『最近鄰法』，只差於步驟15，得選「重心集群法」之『集群方法』而已：

茲僅列出其集群的樹狀圖：可發現，本例若分為兩群，其結果並不同於使用『最近鄰法』。以距離15向下拉一條線，恰可分為兩群，第1群為第2、6、4個觀察值（飛柔、其他與麗仕）。第2群內含第1、5、3個觀察值（海倫仙度絲、多芬與mod's hair）

但若分為三群，以距離10向下拉一條線，則其分群結果同於使用『最近鄰法』。第1群為第2、6個觀察值（飛柔與其他），第2群為第4個觀察值（麗仕），第3群內含第1、5、3個觀察值（海倫仙度絲、多芬與mod's hair）。問題還是一樣，到底應分為幾群才是最恰當？

華德法 SPSS之『Ward's法』集群分析，即是使用最小變異法（minimum variance method），是由J. E. Ward所提出，故又稱之為華德法（Ward's method）。其處理步驟同於前文之『最近鄰法』，只差於步驟15，得選「Ward's法」之『集群方法』而已：

此法是利用何時使總變異產生最大增量來決定應分為幾群才是最恰當？由於有一個明確的判斷方法，故較常被使用！如，將其群數凝聚過程：

整理成下表：（遞增量是將前後兩階段之係數相減）可發現其總變異的最大遞增量是在群數為2變為1時，故應以分為2群時，最為恰當。

其集群的樹狀圖為：可發現，本例之分群結果完全同於『重心集群法』。以分為兩群為例，以距離10向下拉一條線，恰可分為兩群，第1群為第2、6、4個觀察值（飛柔、其他與麗仕）。第2群內含第1、5、3個觀察值（海倫仙度絲、多芬與mod's hair）。（亦可由橫軸距離間隔最大處，向下拉一垂直線，即是最適當之分群數）

由於，已確定要分為2群，故再重新執行一次，過程中加按鈕，選擇要將分群為2時之結果儲存下來。選「單一集群(S)」並輸入集群數2：

會於各樣本之最後增加新欄位（clus2_1），並於每列標示該樣本係分在第幾群：

繪製圖形若只有兩個變數，就可以繪製其圖形。將可更容易看出各觀察值之樣本點位置，並檢查集群結果。若將『SPSS範例\Ch16\洗髮精品牌集群分析.sav』之資料轉到Excel，存於『SPSS範例\Ch16\洗髮精品牌集群分析.xls』：

利用其繪圖功能，可繪出如下之集群結果：將更容易比較出各品牌之優勢為何？左上角海倫仙度絲、多芬與mod's hair等三品牌係以功能因素（『防止掉髮』、『止癢』、『避免抗藥性』、『去頭皮屑』、與『天然成分』）取勝；右下角飛柔、其他與麗仕等三品牌，係以行銷因素（『流行』、『廣告促銷』、『知名度』、『包裝』、『方便購買』與『口碑』）取勝。

若將『SPSS範例\Ch16\洗髮精品牌集群分析.sav』，以下示步驟進行繪圖，亦可繪出其資料點的散佈圖：執行「統計圖(G)/散佈圖(S)…」選「簡單」，續按鈕

選『行銷因素』，按鈕，將其送到右側之『X軸(X)』方塊選『功效因素』，按鈕，將其送到右側之『Y軸(Y)』方塊選『品牌』，按鈕，將其送到右側之『設定標記依據(S)』方塊

按鈕，於『標題』之第1行輸入『洗髮精之市場區隔』當其大標題

按〔繼續〕鈕，回上一層對話方塊按〔確定〕鈕，獲致

此圖當然也不是很好，若將其轉貼到『小畫家』稍加修飾，即可獲致下圖，將更容易比較出各品牌之優勢為何：

非階層化集群分析 SPSS提供之非階層化集群分析法為『K平均數集群法』（K-means method），K即其組數，若未曾以前文之階層化集群分析法進行過分群，只好是憑研究者自己主觀判斷應分為幾群？假定有K組，就得先安排K個種子點（seed point，SPSS稱之為中心點）才能進行K平均數集群法。其種子點可以由電腦隨機決定，也可以由我們自行輸入儲存於檔案，讓SPSS去讀取。為方便與階層化集群分析法進行比較，底下仍使用『SPSS範例\Ch16\洗髮精品牌集群分析.sav』進行『K平均數集群法』之分析。

隨機種子點『K平均數集群法』，得先安排K個種子點（中心點）才能進行K平均數集群法。SPSS預設狀況是隨機取K個觀察值當種子點（中心點）。假定，我們也剛好決定要將先前『SPSS範例\Ch16\洗髮精品牌集群分析.sav』資料分為兩個集群。其處理步驟為：開啟『SPSS範例\Ch16\洗髮精品牌集群分析.sav』執行「分析(A)/分類(Y)/K平均數集群(K)…」

於左側選取『行銷因素』與『功效因素』，按鈕，將其送到右側之『變數(V)』方塊（為了方便與前文之結果比較）於左側選取『品牌』，按鈕，將其送到右側之『觀察值標示註解依據(B)』方塊（此項並非必須）於『集群個數(U)』處輸入要分為幾群？（本例為2）按鈕

選「將最後中心點寫成(W)」，並按其後之〔檔案〕鈕選妥儲存位置，輸妥檔名，將存為SPSS之資料檔（本例將其命名為『K平均數之結果-隨機種子點』）

按鈕，回上一層對話方塊（步驟7～9並非必須，只是要看其內資料欄位如何安排而已）

按鈕加選「各觀察值的集群資訊(C)」（若樣本較多，則不用）

按〔繼續〕鈕，回上一層對話方塊若要將分群之結果儲存下來，可按鈕，進行儲存設定（選「各集群組員(C)」，會於各樣本之最後增加新欄位，並於每列標示該樣本係分在第幾群）（本例暫不想儲存分群之結果）

按〔確定〕鈕，獲致本部份是最初之集群的中心點（種子點），若回原資料檢視，可發現是第1筆之『海倫仙度絲』與第4筆之『麗仕』資料。

本部份是各集群內分別包含那幾個觀察值？可看出第1群內含第1、3、5個觀察值（海倫仙度絲、mod's hair與多芬）；第2群內含第2、4、6個觀察值（飛柔、麗仕與其他）。此一結果與先前之『重心集群法』及『Ward's法』完全相同。

本部份是分群後，各集群之中心。與最初之集群的中心點比較，可發現中心已不是原來之種子點。可見，於分群過程中會不斷重算新的集群中心。

由於，我們先前設定要將此一結果儲存到『SPSS範例\Ch16\K平均數之結果-隨機種子點由於，我們先前設定要將此一結果儲存到『SPSS範例\Ch16\K平均數之結果-隨機種子點.sav』。執行後，開啟該檔，可看到分群後集群之中心資料：其第一欄欄名為『cluster_』，後接用來分群之依據的欄名。下節，我們就可以仿此資料之安排方式。自行輸入『K平均數法』所需要之K個種子點。

以階層化集群分析取得種子點『K平均數法』也允許使用者自行決定種子點之資料。M. Anderberg在1973年提出之二階段集群法（two-stage clustering approach），建議以層次集群法（最好是華德法或平均連鎖法）取得集群數目，計算出各群之重心。再以各群之重心為種子點，投入K平均數法進行重新分群。所以，我們就以『Ward's法』之結果來算其各群之重心（中心）當種子點。此分群資料目前已存於各樣本最後之新欄位（clus2_1）：

接著，以下示步驟先求算各群之重心（即求算各變數之均數）：執行「分析(A)/比較平均數法(M)/平均數(E)…」

於左側，選取『行銷因素』與『功效因素』，按鈕，將其送到右側之『依變數清單(D)』方塊於左側，選取『Ward Method』（此係其註解，原欄名為clu2_1），按鈕，將其送到右側之『自變數清單(I)』方塊

按〔確定〕鈕，獲致兩群體之中心（平均數）

接著，將兩群體之中心（平均數）資料輸入到『SPSS範例\Ch16\以華德法之結果當種子點接著，將兩群體之中心（平均數）資料輸入到『SPSS範例\Ch16\以華德法之結果當種子點.sav』，擬作為下階段『K平均數集群法』之起始種子點。第一欄之欄名為『cluster_』，後接用來分群之依據的欄名：

然後，再以下示步驟進行『K平均數集群』：開啟『SPSS範例\Ch16\洗髮精品牌集群分析.sav』執行「分析(A)/分類(Y)/K平均數集群(K)…」

於左側，選取『行銷因素』與『功效因素』，按鈕，將其送到右側之『變數(V)』方塊（為了方便與前文之結果比較）於左側，選取『品牌』，按鈕，將其送到右側之『觀察值標示註解依據(B)』方塊（此項並非必須）

於『集群個數(U)』處輸入要分為幾群？（本例為2）按鈕

選「起始中心點讀入來源(E)」，並按其後之〔檔案〕鈕。找出『SPSS範例\Ch16\以華德法之結果當種子點.sav』當起始種子點

按鈕，回上一層對話方塊

按鈕，加選「各觀察值的集群資訊(C)」（若樣本較多，則不用）按〔繼續〕鈕，回上一層對話方塊

按〔確定〕鈕，獲致此即由『SPSS範例\Ch16\以華德法之結果當種子點.sav』所讀入之起始種子點。

本部份是各集群內各包含那幾個觀察值？可看出第1群內含第1、3、5個觀察值（海倫仙度絲、mod's hair與多芬）；第2群為第2、4、6個觀察值（飛柔、麗仕與其他）。此一結果與先前之『重心集群法』、『Ward's法』，以及第一次以隨機取得種子點之『K平均數法』，分群結果完全相同。（若樣本較多，則可能會有不同）

本部份是分群後，各集群之中心。與最初之集群的中心點比較，可發現根本就是原來所輸入之種子點，此乃是由於其分群結果完全相同的原因所致。

馬上練習以『SPSS範例\Ch16\洗髮精品牌集群分析.sav』之內容，改採使用『行銷因素』、『功效因素』、『護髮因素』、『香味因素』與『價格因素』等五個因素，進行二階段之集群分析。第一階段以華德法取得集群數目，計算出各群之重心。再以各群之重心為種子點，投入K平均數法進行第二階段重新分群。

信用卡消費者之市場區隔於十三章，我們曾針對『SPSS範例\Ch13\申請信用卡考慮因素.sav』，將受訪者對申請信用卡重要考慮因素：『年費』、『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失『卡風險負擔』、『24小時免付費專線』、『道路救援服務』、『旅遊保險』、『發卡銀行知名度』、『專業形象』、『卡片設計美觀』與『贈品』等15個變數，以主成份分析濃縮成：『知名與專業因素』、『功能因素』、『信貸因素』、『促銷因素』與『費用因素』等五個主成份因素。

本章，先將這些資料及其因素分數，以及受訪者的基本資料、是否有信用卡、主要使用之信用卡、每月刷卡金額、……等資料，轉存到『SPSS範例\Ch16\信用卡市場區隔.sav』：

底下，就利用經主成份分析所濃縮成之『知名與專業因素』、『功能因素』、『信貸因素』、『促銷因素』與『費用因素』等五個主成份因素，針對受訪者進行二階段集群分析，將其分群找出信用卡市場區隔。於以判別分析驗證其分群之適當性後，再針對市場區隔進行描述其特性。

第一階段-華德法集群分析第一階段先以『華德法』集群分析，判斷應分為幾群？其處理步驟為：開啟『SPSS範例\Ch16\信用卡市場區隔.sav』執行「分析(A)/分類(Y)/階層集群分析法(H)…」

於左側，選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素，按鈕，將其送到右側之『變數(V)』方塊

按鈕，於『集群方法』處，選「Ward's法」；『測量』處，選「歐基里得直線距離平方」

按〔繼續〕鈕，回上一層對話方塊按〔確定〕鈕，獲致將91個樣本，由91群合併到成為1群的凝聚過程

將最後幾個凝聚過程彙總到下表，並計算其總變異的遞增量：可發現總變異的最大遞增量是在群數為2變為1時，故應以分為2群，最為恰當。

確定要分為2群後，再重新執行一次前面的『華德法』集群分析，但得按鈕，選擇要將分群為2之結果儲存下來：可將分群結果儲存於『clus2_1』：

接著，以下示步驟先求算各群之重心（即求算各變數之均數）：執行「分析(A)/比較平均數法(M)/平均數(E)…」於左側，選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素，按鈕，將其送到右側之『依變數清單(D)』方塊

於左側，選取『Ward Method』（此係其註解，原欄名為clu2_1），按鈕，將其送到右側之『自變數清單(I)』方塊

按〔確定〕鈕，獲致兩群體之中心（平均數）

第二階段-K平均數法集群分析接著，將兩群體之中心（平均數）資料輸入到『SPSS範例\Ch16\信用卡分群第一階段中心.sav』，擬作為下階段『K平均數集群法』之起始種子點：（注意其欄名的安排方式，否則無法被順利讀取。第一欄為『cluster_』，其餘各欄恰與進行集群分析之五個因素分數欄同名稱）

然後，再以下示步驟進行『K平均數集群』：開啟『SPSS範例\Ch16\信用卡市場區隔.sav』執行「分析(A)/分類(Y)/K平均數集群(K)…」於左側，選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素，按鈕，將其送到右側之『變數(V)』方塊

於『集群個數(U)』處輸入要分為幾群？（本例為2）按鈕，選「起始中心點讀入來源(E)」，並按其後之鈕。找出『SPSS範例\Ch16\信用卡分群第一階段中心.sav』當起始種子點

按鈕，回上一層對話方塊

按〔儲存〕鈕，選擇要將分群結果儲存下來按〔繼續〕鈕，回上一層對話方塊按〔確定〕鈕，獲致初始集群中心

及最後之集群中心：可發現第1群在『促銷』上之分數較高，故可將其命名為『促銷群』；而第2群在『功能』與『信貸』上之分數較高，尤其在『功能』上之差異更明顯，故將其命名為『功能群』。

兩群體分別含幾個樣本：第1群有47個樣本；第2群有45個樣本。並將分群結果儲存於『qcl1_1』：

比較『clu2_1』與『qcl1_1』，可發現兩次分群結果有點不一樣。由於在已知群數的情況下，『K平均數法』優於『Ward‘s法』，故我們取『qcl1_1』之結果進行後續之分析。茲將這些資料彙總於下表：

驗證分群結果要驗證先前之分群結果是否適當？可將分群結果（『qcl1_1』）當分組變數，將原『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素當自變數。跑一次判別分析，看其判別函數之分組準確率如何？準確率越高，表先前之分群結果越好。其處理步驟如下：開啟『SPSS範例\Ch16\信用卡市場區隔.sav』執行「分析(A)/分類(Y)/判別(D)…」

左側選取『集群觀察值個數[qcl1_1]』變數（K平均數法之分群結果）

按鈕，將其送到右側之『分組變數(G)』方塊

按鈕，於『最小值(I)』輸入1，『最大值(A)』輸入2，定義組別的上下限按〔繼續〕鈕，回上一層對話方塊。『分組變數(G)』方塊處，qcl1_1後之括號內會有剛剛所輸入之組別的上下限

左側選取『知名與專業[fact1_1]』、『功能[fact2_1]』、『信貸[fact3_1]』、『促銷[fact4_1]』與『費用[fact5_1]』等五個因素，按鈕，將其送到右側之『自變數(I)』方塊

選擇「使用所有變數(E)」按鈕，於『顯示』處，選「摘要表(U)」，可列出一交叉表（混淆矩陣，confusion matrix），比較原組別與經過判別函數所指派之組別的正確率如何？

按〔繼續〕鈕，回上一層對話方塊按〔確定〕鈕，獲致 Wilks' Lambda值0.266、卡方值115.724、自由度5、顯著性0.000<α=0.05，判別能力達顯著水準，效果非常好。

標準化後之典型判別函數，正值部分以『功能』因素之係數最高（1.060）；負值部分以『促銷』因素之係數較大（-1.031）。

集群1的重心為-1. 606之負值，由於『促銷因素』之係數為負且係數較高（-1 集群1的重心為-1.606之負值，由於『促銷因素』之係數為負且係數較高（-1.031），故愈注重此因素（贈品、卡片設計美觀）之受訪者，愈可能會歸屬到集群1。集群2的重心為1.677之正值，由於『功能因素』係數為正且較高（1.060），故而愈注重此一因素（是否受商店歡迎、失卡風險負擔、是否全球通行、循環利息、24小時免付費專線）之受訪者，愈可能會歸屬到集群2。

此一判別函數的正確判別率為100%，證明分群結果相當良好！

描述分群結果將二階段集群分群之結果，經判別分析確認分群正確率之後，確定了應該分為兩個市場區隔後。接著即可針對這兩個市場區隔進行深入分析，如：以群別進行與基本資料之『交叉表分析』，可看出各群內之人口的性別、年齡、教育程度、職業、所得、有無信用卡、為何申請、為何不申請、所接觸之媒體、……等相關資料。此外，也可以群別與對受訪者申請信用卡時所著重之考慮因素（進行主成份分析前之原始著重程度）、生活型態之態度量表、……等評價量表，進行『獨立樣本T檢定』（兩群體）或『單因子變異數分析』（多群體），以探討各群之考慮因素及生活型態的差異。

由於，對各群體有充份的瞭解，當業者考慮針對某一市場區隔進行重點促銷或主打某一專案時，將較能有效的深入到該群，不僅提高效果更能省下大筆經費。首先，以群別分別與性別、家庭所得、每月零用金、分組過之刷卡金額、有無信用卡、……等資料，進行交叉表分析。其處理步驟為：開啟『SPSS範例\Ch16\信用卡市場區隔.sav』執行「分析(A)/描述性統計(E)/交叉表(C)…」左側選取『集群觀察值個數[qcl1_1]』變數（K平均數法之分群結果）

按鈕，將其送到右側之『直行(C)』方塊選『有無信用卡[q1]』、『最常使用[q3_1]』、『性別』、『家庭所得[家庭所得]』、『可支配零用金[零用金]』、『發卡銀行』與『金額分組』變數，按鈕，將其送到右側之『列(O)』方塊

按鈕，選擇要求得「卡方統計量(H)」

按〔繼續〕鈕，回上一層對話方塊按鈕，設定要顯示「觀察值(O)」及「直行(C)」百分比

按〔繼續〕鈕，回上一層對話方塊按〔確定〕鈕，即可獲致各交叉表及其卡方值。茲將其交叉分析之結果彙總如下，並未發現有任何顯著差異之現象。（可能是受訪者均為大學生，其齊質性太高之故）

由於，只有兩群。故接著以『獨立樣本T檢定』，檢定不同群別受訪者對：『年費』、『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失卡風險負擔』、『24小時免付費專線』、『道路救援服務』、『旅遊保險』、『發卡銀行知名度』、『專業形象』、『卡片設計美觀』與『贈品』等15個變數之著重程度。其處理步驟為：開啟『SPSS範例\Ch16\信用卡市場區隔.sav』執行「分析(A)/比較均數法(M)/獨立樣本T檢定(T)…」於左側選取『年費[q6_01]』～『贈品[q6_15]』，按鈕，將其送到右側之『檢定變數清單(T)』方塊

左側選取『集群觀察值個數[qcl1_1]』變數（K平均數法之分群結果），按鈕，將其送到右側之『分組變數(G)』方塊

按鈕，定義組別之代碼按〔繼續〕鈕，回上一層對話方塊

按〔確定〕鈕結束，即可獲致其等之T檢定結果

於整體分析時，我們尚需要全體受訪者對各屬性著重程度之均數。故續以下示步驟求得：執行「分析(A)/描述性統計(E)/描述性統計量(D)…」於左側以滑鼠拖曵選取『年費[q6_01]』～『贈品[q6_15]』，按鈕，將其送到右側之『變數(V)』方塊

按〔確定〕鈕，獲致全體受訪者對各屬性著重程度之均數

茲將其結果彙總如下：

可發現有：『年費』、『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失卡風險負擔』、『24小時免付費專線』、『道路救援服務』、『卡片設計美觀』與『贈品』等申請信用卡考慮因素的注重程度，隨其群別不同而存有顯著差異。第1群（『促銷群』）較著重：『年費』、『卡片設計美觀』與『贈品』等申請信用卡考慮因素。而第2群（『功能群』）較著重：『循環利息』、『信用額度』、『可貸款』、『可預借現金』、『是否全球通行』、『是否受商店歡迎』、『失卡風險負擔』、『24小時免付費專線』與『道路救援服務』等申請信用卡考慮因素。

第十六章結束辛苦啦！