多變量分析簡報大綱(三) K平均數集群分析 (非階層式集群分析) 2-1.表單位置 2-2.內容設定 2-3.輸出變數 2-4.輸出結果 2-5.結果彙整 第一部份 集群分析 階層集群分析 (階層式集群分析) 1-1.表單位置 1-2.內容設定 1-3.輸出結果 第二部份 判別分析 判別分析 3-1.表單位置 3-2.內容設定 3-3.產生變數 3-4.輸出結果
單元範例 表為十二支球隊評鑑結果,評鑑項目為士氣、攻擊力和守備力,本單元在集群分析部份將以這三項指標作十二支球隊分組區隔。
1-1. 『階層集群分析』表單位置 ◎執行步驟 分類 >階層集群分析法
1-2. 『階層集群分析』內容設定 說明: 使用歐氏距離平方、華德法作分層集群分析
1-3. 『階層集群分析』輸出結果 凝聚過程說明: 1.在階段一為球隊7與球隊11合併形成「類一」,先出現的階段集群(0,0)表示樣本與樣本的合併。 2.接著在階段四球隊6與球隊7所在的「類一」合併,先出現的階段集群(0,1)表示樣本與類一的合併。 3.而在階段九先出現的階段集群(3,5)表示類三與類五的合併, 也就是球隊2、8和球隊4、12合併。 4.最後一階段會將所有球隊合併成一群。 距離測度值,愈大表示兩者間差異愈大,當係數突然增大許多表示不宜再合併,此處在階段九後應停止合併。 由樹狀圖也可看出分成三個集群較理想。
群數凝結過程表格說明 群數凝結過程 階段 組合集群 係數 先出現的階段集群 下一階段 集群1 集群2 1 7 11 2.500 4 4 說明: 7和11合併,兩者之前皆未出現過,此階段組成的「類一」(即7和11)下次和其他觀察值合併會發生在第四階段。 2 5 9 11.500 6 說明: 5和9合併,兩者之前皆未出現過,此階段組成的「類二」(即5和9)下次和其他觀察值合併會發生在第六階段。 3 8 22.000 38.833 1 (即7,11) 說明: 6和7合併,6之前未出現過,但7在階段一出現過,所以6合併7代表的「類一」全體,此階段組成的「類四」(即6、7和11)下次和其他觀察值合併會發生在第七階段。 12 59.333 81.667 2 (即5,9) 116.083 4 (即6,7,11) 10 說明: 3和6合併,3之前未出現過,但6在階段四出現過,所以6代表「類四」全體,此階段組成的「類七」(即3、6、7和11)下次和其他觀察值合併會發生在第七階段。 167.750 6 (即1,5,9) 236.250 3 (即2,8) 5 (即4,12) 說明: 2和4合併,兩者分別在階段三、五出現過,2代表「類三」全體(即2和8),4代表「類五」全體(即4和12),此階段組成的「類九」下次和其他觀察值合併會發生在第七階段。 908.875 8(即1,5,9,10) 7(即3,6,7,11) 1814.850 10(即1,5,9, 10,3,6,7,11) 9(即2,8,4,12) 集群數 11 10 9 8 7 6 5 4 3 2 1
1-3. 『階層集群分析』產生結果 6 2 8 10 7 4 1 11 3 9 5 凝聚順序 冰柱圖說明: 1.綠色直行可視為觀察值間的連結, 例如分成三群時從集群個數3往右劃一條線,可看出12、4、8、2為一群,11、7、6、3為一群,10、9、5、1為一群。 2.從集群個數11往上看亦可看出觀察值凝聚過程,即階段一為11和7,階段二為9和5,階段三為8和2,階段四為6和7與11……,最後階段才是2和11 。
2-1. 『K平均數集群』表單位置 ◎執行步驟 分類 > K平均數集群
2-2. 『 K平均數集群』內容設定 以『階層集群分析法』獲知最佳分群為三群,所以此處將集群個數設為「 3 」 。
2-3.『K平均數集群』產生變數 結果: 在原始資料末端增加一項新變數 ;表示集群分析分群之結果。
2-4.『K平均數集群』產生結果 顯示各集群的中心點性質,可看出集群一注重攻擊力,集群二注重守備力,集群三均衡發展。 以三個指標為依變數,集群別為自變數進行變異數分析,結果顯示分群結果還算恰當。 各球隊的集群代號及其與該集群中心的距離
集群一>集群三集群二>集群一集群二>集群三 2-5.集群分析結果彙整表 士氣平均 (變異數) 攻擊力平均(變異數) 守備力平均(變異數) 集群命名 隊伍代號 集群一 71.50 (5.667) 82.50 (1.667) 73.50 (20.333) 攻擊重視群 1,5,9,10 集群二 67.25 (0.917) 68.00 (24.667) 86.75 (7.583) 守備重視群 2,4,8,12 集群三 67.00 (6.667) 66.50 (6.333) 65.75 (4.917) 全面低落群 3,6,7,11 F值 5.792* 28.684** 41.216** 註:**代表P≦0.01, *代表P≦0.5 Scheffe法多重比較 集群一>集群三 集群一>集群二集群一>集群三 集群一>集群三集群二>集群一集群二>集群三 說明:在此以平均數作為集群命名之主要依據,並應用單因子變異數分析檢驗各集群在各指標是否有顯著差異
單元範例 表為十二支球隊評鑑結果,球評以三項指標將十二支球隊分成強1、中2、弱3等級,如此是否能有效區分。
3-1. 『判別分析』表單位置 ◎執行步驟 分類 > 判別
3-2. 『判別分析』內容設定
3-3. 『判別分析』產生變數 新變數
3-4.『判別分析』產生結果 每一函數的特徵值、可解釋百分比;此處的典型相關是將分類變項化成一組虛擬變項,而把預測變項當作另一組變項所得。 典型區別函數的顯著性檢驗 標準化區別函數係數,可看出預測變項在組成函數的相對貢獻。 預測變項及典型區別函數的聯合組內相關係數
3-4.『判別分析』產生結果 Fisher's線性分類函數。由原始的預測變項數值乘此係數可得分類分數,用此分數可將觀察值重新分類至分數最高那一組。 各判別分析小結。縱軸為實際組別,橫軸為預測組別,對角線為正確者。 重新分類結果。最高組別指重新分類後機率最高的組,其預測組與實際組不同會標示星號,P(D|G)稱為條件機率,這是已知觀察值組別(G)時其D值(與觀察值該組中心點距離)的機率; P(G|D)稱為事後機率,可從上表之分類係數計算得到;第二高組別意義和前者相同;區別函數則是從未標準化區別函數係數計算而得。
單元結尾 本單元結束……