Chapter 6 主成份分析
主成份分析應用簡介 管理決策考量 共線性的問題 主成份分析的目標 以一群完整的變數來共同判定某一個決策,以顧及周延性 另一方面又希望變數的考量不要過於複雜,以降低決策過程的困難度與複雜性 理想狀況:由變數共同形成簡單而又具有代表性的指標,讓決策者可以迅速做出有效的決策 共線性的問題 應用主成份分析,將所有解釋變數縮減成幾個互為獨立的主成份,再以這幾個主成份來進行迴歸分析,以消除共線性 主成份分析的目標 主成份分析是一種利用原有較多的變數資料,以產生少數新的變數的方法 儘量保有原變數資料的資訊內涵 新的變數之間需互為獨立 變數個數已經適當地縮減 多變量分析—管理上的應用
主成份分析之幾何架構(1) 原始成績 變異-共變異矩陣 相關係數矩陣 多變量分析—管理上的應用
主成份分析之幾何架構(2) 將X1軸往逆時鐘方向旋轉θ角度 不同旋轉角度下的變異 X1* = cosθ ×X1 + sinθ ×X2 X2* =-sinθ* ×X1 + cosθ* ×X2 不同旋轉角度下的變異 多變量分析—管理上的應用
主成份分析之幾何架構(3) 原有成績減除平均值在X1*及X2*軸上的座標值 多變量分析—管理上的應用
主成份分析之幾何架構(4) X1*及X2*的變異-共變異矩陣 X1*及X2*的相關係數矩陣 多變量分析—管理上的應用
主成份分析之幾何架構(5) 歸納結論 原有資料點若投影至原來的軸,則可以得到原來的值(θ=0°),而若投影至新的軸,則可以得到新的座標值。這些新的軸若經由前面的程序得到(即第一個軸可以解釋最大可能比例的變異),則稱為主成份;而原資料點投影在這些軸上的值則稱為主成份分數(principal component scores) 新的變數(X1*與X2*)均各自為原來變數X1及X2之線性組合 X1*與X2*變異數的總和等於X1及X2變異數的和。亦即,經過座標轉換後,總變異數不會改變 X1*解釋總變異的比例已是儘可能最大,而X2*則解釋全部剩下的變異 X1*與X2*之間的相關係數為0 多變量分析—管理上的應用
座標軸轉軸 變異增加之座標軸轉軸 變異未顯著增加之座標軸轉軸 多變量分析—管理上的應用
分析架構—兩變數簡化模型(1) 變數的轉換關係 原有的變數為x1及x2,轉換後的變數為x1*及x2* x1*= w11 x1+ w12 x2 多變量分析—管理上的應用
分析架構—兩變數簡化模型(2) 轉換變數之變異數總和極大化 多變量分析—管理上的應用
分析架構—兩變數簡化模型(2) 樣本共變異矩陣 解 即解 結果 λ1為最大特徵值 (x1,x2)的第一主成份解為 利用λ2可以求得第二主成份解為 多變量分析—管理上的應用
分析架構—結論(1) w1’w2=0 λi=Var(xi*) w1與w2正交(orthogonal) 在w’w=1的情況下(即正規化,normalization),一共變異矩陣之特徵值即為其所對應特徵向量所組成之轉換變數(主成份)的變異數 如果有n個原始變數,且組成共n個主成份,則所有主成份變異數的和會等於所有變數變異數的和 多變量分析—管理上的應用
分析架構—結論(2) 每一主成份(xi*)解釋變異的比例為 前p個主成份解釋變異的比例為 多變量分析—管理上的應用
主成份分析注意事項(1) 主成份個數的選取 主成份分析的適用性 取特徵值大於全部平均值者 取特徵值大於1者(適用於標準化資料) 透過特徵值排列圖(陡坡圖),選取開始變平緩的點所對應的個數 正式的統計檢定(如Bartlett test) 主成份分析的適用性 若原有變數之間的相關性很低,那麼經過主成份分析後所選取的主成份個數基本上不會與原有變數的個數相差多少 多變量分析—管理上的應用
主成份分析注意事項(2) 主成份分析並非用來刪除原有變數 主成份負荷(Loading) 主成份分數 主成份分析並不是用來刪除一部份原始變數。 在變數轉換的過程中,每一個主成份(轉換變數)都用到所有的原始變數 主成份負荷(Loading) 當我們希望針對不同的主成份之間,比較原始變數所對應係數的大小時,作法是將各特徵向量按其所對應特徵值的大小比例調整,而調整後的係數 則稱為主成份負荷(principal component loading)。 主成份分數 主成份分數可以用來將各觀測點分類,也可以將每一觀測點的各主成份分數綜合起來計算一個加權平均的綜合性指標,當作一種決策分析的參考 多變量分析—管理上的應用
主成份分析與因素分析 相似處 相異處 二者都具有將原有變數資料縮減成少數可以描述大部分原資料資訊內涵的變數之功能 主成份分析主要是要利用原有的變數,組合成幾個新的變數;而因素分析則主要是要找尋及確認可以解釋原有變數間交互關係的隱藏因素或建構(construct) 主成份分析較偏重在分析及應用原有資料的變異,而因素分析則強調在探討原有變數間的交互影響關係 主成份分析中,原有變數是用來組成新的變數(稱為主成份),也可以稱為形成指標(formative indicators);因素分析中,原有變數是用來反映隱藏因素或建構的存在,也可以稱為反映指標(reflective indicators) 多變量分析—管理上的應用