Chapter 6 主成份分析. Chapter 6 主成份分析 主成份分析應用簡介 管理決策考量 共線性的問題 主成份分析的目標 以一群完整的變數來共同判定某一個決策,以顧及周延性 另一方面又希望變數的考量不要過於複雜,以降低決策過程的困難度與複雜性 理想狀況:由變數共同形成簡單而又具有代表性的指標,讓決策者可以迅速做出有效的決策.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
單元九:單因子變異數分析.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
行銷研究 單元三 次級資料的蒐集.
問題 欲探討組織學習傾向與策略決策模式之關係 預測變數(X)—組織學習傾向構面 準則變數(Y)—策略決策模式 願景溝通 團隊學習 價值領導
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
第 9 章 線性微分方程組.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
第七章 因素分析 7-1 因素分析 7-2 因素分析的基本統計假設 7-3 因素分析之檢定 7-4 選取因素之數目
認識倍數(一) 設計者:建功國小 盧建宏.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
陳維魁 博士 儒林圖書公司 第九章 資料抽象化 陳維魁 博士 儒林圖書公司.
Views ,Stored Procedures, User-defined Function, Triggers
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
Project 2 JMVC code tracing
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第四章 資金成本.
Chapter 5 迴圈.
第零章 統計學概論 0.1 統計學的定義 0.2 敘述統計學與推論統計學 0.3 測量尺度 0.4 資料、資訊與因果關係 ©2009 陳欣得
Chapter 7 因素分析. Chapter 7 因素分析 因素分析的架構(1) 單一共同因子模型 p個指標及一個共同因子 X為指標 ξ為共同因子(common factor) ε則為獨特因子(unique factor) λ為型態負荷(pattern loading) 多變量分析—管理上的應用.
Ch7:一般線性模式 GLM.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
課程九 迴歸與相關2.
第 7 章 複迴歸之二.
Discriminant Analysis
單一分配 Uniform distribution
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
第十一章 相關研究法.
第一章 直角坐標系 1-1 數系的發展.
靜定桁架分析 (應用電腦).
網路安全技術 OSI七層 學生:A 郭瀝婷 指導教授:梁明章.
虎克定律與簡諧運動 教師:鄒春旺 日期:2007/10/8
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
导数的应用 ——函数的单调性与极值.
第一章 直角坐標系 1-3 函數圖形.
為成功制定目標和行動計畫 國際獅子會分區主席訓練.
107學年度國民中學 學障鑑定個測工作說明 Loading…… 臺東縣特教資源中心.
PowerClick Demo.
Definition of Trace Function
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
小學四年級數學科 8.最大公因數.
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
其他 ER 相關觀念 以及OO模型 國立中央大學 資訊管理系 范錚強 2002 中央大學。范錚強.
同分母分數大小比較 ‧教材設計者:台北縣康橋國小 林必勤老師 ‧教材製作者:台北縣康橋國小 吳淑敏老師.
田口方法應用於語音辨識 報告者:李建德.
挑戰C++程式語言 ──第8章 進一步談字元與字串
10-6 CONTROL CHARTS FOR MONITORING VARIABLITY
Chapter 4 迴歸分析. Chapter 4 迴歸分析 迴歸分析原理 迴歸分析的目的在於找出一條最能夠代表所有觀測資料(樣本點)的函數(迴歸估計式),用這個函數代表應變數和自變數之間的關係 多變量分析—管理上的應用.
交流電路(R-L) R-L Series Circuits ATS電子部製作.
MiRanda Java Interface v1.0的使用方法
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
5. 令圖畫動起來 Tween 功能介紹 移動效果 顏色漸變效果 形狀漸變效果 離開.
例題 1. 多項式的排列 1-2 多項式及其加減法 將多項式 按下列方式排列: (1) 降冪排列:______________________ (2) 升冪排列:______________________ 排列 降冪:次數由高至低 升冪;次數由低至高.
13194: DPA Number II ★★☆☆☆ 題組:Problem Set Archive with Online Judge
6.1 動畫檔案的格式 6.2 建立合適的動畫元素.
Chapter 3 相關與變異數分析. Chapter 3 相關與變異數分析 變數的內涵 屬量變數 屬質變數 當一個變數可以量化、計算,而且其值的大小可以做有意義的比較時,則稱為屬量變數 當一個變數的內容是屬於敘述性的(如:快樂/憂鬱、男/女),則即使我們可以將其量化,這些量化之後的數值不但在邏輯上不能運算,其大小的比較也沒有意義,這種變數即稱為屬質變數.
第一章 直角坐標系 1-3 函數及其圖形.
6-1線性轉換 6-2核心與值域 6-3轉換矩陣 6-4特徵值與特徵向量 6-5矩陣對角化
非負矩陣分解法介紹 報告者:李建德.
補充 數值方法 數值方法.
第四組 停車場搜尋系統 第四組 溫允中 陳欣暉 蕭積遠 李雅俐.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三十單元 極大與極小.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

Chapter 6 主成份分析

主成份分析應用簡介 管理決策考量 共線性的問題 主成份分析的目標 以一群完整的變數來共同判定某一個決策,以顧及周延性 另一方面又希望變數的考量不要過於複雜,以降低決策過程的困難度與複雜性 理想狀況:由變數共同形成簡單而又具有代表性的指標,讓決策者可以迅速做出有效的決策 共線性的問題 應用主成份分析,將所有解釋變數縮減成幾個互為獨立的主成份,再以這幾個主成份來進行迴歸分析,以消除共線性 主成份分析的目標 主成份分析是一種利用原有較多的變數資料,以產生少數新的變數的方法 儘量保有原變數資料的資訊內涵 新的變數之間需互為獨立 變數個數已經適當地縮減 多變量分析—管理上的應用

主成份分析之幾何架構(1) 原始成績 變異-共變異矩陣 相關係數矩陣 多變量分析—管理上的應用

主成份分析之幾何架構(2) 將X1軸往逆時鐘方向旋轉θ角度 不同旋轉角度下的變異 X1* = cosθ ×X1 + sinθ ×X2 X2* =-sinθ* ×X1 + cosθ* ×X2 不同旋轉角度下的變異 多變量分析—管理上的應用

主成份分析之幾何架構(3) 原有成績減除平均值在X1*及X2*軸上的座標值 多變量分析—管理上的應用

主成份分析之幾何架構(4) X1*及X2*的變異-共變異矩陣 X1*及X2*的相關係數矩陣 多變量分析—管理上的應用

主成份分析之幾何架構(5) 歸納結論 原有資料點若投影至原來的軸,則可以得到原來的值(θ=0°),而若投影至新的軸,則可以得到新的座標值。這些新的軸若經由前面的程序得到(即第一個軸可以解釋最大可能比例的變異),則稱為主成份;而原資料點投影在這些軸上的值則稱為主成份分數(principal component scores) 新的變數(X1*與X2*)均各自為原來變數X1及X2之線性組合 X1*與X2*變異數的總和等於X1及X2變異數的和。亦即,經過座標轉換後,總變異數不會改變 X1*解釋總變異的比例已是儘可能最大,而X2*則解釋全部剩下的變異 X1*與X2*之間的相關係數為0 多變量分析—管理上的應用

座標軸轉軸 變異增加之座標軸轉軸 變異未顯著增加之座標軸轉軸 多變量分析—管理上的應用

分析架構—兩變數簡化模型(1) 變數的轉換關係 原有的變數為x1及x2,轉換後的變數為x1*及x2* x1*= w11 x1+ w12 x2 多變量分析—管理上的應用

分析架構—兩變數簡化模型(2) 轉換變數之變異數總和極大化 多變量分析—管理上的應用

分析架構—兩變數簡化模型(2) 樣本共變異矩陣 解 即解 結果 λ1為最大特徵值 (x1,x2)的第一主成份解為 利用λ2可以求得第二主成份解為 多變量分析—管理上的應用

分析架構—結論(1) w1’w2=0 λi=Var(xi*) w1與w2正交(orthogonal) 在w’w=1的情況下(即正規化,normalization),一共變異矩陣之特徵值即為其所對應特徵向量所組成之轉換變數(主成份)的變異數 如果有n個原始變數,且組成共n個主成份,則所有主成份變異數的和會等於所有變數變異數的和 多變量分析—管理上的應用

分析架構—結論(2) 每一主成份(xi*)解釋變異的比例為 前p個主成份解釋變異的比例為 多變量分析—管理上的應用

主成份分析注意事項(1) 主成份個數的選取 主成份分析的適用性 取特徵值大於全部平均值者 取特徵值大於1者(適用於標準化資料) 透過特徵值排列圖(陡坡圖),選取開始變平緩的點所對應的個數 正式的統計檢定(如Bartlett test) 主成份分析的適用性 若原有變數之間的相關性很低,那麼經過主成份分析後所選取的主成份個數基本上不會與原有變數的個數相差多少 多變量分析—管理上的應用

主成份分析注意事項(2) 主成份分析並非用來刪除原有變數 主成份負荷(Loading) 主成份分數 主成份分析並不是用來刪除一部份原始變數。 在變數轉換的過程中,每一個主成份(轉換變數)都用到所有的原始變數 主成份負荷(Loading) 當我們希望針對不同的主成份之間,比較原始變數所對應係數的大小時,作法是將各特徵向量按其所對應特徵值的大小比例調整,而調整後的係數 則稱為主成份負荷(principal component loading)。 主成份分數 主成份分數可以用來將各觀測點分類,也可以將每一觀測點的各主成份分數綜合起來計算一個加權平均的綜合性指標,當作一種決策分析的參考 多變量分析—管理上的應用

主成份分析與因素分析 相似處 相異處 二者都具有將原有變數資料縮減成少數可以描述大部分原資料資訊內涵的變數之功能 主成份分析主要是要利用原有的變數,組合成幾個新的變數;而因素分析則主要是要找尋及確認可以解釋原有變數間交互關係的隱藏因素或建構(construct) 主成份分析較偏重在分析及應用原有資料的變異,而因素分析則強調在探討原有變數間的交互影響關係 主成份分析中,原有變數是用來組成新的變數(稱為主成份),也可以稱為形成指標(formative indicators);因素分析中,原有變數是用來反映隱藏因素或建構的存在,也可以稱為反映指標(reflective indicators) 多變量分析—管理上的應用