主成份分析 Principal Component Analysis (PCA) 生物資訊室 Bioinformatic Core Research Assistant 葉坤海
主成份分析的特性 代表性 保有原來變數的資訊 獨立性 新的變數不能重疊 精簡性 用”少數”代替原來的”多個”變數
線性組合: 其中 Result : PC 1 : PC 2 : 收集20位學生身高、體重,如下 No. X1 X2 1 183 75 1 183 75 2 178 70 3 175 68 4 172 60 5 170 72 6 169 65 7 166 54 8 164 58 9 161 49 10 163 58 11 162 60 12 162 54 13 162 51 14 160 56 15 158 52 16 156 46 17 153 45 18 149 44 19 152 43 20 150 45 線性組合: 其中 Result : PC 1 : PC 2 :
資料點的投影方向
主成份的幾何意義
No. x1 x2 1 183 75 2 178 70 3 175 68 4 172 60 5 170 72 6 169 65 7 166 54 8 164 58 9 161 49 10 163 58 11 162 60 12 162 54 13 162 51 14 160 56 15 158 52 16 156 46 17 153 45 18 149 44 19 152 43 20 150 45 y1 y2 179.922 82.29 172.852 82.06 169.34 81.238 161.448 84.52 168.84 74.852 163.046 78.91 152.964 84.244 154.516 80.048 145.894 84.014 153.832 79.318 154.608 77.22 150.228 81.324 148.038 83.376 150.32 78.496 146.032 79.772 140.284 82.416 137.502 80.91 134.036 78.674 135.358 81.548 135.45 78.72 總變異 代入線性組合 第一主成份解釋的變異比例 第二主成份解釋的變異比例
standardize 主成份score No. X1 X2 PC1 PC2 1 183 75 2.857 0.254 2 178 70 1 183 75 2 178 70 3 175 68 4 172 60 5 170 72 6 169 65 7 166 54 8 164 58 9 161 49 10 163 58 11 162 60 12 162 54 13 162 51 14 160 56 15 158 52 16 156 46 17 153 45 18 149 44 19 152 43 20 150 45 PC1 PC2 2.857 0.254 2.115 0.207 1.744 0.110 0.927 0.430 1.671 -0.564 1.076 -0.155 0.036 0.374 0.185 -0.062 -0.705 0.327 0.111 -0.141 0.186 -0.360 -0.259 0.058 -0.483 0.267 -0.259 -0.239 -0.705 -0.118 -1.299 0.141 -1.596 -0.026 -1.966 -0.272 -1.819 0.034 -1.818 -0.263 2.139 1.910 1.597 1.401 1.272 1.197 0.947 0.382 0.731 1.604 0.622 0.891 0.297 -0.229 0.081 0.178 -0.243 -0.738 -0.027 0.178 -0.135 0.382 -0.135 -0.229 -0.135 -0.534 -0.351 -0.025 -0.568 -0.433 -0.785 -1.044 -1.110 -1.146 -1.543 -1.248 -1.218 -1.350 -1.435 -1.146 standardize 代入線性組合 主成份score
主成份散佈圖
standardize 線性組合: 其中 身高 體重 數學 國文 英文 No. x1 x2 x3 x4 x5 1 183 75 85 62 93 2 178 70 64 96 73 3 175 68 79 76 4 172 60 84 5 170 72 88 6 169 65 80 69 7 166 54 71 8 164 58 81 67 9 161 49 90 102 63 10 163 11 162 82 12 98 13 51 94 14 160 56 57 15 158 52 16 156 46 77 97 61 17 153 45 18 149 44 19 152 43 20 150 83 53 身高 體重 數學 國文 英文 x1 x2 x3 x4 x5 2.14 1.91 0.67 -1.37 2.43 1.60 1.40 -0.85 1.16 0.37 1.27 1.20 1.24 -0.10 0.68 0.95 0.38 -1.14 0.27 -0.75 0.73 0.23 0.57 0.99 0.62 0.89 0.30 -0.04 -0.23 -0.35 -0.40 0.08 0.18 0.04 -0.24 -0.74 1.03 1.61 -0.65 -0.03 -0.14 0.45 -1.52 -1.00 1.31 1.50 -0.53 1.01 -1.16 -0.49 -1.74 -1.27 -0.57 -0.43 -0.79 -1.04 0.09 -0.86 -1.11 -1.15 -2.23 -0.70 0.07 -1.54 -1.25 -1.22 -1.35 0.34 -1.44 0.19 -1.68 standardize 線性組合: 其中
主成份分析: 身高, 體重, 數學, 國文, 英文 相關矩陣的特徵分析 特徵值 2.3877 1.1259 0.8908 0.5425 0.0531 比例 0.478 0.225 0.178 0.109 0.011 累積 0.478 0.703 0.881 0.989 1.000 變量 PC1 PC2 PC3 PC4 PC5 身高 0.605 0.169 0.037 -0.350 -0.694 體重 0.618 -0.005 0.021 -0.339 0.709 數學 0.064 -0.677 0.729 0.014 -0.076 國文 -0.049 0.715 0.676 0.141 0.096 英文 0.496 -0.040 -0.099 0.862 -0.017 主成份的變異數 主成份變異佔總變異比例 累計的變異比例 線性組合的係數
Microarray Example sample no. sample_name time CEACAM4 LTA ACAT1 PTN PTAFR PIGA PRPS1 PTPN12 SDHB … 1 M0_H001_S 8.464607 9.232066 6.439598 2.790384 12.93665 11.28565 8.37019 9.951135 12.38981 2 M0_H002_S 8.48573 9.226658 6.420609 3.077487 12.99164 11.34275 8.300278 10.08416 12.35597 3 M05_H003_S 0.5 8.172025 9.66067 6.300901 2.863269 12.94545 11.32569 8.462246 9.375654 12.3824 4 M05_H004_S 8.223312 9.574604 6.344421 2.332044 12.86685 11.2425 8.625884 9.227595 12.42815 5 M1_H005_S 7.938371 9.689491 5.661818 3.353049 12.5792 11.54383 9.17412 8.811082 11.55269 6 M1_H006_S 7.922664 9.765178 5.533741 3.551364 12.57157 11.56709 8.994539 9.132586 11.59925 7 M25_H007_S 2.5 8.420877 9.365536 6.616887 2.906115 12.51577 12.0417 8.560228 10.53034 12.75462 8 M25_H008_S 8.34806 9.363278 6.336785 2.962013 12.50896 12.00049 8.52209 10.54547 12.78613 9 M5_H009_S 8.358381 9.785229 6.975359 3.212325 12.50829 12.11086 8.661786 10.33107 12.58194 10 M5_H010_S 8.52407 9.791055 6.649684 3.181385 12.65944 12.34021 8.726644 10.18882
Thanks for your attention!! ~End~ Thanks for your attention!!