第16章 典型相關分析 本章的學習主題 1. 典型相關的概念 2. 典型相關分析之基本假設及模型適合度 3. 典型權重和典型變量 4. 典型相關係數 5. 典型負荷量 6. 重疊指數 7. 典型相關分析整體模式之解釋
16.1 典型相關分析之基本概念 典型相關 (canonical correlation) 分析是探討多個準則變數 ( Y1、Y2、...、Yn ) 和多個預測變數 ( X1、X2、...、Xm ) 線性組合的相關分析方法。同時典型相關的準則變數和預測變數通常都是計量的資料。而典型相關的一般分析模式如下: Y1 + Y2 +...+ Yn = X1 + X2 +...+ Xm X 組之線性 組合構面 Y 組之線性 RIdu/v RIdv/u R12 X1 X2 Xm X3 …. Y1 Y2 Ym Y3 S11 S12 S13 S1m S21 S22 S23 S2n 圖 16-1 典型相關示意圖
16.1 典型相關分析之基本概念 具體而言,典型相關分析的目的在於: 1. 探討兩組變數(準則變數及預測變數)之間的關 係程度。 2. 針對準則變數和預測變數找出數組權重,使準 則變數和預測變數間之各組線性組合的相關性 為最大。而各組線性組合間是相互獨立的。 3. 分析準則變數各組和預測變數各組線性組合間 之關係,並解釋典型函數中各準則變數對於預 測變數的影響。
16.1 典型相關分析之基本概念 例如我們想探討例如我們想探討機會(包括支持、網站效能)與信任(包括資訊基礎信任、認同基礎信任)之典型相關之典型相關。 首先,在找出第一對X與Y之相關程度最大的線性組合之後,通常還可再找出與第一對線性組合不相關而X與Y之相關程度次大的第二對線性組合。一般而言,在有m1個預測變數和m2個準則變數的情況下,如m1大於m2,則可獲得m2對的線性組合;如m1小於m2,則可獲得m1對的線性組合。 第一對線性組合的典型相關最大,第二對次之,以後則依次愈來愈小。
16.2 典型相關分析的基本假設及模型適合度 典型相關分析具有以下之基本假設: 1. 兩組變數間的相關係數是基於線性關係,若為非線性則資料必須要被轉換成為線性,才能進行典型相關分析。 2. 典型變量間的典型相關為一線性關係,若為非線性則不會被接受。 3. 典型相關不要求變數服從常態分配,只要該變數能不減少和其他變數相關程度。
16.3 典型相關分析之模型 圖16-1為只產生一組典型變量(因為通常可能不只產生一組典型變量)時描繪成的結構示意圖: 16.3 典型相關分析之模型 圖16-1為只產生一組典型變量(因為通常可能不只產生一組典型變量)時描繪成的結構示意圖: 1. S11,S12,…,S1m及S21,S22,…,S2n:此為各變數對各 構面之典型負荷量(canonical loadings)。 2. R1:典型相關係數,X方面線性組合與Y方面線性組合之 間之相關係數。 3. RIdu/v及RIdv/u:重疊指數,典型相關分析中各組線性 組合構面被解釋的變異。
16.3 典型相關分析之模型 RIdu/v RIdv/u …. 圖 16-1 典型相關示意圖 RIdu/v RIdv/u 16.3 典型相關分析之模型 X 組之線性 組合構面 Y 組之線性 RIdu/v RIdv/u R12 X1 X2 Xm X3 …. Y1 Y2 Ym Y3 S11 S12 S13 S1m S21 S22 S23 S2n 圖 16-1 典型相關示意圖 機會 信任 RIdu/v RIdv/u R12 支持 網站效能 資訊基礎信任 認同基礎信任 S11 S12 S21 S22 圖 16-2 知識處理能力與知識基礎能力之典型規則相關模型
16.4 典型相關係數 典型相關係數(canonical correlation)就是預測變數X 16.4 典型相關係數 典型相關係數(canonical correlation)就是預測變數X 的線性函數組合和準則變數Y的線性函數組合間所能獲 得的最大相關係數。 表 16-1 典型相關整體模式評估 典型相關方程式 典型相關係數 (R) 典型相關係數平方(R2) F值 顯著性 1 0.504 0.254 19.486 0.000 2 0.033 0.001 0.269 0.604
16.4 典型相關係數 通常典型權重在0.3以上即具有顯著的解釋能力,然而由於變數之間可能會因為具有相關,因此利用典型權重來解釋變數的貢獻程度是相當不妥的。若利用下節所說明之典型負荷量來解釋變數之貢獻程度,則沒有這些問題。 表 16-2 第一組典型權重 預測變數之標準化典型相關權重 Opf(支持) 0.944* Ops(網站效能) 0.253 準則變數之標準化典型相關權重 Ift(資訊基礎信任) 0.627* Idt(認同基礎信任) 0.523*
16.5 典型負荷量 典型負荷量(canonical loadings)是指預測和準則兩組原始變數對各自之典型線性組合間的相關程度。而此中相關稱為典型結構(canonical structure)。通常典型負荷量在0.3以上即代表此一變數對於各自之線性組合具有顯著之解釋能力。 若將每個變數的典型負荷量予以平方,就可獲得每一個原始變數的變異量被其典型變量解釋的程度。各變數的典型負荷量平方值的簡單平均數就是典型變量所解釋之共有變異量之比例,即所謂自我解釋的能力。
16.5 典型負荷量 表 16-3 第一組典型負荷量 變數名稱 典型相關負荷量 典型相關負荷量平方 自我相關係數 預測變數 52.670% 16.5 典型負荷量 表 16-3 第一組典型負荷量 變數名稱 典型相關負荷量 典型相關負荷量平方 自我相關係數 預測變數 52.670% Opf(支持) 0.968* 0.937 Ops(網站效能) 0.342* 0.117 總和 1.054 準則變數 75.260% Ift(資訊基礎信任) 0.893* 0.797 Idt(認同基礎信任) 0.841* 0.707 1.504 * 代表係數大於0.3,表示變數對於各自之線性組合具有顯著的解釋能力
16.6 重疊指數 重疊指數(index of redundancy),如同複迴歸中的判定係數( R2 ),是衡量典型相關中被解釋的變異量;它計算預測變數(或準則變數)之變異數可被準則變數(或預測變數)之變異所解釋的程度。重疊指數是由以下兩個數字相乘而得:(1)準則(或預測)變數典型變量之解釋百分比(即自我相關係數);(2)典型相關係數的平方(CANR2)。 表 16-4 第一組主管指數 重疊係數彙整 變數名稱 自我相關係數 典型相關係數平方 重疊指數 預測變數 52.670% 0.254 13.378% 準則變數 75.260% 19.116% 一般而言,若重疊指數未達 5%,則此組線性組合之解釋能力不予考慮
16.6 重疊指數 典型相關係數的平方(CANR2)雖是衡量兩個典型變量間共有的變異量,但可能導致一些誤解,因為它代表的是兩組「變數的線性組合」的相關係數,並非兩組「變數」所共有的變異量。 即使線性組合所能解釋的各該組變數變異量之比例不大,有時卻也能獲得較大的典型相關係數。因此計算重疊指數可以將線性組合所能解釋之變異量(即自我相關係數)予以考慮。一般而言,重疊指數未達5%,則此組線性組合之解釋能力即不予考慮。
16.7 典型相關函數 所謂典型相關函數(canonical function)是指兩組典型變量所構成的線性關係。 在解釋典型相關函數時,有三種方法可供使用: 1.典型權重 2.典型負荷量 3.典型交叉負荷量
16.8 典型相關分析的結果呈現 表 16-5 典型相關係數檢定表 典型相關式 特徵值 典型相關係數平方 Approx F Sig. 1 16.8 典型相關分析的結果呈現 表 16-5 典型相關係數檢定表 典型相關式 特徵值 典型相關係數平方 Approx F Sig. 1 0.340 0.254 19.486 0.000 2 0.001 0.269 0.604
16.9 典型相關分析應注意事項 1.典型相關會反映出變數間線性組合的變異量(variance) 2.典型方程式中所得的典型權重相當不穩定。 16.9 典型相關分析應注意事項 典型相關分析之限制因素 1.典型相關會反映出變數間線性組合的變異量(variance) 2.典型方程式中所得的典型權重相當不穩定。 3.典型權重是在兩組線性組合達到最大相關下所產生 之權重解,而非在解釋變異量最大之下所產生之權 重解。
16.9 典型相關分析應注意事項 4.解釋典型變量有困難,因為典型相關分析只是在求出典型變量之間的相關性,但是要如何去解釋個別預測變數與個別準則變數之相關目前並沒有很好的解釋方法。 5.由於並沒有一套很精確的統計方法去解釋典型相關分析,因此很難去解釋預測變數和準則變數之間的關係,只能用負荷量(loading)或交叉負荷量(cross-loadings)去解釋它們。