第十二章 典型相關 12-1 典型相關 12-2 典型相關分析的基本假設 12-3 典型涵數的估計 12-4 典型涵數的選擇 12-5 重疊指數(Redundancy index) 12-6 解釋典型變量 12-7 驗證(validation)結果 12-8 典型相關與其他多變量計數的比較和應用 12-9 典型相關的範例
12-1 典型相關 典型相關 (Canonical Correlation),典型相關適用於依變數為計量或非計量,自變數也是計量或非計量,如下圖: Y1+Y2+Y3+…+Yj = X1+X2+X3+….+Xk (計量,非計量) (計量,非計量) 典型相關的目的,可以有下列幾項: 決定二組變數的關係強度 計算出依變數和自變數在線性關係最大化下的權重Weight, 另 外的線性函數則會最大化,剩餘的相關,並且和前面的線性組 合是相互獨立 用來解釋依變數和自變數關係存在的本質
12-2 典型相關分析的基本假設 在作典型相關分析之前,必須檢定資料是符合下列4種基本的統計假設 (statistical assumption): 1. 線性關係, 兩組變數的相關係數是基於線性關係, 若不是線性關係, 則變數需要轉換, 以達成線性關係 2. 常態性(normality):雖然, 典型相關並無最嚴格要求常態性, 但常 態性會使分配標準化以允許變數問擁有較高的相關, 因此, 符合常 態性是較好的作法, 由多變量的常態難以判讀, 所以大多都是針對 單一變量要求是常態性。 3. 變異數相等(Homoscedasticity) :若不相等, 會降低變數間的相關, 因此, 需要符合變異數相等。 4. 複共線性問題:若是變數間有複共性問題, 則無法說明任何一個變 數的影響, 導致解釋的結果並不可靠, 因此, 需要變數無複共線性 問題。
12-3 典型函數的估計 典型相關分析會得到多少個典型函數呢? 這是由依變數和自變數中較少的個數來決定, 例如:依變數有3個變數, 自變數有6個變數, 經由典型相關分析後, 會得到3個典型函數。
12-4 典型函數的選擇 典型函數的選擇主要是用在挑選那些函數來解釋才有意義, 在一般情形下, 我們都會排選典型相關係數達 a = 0.1 或 0.05水準才會加以解釋, Hair et. al. (1998) 建議不要使用單一準則 (統計的顯著性), 而是使用統計顯著的程度, 典型相關係數的大小, 和重疊指數等3個準則, 分別簡介如下: 統計顯著的程度:典型相關統計顯著的程度最少須達a = 0.1或0.05 水準 典型相關係數的大小:没有一定大小的典型相關係數代 表需要去解釋, 而是能理解研究問題被解釋了多少, 特別 是變異被解釋了多少 重疊指數:是依變數被自變數解釋部份,介紹如後
12-5 重疊指數(Redundancy index) 共享變異可以由典型相係數的平方(特徵值或典型根)所代表, 但典型相關係數的來源是共享變量(shared variance)並非變異萃取(variance extracted), 在解釋的時候會有偏見, 於是, 就有人提出重疊指數(Redundancy index), 如下: Redundancy index = Average loading Squared*Canonical R² 我們會先計算每個典型負載 ( Canonical loading) 的平方, 再將典型負載的平方加總後平均起來, 取得Average loading Squared, 最後再乘以Canonical R², 以得到Redundancy index 的值, 這個值代表依變數被自變數解釋了多少, 類似於複迴歸所談的R² 統計值。
12-6 解釋典型變量 解釋典型變量就是檢驗典型函數在典型相關中, 每個原始多變數的相對重要性, 這個檢験的方法有典型權重(Canonical Weight), 典型負荷量(Canonical loading), 典型交叉負荷量(Canonical cross-loading) 這三種, 我們分別簡介如下: 典型權重:典型權重代表該變數的重要性, 權重較大代表變數對典型變量的 影響較大, 正負號代表著關係的正負方向, 由不同樣本的典型權變動性較大, 會形成這個指標的不穩定, 所以建議較少用 典型負荷量:典型負荷量是計算原始依變數中的觀察變數和依變數典型變 量的相關性, 也計算原始自變數中觀察變數和自變數典型變量的相關性, 就 像是因素負荷量(factor loading), 愈大的相關係數代表愈重要, 由於不同樣 本仍有相當的變動性, 所以仍有指標不穩定的情形, 但是, 比典型權重好。 典型交叉負荷量:是穩定的指標, 建議採用 典型交叉負荷量是計算原始依變數中的觀察變數和自變數典型變量的相關 性, 也計算原始自變數中的觀察變數和依變數典型變量的相關性, 由於, 會交 叉運算依變數和自變數, 所計算出來的結困稱之為典型交叉負荷量。
12-7 驗證(validation)結果 我們擔心的是抽樣無法推論到母體, 若是樣本較少, 至少要作敏感度分析, 也就是每次移除一個變數後, 測試其典型權重和典型負荷是否一樣的穩定。若是樣本夠多, 則分成2個樣本進行分析, 最比較2個樣本的典型權重, 典型負荷量等, 若是呈現不一玫的情形, 則無法從樣本推論到母體, 驗證結果是相當要的一個步驟, 使用時, 需要特別謹慎, 小心, 以避免錯誤地仗用典型相關和解釋上錯誤。
12-8 典型相關與其他多變量計數的比較和應用 Canonical Correlation (典型相關)和 Regression(迴歸)的不同:典型相關分析可以視為複迴歸的延伸使用,複迴歸的依變數(Y)只有一個,自變數(X) 有多個,典型相關則是可以處理多個依變數和多個自變數。
12-9 典型相關的範例 在實務上SPSS 並沒有提供典型相關圖形化的操作,而是需要直接輸入命令語法,早期會使用MANOVA命令語法,後來提供Cancorr 命令語法 (解釋較完整),我們分別實作如後。: 範例: 我們想了解 介面複雜度(C14)、 新技術(C15)、 專業訓練(C16)、 系統功能(C17)、 訓練課程(C19) 分成兩組 Set1 = c14 c15 c16,Set2 = c17 c19 透過典型相關分析以求得一組的權重(Weight)以最大化依變數和自變數的相關。
12-9-1 典型相關使用MANOVA命令語法 SPSS典型相關MANOVA命令語法實務操作如下: 1. 開啟範例 Canonical.SAV 2. 按 File New Syntax 3. 輸入語法 MANOVA c14 To c16 WITH c17 c19 /DISCRIM RAW STAN CORR ALPHA(0.1) /PRINT SIGNIF(EIGN DIMENR ) /DESIGN. 4. 選取語法 5. 按Run, 出現輸出報表
重要的報表分析: Eigenvalues and Canonical Correlations Root No. Eigenvalue Pct. Cum. Pct. Canon Cor. Sq. Cor 1 1.757 97.899 97.899 .798 .637 2 .038 2.101 100.000 .191 .036 第一組Eigenvalues 的值 1.757 和典型相關係數 0.798,代表兩組變數有高度相關。 第二組 Eigenvalues 的值0.038 和典型相關係數 0.191,比第一組的值小很多。 我們畫出關係圖如下:
Raw canonical coefficients for DEPENDENT variables Function No. Variable 1 2 c14 -.228 .928 c15 -.398 .339 c16 -.571 -1.091 依變數原始典型相關系數,一般很少用。
Standardized canonical coefficients for DEPENDENT variables Function No. Variable 1 2 c14 -.216 .880 c15 -.400 .341 c16 -.557 -1.064 依變數標準化典型相關系數, 第一組的值 c14 =-0.216 c15= -0.400 c16=-0.557 。 第二組的值 c14 =0.880 c15= 0.341 c16=-1.064 。
我們畫出關係圖如下:
Raw canonical coefficients for COVARIATES Function No. COVARIATE 1 2 c17 -.809 -.951 c19 -.353 1.331 變數原始典型相關系數,一般很少用。 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Standardized canonical coefficients for COVARIATES CAN. VAR. COVARIATE 1 2 c17 -.789 -.927 c19 -.312 1.176
12-9-2 典型相關使用Cancorr 命令語法 範例:我們想了解 介面複雜度(C14)、 新技術(C15)、 專業訓練(C16)、 系統功能(C17)、 訓練課程(C19) 分成兩組 Set1 = c14 c15 c16,Set2 = c17 c19 透過典型相關分析以求得一組的權重(Weight)以最大化依變數和自變數的相關。 SPSS典型相關Cancorr 命令語法實務操作如下: 1. 開啟範例 Canonical.SAV, 按 File New Syntax 2. 輸入語法 Include file 'C:\SPSS\Canonical correlation.sps' cancorr Set1 = c14 c15 c16 /Set2 = c17 c19. 注意:Include file 是用來引入 Canonical correlation.sps 檔案,此檔案為MACRO命令,一般是在安裝SPSS 的根目錄下,請自行確認檔案路徑後,再引入 Canonical correlation.sps 檔案。 再選取語法 3. 按Run, 出現輸出報表
報表結果分析如下: Canonical Correlations 1 .798 2 .191 典型相關係數 典型相關會先求最大的典型相關係數, 並且會依序排順序, 愈小的相關係數愈往後排序, 第一組典型相關係數 0.798,代表兩組變數有高度相關。第二組典型相關係數 0.191,比第一組的值小很多。
Test that remaining correlations are zero: Wilk's Chi-SQ DF Sig. 1 .350 149.261 6.000 .000 2 .964 5.256 2.000 .072 典型相關分析的檢定 典型相關分的檢定結果是第一組的典型相關係數檢定的P值 0.000<0.05達顯著水準, 第二個的典型相關係數檢定的P值0.072>0.05, 未達顯著水準
Standardized Canonical Coefficients for Set-1 1 2 c14 -.216 .880 c15 -.400 .341 c16 -.557 -1.064 第一組標準化典型係數 標準化典型係數相當於迴歸的係數, 代表變數的影響力大小, 我們可以畫出圖示代表示如下:
Raw Canonical Coefficients for Set-1 1 2 c14 -.228 .928 c15 -.398 .339 c16 -.571 -1.091 第一組原始典型係數 原始典型係數是將原始變數轉換成典型變量的權數, 需要經由標準化後, 才能一起比較和使用 Standardized Canonical Coefficients for Set-2 c17 -.789 -.927 c19 -.312 1.176
第二組標準化典型係數 標準化典型係數相當於迴歸的係數, 代表變數的影響力大小, 我們可以畫出圖示代表如下: Raw Canonical Coefficients for Set-2 1 2 c17 -.809 -.951 c19 -.353 1.331 第二組原始典型係數 原始典型係數是將原始變數轉換成典型變量的權數, 需要經由標準化後, 才能一起比較和使用
Canonical Loadings for Set-1 1 2 c14 -.755 .530 c15 -.846 .284 c16 -.895 -.410 第一組典型負荷係數 是第一組變數與典型變量的簡單相關係數 Cross Loadings for Set-1 c14 -.603 .101 c15 -.675 .054 c16 -.715 -.078 第一組交叉負荷係數, 是典型變量與另一組的簡單相關係數
Canonical Loadings for Set-2 1 2 c17 -.967 -.257 c19 -.762 .648 第二組典型負荷係數 是第二組變數與典型變量的簡單相關係數 Cross Loadings for Set-2 1 2 c17 -.772 -.049 c19 -.608 .124 第二組交叉負荷係數, 是典型變量與另一組的簡單相關係數
Redundancy Analysis: (重複分析) 用來解釋因果關係時的使用, 特別是自變數對於應變數的解釋能力 Proportion of Variance of Set-1 Explained by Its Own Can. Var. Prop Var CV1-1 .696 CV1-2 .177 第一組的組內解釋比率 Proportion of Variance of Set-1 Explained by Opposite Can.Var. CV2-1 .443 CV2-2 .006 第一組變數由第二組變數所解釋的比率
Proportion of Variance of Set-2 Explained by Its Own Can. Var. Prop Var CV2-1 .757 CV2-2 .243 第二組的組內解釋比率 Proportion of Variance of Set-2 Explained by Opposite Can. Var. CV1-1 .482 CV1-2 .009 第二組變數由第一組變數所解釋的比率
我們畫出整體關係圖如下: 結果分析注意事項: 一般在論文中, 只需要列出典型相關係數, “Wiks “ Lambda值與P值(Sig值) 即可以進行討論和說明, 特別要注意的是, 若是有因果關係假設時, 則會特別集中討論單方向的影響, 若是没有因果關係假設時, 則需要進行雙向影響的討論和說明