因素分析 Factor Analysis: From Exploratory to Confirmatory EFA to CFA Structural Equation Modeling 因素分析 Factor Analysis: From Exploratory to Confirmatory EFA to CFA
Part I: Basic Concepts of factor analysis
因素分析:目的與功能 Using statistical methods to identify the basic underlying variables (factors) that account for the correlation among test scores To explain why two tests are correlated (structural exploration) To explain how the entire scale is organization (factorial validity of scale) 功能 進行效度的驗證。探討潛在特質的因素結構與存在的形式,建立量表的因素效度(factorial validity)。 簡化測量的內容。減少受測者作答時間,減少疲勞效果與填答抗拒。 用來協助測驗編製,進行項目分析,檢驗試題的優劣好壞。同時可以針對每一個題目的獨特性進行精密的測量,比較對的重要性。
因素與共變結構 構念或「因素」(factor)隱含在許多現實可觀察的事物背後,雖然難以直接測量,但是可以從複雜的外在現象中計算、估計、或抽取得到。 其數學原理是共變(covariance)的抽取。而受到同一個構念影響的測量分數,共同相關的部份,就是構念所在的部份。構念則是由被稱為「因素」的共同相關的部份的得分來表示。 即
因素分析運算的過程 如果自尊以Y來表示,其他十個題目分數以X1到X10表 示,自尊的得分,可以從下列數學模性預測得到: Y =b1X1 + b2X2 + b3X 3 + …… + b10X10 + U 此一方程式與迴歸方程式的不同: 1.X1到X10十個變項並非相互獨立的自變項,而是具有高度相似性、高度相關、具有共同特質的十個自變項。 2.他們背後的共同特質Y,是「理論」上存在,由十個自變項當中抽離出來,相對的,迴歸分析中的Y,指的是另一個具體的、與自變項無本質上相似之處的依變項。
探索性與驗證性因素分析 Two major types of factor analysis Exploratory factor analysis (EFA)探索性因素分析:the factors that provide the best statistical fit to the data are derived Confirmatory factor analysis (CFA)驗證性因素分析:the factors are defined in terms of the specific hypothesis that is being tested by the experimenter
因素分析的條件 因素分析的變項都必須是連續變項,符合線性關係的假設。順序與類別變項不得使用因素分析簡化結構。 抽樣的過程必須具有隨機性,並具有一定的規模。如果研究的母群據有相當的同質性(如學生樣本),變項數目不多,樣本數可以介於100到200之間。 變數之間需具有一定程度的相關,一群相關太高或太低的變項,皆會造成執行因素分析的困難。太低的相關難以抽取一組穩定的因素,不適於進行因素分析。相關太高的變項,多重共線性(multicollinearity)明顯,有區辨效度不足的疑慮,所獲得的因素結構價值不高。可透過球形檢定與KMO檢定來檢驗上述問題。
因素分析的適切性檢驗 因素分析的基礎是變項之間的相關。因此應先計算數個題目的兩兩相關,詳細檢視該矩陣所代表的意義。 檢驗相關係數是否適當的方法: 1.Bartlett’s test of sphericity(球形考驗): 一般相關矩陣中的相關係數必須顯著的高於0。某一群題目兩兩之間有高相關,顯示可能存有一個因素,多個群落代表多個因素。 如果相關係數都偏低且接近,則因素的抽取越不容易,Bartlett’s test of sphericity(球形考驗)即可用來檢驗是否這些相關係數不同且大於0,顯著的球形考驗表示相關係數足以作為因素分析抽取因素之用。
因素分析的適切性檢驗 2.淨相關矩陣: 3.檢查共同性指數(communality): 變項之間是否具有高度關聯,可以從偏低的淨相關(partial correlation)來判斷。 反映像矩陣,顯示淨相關的大小,矩陣中若有多數係數偏高,則應放棄使用因素分析。 3.檢查共同性指數(communality): 某一變項的變異量被共同因素解釋的比例,其計算方式為在一變項上各因素負荷量平方值的總和。 變項的共同性愈高,因素分析的結果就愈理想。
因素的抽取(factor extraction) 主成份分析法(principle component analysis): 以線性方程式將所有變項加以合併,計算所有變項共同解釋的變異量,該線性組合稱為主要成份。 第一次線性組合建立後,計算出的第一個主成份估計,可以解釋全體變異量的最大一部份。其所解釋的變異量即屬第一個主成份所有,分離後所剩餘的變異量,經第二個的方程式的線性合併,再抽離出第二個主成份,依此類推,所剩餘的共同變異越來越小,每一成份的解釋量依次遞減,直到無法抽取共同變異量為止。 主成份分析法適用狀況於單純為簡化大量變項為較少數的成份時,以及作為因素分析的預備工作。
主軸因素法(principal axis factors) 分析變項間的共同變異量而非全體變異量。 將相關矩陣中的對角線,由原來的1.0改用共同性(communalities)來取代。 目的在抽出一系列互相獨立的因素。第一個因素解釋最多的原來變項間共同變異量;第二個因素解釋除去第一個因素解釋後,剩餘共同變異量的最大變異;其餘因素依序解釋剩餘的變異量中最大部分。直到所有的共同變異被分割完畢為止。 最小平方法(least squares method) 利用最小差距原理,針對特定個數的因素,計算出一個因素型態矩陣(factor pattern matrix)後,使原始相關矩陣與新的因素負荷量矩陣係數相減平方後數值最小,稱為未加權最小平方法(unweighted least squares method),表示所抽離的因素與原始相關模式最接近。 最大概率法(maximum-likelihood method) 相關係數經變項的殘差(uniqueness)加權後,利用參數估計(paratemer estimation)原理,估計出最可能出現的相關矩陣的方法。
因素個數的決定 特徵值(eigenva1ue)判斷法 陡坡檢定(scree test)法 特徵值代某一因素可解釋的總變異量,特徵值越大,代表該因素的解釋力越強。 一般特徵值以1為標準。低於1的特徵值,代表該因素的變異數少於單一一個變項的變異數1,無法以因素的形式存在。 陡坡檢定(scree test)法 其方法是將每一個因素,依其特徵值排列,特徵值逐漸 遞減,當因素的特徵值逐漸接近,沒有變化之時,代表 特殊的因素已無法被抽離出來,當特徵值急遽增加之時, 即代表有重要因素出現,也就是特徵值曲線變陡之時, 即是決定因素個數之時。
因素轉軸(factor rotation) 轉軸的目的:將所抽取的因素,經過數學轉換,使因素或成份具有清楚的區隔,能夠反映出特定的意義,稱為轉軸。目的是在釐清因素與因素之間的關係,以確立因素間最簡單的結構。 轉軸的進行:係使用三角函數的概念,將因素之間的相對關係,以轉軸矩陣(transformation matrix)所計算出的因素負荷矩陣的參數,將原來的共變結構所抽離出來的項目係數進行數學轉換,形成新的轉軸後因素負荷矩陣(經正交轉軸)或結構矩陣(經斜交轉軸),使結果更易解釋。進一步的協助研究者進行因素的命名。
因素轉軸(rotation) 直交轉軸(orthogonal rotation) 斜交轉軸(oblique rotation) 指轉軸過程當中,因素之間的軸線夾角為90度,即因素之間的相關設定為0。如最大變異法(varimax)、四方最大法 (quartimax)、均等變異法(equimax rotation)。 斜交轉軸(oblique rotation) 容許因素與因素之間,具有一定的共變,在轉軸的過程當中,同時對於因素的關連情形進行估計。例如最小斜交法(oblimin roation)、最大斜交法(oblimax rotation)、四方最小法(quartimin)等。
直交與斜交轉軸的優點 直交轉軸的優點:以直交轉軸轉換得到的新參數,是基於因素間是相互獨立的前提,在數學原理上,是將所有的變項在同一個因素或成份的負荷量平方的變異量達到最大,如此最能夠達到簡單因素結構的目的,且對於因素結構的解釋較為容易,概念較為清晰。 斜交轉軸的優點:直交轉軸將因素之間進行最大的區隔,往往會扭曲了潛在特質在現實生活中的真實關係,容易造成偏誤,因此一般進行實徵研究的驗證時,除非研究者有其特定的理論做為支持,或有強而有力的實證證據,否則為了精確的估計變項與因素關係,使用斜交轉軸是較貼近真實的一種作法。
Part II:範例與思考 從自尊的測量開始
Rosenberg(1965) 自尊量表(self-esteem)
Descriptive statistics and correlation matrix
Results of factor analysis
Hints? Two factors were identified What are they? Summation of the items of factors Computation of factor scores .47 Orthogonal rotation .00 Oblique rotation .36 Anything more? .61
Composite scores for factor1 and factor2
Factor scores by orthogonal rotation
Factor scores by oblique rotation
Results from CFA .61