SEM演講—一般因徑模式 主講人 余泰魁
何謂SEM 結構方程式模型分析法(Structural Equation Model; SEM; 以下簡稱為SEM)是一種以迴歸為基礎(Regression-based technique)的多變量技術,並結合徑路分析,它屬於驗證性實證研究的資料分析法,能同時處理多組變項間的關係,其目的在探究變數間的因徑關係以驗證理論,故又可稱為因果模式分析技術(Causal Modeling Technique)或可稱之為因徑模式分析技術。因此,在使用驗證性研究方法時,研究者所提的研究模式必須具有理論基礎,由理論來引導。
SEM主要目的 1.可以解釋一系列具有相互依存變數或變項之間的關係 2.這些變數(Variable)可區分為外生的(Independence, Exogenous)及內生的(Dependence, Endogenous),這些變數均為可觀察的 3.一些具有相同性質的變數,若在理論基礎上能形成一個構面(Construct),則會產生一個或數個潛伏變量(Latent variate):此部份即因素分析(Factor Analysis)的概念 4.依據理論或相關研究,這些潛伏變量之間存在著某些因徑關係,SEM即是以線性(Linear)數學模式來表示這些關係:此部份即迴歸(Regression)的概念 透過上述3、4建立完整的模式,再利用2所觀察到的變數,來驗證模式的配適性,以解釋其因徑關係,即是SEM的目的 必須先有理論,才導出SEM MODEL,若只用data fit出模式,然後就解釋模式是明顯不對的作法。(最為人所垢病)
SEM其它應用 SEM其它應用: (1) 因素分析若從不同母體抽樣,是否可導出相同的因素模式,可透過多群本樣本資料的分析來達成 (1) 因素分析若從不同母體抽樣,是否可導出相同的因素模式,可透過多群本樣本資料的分析來達成 (2) 多變量複迴歸。IV與DV間、DV與DV間的因徑關係 (3) 迴歸與因素分析皆無法處理共線性,但SEM可以。
SEM基本流程 發展理論模式 建構因徑關係圖 決定因徑關係的結構與測量模式 檢視因徑關係與資料共變數矩陣是否收歛 評估模式的適合度 解釋模式 修正模式 結束
SEM資料分析流程1
SEM資料分析流程2
發展理論模式 理論的合理性 理論的適用性 因徑關係的正確性 變項衡量的一致性
行為理論-理性行動理論(TRA) Ajzen & Fishbein, 1980
行為理論-科技接受模型(TAM) Davis, Bagozzi, & Warshaw, 1989
科技接受模型二代(TAM) Venkatesh, V., & F.D. Davis, 2000.
行為理論-整體科技接受第三代 Venkatesh, Morris, Davis & Davis, 2003
簡化的TAM
複雜化的TAM3
建構因徑關係圖 構念間的徑路關係最好要有文獻支持 研究者對理論的熟悉度 理論被應用的廣泛程度 決定是否為遞迴模式與非遞迴模式 決定潛在內生變項與潛在外生變項 研究文獻與理論的支持 合理的創新是被允許
決定因徑關係的結構與測量模式 研究者決定潛在內生變項與潛在外生變項後,針對結構與測量模式應以簡圖呈現 測量模式與結構模式二者並重 測量模式—檢視變項的因素負荷量、測量問項的信效度 結構模式—檢視變項間的徑路關係 潛在變項被單一測量變數衡量 原則將其估計值設定為1,並不開放予以LISREL自行估計 應儘量減少此一現象
檢視因徑關係與資料共變數矩陣是否收歛 資料的投入 模式的估計 程式的選擇 相關矩陣 共變異數矩陣—強烈建議 如參數估計方法(Maximum Likelihood, ML;Generalized Least Squares, GLS;Weighted Least Squares, WLS)的選擇—建議以ML 樣本數—200左右,建議至少為250~350間 Chi-square值 程式的選擇 AMOS LISREL EQS
資料的投入 Covariance Matrix之時機:檢定理論,比較不同的母體或樣本;或解釋待驗證的理論,主要衡量研究變項的總變異,較建議採用此法投入資料 Correlation Matrix之時機:直接比較模式中的係數;或瞭解研究變項之間的關係,使用較廣 。 Raw Data之處理:Prelis 可協助進行名目尺度轉換為相關矩陣
模式鑑定度 待估計之參數個數為t,方程式個數為s=(p+q)(p+q+1)/2,p為測量變數y的個數,q為測量變數x的個數 若t=s(just identified):對每一個參數恰有一個估計值。 df=0,沒有多餘的資訊來檢定模式 若t<s(over identified):一個參數有數個估計值。 df>0,有一組估計值能用來檢定模式 若t>s(unidentified):df<0,必須作下列處理,才能進行Lisrel
評估模式的適合度 自由度—樣本數須大於欲估計參數個數,較易找到適配模式 針對異常估計值(誤差變異數為負、標準化係數大於1、估計係數的標準差很大),予以調整 測量模式評估指標 組成信度 變異抽取量 結構模式評估指標 Chi-square值 Chi-squares/自由度 GFI AGFI CFI NNFI
基本配適度指標的標準 Overall model fit Incremental fit:與Null model進行比較 Parsimonious fit:與不同測量變數個數的模型進行比較 SMC 測量變數對潛在變項的評估 Q-Q plot
Overall model fit a. Chi-square:愈小愈好(或看p-value,愈大愈好),或者不顯著,但因chi-square容易受到樣本數大小的影響,當樣本數越大時,越不容易接受Ho。 b. GFI:愈接近1愈好,一般文獻臨界值0.90 但Baumgartner & Homburg(1996)研究1977-1994年間行銷與消費者領域註[1]採SEM進行資料分析的184篇文獻中,GFI低於建議值的文獻比率分別為24%,故可放寬至0.8 註[1] 作者研究文獻資料來源為Journal of Marketing, Journal of Marketing Research, International Journal of Research in Marketing, Journal of Consumer Research等四種期刊登刊之文章。 c. RMSEA:愈接近0愈好,臨界值0.08,較不受到樣本大小的影響,評鑑適配度時,有產生較穩定的現象
Incremental fit NFI:愈接近1愈好,臨界值0.90(Bentler, 1990,1992),較不受到控制自由度與樣本大小的影響。 NNFI:愈接近1愈好,臨界值0.90 (Bentler, 1990,1992) ,可降低受樣本數大小的影響
Parsimonious fit Chi-square與其自由度比值 :臨界水準介於2.0至3.0之間(Carmines & McIver, 1981; Chin & Todd, 1995) ,不要高於5,低於2.0時,須注意是否存在有over-fitting情形 AGFI:主要利用研究模式的自由度與變項的個數進行調整,愈接近1愈好,臨界值0.9 但Baumgartner & Homburg(1996)研究1977-1994年間行銷與消費者領域註[2]採SEM進行資料分析的184篇文獻中,AGFI低於建議值的文獻比率分別為48%,故可放寬至0.8 註[2] 作者研究文獻資料來源為Journal of Marketing, Journal of Marketing Research, International Journal of Research in Marketing, Journal of Consumer Research等四種期刊登刊之文章。 CFI:愈接近1愈好,臨界值0.9(Bentler, 1990,1992,1995),適用於評估小樣本的資料,一般樣本數未達200時,建議呈現此一數值
SMC (Squared Multiple Correlation Coefficients) 可用來衡量measurement model之配適度(每個變數一個解釋變異情形):通常為測量變數的負荷量平方值,一般而言,最好能高於0.5,越接近1愈好 Taylor與Todd(1995)建議在測量模式時,個別項目的SMC值大於0.4即可 同時可用來衡量structure model之潛在變項配適度:可視為潛在因變項的解釋變異程度(R2),愈接近1愈好
解釋模式 模式結果與資料模式是否相符 模式中測量變數與潛在變項的顯著性 模式中的標準化係數—係數愈高表示在因徑關係的重要性愈高 比較對立模式與遞迴模式
變項與變數的數值資料 (1) 未標準化(Non-standardized):所有的可觀察變數及潛在變量均未標準化,因此其結果與最初變數的衡量單位有關。此方法通常作為初始模型用估計。 (2) 標準化( Standardized):僅將潛伏變項標準化,而可觀察變數未標準化。可用來比較在同一樣本下,同一個應變數受到不同自變數影響的貢獻關係,但無法對不同樣本或母體進行交叉比較 (3) 完全標準化(Completely standardized):將所有的可觀察變數及潛伏變項均標準化,可進行所有的比較。
修正模式 針對異常估計值(誤差變數為負、標準化係數大於1、估計係數的標準差很大),予以調整 透過檢查SR(Standardized Residuals)及 MI(Modification Indices)決定是否需修正 刪除或增加參數
驗證研究模式的不一致性 研究模式在檢定過程,會所產生四種不一致性,分別為 (1)近似的不一致性 (2)抽樣不一致性 (3)估計不一致性 (4)整體不一致性 (MacCallum, Roznowski, Mar, & Reith, 1994)。
不一致性釋疑 (1)近似的不一致性:係指母體共變數矩陣與研究模式假設的 實際參數估計間產生不一致性,如參數估計方法(Maximum Likelihood, ML或Generalized Least Squares, GLS)的選擇 所產生的差異 (2)抽樣不一致性:因調查研究大都是以抽樣樣本來替代母體, 故母體與母體參數大都屬於未知,主要為樣本共變數矩陣與 樣本參數估計間產生不一致 (3)估計不一致性:係指母體參數估計值與樣本參數估計值間的 差異 (4)整體不一致性 :母體共變數矩陣與樣本參數估計的共變數矩 陣所產生不一致性
交叉驗證 以SEM進行交叉驗證不僅可以對測量模式驗證,並可將整體結構模式予以驗證,採用交叉驗證研究的方式有二: (1)將研究過程與問項重新複製一次,以檢查二者之間是否有無差異,但常受時間、金錢、資源的限制; (2)研究樣本如果夠大,則將現有調查樣本予以分割,以二個較少樣本來進行資料分析。 受限於第一種情形下僅能以單一樣本分析時,Browne & Cudeck(1989)建議研究者可採ECVI值,其ECVI值愈小顯示母體愈穩定;研究者若為採第二種方法,Cudeck & Browne(1983)建議可用CVI值,CVI值係由基準樣本(calibration sample)與校準樣本(validation sample)資料共變數矩陣所組成。
投稿SEM文章內容的涵蓋1 (source:Shook, Ketchen, Jr., Hult, & Kacmar, 2004) 樣本的議題 基本敘述統計量 投入樣本數 樣本的分布 樣本統計力 測量的議題 測量的信度:個別信度與組成信度 測量的區別效度 測量的收歛效度
投稿SEM文章內容的涵蓋2 (source:Shook, Ketchen, Jr., Hult, & Kacmar, 2004) 研究複製的議題 投入矩陣 使用的套裝軟體名稱與版本 參數估計的起始值 計算功能的使用 分析異常值的資料 恆等模式的議題 潛在存在模式與模式公認的限制是否交代 特定化的議題 交叉效度的改變 特定模式與假設模式間的關係
LISREL syntax 注意事項 LISREL8.30版本檔案名稱可用中文命名,而在LISREL8.50以上版本,檔案名稱不可全部使用中文命名方式,開頭以英文後中文即可 欄位的寬度最好不得超過127欄,若資料輸入超過時,須予以斷行處理 試用版軟體時,變數輸入不得超過15個 二群組的資料,在LISREL8.30版本無法使用PD繪製徑路關係圖 在LISREL8.30版本時,二群組以上的資料無法形成正定矩陣,會產生錯誤訊息 在LISREL8.50版本以上有增加Bootstrap的功能,可適用於估計小樣本的資料,但使用時較為複雜
簡報結束 問題與討論
測量理論相關重要文獻(資料來源:Ponder & Lueg, 2003)
SEM重要議題與相關文獻(資料來源:Ponder & Lueg, 2003)