Download presentation
Presentation is loading. Please wait.
Published byViviane Landry Modified 6年之前
1
楊志強 博士 cyang@tea.ntue.edu.tw http://tea.ntue.edu.tw/~cyang
多變量分析在測驗暨量表編製之應用 楊志強 博士
2
基本概念 從相關分析談起
3
相關分析(Correlational Analysis)
X1 X2 相關分析(Correlational Analysis)
4
常用在成就測驗的項目分析,以進行各子題與總分之間的一致性分析
r u X 點二系列相關( Point-biserial Correlation Coefficient )
5
簡單線性迴歸(Simple Linear Regression)
y x1 β1 e x + = 1 b 簡單線性迴歸(Simple Linear Regression)
6
多元線性迴歸(Multiple Linear Regression)
y x1 e x2 β1 β2 多元線性迴歸(Multiple Linear Regression)
7
邏輯氏迴歸(Logistic Regression)
x u 邏輯氏迴歸(Logistic Regression)
8
邏輯氏迴歸(Logistic Regression)
x1 u x2 邏輯氏迴歸(Logistic Regression)
9
x1 y1 y2 e1 e2 路徑分析(Path Analysis)
10
x1 y1 y2 e1 e2 x2 路徑分析(Path Analysis)
11
階層線性模式(Hierarchical Linear Model, HLM)
x1 y e between within 階層線性模式(Hierarchical Linear Model, HLM)
12
驗證性因素分析(Confirmatory Factor Analysis)
e1 e2 e3 f1 y4 y6 y5 e4 e5 e6 f2 驗證性因素分析(Confirmatory Factor Analysis)
13
二階驗證性因素分析(2nd order Confirmatory Factor Analysis)
14
結構方程模式(Structural Equation Model, SEM)的general case
x1 y1 f1 e2 d2 x2 f2 y2 d3 x3 y3 e3 zeta 結構方程模式(Structural Equation Model, SEM)的general case 潛在變項路徑分析(Path Analysis with Latent Variables, PA-LV)
15
Multiple indicators multiple causes, MIMIC Model
f y1 y2 y3 e1 e2 e3 zeta x2 x1 Multiple indicators multiple causes, MIMIC Model
16
潛在類別分析(Latent Class Analysis, LCA) Latent Profile Analysis, LPA
Latent Trait Analysis, LTA
17
試題反應理論(Item Response Theory, IRT)
u1 u3 u2 e1 e2 e3 f 試題反應理論(Item Response Theory, IRT)
18
潛在成長曲線模式(Latent Growth Curve Model, LGC)
y1 y3 y2 e1 e2 e3 intercept slope 潛在成長曲線模式(Latent Growth Curve Model, LGC)
19
混和潛在成長曲線模式(Mixture Latent Growth Curve Model, MLGC)
y1 y3 y2 e1 e2 e3 intercept slope C 混和潛在成長曲線模式(Mixture Latent Growth Curve Model, MLGC)
20
多群組分析(Multiple Group Analysis)
x1 x3 x2 d1 d2 d3 f1 f2 y1 y2 y3 e1 e2 e3 zeta group group為干擾/情境變項(moderating variable) 多群組分析(Multiple Group Analysis)
21
多階層結構方程模式(Multilevel Structural Equation Model, Multilevel SEM)
x1 x3 x2 d1 d2 d3 f1 f2 y1 y2 y3 e1 e2 e3 zeta within between 多階層結構方程模式(Multilevel Structural Equation Model, Multilevel SEM)
22
基本概念 再談探索性因素分析 Exploratory Factor Analysis (EFA)
23
如何分類?可分多少類? 機車 腳踏車 三輪車 卡車 轎車 馬車 敞篷車 折疊車 挖土機 耕耘機 遊覽車 吉普車 牛車 跑車 火車 如何命名?
24
模式架構 x1=μ1+l11f1++l12f2+…+l1qfq+ε1 x2=μ2+l21f1++l22f2+…+l2qfq+ε2 …
xp=μp+lp1f1++lp2f2+…+lpqfq+εp x為觀察變項;f為共同因素 l為因素負荷量;ε為獨特因素(誤差項)
25
基本假定 獨特因素互相獨立且為多變項常態分配。 共同因素間互相獨立且變異數為1。 共同因素與獨特因素互相獨立。 X變項間有線性關係。
26
研究者可依某些萃取準則,決定萃取因素數目
x1 e1 x2 e2 x3 e3 f2 f1 f3 探索性因素分析(Exploratory Factor Analysis, EFA) 研究者可依某些萃取準則,決定萃取因素數目
27
研究者依理論,指定因素結構,獨特因素間亦可指定相關
x1 x3 x2 e1 e2 e3 f1 驗證性因素分析(Confirmatory Factor Analysis, CFA) 研究者依理論,指定因素結構,獨特因素間亦可指定相關
28
所需樣本大小 樣本大小不能少於50個,應該要超過100個。 至少要為x觀察變項數目的5倍量或10倍量。
Hair, J. F., Anderson, R. F., Tatham, R. L. & Black, W. C. (1998). Multivariate data analysis 5th ed. New Jersey: Prentice Hall Inc. 樣本大小亦取決於負荷量大小
29
常見萃取方法(Extraction Method)
主要成份法(Principal components ) 主要因素分析法(Principal factor analysis ) 最大概似法(Maximum likelihood, ML) x觀察變項要為連續變項,若為二元資料(如:成就測驗)會有錯誤估計的可能
30
常見萃取標準(Extraction Criteria )
特徵值(eigenvalues ) 先前文獻 累積變異量 陡坡圖
32
因素旋轉 正交旋轉(Orthogonal rotation methods) 斜交選轉(Oblique rotation methods )
Quartimax Varimax Equimax 斜交選轉(Oblique rotation methods ) Oblimin Promax Orthoblique
33
正交旋轉
34
斜交旋轉
35
因素負荷量的選取 樣本大小 0.30 350 0.35 250 0.40 200 0.45 150 0.50 120 0.55 100 0.60 85 0.65 70 0.70 60 0.75 50
36
結構方程模式 驗證性因素分析 Confirmatory Factor Analysis (CFA)
37
基本概念
38
結構方程模式(Structural Equation Modeling, SEM)
潛在變數模式(Latent Variable Models, LVM) 線性結構關係模式(Linear Structural Relationship Model, LISREL) 共變數結構分析(Covariance Structure Analysis) 驗證性因素分析(Confirmatory Factor Analysis, CFA)
39
符號介紹 x1 x3 x2 δ1 δ 2 δ 3 ξ λ1 λ2 λ3 誤差 觀察變項 負荷量 潛在變項
40
x1 x3 x2 δ1 δ2 δ3 ξ1 η1 y1 y2 y3 ε1 ε2 ε3 ζ 測量模式 結構模式
41
x1 x3 x2 δ1 δ2 δ3 ξ1 測量模式 僅有測量模式就是CFA
42
δ[delta] ; λ[lambda]; ξ[xi]
δ1 δ 2 δ 3 ξ1 λ11 λ21 λ31 x1= λ11 ξ1+ δ1 x2= λ21 ξ1+ δ2 x3= λ31 ξ1+ δ3 δ[delta] ; λ[lambda]; ξ[xi] 希臘字母讀音網站
43
ε[epsilon] ; λ[lambda]; η[eta] y1= λ1 η+ ε1
ε 2 ε 3 η λ1 λ2 λ3 ε[epsilon] ; λ[lambda]; η[eta] y1= λ1 η+ ε1 y2= λ2 η + ε 2 y3= λ3 η + ε 3
44
ε1 x1 ξ1 ε 2 x2 ε 3 x3 Φ12/ Φ21 ε 4 x4 Φ[phi] ξ2 ε 5 x5 ε 6 x6
45
基本假定 ε與η 、ξ以及δ相互獨立。 δ與ξ 、η 以及ε相互獨立。 樣本資料要服膺多變量常態分配。 觀察變項間有線性關係。
46
指標變項的討論 以觀察變項作為潛在變項的指標變項時,要幾個觀察變項才夠? 多元指標原則:一個潛在變項必須有兩個以上的觀察變項來估計
愈多愈好嗎?一個可不可以? 應回歸到工具設計與施測實務以及樣本大小、負荷量大小等問題
47
指標變項的討論:反應性指標(reflective indicators)
x1 x3 x2 δ1 δ 2 δ 3 ξ λ1 λ2 λ3
48
指標變項的討論:形成性指標(formative indicators)
y1 y3 y2 η ζ [zeta] vpls下載
49
樣本大小的討論 樣本大小亦取決於潛在變項的數目 樣本大小至少超過150個。
Rigdon, E. (2005). SEM FAQ. from 至少要為x觀察變項數目的10倍量或15倍量。 Thompson, B. (2000). Ten commandments of structural equation modeling. In L. G. Grimm & P. R. Yarnold (eds.), Reading and understanding more multivariate statistics (pp ). Washington, DC: APA. 樣本大小亦取決於潛在變項的數目
50
分析程序 模式概念化 路徑圖建構 模式確認 模式識別 參數估計 模式適配度評估 模式修正 模式複核效化(cross-validation)
51
常見電腦軟體 LISREL Mx SIMPLIS Statistica AMOS SAS PROC CALIS EQS COSAN
Mplus Mx Statistica SAS PROC CALIS COSAN LVPLS …
52
模式確認與識別
53
路徑圖與參數設定 潛在變項的變異數為1,平均數為0(AMOS預設值)。
內因變項要有誤差項(研究者自行設定) 。
54
t法則(過度識別) 樣本共變矩陣的數目 過度識別,方可進行模式適配考驗。 t為待估計的自由參數。 p+q為所有觀察變項數目。
55
t法則(低度識別) 低度識別,參數估計有無限多個解。 減少自由參數數目(增加固定參數數目),以取得過度識別。
56
t法則(正好識別) 正好識別,參數估計有唯一解,即為飽和模式。完美適配在實務不具參考價值。
減少自由參數數目(增加固定參數數目),以取得過度識別。
57
t=13 1/2(3+3)(3+3+1)=21 df=21-13=8 x1 x3 x2 ε1 ε 2 ε 3 ξ1 x4 x6 x5 ε 4
ε 5 ε 6 ξ2 v1 1 v7 1 w1 v2 1 w2 v3 c1 1 v4 v8 1 1 w3 v5 1 df=21-13=8 w4 v6
58
參數估計
59
常見參數估算方法 最大概似法(Maximum likelihood, ML):樣本大於500且觀察資料為多變量常態分配。
一般化最小平方法(Generalized least Squares, GLS ):樣本小於500 亦可;如果樣本夠大 (say >500),觀察資料沒有服膺多變量常態分配亦可。 未加權最小平方法(Unweighted Least Squares, ULS):不需符合某種分配假定。 貝氏估計法(Bayesian Estimation):適用小樣本(say <100) 。
60
模式適配度檢核指標
61
模式基本適配指標 誤差變異數不能為負值。 所有誤差變異數須達顯著水準。 參數統計量間的相關絕對值不能太接近1。
因素負荷量約在 間。 標準誤不能太大。 Bagozzi, R. P. & Yi, Y. (1988). On the evaluation of structural equation models. Academic of Marketing Science, 16,
62
整體模式適配度指標:外在品質評估 χ2 > α χ2 /df (NC) 1~3 GFI > 0.9 AGFI RMR
絕對適配度指標 標準 χ2 > α χ2 /df (NC) 1~3 GFI > 0.9 AGFI RMR < 0.05 SRMR(AMOS須另外計算) RMSEA NCP 愈小愈好,信賴區間含0 ECVI 用於不同模式的相對比較,相對小者較好 理論模式比飽和模式與獨立模式的值還小
63
整體模式適配度指標:外在品質評估 NFI > 0.9 RFI IFI TLI/NNFI CFI
增值適配度指數 標準 NFI > 0.9 RFI IFI TLI/NNFI CFI Diamantopoulos, A. & Siguaw, J. A. (2000). Introducing LISREL: A guide for the uninitiated. Thousand Oaks, CA: Sage.
64
整體模式適配度指標:外在品質評估 PGFI > 0.5 PNFI CN > 200 AIC 用於不同模式的相對比較,相對小者較好
簡約適配度指數 標準 PGFI > 0.5 PNFI CN > 200 AIC 用於不同模式的相對比較,相對小者較好 理論模式比飽和模式與獨立模式的值還小 CAIC
65
模式內在結構適配度評估(內在品質評估) 除整體模式適配之外,深入探討每一個參數,對理論的驗證更能獲得保障。
測量模式的評鑑:觀察變項與潛在變項的關聯,即潛在變項的信度與效度考驗。 結構模式的評鑑:確認外衍與內衍變項的解釋或預測關係是否成立。 Bagozzi, R. P. & Yi, Y. (1988). On the evaluation of structural equation models. Academic of Marketing Science, 16,
66
測量模式的評鑑 個別觀察變項的項目信度(individual item reliability)在0.5以上,即因素負荷量的平方值。
潛在變項的組合信度(composite reliability)在0.6以上。 因素負荷量 觀察變項的誤差
67
測量模式的評鑑 潛在變項的平均變異數萃取量(average variance extracted)在0.5以上。
68
測量模式的評鑑 修正指標(modification indices)小於3.84(AMOS的預設值為4)。
參數統計量的估計值達顯著水準(t or CR大於1.96)。 標準化殘差的絕對值小於2.58/3(可於AMOS的Residual Covariance矩陣獲得)。 修正指標(modification indices)小於3.84(AMOS的預設值為4)。
69
結構模式的評鑑 外衍與內衍變項的路徑係數是否顯著,正負向關係是否與理論相符。 R2愈高,則解釋力/預測力愈高。
參數統計量的估計值達顯著水準(t or CR大於1.96)。 R2愈高,則解釋力/預測力愈高。
70
適配指標的討論 沒有單一指標可以作為唯一明確的標準。 沒有單獨一種指標即可涵蓋或完全取代其他指標。
有些指標的計算是建立在另一些指標的基礎上,亦即有些指標間是相依並有線性關係。 多數決的結論並不能保證所得模式是最好的適配模式。 因此,參採某特定文獻的標準是較可行的方式。
71
直交模式與斜交模式
72
直交模式 x5 x8 … 消費動機 x1 x3 影響來源 x9 x12 商品訊息
73
斜交模式 x5 x8 … 消費動機 x1 x3 影響來源 x9 x12 商品訊息 C2 C3 C1
74
二階驗證性因分析
75
二階驗證性因素分析模式(second-order CFA model)是一階驗證性因素分析模式(first-order CFA model)的特例,又稱高階因素分析。
通常用於理論主張一階因素構念間有高度關聯,因此可進一步假定這幾個一階因素構念在測量更高一階的因素構念。也就是說,某一較高階結構的潛在變項可以解釋所有一階的因素構念。
76
x5 x8 … 消費動機 x1 x3 影響來源 x9 x12 商品訊息 消費文化
77
聚合效度與區分效度
78
聚合效度(Convergent Validity)
測量相同特質的觀察變項要高度相關。 測量同一潛在特質的測量指標會落在同一因素構念上,即同屬一潛在變項的因素負荷量皆要大(say λ>0.71),即代表具有聚合效度。 以部分測量不變性( partial measurement invariance)方式,探討每個潛在變項之指標變項的因素負荷量是否相等。若是,則是具有聚合效度的另一證據。
79
區分效度(Discriminant Validity)
測量不同特質的觀察變項要低相關或沒有相關。 假設兩個模式:一個相關係數為1的兩個潛在變項,以及一個自由估計兩個潛在變項的相關,若此二個模式有顯著不同,即代表具有區分效度。
80
複核效化分析
81
若多群組模式中的測量模式的因素負荷量為相等,則表示模式有測量不變性(measurement invariance),亦即跨群組間具有複核效度。
另有測量截距項相等、結構係數相等、結構矩陣相等、結構平均數相等、結構共變數相等、結構殘差相同、測量殘差相等…等,更嚴格之設定,以進行多群體不變性(multigroup invariance)檢定。
82
EFA 與 CFA 的討論
83
討論一 我們在研究論文中,常發現有類似下列敘述:
本研究的預試資料,以探索性因素分析方式(EFA),進行試題篩選與因素命名,並用以形成正式施測題本…。 正式施測資料,再以驗證性因素分析(CFA),進行建構效度之考驗…
84
若為初探性研究 預試資料以EFA,進行試題篩選與因素命名,並用以形成正式施測題本。
因為,初探性研究無solid的理論基礎,何來效度考驗的依據?
85
若為正式性研究(一) 以質性分析方式,進行初版題本之試題篩選與修整,再以不破壞雙向細目表結構之原則下,組成正式題本。
正式施測資料以CFA,進行信效度之考驗,再以模式校正方式,進行不良試題篩選。 模式校正不是為了取得較佳適配值而已,而是為了進行試題篩選。
86
若為正式性研究(二) 以CFA進行預試資料之信效度考驗,並進行模式校正,取得試題修整或刪題之參考依據,再組成正式題本。
以CFA,進行正式施測資料之信效度考驗,並進行複核效化分析(cross-validation analysis)。
87
複核效化分析 複核效化分析就是主張的理論模式是否也適配於來自於相同母群的不同樣本。作為是將原有樣本分割為二,一為校正樣本(calibration sample),一為效度樣本(validation sample),分別進行CFA。 預試與正式施測資料的CFA過程已有第一次的複核效化分析的概念。 正式施測的CFA,還可以再進行第二次的複核效化分析。
88
討論二 我們常在研究論文中發現有類似下列作法: 進行信效度考驗之後,接著進行分量表/各構面的得分計算。
若量表中的第1題至第3題同屬一構面,則將第1題至第3題加總平均之,即為該構面分數。 構面分數計算完畢,方才進行其他各項推論統計分析。
89
每一個x的權重不見得相等,若真要加總平均,也要有各題等值的證據
δ1 δ 2 δ 3 ξ λ1 λ2 λ3 x之間的加總不會等於潛在變項 每一個x的權重不見得相等,若真要加總平均,也要有各題等值的證據
90
分析的矛盾 假設有一篇論文同時用了皮爾遜積差相關、迴歸分析、變異數分析等方法進行分析;又進行一結構方程模式分析…
一篇論文出現兩種不同分數計算的信仰… 矛盾點在於x與x的加總平均是什麼? 解套:多群組結構共變數與平均數模式分析
91
討論三 假設影響來源是量表中第1題至第4題的加總平均;消費動機是第5題至第8題的加總平均;商品訊息是第9題至第12題的加總平均。
δ1 δ 2 δ 3 消費文化 λ1 λ2 λ3 假設影響來源是量表中第1題至第4題的加總平均;消費動機是第5題至第8題的加總平均;商品訊息是第9題至第12題的加總平均。 承討論二,我們要有x與x可以加總的理由。
92
More Stuff
93
CFA模式適配方式進行EFA探索:使用AMOS的界定搜尋功能(Specification Search)。
94
結構方程模式 路徑分析/徑路分析 Path Analysis
95
基本概念
96
符號介紹 Path analysis with observed variables (PA-OV) γ11 x1 y1 x2 γ22
外衍觀察變項 exogenous observed variable 內衍觀察變項 endogenous observed variable x1 x3 x2 y1 ζ1 y2 ζ2 γ22 γ11 β21 γ23 Φ21 Φ32 Φ31 γ[gamma]; β[beta] 觀察變項路徑分析 Path analysis with observed variables (PA-OV)
97
Path analysis with latent variables (PA-LV)
外衍潛在變項 exogenous latent variable 內衍潛在變項 endogenous latent variable x1 x3 x2 δ1 δ2 δ3 ξ1 η1 y1 y2 y3 ε1 ε2 ε3 ζ1 γ11 β21 η2 y4 y5 y6 ε4 ε5 ε6 ζ2 潛在變項路徑分析 Path analysis with latent variables (PA-LV) γ21
98
觀察變項路徑分析 Path analysis with observed variables (PA-OV)
99
遞迴模式(recursive model)
路徑分析中的解釋/預測(因果)關係只有單一方向性 間接效果 x1 x3 x2 y1 y2 直接效果
100
非遞迴模式(nonrecursive model)
路徑分析中的解釋/預測(因果)關係是互為雙向的關係 x1 y1 x2 x3 y2
101
潛在變項路徑分析 Path analysis with latent variables (PA-LV)
102
一般模式 x1 x3 x2 δ1 δ2 δ3 ξ1 η1 y1 y2 y3 ε1 ε2 ε3 ζ1
103
混和模式 x1 x3 x2 δ1 δ2 δ3 ξ1 η1 y1 y2 y3 ε1 ε2 ε3 ζ1 x4
104
MIMIC模式 x1 η1 y1 y2 y3 ε1 ε2 ε3 ζ1 x2
105
More Stuff
106
潛在成長曲線模式(Latent Growth Curve Model, LGC)
潛在平均數結構分析(latent mean structure analysis)/多群組結構共變數與平均數模式(multigroup covariance and mean structure modeling) 潛在成長曲線模式(Latent Growth Curve Model, LGC)
107
Feedback and Comment cyang@tea.ntue.edu.tw
Similar presentations