邏輯迴歸 Logistic Regression 輔仁大學心理學系 邱皓政 2004.12.10
基本定義 當依變項為二分類別變項的迴歸分析 在邏輯迴歸時,直接估計事件發生的機率 DV的機率值介於0-1,IV與DV的分佈圖呈現曲線,屬於曲線迴歸的應用 單一IV 多元IV
Procedures for Logistic Regression analysis Stage 1: Objectives of Logistic regression analysis Stage 2: Designing a Logistic regression analysis Stage 3: Testing the assumptions Adequacy of expected frequencies Outlier test Multicollinearity Stage 4: Deriving the Logistic regression and assessing overall fit Significance tests for each predictor Parameter estimates Stage 5: Interpreting the prediction results Odd ratios Classification and prediction success table Evaluation of the models
邏輯迴歸模型的檢驗 Classification table Histogram of estimated probabilitie 顯示迴歸模型正確預測DV分組的能力 Histogram of estimated probabilitie 將分類的結果以直方圖表示 .5機率的左右兩側分別為出現與不出現的狀況 Goodness-of-fit of model 使用參數估計的原理, 估計事件出現的或然率(likelihood) 由於或然率為0-1的數值,故將其取對數值Log Likelihood(LL) 乘以-2轉換成-2LL數值, -2LL越小,代表模型越好 完美契合的模型,其掌握出現機率的likelihood為1,取對數乘以-2為0(-2LL) , -2LL數值越小越好(沒有不同於完美模型) Z2=Sum of residual2/P(1-P)
Model goodness-of-fit: -2LL statistic Step0 (null) Step1 (model)
Logistic regression coefficient 邏輯迴歸的係數與多元迴歸最大的不同,是因為DV為類別變項,因此必須以機率的方式來處理迴歸係數B(以Odds來表示) 先利用迴歸係數B計算出依變項的Odds:Odds為某事件出現的機率除以不出線的機率 取Odds的對數值,使DV與IV成為線性關係 EXP(B):每一單位IV的變化,在DV的ODDS的增減量
Wald test (Z statistic)
Prediction success table