Regression for binary outcomes 二元依變項的迴歸模型 Regression for binary outcomes
複習上週:OLS(使用連續變項)
二元依變項(Yes=1/No=0)
graph twoway (lfitci renew term) (scatter renew term)
問題發生了:heteroskedasticity
解決之道:Logistic regression 依變項轉換變為:probability of Y=1 (依變項發生的機率) 利用自變項來估測「依變項發生的機率」,而非依變項的値。 公式: P(Y=1)=1/{1+exp[-(a+B1X1+B2X2…BkXk)]}
Link function 依變項從二元變項(1/0)轉變為連續變項(Y發生的機率range from 0 to 1) Coefficients 沒有直觀上的意義,需要exp之後才行(反log) 我們要看Odds ratios
Odds & odds ratios Logit= the log of the odds Odds=P/(1-P) Odds ratio 指兩個odds之間的比例 例如:男性候選人勝選的Odds/女性候選人勝選的Odds 不用擔心,Stata都會幫你算好
指令 Logit 依變項 自變項A 自變項B 自變項C Logistic依變項 自變項A 自變項B 自變項C 顯示coefficients (可以看方向及顯著性) Logistic依變項 自變項A 自變項B 自變項C 顯示odds ratios(除了上者,還可以詳細解讀)
範例 : logit
範例:logistic
讀報表 Number of Obs P値<0.05,表示此Model是有意義的(if compared to an intercept only model) Pseudo R2不是真的R2
讀報表 coefficient 反log之後(exp),就變成Odds ratio Odds ratio>1 表示 X & Y(p)的正向關係 Odds ratio<1 表示 X & Y(p)的負向關係 P値<0.05表示顯著
解讀 在其他條件不變的情況下,國民黨提名者,連任成功的Odds,是非國民黨提名者的7.92倍。 顯著=P<0.05 在其他條件不變的情況下,擔任立委的資歷,每增加一屆,其連任成功的Odds就會減少8.53% 不顯著=P>0.05 8.53%=1-0.9147382
解讀 在其他條件不變的情況下,民進黨提名者,連任成功的Odds,是非民進黨提名者的4.62倍。 顯著=P<0.05 在其他條件不變的情況下,具備地方民意代表的背景資歷,會使連任成功的Odds減少0.41% 不顯著=P>0.05 0.41%=1-0.9958549