Regression and Correlation Stata教學 Regression and Correlation ©Ming-chi Chen 社會統計
資料散佈圖scatter diagram 打開Chinalife.dta。 討論中國各省市的平均餘命(2000年)和其他地區變數(2004)的關係。 試畫出各省市每萬人病床數和平均餘命關係的scatter diagram。 ©Ming-chi Chen 社會統計
Scatter Diagram IV DV ©Ming-chi Chen 社會統計
PRC各省平均餘命與萬人病床數 ©Ming-chi Chen 社會統計
Stata畫迴歸線 迴歸線從0畫到極大值(.) ©Ming-chi Chen 社會統計
在散佈圖中畫出迴歸線 ©Ming-chi Chen 社會統計
教育投資有助於延長生命嗎? ©Ming-chi Chen 社會統計
前圖怎麼畫出來的? 迴歸線 twoway (scatter lifeexp pcedu) (lfit lifeexp pcedu, range(0 .)), ytitle(平均餘命, margin(medsmall)) xtitle(人均教育支出, margin(medsmall)) legend(off) yline(71.24387) text(71.24387 -60 "Y-bar", place(w)) Y軸標題 散佈圖 加一條平均餘命的平均值(值是用summary計算出來的 不要圖例 中小大小的圖邊 在(─60, 71.24387)的位置左方(W西方)加上Y-bar的字樣 ©Ming-chi Chen 社會統計
可否用下拉式選單完成上圖? 部分可以,但非全部 ©Ming-chi Chen 社會統計
©Ming-chi Chen 社會統計
Overlaid twoway graph:散佈圖 DV IV 先選散佈圖 ©Ming-chi Chen 社會統計
Overlaid twoway graph:迴歸線 迴歸線從X=0起到最大值 ©Ming-chi Chen 社會統計
Overlaid twoway graph:Y軸標題 選擇中小型圖邊 ©Ming-chi Chen 社會統計
Overlaid twoway graph:X軸標題 ©Ming-chi Chen 社會統計
Overlaid twoway graph:不要圖例 ©Ming-chi Chen 社會統計
Overlaid twoway graph:產生圖表 圖表缺少了代表平均餘命平均值的線,也沒有相應的註記,這可能是下拉式選單的缺陷,也可能是我還沒找到正確的方法。所以要在command視窗裡加註。 ©Ming-chi Chen 社會統計
下拉式選單到指令視窗 把下拉式選單的指令在指令視窗裡叫回來。 在Review視窗裡有所有執行過的指令,點一下指令就會出現在指令視窗裡。在指令最後的地方加上yline和text的指令。 ©Ming-chi Chen 社會統計
自訂一條線並加上文字註記 twoway (scatter lifeexp pcedu) (lfit lifeexp pcedu, range(0 .)), ytitle(平均餘命, margin(medsmall)) xtitle(人均教育支出, margin(medsmall)) legend(off) yline(71.24387) text(71.24387 -60 "Y-bar", place(w)) -60是自己試驗出來的位置,因為如果設定為0的話,字會和軸線(不是在0上)重疊,看不清楚。 ©Ming-chi Chen 社會統計
迴歸分析 ©Ming-chi Chen 社會統計
迴歸分析 自變數 依變數 ©Ming-chi Chen 社會統計
迴歸分析:統計結果 ©Ming-chi Chen 社會統計
解讀Stata迴歸分析結果 Stata以ANOVA表和迴歸係數表以及其他重要統計量來呈現迴歸統計結果: ANOVA表 Source SS df MS Number of obs=樣本數 Model SSR df1=k-1 MSR F(df1,df2)=模型F值 Residual SSE df2=n-k MSE R-squared=R2 Total SST df3 Adj R-squared=調整R2=1 - ((1 – R2)((N - 1) /( N - k - 1)). Root MSE=MSE的平方根 迴歸係數表 依變數 Coef. Stf. Err. t p>|t| 係數的95%信賴區間 自變數 迴歸係數 迴歸係數的標準誤 迴歸係數的檢定統計量t P值 常數項 截距 截距的標準誤 截距的檢定統計量 ©Ming-chi Chen 社會統計
迴歸分析:詮釋統計結果 迴歸方程式:lifeexp=69.178+0.003587(pcedu) 人均教育支出每增加人民幣一元,該省市的平均餘命增加0.003587歲。 R2=0.2965,即迴歸模型可以解釋29.65%的總變異,F=MSR/MSE=12.22(=t2),P值=0.0015,我們可以拒絕整個迴歸模型沒有解釋力的虛無假設,也就是R2不等於0。 迴歸係數與截距的顯著水準均在0.01以下 迴歸係數的95%信賴區間為(0.001489, 0.005685)。 ©Ming-chi Chen 社會統計
迴歸模型DV的預測值 ©Ming-chi Chen 社會統計
在data editor中檢視新增加的預測值 預測值加入原資料中 ©Ming-chi Chen 社會統計
母體期望值E(Y|X)或μy的95%信賴區間 無法在下拉式選單中點選,必須在指令欄裡下指令。 對某特定Xp值而言,所預測的母體期望值的估計變異數 • se2=MSE=7.4109, ©Ming-chi Chen 社會統計
Stata中求對應特定Xp預測母體值的標準差 • 在Stata裡用predict 新變數名稱, stdp這個指令來求對應數值。 • predict stderr, stdp ©Ming-chi Chen 社會統計
Stata中求對應特定Xp預測母體值的標準差 ©Ming-chi Chen 社會統計
母體期望值E(Y|X)或μy的95%信賴區間 先求出t值,要知道自由度在31-2=29下,α=0.05的t值。 在Stata中,用invttail(29, .05/2) generate yhatll=yhat-stderr*invttail(29, .05/2)這是信賴下界 generate yhatul=yhat+stderr*invttail(29, .05/2)這是信賴上界 ©Ming-chi Chen 社會統計
母體期望值E(Y|X)或μy的95%信賴區間 ©Ming-chi Chen 社會統計
圖形 ©Ming-chi Chen 社會統計
圖形 ©Ming-chi Chen 社會統計
母體預測值的信賴區間 從實際觀察到的樣本來推測母體,除了可以求出對應特定X值的母體期望值的信賴區間之外,我們還可以求母體預測值的信賴區間。 對某特定Xp值而言,母體預測值的估計變異數 ©Ming-chi Chen 社會統計
Stata中求對應特定Xp預測母體值的標準差 • 在Stata裡用predict 新變數名稱, stdf這個指令來求對應數值。這裡和前面略有不同。 • predict stderrf, stdf ©Ming-chi Chen 社會統計
Stata中求對應特定Xp預測母體值的標準差 • predict stderrf, stdf • list ©Ming-chi Chen 社會統計
母體期望值Y-hat的95%信賴區間 先求出t值,要知道自由度在31-2=29下,α=0.05的t值。 在Stata中,用invttail(29, .05/2) generate yhatllf=yhat-stderrf*invttail(29, .05/2)這是信賴下界 generate yhatulf=yhat+stderrf*invttail(29, .05/2)這是信賴上界 list v1 lifeexp pcedu yhat stderrf yhatllf yhatulf ©Ming-chi Chen 社會統計
母體期望值Y-hat的95%信賴區間 ©Ming-chi Chen 社會統計
圖示 ©Ming-chi Chen 社會統計
母體預測值95%信賴區間圖示 ©Ming-chi Chen 社會統計
Covariance and Correlation 如果只是要知道兩變數之間的相關程度,可以計算共變數或相關係數。 ©Ming-chi Chen 社會統計
Covariance and Correlation ©Ming-chi Chen 社會統計
Correlation ©Ming-chi Chen 社會統計
Correlation . correlate lifeexp pcedu (obs=31) | lifeexp pcedu -------------+------------------ lifeexp | 1.0000 pcedu | 0.5445 1.0000 ©Ming-chi Chen 社會統計
Covariance ©Ming-chi Chen 社會統計
Covariance . correlate lifeexp pcedu, covariance (obs=31) -------------+------------------ lifeexp | 10.1837 pcedu | 841.87 234698 Cov Variance ©Ming-chi Chen 社會統計
Hypothesis Testing ©Ming-chi Chen 社會統計
相關係數的統計檢定 欲檢證的變數名稱,留白為全部變數成對的相關係數 ©Ming-chi Chen 社會統計
相關係數的統計檢定 r . pwcorr lifeexp pcedu, sig | lifeexp pcedu -------------+------------------ lifeexp | 1.0000 | pcedu | 0.5445 1.0000 | 0.0015 r 相關係數t檢定的p值 ©Ming-chi Chen 社會統計