Presentation is loading. Please wait.

Presentation is loading. Please wait.

Regression and Correlation

Similar presentations


Presentation on theme: "Regression and Correlation"— Presentation transcript:

1 Regression and Correlation
Stata教學 Regression and Correlation ©Ming-chi Chen 社會統計

2 資料散佈圖scatter diagram 打開Chinalife.dta。
討論中國各省市的平均餘命(2000年)和其他地區變數(2004)的關係。 試畫出各省市每萬人病床數和平均餘命關係的scatter diagram。 ©Ming-chi Chen 社會統計

3 Scatter Diagram IV DV ©Ming-chi Chen 社會統計

4 PRC各省平均餘命與萬人病床數 ©Ming-chi Chen 社會統計

5 Stata畫迴歸線 迴歸線從0畫到極大值(.) ©Ming-chi Chen 社會統計

6 在散佈圖中畫出迴歸線 ©Ming-chi Chen 社會統計

7 教育投資有助於延長生命嗎? ©Ming-chi Chen 社會統計

8 前圖怎麼畫出來的? 迴歸線 twoway (scatter lifeexp pcedu) (lfit lifeexp pcedu, range(0 .)), ytitle(平均餘命, margin(medsmall)) xtitle(人均教育支出, margin(medsmall)) legend(off) yline( ) text( "Y-bar", place(w)) Y軸標題 散佈圖 加一條平均餘命的平均值(值是用summary計算出來的 不要圖例 中小大小的圖邊 在(─60, )的位置左方(W西方)加上Y-bar的字樣 ©Ming-chi Chen 社會統計

9 可否用下拉式選單完成上圖? 部分可以,但非全部 ©Ming-chi Chen 社會統計

10 ©Ming-chi Chen 社會統計

11 Overlaid twoway graph:散佈圖
DV IV 先選散佈圖 ©Ming-chi Chen 社會統計

12 Overlaid twoway graph:迴歸線
迴歸線從X=0起到最大值 ©Ming-chi Chen 社會統計

13 Overlaid twoway graph:Y軸標題
選擇中小型圖邊 ©Ming-chi Chen 社會統計

14 Overlaid twoway graph:X軸標題
©Ming-chi Chen 社會統計

15 Overlaid twoway graph:不要圖例
©Ming-chi Chen 社會統計

16 Overlaid twoway graph:產生圖表
圖表缺少了代表平均餘命平均值的線,也沒有相應的註記,這可能是下拉式選單的缺陷,也可能是我還沒找到正確的方法。所以要在command視窗裡加註。 ©Ming-chi Chen 社會統計

17 下拉式選單到指令視窗 把下拉式選單的指令在指令視窗裡叫回來。
在Review視窗裡有所有執行過的指令,點一下指令就會出現在指令視窗裡。在指令最後的地方加上yline和text的指令。 ©Ming-chi Chen 社會統計

18 自訂一條線並加上文字註記 twoway (scatter lifeexp pcedu) (lfit lifeexp pcedu, range(0 .)), ytitle(平均餘命, margin(medsmall)) xtitle(人均教育支出, margin(medsmall)) legend(off) yline( ) text( "Y-bar", place(w)) -60是自己試驗出來的位置,因為如果設定為0的話,字會和軸線(不是在0上)重疊,看不清楚。 ©Ming-chi Chen 社會統計

19 迴歸分析 ©Ming-chi Chen 社會統計

20 迴歸分析 自變數 依變數 ©Ming-chi Chen 社會統計

21 迴歸分析:統計結果 ©Ming-chi Chen 社會統計

22 解讀Stata迴歸分析結果 Stata以ANOVA表和迴歸係數表以及其他重要統計量來呈現迴歸統計結果: ANOVA表 Source SS
df MS Number of obs=樣本數 Model SSR df1=k-1 MSR F(df1,df2)=模型F值 Residual SSE df2=n-k MSE R-squared=R2 Total SST df3 Adj R-squared=調整R2=1 - ((1 – R2)((N - 1) /( N - k - 1)).  Root MSE=MSE的平方根 迴歸係數表 依變數 Coef. Stf. Err. t p>|t| 係數的95%信賴區間 自變數 迴歸係數 迴歸係數的標準誤 迴歸係數的檢定統計量t P值 常數項 截距 截距的標準誤 截距的檢定統計量 ©Ming-chi Chen 社會統計

23 迴歸分析:詮釋統計結果 迴歸方程式:lifeexp=69.178+0.003587(pcedu)
人均教育支出每增加人民幣一元,該省市的平均餘命增加 歲。 R2=0.2965,即迴歸模型可以解釋29.65%的總變異,F=MSR/MSE=12.22(=t2),P值=0.0015,我們可以拒絕整個迴歸模型沒有解釋力的虛無假設,也就是R2不等於0。 迴歸係數與截距的顯著水準均在0.01以下 迴歸係數的95%信賴區間為( , )。 ©Ming-chi Chen 社會統計

24 迴歸模型DV的預測值 ©Ming-chi Chen 社會統計

25 在data editor中檢視新增加的預測值
預測值加入原資料中 ©Ming-chi Chen 社會統計

26 母體期望值E(Y|X)或μy的95%信賴區間
無法在下拉式選單中點選,必須在指令欄裡下指令。 對某特定Xp值而言,所預測的母體期望值的估計變異數 • se2=MSE=7.4109, ©Ming-chi Chen 社會統計

27 Stata中求對應特定Xp預測母體值的標準差
• 在Stata裡用predict 新變數名稱, stdp這個指令來求對應數值。 • predict stderr, stdp ©Ming-chi Chen 社會統計

28 Stata中求對應特定Xp預測母體值的標準差
©Ming-chi Chen 社會統計

29 母體期望值E(Y|X)或μy的95%信賴區間
先求出t值,要知道自由度在31-2=29下,α=0.05的t值。 在Stata中,用invttail(29, .05/2) generate yhatll=yhat-stderr*invttail(29, .05/2)這是信賴下界 generate yhatul=yhat+stderr*invttail(29, .05/2)這是信賴上界 ©Ming-chi Chen 社會統計

30 母體期望值E(Y|X)或μy的95%信賴區間
©Ming-chi Chen 社會統計

31 圖形 ©Ming-chi Chen 社會統計

32 圖形 ©Ming-chi Chen 社會統計

33 母體預測值的信賴區間 從實際觀察到的樣本來推測母體,除了可以求出對應特定X值的母體期望值的信賴區間之外,我們還可以求母體預測值的信賴區間。
對某特定Xp值而言,母體預測值的估計變異數 ©Ming-chi Chen 社會統計

34 Stata中求對應特定Xp預測母體值的標準差
• 在Stata裡用predict 新變數名稱, stdf這個指令來求對應數值。這裡和前面略有不同。 • predict stderrf, stdf ©Ming-chi Chen 社會統計

35 Stata中求對應特定Xp預測母體值的標準差
• predict stderrf, stdf • list ©Ming-chi Chen 社會統計

36 母體期望值Y-hat的95%信賴區間 先求出t值,要知道自由度在31-2=29下,α=0.05的t值。
在Stata中,用invttail(29, .05/2) generate yhatllf=yhat-stderrf*invttail(29, .05/2)這是信賴下界 generate yhatulf=yhat+stderrf*invttail(29, .05/2)這是信賴上界 list v1 lifeexp pcedu yhat stderrf yhatllf yhatulf ©Ming-chi Chen 社會統計

37 母體期望值Y-hat的95%信賴區間 ©Ming-chi Chen 社會統計

38 圖示 ©Ming-chi Chen 社會統計

39 母體預測值95%信賴區間圖示 ©Ming-chi Chen 社會統計

40 Covariance and Correlation
如果只是要知道兩變數之間的相關程度,可以計算共變數或相關係數。 ©Ming-chi Chen 社會統計

41 Covariance and Correlation
©Ming-chi Chen 社會統計

42 Correlation ©Ming-chi Chen 社會統計

43 Correlation . correlate lifeexp pcedu (obs=31) | lifeexp pcedu
lifeexp | pcedu | ©Ming-chi Chen 社會統計

44 Covariance ©Ming-chi Chen 社會統計

45 Covariance . correlate lifeexp pcedu, covariance (obs=31)
lifeexp | pcedu | Cov Variance ©Ming-chi Chen 社會統計

46 Hypothesis Testing ©Ming-chi Chen 社會統計

47 相關係數的統計檢定 欲檢證的變數名稱,留白為全部變數成對的相關係數 ©Ming-chi Chen 社會統計

48 相關係數的統計檢定 r . pwcorr lifeexp pcedu, sig | lifeexp pcedu
lifeexp | | pcedu | | r 相關係數t檢定的p值 ©Ming-chi Chen 社會統計


Download ppt "Regression and Correlation"

Similar presentations


Ads by Google