Download presentation
Presentation is loading. Please wait.
1
授課內容: 簡單線性迴歸模型:報告結果 與選擇函數型式
政治大學行政管理碩士學程共同必修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 簡單線性迴歸模型:報告結果 與選擇函數型式 參考書目:Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate Econometrics. New York: John Wiley & Sons 日期:2011年11月28日
2
簡單線性迴歸模型 Yt = β1+ β2Xt+et et ~N(0,1) 兩個分析模型的理由:
在 x0 已知下預測 y0。
3
總平方和 (SST) 可解釋的平方和 (SSR) 誤差平方和 (SSE)
4
若R2 = 1:表示迴歸模型「完全地」配合這份資料。 R2 = 0:表示y 與 x 的樣本資料並不相關,而且未
顯示任何的線性關係,則最小平方配適 線為「水平的」。
5
註: R2 是一個敘述性的衡量值。它本身並不能衡量迴歸模型的品質,只著重將R2最大化的迴歸決策並非好方法。
解釋: R2=0.32 表示 Y的變異中有 32% 可以用X的變異來解釋,或是說迴歸模型可以解釋 32% Y的變異,剩下 68%的變異無法解釋。 這樣的R2看起來很低嗎? 不,在使用橫斷面資料的迴歸研究,以不同時點觀察同一個體或其他經濟行為的樣本時,是很具有代表性的。
6
簡單線性迴歸的相關分析 (1) r2 = R2, r = Cov(X,Y) / = 舉例來證明r2=R2
= 舉例來證明r2=R2 (2) R2=(Yt, )的相關係數 = 舉例來證明r2 =
7
報告迴歸結果 = Xt R2 = 0.317 ( ) (0.0305) (s.e) 或 = Xt R2 = 0.317 (1.84) (4.20) (t)
8
選擇函數形式 簡單線性迴歸模型指的是參數不會相乘、相除、平方、立方等。 滿足SR1 SR5 簡單線性迴歸模型
轉換(Transformation) (1)變數間的線性關係 : β2= 斜率(slope) (2)倒數(Reciprocal):
9
給定一個模型,使其誤差項具有下列性質: 1. E(et)=0 2. Var (et)=σ2 3. Cov(ei,ej)=0 et~N(0, σ2) 運用其他函數形式來進行迴歸分析。
10
選擇函數形式:實證議題 1.散佈(plot) 2.模型 Yt=β1+β2 Xt+et 3.估計 4.預測
技術的改變 1.散佈(plot) 2.模型 Yt=β1+β2 Xt+et 3.估計 4.預測 5.殘差分佈 → 檢查是否為常態分配? 時間
11
其他形式 Yt=β1+β2Xt3+et Zt3=Xt3/ = Zt3 R2=0.751 R2↑ Notice : 殘差模式也有許多其他的不足之處,例如有被忽略的變數,異質變異性(heteroskedasticity),自我相關 (autocorrelation) 錯誤建立迴歸模型。
12
殘差為常態分配嗎? 1.平均值→0 2.傑古貝拉檢定(Jarque-Bera test for normality),用來檢定常態性。
Ho: 常態,H1:非常態 若 P>α 無法拒絕虛無假設
13
JB值 JB = T: 觀察值的個數 S: 偏態(skewness) k: 峰態( kurtosis) Ex:
T=40,S= ,K= JB=1.077 JB ﹤5.99 = 22, 0.05
14
Ho:常態分配(Normal distribution)
JB < 常態分配 包含截距項的係數個數 JB> 拒絕常態分配 P< 拒絕 Ho
15
複迴歸模型 y=1+ 2X+3Z 理論模型 解釋 β1 , β2 , β3 Model:
解釋 β1 , β2 , β3 Model: y=E(y)+et= 1+ 2X+3Z +et 假設: (1) E(et)= (2) Var(et)=σ2 (3) Cov(et,es)=0 (4) et~N(0, σ2)
16
最小平方估計式的變異數與共變數 (1) σ2 Var(b2) 越不精確 (2)T Var(b2) 越精確
(3)Var(X2 ) Var(b2) 越精確 (4)Cov(X2 , X3 ) Var(b2) 越不精確
17
誤差為常態分配之最小平方估計式的性質 * K:未知係數項的個數
18
衡量配適度 R2 =1-(SSE/SST) R2 的一個難題
K代表變數個數
19
R2 (調整後R2) 的使用: * 優點: 當變數增加時R2並不會一直上升。 * 缺點: (1)失去原有的解釋,即R2不再是被解釋的變異百分比。 (2)此修正後的R2有時會被誤用為選擇一組適當的解釋變數之方法。 (3)若模型未包含截距項,則衡量的R2 就不適合了。
20
複迴歸模型的進一步推論 受限制的最小平方 單一參數 t 檢定 聯合虛無假設 F 檢定
21
例: y=α0 +α1 X1 +α2 X2+ α3 X3 + e H0: α2 = α3 = 0 即 y= α0 +α1 X1 + e F=
F≧ F(J,T-K, α) 拒絕虛無假設 P=P﹝F(2,96) ≧F﹞< 拒絕虛無假設 J=2 T=觀察值個數(100) K=4 SSER-SSEu/J SSEu/(T-K) 2, 96, 0.05
22
虛無假設中不能包含任何「大於」或者「小於」的假設。
H0: β2=0, β3=0… βK=0 H1: β2 0 或β3 0 ,或兩者都不為零,βK 中至 少有一個不是零 若 J=1, F= T2
23
注意若模型為: y= β0 + β1 X1 + β2X22+ e =2β2X2 隱含 X2 對每個y有不 同程度的影響
dy dX2 dy dX1
24
其他例子 y= β0 + β1 X1 + β2X2+ e H0: β1=β2 H1: β1β2 y= β0 + β1 (X1 + X2)+ e F test F(1,T-3, α)
25
模型設定 模型選擇的三個重要要素 : (1)函數形式的選擇 (2)選擇包含的解釋變數(迴歸式)的模型。
(3)複迴歸模型的假設MR1-MR6是否成立。
26
1. 遺漏以及不相關的變數 例:y= β0 + β1 X1 + β2X2+ e 假設我們漏了X2 ,以下列式子進行迴歸分析:
y= β0 +β1*X1 + e 若 Cov(X1 ,X2) 0 則 β1* β1 我們得到非常強的虛無假設,β2=0。 然而, Cov(X1 ,X2)=0 的情形非常少見 E(b1*)=β1+β2 Cov(X1, X2) Var(X1)
27
若估計出的方程式有出現未預期,或大小不符現實的係數時,造成這些怪異結果的一個可能原因就是遺漏了重要的變數。
T檢定或F檢定這兩種顯著檢定可以評估是否一個變數或一組變數包含在一個方程式中。
28
必須注意,有兩種可能的原因,不拒絕虛無假設的結果。
(1)對應的變數不會影響 y ,且可以排除在模型之外。(但是結果不能拒絕虛無假設) (2)對應的變數對於納入模型來說是很重要的,但因資料不夠充分而無法拒絕 H0。
29
1.P(無法拒絕 H0│虛無假設為真) Accept H0 => 不顯著係數 2.P(無法拒絕 H0│虛無假設不為真) 如果因為不顯著就去除此變數,要小心喔! 我們可能會排除一個不相關的變數,但也可能造成剩餘的係數估計值會產生遺漏變數的偏誤。
30
所以 ,儘可能在模型中納入最多的變數? Y=β0+β1X1+β2X2+e <= true model (1) 但是估計 Y=β0+β1X1+β2X2+β3X3+e (2) Var (b1),Var (b2),Var (b3)在 (2)式中 比在 (1)式中來的大。 若X3與X2,X1相關,但是理論上X3不影響Y。
31
2. 檢定模型是否設定錯誤: RESET 檢定 是否設定錯誤可用下列問題瞭解: (1) 是否遺漏重要變數? (2) 是否納入重要變數? (3) 是否選擇錯誤的函數形式? (4) 是否違背假設? RESET檢定(Regression Specification Error Test) RESET的用意是發現遺漏的變數,以及不正確的函數形式。
32
假設: Y=β0+β1X1+β2X2+e =b0+b1X1+b2X2 Y=β0+β1X1+β2X2+r e (1) Y=β0+β1X1+β2X2+r r e (2) (1) 檢定 H0: r1=0 H1: r1≠0 (2) 檢定 H0: r1= r2=0 H1: r1≠0 或 r2≠0 拒絕H 表示原始的模型不適當,且可以改進。 無法拒絕H0 表示此檢定沒有發現任何設定錯誤的情況。 只能告訴模型不好,不能告訴模型是好的。
Similar presentations