Download presentation
Presentation is loading. Please wait.
Published byBence Ottó Kovács Modified 5年之前
1
授課內容: 共線性與虛擬變數 簡單線性迴歸模型: 政治大學行政管理碩士學程共同必修課 課程名稱:社會科學研究方法(量化分析)
授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目:Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001), Undergraduate Econometrics. New York: John Wiley & Sons 日期:2011年12月5日
2
共線性的變數 許多變數可能會以某種規律性的方式一起變動,這種變數被稱為是共線性(collinear)的。
當有數個變數牽涉在模型內時,這樣的問題歸類為共線性( collinearity )或線性重合( multicollinearity )。 當模型出現共線性的問題時,要從資料中衡量個別效果(邊際產量)將是非常困難的。
3
當解釋變數幾乎沒有任何變異時,要分離其影響是很困難的,這個問題也是屬於共線性的情況。
共線性所造成的後果 (1)只要解釋變數之間有一個或一個以上的完全線性關係。則完全共線性或完全線性重合的情況會存在,則最小平方估計式無法定義。例:若 r23 (correlation coefficient)= ±1,則 Var(b2) 則是沒有意義的,因為零出現在分母中。 (2)當解釋變數之間存在近似的完全線性關係時,最小平方估計式的變異數、標準誤和共變數中有一些可能會很大 樣本資料所提供有關於未知參數的資訊相當的不精確。
4
(3)當估計式的標準誤很大時 檢定結果不顯著。問題在於共線性變數未能提供足夠的資訊來估計它們的個別效果,即使理論可能指出它們在該關係中的重要性。
(4)對於一些觀察值的加入或刪除,或者刪除一個明確的不顯著變數是非常敏感的。 (5) 如果未來的樣本觀察值之內的共線性關係仍然相同,正確的預測仍然是可能的。
5
分辨與降低共線性 (1) 相關係數 X1、X2 , 若 >0.8 ,0.9 表示有強烈的線性關係
例:如何判斷 X1、X2、X3有collinear? (2) 估計「輔助迴歸」(auxiliary regressions) X2=a1x1+a3x3+……akxk+e 若 R2 高於0.8,其含意為X2的變異中,有很大的比例可以用其他解釋變數的變異來解釋。 Cov(X1, X2)
6
虛擬變數 複迴歸模型(Multiple regression model) y=β0+β1X1+β2X2+…+βkXk+e
βk 當Xk增加一單位,而所有其他變數均保持不變時的E(y)變動。
7
虛擬變數(Dummy variable) 樣本中的某些觀察值,其迴歸參數在模型裡並不相同。 在掌握質化的個別特質時,是很有力的一項工具。 互動變數(Interaction variables)
8
截距虛擬變數 y=β0+β1X1+e 1 若該特質存在 D= 0 若該特質不存在 y=β0+β1X1+αD+e
1 若該特質存在 D= 0 若該特質不存在 y=β0+β1X1+αD+e β0+β1X1+α 當 D=1 E(y)= β0+β1X 當 D=0 D 為截距虛擬變數: 截距項的移動
9
斜率虛擬變數 X1 y=β0+β1X1+γ(DX1) +e β0+β1X1+γX1 當 D=1 E(y) = β0+β1X1 當 D=0
= β 當D=0 E(y) X1
10
X1 若 D 同時影響截距與斜率 y=β0+β1X1+δD+γ(X1D)+e β0+β1X1+δ+γX1 當 D=1 E(y) =
11
常見的虛擬變數應用 每個質化因素的影響都加在迴歸模型的截距項中,且每個虛擬變數的影響都和其它的質化因素無關。
12
2. 有數種類別的質化變數: 教育程度、區域、宗教、種族、性別
將教育程度的所有虛擬變數納入 存在完全共線性的模型。 因為 E0+ E1+ E2+ E3= E0=1- E1-E2-E3 省略一個虛擬變數,並且將其定義為一個參考組。
13
3.控制時間( Controlling for time)
季節虛擬變數:肥沃度 年份虛擬變數: 制度效應(Regime effect): 政治制度, 異常的經濟狀況, 法律環境的改變 檢定:單一質化變數的效果: t test 數個質化變數的效果: F test
14
CHOW檢定(The Chow Test) 兩個類型的迴歸之間是否有差異? 若沒有差異 便可以將這兩類的資料結合成一個樣本。
若沒有差異 便可以將這兩類的資料結合成一個樣本。 y=β0+β1X1+γD+δ(DX1)+e = 男 D = 女 檢定 H0:δ=0, γ=0 或是檢定兩條迴歸式是否相等 y=α0+α1X1+e y=β0+β1X1+ε
15
若 δ=0 則 α1=β1 ,且若γ=0 則 α0=β0 我們可以簡單地估計 pooled? y=a0+a1x1+u 若 H0 不為真, 給予參數非真限制時的結合資料是相同的。不論樣本有多大,都會使最小平方估計式有誤差。
16
Chow Test 估計 y=α0+α1X1+e SSE1 y=β0+β1X1+ε SSE2 y=a0+a1X1+u SSER
Sum=SSEu (SSER-SSE1-SSE2) /J ~FJ , T1+T2-K1-K2 (SSE1+SSE2) /(T-K) T1 T2 J=2,包含截距項的係數個數
Similar presentations