Chapter 13 合併跨期的橫斷面: 簡單縱橫資料法
獨立的合併橫斷面 vs. 縱橫資料 獨立的合併橫斷面(independently pooled cross section) 是透過對不同時點(通常是不同年份) 的一個大母體隨機抽樣而得。他們包含獨立的樣本觀察值。
獨立的合併橫斷面 vs. 縱橫資料 縱橫資料(panel data) 雖然同樣有橫斷面和時間序列的維度,其與獨立的合併橫斷面有一些重要的差異。要收集縱橫資料- - 有時稱為longitudinal 資料(longitudinal data) - - 我們是跨期追蹤相同的個人、家庭、公司、城市、州等。例如,一個個別工資、工作時數、教育,和其他因素的縱橫資料是先對母體的某個時點隨機抽出一些人。接著,再對同樣這些人在未來數期作調查。如此才得出不同年份之相同一群人的工資、工作時數、教育等等。
合併跨期的獨立橫斷面 使用獨立的合併橫斷面的一個原因是增大樣本。透過分析由相同母體,但不同時點抽出的隨機樣本,我們可以得到較精確的估計式和較有檢定力的檢定統計量 我們會允許不同期(通常是年)的截距項不同。這是加入除了基期(通常是樣本中的第一年) 之外每一年的虛擬變數即可。 練習:p529 範例13.1 p531範例13.2
跨期結構變化之Chow 檢定 之前我們討論了Chow 檢定(其為F 檢定) 可用來判定二個群體的複迴歸函數是否不同。我們可以將該檢定用於二個不同期間。一種檢定的作法是先將所有資料合併估計並求出殘差平方和以作為受限制的SSR。未受限制的SSR 則是二期分別估計所求出二個SSR 的加總。 練習:case13.2
合併橫斷面的政策分析 範例13.3(垃圾焚化爐位置對房價的效應) 研究範例顯示,二個分別在事件前和事件後收集的橫斷面資料集,可用來判定事件的效應。 練習:case13.3 p.535
合併橫斷面的政策分析 當資料是取材自自然實驗(natural experiment) [或準實驗(quasi-experiment)]時可運用此方法。一個自然實驗的發生是某外生事件- - 通常是政府政策的改變- - 改變了個人、家庭、公司或城市運作的環境。自然實驗必有一個控制組,其不受到政策改變的影響,且會有個試驗組,其被認為會受到政策改變的影響。
差異的差分估計式 對第一期和第二期而言,兩個群組 A, B (y2,B – y2,A) - (y1,B – y1,A),或是 (y2,B – y1,B) - (y2,A – y1,A),即為差異的差分估計式 練習:case13.3 p.536
二期縱橫資料分析 遺漏變數的問題。一種解決之道是試著控制更多因素,但很多因素可能很難控制。 另一種使用縱橫資料的方式是將影響應變數的不可觀察因素分成二部分:一部分是不會隨時間變動的,另一部分是會隨時間變動。 不隨時間變動的因素,一般稱ai 為不可觀察效果(unobserved effect)或固定效果(fixed effect)
固定效果模型 設母體模型為 yit = β0 + δ0d2t + β1xit + vit ,t =1,2 其中 vit = ai + uit ,通常稱為組合誤點(composite error)。 若 ai 和 xit有相關, 則合併OLS仍是有偏誤和不一致性的。 練習:p543 13.16式
一次差分方程式 其中最重要的假設即△ui 和△xi 無關。 練習:p545 13.18式 練習:case 13.5 練習:case 13.7
多於二期的差分 若有多於二期亦可差分。 除了截距項,代入二個期別虛擬變數。 若有三期的情況,則以第二期減第一期,並以第三期減第二期 練習 case13.9
一次差分縱橫資料的潛在陷阱 當主要自變數跨期變動很小時的潛在問題(若自變數跨期不變,則此方法甚至無效) 當自變數不是嚴格外生時,有更多期通常無法降低FD 估計式的不一致性。 若一個或多個自變數有衡量誤差,FD 估計式可能比合併OLS 還糟。