質性資料的複迴歸分析:二元變數(虛擬變數) Chapter 7 質性資料的複迴歸分析:二元變數(虛擬變數)
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第271-272頁 7.1 描述質性資料 質性因子通常以二元資訊的方式呈現:某人的性別、是否擁有個人電腦、公司是否提供有員工退休金計畫、某州是否有死刑的懲罰等等。這些關切性資訊都可以被定義成二元變數(binary variable),或是一種0 或1 的變數。在計量經濟學中,這類的二元變數通常稱為虛擬變數(dummy variables)。 在使用虛擬變數時,必須要先決定什麼事件發生,其變數值給定為1,什麼事件將給定為0。 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第271-272頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第273頁 表7.1 7.1 描述質性資料 female=1 表示此人為女性 married=1 表示此人已婚 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第273頁 表7.1
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第272.275頁 7.2 單一的虛擬自變數 最簡單的模式,只需要加入一個虛擬解釋變數,以及另一個自變數。 使用過多的虛擬變數來描述給定的群組時,就會產生所謂的虛擬變數的陷阱(dummy variable trap)。 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第272.275頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第274頁 圖7.1 7.2 單一的虛擬自變數 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第274頁 圖7.1
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第274頁 圖7.1 7.2 單一的虛擬自變數 練習 課本p276範例7.1 若其他條件一樣之下,男女的薪資是否有明顯的不同!? 課本p277範例7.2 若其他條件一樣之下,擁有電腦是否對成績有明顯影響!? CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第274頁 圖7.1
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第277-278頁 7.2 單一的虛擬自變數 在很多例子中,虛擬變數反映出個人或其他經濟單位的選擇(對應於一些預先決定的變數,如性別)。因此,變數間的因果關係便是主要的議題。 政策面分析(policy analysis) 的關聯性。在第一個例子,我們想知道性別歧視對於工作的影響;第二個例子是研究擁有電腦對於大學成績表現的影響。在這類屬於政策面分析中有個特例,即計畫的評價(program evaluation),也就是我們想知道經濟上或社會性的計畫對於個人、公司、社區或城市等等所造成的影響。 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第277-278頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第278頁 7.2 單一的虛擬自變數 從最簡單的釋例看,有兩群研究的對象。一是不參與計畫的控制群組(control group);二是實驗群組(experimental group),或稱試驗群組(treatment group),則是參與計畫的。這些群組的定義皆從實驗科學中找出,但它們不能就字面意義上去看。 除了在某些少數事例,控制組與試驗組並非是隨機選取的。然而,某些情況下,複迴歸分析可用來控制足夠數量的其他因素以便估計出計畫的因果關係。 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第278頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第283-284頁 7.3 多個範疇下使用虛擬變數 在同一個迴歸式中,我們可以用上好幾個虛擬自變數。 如果迴歸模型必須要有不同的截距來表示,如g 個群組或分類,除了需要一項截距項外,我們還需要加入g -1個虛擬變數。 基礎群組的截距項就是模型中總的截距項,而不同群組的虛擬變數係數則表示該群組與基礎群組之截距項的估計差距。 P282 範例7.6 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第283-284頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第285頁 使用虛擬變數合併順序資訊 課本範例7.7 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第285頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第289頁 7.4 含虛擬變數的交互作用 虛擬變數間的交互作用 如同量化變數,虛擬變數在迴歸模型中也可以產生交互的意義。 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第289頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第289頁 虛擬變數間的交互作用 範例7.6,我們以性別與婚姻狀態來定義四種分類。事實上,我們可以藉由增加female 及married 的交互項(interaction term) 重新改變原先的模型,且可以說明(7.11) 式中因性別所造成的結婚溢酬。 課本p289 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第289頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第290頁 允許不同的斜率 我們也會利用虛擬變數及非虛擬變數的自變數相乘之交叉項來允許斜率上的差異(difference in slopes)。 假設我們希望檢定男女之間的教育報酬是否相同,並允許男女之間有一個固定的薪資差距(實證上的確有此差距)。為了簡化模型,我們只將教育程度與性別納入模型。何種模型可以允許不同的教育報酬?考慮下面的模型 7.16 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第290頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第291頁 圖7.2 允許不同的斜率 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第291頁 圖7.2
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第291-292頁 7.4 含虛擬變數的交互作用 我們要如何估計模型(7.16)?為了引用OLS,我們必須將模型寫成含有female 和educ 的交互項: 課本p292 7.17 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第291-292頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第297頁 7.4 含虛擬變數的交互作用 不同群體間差異的檢定 課本p295 要檢定某群體之於其他群體的迴歸函數是否不同,我們可想成去檢定虛擬變數和所有其他x變數交叉項之聯合顯著性。 所以,我們可估計有所有交叉項的模型,以及沒有任何交叉項的模型來求的F統計量 ,但這並不簡便。 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第297頁
CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第297頁 7.4 含虛擬變數的交互作用 F 統計量: n 是全部的觀測值個數,這個特別的F 統計量在計量經濟學中稱為Chow 統計量(Chow statistic)。由於Chow 檢定只是個F 檢定,它只有在同質變異性之下才有效。 課本p297 7.24 CH7 質性資料的複迴歸分析:二元變數(虛擬變數) 第297頁