Download presentation
Presentation is loading. Please wait.
1
多元回归分析:虚拟变量 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿
2
Dummy Variables A dummy variable is a variable that takes on the value 1 or 0 Examples: male (= 1 if are male, 0otherwise), south (= 1 if in the south, 0 otherwise), etc. Dummy variables are also called binary variables, for obvious reasons 计量经济学导论 刘愿
3
A Dummy Independent Variable
Consider a simple model with one continuous variable (x) and one dummy (d) y = b0 + d0d + b1x + u This can be interpreted as an intercept shift If d = 0, then y = b0 + b1x + u If d = 1, then y = (b0 + d0) + b1x + u The case of d = 0 is the base/benchmark group 计量经济学导论 刘愿
4
{ } Example of d0 > 0 d0 b0 y = (b0 + d0) + b1x y = b0 + b1x y
slope = b1 { d0 d = 0 y = b0 + b1x b0 } x 计量经济学导论 刘愿
5
计量经济学导论 刘愿
6
例7.1 是否存在性别歧视 计量经济学导论 刘愿
7
例7.2 拥有计算机 与大学GPA 计量经济学导论 刘愿
8
例7.3 培训津贴对培训小时数的影响 问题的关键是:定性变量所度量的影响是否为因果性? 办法之一是,尽可能控制与虚拟变量及因变量相关的因素。
计量经济学导论 刘愿
9
当因变量为log(y)时对虚拟变量系数的解释
当自变量中有一个或多个虚拟变量时,因变量以对数形式出现,虚拟变量的系数具有一种百分比解释。 在保持其他因素不变的情况下,一套殖民地建筑风格的住房的卖价预计高出约5.4%。 计量经济学导论 刘愿
10
当y有较大比例变化时,如何更准确估计y变化的百分比?
计量经济学导论 刘愿
11
计量经济学导论 刘愿
12
Dummies for Multiple Categories
在应用研究中,我们需要使用多个虚拟变量。 在控制性别的基础上,研究婚姻状态的影响; 在区域研究中,往往区分东、中、西部;在省级面板数据中,甚至会引入n-1个地区虚拟变量。 虚拟变量可以描述包含序数的信息:信用等级 计量经济学导论 刘愿
13
例7.6 工资方程 估计一个工资对如下四组都不同的模型:已婚男人、已婚女人、单身男人、单
身女人。首先选择基组:单身男人,对剩下的每一组定义一个虚拟变量,并称 之为marrmal,marrfem,和singfem。因此,三个虚拟变量的估计量度量的都是与 单身男人相比,工资的比例差异。 计量经济学导论 刘愿
14
在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。
如果要比较特定两组之间工资的差异,可以重新设定基组进行回归分析。例如,为检验单身女人和已婚女人之间的估计差异是否显著,以已婚女人组作为基组重新估计得到: 在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。 计量经济学导论 刘愿
15
通过虚拟变量来包含序数信息 序数变量:穆迪或标准普尔对地方政府债券的质量进行了级别评定,假设等级范围从零到四,零为最低的信用等级,四位最高的信用等级,记为CR。然而,很难有意义地解释CR变化一个单位对MBR的影响。 计量经济学导论 刘愿
16
计量经济学导论 刘愿
17
例7.7 相貌吸引力对工资的影响 在劳动力市场中,除了存在性别歧视之外,还可能存在相貌、身高等歧视。如果将样本相貌分为三类:一般水平、低于一般水平、高于一般水平,并以一般水平组作为基组,分别对男人、女人估计方程得: 计量经济学导论 刘愿
18
计量经济学导论 刘愿
19
例7.8 法学院排名对起薪的影响 计量经济学导论 刘愿
20
计量经济学导论 刘愿
21
涉及虚拟变量的交互作用 虚拟变量之间的交互作用
例7.6根据婚姻状况和性别定义了四个类别,在模型中引入三个虚拟变量,以单身男性为基组研究了不同类别之间的工资差异。除此之外,还有什么方法? 计量经济学导论 刘愿
22
此外,我们还可以在female和married分别出现的模型中,增加一个female和married的交互项,同样可以进行组别工资差异比较。
计量经济学导论 刘愿
23
例7.9 计算机使用对工资的影响 计量经济学导论 刘愿
24
容许出现不同的斜率 虚拟变量之间的交互项反映的是截距之间的差异,斜率并未发生变化。含义是:样本回归曲线是平行的。
虚拟变量与非虚拟变量之间也有交互作用,使得出现不同的斜率。 计量经济学导论 刘愿
25
计量经济学导论 刘愿
26
受教育水平相同的男性和女性的平均工资相同。
我们关心的两个假设: 男性和女性受教育的回报是相同的。 受教育水平相同的男性和女性的平均工资相同。 计量经济学导论 刘愿
27
例7.10 对数小时工资方程 计量经济学导论 刘愿
28
计量经济学导论 刘愿
29
检验不同组之间回归函数上的差别 现在,我们考察的虚拟假设是:两个总体或两组具有同一个回归函数;对立假设是,各组间有一个或多个斜率是不同的。
计量经济学导论 刘愿
30
计量经济学导论 刘愿
31
计量经济学导论 刘愿
32
一般的检验方法:邹至庄统计量 计量经济学导论 刘愿
33
邹至庄检验的步骤: 确立回归的一般模型,明确受约束模型和不受约束模型的自由度。(约束个数:k+1)
分别将两组进行回归得到SSR1和SSR2。 将两组数据混合并重新估计模型得到受约束模型的残差平方和SSR. 运用公式计算邹统计量,检验显著性水平。 计量经济学导论 刘愿
34
计量经济学导论 刘愿
35
7.5 二值因变量:线性概率模型 迄今为止,我们讨论的因变量均具有定量的含义。如果用多元回归解释一个定性事件,需引入二值因变量,即y只取0和1两个值。例如,y表示一个成年人是否受过高中教育,或一个大学生在给定年份是否用过非法毒品等。 计量经济学导论 刘愿
36
计量经济学导论 刘愿
37
计量经济学导论 刘愿
38
17 计量经济学导论 刘愿
39
计量经济学导论 刘愿
40
计量经济学导论 刘愿
41
7.6 对政策分析和项目评价的进一步讨论 ——内生性问题
7.6 对政策分析和项目评价的进一步讨论 ——内生性问题 在社会科学研究中,对照组和处理组并不是随机指定的,因此可能遭遇变量内生性问题。 计量经济学导论 刘愿
42
计量经济学导论 刘愿
43
自选择(self-selection)问题
个人自己选择加入某种行为或项目的事实:参与并不是随机决定的。 计量经济学导论 刘愿
44
一般而言,党员在大学生就业市场中具有一定的优势。那么,用人单位究竟是看中党员这种政治身份,还是看中党员身后所具备的能力素质。
政治面貌是否影响大学生就业? 一般而言,党员在大学生就业市场中具有一定的优势。那么,用人单位究竟是看中党员这种政治身份,还是看中党员身后所具备的能力素质。 计量经济学导论 刘愿
Similar presentations