多元回归分析:虚拟变量 y = b0 + b1x1 + b2x2 + . . . bkxk + u 计量经济学导论 刘愿
Dummy Variables A dummy variable is a variable that takes on the value 1 or 0 Examples: male (= 1 if are male, 0otherwise), south (= 1 if in the south, 0 otherwise), etc. Dummy variables are also called binary variables, for obvious reasons 计量经济学导论 刘愿
A Dummy Independent Variable Consider a simple model with one continuous variable (x) and one dummy (d) y = b0 + d0d + b1x + u This can be interpreted as an intercept shift If d = 0, then y = b0 + b1x + u If d = 1, then y = (b0 + d0) + b1x + u The case of d = 0 is the base/benchmark group 计量经济学导论 刘愿
{ } Example of d0 > 0 d0 b0 y = (b0 + d0) + b1x y = b0 + b1x y slope = b1 { d0 d = 0 y = b0 + b1x b0 } x 计量经济学导论 刘愿
计量经济学导论 刘愿
例7.1 是否存在性别歧视 计量经济学导论 刘愿
例7.2 拥有计算机 与大学GPA 计量经济学导论 刘愿
例7.3 培训津贴对培训小时数的影响 问题的关键是:定性变量所度量的影响是否为因果性? 办法之一是,尽可能控制与虚拟变量及因变量相关的因素。 计量经济学导论 刘愿
当因变量为log(y)时对虚拟变量系数的解释 当自变量中有一个或多个虚拟变量时,因变量以对数形式出现,虚拟变量的系数具有一种百分比解释。 在保持其他因素不变的情况下,一套殖民地建筑风格的住房的卖价预计高出约5.4%。 计量经济学导论 刘愿
当y有较大比例变化时,如何更准确估计y变化的百分比? 计量经济学导论 刘愿
计量经济学导论 刘愿
Dummies for Multiple Categories 在应用研究中,我们需要使用多个虚拟变量。 在控制性别的基础上,研究婚姻状态的影响; 在区域研究中,往往区分东、中、西部;在省级面板数据中,甚至会引入n-1个地区虚拟变量。 虚拟变量可以描述包含序数的信息:信用等级 计量经济学导论 刘愿
例7.6 工资方程 估计一个工资对如下四组都不同的模型:已婚男人、已婚女人、单身男人、单 身女人。首先选择基组:单身男人,对剩下的每一组定义一个虚拟变量,并称 之为marrmal,marrfem,和singfem。因此,三个虚拟变量的估计量度量的都是与 单身男人相比,工资的比例差异。 计量经济学导论 刘愿
在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。 如果要比较特定两组之间工资的差异,可以重新设定基组进行回归分析。例如,为检验单身女人和已婚女人之间的估计差异是否显著,以已婚女人组作为基组重新估计得到: 在方程中包括虚拟变量来象征不同组的一般原则:如果回归模型有g组或g类不同的截距,在模型中则包含g-1个虚拟变量和一个1截距。 计量经济学导论 刘愿
通过虚拟变量来包含序数信息 序数变量:穆迪或标准普尔对地方政府债券的质量进行了级别评定,假设等级范围从零到四,零为最低的信用等级,四位最高的信用等级,记为CR。然而,很难有意义地解释CR变化一个单位对MBR的影响。 计量经济学导论 刘愿
计量经济学导论 刘愿
例7.7 相貌吸引力对工资的影响 在劳动力市场中,除了存在性别歧视之外,还可能存在相貌、身高等歧视。如果将样本相貌分为三类:一般水平、低于一般水平、高于一般水平,并以一般水平组作为基组,分别对男人、女人估计方程得: 计量经济学导论 刘愿
计量经济学导论 刘愿
例7.8 法学院排名对起薪的影响 计量经济学导论 刘愿
计量经济学导论 刘愿
涉及虚拟变量的交互作用 虚拟变量之间的交互作用 例7.6根据婚姻状况和性别定义了四个类别,在模型中引入三个虚拟变量,以单身男性为基组研究了不同类别之间的工资差异。除此之外,还有什么方法? 计量经济学导论 刘愿
此外,我们还可以在female和married分别出现的模型中,增加一个female和married的交互项,同样可以进行组别工资差异比较。 计量经济学导论 刘愿
例7.9 计算机使用对工资的影响 计量经济学导论 刘愿
容许出现不同的斜率 虚拟变量之间的交互项反映的是截距之间的差异,斜率并未发生变化。含义是:样本回归曲线是平行的。 虚拟变量与非虚拟变量之间也有交互作用,使得出现不同的斜率。 计量经济学导论 刘愿
计量经济学导论 刘愿
受教育水平相同的男性和女性的平均工资相同。 我们关心的两个假设: 男性和女性受教育的回报是相同的。 受教育水平相同的男性和女性的平均工资相同。 计量经济学导论 刘愿
例7.10 对数小时工资方程 计量经济学导论 刘愿
计量经济学导论 刘愿
检验不同组之间回归函数上的差别 现在,我们考察的虚拟假设是:两个总体或两组具有同一个回归函数;对立假设是,各组间有一个或多个斜率是不同的。 计量经济学导论 刘愿
计量经济学导论 刘愿
计量经济学导论 刘愿
一般的检验方法:邹至庄统计量 计量经济学导论 刘愿
邹至庄检验的步骤: 确立回归的一般模型,明确受约束模型和不受约束模型的自由度。(约束个数:k+1) 分别将两组进行回归得到SSR1和SSR2。 将两组数据混合并重新估计模型得到受约束模型的残差平方和SSR. 运用公式计算邹统计量,检验显著性水平。 计量经济学导论 刘愿
计量经济学导论 刘愿
7.5 二值因变量:线性概率模型 迄今为止,我们讨论的因变量均具有定量的含义。如果用多元回归解释一个定性事件,需引入二值因变量,即y只取0和1两个值。例如,y表示一个成年人是否受过高中教育,或一个大学生在给定年份是否用过非法毒品等。 计量经济学导论 刘愿
计量经济学导论 刘愿
计量经济学导论 刘愿
17 计量经济学导论 刘愿
计量经济学导论 刘愿
计量经济学导论 刘愿
7.6 对政策分析和项目评价的进一步讨论 ——内生性问题 7.6 对政策分析和项目评价的进一步讨论 ——内生性问题 在社会科学研究中,对照组和处理组并不是随机指定的,因此可能遭遇变量内生性问题。 计量经济学导论 刘愿
计量经济学导论 刘愿
自选择(self-selection)问题 个人自己选择加入某种行为或项目的事实:参与并不是随机决定的。 计量经济学导论 刘愿
一般而言,党员在大学生就业市场中具有一定的优势。那么,用人单位究竟是看中党员这种政治身份,还是看中党员身后所具备的能力素质。 政治面貌是否影响大学生就业? 一般而言,党员在大学生就业市场中具有一定的优势。那么,用人单位究竟是看中党员这种政治身份,还是看中党员身后所具备的能力素质。 计量经济学导论 刘愿