工具变量回归
例一 Mincer (1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。针对美国面板调查数据中的年轻男子组群(Young Men’s Cohort of the National Longitudinal Survey,简记 NLS-Y),Griliches (1976)采用工具变量法对遗漏变量问题进行了校正。Blackburn and Neumark (1992)更新 了 Griliches (1976)的数据,即这个例子中将要使用的数据集grilic.dta。
该数据集中包括以下变量:lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledge of the World of Work”测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966—1973年中的某一年)。
这是一个两期面板数据,初始期为当以上变量有数据的最早年份,结束期为1980 年。不带80字样的变量名为初始期,带80字样的变量名为1980年数据。比如,iq 指的是初始期的智商,而lw80指的是1980年的工资对数。
(1) 先看一下数据的统计特征。 use grilic.dta,clear sum (2) 考察智商与受教育年限的相关关系。 pwcorr iq s,sig (3) 建立如下方程: reg lw80 s80 expr80 tenure80
继续对方程进行分析:我们发现了如下问题: 1。遗漏变量问题:认为方程遗漏了“能力”这个变量,加入iq(智商)作为“能力”的代理变量。 reg lw80 s80 iq expr80 tenure80
2。测量误差问题:iq(智商)对“能力”的测量存在误差。 3。变量内生性问题:s80可能与扰动项中除“能力”以外的其他因素相关,因此是内生变量。 解决方法:引入四个变量med,kww,mrt,age,作为内生解释变量iq与s80的工具变量。 然后使用TSLS方法进行回归。 ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first
几点注意事项: 1。 first选项的目的是显示TSLS第一阶段的结果,如果省略,则仅显示第二阶段的结果。 2。命令的用法比较严格,将被解释变量和所有外生解释变量放到括号外面,内生解释变量放到括号里面,等号后面为所有工具变量。 3。2SLS只能通过stata完成,利用定义手动计算的结果是错误的,因为残差序列是错误的。
4。不可能单独为每个内生变量指定一组特定的工具变量,而是给所有内生变量指定一系列工具变量 。 5。所有外生变变量都作为自己的工具变量。 6。为了检验工具变量的外生性,本题为过度识别。 7。在大样本下,IV 估计是一致的,但在小样本下,IV 估计并非无偏估计量,有些情况下偏误可能很严重。
弱工具变量检验 检验方法: 1。初步判断可以用偏R2(partial R2) (剔除掉模型中原有外生变量的影响)。 2。 Minimum eigenvalue statistic(最小特征值统计量),经验上此数应该大于10。 这个方法类似于与书上的“第一阶段F统计量” 。
工具变量外生性检验 我们一般称为过度识别约束J检验。 检验工具变量是否与干扰项相关,即工具变量是否为外生变量。 TSLS根据Sargan统计量进行过度识别检验 。 命令为: estat overid 检验工具变量的外生性。 H0:所有工具变量都是外生的。 H1:至少有一个工具变量不是外生的,与扰动项相关。
ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first estat firststage estat overid
究竟该用OLS 还是IV 解释变量是否真的存在内生性? 假设能够找到方程外的工具变量。 1。如果所有解释变量都是外生变量,则OLS 比IV 更有效。在这种情况下使用IV,虽然估计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则OLS 是不一致的,而IV 是一致的。
检验方法:豪斯曼检验检验 豪斯曼检验(Hausman specification test) H0 :所有解释变量均为外生变量。 quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store iv hausman iv ols hausman iv ols,sigmamore