Presentation is loading. Please wait.

Presentation is loading. Please wait.

二元因变量回归.

Similar presentations


Presentation on theme: "二元因变量回归."— Presentation transcript:

1 二元因变量回归

2 通常的经济计量模型都假定因变量是连续的,但是在现实的经济决策中经常面临许多选择问题。人们需要在可供选择的有限多个方案中作出选择,与通常被解释变量是连续变量的假设相反,此时因变量只取有限多个离散的值作为被解释变量建立的计量经济模型,称为离散选择模型(discrete choice model, DCM)。

3 二元选择模型 在离散选择模型中,最简单的情形是在两个可供选择的方案中选择其一,此时被解释变量只取两个值,称为二元选择模型(binary choice model)。 例如:在讨论家庭是否购车的问题中,可将家庭购车的决策用数字1 表示,而将家庭不购车的决策用数字0表示。

4 如果x作为说明某种具体经济问题的自变量,则应用以前介绍虚拟变量知识就足够了。如果现在考虑某个家庭在一定的条件下是否购车问题时,则表示状态的虚拟变量就不再是自变量,而是作为一个被说明对象的因变量出现在经济模型中。因此,需要对以前讨论虚拟变量的分析方法进行扩展,以便使其能够适应分析类似家庭是否购车的问题。

5 如果解释变量是离散的(比如,虚拟变量),这并不影响回归。但有时被解释变量是离散的,而非连续的。比如,个体的如下选择行为(人生充满了选择):
二值选择(binary choices):考研或不考研;就业或待业;买房或不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回国。

6 在离散选择模型中,影响是否购车的因素有哪些?
汽车本身所具有的属性,如价格、型号等; 决策者的收入水平 决策者对车的偏好程度等。 如果我们要研究是否买车与收入之间的关系,即研究具有某一收入水平的个体买车的可能性。因此,二元选择模型的目的是研究具有给定特征的个体作某种而不作另一种选择的概率。

7 为了深刻地理解二元选择模型,首先从最简单的线性概率模型开始讨论。线性概率模型的回归形式为:
其中:N是样本容量;k是解释变量个数;xj为第j个个体特征的取值。例如,x1表示收入;x2表示汽车的价格;x3表示消费者的偏好等。设 yi 表示取值为0和1的离散型随机变量。ui为相互独立且均值为0的随机扰动项。

8 现在约定备择对象的0和1两项选择模型中,下标i表示各不同的经济主体,取值0或1的因变量表示经济主体的具体选择结果,而影响经济主体进行选择的自变量。如果选择响应Yes的概率为:
经济主体选择响应No的概率为,

9 根据经典线性回归,我们知道其总体回归方程是条件期望建立的,这使我们可以构造线性概率模型:

10 一个例子 被解释变量: 房屋抵押贷款申请是否被拒deny。 1:被拒 0:不被拒 解释变量:种族(是否黑人)black
1:被拒 :不被拒 解释变量:种族(是否黑人)black 还款收入比 P/I ratio

11 下画出了数据集中2380个观测值中127个deny对P/I ratio的数据散点图。

12

13 由这127个观测值估计出的OLS回归线。同前,这条直线画出了用回归变量还款/收入比表示的deny预测值的函数图。
例如,当P/I ratio=0.3时,deny的预测值大约为0.2。可以理解为P/I ratio=0.3时,被拒的概率为0.2,即如果有许多申请者的P/I ratio=0.3 ,则其中有20%的申请会被拒。

14 二元选择模型的三种主要类型: 线性概率模型(LPM) Probit模型 Logit模型

15 线性概率模型

16

17 被拒概率的计算: 假设某人的P/I ratio为0.3,计算他的被拒概率: 被拒概率= *0.3=0.1012=10.12%

18 上述方程再增加一个是否为黑人的虚拟变量,则方程变为:

19 线性概率模型的优点 线性概率模型的优点是,计算方便,且容易得到边际效应(即回归系数)。 直接使用reg命令即可。

20 线性概率模型的缺点 被解释变量常常超出0-1范围。 当P/I ratio 小于 0.132 时 deny<0
处理方式:发现被解释变量大于1,则取1;被解释变量小于0,则取0。

21 Probit和Logit回归 Probit和Logit回归是特别为二元因变量设计的非线性回归模型。
由于二元因变量Y的回归建立了Y=1的概率模型,因此采用使预测值落在0到1之间的非线性形式才有意义。 由于累积概率分布函数产生的概率位于0到1之间,因此我们把它们应用到Probit和Logit回归中。其中Logit回归也称为logistic回归。

22 Probit 回归 Probit模型假定误差项的分布形式为标准正态分布:

23 累积正态概率分布曲线 Probit模型为

24 Logit 模型 Logit模型假定模型的误差项服从Logistic分布 Logistic分布函数

25 逻辑分布的密度函数关于原点对称,期望为0,方差为
(大于标准正态的方差),具有厚尾(fat tails)。   在实践中,Probit与Logit都很常用,二者的估计结果(比如边际效应)也通常很接近。   Logit模型的优势在于,逻辑分布的累积分布函数有解析表达式(而标准正态分布没有),故计算Logit更为方便。

26 边际效应分析 对于Probit模型来说,其边际效应为: 对于Logit模型,其边际效应为: 其中,

27 从上式可以看到,Probit和Logit模型中解释变量对Yi取值为1的概率的边际影响不是常数,它会随着解释变量取值的变化而变化。因此:回归结果的系数并不能真正表示其边际效应。
deny=-2+3*P/I ratio+u 当P/I ratio=0.4时,如何计算被拒概率?

28 例2:利用Probit模型计量出结果为: deny=-2+3*P/I ratio+u 当P/I ratio从0.3变到0.4时,被拒概率的变化?

29 贷款的例子 当P/I ratio从0.3变到0.4时,被拒概率的变化?

30 1. 求P/I ratio=0.3的白人申请者的被拒的概率
将 P/I ratio=0.3并且 black=0带入,得概率为 7. 5%。 2.求P/I ratio=0.3的黑人申请者的被拒的概率 将 P/I ratio=0.3并且 black=1带入,得概率为23.3%。 二者之间相差15. 8个百分点。

31 Logit模型与Probit模型累积分布图和计算方法类似,仅累积分布函数形式不同。

32 假设利用Logit模型回归的方程为 则P/I ratio=0.3的白人的被拒概率为:

33 边际效应 由于Probit与Logit所使用的分布函数不同,故其参数估计值并不直接可比。
这也是两种模型的最大的缺点:系数通常无法解释,也无法比较。 这就需要分别计算二者的边际效应,然后进行比较。 由表达式可知,对于非线性模型而言,边际效应通常不是常数,它随着解释向量 而变。 

34 边际效应 (1) 平均边际效应: (average marginal effect),即分别计算在每个样本观测值上的边际效应,然后进行简单算术平均。  (2) 样本均值处的边际效应 (marginal effect at mean),即计算在X均值 处的边际效应。  (3) 在某代表值处的边际效应 (marginal effect at a representative value)。 传统上,常计算平均边际效应。

35 Logit模型的几率比

36 Probit和Logit回归算法 1. 非线性最小二乘估计 2. 最大似然估计 关于拟合优度:如何衡量(非线性)二值模型的拟合优度呢?
Stata仍然汇报一个“准R2 ”或者称为 “伪R2 ”(Pseudo R2)。

37 ,判断拟合优度的另一方法是计算“正确预测的百分比”(percent correctly predicted)。
如果发生概率的预测值超过0.5 ,则认为其预测 y=1;  反之,则认为其预测 y=0。   将预测值与实际值(样本数据)进行比较,即可计算正确预测的百分比。

38 一个综合例子 使用美国妇女就业数据集“womenwork.dta”,估计决定就业的Probit与Logit模型。被解释变量为work=1,就业;work=0,不就业。解释变量为age(年龄), married(婚否), children(子女数),education(教育年限)。

39 reg work age married children education 2.利用线性概率模型回归
use womenwork,clear 1. 利用线性概率模型回归 reg work age married children education 2.利用线性概率模型回归 logit work age married children education 系数完全不同,无法给与解释。

40 3. 计算平均边际效应,与线性模型比较 margins,dydx(*) 4. 计算正确预测的百分比 estat class 结果中:敏感性(Sensitivity)指真实值取1而预测准确的概率; 特异性(Specificity)是指真实值取0而预测准确的概率。 默认的门限值为0.5。

41 5. 查看个体预测信息 predict p1,pr list work p1 in 1/100 对比一下结果,判断有正有误 6
5. 查看个体预测信息 predict p1,pr list work p1 in 1/100 对比一下结果,判断有正有误 6. 受试者操控曲线(Receiver operating characteristic,简称为ROC曲线)是指敏感性与(1-特异性)的散点图,即预测值等于1的准确率与错误率的散点图。 lroc

42 7。goodness-of-fit 拟合优度检验
estat gof 8. 计算logit模型的几率比 logit work age married children education,or

43 Probit模型的操作类似 probit work age married children education margins,dydx(*) estat class predict p2,pr list work p2 in 1/100 lroc estat gof


Download ppt "二元因变量回归."

Similar presentations


Ads by Google