§7.2 二元选择模型 Binary Choice Model

Slides:



Advertisements
Similar presentations
内容说明:  本培训内容根据 2001 年注册会计师考 试辅导教材《会计》一书和《企业会 计制度》(财会[ 2000 ] 25 号)相关 内容编写.
Advertisements

第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
2012 年长春高新技术产业股 份(集团)有限公司 小组成员:胡佳英 杨玲 陈依云 骆朱岚. 长春高新技术产业集团概况 : 年末流动资产合计( ) 年末流动负债合计( ) 存货( 0 ) 经营活动产生的现金流量净额( ) 资产总额(
第八章 现代企业财务管理 第一节 企业财务管理内容与原则 第二节 资金筹集与资产管理 第三节 成本与利润管理 第四节 财务报表分析.
单项选择题 判断题 陈 琳.
§3.4 空间直线的方程.
3.4 空间直线的方程.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
财务绩效评价计分方法 1、基本指标计分 财务绩效定量评价的基本指标计分是按照功效系数法计分原理,将评价指标实际值对照相应行业标准值,按照规定的计分公式计算各项基本指标得分。    (1)单项指标得分= 本档基础分 调整分 + 本档基础分=指标权数×本档标准系数 功效 系数 实际值-本档标准值 调整分=
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
Chapter 5 Logit與Probit迴歸. Chapter 5 Logit與Probit迴歸.
二元因变量回归.
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
面向对象建模技术 软件工程系 林 琳.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
计算机数学基础 主讲老师: 邓辉文.
EM算法 一种参数估计的方法.
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
三角函数诱导公式(1) 江苏省高淳高级中学 祝 辉.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第五章 异方差.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 两变量线性回归.
第四章 多元线性回归分析.
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
§2 方阵的特征值与特征向量.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
滤波减速器的体积优化 仵凡 Advanced Design Group.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Volterra-Lotka方程 1925年, A. Lotka(美)和V. Volterra(意)给出了第一个两物种间的捕食模型。
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

§7.2 二元选择模型 Binary Choice Model 一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验

说明 在经典计量经济学模型中,被解释变量通常被假定为连续变量。 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择模型(DCM, Discrete Choice Model)。 二元选择模型(Binary Choice Model)和多元选择模型(Multiple Choice Model)。 本节只介绍二元选择模型。

离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。 1962年,Warner首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。 70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。 模型的估计方法主要发展于80年代初期。

一、二元离散选择模型的经济背景

实际经济生活中的二元选择问题 研究选择结果与影响因素之间的关系。 影响因素包括两部分:决策者的属性和备选方案的属性。 对于单个方案的取舍。例如,购买者对某种商品的购买决策问题 ,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由决策者的属性决定。 对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由决策者的属性和备选方案的属性共同决定。

二、二元离散选择模型

1、原始模型 对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。 左右端矛盾

由于存在这两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。 需要将原始模型变换为效用模型。 这是离散选择模型的关键。 具有异方差性 由于存在这两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。 需要将原始模型变换为效用模型。 这是离散选择模型的关键。

2、效用模型 第i个个体 选择1的效用 第i个个体 选择0的效用 作为研究对象的二元选择模型

注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即1和0。 很显然,如果不可观测的U1>U0,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具; 相反,如果不可观测的U1≤U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。

3、最大似然估计 欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。 两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。 最大似然函数及其估计过程如下:

标准正态分布或逻辑分布的对称性 似然函数

在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。 1阶极值条件 在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。

三、二元Probit离散选择模型及其参数估计

1、标准正态分布的概率分布函数

2、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计

关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。 应用计量经济学软件。 这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。

例7.2.2 贷款决策模型 分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(CC)和“市场竞争地位等级”(CM),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与CC、CM之间的关系,并为正确贷款决策提供支持。

样本观测值 CC=XY CM=SC

输出的估计结果 该方程表示,当CC和CM已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值CC=15、CM=-1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517;于是,JG的预测值JGF=1-0.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。

模拟预测

预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。

3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计 思路 对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 建立 “概率单位模型” ,采用广义最小二乘法估计 。 实际中并不常用。

对第i个决策者重复观测n次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 定义“观测到的”概率单位

V的观测值通过求解标准正态分布的概率分布函数的反函数得到 实际观测得到的

四、二元Logit离散选择模型及其参数估计

1、逻辑分布的概率分布函数

Börsch-Supan于1987年指出: 如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用Logit模型。

2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计 关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。 应用计量经济学软件。

Probit 0.999999 1.000000 0.447233 0.000000

3、重复观测值可以得到情况下二元logit离散选择模型的参数估计 思路 对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 建立“对数成败比例模型” ,采用广义最小二乘法估计 。 实际中并不常用。

用样本重复观测得到的pi构成“成败比例”,取对数并进行台劳展开,有 逻辑分布的概率分布函数

五、二元离散选择模型的检验

1、计量经济学模型中的两类检验统计量 基于LS 基于ML 原理相同 R2 总体显著性F检验 约束回归的F检验 Wald LR (likelihood ratio) LM (lagrange multiplier) 原理相同

2、拟合检验 P:样本观测值中被解释变量等于1的比例。 L0:模型中所有解释变量的系数都为0时的似然函数值。 LRI=1,即L=1,完全拟合。 LRI=0,所有解释变量完全不显著,完全不拟合。

LnL=-1.639954 LnL0=-52.80224 LRI=0.968942

3、省略变量检验 经典模型中采用的变量显著性t检验仍然是有效的。 如果省略的变量与保留的变量不是正交的,那么对参数估计量将产生影响,需要进一步检验这种省略是否恰当。

如果X2中的变量省略后对参数估计量没有影响,那么H1和H0情况下的对数最大似然函数值应该相差不大,此时LR统计量的值很小,自然会小于临界值,不拒绝 H0。

检验步骤 首先进行约束模型的估计 选择系数检验 引入省略的变量 判断

省略CC,只保留CM,估计模型

选择”Omitted Variables-LR Test”

引入CC

拒绝CC系数为0的0假设

将解释变量分为两类,Z为只与个体特征有关的变量。显然异方差与这些变量相关。 4、异方差性检验 截面数据样本,容易存在异方差性。 假定异方差结构为: 将解释变量分为两类,Z为只与个体特征有关的变量。显然异方差与这些变量相关。 采用LM检验 将异方差检验问题变为一个约束检验问题

一般都存在异方差。 不检验,采用White修正进行估计

5、分布检验 检验关于分布的假设(probit、logit )。 一般不进行该项检验。 具体见相关教科书(Greene,P682)。

β:模型1的参数,γ:模型2的参数。 组合模型的似然函数: 构造LM统计量,如果不拒绝0假设,表明模型1是适当的。

6、回代检验 当二元离散选择模型被估计后,将所有样本的解释变量观测值代入模型,计算得到每个样本的被解释变量选择1的概率,与每个样本被解释变量的实际观测值进行比较,以判断模型的预测(回代)效果,是一种实际有效的模型检验方法。 概率阈值 朴素选择:p=0.5 (1、0的样本相当时) 先验选择:p=(选1的样本数/全部样本)(全样本 时) 最优阈值:犯第一类错误最小原则

例7.2.2 朴素选择,即以0.5为阈值:除了2个样本外,所有样本都通过了回代检验。 先验选择,即以选择1的样本的比例0.41为阈值:除了1个样本外,所有样本都通过了回代检验。

实例—财务欺诈识别模型 我国上市公司财务欺诈识别模型 样本:年度报告审计意见为“无法发表意见”或者“证监会立案调查”等公司属于财务欺诈样本;年度报告审计意见为“标准无保留意见”和财务报表满足“利润×现金流量>0”的公司属于配对样本。 解释变量:开始选择11个财务指标;通过T检验,确定6个指标:资产负债率、资产毛利率、资产周转率、营运资金比率、应收账款周转率、经营活动现金流量/资产额。

样本:财务欺诈公司30,非财务欺诈公司30 采用犯第一类错误最小原则确定最优阈值为 0.68 欺诈样本中,p<0.68,26个,占86.7% 非欺诈样本中,p>0.68,25个,占83.3%

实例—上市公司并购 被解释变量:当年发生并购行为为1,反之为0。 解释变量:净利润率、……,全流通虚变量。 试图研究全流通都并购的影响。 样本:1994-2008上市公司,并购样本731,非并购样本9835。 采用先验原则,P=5% 模拟结果: 并购样本中:p>5%占53% 非并购样本中:p<5%占72%