Multicollinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
第五章 经典单方程计量经济学模型:专门问题
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第三章 经典单方程计量经济学模型:多元线性回归模型
第十章 相关与回归分析 PowerPoint 统计学.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
计量经济学习题课 詹 鹏 南京财经大学数量经济学2010级.
第三章 函数逼近 — 最佳平方逼近.
§4.3 多重共线性 Multi-Collinearity.
第六章 多重共线性 (Multi-Collinearity)
第四章 经典单方程计量经济学模型:放宽基本假定的模型
预测与决策分析 Forecasting and Decision Analysis
第二章 经典单方程计量经济学模型: 一元线性回归模型
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
§5.3 定积分的换元法 和分部积分法 一、 定积分的换元法 二、 定积分的分部积分法 三、 小结、作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
计量经济学 主讲:詹鹏.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
Applied Regression Analysis
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
计量经济学 第四章 多重共线性.
引子: 国内生产总值增加会减少财政收入吗?
计量经济学 第三章 多元线性回归模型.
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第七章:回归分析的其它问题 第一节 虚拟变量 第二节 设定误差 第三节 滞后变量模型介绍 第四节 随机解释变量 第五节 时间序列模型初步.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第4章 多元线性回归分析.
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
计算机数学基础 主讲老师: 邓辉文.
二.换元积分法 ò ( ) (一)第一类换元积分法 1.基本公式 把3x当作u,“d”后面凑成u 2.凑微分 调整系数 (1)凑系数 C x
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
第4章 非线性规划 4.5 约束最优化方法 2019/4/6 山东大学 软件学院.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
Partial Differential Equations §2 Separation of variables
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第六章 自相关.
§4.2 序列相关性 Serial Correlation.
第六章 多重共线性 一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 两变量线性回归.
第四章 多元线性回归分析.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
多元线性回归分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Volterra-Lotka方程 1925年, A. Lotka(美)和V. Volterra(意)给出了第一个两物种间的捕食模型。
§4.5 最大公因式的矩阵求法( Ⅱ ).
Sssss.
Presentation transcript:

Multicollinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题 §4.3 多重共线性 Multicollinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题 六、分部回归与多重共线性

一、多重共线性的概念

1、多重共线性 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。 perfect multicollinearity approximate multicollinearity

2、实际经济问题中的多重共线性 产生多重共线性的主要原因: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制

二、多重共线性的后果 Consequences of Multicollinearity

1、完全共线性下参数估计量不存在 如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。

近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为 由于|X’X|0,引起(X’X) -1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。

以二元线性模型 y=1x1+2x2+ 为例: 恰为X1与X2的线性相关系数的平方r2 由于 r2 1,故 1/(1- r2 )1。

当完全不共线时, r2 =0 当近似共线时, 0< r2 <1 多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF) 当完全共线时, r2=1,

如果模型中两个解释变量具有线性相关性,例如 X2= X1 , 3、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= X1 , 这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。

4、变量的显著性检验失去意义 存在多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断 可能将重要的解释变量排除在模型之外

5、模型的预测功能失效 变大的方差容易使区间预测的“区间”变大,使预测失去意义。

注意: 除非是完全共线性,多重共线性并不意味着任何基本假设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。 问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。

三、多重共线性的检验 Detection of Multillinearity

说明 多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。 多重共线性检验的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间存在共线性。

(1)对两个解释变量的模型,采用简单相关系数法 1、检验多重共线性是否存在 (1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。 (2)对多个解释变量的模型,采用综合统计检验法 如果在OLS法下,R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。

2、判明存在多重共线性的范围 (1) 判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行辅助回归(Auxiliary Regression),并计算相应的拟合优度。 如果某一种回归Xji=1X1i+2X2i+LXLi的判定系数较大,说明Xj与其他X间存在共线性。 可以构造F检验:

在模型中排除某一个解释变量Xj,估计模型; (2) 排除变量法(Stepwise Backward Regression ) 在模型中排除某一个解释变量Xj,估计模型; 如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。

(3)逐步回归法(Stepwise forward Regression) 以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。

四、克服多重共线性的方法 Remedial Measures of Multicollinearity

找出引起多重共线性的解释变量,将它排除。 1、第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除。 以逐步回归法得到最广泛的应用。 注意:剩余解释变量参数的经济含义和数值都发生了变化。

2、第二类方法:差分法 时间序列数据为样本的线性模型; 将原模型变换为差分模型,可以有效地消除原模型中的多重共线性。 一般讲,对于经济数据,增量之间的线性关系远比总量之间的线性关系弱得多。 另外一个重要的意义,差分可以将非平稳序列变为平稳序列。在第9章将介绍。 差分模型随机项的序列相关问题

多重共线性的主要后果是参数估计量具有较大的方差。 3、第三类方法:减小参数估计量的方差 多重共线性的主要后果是参数估计量具有较大的方差。 采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。 例如,增加样本容量,可使参数估计量的方差减小。 例如,岭回归法

*岭回归法(Ridge Regression) 20世纪70年代发展,以引入偏误为代价减小参数估计量的方差。 具体方法是:引入矩阵D,使参数估计量为 其中矩阵D一般选择为主对角阵,即D=aI,a为大于0的常数。 显然,与未含D的参数B的估计量相比,估计量有较小的方差。

五、案例——中国粮食生产函数 (自学)

步骤 以粮食产量作为被解释变量,以影响粮食产量的主要因素农业化肥施用量、粮食播种面积、成灾面积、农业机械总动力、农业劳动力为解释变量,建立中国粮食生产函数模型; 用OLS法估计模型; 检验简单相关系数; 找出最简单的回归形式; 采用逐步回归方法得到最终模型。

六、补充:分部回归与多重共线性 Partitioned Regression and Multillinearity

1、分部回归法(Partitioned Regression) 将解释变量分为两部分,对应的参数也分为两部分 在满足解释变量与随机误差项不相关的情况下,可以写出关于参数估计量的方程组:

这就是仅以X1作为解释变量时的参数估计量。

2、由分部回归法得到的启示 如果一个多元线性模型的解释变量之间完全正交,可以将该多元模型分为多个一元模型、二元模型、…进行估计,参数估计结果不变; 实际模型由于存在或轻或重的共线性,如果将它们分为多个一元模型、二元模型、…进行估计,参数估计结果将发生变化;

当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义有发生变化; 严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不 真正反映对应变量与被解释变量之间的结构关系。

§4.4 随机解释变量问题 Random Explanatory Variables 一、随机解释变量问题 二、随机解释变量的后果 三、工具变量法 四、解释变量的内生性检验 五、例题

一、随机解释变量问题

1、随机解释变量问题 基本假设:解释变量X1,X2,…,Xk是确定性变量。 如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。 假设X2为随机解释变量。对于随机解释变量问题,分三种不同情况:

(2) 随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。 (1) 随机解释变量与随机误差项独立(Independence) (2) 随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。 (3) 随机解释变量与随机误差项同期相关(contemporaneously correlated)。

在实际经济问题中,经济变量往往都具有随机性。 2、实际经济问题中的随机解释变量问题 在实际经济问题中,经济变量往往都具有随机性。 但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。 于是随机解释变量问题主要表现于:用滞后被解释变量作为模型的解释变量的情况。 例如:

Qt=0+1It+2Qt-1+t t=1,T (1) 耐用品存量调整模型 耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定: Qt=0+1It+2Qt-1+t t=1,T 如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt-1只与t-1相关,与t不相关,属于上述的第2种情况。

(2) 合理预期的消费函数模型 Ct-1是一随机解释变量,且与 (t-t-1)高度相关(为什么?)。属于上述第3种情况。

二、随机解释变量的后果

计量经济学模型一旦出现随机解释变量,且与随机扰动项相关的话,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。 下面以一元线性回归模型为例进行说明。

1、随机解释变量与随机误差项相关图 拟合的样本回归线可能低估截距项,而高估斜率项。 拟合的样本回归线高估截距项,而低估斜率项。 (a)正相关 (b)负相关 拟合的样本回归线可能低估截距项,而高估斜率项。 拟合的样本回归线高估截距项,而低估斜率项。

2、如果X与相互独立,OLS参数估计量仍然是无偏、一致估计量。

3、如果X与同期不相关,异期相关,得到的参数估计量有偏、但却是一致的。 kt的分母中包含不同期的X, kt与t相关

4、如果X与同期相关,得到的参数估计量有偏、且非一致。 前面已经证明

三、工具变量法 Instrument variables

1、工具变量的选取 工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。 选择为工具变量的变量必须满足以下条件: 与所替代的随机解释变量高度相关; 与随机误差项不相关; 与模型中其它解释变量不相关,以避免出现多重共线性。

2、工具变量的应用 多元线性模型的正规方程组 X2为与μ相关的随机变量

能否说“用工具变量代替了模型中的随机解释变量”? 能否说“其它解释变量用自己作为工具变量”? Z作为X2的工具变量 能否说“用工具变量代替了模型中的随机解释变量”? 能否说“其它解释变量用自己作为工具变量”? 能否说“用Z作为X1的工具变量,用X1作为X2的工具变量”?

这种求模型参数估计量的方法称为工具变量法(instrumental variable method),相应的估计量称为工具变量法估计量(instrumental variable (IV) estimator)。 工具变量矩阵

3、工具变量法估计量是一致估计量 一元回归中,工具变量法估计量为

4、几个重要的概念 (1)在小样本下,工具变量法估计量仍是有偏的。 (2)工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。 (3)如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果(Why?)。

(4)OLS可以看作工具变量法的一种特殊情况。 (5)如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(Generalized Method of Moments, GMM)。 在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。 工具变量法是GMM的一个特例。 (6)要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事 可以用Xt-1作为原解释变量Xt的工具变量。

5、 IV演示:居民总消费模型 以居民消费总额JMXF为被解释变量; 以GDP和JMXF(-1)为解释变量; 进行OLS估计。 以政府消费ZFXF作为工具变量,进行IV估计; 以政府消费ZFXF和资本形成ZBXC作为工具变量,进行GMM估计。

数据

OLS估计

IV估计

GMM估计

估计结果 OLS: JMXF = 1001.164757 + 0.1367699684*GDP + 0.7238178139*JMXF(-1) IV: JMXF = 1059.996753 + 0.1584492759*GDP + 0.6655810226*JMXF(-1) GMM: JMXF = 738.873724 + 0.09435006141*GDP + 0.8353195568*JMXF(-1)

拟合结果

四、解释变量的内生性检验

Hausman检验 如果δ显著为0→υ与Y同期无关→υ与μ同期无关→ X与μ同期无关→X是同期外生变量; Z1外生,与μ不相关 选择Z2作为X 的工具变量 如果δ显著为0→υ与Y同期无关→υ与μ同期无关→ X与μ同期无关→X是同期外生变量; 如果δ显著不为0→ υ与Y同期相关→υ与μ同期相关→X与μ同期相关→ X是同期内生变量。

五、例:中国城镇居民人均消费函数 (自学)

步骤 以中国城镇居民人均消费为被解释变量,人均可支配收入和前一年城镇居人均消费支出为解释变量,建立模型; 经分析认为,人均可支配收入可能具有同期内生性; 选择工具变量; 采用Hausman检验判断,城镇居民人均可支配收入确实是内生变量; 采用工具变量估计。 为了比较,采用OLS估计。