第四章 多重共线性.

Slides:



Advertisements
Similar presentations
第一章 餐饮服务程序 学习目的: 掌握餐饮服务四个基本环节的内容 正确表述和运用各种餐饮形式的服务程序 熟悉并利用所学知识灵活机动地为不同需求的 客人提供服务.
Advertisements

昆明机场. 目录  机场历史 机场历史  建设状况 建设状况  运行状况 运行状况  航线 航线.
第十四章 人口(二) 高中地理(一). 第一節 人口成長 第二節 人口組成 第三節 人口問題 第十四章 人口(二)
中國歷史 社會主義文化大革命 我們的報告是關於中國著名的革命 —— 文化大革命。你可會立即想到它何時發 生、怎麼會發生等等。我們將會介紹文 化大革命,希望你細心欣賞。
第八章 土地行政管理.
党课讲座 入党的条件与程序.
中國大陸教育 督導制度探究 凌林煌教授/博士 講授 國立中山大學共同科歷史學程
「互联网金融2.0时代」与房地产的融合 广州互联网金融协会会长、广州e贷总裁 方颂.
企业会计学(三) 人大版本 吕 昌.
第九章 经济增长和经济发展 第一节 经济增长与增长方式的转变 第二节 经济发展与工业化 第三节 经济发展中的结构变化与优化
温故知新 犬 戎 公元前 770年 周平王 公元前771年 东周 洛邑 西周 镐京.
第五章 主张超尘绝俗的 佛家.
让我们走进秋天.
102年10月 公共債務法 講師:財政部國庫署 林組長達聰.
據點考核與評鑑 報告人:臺南市政府 照顧服務管理中心.
第一章 教育与教育学 讲授提纲 教育与教育学 思考题目 主讲: 白彦茹(教授) 阅读文献 教学目的与要求 教学重点与难点 退出.
我国政府受人民的监督 权力的行使:需要监督.
最新消息插播! 意見反應: 我是貴校學生的家長,請問貴校該給工讀生的薪水何時才肯發呢?現在已經是十一月中了,九月十月的薪水還沒入帳我們不知道是卡在哪個環節,但貴校是否知道有多少同學需要這筆錢去過生活、繳納房租? …………………………………………………….? 請各位報帳同仁、專兼任助理們務必養成平時定期清帳的習慣,不要等到年終或結案前才開始緊張。
法學緒論第三單元:立法程序 課程設計: 財經法律系 --楊東連 法學緒論-3.
特殊族群運動健康訓練(I).
依据教材 全国高等教育自学考试指定教材 《西方行政学说史》, 竺乾威主编,高等教育出版社。
鹽酥蝦 蝦子先處理好 蝦頭剪至眼睛處,鬚及蝦頭的小腳也都剪乾淨 2 再用廚房用剪刀開背去腸泥
第四节 K线图研判技巧.
正 信 讀 書 會 主 持 群 : 姚 永 錩 、 鄭 健 、 陳 淑 珍 佛法的生活應用 2008/07/23.
非法集资典型案例评析 南京师范大学法学院 蔡道通 2016年1月.
专题(二) 交往沟通 掌握技能 命 题 解 读 背 景 材 料 新 题 演 练 考 点 链 接 1.
第二课 扬起自信的风帆 我能“行”.
教学目的、重点及难点 教学目的:主要分析构建社会主义和谐社会的重要性和紧迫性,介绍我们党提出构建社会主义和谐社会的理论渊源和现实依据,论述构建社会主义和谐社会的指导思想、基本原则和目标任务,帮助学生深刻认识构建社会主义和谐社会的科学涵义和重要意义,了解关于构建社会主义和谐社会的主要方针政策。 重点:
松竹梅岁寒三友 步入建交 桃李杏村暖一家 迈进职教 活出精彩.
第四章 市场与行业分析.
石家庄迅步网络科技有限公司 联系人:张会耀 电话:
旅游资源赏析.
班級:行流四甲 組員:497D0004何筱瑩 497D0016鄧宜欣 497D0044呂亭儀 497D0056黃 琪 497D0063賴依淩
第一节 舞蹈的概念 第二节 舞蹈基本知识 第三节 舞蹈动作成套欣赏 第四节 舞蹈的编排 学习思考题 推荐书目及网站
第六章 社会主义本质和建设中国特色社会主义总任务
道路交通事故處理.
第八单元第二课第一课时 严守法律 温州四中 蒋莉青.
高级财务会计.
2014年中考历史解题技巧与重要类型题 一、图片材料题 1、地图类 2、人、物、场景类 3、表格、数轴类 二、文字材料题 1、引用材料类
投手丘上的勇者 王建民 導讀者:黃柏涵.
复习回顾 1.我国之所以建立以公有制为主体,多种所有制经济共同发展的基本经济制度 A.是由我国生产力整体水平比较低决定的
第一节 我国社会主义建设的 战略目标和战略步骤
第六章 社会主义初级阶段理论.
誰的電話永遠沒人接 您播(凌波)的 電話號碼是空號.
网络信息资源的开发与设计 主讲教师 罗双兰 广西师范大学教育科学学院.
高中地理(一) 第十六章 產業(二)林、漁、礦業.
第七章 人 口 第一節 種族的分布與現況 第二節 人口結構與成長 第三節 人口問題 總目錄.
公務人員退休法、撫卹法 法制與實務講習 銓敘部退撫司 中華民國99年8月.
第三章 文学作为活动.
宗教故事 Back >> 【被逐出樂園】米開朗基羅1508~12年.壁畫
高考哲学十种主观题常见题型及分析.
本 节 目 录 一、以传统农业为主体的发展阶段 二、工业化阶段 三、高效的益综合发展阶段 四、课堂巩固.
中国财政支出 庄志辉 赖灿荣
2.4 民主监督—— 守望公共家园.
立體圖形、圖形變換、空間 第十一組 廖芳苓 葉玟孝 林佩君.
日本總體經濟 指導老師 許淑媖 國企三甲 余孟雪.
視野死角與內輪差 埔心國小交通安全團隊.
计量经济学 第二章 简单线性回归模型.
首届“互联网+” 大学生创新创业大赛.
党员干部要争做社会主义 社会公德的表率 党员干部要争做 社会公德的表率 中共河南省委党校 周海涛.
东南亚各国国旗.
宏观经济学 国内生产总值的定义 作者:于姗姗 单位:辽东学院 教学课程:宏观经济学 适用对象:经济类本科.
导数的应用 ——函数的单调性与极值.
第十讲 刘少奇与中国革命和建设.
第 四 章 迴歸分析應注意之事項.
報告人:張淑惠.
飛行器製作與飛行 講師:劉修建.
第三节 多重共线性的检验 本节基本内容: ● 简单相关系数检验法 ● 方差扩大(膨胀)因子法 ● 直观判断法 ● 逐步回归法.
景文科技大學學生校外實習訪視暨差旅費核銷說明
Presentation transcript:

第四章 多重共线性

问题的提出 在前述基本假定下OLS估计具有BLUE的优良性。 估计参数时,必须检验基本假定是否满足,并针对基本假定不满足的情况,采取相应的补救措施或者新的方法。 检验基本假定是否满足的检验称为计量经济学检验

回顾6项基本假定 (1)解释变量间不相关(无多重共线性) (2)E(ui)=0 (随机项均值为零) (3)Var(ui)=2 (同方差) (4)Cov(ui, uj)=0(随机项无自相关) (5)Cov(X, ui)=0(随机项与解释变量X不相关) (6)随机扰动服从正态分布。

不满足基本假定的情形(1) 1、通常不会发生随机扰动项均值不等于0的情形。若发生也不会影响解释变量的系数,只会影响截距项。 2、随机扰动项正态性假设一般能够成立,就算不成立,在大样本下也会近似成立的。所以不讨论此假定是否违背。

不满足基本假定的情形(2) 3、解释变量之间相关=>多重共线 4、随机扰动项相关=>序列自相关 时间序列数据经常出现序列相关 5、随机扰动项方差不等于常数=>异方差 截面数据时,经常出现异方差

解决问题的思路 1、定义违反各个基本假定的基本概念 2、违反基本假定的原因、背景 3、诊断基本假定的违反 4、违反基本假定的补救措施(修正)

本章主要介绍 4.1 多重共线性的实例、定义、产生背景; 4.2 多重共线性产生的后果; 4.3 多重共线性的检验; 4.1 多重共线性的实例、定义、产生背景; 4.2 多重共线性产生的后果; 4.3 多重共线性的检验; 4.4 多重共线性的修正。 4.5 违反三个假定的总结 4.6 案例

4.1 多重共线性的实例、定义、产生背景 4.1.1 实例 例一 消费与收入、家庭财富 例二 汽车保养费与汽车行驶里程、拥有汽车时间

4.1.2 多重共线性的定义 多重共线性:在多元线性回归模型中,解释变量之间存在着完全的线性关系或近似的线性关系 完全多重共线性 4.1.2 多重共线性的定义 多重共线性:在多元线性回归模型中,解释变量之间存在着完全的线性关系或近似的线性关系 完全多重共线性 近似多重共线性

4.1.2 多重共线性的定义--矩阵形式

多重共线性分类的矩阵形式

4.1.3 产生多重共线性的背景 (1)时间序列数据中经济变量在时间上常有共同的变动趋势;时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 (2)经济变量之间本身具有内在联系(常在截面数据中出现);横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。

4.1.3 产生多重共线性的背景 (3)由于某种决定性因素的影响可能使各个变量向着同方向变化; 4.1.3 产生多重共线性的背景 (3)由于某种决定性因素的影响可能使各个变量向着同方向变化; (4)滞后变量引入模型,同一变量的滞后值一般都存在相互关系;在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。 有的学者认为多重共线性是一个数据样本的问题。

一般经验 对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。 以截面数据作样本时,问题不那么严重,但多重共线性仍然是存在的。 back

4.2 多重共线性的后果 4.2.1 完全多重共线性下的后果 (1)参数估计值不确定; (2)参数估计值的方差无限大;

4.2.2 不完全多重共线性下的后果 (1)参数估计仍是无偏估计,但不稳定;估计量及其标准差非常敏感,观测值稍微变化,估计量就会产生较大的变动。 (2)参数估计式的方差随着共线性程度的增大而增大。 (3)t检验失效,区间估计失去意义;估计量的方差很大,相应标准差增大,进行t检验时,接受零假设的可能性增大 (4)严重多重共线性时,甚至参数估计式的符号与其经济意义相反。得出完全错误的结论。

4.2.2 一般共线性下普通最小二乘法参数估计量非有效 在一般共线性(或称近似共线性)下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为 可见,由于此时|X’X|0,引起(X’X) -1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量非有效。

仍以二元模型中 1 ˆ b 为例, 的方差为 å - = ¢ 2 11 ) ( / var( i x X s

即:多重共线性使参数估计值的方差增大,方差扩大因子(Variance Inflation Factor)为1/(1-r2),其增大趋势见下表:

如果模型中两个解释变量具有线性相关性,例如X1和X2,那么它们中的一个变量可以由另一个变量表征。 4.2.2 参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如X1和X2,那么它们中的一个变量可以由另一个变量表征。 这时,X1和X2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。

举例 A: B: C: Housing:动工的住房数量 Intrate:新房抵押利率 POP:人口 GNP:收入

举例 变量 模型A 模型B 模型C C Intrate POP GNP 估计值 t值 -3812.93 -2.40 687.90 1.80 -1315.75 -0.27 Intrate -198.40 -3.87 -169.66 -184.75 -3.18 POP 33.82 3.61 14.90 0.41 GNP 0.91 3.64 0.52 0.54

4.3 多重共线性的检验 (1)简单相关系数矩阵法(辅助手段) (2)变量显著性与方程显著性综合判断; 4.3 多重共线性的检验 (1)简单相关系数矩阵法(辅助手段) 此法简单易行;但要注意两变量的简单相关系数包含了其他变量的影响,并非它们真实的线性相关程度的反映;一般在0.8以上可初步判定它俩之间有线性相关。 (2)变量显著性与方程显著性综合判断; 拟合优度R2很高,F值显著大于临界值,而t值不显著;那么可认为存在多重共线性。 (3)辅助回归:将每个解释变量对其余变量回归,若某个回归方程显著成立,则该解释变量和其余变量有多重共线性。即看判定系数较大。 (4)判断参数估计值的符号,如果不符合经济理论或实际情况,可能存在多重共线性

4.4.1 多重共线性的修正方法(一):增加样本容量 4.4.1 多重共线性的修正方法(一):增加样本容量 增加后,样本向量有可能不再线性相关。这也可以降低观察误差,减小估计量的方差,有助于提高估计精度。 但是,增加样本是比较困难的,也不能根本解决它。 适用于:样本引起的多重共线性——测量误差、偶然因素,解释变量总体不存在多重共线性 增加样本容量,如把时间序列数据和截面数据合并成平行数据

4.4.2 多重共线性的修正方法:(二)利用先验信息改变约束形式 4.4.2 多重共线性的修正方法:(二)利用先验信息改变约束形式 先验信息:在此之前的研究成果所提供的信息。 利用某些先验信息,可以把有共线性的变量组合成新的变量,从而消除共线性。 如 其中Y=消费,X2=收入 X3=财富。因为收入与财富有高度共线的趋势,如果先验认为 则代入消去

4.4.2 多重共线性的修正方法:(二)利用先验信息改变约束形式 4.4.2 多重共线性的修正方法:(二)利用先验信息改变约束形式 高度相关 已知α+ β =1,即规模报酬不变,则将 β =1- α代入

4.4.3 多重共线性的修正方法:(三)截面数据和时序数据结合 4.4.3 多重共线性的修正方法:(三)截面数据和时序数据结合 有时在时间序列数据中多重共线性严重的变量,在截面数据中不一定有严重的共线性。 在假定截面数据估计出的参数在时间序列数据中变化不大的前提下,可先用截面数据估计出一些变量的参数,再代入原模型估计另一些变量的参数。 例:销量与商品价格、消费者收入。

4.4.4 多重共线性的修正方法:(四)变换模型形式(差分法) 4.4.4 多重共线性的修正方法:(四)变换模型形式(差分法)

对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型 差分法 对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型 Yi=1  X1i+2  X2i++k  Xki+  i 可以有效地消除存在于原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。

例如:在中国消费模型中的2个变量:

由表中的比值可以直观地看到,两变量增量的线性关系弱于总量之间的线性关系。 进一步分析: Y与C(-1)之间的相关系数为0.9845, △Y与△C(-1)之间的相关系数为0.7456。 一般认为:两个变量之间的相关系数大于0.8时,二者之间存在线性关系。 所以,原模型经检验地被认为具有多重共线性,而差分模型则可认为不具有多重共线性。

4.4.4 多重共线性的修正方法:(五)逐步回归法 基本思想: 用逐步回归法发现产生共线性的解释变量,将其剔除,从而减少共线性的影响。 4.4.4 多重共线性的修正方法:(五)逐步回归法 基本思想: 用逐步回归法发现产生共线性的解释变量,将其剔除,从而减少共线性的影响。 这既是判断是否存在多重共线性的方法,也是解决多重共线性的方法。 具体方法:见流程图(word文档:多重共线性—逐步回归法流程图)

多重共线性—逐步回归法流程图

4.4.4 多重共线性的修正方法:(六)剔除不重要的解释变量 4.4.4 多重共线性的修正方法:(六)剔除不重要的解释变量 如果多重共线性由不重要的解释变量引起,可以从模型中除去该解释变量,减弱多重共线性 该解释变量被纳入随机误差项中,可能使随机误差项不能满足零均值假设

4.4.4 多重共线性的修正方法:(六)剔除变量与设定偏误 4.4.4 多重共线性的修正方法:(六)剔除变量与设定偏误 面对严重多重共线性,最简单的做法之一是剔除共线性诸变量之一,但是从模型中删除一个变量,可能导致设定偏误或设定误差。也就是说在分析中使用了不正确设定的模型。 由上面的讨论可见,从模型中除掉一个变量以缓解多重共线性的问题会导致设定上的偏误,因此在某些情形中,医治也许比疾病更糟糕,多重共线性虽然有碍于对模型参数的准确估计,但是剔除变量,则对参数的真值有严重的误导,应该记得,在近似共线性情形下,OLS估计量仍是BLUE。

4.4.4 多重共线性的修正方法:(七)变量变换 偶尔地,通过对模型中变量的变换能够降低共线性程度。如有的总量变成人均量,名义量变成实际量。但不能保证一定有效! 参看课本P214。

4.4.4 多重共线性的修正方法:(七)变量变换 销量 出厂价格 市场价格 市场总供应量 高度相关 相对价格

数据中心化

4.4.4 多重共线性的修正方法:(八)用被解释变量的滞后值代替解释变量的滞后值 4.4.4 多重共线性的修正方法:(八)用被解释变量的滞后值代替解释变量的滞后值 个人消费 现期收入 前期收入 高度相关 线性关系较弱

4.5 违反三个假定的总结

多重共线性 序列相关性 异方差性 定义 要 点 对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。 定义 要 点 多重共线性 序列相关性 异方差性

后果 多重共线性 序列相关性 异方差性 检验思路

1判定系数检验法 2逐步回归法 检验 方法 多重共线性 序列相关性 异方差性 解决方法

4.6.1 案例一:服装市场需求函数

1、建立模型 根据理论和经验分析,影响居民服装类支出的主要因素有:可支配收入、居民流动资产拥有量、服装价格指数、物价总指数。 已知某地区的有关资料,根据散点图判断,建立线性服装消费支出模型: Y=0+1X+2K+3P1+4P0+

2、样本数据

3、估计模型 由于R2较大且接近于1,而且 F=638.4,大于临界值:F 0.05(4,5)=15.19,故认为服装支出与上述解释变量间总体线性关系显著。 但由于参数K的估计值的t检验值较小(未能通过检验),故解释变量间存在多重共线性。

(2)检验简单相关系数 各解释变量间存在高度相关性,其中尤其以P1,P0间的相关系数为最高。

(3)找出最简单的回归形式 可见,应选①为初始的回归模型。

(4)逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。

①在初始模型中引入P1,模型拟合优度提高,且参数符号合理,但P1的t检验未通过; 4、讨论: ①在初始模型中引入P1,模型拟合优度提高,且参数符号合理,但P1的t检验未通过; ②再引入K,拟合优度虽有提高,但K与P1的t检验未能通过,且X与P1的t检验值及F检验值有所下降,表明引入K并未对回归模型带来明显的“好处”,K可能是多余的; ③去掉K,加入P0,拟合优度有所提高,且各解释变量的t检验全部通过,F值也增大了。 ④将4个解释变量全部包括进模型,拟合优度未有明显改观,K的t检验未能通过,K显然是多余的。

5、结论 回归方程以Y=f(X,P1,P0)为最优: Y=-12.45+0.10X-0.19P1+0.31P0 back

4.6.2 案例二:中国消费函数模型

1、OLS估计结果

2、差分法估计结果

3、比较 β1:0.48095→0.49672 β2:0.19854→0.15850 在消除了共线性后,GDP对CONS的影响增大,CONS1对CONS的影响减少。

当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义发生变化; 严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不真正反映对应变量与被解释变量之间的结构关系。

一点说明 当模型仅用于预测,而对参数估计值没有过高的要求,只要回归系数是显著的,符号和大小有意义,多重共线性问题可以忽略