第4章 多元线性回归分析.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
3.4 空间直线的方程.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第六章 回归分析.
5 多元线性回归分析 §1 一元线性回归分析 §2 多元线性回归分析 §3 最优回归方程的选取 §4 可线性化的非线性回归.
第三章 异方差和自相关.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
计量经济学习题课 詹 鹏 南京财经大学数量经济学2010级.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
§4.3 多重共线性 Multi-Collinearity.
第六章 多重共线性 (Multi-Collinearity)
Multicollinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
计量经济学 主讲:詹鹏.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
第一节 引言 第二节 一元线性回归模型 第三节 多元线性回归模型 第四节 虚拟变量回归模型 第五节 非线性回归模型 本章小节 主要内容.
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
计量经济学 第四章 多重共线性.
引子: 国内生产总值增加会减少财政收入吗?
计量经济学 第三章 多元线性回归模型.
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第二章 一元线性回归模型.
二、Dickey-Fuller检验(DF检验)
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
多元回归分析:异方差性 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第4章 Excel电子表格制作软件 4.4 函数(一).
第六章 多重共线性 一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验
第五章 异方差.
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
iSIGHT 基本培训 使用 Excel的栅栏问题
§8.3 不变因子 一、行列式因子 二、不变因子.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 两变量线性回归.
第四章 多元线性回归分析.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
多元线性回归分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

第4章 多元线性回归分析

多元线性回归分析 4.1 多元线性回归模型设定 4.2 多元线性回归模型参数估计 4.3 更多假设下OLS估计量性质 4.2.1 回归系数估计 4.2.2 误差估计—残差 4.2.3 的分布 4.3 更多假设下OLS估计量性质 4.4 回归系数检验(t检验) 4.5 调整 、信息准则和变量选择 4.5.1调整 4.5.2 信息准则

多元线性回归分析 4.6 回归模型检验(F检验) 4.7 用EViews7.2进行多元线性回归 4.8 假设条件的放松 4.9 自变量共线性 4.8 假设条件的放松 4.7.1 假设条件的放松(一)—非正态分布误差项 4.7.2 假设条件的放松(二)—异方差 4.7.3 假设条件的放松(三)—非随机抽样和序列 相关 4.7.4 假设条件的放松(四)—内生性 4.9 自变量共线性 重要概念

4.1 多元线性回归模型设定 模型设定: 假设1(零条件均值:zero conditonal mean) 给定解释变量,误差项条件数学期望为0,即

4.1 多元线性回归模型设定 假设2 (无共线性:no colinearity) 解释变量之间不存在线性关系。即不存在不全 为零的一组数 使得 若不成立,称自变量间存在完全共线性(perfect colinearity),此时参数不能被唯一估计。

4.1 多元线性回归模型设定 … 假设2’(样本无共线性:no colinearity) 对于样本模型,从无共线性的假设得出解释变量 样本值形成的向量之间线性无关。 … 假设2’(样本无共线性:no colinearity) 不存在不全为零的一组数 使得

4.2 多元线性回归模型参数估计 4.2.1 回归系数估计 4.2.2 误差估计—残差 4.2.3 的分布

4.2 多元线性回归模型参数估计 4.2.1 回归系数估计 类比原则得样本矩条件

4.2 多元线性回归模型参数估计 4.2.1 回归系数估计 多元回归分析参数估计一般用矩阵表示,这里 仅给出二元情况下用克莱姆法则解出的解。

4.2 多元线性回归模型参数估计 4.2.1回归系数估计 结论 结论1: OLS估计的一致性 为一致估计,即 结论2: OLS估计的无偏性 为无偏估计:

4.2 多元线性回归模型参数估计 4.2.2 误差估计—残差 结论 结论3: 如果假设1和假设2满足,则回归残差是回归误差的 一致估计: 结论4: 如果假设1和假设2满足,残差形成的向量和自变量 样本值形成的向量正交。

4.2 多元线性回归模型参数估计 4.2.3 的分布 结论5 如果假设1和假设2满足,样本量 较大时,OLS估 计 近似服从正态分布: 其中

4.3 更多假设下OLS估计量性质 假设3(同方差:homoskedasticity) 假设4(随机抽样: random sample) 给定解释变量,误差项条件方差为常数,即 假设4(随机抽样: random sample) 样本 是随机抽样产生的,样本之间相互独立,模型误差项 之间相互独立。

4.3 更多假设下OLS估计量性质 结论6 如果假设1~假设4满足,则当样本量 较大时, OLS估计 近似服从结论5中的正态分布,方差计算 如果假设1~假设4满足,则当样本量 较大时, OLS估计 近似服从结论5中的正态分布,方差计算 公式为 其中 为以 为因变量对其余解释变量进行多元线 性回归的拟合优度。

4.3 更多假设下OLS估计量性质 结论7 如果假设1~假设4满足,统计量 是误差项方差 的无偏和一致估计,即 为回归标准误,记为 。

4.3 更多假设下OLS估计量性质 结论8 结论9 如果假设1~假设4满足,样本量 较大时,如下统计 量近似服从正态分布 如果假设1~假设4满足,样本量 较大时,如下统计 量近似服从正态分布 结论9 如果假设1~假设4满足,OLS估计量 为最有效估计: 在 的所有线性无偏估计中, 的方差最小。这称为 OLS估计的马尔科夫性。

4.3 更多假设下OLS估计量性质 假设5(正态分布: normal distribution) 给定解释变量,误差项 服从正态分布, 即 给定解释变量,误差项 服从正态分布, 即 其中

4.3 更多假设下OLS估计量性质 结论10 如果假设1~假设5满足, (1) 服从正态分布, , 由上面公式给出; (1) 服从正态分布, , 由上面公式给出; (2) 服从自由度为 的t-分布 其中 由上面公式给出, 。

4.4 回归系数检验( 检验) 检验的原假设和备选假设为: 通常取显著水平 或 假设1~5都成立的情况下,统计量 4.4 回归系数检验( 检验) 检验的原假设和备选假设为: 通常取显著水平 或 假设1~5都成立的情况下,统计量 样本量较大时(n>35),0.05显著水平下双边检验临界值接近2,故常用t值是否大于2判断参数是否显著。

4.5 调整 、信息准则和变量选择 4.5.1调整 4.5.2 信息准则

4.5 调整 、信息准则和变量选择 4.5.1调整 增加解释变量只会减少RSS的值(不受限的最小化总比受限的最小化来的小),从而增加 值。 4.5 调整 、信息准则和变量选择 4.5.1调整 增加解释变量只会减少RSS的值(不受限的最小化总比受限的最小化来的小),从而增加 值。 用自由度来调整 的定义 关系:

4.5 调整 、信息准则和变量选择 4.5.2 信息准则 将模型自变量个数考虑在内的变量选择标准:AIC,SC,HQ 4.5 调整 、信息准则和变量选择 4.5.2 信息准则 将模型自变量个数考虑在内的变量选择标准:AIC,SC,HQ 应用原则是使信息准则值最小的模型最好。(只对嵌套模型有用) 常用AIC和SC准则,SC准则对增加解释变量的惩罚更为严厉,因此得出的模型往往更简洁。

4.6 回归模型检验( F检验) 拟合优度和信息准则均不严格,带有很 多主观判断,因此要进行严格的模型检验。 原假设: 至少一个不为0 统计量:

4.6 回归模型检验( F检验) 结论11 如果假设1~假设5满足,上述统计量服从第一自由度为k、第二自由度为(n-2)的F分布,即: 一个参数的t检验要拒绝原假设;反之,即使全部t检 验都不拒绝原假设,上述F检验也不一定不拒绝原假 设。

4.7 用EViews7.2进行多元线性回归 步骤: 与一元线性回归模型类似,先建立Excel数据文件,再将文件导入EViews 用Genr按钮从原始数据生成回归模型中的变量 按住Control键,选中回归模型中的变量,点击鼠标右键,在弹出菜单中点选Open→as Group 在数据表格界面点击菜单:Proc→Make Equation,进入模型估计(Equation Estimation)对话框

4.7 用EViews7.2进行多元线性回归 步骤: 模型设定窗口Equation specification,默认OLS估计方法

4.7 用EViews7.2进行多元线性回归 步骤: 输出结果

4.7 用EViews7.2进行多元线性回归 步骤: 在输出结果界面点击顶端按钮Resids,将输出残差图 同样可以在结果界面点击菜单Forecast,保存拟合值。

4.8 假设条件的放松 4.8.1 假设条件的放松(一)—非正态分 布误差项 4.8.2 假设条件的放松(二)—异方差 4.8.3 假设条件的放松(三)—非随机抽 样和序列相关 4.8.4 假设条件的放松(四)—内生性

4.8 假设条件的放松 4.8.1 假设条件的放松(一)—非正态分 布误差项 去掉假设5不影响OLS估计的一致性、无偏性和渐近正态性。 不能采用t-检验来进行参数的显著性检验,也不能用F检验进行整体模型检验。 大样本情况下,t统计量往往服从标准正态分布(在原假设下)。

4.8 假设条件的放松 4.8.2 假设条件的放松(二)—异方差 异方差检验原理 至少一个不为0

4.8 假设条件的放松 4.8.3 假设条件的放松(三)—非随机抽 样和序列相关 序列相关不影响OLS估计的无偏性、一致性和渐近正态性 标准误的计算要用HAC标准误 用EViews检验序列相关

4.8 假设条件的放松 4.8.4 假设条件的放松(四)—内生性 假设1’(外生性假设:exogenous independent variable) 模型误差项和解释变量不相关0,即 结论5’:如果假设1’和假设2满足, (1)OLS估计 是 的一致估计; (2)当样本量 较大时, 近似服从正态分布:

4.8 假设条件的放松 4.8.4 假设条件的放松(四)—内生性 若假设1’都不能满足,则OLS失效,此时应当采用工具变量估计方法、面板数据估计方法等其他方法。

4.9 自变量共线性 当假设2和假设2’不满足时,存在多重共线性(multicolinearity),模型无法估计。 方差膨胀因子 一般认为,当 时, 与其他自变量存在严重共线性,需进行处理。

4.9 自变量共线性 存在多重共线性时处理方法 (1)增加样本量。 (2)对变量实施变换。例如对取正值的变量取自然对数,采用增长率数据而不是原始数据等。 (3)多重共线性只对有共线关系的自变量的回归系数OLS估计方差有影响,如果所关注的自变量不存在严重多重共线性,则不影响对问题的判断。

重要概念 1、多元线性回归模型的概念和理论大多与一元线性回归模型相同。由于有多个自变量,为了模型参数可以被估计,除了对模型误差项给出必要的假设之外,需要假设解释变量之间不存在完全共线性。 2、在无共线性假设下,设误差项的外生性假设是最基本的假设,在此假设下,OLS估计具有一致性和渐近正态性。如果同方差假设和随机抽样假设同时成立,则OLS估计近似服从正态分布,参数估计的标准误采用(4.18)计算,并采用结论8中的统计量对参数进行t检验。如果误差项存在异方差,OLS估计近似服从正态分布,但参数估计的标准误需要采用(4.26)给出的White方法进行计算,用于回归系数假设检验的t-统计量计算做相应的调整。如果误差项存在异方差和序列相关,则OLS估计近似服从正态分布,但参数估计的标准误需要采用Newey-West给出HAC方法进行计算,用于回归系数假设检验的t-统计量计算做相应的调整。采用EViews软件进行操作时,在回归选项中根据误差项假设选择合适的选项可得出稳健的检验结果。 如果外生性假设不满足,不能采用OLS方法估计模型。

重要概念 3. 多元线性回归的因变量总平方和,可以分解为回归平方和和残差平方和,由此可以定义拟合优度 。 会随自变量的增加而增加,以此为标准会使模型包含过多的对因变量没有解释能力的自变量。对 分子分母中的量用各自的自由度调整得出调整 。信息准则与调整 在自变量取舍上具有相同功能。信息准则包括AIC、SC和HQ,使用的原则是选择使信息准则达到最小的模型。 和信息准则只能用于嵌套模型的比较。 4. 多元线性回归模型误差项是否有异方差可以通过White方法进行检验。White方法的做法是对辅助回归模型进行检验,辅助回归以原回归模型的OLS回归残差平方 为因变量以原模型自变量、自变量平方和自变量的交叉相乘为解释变量的回归,以回归的F检验结果决定是否存在异方差。

重要概念 5.多元线性回归模型误差项是否有序列相关可以通过布罗施-葛德福瑞LM检验方法进行检验。只需要在EViews结果输出界面逐级点击菜单即可实现误差项的序列相关检验。 6. 与一元线性回归模型不同,多元线性回归模型自变量之间的多重共线性会影响到回归系数OLS估计的方差和标准误,从而影响到t-检验。方差膨胀因子VIF用来衡量共线性的程度。当存在严重共线性时,可以通过变量变换、增加样本量减轻影响,但不能轻易将解释变量从模型中去掉,导致参数OLS估计的不一致性,带来更严重的后果。