多元线性回归分析.

Slides:



Advertisements
Similar presentations
3.4 空间直线的方程.
Advertisements

非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
3.2.平稳性检验的单位根方法 单位根检验方法 DF检验 ADF检验 PP检验 KPSS检验 ERS检验 NP检验.
第6章 多重共线性的情形及其处理 6 .1 多重共线性产生的背景和原因 6 .2 多重共线性对回归模型的影响 6 .3 多重共线性的诊断
第六章 回归分析.
5 多元线性回归分析 §1 一元线性回归分析 §2 多元线性回归分析 §3 最优回归方程的选取 §4 可线性化的非线性回归.
第三章 经典单方程计量经济学模型:多元线性回归模型
第三章 异方差和自相关.
第十章 相关与回归分析 PowerPoint 统计学.
回归分析法预测 (Regression Analysis)
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
Introductory Econometrics for Finance 回归分析的基本概念
多元回归分析:推断 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
完全随机设计多样本资料秩和检验.
§4.3 多重共线性 Multi-Collinearity.
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
第二章 经典单方程计量经济学模型: 一元线性回归模型
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
Y = b0 + b1x + u ch2 简单二元回归 y = b0 + b1x + u 1.
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
§3.6 受约束回归 在建立回归模型时,有时根据经济理论需对模型中变量的参数施加一定的约束条件。 1阶齐次性 条件的C-D生产函数
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
引子: 国内生产总值增加会减少财政收入吗?
计量经济学 第三章 多元线性回归模型.
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
多元线性回归分析.
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第二章 一元线性回归模型.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第4章 多元线性回归分析.
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
多元回归分析:异方差性 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第六章 自相关.
第六章 多重共线性 一、多重共线性的概念 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验
第五章 异方差.
第16讲 相似矩阵与方阵的对角化 主要内容: 1.相似矩阵 2. 方阵的对角化.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 两变量线性回归.
第四章 多元线性回归分析.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
线 性 代 数 厦门大学线性代数教学组 2019年5月12日4时19分 / 45.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
§2 方阵的特征值与特征向量.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
3-3 随机误差的正态分布 一、 频率分布 在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
数学模型实验课(二) 最小二乘法与直线拟合.
第三章 线性方程组 §4 n维向量及其线性相关性(续7)
Presentation transcript:

多元线性回归分析

古典线性回归模型的假定 为了得到OLS估计量的良好性质,“古典线性回归模型”(Classical Linear Regression Model) 作了如下假定。

假设1:给定X1i, X2i,… Xki时,εi的条件分布均值为零。 即:随机误差项具有零均值。

假设2 随机误差项彼此之间不相关 假定3 球型扰动项(spherical disturbance), 即对于解释变量的所有观测值,随机误差项有相同的方差。扰动项满足“同方差”、“无自相关”的性质

假定4: 不存在“严格多重共线性”(strict multicolinearity),即数据矩阵满列秩(full column rank)。 这意味着,数据矩阵的各列向量为线性无关,即不存在某个解释变量为另一解释变量的倍数,或可由其他解释变量线性表出的情形。 解释变量Xi之间不存在精确的线形关系,即解释变量的样本观测值矩阵X是满秩矩阵,应满足关系式: rank(X)=k+1<n 可以理解为各X之间互不相关(无多重共线性)

假设5 随机误差项服从正态分布,Y也服从正态分布。

多元回归中OLS估计量的分布 每抽取一组样本就会有一组相应的回归系数 ,因此, 一定不是常数,而是随机变量,并且具有一定的概率分布。 每抽取一组样本就会有一组相应的回归系数 ,因此, 一定不是常数,而是随机变量,并且具有一定的概率分布。 同样,在多元线性回归方程中, 也是随机变量。

最小二乘估计量的性质 在满足基本假设的情况下,最小二乘估计量具有:线性性、无偏性、有效性(最小方差性)(BLUE特性)。 高斯—马尔可夫定理(Gauss-Markov theorem) 在满足基本经典线性回归的假定下,最小二乘估计量是具有最小方差的最优线性无偏估计量。

最小二乘估计量的性质 在满足基本假设的情况下,最小二乘估计量具有:线性性、无偏性、有效性(最小方差性)。 1、线性性 其中,A=(X’X)-1 X’ 为一仅与固定的X有关的常数矩阵。

2、无偏性 3、有效性(最小方差性)

部分F检验 有时我们会考虑知道部分回归方程系数是否整体显著,即除常数项以外,部分解释变量的回归系数是否都为零。例如:

还有其他各种灵活的检验 这些就需要部分F检验。

s为回归方程的标准误差

部分约束的F统计量 当检验被解释变量yt与一组解释变量x1, x2 , ... , x q是否存在回归关系时,给出的零假设与备择假设分别是 H0:1 = 2 = ... = q = 0 ; H1:i , i = 1, ..., q不全为零。

检验思路:(部分参数联合检验) 无约束模型为:方程(a) yt = 0 +1x1t + 2x2t +…+ kx k t + ut 假设约束为:有q个回归系数同时为0,方程 包含k-q个变量 受约束模型为:方程(b): yt = 0 +1x1t + 2x2t +…+ k-qx k-q t + vt

关于上述原假设的检验很简单。若从模型中去掉这q个变量,对受约束模型方程进行估计的话,得到的误差平方和RSSR肯定会比相应的无约束模型的误差平方和RSSU 大,这一点和给回归模型添加解释变量总会引起R2的增加一样。如果原假设正确,去掉这q个变量将对方程的解释能力影响不大,RSSR将比RSSU 略有增加。当然,原假设的检验依赖于限制条件的数目,即被设定为零的系数个数,以及无条件回归模型的自由度。

如果原假设成立,那么模型(b)中的q个变量的系数均不显著,模型(a)与模型(b)的残差平方和近似相等。如果备择假设成立,那么q个变量中至少有一个变量是显著的,而模型(b)中的随机扰动项vt包含了这些显著性的变量,因此模型(b)的残差平方和会明显高于模型(a)的残差平方和。

模型(a)的残差平方和表示为RSSU(其中U表示没有约束(Unrestricted))。 模型(b)的残差平方和表示为RSSR(其中R表示带有约束(Restricted))。

因此,可以根据残差项方差的变化来检验假设是否是正确的。如果(RSSR - RSSU)比较大(小),则倾向于拒绝(接受)原假设。正式的统计检验是通过构建如下F 统计量来完成的。

在H0成立条件下,有 F  F (q, n – k – 1) 由检验思路可以看出,F统计量越大(小),我们越倾向于拒绝(接受)原假设。因此,这是右单端检验。检验可以临界值方法和构建p值的方法来完成。设检验水平为,检验规则如下。 临界值法:若F  F (q, n – k – 1),则接受H0;若F > F (q, n – k – 1),则拒绝H0。 P值法:若P(x > F ) > α,接受H0;若P(x > F ) < α,拒绝H0。

拒绝H0意味着q个约束中肯定有解释变量与yt存在回归关系。若F检验的结论是接受H0,则说明q个解释变量都不与yt存在回归关系。此时,假设检验应该到此为止。当F检验的结论是拒绝H0时,应该进一步做t检验,从而确定模型中哪些是重要解释变量,哪些是非重要解释变量。

两个回归方程具有相同的因变量,因此TSSU=TSSR

F检验的例子 test命令 例一 sysuse auto, clear reg price mpg weight length 1。检验参数的联合显著性 2。分别检验各参数的显著性

例二: use wage2, clear reg lnwage educ tenure exper exper2 1。教育(educ)和工作时间(tenure)对工资的影响相同。 2。工龄(exper)对工资没有影响 3。检验 educ和 tenure的联合显著性

例三:打开数据production,完成道格拉斯生产函数的估计。 use production,clear reg lny lnl lnk

1. 检验lnL(a)和lnL(b)的联合显著性 2. 劳动占比a为0.8,资本占比b为0.2。 3. 生产过程规模报酬不变。

总体回归模型: 总体回归函数: 样本回归模型: 样本回归函数: