第三章 两变量线性回归.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
计量经济学 第五章 异 方 差 性.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第六章 回归分析.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
第十章 相关与回归分析 PowerPoint 统计学.
回归分析法预测 (Regression Analysis)
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第二章 经典单方程计量经济学模型: 一元线性回归模型
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
田间试验和统计方法 第九章 直线回归与相关.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第12章 回归直线.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
引子: 国内生产总值增加会减少财政收入吗?
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第六章 正态条件下回归的推论.
计量经济学 第三章 多元线性回归模型.
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
计量软件实验:EViews软件应用 基本回归模型.
第二章 一元线性回归模型.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第4章 多元线性回归分析.
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
回归分析.
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
多元回归分析:异方差性 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第五章 异方差.
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第四章 多元线性回归分析.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
多元线性回归分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

第三章 两变量线性回归

本章主要内容 第一节 两变量线性回归模型 第二节 参数估计 第三节 最小二乘估计量的性质 第四节 回归拟合度评价和决定系数 第五节 统计推断 第六节 预测

引言 本章介绍两变量线性回归分析。两变量线性回归分析的对象是两变量单向因果关系,模型的核心是两变量线性函数,分析方法是回归分析。两变量线性回归分析是经典计量经济分析的基础,掌握两变量线性回归分析的原理和技术,对进一步学习多元回归和其他计量经济分析方法都有帮助。

第一节 两变量线性回归模型 一、模型的建立 二、模型的假设

一、模型的建立 变量和函数式 变量关系的随机性

变量和函数式 两变量线性因果关系:Y =  +  X Y——被解释变量 X——解释变量 、——待定参数

1、模型根据: (1)研究问题的需要; (2)经济理论和观点; (3)利用经验和数据分布情况; (4)非线性函数和线性变换。

2、例子: (1)上海经济消费函数研究 P66; (2)科布—道格拉斯生产函数 P68;

例3-1 上海经济的消费规律研究 年份 可支配收入 Y 消费性支出CC 消费性支出C 1981 637 585 1992 3009 2509 1982 659 576 1993 4277 3530 1983 686 615 1994 5868 4669 1984 834 726 1995 7172 1985 1075 992 1996 8159 6763 1986 1293 1170 1997 8439 6820 1987 1437 1282 1998 8773 6866 1988 1723 1648 1999 10932 8248 1989 1976 1812 2000 11718 8868 1990 2182 1936 2001 12883 9336 1991 2485 2167 2002 13250 10464

例3-1 上海经济的消费规律研究

变量关系的随机性 1、在经济问题中精确的因果关系实际上不存在。 人类经济行为本身的随机性;两变量线性关系 通常只是抓了主要矛盾,而忽略的其他众多因素的影响。 2、正确的计量经济模型应该是随机模型: Y =  +  X +  ; 为随机扰动项。

二、模型的假设 1、特定的方法适用的模型是有条件的,因此必须对模型先作设定。 2、六条假设 (1)变量间存在随机函数关系Y= + X + ; (2)误差项均值为0; (3)误差序列同方差; (4)误差序列不相关; (5)X是确定性的,非随机变量; (6)误差项服从正态分布。

对假设的进一步分析 1、前五条假设是古典线性回归模型的基本假定; 2、假设(2)是反映线性回归模型本质的基本假设 ; 3、假设(3)的意义是对应不同观测数据组误差项分布的发散趋势相同,或有相同形状的概率密度函数; 4、假设(4)的意义是对应不同观测值的误差项之间没有相关性; 5、假设(5)和(6)都是为了回归分析和统计推断的方便而要求的,人为性较大的假设 。

第二节 参数估计 一、最小二乘估计 二、消费函数参数估计

一、最小二乘估计 建立两变量线性回归模型后,根据样本数据估计模型的参数,是线性回归分析的核心步骤。 对满足模型假设两变量线性回归模型的参数,最有效的估计方法是最小二乘法。

最小二乘法是根据随机变量理论值和实际值的拟合程度估计参数的。 线性回归模型的理论值可以用样本回归直线上点的坐标表示,实际值就是样本观测数据, 因此线性回归模型理论值与实际值的拟合,就是样本回归直线对观测数据的拟合。

若两变量线性回归模型为: 参数估计的思路就是找到能很好拟合样本数据的样本回归直线,近似模型总体回归直线E(Y ) =+ X,从而得到和 的估计a和b。

判断拟合程度最基本的标准是样本点与回归直线的偏差 ,称为“回归残差”或“残差” 。 越小回归直线离样本点越近,如果所有样本点的回归残差都较小,回归直线对样本趋势的拟合当然最好。 一般采用残差平方和 = 作为判断回归直线对样本数据拟合程度的标准,残差平方和越小就认为拟合程度越好。

核心:残差平方和 最小。

参数估计值

若两变量线性回归模型无常数项,即模型为 ,这时只有一个需要估计的参数,上述最小二乘估计的方法仍然是一致的。 最小二乘估计的残差平方和为 令该残差平方和对b的偏导数等于0,不难求得: b =

二、消费函数参数估计 以例3-1建立的消费函数模型为例,具体说明如何用最小二乘法估计模型中的参数。

例3-3上海经济的消费规律研究 年份 可支配收入 Y 消费性支出CC 消费性支出C 1981 637 585 1992 3009 2509 1982 659 576 1993 4277 3530 1983 686 615 1994 5868 4669 1984 834 726 1995 7172 1985 1075 992 1996 8159 6763 1986 1293 1170 1997 8439 6820 1987 1437 1282 1998 8773 6866 1988 1723 1648 1999 10932 8248 1989 1976 1812 2000 11718 8868 1990 2182 1936 2001 12883 9336 1991 2485 2167 2002 13250 10464

例3-3 上海经济的消费规律研究 Estimation Command: ===================== LS Y C X Estimation Equation: Y = C(1) + C(2)*X Substituted Coefficients: Y = 237.5 + 0.75*X

例3-3 上海经济的消费规律研究 Dependent Variable: Y Method: Least Squares Date: 10/04/04 Time: 20:14 Sample: 1981 2002 Included observations: 18 ------------------------------------------------------------------------------------------------- Variable Coefficient Std. Error t-Statistic Prob. C 237.5 35.50781 4.074556 0.0009 X 0.75 0.008022 98.45858 0.0000 R-squared 0.998352 Mean dependent var 2807.444 Adjusted R-squared 0.998249 S.D. dependent var 2333.000 S.E. of regression 97.61747 Akaike info criterion 12.10443 Sum squared resid 152466.7 Schwarz criterion 12.20336 Log likelihood -106.9399 F-statistic 9694.092 Durbin-Watson stat1.082919 Prob(F-statistic) 0.000000

第三节 最小二乘估计量的性质 一、最小二乘估计的线性性 二、最小二乘估计的均值和无偏性 三、最小二乘估计的方差和最小方差性 四、最小二乘估计的一致性

一、最小二乘估计的线性性: 参数估计量可以表示为被解释变量观测值的线性组合。 b的线性性 b

若把每项因子 记为 ,就得到: b = ,这表明b是随机变量Y 的线性组合。 a 的线性性: =

令 = V ,得a = 这表明a同样是随机变量Y 的线性组合。 线性性对于确定最小二乘估计量服从什么分布非常重要。由于解释变量X是确定性的,与最小二乘估计量的分布性质无关,因此最小二乘估计量可以表示为被解释变量观测值Y的线性组合,就与Y有相同类型的概率分布。

和V 两个指标的性质 =0, = =1, =1, =0

二、最小二乘估计的均值和无偏性 定义:参数估计量的均值就是真实值: b的无偏性的证明

a的无偏性同理可证。 意义:参数估计量是以参数真实值为分布中心的随机变量,反复抽样估计可得真实值。这是重要的分布性质,是推断分析的基础。 因为同时具有线性性和无偏性,因此最小二乘估计量是线性无偏估计量。

三、最小二乘估计的方差和最小方差性 在参数估计是无偏估计、线性无偏估计的基础上,方差较小的则意味着参数估计的精确程度较高,统计推断的效果也较好。 b的方差: a的方差:

在所有可能的线性无偏估计中,最小二乘估计a和b的方差最小。 这个性质称为最小方差性,也称为有效性。 最小二乘估计是参数真实值的最小方差线性无偏估计,也称为最优线性无偏估计或BLUE估计。

四、最小二乘估计的一致性 定义:参数估计量的概率极限等于参数真实值。 意义:属于大样本性质。保证增加样本容量可以逼近参数真实值。 最小二乘估计在模型假设下是一致估计。

第四节 回归拟合度评价和决定系数 一、拟合度评价的意义 二、离差分解和决定系数

一、拟合度评价的意义 评价回归分析、参数估计优劣的根本标准,是回归直线对样本数据的吻合程度,也称为“拟合度”或“回归拟合度”。 回归拟合度是判断和检验参数估计方法的方法之一。 回归拟合度也是检验模型变量关系真实性,判断模型假设是否成立的重要方法。

二、离差分解和决定系数 残差平方和不适用作为拟合度的评价指标。 用Y 的离差被回归值或X 的离差决定的程度作为评价拟合度的标准。 离差分解 SST = SSR + SSE (式3-3)。

1、离差分解 总离差平方和 SST= = 其中 = 称为“回归平方和”,记为SSR 。 残差平方和 记为SSE。 +

(3-3)式表明被解释变量Y的离差平方和可以分解为两部分,一部分是回归平方和,另一部分则是残差平方和。 前一部分SSR相对后一部分SSE越大,说明回归拟合程度越好,Y与X之间的线性决定关系越明显。

2、决定系数 为了突出这几部分之间的相对关系,将(3-3)式两边同除以SST 得到: 1= + 1= + 式中的 正是反映解释变量(或回归直线)对被解释变量决定程度的指标,称为“决定系数”,通常用R 表示。

R 的数值在0到1之间,是一个相对比重指标,可以避免样本数量和样本数值、单位的影响,因此在不同模型和不同样本的回归分析中具有可比性,是比残差平方和更合理的回归拟合度指标。

第五节 统计推断 一、最小二乘估计的分布和标准化 二、误差项方差的估计 三、参数的置信区间和假设检验

一、最小二乘估计的分布和标准化 线性回归模型的统计推断需要以参数估计量的概率分布为基础。 根据对最小二乘估计量性质的分析,已知最小二乘估计量服从以参数真实值为中心,以误差项方差的一个比例为方差的正态分布。

参数最小二乘估计量的这种分布性质,使得参数估计量与真实值通过概率分布联系在一起,从而可以通过参数估计量的分布性质推断参数真实值的情况等 。 在利用正态分布随机变量进行统计推断分析之前,需要先把它们变换为服从标准正态分布的统计量。对于b可以通过下列变换转化为服从标准正态分布的随机变量

二、误差项方差的估计 标准状态分布中包含未知参数 ,必须先估计出来。 本身也是线性回归模型的重要组成部分,是反映这一部分情况的基本参数。 标准状态分布中包含未知参数 ,必须先估计出来。 本身也是线性回归模型的重要组成部分,是反映这一部分情况的基本参数。 因为 因此 是 的无偏估计。

称“残差的标准差”。 用 代 ,得到的统计量服从t分布,而不是正态分布。如: 服从自由度为n-2的t分布。

三、参数的置信区间和假设检验 1、参数的置信区间 2、模型参数的显著性检验 3、其他假设检验

1、参数的置信区间(以参数 为例) 假设要求的置信度是95%,也就是显著性水平 根据t分布的意义,有: 整理该式得到:

这就是参数 的置信度为95%的置信区间,或者说区间估计。 构造参数的置信区间是非常重要的。置信区间限定了参数估计量与参数真实值的偏差程度,使我们对变量关系的了解更加深入和明确,对经济规律的可靠程度和适用情况更有把握。区间估计常常比点估计更加重要。

2、模型参数的显著性检验 模型参数的显著性检验,即检验模型参数是否显著异于0,是其中基本的一种假设检验。 两变量线性回归模型的基本出发点就是两个变量之间存在因果关系,认为解释变量是影响被解释变量变化的主要因素,而这种变量关系是否确实存在或者是否明显,会在参数中反映出来。

检验的具体方法如下:作原假设 备择假设 仍然选择95%置信度,那么95%的可能性 应该满足

如果原假设 成立,也就是说可以认为 是等于0的,那么就意味着: 95%的可能性会成立。 如果结果该不等式不成立,应该拒绝接受原假设,认为参数是显著的,变量关系是存在的。如果该不等式不成立,就不能拒绝接受原假设,只能认为没有显著性,变量关系并不明显存在。

第六节 预测 一、点预测 二、点预测的性质 三、区间预测

一、点预测 预测就是以估计出参数的线性回归模型为基础,对对应解释变量特定水平、未来值的被解释变量水平进行估计判断。 检验模型时通常把观测数据分成两部分,一部分用来进行回归估计参数,一部分用来进行预测和评估模型的预测效果。

点预测公式 预测残差(误差): 由于 未知,因此预测误差也未知。

二、点预测的性质 1、线性性 是一个线性预测,线性性的意义仍然是可以表示为 的线性组合。 =

2、无偏性 的第二个性质是无偏性,即是 的无偏预测, 或 。 这个性质也很容易证明,因为 =0

3、预测方差和最小方差性 作为随机变量,预测量 的方差也有重要意义,方差大小也是影响预测可靠性和价值的重要方面,利用预测量的分布性质进行区间预测要用到它。 根据与的关系,以及证明无偏性时得到的展开式等有:

= 这就是预测量 和预测误差 的方差。

三、区间预测 有了上述对点预测量性质的分析,我们可以与构造参数的区间估计一样,构造对的 预测置信区间,或者说“区间预测”。 有了上述对点预测量性质的分析,我们可以与构造参数的区间估计一样,构造对的 预测置信区间,或者说“区间预测”。 先将 标准化为服从标准正态分布的统计量,然后用 代替 ,得到服从t分布的统计量。

根据样本容量n,以及显著性水平 或 ,查t分布临界值表得 的置信区间为 - ≤ ≤ +