第十二章 线性回归
教学目标 理解线性回归原理; 掌握线性回归模型的建立和检验方法; 了解简单线性回归分析方法的用途。
回归分析 回归分析是探讨变量间数量关系的一种常用统计方法。它通过建立变量间的数学模型对变量进行预测和控制。 例如,视听反应时研究中,只要知道视觉反应时,就可以利用已有的模型,估计听觉反应时。
主要内容 第一节 线性回归模型的建立方法 第二节 回归模型的检验与估计 第三节 回归方程的应用
主要内容 第一节 线性回归模型的建立方法 第二节 回归模型的检验与估计 第三节 回归方程的应用
回归分析的定义 通过大量的观测数据,可以发现变量之间存在的统计规律性,并用一定的数学模型表示出来。这种用一定模型来表述变量相关关系的方法就称为回归分析。
一、回归分析与相关分析的关系 回归分析与相关分析均为研究两个或两个以上变量之间的关系的方法。广义上讲,相关分析包括回归分析,但严格说,二者也有区别。 确定变量间是否存在关系,这是两种分析的共同起点。但是回归与相关是以不同目的、从不同角度去分析变量间的关系的。 当旨在分析变量间关系的密切程度时,一般进行相关分析;倘若研究的目的是确定变量之间数量关系的可能形式,找出表达他们之间依存关系的合适的数学模型,并用这个模型表示这种关系形式,则叫做回归分析。
二、回归模型与回归系数 回归模型 回归系数 用来表达变量之间规律的数学模型称为回归模型。 回归方程的系数b,或者说方程所表示的直线的斜率,叫做回归系数。
三、回归模型建立方法 回归模型建立的步骤(p.401) 两种计算方法 平均数方法:把数据分为两组,分别代入设定的回归方程求和。 最小二乘法
四、回归系数与相关系数的关系 相关系数是两个回归系数的几何平均。
五、线性回归的基本假设 1、线性关系假设 2、正态性假设 3、独立性假设 4、误差等分散性假设 X与Y在总体上具有线性关系。 某一个X值对应的一组Y值与另一个X值对应的一组Y值之间相互独立; 误差项独立,误差项也需与自变量X相互独立。 4、误差等分散性假设 特定X水平的误差,除了应呈随机化的常态分配,其变异量也应相等。
主要内容 第一节 线性回归模型的建立方法 第二节 回归模型的检验与估计 第三节 回归方程的应用
为什么要进行有效性检验? 回归模型建立起来以后,需要考察这个模型是否有效?是否真正反映了两个变量之间的线性关系?以及用它来进行预测或估计的有效程度如何。 只有一个有效的回归模型,才能够用来进行预测。
一、回归模型的有效性检验 回归模型的有效性检验,就是对求得的回归方程进行显著性检验,看是否真实地反映了变量间的线性关系。 回归方程显著性检验的方法 回归方程方差分析(见书p.408)
二、回归系数的显著性检验 对于回归系数b进行显著性检验后,如果b是显著的,表明所建回归方程是显著的,或者说X与Y之间存在显著的线性关系。 回归系数的显著性检验利用t检验
三、测定系数 经过回归方程的方差分析或回归系数的显著性检验,解决了回归方程是否显著的问题(即两变量有否显著线性关系)。但在回归分析中还经常关系回归效果的问题(即两变量线性关系的程度问题)。 相关系数的平方(r2)叫做测定系数,表示的是回归平方和在总平方和中所占的比例。
主要内容 第一节 线性回归模型的建立方法 第二节 回归模型的检验与估计 第三节 回归方程的应用
回归方程的应用 回归方程的应用主要体现在利用建立的回归模型进行估计或预测。 回归预测分为点预测和区间预测两种。 例题:p.414
三、回归分析与相关分析的综合应用 一般情况下,回归分析与相关分析通常结合起来运用,具体包括以下几个步骤: 1、绘制散点图,判断X与Y是否有线性关系; 2、建立回归模型; 3、回归方程显著性检验; 4、计算回归估计标准误差SYX; 5、根据建立的回归模型进行预测,估计真值预测区间。