Presentation is loading. Please wait.

Presentation is loading. Please wait.

第六章 相关与回归分析 本章主要内容 1.相关分析的基本问题 2.相关关系的测度 3.回归分析的基本问题 4.回归分析模型的建立

Similar presentations


Presentation on theme: "第六章 相关与回归分析 本章主要内容 1.相关分析的基本问题 2.相关关系的测度 3.回归分析的基本问题 4.回归分析模型的建立"— Presentation transcript:

1 第六章 相关与回归分析 本章主要内容 1.相关分析的基本问题 2.相关关系的测度 3.回归分析的基本问题 4.回归分析模型的建立
第六章 相关与回归分析 本章主要内容 1.相关分析的基本问题 2.相关关系的测度 3.回归分析的基本问题 4.回归分析模型的建立 本章讲授方法 讲授及练习 本章课时: 6课时

2 第一节 相关分析的基本问题 一、相关关系与函数关系 (一)函数关系:指现象之间存在着严格的数量依存关系。
第一节 相关分析的基本问题 一、相关关系与函数关系 (一)函数关系:指现象之间存在着严格的数量依存关系。 (二)相关关系:指现象之间存在着不严格的数量依存关系。 例如:收入与支出之间的关系 入学成绩与毕业成绩 (三)二者关系 如果存在观察误差,函数关系会以相关关系的形式表现。如果所有变量皆纳入方程,则相关关系转化为函数关系。相关关系通常以函数形式去描述。

3 二、相关关系的种类 (一)按因素多少分 1.单相关(一元相关):两个因素,一个原因,一个结果。
2.复相关:三个或三个以上因素,多个原因,一个结果。如果只研究一个原因与结果的关系,叫偏相关。 (二)按相关表现形式分 1.线性相关(直线相关):在坐标上描点,近似地表现为一条直线。 2.非线性相关(曲线相关):在坐标上描点,近似地表现为一条曲线。(抛物线、双曲线、指数曲线)

4 (三)按相关的方向分 1.正相关:自变量增加,因变量也增加。收入与支出的关系等 2.负相关:自变量增加,因变量却减少。单位成本与产量等 (四)按相关程度不同分 1.完全相关:即函数关系 2. 不相关:现象之间没有任何关系 3.不完全相关:现象之间有关系,但非确定性的函数关系。

5 三、相关分析的主要内容 对两个或两个以上的现象之间数量上的不确定性依存关系进行的统计分析,即为相关分析。 具体内容有: (一)判断确定现象之间有无关系 (二)确定相关的具体表现形式 (三)确定相关关系的密切程度和方向 (四)检验现象相关的显著性

6 第二节 相关关系的测度 一、相关关系的一般判断
第二节 相关关系的测度 一、相关关系的一般判断 (一)定性分析:根据所掌握的理论知识,实践经验来判断现象之间是否存在着相关关系以及相关关系的类型。 例如收入和支出的关系。 (二)相关表和相关图:根据获得的数据资料,编制相关的相关表和相关图来分析数据变动的规律,判断现象的相关性。 我们以一元相关为例,来说明相关图和相关表。

7 某企业各年销售额和流通费用资料 年份 (年) 销售额 (万元) 流通费用(万元) 1998 10 1.8 1999 16 3.1 2000
32 5.2 2001 40 7.7 2002 74 10.4 2003 120 13.3 2004 197 18.8 2005 246 21.2 2006 345 28.3

8 二、相关系数的测定 (一)相关系数的定义:相关系数是测定线性相关的两个变量之间密切程度和相关方向的统计分析指标。
(二)相关系数的计算(皮尔逊线性相关系数) 设两个变量分别为: 相关系数(积差法) 相关系数 观测值个数

9 相关系数的值介于—1和1之间。其性质如下: (1)当 (2)当 时,表明两变量之间为完全的线性相关,即为函数关系。 (3)当 时,表明两变量之间没有线性相关关系。 (4)当 时,表明两变量存在一定程度的直线相关关系。且 越接近于1,两变量间相关关系越密切;越 接近于0,表明两变量之间相关关系越弱。 (5)相关的密切程度一般可以划分为四个级别:相关系数的绝对值在0.3以下为微弱相关,在 之间低度相关,在 之间为一般相关,在0.8以上为高度相关。 注意:相关系数低,只表明不存在较高的线性相关,但可能存在着较高的其它相关关系。

10 例如:固定资产和工业增加值相关系数计算表
企业编号 固定资产价值x 工业增加值y 1 2 3 4 5 6 7 8 9 10 15 17 25 28 30 36 37 42 45 - 66 320 xy 45 51 125 168 180 252 296 378 405 450 2350 x2 9 25 36 49 64 81 100 490 y2 225 289 625 784 900 1296 1369 1764 2025 11302 相关系数有一个明显的缺点,即它的数值与实际观测的数据组数有关,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1,当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量之间的关系密切程度也是不妥当的。

11 第三节 回归分析的基本问题 一、回归分析的概念:对具有相关关系的变量之间的数量变化的一般关系进行测定和描述,确定因变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计和预测的统计分析方法。 二、回归分析的主要内容 (一)根据研究的目的和现象之间的内在联系,确定自变量和因变量;通常原因为自变量(X),结果为因变量(Y) (二)确定回归分析模型的类型及数学表达式。 我们主要介绍一元线性相关的回归分析:则其数学表达为: (三)对回归模型进行评价与诊断,即对回归模型的代表性与拟合度进行评价。 (四)根据给定的自变量数值确定因变量的数值。

12 三、回归分析与相关分析的区别与联系: (一)区别
(1)在相关的两个或两个以上的变量中,必须根据研究的目的,确定一个因变量和自变量。而相关分析不必确定。 (2)在回归分析中,因变量是随机的,而自变量是给定的;在相关分析中,两个变量都是随机的。 (3)在因果关系不明显或互为因果关系的两个变量中,可以求出两个回归方程。即Y(因变量)倚X(自变量)的回归方程和X(因变量)倚Y(自变量)的回归方程。相关系数只有一个。只能用自变量的数值去推算因变量的数值。 (二)联系 (1)相关分析是回归分析的基础和前提 (2)回归分析是相关分析的深入和继续

13 四、回归分析的类型 (一)按具有相关关系的变量个数多少来分: 1.简单回归:一个自变量,一个因变量的回归分析 2.多元回归:一个因变量,多个自变量的回归分析 (二)按变量之间的相关形式分: 1.线性回归:变量之间的相关形态表现为直线相关时,进行的回归分析。 2.非线性回归:当变量之间相关的形态表现在曲线相关时,进行的回归分析。

14 第四节 一元线性回归分析 一、简单线性回归分析的含义:就是对两个变量间的数量变化关系的一般关系进行测定,拟合一个直线回归方程,以便于估计或预测的统计方法。 即只有两个现象(变量),并且二者之间呈一种直线相关的状态。 二、简单线性回归模型的建立 简单线性回归模型可设为: 由该方程确定的直线称回归直线,其中: 为直线的截距, 为直线的斜率。因变量估计值实际上是当给定一个自变量时,所有可能的因变量值的平均值。 因变量估计值 待定参数

15 参数 和 的确定 确定回归模型的主要问题是要确定两个待定参数。这两个参数的确定,通常是用最小平方法来确定的。用这种方法确定的回归方程是所有观测值的最优拟合线,也即此线会经过所有观测点的中心。因此有: 利用 这个式子,将 代入到上式中,并设其为Q。则有: 分别求Q对 和 的偏导数,并令其等于零。则会得到:

16 当自变量为8.5时,可以估计增加值为(点估计):
我们以固定资产和增加值资料如下 则回归方程为: 当自变量为8.5时,可以估计增加值为(点估计): 企业 编号 固定资 产价值x 工业增 加值y 1 2 3 4 5 6 7 8 9 10 15 17 25 28 30 36 37 42 45 合计 66 320 xy 45 51 125 168 180 252 296 378 405 450 2350 x2 9 25 36 49 64 81 100 490

17 三、回归估计标准误 (一)估计标准误的含义:是衡量回归估计精确度高低或回归方程代表性大小的统计分析指标。 (二)估计标准误差的计算
估计标准误差值越大,表明实际观测值与估计值的离差就大,就意味着回归方程的体表性比较差。反之,则代表性比较强。 根据上例,我们可以计算估计标准误差为:


Download ppt "第六章 相关与回归分析 本章主要内容 1.相关分析的基本问题 2.相关关系的测度 3.回归分析的基本问题 4.回归分析模型的建立"

Similar presentations


Ads by Google