Download presentation
Presentation is loading. Please wait.
1
第8章 相关分析 一元线性相关分析 多元线性相关分析 相 关 分 析 相关系数 相关指数 直线相关 曲线相关 相关分析概述 相关分析的意义
第8章 相关分析 一元线性相关分析 多元线性相关分析 相 关 分 析 相关系数 相关指数 直线相关 曲线相关 相关分析概述 相关分析的意义 相关关系的种类 相关分析的内容 单相关和复相关 正相关和负相关 直线相关和曲线相关 完全相关、完全不相关和不完全相关
2
8—1 相关分析的概述 相关分析的的意义 相关关系的种类 相关分析的概念和内容 返回
3
相关分析的的意义 相关关系是两个变量或者若干变量之间存在着一种不完全确定的关系, 它是一种非严格的确定性的关系。
函数关系是变量之间存在的一种完全确定的一一对应的关系,它是一种严格的确定性的关系。 函数关系的一般表达式为y=f(x) 返回
4
当一个变量每增减1个单位,另一相关变量按一个大致固定的增(减)量变化时称为线性相关;反之,相关变量不按固定增(减)量变化时,则为非线性相关。
相关关系的种类 两个变量的相关关系称为单相关。 三个或三个以上变量的相关关系称为复相关 相关的变量按同一方向变化,为正相关。 相关的变量按反方向变化,为负相关。 单相关和复相关 正相关和负相关 直线相关和曲线相关 完全相关、完全不相关和不完全相关 当一个变量每增减1个单位,另一相关变量按一个大致固定的增(减)量变化时称为线性相关;反之,相关变量不按固定增(减)量变化时,则为非线性相关。 当变量之间的依存关系密切到近乎于函数关系时,称为完全相关; 当变量之间不存在依存关系时,就称为不相关或零相关; 大多数相关关系介于其间,称为不完全相关。 返回
5
相关分析的概念和内容 相关分析就是对变量之间有无相关关系,相关关系的表现形式、变动的方向以及相关的密切程度进行的判断和分析。
在相关分析时,如果现象之间存在因果关系,我们常常把起决定作用的现象的量称为自变量,把受自变量影响随自变量变动而变化的现象的量称为因变量。如果现象之间互为因果关系或因果关系不明显,则根据研究目的来确定自变量和因变量。 判断变量间是否存在相关关系以及其表现形式 (借助于相关表和相关图来直观判断) 确定相关关系的密切程度和方向 (借助相关系数来确定) 返回
6
8—2 一元线性相关分析 相关表 相关图 相关系数 一元线性回归分析内容 返回
7
相关表 相关表是一种显示变量之间相关关系的统计表。 通常将两个变量的对应值平行排列,且其中某一变量按其取值大小顺序排列,便可得到相关表。
如下表 某商店10名售货员的工龄和日工资的相关系表 工龄(年) 4 5 6 7 8 9 10 日工资(百元) 42 46 50 60 64 68 74 72 80 84 返回
8
相关图 相关图又称散点图,是将两个变量的对应值,在平面直角坐标系中用坐标点的形式描绘而成的图形。 返回
9
相关系数 相关系数是用来说明变量之间直线相关关系密切程度和方向的统计指标,通常用r表示。 其计算公式如下: 实际中一般采用下列简捷法公式计算
评价标准 实例 返回
10
相关关系密切程度的评价标准 相关系数的取值范围是:-1≤r≤+1 ;正的表示正相关;负的表示负相关;
当 时,表示变量x与y 为完全的线性相关,也即为确定的函数关系。 当 时,表示两变量不存在线性相关关系,但不排除x,y间有可能存在非线性相关关系。 当 时,表示两变量存在不同程度的线性相关。 通常认为: r = 完全不相关; 0 ≤ r ≤ 微弱相关; 0.3 ≤ r ≤ 低度相关; 0 .5≤ r ≤ 显著相关; 0.8 ≤ r ≤ 高度相关; r = 完全相关。 由以上分析可见,相关系数的正负号表示直线相关的方向,其绝对数值的大小表示相关关系密切程度的强弱。 返回
11
计算相关系数的实例 【例】某地区历年人均收入与商品销售额资料如下: 要求计算人均收入与商品销售额的相关系数,说明其相关方向和程度。 年份
人均收入(百元)x 商品销售额(百万元)y xy x2 y2 1998 1999 2000 2001 2002 24 30 32 34 38 11 15 14 16 20 264 450 448 544 760 576 900 1024 1156 1444 121 225 196 256 400 合计 158 76 2466 5100 1198
12
计算相关系数的实例 解:将计算表中的数值代入效率公式得: 计算结果表明,人均收入与商品销售额之间存在高度的直线正相关关系。 返回
13
一元线性回归分析内容 回归分析的概念和特点 回归方程的建立 回归误差 返回
14
回归分析的概念和特点 回归分析是对具有相关关系的两个或多个变量之间的数量变化的一般关系确定一个合适的数学表达式,以便进行估计和预测的统计方法。 一元线性回归分析的特点 必须确定 自变量(x)和 因变量(y)。 y依x 和x依y的两个回归方程相互独立的,不能互换。 给出自变量的数值来估计因变量的数值。 计算相关系数时,要求相关的两个变量都是随机的变量;但是,确定回归方程时,尽管两个变量也都是随机变量,但要求自变量是给定的,因变量是随机的。 返回
15
回归方程 一元线性回归方程是用于分析两个变量(一个自变量与一个因变量)线性关系的数学表达式,一元线性回归方程的一般形式为:
式中, x是自变量的实际观测值。yc是因变量的估计值(又称理论值),是当自变量给定一个值时,对应的因变量的许多可能值的平均值。a和b为回归方程参数,其中b也叫回归系数。其几何意义是:a是直线方程的截距,b是斜率。其经济意义是:a是当x为零时y的起点值,b是当x每增加一个单位时,y平均增加(或减少)的数量, 它的符号同相关系数r的符号是一致的。 返回
16
回归方程 一元线性回归方程式的确定,实际上是根据抽样取得的若干对x和y的观测值,对方程中两个未知参数a和b的确定。根据最小平方法可的求解a、b两个参数的标准方程式为:
17
例题分析 【例】根据前面计算相关系数的资料,建立人均收入与商品销售额的直线回归方程。
解:将前面计算表中的有关数据代入求参数a、b的标准方程,得: 所以,人均收入与商品销售额的直线回归方程为: 返回
18
回归误差 一元线性回归方程的估计标准误差是用来说明回归方程代表性大小的统计分析指标,是指实际观察值和理论值的平均误差。 其计算公式为:
将 代入上式,经过推算可以得到计算回归误差的简捷公式:
19
回归误差 在实际应用中,当n很大时,一般是n≥30时,计算估计标准误差时就用n来代替n-2,则计算公式就成为: 或 返回
20
例题分析 【例】根据前面回归分析时所举例题的有关资料,计算人均收入与商品销售额回归方程的估计标准误差为: 返回
21
8—3 多元线性相关分析 多元线性相关的涵义 多元线性回归模型 多元线性回归方程的估计标准误差 复相关系数和偏相关系数 返回
22
多元线性相关的涵义 在统计中,研究一个变量与多个变量之间相关关系的理论和方法,称为多元相关分析;研究一个因变量和多各自变量的回归分析就是多元回归分析或复回归分析。 多元回归可分为两个主要方面:一是线性回归;二是非线性回归。 返回
23
多元线性回归模型 多元线性回归模型的一般表达式为: 式中,b0表示截距, 分别表示与每个自变量相联系的斜率,
ui表示剩余残差项或称作随机扰动项服从 。 返回
24
多元线性回归模型 方程式中的参数的求解方程式组为: ………………………………………
25
二元线性回归模型 两个自变量分别与因变量之间呈现线性相关时,可用二元线性回归模型来表示。 二元线性回归模型为: 求解参数的方程组为:
26
多元线性回归方程的估计标准误差 在多元线性回归分析中,回归估计标准误差的计算同一元线性回归标准误差的计算方法相同。 公式如下: 返回
27
复相关系数和偏相关系数 (一)复相关系数 复相关系数是指在具有多元相关关系的变量中,用来测定因变量y与一组自变量x1 ,x2 …,xm 之间相关程度的指标。 复相关系数的计算公式为: 复相关系数的取值是介于-1和+1之间,和简单相关系数一样,也是用其绝对值的大小来判断相关的密切程度。 返回
28
复相关系数和偏相关系数 (二) 偏相关系数 偏相关系数是在多个变量中,当其他变量保持不变的情况下,测定任意两个变量之间的相关程度的指标。
偏相关系数取值是介于-1和+1之间,和简单相关系数一样,也是用其数值的大小来判断相关的密切程度。 设有三个变量x1 ,x2 , x3,如果在这三个变量中,剔除x3的影响,可计算x1 ,x2,对 x3 的偏相关系数,记作 r12,3,其计算公式为:
29
如果在这三个变量中,剔除x2的影响,可计算x1 ,x3,对x2 的偏相关系数,记作 r13,2,其计算公式为:
30
如果在这三个变量中,剔除x1的影响,可计算x2 ,x3,对 x1 的偏相关系数,记作 r23,1,其计算公式为:
Similar presentations