Download presentation
Presentation is loading. Please wait.
1
相关与回归分析 目 录 一 相关分析概述 二 一元线性回归分析 小 结 三
2
一、相关分析概述 生活中的相关 教学中的相关 学习时间与学习成绩; 意志力与学习成绩; 学习氛围与学习成绩; 出勤率的高低与学习成绩;
常见的相关关系 生活中的相关 教学中的相关 学习时间与学习成绩; 意志力与学习成绩; 学习氛围与学习成绩; 出勤率的高低与学习成绩; 学习态度与学习成绩; 教师的授课风格与学习成绩; 考试体系与学习成绩; 父母的受教育程度与学习成绩。 原材料的进价与产品的制造成本; 成本与利润; 父母身高与子女身高; 一个人的成就动机与未来的成就; 学生的学习时间与学习成绩; 家庭子女个数与孩子的性格;收入与消费; 肺活量与体重。 陕西工商职业学院
3
一、相关分析概述 (一)相关分析的概念 当一个或几个相互联系的变量取一定数值时,另一个变量的取值往往不确定,但它一般按某种规律在一定范围内变化。
4
一、相关分析概述 (二)相关分析的特点 变量之间确实存在着数量上的依存关系。如果一个现象发生数量上的变化,则另一个现象也会相应发生数量上的变化。 变量之间数量上的依存关系的具体关系值难以固定,难以用数学公式表示。相关关系属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个变量的影响,却并不由这一个变量完全决定。
5
一、相关分析概述 (三)相关分析的种类 1.按研究变量的个数多少:单相关、复相关
单相关是指两个变量之间的相关关系,即研究的问题只涉及一个自变量和一个因变量。 有三个或三个以上变量的相关关系称为复相关。
6
一、相关分析概述 2.按相关的密切程度,可以分成:完全相关、不完全相关和不相关
完全相关是指两种现象之间,其中一个现象的数量变化完全由另一个现象的数量变化所决定。 若两个现象之间彼此互不影响,其数量变化各自独立,我们就称这两种现象之间的关系为不相关。 若两个现象之间的关系介于完全相关和不相关之间,就称为不完全相关。
7
一、相关分析概述 3.按变量之间依存关系的形式:线性相关和非线性相关
线性相关(也称直线相关)是指在两个变量之间,当自变量X数值发生变动的,因变量Y跟着发生大致均等的变动。 如果现象相关点的分布不表现为直线的关系,而近似于某种曲线方程的关系,例如表现为抛物线、双曲线、指数曲线等非直线形式,则这种关系就称为非线性相关。
8
一、相关分析概述 4.按变量变化的方向,可以分成正相关和负相关 正相关是指两个变量有着一致的变动方向。
当一个现象的数量变动与另一个现象的数量呈相反方向时,这种相关称为负相关。如:利润与成本的关系。
9
一、相关分析概述 (四)函数关系与相关关系的异同 函数关系指现象之间存在着严格的数量依存关系。自变量与因变量存在确定性关系。
例:一个保险公司承保汽车5万辆,平均每辆保费收入为1000元,则该保险公司汽车承保总收入为5000万元。如果把承保总收入记为y,承保汽车辆数记为x,则y=1000x,x与y两个变量间完全表现为一种确定性关系,即函数关系。
10
一、相关分析概述 相关关系指现象之间存在着不严格的数量依存关系。某一变量的每一个数值可以有另一个变量的若干数值与之对应,不能由一个变量的数值精确地求出另一变量的数值。如居民的消费与收入关系。
11
一、相关分析概述 函数关系 相关关系 相关分析与函数关系的区别与联系 相关系数 目的 分析手段 地位相同,都是随机变量
研究变量之间数量伴随关系的规律,并通过一定的数学表达式描述这种规律 测度变量之间是否存在相关关系,以及相关关系的密切程度 目的 回归函数的数学表达式 相关系数 分析手段 不相同,因变量随着自变量的变化而变化,因变量是随机变量。 地位相同,都是随机变量 变量地位与数量 相关分析主要分析变量之间的密切程度和相关的方向 建立模型,对因变量进行预测或控制 侧重点 函数关系与相关关系虽然是两种不同类型的变量关系,但是它们之间并无严格的界限,在一定的条件下是可以互相转化的。
12
一、相关分析概述 (五)相关分析的方法 定性分析 相关图 相关表 定量方法 相关系数
13
一、相关分析概述 陕西工商职业学院 1.相关分析的方法:相关表 年 份 市场营销人员数(个)X 营业额(万元)Y 2001 2002
年 份 市场营销人员数(个)X 营业额(万元)Y 2001 2002 2003 2004 2005 2006 2007 63 65 73 79 82 90 99 550 590 630 690 700 790 810 月份 上证指数 A证券价格 1 3849 12.45 2 3854 14.48 3 3870 13.54 4 3795 11.42 5 3737 9.86 6 3720 8.53 7 3705 7.55 8 3801 8.05 9 3815 8.68 10 3830 10.08 11 3825 9.45 12 3865 12.48
14
一、相关分析概述 2.相关分析的方法:相关图
15
一、相关分析概述 3.相关系数 通过编制相关表,绘制相关图只能初步判断现象之间有无相关关系以及相关关系是什么形式。为了准确地测定两个现象之间相关关系的密切程度和方向,则需要计算相关系数r。 相关系数是用来说明,在直线相关条件下,变量之间相关关系密切程度和方向的统计分析指标。
16
一、相关分析概述
17
一、相关分析概述 式中:n表示数据项数, 为自变量的算术平均数, 为因变量y的算术平均数。
18
一、相关分析概述 两个变量之间的相关程度和方向,取决于两变量离差乘积之和 ,当它为0时,r为0;当它为正时,r为正;当它为负时,r为负。
相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差 ,所以相关系数是无量纲的数量。
19
一、相关分析概述 如何利用相关系数判断现象之间的相关程度 相关系数 r的取值范围为:-1≤r≤1 r>0,表明现象呈正线性相关
20
一、相关分析概述 利用相关分析应注意的问题 相关系数只是研究两个变量之间的密切程度(单) 自变量和因变量是随机的(r的唯一性)
只能判断有无直线相关关系,而不能 否定其他相关关系(局限性) 可以反映两现象的相关方向(正、负) 利用r的取值范围可以判断现象之间的密切程度
21
一、相关分析概述 相关分析的内容 1 2 3 4 确定现象之间有无相关关系,表现形式。 确定相关关系的表现形式。
判定相关关系的密切程度和方向。 4 测定变量估计值的可靠程度、对计算出的相关系数进行显著性检验。 相关分析的内容
22
二、一元线性回归分析 一元回归方程的概念、回归分析的特点 在两个变量之间,必须根据研究目的具体确定哪个是自变量,哪个是因变量
回归方程的作用在于,在给定自变量的数值情况下来估计因变量的可能值。一个回归方程只能作—种推算。推算的结果表明变量之间具体的变动关系) 直线回方程中,自变量的系数为回归系数。回归系数的符号为正时,表示正相关;回归系数符号为负时,表示负相关。 确定回归方程时,只要求因变量是随机的,而自变量是给定的数值。 所谓回归分析,就是对具有相关关系的变量之间变化的关系进行测定与描述,确立一个数学表达式,以便进行估计与预测的方法。
23
进行回归方程的显著性检验和测定估计标准误差
二、一元线性回归分析 陕西工商职业学院 (一) 回归分析的内容 表现形式 具体内容 曲线、直线 确定现象之间相关关系的数学表达模型 a、b的检验 进行回归方程的显著性检验和测定估计标准误差 在一定范围内进行预测 运用回归方程进行预测 (点和区间)
24
二、一元线性回归分析 (二)回归分析的类型 标志 类型 解释 回归变量的个数不同 一元回归 多元回归 一元回归是指只有一个自变量的回归。
多元回归包含了两个或两个以上的自变量。 回归的形式不同 线性回归 非线性回归 线性回归是指变量之间的变化趋势大体呈直线的回归分析。 非线性回归是指变量的变化趋势不是呈直线状态,而是表现为一定的曲线形式。
25
二、一元线性回归分析 (三)一元回归分析的步骤 函数表达 一元回归分析的步骤 yc0=a+bx0 回归方程的显著性检验
一元线性回归模型的确定 参数a、b的最小二乘估计 一元线性回归预测 回归方程的显著性检验
26
二、一元线性回归分析 (四)回归方程的显著性检验(拓展知识)
通过对回归方程检验,如果发现模型有缺陷,则必须回到模型的设定阶段或参数的估计阶段,重新选择自变量、因变量和函数形式,并重新进行模型建立和参数估计。
27
二、一元线性回归分析 显著性F检验: 回归系数b与0是否具有显著差异,表明着母体回归系数β是否为0。若B=0,母体回归直线就是一条水平线,x的变动对y没有影响,x与y之间无线性相关关系;如果B≠0,即x与y之间存在着线性相关关系,符合假设条件,所建立的一元回归方程可以认为符合变量间的变化规律。回归方程的显著性检验就是要验证变量x与y之间是否真正存在线性关系。
28
二、一元线性回归分析 (五)一元线性回归预测
建立回归模型的重要目的之一是进行预测。如果一元线性回归模型检验是显著的,就可以利用其进行预测,所谓预测,就是当自变量x取一个值x0时,估计y的取值。
29
二、一元线性回归分析 预测类型 涵 义 回归点预测 区间预测
涵 义 回归点预测 在不考虑估计的误差的条件下,进行一元线性回归预测,显得比较简单。根据—元线性回归模型yc=a+bx进行预测,其预测值为yc0=a+bx0。x0表示给定x具体数值,yc0是x=x0时y的预测值,通常也称点估计或点预测。 区间预测 当x=x0时,对应的预测对象y的点预测值为yc0=a+bx0。但是,由于各种因素的影响,在x=x0时,实际上观察到的数值y0一般不会恰好是yc0,它们之间总存在着一定的偏差,即预测误差。我们通常用估计标准误差来说明yc与y的差异程度。估计标准误差也可以用来说明回归方程代表性的大小,其计算原理与标准差基本相同。标准差说明平均数的代表性,估计标准误差说明回归线的代表性。
30
二、一元线性回归分析 1.回归点预测 在不考虑估汁的误差的条件下,进行一元线性回归预测,显得比较简单。根据—元线性回归模型yc=a+bx进行预测,其预测值为yc0=a+bx0。x0表示给定x具体数值,yc0是x=x0时y的预测值,通常也称点估计或点预测。
31
二、一元线性回归分析 陕西工商职业学院 2.区间预测(拓展知识)
当x=x0时,对应的预测对象y的点预测值为yc0=a+bx0。但是,由于各种因素的影响,在x=x0时,实际上观察到的数值y0一般不会恰好是yc0,它们之间总存在着一定的偏差,即预测误差。
32
二、一元线性回归分析 我们通常用估计标准误差来说明yc与y的差异程度。估计标准误差也可以用来说明回归方程代表性的大小,其计算原理与标准差基本相同。标准差说明平均数的代表性,估计标准误差说明回归线的代表性。
33
二、一元线性回归分析 3.检验步骤如下(拓展知识) 提出假设 H0:β=0 H1:β≠0 确定检验统计量 确定显著性水平 确定临界值
a=0.05 确定临界值 F检验的临界值是由显著性水平。(通常 a=0.05)和自由度f决定的,依据 、fl、f2查F分布可得F检验的临界值F0.05(1,5)=6.61 做出判断 F= 。 由于F= >F0.05(1,5)=6.61,则拒绝原假设H0,接受备择假设,回归系数不为0,表明该一元线性回归方程的F检验通过,回归方程的回归效果显著。
34
逐步判断,定性、定量分析 三、小结 相关分析 回归分析 相关分析 回归分析 相关与回归 再次判断,深入分析 理论联系实际
Similar presentations