简单相关与回归 武汉大学.公共卫生学院 卫生统计学教研室.

Slides:



Advertisements
Similar presentations
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
Advertisements

3.4 空间直线的方程.
第六章 回归分析.
生 物 统 计 学 第7章 回归与相关 彭司华 2016年5月.
双变量关联性分析.
第十章 相关与回归分析 PowerPoint 统计学.
第六章 相关与回归分析 本章主要内容 1.相关分析的基本问题 2.相关关系的测度 3.回归分析的基本问题 4.回归分析模型的建立
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
Pro. Xuezhong SHI, College of Public Health
第十一章 两变量关联性分析.
第13章 多重线性回归与相关 (multiple linear regression & multiple correlation)
预测与决策分析 Forecasting and Decision Analysis
相关与回归分析 目 录 一 相关分析概述 二 一元线性回归分析 小 结 三.
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
田间试验和统计方法 第九章 直线回归与相关.
第三节 协方差及相关系数 协方差 相关系数 课堂练习 小结 布置作业.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
第十一章 线性相关与回归.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第十九章 直线相关和回归分析.
第15章 相关分析与回归分析 (续).
曲线拟合 Curve fitting 2002级研究生《医学统计学》.
第八章 相关分析和回归分析 第一节:相关的意义、概念和种类 第二节:相关图表和相关系数 第三节:回归分析
简单回归分析.
线性相关分析.
第十七章 SPSS系统在传播学研究中的应用
Applied Regression Analysis
医学统计学 7 主讲人 陶育纯 医学统计学 7 主讲人 陶育纯
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第12章 回归直线.
Multiple linear regression
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第十一章. 簡單直線迴歸與簡單相關 Simple Linear Regression and Simple Correlation
十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression )
统计软件应用 7 主讲人 陶育纯 SPSS统计分析 统计软件应用 7 主讲人 陶育纯 教案.
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
相关与回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
線性相關與直線迴歸 基本概念 線性相關:兩個連續變項的共變關係,且有線性關係。所謂 的線性關係乃指兩個變項的關係可以被一條最具
第十七章 相關係數 17.1 前言 17.2 相關係數 17.3 功能視窗(Bivariate) 17.4 範例(Bivariate)
第十章 方差分析.
医学统计学 6 主讲人 陶育纯 医学统计学 6 主讲人 陶育纯
2 主讲人 陶育纯 MEDICAL MULTIVARIATE STATISTICS ANALYSIS 多元统计分析 教案
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
相关与回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/13.
第七章 参数估计 7.3 参数的区间估计.
Excel在报表分析中应用 潘雷驰 2019/4/4.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 6 主讲人 陶育纯 医学统计学方法 6 主讲人 陶育纯 流行病与卫生统计学教研室
抽样和抽样分布 基本计算 Sampling & Sampling distribution
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
(实验二) 回归函数的线性性、 误差的独立性和方差齐性的诊断
模型分类问题 Presented by 刘婷婷 苏琬琳.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
相關分析 7.1 連續變項之相關係數:Pearson 積差相關 7.2 質化變項之相關係數
用统计学方法研究电商平台上的产品销售特征
第十三章 直线相关与直线回归.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第四章 多元线性回归分析.
分数再认识三 真假带分数的练习课.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
相关关系 主讲人:孟迎芳.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

简单相关与回归 武汉大学.公共卫生学院 卫生统计学教研室

线性相关 直线相关:又称简单相关(simple correlation),用于描述两个变量之间的线性相关程度。 经典相关分析要求X与Y都是随机变量,而且服从双变量正态分布。 相关关系的统计量使人们对变量间的相关关系是否成立、相关的性质和强弱等有了量化依据。 2017/9/11 公共卫生学院.卫生统计学教研室

线性相关 相关系数(correlation coefficient),又称积差相关系数或 Pearson 相关系数(软件中常用此名称)以及spearman相关系数; 定量描述线性相关程度的一个常用指标,说明相关的密切程度和方向。 计算公式 2017/9/11 公共卫生学院.卫生统计学教研室

线性相关 关系数的特点: 相关系数r是表示两个随机变量之间直线相关强度和方向的统计量,是一个无量纲的数值,取值范围-1≤ r ≤ 1; r的正负值表示两变量之间直线相关的方向,即 r>0为正相关,r<0为负相关,r=0为零相关;r与回归系数b的符号相同; r的绝对值大小表示两变量之间直线相关的密切程度,|r|越接近于1,说明密切程度越高,|r|越接近于0,说明密切程度越低。 2017/9/11 公共卫生学院.卫生统计学教研室

线性相关 相关系数的假设检验: r≠0原因:① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠0 ② 存在相关关系, ρ≠0 检验方法:① 直接查表法(r界值表),② t 检验; 公式 Sr---- 相关系数的标准误 2017/9/11 公共卫生学院.卫生统计学教研室

定义 线性回归 用直线方程表达X(自变量,independent variable) 和Y(应变量, dependent variables)之间的数量关系。 Y(实测值)的预测值(predictive value),b是直线的斜率,即X每变化一单位,Y相应的变化b个单位。a为截距,即X为0时Y值的大小。 2017/9/11 公共卫生学院.卫生统计学教研室

直线回归的前提假设(LINE) 线性回归 线性 Linearity 反应变量均数 与X间呈线性关系:Y|X= α + X 独立 Independence 每一观察值之间彼此独立 正态 Normality 对于任何给定的 X:Y均服从正态分布 等方差 Equal variance 对于任何X值,随机变量Y的标准差  Y|X相等 2017/9/11 公共卫生学院.卫生统计学教研室

回归直线的建立主要是基于最小二乘法(least-squares ,LS),即各实测点与拟合直线之间纵向距离的平方和最小。 线性回归 回归直线的建立主要是基于最小二乘法(least-squares ,LS),即各实测点与拟合直线之间纵向距离的平方和最小。 线性回归的主要运用:统计预测与统计控制 统计预测:给定X值,估计Y; 统计控制(逆估计):要求Y在一定范围内波动,可通过X的取值来实现。 2017/9/11 公共卫生学院.卫生统计学教研室

线性回归 注意: 方法一:t检验 做直线回归之前,先做散点图,是确定两变量之间是否有关系的最简单的好方法。 回归系数(b)的假设检验 判断直线回归方程是否成立,需要检验总体回归系数β是否为0。 方法一:t检验 两种方法等价, 方法二:F检验 只有当β ≠0,才能认为直线回归方程成立(具有统计学意义) 2017/9/11 公共卫生学院.卫生统计学教研室

相关与回归的区别和联系 区别 1. 资料: 回归 —— Y为正态随机变量,X为固定的非随机变 量 相关 —— X、Y均为随机变量,且服从双变量正态分布 2.意义与应用: 回归 —— 反映两变量间的依存关系 相关 —— 反映两变量间的相互关系 3.回归系数与原度量单位有关,而相关系数无关 2017/9/11 公共卫生学院.卫生统计学教研室

相关与回归的区别和联系 联系 2017/9/11 公共卫生学院.卫生统计学教研室

相关与回归应用的注意事项 1. 根据分析目的选择变量及统计方法 直线相关用于说明两变量之间直线关系的方向和密切程 度,X与Y 没有主次之分 直线回归则进一步用于定量刻画应变量Y 对自变量X 在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y例如用身高估计体表面积 两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归或相关分析 2017/9/11 公共卫生学院.卫生统计学教研室

相关与回归应用的注意事项 2. 进行相关、回归分析前应绘制散点图—第一步 散点图可考察两变量是否有直线趋势 可发现异常点(outlier) 散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。 2017/9/11 公共卫生学院.卫生统计学教研室

相关与回归应用的注意事项 3. 资料的要求 直线相关分析要求 X与Y 服从双变量正态分布 直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回归方程不相同 2017/9/11 公共卫生学院.卫生统计学教研室

相关与回归应用的注意事项 4. 结果解释及正确应用 反应两变量关系密切程度或数量上影响大小的统计量 应该是回归系数或相关系数的绝对值,而不是假设检 验的P值 P值越小只能说越有理由认为变量间的直线关系存在, 而不能说关系越密切或越“显著” 不能任意“外延”;直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围 2017/9/11 公共卫生学院.卫生统计学教研室

表1 12名健康儿童的发硒与血硒的测量值(单位:1000ppm) 例题(相关与回归) 例题1 在某克山病区测量12名健康儿童头发中的硒含量与血液中的硒含量,其结果如表1所示。问儿童头发中的硒含量与血液中的硒含量是否相关,是否能求出以血液中的硒含量为因变量的回归方程。 表1 12名健康儿童的发硒与血硒的测量值(单位:1000ppm) 编号 发硒值 血硒值 1 74.2 13.5 2 66.6 10.5 3 88.8 13.8 4 69.5 11.0 5 91.0 16.6 6 73.5 9.8 7 7.8 8 96.0 14.0 9 58.8 5.8 10 10.0 11 64.8 7.6 12 78.6 11.5 2017/9/11 公共卫生学院.卫生统计学教研室

spss操作步骤(相关) 二、对X/Y变量做正态性检验 三、相关spss步骤 一、 绘制散点图 有线性趋势 X/Y变量均成正态分布 2017/9/11 公共卫生学院.卫生统计学教研室

spss操作步骤(相关与回归) Graphs Legacy dialogs Scatter/Dot… Simple Scatter 2017/9/11 公共卫生学院.卫生统计学教研室

spss操作步骤(相关) 等级相关系数 非参数方法 Kendall’s 相关系数:用于反映分类变量一致性的指标, 相关过程步 Analyze Correlate Bivariate Correlations 等级相关系数 非参数方法 Kendall’s 相关系数:用于反映分类变量一致性的指标, 只能在两个变量均为有序分类时使用。 2017/9/11 公共卫生学院.卫生统计学教研室

相关分析(结果) 散点图结果 有线性趋势 正态性检验结果 发硒值(X)、血硒值(Y)的P>0.05,均成正态分布。 2017/9/11 公共卫生学院.卫生统计学教研室

相关分析(结果) 结果解释: 相关系数r=0.880,双侧Pearson检验p<0.001,有统计学意义,可认为血硒值与发硒值呈正相关关系。 2017/9/11 公共卫生学院.卫生统计学教研室

是否能求出以血液中的硒含量为因变量的回归方程? 例题(相关与回归) 问题: 是否能求出以血液中的硒含量为因变量的回归方程? 2017/9/11 公共卫生学院.卫生统计学教研室

spss操作步骤(回归) 回归过程步 正态性、散点图 Analyze Regression Linear 2017/9/11 公共卫生学院.卫生统计学教研室

给出复相关系数R、决定系数R2 调整决定系数及方差分析结果 spss操作步骤(回归) 给出复相关系数R、决定系数R2 调整决定系数及方差分析结果 检验残差序列是否存在相关关系 2017/9/11 公共卫生学院.卫生统计学教研室

参数解释 “DEPENDNT”因变量。 “ZPRED”标准化预测值。 “ZRESID”标准化残差。 “DRESID”删除残差。 “ADJPRED”调节预测值。 “SRESID”学生氏化残差。 “SDRESID”学生氏化删除残差。 2017/9/11 公共卫生学院.卫生统计学教研室

回归分析(结果) 结果解释 相关系数R=0.880,R2=0.774,表示血硒值(因变量)的变异中77.4%可由发硒值(自变量)来解释,说明血硒值的变化能较好的运用发硒值的变化来解释。 2017/9/11 公共卫生学院.卫生统计学教研室

回归分析(结果) 结果解释 经F检验,F=34.156,P<0.001,差异有统计学意义,即此回归方程有意义. 2017/9/11 公共卫生学院.卫生统计学教研室

回归分析(结果)   2017/9/11 公共卫生学院.卫生统计学教研室

回归分析(结果) 学生化残差散点图 以血硒值为纵轴,学生化残差为横轴的散点图显示: 可认为散点图无明显变化趋势,且各学生化残差的绝对值都不大于2,未发现极端值; 可用回归方程描述发硒值和血硒值之间的关系。 2017/9/11 公共卫生学院.卫生统计学教研室

Thank You !