Download presentation
Presentation is loading. Please wait.
1
实验七 相关分析
2
SPSS的相关分析 7.1 相关分析和回归分析概述 7.2 相关分析 7.3 偏相关分析
3
7.1 相关分析和回归分析概述 客观事物之间的关系大致可归纳为两大类: 相关分析和回归分析都是分析客观事物之间统计关系的数量分析方法。
函数关系(确定性关系) :指两事物之间的一种一一对应的关系,如商品的销售额和销售量之间的关系。 统计关系(非确定性关系):指两事物之间的一种非一一对应的关系,例如家庭收入和支出、子女身高和父母身高之间的关系等。统计关系又分为相关关系和回归关系两种。 相关分析和回归分析都是分析客观事物之间统计关系的数量分析方法。
4
相关分析与回归分析的区别 相关关系 回归关系 变量y与变量x处于平等地位 变量y处于被解释的特殊地位 变量y与x均为随机变量
目的是刻画变量间的相关程度 可解释x对Y的影响大小,还可以对y进行预测与控制
5
7.2 相关分析 7.2.1 散点图 7.2.2 相关系数 7.2.3 基本操作 7.2.4 应用举例
6
7.2.1 散点图 相关分析通过图形和数值两种方式,有效地揭示事物之间相关关系的强弱程度和形式。
它将数据以点的的形式画在直角坐标系上,通过观察散点图能够直观的发现变量间的相关关系及他们的强弱程度和方向。
7
散点图的绘制 单击图形旧对话框散点/点状,打开窗口
8
简单分布(Simple Scatter),只能在图上显示一对相关变量
矩阵分布(Matrix Scatter),在矩阵中显示多个相关变量 重叠分布(Overlay Scatter),在图上显示多对相关变量 3-D分布(3-D Scatter),显示三个相关变量 简单点,堆积散点图
9
相关回归分析(高校科研研究).sav 1、简单散点图 选中简单分布,单 击定义Define按钮, 打开窗口
10
Y轴Y Axis:选择Y轴要绘制的变量 X轴X Axis:选择X轴要绘制的变量 设置标记Set Markers by:选择分组变量,SPSS根据该变量的值将观测量分成几组,每组采用不同的符号标注 标注个案Label Cases by:观测量标签变量
12
2、矩阵散点图 在矩阵散点图中,将图形分成多个方格,在每个方格中单独绘制某两个变量的数据。
在散点图窗口中选择矩阵散点图,单击定义Define,在出现的窗口中,依次选择投入高级职称人数、课题总数、论文数和获奖数进入矩阵变量Matrix框中,选择是否为直辖市进入设置标记Set Markers框中。
13
相关回归分析(高校科研研究).sav
15
3、重叠散点图 在重叠散点图中,在一个坐标系中绘制多个不同的变量对。
在散点图窗口中选择重叠散点图,单击定义Define,在出现的窗口中,选择变量投入人年数--论文数对和投入高级职称的人年数--专著数对进入Y-X Pairs框中。
16
相关回归分析(高校科研研究).sav
18
4、三维散点图 三维散点图在三维坐标系中绘制三个变量的数据。
在散点图窗口中选择三维散点图,单击Define,在出现的窗口中,分别选择论文数、投入人年数和获奖数为Y轴变量、X轴变量、Z轴变量。
19
相关回归分析(高校科研研究).sav
21
相关回归分析(高校科研研究).sav 5、堆积散点图-简单点图 选中简单点,单击定义Define按钮,打开窗口
23
对于其它图形的SPSS绘制,可阅读参考书,杜强、贾丽艳,《SPSS统计分析从入门到精通》,人民邮电出版社,2011年
书中的第19章,统计图形.
24
7.2.2 相关系数 利用相关系数进行变量间线性关系的分析通常需要完成以下两个步骤: 第一,计算样本相关系数r;
r>0,正的线性相关关系;r<0负的线性相关关系 r=1,完全正相关;r=-1,完全负相关;r=0,不相关 |r|>0.8,较强的线性关系; |r|<0.3,线性关系较弱 第二,对样本来自的两总体是否存在显著的线性关系进行推断。
25
对不同类型的变量应采用不同的相关系数来度量
双变量关系强度测量的主要指标
26
适用于两顺序变量的分析 更多指标-交叉列联表 适用于两分类变量的分析 适用于一分类变量一定距变量的分析
27
1. Pearson简单相关系数 适用于两个变量都是数值型的数据 Pearson简单相关系数的检验统计量为:
28
2. Spearman等级相关系数 用来度量两定序变量间的线性相关关系,计算时并不直接采用原始数据 ,而是利用数据的秩,用两变量的秩 代替 代入Pearson简单相关系数计算公式中,于是其中的 和 的取值范围被限制在1和n之间,且可被简化为:
29
如果两变量的正相关性较强,它们秩的变化具有同步性,于是 的值较小,r趋向于1;
在小样本下,在零假设成立时, Spearman等级相关系数服从Spearman分布;在大样本下, Spearman等级相关系数的检验统计量为Z统计量,定义为: Z统计量近似服从标准正态分布。
30
3. Kendall 相关系数 用非参数检验方法来度量两定序变量间的线性相关关系, 利用变量秩数据计算一致对数目(U)和非一致对数目(V)。
31
. Kendall 统计量的数学定义 小样本下服从Kendall分布, 大样本下采用的检验统计量为
32
7.2.3 基本操作 相关分析用于描述两个变量间 关系的密切程度,其特点是 变量不分主次,被置于同等的地位。
在分析Analyze的下拉菜单相关Correlate命令项中有三个相关分析功能子命令双变量Bivariate、偏相关Partial、 距离Distances,分别对应着相关分析、偏相关分析和相似性测度(距离)的三个SPSS过程。
33
Bivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。
Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的偏相关系数。 Distances过程用于对各样本点之间或各个变量之间进行相似性分析,一般不单独使用,而作为聚类分析和因子分析等的预分析。
34
1) 选择菜单Analyze Correlate Bivariate,出现窗口:
35
2) 把要分析的变量选到变量Variables框。
3) 在相关系数Correlation Coefficents框中选择计算哪种相关系数。 4) 在显著性检验Test of Significance框中选择输出相关系数检验的双边(Two-Tailed)概率p值或单边(One-Tailed)概率p值。 5)选中标记显著性相关Flag significance correlation选项表示分析结果中除显示p值外,还输出星号标记,以标明变量间的相关性是否显著;不选中则不输出星号标记。
36
6) 在选项Option按钮中的统计Statistics选项中,选中Cross-product deviations and covariances表示输出两变量的离差平方和协方差。
37
相关回归分析(高校科研研究).sav 7.2.4 应用举例 为研究高等院校人文社会科学研究中立项课题数会受哪些因素的影响,收集1999年31个省市自治区部分高校有关社科研究方面的数据,研究立项课题数(当年)与投入的具有高级职称的人年数(当年)、发表的论文数(上年)之间是否具有较强的线性关系。 对该问题的研究可以采用相关分析的方法,首先可绘制矩阵散点图;其次可以计算Pearson简单相关系数。
38
输出结果
39
7.3 偏相关分析 7.3.1 偏相关分析和偏相关系数 7.3.2 基本操作 7.3.3 应用举例
40
7.3.1 偏相关分析和偏相关系数 上节中的相关系数是研究两变量间线性相关性的,若还存在其他因素影响,就相关系数本身来讲,它未必是两变量间线性相关强弱的真实体现,往往有夸大的趋势。 例如,在研究商品的需求量和价格、消费者收入之间的线性关系时,需求量和价格之间的相关关系实际还包含了消费者收入对价格和商品需求量的影响。
41
偏相关分析也称净相关分析,它在控制其他变量的线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。
控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。
42
利用偏相关系数进行分析的步骤 第一,计算样本的偏相关系数
假设有三个变量y、x1和x2,在分析x1和y之间的净相关时,当控制了x2的线性作用后,x1和y之间的一阶偏相关定义为: 偏相关系数的取值范围及大小含义与相关系数相同.
43
第二,对样本来自的两总体是否存在显著的净相关进行推断
检验统计量为: 其中,r为偏相关系数,n为样本数,q为阶数。T统计量服从n-q-2个自由度的t分布。
44
相关回归分析(高校科研研究).sav 7.3.2 基本操作 1) 选择菜单Analyze Correlate Partial
45
2) 把参与分析的变量选择到Variables框中。
3) 选择一个或多个控制变量到Controlling for框中。 4) 在Test of Significance框中选择输出偏相关检验的双尾概率p值或单尾概率p值。 5) 在Option按钮中的Statistics选项中,选中Zero-order Correlations表示输出零阶偏相关系数。 至此,SPSS将自动进行偏相关分析和统计检验,并将结果显示到输出窗口。
46
相关回归分析(高校科研研究).sav 7.3.3 应用举例 上节中研究高校立项课题总数影响因素的相关分析中发现,发现立项课题数与论文数之间有较强正线性相关关系,但应看到这种关系中可能掺入了投入高级职称的人年数的影响,因此,为研究立项课题总数和发表论文数之间的净相关系数,可以将投入高级职称的人年数加以控制,进行偏相关分析。
47
输出结果 偏相关分析输出结果 负的弱相关 相关分析输出结果 正强相关
48
Thank you
Similar presentations