1 第五章 相关关系
2 学习内容 识记相关、散点图、相关系数的含义; 理解各种相关系数的意义和适用条件, 熟练掌握常用相关系数的计算方法; 恰当选用相关系数进行相关分析。
3 与前面所学内容的关系 集中量数和差异量数主要用于描述单 变量数据资料的分布特征。 相关关系描述双变量数据相互之间的 关系(两列或多列的两两之间)。
4 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
5 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
6 一、相关 事物之间的相互关系:因果关系 一种现象是另一种现象的原因,而另一种现象 是结果。 共变关系 表面看起来有联系的两种事物都与第三种现象 有关。 相关关系 即两类现象在发展变化的方向与大小方面存在 一定的联系。
7 相关的类别 正相关两列变量变动方向相同,如身高和体重。负相关 两列变量变动方向相反,如练习时间和错误次 数。 零相关 两列变量无关系,一列变量变动时,另一列变 量做无规则运动,如相貌与成就。
8 二、相关系数 含义: 相关系数是两列变量间相关程度的数字表现形 式,是用来表示相关关系强度的指标。作为样 本统计量,常用 r 表示;作为总体参数,一般用 ρ 表示,并且是指线性相关而言。 性质: 取值介于 至 之间,常用小数形式表示; 符号表示相关的性质,绝对值大小表示强弱; 注意:相关密切程度不能只看相关系数的大小,而 应注意样本量,经过统计检验才能确定。
9 三、散点图 含义: 通过点的散布形状和疏密程度显示变量 间相关趋势和程度的统计图。 画法: P.121 通过散点图推断相关关系的方法。利用原始数据作图;利用标准分数作图。
10 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
11 一、积差相关的概念与适用资料 概念: 积差相关,又称积矩相关,是英国统计学家皮 尔逊于 20 世纪初提出的一种计算相关的方法, 因而也称皮尔逊相关,是求直线相关的基本方 法。 适用条件: 1 、成对的数据,数据部少于 30 对; 2 、两列变量都是连续变量; 3 、两列变量总体都为正态分布; 4 、两列变量之间的关系是直线性的。
12 二、积差相关计算公式 基本公式:应用标准分数计算:用原始数据计算:
13 例题(用原始分数计算)( p.127 )
14 三、计算积差相关系数的差法公式 适用条件: 当要同时计算两列以上的变量相互间的 相关系数时,应用加差法和减差法公式 计算相关系数比较方便。 减差法公式:加差法公式:
15 四、相关系数的合并 应用范围: 对同一总体几个样本的相关系数进行合成,或 求平均相关系数。 转换原因: 相关系数不是等距尺度,因此不能简单求平均 数,应先转化后求平均。 方法: 1 、 Z-r 转换 2 、求 Z 的平均数,公式为: 3 、 r-Z 转换
16 例题:今有三个样本相关系数,欲求平均的 相关系数。具体见下表: 查 r — Z r 转换表
17 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
18 一、斯皮尔曼等级相关 概念: 斯皮尔曼等级相关是等级相关的一种, 常用符号 r R 表示。 适用条件: 两列变量属于等级变量,对总体分布形 态无要求,样本量也可以小于 30 。 精确度比积差相关系数差,所以凡符合 计算积差相关系数的数据应计算积差相 关系数。
19 计算公式 1 、等级差数法: 2 、等级序数法: 3 、有相同等级时的计算方法:
20 例题: 10 名学生的数学和语文考试成绩(见 下表),问数学与语文成绩是否相关?
21 二、肯德尔等级相关 肯德尔 W 系数(和谐系数) 适用资料: 多列等级变量求相关。这种资料的获 得一般采用等级评定的方法,即让 K 个评价者对 N 件事物进行等级评定 。 肯德尔 U 系数(一致性系数) 适用资料: 对 K 个评价者的一致性进行统计分析。 这种资料的获得一般为评价者采用对偶比较的方法 对事物进行评定,即将 N 件事物两两配对,可配成 N ( N+1 ) /2 对,然后对每一对中两事物进行择优 选择。
22 肯德尔 W 系数 计算公式:取值范围: 如果 K 个评价者意见完全一致,则 W=1 ; 若 K 个评价者意见存在一定的关系,但又不完 全一致,则 0<W<1 ; 如果 K 个评价者的意见完全不一致,则 W=0 。
23 例题:有 10 人对红、橙、黄、绿、青、蓝、紫七种颜 色的评价,将其喜好程度直接排等级顺序,结果如下 表,问这 10 人的颜色爱好是否具有一致性?
24 有相同等级时计算 W 系数
25 肯德尔 U 系数 计算公式: N 为被评价事物的数目即等级数; K 为评价者的数目; 为对偶比较记录中 i>j (或 i j (或 i<j )的格中的 择优分数; 将每一对事物择优比较的结果按优者记 1 , 非优记 0 ,难以判定记 0.5 的记分方法,将 分数填到相应的格子中,这便是
26 肯德尔 U 系数 例题( p.147 ) 取值范围: 完全一致 U=1 ; 完全不一致 或 ( K 为奇数) ( K 为偶数) ( K 为奇数) ( K 为偶数) 可见一致性系数 U 的取值 “ + ”“—” 不是表示相一 致的方向,这点与一般的相关系数不同。
27 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
28 质与量相关适用资料 两列变量求相关:一列是等比或等距的测量数据;另一列是按性质划分的类别。质与量相关包括:点二列相关二列相关多系列相关
29 关于二分变量 概念: 按事物某一性质划分的只有两类结果的 变量,称为二分变量。 分类:真正的二分变量:如男女。 人为的二分变量:本来是连续型的测量 数据,但是人为划分为两个类别,如及 格与不及格。
30 一、点二列相关 适用资料: 两列观测值一个为连续变量(点数据), 另一个是二分称名变量(真正的二分型 数据)。 公式: 例题: p.149
31 二、二列相关 适用资料: 两列变量均属正态分布。但其中一列变 量为等距或等比的测量数据,另一列变 量虽然也呈正态分布,但它被人为地划 分为两类(人为的二分变量)。 公式: 例题: p.152
32 三、多列相关 适用资料: 两列正态变量,其中一列为等距或等比 的测量数据称为连续变量,另一列正态 变量被人为地分成多种类别,例如学习 成绩可为正态变量,被人为地划分为优、 良、中、差四类。 公式: 例题: p.155
33 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
34 品质相关适用资料 两列变量都只划分为不同的品质类别;数据一般都是计数数据; 数据通常被列为 R*C 表的格式。
35 一、四分相关 适用资料: 两列变量都是连续变量,但每个变量都 被人为地划分为两种类型; 通常,计算四分相关的数据会整理成四 格表。 公式: 例题: p.157
36 四格表的形式(固定) A 因素 A 因素 A 非 A A 非 A B 因素 B a+b 非 B c+d 非 B c+d a+c b+d a+c b+d ab cd
37 二、 Φ 系数( phi 系数) 适用资料:两列变量都是真正的二分变量;数据也要整理成四格表。公式:取值范围: 当 Φ<0.3 时,表示相关较弱; 当 Φ>0.6 时,表示相关较强。 例题: p.158
38 三、列联表相关 适用资料: 当数据属于 R*C 表的计数资料,欲分析 两变量之间的相关程度,就要应用列联 相关。 公式: 或
39 本章内容 第一节 相关、相关关系与散点图 第二节 积差相关 第三节 等级相关 第四节 质与量相关 第五节 品质相关 第六节 相关系数的选用与解释
40 一、如何选择合适的相关系数 选择计算相关系数方法要考虑的因素: 1 、要处理的数据的性质类别; 2 、某一相关系数需要满足的假设条件。 各种相关系数适用条件见表( p.162 )
41 二、相关系数值的解释 相关系数不是等距的测量值(无倍数关系, 不能简单求平均)。 相关系数大小与样本量有关,只有通过统 计检验才能说明含义。 两个变量之间的相关系数大小有时会受到 其他变量的影响。 相关不等于因果。
42 三、相关系数的用途 作为相关分析的指标。 高级心理统计方法中反映变量之间关 系的指标。 作为心理测量中作为信效度和区分度 的指标。