特征量 专 业:心理学 课 程:心理统计学 授课者:章 永 单 位:教科院 2013.02
特 征 量 用来描述一组数据分布特征的数量 1.集中量 2.差异量 3.偏态量 4.峰态量 5.相关量
集 中 量 集中量:代表一组数据典型水平或集中趋势的特征量 一、功能: 1.描述和代表研究对象的一般水平 集 中 量 集中量:代表一组数据典型水平或集中趋势的特征量 一、功能: 1.描述和代表研究对象的一般水平 2.与同质的另一研究对象进行比较分析 二、种类: 1.平均数 大小之中 算术平均数 加权平均数 几何平均数 调和平均数 2.中 数 位置之中 3.众 数 频数之众
算术平均数 算术平均数:所有观察值的总和除以总频数所得之商 一、平均数的计算 1.原始数据计算法 2.频数分布表计算法 3.计算器计算法 二、平均数的特点 1.反应灵敏、确定严密、简明易解、计算简单; 2.较小受抽样变化的影响; 3.易受极端数据的影响。
算术平均数 算术平均数:所有观察值的总和除以总频数所得之商 三、平均数的性质 1.一组数据中每一个数与平均数之差(称为离差)的总和等于0。 2.给一组数据中每一个数加上一个常数C,则所得新数组的平均数为原来数组的平均数加上常数C。 3.给一组数据中每一个数乘上一个常数C,则所得新数组的平均数为原来数组的平均数乘以常数C。
加权平均数 加权平均数:不同比重数据(或平均数)的平均数 一、加权平均数的计算 二、加权平均数主要适用于 1.小组平均求总平均时 2.各个数据的份量不一样时
几何平均数 几何平均数:N个数据连乘积的N次方根 一、几何平均数的计算 二、几何平均数适用于 当数据成比率的时候 如:进步率、增加率、提高率等
调和平均数 调和平均数:一组数据的倒数的算术平均数的倒数 一、调和平均数的计算 二、调和平均数适用于 计算平均速率或速度 如:阅读速度、解题速度、识字速度等
频数分布表计算法 48个学生数学分数算术平均数计算表 分数 (1) 组中值 (2) 频数 (3) 组中值与频数之积 (4) 按公式计算 (5) 45— 50— 55— 60— 65— 70— 75— 80— 85— 90— 95— 47.5 52.5 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5 1 2 3 8 7 5 6 105 125 202.5 580 542.5 577.5 612.5 462.5 585 总和 48 3840
中 数 中数:位于按一定顺序排列的一组数据中央位置的数 一、中数的计算 1.原始数据计算法 2.频数分布表计算法 二、中数的优缺点
众 数 众数:在一组数据中出现频数最多的数 众数的计算 1.观察法(实际众数) 2.公式法(理论众数) 皮尔逊公式: 金氏插补法:
频数分布表计算法 48个学生数学分数中位数计算表 分数 (1) 组中值 (2) 频数 (3) 累积频数 (4) 计算中位数 (5) 45— 50— 55— 60— 65— 70— 75— 80— 85— 90— 95— 47.5 52.5 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5 1 2 3 8 7 5 6 16 23 30 37 42 48 总和
差 异 量 差异量:描述一组数据变异程度或离中趋势的特征量。 一、动差体系: 差 异 量 差异量:描述一组数据变异程度或离中趋势的特征量。 一、动差体系: 在统计学中,借用力学中的动差概念来描述一组数据分布的离散情况。常用的动差有: 1.一级动差: 2.二级动差: 3.三级动差: 4.四级动差:
差 异 量 二、差异量的种类及其计算: 1.绝对差异量 两极差 四分差 百分位差 平均差 方差及标准差 2.相对差异量 差异系数 差 异 量 二、差异量的种类及其计算: 1.绝对差异量 两极差 四分差 百分位差 平均差 方差及标准差 2.相对差异量 差异系数 3.相对位置量 标准分数 百分等级
差 异 量 三、各种差异量的比较与选用: 1.优良差异量应具备的标准 2.各种差异量优缺点的比较 3.各种差异量之间的关系 差 异 量 三、各种差异量的比较与选用: 1.优良差异量应具备的标准 2.各种差异量优缺点的比较 3.各种差异量之间的关系 当N很大且呈正态分布时: 4.如何选用差异量
两 极 差 两极差:一组数据最大值与最小值之差,又叫全距。 两极差的计算: 两 极 差 两极差:一组数据最大值与最小值之差,又叫全距。 两极差的计算: 两极差是一种低效的差异量。通常用于了解数据散布的大概范围,以便确定如何进行统计分组。
四 分 差 四分差:上四分位数(Q3=P75)与下四分位数(Q1=P25)之差的一半。 四分差的计算: 例: 四 分 差 四分差:上四分位数(Q3=P75)与下四分位数(Q1=P25)之差的一半。 四分差的计算: 例: 四分差通常与中位数联系起来共同应用。
百 分 位 差 百分位差:指两个百分位数之差。常用的有两种: (P90-P10):百分之90位数与百分之10位数之差 计算方法与四分差相同
平 均 差 平均差:所有原始数据与平均数的绝对离差的平均值。 “一级动差”中取绝对值 计算方法: 1.原始数据计算法: 平 均 差 平均差:所有原始数据与平均数的绝对离差的平均值。 “一级动差”中取绝对值 计算方法: 1.原始数据计算法: 2.频数分布表计算法:
方差及标准差 方差:一组数据的离差平方的算术平均数。 二级动差 标准差:方差的平方根。
方差及标准差 一、方差及标准差的计算 1.原始数据计算法 2.分组数据计算法 3.计算器计算法 4.标准差的组合
方差及标准差 二、方差及标准差的特点 1.一组数加上一常数,新数组的方差与标准差不变。 2.一组数乘以一常数,新数组的方差是原数组方差的常数的平方的倍数,新数组标准差是原数组标准差的常数的绝对值的倍数。 三、方差及标准差的意义 1.方差与标准差是表示一组数据离散程度最好指标。 2.方差具有可加性,利用这个特点能分解出由于不同原因造成的数据的变异性。 3.标准差和平均数结合可以概括数据的整体情况。
差 异 系 数 差异系数:指标准差与其算术平均数的百分比(CV) 一、计算方法: 二、差异系数的用途: 1.比较不同单位资料的差异程度。 2.比较单位相同但平均数相差较大的两组资料的差异程度。 3.可判断特殊差异情况: (1)一般情况下: CV在5%-35%之间。 (2)CV>35%:可怀疑平均数是否失去意义。 (3)CV<5%:可怀疑平均数、标准差是否计算有误。
差 异 系 数 差异系数:指标准差与其算术平均数的百分比(CV) 一、计算方法: 二、差异系数的用途: 例题1: 已知某地区6岁男童体重平均数为9.39kg,标准差为2.16kg,身高平均数为115.87cm,标准差为4.86cm,问体重与身高谁的差异更大? 例题2: 已知女童2个月和6岁时体重均数和标准差分别为:0.45kg、0.62kg;19.02kg、2.12kg;问什么时候差异更大?
标 准 分 数 标准分数:原始分数与其平均数之差(离差)除以其标准差所得之商。 一、计算方法 二、标准分数的性质 1.Z分数是以标准差为单位来表示一个数据在团体中所处相对位置的量数,无单位。 2.一组数据中所有数据的Z分数的: 平均数为0 标准差为1
标 准 分 数 标准分数:原始分数与其平均数之差(离差)除以其标准差所得之商。 三、标准分数的优点 1.可比性 2.可加性 3.明确性 4.稳定性 四、标准分数的应用 1.用于比较分属不同性质的观测值在各自数据分布中相对位置的高低 2.表示标准测验分数 3.用于合成不同质的数据 4.异常数值的取舍
百 分 等 级 百分等级:某一数据在按一定顺序排列的一组数据中的百分位置。 一、百分等级的计算: 就是百分位数的逆运算 二、百分等级在心理与教育研究中应用广泛
48个学生数学分数四分差计算表 分数 (1) 组中值 (2) 频数 (3) 累积频数 (4) 计算四分差 (5) 45— 50— 55— 60— 65— 70— 75— 80— 85— 90— 95— 47.5 52.5 57.5 62.5 67.5 72.5 77.5 82.5 87.5 92.5 97.5 1 2 3 8 7 5 6 16 23 30 37 42 48 总和
偏 态 量 α3 =0 : 对称分布 α3>0 : 正偏态分布 α3<0 : 负偏态分布 偏态量:描述一组数据分布偏斜程度的特征量 偏 态 量 偏态量:描述一组数据分布偏斜程度的特征量 偏态系数: 三级动差除以标准差的三次方 α3 =0 : 对称分布 α3>0 : 正偏态分布 α3<0 : 负偏态分布
偏 态 量 α3>0 α3<0 α3 =0
峰 态 量 α4 =0 :正态峰 α4>0 : 低阔峰 α4<0 : 高狭峰 峰态量:描述一组数据分布峰值程度的特征量 峰 态 量 峰态量:描述一组数据分布峰值程度的特征量 峰态系数: 四级动差除以标准差的四次方与3之差 α4 =0 :正态峰 α4>0 : 低阔峰 α4<0 : 高狭峰
峰 态 量 α4<0 α4>0 α4 =0
相 关 量 相关量:描述两个变量之间相关关系的特征量 一、相关关系 1.事物、现象、变量之间的相互关系有三种 相 关 量 相关量:描述两个变量之间相关关系的特征量 一、相关关系 1.事物、现象、变量之间的相互关系有三种 A.因果关系:一种变量是因,另一种变量是果 B.共变关系:两个变量都与第三个变量有关 C.相关关系:两个变量在大小、方向上有一定关系 2.从数学上讲,变量之间的相互关系有两种 A.函数关系:一种严格确定的一一对应关系 B.相关关系:两个变量之间不精确、不稳定的关系
相 关 量 二、相关系数 描述两个变量相互之间变化方向及密切程度的数字。 相关系数 r 的取值范围: -1.00≤r ≤+1.00 相 关 量 二、相关系数 描述两个变量相互之间变化方向及密切程度的数字。 相关系数 r 的取值范围: -1.00≤r ≤+1.00 相关系数并不能揭示两者之间内在的本质联系,也不能说明两者之间的因果关系。 三、相关的种类 正相关:两个变量变化方向相同 0.00<r ≤+1.00 负相关:两个变量变化方向相反 -1.00≤r <0.00 零相关:两个变量没有关系 r=0.00 四、相关散点图
相 关 量 五、相关系数的转换及合并 1.r的转换:相关系数不是等距变量,也不是百分比,其数值不能直接做加、减、乘、除等运算。 相 关 量 五、相关系数的转换及合并 1.r的转换:相关系数不是等距变量,也不是百分比,其数值不能直接做加、减、乘、除等运算。 但是,可以把r转换成Zr ——查“r-Zr转换表 ” Zr是等距的,所以可加、减,可计算平均数。 2.r的合并:——求r的平均数 r → Zr : (查表) ___ Zr → Zr : __ __ Zr → r : (查表)
相 关 量 六、相关系数 r 的解释(要做显著性检验) 0.00<r ≤0.30: 相关程度低——些微相关 相 关 量 六、相关系数 r 的解释(要做显著性检验) 0.00<r ≤0.30: 相关程度低——些微相关 0.30<r ≤0.50: 确定有关系——切实相关 0.50<r ≤0.80: 相关程度较高——显著相关 0.80<r ≤1.00: 相关程度很高——高度相关 七、常用的几种相关系数 积差相关系数 斯皮尔曼等级相关系数 肯德尔等级相关系数 点二列相关系数 二列相关系数 多列相关系数 四分相关系数 Φ相关系数 列联相关系数
相 关 量
积差相关系数 积差相关系数:当两个变量都是正态连续变量,且两者之间呈线性关系时,表达这两个变量之间的相关 一、定义式 二、适用条件 1.两个变量都是由度量而来的连续变量 2.两个变量的总体呈正态分布或近似正态分布(单峰) 3.两个变量之间呈线性关系 4.必须是成对的数据,数据之间相互独立,且n≥30 三、计算方法
斯皮尔曼等级相关系数 斯皮尔曼等级相关系数:当两个变量值以等级次序排列或以等级次序表示时,这两个变量之间的相关 一、适用条件 1.变量本身是等级资料或转化为等级的其他资料 2.不要求总体呈正态分布,也不要求 n≥30 3.两个变量之间呈线性关系 二、计算方法 1.等级差数法 式中:N:等级个数 D:二列成对变量等级之差
斯皮尔曼等级相关系数 二、计算方法 2.等级序数法 式中:N:等级个数 Rx、Ry:二列变量等级序数 3.有相同等级时的计算方法 式中:
肯德尔等级相关系数 肯德尔等级相关系数:当多个(两个以上)变量值以等级次序排列或以等级次序表示时,这几个变量之间的相关. 一、适用条件 与斯皮尔曼等级相关系数适用条件相同,只是用于两列以上等级变量的资料。例如: 几个评定者对一组学生成绩以等级评定的一致性 一个评定者对一组学生成绩以等级多次评定的一致性
肯德尔等级相关系数 二、计算方法 1.无相同等级的计算 2.有相同等级的计算 式中:K:评定者数目 N:被评者数目 R:被评者K个等级之和
点二列相关系数 点二列相关系数:当两个变量中,一个是正态的连续变量,而另一个是真正的二分变量时,这两个变量之间的相关。 一、适用条件 一列变量为等距或等比测量数据,且总体分布呈正态 另一列变量为真正的二分变量。 多用于评价由是非类测验题目组成的内部一致性问题 二、计算方法
二列相关系数 二列相关系数:当两个变量都是正态的连续变量,而其中一个变量被人为地划分成二分变量时,这两个变量之间的相关。 一、适用条件 两列变量均为等距或等比测量数据,且总体分布呈正态 其中一列被人为地划分为二分变量 二、计算方法
多列相关系数 多列相关系数:当两个变量都是正态的连续变量,而其中一个变量被人为地划分成多种类别(两类以上)变量时,这两个变量之间的相关。 一、适用条件 两列变量均为等距或等比测量数据,且总体分布呈正态 其中一列被人为地划分为多分(二分以上)变量 二、计算方法
四分相关系数 四分相关系数:当两个变量都是正态的连续变量,但两个变量都被人为地划分成二分变量时,这两个变量之间的相关。 一、适用条件 两列变量均为等距或等比测量数据,且总体分布呈正态 两列人为二分变量组成四格表 二、计算方法
Φ相关系数 Φ相关系数:当两个变量都是真正的二分变量时,这两个变量之间的相关。 一、适用条件 适用与除四分相关以外的其他四格表资料 两列真正的二分变量组成四格表 二、计算方法
列联相关系数 列联相关系数:当两个变量均被划分成两个以上类别时,或其中一个变量被划分成两个以上类别时,这两个变量之间的相关。 一、适用条件 两列变量均被分为多种类别变量 两列多分变量组成“二因素 R×C 列联表” 二、计算方法