第八章 均值比较与检验 2019/5/10
本章内容 注意数据结构的不同 8.1 均值比较与均值比较的检验过程 8.2 MEANS 过程 8.3 单一样本的T检验 2019/5/10
8.1 均值比较与均值比较的检验过程 8.1.1 均值比较的概念 8.1.2 进行均值比较及检验的过程 8.1 均值比较与均值比较的检验过程 8.1.1 均值比较的概念 8.1.2 进行均值比较及检验的过程 MEANS过程:不同水平下(不同组)的描述统计量,如男女的平均工资,各工种的平均工资 T test 过程:对样本进行T检验的过程(三种:单一样本的T检验、独立样本的T检验、配对T检验) One-Way ANOVA:一元(单因素)方差分析,用于检验几个独立的组,是否来自均值相同的总体
8.1.1 均值比较的概念 统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:均值不相等的两组样本不一定来自均值不同的总体。 能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。
8.1.2 进行均值比较及检验的过程 MEANS过程:不同水平下(不同组)的描述统计量,如男女的平均工资,各工种的平均工资。目的在于比较。术语:水平数(指分类变量的值数,如sex变量有2个值,称为有两个水平)、单元Cell(指因变量按分类变量值所分的组)、水平组合 T test 过程:对样本进行T检验的过程 单一样本的T检验:检验单个变量的均值是否与给定的常数之间存在差异。 独立样本的T检验:检验两组不相关的样本是否来自具有相同均值的总体(均值是否相同,如男女的平均收入是否相同,是否有显著性差异) 配对T检验:检验两组相关的样本是否来自具有相同均值的总体(前后比较,如训练效果,治疗效果) One-Way ANOVA:一元(单因素)方差分析,用于检验几个(三个或三个以上)独立的组,是否来自均值相同的总体。-9章 如果分析变量明显是非正态分布的,应该选择12章的非参数检验过程。
8.2 MEANS 过程 功能:分组计算、比较指定变量的描述统计量。包括均值、标准差、总和、观测数、方差等等,还可以给出方差分析表和线性检验结果。描述统计量公式P126。 Analyze-> Compare Means->Means Dependent List:因变量(分析变量,一般为定距或定序变量) Independent List:自变量(分组变量,为分类变量,注意可分层) 选项:统计量选择项,对第一层每个控制变量的分析(方差分析和线性度检验) 例子:P128的学生身高data08-01(不同性别、不同年龄); 银行数据(不同性别的收入、不同工种的收入、不同性别和工种的收入) 选择项(P130):发育阶段相同年龄的男孩和女孩是否身高有所不同?是否身高随年龄的增长呈线性关系(注意分层:h BY age BY sex)-方差分析和线性度检验
8.3 单一样本的T检验 概念:检验单个变量的均值是否与给定的常数(指定的检验值)之间是否存在显著差异。如:研究人员可能想知道一组学生的IQ平均分与100分的差异。要求样本来自正态分布总体。 菜单: Analyze -> Compare Means-> One-Samples T test Test Variable(s):要求平均值的变量(一般是定距变量) Test Value:常数 零假设H0:样本均值Mean=常数(检验值); 结果中比较有用的值:Mean和Sig显著性概率值 例子P134 : 某地区12岁男孩的平均身高为142.5cm,而某市测量120名12岁男孩身高资料data08-02,检验该市12岁男孩平均身高与该地区12岁男孩平均身高是否有显著性差异(结论:无,原因Sig=.304>.05) 银行的平均工资是否是$30,000。
8.4 独立样本的T检验 要求:a. 被比较的两组样本彼此独立, 没有配对关系 b. 两组样本均来自正态总体 c. 均值是对于检验有意义的描述统计量 两组样本方差相等和不等时使用的计算t值的公式不同。因此应该先对方差进行齐次性检验。SPSS的输出,在给出方差齐和不齐两种计算结果的t值,和t检验的显著性概率的同时,还给出对方差齐次性检验的F值和F检验的显著性概率。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。 进行方差齐次检验使用F检验。对应的零假设是:两组样本方差相等。概率p<0.05 时,否定原假设,说明方差不齐;否则两组方差无显著性差异。F计算公式为: F=MAX(v1,v2)/MIN(v1,v2)(方差比)
8.4 独立样本的T检验(续) 菜单: Analyze -> Compare Means-> Independent Samples T test Test Variable(s):要求平均值的变量(一般是定距或定序变量) Grouping Variable :分组变量(只能分成两组) 结果中比较有用的值:方差齐次性检验F的Sig和方差相等或不相等的Sig( Sig为显著性概率值) 例子: 用分类变量分组:银行男女雇员的平均工资是否有显著性差异(Salary,gender(f,m)) 用定距变量分组: 例子P139的男生身高、体重、肺活量data08-03。不同身高(≥155cm, <155cm)其平均体重、肺活量是否有显著性差异;银行年轻和年老的平均工资(要先计算Age=2003-XDATE.YEAR(bdate)
8.5 配对样本T检验 要求:a. 被比较的两组样本有配对关系 b.两组样本均来自正态总体 c.均值是对于检验有意义的描述统计量。 菜单: Analyze -> Compare Means-> Paired Samples T test(注意数据结构,即前后在一个观测量中) Paired Variables:配对两变量 结果中比较有用的值:差值变量的均值Mean和Sig显著性概率值 例子: 选择项: P142的体育疗法治高血压(前后比较),判断体育疗法对降低血压是否有效。(特别说明:数据不是Data08-04) 银行的现工资Salay和起始工资salbegin是否有显著性差异