Download presentation
Presentation is loading. Please wait.
1
第7章 基本统计分析 2019/5/14
2
本章内容 SPSS 统计分析功能概述 SPSS 数值分析过程 基本统计分析概述 7.1 一维频数分布表Frequencies
7.2 描述统计分析过程Descriptives 7.3 探索分析 Explore 7.4 多维频数分布表(交叉表,列联表) 7.5 OLAP报告摘要表OLAP Cubes 补充: Reports的其他分析过程 练习题 2019/5/14
3
SPSS 统计分析功能概述 有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。 SPSS有数字分析和作图分析两类方法 2019/5/14
4
SPSS 数值分析过程 SPSS 数值统计分析过程均在Analyze菜单中,包括:
a、基本统计分析 :Reports, Descriptive Statistics b、均值比较与检验 :Compare Means d、方差分析:ANOVA Models b、相关分析:Correlate e、回归分析 :Regression f、聚类与判别:Classify g、因子分析:Data Reduction h、非参数检验:Nonparametric Tests 等等 2019/5/14
5
基本统计分析概述 基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。 在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。 Descriptive Statistics包括的统计功能有: Frequencies:频数分析 Descriptives:描述统计量分析 Explore:探索分析 Crosstabs:多维频数分布交叉表(列联表) Reports包括的统计功能有: OLAP Cubes:OLAP报告摘要表 Case Summaries:观测量列表 Report Summaries in Row:行形式输出报告 Report Summaries in Columns:列形式输出报告 2019/5/14
6
7.1 一维频数分布表Frequencies 1、了解变量的取值分布情况对整体把握数据的特征是非常有利的。
2、求分类(定类、定序)变量的频数和作Bar图 3、求定距变量(连续变量)的分布情况和作直方图Histogram 比Descriptives 多百分位,在Statistics选项(见Excel第三章 数据描述与分析)和 Format选项) 4、对连续变量进行分组(recode)后再求频数,如老中青(35, 60)的比例,文化程度(中学、大学及以上)的人数及比例等 5、Analyze + Descriptive Statistics + Frequencies 6、例子p :对1991年美国社会调查情况数据 (data07-01)进行统计处理。分析不同年龄(age变量)和最高受教育年限(educ变量)各水平的频数分布情况。 2019/5/14
7
7.2 描述统计分析过程Descriptives
1、功能:了解数据的基本统计特征和对指定的变量值进行标准化处理(标准化后的新变量的均值为0,标准差为1,目的是为了消除各变量间变量值在数量级上的差异,从而增强数据间的可比性)。 2、描述统计分析过程通过平均值(Mean)、 算术和(Sum) 、标准差(Std Dev) 、最大值(Maximum) 、最小值(Minimum) 、方差(Variance)、范围(Range)、平均数标准误(S.E. Mean)等统计量对变量进行描述。 3、一般是求定距变量的描述统计量,从中分析差异性(max,min) 4、 Analyze +Descriptive Statistics+Descriptives 5、例子:1985年美国联邦调查局对50个州各种犯罪情况调查的数据(data07-02)进行描述统计分析 50个州总的情况 不同地区region的情况(2种方法:Split File+ Descriptives, 第8章的Means) 2019/5/14
8
7.3 探索分析 Explore 1. 考察数据的奇异性和分布特征 2. 一般是考察定距变量
奇异性:数据的过大或过小(找出、分析原因、是否剔除) 分布特征:数据是否来自正态分布总体 考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验Spread vs level图) 2. 一般是考察定距变量 3. Analyze + Descriptive Statistics + Explore 因(分析)变量(Dependent List):定距变量 分组变量(Factor List):分类变量 标识变量(Label Cases by):为方便查找输出观测量如id 4.例子p112:考察银行数据(data07-03)中的不同性别的工资情况 2019/5/14
9
7.4 多维频数分布表(交叉表,列联表) 二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系 例子:
Analyze + Descriptive Statistics + Crosstabs 行变量(Row):需分类变量 列变量(Column):需分类变量 分层变量(Layer):条件(若有,需分类变量) Statistics选项: Chi-square复选项及其四种检验结果 Correlations复选项:相关系数 例子: 银行数据(data07-03)中:如求男女的民族分布情况,可得到白种人多,男性多的结论(注意cell选项,一般选频数和百分比),如求每一工种的男女分布情况(人数) P118:1991年美国社会调查情况数据(data07-01) :男女对生活的认识。 2019/5/14
10
7.5 OLAP报告摘要表OLAP Cubes OLAP(Online Analytical Processing)在线分析处理过程以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。 Analyze + Reports + OLAP Cubes Summary Variables:要进行统计汇总的数值型变量 Grouping Variables:分组变量(分类变量),注意:此分组变量在实际的运算过程中并不发挥分组的功能,而是确定进入统计的观测量的范围。如选择数学成绩作为摘要分析变量,而性别作为分组变量,要计算数学平均成绩,则结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有男女生观测量的数学成绩的总平均值。即所有性别有值(非Missing Value)的Case,才参与分析计算 Statistics选项:Sum和、Number of Cases观测量数目、Mean均值、Median中位数、Maximum最大…等等 例子p122:1991年美国社会调查情况数据(data07-01) :对不同种族race的孩子childs和教育educ情况进行报告摘要分析。 2019/5/14
11
补充: Reports的其他分析过程 Reports的其他分析过程有: Case Summaries:观测值摘要分析
Report Summaries in Row:行形式输出报告 Report Summaries in Columns:列形式输出报告 2019/5/14
12
Case Summaries:观测量列表 察看或打印所需要的变量值 Analyze + Reports + Case Summaries
Variables:要显示的变量名 Grouping Variables:分组变量(分类变量) 结果显示:多行或单行 2019/5/14
13
行形式输出报告 Summary 按行,如:sum、mean、max、min、count、std dev、 variance、percentage(above,below,inside)等 菜单: Analyze + Reports Report Summaries in Rows Data Column:报告变量 Break Column:分组变量及其Summary(多个交叉) Report:可对全部数据进行描述统计(Grand Total) Display Cases:是否显示每一个观测量 2019/5/14
14
列形式输出报告 Summary 按列,如: sum、mean、max、min、count、std dev、 variance、percentage(above,below,inside)等 菜单: Analyze + Reports + Report Summaries in Columns Data Column:报告变量 一一对应的Summary Insert Total:汇总列,可汇总两列或多列的信息 Break Column:分组变量(多个交叉)及Subtotal Report:可对全部数据进行描述统计(Grand Total) 2019/5/14
15
练习题 关于计算机课程教学情况的调查.DOC 请用Word提交分析报告,包括:
用什么命令(如Frequencies,Descriptive)和分析的变量 结果(表格或图形) 结果分析 2019/5/14
Similar presentations