吴志强 信息管理学院 wuzhiqiang518@tom.com 讲座:SPSS使用方法 吴志强 信息管理学院 wuzhiqiang518@tom.com.

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
庄文忠 副教授 世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.
第二章 SPSS的基本操作 2-1 SPSS 的簡介 2-2 SPSS 軟體的功能表介紹 2-3 資料的輸入 2-4 資料的分析與輸出結果
SPSS系统教程.
多元统计分析 何晓群 中国人民大学出版社 2017/3/4 中国人民大学六西格玛质量管理研究中心.
龙星课程—肿瘤生物信息学上机课程 曹莎
第六章 回归分析.
统计软件SPSS — t 检验和方差分析 主讲人 陶育纯
第十章 相关与回归分析 PowerPoint 统计学.
How to Use SPSS in Biomedical Data analysis
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
传播学研究:理论与方法 戴元光 赵士林 邢虹文.
第1讲 SPSS基础
DOE & EXCEL, SPSS application
如何使用 Excel 與SPSS繪製 統計圖型
第一章 统计学及其基本概念 南京财经大学统计学系.
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
STATISTICA統計軟體的應用 第二講:廻歸與ANOVA
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
平均数检定 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
统计学期末复习
第十七章 SPSS系统在传播学研究中的应用
第四章 單變量描述性分析 第一節 描述性統計原理 第二節 報告(Reports)
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
平均数检定 庄文忠 副教授 世新大学行政管理学系 计量分析一(庄文忠副教授) 2011/7/12.
研究方法 Research Methodology
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第八章 均值比较与检验 2019/1/11.
交叉表格分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/13.
第十章 方差分析.
数据挖掘工具性能比较.
第9章 方差分析 介绍 1、方差分析的概念 2、方差分析的过程.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
消防人員土石流防救災訓練之效益 研究-以台中市消防局為例
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
SPSS for Windows简介 电子工业出版社.
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
第4章 Excel电子表格制作软件 4.4 函数(一).
统计图表绘制 电子工业出版社.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心
第八章 均值比较与检验 2019/5/10.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
第7章 基本统计分析 2019/5/14.
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
2003年中華職棒大聯盟現場球迷參與動機與滿意度之研究 A Study of Participation Motivation and Satisfaction of the Chinese Professional League Baseball’ Scene Fan in 2003 真理大學 運動管理學系.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
分类变量资料的统计推断.
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
庄文忠 副教授 世新大学行政管理学系 变异数分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/8/12.
数学模型实验课(二) 最小二乘法与直线拟合.
实习二 方差分析 流行病与卫生统计学系
Presentation transcript:

吴志强 信息管理学院 wuzhiqiang518@tom.com 讲座:SPSS使用方法 吴志强 信息管理学院 wuzhiqiang518@tom.com

关于SPSS SPSS原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。 随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司于2000年将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”。

社会科学研究中的统计 数据的描述性统计 频次分布 集中趋势:平均数、众数、中位数等; 离散趋势:方差和标准差、极差等; 数据分析 数据预测

一、SPSS常用菜单的功能 Data菜单:对数据进行排序、转置以及观测记录的选择; Transform菜单:数据转换功能,常用的有Compute、Recode以及Count。 Analyze菜单:各种统计分析。 Graphs菜单:制图工具。

二、SPSS的数据管理 常用的功能有: 数据转换; 数据聚合。

1.数据转换-Compute 对数据进行规律性的整理和计算。 步骤: 示例说明 Transform->Compute If条件的设置 新变量设定 示例说明

2.数据转换-Recode 对数据按分段模式转换,如:把数据中的年龄转换为年龄段。 步骤: 示例 Transform->Recode 选择需要转换的变量,并设置转换后的变量; 设置旧变量转换为新变量的条件; 运行OK即可。 示例

3.数据聚合-Aggregate 把数据按照某一变量进行分类汇总。 步骤: 示例 Data->aggregate 选定分类变量到Break Variables框 选定聚合变量到Aggregate Variables框 Function设置聚合函数 选择创建新文件 运行OK即可 示例

示例: Recode和Aggregate的组合使用

三、数据的描述统计 包括: 频数分析 均值 标准差

数据的集中趋势统计量 频数:各个组内含个体的个数 平均数(均值): 众数:频数出现最多的变量值 中位数:第50个百分位数点上的值

1.频数 SPSS操作: 打开数据文件,执行Analyze->Descriptive Statistics->Frequencies. 选择分析变量 Statistics按钮设置频数 Charts设置直方图以及正态曲线 OK即可。

2.平均数与标准差 SPSS操作: 打开数据文件,执行Analyze->Descriptive Statistics-> Descriptive. 选择分析变量 Option按钮设置统计量 OK即可。

数据的离散趋势统计量 方差和标准差 极差:最大值与最小值之间的距离 四分位数差:第25、50、75个百分位数点之间的距离

3.分组求均值 对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。 SPSS操作 Analyze->Compare Means->Means. 示例:求不同性别的人在各工资段上的平均值。

4.数据探测(Explore) 计算描述统计量,通过各类统计图等描述数据的分布类型。 SPSS: Analyze->Descriptive Statistics-> Explore。

5.交互分析 目的:描述同一组样本中不同变量之间是否存在显著联系。 SPSS: Analyze->Descriptive Statistics-> Crosstabs. Rows 和columns Chi-Square, Phi and Cramer’s V row 示例:性别与工资的联系。

交互分析的结果 卡方检验。P<0.05,则拒绝0假设,变量之间具有显著联系。 Phi值反应变量之间的关系强度,0.5表示高,0.3表示一般,0.1表示低。

四、SPSS数据的推断性统计分析 T检验 方差分析 … …

1. T检验 T检验的目的是检验两个样本中存在的差异在总体中是否也同样存在。 T检验的先决条件是: T检验是0假设,即两者之间不存在差异。 两个样本是随机取样的; 被比较的变量属于区间或比率等级; 样本的抽样分布呈正态分布。 T检验是0假设,即两者之间不存在差异。 T检验的结果:如果在置信度为95%下,显著性水平>0.05,则接受假设;如果<0.05,拒绝假设。

T检验的SPSS操作 Analyze->Compare Means->Independent T Test. 确定T检验的变量; Ok即可。 示例:不同性别工资差异的T检验。

2.方差分析 分析变量之间是否存在相关性。 要求:因变量在影响因素的各个水平上的分布必须服从正态分布。 例如:人的年龄是否受到地域的影响。不同地域的人的年龄,其平均年龄是否存在差异。 要求:因变量在影响因素的各个水平上的分布必须服从正态分布。

方差分析的原理—以单因素分析为例 假定H0:在某一自变量下的不同水平下,总体均值μ没有差异。 将原始数据按照自变量的水平不同随机分成c个组,然后进行分析: 如果组内差异大而组间差异下,则说明两个变量之间没有什么关联性; 如果组间差异大而组内差异小,则说明两个变量之间有某种关联性。

例子:人年龄与地域之间是否存在关联性 要解决的问题: 他们之间是否存在关联性? 如果有,则: 不同地域对人年龄的影响程度如何? 哪些地域对人的年龄的影响明显? 哪些地域对人年龄的影响最不明显?

解题步骤 1)原始数据按地域随机抽样。结果如下表: 地域1 地域2 地域3 82 81 83 79 80 84 85 =82 =80 =84

解题步骤 2)假定: 由于三个样本取自同一总体,因而其均值μ相同。但各自的 有差异。因此 假设H0: μ1= μ2= μ3 由于三个样本取自同一总体,因而其均值μ相同。但各自的 有差异。因此 假设H0: μ1= μ2= μ3 (含义:地域对人的年龄没有影响,其本身的样本均值与总体均值不同是由于抽样的波动引起的。)

解题步骤 3)求组间变差与联合方差 组间样本总平均值: 组间样本总方差: 联合方差:

解题步骤 4). F检验: 1)F值: 2)F的自由度 分子自由度:df1=c-1=3-1=2 如果Ho为真,F比值将围绕着1波动;如果Ho不真,F值将倾向于比1大很多。 1)F值: 2)F的自由度 分子自由度:df1=c-1=3-1=2 分母自由度:df2=c(n-1)=3(5-1)=12 3)用F分布表查Ho的概值。其概值远远小于0.001,趋近于0。 Ho的概值小于0.05( μ 的显著水平),拒绝Ho。

解题步骤 5)对方差的方差齐性检验 该检验是对自变量不同水平下各观测变量总体方差是否相等进行检验。因为方差分析的前提是“自变量不同水平下观测变量总体方差无显著差异”。 分析过程:用t检验,首先分析p值(概值)是否大于a(=0.05),如果大于,方差无显著差异;然后,比较两个总体均值的t检验结果,如果t统计量对应的两端的概率p值大于a,无显著差异,如果小于,则有显著差异。

解题步骤 6). 多重比较检验 确定自变量的不同水平对观测变量的影响程度。 这种检验比较复杂,方法也很多,其中LSD敏感性最强。

结果 总体描述及95%置信区间 地域1 地域2 地域3

检验结果 1)概值趋近于0,小于0.05,拒绝Ho,不同地域下人的年龄有显著差异。 2)回归的概值为0.002,地域与人的年龄之间不是零线性相关。

1). 单因素方差分析 Analyze->Compare Means-On Way ANOVA. Dependent list选择因变量;Factor选择自变量。 posHoc选择R-E-G-W Q和Tukey。 Option选择Describtive和Homogeneity of V test. 结果:如果Post Hoc Tests检验中p<0.05,则具有显著差异。 例子:职务与工资的方差分析。

2).多因素方差分析 SPSS: Analyze->General Linear Model->Univariate. Dependent Variable, Fixed Factors. Options选择Descriptive St. 例子:职务、性别与工资的方差分析。

3.卡方检验 目的:检验样本中自变量与应变量之间的关系在总体中是否存在。 0假设:自变量与应变量之间的关系在总体中不存在。 结论:如果p>0.05,拒绝0假设。 卡方检验要求自变量与因变量都是分隔变量。

卡方检验的SPSS操作 SPSS: Analyze->Descriptive Statistics-> Crosstabs. Rows 和columns Chi-Square Ok.

五、 SPSS数据的预测分析 线性回归 对数回归 ……

关于回归分析 回归分析是社会研究中进行定量分析的基本方法,主要解决3个方面的问题: ①确定几个变量间是否存在相关关系;若存在,则找出它们之间合适的数学表达式。 ②据一个或几个变量值,预测或控制另一个或几个变量的值,且要知道这种控制或预测可达何种精确度。 ③进行因素分析,即在共同影响一个变量的多个变量(因素)间,找出主要和次要因素及其相互关系。

变量之间的两种关系 确定性关系 非确定性关系--相关关系 问题1:正方形的面积y与正方形的边长x之间的函数关系是y = x2。--确定性关系

相关关系的回归分析 对具有相关关系的两个变量进行统计分析的方法叫回归分析。 注:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。

现实生活中的相关关系 人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。

回归方程 对具有相关关系的现象,选择一适当的数学关系式,用以说明一个或一组变量变动时,另一变量或一组变量平均变动的情况,这种关系式称为回归方程。 如果所择关系式是线性的,就称为线性回归分析;反之,则称为非线性回归分析。 线性回归是回归分析的基本模型,很多复杂的情况都是转化为线性回归进行处理。

线性回归分析--最小二乘法

例子:大学生身高与体重的关系 从某大学中随机选出8名大学生,其身高和体重数据如下表: 编号 1 2 3 4 5 6 7 8 身高 165 157 170 175 155 体重 48 57 50 54 64 61 43 59 求大学生的身高与体重的回归方程。

结果 回归方程:

相关系数 r>0正相关;r<0负相关。 通常,r>0.75,认为两个变量有很强的相关性。

1.利用SPSS求线性回归 SPSS:Analyze->Regression->Linear. 因变量dependent和自变量Idependent OK即可。 示例:工作年限与工资水平的线性回归。

线性回归的结果 Model Summary:R方用来解释应变量中有多少可以被自变量所解释。 ANOVA方差分析:判断回归模型是否有统计学意义。如果P<0.05,具有意义。 Coefficients:具体的数学模型y=a+bx。

2.利用SPSS求对数回归 非线性回归。 通常用来求应变量是分隔变量的回归模型,而且要求应变量只有两个值,因此需要对变量进行重新编码。 SPSS:Analyze-> Regression-Binary Logistic. 示例:职务与工资之间的对数回归模型。

SPSS的使用心得 要掌握统计学的基本知识; 使用SPSS之前要先对数据进行宏观把握; 要根据数据以及分析思路选择合适的SPSS命令。

谢谢!