吴志强信息管理学院 wuzhiqiang518@tom.com 讲座:SPSS使用方法吴志强信息管理学院 wuzhiqiang518@tom.com.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

庄文忠副教授世新大学行政管理学系 2012/7/6 SPSS 之应用 ( 庄文忠副教授 ) 1 SPSS 的环境与基本操作.

第二章 SPSS的基本操作 2-1 SPSS 的簡介 2-2 SPSS 軟體的功能表介紹 2-3 資料的輸入 2-4 資料的分析與輸出結果

SPSS系统教程.

多元统计分析何晓群中国人民大学出版社 2017/3/4 中国人民大学六西格玛质量管理研究中心.

龙星课程—肿瘤生物信息学上机课程曹莎

第六章回归分析.

统计软件SPSS — t 检验和方差分析主讲人陶育纯

第十章相关与回归分析 PowerPoint 统计学.

How to Use SPSS in Biomedical Data analysis

一、能线性化的多元非线性回归二、多元多项式回归（线性化）

传播学研究：理论与方法戴元光赵士林邢虹文.

第1讲 SPSS基础

DOE & EXCEL, SPSS application

如何使用 Excel 與SPSS繪製統計圖型

第一章统计学及其基本概念南京财经大学统计学系.

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习2 主讲人陶育纯医学统计学方法实习2 主讲人陶育纯流行病与卫生统计学教研室

不确定度的传递与合成间接测量结果不确定度的评估

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

STATISTICA統計軟體的應用第二講:廻歸與ANOVA

第一章商品第一节价值创造第二节价值量第三节价值函数及其性质第四节商品经济的基本矛盾与利己利他经济人假设.

平均数检定庄文忠副教授世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.

统计学期末复习

第十七章 SPSS系统在传播学研究中的应用

第四章單變量描述性分析第一節描述性統計原理第二節報告（Reports）

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

平均数检定庄文忠副教授世新大学行政管理学系计量分析一(庄文忠副教授) 2011/7/12.

研究方法 Research Methodology

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

第八章均值比较与检验 2019/1/11.

交叉表格分析庄文忠副教授世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2011/7/13.

第十章方差分析.

数据挖掘工具性能比较.

第9章方差分析介绍 1、方差分析的概念 2、方差分析的过程.

统计学 (第三版) 2008 作者贾俊平统计学.

第七章参数估计 7.3 参数的区间估计.

第一章函数与极限.

消防人員土石流防救災訓練之效益研究-以台中市消防局為例

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

SPSS for Windows简介电子工业出版社.

9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

完全随机设计多组资料的比较赵耐青卫生统计教研室.

第4章 Excel电子表格制作软件 4.4 函数（一）.

统计图表绘制电子工业出版社.

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

主講人陳陸輝特聘研究員兼主任政治大學選舉研究中心

第八章均值比较与检验 2019/5/10.

概率统计主讲教师叶宏山东大学数学院.

第4课时绝对值.

第7章基本统计分析 2019/5/14.

第四节多个样本均数的两两比较多个样本均数的两两比较又称多重比较(multiple comparison)，其目的是推断究竟哪些总体均数之间存在差别。

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

概率论与数理统计B.

2003年中華職棒大聯盟現場球迷參與動機與滿意度之研究 A Study of Participation Motivation and Satisfaction of the Chinese Professional League Baseball’ Scene Fan in 2003 真理大學運動管理學系.

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

分类变量资料的统计推断.

第六章 Excel的应用五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行

统计工具的使用方法主讲人陶育纯统计工具的使用方法主讲人陶育纯

第十五讲区间估计本次课讲完区间估计并开始讲授假设检验部分下次课结束假设检验，并进行全书复习本次课程后完成作业的后两部分

回归分析实验课程（实验三）多项式回归和定性变量的处理.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

庄文忠副教授世新大学行政管理学系变异数分析庄文忠副教授世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/8/12.

数学模型实验课（二）最小二乘法与直线拟合.

实习二方差分析流行病与卫生统计学系

Presentation transcript:

吴志强信息管理学院 wuzhiqiang518@tom.com 讲座:SPSS使用方法吴志强信息管理学院 wuzhiqiang518@tom.com

关于SPSS SPSS原意为Statistical Package for the Social Sciences，即“社会科学统计软件包”。随着SPSS产品服务领域的扩大和服务深度的增加，SPSS公司于2000年将英文全称更改为Statistical Product and Service Solutions，意为“统计产品与服务解决方案”。

社会科学研究中的统计数据的描述性统计频次分布集中趋势：平均数、众数、中位数等；离散趋势：方差和标准差、极差等；数据分析数据预测

一、SPSS常用菜单的功能 Data菜单：对数据进行排序、转置以及观测记录的选择； Transform菜单：数据转换功能，常用的有Compute、Recode以及Count。 Analyze菜单：各种统计分析。 Graphs菜单：制图工具。

二、SPSS的数据管理常用的功能有：数据转换；数据聚合。

1.数据转换－Compute 对数据进行规律性的整理和计算。步骤：示例说明 Transform->Compute If条件的设置新变量设定示例说明

2.数据转换－Recode 对数据按分段模式转换，如：把数据中的年龄转换为年龄段。步骤：示例 Transform->Recode 选择需要转换的变量，并设置转换后的变量；设置旧变量转换为新变量的条件；运行OK即可。示例

3.数据聚合－Aggregate 把数据按照某一变量进行分类汇总。步骤：示例 Data->aggregate 选定分类变量到Break Variables框选定聚合变量到Aggregate Variables框 Function设置聚合函数选择创建新文件运行OK即可示例

示例： Recode和Aggregate的组合使用

三、数据的描述统计包括：频数分析均值标准差

数据的集中趋势统计量频数：各个组内含个体的个数平均数（均值）：众数：频数出现最多的变量值中位数：第50个百分位数点上的值

1.频数 SPSS操作: 打开数据文件,执行Analyze->Descriptive Statistics->Frequencies. 选择分析变量 Statistics按钮设置频数 Charts设置直方图以及正态曲线 OK即可。

2.平均数与标准差 SPSS操作: 打开数据文件,执行Analyze->Descriptive Statistics-> Descriptive. 选择分析变量 Option按钮设置统计量 OK即可。

数据的离散趋势统计量方差和标准差极差：最大值与最小值之间的距离四分位数差：第25、50、75个百分位数点之间的距离

3.分组求均值对数据分组描述，可以输出分组数据的均值、标准差、极值等，即对数据进行多层分类汇总。 SPSS操作 Analyze->Compare Means->Means. 示例：求不同性别的人在各工资段上的平均值。

4.数据探测（Explore）计算描述统计量，通过各类统计图等描述数据的分布类型。 SPSS： Analyze->Descriptive Statistics-> Explore。

5.交互分析目的：描述同一组样本中不同变量之间是否存在显著联系。 SPSS： Analyze->Descriptive Statistics-> Crosstabs. Rows 和columns Chi-Square, Phi and Cramer’s V row 示例：性别与工资的联系。

交互分析的结果卡方检验。P<0.05，则拒绝0假设，变量之间具有显著联系。 Phi值反应变量之间的关系强度，0.5表示高，0.3表示一般，0.1表示低。

四、SPSS数据的推断性统计分析 T检验方差分析 … …

1. T检验 T检验的目的是检验两个样本中存在的差异在总体中是否也同样存在。 T检验的先决条件是： T检验是0假设，即两者之间不存在差异。两个样本是随机取样的；被比较的变量属于区间或比率等级；样本的抽样分布呈正态分布。 T检验是0假设，即两者之间不存在差异。 T检验的结果：如果在置信度为95％下，显著性水平>0.05,则接受假设；如果<0.05，拒绝假设。

T检验的SPSS操作 Analyze->Compare Means->Independent T Test. 确定T检验的变量； Ok即可。示例：不同性别工资差异的T检验。

2.方差分析分析变量之间是否存在相关性。要求：因变量在影响因素的各个水平上的分布必须服从正态分布。例如：人的年龄是否受到地域的影响。不同地域的人的年龄，其平均年龄是否存在差异。要求：因变量在影响因素的各个水平上的分布必须服从正态分布。

方差分析的原理—以单因素分析为例假定H0：在某一自变量下的不同水平下，总体均值μ没有差异。将原始数据按照自变量的水平不同随机分成c个组，然后进行分析：如果组内差异大而组间差异下，则说明两个变量之间没有什么关联性；如果组间差异大而组内差异小，则说明两个变量之间有某种关联性。

例子：人年龄与地域之间是否存在关联性要解决的问题：他们之间是否存在关联性？如果有，则：不同地域对人年龄的影响程度如何？哪些地域对人的年龄的影响明显？哪些地域对人年龄的影响最不明显？

解题步骤 1）原始数据按地域随机抽样。结果如下表：地域1 地域2 地域3 82 81 83 79 80 84 85 ＝82 ＝80 ＝84

解题步骤 2）假定：由于三个样本取自同一总体，因而其均值μ相同。但各自的有差异。因此假设H0： μ1＝ μ2＝ μ3 由于三个样本取自同一总体，因而其均值μ相同。但各自的有差异。因此假设H0： μ1＝ μ2＝ μ3 （含义：地域对人的年龄没有影响，其本身的样本均值与总体均值不同是由于抽样的波动引起的。）

解题步骤 3）求组间变差与联合方差组间样本总平均值：组间样本总方差：联合方差：

解题步骤 4）. F检验： 1)F值： 2)F的自由度分子自由度：df1=c-1=3-1=2 如果Ho为真，F比值将围绕着1波动；如果Ho不真，F值将倾向于比1大很多。 1)F值： 2)F的自由度分子自由度：df1=c-1=3-1=2 分母自由度：df2=c(n-1)=3(5-1)=12 3)用F分布表查Ho的概值。其概值远远小于0.001,趋近于0。 Ho的概值小于0.05（ μ 的显著水平），拒绝Ho。

解题步骤 5）对方差的方差齐性检验该检验是对自变量不同水平下各观测变量总体方差是否相等进行检验。因为方差分析的前提是“自变量不同水平下观测变量总体方差无显著差异”。分析过程：用t检验，首先分析p值（概值）是否大于a(=0.05)，如果大于，方差无显著差异；然后，比较两个总体均值的t检验结果，如果t统计量对应的两端的概率p值大于a，无显著差异，如果小于，则有显著差异。

解题步骤 6）. 多重比较检验确定自变量的不同水平对观测变量的影响程度。这种检验比较复杂，方法也很多，其中LSD敏感性最强。

结果总体描述及95％置信区间地域1 地域2 地域3

检验结果 1）概值趋近于0，小于0.05，拒绝Ho，不同地域下人的年龄有显著差异。 2）回归的概值为0.002，地域与人的年龄之间不是零线性相关。

1). 单因素方差分析 Analyze->Compare Means-On Way ANOVA. Dependent list选择因变量；Factor选择自变量。 posHoc选择R-E-G-W Q和Tukey。 Option选择Describtive和Homogeneity of V test. 结果：如果Post Hoc Tests检验中p<0.05，则具有显著差异。例子：职务与工资的方差分析。

2).多因素方差分析 SPSS: Analyze->General Linear Model->Univariate. Dependent Variable, Fixed Factors. Options选择Descriptive St. 例子：职务、性别与工资的方差分析。

3.卡方检验目的：检验样本中自变量与应变量之间的关系在总体中是否存在。 0假设：自变量与应变量之间的关系在总体中不存在。结论：如果p>0.05，拒绝0假设。卡方检验要求自变量与因变量都是分隔变量。

卡方检验的SPSS操作 SPSS： Analyze->Descriptive Statistics-> Crosstabs. Rows 和columns Chi-Square Ok.

五、 SPSS数据的预测分析线性回归对数回归 ……

关于回归分析回归分析是社会研究中进行定量分析的基本方法，主要解决3个方面的问题： ①确定几个变量间是否存在相关关系；若存在，则找出它们之间合适的数学表达式。 ②据一个或几个变量值，预测或控制另一个或几个变量的值，且要知道这种控制或预测可达何种精确度。 ③进行因素分析，即在共同影响一个变量的多个变量（因素）间，找出主要和次要因素及其相互关系。

变量之间的两种关系确定性关系非确定性关系－－相关关系问题1：正方形的面积y与正方形的边长x之间的函数关系是y = x2。－－确定性关系

相关关系的回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析。注：自变量取值一定时，因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。

现实生活中的相关关系人的身高与年龄；产品的成本与生产数量；商品的销售额与广告费；家庭的支出与收入。

回归方程对具有相关关系的现象，选择一适当的数学关系式，用以说明一个或一组变量变动时，另一变量或一组变量平均变动的情况，这种关系式称为回归方程。如果所择关系式是线性的，就称为线性回归分析；反之，则称为非线性回归分析。线性回归是回归分析的基本模型，很多复杂的情况都是转化为线性回归进行处理。

线性回归分析－－最小二乘法

例子：大学生身高与体重的关系从某大学中随机选出8名大学生，其身高和体重数据如下表：编号 1 2 3 4 5 6 7 8 身高 165 157 170 175 155 体重 48 57 50 54 64 61 43 59 求大学生的身高与体重的回归方程。

结果回归方程：

相关系数ｒ＞０正相关；ｒ＜０负相关。通常，r>0.75，认为两个变量有很强的相关性。

1.利用SPSS求线性回归 SPSS：Analyze->Regression->Linear. 因变量dependent和自变量Idependent OK即可。示例：工作年限与工资水平的线性回归。

线性回归的结果 Model Summary：R方用来解释应变量中有多少可以被自变量所解释。 ANOVA方差分析：判断回归模型是否有统计学意义。如果P<0.05,具有意义。 Coefficients：具体的数学模型y=a+bx。

2.利用SPSS求对数回归非线性回归。通常用来求应变量是分隔变量的回归模型，而且要求应变量只有两个值，因此需要对变量进行重新编码。 SPSS：Analyze-> Regression-Binary Logistic. 示例：职务与工资之间的对数回归模型。

SPSS的使用心得要掌握统计学的基本知识；使用SPSS之前要先对数据进行宏观把握；要根据数据以及分析思路选择合适的SPSS命令。

谢谢！