Download presentation
Presentation is loading. Please wait.
1
交叉表格分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6
2
课程大纲 交叉表格分析(Crosstabs analysis) 卡方检定(Chi-square test)
残差分析(Residual analysis) 关联性测量(Measures of association) 加入控制变数(Control variable)的交叉 表格分析 SPSS之应用(庄文忠副教授) 2012/7/6
3
交叉表格分析(Crosstabs analysis)
次数分配(frequency)虽然得知类别变数 的分布情形,了解各个类别或等第的分布 情形是否过于集中或分散,但这是属于单 变数分析,并无法告诉我们「为什么」会 是这种分布,也不知道有哪些可能的解释 原因。 交叉表格分析经常被用来查看类别数较少 的两个变数(通常是名义的或等第的)之间 的关系。 SPSS之应用(庄文忠副教授) 2012/7/6
4
交叉表格的概率分布 边际概率(marginal probability distribution) 属于单变量的概率分布, P(X=i,Y=全部)或P(X=全部,Y=j),即 联合概率(joint probability distribution) 属于多变量的概率分布,P(X=i,Y=j)
5
交叉表格的概率分布 条件概率(conditional probability distribution) 属于多变量的概率分布, P(X=i/Y=j),公式: 独立概率(independent probability distribution):统计上互为独立发生的事件。
6
建立交叉表格的步骤与原则 交叉表应该有一个表头或标题。 在适当的位置(如表格内最上一列和最左一列、或 表格下方的注脚处)陈述变数的内容。
依据自变数和依变数的属性各自分成数个类别,形 成矩阵式表格。 分别计算表格内各个细格的个案数,再以边际个数 和为分母计算横百分比(row percentage)和直百分 比(column percentage),或是利用总和为分母计 算总和百分比(grand percentage)。 若资料中有遗漏值,在交叉分析时被舍弃不用,必 须在表格的附注说明处交待遗漏值的个数及比例。 SPSS之应用(庄文忠副教授) 2012/7/6
7
交叉表格的基本内容 个数(Counts) 期望个数(Expected frequencies) 横百分比(Row percentage)
直百分比(Column percentage) 总和百分比(Grand percentage) SPSS之应用(庄文忠副教授) 2012/7/6
8
交叉表格分析 SPSS之应用(庄文忠副教授) 2012/7/6
9
SPSS之应用(庄文忠副教授) 2012/7/6
10
卡方检定(Chi-square test)
卡方检定(Chi-square test)是用以决定两个变数 之间,是否有统计上的显着关联性。如果这两个变 数之间没有关系,就可以说是统计上独立,因此, 卡方检定通常是指「独立性卡方检定」(Chi- square test of independence)。作为一种推论性 统计,我们可以用样本的检定结果为基础,得知有 关母体的结论。 公式: SPSS之应用(庄文忠副教授) 2012/7/6
11
卡方检定 SPSS之应用(庄文忠副教授) 2012/7/6
12
SPSS之应用(庄文忠副教授) 2012/7/6
13
残差分析(Residual analysis)
残差=观察个数-期望个数=Oij - Eij 标准化残差(standard residual) 调整后标准化残差(adjust standardized residual) SPSS之应用(庄文忠副教授) 2012/7/6
14
残差分析 SPSS之应用(庄文忠副教授) 2012/7/6
15
SPSS之应用(庄文忠副教授) 2012/7/6
16
关联性测量(Measures of association)
卡方检定仅能证实这两个变数之间是否有 统计上的显着关联性,但未能说明两者的 关联「方向」与 「强度」。 由于卡方检定一方面要求随机抽取样本, 另一方面卡方值的计算受样本数和分类数 目所影响,因而无法提供关联强度的信 息。 SPSS之应用(庄文忠副教授) 2012/7/6
17
常见的关联量数 Lambda值:利用X变数所提供的信息来帮忙预测 Y变数所减少犯错的比例。适用在名义尺度的变 数上。
Cramer's V:适用在名义尺度的变数上。 Gamma参数:适用在等第尺度的变数上。 SPSS之应用(庄文忠副教授) 2012/7/6
18
常见的关联量数 Somers' d值:适用在等第尺度的变数上。 Kendall's tau-b相关系数:适用在等第尺度 的变数上。
SPSS之应用(庄文忠副教授) 2012/7/6
19
SPSS之应用(庄文忠副教授) 2012/7/6
20
SPSS之应用(庄文忠副教授) 2012/7/6
21
加入「控制变数」的交叉表格分析 分析自变数X对依变数Y的效果,必须透 「控制」可能影响此一关系的变异,让这 些变异保持固定的状态下,观察X和Y的关 系是否依然存在。 在三维或多维的交叉表格分析中,研究者 所感兴趣的不是X和Y是否独立的单一假 设,而是关心多个变数之间的关系是否成 立。 SPSS之应用(庄文忠副教授) 2012/7/6
22
「控制变数」的交叉表格分析 SPSS之应用(庄文忠副教授) 2012/7/6
23
SPSS之应用(庄文忠副教授) 2012/7/6
24
SPSS之应用(庄文忠副教授) 2012/7/6
25
操作练习&提问时间 SPSS之应用(庄文忠副教授) 2012/7/6
26
作业: 挑选两个类别变数,并提出假设,利用交 叉表格分析验证此一假定是否成立。
同前例,如果两个变数之间有显着相关的 话,利用残差分析说明造成显着相关的原 因。 同前例,加入第三个变数,验证原始两个 变数之间的关系是否仍然成立。 SPSS之应用(庄文忠副教授) 2012/7/6
Similar presentations