Presentation is loading. Please wait.

Presentation is loading. Please wait.

聚类分析 电子工业出版社.

Similar presentations


Presentation on theme: "聚类分析 电子工业出版社."— Presentation transcript:

1 聚类分析 电子工业出版社

2 提 纲 1.聚类分析概述 2.系统聚类分析 3.二阶聚类分析 4. K-均值聚类分析 5.本章小结

3 聚类分析概述 聚类分析是从事物数值的特征出发对事物进行分类,是数值分类学和多元统计技术相结合的结果,但目前它还是一种较粗糙的、理论并非完善的分析方法。可是,它使用简单,分类效果较好,其内容也在不断丰富中,是一种常用的数据探索性分析工具。 聚类分析(Cluster Analysis),又称集群分析,其分析的基本思想是依照事物的数值特征来观察各样品间的亲疏关系。而样品之间的亲疏关系则由样品之间的距离来衡量,一旦样品之间的距离定义之后,就把距离近的样品归为一类。

4 聚类分析概述 聚类分析是通过将一批数据的个案或者变量的诸多特征,按照关系的远近程度进行分类。如果关系远近程度的定量描述不一样,那么所利用的聚类方法也不一样,可以产生有差别的聚类结果。

5 聚类分析概述 聚类类型根据分类对象的不同可分为以下两种: (1)个案聚类 (2)变量聚类
根据聚类分析过程的不同,聚类分析的方法又可以分为以下三种:快速聚类、分层聚类和二步聚类。

6 系统聚类分析 系统聚类分析中的技术问题是描述个案和个案、个案和类以及类与类之间的远近关系,前面已经定义了个案与个案之间的距离,下面继续定义个案与类以及类与类之间的距离,这也是系统聚类分析过程中首先要确定的聚类方法。个案与类以及类与类之间的距离主要有组间平均链锁法(Between-groups linkage)、组内平均链锁法(Whthin-groups linkage)、最近相邻法(Nearest neighbor)、最远相邻法(Furthest neighbor)、重心聚类法(Centroid clustering)、中位数聚类法(Median clustering)和离差平方和法(Ward’s method)。

7 系统聚类分析 依次单击菜单“分析→分类→系统聚类”命令,打开“系统聚类分析”对话框

8 系统聚类分析 系统聚类分析:方法

9 系统聚类分析 系统聚类分析:保存

10 系统聚类分析 系统聚类分析:统计量

11 系统聚类分析 系统聚类分析:图

12 二阶聚类分析 二阶聚类模型是一种新型的系统聚类算法(Herarchical Algorithms),目前一般应用在数据挖掘与多元统计的交叉领域——模式分类中,其算法适合任何尺度的变量。 二阶聚类分析主要是利用距离度量假设聚类模型的变量均为自变量,即假设连续性变量为正态分布,分类变量是多项式。使用经验内部检验方法稳定自变量假设及分布假设的干扰。二阶聚类分析可以产生不同的聚类判别信息、最终聚类的聚类频数、最终聚类的描述性统计量,而且可以产生聚类频数的饼图、条形图和变量的重要性图。

13 二阶聚类分析 依次单击菜单“分析→分类→两步聚类”命令,打开“二阶聚类分析”对话框

14 二阶聚类分析 二阶聚类:选项

15 二阶聚类分析 二阶聚类:选项

16 二阶聚类分析 二阶聚类:绘制

17 二阶聚类分析 二阶聚类:输出

18 K-均值聚类分析 使用系统聚类分析能够得到多个分类解,但也存在执行时间过长的缺点;当给定分类的类数时,使用K-均值聚类分析过程可以有效地解决该问题,该方法的特点是分类速度快、占用内存少。 使用K-均值聚类时,可以利用系统默认设置执行命令,也可以对聚类过程设置各种参数,进行人为的干预。例如,可以事先指定样本的分类数,或者指定使聚类过程终止的判据或迭代次数等。 K-均值聚类分析仍是利用距离作为度量个体之间关系紧密程度的指标,并通过指定分类数而求得聚类结果,

19 K-均值聚类分析 依次单击菜单“分析→分类→K-均值聚类”命令,打开“K-均值聚类”对话框

20 K-均值聚类分析 K-均值聚类:迭代

21 K-均值聚类分析 K-均值聚类分析:选项

22 K-均值聚类分析 K-均值聚集:保存

23 本章小结 本章给出了聚类分析的基本原理和几种常用的聚类方法。聚类分析在高级统计分析中已经得到了极为广泛的应用,尤其是在社会学研究领域,聚类分析已经成为了一种不可或缺的分析方法。 聚类分析在本质上是一种分类学方法,虽然从方法上来说并不是很成熟,但几种重要的聚类方法无论从理论上还是在实际应用中都有了很多明显的结果,包括系统聚类分析、二阶聚类分析和K-均值聚类分析。SPSS的聚类分析模块给出了以上聚类方法的3个过程。读者学习时,要重点掌握和理解聚类分析的基本思想和SPSS操作中输出结果所包含的内容。


Download ppt "聚类分析 电子工业出版社."

Similar presentations


Ads by Google