集成学习及其应用 余志文 计算机科学与工程学院 华南理工大学 二〇一六年五月.

Similar presentations


Presentation on theme: "集成学习及其应用 余志文 计算机科学与工程学院 华南理工大学 二〇一六年五月."— Presentation transcript:

1 集成学习及其应用 余志文 计算机科学与工程学院 华南理工大学 二〇一六年五月

2 提纲 集成学习的动机 集成学习的应用 集成学习模型介绍 我们在集成学习方向的研究工作 总结

3 集成学习的动机 “大数据”是继“云计算” 之后,在信息科技领域出现的一个研究焦点。如何从各种各样的海量数据中挖掘出有价值的规律,为政府和企业的决策提供支持成为新一代信息技术亟需解决的问题。 海量数据具有多样性,数据往往来源于不同的传感器。因此,研究如何把来自不同数据源的数据进行融合获取有价值的规律就成为非常值得探讨的问题。

4 集成学习的动机 数据集 模型4 模型1 模型2 模型3 单一学习模型:有如盲人摸象,从单一视角探索未知数据集,只有一个结果
集成学习模型:集思广益,从不同的视角探索未知的数据集,存在多个学习过程,允许一个或多个学习结果 模型4 模型1 模型2 模型3

5 集成学习的动机 集成学习是机器学习主要研究方向之一。 一个复杂的问题可以分解为多个简单的子问题,子问题的集成可以 解决原问题。
集成学习模型能把多个单一学习模型融合为一个综合的模型,并获 得一个全局的结果。 与单一学习模型相比,集成学习模型能够提高准确率、稳定性和强 壮性。

6 提纲 集成学习的动机 集成学习的应用 集成学习模型介绍 我们在集成学习方向的研究工作 总结

7 集成学习的应用 任务大类 分类任务 聚类任务 半监督学习任务 具体任务 协同过滤 异常检测 分布计算 多源数据融合 ……

8 集成学习的应用 电影推荐 人脸识别 数据挖掘竞赛 多源数据融合

9 提纲 集成学习的动机 集成学习的应用 集成学习模型介绍 我们在集成学习方向的研究工作 总结

10 集成学习的类型 单一学习模型: 分类任务 Support vector machine (SVM), Neural network, Decision tree, Bayesian classifier, Nearest neighbor classifier, 聚类任务 Partition clustering (K-means), Hierarchical clustering, Model based clustering, Density based clustering, Scalable clustering, 半监督学习任务

11 集成学习的类型 集成学习模型: 分类集成模型
Bagging, Boosting, Random subspace, Random forest, Rotation forest, Neural network ensemble, 半监督集成模型 Semi-supervised classifier ensemble, Semi-supervised clustering ensemble

12 集成学习的类型 聚类集成模型 (Cluster ensemble or consensus clustering)
基于图论的聚类集成 -- Graph based cluster ensemble 聚类结构集成 -- Cluster structure ensemble 多聚类结果 -- Multiple clustering solutions 协同聚类 -- Collaborative clustering 多视图聚类 -- Multi-view clustering 多源聚类 -- Multi-source clustering 聚类结果选择 -- Clustering solution selection ……

13 分类集成学习模型介绍 分类集成学习模型

14 分类集成学习模型介绍 Bagging: 样本维, 基础模型间为并联关系,针对学习结果的集成

15 分类集成学习模型介绍 Random subspace: 属性维, 基础模型间为并联关系,针对学习结果的集成

16 分类集成学习模型介绍 Adaboost: 样本维, 基础模型间为串联关系,针对学习过程的集成

17 半监督分类集成学习模型介绍 半监督分类集成学习模型流程图

18 聚类集成学习模型介绍 聚类集成学习模型流程图

19 聚类集成学习模型介绍 聚类集成(cluster ensemble)两个阶段: 集成器生成阶段
生成一组聚类结果,这组聚类结果之间的差异性越大越好 一致性函数阶段 寻找一个更优的综合结果,能够有效地融合集成器中的多个聚类结果

20 提纲 集成学习的动机 集成学习的应用 集成学习模型介绍 我们在集成学习方向的研究工作 总结

21 我们的研究工作

22 我们的研究工作 围绕以上研究工作,我们的研究团队在集成学习理论及其应用,特别是聚类集成算法,取得了良好的科研成果:
共发表科研论文100多篇,其中SCI论文46篇(含录用),IEEE Transactions系列长文21篇(包括TKDE、TEC、TCYB、TMM、TCBB、TCSVT、TNB等),Pattern Recognition论文4篇,Information Science论文3篇,Bioinformatics论文2篇,等。

23 研究创新点及科学意义 1. 设计渐进式集成框架,移除集成器中的冗余成员
集成器成员之间的差异性越大越好,但并非所有集成器成员都对最终结果有贡献。因此需要移除冗余成员,从而增加集成器多样性,提升其性能。 我们提出了一类新的集成框架——渐进式集成框架,其特色在于: 设计了基于全局和局部代价函数的渐进式集成器成员选择过程, 用于移除集成器中的冗余成员; 设计了基于随机组合数据映射操作的集成器成员生成方式,充分 利用不同维度下的随机组合数据映射操作和混合聚类技术,生成 一 个合适的集成器; 设计了混合聚类结果选择策略,有机地融合不同特征选择算法所 获取的学习结果。

24 渐进式半监督聚类集成 动机: 大部分传统聚类集成算法在处理高维数据时难以获得满意的结果。
传统聚类集成算法把所有集成器成员都考虑进去,然而有些集成器成员对最终结果不但没有贡献,往往还是有害的。 Reference:Zhiwen Yu, Peinan Luo, Jane You, Hau-San Wong, Hareton Leung, Si Wu, Jun Zhang, Guoqiang Han,"Incremental Semi-supervised Clustering Ensemble for High Dimensional Data Clustering", IEEE Transactions on Knowledge and Data Engineering, vol. 28, no. 3, pp , 2016.

25 渐进式半监督聚类集成 提出了渐进式半监督聚类集成方法 (ISSCE),用于处理高维数据。 贡献:
提出了一个全局目标函数和局部代价函数,用于渐进式地对集成器成员进行选择。 新设计了相似性函数用于衡量子空间中两组属性的相似程度。

26 渐进式半监督聚类集成框架(ISSCE)

27 渐进式半监督聚类集成 ISSCE采用渐进式集成器成员选择过程生成新的集成器。
渐进式集成器成员选择过程主要依靠全局目标函数和局部代价函数来选择新集成器成员。 全局目标函数有利于全局搜索,而局部代价函数则适合局部搜索。 局部代价函数不仅考虑了两个子空间的相似性,还考虑了聚类结果的目标函数值,有利于提高选择过程的自适应性。

28 全局目标函数 Reference:Zhiwen Yu, Peinan Luo, Jane You, Hau-San Wong, Hareton Leung, Si Wu, Jun Zhang, Guoqiang Han,"Incremental Semi-supervised Clustering Ensemble for High Dimensional Data Clustering", IEEE Transactions on Knowledge and Data Engineering, vol. 28, no. 3, pp , 2016.

29 渐进式半监督聚类集成 实验 数据集 衡量指标 18 真实数据集 The Normalized mutual information
The adjusted Rand index

30 The Comparisons among different semi-supervised clustering ensemble approaches w.r.t the ARI values
随机子空间技术能够减轻高维数据对所提出方法ISSCE的影响。 渐进式集成器成员选择过程能够移除ISSCE中多余的成员,从而提高ISSCE的性能。

31 渐进式半监督聚类集成 结论 渐进式集成器成员选择过程是一项通用的技术,能够应用于不同的半监督聚类集成中。
所提出的方法ISSCE在大多数数据集中都取得了比传统半监督聚类集成更好的性能,尤其是在高维数据集中。

32 研究创新点及科学意义 2. 提出基于随机子空间和图论的聚类集成算法,提高聚类结果融合质量
聚类集成算法的集成器中聚类结果的类的对应关系复杂,如右图所示,每个结果中的类数目不同,类标签不一致,分类集成中的投票机制并不适用,因此需要设计新的一致性函数来对多个聚类结果进行融合。 我们提出基于随机子空间和图论的聚类集成算法,其特色在于: 利用随机子空间技术处理高维带噪音数据; 构造一致性矩阵,利用图论规范切算法构造一致性函数,对一 致性矩阵进行分割; 引入专家知识,把数据集先验知识转换成约束条件,加入到集 成器中

33 聚类结构集成 动机: 应用驱动,例如:不同研究小组所获得肺癌基因表达数据集共享了许多相似的特性,是否能够寻找一个最具代表性的聚类结构,该聚类结构能够把握住这些相似的特性? 大多数聚类集成算法只考虑如何对齐来自不同聚类结果的个体标号,而忽略了来自不同数据源的聚类结构。 Reference:Zhiwen Yu, Xianjun Zhu, Hau-San Wong, Jane You, Jun Zhang, Guoqiang Han,"Distribution based Cluster Structure Selection", IEEE Transactions on Cybernetics, 2016 (DOI: /TCYB ​).

34 聚类结构集成 在现实生活中,许多数据源都会随时间而逐渐变化, 来自不同聚类结果的个体标号也会随之变化;
数据集的结构比数据的标记在很多情况下更有用; 寻找最具代表性的聚类结构比寻找最具代表性的聚类 个体标号更值得大家去研究。

35 聚类结构集成 Cluster ensemble Structure ensemble Distributed data1

36 基于高斯混合分布的聚类结构集成框架 ① 数据集生成 ② K-means 生成初始聚类结构 ③ EM 估计聚类结构参数 ④ 聚类结构选择
⑤ 聚类结构超图表示 ⑥ 超图分割得到最终结构 ⑦ 样本分配

37 基于高斯混合分布相似度的聚类结构选择 高斯混合模型相似度分数 基于相似度的聚类结构选择策略 其中DMM为高斯混合模型距离度量
★ 选择策略1 : 选择相似度分数最低的 B’ 个高斯混合模型 ★ 选择策略2 : 选择相似度分数最高的 B’ 个高斯混合模型 ★ 选择策略3 : 选择相似度分数中等的 B’ 个高斯混合模型 ★ 选择策略4 : 随机选择 B’ 个高斯混合模型 ★ 选择策略5 : 基于概率选择B’ 个高斯混合模型

38 基于高斯混合分布的相似度衡量

39 基于高斯混合的分布相似度衡量 subject to Update rule of confidence score:

40 基于超图分割的聚类结构获取 高斯混合模型的超图表示 ( G=(V, E, W) )
a) 点 高斯混合模型 Ω 1 , Ω 2 ,…, Ω 𝐵 ′ 分别包含 𝐾 1 , 𝐾 2 ,…, 𝐾 𝐵 ′ 个高斯模型,每个高斯模型表示为超图的一个点 b) 超边 每个高斯模型的Q-近邻模型构成一个超边,超边的度为模型数: c) 权值 利用N-CUT对高斯混合模型超图进行分割,得到最终聚类结构

41 聚类结构集成 提出了基于高斯混合分布的聚类结构集成算法。 贡献:
提出了研究多种度量两组高斯混合分布之间的相似性的新方法,特别是基于图论最佳匹配的距离函数。 设计了基于分布的超图算法作为聚类结构一致性函数来寻找最具代表性的聚类结构。 设计了基于评估函数的聚类结构选择策略,可以获取一组有用的聚类结构。

42 聚类结构集成 衡量 数据集 指标 实验 ● 13个UCI 真实数据集 ● 3 个KEEL真实数据集 ● Normalize mutual
● 4 个基因数据集 ● Normalize mutual information(NMI)

43 DSCE与单一聚类算法对比 与传统聚类算法对比,DSCE聚类效果更好 对比算法 简称 K-means algorithm KM
Expectation-Maximization algorithm EM Neural gas algorithm NG Hierarchical clustering algorithm HC Fast density based algorithm DP 与传统聚类算法对比,DSCE聚类效果更好

44 DSCE与聚类集成算法对比 与State-of-art的聚类集成算法对比,DSCE聚类效果更好 对比算法 简称
Cluster ensemble based on K-means and normalized cut KMCE Cluster ensemble based on hierarchical clustering and normalized cut HCCE Cluster ensemble based on neural gas and normalized cut NGCE Cluster ensemble based on bagging and K-means BGKM Cluster ensemble based on bagging and neural gas BGNG Cluster ensemble based on bagging and SOM BGSOM 与State-of-art的聚类集成算法对比,DSCE聚类效果更好

45 聚类结构集成 结论 基于高斯混合模型相似度选择算法的在聚类结构选择中有显著效果,超图分割能适用于聚类结构的获取。
所提出的聚类结构集成方法DSCE在大多数数据集中都比传统单一聚类、聚类集成算法有更好的聚类效果。

46 研究创新点及科学意义 3. 提出自适应集成框架,对集成器内在和外在环境进行优化
传统集成学习框架没有考虑到外在环境(如:样本空间和属性空间)和内 在环境(基本分类器的参数和基本分类器的权重)的影响,造成集成器的性能 无法进一步提升。因此,需要考虑如何适应外在环境和内在环境的综合影响,自适应地寻找最优的集成学习模型。 我们提出自适应集成框架,优化集成器的内在环境和外在环境,如下图示: 自适应集成框架会根据解决问题的需要进行一定的信息交互,不断地进行调整,直到达到最佳的状态。自适应集成框架将在传统集成框架的基础上,从多个不同角度加入自适应学习过程,从而获取最优的集成框架

47 集成学习模型优化 自适应集成学习 = 自适应过程 + 集成学习 Self Adaptive Ensemble Learning =
self adaptive process + ensemble learning TEVC2011:基于近邻知识的演化算法 TCYB2015: 混合自适应分类集成 TCBB2015: 自适应模糊聚类集成 TKDE2015b:自适应噪音免疫聚类集成 集成学习模型优化

48 混合自适应分类集成 基于随机子空间的分类集成框架(RSCE)

49 混合自适应分类集成 原有框架的局限性: 基于随机子空间的分类集成框架把每个子空间都看作同等重要,忽略了不同子空间及相应分类器的不同重要性。
每个随机子空间集合都包含了一组随机子空间。不同的随机子空间集合将导致不同的分类器组合。原有框架没有考虑到如何选择合适的随机子空间集合。 Reference:Zhiwen Yu, Le Li, Jiming Liu, Guoqiang Han, "Hybrid Adaptive Classifier Ensemble", IEEE Transactions on Cybernetics, vol. 45, no. 2, pp , 2015.

50 混合自适应分类集成 目标: 设计一个通用的混合自适应集成学习框架,并把它应用于基于随机子空间的分类集成算法的优化。

51 混合自适应分类集成 目标函数

52 集成学习框架中单一自适应过程流程图

53 混合自适应分类集成 The adaptive process of base classifier competition in SAEL

54 混合自适应分类集成 混合自适应优化过程 (HAEL)
Reference:Zhiwen Yu, Le Li, Jiming Liu, Guoqiang Han, "Hybrid Adaptive Classifier Ensemble", IEEE Transactions on Cybernetics, vol. 45, no. 2, pp , 2015.

55 混合自适应分类集成 实验 数据集 衡量指标 36 真实数据集 6 癌症基因表达数据集 准确率 Accuracy

56 The Comparisons among different classifier ensemble approaches w. r
The Comparisons among different classifier ensemble approaches w.r.t the average accuracy values

57 The Comparisons among different classification or classifier ensemble approaches w.r.t the average accuracy values

58 混合自适应分类集成 结论 自适应优化过程中,合适的结束条件能够提高测试集的准确性。
基本分类器竞争过程和分类集成器交互过程,这两个自适应过程对新算法HAEL的性能提高起到非常重要的作用。 新算法HAEL在KEEL数据集和癌症基因表达数据都取得了不错的效果。

59 自适应噪音免疫聚类集成 动机:聚类集成算法如何才能在噪音数据集中取得较好的性能? 一些噪音数据集包含有一些噪音属性;
一些噪音数据集包含有一些噪音样本; 一些噪音数据集对距离函数敏感。 Reference:Zhiwen Yu, Le Li, Jiming Liu, Jun Zhang , Guoqiang Han, "Adaptive Noise Immune Cluster Ensemble Using Affinity Propagation", IEEE Transactions on Knowledge and Data Engineering, vol. 27, no. 12, pp , 2015.

60 自适应噪音免疫聚类集成 提出了一种自适应噪音免疫聚类集成算法,又称为基于双层近邻传播的聚类集成算法 (AP2CE) 贡献
运用近邻传播算法对属性进行分组,移除噪音属性,并选择有代表性的属性; 设计了一种自适应过程用于寻找最优的 AP2CE; 采用多种距离函数,而非单一距离函数,有利于增加集成器的多样性,避免对距离函数敏感的噪音样本影响。

61 自适应噪音免疫聚类集成框架

62 自适应噪音免疫聚类集成 自适应优化过程流程图(Adaptive AP2CE)
Reference:Zhiwen Yu, Le Li, Jiming Liu, Jun Zhang , Guoqiang Han, "Adaptive Noise Immune Cluster Ensemble Using Affinity Propagation", IEEE Transactions on Knowledge and Data Engineering, vol. 27, no. 12, pp , 2015.

63 目标函数

64 自适应噪音免疫聚类集成 实验 数据集 衡量指标 4 个合成数据集 6 个真实数据集 3 个基因表达数据集
The purity measure The rand index

65 The Comparisons among different cluster ensemble approaches w. r
The Comparisons among different cluster ensemble approaches w.r.t the RI values

66 The Comparisons of adaptive AP2CE and AP2CE
A − AP2CE 在 7个数据集的性能都优于AP2CE,这证明了自适应过程的有效性。 集成器中单一成员的平均结果并不令人满意,这也反过来说明了集成的重要性。 实验结果表明聚类集成算法比单一近邻传播算法在处理带噪音数据集时更加有效。

67 自适应噪音免疫聚类集成 Conclusions 采用多种距离函数的组合能够提升算法的性能。
如果其中一个组成部件被移除,AP2CE的性能会受到影响。 与传统聚类集成算法相比,在处理大多数噪音数据集时,AP2CE是一个更好的选择。

68 研究创新点及科学意义 4. 集成学习算法在高维带噪音多元异构数据挖掘中的应用
为了进一步检验并拓展上述的算法研究成果,我们将上述研究成果向实际应用推广,应用于生物信息数据挖掘、多媒体智能处理等领域。 生物信息数据挖掘 我们在基于随机子空间和图论的聚类集成算法的基础上,引入模糊理论,设计了新的数据扰动技术和聚类有效性检验指标,并应用于癌症基因表达数据进行癌症模式的发现。我们还在原框架基础上,加入了新设计的代表性距离函数用于消除噪音的影响,用于衡量癌症样本之间的相似性。 多媒体智能处理 我们成功地将所提出的聚类集成算法应用于图像分割,从图像中分离出具有语义信息的物体。基于图像分割的结果,进一步提出基于规则和聚类集成的视觉显著区域检测算法。新算不但融合了聚类集成用于图像分割的结果,提出了层次视觉显著区域的概念,还设计了一个自适应的图像显示模型和一种基于规则的检测算法

69 混合模糊聚类集成 混合模糊聚类集成框架(HFCEF) HFCEF-I运用近邻传播算法对样本维进行聚类,并用模糊成员函数获取模糊矩阵
HFCEF-II运用近邻传播算法对属性维进行聚类,并用模糊成员函数获取模糊矩阵 HFCEF-III是HFCEF-I和HFCEF-II的串联组合,HFCEF-IV是HFCEF-I和HFCEF-II的并联组合 HFCEF把硬聚类和软聚类进行了有机地融合,并用于癌症聚类

70 HFCEF-I

71 HFCEF-II Cluster ensemble

72 混合模糊聚类集成 混合模糊聚类集成框架(HFCEF) HFCEF-I运用近邻传播算法对样本维进行聚类,并用模糊成员函数获取模糊矩阵
HFCEF-II运用近邻传播算法对属性维进行聚类,并用模糊成员函数获取模糊矩阵 HFCEF-III是HFCEF-I和HFCEF-II的串联组合,HFCEF-IV是HFCEF-I和HFCEF-II的并联组合 HFCEF把硬聚类和软聚类进行了有机地融合,并用于癌症聚类

73 HFCEF-III

74 混合模糊聚类集成 实验 数据集 衡量指标 6个癌症基因表达数据集 4个UCI数据集
The normalized mutual information The purity

75 混合模糊聚类集成 Reference:Zhiwen Yu, Hantao Chen, Jane You, Guoqiang Han, Le Li, "Hybrid Fuzzy Cluster Ensemble Framework for Tumor Clustering from Bio-molecular Data", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 10, no. 3, pp , 2013.

76 混合模糊聚类集成 实验结论 硬聚类和软聚类之间不同的结合方式对算法的性能有一定的影响
混合模糊聚类集成框架,在癌症基因表达数据集和UCI数据集上都能取得不错的性能 Reference:Zhiwen Yu, Hantao Chen, Jane You, Guoqiang Han, Le Li, "Hybrid Fuzzy Cluster Ensemble Framework for Tumor Clustering from Bio-molecular Data", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 10, no. 3, pp , 2013.

77 提纲 集成学习的动机 集成学习的应用 集成学习模型介绍 我们在集成学习方向的研究工作 总结

78 总结 聚类集成学习模型流程图

79 总结 四个阶段 数据映射操作 -- Operation of data transformation
学习模型组合 -- Combination of learning models 学习结果选择 -- Selection of learning results 学习结果融合 -- Fusion of learning results 集成学习模型优化 -- Optimization of ensemble model 将来工作 Self adaptive ensemble learning Palleral ensemble learning

80 Acknowledge Collaborators
Guoqiang han, Jun Zhang, Jiming Liu, Jane You, Hau-San Wong Students Le Li, Hantao Chen, Xiaowei Wang, Daxing Wang, Zhiqiang Wang, Hongsheng Chen, Xianjun Zhu,Zhuoxiong Zhao, Peinan Luo, Ye Lu, Weijie Wang

81 Thank you!

82 References [TKDE2016] Zhiwen Yu, Peinan Luo, Jane You, Hau-San Wong, Hareton Leung, Si Wu, Jun Zhang, IEEE, Guoqiang Han,"Incremental Semi-supervised Clustering Ensemble for High Dimensional Data Clustering", IEEE Transactions on Knowledge and Data Engineering, vol. 28, no. 3, pp , 2016. [TKDE2015] Zhiwen Yu, Le Li, Jiming Liu, Jun Zhang , Guoqiang Han, "Adaptive Noise Immune Cluster Ensemble Using Affinity Propagation", IEEE Transactions on Knowledge and Data Engineering, vol. 27, no. 12, pp , 2015. [TNBS2009] Zhiwen Yu, and Hau-San Wong. “Class Discovery from Gene Expression Data based on Perturbation and Cluster Ensemble”. IEEE Transactions on NanoBioScience, Vol.8, no.2, pp , 2009. [TNBS2011] Zhiwen Yu, Hau-San Wong, Jane You, Qinmin Yang, Hongying Liao, “Knowledge based Cluster Ensemble for Cancer Discovery from Biomolecular Data”, IEEE Transactions on NanoBioScience, vol.10, no.2, pp.76-85, 2011.

83 References [TCBB2015] Zhiwen Yu, Hantao Chen, Jane You, Jiming Liu, Hau-San Wong, Le Li, "Adaptive Fuzzy Consensus clustering framework for Clustering Analysis of Cancer Data", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 12, no. 3, pp , 2015. [TCYB2015] Zhiwen Yu, Le Li, Jiming Liu, Guoqiang Han, "Hybrid Adaptive Classifier Ensemble", IEEE Transactions on Cybernetics, vol. 45, no. 2, pp , 2015. [TCYB2016a] Zhiwen Yu, Hongsheng Chen, Jiming Liu, Jane You, Hareton Leung, Guoqiang Han, "Hybrid k-Nearest Neighbor Classifier", IEEE Transactions on Cybernetics, 2015 (DOI: /TCYB ). [TCYB2016b] Zhiwen Yu, Xianjun Zhu, Hau-San Wong, Jane You, Jun Zhang, Guoqiang Han, “Distribution based Cluster Structure Selection”, IEEE Transactions on Cybernetics, 2016 (DOI: /TCYB ​). [TEVC2011] Zhiwen Yu, Hau-San Wong, Dingwen Wang, Ming Wei, "Neighborhood Knowledge-Based Evolutionary Algorithm for Multiobjective Optimization Problems", IEEE Transactions on Evolutionary Computation, vol. 15, no. 6, pp , 2011.

84 References [SDM2010] Jing Gao, Wei Fan, Jiawei Han, "On the Power of Ensemble: Supervised and Unsupervised Methods Reconciled", SDM’2010. [TCBB2012] Zhiwen Yu, Le Li, Jane You, Guoqiang Han, "SC3: Triple spectral clustering based consensus clustering framework for class discovery from cancer gene expression profiles", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol.9, no.6, pp , 2012. [TCBB2013] Zhiwen Yu, Hantao Chen, Guoqiang Han, Le Li, "Hybrid Fuzzy Cluster Ensemble Framework for Tumor Clustering from Bio-molecular Data", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 10, no. 3, pp , 2013. [TCBB2014] Zhiwen Yu, Hongsheng Chen, Jane You, Hau-San Wong, Jiming Liu, Le Li, Guoqiang Han, "Double Selection based Semi-Supervised Clustering Ensemble for Tumor Clustering from Gene Expression Profiles", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol. 11, no. 4, 2014.

85 References [BIO2007] Zhiwen Yu, Hau-San Wong and Hongqiang Wang, “Graph-based consensus clustering for class discovery from gene expression data”, Bioinformatics, 23, pp , 2007. [INS2012] Zhiwen Yu, Jane You, Hau-San Wong, Guoqiang Han, "From Cluster Ensemble to Structure Ensemble", Information Science, vol.168, pp.81-99, 2012. [INS2012] Zhiwen Yu, Le Li, Hau-San Wong, Jane You, Guoqiang Han, Yunjun Gao, Guoxian Yu, "Probabilistic Cluster Structure Ensemble", Information Science, vol.267, pp.16-34, 2014. [JMLR2002] A. Strehl and J. Ghosh, “Cluster Ensembles - A Knowledge Reuse Framework for Combining Multiple Partitions”, Journal of Machine Learning Research 3, pp , 2002. [PR2012] Zhiwen Yu, Hau-San Wong, Jane You, Guoxian Yu, Guoqiang Han , "Hybrid Cluster Ensemble Framework based on the Random Combination of Data Transformation Operators", Pattern Recognition, vol. 45, no. 5, pp , 2012. [PR2014] Zhiwen Yu, Le Li, Yunjun Gao, Jane You, Jiming Liu, Hau-San Wong, Guoqiang Han, "Hybrid Clustering Solution Selection Strategy", Pattern Recognition, vol. 47, no. 10, pp , 2014.

86 My homepage More references: Homepage:


Download ppt "集成学习及其应用 余志文 计算机科学与工程学院 华南理工大学 二〇一六年五月."

Similar presentations


Ads by Google