libD3C: 一种免参数的、支持不平衡分类的二类分类器

Slides:



Advertisements
Similar presentations
班級:四食四甲 學號: 姓名:陳雅欣 日期:101年10月15日
Advertisements

审核评估释义 余国江 教学质量监控与评估处.
《高等学校创新能力提升计划》 的情况介绍 2012年3月.
妇产科2015年上半年 工作总结 汇报人:.
Some theoretical notes on boosting
毛峰教授 北京师范大学教授,博士生导师 国家社科基金项目专家 北京华文教育顾问
詹天佑 詹天佑(1861—1919),江西婺wu源人。我国杰出的爱国工程师、铁路工程专家。毕业于美国耶鲁大学。他是中国首位铁路工程师,负责修建了京张铁路(北京——张家口)等铁路工程,有“中国铁路之父”、“中国近代工程之父”之称。
(语文).
-- 牛津大学出版社 -- 牛津期刊现刊库平台 -- 牛津期刊投稿指南.
Unsupervised feature learning: autoencoders
分類:基本概念、決策樹與模型評估.
(Problem-Based learning 教学法)
虚拟心脏建模及其应用 Innovation course.
一种基于结构序列 藕合模块辨别人类 miRNA前体的新方法
天净沙·秋思 马致远 枯藤老树昏鸦, 小桥流水人家, 古道西风瘦马。 夕阳西下, 断肠人在天涯。
回顾与展望:高州经验与广东医改 省卫生计生委、省医改办 黄 飞 2015年7月3日.
汇报人:李臻 中国海洋大学信息科学与工程学院 计算机科学与技术系
第七章 NP问题选讲 邹权(博士) 计算机科学系.
二十一世紀的知識人 高 希 均 美國威斯康辛大學榮譽教授 財團法人知識經濟與管理研究院董事長 淡江大學「名人講座」 2005年11月21日
国家“十一五”规划教材 数据库原理与应用教程(第3版).
高等院校计算机教材系列 数据库原理与应用(第2版).
华东师范大学软件学院 王科强 (第一作者), 王晓玲
感知学习 ——可视化学习平台.
Chapter 29 English Learning Strategy Of High School Students
邹 权 厦门大学计算机科学系 生物信息学中的分类学习问题 邹 权 厦门大学计算机科学系
邹 权 (博士、副教授) 厦门大学数据挖掘实验室
展 览 会 2016年第16届中国(成都) 国际社会公共安全产品与技术 时间: 2016年5月19日——21日
姓 名: 刘永鹏 专 业: 计算机应用 指导老师:王宗敏 教授 李润知 讲师
Adversarial Multi-Criteria Learning for Chinese Word Segmentation
Some Effective Techniques for Naive Bayes Text Classification
Improving classification models with taxonomy information
生物資訊 bioinformatics 林育慶.
毕业论文报告 孙悦明
学 术 报 告 新型富勒烯的合成 报告人: 时间: 地点: 简历: 谢素原 教授 (厦门大学) (周三)
汇报人:王晓东 单 位:信息科学与工程学院 日 期:2016年9月
Manifold Learning Kai Yang
당신을 향한 노래.
5、利用EST数据库发现新基因 EST (expressed sequence tags),是从基因表达的短的序列,携带着完整基因某些片断的信息,称为表达序列标签 获得一个EST的途径有三种:1 大规模测序;2 比较同源性;3 差异显示或基因芯片法获得与某一性状相关的EST 电脑克隆 第一步,找到与待克隆基因相关的EST;第二步.
Source: IEEE Access, vol. 5, pp , October 2017
词汇语义资源在中文关系抽取中的应用 报告人:钱龙华 刘丹丹 胡亚楠 钱龙华 周国栋
研究、論文、計畫與生活之平衡 演講人:謝君偉 元智大學電機系 2018年11月22日.
CCF ADL66大数据管理系统和技术 刘达欣 2018/11/28.
作者 :Pawan Sinha, Benjamin Balas, Yuri Ostrovsky, Richard Russell
基于自适应同步的网络结构识别 陆君安 School of Mathematics and Statistics, Wuhan University (复杂网络论坛,北京,April.27-29th,2011)
中国科技大学软件学院 School of Software Engineering
高职申请 申 请 人:孟增 竞聘岗位:副教授 研究方向:结构优化设计及可靠性分析 设岗学科:工程力学 土木与水利工程学院
碳汇资本在旅游融资中的应用研究 阚如良 梅雪 孔婷 经济与管理学院旅游管理系
第二讲 计算机信息检索概述 主要内容: 一 信息检索的基本概念 二 电子资源的概念与类型 三 计算机信息检索系统 四 计算机检索技术.
近期科研汇报 报告人: 纪爱兵.
中国科技大学计算机科学与技术学院 School of Computer Science & Technology
模糊系统与模糊控制简介 --博士生论坛系列报告.
A high payload data hiding scheme based on modified AMBTC technique
Measurement of Magic Wavelengths for the 40Ca+ Clock Transition
模式识别与智能系统研究中心介绍 2017年8月.
Course 4 分類與預測 Classification and Prediction
Review and Analysis of the Usage of Degree Adverbs
Representation Learning of Knowledge Graphs with Hierarchical Types
National Taiwan University
IEEE Computer Society 長亨文化事業有限公司.
教學理念與教材分享 楊秉祥 Bing-Shiang Yang, Ph.D., P.E.
(二)盲信号分离.
高效洁净机械制造实验室是 2009 年教育部批准立项建设的重点实验室。实验室秉承“突出特色、创新发展“的宗旨,以求真务实的态度认真做好各项工作。 实验室主任为黄传真教授,实验室副主任为刘战强教授和李方义教授。学术委员会主任为中国工程院院士卢秉恒教授。实验室固定人员中,有中国工程院院士艾兴教授,教育部.
钱炘祺 一种面向实体浏览中属性融合的人机交互的设计与实现 Designing Human-Computer Interaction of Property Consolidation for Entity Browsing 钱炘祺
玉泉校区教八107室 2008年1月10日(星期四)上午10:0011:30
Chapter 9 Validation Prof. Dehan Luo
Class imbalance in Classification
社會學習領域 課綱修正宣導簡報 臺北市社會領域輔導小姐.
WiFi is a powerful sensing medium
Gaussian Process Ruohua Shi Meeting
范例分析—— Shonan Christ Church 组员:牛贤锐 孙浩源 指导老师: 杜春宇 刘士兴 秦丹尼 宣湟 1.
Presentation transcript:

libD3C: 一种免参数的、支持不平衡分类的二类分类器 Quan Zou (邹 权) (Ph.D.& Professor) Tianjin University zouquan@tju.edu.cn

libD3C≈libSVM libSVM的缺点 优化参数慢 处理不平衡的分类效果不好

Kernel function parameter tuning in libSVM

Ensemble learning: Make weak classifiers to strong one h1( ) h2() h3( ) h4( ) h5( ) h6() h7() Classification Result Combine to form the Final strong classifier

选择性集成 改善集成学习的预测效果 选择性集成学习算法 问题 提高集成学习的预测速度 降低存储需求 Classifier 1 Classifier n 5 5

基于聚类的方法 Parameters tuning C1 Out1 Out1 Out1 Out1 Out1 Out1 Out1 Out1 Cluster1 C2 Out2 Out2 Out2 Out2 Out2 Out2 Out2 Out2 C2 Out2 C2 Data KMeans Cluster2 C3 Out3 Out3 C3 Out3 C3 Out3 Out3 Out3 C3 Out3 Cluster3 C9 C9 C9 C9 Out9 Out9 C9 Out9 C9 Out9 C10 Out10 Out10 Out10 Out10

模拟退火优化参数 SA

Predicting in parallel

2018/5/14

Ensemble learning for Class Imbalance Problem

Strategy First, the negative set is divided randomly into several subsets equally. Every subset together with the positive set is a class balance training set. Then several different classifiers are selected and trained with these balance training sets. They will vote for the last prediction when facing new samples. The samples will be added to the next two classifiers’ training sets if they are misclassified. Reference 邹权, 郭茂祖, 刘扬, 王峻. 类别不平衡的分类方法及在生物信息学中的应用. 计算机研究与发展. 2010,47(8):1407-1414 X.-Y. Liu, J. Wu, and Z.-H. Zhou. Exploratory undersampling for class-imbalance learning. IEEE Transactions on Systems, Man, and Cybernetics - Part B: Cybernetics, 2009, 39(2): 539-550

http://lab.malab.cn/soft/LibD3C/ 2018/5/14

http://lab.malab.cn/soft/MRMD/ Quan Zou, et al. A Novel Features Ranking Metric with Application to Scalable Visual and Bioinformatics Data Classification. Neurocomputing. 2016, 173:346-354

ESI High Cited Paper 2018/5/14

Application in Bioinformatics DNA Binding proteins Li Song, Dapeng Li, Xiangxiang Zeng, Yunfeng Wu, Li Guo*, Quan Zou*. nDNA-prot: Identification of DNA-binding Proteins Based on Unbalanced Classification. BMC Bioinformatics. 2014, 15:298. ESI高引论文(HIGHLY CITED PAPER) Cytokines Quan Zou, et al. An Approach for Identifying Cytokines Based On a Novel Ensemble Classifier. BioMed Research International. 2013, 2013:686090 tRNA Quan Zou, et al. Improving tRNAscan-SE annotation results via ensemble classifiers. Molecular Informatics. 2015,34(11-12):761-770 miRNA Leyi Wei, Minghong Liao, Yue Gao, Rongrong Ji, Zengyou He*, Quan Zou*. Improved and Promising Identification of Human MicroRNAs by Incorporating a High-quality Negative Set. IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2014, 11(1):192-201 ESI高引论文(HIGHLY CITED PAPER)

利用邹权副教授提出的集成学习方法 2018/5/14

Thanks ! http://lab.malab.cn/soft/LibD3C/ Quan Zou(PH.D., Prof.) School of Computer Sci &Tech@Tianjin Univ. Email:zouquan@nclab.net http://lab.malab.cn/ 2018/5/14