邹 权 (博士、副教授) 厦门大学数据挖掘实验室

Slides:



Advertisements
Similar presentations
Quality verification systems of Medical Equipment 子宮收縮監測裝置 碩研電機二甲 杜駿昌 MA
Advertisements

我们常遇到 欧美人患结直肠息肉较多,而中国 广东一带的人患鼻咽癌较多; 某些人容易感染某种疾病,而另一 种人则不会; 有的人吸烟喝酒却长寿,也有人自 幼就病痛缠身; 同一种治疗肿瘤的药物对一些人非 常有效,另一些人则完全无效; 不同个体对吗啡引起的不良反应的 敏感性存在很大差异; 相同的病例、相同的处方,可疗效.
4.体词 体词包括:名词,处所词,方位词,时间词,区别词,数词,量词以及一部分代词。.
班級:四食四甲 學號: 姓名:陳雅欣 日期:101年10月15日
插花艺术的起源 一、插花艺术的原始形式 (一)源自佛教供花 使用器皿的插花最早起源于佛教供花
2011年度汇报 科技部973项目 《日地空间天气预报的物理基础与模式研究》 第六课题组:空间天气预报方法和技术的应用与集成研究
Rapamycin attenuates mitochondrial dysfunction via activation of mitophagy in experimental ischemic stroke Qiang Li a,b,1, Ting Zhang a,1, Jixian Wang.
目的要求:骨骼肌的形态与结构、功能与分布 重点难点:肌的形态与结构,主要肌的分布、名称
《普通話自學速成-相輔相成讀打學習法》 是利用資訊科技, 將以上各項基本功相輔相成學習, 就能獲得高質和高效的成果。
台東縣蘭嶼綠島整體發展綱要計畫 (草案) 行政院經濟建設委員會 台東縣政府 99年8月4日.
詹天佑 詹天佑(1861—1919),江西婺wu源人。我国杰出的爱国工程师、铁路工程专家。毕业于美国耶鲁大学。他是中国首位铁路工程师,负责修建了京张铁路(北京——张家口)等铁路工程,有“中国铁路之父”、“中国近代工程之父”之称。
(语文).
粒子物理卓越创新中心优秀青年骨干 选拔报告
秦始皇兵马俑.
大师 的 童稚活泼 亲切可爱.
我家跨上了“信息高速路”.
每日一拼 yuèliàng xiang yi ge hai xiu de shao nv yi hui er duo jin yun jian yi hui er you liao kai mian sha lu chu jiao rong zheng ge shi jie dou bei yue.
By : Jennifer/5C and Olivia/5C
疲倦寂寞多感喟 卻無法得著安慰 1.煩忙人生的時光中 微聲盼望 Fan mang ren shang de shi guang zhong
文字学与识字教学 汉字是表意文字中历史悠久、直到今天仍有生命力的唯一文字。.
天净沙·秋思 马致远 枯藤老树昏鸦, 小桥流水人家, 古道西风瘦马。 夕阳西下, 断肠人在天涯。
日本中国语学会关东支部扩大会议・中央大学
杜甫诗三首 《望岳》 《春望》 《石壕吏》 授课人:姚晓霞.
问题 你用过科技手段辅助汉字/书法的教学/学习吗? 如果曾经使用过,请列出用过的应用/软件/网页。
第七章 NP问题选讲 邹权(博士) 计算机科学系.
数学建模实践 与学生科研素质培养 报告人:王文娟.
第十章 针灸学基础 广州医学院 刘义海、潘俊辉 人民卫生电子音像出版社出版.
所工作会议交流报告 基于结构的化学生物学 在药物研发中的应用 杨财广 药理三室 2008年11月 南通.
邹 权 厦门大学计算机科学系 生物信息学中的分类学习问题 邹 权 厦门大学计算机科学系
苏教版小学语文第七册 5.我给江主席献花 第一课时 侯小群.
姓 名: 刘永鹏 专 业: 计算机应用 指导老师:王宗敏 教授 李润知 讲师
班級:觀光一B 姓名:李詩涵 座號: 18 指導老師:杜光玉
R.
最知心的朋友 My Best Friend 其它敬拜赞美诗歌 27首.
聚會即將開始…….. 為讓您有個舒服的聚會 邀請您~~~
杜甫诗三首 《望岳》 《春望》 《石壕吏》.
libD3C: 一种免参数的、支持不平衡分类的二类分类器
生物資訊 bioinformatics 林育慶.
中科院“百人计划”终期评估汇报 卢 克 清 中科院西安光学精密机械研究所.
报告人:张婧 导师:黄德根教授 学校:大连理工大学 研究领域:自然语言处理
学 术 报 告 新型富勒烯的合成 报告人: 时间: 地点: 简历: 谢素原 教授 (厦门大学) (周三)
诗歌鉴赏专题训练 二零零七年九月.
从量子信息观点看量子统计和热力学 孙昌璞 中国科学院理论物理研究所
당신을 향한 노래.
化学生物信息学 -从进化到药物发现 张红雨 (华中农业大学生物信息中心).
词汇语义资源在中文关系抽取中的应用 报告人:钱龙华 刘丹丹 胡亚楠 钱龙华 周国栋
空谷的回音.
宣教的中国 xuan jiao de zhong guo
Liu Tong, Gu Wei-Min, Xue Li, Weng Shan-Shan, Lu Ju-Fu
一件礼物 A Gift.
一件礼物.
天線工程期中報告 “Low-SAR Hexa-Band Antenna for Mobile
A Study on the Next Generation Automatic Speech Recognition -- Phase 2
wo men yang wang deng hou
碳汇资本在旅游融资中的应用研究 阚如良 梅雪 孔婷 经济与管理学院旅游管理系
最知心的朋友.
免费全文期刊网站介绍 各位老师好,同学们好,今天我给大家介绍网上免费生物医学资源。网上免费资源很多,今天我介绍几个著名、大型的免费资源站点。
模式识别与智能系统研究中心介绍 2017年8月.
1.
涉江采芙蓉 重庆市涪陵实验中学 余波.
IEEE Computer Society 長亨文化事業有限公司.
系统科学与复杂网络初探 刘建国 上海理工大学管理学院
中国传统色彩 主讲人:武献鸽.
高效洁净机械制造实验室是 2009 年教育部批准立项建设的重点实验室。实验室秉承“突出特色、创新发展“的宗旨,以求真务实的态度认真做好各项工作。 实验室主任为黄传真教授,实验室副主任为刘战强教授和李方义教授。学术委员会主任为中国工程院院士卢秉恒教授。实验室固定人员中,有中国工程院院士艾兴教授,教育部.
Structure and Luminosity of Neutrino-cooled Accretion Disks
张亮生 可变剪切对基因进化模式和功能的影响 张亮生
A Note on the Slim Accretion Disk Model
吉林大学动物科学学院硕士 研究生招生情况介绍
申 请 人:李强明 申报职务:副教授 所在单位:食品与生物工程学院
Some discussions on Entity Identification
Presentation transcript:

邹 权 (博士、副教授) 厦门大学数据挖掘实验室 http://datamining.xmu.edu.cn/~zq 生物信息学中的不确定性和分类问题 邹 权 (博士、副教授) 厦门大学数据挖掘实验室 http://datamining.xmu.edu.cn/~zq

提纲 生物信息学和机器学习的关系 一些生物信息学中的分类问题 microRNA识别 蛋白质功能预测 基因表达数据分析 全基因组关联分析 总结

生物信息学 人类基因组计划 HapMap计划 /1000 Genome计划 数据存储---数据库 数据分析---数据挖掘 大数据 Olson M V. Human genetics: Dr Watson's base pairs[J]. Nature, 2008, 452(7189): 819-820. HapMap计划 /1000 Genome计划 大数据

生物信息学中的我国计算机学者 算法阶段(1990-2000) 标注阶段(2000-2008) 系统分析阶段(2008-2013) 朱大铭、姜涛、卜东波 标注阶段(2000-2008) 王晓龙、朱小燕等 系统分析阶段(2008-2013) 李衍达、张学工等 大规模数据处理阶段(2010-now) 华大基因

一些生物信息学中的分类问题 microRNA识别 蛋白质功能预测 基因表达数据分析 全基因组关联分析

microRNA识别 2006年诺贝尔奖---RNA干扰机制 CCCCUCUAUUCACAAUUGUUUGGAACUCAGUUUUGUGAUUAUUCUAUCAUUGCCAGGGAGUUUGUGUGGUUGCAUCAGGGG

microRNA分类相关论文 Chenghai Xue, Fei Li, Tao He, Guo-Ping Liu, Yanda Li, Xuegong Zhang. Classification of real and pseudo microRNA precursors using local structure-sequence features and support vector machine. BMC Bioinformatics. 2005.6:310 (google scholar引用271次,截至2014.8.2) Peng Jiang, Haonan Wu, Wenkai Wang, Wei Ma, Xiao Sun, Zuhong Lu. MiPred: classification of real and pseudo microRNA precursors using random forest prediction model with combined features. Nucleic Acids Research. 2007,35:W339-W344 (google scholar引用239次,截至2014.8.2) Leyi Wei, Minghong Liao, Yue Gao, Rongrong Ji, Zengyou He, Quan Zou. Improved and promising identification of human microRNAs by incorporating a high-quality negative Set. IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2014, 11(1):192-201

microRNA与疾病的关系 图挖掘 相似度度量、不确定性 参考文献 Jiang Q, Hao Y, Wang G, et al. Prioritization of disease microRNAs through a human phenome-microRNAome network[J]. BMC Systems Biology, 2010, 4(Suppl 1): S2. Xuan P, Han K, Guo M, et al. Prediction of microRNAs associated with human diseases based on weighted k most similar neighbors[J]. PloS one, 2013, 8(8): e70204.

一些生物信息学中的分类问题 microRNA识别 蛋白质功能预测 基因表达数据分析 全基因组关联分析

蛋白质功能预测 问题 难点 特征提取 分类器 输入:蛋白质序列,进行聚类、分类 特殊蛋白识别---不平衡分类 亚细胞定位-----多类分类 酶和多功能酶---多类,少量多标记 功能预测------多示例、多标记 二级结构、结构域-----标注、HMM 难点 特征提取 分类器

一些生物信息学中的分类问题 microRNA识别 蛋白质功能预测 基因表达数据分析 全基因组关联分析

基因表达数据分析 分类 双聚类 聚类 14/57

一些生物信息学中的分类问题 microRNA识别 蛋白质功能预测 基因表达数据分析 全基因组关联分析

全基因组关联分析(GWAS)

GWAS 难点 高维小样本 SNP-SNP相互作用 结果的可解释性 前景 疾病的遗传机理 遗传育种(作物、养殖)

总结 机器学习在寻找生物信息学 生物信息学在寻找机器学习 应用---分类、聚类、降维、不确定性 结果的解释和验证 数据量在增大 生物实验验证 文献验证 生物信息学在寻找机器学习 数据量在增大 统计学无法满足精度需要

邹权,Email:zouquan@xmu.edu.cn http://datamining.xmu.edu.cn 敬请指正! 邹权,Email:zouquan@xmu.edu.cn http://datamining.xmu.edu.cn