生物医学大数据分析与挖掘 蒋太交 中国科学院生物物理研究所 研究员 湖南大学国家超级计算中心 教授(兼) 北京健数通 首席科学顾问 湘雅大数据讲座 2014.5.10于长沙
报告内容 一、生物医学大数据分析挖掘的几个方向 二、基于流感大数据发展流感预测预警新方法
大数据时代 智能交通 交通大数据 天气预报 气象大数据 股票 金融大数据 商业大数据 生物医学大数据 智慧医疗和个性化医疗 ?
医院信息化产生海量临床数据 临床大数据
美国卫生信息化发展计划 2011年,美国卫生信息技术协调官办公室发布全国卫生信息化发展计划,计 划时限2011-2015
我国卫生信息化发展计划 35212工程
美国VS中国 美国 系统逐步成型、理念推广、政策制定、科 学研究 中国 系统建设和部署
临床大数据的特点与现状
临床大数据的采集与标准化
临床大数据- 沉睡的金矿 临床大数据
临床大数据分析与挖掘
临床大数据分析与挖掘-病因识别 大数据驱动的病因分析 相关性分析 https://www.bgc-jena.mpg.de/bgi/index.php/People/MaartenBraakhekke
临床大数据分析与挖掘-样本筛选 根据临床大数据中病人多方面的信息,选择满足生物医学研究/临床实验需要的病人,获取相应样本. 相对于传统选择样本的方式,其优势在于: 选择面广,便于控制干扰因素,结果更明显; 节约人工和经济成本; 加快研究/实验进程 Source: http://blog.digitalpathologyinsights.com/2014/04/23/more-efficient-clinical-trials-with-tissue-phenomics/
临床大数据分析与挖掘-临床决策支持 Treatment C Treatment D Treatment A Treatment B Treatment E
临床大数据分析与挖掘-健康评估 统计学建模 综合健康评估
. . 临床大数据分析与挖掘-疾病预测预警 疾病风险预测 F(x) 疾病分子标志物识别:ER/PR, bcl-2,p53, AFP,CEA等等 疾病风险预测 F(x) 健康指标异常检测 . .
Risk = w1*SNP1+ w2*SNP2+…+ wi*SNPi https://customercare.23andme.com/entries/21548199-Understanding-Health-Risk-Reports
临床大数据分析与挖掘-个性化诊疗 The U.S. Food and Drug Administration defined personalized medicine as “the best medical outcomes by choosing treatments that work well with a person’s genomic profile or with certain characteristics in the person’s blood proteins or cell surface proteins” http://home.ccr.cancer.gov/connections/2010/Vol4_No1/features_pg2.asp http://blog.sciencenet.cn/blog-41174-719048.html
Personalized medicine drugs for breast cancer as of July 2012 The first human trial of a pioneering personalised cancer treatment developed at Oxford University will begin this week, with the potential to tackle a wide range of late-stage cancers. Inefficacy of the one-dose-fits-all approach. The average response rate of a cancer drug is the lowest at 25%. Personalized medicine drugs for breast cancer as of July 2012 http://www.ox.ac.uk/media/news_stories/2014/140313_2.html J Breast Cancer 2012 September; 15(3): 265-272
临床大数据分析与挖掘-个性化诊疗 P4 Medicine: personalized: it takes into account a person’s genetic or protein profile. preventive: it anticipates health problems and focuses on wellness, not disease. predictive: it directs appropriate treatment and avoids drug reactions. participatory: it empowers patients to take more responsibility for their health and care.
报告内容 一、生物医学大数据分析挖掘的几个方向 二、基于流感大数据发展流感预测预警新方法
临床大数据分析与挖掘-流感危害性预测 y = 31.31 x - 8.85 R2=0.83 通过分析流感监测产生的大数据,社会经济大数据以及大量基因序列,以及大量的相关性分析,发现了快速预测流感病毒危害性的新方法 Wu et al., 2010, Plos Computational Biology;
早期预测流感危害程度的计算模型在流感防控策略上具有十分重要的应用价值,该工作在国内外引起重要关注
接种疫苗是控制流感传染最有效的手段 Vaccination 《流感重要的科学问题》 接种疫苗是控制流感传染最有效的手段 Vaccination Every season, WHO will recommend trivalent vaccine composition: A/H1N1, A/H3N2, and B Grown in eggs Inactivated virus or live attenuated virus Injection (Flu shot) 24 .
世界卫生组织(WHO)在全球建立了一个流感监控网络。
目前流感疫苗推荐不是非常有效 世界卫生组织WHO推荐疫苗的准确度不高:对中国地区 :2/7 其他北半球地区:4/7 Based on 7 seasons during 2002-2009. 这是因为目前WHO推荐的疫苗频繁地不匹配。 Du et al. Nature Communications 2012. 26 .
临床大数据分析与挖掘-流感疫苗推荐 大规模病毒采样与基因测序 流感病毒关联网络 疫苗推荐 该工作发表在《Nature Communications》上,被选为亮点文章,并且同期《Nature》杂志也对该工作进行了报道 Du, et al., 2012, Nature Communications.
新方法优于目前WHO使用的方法 我们预测的准确度: 对中国地区 6/7;其他北半球地区6/7。 X X X X X X X X X X 我们预测的准确度: 对中国地区 6/7;其他北半球地区6/7。 X X Based on 7 seasons during 2002-2009. X X X X X X X X Despite this global effort, vaccine recommendation still presents a significant challenge as evidenced by vaccine mismatches in the past (8-13). 2, Moreover, reports also suggest that the degree of antigenic mismatch may vary with region, and may be a particular problem in some Asian regions that are sources of new variants. By comparing WHO-recommended vaccine strains with the epidemic strains in Taiwan from 1987-1988 to 2003-2004, Hsieh et al found that the vaccine mismatch rate for influenza A (H3N2) viruses in Taiwan was 47%, higher than the 35% in Canada (8, 14). This shows the urgent need for the development of a more effective influenza surveillance program to assist WHO in global vaccine strain recommendation. 世界卫生组织WHO:对中国地区 2/7;其他北半球地区4/7 1,目前该方法已经申请了专利。 2,在使用我们的方法向WHO推荐疫苗参考株。 3,Nature Communcations, 2012. .
X X X X X X X X X X Despite this global effort, vaccine recommendation still presents a significant challenge as evidenced by vaccine mismatches in the past (8-13). 2, Moreover, reports also suggest that the degree of antigenic mismatch may vary with region, and may be a particular problem in some Asian regions that are sources of new variants. By comparing WHO-recommended vaccine strains with the epidemic strains in Taiwan from 1987-1988 to 2003-2004, Hsieh et al found that the vaccine mismatch rate for influenza A (H3N2) viruses in Taiwan was 47%, higher than the 35% in Canada (8, 14). This shows the urgent need for the development of a more effective influenza surveillance program to assist WHO in global vaccine strain recommendation. .
新华社发布的新闻:我国科学家发明流感 疫苗株快速选择新技术
我国2013年华东地区H7N9溯源 进化分析 大规模病毒采样与基因测序 Wu et al. 2013. Cell Host & Microbe
通过多源数据整合,我们发现H7N9是两次重配的结果 Cell Host & Microbe. Oct 2013.
该工作对流感防控具有重要的指导意义
临床大数据的价值 更深入的理解人类疾病 个性化诊疗 智能临床决策 医学研究方式的转变:假设驱动转变为数据驱动 临床大数据
卫生信息化发展计划 国家卫生信息化“十二五”规划“35212工程” 重点建设国家级、省级和地市级三级卫生信息平台 加强信息化在公共卫生、医疗服务、新农合、基本药物制度、综 合管理五项业务中的深入应用 建设电子健康档案和电子病历二个基础数据库 建设一个医疗卫生信息专用网络 逐步建设信息安全体系和信息标准体系
Google Flu Trends http://www.google.org/flutrends/
糖尿病病例识别算法 对照病例识别算法 Joint study by Northwestern University , Mayo Clinic ,Marshfield Clinic Research Foundation, Vanderbilt University, Group Health Cooperative
临床大数据分析与挖掘-临床决策支持 临床决策支持系统(CDSS)是用来帮助医生和其他医护人员做临床决策支持的交互式计算机软件。现在常用的一些 CDSS包括Archimedes IndiGO, Auminence, DiagnosisOne, Dxplain等等。CDSS的发展趋势是与HER融合,成为后者的重要组成部分。临床大数据将极大地改善此类系统的准确率。 提高患者安全 降低药物差错和不良反应 改善用药与检验的顺序 提高医护质量 减少临床医生处理日常事务的时间 增加临床路径和临床指南的使用 提高医护信息传输的有效性提高医嘱过程,降低成本 改变了现有处方的模式 DXplain系统是美国波士顿马萨诸塞州综合医院计算机科学实验室的杰作,从1986年就开始投入使用,并在1987年实现全美通行。经历了这些年的发展壮大,它的知识体系已经从最初的约500个病种扩大到现在的2400个,还有5000个临床新发现和230000个资料点。至今该系统还在美国医院中普遍使用。 http://www.eeworld.com.cn/medical_electronics/2012/0101/article_2627.html 39