龙星课程—肿瘤生物信息学上机课程 曹莎 Email:scaorobin@sina.com
课程安排 各类数据类型的介绍,简单的R入门; 差异性表达的检验, 假阳性检验(FDR), 批次效应(batch effect); 基因表达数据和蛋白表达数据的相关性; 基因突变数据以及表达通路的富集分析 基因表达数据的相关性以及双聚类分析 各类数据的整合 基因表达数据和metabolic profiling的数据;基因表达数据和表观遗传数据的整合
基因突变数据以及表达通路的富集分析 基因突变数据类型
富集分析 首先,我们有很多感兴趣的基因,如 显著上调的基因 是否存在一个GO term/pathway/gene set,它包含异常多的我们感兴趣的基因? 如果是,我们会得到关于我们感兴趣的基因的一些生物特性
和cancer发展相关的突变-Idea Stage 1 Stage 2 mutations Mutations not correlated to cancer progrresion Stage 1 Stage 2 mutations Mutations positively correlated to cancer progression
Contingency table In GO Not in GO Total Mutated genes 9 43 52 Non mutated genes 44 4 48 Totals 53 47 100
Test the significance of gene set enrichment Hypergeometric test Fisher exact test
A good lecture of enrichment analysis http://marray.economia.unimi.it/2007/material/day4/Lecture7.pdf