一个交叉学科的胜利 简介 生物信息学 08300240054 黄晓靖
简介 生物信息学 1 现代医学的挑战 2 生物信息学 3 分子同源性计算 一个交叉学科的胜利
1 现代医学的挑战 一个交叉学科的胜利
现代医学的挑战 过去 个人 经验学科 现在 极小 极大 实验学科
现代医学的挑战 大规模数据的采集 大规模数据的处理 经验型处理常常会出错 Wal-Mart 发生在Wal Mart 的真实故事 理念:相关联的货物最好摆在一起 问题:啤酒和什么货物关联? 可能的答案:花生米?红肠?…… 从上百万张收银单获得的答案:尿布!
现代医学的挑战 CS to the rescue~~~
2 生物信息学 一个交叉学科的胜利
Biology Informatics Bioinformatics 当生物遇上了计算机 生物信息学!
网络预测流感
网络预测流感(2)
数据挖掘 分类 Classifying 建模与模拟 Modeling & Simulating 关联 Associating 分类 Classifying 建模与模拟 Modeling & Simulating 预测与检验 Predicting & Testing
主要应用领域 …… 基因测序 Sequence analysis 基因注解 Genome annotation 同源性计算 Computational evolutionary biology 基因表达分析 Analysis of gene expression 拮抗/协同分析 Analysis of regulation 蛋白质表达分析 Analysis of protein expression 蛋白质结构预测 Prediction of protein structure 生物系统模型 Modeling biological systems 大信息量图像分析 High-throughput image analysis ……
3 分子同源性计算 一个交叉学科的胜利
分子系统发育分析的主要方法 距离矩阵法 (Distance Matrix) 最大简约法 (Maximum Parsimony) 最大似然法 (Maximum Likelihood) 贝叶斯法 (Bayesian Inference)
距离聚类 主要有UPGMA法 (类平均法) 和NJ法 (邻接法 ) 。 使用这两种方法前都必须获得一个对称距离矩阵 (m阶方阵) D = {dij}m×m, 其中m为OUT(分类群〕数目。 距离系数的公式很多。例如,Nei (1972)的遗传距离系数适用于限制性内切酶和同功酶数据,Jukes-Cantor 单参数距离系数和Kimura两参数模型距离系数则广泛用于各种序列数据。 1.将最近的物种聚合在一起 2.开始用于聚合的单元是独立的 3.在每次迭代中,将 两个”最近”单元(距离最小)聚在一起形成一个新的聚合单元
分子系统发育分析的主要方法 A B C D E 1.43 2.65 4.24 5.24 4.33 2.52 3.08 1.57 2.19 3.02 找到距离矩阵中最小的距离,在这个例子中 最小距离是物种A 和 B.
2. 将 A 和 B 用树枝相连并给每一个分枝赋予一半的遗传距离 0.715
A B C D E 1.43 2.65 4.24 5.24 4.33 2.52 3.08 1.57 2.19 3.02 4. 根据A和B的距离来重新计算遗传距离 例如, (A+B) 和 C 的距离是 (2.65+4.24)/2= 3.445 依次计算所有影响到的距离
A+B C D E 3.445 4.785 2.52 2.325 2.19 3.02 5. 重复上述步骤,找到下一个最小的距离。在这个例子中是C 和 E之间的距离.
A B 0.715 C E 1.095 D 1.385 1.92 1.92
Freeman & Herron, 2001. Evolutionary Analysis. Prentice Hall HIV从何而来 Freeman & Herron, 2001. Evolutionary Analysis. Prentice Hall
Artificial Neural Networks 结语 Bioinformatics Artificial Neural Networks …… 这是交叉学科的胜利!!
END