Download presentation
Presentation is loading. Please wait.
1
生物信息学 与 信息技术 张 勤
2
什么是生物信息学 生命科学中的信息科学 计算机科学应用于(分子)生物学 生物学、计算机科学、信息技术相结合所形成的学科
利用计算技术管理和分析生物数据的科学 生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。
3
背景 1990.10:人类基因组计划启动 2000.06:人类基因组“工作框架图”完成 生物学家 人类基因组计划 生物信息学 生物数据的激增
(每15个月翻一番) 生物学家 数学家 计算机 科学家 生物信息学 (bioinfomatics) 的诞生 :人类基因组计划启动 :人类基因组“工作框架图”完成
5
概念(广义) 生 命 科 学 中 的 信 息 生物体系和过程中信息 的存贮、传递和表达 信息科学 细胞、组织、器官的生理、病理
、药理过程的中各种生物信息
6
概念(狭义) 生物分子信息的获取、存贮、分析和利用 分子生物信息学 Molecular Bioinformatics 获取 深层次 生物
生物学知识 生物 分子信息 挖掘
7
生物分子信息 生物信息的载体 DNA分子 - 遗传信息 蛋白质分子 -与功能相关的结构信息 蛋白质分子 DNA分子
8
DNA
9
From DNA to Protein
10
生物分子数据类型 DNA序列数据 最基本 生 物 分 子 信 息 蛋白质序列数据 直观 生物分子结构数据 生物分子功能数据 复杂
11
生物分子数据及其关系 第一部 遗传密码 第二部 遗传密码? DNA 核酸序列 蛋白质 氨基酸序列 蛋白质 结构 蛋白质 功能 最基本的
生物信息 生命体系千姿百态的变化 维持生命活动的机器
12
生物分子信息的特征 数据量大 复杂程度高 彼此间密切关联 动态变化
GigaBytes (109) TeraBytes (1012) PetaBytes (1015) 复杂程度高 彼此间密切关联 动态变化
13
生物信息学的目标和任务 收集和管理生物分子数据 数据库 数据分析和挖掘 算法 开发分析工具 软件
14
分子生物学数据库 种类 特点 核酸序列数据库 蛋白质序列数据库 生物大分子数据库 数量:> 1000个 通常可通过WEB进入
大小:< 10 Kb ~ > 10Gb 更新频率:每天 ~ 每年
15
核酸序列数据库 欧洲分子生物学实验室的EMBL http://www.embl-heidelberg.de
美国生物技术信息中心的GenBank 日本遗传研究所的DDBJ
18
核酸序列数据的增长趋势
19
蛋白质序列数据库 PIR(Protein Information Resource)
SWISS-PROT 提供 (1)蛋白质序列 (2)蛋白质的分类、蛋白质的来源; (3)关于原始数据的参考文献; (4)蛋白质功能和蛋白质的一般特征,包括基因 表达、翻译后处理、活化等; (5)序列中相关的位点、功能区域
21
生物大分子结构数据库 PDB(Protein Data Bank) http://www.rcs.org/pdb
含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子(蛋白质、核酸、糖类、其他复合物)的三维结构 MMDB(Molecular Modeling Database) 包括来自于实验的生物大分子结构数据 分子的生物学功能、产生功能的机制、分子的进化历史 生物大分子三维结构模型显示、结构分析和结构比较
23
其它生物分子数据库 单碱基多态性数据库dbSNP http://www3.ncbi.nlm.nih.gov/SNP/
蛋白质结构分类数据库SCOP 蛋白质二级结构数据库DSSP 蛋白质同源序列比对数据库HSSP 生物学、医学文献引用数据库PubMed
24
生物信息学的某些应用领域 数据获取 DNA序列、质谱仪、2-D电泳图像 软件程序与硬件设备紧密关联 主要通过信号检测和图像分析获取数据
27
生物信息学的某些应用领域 DNA序列的组装 将100~300bp的片断组装成完整的DNA序列
28
生物信息学的某些应用领域 编码序列的检测 如何在基因组序列中找出基因 其难度与基因组的复杂程度直接相关
29
生物信息学的某些应用领域 DNA序列分析 分析酶切位点 发现重复序列(如微卫星,小卫星)
发现tRNA序列和其他类型的RNA
31
生物信息学的某些应用领域 序列比较 生物信息学的基本工具 某个DNA或蛋白质序列与已知序列(数据库)的比较 ( 比对,Alignment)
将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,找出两个序列共有的排列顺序
34
生物信息学的某些应用领域 比较基因组学 不同物种基因组的比较
36
生物信息学的某些应用领域 蛋白序列分析 物理化学特征 发现转膜区域 预测功能区域 预测翻译后修饰位点 发现重复序列
37
生物信息学的某些应用领域 蛋白质结构预测 蛋白质结构:肽链 二级结构 空间结构 序列 结构 功能 功能
….-Gly-Ala-Glu-Phe-….
38
生物信息学的某些应用领域 ! 寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射 ….-Gly-Ala-Glu-Phe-….
功能
39
生物信息学的某些应用领域 基因芯片数据分析
40
cDNA arrays in summary excitation scanning cDNA clones (probes)
laser 2 laser 1 emission PCR product amplification purification printing mRNA target) overlay images and normalise 0.1nl/spot Hybridise target to microarray microarray analysis
41
生物信息学的某些应用领域 基因调控网络 性状受多个基因的影响 各个基因不是独立地发挥作用 gene gene ?
44
Nature (2000)
45
生物信息学所用的方法和技术 1、数学统计方法 2、动态规划方法 3、机器学习与模式识别技术 4、数据库技术及数据挖掘 5、人工神经网络技术
6、专家系统 7、分子模型化技术 8、量子力学和分子力学计算 9、生物分子的计算机模拟 10、因特网(Internet)技术
Similar presentations