生物信息学数据库
序列数据库 结构数据库 生物信息学数据库的种类 图谱数据库 突变数据库 文献数据库 专业杂志 生物信息学数据库的查找方法 专门数据库目录的网站 著名的生物信息学中心 参见教材p227--p242
NCBI数据库组织
一、NCBI中的生物信息数据库 1)、PubMed: 生物医学文献数据库 2)、Nucleotide:核酸序列数据库 3)、Protein sequence database: 蛋白质序列数据库 4)、Senome: 大分子三维结构数据库 5)、Genome: 完整的基因组数据 6)、PopSet: 人口研究数据集 7)、OMIM: 人类孟德尔遗传数据库
8)、Taxonomy: Genbank中的物种分类学数据库 9)、Structure:分子结构数据库 10)、SNP:单核苷酸多肽性数据库 11)、Books: 在线生物医学图书
所 有 数 据 库
例: 在Nucleotide核酸数据库中检索牛冠状病毒的序列信息。 牛冠状病毒 bovine coronavirus
Nucleotide 核苷酸数据库
本库利用 其它资源 本库工具 bovine coronavirus 核苷酸数据库序列来源于GenBank中的RefSeq,TPA和PDB。基因组,基因和转录本序列数据为生物医学研究和发现的基础。 本库利用 其它资源 本库工具
结果分类 牛冠状病毒全基因组 按数量多少列出的生物类别
序列存储号 不同库的显示格式 存储号、定义、入口、 版本、来源等详细描述
FASTA格式显示 全序列
Graphics格式
Send to保存格式 Display Setting 显示格式
二、序列相似性搜索工具 是用来查找序列之间的同源序列的工具,可以明确序列之间相似性的大小。 BLAST:美国NCBI(国家生物技术信息中心)支持。 FASTA:是英国EBI(生物信息研究所)负责维护。
BLAST:碱基局部对准检索工具 Basic Locul Alignment Search Tool 可进行核苷酸序列、蛋白质序列方面的同源性分析,能在8秒内在整个DNA数据库中进行序列比较。
入口
最近检索结果 帮助 检索策略保存 检索物种分类 不同项目的检索
在核苷酸数据库中检索核苷序列 在蛋白质数据库中检索蛋白质序列 用翻译的核苷酸序列在蛋白质数据库中检索 用蛋白质序列在翻译的核苷酸数据库中检索 用翻译过来的核苷在核苷翻译库中检索
用法学习
检索方法 例:对“人胰岛素cDNA序列”进行相似性分析 步骤: 先检索出cDNA核苷酸序列 用FASTA格式显示 将FASTA格式全选后粘贴于BLAST检索框中 选择分析用的数据库 点击BLAST进行比较
序列存贮号 描述说明 序 列
可限定对比起始位置,长度 检索框:用来粘贴FASTA格式 老鼠基因库 其他数据库 人类基因库
粘贴FASTA格式
比较结果页面
彩色积分图 序 列 相 似 描 述 E值 统计 检索范围 链接 积分 存贮号 描述
相似率为100% 序列对准描述
三、基因组数据库 1、Genome:可获得800多种生物体的基因组数据,部分已完成测序。 2、人类基因组资源: human genome resources 整合了多种相关的分子生物学数据库和公共分析软件,为科研人员提供了自动化的实验数据获得、加工和整理途径,为基因区域的预测和基因功能预测提供了一系列便捷的方法。
检索框空白 入口1 入口2
使用帮助 常用资源 其他资源 扩展资源 本库工具 注释和分析 扩展资源 本库工具
四、OMIM孟德尔人类遗传学数据库 OMIM:Online Mendelian Inheritance in Man 此库是关于人类基因和遗传性疾病的数据库,适合关注遗传疾病的医生和科研人员
检索框空白,不填入任何内容
diabetes 顺序号中第1位数字表示所涉及 基因的遗传类型: 1:常染色体显性(1994.5.15前创建) 2:常染色体隐性(1994.5.15前创建) 3:X连锁基因座或表现型 4:Y连锁基因座或表现型 5:线粒体基因座或表现型 6:常染色体基因座或表现型 (1994.5.15后创建的条目)
此页为早期页面,但较好地 解释了各种前缀的含义等 顺序号前缀的含义 题名 顺序号 等位基因的变化 原文 参考文献 临床症状 基因图异常 投稿者 结果记录 只包含 条目创建时间 条目最后修正时间
结果原文 基因图位置
五、Taxonomy---分类学 即生物学门类数据库,可以按生 物学门类进行检索或浏览其核苷酸序 列、蛋白质序列、结构等。
Taxonomy 入口一 Taxonomy 入库二
本库工具 其他资源 使用帮助
检索方法 1、分类浏览 Taxonomy browser 最高级类目名称
Browser 浏览 检索区 古生物 细菌 真核生物 分 类 类病毒 病毒 其他 常用分子生 物研究 未分类物种
系统默认 3级分类级别
点击进入
显示该物种在这些数据库中的文献量 存储序号 基因码 类别 同义词 类别 在Taxonomy数据库中的文献 作者链接,点击进入pubmed
检索方法 2、关键词查询
输入生物体名称或生物门类,如 hepatitis b virus 或 proifera
完整名称 通配符 模糊检索 口语中的名称 分类序号
检索方法 3、直接用生物体名称列表查询
点击下列名称,直接检索 具体生物体的树状结构
六、Structure 也称大分子三维数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从蛋白质数据库PDB(Protein Data Bank)获得。对结构的阐述较PDB详细,更多的是比较结构的相似性及亲缘关系。
Structure
本库工具 其他资源 使用帮助等 Cn3d 阅读器
Install 安装方法一 Windows 安装方法二 Tutorial 学习指南
下半页 Download Cn3d 方法三
点击下载、安装
检索方法 1、关键词检索 直接输入检索的蛋白质名称,然后GO 2、登记号检索 前提是已经知道PDB或MMDB的登记号
MMDB:Molecular Modelling Database 例:检索PTEN的结构图 PTEN 名称 在MMDB、PDB中的登记号 3D结构图,点击直接下载 PDB:Protein Data Bank 蛋白质数据库 MMDB:Molecular Modelling Database 大分子三维结构数据库
名称 来源 分子图 浏览或保存3D结构图
在图上双击, 下边显示对应的内容
NCBI数据库组织,是世界上著名的生物医 学数据库组织,希望同学们以后多利用多挖 掘它的资源。