生 物 信 息 学 Bioinformatics 0233301510 巩晶 癌症研究中心 山东大学 医学院 2015.9.18.

Slides:



Advertisements
Similar presentations
做个百数表. 把表格填完整,仔细观察,你还有什么新发现 ?
Advertisements

练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
Lib.ujs.edu.cn PubMed 检索与利用 刘海军
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
第九章 核酸序列的其他分析方法 生物信息学. 1. 确定 DNA 序列的分子量和碱基组成  分子量( molecular weight )  单链 DNA ( single strand DNA , ssDNA )  双链 DNA ( double strand DNA , dsDNA ) 
Chapter 3: SQL.
第六 章数据库访问页 6.1 数据访问页视图 6.2 创建数据访问页 6.3 编辑数据访问页 6.4 查看数据访问页 退出.
一次数据库的查寻.
龙星课程—肿瘤生物信息学上机课程 曹莎
中外文医学文摘数据库检索方法与技巧 北京大学口腔医院图书馆 李晓霞
人大复印资料全文数据库 人大复印资料全文数据库选辑1995年至今公开发表的人文科学和社会科学中各学科、专业的重要论文和重要动态资料的全部原文。其信息资源覆盖了人文科学和社会科学领域国内公开出版的3000多种核心期刊、专业期刊和报纸,分4大类100多个专题。
PubMed 检索教程.
彻底搞清楚promoter, exon, intron, and UTR
生物信息学数据库.
第四节 地域文化与人口 有儿无女不称心,有女无儿就伤心; 一儿一女不放心,多子多女才舒心。 有权的顶着生,有钱的买着生;
第4章 基因的表达 第1节 基因指导蛋白质的合成.
基因的表达 凌通课件.
生物信息学 艾对元: QQ:
一、文摘数据库:Pubmed、 Highwire 二、原文传递系统: 外文医学信息资源检索平台 三、全文数据库:OVID
生物信息学 Bioinformatics.
生物資訊 bioinformatics 林育慶.
國立體育大學教育訓練 EBSCOhost 系列資料庫 內容與操作說明
生物信息学 第三章 基因组学与序列分析 张高川 生物信息学教研室 (Department of Bioinformatics)
如何使用CiteSpace分析Derwent专利数据
Chinese Virtual Observatory
PubMed操作指令教學 嘉基醫圖 陳玉嬋製作.
电 子 克 隆.
李杰 首都经济贸易大学 安全与环境工程学院 个人主页:
高通量测序 高通量测序的应用 朱伟珊 高通量测序 朱伟珊 东盛生物.
生物信息学 与 信息技术 张 勤
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
人类基因组计划(human genome project,HGP)是由美国科学家、诺贝尔奖获得者Renato dulbecco于1986年在杂志《Science》上发表的文章中率先提出的,旨在阐明人类基因组脱氧核糖核酸(DNA)3×109核苷酸的序列,阐明所有人类基因并确定其在染色体的位置,从而破译人类全部遗传信息。美国于1990年正式启动人类基因组计划,估计到2003年完成人类基因组全部序列测定。欧共体、日本、加拿大、巴西、印度、中国也相继提出了各自的基因组研究计划。由于各国政府和科学家的共同努力,HG
生物信息学 第六章 基因预测和基因结构分析 (II).
ScienceDirect高级检索功能及使用视频、说明发现路径
第8章 遗传密码 8.1 遗传密码的基本特性.
第十一章 动物基因组学 (Animal Genomics).
美国数学学会 MathSciNet 电子资源的检索和使用
姓名 遥感科学国家重点实验室 中国科学院遥感与数字地球研究所﹒北京师范大学 地址:北京市朝阳区大屯路甲20号北 北京9718信箱
学习目标 1、什么是字符集 2、字符集四个级别 3、如何选择字符集.
线段的有关计算.
ASP New and other UIs: Medical Videos Searchasaurus
2019/4/16 关注NE官方微信,获取更多服务.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
VB与Access数据库的连接.
数据库使用指南 Nature全文数据库.
中国国家标准文献 共享服务平台检索 信息检索与利用 2019/4/29 王婧怡 图书馆615室 科技信息研究所
2019/4/ /4/25 学习科研好助手 NoteExpress文献管理与检索系统 北京爱琴海乐之技术有限公司.
超越自然还是带来毁灭 “人造生命”令全世界不安
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
获奖类别: 获奖题目: 获奖学生: 指导教师: 研究内容:(400~500字,2~3幅插图)
JoVE实验视频期刊用户指南.
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
H基因库(重链基因连锁群): --- 第14号染色体 κ基因库(κ链基因连锁群): --- 第2号染色体 λ基因库(λ链基因连锁群):
SIAM全文电子期刊数据库国际站使用指南
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
SCI收录号查询方法介绍 上海大学情报研究所
SpringerLink数据库使用说明 上海师范大学图书馆
SIAM全文电子期刊数据库国际站使用指南
Python 环境搭建 基于Anaconda和VSCode.
生物数据库.
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
总复习.
基因信息的传递.
第三节 转录后修饰.
第四章 UNIX文件系统.
第十七讲 密码执行(1).
RefWorks使用指南 归档、管理个人参考文献.
辞典类 Oxford English Dictionary 牛津在线英语大辞典
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
百万行、千万行数据查询教程 老黄牛.
Presentation transcript:

生 物 信 息 学 Bioinformatics 0233301510 巩晶 癌症研究中心 山东大学 医学院 2015.9.18

第二章 生物数据库 

ataggatctaatctttactagaacgcc 2.1为什么需要生物数据库? 什么 东东? gcattac ttgatctaatca ataggatctaatctttactagaacgcc ttgatctaatca ttgcaa

ataggatctaatctttactagaacgcc 2.1为什么需要生物数据库? 这是HIV1病毒的整个基因组,包含9752个碱基,构成9个基因。 gcattac ttgatctaatca ataggatctaatctttactagaacgcc ttgatctaatca ttgcaa

2.1为什么需要生物数据库? 人基因组 : 3 Gbp = 3,000,000,000 bp 5000bp/页 600页/书 1000 本 3cm厚的书 600,000 页 1000 书 = 30m长的书架 26.6m 超过1000个物种 : 1000 个 30m长的书架 = 200 个 五层的书架 (6m/层) = 2 x 450,000 本书

2.1为什么需要生物数据库? 10cm 所有测序的基因组: 收集 访问 14.6cm x 1000 更 新 26.6m 更 新 26.6m 生物数据库: 被组织起来的大量生物数据,这些数据通过计算机可以被方便的访问、管理及更新。 管理

2.1为什么需要生物数据库? 天文数字单位: 尧 yotta 1000000000000000000000000 泽 zetta 1000000000000000000000 艾 exa 1000000000000000000 拍 peta 1000000000000000 (千万亿) 太 tera 1000000000000 (万亿) 吉 giga 1000000000 (十亿) 兆 mega 1000000 (百万) 千 kilo 1000 百 hecto 100 十 deca 10 个 mono 1

2.2生物数据库的分类 >2000 核酸数据库 蛋白质数据库 一级核酸数据库 一级蛋白质数据库 蛋白质序列数据库 蛋白质结构数据库 INSDC UniProt 二级核酸数据库 二级蛋白质数据库 专用数据库

2.2生物数据库的分类 >2000 核酸数据库 蛋白质数据库 一级核酸数据库 一级蛋白质数据库 蛋白质序列数据库 蛋白质结构数据库 INSDC UniProt 二级核酸数据库 二级蛋白质数据库 专用数据库

2.3 文献数据库 PubMed 基因序列 生物信息学 “专家” 可啥是 dUTPase 啊!? 太棒了!原来是 dUTPase!

2.3 文献数据库 PubMed http://www.ncbi.nlm.nih.gov/pubmed

2.3 文献数据库 PubMed http://www.ncbi.nlm.nih.gov/pubmed PublMed拥有超过两百四十万的生物医学文献。它们来源于MEDLINE(生物医学文献数据库)、生命科学领域学术杂志以及在线的专业书籍。这些文献部分提供全文链接。

2.3 文献数据库 PubMed 找到507条与dUTPase相关的发表文献 这么多!

2.3 文献数据库 PubMed 调整显示内容、个数、排序规则

2.3 文献数据库 PubMed 把找到的结果下载到本地保存

2.3 文献数据库 PubMed 把找到的结果下载到本地保存

2.3 文献数据库 PubMed 这次按照作者的名字搜索一下 作者名字 比刚刚搜dUTPase少了一点儿,但还是多!

2.3 文献数据库 PubMed 这次把作者名字和主题一起搜索一下 作者名字+主题 就剩2条了!

2.3 文献数据库 PubMed 查看文章摘要等信息以及原文链接 53

2.3 文献数据库 PubMed 从原文所在杂志下载全文阅读

2.3 文献数据库 PubMed 改显示摘要为显示MEDLINE 53

2.3 文献数据库 PubMed 数据库中一条文献记录的内部结构 Pubmed ID Publication Date Title Page Abstracts Laboratory address Authors 信息被分割成小节,每个小节都有自己的索引名,如AU代表作者,AB代表摘要等。

2.3 文献数据库 PubMed 按照不同规则搜索Down这个词 按作者名 “Author [AU]” 搜索关键词 按题目 “Title [TI]” 按实验室地址 “Laboratory address [AD]”搜索关键词 在任意地方搜索 关键词

2.3 文献数据库 PubMed 查找那个离你最近的“专家” 1 2 4 3 Beijing Beijing Beijing Tel : 86 - 10 - 6275-5002 Fax : 86 - 10 - 6276-2292 New Life Science Building, Peking University, Summer Palace Road No. 5, Beijing, P. R. China 100871 3

2.3 文献数据库 PubMed 用高级搜索工具更精确的查找

2.3 文献数据库 PubMed 查找2000年至今发表的所有题目里有dUTPase关键词的英文Review

2.3 文献数据库 PubMed 用好高级搜索可以大大提高搜索效率

2.3 文献数据库 PubMed 关于使用PubMed的几个小建议: 使用引号(比如,“down syndrome”) 使用逻辑词 AND, OR, NOT (比如, dUTPase [TI] AND bacteria [TI] NOT Smith [AU]) 使用正确的名字缩写(比如,“Abergel C”) 使用每篇文献唯一的PubMed ID( 比如,PMID: 24933525) 有时PubMed的也帮不了你: 搜索1995年以前的文献中排名十位以后的作者是白费力气。 1976年以前的文献是没有摘要的。 搜索1965年以前的文献就别想了。 PubMed也不是万能滴!

2.4 一级核酸数据库 >2000 核酸数据库 蛋白质数据库 一级核酸数据库 一级蛋白质数据库 蛋白质序列数据库 蛋白质结构数据库 INSDC UniProt 二级核酸数据库 二级蛋白质数据库 专用数据库

2.4 一级核酸数据库 由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI    )开发并负责维护。NCBI 隶属于美国国立卫生研究院(National Institutes of Health,NIH  )。 http://www.ncbi.nlm.nih.gov/ EMBL核苷酸序列数据集(European Nucleotide Archive,ENA)由欧洲分子生物学研究室(European Molecular Biology Laboratory ,EMBL )开发并负责维护。 http://www.ebi.ac.uk/ena/ 日本DNA数据库(DNA Data Bank of Japan,DDBJ) 由位于日本静冈的日本国立遗传学研究所( National Institute of Genetics,NIG )开发并负责维护。 http://www.ddbj.nig.ac.jp/

2.4 一级核酸数据库 Genbank,EMBL与DDBJ共同构成国际核酸序列数据库合作数据库(International Nucleotide Sequence Database Collaboration,INSDC)。三个数据库的信息每日更新汇总至INSDC。 http://www.insdc.org/

2.4.1 一级核酸数据库 GenBank 原核生物与真核生物基因的不同: Prokaryotes Eukaryotes 基因组大小 0.5-91 million bp 10–670,000 million bp 基因密度 one gene / 1,000 bp One gene / 100,000 bp (人) 编码区含量 70% 5% 基因是否线性分布 是 否 mRNA有无内含子 无 有 Eu.

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 http://www.ncbi.nlm.nih.gov/ 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 2 3 1

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 脱氧尿苷焦磷酸酶

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 基因座名 核酸序列长度 分子的类别 拓扑类型 更新日期

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 DEFINITION:简短的定义,标题。

2.4.1 一级核酸数据库 GenBank 2.4.1 一级核酸数据库 GenBank GI(GenInfo Identifier)号:与前面的版本号系统是平行运行的。 当一条序列改变后,它将被赋予一个新的GI号,同时它的版本号将增加。 当依据核酸序列的内部序列进行蛋白质翻译时,蛋白质的翻译发生任何变换,核酸序列都将被赋予一个新的GI号。 2.4.1 一级核酸数据库 GenBank 2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 ACCESSION:检索号在数据库中是唯一且不变的,即使数据提交者改变数据内容。ACCESSION不一定和LOCUS相同。 VERSION:版本号的格式是“检索号.版本号。 版本号于99年2月由三大数据库采纳使用。主要用于识别数据库中一条单一的特定核苷酸序列。在数据库中,如果某条序列数据发生了变化,即使是单碱基的改变,它的版本号都将增加,而它的检索号保持不变。如由U12345.1变为U12345.2。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 KEYWORDS:能够大致描述该条目的几个关键词,可用于数据库搜索。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 SOURCE:基因序列所属物种的俗名。 ORGANISM:对所属物种更详细的定义,包括他的科学分类。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 REFERENCE:基因序列来源的科学文献(一条基因序列的不同片段可能来源于不同的文献)。文献具体分为作者、题目及刊物。刊物还包括PubMed ID作为其子内容。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 COMMENT:自由撰写内容,比如致谢或者是无法归入前面几项的内容。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 FEATURES:描述核酸序列中各个已确定的片段区域,包含很多子项目,比如来源(source),启动子(promoter)等。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 source:说明了核酸序列的来源,据此可以容易的分辨出该序列是来源于克隆载体还是基因组。当前序列(全长)来源于大肠杆菌(Escherichia coli)的基因组DNA

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 promoter:列出了启动子的位置。复习:细菌有两个启动子区, 一个 -35区(5’-TTGACA-3’)位置在第286个碱基到第291个碱基 ,一个 -10区(5‘-TATAAT-3’)位置在第310个碱基到第316个碱基。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 misc_feature:混合内容,比如,这条说明了从第322个碱基到第324个碱基是一个一般认定的(putative,基本认定,但无实验证实)转录起始位置。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 RBS (Ribosome Binding Site) :核糖体结合位点。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 CDS (Coding Segment) :记录了一个ORF( open reading frame ),从第343个碱基开始的ATG(起始密码子)到第798个碱基结束的TAA(结束密码子)。除了第一行的位置信息,还包括翻译产物(蛋白质)的诸多信息。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 翻译起始位置和 翻译所使用的密码本 计算机使用翻译密码本根据核酸序列翻译出的蛋白质序列(不是实验真实获得的)。

翻译产物蛋白的名字(dUTP-ase,该ORF编码其第1-151个氨基酸),以及该蛋白在各种蛋白质数据库中对应的ID。通过这些ID可以轻松链接到其他数据库,比如蛋白质结构数据库PDB、蛋白质序列数据库Swiss-Prot等。 2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 X01714这条核酸序列还包含第二个“潜在的”基因(potential,计算机预测出来的)。其编码的蛋白目前的数据库里没有详细记录,是个未知的蛋白。GenBank里一条核酸序列包含多个基因的情况是很常见的。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 最后一个索引项ORIGIN记录的是核酸序列,并以双斜线“//”作为整条记录的结束符。每行核酸序列以该行第一个碱基的位置开始,每10个碱基一个空格,每行60个碱基。

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 获得FASTA格式的核酸序列 FASTA格式: 第一行:大于号加名称或其它注释 第二行以后:序列,每行60个字母

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 获得序列的图形概览

2.4.1 一级核酸数据库 GenBank 浏览编码大肠杆菌(原核生物)dUTPase的DNA序列信息:X01714 最后一个索引项ORIGIN记录的是核酸序列,并以双斜线“//”作为整条记录的结束符。每行核酸序列以该行第一个碱基的位置开始,每10个碱基一个空格,每行60个碱基。 2 3 下载纯文本格式(Flat File)的数据库记录

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的成熟mRNA序列信息:U90223 http://www.ncbi.nlm.nih.gov/ 浏览编码人(真核生物)dUTPase的成熟mRNA序列信息:U90223 2 3 U90223 1

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的成熟mRNA序列信息:U90223 50

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的成熟mRNA序列信息:U90223 所有的数据库都有数据不完整的问题。 忠言逆耳:别指望GenBank或任何一个数据库能购百分百做到数据无误且实时更新( up-to-date )。

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的成熟mRNA序列信息:U90223 这个CDS指出了从63到821为一段编码区,在这段编码区里基因是连续的(经过剪切后的成熟mRNA),它将被翻译成线粒体型dUTPase。

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的成熟mRNA序列信息:U90223 sig peptide:指出了编码用于蛋白定位的信号肽的碱基位置。 mat peptide:指出了编码成熟蛋白的碱基位置。

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 http://www.ncbi.nlm.nih.gov/ 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 2 3 1

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 一个完整的基因是被分成若干片段,分别存储在数据库中的,即,一共需要四个片段(SEGMENT,一个片段对应一条数据库记录)才能拼凑起完整的基因。当前这条记录是所有四个片段里的第二个。一个片段里可能包含不止一个外显子。

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 指出了该序列属于第15号染色体,更精确的说,是在该染色体的长臂上(q)的q21.1条带内。

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 指出了拼出完整基因所需的所有四个片段的GenBank ID,以及具体的位置。 请记住这个基因的名字,后面还会用到。 指出了所有外显子在四个片段中的具体位置。串起来是成熟mRNA

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 多一个将被翻译成定位线粒体的信号肽的外显子

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430

2.4.1 一级核酸数据库 GenBank 浏览编码人(真核生物)dUTPase的基因组DNA序列信息:AF018430 当前这个序列所包含的外显子的位置及编号

2.4.2 NCBI的Entrez检索系统 NCBI数据库检索系统,可以检索NCBI下属的所有36个数据库。

2.4.3 基因组数据库---NCBI Genome http://www.ncbi.nlm.nih.gov/ 查看病毒HIV-1的基因组

2.4.3 基因组数据库---NCBI Genome 查看病毒HIV-1的基因组 http://www.ncbi.nlm.nih.gov/genome/ 查看病毒HIV-1的基因组

2.4.3 基因组数据库---NCBI Genome 查看病毒HIV-1的基因组

2.4.3 基因组数据库---NCBI Genome 查看病毒HIV-1的基因组 HIV1病毒的整个基因组包含9752个碱基,构成9个基因。

2.4.4 基因组数据库---Ensemble 查看人的基因组 看之前,需要先搞清楚几件事: 1. 人的基因组有33亿个碱基分布在23个染色体上。 2. 我们现在已经获得了人的全基因组序列。 3. 起初拿到手的就是序列,33亿个字母,下一步 面临的巨大挑战就是给它们添加注释,也就是 做一个详细的FEATURES表。 4. 全世界每时每刻关于人类基因及其功能都有新的发现。 5. 研究基因的方法五花八门,层出不穷,想全部学会,没门! 用到哪学到哪吧!

2.4.4 基因组数据库---Ensemble 查看人的基因组 http:// www.ensembl.org/ 查看人的基因组 Ensembl由欧洲生物信息学研究所( European Bioinformatics Institute,EBI)和英国桑格研究院( Sanger Institute )合作开发。Ensembl收入了各种动物的基因组,特别是那些离我们人类近的动物(脊椎动物)。这些基因组的注释都是通过配套开发的软件自动添加的。

2.4.4 基因组数据库---Ensemble 查看人的基因组 92

2.4.4 基因组数据库---Ensemble 查看人的基因组 还 记得15 号染色体上有什么吗?

GenBank human dUTPase mRNA: U90223

DUT

2.4.5 基因组数据库---JCVI 查看微生物的基因组 http://www.jcvi.org/ 美国基因组研究所( Institute for Genome Research,TIGR )致力于微生物基因组的研究,也有部分植物基因组项目。它是克莱格·凡特研究所(J. Craig Venter Institute )的一部分,自1995年成立之初的两个基因组,至今已拥有超过700个基因组,而且还将更多。TIGR是NCBI基因组资源的有力补充,因为它不仅拥有已完成测序的基因组,还有那些测序中的基因组信息。

2.4.5 基因组数据库---JCVI 查看微生物的基因组 拟南芥 玉米 苜蓿 柳树

2.4.5 基因组数据库---JCVI 查看微生物的基因组 ……

2.4.5 基因组数据库---JCVI 查看微生物的基因组 ……

2.4.5 基因组数据库---JCVI 查看微生物的基因组

2.4.5 基因组数据库---JCVI 美国国立卫生研究所(NIH)建立了人类微生物组学计划(Human Microbiome Project,HMP)。目前HMP主要包括了人类鼻腔、口腔、皮肤、胃肠道和泌尿生殖道的宏基因组样本数据和分析流程。 NIH的HMP由四个测序中心共同完成:the Broad Institute, the Baylor College of Medicine, Washington University School of Medicine, and the J. Craig Venter Institute。

2.4.5 基因组数据库---JCVI 查看微生物的基因组

2.4.5 基因组数据库---JCVI 查看微生物的基因组

2.4.5 基因组数据库---JCVI 查看微生物的基因组 全基因组鸟枪法测序项目数据库记录

2.4.5 基因组数据库---JCVI 查看微生物的基因组 NCBI高通量测序数据库(Sequence Read Archive,SRA)

2.4.5 基因组数据库---JCVI 查看微生物的基因组

2.5 二级核酸数据库 >2000 核酸数据库 蛋白质数据库 一级核酸数据库 一级蛋白质数据库 蛋白质序列数据库 蛋白质结构数据库 INSDC UniProt 二级核酸数据库 二级蛋白质数据库 专用数据库

2.5 二级核酸数据库 RefSeq数据库:参考序列数据库,是通过自动及人工精选出的非冗余数据库,包括基因组序列、转录序列和蛋白质序列。 dbEST数据库:包含来源于不同物种的表达序列数据库和表达序列标签序列的其他信息。 Gene数据库:为用户提供基因序列注释和检索服务,收录了来自5300多个物种的430万条基因记录