普通高等教育 “十二五”规划教材生物信息学 Bioinformatics 第五章：真核生物基因组的注释.

Slides:

Advertisements

Similar presentations

行政院原住民族委員會法規暨訴願審議委員會 102 年度原住民身分法實例演練講習：原住民身分認定及救濟程序.

Advertisements

浙江省普陀中学张海霞例谈高中生物一轮复习有效性的提高一轮复习有效性的提高. 高三生物一轮复习目标？ 1 、知识：提高审题能力强化、突出主干知识。易化、突破难点知识。细化、整理基础知识。 2 、能力：提高解题技巧提高表达能力.

本校自民國 78 年於顏前校長世錫任內創設本系設立鑑識科學學系大學部，專責鑑識人才之培養，為目前國內唯一專門培育鑑識科學人才、研究鑑識科學學術之大學學系，設系剛滿 20 年。自 85 年於姚前校長高橋任內，設立鑑識科學研究所招收碩士生，民國 88 年於謝前校長瑞智任內先後獲內政部、教.

化疗知识讲座台州博爱肿瘤医院陈国卿. 一、化疗药物的抗癌机制 1 、抑制细胞增殖和肿瘤的生长是其主要作用机理。 2 、对于新陈代谢旺盛的正常组织同样具有毒性，如骨髓细胞，粘膜细胞。 3 、理想的药物 — 最大程度的抑制肿瘤细胞，最小程度的影响正常细胞。 4 、基因药物是发展方向。

第二节基因在亲子代间的传递. 1. 什么叫做遗传？ 2. 什么叫做性状？ 3. 性状是由什么决定的？

主题二生命的基础细胞的结构和功能. 细胞壁细胞膜细胞质细胞核化学组成功能成分结构基质细胞器结构功能.

第四节 RNA 的空间结构与功能. RNA 的种类和功能核糖体 RNA （ rRNA ）：核蛋白体组成成分转移 RNA （ tRNA ）：转运氨基酸信使 RNA （ mRNA ）：蛋白质合成模板不均一核 RNA （ hnRNA ）：成熟 mRNA 的前体小核 RNA （ snRNA ）：

选修3 现代生物技术专题第三节蛋白质工程.

第二章：生物科學與食品第三節：基因改造食品.

第十一章药物生物信息学基础.

第三章现代教育与人的发展.

龙星课程—肿瘤生物信息学上机课程曹莎

神创造万物及人类.

第21课时　生物圈中的微生物考点聚焦专项突破 1.

國民中學自然與生活科技第二冊第３章　生殖 3-1 細胞分裂 3-2 無性生殖 3-3 有性生殖.

生命科学发展趋势、优先发展领域与资助思考

基因工程及应用.

第2章基因和染色体的关系第1节减数分裂和受精作用.

学校核心发展力上海市建平中学程红兵.

专题 1、4 基因工程、生物技术的安全和伦理问题考纲内容能力要求命题展望 1. 基因工程的诞生 2．基因工程的原理及技术

必修二生物（人教版）.

高二生物绪论制作人：李绒.

想一想议一议 P74 我们常吃的蘑菇有根、茎、叶吗？它们的生长是否需要光？为什么说它们是真菌而不是植物呢？

三次科技革命学习目标： 1.知道三次科技革命的时间、标志、发源地、理论基础、主要成就、主要特点及影响。 2.培养归纳历史知识的能力

一轮复习细胞的增值.

　　22. 关于生物组织中还原糖的鉴定,下列叙述正确的是

王永慶遺產分配第三組民法報告 4970T011 劉昭妤 4970T037 吳品怡 4970T090 袁如意

台南在地美食文化介紹台南市鳳凰城文史協會理事長歐財榮.

第四节地域文化与人口有儿无女不称心，有女无儿就伤心；一儿一女不放心，多子多女才舒心。有权的顶着生，有钱的买着生；

第３节　细胞核——系统的控制中心肥西中学蔡林.

一、作者概說：　　王壽來，民國三十八年生，山西省五臺縣人，中興大學法律系畢業，美國喬治城大學碩士、臺灣師範大學美術研究所碩博士。長期從事文化與外交工作，現任文建會文化資產總管理處籌備處主任。　　王壽來靈感多取自生活經驗，善用中外名言，描繪人生百態。著有《公務員快意人生》、《藝術‧收藏‧我》、《公務員DNA》、《和世界偉人面對面》等書。

必修二遗传与进化第三章基因的本质第4节基因是有遗传效应的DNA片段巢湖市无为县二坝职中何宇.

导入新课波能绕过障碍物产生衍射。既然光也是一种波，为什么在日常生活中难以观察到光的衍射现象呢？.

高中生物学必修Ⅰ 分子与细胞前言.

第十一讲生物测序技术概述转录组测序.

基因对性状的控制.

mRNA 转录、翻译和DNA复制的区别细胞核细胞核转录翻译 DNA复制场所模板原料信息传递时间产物生长发育过程中

我的社區_觀塘第三課.

13-14学年度生物学科教研室总结计划 2014年2月.

必修1 分子与细胞第二章第三节细细胞溶胶内质网胞核糖体质高尔基体线粒体第一课时浙江省定海第一中学黄晓芬.

关注生物技术的伦理问题.

2015年高考历史质量分析报告兰州市外国语高级中学杨彩玲.

肝功能正常的小三阳注意事项.

突變突變是指遺傳物質發生改變，而影響到性狀的表現例：白化症.

基因突变授课人：羊金华

国家自然科学基金 2009年资助情况及医学科学部学科设置

第四章基因的表达基因指导蛋白质的合成 (第二课时) 高二年级(理) 教师姓名:葛红.

第1章走近细胞制作人：周红锳第1章　.

第六章转座.

生物五界的分類方式.

真核生物基因结构的预测分析.

生物信息学第六章基因预测和基因结构分析（II）.

生物信息学第六章基因预测和基因结构分析（I）.

第三章基因工程制药.

基因指导蛋白质的合成淮安市洪泽湖高级中学：王建友. 基因指导蛋白质的合成淮安市洪泽湖高级中学：王建友.

人是由什么发育而来的？一个受精卵.

第3节细胞核——系统的控制中心本节聚集： 1.细胞核有什么功能？ 2. 细胞核的形态结构是怎样的？

第二节核酸与细胞核.

复习：蛋白质的形成几条肽链盘曲折叠形成的蛋白质氨基酸 …….

遗传信息的携带者——核酸授课教师：王建友.

细胞增殖意义：生物体生长、发育、繁殖和遗传的基础有丝分裂减数分裂无丝分裂真核细胞的分裂方式有.

AD相关LncRNA调控及分析方法研究项目成员：魏晓冉李铁志指导教师：张莹 2018年理学院大学生创新创业训练计划项目作品成果展示

遗传信息的传递与表达.

非同源染色体：不是同源染色体的两条染色体

基因信息的传递.

基因组学及相关组学基因组学后基因组学蛋白质组学组学 ---- 研究细胞、组织或整个生物体内某种分子（核酸、

园艺专业《园艺植物遗传与良种繁育》基因的表达平凉市电大庄浪工作站苏显扬.

第三节转录后修饰.

证据运用第八章证据的运用第一节证据体系的结构及运用规则.

Presentation transcript:

普通高等教育 “十二五”规划教材生物信息学 Bioinformatics 第五章：真核生物基因组的注释

第一节蛋白质编码基因的注释注释策略： (一)、基于证据的注释，即根据已有的实验证据（如cDNA）、表达序列标签（EST）和蛋白质序列进行蛋白质编码基因的注释。 (二)、从头开始（ab initio）的基因预测，即只根据基因组的DNA序列对蛋白质编码基因进行预测。 (三)、重新（de novo）基因预测，即通过与其他物种的基因组进行比较，从而预测一个新基因组中的蛋白质编码基因。

一、基于证据的基因注释（一）顺式比对顺式比对是使用被注释基因组的cDNA或者蛋白质序列与基因组序列进行比对后得到的最好的比对位点，而这个位点常常被认为就是转录或者翻译形成cDNA或者蛋白质的基因。常用的顺式比对程序如AAT、SIM4、Splign等。

（二）反式比对反式比对是使用cDNA或者蛋白质序列与基因组进行比对得到同源位点（比对所用的cDNA或者蛋白质并不来自于这个位点，往往属于同一个基因家族）。常用的反式比对工具有BLAT、Exonerate和GeneWise 。

二、从头开始的基因预测从基因组测序一开始，一个明确的目标就是能够准确地进行从头开始（ab initio）的基因预测，即只依赖蕴含在DNA序列内部的信息来确定基因结构。从头开始的基因预测包括两个主要步骤，即蛋白质编码基因特征的识别和基因结构的生成。从头预测基因软件：GENSCAN

三、重新基因预测重新预测软件：Twinscan、SGP2、SLAM 四、整合信息（一）人工整合（二）自动整合

五、蛋白质编码基因的功能注释常用的数据库主要包括NCBI的NT、NR（非荣冗余蛋白质序列数据库）、UniProt、InterPro、KEGG、KOG等。

第二节 RNA基因的注释 RNA基因是指不编码蛋白质的基因，又称为非编码基因（non-coding gene，ncRNA），其编码产物为一条功能RNA分子。

根据是否需要依赖基因组序列以外的信息RNA基因的预测方法分为两类，一类是基于相似性的预测方法，一类是从头开始的预测方法。最全面的RNA家族序列和比对信息的数据库之一是Rfam数据库。

第三节重复序列的注释串联重复序列（tandem repeat）分为：microsatellite、minisatellite、satellite 软件：Tandem Repeats Finder 散布的重复序列（dispersed repeat）大多是转座元件（transposable element，TE），是指可以通过转座（transposition）过程在基因组内不同位置间移动的DNA片段。转座机制：剪切和粘贴、复制和粘贴软件：RepeatMasker

第四节假基因的注释 non-processed pseudogene processed pseudogene 假基因是基因组中与真基因序列相似但缺乏功能的DNA序列。 non-processed pseudogene 又称为复制型假基因，是通过基因组DNA复制或者不平衡交换产生的,多位于其同源功能基因的附近。 processed pseudogene 又称反转座假基因，来源于反转座事件，由mRNA反转录成cDNA，然后整合到基因组中。

第五节案例分析：黄瓜基因组的注释一、蛋白质编码基因的注释

黄瓜基因组使用的转录物数据库有：黄瓜EST和mRNA（NCBI下载）、甜瓜EST（MELOGEN数据库）和TIGR植物转录数据库。（一）基于证据的基因注释 1、转录物比对黄瓜基因组使用的转录物数据库有：黄瓜EST和mRNA（NCBI下载）、甜瓜EST（MELOGEN数据库）和TIGR植物转录数据库。 cDNA、EST比对软件PASA和AAT-gap2 2、蛋白质比对蛋白质数据来自UniProt数据库比对软件：AAT-nap和Genewise

（二）构建基因预测训练集（三）从头开始的基因预测基因预测训练集的构建对于从头开始基因预测及EVM 中权重的训练都是至关重要的。从头开始基因预测软件——BGF、GlimmerHMM、SNAP和GENSCAN （四）EVM基因预测自动整合系统

（五）基因功能注释 1、寻找同源基因使用BLASTp在UniProt数据库中进行相似性搜索同源基因。

2、结构域和GO注释结构域预测软件：InterPro数据库的InterproScan程序 GO注释：由InterPro的结构域提供

3、代谢通路注释 KEGG（Kyoto encyclopedia of genes and genomes）

二、RNA基因的注释

三、重复序列的注释（一）串联重复序列的注释 Tandem Rpeats Finder

（二）转座元件的注释 1、构建黄瓜特意的de novo TE库 TE预测软件：ReAS、RepeatScout、PILER和LTR_FINDER 2、黄瓜的de novo TE库的分类

3、基因组水平上的转座元件的注释

四、假基因的注释