普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第五章:真核生物基因组的注释.

Slides:



Advertisements
Similar presentations
行政院原住民族委員會 法規暨訴願審議委員會 102 年度原住民身分法實例演練講習: 原住民身分認定及救濟程序.
Advertisements

浙江省普陀中学 张海霞 例谈高中生物 一轮复习有效性的提高 一轮复习有效性的提高. 高三生物一轮复习目标? 1 、知识: 提高审题能力 强化、突出主干知识。 易化、突破难点知识。 细化、整理基础知识。 2 、能力: 提高解题技巧 提高表达能力.
本校自民國 78 年於顏前校長世錫任內創設本系 設立鑑識科學學系大學部,專責鑑識人才之培養, 為目前國內唯一專門培育鑑識科學人才、研究鑑識 科學學術之大學學系,設系剛滿 20 年。自 85 年於姚 前校長高橋任內,設立鑑識科學研究所招收碩士生 ,民國 88 年於謝前校長瑞智任內先後獲內政部、教.
化疗知识讲座 台州博爱肿瘤医院 陈国卿. 一、化疗药物的抗癌机制 1 、抑制细胞增殖和肿瘤的生长是其主要作 用机理。 2 、对于新陈代谢旺盛的正常组织同样具有 毒性,如骨髓细胞,粘膜细胞。 3 、理想的药物 — 最大程度的抑制肿瘤细胞, 最小程度的影响正常细胞。 4 、基因药物是发展方向。
第二节 基因在亲子代间的传递. 1. 什么叫做遗传? 2. 什么叫做性状? 3. 性状是由什么决定的?
主题二 生命的基础 细胞的结构和功能. 细胞壁 细胞膜 细胞质 细胞核 化学组成 功能 成分 结构 基质 细胞器 结构 功能.
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
选修3 现代生物技术专题第三节 蛋白质工程.
第二章:生物科學與食品 第三節:基因改造食品.
第十一章 药物生物信息学基础.
第三章 现代教育与人的发展.
龙星课程—肿瘤生物信息学上机课程 曹莎
神创造万物及人类.
第21课时 生物圈中的微生物 考 点 聚 焦 专 项 突 破 1.
國民中學 自然與生活科技 第二冊 第3章 生殖 3-1 細胞分裂 3-2 無性生殖 3-3 有性生殖.
生命科学发展趋势、优先发展领域与资助思考
基因工程及应用.
第2章 基因和染色体的关系 第1节 减数分裂和受精作用.
学校核心发展力 上海市建平中学 程红兵.
专题 1、4 基因工程、生物技术的安全和伦理问题 考纲内容 能力要求 命题展望 1. 基因工程的诞生 2.基因工程的原理及技术
必修二 生物 (人教版).
高二生物 绪论 制作人:李 绒.
想一想 议一议 P74 我们常吃的蘑菇有根、茎、叶吗? 它们的生长是否需要光? 为什么说它们是真菌而不是植物呢?
三次科技革命 学习目标: 1.知道三次科技革命的时间、标志、发源地、理论基础、主要成就、主要特点及影响。 2.培养归纳历史知识的能力
一轮复习 细胞的增值.
  22. 关于生物组织中还原糖的鉴定,下列叙述正确的是
王永慶遺產分配 第三組民法報告 4970T011 劉昭妤 4970T037 吳品怡 4970T090 袁如意
台南在地美食文化介紹 台南市鳳凰城文史協會 理事長 歐財榮.
第四节 地域文化与人口 有儿无女不称心,有女无儿就伤心; 一儿一女不放心,多子多女才舒心。 有权的顶着生,有钱的买着生;
第3节 细胞核——系统的控制中心 肥西中学 蔡林.
一、作者概說:    王壽來,民國三十八年生,山西省 五臺縣人,中興大學 法律系畢業,美國 喬治城大學碩士、臺灣師範大學 美術研究所碩博士。長期從事文化與外交工作,現任文建會 文化資產總管理處籌備處主任。   王壽來靈感多取自生活經驗,善用中外名言,描繪人生百態。著有《公務員快意人生》、《藝術‧收藏‧我》、《公務員DNA》、《和世界偉人面對面》等書。
必修二 遗传与进化 第三章 基因的本质 第4节 基因是有遗传效应的DNA片段 巢湖市 无为县二坝职中 何宇.
导入新课 波能绕过障碍物产生衍射。既然光也是一种波,为什么在日常生活中难以观察到光的衍射现象呢?.
高中生物学必修Ⅰ 分子与细胞 前 言.
第十一讲 生物测序技术概述 转录组测序.
基因对性状的控制.
mRNA 转录、翻译和DNA复制的区别 细胞核 细胞核 转录 翻译 DNA复制 场所 模板 原料 信息传递 时间 产物 生长发育过程中
我的社區_觀塘 第三課.
13-14学年度生物学科教研室总结计划 2014年2月.
必修1 分子与细胞 第二章 第三节 细 细胞溶胶 内质网 胞 核糖体 质 高尔基体 线粒体 第一课时 浙江省定海第一中学 黄晓芬.
关注生物技术的 伦理问题.
2015年高考历史质量分析报告 兰州市外国语高级中学 杨彩玲.
肝功能正常的小三阳注意事项.
突變 突變是指遺傳物質發生改變, 而影響到性狀的表現 例:白化症.
基因突变 授课人:羊金华
国家自然科学基金 2009年资助情况及医学科学部学科设置
第四章 基因的表达 基因指导蛋白质的合成 (第二课时) 高二年级(理) 教师姓名:葛红.
第1章 走近细胞 制作人:周红锳 第1章 .
司法机关.
第六章 转座.
生物五界的分類方式.
真核生物基因结构的预测分析.
生物信息学 第六章 基因预测和基因结构分析 (II).
生物信息学 第六章 基因预测和基因结构分析 (I).
第三章 基因工程制药.
基因指导蛋白质的合成 淮安市洪泽湖高级中学:王建友. 基因指导蛋白质的合成 淮安市洪泽湖高级中学:王建友.
人是由什么发育而来的? 一个受精卵.
第3节 细胞核——系统的控制中心 本节聚集: 1.细胞核有什么功能? 2. 细胞核的形态结构是怎样的?
第二节 核酸与细胞核.
复习:蛋白质的形成 几条肽链盘曲折叠形成的蛋白质 氨基酸 …….
遗传信息的携带者——核酸 授课教师:王建友.
细胞增殖 意义:生物体生长、发育、繁殖和遗传的基础 有丝分裂 减数分裂 无丝分裂 真核细胞的分裂方式有.
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
遗传信息的传递与表达.
非同源染色体:不是同源染色体的两条染色体
基因信息的传递.
基因组学及相关组学 基因组学 后基因组学 蛋白质组学 组学 ---- 研究细胞、组织或整个生物体内某种分子(核酸、
园艺专业《园艺植物遗传与良种繁育》 基因的表达 平凉市电大庄浪工作站 苏显扬.
第三节 转录后修饰.
证据运用 第八章 证据的运用 第一节 证据体系的结构及运用规则.
Presentation transcript:

普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第五章:真核生物基因组的注释

第一节 蛋白质编码基因的注释 注释策略: (一)、基于证据的注释,即根据已有的实验证据(如cDNA)、表达序列标签(EST)和蛋白质序列进行蛋白质编码基因的注释。 (二)、从头开始(ab initio)的基因预测,即只根据基因组的DNA序列对蛋白质编码基因进行预测。 (三)、重新(de novo)基因预测,即通过与其他物种的基因组进行比较,从而预测一个新基因组中的蛋白质编码基因。

一、基于证据的基因注释 (一)顺式比对 顺式比对是使用被注释基因组的cDNA或者蛋白质序列与基因组序列进行比对后得到的最好的比对位点,而这个位点常常被认为就是转录或者翻译形成cDNA或者蛋白质的基因。 常用的顺式比对程序如AAT、SIM4、Splign等。

(二)反式比对 反式比对是使用cDNA或者蛋白质序列与基因组进行比对得到同源位点(比对所用的cDNA或者蛋白质并不来自于这个位点,往往属于同一个基因家族)。 常用的反式比对工具有BLAT、Exonerate和GeneWise 。

二、从头开始的基因预测 从基因组测序一开始,一个明确的目标就是能够准确地进行从头开始(ab initio)的基因预测,即只依赖蕴含在DNA序列内部的信息来确定基因结构。 从头开始的基因预测包括两个主要步骤,即蛋白质编码基因特征的识别和基因结构的生成。 从头预测基因软件:GENSCAN

三、重新基因预测 重新预测软件:Twinscan、SGP2、SLAM 四、整合信息 (一)人工整合 (二)自动整合

五、蛋白质编码基因的功能注释 常用的数据库主要包括NCBI的NT、NR(非荣冗余蛋白质序列数据库)、UniProt、InterPro、KEGG、KOG等。

第二节 RNA基因的注释 RNA基因是指不编码蛋白质的基因,又称为非编码基因(non-coding gene,ncRNA),其编码产物为一条功能RNA分子。

根据是否需要依赖基因组序列以外的信息RNA基因的预测方法分为两类,一类是基于相似性的预测方法,一类是从头开始的预测方法。 最全面的RNA家族序列和比对信息的数据库之一是Rfam数据库。

第三节 重复序列的注释 串联重复序列(tandem repeat) 分为:microsatellite、minisatellite、satellite 软件:Tandem Repeats Finder 散布的重复序列(dispersed repeat) 大多是转座元件(transposable element,TE),是指可以通过转座(transposition)过程在基因组内不同位置间移动的DNA片段。 转座机制:剪切和粘贴、复制和粘贴 软件:RepeatMasker

第四节 假基因的注释 non-processed pseudogene processed pseudogene 假基因是基因组中与真基因序列相似但缺乏功能的DNA序列。 non-processed pseudogene 又称为复制型假基因,是通过基因组DNA复制或者不平衡交换产生的,多位于其同源功能基因的附近。 processed pseudogene 又称反转座假基因,来源于反转座事件,由mRNA反转录成cDNA,然后整合到基因组中。

第五节 案例分析:黄瓜基因组的注释 一、蛋白质编码基因的注释

黄瓜基因组使用的转录物数据库有:黄瓜EST和mRNA(NCBI下载)、甜瓜EST(MELOGEN数据库)和TIGR植物转录数据库。 (一)基于证据的基因注释 1、转录物比对 黄瓜基因组使用的转录物数据库有:黄瓜EST和mRNA(NCBI下载)、甜瓜EST(MELOGEN数据库)和TIGR植物转录数据库。 cDNA、EST比对软件PASA和AAT-gap2 2、蛋白质比对 蛋白质数据来自UniProt数据库 比对软件:AAT-nap和Genewise

(二)构建基因预测训练集 (三)从头开始的基因预测 基因预测训练集的构建对于从头开始基因预测及EVM 中权重的训练都是至关重要的。 从头开始基因预测软件——BGF、GlimmerHMM、SNAP和GENSCAN (四)EVM基因预测自动整合系统

(五)基因功能注释 1、寻找同源基因 使用BLASTp在UniProt数据库中进行相似性搜索同源基因。

2、结构域和GO注释 结构域预测软件:InterPro数据库的InterproScan程序 GO注释:由InterPro的结构域提供

3、代谢通路注释 KEGG(Kyoto encyclopedia of genes and genomes)

二、RNA基因的注释

三、重复序列的注释 (一)串联重复序列的注释 Tandem Rpeats Finder

(二)转座元件的注释 1、构建黄瓜特意的de novo TE库 TE预测软件:ReAS、RepeatScout、PILER和LTR_FINDER 2、黄瓜的de novo TE库的分类

3、基因组水平上的转座元件的注释

四、假基因的注释