真核生物基因结构的预测分析.

Slides:



Advertisements
Similar presentations
A11 Regulation of gene expression in eukaryotes 2  真核生物基因表达调控的特点 真核生物表达调控与原核生物的不同: ( 1 )染色体结构不同; ( 2 )原核生物具有正调控和负调控并重的特点,真核 生物目前已知的主要是正调控; ( 3 )原核生物的转录和翻译是相偶联的,真核生物的.
Advertisements

病历书写 中山医院呼吸科 张 新. 定 义 病历是临床医生根据问诊、体格检查、实验 室和其他检查获得的资料经过归纳、分析、整理, 按照规定的格式而写成的;是关于病人发病情况, 病情发展变化,转归和诊疗情况的系统记录。 病历是临床医生根据问诊、体格检查、实验 室和其他检查获得的资料经过归纳、分析、整理,
第十二章 病历书写与要求 病历病历 医务人员在医疗中形成的文字、符号、图表、 影像、切片等资料的总和。 病历书写 通过诊法、诊断、治疗、护理等医疗活动获得有关资 料,进行归纳、分析、整理形成医疗活动记录行为。 病历意义 A 诊疗等的源文件; B 复 / 转 / 会诊,解决医疗纠纷、判定法律责任、医疗保险等的资料和依据;
主题二 生命的基础 细胞的结构和功能. 细胞壁 细胞膜 细胞质 细胞核 化学组成 功能 成分 结构 基质 细胞器 结构 功能.
诺如病毒感染性腹泻病.
金門的特色小吃 ~結合自然與人文的美食之旅~
Regulation of Gene Expression
五所交大是一家 演讲: 孔谐和 尹天威.
第 十 三 章 基因表达调控 Regulation of Gene Expression.
黄芪多糖粉 ----控制细菌病毒复合感染的传染性疾病药物
神创造万物及人类.
专题1 基因工程 考点1:基因工程原理及特点 外源基因在受体细胞中能够表达. 原因: (1)不同生物间DNA分子的结构基本相同; (2)不同生物进行基因表达时都遵循“中心法则”; (3)所有生物共用一套遗传密码.
从诺贝尔奖到新世纪 生命科学发展趋势 尚忠林 河北师范大学生命科学学院.
生命科学发展趋势、优先发展领域与资助思考
Yingzi Kang Ph.D Dept. of biochemistry, Tianjin Medical University
DNA多态性分析基础.
专题 1、4 基因工程、生物技术的安全和伦理问题 考纲内容 能力要求 命题展望 1. 基因工程的诞生 2.基因工程的原理及技术
高二生物 绪论 制作人:李 绒.
第一章 基因与基因组   .
基础分子生物学.
第十二章 遗传与个体发育 第一节 细胞质在遗传中的作用 第二节 细胞分化的可逆性 第三节 基因表达的调控.
一轮复习 细胞的增值.
生物信息学数据库.
台灣的名勝古蹟.
主讲人:孙 啸 制作人:刘志华 东南大学 吴健雄实验室
第3节 细胞核——系统的控制中心 肥西中学 蔡林.
第十二章 核酸的生物合成 第一节 DNA的生物合成 第二节 RNA的生物合成 第三节 反转录作用(逆转录) 一、DNA的复制方式~半保留复制
第三章:基因的本质 第2节 DNA分子的结构.
基因对性状的控制.
mRNA 转录、翻译和DNA复制的区别 细胞核 细胞核 转录 翻译 DNA复制 场所 模板 原料 信息传递 时间 产物 生长发育过程中
遗 传 生命与繁衍的保证.
13-14学年度生物学科教研室总结计划 2014年2月.
8 基因的表达与调控 ——真核基因表达调控 真核生物(除酵母、藻类和原生动物等单细胞类之外)主要由多细胞组成,每个细胞基因组中蕴藏的遗传信息量及基因数量都大大高于原核生物。人类细胞单倍体基因组有3×109bp,为大肠杆菌总DNA的800倍,噬菌体的10万倍左右!
台灣史總複習.
必修1 分子与细胞 第二章 第三节 细 细胞溶胶 内质网 胞 核糖体 质 高尔基体 线粒体 第一课时 浙江省定海第一中学 黄晓芬.
欢 迎.
基因突变 授课人:羊金华
RNA Biosynthesis ( Transcription )
第三章 真核细胞基因表 达的调控 生物工程04级1班 马莉.
兔肝DNA的提取与二苯胺显色法测定DNA含量 目的基因SNP位点的鉴定及其意义
國文報告 儒家生死文化討論 不死鳥 組員 972BP001 彭科強 972BP008 王薪榕 972BP025 彭裕宗
第四章 基因的表达 基因指导蛋白质的合成 (第二课时) 高二年级(理) 教师姓名:葛红.
分子生物学技术在 中医药研究中的应用 上海中医药大学 方肇勤.
Lots of tools for cloning:
第9章 转录 9.1 引言 9.2 转录发生在没有配对的DNA转录泡中,并根据碱基互补配对原则进行 9.3 转录的三个阶段
基本概念介紹 生命是什麼? 生命的密碼~DNA 解讀生命的執行者~RNA 生命舞台的主演者~蛋白質 DNA、RNA、蛋白質的三角關係
TIANGEN BIOTECH (BEIJING) CO.,LTD
电 子 克 隆.
第 十 三 章 基因表达调控 Regulation of Gene Expression 目 录.
Alternative splicing of mRNA molecule
DNA是生物遗传的主要物质基础,生物机体的遗传信息以密码的形式编码在DNA分子上,表现为特定的核苷酸排列顺序,并通过DNA的复制由亲代传递给子代。在后代的生长发育过程中,遗传信息自DNA转录给RNA,然后翻译成特异的蛋白质,以执行各种生命功能,使后代表现出与亲代相似的遗传性状。 1958年,遗传信息的单向.
第三章 基因组的结构与功能.
五、受体蛋白病 家族性高胆固醇血症(FH)
第八章 DNA文库的构建和 目的基因的筛选 §1 基因组DNA文库的构建 §2 cDNA文库的构建 §3 基因克隆的筛选策略.
第二节、真核生物基因结构及功能 一、基因的概念 基因的概念随着分子遗传学、分子生物学、生物化学领域的进展而不断完善。 从遗传学角度看:
第十三章 RNA生物合成和加工 第一节 DNA指导下RNA的合成(转录) 第二节 RNA转录后加工
第三章 基因工程制药.
RNA Biosynthesis (Transcription)
Yeast two-hybrid system
第 十 三 章 基因表达调控 Regulation of Gene Expression 目 录.
基因结构和表达调控 Gene Structure and Expression 目 录.
基因指导蛋白质的合成 淮安市洪泽湖高级中学:王建友. 基因指导蛋白质的合成 淮安市洪泽湖高级中学:王建友.
第五章 目的基因的获得 第一节 PCR扩增获得目的基因或cDNA 第二节 基因组文库的构建与基因分离 第三节 cDNA文库的构建与筛选
第3节 细胞核——系统的控制中心 本节聚集: 1.细胞核有什么功能? 2. 细胞核的形态结构是怎样的?
第二节 核酸与细胞核.
复习:蛋白质的形成 几条肽链盘曲折叠形成的蛋白质 氨基酸 …….
遗传信息的携带者——核酸 授课教师:王建友.
遗传信息的传递与表达.
园艺专业《园艺植物遗传与良种繁育》 基因的表达 平凉市电大庄浪工作站 苏显扬.
生物化学 杭州职业技术学院.
Presentation transcript:

真核生物基因结构的预测分析

课程内容 基因组学 系统生物学 转录物组学 蛋白质组学 实习一 基因组数据注释和功能分析 实习二 真核生物基因结构的预测分析 实习三 芯片的基本数据处理和分析 实习四 蛋白质结构与功能分析 实习五 蛋白质组学数据分析 实习六 系统生物学软件实习 基因组学 系统生物学 转录物组学 蛋白质组学

基因组功能分析 蛋白质序列 基因组序列cDNA序列 编码区预测 序列比对 功能注释 KEGG GO 系统发育树 蛋白质理化性质 二级结构预测 翻译 蛋白质理化性质 二级结构预测 结构域分析 重要信号位点分析 三级结构预测 基因组序列cDNA序列 编码区预测 Codon bias GC Content 限制性酶切位点 基因结构分析 选择性剪切 转录调控因子 序列比对 功能注释 KEGG GO 系统发育树 3

真核生物基因的主要结构

基因结构分析常用软件 基因结构分析 开放读码框 GENSCAN GENOMESCAN CpG岛 CpGPlot 转录终止信号 POLYAH 启动子/转录起始位点 PromoterScan DBTSS database mRNA剪切位点 NETGENE2 Spidey 选择性剪切 ASTD

开放读码框的识别 开放读码框(open reading frame, ORF) 是一段起始密码子和终止密码子之间的碱基序列

基因开放阅读框/基因结构分析识别工具 ORF Finder http://www.ncbi.nlm.nih.gov/gorf/gorf.html NCBI 通用 BestORF http://linux1.softberry.com/berry.phtml?topic=bestorf&group=programs&subgroup=gfind Softberry 真核 GENSCAN http://genes.mit.edu/GENSCAN.html MIT 脊椎、拟南芥、玉米 Gene Finder http://rulai.cshl.org/tools/genefinder/ Zhang lab 人、小鼠、拟南芥、酵母 FGENESH http://linux1.softberry.com/berry.phtml?topic=fgenesh&group=programs&subgroup=gfind 真核(基因结构) GeneMark http://opal.biology.gatech.edu/GeneMark/eukhmm.cgi GIT 原核 GLIMMER http://www.ncbi.nlm.nih.gov/genomes/MICROBES/glimmer_3.cgi http://www.cbcb.umd.edu/software/glimmer Maryland Fgenes http://linux1.softberry.com/berry.phtml?topic=fgenes&group=programs&subgroup=gfind 人(基因结构) FgeneSV http://linux1.softberry.com/berry.phtml?topic=virus&group=programs&subgroup=gfindv 病毒 Generation http://compbio.ornl.gov/generation/ ORNL FGENESB http://linux1.softberry.com/berry.phtml?topic=fgenesb&group=programs&subgroup=gfindb 细菌(基因结构) GenomeScan http://genes.mit.edu/genomescan.html GeneWise2 http://www.ebi.ac.uk/Wise2/ EBI 人 GRAIL http://grail.lsd.ornl.gov/grailexp/ 人、小鼠、拟南芥、果蝇 1.原核,简单的基因结构 2.真核 3.微生物,原核生物基因组 7

ORF识别:GENSCAN http://genes.mit.edu/GENSCAN.html 选择物种类型 是否显示非最优外显子 序列名称(可选) 显示氨基酸或CDS序列 提交序列文件 提交序列 结果返回到邮箱(可选) 运行GENSCAN

GENSCAN输出结果:文本 9

GENSCAN输出结果:图形 10

ORF识别: GenomeScan http://genes.mit.edu/genomescan.html 提交待分析序列 提交同源蛋白质序列 运行GenomeScan

GenomeScan输出结果:文本 预测外显子位置、可信度等信息 同源比对信息 预测结果的氨基酸序列

GenomeScan输出结果:图形

课堂练习 1使用GENESCAN预测序列中可能的ORF。 2使用GENOMESCAN预测序列中可能的ORF。 练习用的序列文件在c:\zcni\shixi2文件下,名字为clone.fasta,使用写字板打开查看。

转录调控序列分析

启动子区结构 启动子(Promoter) 位于结构基因5’端上游,能活化RNA聚合酶,使之与模板DNA结合并具有转录起始的特异性。 转录起始位点(Transcription start site, TSS) PYCAPY(嘧啶) 核心启动子元件(Core promoter element) TATA box,Pribnow box (TATAA) 上游启动子元件(Upstream promoter element,UPE) CAAT box,GC box,SP1,Otc 增强子(Enhancer) 16

原核和真核生物基因转录起始位点上游区结构 原核生物 TTGACA TATAAT A mRNA +1 -10 -35 真核生物 PyAPy TATAAT GC区 CAAT区 mRNA +1 -40 -25 -110 增强子 上游启动子元件,UPE 核心启动子元件 转录起始位点

Neural Network Promoter Prediction Softberry: BPROM, TSSP, TSSG, TSSW 启动子结合位点分析常用软件 PromoterScan http://bimas.dcrt.nih.gov:80/molbio/proscan/ Web Promoser http://biowulf.bu.edu/zlab/PromoSer/ Neural Network Promoter Prediction http://www.fruitfly.org/seq_tools/promoter.html Softberry: BPROM, TSSP, TSSG, TSSW http://www.softberry.com/berry.phtml?topic=index&group=programs&subgroup=promoter MatInspector http://www.gene-regulation.de/ RSAT http://rsat.ulb.ac.be/rsat/ Cister http://zlab.bu.edu/~mfrith/cister.shtml

启动子预测:PromoterScan http://www-bimas.cit.nih.gov/molbio/proscan/ 提交序列

PromoterScan输出结果 找到的TATA box和转录起始位点 预测可能的转录因子 转录因子在提交序列中的位置

转录起始位点数据库数据库:DBTSS http://dbtss.hgc.jp/

DBTSS搜索工具条 限定物种“H. sapiens” 最新数据库版本加入Solexa测序新数据支持 限定搜索“基因名称” 搜索基因“FXYD5” 限定至少需要多少条cDNA序列覆盖

DBTSS搜索结果

FXYD5基因的启动子区域显示 SNP位点 覆盖的cDNA序列数目 转录起始位点TSS DBTSS图例说明

ALB基因的启动子区域显示 TF:转录因子结合位点 转录起始位点TSS 覆盖的cDNA序列数目

下载启动子序列 下载启动子区序列 设置下载序列的起点、终点 需选择转录起始位点 下载全长cDNA(包括启动子区)序列

课堂练习 1 使用PromoterScan 预测clone.fasta里面的潜在外显子。 2 利用DBTSS数据库搜索基因的转录起始位点和可能的上游调控序列。

CpG岛的预测 CpG岛 常位于真核生物基因转录起始位点,GC含>50% ,长度>200bp CpG Island 分析 http://www.uscnorris.com/cpgislands2/cpg.aspx Web CpGPlot http://www.ebi.ac.uk/emboss/cpgplot/index.html CpG finder http://www.softberry.com/berry.phtml?topic=cpgfinder&group=programs&subgroup=promoter CpGi130 http://methycancer.psych.ac.cn/CpG130.do web CpGproD http://pbil.univ-lyon1.fr/software/cpgprod_query.html

CpG岛的预测:CpGPlot 参数选项 提交序列 提交序列文件 http://www.ebi.ac.uk/emboss/cpgplot/index.html 提交序列文件 提交序列 参数选项

GENESCAN 预测结果 起始为532bp 终止于51783bp

转录终止信号 上游作用元件:AAUAAA 下游作用元件:GC rich二重对称区、UUUUUU AAUAAA CAAAAAAAAAAAAA 成熟mRNA 5’ 3’ CA GU mRNA前体 下游作用元件:GC rich二重对称区、UUUUUU C-G G-C U-A UUUUUUUUU RNA 5’ 3’

转录终止信号polyA预测:POLYAH http://www.softberry.com/berry.phtml?topic=polyah&group=programs&subgroup=promoter 提交序列 提交序列文件

POLYAH输出结果 polyA位置 GENESCAN预测结果 PolyA位点52398bp

课堂练习 使用CpG plot预测clone.fasta中的CpG岛。 使用POLYAH预测clone.fasta中的POLYA剪切位点。

内含子/外显子剪切位点识别 如何分析mRNA/cDNA的外显子组成? 通过对特征序列(GT-AG)的分析进行直接的预测基因预测软件(NetGene2) 与相应的基因组序列比对,分析比对片段的分布位置(Spidey)

剪切位点识别:NetGene2 http://www.cbs.dtu.dk/services/NetGene2/ 选择物种 提交序列

NetGene2输出结果 相位 可信度 供体位点 受体位点

mRNA剪切位点识别:Spidey NCBI开发的在线预测程序 用于mRNA序列同基因组序列比对分析 http://www.ncbi.nih.gov/spidey NCBI开发的在线预测程序 用于mRNA序列同基因组序列比对分析

Spidey同源序列的获得:序列比对 通过BLAST进行序列比对,找到可能同源的相似性好的一系列mRNA序列。

Spidey序列提交页面 输入基因组序列或序列数据库号 输入相似性序列 判断用于分析的序列间的差异,并调整比对参数 不受默认内含子长度限制, 默认长度:内部内含子 为35kb, 末端内含子为100kb 比对阈值 选择物种 输出格式选择

Spidey输出结果 第一条蓝色序列为基因组序列,橘黄色为外显子 外显子对应于 基因组上的 mRNA/cDNA上的 起始/结束位置 供体、受体位点 外显子 长度 一致性 百分比 错配和gap 序号 序列联配结果

GENSCAN与Spidey结果比较 可能的选择性剪切体

课堂练习 练习两种预测剪切位点的软件的使用,NetGene2和Spidey。 Spidey的同源序列文件保存在c:\zcni\shixi2文件下,名字为Spidey.txt,使用写字板打开查看。

选择性剪切(Alternative splicing)分析 选择性剪接是调控基因表达的重要机制 了解不同物种、细胞、发育阶段、环境压力下基因的调控表达机制

选择性剪接的类型 选择性剪切的五种类型: 内含子保留. 5‘端选择性剪切位点. 3’端选择性剪切位点. 外显子遗漏. 互斥外显子.

查询选择性剪切相关的网站 从已知基因的功能推测剪切机制 综合 人 线虫 拟南芥 http://www.ebi.ac.uk/astd/main.html 综合 http://splicenest.molgen.mpg.de/ http://rulai.cshl.edu/new_alt_exon_db2/ http://prosplicer.mbc.nctu.edu.tw/ http://www.bit.uq.edu.au/altExtron 人 http://www.cse.ucsc.edu/~kent/intronerator/altsplice.html 线虫 http://www.tigr.org/tdb/e2k1/ath1/altsplicing/splicing_variations.shtml 拟南芥 http://splicenest.molgen.mpg.de :人,果蝇,拟南芥 48

选择性剪切查询:ASTD数据库 http://www.ebi.ac.uk/astd/main.html 输入基因名称 选择物种类型

ASTD数据库检索结果:基因描述信息 导出序列文件

ASTD数据库检索结果:选择性剪切的mRNA 十一种选择性剪切产物

ASTD数据库检索结果:表达的组织特异性 十一种不同的选择性剪切产物 在不同组织中各种选择性剪切体 的表达差异

Thanks!