第九章 真核生物基因的表达及其调控 真核生物基因的表达调控系统远比原核生物复杂。
原核生物 真核生物 真核生物与原核生物的调控差异 操纵元调控。 操纵元调控。 多样化调控,更为复杂。 基因组小,大肠杆菌:总长4.6×106bp, 编码4288个基因, 每个基因约1100bp。 基因组大,人类基因组全长3×109 bp,编码10万个基因,其余为重复序列。 基因分布在同一染色体上,操纵元控制。 DNA与组蛋白结合成染色质,染色质的变化调控基因表达;基因分布在不同的染色体上,存在不同染色体间基因的调控问题。 适应外界环境,操纵元调控表达。 基因差别表达是细胞分化和功能的核心。 转录和翻译同时进行,大部分为转录水平调控。 转录和翻译在时间和空间上均不同,从DNA到蛋白质的各层次上都有调控,但多数为转录水平调控
与原核生物比较,真核生物的基因组更为复杂,可列举如下: 一、真核基因组的复杂性 与原核生物比较,真核生物的基因组更为复杂,可列举如下: 真核基因组比原核基因组大得多,大肠杆菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍;大肠杆菌约有4000个基因,人则约有10万个基因。 真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等),这就增加了基因表达调控的层次和复杂性。
原核生物的基因组基本上是单倍体,而真核基因组是二倍体 ; 细菌多数基因按功能相关成串排列,组成操纵元的基因表达调控的单元,共同开启或关闭,转录出多顺反子(polycistron)的mRNA;真核生物则是一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有操纵元的结构,而真核细胞的许多活性蛋白是由相同和不同的多肽形成的亚基构成的,这就涉及到多个基因协调表达的问题,真核生物基因协调表达要比原核生物复杂得多。
原核基因组的大部分序列都为基因编码,而核酸杂交等实验表明:哺乳类基因组中仅约10%的序列为蛋白质、rRNA、tRNA等编码,其余约90%的序列功能至今还不清楚。 原核生物的基因为蛋白质编码的序列绝大多数是连续的,而真核生物为蛋白质编码的基因绝大多数是不连续的,即有外显子(exon)和内含子(intron),转录后需经剪接(splicing)去除内含子,才能翻译获得完整的蛋白质,这就增加了基因表达调控的环节。 原核基因组中除rRNA、tRNA基因有多个拷贝外,重复序列不多。哺乳动物基因组中则存在大量重复序列(repetitive sequences)。
从上述可见:真核基因组比原核基因组复杂得多,至今人类对真核基因组的认识还很有限,现在国际上制订的人基因组研究计划(human gene project)完成,绘出人全部基因的染色体定位图,测出人基因组109bp全部DNA序列后,要搞清楚人全部基因的功能及其相互关系,特别是要明了基因表达调控的全部规律,还需要经历很长期艰巨的研究过程。
二、真核基因表达调控的特点 与原核生物比较它具有一些明显的特点: (一)真核基因表达调控的环节更多 基因表达是基因经过转录、翻译、产生有生物活性的蛋白质的整个过程。同原核生物一样,转录依然是真核生物基因表达调控的主要环节。但真核基因转录发生在细胞核(线粒体基因的转录在线粒体内),翻译则多在胞浆,两个过程是分开的,因此其调控增加了更多的环节和复杂性,转录后的调控占有了更多的分量。
(二)真核基因的转录与染色质的结构变化相关 。 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中DNA和组蛋白的结构状态都影响转录,至少有以下现象: 1.染色质结构影响基因转录 2.组蛋白的作用:组蛋白与DNA结合阻止DNA上基因的转录,去除组蛋白基因又能够转录。组蛋白是碱性蛋白质,带正电荷,可与DNA链上带负电荷的磷酸基相结合,从而遮蔽了DNA分子,妨碍了转录,可能扮演了非特异性阻遏蛋白的作用;染色质中的非组蛋白成分具有组织细胞特异性,可能消除组蛋白的阻遏,起到特异性的去阻遏促转录作用。
3.转录活跃的区域也常缺乏核小体的结构。这些都表明核小体结构影响基因转录。 4.转录活跃区域对核酸酶作用敏感度增加。活跃进行转录的染色质区域受DNase Ⅰ消化常出现100-200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNase Ⅰ高敏感点(hypersensitive site)。这种高敏感点常出现在转录基因的5′侧区(5′ flanking region)、3′末端或在基因上,多在调控蛋白结合位点的附近,分析该区域核小体的结构发生变化,可能有利于调控蛋白 结合而促进转录。
5. DNA碱基修饰变化:真核DNA中的胞嘧啶约有5%被甲基化为5-甲基胞嘧啶(5methylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。这种甲基化最常发生在某些基因5′侧区的CG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录。如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的。
由此可见,染色质中的基因转录前先要有一个被激活的过程,但目前对激活机制还缺乏认识。 (三)真核基因表达以正性调控为主:真核RNA聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,需要依赖多种激活蛋白的协同作用。真核基因调控中虽然也发现有负性调控元件,但其存在并不普遍;真核基因转录表达的调控蛋白也有起阻遏和激活作用或兼有两种作用者,但总的是以激活蛋白的作用为主。即多数真核基因在没有调控蛋白作用时是不转录的,需要表达时就要有激活的蛋白质来促进转录。换言之:真核基因表达以正性调控为主导。
三、真核基因转录水平的调控 真核细胞的三种RNA聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有RNA聚合酶Ⅱ能转录生成mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控。 (一)顺式作用元件(cisacting elements) 真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。其中主要是起正性调控作用的顺式作用元件,包括启动子(promoter)、增强子(enhancer);近年又发现起负性调控作用的元件静止子(silencer)
1.启动子 与原核启动子的含义相同,是指RNA聚合酶结合并启动转录的DNA序列。但真核启动子间不像原核那样有明显共同一致的序列,而且单靠RNA聚合酶难以结合DNA而起动转录,而是需要多种蛋白质因子的相互协调作用,不同蛋白质因子又能与不同DNA序列相互作用,不同基因转录起始及其调控所需的蛋白因子也不完全相同,因而不同启动子序列也很不相同,要比原核更复杂、序列也更长。真核启动子一般包括转录起始点及其上游约100-200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件约长7-30bp。最常见的哺乳类RNA聚合酶Ⅱ启动子中的元件序列见表1。
哺乳类RNA聚合酶Ⅱ启动子中的元件序列 元件名称 共同序列 结合的蛋白因子 名称 分子量 结合DNA长度 TATAbox TATAAAA TBP 30,000 ~10bp GC box GGGCGG SP-1 105,000 ~20bp CAAT box GGCCAATCT CTF/NF1 60,000 ~22bp Octamer ATTTGCAT Oct-1 76,000 Oct-2 53,000 kB GGGACTTTCC NFkB 44,000 ATF GTGACGT AFT ? 20bp
启动子中的元件可以分为两种: ①核心启动子元件(core promoter element) 指RNA聚合酶起始转录所必需的最小的DNA序列,包括转录起始点及其上游-25/-30bp处的TATA盒。核心元件单独起作用时只能确定转录起始位点和产生基础水平的转录。
②上游启动子元件(upstream promoter element)包括通常位于-70bp附近的CAAT盒和GC盒、以及距转录起始点更远的上游元件。这些元件与相应的蛋白因子结合能提高或改变转录效率。不同基因具有不同的上游启动子元件,其位置也不相同,这使得不同的基因表达分别有不同的调控。
2.增强子 是一种能够提高转录效率的顺式调控元件,最早是在SV40病毒中发现的长约200bp的一段DNA,可使旁侧的基因转录提高100倍,其后在多种真核生物,甚至在原核生物中都发现了增强子。增强子通常占100-200bp长度,也和启动子一样由若干组件构成,基本核心组件常为8-12bp,可以单拷贝或多拷贝串连形式存在。增强子的作用有以下特点:
①增强子提高同一条DNA链上基因转录效率,可以远距离作用,通常可距离1-4kb、个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。 ②增强子作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒就不能起作用,可见增强子与启动子是很不相同的。
③增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。例如当含有增强子的病毒基因组整合入宿主细胞基因组时,能够增强整合区附近宿主某些基因的转录;当增强子随某些染色体段落移位时,也能提高移到的新位置周围基因的转录。使某些癌基因转录表达增强,可能是肿瘤发生的因素之一。
④增强子的作用机理虽然还不明确,但与其他顺式调控元件一样,必须与特定的蛋白质因结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有的特异性蛋白质因子所决定的。
3.静止子 最早在酵母中发现,以后在T淋巴细胞的T抗原受体基因的转录和重排中证实这种负调控顺式元件的存在。目前对这种在基因转录降低或关闭中起作用的序列研究还不多,但从已有的例子看到:静止子的作用可不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。
(二)反式作用因子(transacting factors) 由不同染色体上基因座位编码的、能直接或间接地识别或结合在各顺式作用元件8一12bP核心序列上并参与调控靶基因转录效率的这些结合蛋白.称作反式作用因子(trans—acting factor)。它们在转录调节中具有特殊的重要性。这类DNA结合蛋白有多种.能特异性识别这类蛋白的序列也有多种.正是不同的DNA结合蛋白与不同识别序列之间在空间结构上的相互作用,以及蛋白质与蛋白质之间的相互作用,构成了复杂的基因转录调控机制的基础。 研究得较多的反式作用因子有Spl、CTF、Ap—t、 Ap—2、 oct—1、oct—2等。
激素诱导模式:真核生物内的调控信号来自体内激素,这些可扩散的物质称反式作用因子。 五、基因转录后水平的调控 四、激素的调控作用: 激素诱导模式:真核生物内的调控信号来自体内激素,这些可扩散的物质称反式作用因子。 五、基因转录后水平的调控 (一)不同剪接方式可产生不同的mRNA: 组成型剪接、交替剪接、 组成型剪接:大多数前体mRNA都含有多个内含子,他们常被有序的逐一切除,形成一个由各外显子连接而成的成熟mRNA,这种剪接方式称~。
交替剪接(alternative splicing):来自同一个基因的前体mRNA中某个内含子5’端供点又可在特定条件下与另一个内含子的3’端受点进行剪接,从而删除这两个内含子及其中间的全部外显子和内含子。这样,一个前体mRNA就可因剪接方式不同产生多种mRNA,转译出多个不同蛋白质,这样的剪接方式称为交替剪接. 剪接方式有3类(P291) 类型1:不同5‘末端 交替剪接 类型2:不同3‘末端 类型3:不同剪接方式
六、基因翻译水平的调控 (二)RNA编辑: 定义:转录后的RNA在编码区发生碱基插入, 缺失或转换的现象。 1. 翻译多肽过程的调控: 意义:纠正某些移码突变;构建或删除起始密码子、终止密码子;增减核苷酸扩充遗传信息。 六、基因翻译水平的调控 1. 翻译多肽过程的调控: 真核生物的许多组织或细胞中,经转录mRNA受抑制不能翻译成多肽,以失活的状态贮存。如植物种子在发芽的早期阶段,虽没有mRNA 的合成,但有蛋白质的合成。海胆卵内mRNA在受精前不能进行翻译,受精后的蛋白质合成速率猛增。
调节机制: ①. mRNA加尾过程: 卵细胞中mRNA仅具有20个核苷酸的多聚A(polyA) 尾端序列,在生物发育适宜时期,尾端序列加长至几百个核苷酸序列,并翻译成蛋白质。 ②. 阻遏蛋白特异结合: 如铁蛋白的翻译调控:铁蛋白的功能是贮存铁。铁蛋白的mRNA翻译取决于铁的供应。当细胞没有铁时,阻遏蛋白与铁蛋白mRNA启动子区域铁反应元(iron response element,IRE)结合,阻止翻译进行;当有铁存在时,阻遏物不再与IRE结合,翻译顺利进行。
2. 蛋白质加工过程的调控: ⑴. 蛋白质的折叠: 蛋白质在一定的条件下(如伴蛋白chaperones 存在时),才能折叠成一定的空间构型并具有生物学功能。 ⑵. 蛋白酶的切割: ①. 末端切割:有些分泌蛋白对细胞有毒害作用,常以无活性的前体蛋白形式贮存在于细胞内,需要这种蛋白时,由蛋白酶切割加工成有功能的蛋白。如,蜜蜂在叮咬动物时注入蜜毒素,引起细胞溶解,蜜毒素也能使蜜蜂自身的细胞溶解。翻译后以前体形式储存于细胞内,能被细胞间隙的一种蛋白酶识别和切割,释放出有活性的蜜毒素。
又如,脊椎动物的胰岛素加工过程: 最初前胰岛素原有 105个氨基酸,加工中先将N端的24个氨基酸残基切除,形成前体胰岛素 又如,脊椎动物的胰岛素加工过程: 最初前胰岛素原有 105个氨基酸,加工中先将N端的24个氨基酸残基切除,形成前体胰岛素?然后切除中间一段氨基酸序列,留下21个氨基酸残基的A链和30个氨基酸残基的B链?由二硫键连接两条肽链。
②. 多聚蛋白质切割: 有些蛋白质开始翻译时形成一个含有多个蛋白质分子的多肽链,切割后产生具有不同功能的蛋白质分子。如,一些脊椎动物的激素合成。 ⑶. 蛋白质的化学修饰: ①. 简单修饰: 将一些小化学基团,如乙酰基、甲基和磷酸基加到氨基酸侧链或蛋白质的氨基端或羧基端上,具有特异性。 如核小体组蛋白H3的乙酰化,使染色质的构型发生变化,影响基因表达。
②. 复杂修饰: 蛋白质的糖基化(glycosylation):一些大分子量碳水化合物加到多肽链上。 ⑷. 蛋白质内含子: 同mRNA一样,一些前体蛋白质具有内含子(intein)序列,位于多肽序列的中间?经加工切除后,两端的蛋白质外显子 (extein)连接为成熟蛋白质分子。
特点: ①. 切割位点保守: 内含子前面常为半胱氨酸,后面序列是组氨酸-天门冬酰胺;内含子后面外显子序列的前面常是半胱氨酸、丝氨酸和苏氨酸;存在一些保守序列。 ②. 具有自动切割加工能力: 如果蝇胚胎发育的内含子蛋白(Hedgehog)。 ③. 蛋白质内含子片段具有核酸内切酶活性:杂合体中,无内含子的DNA序列,经内含子的切割跳跃 而成为纯合子。