真核生物基因 表达的调控
真核生物和原核生物由于基本生活方式不同所决定基因表达调控上的巨大差别。 原核生物的调控系统就是要在一个特定的环境中为细胞创造高速生长的条件,或使细胞在受到损伤时,尽快得到修复,所以,原核生物基因表达的开关经常是通过控制转录的起始来调节的。 真核生物(除酵母、藻类和原生动物等单细胞类之外)主要由多细胞组成,每个真核细胞所携带的基因数量及总基因组中蕴藏的遗传信息量都大大高于原核生物。人类细胞单倍体基因组就包含有3×109bp总DNA,约为大肠杆菌总DNA的1000倍,是噬菌体总DNA的10万倍左右!
真核基因表达调控的最显著特征是能在特定时间和特定的细胞中激活特定的基因,从而实现"预定"的、有序的、不可逆转的分化、发育过程,并使生物的组织和器官在一定的环境条件范围内保持正常功能。
真核生物基因调控,根据其性质可分为两大类: 真核生物基因调控,根据其性质可分为两大类: 第一类是瞬时调控或称可逆性调控,它相当于原核细胞对环境条件变化所做出的反应,包括某种底物或激素水平升降及细胞周期不同阶段中酶活性和浓度的调节。 第二类是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的全部进程。
在真核生物中基因表达的调节其特点是: (1)多层次; (2)无操纵子和衰减子; (3)个体发育复杂; (4)受环境影响较小;
研究基因调控主要应回答3个问题: ① 什么是诱发基因转录的信号? ② 基因调控主要是在哪一步(模板DNA的转录、mRNA的成熟或蛋白质合成)实现的? ③ 不同水平基因调控的分子机制是什么?
真核基因组的一般构造特点 ① 在真核细胞中,一条成熟的mRNA链只能翻译出一条多肽链,不存在原核生物中常见的多基因操纵子形式。 ② 真核细胞DNA都与组蛋白和大量非组蛋白相结合,只有一小部分DNA是裸露的。 ③ 高等真核细胞DNA中很大部分是不转录的,大部分真核细胞的基因中间还存在不被翻译的内含子。 ④ 真核生物能够有序地根据生长发育阶段的需要进行DNA片段重排,还能在需要时增加细胞内某些基因的拷贝数。
⑤ 在真核生物中,基因转录的调节区相对较大,它们可能远离启动子达几百个甚至上千个碱基对,这些调节区一般通过改变整个所控制基因5‘上游区DNA构型来影响它与RNA聚合酶的结合能力。
⑥ 真核生物的RNA在细胞核中合成,只有经转运穿过核膜,到达细胞质后,才能被翻译成蛋白质,原核生物中不存在这样严格的空间间隔。 ⑦ 许多真核生物的基因只有经过复杂的成熟和剪接过程(maturation and splicing),才能顺利地翻译成蛋白质。
基因的典型结构及特点 (1)染色体结构复杂 由DNA、组蛋白、非组蛋白等大分子组成。 其基本结构物质是DNA和组蛋白。 核小体是染色质的基本单位。 真核染色体上三要素: DNA复制起始点、着丝点(centromere)和端粒(telomere)。
(2) DNA顺序重复 轻度、中度、高度重复序列三种: 轻度重复序列:单拷贝基因;一个基因组中有一个或几个拷贝的序列;例如结构基因基本上属于不重复序列,如蛋清蛋白、蚕的丝心蛋白等。 中度重复序列:l0个至几百个拷贝的序列;各种rRNA、tRNA及某些结构蛋白基因(如组蛋白基因)。 高度重复序列:从几百到几百万个,通常说的卫星DNA就属于高度重复序列。 重复序列的存在是真核生物DNA区别于原核生物DNA的一个重要特征。
(3) 基因不连续性(interrupted gene) 基因的编码序列在DNA分子上是不连续的,为不编码的序列所隔开。 不连续基因是通过mRNA和DNA杂交试验发现的。 外显子(exon):编码序列 内含子(intron):非编码序列 外显子和内含子的概念与是否编码氨基酸的概念并不相对应。 从不连续基因到成熟mRNA之间存在着一个基因转录的中间体,叫做初级转录物,叫做不均一核RNA(heterogeneous nuclear RNA, hnRNA), 这个基因的初级转录物既含有外显子又含有内合子序列, 从不均一核RNA到成熟mRNA要经过一转录后的加工拼接过程。 真核生物基因的不连续性和转录后加工是真核基因有别于原核基因的又一重要特征。
在真核生物中也有些基因是不含内含子的,如组蛋白基因及α型、β型干扰素基因 、大多数酵母蛋白基因等。 在一个结构基因中,编码某一蛋白质不同区域的各个外显子并不连续排列在一起,而常常被长度不等的内含子所隔离,形成镶嵌排列的断裂方式。所以,真核基因有时被称为断裂基因(interrupted gene)。 目前尚不清楚内含子的生理功能。研究发现,只有真核生物具有切除基因中内含子,产生功能型mRNA和蛋白质的能力,原核生物一般不具有这种本领。 如果要在原核细胞里表达真核基因,必须首先构建切除内含子的重组基因,才有可能得到所研究的蛋白质。
(4) 存在许多基因家族(gene family) 来源相同、结构相似、功能相关的基因组成为单一的基因簇或称基因家族。 同一家族中的成员有时紧密地排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同的染色体上,具有各自不同的表达调控模式。
简单多基因家族 简单多基因家族中的基因一般以串联方式前后相连。在大肠杆菌中,16S,23S和5S rRNA基因联合成一个转录单位,各种rRNA分子都是从这个转录单位上剪切下来的。 在真核生物中,前rRNA转录产物的分子量为45S,包括18S,28S和5.8S三个主要rRNA分子。前rRNA分子中至少有100处被甲基化(主要是核糖的2-OH甲基化),原始转录产物也被特异性RNA酶切割降解,产生成熟rRNA分子。5S rRNA作为一个独立的转录单位,由RNA聚合酶III(而不是聚合酶I)完成转录。
复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。现已发现存在不同形式的复杂多基因家族。 复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。现已发现存在不同形式的复杂多基因家族。 海胆的组蛋白基因家族 串联单位中的每一个基因分别被转录成单顺反子RNA,这些RNA都没有内含子,而且各基因在同一条DNA链上按同一方向转录,每个基因的转录与翻译速度都受到调节。 研究还表明,在一个特定的细胞中,并不是所有串联的单位都得到转录。胚胎发育的不同阶段或不同组织中,有不同的串联单位被转录,暗示可能存在具有不同专一性的组蛋白亚类和发育调控机制。
(5)存在串联重复基因 其特点是各成员之间有高度的序列一致性甚至完全相同,拷贝数高、非转录的间隔区短而一致。组蛋白基因、rRNA基因、tRNA基因都是串联重复基因,这些基因的产物在细胞中都是大量需要的。
真核生物DNA水平上的基因表达调控 分子生物学的最新研究表明,在个体发育过程中,用来合成RNA的DNA模板也会发生规律性变化,从而控制基因表达和生物体的发育。 高度重复基因的形成通常与个体分化阶段DNA的某些变化有关。例如,一个成熟的红细胞能产生大量的可翻译出成熟珠蛋白的mRNA,而其前体细胞却不产生珠蛋白。许多情况下,这种变化是由于基因本身或它的拷贝数发生了永久性变化。 这种DNA水平的调控是真核生物发育调控的一种形式,它包括了基因丢失、扩增、重排和移位等方式,通过这些方式可以消除或变换某些基因并改变它们的活性。这些调控方式与转录及翻译水平的调控是不同的,因为它使基因组发生了改变。
“开放”型活性染色质(active chromatin)结构对转录的影响 真核基因的活跃转录是在常染色质上进行的。转录发生之前,染色质常常会在特定的区域被解旋松弛,形成自由DNA。这种变化可能包括核小体结构的消除或改变,DNA本身局部结构的变化等,这些变化可导致结构基因暴露,促进转录因子与启动区DNA的结合,诱发基因转录。 用DNA酶I处理各种组织的染色质时,发现处于活跃状态的基因比非活跃状态的DNA更容易被DNA酶I所降解。 鸡成红细胞(erythroblast)染色质中,β-血红蛋白基因比卵清蛋白基因更容易被DNA酶I切割降解。 鸡输卵管细胞的染色质中被DNA酶I优先降解的是卵清蛋白基因,而不是β-血红蛋白基因。
基因扩增 基因扩增是指某些基因的拷贝数专一性大量增加的现象,它使细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。 1 . 基因的扩增(amplification) 两栖类和昆虫卵母细胞rRNA基因的扩增非洲爪蟾的染色体上有约450拷贝编码18Sr RNA和28S rRNA的DNA,在卵母细胞中它们的拷贝数扩大了1000倍.一旦卵母细胞成熟,多余的rDNA就没有用了,将被逐渐降解。受精之后,染色体DNA开始复制,并通过有丝分裂的方式,不断扩大细胞群体。在此期间,多余的rDNA继续被降解,直到分裂产生几百个细胞时,rDNA的过剩现象就不复存在了。
基因重排 将一个基因从远离启动子的地方移到距它很近的位点从而启动转录,这种方式被称为基因重排。
V、C和J基因片段在胚胎细胞中相隔较远。编码产生免疫球蛋白的细胞发育分化时,通过染色体内DNA重组把4个相隔较远的基因片段连接在一起,从而产生了具有表达活性的免疫球蛋白基因。
DNA甲基化与基因活性的调控 DNA甲基化是最早发现的修饰途径之一,这一修饰途径可能存在于所有高等生物中并与基因表达调控密切相关。 DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。研究证实,CpG二核苷酸中胞嘧啶的甲基化导致了人体1/3以上由于碱基转换而引起的遗传病。 DNA甲基化修饰现象广泛存在于多种有机体中。 实验证明,这个过程不但与DNA复制起始及错误修正时的定位有关,还通过改变基因的表达参与细胞的生长、发育过程及染色体印迹、X染色体失活等的调控。
DNA的甲基化 DNA甲基化主要形成5-甲基胞嘧啶(5-mC)和少量的N6-甲基腺嘌呤(N6-mA)及7-甲基鸟嘌呤(7-mG)。 在真核生物中,5-甲基胞嘧啶主要出现在CpG序列、CpXpG、CCA/TGG和GATC中。因为高等生物CpG二核苷酸序列中的C 通常是甲基化的,极易自发脱氨,生成胸腺嘧啶。 由于这些CpG二核苷酸通常成串出现在DNA上,这段序列往往被称为CpG岛。
DNA甲基化抑制基因转录的机理 DNA甲基化导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,抑制了转录因子与启动区DNA的结合效率。 研究表明,当组蛋白H1与含CCGG序列的甲基化或非甲基化DNA分别形成复合体时,DNA的构型存在着很大的差别,甲基化达到一定程度时会发生从常规的B-DNA向Z-DNA的过渡。由于Z-DNA结构收缩,螺旋加深,使许多蛋白质因子赖以结合的元件缩入大沟而不利于基因转录的起始。 有实验用序列相同但甲基化水平不同的DNA为材料,比较其作为RNA聚合酶转录模板的活性,发现甲基的引入不利于模板与RNA聚合酶的结合,降低了其体外转录活性。
5-甲基胞嘧啶在DNA上并不是随机分布的,基因的5' 端和3' 端往往富含甲基化位点,而启动区DNA分子上的甲基化密度与基因转录受抑制的程度密切相关。对于弱启动子来说,稀少的甲基化就能使其完全失去转录活性。当这一类启动子被增强时(带有增强子),即使不去甲基化也可以恢复其转录活性。若进一步提高甲基化密度,即使增强后的启动子仍无转录活性。因为甲基化对转录的抑制强度与MeCPl(methyl CpG-binding protein l)结合DNA的能力成正相关,甲基化CpG的密度和启动子强度之间的平衡决定了该启动子是否具有转录活性。
DNA甲基化与X染色体失活 X染色体失活是发育过程中独特的调节机制。 雌性胎生哺乳类动物细胞中两条X染色体之一在发育早期随机失活,以确保与只有一条X染色体的雄性个体内X染色体基因的剂量相同。一旦发生X染色体失活,这个信息便能够稳定地传递给子代细胞,使该细胞有丝分裂所产生的后代都保持同一条X染色体失活。
真核基因的转录 真核基因调控主要也是在转录水平上进行的,受大量特定的顺式作用元件(cis-acting element,又称顺式作用元件)和反式作用因子(trans-acting factor,又称跨域作用因子)的调控,真核生物的转录调控大多数是通过顺式作用元件和反式作用因子复杂的相互作用来实现的。 顺式元件: (1) 核心启动子成分,如TATA框; (2)上游启动子成分,如CAAT框,GC框; (3)远上游顺序 :如增强子,酵母的UAS( upstream activator sequences)等。 (4)特殊细胞中的启动子成分:如淋巴细胞中的 Oct(octamer)和κB。
一个完整的基因,不但包括编码区(coding region),还包括5’和3’端长度不等的特异性序列,它们虽然不编码氨基酸,却在基因表达的过程中起着重要作用。所以,“基因”的分子生物学定义是:产生一条多肽链或功能RNA所必需的全部核苷酸序列。
增强子是指能使和它连锁的基因转录频率明显增加的DNA序列。作为基因表达的重要调节元件,增强子通常具有下列性质: 增强子及其对转录的影响 增强子是指能使和它连锁的基因转录频率明显增加的DNA序列。作为基因表达的重要调节元件,增强子通常具有下列性质: 1、增强效应十分明显,一般能使基因转录频率增加10-200倍。 2、增强效应与其位置和取向无关,不论增强子以什么方向排列(5'→3'或3'→5'),甚至和基因相距3 kb,或在基因下游,均表现出增强效应; 3、大多为重复序列,一般长约50bp,适合与某些蛋白因子结合。其内部常含有一个核心序列:(G)TGGA/TA/TA/T(G),是产生增强效应时所必需的; 4、 增强效应有严密的组织和细胞特异性,说明只有特定的蛋白质(转录因子)参与才能发挥其功能; 5、 没有基因专一性,可以在不同的基因组合上表现增强效应; 6、 许多增强子还受外部信号的调控,如金属硫蛋白的基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应。 direction of transcription 5′ Enhancer Gene Enhancer Enhancer 3′
增强子的作用原理是什么呢? 增强子可能有如下3种作用机制: ①影响模板附近的DNA双螺旋结构,导致DNA双螺旋弯折或在反式因子的参与下,以蛋白质之间的相互作用为媒介形成增强子与启动子之间“成环”连接,活化基因转录; ②将模板固定在细胞核内特定位置,如连接在核基质上,有利于DNA拓扑异构酶改变DNA双螺旋结构的张力,促进RNA聚合酶II在DNA链上的结合和滑动; ③增强子区可以作为反式作用因子或RNA聚合酶II进入染色质结构的“入口”。
增强子的功能是可以累加的。SV40增强子序列可以被分为两半,每一半序列本身作为增强子功能很弱,但合在一起,即使其中间插入一些别的序列,仍然是一个有效的增强子。因此,要使一个增强子失活必须在多个位点上造成突变。对SV40增强子而言,没有任何单个的突变可以使其活力降低10倍。
反式作用因子 ①参与所有或某些转录阶段的RNA聚合酶亚基,不具有基因特异性。 ②与转录的起始或终止有关的辅助因子,不具有基因特异性。 真核生物启动子和增强子是由若干DNA序列元件组成的,由于它们常与特定的功能基因连锁在一起,因此被称为顺式作用元件。这些序列组成基因转录的调控区,影响基因的表达。在转录调控过程中,除了需要调控区外,还需要反式作用因子。 一般认为,如果某个蛋白是体外转录系统中起始RNA合成所必需的,它就是转录复合物的一部分。根据各个蛋白成分在转录中的作用,能将整个复合物分为3部分: 反式作用因子是能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与调控靶基因转录效率的蛋白质。 ①参与所有或某些转录阶段的RNA聚合酶亚基,不具有基因特异性。 ②与转录的起始或终止有关的辅助因子,不具有基因特异性。 ③与特异调控序列结合的转录因子。它们中有些被认为是转录复合物的一部分,因为所有或大部分基因的启动区都含有这一特异序列。更多的则是基因或启动子特异性结合调控蛋白,它们是起始某个(类)基因转录所必需的。
反式作用因子可以分为3类; (1) 通用反式作用因子,主要识别启动子的核心启动成分,如TBP; (2)特殊组织与细胞中的反式作用因子,如淋巴细胞中的Oct-2; (3)和反应性元件(response elenents)相结合的反式作用因子。 如HSE(热休克反应元件,heat shock response element), GRE(糖皮质激素反应元件glucocorticoid response element); MRE(金属反应元件,metal response element); TRE(肿瘤诱导剂反应元件,tumorgenic agent response element);
(一) 蛋白质直接和DNA结合 螺旋转角螺旋 锌指结构 亮氨基拉链 螺旋环螺旋 同源异形结构域
1. 螺旋转角螺旋(Helix-turn-helix,HTH): 最初在λ噬菌体的阻遏蛋白中发现的一种DNA结合结构域。 在阻遏蛋白氨基端有5段α螺旋,每段螺旋之间折转成一定角度相连接,其中两段负责同DNA结合。 α螺旋3由9个氨基酸组成,与前面的由7个氨基酸组成的。螺旋2形成一个角度。α螺旋3通过氨基酸侧链同DNA碱基之间的氢键同DNA序列相结合,所以,螺旋α被称为识别螺旋(recognition helix)。 螺旋2则是通过氢键同DNA的磷酸骨架相接触。这种相互作用对于同DNA结合是必需的,但并不控制对靶序列识别的专一性。
2.锌指结构(zinc fimger) 是一个蛋白质结构域,由重复的半胱氨酸和组氨酸或重复的半胱氨酸在一个金属锌离子四周形成一个四面体的排列。长约30个aa,其中4个氨基酸(Cys或2个Cys,两个His)与一个Zinc原子相结合。与Zinc结合后锌指结构较稳定。
最初是在爪蟾(Xenopus laevis)的RNA聚合酶III转录因子(TFIIIA)中发现的。9个串联重复的锌指区组成,每个单位大约由30个氨基酸残基组成。 基序因在锌结合位点上突出的氨基酸环的形状如同手指,所以称为“指状”结构。这种蛋白质结构域是同DNA或RNA结合的部位。 单个的锌指保守序列是:Cys-X2-4-Cys-X3-Phe-X5- Leu-X2-His-X2-His 这里x2、x5代表2个和5个任何一种氨基酸残基。根据锌指结构中与锌配位的半胱氨酸(C)和组氨酸(H)的数目和位置,可将指状结构分为2类。 Ⅰ型: 2Cys/2His : TF IIIA, SP1 Ⅱ型: 2cys/2cys : GAL4
3. 亮氨酸拉链 亲脂性(amphipathic)的α螺旋,包含有许多集中在螺旋一边的疏水氨基酸,两条多肽链以此形成二聚体。每隔6个残基出现一个亮氨酸。由赖氨酸(Lys)和精氨酸(Arg)组成DNA结合区。 (Leucine ziipper) 同二聚体(honwdimers) 异二聚体(hefercdimers) C-Jun,C-Fos,Myc ,
亮氨酸是疏水性氨基酸,排列在双螺旋的一侧,所有带电荷的氨基酸残基排在另一侧。当2个蛋白质分子平行排列时,亮氨酸之间相互作用形成二聚体,形成“拉链” 。 由于这类蛋白质都以二聚体形式与DNA结合,两个蛋白质α螺旋上的亮氨酸一侧是形成拉链型二聚体的基础。然而,亮氨酸拉链区并不能直接结合DNA,只有肽链氨基端20~30个富含碱性氨基酸结构域与DNA结合。 在“拉链”式的蛋白质分子中,亮氨酸以外带电荷的氨基酸形式同DNA结合。不形成二聚体,该碱性区对DNA的亲和力明显降低。所以,这类蛋白质的DNA结合结构域实际是以碱性区和亮氨酸拉链结构域整体作为基础的。
4. 螺旋一环一螺旋(HLH) 该调控区长约50个aa残基,同时具有DNA结合和形成蛋白质二聚体的功能,其主要特点是可形成两个亲脂性α-螺旋,两个螺旋之间由环状结构相连,其DNA结合功能是由一个较短的富碱性氨基酸区所决定的。 在HLH中带有碱性区的肽链称为 碱性HLH(bHLH,protein)。 bHLH又分为两类。 A类是可以广泛表达的蛋白,包括哺乳动物的E12/E47(可和免疫球蛋基因增强子中的元件结合)和果蝇da(daughterless,性别控制的总开关基因)的产物; B类是组织特异性表达的蛋白,包括哺乳动物的MyoD(肌浆蛋白(myogen)基因的转录因子 果蝇的AC-S(achaete-scute 无刚毛基因的产物)
DNA结合蛋白的共同特性: (1)具有一些与DNA结合的螺旋区, (2)能形成二聚体, (3)有一个共同的基序。 基序由40—50个氨基酸组成,含有2个两亲的(amphipathic,既有极性基也有非极性基)螺旋,由2个长度不等的连接区(环)相连。 通过两条螺旋对应位置上的疏水性氨基酸残基之间的相互作用,可以生成同源二聚体或异源二聚体。每个螺旋区长15一16个氨基酸,其中有几个氨基酸残基是保守的。两个螺旋区之间的环使两个螺旋区可以彼此独立地相互作用。
English Review: Control Of Expression In Eukaryotes Eukaryotic genes are controlled individually and each gene has specific control sequences preceding the transcription start site
Eukaryotes Have Large Complex Geneomes The human genome is about 3 x 109 base pairs or ≈ 1 m of DNA Because humans are diploid, each nucleus contains 6 x 109 base pairs or ≈ 2 m of DNA That is a lot to pack into a little nucleus!
Eukaryotic DNA Must be Packaged Eukaryotic DNA exhibits many levels of packaging The fundamental unit is the nucleosome, DNA wound around histone proteins Nucleosomes arrange themselves together to form higher and higher levels of packaging.
Highly Packaged DNA Cannot be Expressed The most highly packaged form of DNA is “heterochromatin” Heterochromatin cannot be transcribed, therefore expression of genes is prevented Chromosome puffs on some insect chomosomes illustrate where active gene expression is going on
Only a Subset of Genes is Expressed at any Given Time It takes lots of energy to express genes Thus it would be wasteful to express all genes all the time By differential expression of genes, cells can respond to changes in the environment Differential expression, allows cells to specialize in multicelled organisms. Differential expression also allows organisms to develop over time.
Control of Gene Expression DNA Cytoplasm Nucleus Nuclear pores Packaging Degradation RNA Transcription Modification Ribosome Translation Transportation G AAAAAA RNA Processing mRNA Degradation etc. G AAAAAA G AAAAAA Export
Logical Expression Control Points DNA packaging Transcription RNA processing mRNA Export mRNA masking/unmasking and/or modification mRNA degradation Translation Protein modification Protein transport Protein degradation Increasing cost The logical place to control expression is before the gene is transcribed
A “Simple” Eukaryotic Gene Transcription Start Site 3’ Untranslated Region 5’ Untranslated Region Introns 5’ 3’ Exon 1 Int. 1 Exon 2 Int. 2 Exon 3 Terminator Sequence Exons Promoter/ Control Region RNA Transcript
Enhancers 5’ 3’ 3’ 5’ TF TF 3’ 5’ TF Many bases DNA Enhancer Promoter Transcribed Region TF 3’ 5’ TF TF 3’ 5’ TF RNA Pol. 5’ RNA Pol.
Eukaryotic mRNA RNA processing achieves three things: G 5’ 3’ 5’ Untranslated Region 3’ Untranslated Region 5’ G 3’ Exon 1 Exon 2 Exon 3 AAAAA Protein Coding Region 5’ Cap 3’ Poly A Tail RNA processing achieves three things: Removal of introns Addition of a 5’ cap Addition of a 3’ tail
Regulation of Gene Expression Six steps at which eucaryotic gene expression can be regulated. NUCLEUS CYTOSOL inactive mRNA mRNA degradation control DNA RNA transcript mRNA mRNA transcriptional control RNA processing control RNA transport and localization control translation control protein protein activity control inactive protein
Translational control In principle, every step required for the process of gene expression could be controlled. Predominant form: Control of initiation of transcription.
1. Transcriptional Initiation: This is the most important mode for control of eukaryotic gene expression. promoter elements : enhancer sequences can enhance the activity of RNA polymerase at a given promoter by binding specific transcription factors.
2. Transcript Processing and Modification: Eukaryotic mRNAs must be capped and polyadenylated, and the introns must be accurately removed. Several genes have been identified that undergo tissue-specific patterns of alternative splicing, which generate biologically different proteins from the same gene.
3. RNA Transport: A fully processed mRNA must leave the nucleus in order to be translated into protein. 4. Transcript Stability: Unlike prokaryotic mRNAs, whose half-lives are all in the range of 1--5 minutes, eukaryotic mRNAs can vary greatly in their stability. Certain unstable transcripts have sequences that are signals for rapid degradation.
5. Translational Initiation: Since many mRNAs have multiple methionine codons, the ability of ribosomes to recognize and initiate synthesis from the correct AUG codon can affect the expression of a gene product. Several examples have emerged demonstrating that some eukaryotic proteins initiate at non-AUG codons. This phenomenon has been known to occur in E. coli for quite some time, but only recently has it been observed in eukaryotic mRNAs.
6. Post-Translational Modification: Common modifications include glycosylation, acetylation, fatty acylation, disulfide bond formations, etc. 7. Protein Transport: proteins must be biologically active following translation and processing, they must be transported to their site of action. 8. Control of Protein Stability: Many proteins are rapidly degraded, whereas others are highly stable. Specific amino acid sequences in some proteins have been shown to bring about rapid degradation
Control of Eukaryotic Transcription Initiation Transcription of the different classes of RNAs in eukaryotes is carried out by three different polymerases. RNA pol I synthesizes the rRNAs, except for the 5S species. RNA pol II synthesizes the mRNAs and some small nuclear RNAs (snRNAs) involved in RNA splicing. RNA pol III synthesizes the 5S rRNA and the tRNAs. The vast majority of eukaryotic RNAs are subjected to post-transcriptional processing.
The most complex controls observed in eukaryotic genes are those that regulate the expression of RNA pol II-transcribed genes, the mRNA genes. Almost all eukaryotic mRNA genes contain a basic structure consisting of coding exons and non-coding introns and basal promoters of two types and any number of different transcriptional regulatory domains.
The basal promoter elements are termed CCAAT-boxes and TATA-boxes because of their sequence motifs. The TATA-box resides 20 to 30 bases upstream of the transcriptional start site and is similar in sequence to the prokaryotic Pribnow-box (consensus TATAT/AAT/A, where T/A indicates that either base may be found at that position).
Structural Motifs in Eukaryotic Transcription Factors Homeodomain: The homeodomain is a highly conserved domain of 60 amino acids found in a large family of transcription factors. This family was first identified in Drosophila as a group of genes that, when altered, would cause transformations of one body part for another , so called homeotic transformations. This class of genes has been identified in both invertebrate and vertebrate organisms. The homeodomain itself forms a structure highly similar to the bacterial helix-turn-helix proteins. The principal function of all homeodomain containing proteins is in the establishment of pattern in an organism such as that of the spinal column in vertebrates.
Helix-Loop-Helix (HLH): The HLH domain is involved in protein dimerization. The HLH motif is composed of two regions of a-helix separated by a region of variable length which forms a loop between the 2 alph-helices. This motif is quite similar to the Helix-turn-helix motif found in several prokaryotic trascription factors such as the CRP protein involved in the regulation of the lac operon.
The a-helical domains are structurally similar and are necessary for protein interaction with sequence elements that exhibit a twofold axis of symmetry. This class of transcription factor most often contains a region of basic amino acids located on the N-terminal side of the HLH domain (termed bHLH proteins) that is necessary in order for the protein to bind DNA at specific sequences.
Zinc Fingers: The zinc finger domain is a DNA-binding motif consisting of specific spacings of cysteine and histidine residues that allow the protein to bind zinc atoms. The metal atom coordinates the sequences around the cysteine and histidine residues into a finger-like domain. The finger domains can interdigitate into the major groove of the DNA helix.
The spacing of the zinc finger domain in this class of transcription factor coincides with a half-turn of the double helix. The classic example is the RNA pol III transcription factor, TFIIIA. Proteins of the steroid/thyroid hormone family of transcription factors also contain zinc fingers.