Regulation of Gene Expression in Eukaryotes 第十九章 真核生物基因表达调控 Regulation of Gene Expression in Eukaryotes
1970年,猿猴病毒40(simian virus 40, SV40)的生命周期被确定为早、晚两个阶段,使它们成为基因表达调控的典型模型。 1975年D. Pribonow发现T7启动子序列。 1982年C. Benoist和P. Chambon揭示了SV40的早期启动子序列。 1983年,W.S. Dynan和R. Tjian分离、鉴定了真核转录因子AP1。 1986年,J.Clarke和Chambon两个实验室同时报告了SV40增强子的多功能元件组成。 1990年代,信号转导-基因转录偶联机制成为热点课题。
Control of Transcription Initiation 第一节 转录起始调控 Control of Transcription Initiation
基因表达的多级调控: 基因激活 转录起始 转录后加工 mRNA降解 蛋白质降解等 蛋白质翻译 翻译后加工修饰
基因转录激活调节基本要素: 基因的结构、性质 生物个体或细胞所处的内、外环境 细胞内所存在的转录调节蛋白
一、真核细胞基因调控区由启动子和调节DNA序列组成 真核细胞基因转录也受DNA转录起始位点附近的DNA调控序列控制。有些基因的调控区域结构简单,可被一个单一信号启动“开关”。但更多的基因调控区域结构复杂 对顺式作用元件-反式作用因子相互作用的各种信号进行解读,并整合所获信息来决定邻近基因的开与关 。
真核细胞顺式作用元件(cis-acting elements)包括启动子(promoter)、其它调控元件及特定的远隔序列 。 exon1 intron1 exon n intron n 上游 下游 转录起始点 增强子 沉默子 启动子 TATA盒 GC盒 CAAT盒
(一)近起始点的TATA盒/起始子及CpG岛是真核生物启动子的核心序列 真核细胞的启动子是包括转录起始点(transcription initiation site或transcription start site)在内的、有通用转录因子及RNA聚合酶组装、结合的一段DNA序列。 典型的启动子核心序列(core sequences)是在转录起始位点上游25~35 bp处,有一保守的TATA序列,被称为TATA盒(TATA box),真核细胞的TATA盒多为TATAAAA序列。TATA盒与原核细胞的启动子一样,对RNA聚合酶II的转录起始位点起定位作用。
一些真核细胞基因含有另一种启动子元件,称为起始子(initiator,Inr),决定启动子的强度。 起始子共有序列为:(5)Y-Y-A+1-N-T/A-Y-Y-Y(3);Y代表胞嘧啶C或胸腺嘧啶T,N代表任意碱基,T/A代表T或A。
有一些编码蛋白质基因的转录可有多个起始点,可产生含不同5末端的mRNA。 这些基因大多为低转录基因,编码中间代谢酶的管家基因。 它们不含TATA盒或起始子,多在起始位点上游约100 bp内含有2050个核苷酸的CG序列,被称做CpG岛(CpG island)。
(二)启动子中的上游元件协助真核基因调节 启动子上游元件(promoter-proximal elements, 或upstream promoter elements)是一些位于TATA盒上游的DNA序列,与调节蛋白结合,调节通用转录因子与TATA盒的结合、RNA聚合酶与启动子的结合,以及转录起始复合物的形成,从而决定基因的转录效率与专一性。 常见的序列是: GC盒(GC box) (GGGCGG) CAAT盒(CAAT box) (GCCAAT )
(三)远距离增强子促进RNA聚合酶II的转录 增强子(enhancer) 是能够结合特异基因调节蛋白,促进邻近或远隔特定基因表达的DNA序列;在酵母中,被称为上游活化序列(upstream activator sequences, UASs)。 增强子的作用通常与其所处的位置和方向无关。
很多哺乳动物基因受一个以上的增强子调控。 增强子所处位置 在所调控基因的上游或下游,但主要位于上游。下游内含子当中,乃至下游最后外显子以外的序列也可含有增强子。 增强子距转录起始位点的距离变化很大,从100 nt到50 000nt,甚至更大。但总是作用于最近的启动子。 很多哺乳动物基因受一个以上的增强子调控。
(四)沉默子可抑制基因的转录 负性调节元件——沉默子(silencer) 有部分基因含有负性调节元件,当其结合特异转录因子时,对基因转录起阻遏作用。 有些DNA序列既可以作为正性,又可以作为负性调节元件发挥顺式调节作用,这取决于细胞内存在的转录因子的性质。
二、转录因子是由不同的功能结构域构成的调节蛋白 转录因子(transcription factors) 基因调节蛋白(gene regulatory proteins) 反式作用因子(trans-acting factors) 转录调节因子 (transcription regulation factors)
大部分转录因子是活化基因转录,至少有两个不同的功能结构域: 转录因子分为: RNA聚合酶结合启动子所必需的一组蛋白质因子,为各类真核细胞所共有、通用,决定3种RNA转录的类别。 通用转录因子 特异转录因子 通过结合它的调节序列直接、或间接活化或阻遏特异基因的转录。 大部分转录因子是活化基因转录,至少有两个不同的功能结构域: DNA结合域(DNA-binding domain) 激活域(activation domain)
(helix-turn-helix,HTH) (一)转录因子含有不同的DNA结合域 螺旋-回折-螺旋是常见的DNA结合模体之一 螺旋-回折-螺旋 (helix-turn-helix,HTH) 同源异型域 (homeodomain,HD) 识别螺旋 DNA大沟 DNA小沟 螺旋1N-端 螺旋3
2. 锌指结构是一类含锌的DNA结合蛋白质模体 C2H2型锌指(Zinc finger)
反向平行β片层 Zn2+ α螺旋 DNA大沟
亮氨酸拉链(leucine zipper) 3. 亮氨酸拉链同时调节DNA结合与蛋白质二聚体化 Leu DNA大沟 亮氨酸拉链(leucine zipper)
(basic helix-loop-helix,bHLH) 4. 碱性螺旋-环-螺旋结构也可调节DNA结合及蛋白质二聚体化 碱性螺旋-环-螺旋 (basic helix-loop-helix,bHLH) bHLH双体 DNA大沟 螺旋 环
5. 片层也可识别DNA 在前面所述的DNA结合域中,至少一个-螺旋被插入DNA双螺旋的大沟中。但一些转录因子含有替代的结构,如-片层和环,它们特殊的氨基酸组成,可以识别DNA双螺旋分子大沟表面的特殊序列。
(二)转录因子也有蛋白质-蛋白质相互作用区域 亮氨酸拉链和bHLH的结构特点使它们易于形成同(源)或异(源)二聚体。异(源)二聚体(heterodimer)的形成增加了结构和功能的多样性。 转录因子的激活结构域通过与其它蛋白质结构域之间的相互作用,对启动子上通用转录因子与RNA聚合酶吸引、定位、以及修饰来提高转录起始效率。
真核细胞中较为常见的结构域是3种: 富含谷氨酰胺激活结构域(glutamine-rich activation domains) 富含脯氨酸激活结构域(proline-rich activation domains) 酸性氨基酸激活结构域(acidic activation domains)。
阻遏蛋白(repressor protein) 一些既有DNA结合域,也有与其它蛋白相互作用的抑制结构域。 也有一些基因阻遏蛋白没有DNA结合域,而是通过蛋白质-蛋白质间相互作用,调节基因激活蛋白及其它转录因子的作用。
三、真核细胞基因开关的分子机制比原核复杂 基本共同点:转录起始的调节是关键点 根本不同点: 原核生物:启动子在缺少转录因子情况下就具有天然活性 真核生物:强力启动子在缺少调节蛋白的情况下往往没有活性
真核细胞对基因表达起始的调控至少在下面几个方面与原核细胞存在不同: 真核细胞基因及其调控区域受到染色质结构的限制,转录的活化与转录调控区域、转录区域内染色质结构的诸多变化相关; 正性调节是主要形式。因此,在转录的基本状态受到制约的情况下,使得每个真核细胞基因需要活化才能被转录; 真核细胞有更大、更为复杂、种类更多的调节蛋白。单一启动子可以被分散在DNA分子上、数量近乎无限的调节序列所控制。
(一)基因活化蛋白质改变局部染色质结构 转录活化染色质与非活化染色质在结构上有很大不同。 异染色质(heterochromatin)是转录非活性的。 常染色质(euchromatin)中的转录活性区域对核酸酶敏感,特别是转录基因的5’-侧翼区1000 nt以内是高敏感位点(hypersensitive sites)。很多高敏感位点是调节蛋白质的结合序列,而这些区域核小体的相对缺少也使得这些蛋白质易于与之结合。
转录活化染色质与非活化染色质的组蛋白共价修饰的方式也不相同。 核小体的核心组蛋白(H2A,H2B,H3,H4)中赖氨酸残基的非可逆性甲基化,丝氨酸与苏氨酸残基的磷酸化,乙酰化以及泛素化多是转录活性染色质的特点。 真核细胞DNA的CpG序列(CpG岛)中的胞嘧啶被甲基化为5-甲基胞嘧啶是常见现象,但转录活性染色质区域胞嘧啶被甲基化的程度降低。
染色质重塑(chromatin remodeling) 基因活化蛋白质可以通过改变基因的启动子和调节序列区域的染色质结构来促进转录开始。这种改变局部染色质结构的过程被称为染色质重塑 。 最主要的两种方式: 组蛋白的共价修饰 核小体重塑(nucleosome remodeling)
染色质重塑
组蛋白乙酰化 时间:基因活化蛋白质结合在转录调节区域后。 位点:组蛋白乙酰化转移酶(histone acetyl transferases, HATs),也称组蛋白乙酰化酶(histone acetylase)主要作用于核小体的核心组蛋白所富含的赖氨酸残基,降低整个核小体对DNA的亲和性。
作用:使染色质进入转录活性状态乙;还可能促进或防止与其它转录或调节相关蛋白的相互作用。 逆转:组蛋白脱乙酰化酶(histone deacetylase)减少核小体的乙酰化,使染色质恢复转录非活性状态。
(二)基因活化蛋白质促进RNA聚合酶与通用转录因子在转录起始位点的组装 RNA聚合酶II与启动子的结合、启动转录需要诸多蛋白质因子的协同作用。这通常包括: ①基因活化蛋白质与增强子或UASs的结合; ②通用转录因子在启动子处的组装; ③辅助激活子(coactivator)和/或中介子(medicator)在通用转录因子/RNA聚合酶II复合物与基因活化蛋白质之间的辅助和中介作用。
基因活化蛋白质与增强子结合后,通过与全酶复合体中的中介子相互反应,使全酶复合体在空间上更接近启动子并有效组装。 此外,多数全酶复合体中缺少一些通用转录因子,如TFIID与TFIIA,它们需要在启动子处分别组装,最后形成稳定的转录起始复合物(transcription initiation complex),启动转录。
TATA盒 TF IID RNA聚合酶II 通用转录因子 转录方向 中介子 活化蛋白 增强子 DNA TF IIA
基因活化蛋白与增强子结合后如何影响到远距离的RNA聚合酶结合位点,有以下几种模式: ①扭曲(twisting) 通过扭曲作用使DNA链发生构型变化,更适合于通用转录因子与RNA聚合酶结合, 并通过直接接触或通过辅活化子/中介子而影响通用转录因子和RNA聚合酶的组装。
②滑动(sliding) 沿DNA滑动,直到接触另一个特异DNA序列结合的转录因子,发挥作用。 ③成环(looping) 利用DNA分子的柔曲性弯曲成环,使增强子区域与RNA聚合酶结合位点靠近,直接接触或通过辅活化子/中介子而发挥作用。
固醇类激素、甲状腺激素、维甲酸类激素等激素与细胞核内的特异性受体,即特异基因调节蛋白结合,形成的激素-受体复合物结合到DNA特定的基因调节序列——激素反应元件(hormone response elements, HREs),再通过与其它调节因子的相互作用,活化或抑制相邻基因的表达。
几种不同的激素反应元件 受体 共同结合序列* 雄激素(androgen) GG(A/T)ACAN2TGTTCT 糖皮质激素 (glucocorticoid) GGTACAN3TGTTCT 维甲酸 (retinoic acid) AGGTCAN5AGGTCA 维生素D (vitamin D) AGGTCAN3AGGTCA 甲状腺激素 (thyroid hormone) 类维生素A (retinoid X+) AGGTCANAGGTCANAGGTCANAGGTCA
(三)真核基因阻遏蛋白以各种方式抑制转录 真核细胞阻遏蛋白有更多可能的作用机制: ①结合沉默子或与基因活化蛋白竞争同一DNA调节序列; ②基因阻遏蛋白与基因活化蛋白分别与DNA调节序列结合,但阻遏蛋白通过与活性蛋白的基因活化区域相互作用,使后者不能发挥活化作用;
真核细胞阻遏蛋白有更多可能的作用机制: ③直接作用于通用转录因子; ④补给阻遏性染色质重塑复合体(repressive chromatin remodeling complexes); ⑤吸引组蛋白脱乙酰化酶。
Posttranscriptional Controls 第 三 节 转录后调控 Posttranscriptional Controls
一、真核细胞mRNA 5端加帽和3端多聚腺苷酸化修饰 除组蛋白外,所有真核细胞mRNA都有5端的“帽”和3端的poly(A)尾结构 。 5端的“帽”和3端的poly(A)尾均有其特有的作用。
5加帽的作用在于: ①有助于保护mRNA免于被核糖核酸酶降解;
poly(A)尾的作用: poly(A)尾可结合一种或多种特殊蛋白,避免mRNA被酶降解,并在翻译过程中具有重要作用。许多原核mRNA也含有poly(A)尾,但是此尾的功能是促进mRNA降解,而不是保护mRNA免于被降解。
二、选择性剪接可以使同一基因产生不同的蛋白质 许多初始转录本可以通过一种以上的选择性剪接(alternative RNA splicing)方式,去除不同的内含子而被加工形成不同的mRNAs,因而形成不同的多肽。
人视黄醛还原酶mRNA的选择性剪接 mRNA Pre-mRNA 同种异型mRNA
初始转录本含有所有选择性加工途径所需要的分子信号。 一种细胞偏好何种选择性加工途径取决于加工因子——RNA结合蛋白的特异性。 选择性剪接可以被正负调节分子调节: 负调节:抑制蛋白质可以通过与原始转录本的结合来防止剪接复合体切除内含子序列。 正调节:而不能正常剪接的剪接复合体可以在活化蛋白的帮助下发挥剪接功能。
三、RNA编辑可以改变RNA分子信息的内涵 某些mRNAs在翻译前被编辑(editing)。 结果:转录后编辑过程插入了4个U残基,从而改变了转录本的翻译读码框。 机制:尚不清楚。研究人员已经发现线粒体转录一类特殊的RNA分子,其3端有一段 poly(U), 其5端序列与mRNAs被编辑的区域互补,被称为引导RNA(guide RNA)。引导RNA可能作为编辑过程的模板,并将其3端的U转移给被编辑的mRNAs。
四、RNA的核外转运可以被调控 现象:估计有1/5的核内成熟mRNAs能进入细胞浆。留在核内的mRNAs约在1小时内降解。mRNA通过核膜的过程是一个主动运输过程,常常需要借助于核输出受体(nuclear export receptors)才可穿过9nm的核孔通道。 机制:调控RNA从核运输至细胞浆的机制还不很清楚。
五、一些RNA分子定位于细胞浆的特殊区域 现象:一些mRNA分子携带有信息,可以在翻译开始前自我导向定位于细胞内的特定位置。 作用:在细胞的特定部位集中产生所需要的大量蛋白质。
机制:导向信号存在于mRNA的3端非翻译区(3untranslated region, 3UTR)。 第一种情况 mRNA被连接在附着于细胞骨架上的动力蛋白(motor proteins)上,利用其水解ATP所提供的能量沿着骨架成分朝目的方向移动,最终在目的地被锚蛋白(anchor proteins)固定。 第二种情况 mRNA通过在细胞浆中的随机扩散,在其定位处被锚蛋白捕捉、固定。 第三种情况 mRNA在细胞浆中随机扩散并被不断地降解,只有碰上锚蛋白才能得到保护。
mRNA分子的3种不同定位过程
六、mRNA稳定性的改变也可调控基因表达 暂时需要的基因产物:半衰期可能仅为几分钟、甚至几秒钟。 经常需要的基因产物:其mRNA 可在多代细胞中稳定存在。
真核细胞mRNA降解有两种途径,是由每种mRNA分子的序列所决定。 poly(A)的逐渐短缩:最常见的途径 mRNA分子一旦进入细胞浆中,核酸外切酶会使poly(A)末端逐步短缩,当剩下约30个A时,5端发生脱帽,mRNA分子被迅速降解。 一些mRNA分子的3UTR的特殊序列有助于特殊蛋白质的结合,增加或降低poly(A)短缩的速度。
另一个途径始于特殊内切酶的作用 可将poly(A)直接从mRNA分子上切除。这种切除也有赖于mRNA分子的3UTR特殊序列可以被内切酶识别。 例如: 转铁蛋白受体(transferrin receptor, TfR) mRNA分子 3UTR柄环(stem-loop)结构——铁反应元件(iron-response element,IRE)。
低铁状态 高铁状态 IRE-BP对转铁蛋白受体mRNA稳定性的调节 转铁蛋白受体 mRNA 5’ 编码区 活化的IRE-BP 3’ poly(A)n 翻译 TfR蛋白 IRE 高铁状态 转铁蛋白受体 mRNA 5’ 编码区 铁 失活的IRE-BP 3’ poly(A)n mRNA降解 IRE IRE-BP对转铁蛋白受体mRNA稳定性的调节
七、细胞浆poly(A)的添加可以调节蛋白翻译 例:正在成熟中的卵母细胞与卵细胞 一些存在于细胞浆的mRNA分子的3′末端只有10-30个腺苷酸(A),它们并不翻译。在卵母细胞成熟和受精后的一个特定时段,当需要这些mRNA 所编码的蛋白质时,poly(A)被添加到这些选定的mRNA分子,大大促进它们翻译的开始。
八、无义变化介导的mRNA降解是真核细胞mRNA监视系统 (nonsense-mediated mRNA decay, NMD) 当在同一阅读框架内的翻译终止密码子UAA、UAG或UGA提前出现在最后两个外显子交界处上游约50 nt处时,mRNA被迅速降解。这些错位终止密码子被称为成熟前终止密码子(premature termination codons, PTC),可以来自突变、重组、不完全或不正确剪接。
无义变化介导的mRNA的降解
意义: 可以使某些异常的mRNA在被有效地翻译成蛋白质前得到清除 ,这个mRNA监视系统可以防止非正常截短的蛋白质的合成 。 NMD在进化过程中发挥了重要作用,使真核细胞更容易探究由于DNA重排、突变或不同剪接方式所形成的新基因。 免疫系统细胞的发育过程中也很重要,重排基因产生的这类mRNA被NMD系统迅速降解,避免了截短蛋白质的细胞毒作用。
九、RNA干涉可以使转录后的基因沉默 RNA干涉 在高等真核生物中发现有一类小RNAs (small RNAs)介导的特殊基因的沉默。这是由于此类小RNAs与mRNAs(经常是3UTR)相互作用,导致mRNA降解或者翻译抑制,使mRNA及其相应基因无法表达而沉默(silence)。 意义: 控制至少某些生物体的适时发育。它也是一种保护生物体免受RNA病毒侵袭和控制转座子活性的机制 。
miRNA 与siRNA使靶mRNA沉默机制 700bp左右RNA前体 配对碱基 DICER 20-25bpmRNA 5’ RISC 靶mRNA 未配对区域 靶mRNA降解 导入的双链RNA片段 siRNA RDE-1 靶mRNA被核酸内切酶切割 靶mRNA被核酸外切酶降解
第三节 翻 译 调 控 Translation Control
一、翻译起始因子的磷酸化调节蛋白质合成 条件变化活化了特殊的蛋白质激酶,使真核(翻译)起始因子eIF-2(eukaryotic initiation factor,eIF-2)磷酸化所致。
二、结合mRNA 5与3非转录区的蛋白质介导负翻译调控 一些转录抑制蛋白质结合到mRNA的5端抑制转录起始,而另一些抑制蛋白质则识别特殊mRNA分子的3UTR,通过干扰3poly(A)尾与5端帽的联络而减少翻译的起动。
IRE-BP对铁蛋白mRNA翻译的调节 低铁状态 高铁状态 5’ 铁蛋白mRNA 活化的IRE-BP 编码区 3’ 翻译不能进行 高铁状态 5’ 铁蛋白mRNA 失活的IRE-BP 铁 编码区 3’ 翻译
三、真核细胞mRNA翻译起始点也可被调控 易遗漏扫描:当不利于识别时,扫描的核糖体小亚基有时可以无视第一个AUG而滑向第二个,甚至第三个AUG,这种现象被称为易遗漏扫描(leaky scanning),可以使一个mRNA分子产生两个或更多仅氨基末端不同的相关的蛋白质。在一些情况下,细胞可以通过易遗漏扫描调节这些不同长度蛋白质的相对丰度。
上游开放阅读框架(upstream open reading frames , uORFs):在有些mRNA 分子中,起始密码子AUG的上游(5UTR)有一个或几个AUG,这些上游开放阅读框架与正常的开放阅读框架多不一致,翻译后很快会遇到终止密码子而释出无功能的多肽。 意义: 在于其调节功能,它们的AUG可以与正常起始密码子AUG竞争扫描核糖体起始复合物,翻译无功能的多肽而使正常翻译维持在较低水平。