真核生物基因的转录
一、真核生物基因转录概述 (一)真核生物的转录和原核生物转录的不同点: 1、原核细胞只有一种RNA聚合酶,而真核细胞 有三种聚合酶; 2、启动子的结构特点不同,真核基因有三种不 同的启动子和有关的元件; 3、真核基因的转录有很多蛋白质因子的介入。
(二)真核生物RNA聚合酶(三种) 类型 转录产物 对鹅膏蕈碱的反应 Ⅰ rRNA:18s,5.8s,28s 不敏感 高度敏感 Ⅱ hnRNA RNApolⅡ的产物种类很多,大小不一 包括 前mRNA、snRNA RNApol Ⅰ位于核仁, RNApol Ⅱ、Ⅲ位于核质 tRNA,5srRNA,snRNA 不同物种敏感性不同 Ⅲ
(三)真核生物RNA 聚合酶(RNA Pol II) 由8~14个亚基组成,分子质量为500KDa 250KDa 与模板结合;与转录起始、延伸有关 与DNA、底物和新生的RNA结合 负责酶的装配 130KDa 250KDa亚基相当于原核RNA Pol的β′亚基 130KDa亚基相当于原核RNA Pol的β亚基 三种RNApol的两个大亚基具有同源性 说明同源序列对于聚合功能的重要性 40KDa亚基相当于原核RNA Pol的α亚基 至少有5种小亚基是三种聚合酶共有的 有4~7种亚基是某一特定RNA聚合酶所特有的 40KDa 40KDa
附:真核基因在转录时RNA聚合酶需要多种 转录因子的协助 Pol I TBP TAFIs
(四)转录因子 1、通用因子(General factor) (1)是所有启动子起始RNA合成所必须 并决定起始的位置。 Pol I TBP TAFIs 转录因子有通用因子、上游因子、可诱导因子三种 通用因子举例:如TBP—TATA binding protein 和RNA聚合酶组成基本转录机构 Pol III TF III B (B’’, TBP, BRF)
2、上游因子(Upstream factor) (1)识别并与启动子上游元件结合 (2)与上游元件结合可增加转录起始的效率 Startpoint 上游元件 UBF1
(五)启动子 RNA 聚合酶Ⅰ的启动子:位于转录起点上游 RNA 聚合酶Ⅱ的启动子:位于转录起点上游RNA 聚合酶III的启动子:位于转录起点下游 转录的起始是三者相互作用的结果 基因内启动子
二、RNA 聚合酶 I 基因的转录 (一)rRNA基因(Ribosomal RNA Genes ) 多拷贝基因 由RNA聚合酶Ⅰ负责转录,在分裂间期的连续合成rRNA 人类细胞在不同染色体上分布有5簇rRNA重复基因,每簇大约有40个拷贝的rRNA基因 这种多拷贝rRNA基因的连续转录是产生足够量的rRNA所必需。 每一rRNA基因产生一个45S的rRNA转录物,长约13000nt。这一转录物随后被切成28S(5000nt),18S(2000nt),5.8S(160nt) rRNA各一个。
(二)RNA聚合酶Ⅰ启动子 1、核心启动子(core promoter)或核心元件: 位于-45 ~ +20,负责转录的起始。 位于-45 ~ +20,负责转录的起始。 2、上游控制元件(upstream control element ): 位于-180 ~ -107,可增加转录起始的效率。 上游控制元件(UCE) startpoint CTCCGAGTCGNNNNNNTGGGCCGCCGG 核心启动子(core element) +20 -40 -110 -170 rRNA 基因的转录:是RNA Pol I、启动子、转录因子相互作用的结果 人类RNA Pol I的启动子
(三)RNA Pol I的辅助因子(UBF1 & SL1) (1)可以与UCE结合 (2)可与核心元件的一段序列结合 (3)两个UBF1通过蛋白-蛋白相互作用而相互结合,导致在两个结合位点间的DNA形成一个环状结构。 一种特异的DNA结合蛋白 在UBF1缺乏时,可以观察到本底水平的转录,而在UBF1存在时转录效率大大增强。 UBF1 UBF1
是保证RNA pol 准确结合到起始位点的一个关键因子 2、选择因子1(SL1) (1)组成:4个亚基 a、TBP (TATA-binding protein): 是保证RNA pol 准确结合到起始位点的一个关键因子 b、其他的三个亚基TAF:(TBP 相关因子) 为RNApol I转录所需的亚基称为TAFI (2)功能:是使RNA 聚合酶正确的定位在起始位点。 与核心元件游离的下游部分相互作用 SL1 是RNA聚合酶Ⅰ转录所必需 SL1结合并稳定UBF1-DNA复合物 SL1的结合使得RNA聚合酶Ⅰ能与上述复合物结合并起始转录,对rRNA转录非常重要。 SL1的行为类似细菌的σ因子。 不与启动子特异性地结合 但可以与和启动子特异结合的其它成分相结合
RNA 聚合酶 I 基因转录起始 UBF1 startpoint 核心启动子(core element) +1 TAFIs TAFIs 上游控制元件(UCE) startpoint CTCCGAGTCGNNNNNNTGGGCCGCCGG 核心启动子(core element) +20 -40 -110 -170 +1 UBF1 SL1 TBP TAFIs a low basal transcription is seen in the absence of UBF,and this is greatly stimulated in the presence of UBS。 RNApol I需要两种辅助蛋白,UBF1和SL1.UBF1与UCE及核心启动子的富G-C区结合,无种属特异性(例如人和鼠模板互换);SL1含4种蛋白,其一为TBP,它亦为Pol II和 III的起始所需要,但是,TBP无种属特异性,也不像能与富G-C区结合.因此,SL1的特异性来自于TBP以外的蛋白组份. SL1的功能类似于西格玛因子,其体外纯化物特异性结合启动子.因此,推测它通过保证Pol的正确结合位置实现功能的. 通观Pol II和III,位置因子由TBP和其它与其结合的蛋白构成,后者特异性识别不同的启动子. Pol I TBP TAFIs
三、RNA 聚合酶III 基因的转录 (一)tRNA基因的转录 1、启动子----基因内启动子 (1)启动子的两个保守序列: A框(5’-TGGCNNAGTGG-3’); B框(5’-GGTTCGANNCC-3’) (2)A框和B框编码的序列: A框----D-loop; B框---- TψC-loop
2、tRNA基因转录因子 (1)TFⅢC:识别boxB (2)TFⅢB:与A框上游50kb上游序列结合 a、组成: TBP、BRF、B” b、功能:是RNA聚合酶Ⅲ真正的起始因子
3、tRNA基因转录的起始 boxB boxA TF III C TF III B Pol III TFⅢC识别boxB,但结合在一个更大的区域包括A框和B框 TFⅢC是为TFⅢB定位的装配因子,帮助TFⅢB结合在正确的位置
(二)5S rRNA 基因的转录 1、 5S rRNA 基因: 特点:串连排列,形成基因簇 (是唯一单独被转录的rRNA亚基) 2、启动子: C框 ;A框 在人类基因组中,约2000个基因串连排列组成的基因簇 C框 ,位于转录起始点下游81-99碱基处。另一个位于+50-+65称为A框的区域也很重要。
3、转录因子: (1) TFIIIA :结合位点为C box 。 (2) TFIIIC (3) TFIIIB: TBP + BRF + B// TFIIIA作为一个装配因子允许TFIIIC与 5SRNA的启动子相互作用 A 框可能稳定TFIIIC的结合 在一个相对于tRNA启动子起始位点的等同位置, TFIIIC与DNA结合
4、5s rRNA 基因转录的起始 boxA boxC TF III A TF III C TF III B Pol III (B’’, TBP, BRF) TF III B 进入延长期时,需要释放除起始/固定因子以外的其他转录因子.体外实验中可通过提高盐浓度除去. Pol III
四、RNA 聚合酶 II 基因的转录 (一)RNA聚合酶 II 的启动子 1、组成: 核心启动子(core promoter): TATA盒(Hogness box): - 25 ~ -35bp 上游启动子(upstream promoter element,UPE) CAAT盒 :-70 ~ -80区 GC盒:-80 ~ -110区 -20 -40 -60 -80 -100 GCCACACCC GGCCAATC ATATAA GC CAAT TATA
2、核心启动子(core promoter): (1)TATA盒(Hogness box): a、位置: - 25 ~ -35bp b、序列特征:富含AT, 5’-TATA(A/T)A(A/T)-3’. c、功能:决定RNApol II的定位与转录精确起始 大多数真核生物的启动子具有一个TATA 框 决定转录起始的关键序列,缺失或突变会导致RNA产物起始点不固定 TATA 框作用与E.coli的-10序列相似 TATA 框与转录起始位点之间的序列并不 重要,但距离很重要,且TATA 框周围的碱基序列非常关键。 TBP结合8对碱基,包括一对额外的下游碱基。 核心启动子:只能引发低水平的转录起始
(2)起始子(initiator,Inr) 与转录起始位点重叠的短的较保守序列 附:缺少TATA 盒启动子 (1)无TATA盒,只有一个起始子 (2)既无TATA框,也无起始子,这种基因通常转录速率很低,起始点不固定。 不是所有基因都含有TATA盒或Inr序列.有的只有其中之一,有的两者都无.
3、上游启动子(upstream promoter element,UPE) (1)位置: CAAT盒 :-70 ~ -80区( -70区) GC盒:-80 ~ -110区(-90区) (2)功能: 控制转录起始的频率 (基本不参与起始位点的精确定位) (3)功能特点:正反方向排列均能发挥作用 GC-box可以有多拷贝 CAAT可在更远处 对转录起始的效率影响很大
(4)上游元件的多样性 SV40 early 胸苷激酶 Thymidine kinase Histone H2B Octamer CAAT GC TATA Startpoint SV40 early 胸苷激酶 Thymidine kinase Histone H2B -140 -120 -100 -80 -60 -40 -20 CAAT(-80)可在更远处,任意方向起作用.但似乎不直接影响启动的特异性.位置和方向以起始点为参照. GC-box(-40至70)也是常见的启动子元件.可在任意反向作用.可以有多拷贝. 启动子中含有多种上游元件,但是没有哪一种是所有启动子所共同必需的. GC,CAAT本身不对称,但可以在任意方向作用.虽然,转录只能向下游方向进行.原理尚不清楚. 组件特性--可互换组合(例,胸苷基酶和珠蛋白启动子部分融合),不影响功能.表明其功能为将蛋白质因子带到起始点区域,转录效率取决于蛋白因子的互作.
上游元件的多样性 真核RNA 聚合酶II 启动子包含着TATA 盒、CAAT 盒、GC 盒以及其他序列元件之间的不同组合。 没有哪一种上游元件是所有启动子所共同必需的 构成功能性启动子的元件多样性和相对于起始位点的位置变化表明,转录因子能以多种方式通过蛋白质-蛋白质相互作用而彼此相互作用
Module Consensus DNA bound Factor Distribution 哺乳类 RNA聚合酶 II 启动子的常见组件 Module Consensus DNA bound Factor Distribution TATA box TATAAAA ~10bp TBP General CAAT box # GGCCAATC ~22bp CTF/NF1 General GC box GGGCGG ~20bp SP1 General Octamer # ATTTGCAT ~20bp Oct-1 General `` `` 23bp Oct-2 Lymphoid B GGGACTTTCC ~10bp NF B Lymphoid `` `` ~10bp H2-TF1 General ATF GTGACGT ~20bp ATF General # 同一组件可被不同因子识别/结合 CAAT CP1(-globin), CP2(-fibrinogen), CP3 Octamer Oct-1, Oct-2(immunoglobulin in Lymphoid)
(1)具有7个氨基酸(Tyr-Ser-Pro-Thr-Ser -Pro-Ser) 的重复序列(酵母:重复26次;哺乳类:52次) (二)RNA聚合酶Ⅱ 羧基末端结构域(CTD): 1、位置:RNA聚合酶Ⅱ最大亚基羧基末端 2、结构特点: (1)具有7个氨基酸(Tyr-Ser-Pro-Thr-Ser -Pro-Ser) 的重复序列(酵母:重复26次;哺乳类:52次) (2)多个磷酸化位点:Ser、Thr
3、作用: CTD磷酸化对调控基因转录有重要作用: (1)CTD去磷酸化,RNA聚合酶II易与DNA 结合,这种构象适于转录的起始; (2)CTD磷酸化可使RNA聚合酶II与DNA的 结合变得松弛,形成适于延伸的构象
RNA聚合酶II自身不能起始转录,需要依靠转录因子的协助。
(三)RNApol II 的转录因子 TF II D TBP(TATA盒结合蛋白) + TAFs(TBP协同因子 ) —— 结合在DNA小沟(其他DNA结合蛋白为大沟),识 别和结合核心启动子(TATA盒和Inr) TF II A —— 含数个亚基,可能通过解除TAFs的抑制而激活TBP TF II B —— 覆盖靠近起始点的启动位置,C端与TFIID和DNA 的复合物结合,N-端与TFⅡF协同作用募集RNA聚 合酶II。
TF II F ——结合Pol II并带向启动子;RAP74(ATP依赖性解旋酶),RAP30(与细菌因子有同源性) TF II E —— 扩大DNA覆盖区至+30 TF II H 和TF II J —— H有激酶活性, 使Pol II 的CTD 磷酸化 ,PolⅡ 离开启动子区
TBP(TATA盒结合蛋白) + TAFs(TBP协同因子 ) (四)RNA PolⅡ基因转录的过程 1、转录起始 (1) TFIID: TBP(TATA盒结合蛋白) + TAFs(TBP协同因子 ) TBP TAFs TATA -20 -10 +10 -30 -40 +20
TBP的作用----定位因子 a、在TATA框处与DNA结合 b、是所有三种RNA聚合酶转录起始所需的因子
a 、两个结构域形成一个完全二元对称的马鞍型 结构,与DNA小沟有效结合 TBP的作用机制: a 、两个结构域形成一个完全二元对称的马鞍型 结构,与DNA小沟有效结合 目前发现的所有DNA结合蛋白都是结合大沟,但TBP却能与小沟结合 TBP内面与DNA结合,较大的外面可与其他蛋白质结合
b、TBP 与DNA 结合,使DNA 弯曲了约80°, TATA 盒向大沟弯曲,拓宽了小沟。
与TFIID结合,稳定TFIID-DNA复合体;可能通过解除TAFs的抑制而激活TBP (2) TFIIA 含有至少3个亚基 与TFIID结合,稳定TFIID-DNA复合体;可能通过解除TAFs的抑制而激活TBP TF II A
(3) TFIIB 覆盖靠近起始点的启动位置,C端与TFIID和DNA的复合物结合,N-端与TFⅡF协同作用募集RNA聚合酶II TFIIB与TFIID结合,并为RNA聚合酶结合起一个桥梁作用。 TF II B
(4)与RNA聚合酶与TFIIF相连的复合体结合 Pol II TF II F 结合Pol II并带向启动子; 两个亚基: RAP74(ATP依赖性解旋酶),可能参与DNA 双链的溶解 RAP30(与细菌因子有同源性),与RNA 聚合酶Ⅱ紧密结合
(5)TF II E 扩大DNA覆盖区至+30 TF II E
(6)TF II H 和TF II J加入复合物
(7)TF II H 有多种酶活性,包括ATP酶、解旋酶、和可使Pol II 的CTD 磷酸化的激酶活性。 Pol II 的CTD 磷酸化 , TF II 在PolⅡ离开启动 子前释放,形成适于 延伸的构象 Pol II 离开启动子区, 进入延伸阶段
RNA聚合酶Ⅱ起始复合物的组装 启动子TATA盒+ TFⅡD + TFⅡA + TFⅡB +(RNA聚合酶+ TFⅡF)复合物 +TFⅡE 、TFⅡJ +TFⅡH(解旋酶、蛋白激酶) DNA解旋、RNA聚合酶Ⅱ的 CTD磷酸化 polⅡ从转录因子中释放出来 从起始点向下游移动
2、转录的终止 (1)终止位点: 目前还不清楚RNA聚合酶Ⅱ基因的精确终止位点 (2)AAUAAA序列: 初始转录物3’末端的保守序列 对于转录产物的准确切割及加poly(A)是必须的
起始 延伸 AAUAAA 5’ cap An Poly(A)聚合酶 RNA内切酶 AAUAAA识别因子
(3)多聚A尾的添加 a、RNA聚合酶Ⅱ并不在AAUAAA 序列或poly(A)添加位点终止,而往往继续转录,因此大部 分已知基因的初级转录产物拥有poly(A)添加位点下游0.5~2kb核苷酸序列 b、内切酶切开mRNA 3’端的特定部位 c、poly(A)合成酶催化多聚腺苷酸的反应
Question 1、试述TBP对真核基因转录的作用 2、RNA聚合酶II的启动子有哪些基本元 件,各 元件的作用是什么 3、试述RNA聚合酶II羧基末端结构域(CTD)的结构特点及对基因转录的作用