Control of gene expression in eukaryote 第十二章 真核基因表达调控 Control of gene expression in eukaryote
主要内容 1 引 言 2 DNA水平的基因表达调控 3 转录水平的基因表达调控 4 转录产物的加工转运调控 5 翻译水平的基因表达调控 1 引 言 2 DNA水平的基因表达调控 3 转录水平的基因表达调控 4 转录产物的加工转运调控 5 翻译水平的基因表达调控 6 小 结
1 引 言 1.1 真核生物基因组结构特点 1.2 真核基因表达调控水平
1.1 真核生物基因组结构特点 (1)基因组大,基因多,存在大量重复序列,大部分与组蛋白和非组蛋白结合在一起; (2)基因主要以单顺反子形式存在; (3)多数基因是断裂的; (4)存在基因家族; (5)基因表达的调控位点多,位置多样化; (6)部分基因组序列存在重排、扩增、丢失等规律性变化。
1.2 真核基因表达调控水平 在高等真核生物中,各种细胞表型的差异很大程度上取决于那些由RNA聚合酶Ⅱ转录的可编码蛋白质的基因在表达上的不同。
Core stage:Initiation of transcription
2 DNA水平的基因表达调控 2.1 染色质状态对基因表达的调控 2.2 DNA结构的规律性变化与基因表达调控
2.1 染色质状态对基因表达的调控 2.1.1 染色质的两种状态 2.1.2 DNA表达状态的调控模型 2.1 染色质状态对基因表达的调控 2.1.1 染色质的两种状态 2.1.2 DNA表达状态的调控模型 2.1.3 修饰作用与染色质状态的关系
2.1.1 染色质的两种状态 按功能状态的不同可将染色质分为: (1)活性染色质(有转录活性) (2)非活性染色质(没有转录活性) 染色质是否处于活化状态是决定转录功能的关键。 活性染色质的核小体发生构象改变,具有松散的染色质结构,从而便于转录调控因子和顺式用元件结合和RNA聚合酶在转录模板上滑动。
2.1.2 DNA表达状态的调控模型 (1) 细菌DNA (化学平衡模型) 存在着活性和非活性两种状态,转录复合体或核小体可能形成两种稳定结构,它不会由于游离成分平衡的变化而改变。
The equilibrium model depends on protein concentration a bacterial gene is transcribed can be predicted from the sum of the concentrations of the various factors that either activate or repress the individual gene.
If nucleosomes form at a promoter, transcription factors (and RNA polymerase) cannot bind. If transcription factors (and RNA polymerase) bind to the promoter to establish a stable complex for initiation, histones are excluded.
The dynamic model for transcription of chromatin relies upon factors that can use energy provided by hydrolysis of ATP to displace nucleosomes from specific DNA sequences.
2.1.3 修饰作用与染色质状态的关系 修饰作用主要包括: 组蛋白的乙酰化(与基因活化有关) 组蛋白的甲基化(与基因失活有关) DNA的甲基化(与基因失活有关)
Acetylation of histones activates chromatin, and methylation of DNA and histones inactivates chromatin.
2.2 DNA结构的规律性变化 与基因表达调控 2.2.1 基因的丢失 2.2.2 基因的扩增 2.2.3 基因的重排 2.2.1 基因的丢失 2.2.2 基因的扩增 2.2.3 基因的重排 2.2.4 DNA的甲基化
2.2.1 基因的丢失 在细胞分化过程中,可通过丢失掉某些基因而去除这些基因的活性。某些原生动物、线虫、昆虫和甲壳类动物在个体发育中,许多体细胞常丢失整条或部分染色体,只有将来分化产生生殖细胞的那些细胞一直保留着整套的染色体。 目前,在高等真核生物(包括动物、植物)中很少发现类似的基因丢失现象。
2.2.2 基因的扩增 首先,许多昆虫的某些细胞,如唾腺细胞染色体不经发生细胞分裂就可进行重复复制。这种现象叫做多线性(polyteny)。 2.2.2 基因的扩增 在真核生物中,大部分的染色体DNA在每次细胞分裂周期中都只复制一次。但有例外: 首先,许多昆虫的某些细胞,如唾腺细胞染色体不经发生细胞分裂就可进行重复复制。这种现象叫做多线性(polyteny)。 其次,有一些DNA病毒如SV40,同样也能够克服每个细胞分裂周期只复制一次的局限。 第三,在没发生细胞分裂、整条染色体几乎没复制情况下,染包体的某特定区段却能进行超量复制(over replication),而且这种情况在许多类型细胞和发育阶段都能正常发生。 此即是所谓的DNA扩增。
2.2.3 基因的重排与变换 基因的重排分两种类型: (1) 有序: 在特殊细胞类型中,或是在特殊刺激下产生的一种高度特异重排。如:免疫球蛋白结构基因的表达。 (2) 无序: 由重复元件之间的重组事件、转座子的转座等产生的染色体的重新排列。 基因的变换: 基因序列的改变导致一个基因变成另一个基因。如酵母中的交配型转换。
2.2.4 DNA的甲基化 (1) 碱基甲基化的形成部位 (2) DNA甲基化的位点 (3) 与DNA甲基化作用相关的三种酶 (1) 碱基甲基化的形成部位 (2) DNA甲基化的位点 (3) 与DNA甲基化作用相关的三种酶 (4) DNA甲基化抑制基因转录的机理
(1) 碱基甲基化的形成部位
(2) DNA甲基化的位点 ★ 大多数DNA的甲基化位点存在于双链CpG岛的胞嘧啶上。 ★ 2%~7%的动物细胞DNA胞嘧啶是被甲基化的(数值依物种而变化)。大多数甲基基团能在CG“双联体”中被找到,事实上,大多数CG序列是被甲基化的。 ★ 形成的回文结构为: 5` mCpG 3` 3` GpCm 5`
(3) 与DNA甲基化作用相关的三种酶 ♣ 重新合成甲基化酶(de novo methylase): 在新位点通过识别特异序列识别DNA,它只作用于非甲基化位点; ♣ 维持甲基化酶(maintenance methylase): 组成型地作用于半甲基化位点,把它们转变成完全甲基化位点。 ♣ 去甲基化酶(demethylase) :还没有被鉴定出来。
The state of methylation is controlled by three types of enzyme. De novo and perpetuation methylases are known, but demethylases have not been identified.
(4) DNA甲基化抑制基因转录的机理 作用机理: DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。 启动区DNA分子上的甲基化密度与基因转录受抑制的程度密切相关。
启动子强度 弱 强 甲基化 - + 低密度CpG 高密度CpG CpG岛 DNA甲基化对基因转录的抑制作用
Xist基因甲基化与X染色体失活 甲基化、 不转录 活性 去甲基化、 转录 失活 Xist X染色体 其他位点
3 转录水平的基因表达调控 3.1 顺式作用元件 3.2 反式作用因子 3.3 真核基因转录调控的主要模式
3.1 顺式作用元件 3.1.1 基本概念 3.1.2 顺式作用元件的分类
3.1.1 基本概念 顺式作用元件(cis-acting elements) 基因周围能与特异转录因子结合而影响基因转录的DNA序列。 顺式作用元件对基因表达起调控作用的过程。
3.1.2 顺式作用元件的分类 (1)启动子 (2)增强子 (3)绝缘子 (4)转座子 (5)其他应答元件
(1)启动子(Promoter) ① 定义 ② 作用特点 ③ 作用机制 ④ 分类
① 定义 位于转录起始点附近且为转录起始所必需的DNA序列。 ② 作用特点 <1> 一个基因可同时拥有一个及以上启动子; <2> 位置不定,一般在转录起始点上游; <3> 可与增强子共同控制转录起始和强度; <4> 发挥功能时除需RNA聚合酶外,还需转录调控因子与启动子区各种调控元件相互作用。
③ 作用机制 通过直接与RNA聚合酶相互作用,或结合于启动子关键元件上的蛋白质因子与RNA聚合酶的直接或间接作用,使得RNA聚酶处于适于转录起始的位置,从而利于转录起始。 ④ 分类 <1> 细胞特异启动子 <2> 诱导型启动子 <3> 通用启动子
(2)增强子(enhancer) ① 定义 ② 作用特点 ③ 作用机制 ④ 分类
① 定义 指位于离转录起始点较远位置上,具有参与激活和增强起始功能的序列元件。 ② 作用特点 <1> 增强效应显著; <2> 增强效应与其位置和取向无关; <3> 要有启动子才能发挥作用; <4> 须与特定蛋白质因子结合才能发挥作用; <5> 一般具有组织或细胞特异性; <6> 无基因专一性。
③ 增强子的作用机制 ④ 增强子的种类 通过提高启动子附近激活剂浓度而起作用。当它被约束在启动子附近时,可在任何位置起作用。 三种可能的作用方式: <1> 可影响模板附近的DNA双螺旋结构; <2> 将模板固定在细胞核内特定位置; <3> 增强子区可以作为反式作用因子或RNA聚合酶Ⅱ进入染色质特定结构的入口。 ④ 增强子的种类 <1> 细胞特异性增强子 <2> 诱导性增强子 <3> 通用增强子
A typical gene transcribed by RNA polymerase II has a promoter that extends upstream from the site where transcription is initiated. The promoter contains several short (<10 bp) sequence elements that bind transcription factors, dispersed over >200 bp. An enhancer containing a more closely packed array of elements that also bind transcription factors may be located several kb distant.
An enhancer can activate a promoter from upstream or downstream locations, and its sequence can be inverted relative to the promoter,
(3)绝缘子(Insulator) 一种负调控元件,参与基因表达的负调控。其作用可不受序列方向影响,能远距离发挥作用。
An enhancer activates a promoter in its vicinity, but may be blocked from doing so by an insulator located between them.
(4)转座子(transposon) 能将自己插入基因组中新的位置的DNA序列。
3.2 反式作用因子 3.2.1 基本概念 3.2.2 转录因子的类型 3.2.3 转录因子活性调节的主要方式 3.2 反式作用因子 3.2.1 基本概念 3.2.2 转录因子的类型 3.2.3 转录因子活性调节的主要方式 3.2.4 反式作用因子的DNA识别或结合域 3.2.5 反式作用因子中的转录激活域
3.2.1 基本概念 反式作用因子(trans-acting factor) 3.2.1 基本概念 反式作用因子(trans-acting factor) 一种基因的RNA或蛋白质产物,能影响位于基因组另一条染色体上的(或基因组别处的)另一个基因的活性。 反式作用(trans-acting) 反式作用因子对基因表达起调控作用的过程。
3.2.2 转录因子的类型 (1)基本转录因子(Basal factor) 和RNA聚合酶一起结合于转录起始点和TATA盒; 3.2.2 转录因子的类型 (1)基本转录因子(Basal factor) 和RNA聚合酶一起结合于转录起始点和TATA盒; (2)激活剂(activator) 特异性识别短共有序列元件的转录因子。结合于启动子或增强子位点上。通过增加基本转录复合体(basal apparatus) 结合于启动子的效率而起作用; (3)辅激活剂(coactivator) 连接了激活剂和基本转录复合体; (4)一些调节因子(Some regulators) 可使染色质结构改变。
Factors involved in gene expression include RNA polymerase and the basal apparatus, activators that bind directly to DNA at the promoter or at enhancers, co-activators that bind to both activators and the basal apparatus, and regulators that act on chromatin structure.
3.2.3 转录因子活性调节的主要方式 注:细胞信号传导内容见细胞生物学。 3.2.3 转录因子活性调节的主要方式 注:细胞信号传导内容见细胞生物学。 The activity of a regulatory transcription factor may be controlled by synthesis of protein, covalent modification of protein, ligand binding, or binding of inhibitors that sequester the protein or affect its ability to bind to DNA.
真核和原核转录因子起作用的差异 细菌启动子: 所有的转录因子都必须与RNA聚合酶直接作用; 真核生物启动子: 激活剂可能与基本转录因子相互作用或与辅激活剂结合,后者再与基本转录因子作用。这种通过层层相互作用构建的装置,可解释这些元件排列和分布距离的灵活性。
3.2.4 反式作用因子的DNA识别或结合域 (1) 螺旋-转折-螺旋 (2) 锌指结构 (3) 碱性-亮氨酸拉链 (4) 螺旋-环-螺旋
(1)螺旋-转折-螺旋(helix-turn-helix) 现广泛分布在从酵母到人类的各种真核生物中,虽彼此在氨基酸的顺序上差别很大,但高级结构高度保守,如同源域蛋白。
同源域结构特征与DNA结合的关系 同源域(homeodomain) 是一个DNA结合域,它由60个氨基酸组成,并形成3个α螺旋。C端α螺旋有17个氨基酸,结合DNA大沟。N端臂插入DNA小沟。 含同源域的蛋白质可能是转录的激活剂或阻抑物(activators or repressors) 。
The homeodomain is a module of 60 amino acids The homeodomain of the Antennapedia gene represents the major group of genes containing homeoboxes in Drosophila; engrailed (en) represents another type of homeotic gene; and the mammalian factor Oct-2 represents a distantly related group of transcription factors. The homeodomain is conventionally numbered from 1 to 60. It starts with the N-terminal arm, and the three helical regions occupy residues 10-22, 28-38, and 42-58. Amino acids in red are conserved in all three examples. 三种有代表性的同源域: 果蝇触角足(Antp)基因的同源盒代表了果蝇中大部分含有同源盒的基因的情况; 锯齿(En)基因的同源盒代表了另一类同源基因的情形; 哺乳动物因子(Oct-2)则代表了一组关系较远的转录因子。
Helix 3 of the homeodomain binds in the major groove of DNA, with helices 1 and 2 lying outside the double helix. The N-terminal arm lies in the minor groove, and makes additional contacts.
(2) 锌指结构(zinc finger motif)
“锌指”: 据其结构命名,其中一小段保守氨基酸与Zn2+结合,形成一个相对独立的区域。 有两类DNA结合蛋白含有这种结构: ① 典型的“锌指”蛋白质; ② 类固醇受体
① 典型的“锌指”蛋白质 典型“锌指蛋白” (typic zinic fingers)含一连串锌指。单个锌指共有序列为: Cys-X2-4-Cys-X3-Phe-X5-Leu-X2- His-X3-His 称为Cys2/His2锌指。
Transcription factor SP1 has a series of three zinc fingers, each with a characteristic pattern of cysteine and histidine residues that constitute the zinc-binding site.
Zinc fingers may form α-helices that insert into the major groove, associated with β-sheets on the other side.
② 类固醇受体( Steroid receptors) 类固醇受体是配体应答的激活剂,通过结合类固醇(或其他相关分子)而激活。有独立的DNA结合域和配体结合域。其DNA结合域是一类锌指: Cys-X2-Cys-X13-Cys-X2-Cys 被称为Cys2/ Cys2锌指。 如糖皮质激素受体和雌激素受体各含两个锌指。 Steroid hormones are synthesized in response to a variety of neuroendocrine activities, and exert major effects on growth, tissue development, and body homeostasis in the animal world. The major groups of steroids and some other compounds with related (molecular) activities are classified in Figure 22.15. The adrenal gland secretes >30 steroids, the two major groups being the glucocorticoids and mineralocorticoids. Steroids provide the reproductive hormones (androgen male sex hormones and estrogen female sex hormones). Vitamin D is required for bone development.
The first finger of a steroid receptor controls which DNA sequence is bound (positions shown in red); the second finger controls spacing between the sequences (positions shown in blue).
配体的结合使得受体(如类固醇受体)能够结合应答元件。配体结合于受体的C端结构域,提高了DNA结合域对DNA特异靶位点的亲和力。
Glucocorticoids regulate gene transcription by causing their receptor to bind to an enhancer whose action is needed for promoter function.
谨慎理解锌指存在的意义: 尤其是蛋白质仅含有单个锌指时。锌指可能参与RNA的结合而不是DNA结合,或它与任何核酸结合活性均无关。
(3) 碱性-亮氨酸拉链(basic - leucine zipper, bZIP) 这种基序含4-8个亮氨酸,每隔6个氨基酸就有一个亮氨酸残基间隔,这导致第7个亮氨酸残基都在螺旋的同侧。又因这类蛋白质都以二聚体形式与DNA结合,两个蛋白质α螺旋上的亮氨酸靠近而形成拉链样结构。
N-end The basic regions of the bZIP motif are held together by the dimerization at the adjacent zipper region when the hydrophobic faces of two leucine zippers interact in parallel orientation.
(4)螺旋-环-螺旋 (helix-loop-helix, HLH) ◆ 螺旋-环-螺旋蛋白质有一个由40-50个氨基酸残基组成的基序,含有两个两性α螺旋。 ◆ α螺旋由15-16个氨基酸残基组成,两个α螺旋被环隔开。 ◆ 螺旋负责二聚体的形成,bHLH蛋白含碱性序列,它在HLH基序附近,负责结合DNA。
An HLH dimer in which both subunits are of the bHLH type can bind DNA, but a dimer in which one subunit lacks the basic region cannot bind DNA.
An HLH dimer in which both subunits are of the bHLH type can bind DNA, but a dimer in which one subunit lacks the basic region cannot bind DNA.
3.2.5 反式作用因子中的转录激活域 (Transcriptional activation domain) (1)酸性激活域 (2)富含谷氨酰胺的激活域 (3)富含脯氨酸的激活域
酸性激活域 acidic activation domain 共同点:它们之间并不存在较为明显的氨基酸序列的同源性,但却都含有高比例的酸性氨基酸,产生出很强的净负电荷。 例如:糖皮质激素受体蛋白质17/82;GCN4为17/60 。
(2)富含谷氨酰胺的激活域 glutamine-rich activation domain 例:在组成型表达的转录因子SP1的两个最强的激活域中,谷氨酰胺几乎占了25%,而带负电菏的氨基酸比例则非常低。
(3)富含脯氨酸的激活域 proline-rich activation domain 与CCAAT元件结合的组成型转录因子CTF/NF1,转录激活域位于转录因子的C-末端,其中酸性氨基酸及谷氨酰胺所占比例都很低,但含大量的脯氨酸,约占该区域的1/4。 如原癌基因蛋白质产物Jun和AP2以及Oct-2中,都鉴定出了富含脯氨酸的激活域。
3.3 真核基因转录调控的模式 3.3.1 RNA聚合酶Ⅰ的启动子和转录因子 3.3.2 RNA聚合酶Ⅲ的启动子和转录因子 3.3 真核基因转录调控的模式 3.3.1 RNA聚合酶Ⅰ的启动子和转录因子 3.3.2 RNA聚合酶Ⅲ的启动子和转录因子 3.3.3 RNA聚合酶 Ⅱ的启动子和转录因子
真核细胞细胞核中共有3类RNA聚合酶 酶 主要转录产物 RNA聚合酶Ⅰ rRNA,大多数snRNA RNA聚合酶Ⅱ mRNA前体,部分snRNA RNA聚合酶Ⅲ tRNA、部分snRNA
3.3.1 RNA聚合酶Ⅰ的启动子和转录因子 RNA聚合酶Ⅰ的启动子由一个核心启动子 (core promoter) 和一个上游控制元件 (upstream control element, UCE) 组成。
(-180~-107) (-45~+20) UBF SL1 Transcription units for RNA polymerase I have a core promoter separated by ~70 bp from the upstream promoter element. UBF binding to the UPE increases the ability of core-binding factor to bind to the core promoter. Core-binding factor positions RNA polymerase I at the startpoint.
3.3.2 RNA聚合酶Ⅲ的启动子和转录因子 RNA聚合酶Ⅲ识别的启动子分为两类: ♣ 5S RNA和tRNA基因的启动子位于基因内部(起始点下游),称内部启动子(internal promoter) ; ♣ 核小RNA(snRNA)基因的启动子则位于起始点上游,与其他常规启动子的作用方式相同。
Deletion analysis shows that the promoter for 5S RNA genes is internal; initiation occurs a fixed distance (~55 bp) upstream of the promoter. So the promoter for 5S RNA transcription lies between positions +55 and +80 within the gene. +1 +55 +80
Only in 5S RNA Only in snRNA Promoters for RNA polymerase III may consist of bipartite sequences downstream of the startpoint, with boxA separated from either boxC or boxB. Or they may consist of separated sequences upstream of the startpoint (Oct, PSE, TATA).
Only in 5S RNA TBP TBP RNA聚合酶Ⅲ起始复合体的形成需要TFⅢA、TFⅢB和TFⅢC三个转录因子的参与。1型启动子(只存在于5S rRNA的基因中)的启动,首先是TFⅢA结合于C框,并促进TFⅢC结合在其下游。TFⅢC的结合又促进TFⅢB结合在起始位点周围,并且伴随另一个TFⅢC结合在TFⅢA与TFⅢB之间。最后,RNA聚合酶Ⅲ结合在起始位点周围开始转录。2型启动子的启动,是两个TFⅢC直接结合于B框和A框,然后TFⅢB和RNA聚合酶Ⅲ先后结合在启动子上开始转录。 体外实验表明,在TFⅢA、TFⅢC和TFⅢB和都结合到启动子上以后,除去TFⅢA和TFⅢC对TFⅢB以及RNA聚合酶Ⅲ的结合和转录启动均无影响。可见,TFⅢA和TFⅢC的作用是帮助TFⅢB的这位结合,称为组装因子(assembly factor)。TFⅢB才是使RNA聚合酶Ⅲ正确定位的定位因子,也含有与SL1相同的TBP亚基。 在RNA聚合酶的两类启动子中,蛋白质因子都以相同的方式起作用。在RNA聚合酶自身能结合上去之前,蛋白质因子都先结合到启动子上。它们形成前起始复合体后,再指导RNA聚合酶结合上去。RNA聚合酶III本身并不能识别启动子序列,先由蛋白质因子先结合到紧邻起始点上游的位置上,然合聚合酶再结合到蛋白质因子旁边。在1型和2型内部启动中,由装配因子来确保TFIIIB(内含TBP)结合到紧靠起始点上游的位置来提供定位的信息;就上游启动子而言,TFIIIB则直接结合含有TATA盒的区域上。 所以不管启动子序列位于何处,蛋白质因子总是结合到紧邻起始点的地方来指导RNA聚合酶III的结合。 TBP Internal type 1 pol III promoters use the assembly factors TFIIIA and TFIIIC, at boxA and boxC, to recruit the positioning factor TFIIIB, which recruits RNA polymerase III.
TBP TBP TBP Internal type 2 pol III promoters use binding of TFIIIC to boxA and boxB sequences to recruit the positioning factor TFIIIB, which recruits RNA polymerase III.
3.3.3 RNA聚合酶 Ⅱ的启动子和转录因子 RNA聚合酶Ⅱ的启动子结构复杂,且序列变化很大,与转录启动有关的位点包括4个部位: ⑵ -25附近的TATA框; ⑶ -75附近的CAAT框; ⑷ -100以上的远上游序列,即增强子。 转录要起始,需很多的转录因子参与。
-25 Py2CAPy5(-3~+5) +28~+32 The minimal pol II promoter can consist either of a TATA box plus InR or of an InR plus DPE (downstream promoter element).
TBP是一种通用因子 TBP(TATA-binding protein)是定位因子的一个组分,每类RNA聚合酶在结合到各自的启动子上时都需要TBP。
At promoters for RNA polymerase III, TFIIIB binds adjacent to TFIIIC. Polymerases bind via commitment factors At promoters for RNA polymerase III, TFIIIB binds adjacent to TFIIIC. At promoters for RNA polymerase I, SL1 binds in conjunction with UBF. TFIID is solely responsible for recognizing promoters for RNA polymerase II.
4 转录产物的加工转运调控 4.1 RNA的不同剪接和编辑使同一基因转录产生出不同的蛋白质 4 转录产物的加工转运调控 4.1 RNA的不同剪接和编辑使同一基因转录产生出不同的蛋白质 4.2 RNA的切割和加polyA改变基因编码的蛋白质 4.3 RNA从核中转运到细胞质的过程受控制
5 翻译水平的基因表达调控 5.1 mRNA的稳定性与基因表达调控 5.2 mRNA 5`前导序列对翻译水平的影响 5 翻译水平的基因表达调控 5.1 mRNA的稳定性与基因表达调控 5.2 mRNA 5`前导序列对翻译水平的影响 5.3 翻译起始因子的磷酸化可抑制或选择性地加强蛋白质的合成 5.4 mRNA 3`端的结构对翻译速率和mRNA寿命的影响 5.5 真核生物mRNA翻译起始的控制 5.6 翻译延伸过程对蛋白质合成的影响 5.7 微小的干扰RNA对mRNA翻译的负控制 5.8 蛋白质的加工折叠转运的调控