第四章 基因表达的调控
基因表达调控 基因表达主要包括(基因)转录和(蛋白质)翻译使信息分子DNA转变成有功能蛋白质的过程,这一过程在体内受到精密的调控,以保证功能的有序性。这一调控称为基因表达的调控,简称基因调控。 基因表达过程分为基因活化、转录、转录后加工、翻译、翻译后加工等阶段。在上述各环节都存在基因表达调控的控制点。
基因表达及其调控的特点 组成性基因表达(constitutive gene expression)管家基因的表达方式,较少受环境影响,在个体各生长阶段的几乎全部组织中持续表达或变化很小。 管家基因(housekeeping gene)在一个生物个体的几乎所有细胞中持续表达的基因。
诱导表达(induction expression)有一些基因表达极易受环境影响,在特定环境信号刺激下,基因的表达开放或增强。 阻遏表达(repression expression)在特定环境信号刺激下,基因的表达关闭或减弱。 协调表达:在生物体内,各种代谢途径有条不紊地进行,这是在一定机制控制下,功能相关的一组基因,协调一致,共同表达。
基因表达调控的生物学意义 适应环境、维持生长和增殖 维持个体发育与分化 基因表达调控的环节: 基因活化、转录、转录后加工、翻译、翻译后加工
第一节 原核生物基因表达调控 一、转录水平的调控是原核生物的主要调控环节 第一节 原核生物基因表达调控 一、转录水平的调控是原核生物的主要调控环节 原核生物基因多以操纵子形式存在。操纵子由调控区和信息区组成。上游调控区包括启动子与操纵元件二部分。启动子是同RNA聚合酶结合并启动转录的特异性DNA序列,操纵元件是特异的阻遏物结合区。
5、倒位蛋白通过DNA重组倒位而调节基因表达 6、衰减子 7、RNA聚合酶抑制物 影响原核生物转录的因素 1、启动子 2、σ因子的种类与浓度 3、阻遏蛋白 4、正调控蛋白 5、倒位蛋白通过DNA重组倒位而调节基因表达 6、衰减子 7、RNA聚合酶抑制物
1、启动子 促进DNA转录的DNA顺序,是DNA分子上可与RNA pol结合并使之转录的部位。又称启动基因,但启动子本身不被转录。 如E.coli启动子全长约40∽60bp,3个功能部位,2个重要功能: (1)起始部位: 转录合成的第一个互补碱基对,用+1表示,左为上游,右为下游,用负、正表示,没有O的位置。 (2)结合部位: RNA pol 与启动子结合位置,位于-10bp,同源性强,又称TATA box或pribnow盒。 (3)识别部位: 位于-35bp,RNApol识别启动子部位,保守性极强。
启动子功能:: (1)决定转录方向及那一条DNA链作模板。(以信息链的互补链作模板,转录mRNA与信息链一致) (2)决定转录效率。 E.coli启动子,在-35、-10的两个区序列称为一致性序列。通过比较大量的E.coli启动子,表明这两个序列中各碱基的出现频率为-35区:TGACA;-10区:TATAAT。如果某一个启动子与上述序列越接近,基因的转录效率越强。反之就弱。
原核生物转录起始区的一致性序列
2、 σ因子的种类与浓度 不同的因子σ可以竞争性的结合RNA聚合酶,环境变化可产生特定的σ因子,从而打开一套特定的基因。通过对大肠杆菌基因组序列分析后,发现存在6种σ因子,并根据其相对分子质量的大小或编码基因进行命名。 编码基因 rpoD rpoN rpoH rpoS rpoF rpoE σ因子 σ70 σ54 σ38 σ32 σ28 σ24 主要功能 参与碳代谢过程基因的调控 参与多数氮源利用基因的调控 参与分裂间期特异基因表达调控 热体克基因的表达调控 鞭毛趋化相关基因的表达调控 过渡热休克基因的表达调控
3、阻遏蛋白 阻遏蛋白是一类在转录水平对基因表达产生负调控作用的蛋白质。根据其作用特征可分为负控诱导和负控阻遏二大类。在负控诱导系统中,阻遏蛋白不与效应物(诱导物)结合时,结构基因不转录;在负控阻遏系统中,阻遏蛋白与效应物结合时,结构基因不转录。阻遏蛋白作用部位是操纵区。
4、正调控蛋白 正调控蛋白结合于特异DNA序列后,具有促进基因的转录,这种基因表达调控的方式称为正调控。根据正调控蛋白的作用性质分为正控诱导系统和正控阻遏系统。在正控诱导系统中,效应物分子(诱导物)的存在使正调控蛋白处于活性状态;在正控阻遏系统中,效应物分子的存在使激活蛋白处于非活性状态。
5、倒位蛋白通过DNA重组倒位而调节基因表达 倒位蛋白是一种位点特异性的重组酶。
6、衰减子 衰减子又称为弱化子,位于一些操纵子中第一个结构基因之前,是一段能减弱转录作用的序列。如色氨酸操纵子序列内含有一段衰减子序列. 7、RNA聚合酶抑制物 细菌在缺乏氨基酸的环境中,RNA聚合酶活性降低,RNA(rRNA,tRNA)合成减少或停止,这种现象称为严谨反应。机制:当氨基酸缺乏时,游离核糖体与空载的tRNA增加,在ATP存在下,产生pppGpp和ppGpp,后者与RNA聚合酶结合形成复合物,进而使RNA聚合酶构象变化,活性降低。
乳糖操纵子调控的机制 阿拉伯糖操纵子的调控机制 色氨酸操纵子的调控机制 二、转录的调控机制 在大肠杆菌的许多操纵子中,基因的转录不是由单一因子调控的,而是通过负调控因子和正调控因子进行复合调控的。比较典型的是一些糖代谢有关的操纵子。 乳糖操纵子调控的机制 阿拉伯糖操纵子的调控机制 色氨酸操纵子的调控机制
操纵子模型的提出 —莫洛(Monod)和雅各布(Jacob) 获1965年诺贝尔生理学和医学奖
1.乳糖操纵子的调控机理(可诱导的操纵子) (1)人们早在上个世纪初就发现了酵母中酶的诱导现象。即分解底物的酶只有底物存在时才出现。酶受底物的诱导,这种可诱导现象在细菌中普遍存在。 在培养基中加入适合底物-乳糖或半乳糖后2~3分钟,β一半乳糖苷酶可迅速达到5000个酶分子,增加了1000倍,占细菌蛋白总量的5~10%。 (β一半乳糖苷酶水解乳糖→半乳糖+葡萄糖 2个单糖)。 若撤消底物,该酶合成迅速停止,就象当初迅速合成一样。从60年代乳糖操纵子模型提出→1966年分离得到该操纵子的阻遏蛋白→1975年乳糖操纵子的碱基序列已全部测定清楚了。
(2)乳糖操纵子(Lactose operon ,Lac operon)结构示意图 CAP CAMP I P O Z Y A 结构基因区(信息区) RNA pol 调控区 I-调节基因 P-启动子 O-操纵基因 (OP有一定的重叠) CAP结合位点 结构基因 Z-β半乳糖苷酶基因 ( β-galactosidase) Y-半乳糖苷透酶(乳糖透酶) ( β-galotoside porinerase) A-硫代半乳糖转乙酰基酶(trans acetylase)
(3)调控机理 乳糖操纵子的转录起始受到CAP和阻遏蛋白的双重调控,即正、负调控。 ①CAP(正控):通过结合到启动子上游CAP结合位点,促进RNA pol与P的结合,才能有效的转录,原因是: Lac p 是弱启动子,与一致序列的差异极大,CAP位点结合cAMP-CAP复合物后,改变了RNA pol空间结构,增强了RNA pol与P的结合的牢固性。所以CAP是Lac operon 的正控因子。 ②阻遏蛋白(负控) 调节基因I(除Lac operon用I外,其余均用R)产生的阻遏蛋白结合到操纵基因O上,由于启动子p与操纵基因有一定的重叠,妨碍RNA pol与P的结合,就抑制了结构基因的转录,诱导物(或称效应物)可以去阻遏,实现对基因的转录,这是Lac operon的负控机制。
CAP结合到CAP位点发挥正控作用,乳糖诱导去阻遏,这样1个操纵子中的1组基因就有2道开关,只有2道开关同时打开时,基因才能转录。 2个CAP分子和RNA pol 在Lac p 一致序列上排列 CAP -35 RNA pol -10 I P O Z Y A DNA mRNA 阻遏蛋白 效应物(半乳糖) ZYA基因产物(酶)
细菌优先利用葡萄糖(G)-葡萄糖效应 如果细菌生长环境中,乳糖、葡萄糖同时存在,尽管有诱导物乳糖存在,但细菌优先利用葡萄糖,不予理睬乳糖,在G耗尽之前,Lac operon也不会表达。也就是说G阻碍了Lac operon的表达。这种G效应在半乳糖、阿拉伯糖操纵子中也存在。 G效应的原因是: ①G降解代谢产物可以抑制腺苷环化酶、 激活磷酸二酯酶,结果使胞内cAMP下降;CAP的正调控需要结合cAMP形成复合物才能结合到CAP结合位点; ②当G耗尽,cAMP开始集累↑,cAMP和CAP结合→使CAP变构才能结合到CAP结合位点上,促进RNA pol与P结合。
结合乳糖、葡萄糖存在与否及与操纵子正、负控因素、基因开放与关闭情况如下: 葡萄糖(G) 乳糖 基因开放 基因关闭 机理简述(学生填充) × √ √ CAP正控、乳糖去阻遏、基因开放、 转录进行 × × √ 不能诱导去阻遏,CAP即使结合,基因未开放 √ × √ 细菌优先用G,无CAP结合,无诱导去阻遏 √ √ √ cAMP-CAP复合物无,CAP位点空,乳糖去阻 遏,基因未开放 ① ② ③ ④
2.色氨酸操纵子(trp operon) 结构特点 E.coli的色氨酸操纵子有五个结构基因E、D、C、B、A基因编码三种酶,用于合成色氨酸, 上游调控区由启动子(P)和操纵基因(O)组成 调节基因R:编码阻遏蛋白
无色氨酸—操纵子基因开始转录,此后转录速率受转录衰减机制(attenuation)调节 结构基因与 O 之间有一个L基因,在L基因内存在一个衰减子。 衰减子:有4段特殊的序列,可形成不依赖ρ因子的转录终止信号。 终止密码 前导肽编码区 3 4 UUUUU 1 2 四个片段之间形成发夹能力:1/2>2/3>3/4,四个片段形成何种发夹结构,是由L基因转录物的翻译过程控制的。 前导肽编码区转录产物中含两个相邻的色氨酸密码子,这两个密码子以及原核生物中转录与翻译偶联是产生衰减作用的基础。
当有色氨酸时 无色氨酸时
色氨酸操纵子中的操纵基因和衰减子可以起双重负调节作用。衰减子可能比操纵基因更灵敏, 只要色氨酸一增多,即使不足以诱导阻遏蛋白结合操纵基因,就足可以使大量的mRNA提前终止。反之,当色氨酸减少时,即使失去了诱导阻遏蛋白的阻遏作用,但只要还可以维持前导肽的合成,仍继续阻止转录。这样可以保证细菌对色氨酸的充分利用。防止堆积。
结构特点 3.阿拉伯糖操纵子(ara operon)调节机制 结构基因 B、A、D,分别编码异构酶(isomerase)、激酶(kinase)、表位酶(epimerase),催化阿拉伯糖转变为5-磷酸木酮糖 调控区:调节基因为C基因(编码调控蛋白C蛋白) 、启动子(P)、起始区(I)和操纵基因(O)构成
二、翻译水平的调控 1、SD序列对翻译的影响 SD序列(Shine-Dalgarno sequence): mRNA起始密码前的一段富含嘌呤核苷酸的序列。(9-12bp) ❶SD序列的差异对翻译的影响 ❷ SD序列位置对翻译的影响
2、mRNA二级结构隐蔽SD序列 某些mRNA分子中,核糖体结合位点在一个二级结构中(茎环)中,使核糖体无法结合,只有打破茎环结构,核糖体才能结合。例如:带有红霉素抗性的细菌
终止密码子 编码区 核糖体23SmRNA上特定位点的一个腺嘌呤甲基化。 红霉素甲基化酶 红霉素
3、mRNA的稳定性是调控翻译的方式之一 细菌蛋白质的合成速率的快速改变,不仅是转录与翻译偶联,更重要的与mRNA的降解速度快有关。 ①细菌的生理状态、环境因素; ② mRNA的一级结构及次级结构的影响; ③与mRNA的序列和结构有关
4、翻译产物对mRNA的翻译进行调控 有些mRNA编码的蛋白质,本身也可以对相应的mRNA的翻译过程产生调节作用,这是一种自身翻译调控作用。 ①核糖体蛋白翻译的自身调控 ② 翻译的RF2调节自身的翻译 UGAC 315 25 编码RF2蛋白mRNA
5、小分子RNA抑制特定mRNA的翻译 ❶小分子RNA调整基因表达产物的类型: 大肠杆菌渗透压调节基因ompR的产物OmpR蛋白,在不同渗透压时具有不同的构象。 低渗 结合ompF基因的调控区,起正调控 OmpR 结合ompC基因的调控区,起正调控 高渗 当细菌从低渗到高渗状态时,不仅ompF基因抑制,其表达的mRNA的翻译也抑制。
❷小分子RNA控制特定基因的低水平表达 Tn10转位酶基因表达在细菌中处于极低水平。这是因了一种小分子RNA阻遏物在翻译水平上严格限制着Tn10转位酶基因的表达。
小分子RNA在翻译水平上对Tn10转位酶基因表达调控
真核生物基因表达的调控 DNA水平的调控 转录水平的调控 转录后水平的调控 翻译水平的调控 翻译后水平的调控
DNA水平的调控 1、染色质的丢失:低等生物的细胞发育过程中及动物红细胞成熟过程中,发现有染色质的丢失。 2、基因扩增:增加基因的拷贝数是调控基因表达活性的一种有效方式。 药物:诱导抗药性基因的扩增;肿瘤细胞:原癌基因拷贝数异常增加 3、基因重排:基因片段改变原衔接顺序,重排为完整的转录单位 如免疫球蛋白基因在B淋巴细胞分化和浆细胞生成过程中重排,奠定了其多样性的基础。
4、DNA甲基化:在真核生物基因表达中,基因甲基化程度高,基因表达降低;去甲基化:基因表达增加。 5、染色质结构对基因表达的调控:真核生物的染色体或染色质由DNA与组蛋白、非组蛋白及少量RNA及其它物质结合而成。具有核小体结构。非组蛋白(高迁移组分)与组蛋白竞争结合DNA,解除组蛋白对基因表达的抑制。
转录水平的调控 是真核生物基因调控中最重要 调控主要通过顺式作用元件、反式作用因子、RNA聚合酶的相互作用来完成的。同时转录水平的调控主要通过上述三者作用影响转录起始复合物的形成。
(一) 转录起始复合物的形成 真核生物的RNA聚合酶识别的不是单纯的DNA序列,而是由一个通用转录因子(transcription factor,TF)与DNA形成的蛋白质-DNA复合物.形成过程: 1、TFIID结合TATA盒 2、RNA聚合酶Ⅱ结合TFⅡD,形成闭合的复合物 3、其它TF与RNA聚合酶形成开放的复合物 在转录调控过程中,反式作用因子的主要作用:是促进或抑制TFIID结合TATA盒或RNA聚合酶结合TFⅡD,形成闭合的复合物以及转录起始复合物的形成。
(二)、反式作用因子 真核细胞内含有大量的能识别、结合特异性序列的DNA结合蛋白,其主要功能是使基因开放或关闭,称为反式作用因子,通常是一类细胞核内蛋白质因子。 反式作用因子特点: 1、常含有三个功能结构域:DNA识别结合域;转录活性 域;结合其他蛋白的结合域 2、能识别并结合顺式作用元件。 3、对基因的表达具有正调控与负调控作用。
DNA结合域(DNA-binding domain) 锌指结构(Zinc finger motif) 同源结构域(Homodomain):螺旋-回折-螺旋 亮氨酸拉链(Leucine zipper) 螺旋-环-螺旋(Helix-loop-helix structure) 碱性α 螺旋(Alkaline α-helix)
Zinc-fingers 锌指 最常见DNA结合域之一 约有30个AA残基 其中4个AA残基 (2个Cys,2个His或4个Cys) 配位键 Zn2+ 锌指 与DNA双螺旋大沟结合。 存在于多种真核转录因子 具多个锌指结构
锌指结构
1 2 3 4 5 6 7 8 9 蛋白质 图15-10 图15-11
同源结构域:螺旋-回折-螺旋
碱性-亮氨酸拉链结构 亮氨酸拉链区 COOH NH2 碱性氨基酸区 亮氨酸拉链区 COOH NH2 特点:是蛋白质分子的肽链上每隔6个氨基酸就有一个亮氨酸残基,结果就导致这些亮氨酸残基都在α螺旋的同一个方向出现。两个相同的结构的两排亮氨酸残基就能以疏水性作用力结合成二聚体,这二聚体的另一端的肽段富含碱性氨基酸残基,借其正电荷与DNA双螺旋链上带负电荷的磷酸基团结合。若不形成二聚体则对DNA的亲和结合力明显降低
图15-13
helix-loop-helix :螺旋-环-螺旋 : α-螺旋有兼性:疏水性基因一侧以及由碱性氨基酸组成的亲水性一侧。 形成二聚体:通过疏水性区域相互结合,而形成同二聚体或异二聚体。 有利于与DNA结合:通过碱性氨基酸区结合DNA。
二聚体
转录活化结构域 转录活化结构域是反式作用因子的转录激活区,通常在反式作用因子的DNA结合域以外由80到100个氨基酸组成的区域。转录因子通常具有一个以上的转录活化区。转录活化结构模型有以下几种: 1、酸性α-螺旋结构域:带较多负电荷,能形成亲脂性α- 螺旋(糖皮质激素受体) 2、富含谷氨酰胺结构域(转录因子SP1) 3、富含脯氨酸结构域:CTF NF-1
(三)、转录起始是由多种激活的反式作用因子 进行复合调控 1、反式作用因子激活方式: (1)、通过基因表达产生反式作用因子是激活方式之一。 通常这种激活方式又称为表达方式调节。这类因子一合成出来就有活性,它们只是在需要时才合成,并迅速通过蛋白水解酶迅速降解。 (2)、共价修饰调节蛋白活性。 这类因子通常可通过磷酸化-去磷酸化、糖基化修饰方式来调节其蛋白活性。
(3)、与配体结合引起功能变化: 许多激素的受体也是反式作用因子,本身对基因转录无调节作用。当激素进入细胞后,受体与激素结合,才能结合于DNA,调节基因的表达。 (4)、蛋白与蛋白相互作用: 蛋白与蛋白之间的解离或形成复合体,是许多细胞内反式作用因子活性调节的重要方式。如c-myc蛋白单一作用靶DNA,其效率低,但与其配体max蛋白形成异二聚体形式作用,效率大增。
反式作用因子激活后,通过识别并结合基因上游的启动子元件或增强子中的保守序列,从而发挥其对下游基因的调节作用。那么反式作用因子又是如何影响下游基因活性呢?目前提出反式作用因子有以下几种作用模式: 1、成环:当反式作用因子与增强子结合后,利用DNA的柔曲性,弯曲成环,使增强子区域与RNA聚合酶结合 位点靠近,直接接触而发挥作用。 2、扭曲:反式作用因子通过与DNA结合后,通过DNA变形,扭曲而发生构型改变,使通用转录因子与RNA聚合酶结合更适合。 3、滑动: 4、连锁反应:
反式作用因子的组合式调控作用 组合式基因调控(conbinatorial gene regulation):指在反式作用因子在对基因表达调控时,并非由单一因子完成,而是由几种反式作用因子组合而发挥特定作用。 在组合式基因调控中每一种作用因子如果单独作用,可能是正调控或负调控,但由多因子的作用效应,并不是几个因子的简单加合的结果。
三、mRNA的加工和运输可形成转录后水平的调控 (一)、5`端加帽和3`端加多聚腺苷酸尾具有调控意义 1、5`形成一个m7GpppNp- 2、3`形成一个100∽200个腺苷酸,即poly(A) 3、核糖体的组装在细胞核内,可能保护rRNA不被降解; 4、tRNA在合成后,形成特定的空间构象,也使其具有抵抗降解的机制。
(二)、mRNA的选择剪接亦可调控基因表达 mRNA的选择剪接是指真核细胞基因表达所转录出的前体mRNA的剪接过程中,参加拼接的外显子可以不按其在基因组的线性分布次序拼接,内含子也可以不被切除而保留,即一个外显子或内含子是否出现在成熟的mRNA中是可以选择的。这种剪接称mRNA选择剪接。 mRNA选择剪接方式: 外显子选择(optional exon) 内含子选择(optional intron) 互斥外显子 内部剪接位点
Bax基因转录产物的选择剪接 选择剪接产生α、β、γ三种蛋白 共含192个密码子 1 2 3 4 5 6 共218个密码子 共151个密码子 终止密码子 共151个密码子 1 3 4 5 6
(三)、mRNA运输控制调节进入细胞质的mRNA量 mRNA的运输是受控制的。成熟的mRNA并不是全部进入细胞质。大约只有20%的mRNA进入胞浆,留在核内的RNA大约在1小时内降解。RNA通过核膜的运输是一个主动运输过程,RNA运输出核孔的机制,目前不清。
四、翻译水平的调节或控制 (一)、蛋白翻译起始可受特定因素的调控 1、阻遏蛋白的调控:可以结合到mRNA的5`端 编码铁蛋白的基因信息区 铁 铁结合调节蛋白 5`端非编码区 铁反应元件 编码铁蛋白的基因信息区 铁
2、翻译起始因子调节蛋白质合成速度 eIF-2是蛋白质合成过程中重要的起始因子,有些物质可以影响其活性。如:血红素对珠蛋白合成的调节 -Pi eIF-2 活性降低 + cAMP依赖性蛋白激酶 - 血红素
3、5′AUG对翻译的调控作用 在真核生物通常以mRNA为模板的翻译开始于最靠近其5`端的第一个AUG为起始密码子指导翻译。但少数mRNA中,在起始密码子AUG上游非编码区存在一个或数个AUG,称为5`AUG,由于5`AUG的开放阅读框与正常编码区的阅读框不一致,如果从5`AUG开始翻译,很快就会遇到终止密码子,从而翻译出无活性的短肽。因此有5`AUG存在会竞争抑制正常起始密码子的翻译,使正常翻译处于低水平状态。 在正常的原癌基因中其5′端的非翻译区内多存在5`AUG从而抑制了原癌基因表达。
4、mRNA 5` 端非编码区长度对翻译的影响 mRNA5`端的非编码区太短时,起始密码子由于和5`端帽子位置太近,从而不容易被40S亚基识别。当5`端的非编码区长度在17-80核苷酸之间时,体外翻译效率与其长度成正比。 第一个AUG至5`端的长度影响翻译起始效率和翻译起始准确性。
(二) mRNA稳定性调节蛋白质合成的水平 1、mRNA 3`端非编码区结构中含有一段丰富的A和U序列,是致mRNA不稳定的原因。 2、同时研究组蛋白的mRNA 3`端结构时,发现其3`端的特殊的茎-环结构,其稳定性受DNA合成调节。 (三)、小分子RNA(MicroRNA,miRNA)对翻译水平的影响
五、翻译后水平的调控 (一)、新生肽链的水解; 1、新生肽链N端的氨基酸是稳定残基还是不稳定残基,是控制其降解的一个重要因素; 不稳定残基又分一级、二级、三级三类 一级:精、赖、苏、甘、苯、亮、异亮、酪、色 二级:天冬氨酸、谷、半 三级:天冬酰胺、谷氨酰胺 2、新生肽链的运输速度是控制功能蛋白质数量的一个重要因素。
(二) 、肽链中氨基酸的共价修饰具有调节蛋白质的活性: 磷酸化、甲基化、酰基化; (三) 、通过信号肽(signal peptide)分拣、运输、定位影响蛋白的功能发挥。
近年来提出的有关基因表达的新理论---- “统一理论” 。这一理论将基因表达过程中的单个具体的事件或步骤联系在一起,从而形成一个完整的调控网络。 同时随着功能基因组时代的到来,基因的调控已不再是细胞内单个的事件,而是一个更复杂调控网络下的综合协同过程。