第七章 基因的表达与调控(下) —真核基因表达调控的一般规律 第七章 基因的表达与调控(下) —真核基因表达调控的一般规律
真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 Contents 真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 真核基因转录后水平上的调控
第一节 真核生物的基因组 一、真核基因组结构特点 真核基因组结构庞大 3×109bp、染色质、核膜 单顺反子 基因不连续性 断裂基因(interrupted gene)、内含子(intron)、 外显子(exon) 非编码区较多 多于编码序列(9:1) 含有大量重复序列
原核生物基因组结构特点 ● 基因组很小,大多只有一条染色体 ● 结构简炼 ● 存在转录单元多顺反子 ● 有重叠基因
二、真核细胞与原核细胞在基因转录、翻译及DNA的空间结构方面存在以下几个方面的差异 武汉大学2003年分子生物学硕士入学试题
① 在真核细胞中,一条成熟的mRNA链只能翻译出一条多肽链,很少存在原核生物中常见的多基因操纵子形式。 ② 真核细胞DNA与组蛋白和大量非组蛋白相结合,只有一小部分DNA是裸露的。
③ 高等真核细胞DNA中很大部分是不转录的,大部分真核细胞的基因中间还存在不被翻译的内含子。
⑤ 在真核生物中,基因转录的调节区相对较大,它们可能远离启动子达几百个甚至上千个碱基对,这些调节区一般通过改变整个所控制基因5’上游区DNA构型来影响它与RNA聚合酶的结合能力。
⑥ 真核生物的RNA在细胞核中合成,只有经转运穿过核膜,到达细胞质后,才能被翻译成蛋白质,原核生物中不存在这样严格的空间间隔。 ⑦ 许多真核生物的基因只有经过复杂的成熟和剪接过程,才能顺利地翻译成蛋白质。
三、基本概念 (一)基因家族(gene family) 真核生物的基因组中有很多来源相同、结构相似、功能相关的基因,将这些基因称为基因家族。 如:编码组蛋白、免疫球蛋白和血红蛋白的基因都属于基因家族 同一家族中的成员有时紧密地排列在一起,成为一个基因簇(gene cluster) 。
1、简单多基因家族 简单多基因家族中的基因一般以串联方式前后相连。
The eukaryotic ribosomal DNA repeating unit
2、复杂多基因家族 复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。现已发现存在不同形式的复杂多基因家族。
Organization of histone genes in the animal genome
基因的编码序列在DNA分子上是不连续的,为非编码序列所隔开,其中编码的序列称为外显子,非编码序列称内含子。 (二)断裂基因 基因的编码序列在DNA分子上是不连续的,为非编码序列所隔开,其中编码的序列称为外显子,非编码序列称内含子。 外显子(Exon) :真核细胞基因DNA中的编码序 列,这些序列被转录成RNA并进而翻译为蛋白质。 内含子(Intron) :真核细胞基因DNA中的间插序列,这些序列被转录成RNA,但随即被剪除而不翻译。
1、外显子与内含子的连接区 指外显子和内含子的交界或称边界序列,它有两个重要特征: 内含子的两端序列之间没有广泛的同源性 连接区序列很短,高度保守,是RNA剪接的信号序列 5'GT——AG 3'
2、外显子与内含子的可变调控 组成型剪接:一个基因的转录产物通过剪接只能产生一种成熟的mRNA。 选择性剪接:同一基因的转录产物由于不同的剪接方式形成不同mRNA。
(三)假基因 是基因组中因突变而失活的基因,无蛋白质产物。一般是启动子出现问题。
真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 Contents 真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 真核基因转录后水平上的调控
第二节 真核生物基因表达调控的特点和种类 一、真核生物基因表达调控的特点 1、RNA聚合酶 2、多层次 3、个体发育复杂 4、活性染色体结构变化:对核酸酶敏感 、DNA拓扑结构变化 、DNA碱基修饰变化 、组蛋白变化 5、正性调节占主导 6、转录与翻译间隔进行 7、转录后修饰、加工
二、真核生物基因表达调控的种类: 根据其性质可分为两大类: 一是瞬时调控或称为可逆性调控,它相当于原核细胞对环境条件变化所做出的反应。瞬时调控包括某种底物或激素水平升降时,及细胞周期不同阶段中酶活性和浓度的调节。 二是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的全部进程。 根据基因调控在同一事件中发生的先后次序又可分为: DNA水平调控--转录水平调控--转录后水平调控--翻译水平调控--蛋白质加工水平的调控
真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 Contents 真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 真核基因转录后水平上的调控
第三节 真核生物DNA水平上的基因表达调控 ● 基因丢失 ● 基因扩增 抗体分子的形成 Ti质粒 转座子 ● 基因重排 ● DNA甲基化状态与调控 ● 染色体结构与调控
一、基因丢失: 在细胞分化过程中,可以通过丢失掉某些基因而去除这些基因的活性。某些原生动物、线虫、昆虫和甲壳类动物在个体发育中,许多体细胞常常丢失掉整条或部分的染色体,只有将来分化产生生殖细胞的那些细胞一直保留着整套的染色体。 目前,在高等真核生物(包括动物、植物)中尚未发现类似的基因丢失现象。
二、基因扩增: 基因扩增是指某些基因的拷贝数专一性增大的现象,它使得细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。 如非洲爪蟾体细胞中rDNA的基因扩增是因发育需要而出现的基因扩增现象。
发育或系统发生中的倍性增加在植物中普遍存在 基因组拷贝数增加,即多倍性,在植物中是非常普遍的现象。基因组拷贝数增加使可供遗传重组的物质增多,这可能构成了加速基因进化、基因组重组和最终物种形成的一种方式。
DNA含量的发育控制 利用流式细胞仪对从拟南芥不同发育阶段的组织中分离到的间期细胞核进行分析,发现多倍体的DNA含量与组织的成熟程度成正比。对于一给定的物种,C是单倍体基因组中的DNA质量。
三、基因重排: 将一个基因从远离启动子的地方移到距它很近的位点从而启动转录,这种方式被称为基因重排。 通过基因重排调节基因活性的典型例子是免疫球蛋白结构基因的表达。
四、DNA的甲基化与基因调控: 1、DNA的甲基化
在真核生物中,5-甲基胞嘧啶主要出现在CpG序列、CpXpG、CCA/TGG和GATC中 CpG二核苷酸通常成串出现在DNA上,CpG岛
真核生物细胞内存在两种甲基化酶活性: 日常型甲基转移酶 从头合成型甲基转移酶
2、DNA甲基化抑制基因转录的机理 DNA甲基化导致某些区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,抑制了转录因子与启动区DNA的结合效率。
活性染色质 五、染色质结构与基因表达调控: 按功能状态的不同可将染色质分为活性染色质和非活性染色质,所谓活性染色质是指具有转录活性的染色质;非活性染色质是指没有转录活性的染色质。 活性染色质由于核小体构型发生构象的改变,往往具有疏松的染色质结构从而便于转录调控因子与顺式调控元件结合和RNA聚合酶在转录模板上滑动。
真核细胞中基因转录的模板是染色质而不是裸露的DNA,因此染色质呈疏松或紧密结构,即是否处于活化状态是决定RNA聚合酶能否有效行使转录功能的关键。
活性染色质的主要特点 在结构上: 活性染色质上具有DNaseI超敏感位点 活性染色质上具有基因座控制区 活性染色质上具有核基质结合区(MAR序列)
二、真核基因表达调控特点 (一)RNA聚合酶 (二)活性染色体结构变化 1. 对核酸酶敏感 活化基因常有超敏位点,位于调节蛋白结合位点附近。
2. DNA拓扑结构变化 正超螺旋 负超螺旋 3. DNA碱基修饰变化 天然双链DNA均以负性超螺旋构象存在; 基因活化后 RNA-pol 转录方向 3. DNA碱基修饰变化 真核DNA约有5%的胞嘧啶被甲基化, 甲基化范围与基因表达程度呈反比。
4. 组蛋白变化 (三)正性调节占主导 (四)转录与翻译分隔进行 (五)转录后修饰、加工 ① 富含Lys组蛋白水平降低 ② H2A, H2B二聚体不稳定性增加 ③ 组蛋白修饰 ④ H3组蛋白巯基暴露 (三)正性调节占主导 (四)转录与翻译分隔进行 (五)转录后修饰、加工
活性染色质上具有DNaseI超敏感位点。每个活跃表达的基因都有一个或几个超敏感位点,大部分位于基因5´端启动子区域。
活性染色质上具有核基质结合区( matrix attachment region ,MAR)。MAR一般位于DNA放射环或活性转录基因的两端。在外源基因两端接上MAR,可增加基因表达水平倍以10上,说明MAR在基因表达调控中有作用。是一种新的基因调控元件。
真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 Contents 真核生物的基因组 真核生物基因表达调控的特点和种类 真核生物DNA水平上的基因表达调控 真核生物转录水平上的基因表达调控 真核基因转录后水平上的调控
第四节 真核生物转录水平上的基因表达调控 一、真核基因转录 (一)真核基因结构
“基因”的分子生物学定义:产生一条多肽链或功能RNA所必需的全部核苷酸序列。
(二)顺式作用元件 定义:影响自身基因表达活性的非编码DNA序列。 例: 启动子、增强子、沉默子等 (1)启动子:在DNA分子中,RNA聚合酶能够识别、结合并导致转录起始的序列。 核心启动子和上游启动子
(2)增强子:指能使与它连锁的基因转录频率明显增加的DNA序列。
SV40的转录单元上发现,转录起始位点上游约200 bp处有两段长72 bp的正向重复序列。
增强子特点: ① 增强效应十分明显,一般能使基因转录频率增加10-200倍 ② 增强效应与其位置和取向无关,不论增强子以什么方向排列(5‘→3’或3‘→5’),甚至和靶基因相距3 kb,或在靶基因下游,均表现出增强效应;
③大多为重复序列,一般长约50bp,适合与某些蛋白因子结合。其内部常含有一个核心序列:(G)TGGA/TA/TA/T(G),该序列是产生增强效应时所必需的; ④ 增强效应有严密的组织和细胞特异性,说明增强子只有与特定的蛋白质(转录因子)相互作用才能发挥其功能;
⑤ 没有基因专一性,可以在不同的基因组合上表现增强效应; ⑥ 许多增强子还受外部信号的调控, 如金属硫蛋白的基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应。
增强子作用机理:
(3)沉默子:某些基因含有负性调节元件——沉默子,当其结合特异蛋白因子时,对基因转录起阻遏作用。
1、定义:能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与调控靶基因转录效率的蛋白质。 (三)反式作用因子 1、定义:能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与调控靶基因转录效率的蛋白质。 TFⅡD(TATA)、CTF(CAAT)、SP1(GGGCGG)、HSF(热激蛋白启动区)
2、结构 DNA结合结构域 结构域 连接区 转录活化结构域
(1)DNA结合结构域: 螺旋-转折-螺旋(Helix-turn-helix,H-T-H) 锌指结构(zinc finger) 碱性-亮氨酸拉链(basic - leucine zipper) 碱性-螺旋-环-螺旋(basic – helix /loop /helix,bHLH)
1、螺旋-转折-螺旋
2、锌指结构 定义:是一种常出现在DNA结合蛋白中的结构基元。是由一个含有大约30个氨基酸的环和一个与环上的4个Cys或2个Cys和2个His配位的Zn构成,形成的结构像手指状。 2-9个 配位键
Cys2 / Cys2锌指 Cys2 / His2锌指 见于甾体激素受体 见于SP1,TF ⅢA等
转录因子SP1 (GC盒) 、连续的3个锌指重复结构。
3、碱性-亮氨酸拉链 二聚体 亮氨酸之间相互作用形成二聚体,形成“拉链” 。 肽链氨基端20~30个富含碱性氨基酸结构域与DNA结合。
这类蛋白质的DNA结合结构域实际是以碱性区和亮氨酸拉链结构域整体作为基础的。
定义:出现在DNA结合蛋白质和其它蛋白质中的一种结构基元(motif)。当来自同一个或不同多肽链的两个α-螺旋的疏水面(常常含有亮氨酸残基)相互作用形成一个圈对圈的二聚体结构时就形成了亮氨酸拉链。
4、碱性-螺旋-环-螺旋
(四)转录起始复合物