表观遗传学 Epigenetics 闵 捷 21014007
概 念 表观遗传学 研究不涉及DNA序列改变的基因表达和调控的可遗传变 化的,或者说是研究从基因演绎为表型的过程和机制 的一门新兴的遗传学分支。 表观遗传 所谓表观遗传就是不基于DNA差异的核酸遗传。即细胞分裂过程中,DNA 序列不变的前提下,全基因组的基因表达调控所决定的表型遗传,涉及染色质重编程、整体的基因表达调控(如隔离子,增强子,弱化子,DNA甲基化,组蛋白修饰等功能 ), 及基因型对表型的决定作用。
表观遗传学的特点: 可遗传的,即这类改变通过有丝分裂或减数分 裂,能在细胞或个体世代间遗传; 可遗传的,即这类改变通过有丝分裂或减数分 裂,能在细胞或个体世代间遗传; 可逆性的基因表达调节,也有较少的学者描述 为基因活性或功能的改变; 没有DNA序列的改变或不能用DNA序列变化来 解释。
表观遗传学的研究内容: 基因选择性转录表达 的调控 基因转录后的调控 DNA甲基化 基因组中非编码RNA 基因印记 微小RNA(miRNA) 基因选择性转录表达 的调控 DNA甲基化 基因印记 组蛋白共价修饰 染色质重塑 基因转录后的调控 基因组中非编码RNA 微小RNA(miRNA) 反义RNA 内含子、核糖开关等
表观遗传学机制 DNA甲基化 组蛋白修饰 染色质重塑 RNA调控 其他表观遗传机制 遗传印记 X染色体失活
一、DNA甲基化 DNA甲基化(DNA methylation)是研究得最清楚、 也是最重要的表观遗传修饰形式,主要是基因组 DNA上的胞嘧啶第5位碳原子和甲基间的共价结合,胞嘧啶由此被修饰为5甲基胞嘧啶(5-methylcytosine,5mC)。 DNMT1 SAM 胞嘧啶 5-甲基胞嘧啶 S-腺苷甲硫氨酸 胞嘧啶甲基化反应
哺乳动物基因组中5mC占胞嘧啶总量的2%-7%,约70%的 5mC存在于CpG二连核苷。 在结构基因的5’端调控区域, CpG二连核苷常常以成簇串联 形式排列,这种富含CpG二连核苷的区域称为CpG岛(CpG islands),其大小为500-1000bp,约56%的编码基因含该 结构。 基因调控元件(如启动子)所含CpG岛中的5mC会阻碍转录 因子复合体与DNA的结合。 DNA甲基化一般与基因沉默相关联; 非甲基化一般与基因的活化相关联; 而去甲基化往往与一个沉默基因的重新激活相关联。
启动子区域的CpG岛一般是非甲基化状态的,其非甲基 化状态对相关基因的转录是必须的。 Rb基因 3’ 5’ CpG岛主要处于基因5’端调控区域。 启动子区域的CpG岛一般是非甲基化状态的,其非甲基 化状态对相关基因的转录是必须的。 目前认为基因调控元件(如启动子)的CpG岛中发生5mC 修饰会在空间上阻碍转录因子复合物与DNA的结合。因 而DNA甲基化一般与基因沉默相关联。
DNA甲基化的转录抑制机制: (1)直接干扰特异转录因子与各自启动子结合的识别位置。DNA的大沟是许多蛋白因子与DNA结合的部位,胞嘧啶的甲基化干扰转录因子与DNA的结合。 (2)转录抑制复合物干扰基因转录。甲基化DNA结合蛋白与启动子区内的甲基化CpG岛结合,再与其他一些蛋白共同形成转录抑制复合物(TRC),阻止转录因子与启动子区靶序列的结合,从而影响基因的转录。 (3)通过改变染色质结构而抑制基因表达。染色质构型变化伴随着组氨酸的乙酰化和去乙酰化,许多乙酰化和去乙酰化本身就分别是转录增强子和转录阻遏物蛋白。
DNA甲基化状态的遗传和保持: DNA复制后,新合成链在DNMT1的作用下,以旧 链为模板进行甲基化。(缺乏严格的精确性,95% ) 甲基化并非基因沉默的原因而是基因沉默的结果, 其以某种机制识别沉默基因,后进行甲基化。 DNA全新甲基化。引发因素可能包括: DNA本身的序列、成分和次级结构。 RNA根据序列同源性可能靶定的区域。 特定染色质蛋白、组蛋白修饰或相当有序的染色质 结构。
DNA去甲基化 主动去甲基化 复制相关的去甲基化 在复制过程中维持甲基化酶活性被关闭或维持甲基化酶 活性被抵制。
复制相关的DNA去甲基化
DNA主动去甲基化 DNA全新甲基化 DNA甲基化状态的保持
二、组蛋白修饰
组蛋白修饰是表观遗传研究的重要内容。 组蛋白的 N端是不稳定的、无一定组织的亚单位,其 延伸至核小体以外,会受到不同的化学修饰,这种修 饰往往与基因的表达调控密切相关。 被组蛋白覆盖的基因如果要表达,首先要改变组蛋白 的修饰状态,使其与DNA的结合由紧变松,这样靶基因 才能与转录复合物相互作用。因此,组蛋白是重要的 染色体结构维持单元和基因表达的负控制因子。
组蛋白修饰种类 乙酰化-- 一般与活化的染色质构型相关联,乙酰化修 饰大多发生在H3、H4的 Lys 残基上。 甲基化-- 发生在H3、H4的 Lys 和 Arg残基上,可以 与基因抑制有关,也可以与基因的激活相关,这往往 取决于被修饰的位置和程度。 磷酸化-- 发生与 Ser 残基,一般与基因活化相关。 泛素化-- 一般是C端Lys修饰,启动基因表达。 SUMO(一种类泛素蛋白)化-- 可稳定异染色质。 其他修饰(如ADP的核糖基化)
组蛋白中被修饰氨基酸的种类、位置和修饰类型被称为组蛋白密码(histone code),遗传密码的表观遗传学延伸,决定了基因表达调控的状态,并且可遗传。 Bryan M. Turner, nature cell biology, 2007
三、染色质重塑 染色质重塑(chromatin remodeling)是 一个重要的表观遗传学机制。 染色质重塑是由染色质重塑复合物介导的一系列以染色质上核小体变化为基本特征的生物学过程。 组蛋白尾巴的化学修饰(乙酰化、甲基化及磷酸化等)可以改变染色质结构,从而影响邻近基因的活性。
核小体
核小体定位是核小体在DNA上特异性定位的现象。 核小体核心DNA并不是随机的,其具备一定的定向特性。 核小体定位机制: 外在定位机制:内在定位结束后,核小体以确定的长度特性重复出现。 核小体定位的意义: 核小体定位是DNA正确包装的条件。 核小体定位影响染色质功能。
重塑因子调节基因表达机制的假设有两种: 机制1:一个转录因子独立地与核小体DNA 结合(DNA可以是核小体或核小体之间的), 然后, 这个转录因子再结合一个重塑因子, 导致附近核小体结构发生稳定性的变化, 又导致其他转录因子的结合, 这是一个串联反应的过程; (重建) 机制2:由重塑因子首先独立地与核小体结合, 不改变其结构, 但使其松动并发生滑动, 这将导 致转录因子的结合, 从而使新形成的无核小体的区域稳定。 (滑动)
染色质修饰与重塑(共价修饰型与ATP依赖型)
(A)结合 (B)松链 (C)重塑 八聚体转移 八聚体滑动 + ATP 重塑 复合物 ATP依赖的染色质重构机制
边界子( boundary elements):相邻基因间的物理隔离元件。也可称为隔离子( insulator elements)。 边界子和隔离子的隔离功能 : 封阻末梢增强子对启动子的作用。 防止染色质位置效应(CPE)。 由边界子所确定的染色质片断是基因组调节的基本单位,其构成染色质的功能与或区室,这即是染色质区室化。
四、RNA调控 1995,RNAi现象首次在线虫中发现。 1998,RNAi概念的首次提出。 2001,RNAi技术成功诱导培养的哺乳动物细胞基 因沉默现象。RNAi 技术被《Science》评为2001 年度的十大科技进展之一。 至今,蓬勃发展,成为分子生物学领域最为热门 的方向之一。
RNA干扰(RNAi)作用是生物体内的一种通过双链RNA分子在mRNA水平上诱导特异性序列基因沉默的过程。 由于RNAi发生在转录后水平,所以又称为转录后基因沉默(post-transcriptional gene silencing, PTGS )。 RNA干扰是一种重要而普遍表观遗传的现象。
siRNA siRNA结构:21-23nt的双链结构,序列与靶 mRNA有同源性,双链两端各有2个突出非 配对的3’碱基。 siRNA功能:是RNAi 作用的重要组分,是 RNAi发生的中介分子。内源性siRNA是细胞 能够抵御转座子、转基因和病毒的侵略。
siRNA介导的RNAi
siRNAi 的特点: 高效性和浓度依赖性 特异性 位置效应 时间效应 细胞间RNAi的可传播性 多基因参与及ATP依赖性
特点:具有高度的保守性、时序性和组织特异性 。 功能: miRNA 结构:21-25nt长的单链小分子RNA ,5′端有一个磷酸 基团,3′端为羟基,由具有发夹结构的约70-90个碱 基大小的单链RNA前体经过Dicer酶加工后生成。 特点:具有高度的保守性、时序性和组织特异性 。 功能:
siRNA介导的RNAi
都约在22nt左右,5’端是磷酸基,3'端是羟基 相同点/联系点 siRNA miRNA 长度及特征 都约在22nt左右,5’端是磷酸基,3'端是羟基 合成的底物 miRNA和siRNA合成都是由双链的RNA或RNA前体形成的 Dicer酶 依赖Dicer酶的加工,是Dicer的产物,所以具有Dicer产物的特点 Argonaute家族蛋白 都需要Argonaute家族蛋白参与 RISC组分 二者都是RISC组分,所以其功能界限变得不清晰,如二者在介导沉默机制上有重叠;产生了on target和off target的问题 作用方式 都可以阻遏靶标基因的翻译,也可以导致mRNA降解,即在转录水平后和翻译水平起作用 进化关系 可能的两种推论:siRNA是miRNA的补充,miRNA在进化过程中替代了siRNA
不同点/分歧点 siRNA miRNA 机制性质 往往是外源引起的,如病毒感染和人工插入dsRNA之后诱导而产生,属于异常情况 是生物体自身的一套正常的调控机制 直接来源 长链dsRNA 发夹状pre-miRNA 分子结构 siRNA是双链RNA,3‘端有2个非配对碱基,通常为UU miRNA是单链RNA 对靶RNA特异性 较高,一个突变容易引起RNAi沉默效应的改变 相对较低,一个突变不影响miRNA的效应 作用方式 RNAi途径 miRNA途径 生物合成,成熟过程 由dsDNA在Dicer酶切割下产生;发生在细胞质中 pri-miRNA在核内由一种称为Drosha酶处理后成为60nt的带有茎环结构的Precursor miRNAs (pre-miRNAs);这些pre-miRNAs在转运到细胞核外之后再由Dicer酶进行处理,酶切后成为成熟的miRNAs;发生在细胞核和细胞质中 Argonaute (AGO) 蛋白质 各有不同的AGO蛋白质 互补性(complementarity) 一般要求完全互补 不完全互补,存在错配现象 RISCs的分子量不同(Martinez and Tuschl, 2004; Martinez et al., 2002; Nykanen et al., 2001; Pham et al., 2004) siRISCs miRISCs/miRNP
不同点/分歧点 siRNA miRNA 各自的生物学功能不同 ⅰ抵抗病毒的防御机制(Pfeffer et al., 2004; Ding et al., 2004);ⅱ沉默那些过分表达的mRNA;ⅲ保护基因组免受转座子的破坏(Mello and Conte, Jr., 2004; Hannon, 2002; Tabara et al., 1999)-9; 对有机体的生长发育有重要作用(Rhoades et al., 2002) 重要特性 高度特异性 高度的保守性、时序性和组织特异性 作用机制 单链的siRNA结合到RISC复合物中,引导复合物与mRNA完全互补,通过其自身的解旋酶活性,解开siRNAs,通过反义siRNA链识别目的mRNA片段,通过内切酶活性切割目的片段,接着再通过细胞外切酶进一步降解目的片段。同时,siRNA也可以阻遏3′UTR具有短片断互补的mRNA的翻译(off target)。 成熟的miRNAs则是通过与miRNP核蛋白体复合物结合,识别靶mRNA,并与之发生部分互补,从而阻遏靶mRNA的翻译。在动物中,成熟的单链miRNAs与蛋白质复合物miRNP结合,引导这种复合物通过部分互补结合到mRNA的3′UTR(非编码区域),从而阻遏翻译。除此之外,miRNA也可以切割完全互补的mRNA。 加工过程 siRNA对称地来源于双链RNA的前体的两侧臂 miRNA是不对称加工,miRNA仅是剪切pre-miRNA的一个侧臂,其他部分降解。 对RNA的影响 降解目标mRNA;影响mRNA的稳定性 在RNA代谢的各个层面进行调控;与mRNA的稳定性无关 作用位置 siRNA可作用于mRNA的任何部位 miRNA主要作用于靶标基因3´-UTR区 生物学意义 siRNA不参与生物生长,是RNAi的产物,原始作用是抑制转座子活性和病毒感染 miRNA主要在发育过程中起作用,调节内源基因表达
五、其他表观遗传机制 除DNA甲基化、组蛋白修饰、染色质重塑、和RNA调控以外,还有遗传印迹、X染色体失活、转座、负突变等。 遗传印迹、X染色体失活的本质仍为DNA甲基化、组蛋白修饰、染色质重塑。
遗 传 印 迹 概念: 特点: 或称亲本印迹(parent imprinting) 是指基因组在传递遗传信息的过程中,通过基因组的化学修饰(DNA的甲基化;组蛋白的甲基化、乙酰化、磷酸化、泛素化等)而使基因或DNA片段被标识的过程。 特点: 基因组印迹依靠单亲传递某种性状的遗传信息,被印迹的基因会随着其来自父源或母源而表现不同,即源自双亲的两个等位基因中一个不表达或表达很弱。 不遵循孟德尔定律,是一种典型的非孟德尔遗传,正反交结果不同。
♀ ♂ 正 交 反 交 Igf-2 Igf-2m Igf-2m Igf-2 正常小鼠 矮小型小鼠 矮小型小鼠 正常小鼠 Igf-2m 正 交 反 交 Igf-2 Igf-2m ♀ ♂ Igf-2m Igf-2 正常小鼠 矮小型小鼠 矮小型小鼠 正常小鼠 Igf-2m Igf-2 Igf-2 Igf-2m 正常小鼠 矮小型小鼠
由正反交实验可以看出: 印迹基因的正反交结果不一致、不符合孟德尔定律。 小鼠 Igf-2 基因总是母本来源的等位基因被印迹,父本来源的等位基因表达,因此是母本印迹。 基因印迹使基因的表达受到抑制,导致被印迹的基因的生物功能的丧失。
基因印迹过程 基因组印迹的机制 印迹的形成 印迹形成于成熟配子,并持续到出生后。 印记的维持 印记的去除 印记的去除过程是发生在原始生殖细胞的早期阶段。 基因组印迹的机制 配子在形成过程中,DNA产生的甲基化、核组蛋白产生的乙酰化、磷酸化和泛素化等修饰,使基因的表达模式发生了改变。
X染色体失活 1961年M.F.Lyon就提出了关于雌性哺乳动物体细胞的两条X染色体中会有一条发生随机失活的假说,并认为这是一种基因剂量补偿的机制。以后的研究表明在给定的体细胞有丝分裂谱系中,有一条X染色体是完全失活并呈异染色质状态,而在另一个细胞谱系中同一条X染色体又可以是活化的且呈常染色质状态。 1996年G.D.Penny等发现X染色体的Xq13.3区段有一个X失活中心( X-inaction center,Xic),X-失活从Xic区段开始启动,然后扩展到整条染色体。
X染色体失活过程模式图
巴氏小体 失活X染色体即为巴氏小体。 失活X染色体特点: 组蛋白H4不被乙酰化 CpG岛的高度甲基化
参考文献 [1] 张永彪,褚嘉祜.表观遗传学与人类基因组.科学(上海),2007,59(3),34-37. [2] 梁前进,表观遗传学——理论·方法·研究进展(1).生物学通报,2007,42(10),4-7. [3] 张丽丽,吴建新. DNA甲基化----肿瘤产生的一种表观遗传学机制。遗传HEREDITAS (Beijing),28(7),2006,800—805. [4] 蒋智文 ,刘新光 ,周中军.组蛋白修饰调节机制的研究进展.生物化学与生物物理进展,2009,36(10):1252-1259. [5] 李文艺,表观遗传学及其研究进展. 。Journal of Anhui Agri .Sci.2009,37( 4):6358—6360.
谢谢!