RNA interference (RNAi)
1. 染色体结构的调控 2. 转录水平的调控 3. 转录后水平的调控 4. 翻译水平的调控 5. 翻译后水平的调控 基因表达的调控阶段 1. 染色体结构的调控 2. 转录水平的调控 3. 转录后水平的调控 4. 翻译水平的调控 5. 翻译后水平的调控
1. History and Discovery 反义RNA能够与野生型转录物复性配对形成双链RNA.
与靶RNA的一段单链区域结合的蛋白质会由于调节因子RNA与这段区域结合并形成双链体而被排除出去.
Post Transcriptional Gene Silencing in Petunia PTGS: Transformation of wild-type petunia (bottom left) with a transgene encoding a pigment protein can lead to loss of pigment (white areas) owing to cosuppression of the transgene and homologous endogenous plant gene. WT Plant with a pigment transgene
Establishing Polarity in C. elegans 1995年,Guo S等试图阻断秀丽新小杆线虫(C. elegans)中的par-1基因的表达。 设计: 反义RNA 特异性地阻断par-1基因的表达; 正义RNA 以期观察到基因表达的增强。 结果: 二者都同样地切断了par-1基因的表达途径。这是与传统上对反义RNA技术的解释不相符合。该研究小组一直没能给这个意外以合理解释。
Surprise 1995年,Guo S等试图阻断秀丽新小杆线虫(C. elegans)中的par-1基因的表达。 设计: 反义RNA 特异性地阻断par-1基因的表达; 正义RNA 以期观察到基因表达的增强。 结果: 二者都同样地切断了par-1基因的表达途径。这是与传统上对反义RNA技术的解释不相符合。该研究小组一直没能给这个意外以合理解释。
It is the double stand RNA 直到1998年2月,Fire A和Mello C才首次揭开这个悬疑之谜。 他们将体外转录得到的单链RNA纯化后注射线虫时发现,基因抑制效应变得十分微弱;而经过纯化的双链RNA却正好相反,能够高效特异性阻断相应基因的表达。 他们证实,Guo S博士遇到的正义RNA抑制基因表达的现象,以及过去的反义RNA技术对基因表达的阻断,都是由于体外转录所得RNA中污染了微量双链RNA而引起。 该小组将这一现象称为RNA干扰(RNA interference,简称RNAi)。
RNAi广泛存在于自然界 随后,RNAi现象被广泛地发现于真菌、拟南芥、水螅、涡虫、锥虫、斑马鱼等大多数真核生物中。
2. Cellular mechanism A: dsRNA cleavage http://en.wikipedia.org/wiki/Image:SiRNAvitro.gif
当dsRNA导入细胞后,被一种dsRNA特异的核酸内切酶识别,切割成21-23核苷酸长的小片段,这些片段可与该核酸酶的dsRNA结合结构域结合,并且作为模板识别目的mRNA。 识别之后,mRNA与dsRNA的有义链发生链互换,原先dsRNA中的有义链被mRNA代替,从酶-dsRNA复合物中释放出来,而mRNA则处于原先的有义链的位置。 核酸酶在同样位置对mRNA进行切割,这样又产生了21-23核苷酸长的dsRNA小片段,与核酸酶形成复合物,继续对目的mRNA进行切割,从而使目的基因沉默,产生RNAi现象。 通过遗传分析的方法,目前已从线虫中已分离到RDE-2,RDE-3和Mut-7等RNAi相关的基因。 一种称为Dicer 的核酸酶负责将dsRNA 转化为siRNA 。 它属于RNase Ⅲ家族,具有两个催化结构域、一个解旋酶( helicase) 结构域和一个PAZ ( Piwi/ Argonaute/ Zwille ) 结构域, Dicer 在催化过程中以二聚体的形式出现, 其催化结构域在dsRNA 上反平行排列, 形成四个活性位点, 但只有两侧的两个位点有内切核酸酶活性, 这两个位点在相距约22bp 的距离切断dsRNA , 各种生物体内Dicer 结构略有不同, 致使siRNA 长度存在微小差别。 许多研究显示RNAi 过程中有新的dsRNA 分子的合成。 当siRNA 反义链识别并结合靶mRNA 后, siRNA 反义链可作为引物, 以靶mRNA 为模板在依赖于RNA 的RNA 聚合酶(RNA dependent RNA polymerase , RdRP) 催化下合成新的dsRNA , 然后由Dicer 切割产生新的siRNA , 新siRNA 再去识别新一组mRNA, 又产生新的siRNA , 经过若干次合成2切割循环, 沉默信号就会不断放大。
siRNA具相似的结构特征: 为长约21~23bp 的双链RNA ,具5’单磷酸和3’羟基末端, 互补双链的3’端均有一个2~3nt 的单链突出。
B: micro RNA (miRNA) 生物体中有一群小RNA(目前看来人体中编码约255种小RNA,竟占整个基因组近1%,很多可能编码自以前被认为的“垃圾DNA”)可以影响蛋白表达水平,从而控制细胞的多种生命活动. 尤其在发育过程中2003年有一些激动人心的最新发现: 仅约22个核苷酸长度的小RNA,发现竟能引导早期发育——从使植物叶片成形到介导果蝇胚胎在植物组织中的细胞增殖; 缺少RNAi蛋白Dicer(一种RNA酶III家族的酶,参与RNAi过程中对RNA的剪切)的小鼠会缺少干细胞的某些分化系(swathsofstemcells),在出生前就夭折; 小鼠中特定的小RNA能帮助引导干细胞生成胚胎的血细胞系统. 1)抗病毒功能 Voinnet和Li等分别在植物和果蝇中发现了通过RNAi实现的抗外源核酸机制:被大多数RNA病毒启动的RNAi可导致病毒基因组降解。 例如在果蝇细胞中,Flock house virus(FHV)就能引发果蝇内部的RNAi反应,产生FHV特异性的siRNA来降解感染的FHV。 2)基因调控 目前在人、蠕虫,果蝇和植物等生物体中都发现了小RNA,有的通过结合3‘非翻译区(UTR)和靶mRNA抑制mRNA翻译,有的作为siRNA通过RNAi机制破坏靶基因转录本。 3)染色质浓缩 内源的一些siRNA可能通过使染色质浓缩调节基因表达。 一些研究小组发现dsRNA结合到植物启动子区域能通过一种使DNA甲基化的作用导致基因沉默; 在蠕虫体内检测到许多Polycomb蛋白(能结合染色质)是RNAi过程所必须的; 裂殖酵母中内源siRNA可介导中心粒区染色质浓缩,导致这个位点的基因转录沉默。如Vera Schramke等在裂殖酵母中通过合成shRNA反式抑制同源位点,导致在mate区沉默的Swi6染色质浓缩。 这些结果都提示一些内源性的siRNA通过导致染色质浓缩来调节基因水平。 4)转座子沉默 目前,两方面的证据提示转座子沉默涉及siRNA。 其一,发现蠕虫mut-7基因参与RNAi和转位抑制。 其二,从裂殖酵母的中心粒区也分离出siRNA,并检测到这些siRNA介导此区内组蛋白甲基化。由于中心粒区包含重复序列——含转座子片段,在一些减数分裂基因中也发现了通过其附近的逆转录转座子LTR(长末端重复序列)介导的RNAi,推测在siRNA介导的中心粒区域的组蛋白甲基化可能源于古老的转座子沉默作用。 5)基因组重组 siRNA可能参与纤毛虫,四膜虫虫体间结合时的基因重组。 结合到重组序列的siRNA,在虫体之间的结合过程中介导DNA缺失和染色体断裂。 有趣的是,在这些siRNA介导的程序性DNA删除事件中,也发现需要重组区域组蛋白的甲基化。 http://en.wikipedia.org/wiki/Image:Rnai_diagram_retrovirology.png
3. CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) are direct repeats found in the DNA of many bacteria and archaea. These repeats range in size from 24 to 48 base pairs. They usually show some dyad symmetry but are not truly palindromic. The repeats are separated by spacers of similar length. Spacers are usually unique in a genome. Some spacer sequences match sequences in phage genomes; it was proposed, and more recently demonstrated, that these spacers can be derived from phage and subsequently help protect the cell from infection. Consequently, an active CRISPR repeat array may evolve rapidly. Different strains of the same species of bacterium often can be differentiated according to differences in the spacers in their CRISPR arrays, a technique called . Sets of genes have been described recently that are found only in genomes that contain CRISPR repeats, and almost always near the repeats themselves. Such CRISPR-associated genes are called cas genes. More than forty different Cas protein families have been described. The most important of these is Cas1, which is present in almost every CRISPR/Cas system. Particular combinations of cas genes are found together regularly, along with characteristic subclasses of CRISPR repeat and corresponding subfamilies of the Cas1 family. These combinations appear to represent distinct CRISPR/Cas subtypes; several different subtypes may occur in a single genome. The sporadic distribution of each CRISPR/cas subtype suggests that these elements undergo numerous horizontal gene transfer events during microbial evolution. In the bacteria E. coli the CasA-E proteins form a functional complex, Cascade, that process CRISPR RNA transcripts into spacer-repeat units that are retained by Cascade. CRISPR-based phage inactivation in E. coli requires Cascade and Cas3, but not Cas1 and Cas2. The understanding of the mechanism of action of CRISPR systems has progressed very quickly in the past few years; it may indeed represent a prokaryotic analog of eukaryotic RNA interference systems that provides bacteria with a form of acquired immunity.
4. Small RNA-induced gene activation (RNAa) Small double-stranded RNA (dsRNA) has been found to silence gene expression by an evolutionally conserved mechanism known as RNA interference or RNAi. Such dsRNAs are called small interfering RNAs or siRNA. RNAi can occur at both transcriptional and post-transcriptional levels. Surprisingly, two recent studies have found that dsRNA can also activate gene expression, a mechanism that has been termed "small RNA-induced gene activation" or RNAa.[1][2][3] It has been shown that dsRNAs targeting gene promoters induce potent transcriptional activation of associated genes. Both studies demonstrate RNAa in human cells using synthetic dsRNAs termed small activating RNAs (saRNAs). Endogenous miRNA that cause RNAa has also been found in humans.[4] It is currently unknown if RNAa is conserved in other organisms. Another surprising observation is that gene activation by RNAa is long-lasting. Induction of gene expression has been seen to last for over ten days. The prolonged effect of RNAa could be attributed to epigenetic changes at dsRNA target sites.
5. Preparation of siRNAs (1)从mRNA 的AUG起始密码开始,寻找“AA”二连序列,并记下其3'端的19个碱基序列,作为潜在的siRNA靶位点。有研究结果显示GC含量在30%—50%左右的siRNA要比那些GC含量偏高的更为有效。 Tuschl等建议不要针对5'和3'端的非编码区(untranslated regions,UTRs)。这些地方有丰富的调控蛋白结合区域,而这些UTR结合蛋白或者翻译起始复合物可能会影响siRNP核酸内切酶复合物结合mRNA从而影响siRNA的效果。 (2)将潜在的序列和相应的基因组数据库(人,或者小鼠,大鼠等等)进行比较,排除那些和其他编码序列/EST同源的序列。例如使用BLAST (3)选出合适的目标序列进行合成。通常一个基因需要设计多个靶序列的siRNA,以找到最有效的siRNA序列。 一个完整的siRNA实验应该有负对照。 作为负对照的siRNA应该和选中的siRNA序列有相同的组成,但是和mRNA没有明显的同源性。 通常的做法是将选中的siRNA序列打乱,同样要检查结果以保证它和其他基因没有同源性。
尽管化学合成是最贵的方法,但是却是最方便的——研究人员几乎不需要做什么工作。许多公司都可以根据用户要求提供高质量的化学合成siRNA。 主要的缺点包括价格高,定制周期长,特别是有特殊需求的。 由于价格比其他方法高,为一个基因合成3—4对siRNAs 的成本就更高了,比较常见的做法是用其他方法筛选出最有效的序列再进行化学合成。 最适用于:已经找到最有效的siRNA的情况下,需要大量siRNA进行研究; 不适用于:筛选siRNA等长时间的研究,主要原因是价格因素. (3)用RNase III 消化长片断双链RNA制备siRNA 其他制备siRNA的方法的缺陷是需要设计和检验多个siRNA序列以便找到一个有效的siRNA。 这种方法——制备一份混合有各种siRNAs “混合鸡尾酒” 就可以避免这个缺陷。 这个方法是选择通常是200—1000碱基的靶mRNA模版,用体外转录的方法制备长片段双链dsRNA ,然后用RNase III (or Dicer) 在体外消化,得到一众siRNAs“混合鸡尾酒”。 在除掉没有被消化的dsRNA后,这个siRNA混合物就可以直接转染细胞,方法和单一的siRNA转染一样。 由于siRNA混合物中有许多不同的siRNAs,通常能够保证目的基因被有效地抑制。 dsRNA消化法的主要优点在于可以跳过检测和筛选有效siRNA序列的步骤,为研究人员节省时间和金钱(注意:通常用RNAse III比用Dicer要便宜)。 不过这种方法的缺点也很明显,就是有可能引发非特异的基因沉默,特别是同源或者是密切相关的基因。 现在多数的研究显示这种情况通常不会造成影响(1-4)。 最适用于:快速而经济地研究某个基因功能缺失的表型 不适用于:长时间的研究项目,或者是需要一个特定的siRNA进行研究,特别是基因治疗
B 值得一提的是体外转. 录得到的siRNAs毒性小,稳定性好,效率高,只需要化学合成的siRNA量的1/10 就可. 以达到化学合成siRNA所能达到的效果,从而使转染效率更高。值得一提的是体外转录得到的siRNAs只要较低的浓度就可以达到化学合成siRNAs较高浓度得到的效果。 (0.5-20 nM vs. 50-100 nM per transfection) (2)体外转录 相对化学合成法而言成本比较低,是一种性价比高的筛选siRNAs的好方法。 更重要的是能够更快的得到siRNAs。 值得一提的是体外转录得到的siRNAs只要较低的浓度就可以达到化学合成siRNAs较高浓度得到的效果。 不足之处:实验的规模受到限制,虽然一次体外转录合成能提供足够做数百次转染的siRNAs,但是反应规模和量始终有一定的限制。 最适用于:筛选siRNAs,特别是需要制备多种siRNAs,化学合成的价格成为障碍时。 不适用于:实验需要大量的,一个特定的siRNA。长期研究。 (4)siRNA表达载体 多数的siRNA表达载体依赖3种RNA聚合酶III 启动子(pol III)中的一种,操纵一段小的发夹siRNA在哺乳动物细胞中的表达。包括的人源和鼠源的U6启动子和人H1启动子。 之所以采用RNA pol III启动子是由于它可以在哺乳动物细胞中表达更多的小分子RNA,而且它是通过添加一串(3到6个)U来终止转录的。 使用这类载体,需要2段编码短发夹RNA序列的DNA单链,退火,克隆到相应载体的pol III 启动子下游。 由于涉及到克隆,这个过程需要几天的时间,同时也需要经过测序以保证克隆的序列是正确的。 不过幸好载体容易大量扩增,这个优点足以弥补所有缺陷,特别是当载体在实验中确实有效的时候。
毫无疑问,siRNA表达载体的优点在于这是众多方法中唯一可以进行长期研究的方法——带有抗生素标记的载体可以在细胞中持续抑制靶基因的表达,持续数星期甚至更久。 即使是对转染带有筛选标记质粒的细胞进行瞬时筛选,也有助于富集带质粒的细胞。这也可以帮助解决一些难转染的细胞由于转染效率低造成的问题。 开始研究逆转录病毒和其他病毒载体用于siRNA表达,其优势在于可以直接高效率感染细胞进行基因沉默的研究,避免由于质粒转染效率低而带来的种种不便。 最适用于:已知一个有效的siRNA序列,需要维持较长时间的基因沉默,或者需要用抗生素筛选能表达siRNA的细胞。长期研究。 不适用于:筛选siRNA序列(其实主要是指需要多个克隆和测序等较为费时、繁琐的工作)
C (5) siRNA表达框架 siRNA表达框架(siRNA expression cassettes,SECs)是一种由PCR得到的siRNA表达模版,能够直接导入细胞进行表达而无需事前克隆到载体中。 这个方法最早是由Castanotto采用,包括一个RNA pol III启动子,一段发夹结构siRNA,一个RNA pol III终止位点。 和siRNA表达载体不同的是,SECs不需要载体克隆、测序等颇为费时的步骤,可以直接由PCR得到,不用一天的时间。 因此,SECs成为筛选siRNA的最有效工具,甚至可以用来筛选在特定的研究体系中启动子和siRNA的最适搭配! 如果在PCR两端添加酶切位点,那么通过SECs筛选出的最有效的siRNA后,可以直接克隆到载体中构建siRNA表达载体。 构建好的载体可以用于稳定表达siRNA和长效抑制的研究。 这个方法的主要缺点是PCR产物很难转染到细胞中。如果有适合的新型转染试剂能提高SEC的转染效率的话,那问题就可以解决了。另外,没有克隆到载体中的PCR片断并不适于大规模制备。 最适用于:筛选siRNA序列,在克隆到载体前筛选最佳启动子; 不适用于:长期抑制研究。(如果克隆到载体后就可以了) 。