第八章 药物转录组学
第一节 转录组学概述
(一)转录组(transcriptome)指生命单元(通常是一种细胞)所能转录出来的可直接参与蛋白质翻译的mRNA(编码RNA)总和,而其他所有非编码RNA均可归为RNA组(RNome)。
(二)转录组与基因组的关系 1.转录组来自于基因组,量小得多但重要(人类基因组包含有30亿个碱基对,其中大约只有3万个基因转录成mRNA分子,转录后的mRNA能被翻译生成蛋白质的也只占整个转录组的40%左右)。 2.转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。
(三)转录组学(transcriptomics)是在整体水平上研究细胞编码基因转录情况及转录调控规律的科学。 转录组学研究方法: 1.基因芯片技术 2. 基因表达系列分析(Serial Analysis of Gene Expression,SAGE) 3.大规模平行信号测序系统 4. RNA测序技术
1.基因芯片技术 基因芯片(gene chip)又称 DNA 芯片,指将大量(通常每平方厘米点阵密度高于 400 )探针分子固定于支持物上后与标记的样品分子进行杂交,通过检测每个探针分子的杂交信号强度进而获取样品分子的数量和序列信息。
按用途分 表达谱芯片 诊断芯片 指纹图谱芯片 测序芯片 毒理芯片 芯片实验室是生物芯片技术发展的最终目标
基因芯片的特点: 操作简单 自动化程度高 序列数量大 检测效率高 应用范围广 成本较低
DNA芯片技术步骤 芯片制备 实性材料:硅芯片、玻片和瓷片 需进行预处理,使其表面衍生出羟基、氨基活性基团。 膜性材料:聚丙烯膜、尼龙膜、硝酸纤维膜 通常包被氨基硅烷或多聚赖氨酸
样品制备 样品分离纯化 扩增 标记 DNA , mRNA PCR, RT—PCR,固相PCR 荧光标记(常用Cy3、Cy5),生物素、放射性标记
分子杂交 影响杂交反应的因素: 样品与DNA芯片上的探针阵列进行杂交。 与经典分子杂交的区别: 杂交时间短,30分钟内完成 可同时平行检测许多基因序列 影响杂交反应的因素: 盐浓度、温度、反应时间、DNA二级结构
④检测分析 激光激发使含荧光标记的DNA片段发射荧光 激光扫描仪或激光共聚焦显微镜采集各杂交点的信号 软件进行进行图象分析和数据处理
2.基因表达系列分析 基因表达系列分析(Serial Analysis of Gene Expression,SAGE)是通过快速和详细分析成千上万个EST(express sequenced tags)来寻找出表达丰富度不同的SAGE标签序列,从而比较完整地获得基因组的表达信息。 SAGE能够快速、全范围提取生物体基因表达信息,对已知基因进行量化分析。SAGE也能应用于寻找新基因。
EST(Expressed Sequence tags,表达序列标签 )是从已建好的cDNA库中随机抽取克隆,从5’末端或3’末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。
SAGE的主要依据 第一,一个9~10碱基的短核苷酸序列标签包含有足够的信息,能够唯一确认一种转录物。 第二,如果能将9碱基的标签集中于一个克隆中进行测序,并将得到的短序列核苷酸顺序以连续的数据形式输入计算机中进行处理,就能对数以千计的mRNA转录物进行分析。
SAGE的主要过程 第一阶段:SAGE文库的构建 ①以biotin-oligo dT为引物将mRNA反转录合成双链cDNA,经锚定酶(Anchoring Enzyme, AE)酶(如Nla Ⅲ、Sau3AⅠ等)切后收集cDNA的3’端部分。
anchor 锚,靠山 synthesis 综合物 zyme酶,病菌 enzyme酶
②将收集的3’端cDNA等分为两部分,分别同接头A、B相连接。每一种接头的结构都由PCR扩增引物A或B的序列、标签酶识别位点和锚定酶识别位点三部分组成。 标签酶(Tagging Enzyme, TE)是一种IIS类限制性内切酶,如BsmF I等,它在距识别位点下游约20bp的位置切割DNA双链。
③连接产物以标签酶酶切后用Klenow酶补平5’突出端,得到两组分别带有接头A、B的短cDNA片段(约50bp)。混合并连接两组短cDNA片段,形成一个约100bp的双标签体(ditag)群,并以引物A和B对其进PCR扩增。
ample充足的amplifiy增强 放大
④用锚定酶切割扩增产物,分离纯化去除接头后的双标签体(约26bp),并使之相互连接成为大片段的连接体,克隆至质粒载体内形成一个SAGE文库以备集中测序。
第二阶段:SAGE文库的测序 第三阶段:标签序列的提取 对测序得到的标签数据进行分析处理。在所测得序列中的每个双标签体之间由锚定酶序列相间隔,每一标签序列是否出现以及出现的频率将代表基因是否表 达以及表达的水平。一般一个测序反应的结果可得到约20个双标签体,亦即包含了约40个转录本的信息。
3.大规模平行信号测序系统 大规模平行信号测序系统MPSS(massively parallel signature sequencing,MPSS)是以基因测序为基础的新技术,其方法学基础是一个标签序列(10-20bp)含有能够特异识别转录子的信息,标签序列与长的连续分子连接在一起,便于克隆与序列分析。通过定量测定可以提供相应转录子的表达水平,也就是将mRNA的一端测出一个包含10-20个碱基的标签序列,每一个标签序列在样品中的频率(拷贝数)就代表了与该标签相应的基因表达水平。
技术方法 (1) 首先将cDNA 模板体外“克隆”到直径5μm的微球体上。“克隆”的方法主要是利用人工设计长度不同的两类互补寡核苷酸,分别与cDNA 模板和微球体连接之后,再将cDNA 模板与微球体连接起来。为了能装载下细胞内所有的cDNA 模板(若以3~4 ×104 个基因计算) ,寡核苷酸的数量至少应该要比模板的量多100 倍以上。
(2) 用DpnII 酶切处理微球体上的cDNA 模板,形成粘性末端。 (3) 用含有II 型限制性内切酶Bbv1 识别位点的不同寡核苷酸接头与连接在微球体上的cDNA 模板相连接,另外每一种接头的3’端还带有一个荧光标记,可与荧光探针杂交,产生荧光信号,该信号可以反映出接头5’端与模板cDNA 杂交的不同位置上的碱基信息,从而获取模板cDNA 的序列信息。
(4) 分别加入能产生红黄蓝绿杂交信号的四套荧光探针,进行杂交, 每次杂交完毕用洗脱液清洗微球体阵列,除去上一轮杂交的荧光探针。用显微拍照的方法记录荧光信号,并将四种信号的图像输入计算机储存。 (5) 用II 型限制性酶Bbv1 进一步消化cDNA模板,Bbv1 能在距识别位点约13 个碱基的位置切割cDNA 双链,并在cDNA 模板上产生下4 个碱基末端。
(6) 洗脱除去寡核苷酸接头,经过Bbv1 酶切后的cDNA 模板,进入下一轮分析。重复(3) ~ (5) 的步骤4~5 次后,分析所得到的16~20 张荧光显微照片,就可以读出微球体阵列中每一个微球体上长度为16~20bp 的cDNA 模板序列。
三者比较 芯片无法同时大量地分析组织或细胞内基因组表达的状况,而且由于芯片技术需要准备基因探针,所以可能漏掉那些未知的、表达丰度不高的、可能是很重要的调节基因。SAGE是近年来发展的以测序为基础的分析特定组织或细胞类型中基因群体表达状态的一项技术。其显著特点是快速高效地、接近完整地获得基因组的表达信息。SAGE可以定量分析已知基因及未知基因表达情况,在疾病组织、癌细胞等差异表达谱的研究中,SAGE可以帮助获得完整转录组学图谱、发现新的基因及其功能、作用机制和通路等信息。
MPSS是对SAGE的改进,它能在短时间内检测细胞或组织内全部基因的表达情况,是功能基因组研究的有效工具。因其需要配套的软硬件较为昂贵,目前国内外的相关应用报道不多。MPSS技术对于致病基因的识别、揭示基因在疾病中的作用、分析药物的药效等都非常有价值,该技术的发展将在基因组功能方面及其相关领域研究中发挥巨大的作用。
4.RNA测序技术 RNA-seq即转录组测序技术,就是把mRNA,smallRNA,and NONcoding RNA等或者其中一些用高通量测序技术把它们的序列测出来。反映出它们的表达水平。 优点:(1)避免亚克隆引入的偏差; (2)测定序列更长更精确; (3)可得到转录可变剪接序列; (4)准确检测低表达基因,定量转录水平。
(三)转录组学的意义 以DNA为模板合成RNA的转录过程是基因表达的第一步,也是基因表达调控的关键环节。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。通过测序技术揭示造成差异的情况,已是目前最常用的手段。
第二节 转录组学在药学中的应用
一、药靶候选基因的鉴定 药物靶标是指体内具有药效功能并能被药物作用的生物大分子,如某些蛋白质和核酸等生物大分子。那些编码靶标蛋白的基因也被称为靶标基因。事先确定靶向特定疾病有关的靶标分子是现代新药开发的基础。
发现药物靶标的途径 有效单体化合物 基因表达差异 蛋白质表达差异 蛋白质相互作用等 基因表达和疾病发生发展有时间空间差异
二、反义药物和siRNA药物 (一)反义药物 反义技术(antisense technology)是通过碱基互补原理,干扰基因的解旋、复制、转录、mRNA的剪接加工乃至输出和翻译等各个环节,从而调节细胞的生长、分化等。 根据结合部位的不同分为反义DNA(asDNA)、反义RNA(asRNA)、自催化性核酶(ribozyme)。
根据反义RNA的作用机制可将其分为3类: Ⅰ类反义RNA直接作用于靶mRNA的S D序列和(或)部分编码区,直接抑制翻译,或与靶mRNA结合形成双链RNA,从而易被RNA酶Ⅲ 降解; Ⅱ类反义RNA与mRNA的非编码区结合,引起mRNA构象变化,抑制翻译; Ⅲ类反义RNA则直接抑制靶mRNA的转录。
反义DNA是指能与靶DNA或靶RNA互补结合的短小DNA分子,主要指反义寡核苷酸。 核酶(ribozyme)是具有酶活性的RNA,主要参加RNA的加工与成熟。天然核酶可分为四类: (1)异体催化剪切型,如RNaseP; (2)自体催化的剪切型,如植物类病毒、拟病毒和卫星RNA; (3)第一组内含子自我剪接型,如四膜虫大核26SrRNA; (4)第二组内含子自我剪接型。
反义药物 通常指反义寡核苷酸(ODNs), 即其核苷酸序列可与靶mRNA或靶DNA互补, 抑制或封闭基因的转换和表达,或诱导RnaseH 识别或切割mRNA, 使其丧失功能。
反义药物与传统药物的性质和作用对象明显不同 表现为: 1、新的化学物质-核酸; 2、新的药物受体-mRNA,DNA; 3、新的受体结合方式-Watson-Crick杂交; 4、新的药物受体结合后反应-如RNase H介导的靶RNA的降解。
反义药物与传统药物相比具有以下优点: 1、特异性较强。一个15聚体的反义寡核苷酸含有30-45氢键,而低分子的传统药物(200-600u)与靶点一般只形成1-4个键; 2、信息量较大。遗传信息从DNA-RNA-蛋白质,用互补寡核苷酸阻断某种蛋白的合成是很准确的; 3、反义药物以核酸为靶点,与蛋白质作为靶点比较,更易合理设计新药物。 4、比传统药物更具选择性及效率,副作用可能更少。
(二)siRNA药物 小干扰RNA(Small interfering RNA;siRNA)是一个长21到25个核苷酸的双股RNA,可以阻断异常蛋白的产生。 RNA干扰(RNA interference, RNAi)是由同源双链RNA(dsRNA)诱导序列特异的目标基因沉寂,阻断基因活性的现象。
病毒基因、人工转入基因、转座子等外源性基因随机整合到宿主细胞基因组内,并利用宿主细胞进行转录时,常产生一些dsRNA。 胞质中的核酸内切酶Dicer将dsRNA切割成多个具有特定长度和结构的小片段RNA(大约21~23 bp),即siRNA。
siRNA在细胞内RNA解旋酶的作用下解链成正义链和反义链,继之由反义siRNA再与体内一些酶(包括内切酶、外切酶、解旋酶等)结合形成RNA诱导的沉默复合物(RNA-induced silencing complex,RISC)。 RISC与外源性基因表达的mRNA的同源区进行特异性结合,RISC具有核酸酶的功能,在结合部位切割mRNA,切割位点即是与siRNA中反义链互补结合的两端。
siRNA不仅能引导RISC切割同源单链mRNA,而且可作为引物与靶RNA结合并在RNA聚合酶(RNA-dependent RNA polymerase,RdRP)作用下合成更多新的dsRNA,新合成的dsRNA再由Dicer切割产生大量的次级siRNA,从而使RNAi的作用进一步放大,最终将靶mRNA完全降解。
siRNA设计应注意: ①物种特异性 ②靶标一般在CDS区 ③siRNA的转染效率
三、转录组学在药用植物中的应用 四、转录组在代谢工程领域的应用 三、转录组学在药用植物中的应用 四、转录组在代谢工程领域的应用