第五章 核酸的序列测定 易发平 基础医学院生物化学与分子生物学教研室
DNA的测序是分子生物学研究中非常重要和关键的内容。对DNA一级结构的研究,有助于探索基因结构与功能、基因与疾病关系,进而推动生命科学研究获得质的飞跃。测定基因组的全部核苷酸序列、阅读和分析全部遗传信息,正是人类基因组计划(human genome project, HGP)的最主要目标之一。
将DNA片段用荧光等分析仪,测出DNA序列碱基排列顺序。 1. Sanger的双脱氧法:A/T/G/C四个反应。 2.化学降解法:G反应;G+T反应;T+C反应和C反应。 3.自动测序法。
DNA 测序的主要方法有两种,即双脱氧链终止法(Sanger 法、酶促法)和化学裂解法(Maxam-Gelbert 法)。二者均依赖于高分辨率的变性聚丙烯酰胺凝胶电泳(PAGE)。不管是酶促法还是化学法,都是分为4个反应体系进行测序反应,寡核苷酸链分别终止于不同位置的A、T、G或C碱基。4种反应体系的寡核苷酸链产物,进行变性聚丙烯酰胺凝胶电泳,放射自显影后,读出待测DNA的连续序列。
一、 Sanger 双脱氧链终止法 (一)原理(单链) DNA链中的核苷酸是以3`,5`-磷酸二酯键相连接,合成DNA所用的底物是2`-脱氧核苷三磷酸(dNTP),在Sanger 双脱氧链终止法中被掺入了2`,3`-双脱氧核苷三磷酸(ddNTP),当ddNTP位于链延伸末端时, 由于它没有3`- OH,
不能再与其它的脱氧核苷酸形成3′,5′-磷酸二酯键,DNA合成便在此处终止,如果此处掺入的是一个ddATP,则新生链的末端就是A,依次类推可以通过掺入ddTTP、 ddCTP、 ddGTP ,则新生链的末端为T、C或G,根据这个原理,Sanger与1977年建立了双脱氧链终止测序法。他本人也因此而获得了诺贝尔奖。
Sanger
双脱氧核苷三磷酸 互补链合成过程
以单链或双链DNA为模板,采用DNA引物引导新生DNA的合成,因此又称为引物合成法,或酶促引物合成法。主要是基于DNA聚合酶的催化特性:①以DNA为模板,根据碱基配对的原则逐个将dNTP加到与模板结合的寡核苷酸引物的3′-OH末端,形成正确的模板DNA互补链;②能以dNTP作为底物,也能利用ddNTP作底物,将其掺入寡核苷酸链的3 ′末端而终止新生互补链的延伸。
如果在DNA的合成反应中,除了加入4种正常的脱氧核苷三磷酸(dNTP)外,再加入一种少量的2ˊ,3ˊ ddNTP,那么多核苷酸链的延伸将与偶然发生但却十分特异的链终止展开竞争,所以反应产物是一系列的长短不一的核苷酸链。 在4组独立的DNA合成反应中,分别加入4种不同的ddNTP,结果将生成4组核苷酸链,它们将分别(随机)终止于每一个A,每一个G,每一个C,每一个T的位置上。对这4组核苷酸链进行聚丙烯酰胺凝胶电泳,就可读出序列。
在测序反应中通常设置4个反应,各反应管中同时加入一种DNA模板和引物、DNA聚合酶I(失去5′ 3′外切核酸酶活性)、其中一管中分别加入一种 ddNTP ( 如ddTTP、dTTP)以及其它三种dNTP( dATP 、dCTP 、dGTP ),引物末端用放射性核素标记, ddTTP的比例很小(1:10),因此掺入的位点是随机的,经过适当的条件下温育,将会有不同长度的DNA片段合成。它们都具有相同的5′末端,3′末端都因掺入了ddTTP而以T结尾。在其它三管中同理加入相应的ddNTP。
Sanger双脱氧测序方法示意图
双脱氧法测序原理示意图
(二)DNA序列测定的策略 1、测序载体和引物 双脱氧链终止法测定DNA序列时,通常是将待测片段先克隆到M13载体(如M13mp18和M13mp19)或质粒载体(如pUC18和pUC19)。克隆于M13载体,可获得单链模板。克隆于pUC载体,则是直接采用双链DNA作为测序模板,待测DNA克隆到质粒载体后,通过碱变性处理重组载体,使测序引物便于结合模板DNA。
任何待测DNA序列的片段克隆于上述载体后,都可按克隆位点两侧的载体序列设计和合成寡核苷酸片段作为“通用引物”,该类引物可以与载体DNA序列互补结合,并以待测DNA为模板引导合成新生链,用双脱氧终止法进行序列测定。
载体 DNA片段 酶切,连接 设计通用引物
2、大片段DNA序列测定的策略 (1)鸟枪法 将长链DNA片段随机断裂成适于序列测定的片段(300-600bp),断裂方法有超声波处理、核酸酶I法和限制酶切割法。 (2)嵌套缺失法(nested deletion,Erase-a-base) ①首先将大片段克隆到测序载体; ②选用两种限制酶从待测DNA片段与载体序列之间将DNA切断,使切割后近载体端为3`突出的粘性末端,近待测DNA的末端为5`突出的粘性末端或平端;
③用外切核酸酶III消化上述线性DNA(37C,250核苷酸/min),在不同时间终止反应,可以获得在同一端缺失并依次相差200-250bp的DNA片段。 ④用核酸酶S1消化末端的单链,使之成平端,经T4 DNA连接酶连接环化,得到一套缺失长度不同的DNA片段克隆; ⑤将各个克隆从其缺失端开始用通用引物测序。由于引物相同,测序结果可以从子片段序列的相互重叠部分准确无误地将相邻片段的序列拼接起来。
目的片段 E E B B 引物 BamH I
3` 5` Exo III S1 T4 ligase
tttgggcccaaa atcggggctg……ggcatagt tttgggcccaaa ggcatagt……….cgatcag 测序 引物 tttgggcccaaa atcggggctg……ggcatagt tttgggcccaaa ggcatagt……….cgatcag tttgggcccaaa cgatacgcg…..tcagtcgtag tttgggcccaaa tcgtagcgtagcta…..gggaa 拼接方向 每次测序的长度是有限的
原理解析: A.该法巧妙地利用exoIII的酶学特征,它有3`5`外切酶活性,它只能从dsDNA的平端或5‘突出末端起始消化,而不能切ssDNA的3`末端(即突出末端)。 B.水解速度较均匀,在37 C,每分钟可降解250个核苷酸,因此,在一定的时间间隔内取样终止反应,可以得到依次相差200-250个碱基对的DNA片段。
C. exoIII能从DNA的切口处进行3`5`外切,因此,样品不能有切口存在,操作时用含有50mmol/LpH4 C. exoIII能从DNA的切口处进行3`5`外切,因此,样品不能有切口存在,操作时用含有50mmol/LpH4.0 NaOAC(醋酸钠 )的酚代替普通的pH7.0的酚去除有切口的DNA分子。 D.exoIII能被微量的NaCl 强烈抑制,因此,样品DNA必须用酚/氯仿抽提和酒精沉淀。
(3)引物延伸法 从DNA的3′端依赖特定引物延伸测定一段DNA序列,再根据测得序列设计新的引物,如此逐步推进。
一轮 随机引物 二轮 测出的序列 作为二轮的引物 三轮
二、Maxam-Gilbert化学修饰法 几乎与双脱氧链终止法建立的同时,Maxam和Gilbert于1977年建立了一种以化学修饰为基础的DNA序列分析法,称为Maxam-Gilbert化学修饰法。
基本原理:用化学试剂处理具末端放射性标记的DNA片段,造成碱基的特异性切割,由此产生一组具有各种不同长度的DNA链的反应混和物,经凝胶电泳按大小分离和放射自显影,便可根据X线片底板上显示相应带谱,直接读出待测DNA片段的核苷酸顺序。
化学修饰法的待测DNA片段有的是双链,有的是单链DNA。在进行碱基特异性化学切割反应前,首先对待测DNA片段作末端标记,使其末端(5′端或者是3′端)带上放射标记。如果待测DNA是双链,必须使其形成末端标记的单链。
对末端标记的DNA链进行化学断裂反应分两步进行: 第一步是在4个反应管中分别以肼、硫酸二甲酯(DMS)和甲酸对特定的碱基进行化学修饰; 第二步是以六氢吡啶取代被修饰的碱基并将DNA链断裂。
DNA化学裂解反应体系 G 硫酸二甲酯 鸟嘌呤甲基化 六氢吡啶 G G+A 甲酸 脱嘌呤作用 六氢吡啶 G和A 反应体系 碱基修饰试剂 碱基修饰反应 主链断裂试剂 断裂点 G 硫酸二甲酯 鸟嘌呤甲基化 六氢吡啶 G G+A 甲酸 脱嘌呤作用 六氢吡啶 G和A C+T 肼 嘧啶开环 六氢吡啶 C和T C 肼(加盐) 胞嘧啶开环 六氢吡啶 C DMS(硫酸二甲酯)在中性pH环境中,主要作用于G,被六氢吡啶作用而造成该位点上DNA链的断裂。 甲酸具有脱嘌呤作用。DNA链在脱嘌呤位点(G和A)发生断裂。 肼,在碱性条件下,作用于胸腺嘧啶和胞嘧啶,在具有六氢吡啶的条件下,导致在这个核苷酸位置上发生DNA链的断裂。如果在反应体系中加入高浓度的盐,同胸腺嘧啶的反应速率便会下降,主要作用于胞嘧啶。
在化学修饰反应过程中,通过控制反应温度和反应时间,只有一小部分碱基被修饰(而不是全部被修饰),随后进行的断裂反应也是定量反应。因此,DNA链并不是在所有可被修饰的碱基位点断裂,而是随机断裂。在4个反应中,产生4套带相同标记末端、长短不一的寡聚核苷酸片段。只有带标记末端的片段可被识别,没有标记末端的片段可以忽略不计。
以上4种反应体系DNA片段混合物经高分辨凝胶电泳与放射自显影,便可直接读得测定DNA片段的碱基排列顺序。各DNA子片段测序工作完成后,按酶切图谱,可顺序相连完成完整的长链DNA序列。
5′— GATCACTACTG —3 ′ 5′— *GATCACTACTG —3 ′ 标记 G C:肼(加盐) G:DMS G+A:甲酸
电 泳 G+A C+T G C 5′-*GATCACTACTG 5′-*GATCACTACT 5′-*GATCACTAC 电 泳 G+A C+T G C 5′-*GATCACTACTG 5′-*GATCACTACT 5′-*GATCACTAC 5′-*GATCACTA 5′-*GATCACT 5′-*GATCAC 5′-*GATCA 5′-*GATC 5′-*GAT 5′-*GA 5′-*G 5′
(二)、Maxam-Gilbert化学修饰法的特点 1. 本法不需要体外进行酶催化的延伸反应,未经克隆的待测DNA片段也可以直接进行序列测定; 2. 对于含有稀有碱基如5-甲基腺嘌呤或G、C含量较高的DNA片段、短链的寡聚核苷酸的序列测定,化学修饰法较双脱氧链终止法更具优越性;
3. 采用化学修饰法测序时,既可以标记5 ′末端,也可以标记3 ′末端,因此可以从两个相反方向测定同一条DNA链的核苷酸顺序,测定结果可以互作参照,彼此核对。 主要缺点 1. 操作比较繁琐和费时,未端核素标记效率低造成放射自显影需曝光较长时间, 2. 对过长DNA链的序列测定仍比较困难。
三、DNA测序自动化技术 1、激光测序法(终止标记系统) 用4种不同的荧光基团分别标记4种ddNTP,这样测序反应就可以在一个试管中进行,终止反应的产物按终止位置碱基的不同,其3`末端带有不同的荧光基团,被激发后发出不同的荧光,因此可以上样在一个加样孔上,电泳结束后,用DNA测序仪识别,经软件处理,便得到待测的核苷酸序列。工作量和效率均大大提高。
2、焦磷酸测序技术的原理 焦磷酸测序技术(pyrosequencing)是1987年发展起来的一种新型的酶联级联测序技术,其原理是:引物与模板DNA退火后,在DNA聚合酶(polymerase)、ATP硫酸化酶(sulfurylase)、荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)4种酶的协同作用下,每一个dNTP的聚合与一次荧光信号的释放级联起来,以荧光信号的形式实时记录模板DNA的核苷酸序列。它具有快速、准确、经济、实时检测的特点,不需要凝胶电泳,也不需要对DNA样品进行任何特殊形式的标记和染色,有很高的可重复性、高度的并行性和高度的自动化。
具体过程: 第一步,将测序引物杂交到PCR扩增的模板上,与DNA聚合酶(polymerase)、ATP硫酸化酶(sulfurylase)、荧光素酶(luciferase)和三磷酸腺苷双磷酸酶(apyrase)加入反应体系。 第二步,加入4种dNTP到反应体系中进行聚合酶链式反应,当DNA聚合酶将某一种dNTP与模板上相应的核苷酸互补聚合时,会产生相同摩尔数的焦磷酸。需要说明的是在焦磷酸测序中,dATP不能被荧光素酶识别,故用-S-dATP代替常用的dATP。
第三步,在5’-腺苷磷酸硫酸化酶协调作用下ATP硫酸化酶将焦磷酸(PPi)转移到ATP上,该硫酸化的ATP驱动荧光素酶将荧光素转化成氧化荧光素,后者在荧光素酶催化下释放出与ATP量成比例的荧光,发出的荧光信号被CCD摄像机拍摄下来,并以很尖的波峰形式在pyrogram软件记录下来。每一峰高(即荧光信号强度)都与参与DNA合成的核苷酸数成比例。
第四步,没有聚合的过剩的dNTP迅速被三磷酸腺苷双磷酸酶降解,反应体系得以再生,随后加入另一种dNTP,重复以上反应。模板序列就可以随聚合酶链式反应的进行而被同步测定。整个测序过程没有特殊的标记、染色、电泳等烦琐的操作。
特点: 焦磷酸测序法适于对已知的短序列的测序分析,目前的技术通常能满足25-30个核苷酸的短序列测定,其重复性和精确性能与sanger DNA测序法相媲美,而速度却大大的提高,最近开发的PQ96MA和PQ96HS系统能在1小时内同时对96个样品进行SNPs分析和基因分析,工作效率大大提高,测序成本大大降低。
了决定性的作用。
分析仪器的新发展: http://www.rivers.com.cn/department/criminal_investigation/products/dna/(来源) 377型遗传分析仪 377 型DNA 全自动测序仪采用经典的聚丙烯酰胺凝胶的电泳方式, 结合美国应用生物系统公司专利的四色荧光标记, 激光检测, 一个泳道检测的方法, 具有测序结果准确性好, 精度高, 操作简便快速等特点, 已成为全球应用最多最广泛的全自动DNA 测序仪之一。
其他DNA全自动分析仪: ABI Prism® 3100遗传分析仪 310型全自动遗传分析仪 3700型全自动遗传分析仪 安玛西亚DNA序列分析系统型号:MegaBACE 500/1000/4000
电泳检测--310
电泳检测--3100
步骤1:毛细管灌胶
步骤2:样品盘移动
步骤3:电进样及电泳
步骤4:荧光激发及检测
补充:测序及连接方法的遴选 对文库中的各片段逐一测序,测序后的连接则是一个巨大的任务(生物信息学)。目前有两种思路: 1. 第一种是全基因组散弹法(whole genome shut-gun):即从文库中随机取,然后分析,分析后再根据碱基序列进行拼接,由Celera提出。
步骤: 取全基因组DNA → 纯化酶切或超声波打断 → 电泳 → 回收DNA片段 → 构建质粒文库 → 转化宿主菌 → 扩增培养 → 提质粒DNA为模板进行PCR测序 → 上测序仪 → 处理测序数据 → 补缺 → 完整基因组序列。
⑴. shutgun法 全基因组DNA 随机酶切成小片段 拼接 补缺 完整基因组序列
2. 层次散弹(hierarchical shutgun)