第 五 章 分子生物学研究法 (上)DNA、RNA及蛋白质操作技术
扉页: 当你进入实验室时,要像脱去外衣那样放下你的想象力,因为实验操作中不能有一丁点儿的想象,否则,你对事物的观察就会受影响;当你翻开书本的时候,你又必须尽可能展开想象的“翅膀”,否则,你就不可能走在别人的前面。 没有想象的“翅膀”,你的实验不可能走远,也不会有什么太大的、根本性的建树!
基因操作主要包括DNA分子的切割与连接、细胞转化、核酸序列分析以及基因人工合成、表达、定点突变和PCR扩增等,是分子生物学研究的核心技术。 基因工程是指在体外将核酸分子插入病毒、质粒或其它载体分子,构成遗传物质的新组合,使之进入原先没有这类分子的寄主细胞内并进行持续稳定的繁殖和表达。
Agrobacterium tumefaciens 寄主植物细胞核 质粒DNA 细菌 染色体DNA T-DNA 细胞分裂素 农杆碱 农杆菌 Agrobacterium tumefaciens 寄主植物细胞
土壤根癌农杆菌(Agrobaoterium tumefaciens)侵染植物细胞后能将其Ti(tumor inducing)质粒上的一段DNA(T-DNA)插入到被侵染细胞的基因组,并能稳定地遗传给后代,植物的遗传转化(植物基因工程)技术随之得到迅速发展。
5. 1 重组DNA技术史话 基因工程技术是核酸操作技术的一部分,只不过它强调了外源核酸分子在另一种不同的寄主细胞中的繁衍与性状表达。 事实上,这种跨越物种屏障、把来自其它生物的基因置于新的寄主生物细胞之中的能力,是基因工程技术区别于其它生命科学技术的根本特征。
表5-1重组DNA技术史上的主要事件 年 份 事 件 1869 F.Miescher首次从莱茵河鲑鱼精子中分离DNA。 1957 年 份 事 件 1869 F.Miescher首次从莱茵河鲑鱼精子中分离DNA。 1957 A.Kornberg从大肠杆菌中发现了DNA聚合酶I。 1959-1960 Uchoa发现RNA聚合酶和信使RNA,并证明mRNA决定了蛋白质分子中的氨基酸序列。 1961 Nirenberg破译了第一个遗传密码;Jacob和Monod提出了调节基因表达的操纵子模型。 1964 Yanofsky和Brenner等人证明,多肽链上的氨基酸序列与该基因中的核苷酸序列存在着共线性关系。 1965 Holley完成了酵母丙氨酸tRNA的全序列测定;科学家证明细菌的抗药性通常由“质粒”DNA所决定。 1966 Nirenberg,Uchoa,Khorana,Crick等人破译了全部遗传密码。
1967 第一次发现DNA连接酶 1970 Smith,Wilcox和Kelley分离了第一种限制性核酸内切酶,Temin和Baltimore从RNA肿瘤病毒中发现反转录酶。 1972-1973 Boyer,Berg等人发展了DNA重组技术,于72年获得第一个重组DNA分子,73年完成第一例细菌基因克隆。 1975-1977 Sanger与Maxam和Gilbert等人发明了DNA序列测定技术,1977年完成了全长5387bp的噬菌体φ174基因组测定。 1978 首次在大肠杆菌中生产由人工合成基因表达的人脑激素和人胰岛素。 1980 美国联邦最高法院裁定微生物基因工程可以被专利化。 1981 Palmiter和Brinster获得转基因小鼠,Spradling和Rubin得到转基因果蝇。
1982 美、英批准使用第一例基因工程药物——胰岛素,Sanger等人完成了入噬菌体48,502bp全序列测定。 1983 获得第一例转基因植物。 1984 斯坦福大学获得关于重组DNA的专利。 1986 GMO首次在环境中释放。 1988 Watson出任“人类基因组计划”首席科学家。 1989 DuPont公司获得转肿瘤基因小鼠—“Oncomouse”。 1992 欧共体35个实验室联合完成酵母第三染色体全序列测定(315kb)。 1994 第一批基因工程西红柿在美国上市。 1996 完成了酵母基因组(1.25×107bp)全序列测定。 1997 英国爱丁堡罗斯林研究所获得克隆羊。 2000 完成拟南芥的全序列测定(1.2×108bp)。 2001 完成第一个人类基因组全序列测定(2.7×109bp)。
(一)限制性核酸内切酶 能够识别DNA上的特定碱基序列并从这个位点切开DNA分子。 第一个核酸内切酶EcoRI是Boyer实验室在1972年发现的,它能特异性识别GAATTC序列,将双链DNA分子在这个位点切开并产生具有粘性末端的小片段。
图5-1 几种主要DNA内切酶所识别的序列及其酶切末端。
图5-2 DNA连接酶能把不同的DNA片段连接成一个整体
多聚核苷酸链中新生磷酸糖苷键的产生过程 单核苷酸5‘-磷酸基团向核酸链的3’-OH发起进攻
RE 切割随机DNA分子(假定4种碱基在DNA中均匀分布)的概率由该酶所识别的碱基数目按照4n 来计算,如一个6碱基切割酶平均每4096 bp核DNA有一个酶切位点(46),而一个4碱基切割酶平均每256 bp核DNA就有一个酶切位点(44)。
重组DNA实验中常见的主要工具酶 酶 类 功 能 限制性核酸内切酶 识别并在特定位点切开DNA DNA连接酶 酶 类 功 能 限制性核酸内切酶 识别并在特定位点切开DNA DNA连接酶 通过磷酸二酯键把两个或多个DNA片段连接成一个DNA分子 DNA聚合酶I(大肠杆菌) 按5'到3'方向加入新的核苷酸,补平DNA双链中的缺口 反转录酶 按照RNA分子中的碱基序列,根据碱基互补原则合成DNA链 多核苷酸激酶 把磷酸基团加到多聚核苷酸链的5'-OH末端(进行末端标记实验或用来进行DNA的连接 末端转移酶 在双链核酸的3'末端加上多聚或单核苷酸 DNA外切酶III 从DNA链的3'末端逐个切除单核苷酸 λ噬菌体DNA外切酶 从DNA链的5'末端逐个切除单核苷酸 碱性磷酸酯酶 切除位于DNA链末端的磷酸基团
仅仅能在体外利用限制性核酸内切酶和DNA连接酶进行DNA的切割和重组,还不能满足基因工程的要求,只有将它们连接到具备自主复制能力的DNA分子上,才能在寄主细胞中进行繁殖。 具备自主复制能力的DNA分子就是分子克隆的载体(vector)。病毒、噬菌体和质粒等小分子量复制子都可以作为基因导入的载体。
(二)基因克隆的载体 pSC101质粒载体 长9.09kb,带有四环素抗性基因(tetr)及EcoRI、HindIII、BamHI、SalI、XhoI、PvuII以及SmaI等7种限制性核酸内切酶的单酶切位点,在HindIII、BamHI和SalI等3个位点插入外源基因,会导致tetr失活。
ori ColE1 6.64 kb pSC101 9.09 kb pBR322 4.36 kb pUC18 2.69 kb A B C D
是第一个基因克隆载体。缺点:它是一种严紧型复制控制的低拷贝质粒,平均每个寄主细胞仅有1~2个拷贝,从带有该质粒的寄主细胞中提取pSC101 DNA,产量很低。
ColE1质粒载体 松弛型复制控制的多拷贝质粒。 一般情况下,当培养基中氨基酸被耗尽,或是在细胞培养物中加入氯霉素以抑制蛋白质的合成,寄主染色体DNA的复制便被抑制,细胞的生长也随之停止。 松弛型质粒DNA却继续复制数小时,使每个寄主细胞中ColE1质粒的拷贝数达到1000~3000个,占细胞总DNA的50%左右。
ColE1质粒DNA复制起始部位调控机制
前体RNA(RNAII)的转录起始于复制起点上游,需经RNaseH加工后产生有555个核苷酸的引物,起始DNA合成。 RNA 1在RNA 2的5’末端,转录方向相反,因此能通过氢键配对与后者相互作用,阻止RNaseH加工RNA 2,使其不能转化为有活性的引物,阻碍复制起始。 没有Rop蛋白,RNA 1基因就不能起始转录。
3、pBR322质粒载体 由三个不同来源的部分组成的: 第一部分来源于pSF2124质粒易位子Tn3的氨苄青霉素抗性基因(AmpR); 第二部分来源于pSC101质粒的四环素抗性基因(tetr); 第三部分则来源于ColE1的派生质粒pMB1的DNA复制起点(ori)。
Ampr pBR322 4.36 kb
优点是具有较小的分子量(4363 bp)。能携带6-8 kb的外源DNA片段,操作较为便利。 有两种抗生素抗性基因作为转化子的选择标记。 有较高的拷贝数,经过氯霉素扩增,每个细胞可累积1000~3000个拷贝,便于制备重组体DNA。
4、pUC质粒载体(包括四个部分): 来自pBR322质粒的复制起点(ori) 氨苄青霉素抗性基因(ampr) 大肠杆菌β-半乳糖酶基因(lacZ)启动子及编码α-肽链的DNA序列。特称为lacZ’基因 位于lacZ’基因5’-端的一段多克隆位点(MCS),外源基因插入破坏lacZ ’基因功能
pUC18 2.69 kb
LacZ编码β-半乳糖苷酶氨基端146个氨基酸的α-肽,IPTG(异丙基- β-D-硫代半乳糖苷)诱导该基因表达,所合成的β-半乳糖苷酶α-肽与宿主细胞编码的缺陷型β-半乳糖苷酶互补,产生有活性的β-半乳糖苷酶,水解培养基中的X-gal(5-溴-4-氯-3-吲哚-β-D-半乳糖苷),生成蓝色的溴氯吲哚。 含X-gal培养基中非转化菌落呈蓝色,含有重组DNA分子的菌落为白色。
优点: 更小的分子量和更高的拷贝数。在pBR322基础上构建pUC质粒载体时,仅保留下其中的氨苄青霉素抗性基因及复制起点,其分子小了许多,pUC8为2750bp,pUC18为2686bp。由于缺失rop基因,pUC质粒不经氯霉素扩增时,平均每个细胞即可达500~700个拷贝。
pUC质粒结构中具有来自大肠杆菌lac操纵子的lacZ’基因,所编码的α-肽链可参与α-互补作用。因此,可用X-gal显色法实现对重组体转化子的鉴定。 具有多克隆位点MCS区段,可以把具两种不同粘性末端(如EcoRI和BamHI)的外源DNA片段直接克隆到pUC8质粒载体上。
5、 pGEM-3Z质粒 长度为2743bp,编码有一个氨苄青霉素抗性基因和一个lacZ'基因。 含有两个噬菌体启动子(T7和SP6),为RNA聚合酶的附着提供了特异性识别位点。加入T7或SP6 RNA聚合酶,所克隆的外源基因便会转录出相应的mRNA。
6、穿梭质粒载体(shuttle plasmid vector) 由人工构建的具有原核和真核两种不同复制起点和选择标记,可在不同的寄主细胞内存活和复制的质粒载体。 这类质粒载体可保证外源DNA序列在不同物种(原核和真核)的细胞内得到扩增,用途广泛。
7、pBluescript噬菌粒载体 pBluescript是一类从pUC载体派生而来的噬菌粒载体,简称为pBS(+/-),如今则更多地叫作pBluescript KS(+/-)或pBluescript SK(+/-)。
SK表示多克隆位点区的取向,即lacZ基因是按照SacI→KpnI的方向转录; (+/ -)表示单链噬菌体f1复制起点的两种相反的取向。 f1(+)起点表示当pBluescript噬菌粒载体和辅助噬菌体共感染寄主细胞时,能够回收到lacZ基因的有意义链DNA;而f1(-)起点则表示当pBluesript噬菌粒载体与辅助噬菌体共感染寄主细胞时,可回收到lacZ基因的无意义链DNA。
(i)在多克隆位点区(MCS)的两侧,存在一对T3和T7噬菌体的启动子,用以定向指导插入在多克隆位点上的外源基因的转录; (ii)具有单链噬菌体f1的复制起点和一个来自ColE1质粒的复制起点,保证pBluescript噬菌粒载体在有无辅助噬菌体共感染时,按照不同的复制形式分别合成出单链或双链DNA;
(iii)编码有一个氨苄青霉素抗性基因,作为转化子克隆的选择标记; (iv)含有一个lacZ基因,可以按照X-gal-IPTG组织化学显色法筛选噬菌粒载体的重组子。
5. 2 DNA操作技术 5. 2. 1核酸的凝胶电泳 自从琼脂糖(agarose)和聚丙烯酰胺(polyacrylamide)凝胶被引入核酸研究以来,按分子量大小分离DNA的凝胶电泳技术,已经发展成为一种分析鉴定重组DNA分子及蛋白质与核酸相互作用的重要实验手段。
一种分子被放置到电场中,它就会以一定的速度移向适当的电极。我们把这种电泳分子在电场作用下的迁移速度,叫做电泳的迁移率,它与电场强度和电泳分子本身所携带的净电荷数成正比,与片段大小成反比。
生理条件下,核酸分子中的磷酸基团呈离子化状态,所以,DNA和RNA又被称为多聚阴离子(polyanions),在电场中向正电极的方向迁移。
琼脂糖凝胶分辨DNA片段的范围为0.2~50kb之间。 聚丙烯酰胺凝胶的分辨范围为1到1000个碱基对之间。 凝胶浓度的高低影响凝胶介质孔隙的大小,浓度越高,孔隙越小,其分辨能力就越强。
表5-3 琼脂糖及聚丙烯酰胺凝胶分辨DNA片段的能力 凝胶类型及浓度 分离DNA的大小范围(bp) 0.3%琼脂糖 50 000~1 000 0.7%琼脂糖 20 000~1 000 1.4%琼脂糖 6 000~300 4.0%聚丙烯酰胺 1 000~100 10.0%聚丙烯酰胺 500~25 20.0%聚丙烯酰胺 50~1
溴化乙锭染料的化学结构及其对DNA分子的插入作用。由于插入了溴化乙锭分子,在紫外光照射下,琼脂糖凝胶电泳中DNA的条带便呈现出橘黄色荧光,易于鉴定。
5. 2. 2 细菌转化与目标DNA分子的增殖 获得了用外源DNA片段和载体分子重组而成的杂种DNA分子后,还必须通过一个被称为细菌转化的过程将其重新导入到寄主细胞中,才能保证重组DNA分子的增殖。 外源DNA能在宿主细胞中通过自身载体上的复制起始位点进行复制增殖,从而在宿主细胞中长期保存,并以完整的形式从细胞中被分离纯化出来。
细菌转化(transformation),是指一种细菌菌株由于捕获了来自供体菌株的DNA而导致性状特征发生遗传改变的过程。
重组DNA操作过程示意图
为提高效率,可对受体菌进行物理或化学处理,增加其获取DNA的能力。经过这种处理的细胞被称作感受态细胞(competent cells)。
CaCl2法 将快速生长期大肠杆菌置于经0℃预处理的低渗CaCl2溶液中,细胞膨胀,膜通透性改变,易与外源DNA相粘附。 将该体系转移到42℃下做短暂的热刺激,外源DNA就可能被细胞吸收。将经过转化后的细胞置于选择性培养基上,筛选阳性克隆。 转化效率可达到5×106~2×107个转化子/µg超螺旋质粒DNA。
细菌转化及蓝白斑筛选
电击法 电脉冲可以在细胞膜上造成小凹陷,形成疏水孔洞。随着跨膜电压增加,大疏水性孔洞会转变为亲水性孔洞,介质中的DNA进入细胞质。 将生长至对数中期的E. coli菌液冷却至4℃后离心,洗菌后用10%的甘油悬浮,将高密度菌液(~2×1010/ml)置于特制的电极杯中进行电击。
获得最大转化效率时场强一般为12.5~15kV/cm,时间跨度一般为4.5~5.5毫秒。 电击转化与温度有关,一般在0~4℃进行。由于转化载体上常带有LacZ基因,多用带有不同抗生素的选择性培养基结合α-互补蓝白斑筛选法鉴定转化细胞。
利用噬菌体颗粒能够有效地将DNA注入到寄主细胞中这一特点,科学家还发明了重组体DNA分子的体外包装法。经包装的基因工程噬菌体颗粒能够借助细菌表面的噬菌体接受器位点将DNA注入受体细菌,并在这些细胞中得到繁殖和表达。
5. 2. 3聚合酶链式反应(PCR)技术 聚合酶链式反应是快速扩增DNA序列最常用的方法。 PCR反应的模板DNA若是基因组上的某个片段,就称为genomic PCR,若是mRNA反转录产生的cDNA,就称为RT-PCR。
图5-7 聚合酶链式反应(PCR)技术
图5-8 PCR指数扩增时循环次数与理论DNA产量比较
1989年12月, 著名的自然科学杂志“SCIENCE”将PCR和它所使用的聚合酶命名为第一个“年度分子”。 主编Daniel Koshland Jr. 写道:第一篇有关PCR的论文发表于1985年。自那以后,PCR已经发展成为日益强大的和有广泛用途的技术。…… 有了PCR,极少量遗传物质也能扩增产生大量一般实验室都能得到的、可用于生化分析和鉴定的材料。
凯利·穆利斯
“SCIENCE”确实在1985年发表了第一篇关于PCR的论文。但是,却拒绝了由穆利斯早些时候撰写的描述PCR技术的论文。编辑部给他回了一封标准的拒稿信: “这篇文章虽然通过了评审委员会的初选,但不幸的是,专家们对本文的评审结论并没有像对同时期拟录用的稿件那样积极。所以,尊稿无力竞争本刊有限的版面。”
凯利·穆利斯(Kary Mullis),1944年出生,1962年去佐治亚理工学院化学工程专业读本科. 受同学们的蛊惑,1966年毕业时报考加州伯克利大学生化专业研究生被录取。 1968年一个人在NATURE发表“时间反演的宇宙学意义”论文并侥幸通过了博士生资格考试。 1972年,以“微生物铁转运因子的结构与有机合成”获得博士学位。
穆利斯热爱学习,受家庭和老师们的熏陶,功课一直不错。回忆高中时代,他记忆最深的是与他的兄弟们一道制造土火箭!他们设计的土火箭可以向上飞1英里左右,火箭体内还关有一只用石棉和其它防火材料保护起来的青蛙,有一把降落伞以保证小青蛙能活着回到地面!
毕业后,尝试写小说,但因“不能使一部分人物具有不幸的遭遇”而失败,又因厌恶天天宰杀实验小鼠而两次丢掉工作。
他有一条知名的可能引起不少同学共鸣的学习曲线:刚开始时,对拓宽自身知识面表现出极大的兴趣—知识迅速上升,然后徘徊不前,最终进入失望和不安阶段—辞职 以后去一家小咖啡馆当了两年经理。1979年加入西特斯公司,负责DNA合成。 正是费时费力的DNA合成(单引物,以算术级数增长),激发了他的思维。
1971年成立的西特斯公司是世界上第一家重组DNA技术公司。 1979年开始,Kary Mullis在那儿构思了一种能沿着单链DNA的某些特定位点起始和终止聚合酶活性的方法。Polymerase Chain Reaction,聚合酶链式反应。
1983年8月,穆利斯第一次在公司正式作了一个有关PCR原理的学术报告。人们对这个报告的反应冷谈,只有少数几个实验技术人员有些兴趣。穆利斯回忆说,“绝大多数人要么在我结束报告之前就离开了会场,要么故意留下来给我出难题。他们认为这些肯定是胡说八道。” 普遍的观点是,虽然我不够聪明,没看出问题的要害,但肯定有理由证明这个方法不行,要不为什么从前没人想到呢?
PCR技术的原理 首先将双链DNA分子在临近沸点的温度下加热分离成两条单链DNA分子,DNA聚合酶以单链DNA为模板并利用反应混合物中的四种脱氧核苷三磷酸、合适的Mg2+浓度和实验中提供的引物序列合成新生的DNA分子。
DNA解链(变性) 引物与模板DNA相结合(退火) DNA合成(链的延伸)三步 经不断重复循环之后,反应混合物中所含有的双链DNA分子数,即两条引物结合位点之间的DNA区段的拷贝数,理论上的最高值应是2n,实得1.8n.
将含有待扩增DNA样品的反应混合物放置在高温(>94℃)环境下加热1分钟,使双链DNA变性,形成单链模板DNA。
94°C 加热,变性 (也叫淬火)
降低反应温度(退火,约50℃),约1分钟,使寡核苷酸引物与两条单链模板DNA结合在靶DNA区段两端的互补序列位置上。
50°C~60°C,退火, 引物与模版DNA相结合
将反应混合物的温度上升到72℃左右保温1-数分钟,在DNA聚合酶的作用下,从引物的3'-端加入脱氧核苷三磷酸,并沿着模板分子按5'→3'方向延伸,合成新生DNA互补链。
PCR扩增,72°C左右, 每分钟约合成1kb.
实验中通过对拟南芥基因芯片数据分析, 鉴定出一个受干旱胁迫诱导的cDNA。干旱、紫外线、脱落酸、高盐以及水杨酸等胁迫条件处理后表达量均有显著提高, 特别是干旱处理3h后表达量极显著提高。 多序列比对和系统进化分析发现该基因含有典型的AP2/EREBP DNA结合结构域,且属于DREB亚家族。由于其N端富含谷氨酰氨残基, 将它命名为QRAP2 (Glutamine-rich AP2)。
5. 2. 4 实时定量PCR (real time quantitative PCR,Q-PCR) 由于PCR敏感性高,扩增产物总量变异系数大,定量不准确。90年代末期出现了Q-PCR,利用荧光检测PCR仪绘制DNA扩增过程中的累积速率动态变化图,基本消除在测定终端产物丰度时变异系数较大的问题。
混合在PCR反应液中的荧光探针只有与大片段DNA结合后,才能够被激发出荧光。 随着新合成DNA片段的增加,由于结合到DNA上的荧光探针增加,被激发产生的荧光相应增加。 非序列特异性荧光染料SYBR Green I, 激发光波长520nm。
SYBR Green I作探针的实时定量PCR实验过程图示
Ct值是产物荧光强度首次超过设定阈值时,PCR反应所需的循环数。利用标准曲线,可以确定样品中待检测靶DNA的绝对含量。
图5-11用实时定量PCR法分析未知样品靶基因的绝对量 A 扩增曲线 循环数 荧光强度 Log值 B标准曲线 图5-11用实时定量PCR法分析未知样品靶基因的绝对量
为确保荧光检测的确实是靶DNA,又设计了仅能与目的DNA特异结合的荧光探针。 TaqMan探针是一段与靶DNA序列中间部位结合的单链DNA,长50bp-150bp,该DNA的5’和3’端带有短波长和长波长两个不同荧光基团,由于彼此距离靠近,在荧光共振能量转移(FRET)作用下发生荧光淬灭,因而检测不到荧光。
随着PCR反应的进行,TaqMan 探针结合到目的DNA序列上,并且会被具有外切酶活性的Taq DNA聚合酶逐个切除而降解。切下来的荧光基团解除了荧光淬灭的束缚,会在激发光下发出荧光,因此,产生的荧光强度直接反映了所扩增靶DNA的总量。
TaqMan探针实时定量PCR技术
△Ct(AvgCt WT-AvgCtMu) 表5-3 实时定量PCR相对定量实验的数据处理 野生型拟南芥(WT) 突变体拟南芥(Mu) △Ct(AvgCt WT-AvgCtMu) 相对比值(1.8△Ct) Wus Ct值 31.49 21.78 30.87 21.95 31.34 22.04 平均值(Avg) 31.23+0.32 21.92+0.13 9.31+0.19 239+26.25 拟南芥野生型和突变体样品经由拟南芥持家基因(UBQ10)进行均一化处理。
5. 2. 5 重亚硫酸盐测序技术(Bisulfite Sequencing) DNA分子上可能发生多种化学修饰,如甲基化、乙酰化等。在不改变DNA序列的情况下,通过对DNA分子的化学修饰,可以改变基因表达水平。相对于传统的遗传学——即只有DNA序列变化才能导致基因表达的改变——而言,这种现象被称为表观遗传学(Epigenetics)。
主要实验过程: 将待测DNA样品用限制性内切酶处理或超声波破碎等物理方法打断成500~1000 bp的碎片, 重亚硫酸盐处理使DNA中未甲基化的胞嘧啶脱氨基变成尿嘧啶,PCR扩增后被测序仪读为胸腺嘧啶。 已甲基化的胞嘧啶由于甲基的保护而不受影响。 参考原始序列判定原C位点是否甲基化——未甲基化的C位点变为T,甲基化的C位点仍保持为C。
重亚硫酸盐测序(bisulfite sequencing)
因为没有甲基保护的C在重亚硫酸盐处理后转变为U,引物设计时要将该位点相应改为T。 由于DNA上的C位点通常不是百分之百甲基化或非甲基化,所以合成引物时要用简并位点,正向引物中为Y (Y=C或T),反向引物中记做R (R=G或A)。 重亚硫酸盐测序分析时,必须对同一目标片段进行多次测序,通常要求至少测序11次,以避免产生同源测序(sibling sequencing)。 要设置已知甲基化水平的正对照。
5. 2. 6 基因组DNA文库构建 把某种生物的基因组DNA切成适当大小,分别与载体组合,导入微生物细胞,形成克隆。汇集包含基因组中所有DNA序列的克隆(理论上每个序列至少有一个代表),这样的克隆片段的总汇,称为基因组DNA文库。
可用Clark和Carbon公式预测一个完整基因组文库应包含的克隆数目: N=ln(1-p) / ln(1-f) N表示一个基因组文库所应该包含的重组克隆数目 p 表示所期望的靶基因在文库中出现的概率 f表示重组克隆平均插入长度与基因组DNA总长之比。 以人为例,其基因组大小为3×109 bp,若要求p = 99%,平均插入片段大小为20 kb,则N = 6.9×105。
构建基因组文库最常用的是λ噬菌体载体(克隆能力约15—20kb)和限制性内切酶部分消化法。例如用识别4个核苷酸的核酸限制性内切酶Sau3A,与BamHI是一对同尾酶消化DNA,由Sau3A酶切产生的DNA片段可插入到经BamHI消化的λ噬菌体载体上。
图5-13 用Sau3A限制性核酸内切酶消化真核生物基因组DNA并利用噬菌体载体构建基因组文库的过程图示。
λ噬菌体作为克隆载体的体外包装过程
此外,还有很多大容量克隆载体,如柯斯质粒、细菌人工染色体(BAC)、P1源人工染色体(PAC)、酵母人工染色体(YAC)等都可用于基因组文库的构建。 它们的优点是可以插入更大片段DNA,但是稳定性一般较差,在大量复制的过程中容易出现缺失现象。操作也相对较困难。
5. 3 RNA基本操作技术 真核生物基因组DNA庞大,有大量重复序列,很难直接分离得到靶基因片段。而cDNA来自反转录的mRNA,无冗余序列,通过筛选cDNA文库,可较快地分离到相关基因。
细胞中的总RNA包括mRNA,rRNA ,tRNA以及一些小RNA(sRNA)。 一个典型的动物细胞约含10-5μg RNA,其中: 80%-85%为rRNA 15%-20%为tRNA及sRNA mRNA约占总RNA 的1%-5%
rRNA分子具有确定的大小和核苷酸序列,特别是28S和18S特征性条带是电泳鉴定总RNA纯度和完整性的重要参数。
图5-14 PolyATtract mRNA的分离纯化过程简图
RNA的浓度和纯度可以通过测定其OD260和OD280 来判断。OD260为1时相当于浓度为40μg/ml,而OD260/OD280的比值如果在1.8-2.0之间,表示所提取的RNA纯度较好,如果样品中有蛋白质或酚污染,则OD260/OD280的比值将明显低于1.8。
由于RNA分子敏感脆弱,在自然状态下难以被扩增,为了研究mRNA所包含的功能基因信息,一般将其反转录成稳定的DNA双螺旋(cDNA,complementary DNA),再插入到可以自我复制的载体中。
图5-15 cDNA合成过程示意图
图5-16 定向cDNA 合成及分子修饰
因为绝大多数大肠杆菌细胞都会切除带有5'-甲基胞嘧啶的外源DNA,所以实验中常选用mcrA- mcrB-菌株以防止cDNA被降解。
cDNA文库的构建 cDNA的长度一般在0.5-8 kb之间,质粒载体和噬菌体类载体都能满足要求。 cDNA文库常用Uni-zap XR(一种λ噬菌粒载体)做载体,它具备噬菌体的高效性和质粒载体系统利用蓝白斑筛选的便利,可容纳0-10 kb DNA插入片段,含有pBluescript载体的全部序列。 重组后可通过体内剪切反应(In Vivo Excision)将cDNA插入片段转移到质粒系统中进行筛选、克隆和序列分析。
基因文库的筛选 基因文库的筛选是指通过某种特殊方法从基因文库中鉴定出含有所需重组DNA分子的特定克隆的过程。筛选的方法有很多种,如核酸杂交法,PCR筛选法和免疫筛选法等。
核酸杂交法: 核酸杂交法以其广泛的适用性和快速性成为基因文库筛选中最常用的一种方法,用放射性标记的特异DNA探针适用于高密度的菌落杂交筛选。 将待筛选菌落转移到硝酸纤维素膜上,适当温育。同时保留原来的菌落平板作对照。
图 5-17 通过核酸杂交筛选目的克隆流程图
取出已经长有菌落的膜,用碱液处理,使菌落发生裂解,DNA随之变性。用蛋白酶K处理硝酸纤维素膜去除蛋白质,形成菌落DNA的印迹。 80℃烘烤滤膜,将DNA固定在膜上。将滤膜与放射性标记的DNA或RNA探针杂交,通过放射性自显影显示杂交结果。通过对应于平板上的位置找到相应克隆。
PCR筛选法 将整个文库(以质粒的形式或者细菌的形式均可)保存在多孔培养板上,用设计好的目的基因探针对每个孔进行PCR筛选,鉴定出阳性的孔,把每个阳性孔中的克隆再稀释到次级多孔板中进行PCR筛选。重复以上程序,直到鉴定出与目的基因对应的单个克隆为止。
免疫筛选法 该法仅适用于对表达文库的筛选。若实验中靶基因的序列完全未知但是有针对该基因产物的特异性抗体,就可以采用免疫筛选法。
图5-18 噬菌体表达文库的免疫化学筛选法示意图
5. 4 基因克隆(clone)技术 在多细胞的高等生物个体水平上,克隆表示由具有相同基因型的同一物种的两个或数个个体组成的群体。从同一受精卵分裂而来的单卵双生子(monozygotic twins)便是属于同一克隆。
在细胞水平上,克隆一词是指由同一个祖细胞(progenitor cell)分裂而来的一群带有完全相同遗传物质的子细胞。 在分子生物学上,人们把将外源DNA插入具有复制能力的载体DNA中,使之得以永久保存和复制这种过程称为克隆。
RACE技术 Rapid amplification of cDNA ends 在已知cDNA序列基础上克隆5’或3’端缺失序列的技术。根据已知序列设计基因片段内部特异引物,由该片段向外侧进行PCR扩增得到目的序列。 用于扩增5’端的方法称为5’RACE,用于扩增3’端的称为3’RACE。
5’ RACE
在反转录酶的作用下,以基因片段内部特异性引物(GSP1)启始cDNA第一条链合成。 RNase降解模板链mRNA,纯化第一链。 用末端转移酶在cDNA链3’端加入连续的dCTP。 以连有oligo(dG) 的锚定引物和基因片段内部特异的nested引物进行PCR扩增,得到目的片段,用nest PCR检测。
3’RACE 1、用oligo(dT)锚定引物启始cDNA第一链的合成. 2、降解模板mRNA. 3、用通用锚定引物UAP和基因片段内部特异引物进行PCR扩增得到目的3’片段,用nest PCR法检测.
除了获得全长cDNA之外,RACE技术还被用于获得5’和3’端非转录序列,研究转录起始位点的不均一性,研究启动子区的保守性等。
应用mRNA差别显示技术克隆目的基因。 不同基因在生物个体发育的不同阶段或不同的组织、细胞中发生的按时间、空间进行有序表达的方式称为基因的差别表达(differential expression)。
1992年,美国波士顿Dena-Farber癌症研究所的科学家P. Liang和A. D 1992年,美国波士顿Dena-Farber癌症研究所的科学家P. Liang和A. D. Pardee发明了mRNA的差别显示(mRNA differential display)技术,简称DDRT-PCR,可以从一对不同基因型的细胞群体所产生的约15 000种mRNA中有效地鉴定并分离出差别表达的基因。
5'-AGAAAAA…AA-3' 5'-CGAAAAA…AA-3' 5'-GGAAAAA…AA-3' 5'-TGAAAAA…AA-3' 5'-ATAAAAA…AA-3' 5'-CTAAAAA…AA-3' 5'-GTAAAAA…AA-3' 5'-TTAAAAA…AA-3' 5'-ACAAAAA…AA-3' 5'-CCAAAAA…AA-3' 5'-GCAAAAA…AA-3' 5'-TCAAAAA…AA-3'
设计合成了12种由11个或12个连续的脱氧胸苷酸加上两个3‘-端锚定脱氧核苷酸组成的3'引物,用以反转录mRNA,合成第一链cDNA。每一种人工合成的寡核苷酸引物,都能够把总mRNA群体的1/12分子反转录成mRNA-cDNA杂合分子。
从一对不同的组织或器官中分离总mRNA,分别称为A组和B组。 图5-29 DDRT-PCR反应的基本程序。
cDNA差示分析法 (RDA, Representation Difference Analysis) 通过降低cDNA群体复杂性和更换cDNA两端接头等方法,特异性扩增目的基因片段。 4碱基切割酶处理Tester和Driver,形成平均为256 bp的代表群,保留了绝大部分遗传信息。 每次T减D反应后仅设置72℃复性与延伸,94℃变性这两个参数共20个PCR循环,PCR产物的特异性和所得探针的纯度高。
Gateway大规模克隆技术 Gateway技术利用λ噬菌体进行位点特异性DNA片段重组,实现了不需要传统的酶切联接过程的基因快速克隆和载体间平行转移。
Gateway大规模克隆策略
TOPO反应: 将目的基因PCR产物连入Entry载体。载体上的CCCTT被拓扑异构酶所识别,通过与切口处的磷酸基团形成共价键,将该酶偶联在载体上。5’GTGG粘性末端攻击PCR产物的互补性末端并与接头序列CACC退火,使PCR产物以正确方向连入Entry载体。
LR反应: 将目的片段从Entry 载体中重组入表达载体。Entry载体上基因两端具有attL1和attL2位点,目的载体上含有attR1和attR2位点,在重组蛋白的作用下发生定向重组,形成新的位点attB1和attB2,将目的基因转移到表达载体中。
基因的图位克隆法 (Map-based cloning) 所有具有某种表现型的基因都可以通过该方法克隆得到。 通过构建遗传连锁图,将目的基因定位到某个染色体的特定位点,并在其两侧确定紧密连锁的RFLP或RAPD分子标记。
通过对不同的生态型及限制性内切酶和杂交探针的分析,找出与目的基因距离最近的分子标记,通过染色体步移法将位于这两个标记之间的基因片段克隆并分离出来,根据基因功能互作原理鉴定目的基因。
图5-26 染色体步移法克隆基因示意图
在RFLP作图中,连锁距离是根据重组率来计算的,1cM(厘摩)相当于1%的重组率。人类基因组中,1cM≈1000kb;拟南芥中,1cM≈290kb;小麦中,1cM≈3500kb。
用图位克隆法获得水稻脆杆基因BCL
将BCL定位于水稻3号染色体(Chr3)分子标记C524a和RM16之间; B. 覆盖BCL位点的BAC大片段。 C. BCL位点的精细定位。BCL位点被定位于分子标记P2和P4之间与P3共分离。 D. BCL基因结构。红色为编码区,白色为5’和3’非翻译区,黑色线段为内含子。bcl-1和bcl-2表示两个突变位点。
Kosambi函数 r: 重组率 d: 遗传距离
热不对称交错多聚酶链式反应克隆T-DNA插入位点侧翼序列 TAIL-PCR:Thermal Asymmetric Inter-Laced PCR
常规PCR技术能扩增两引物之间的DNA区段,然而,有时我们也希望扩增位于靶DNA区段之外的未知DNA序列,这就需要应用反向PCR(reverse PCR)技术。
用一种在靶序列上没有酶切位点的核酸限制性内切酶消化DNA; 产生大小不同的线性DNA片段群体,其中靶DNA区段的DNA分子长度不超过2~3kb,经连接后重新环化; 按靶序列设计的一对引物与互补序列退火结合,其延伸方向如箭头所指。
反向PCR的基本操作程序。波纹线表示靶DNA区段,箭头表示限制性内切酶位点,分别用方框表示靶DNA区段的左侧和右侧序列。
实验中常用热不对称交错多聚酶链式反应(TAIL-PCR:Thermal Asymmetric Inter-Laced PCR)扩增T-DNA插入位点侧翼序列,获得转基因植物插入位点特异性分子证据。
TAIL-PCR使用一套巢式(nested)特异引物(T-DNA边界引物,TR)和一个短的随机简并引物(AD)。 第一轮反应(Primary reaction)是TAIL-PCR的重要环节,先进行5轮高严谨性循环,特异性引物与模板退火,只能发生单引物循环,T-DNA上游侧翼序列得到线性扩增。
大幅度降低退火温度,使AD及TR均与模板DNA相结合,指数扩增一个循环。 此后,两个高严谨、一个低严谨循环交替进行(PCRII),共15个循环。特异性序列(两端分别拥有TR1和AD序列)和非特异性序列I(只有TR1,没有AD序列)大大超过非特异性序列II (两端均为AD序列)。
PCRII中,特异性序列再次被优先扩增,经稀释的非特异性序列I也已大为降低,此时已没有明显的背景片段了。 PCRIII是真正意义上的PCR,共20个循环,进一步扩增特异性序列。
1、DNA内切酶所识别的序列及其酶切末端 的主要生物学意义是什么? 2、说出重组DNA实验中常用的工具酶? 3、 说出分子克隆载体的主要改进过程。 4、说出蓝白斑筛选的分子机制。 5、说出rop基因和pUC质粒高拷贝数之间的关系。 6、细菌转化的主要原理及生物学意义是什么?
7、请说说穿梭质粒载体的作用机制与应用。 8、为什么cDNA操作中现在常用pBluescript替代 了pUC质粒载体? 9、PCR实验注意事项主要有哪些? 10、做qRT-PCR时,为什么用TaqMan荧光探针比 SYBR Green I荧光探针更准确? 11、说出一个经典动物细胞中RNA总量及各种 不同RNA组分的比例。
12、如何用OD260和OD280 来判断实验中所获得 RNA样品的纯度及含量? 13、说出反向PCR操作的技术要领。 14、TAIL-PCR的英文全称、原理及技术要点。 15、说出5’和3’RACE的主要技术流程。 16、cDNA合成时的方向性是如何实现的? 17、为什么科学家常常需要用到大容量克隆载体? 18、说说用PolyATtract 分离mRNA的主要过程. 19、筛选基因文库主要有哪些方法?
20、bisulfite sequencing的技术要点。 21、 为什么Gateway大规模克隆法可以不用DNA内切 酶进行分子克隆操作? 22、构建cDNA文库为什么要用mcrA- mcrB-菌株? 23、Gateway大规模克隆技术原理及基本操作流程。 24、厘摩(cM)代表什么? 25、说说基因图位克隆法的原理和过程。