基因组文库(genomic library) 第二节 基因组文库的构建与基因分离 基因组文库(genomic library) 基因组文库:将某一生物基因组DNA片段化并全部克隆后所获得的重组子群体的总称。理论上讲,这些重组载体上带有了该生物体的全部基因。 操作:将某种生物细胞的整个基因组DNA切割成 大小合适的片断,并将所有这些片断都与适当的载体连 接,引入相应的宿主细胞中保存和扩增。 利用一系列序列特异性的巢式引物和一个短的任意引物引导扩增已知序列的侧翼序列的反应。
按外源DNA片段的来源分基因文库分为 基因组DNA文库 从特定组织提取的染色体基因组DNA cDNA文库 mRNA反转录成的cDNA拷贝
构建基因文库的载体选用 (1)对载体的要求 (2)目前常用的载体 载体能够容载的DNA片断大小直接影响到构建完整的基因文库所需要的重组子的数目。 (1)对载体的要求 载体容量越大,所要求的DNA片断数目越少,所需的重组子越少。 (2)目前常用的载体 载体系列: 容量为 23 kb cosmid载体: 容量为 45 kb YAC: 容量为 1 Mb BAC: 容量为 300 kb
基因组文库应满足的条件 1、文库的完整性: 文库应包含基因组的完整序列信息 2、基因组信息的可重建性: 重建基因组的完整信息 3、文库的大小: 即文库中应包含的独立重组子数目
基因组文库的大小 理论值: 基因组文库的克隆数目=基因组DNA总长/DNA插入片段的平均长度。 例如: 理论值: 基因组文库的克隆数目=基因组DNA总长/DNA插入片段的平均长度。 例如: 细菌基因组DNA总长度=4.6 × 106kb 酶切后的DNA片段平均长度= 15kb 基因组文库的克隆数= 4.6 × 106kb/ 15kb= 3.1 × 105个克隆
ln (1-P) N= N= ln (1-L/G) G 4.61× L P:文库包含了整个基因组DNA的概率(99%) 经验值: ln (1-P) G N= 4.61× N= L ln (1-L/G) P:文库包含了整个基因组DNA的概率(99%) L:克隆fragment的平均大小 G:Genome大小 N:所需的重组载体数(克隆数)
这个例子说明用质粒载体(插入片断5-10kb )就可以建立很好的原核生物基因文库,只需要几千个克隆;而真核生物则需要更大承载能力的载体。 For example : 期望值为0.99,插入片断为20kb的 E.coli (4.6×106 bp) 和 human (3×109 bp) 基因组的克隆数的计算 ln( 1-0.99) N E.coli= =1.1 ×103 ln[1-(2×104/4.6×106)] ln(1-0.99) Nhuman= = 6.9 ×105 ln[1-(2 ×104/3 ×109)] 这个例子说明用质粒载体(插入片断5-10kb )就可以建立很好的原核生物基因文库,只需要几千个克隆;而真核生物则需要更大承载能力的载体。
= = 8.1×105 N= 例如:人的基因组是 3×109 bp,插入DNA片断的平均长度如果是1.7×104 bp,所需的重组载体数: 4.61× G f = 3×109 1.7×104 = 8.1×105 N= 基因组文库实际克隆数:比计算值大2倍或3倍,或更高
一、基因组DNA文库的构建 基因组文库应具有的克隆子数 基因组大小/bp 2×106(细菌) 2×107 (真菌) 2×109(动物) 理论克隆数 实际克隆数 5×103 400 1831 4000 18418 600000 2763110 10×103 200 919 2000 9208 300000 1381550 20×103 100 458 1000 4603 150000 690774 40×103 50 278 500 2300 75000 345 386
基因组文库构建的一般步骤 1、染色体DNA的分离 3、载体的制备 2、大片段的制备 4、重组连接 5、包装 6、重组噬菌体 感染大肠杆菌
1、载体DNA的分离 2、大片段的制备 DNA分离纯化→限制酶切 → 脱磷酸化反应 ① 酶切法: ② 物理切割法: 总DNA分离纯化→物理切割法[超声波(300bp)或 机械搅拌(8kb)]或酶切法(内切酶Sau3A进行局部消化。可得到10-30kb的随机片断。 )→分离特定大小DNA片段 不完全酶解:产生随机性的DNA片段,片段大小取决于内切酶识别的位点数和酶解程度。 识别4对碱基的内切酶适用于制备1~20kb的DNA片段
DNA的不完全酶切 目的片段低熔点琼脂糖回收
20kb 14kb 9kb 3、载体与基因组DNA大片段的连接 内切酶,将载体切成三段:左臂、右臂、中间片段 BamH I EcoR I Sal I BamH I EcoR I Sal I 左臂 可置换区 右臂 20kb 14kb 9kb
左臂 右臂 左臂 插入片段 右臂 插入片段 插入片段
(1) 粘性末端直接连接:载体与外源DNA大片段的两个末端都有相同的粘性末端。 如:Sau3A与BamHI的酶切末端。 直接连接、人工接头或同聚物加尾。 (1) 粘性末端直接连接:载体与外源DNA大片段的两个末端都有相同的粘性末端。 如:Sau3A与BamHI的酶切末端。 (2)人工接头法(adapter) 人工合成的限制性内切酶粘性末端片断。 接上人工接头 粘性末端 各种酶的接头可以向公司定做或购买。 (3)同聚物加尾 末端转移酶 CCC CCC 粘性末端
4、重组DNA转化受体细胞 根据克隆载体的性质选择合适的受体细胞 常见的宿主细胞: 常见的宿主细胞: DH5:用于铺制与培养质粒平板和粘粒平板的重组缺陷型的抑制型菌株,可与pUC编码的-半乳糖苷酶氨基端实现互补。 HB101: 用于大规模制备质粒的抑制型菌株,转化效率高 JM101: 可支持带有琥珀突变载体生长的宿主菌 JM109: 支持带有琥珀突变载体生长的重组缺陷的抑制型菌 MZ-1: 温度敏感的溶源性菌株,用于含有噬菌体PL启动子质粒载体的宿主菌
5. DNA文库的保存 1、影印膜滤保存法
2.液体培养基中扩增保存 方法:从平板上挑取已长出的克隆子转入含适当的抗生素培养基中,混合的细菌生长数代后,其培养物于-70oC储存(加终浓度为30%的甘油)。 缺点:因文库菌落生长的不均匀性而导致文库中某些特定的序列过多或过少。
3.保存单个克隆子于含有甘油的培养基中 方法:从平板上挑选单个克隆子接种于合适的含抗生素的培养基中,菌体生长到一定浓度后,加入终浓度为30%的甘油,于-70 oC或-25 oC下保存。 缺点:需保存的克隆子数过多,工作量大
6、基因组文库的筛选 筛选:从众多的分子克隆群体中将确定的克隆筛选出来 探针筛选法:两步或三步原位杂交法
第三节 cDNA文库的构建与筛选 以mRNA为模板逆转录出的DNA称cDNA。 3’ mRNA 5’ 反转录酶 5’ 引物 cDNA 3’ cDNA library 将某一生物的特定组织或特定发育时期细胞内的全部mRNA反转录成cDNA,与适当的载体连接后转化受体菌,则每个细菌含有一段cDNA,这些cDNA克隆(包含着细胞全部mRNA信息)的集合称为该组织细胞的cDNA文库。
cDNA文库的特点 (1)以mRNA为材料,适用于RNA病毒 (2)文库小,构建容易,筛选简单 (3)每一个cDNA克隆对应一种mRNA序列 (4)不含内含子序列,可进行原核表达 cDNA文库应满足的条件: 文库的代表性:文库中重组cDNA分子是否可以完整的反映来源细胞中的表达信息,用库容量衡量。 序列的完整性:5’UTR(容易丢失)、编码区、3’UTR
构建cDNA文库的一般步骤 (1)总RNA(total RNA)提取 (2)mRNA的分离纯化 Trizol试剂提取,或商业化的试剂盒(kit)。 (2)mRNA的分离纯化 分离mRNA用商业化的Oligo dT纤维柱。 mRNA只占总RNA的1%-2%,利用mRNA都含有一段polyA尾巴,将mRNA从总RNA(rRNA、tRNA等)中分离纯化。
mRNA的分离纯化
(3)cDNA的合成 ① cDNA第一链合成 逆转录酶能以RNA为模板合成DNA。 用Oligo dT(或随机引物)作引物,合成cDNA的第一链。 3’ AAAAAAA mRNA 5’ 反转录酶 TTTTTTT 5’ cDNA Oligo dT引物
降解mRNA模板 用碱处理或用RNaseH降解mRNA-DNA杂交分子中的mRNA。 3’ mRNA 5’ 反转录酶 5’ 引物 cDNA 5’ 3’ mRNA 5’ 引物 cDNA第一链 3’ 碱 或RNaseH 5’ 引物 cDNA第一链 3’
② cDNA第二链合成(自身引导法) 剩下的cDNA单链的3’末端一般形成一个弯回来的双链发卡结构(机理不明),可成为合成第二条cDNA链的引物。用DNA聚合酶合成第二链DNA。 5’ cDNA第一链 DNA聚合酶 cDNA第二链合成 cDNA第一链 5’ cDNA第二链 3’
用核酸酶S1可以切掉发卡结构(但这会导致cDNA中有用的序列被切掉!)。 去掉发卡结构 用核酸酶S1可以切掉发卡结构(但这会导致cDNA中有用的序列被切掉!)。 5’ cDNA第一链 3’ cDNA第二链 核酸酶S1 5’ cDNA第一链 3’ 3’ cDNA第二链 5’
自身引导法
③ cDNA第二链合成(置换合成法) 妙用RNaseH 这种酶能识别mRNA-cDNA杂交分子中的mRNA,并将其降解成许多小片断。 DNA PolI除去引物并修补后再使用DNA连接酶连成一整条DNA链。
3’ mRNA 5’ 引物 cDNA第一链 RNaseH DNA 聚合酶 DNA 聚合酶 3’ mRNA mRNA mRNA 5’ cDNA第一链 去引物 DNA ligase 3’ cDNA第二链 5’ cDNA第一链
置换合成法
(4)cDNA与载体连接 在双链cDNA末端接上人工接头(含限制性内切酶黏性末端),即可与载体连接,转入受体菌。 或借助末端转移酶给载体和双链cDNA的3’端分别加上几个C或G,成为粘性末端。 接上人工接头 粘性末端 末端转移酶 CCC CCC
(5)重组载体转化受体菌
文库的筛选(screening) 文库 载体 探针 测序分析 电泳后杂交放射自显影 分子探针杂交法:用目的基因探针与文库中的重组载体进行Southern blot杂交。 文库 载体 测序分析 探针 电泳后杂交放射自显影
Genomic library与cDNA library区别
① 基因组文库克隆的是任何片段,包括未知功能的DNA序列、调控基因,cDNA文库克隆的是具有蛋白质产物的结构基因。 ② 基因组文库克隆的是全部遗传信息,不受时空影响;cDNA文库克隆的是不完全的编码DNA序列,受发育的调控因子的影响。 ③ 基因组文库中编码基因是真实的基因,含有内含子和外显子;cDNA克隆的是不含内含子的基因。
相对于cDNA文库,基因组文库的优点: cDNA克隆只能反映着mRNA的分子结构,没有包括基因组的间隔序列; cDNA文库中,不同克隆的分布状态总是反映着mRNA的分布状态,即:高丰度mRNA的cDNA克隆,所占比例较高,分离基因容易;低丰度mRNA的cDNA克隆,所占比例较低,分离基因困难; 从cDNA克隆中,不能克隆到基因组DNA 中的非转录区段序列,不能用于研究基因编码区外侧调控序列的结构与功能。
cDNA文库的优点 cDNA文库以mRNA为材料,特别适用于某些RNA病毒等的基因组结构研究及有关基因的克隆分离。 cDNA文库的筛选比较简单易行。 每一个cDNA文库都含有一种mRNA序列,这样在目的基因的选择中出现假阳性的概率就会比较低,因此阳性杂交信号一般都是有意义的,由此选择出来的阳性克隆将会含有目的基因。 cDNA文库可用于在细菌中能进行表达的基因的克隆,直接应用于基因工程操作。 cDNA克隆还可用于真核细胞mRNA的结构和功能