第三节 大肠杆菌分子克隆载体
一、E.coli克隆载体的种类 1. 质粒载体—复制起点来自一些天然质粒。 1. 质粒载体—复制起点来自一些天然质粒。 2. 噬菌体载体—λ,P1和M13、fd载体,复制起点来自噬菌体。 3. COS质粒载体—质粒载体中插入λcos片段,以利于体外包装 4.噬粒载体(phagemid)—有质粒和M13、fd的复制起点,以质粒或噬菌体方式复制。
二、质粒与质粒载体 2) R因子(抗药性因子) 可接合转移DNA,属低拷贝 严紧型, 质粒较大,操作不便 3) F因子(性因子) 1. E.coli的质粒种类 1) colE1因子(大肠杆菌素因子)—多数不能进行接合转移DNA,属高拷贝松弛型。 2) R因子(抗药性因子) 可接合转移DNA,属低拷贝 严紧型, 质粒较大,操作不便 3) F因子(性因子)
2.质粒的特点 1) 质粒DNA复制与染色体复制无关 2) 质粒DNA以超螺旋形式存在 3) 质粒DNA可以接合转移 4) 质粒的不相容性和不相容群 5) 质粒DNA的消除—化学和物理法(吖啶染料,EtBr,高温等) 6) 质粒的整合—F因子又可整合到E.coli染色体中 3.质粒DNA的转移 1)质粒DNA的转移过程
质粒的自主转移过程
质粒DNA的转移和复制
ⅰ.转移起点(oriT),它是质粒DNA转移时的复制起点—顺式 作用(cis-action) 2)质粒转移的必备条件 ⅰ.转移起点(oriT),它是质粒DNA转移时的复制起点—顺式 作用(cis-action) ii. 细胞附属物—性纤毛,由蛋白质构成—反式作用 ⅲ.转移过程所需的全部酶类—反式作用 3)质粒转移类型 ⅰ.自我转移(Self-transmissible) ⅱ.辅助转移(Donation)—可转移质粒仅具备oriT,若无辅助质粒,前者不会发生接合转移。若辅助质粒可提供所有反式作用的蛋白质,前者便会发生接合转移。 ⅲ.重组转移(conduction)—若质粒无oriT,该质粒只有整合到辅助质粒DNA中,重组质粒便可转移。 因此,用于克隆外源DNA的分子克隆载体,只要具备oriT即可,另外两类功能基因可置于辅助质粒上,该质粒一般没有oriT,因而可以减少后者进入另一种细胞的频率。
质粒自主转移 质粒的辅助转移 质粒的重组转移 R-重组DNA分子
2) 质粒拷贝数的控制—抑制剂模型:高拷贝质粒需高浓度抑制剂,低拷贝质粒需低浓度抑制剂,同一不相容群质粒产生的抑制剂可交叉相互作用。 4.质粒DNA的复制和调节控制 1) 复制机制—复制方向、终止和方式 2) 质粒拷贝数的控制—抑制剂模型:高拷贝质粒需高浓度抑制剂,低拷贝质粒需低浓度抑制剂,同一不相容群质粒产生的抑制剂可交叉相互作用。 3) 质粒的复制调控机制 例子: ColE1质粒的复制及复制起点结构 Boros etal.(1984)分离到一个pBR322突变体,其拷贝数可达1000/ cell或65%总DNA,原因是在RNAI基因的3'端附近发生一次G→T颠换。
质粒DNA的 复制过程 ColE1质粒 复制起点结构
5.大肠杆菌质粒载体 1) 常用质粒载体的复制子 质粒载体 复制子来源 拷贝数 pBR322系列 pMB1 15-20 1) 常用质粒载体的复制子 质粒载体 复制子来源 拷贝数 pBR322系列 pMB1 15-20 pUC系列 pMB1 500-700 pACYC系列 p15A 10-12 pSC101系列 pSC101 25 colE1 colE1 15-20 2) 质粒载体常用的遗传标记基因 Apr Cmr Kanr Neor Tcr Hygr LacZ LacZα 3) 多克隆位点区 大多数从pUC系列中的多克隆位点衍生出来的
1)分子量小,仅为2.7KB,容纳外源DNA量增大 2)易于检测是否有外源DNA插入的标记基因LacZα 3)多克隆位点区 6.实例—pUC18和pUC19 pUC系列质粒载体由Messing et al.构建,具有三个显著特点: 1)分子量小,仅为2.7KB,容纳外源DNA量增大 2)易于检测是否有外源DNA插入的标记基因LacZα 3)多克隆位点区 ⅰ.多克隆位点成对地存在于pUC18和pUC19中,位点排列顺序相同,但方向相反。 这种排列方式有利于外源DNA的克隆和定向插入 ⅱ.产生不同末端规律排列: 两端限制酶位点产生5’—突起端(EcoRI和HindⅢ),与之相邻的两个限制酶位点产生3’—突起端(SstI、KpnI、SphI、PstI),中央四个限制酶位点产生5’—突起端或平端。这种排列方式十分有利于插入DNA片段的单向缺失和缺失片段的回收。
pUC18和pUC19载体
如插入片段的5’段定向缺失: XbaI→SphI→ExoⅢ→S1→T4 DNA lingase; 插入片段的3’-端亦可采用类似的方法进行缺失(SmaI→SstI→ExoⅢ→S1→T4 DNA lingase) 不同载体中的多克隆位点区可以供不同目的片段的重组。又例如: pBS+多克隆位点区的排列顺序是(见图): 假设有一EcoRI→HindⅢ DNA片段,并要求在其3’-末端或5’-端接上另外的DNA片段(如终止子、启动子),显然,pUC系列载体的多克隆位点区是不太适宜,但选用pBS+中的多克隆位点区就能满足要求。 ⅲ. 多克隆位点集中排列,有利于克隆片段的物理图谱的绘制。 除上述三个特点外,pUC系列载体还可用于表达外源基因 (LacZα启动子)。
pBS载体的结构
ⅰ) 调控基因:CⅢ、N、CI、Cro、CⅡ—决定进入溶源化还是裂解状态 ⅱ) DNA复制:O、P、Q 三. 噬菌体载体 1. 噬菌体λ载体 1)λ的结构和特点 i. 一般结构:48,502bp,线状ds-DNA,两端具有12n.t 5‘-突起(5’-GGGCGGCGACCT-3’)该末端称为cos位点,可被λ编码的末端酶所识别(该酶由λ末端的两个基因Nul和A编码蛋白gpNul和gpA组成) ii. 基因结构—46个基因,分为以下四类: ⅰ) 调控基因:CⅢ、N、CI、Cro、CⅡ—决定进入溶源化还是裂解状态 ⅱ) DNA复制:O、P、Q ⅲ)λ重组:int、xis、redβ和gam ⅳ)噬菌体颗粒形成与细胞裂解:头(A-F)、尾(E-J)、S & R (细胞裂解)λ中部约1/3的DNA(b2)与λ存活无关。
大肠杆菌λ噬菌体的基因和表达调控
ii. 后早期转录:N蛋白可使宿主细胞转录终止因子ρ失活,导致转录通过tR1、tR2和tL进入其余早期基因区域。 2) λ噬菌体基因的表达 i. 最早期转录:转录起始于CI基因两侧的PL和PR启动子,止于N和Cro末端的tL和tR1,有的右向转录物可継续通过O和P止于tR2。 ii. 后早期转录:N蛋白可使宿主细胞转录终止因子ρ失活,导致转录通过tR1、tR2和tL进入其余早期基因区域。 iii. 后期转录:cro蛋白可与OL和OR结合,阻止RNA聚合酶与PL和PR结合,转录终止,此时已合成了足够多的控制蛋白Q,它对P'R起激活作用,导致后期基因转录。 iv. DNA复制:因早期转录获DNA复制蛋白O和P,双向复制开始。 v. 包装:Nul和A蛋白与λDNA的cos位点的识别与切割,FI蛋白促进DNA进入头部蛋白,DNA充满后,gpw和gpFⅡ将头部封住,然后与尾部相连,形成噬菌体颗粒。
vi. 裂解:基因R和S产物形成,细菌细胞裂解,噬菌体颗粒释放。 vii. 溶源反应:CⅡ和CⅢ基因产物分别激活PE和PI的左向转录,致使CI和int基因表达,CI 产物可阻止早期转录,导致后期基因表达受阻。 对于裂解反应和溶源反应的选择,取决于感染细胞中一系列宿主和噬菌体因子间错综复杂的精细平衡关系。 * 当λDNA注入宿主细胞后,线状DNA首先环化为环状DNA,这种环化有以下几点好处: a. 若为单向复制,不管从何处开始复制,全基因组均 可全部复制 b. 噬菌体DNA插入宿主染色体DNA,只需一次位点特异性重组 c. 拓扑异构酶易于对其进行不足和过度加旋 d. 受损的基因组增大了存活的可能性,因为双向复制不会受阻于 损伤的DNA链,而单向复制就不能通过
3) λDNA的复制
4) λDNA的包装过程 l 头—尾连接器由12分子gpB构成中空结构,groE1和groES负责装配 l pX由10个杂合的gpC和gpE构成,使连接器定位 l gpW和gpFⅡ结合在连接器上,防止DNA外泄,提供尾部粘着点末端酶由两基因产物组成(Nul和A),gpNul2-gpA1 (20,444 x 2 + 72,280 = 113,168) 该酶具有以下多种酶活性:1)特异DNA位点结合;2)特异位点切口形成;3)头前体结合;4)gpFI结合;5)cos位点变性;6)DNA转位;7)DNA序列扫描;8)ATP结合;9)ATP水解。 因此,头部蛋白gpE和gpD以及包装蛋白gpA是λDNA形成噬菌体颗粒必不可少的组分,体外包装物的制备就是依据这一结论
λDNA的包装
ii.同一种限制酶具有多个识别位点,不利于外源DNA插入—体内突变和建立新的克隆位点。 i.λ头部只能容纳自身DNA的78-105%,即39-52.5 Kb,天然λ仅可插入3 Kb外源DNA片段—除去所有与λ裂解无关的基因和空白区,最大可插入22 Kb。 ii.同一种限制酶具有多个识别位点,不利于外源DNA插入—体内突变和建立新的克隆位点。 ⅲ.重组的λDNA分子难于直接导入宿主细胞—利用体外包装成病毒颗粒,然后通过感染的方法注入DNA。 6) λ载体的种类 i. 插入型—即将外源DNA直接插入已构建载体中,如λgt11,可以插入长达7 Kb的DNA。这类载体被限制酶切成左右臂。 ⅱ.取代型—即利用一段外源DNA去取代载体中的一段DNA,而这段DNA常含有一定的标记基因。这类载体常被限制酶切为三段:左臂、隔离段和右臂。 * 有的取代型λ载体亦可用作插入型载体,如Charon 4A
大肠杆菌λ载体 Charon 4A Spi 重组子的筛选
7) λ载体的遗传标记基因和重组子筛选 由于λ载体或重组DNA是通过感染途径进入宿主细胞的,因而形成的噬菌斑就是一个明显的标记。用于重组子检测的遗传标记基因主要有lacZ 基因。不管是用插入或取代法,该标记基因均会失活。 利用spi-选择重组子:野生型λ不能在P2溶源化菌种中成活,称之为spi+(sensitive to P2 interference),这与red和gam基因有关。若用外源DNA将这些基因取代,形成的重组DNA分子可在P2菌中株中存活,并形成噬菌斑。λ载体λ1059、λL47.1均属此类,这种选择方式亦称之为显性选择。
1) 基本结构与特征 ii. 可以低拷贝质粒形式存在于细菌细胞中, 又可以烈性噬菌体形式进行复制; 2. P1噬菌体载体 1) 基本结构与特征 i. 基因组长88 kb, 在噬菌体颗粒中的DNA长100 kb, 呈线状,其中约有12%的多余DNA; ii. 可以低拷贝质粒形式存在于细菌细胞中, 又可以烈性噬菌体形式进行复制; iii. P1噬菌体包装原理: 渐进满头机制(processive headful mechanism) 底物: 滚环复制过程形成的头尾相连串状体
包装过程: 始于一个长162bp的P1 pac位点,识别和切割此位点的是P1编码的pacase,切出的pac一端进入预制头部,当其头部充满DNA后,DNA再次被切。第二次切割是随机的,无特异性DNA序列。第二轮包装则从非特异性切割出的末端开始。因此,多次包装都是从一个pac位点开始的。P1头部可容110Kb。 pac位点: 一端含4个六聚体(5’ TGATCA/G 3’),另一端则有三个,中间区域长90 bp,pacase切点位于靠近90 bp区的中心序列。每个六聚体都有一个腺嘌呤甲基化位点(dam→GATC), pacase 只作用甲基化的pac位点.
大肠杆菌P1噬菌体基因组和包装
2) P1载体---pAd10 sacBⅡ ii) 较高的转化频率, 1~2μg载体 + 2~4μg外源DNA→105转化子 i) 可克隆较大插入片段, 可插入95Kb外源DNA,二倍于cos质粒载体 ii) 较高的转化频率, 1~2μg载体 + 2~4μg外源DNA→105转化子 iii) 与YAC载体相比,它易于产生多拷贝的基因组片段; 易于获得大量特定的克隆DNA; 克隆过程更可靠; 克隆片段易于进行次克隆 ii. 结构 载体被二个loxP重组位点分隔为两区— Ampr和Kanr区 Ampr区:来自pBR322的ori, pac位点(反时针包装), 来自腺病毒的11Kb填充片段(插入到ScaⅠ位点) Kanr 区:Kanr(Tn903)和Tetr基因,P1质粒复制子和分离系统,P1裂解复制子,其活性受lac操纵基因启动子控制
大肠杆菌P1噬菌体载体p Ad10 sacBⅡ
P1噬菌体载体构建 基因组文库的示意图 pAd10 sacBⅡ ScaI+BamHI 长臂 + 短臂 加入外源 DNA片段 重组DNA分子 长臂 + 短臂 加入外源 DNA片段 重组DNA分子 离体包装 感染宿主细胞
SacB基因:编码一种将蔗糖转化为果聚糖的酶,当含该基因的细胞培养在2%以上蔗糖培养基中时,果聚糖积累在细胞周质空间内,导致大肠杆菌细胞死亡 SacB基因被克隆到原Tetr 基因的BamHI- SalI间,在其上游加上E.coli基因启动子,克隆位点BamHI位于这两个DNA片段间,外源DNA片段插入时可进行显性筛选重组子 为了使sacB基因自发突变减小到最小限度,sacB基因上游还有一个P1 C1阻遏物结合位点与其启动子重叠。凡是表达P1 C1基因的细胞,sacB基因表达受阻,在无蔗糖条件下,这种细胞会生长得更好 iii. 克隆策略 3.3kb短臂:含pac,loxP,无启动子的sacB 26kb长臂: 含P1裂解复制子,Kanr,P1质粒复制子,loxP 位点
包装: 重组DNA分子先用pacase或抽提物Ⅰ酶切pac位点,然后用抽提物Ⅱ(含头部和尾部)进行包装直至头部充满DNA,最后与尾部相连成有感染力的重组P1噬菌体颗粒。 iV. 重组DNA分子形成 当重组DNA分子进入宿主细胞后,特异性位点重组发生在两个方向相同的loxP位点,该过程由宿主细胞表达的重组酶(Cre)催化 v. 宿主菌 E.coli NS3529菌株基因型recA-,lacⅠq,mcrABC,mrr: recA-:防止插入DNA片段内的同源重组,以免发生重排; lacⅠq : 抑制P1裂解复制子的激活, 使P1质粒复制子在细胞中以单拷贝形式存在,亦防止外源DNA分子重排; mcr和mrr: 抑制富含GpMeC或ApMeC插入片段的选择性丢失
2) 复制过程:ss(+) RF(0-1 min) 3. M13和fd载体 1) 结构特征—环状ssDNA,病毒颗粒呈丝状 RF RF(0-20 min) RF ss(+)(20 min→∞)DNA包装无严格限制 3) 生活史 a. 病毒粒子靠小分子衣壳蛋白和A蛋白附着于性纤毛顶端(E.coli中F因子提供) b. 病毒DNA和A 蛋白进入细胞内,大部分衣壳蛋白则留在细胞膜上 c. 病毒DNA变为双链复制形式(RF), 衣壳蛋白可能为DNA复制提供附着位点 d. RF进行滚环复制,形成单链,同时基因与蛋白质结合 e. ssDNA环化,并形成线状的DNA—基因与蛋白质复合物 f. 病毒DNA穿膜时,基因与蛋白质被附着于膜上的衣壳蛋白取代,完整病毒从细胞中释放,释放时不杀死细胞,但因感染细胞生长缓慢,仍然可见噬菌斑
M13噬菌体的生活史
1)基因结构 基因Ⅰ、Ⅳ和Ⅶ编码特异性蛋白质,参与病毒颗粒的组装 基因Ⅱ参与DNA复制 基因Ⅲ、Ⅷ和Ⅸ编码M13的结构蛋白 基因Ⅴ参与单链复制过程中的环化作用 基因Ⅵ是衣壳蛋白的重要组成部分 2)M13mp系列载体 a. 特点:在IR区中插入一个lacZα基因,然后在该基因中逐渐构建一个多克隆位点区,ds-DNA可用常规方法直接导入,ss-DNA常用感染的方法 噬菌斑的形成用于选择DNA导入的细胞,在X-Gal平板上形成的无色噬菌斑检测重组子 b. 优点:易于获得ss-DNA用于DNA序列测定和基因突变,从细胞中易于检测分离到RF型的ds-DNA用于外源DNA重组 M13mp系列载体的多克隆位点区
四. COS质粒载体 l cos位点的精细结构 cos长200 bp,由以下几个亚单位组成: 1. 结构特点:在普通质粒载体中插入一个或两个来自λ的cos位点片段, 双cos载体比单cos载体易于重组 l cos位点的精细结构 cos长200 bp,由以下几个亚单位组成: a. cosN—由λ末端酶的gpA亚基识别和切割,产生5-12 n.t突起; b. cosB—分别位于cosN的两侧,称之为cosBL(左侧)和cosBR(右侧),为蛋白质结合位点。 R1、R2和R3长16 bp,其中有12个n.t相等,可与gpNul蛋白进行体外结合。 R4与上述三个R片段仅有8个n.t相等,不能与gpNul蛋白进行体外结合,但可以和全酶结合(ATP存在时)。 I1为IHF结合位点。
COS位点的结构
2. 优点 ⅱ. 形成的重组DNA分子可进行体外包装,并能感染E.coli细 胞(在细胞内不能形成噬菌体颗粒,因而不能形成噬菌斑) ⅰ. 容量大(可达48 kb),用于基因簇的克隆 ⅱ. 形成的重组DNA分子可进行体外包装,并能感染E.coli细 胞(在细胞内不能形成噬菌体颗粒,因而不能形成噬菌斑) ⅲ. 操作简便,可直接转化细胞 ⅳ. 对重组DNA分子长度具有选择性包装 3.遗传标记:与质粒载体相同,利用抗生素抗性选择转化子 例子: pJB8和C2XB
COS质粒载体结构图
五. 噬粒载体(phagemid) 1. 结构特点:在质粒载体中插入一段M13或fd的复制起点,其插入方向决定在噬菌体颗粒中形成正链还是负链 2. 优点 ⅰ.可以质粒方式复制,高拷贝存在于E.coli细胞中,便于大量提取质粒DNA用于DNA重组 ⅱ.当有辅助噬菌体存在时(如M13K07和R408),噬质粒重组DNA分子将以f1复制起点开始进行复制,形成单链DNA和噬菌体颗粒,形成的单链DNA可用于定序和特异位点突变
噬粒载体pGEM结构