7.生物制药的上游技术 制作人: 李慧
生 物 制 药 的 上 游 技 术 ◆生物制药的上游技术总论 ◆ 7.1 基因工程技术简介 ◆ 7.2 重组药物基因的构建技术 ◆ 7.3 重组药物基因表达系统 ◆ 7.4 重组药物产物高效表达的方法 生 物 制 药 的 上 游 技 术
■生物制药的上游技术总论 ★生物制药是一个包含多个学科的非常庞大的系统工程。从生物制药的全过程来看,生物制药工艺技术实际上是由生物制药的上游技术、中游技术和下游技术组成的。生物制药的上游技术应是生物制药原料的原料制备/准备技术,生物制药的中游技术应是生物制药原料的生产技术,生物制药的下游技术才是对生物制药原料的各种后加工技术,如提取分离与纯化技术等。
★生物制药的上游技术 ● 根据生物药物的来源,生物制药的上游技术应包括药用动植物种子的快速繁育、微生物菌种的分离培养及高产种子的培育技术、目的基因的分离、纯化、构建、鉴定及定点诱变等技术。由此可知,生物制药的上游技术实际上就是“育种”技术,这个“育种”技术既包括传统的各种生物种子的培育,又包括重组药物基因的构建(“分子育种”)等。 ● 传统的各种生物种子的培育(因在其它相关课程中有详述,在此不再多论),除了微生物菌种,基本上属于农业、林果业、牧渔业的范畴。虽然药用动植物种子的快速繁育在现代生物制药工业中依然发挥着重要作用,但基因工程技术是现代生物制药技术的核心。 ● 利用基因工程技术研究开发生物药物已成为全球生物新药研发的主要手段。作为未来的现代生物制药者,首先应对这一技术有所认识。
■7.1基因工程技术简介 ★完全按照人类意愿,重新构建或组装所需基因到生物中,产生人类所需的生物特性与生物产品的技术被称为 “基因工程” 。 ★ 随着DNA分子结构和遗传机制这一奥秘的揭示——特别是人们了解到遗传密码通过信使RNA转录表达和翻译成蛋白质以后,生物学家不再仅仅满足于探索揭示生命的奥秘,而是大胆设想在分子水平上去控制生命。曾有一个神奇的构思:假如将一种生物DNA中的某个遗传密码片段连接到另外一种生物的DNA链上,将DNA重新组织,不就按照人类的愿望,设计出新的遗传物质并创造出新的生物类型吗?这个目标正在众多科研人员的实践中。
★7.1.1第一代基因工程——基因克隆与蛋白质表达 ● 1973年,身为美国斯坦福大学教授的科恩,从大肠杆菌里取出了两种不同的质粒,它们各自具有一个抗药的基因,分别对抗不同的药物。科恩把两种质粒上不同的抗药基因“剪接”下来,再把这两种基因“拼接”在同一个质粒中。当这种杂合质粒进入大肠杆菌后,这些大肠杆菌就能抵抗两种药物,而且这种大肠杆菌的后代都具备双重抗药性。从而拉开了基因工程时代的序幕。
1.取得符合人们所需的DNA片段,这种DNA片段被称为“目的基因”; 2.将目的基因与质粒或病毒DNA连接成重组DNA; 基因工程一般分为4个步骤: 1.取得符合人们所需的DNA片段,这种DNA片段被称为“目的基因”; 2.将目的基因与质粒或病毒DNA连接成重组DNA; 3.把重组DNA引入某种宿主细胞; 4.把能表达目的基因的受体细胞挑选出来。 基因工程示意图
● 当代生物技术制药的重点是基因工程药物,基因工程药物多属真核生物的蛋白质(酶)或活性多肽,为使重组蛋白质能得到正确、大量的表达,必须解决好如下问题:①选择合适的宿主细胞;②选择和构建启动子;③优化翻译起始区;④优化mRNA二级结构;⑤使用宿主偏爱的密码子;⑥提高质粒拷贝数;⑦利用强转录终止子;⑧增加质粒稳定性等。随着基因工程上游技术的逐步成熟,以上这些问题正逐步得到解决。上游构建工作已实现了工业化。
● 基因工程基本过程的操作要点如下: 1 DNA化学。目的DNA的分离纯化测序合成与扩增方法的建立。 2 DNA酶学。对限制性内切酶DNA连接酶和DNA聚合酶的确定及应用。 3 DNA复制。了解DNA的复制操作过程及可独立复制DNA载体的重要性。 4 质粒和接合转移。研究质粒和质粒复制的过程,以及一些质粒是如何进行接合转移的。 5 温和噬菌体。研究温和噬菌体如何对复制和整合进行调控及局限性转导噬菌体的形成过程 6 转化。研究将游离DNA转入受体细胞的方法。 7 RNA化学和酶学。了解如何对mRNA进行操作,真核生物mRNA的结构以及RNA加工修饰对真核生物成熟mRNA形成的重要作用。 8 反转录。了解在反转录病毒中发现反转录酶的作用及意义和将遗传信息由mRNA传递至DNA的原理和方法。 9 调控。了解转录调控中的诸多因素,包括发现启动子位点及操纵子调控等。 10 翻译。了解翻译的操作过程和步骤,mRNA上核糖体结合位点的重要作用,起始密码子的作用以及正确的读码框架的重要性。 11 蛋白质化学。研究对蛋白质进行分离纯化鉴定以及测序的方法。 12 蛋白质翻译后修饰及分泌。了解蛋白与信号肽的关系以及信号肽在分泌中或分泌后会被切除的机理。研究对蛋白质的翻译后修饰。 13 遗传密码。了解遗传密码的特性,明确其在生物体中的通用性和线粒体中的特殊性差异。
★7.1.2第二代基因工程——蛋白质工程 ● 蛋白质工程/定点诱变是以蛋白质结构与功能的关系为基础,通过周密的分子设计,把蛋白质改造为合乎人类需要的新型蛋白质。 ● 1983年,美国生物学家额尔默首先提出了“蛋白质工程”的概念。其内容主要有两个方面:①根据需要合成具有特定氨基酸序列和空间结构的蛋白质;②确定蛋白质化学组成空间结构与生物功能之间的关系。在此基础上,实现从氨基酸序列预测蛋白质的空间结构和生物功能,设计合成具有特定生物功能的全新的蛋白质,这也是蛋白质工程最根本的目标之一。 ● 蛋白质工程的实践依据是DNA指导合成蛋白质,因此,人们可以根据需要对负责编码某种蛋白质的基因进行重新设计,使合成出来的蛋白质的结构变得符合人们的要求。由于蛋白质工程是在基因工程的基础上发展起来的,在技术方面有诸多同基因工程技术相似的地方,因此蛋白质工程也被称为第二代基因工程。蛋白质工程第一个十分成功的范例是胰岛素的人工合成。
★ 定点诱变(site-directed mutagenesis, site-specific mutagenesis)一直是人们向往的目标。过去都是对一个群体进行诱变,随后通过对某些表型特征进行筛选,这样引起的突变是随机的,筛选工作量非常大。随着重组DNA技术、DNA测序技术以及寡核苷酸的快速合成技术的出现,在一个插入了外源DNA片段的质粒上,对该DNA片段在预定位置上进行结构的改变已经实现,应用也日益广泛。 ★ 定点诱变技术的成功,人们将可更自如地改造蛋白质、改造生物。有人设想通过蛋白质工程,有可能获得更加耐热、耐酸或耐碱、酶活更高、专一性更强和空间结构更加稳定的酶,有可能研制出新一代的疫苗。有可能改变品种,如蚕丝基因经过改造,也许可能产生出强度更高的纤维等。由于蛋白质工程是可以使人们按照自己的意愿通过改造基因获得蛋白质,其发展前景非常广阔。
★ 7.1.3第三代基因工程——代谢/途径工程 ★代谢工程又称途径工程(metabolic engineering/pathway engineering)是由美国加州理工学院化学工程系教授Bailey于1991年首先提出的。代谢工程是一门利用重组DNA技术对细胞物质代谢、能量代谢及调控网络信号进行修饰与改造,进而优化细胞生理代谢、提高或修饰目标代谢产物以及合成全新的目标产物的新学科。代谢工程所采用的概念来自反应工程和用于生化反应途径分析的热力学。它强调整体的代谢途径而不是个别的酶反应。 ★ 代谢工程是一个多学科高度交叉的新领域,其主要目标是通过定向性地组合细胞代谢途径和重构代谢网络,达到改良生物体遗传性状的目的。代谢工程是一门综合性大学科,现仍处于起步时期。
★代谢工程的基本原理: 1细胞物质代谢规律及途径组合的生物化学原理,它提供了生物体的基本代谢图谱和生化反应的分子机理。 2细胞代谢流及其控制分析的化学计量学、分子反应动力学、热力学和控制学原理,这是代谢途径修饰的理论依据。 3途径代谢流推动力的酶学原理,包括酶反应动力学、变构抑制效应、修饰激活效应等。 4基因操作与控制的分子生物学和分子遗传学原理,它们阐明了基因表达的基本规律,同时也提供了基因操作的一整套相关技术。 5细胞生理状态平衡的细胞生理学原理,它为细胞代谢机能提供了全景式的描述,因此是一个代谢速率和生理状态表征研究的理想平台。 6发酵或细胞培养的工艺和工程控制的生化工程和化学工程原理,化学工程对将工程方法运用于生物系统的研究无疑是最合适的渠道。从一般意义上来说,这种方法在生物系统的研究中融入了综合、定量、相关等概念。更为特别的是,它为速率过程受限制的系统分析提供了独特的工具和经验,因此在代谢工程领域中具有举足轻重的意义。 7生物信息收集、分析与应用的基因组学、蛋白质组学原理,随着基因组计划的深入发展,各生物物种的基因物理信息与其生物功能信息在此交汇,并为途径设计提供了更为广阔的舞台,这是代谢工程技术迅猛发展和广泛应用的最大推动力。
★代谢工程研究的基本过程 代谢工程研究的主要目的是通过重组DNA技术构建具有能合成目标产物的代谢网络途径或具有高产能力的工程菌(细胞株、生物个体),并使之应用于生产。其研究的基本程序通常由代谢网络分析(靶点设计)、遗传操作和结果分析三方面组成。 代谢工程研究技术的主要内容包括三个方面:1 微点阵、同位素示踪和各种常规的及现代高新生化检测技术;2 结合遗传信息学、系统生物学、组合化学、化学计量学、分子反应动力学、化学工程学及计算机科学的分析技术;3涉及几乎所有的分子生物学和遗传学的操作技术。
● 靶点设计 生物化学家在长达数十年的研究中,已确定了相当数量的细胞代谢途径,并绘制出了较完整的代谢网络图,这为代谢工程的实施奠定了基础。然而,正确的靶点设计还必须对现有的代谢途径和网络信息进行更深入的分析。首先,根据化学动力学和计量学原理定量测定网络中的代谢流分布,即代谢流分析(MFA),其中最重要的是细胞内碳元素和氮元素的流向比例关系;其次,在代谢流分析的基础上研究其控制状态、机制和影响因素,即代谢控制分析(MCA);最后,根据代谢流分布和控制的分析结果确定途径操作的合理靶点,通常包括拟修饰基因的靶点、拟导入途径的靶点或者拟阻断途径的靶点等。值得强调的是,靶点设计对代谢工程的成败起着关键作用,任何精细的靶点选择都必须经得起细胞生理特性以及代谢网络热力学平衡的检验。 ●基因操作 利用代谢工程战略修饰改造细胞代谢网络的核心是在分子水平上对靶基因或基因簇进行遗传操作,其中最典型的形式包括基因或基因簇的克隆、表达、修饰、敲除、调控以及重组基因在目标细胞染色体DNA上的稳定整合。后者通常被认为是代谢工程中最重要的特征操作技术,因为在以高效表达目的基因编码产物为主要目标的基因工程和以生产突变体蛋白为特征的蛋白质工程中,重组DNA分子一般独立于宿主细胞染色体而自主复制。
●效果分析 很多初步的研究结果显示,一次性的代谢工程设计和操作往往不能达到实际生产所要求的产量、速度或浓度,因为大部分实验涉及到的只是与单一代谢途径有关的基因、操纵子或基因簇的改变。然而通过对新途径进行全面的效果分析,这种由初步操作构建出来的细胞所表现出的限制与缺陷可以作为新一轮实验的改进目标。正像蛋白质工程实验所采用的研究策略一样,如此反复进行遗传操作即有望获得优良物种。目前,通过这种代谢工程循环获得成功的范例已有一些,所积累的经验有助于鉴定和判断哪一类特定的遗传操作对细胞功能的期望改变是相对有效的。
■基因相互作用与癌基因表达 ★7.1.4 基因打靶技术简介 ● 基因打靶技术是一种定向改变生物活体遗传信息的实验手段。其主要操作是对生物活体的遗传信息进行定向修饰,包括基因灭活、点突变引入、外源基因定向引入、染色体组大片段删除等。它能使修饰后的遗传信息在生物体内稳定地遗传和表达,这就为研究基因功能等重大生命科学问题提供了帮助,此外,它还能向人们提供关于疾病治疗和新药筛选等方面的信息。 ● 如今,基因打靶技术的发展已使得对特定细胞、组织或动物个体进行遗传修饰成为可能。它的产生和发展是建立在胚胎干细胞(embryonic stem cell,ESC)技术和同源重组技术成就的基础上,并促进了相关技术的进一步发展。
★具体的方法: 首先要获得ES细胞系,利用同源重组技术获得带有研究者预先设计突变的中靶ES细胞。通过显微注射或者胚胎融合的方法将经过遗传修饰的ES细胞引入受体胚胎内。经过遗传修饰的ES细胞仍然具有分化的全能性,可以发育为嵌合体动物的生殖细胞,使得经过修饰的遗传信息经生殖系统遗传。最终获得的带有特定修饰的突变动物为研究者提供了一个特殊的研究体系,可以在生物活体中研究特定基因的功能。 ●目前,对ES细胞进行同源重组已经成为一种在小鼠染色体组上任意位点进行遗传修饰的常规技术。通过基因打靶获得的突变小鼠已超过千种,并正以每年数百种的速度增加。通过对这些突变小鼠的表型分析,许多与人类疾病相关的新基因的功能已得到阐明,并促进了现代生物学研究各个领域中许多突破性的进展。
★7.1.5 酵母双杂交系统 ●酵母双杂交的平台技术 ☆酵母双杂交系统的建立是基于对真核生物调控转录起始过程的认识。细胞起始基因转录需要有反式转录激活因子的参与,反式转录激活因子,例如酵母转录因子GAL4在结构上是模块式的(modular),往往由两个或两个以上结构上可以分开、功能上相互独立的结构域(domain)构成,其中有DNA结合功能域(DNA binding domain,DNA-BD)和转录激活结构域(activation domain,DNA-AD)。这两个结构域,将它们分开时仍分别具有功能,但不能激活转录,只有当被分开的两者通过适当的途径在空间上较为接近时,才能重新呈现完整的GAL4转录因子活性,并可激活上游激活序列(upstream activation sequence,UAS)的下游启动子,使启动子下游基因得到转录。
☆根据这个特性,将编码DNA-BD的基因与已知诱饵蛋白质(bait protein)的基因构建在同一个表达载体上,在酵母中表达两者的融合蛋白BD-诱饵蛋白质。将编码AD的基因和cDNA文库的基因构建在AD-LIBRARY表达载体上,同时用上述两种载体转化改造后的酵母,这种改造的酵母细胞的基因组中不能产生GAL4,又不能合成LEU、TRP、HIS、ADE,因此酵母在缺乏这些营养的培养基上无法生长。当上述两种载体所表达的融合蛋白能够相互作用时,功能重建的反式作用因子能够激活酵母基因组中的报告基因HIS、ADE、LACZ、MEL1,从而通过功能互补和显色反应筛选到阳性菌落。将阳性反应的酵母菌株中的AD-LIBRARY载体分离提取出来,从而对载体中插入的文库基因进行测序和分析工作。在酵母双杂交的基础上,又发展出了酵母单杂交、酵母三杂交和酵母的反向杂交技术。它们随后被分别应用于核酸和文库蛋白之间的研究、三种不同蛋白质之间的相互作用和两种蛋白质相互作用的结构和位点研究。
●酵母双杂交系统的应用 酵母双杂交技术作为发现和研究在活细胞体内的蛋白质与蛋白质之间的相互作用的技术平台,在近几年得到了广泛运用。酵母双杂交系统是在真核模式生物酵母系统中进行的,研究活细胞内蛋白质的相互作用,对蛋白质之间微弱的、瞬间的作用也能够通过报告基因的表达产物敏感地检测得到,它是一种具有很高灵敏度的研究蛋白质之间关系的技术。大量的研究文献表明,酵母双杂交技术既可以用来研究哺乳动物基因组编码的蛋白质之间的相互作用,也可以用来研究高等植物基因组编码的蛋白质之间的相互作用。因此,它在许多研究领域中有着广泛的应用。
具体应用: (1)利用酵母双杂交发现新的蛋白质和蛋白质的新功能 酵母双杂交技术现已成为发现新基因的主要途径。研究它们之间的相互作用位点有利于基因治疗药物的开发。 (2)利用酵母双杂交在细胞体内研究抗原和抗体的相互作用 酶联免疫(ELISA)和免疫共沉淀(CO-IP)技术都是利用抗原和抗体间的免疫反应研究抗原和抗体之间的相互作用。但是,它们都是基于体外非细胞环境中研究蛋白质和蛋白质的相互作用。而在细胞体内的抗原和抗体反应则需要通过酵母双杂交进行检测。 (3)利用酵母双杂交筛选药物的作用位点以及药物对蛋白质之间相互作用的影响 酵母双杂交的报告基因能否表达在于诱饵蛋白与靶蛋白之间的相互作用。对于能够引发疾病反应的蛋白质相互作用可以采取药物干扰的方法,阻止它们的相互作用以达到治疗疾病的目的。 (4)利用酵母双杂交建立基因组蛋白连锁图(genome protein linkage map)这对于揭示重要的生命活动,如信号传导、代谢途径等具有重大意义。
★7.1.6 噬菌体展示系统 英国剑桥的Winter研究组和美国加州的Lernern研究组(1989)分别同时创立了噬菌体抗体库技术,这一重大技术被誉为抗体第三次革命。从此用丝状噬菌体表面展示技术制备高亲和特异性抗体成为可能。表面展示系统除丝状噬菌体展示系统外,还包括λ噬菌体展示系统、T4噬菌体展示系统和细菌展示系统,它们各自有其独特的用途和优缺点。
1.单链丝状噬菌体展示系统 (1)pⅢ展示系统及噬菌体抗体 丝状噬菌体属单链DNA病毒,pⅢ是病毒的次要衣壳蛋白(minor coat protein),位于病毒颗粒一端,每个病毒颗粒都有3~5个拷贝的pⅢ蛋白,pⅢ有2个位点可供外源序列插入,即N端和近N端区。当抗体片段或蛋白质融合到pⅢ的N端时,噬菌体仍有感染性,但若融合到后一位点则会切去N端而丧失感染性,这时就需要有辅助噬菌体提供野生型pⅢ蛋白。pⅢ很容易为蛋白酶水解,所以有辅助噬菌体超感染时,可以使每个噬菌体平均显示不到一个融合蛋白,即所谓“单链”噬菌体,从而使抗体部分最大限度地保持原型且功能完好。 主要用途:制备噬菌体抗体,它的突出优点是模拟了自然免疫选择系统。 用pⅢ系统制备抗体的基本程序是:从经免疫或未免疫者获取淋巴细胞 ,提取细胞mRNA,逆转录成cDNA,用PCR技术扩增抗体重链和轻链基因 。pⅢ展示系统的载体,在抗体基因与pⅢ蛋白之间插入了一个琥珀终止密码(amber stop codon),当此密码受限制时抗体片段就展示在噬菌体表面;当此密码不受限制时,抗体则分泌。 与杂交瘤技术相比,pⅢ展示系统筛选范围从几千到几百万甚至几亿,而时间可以从几个月缩短到几周,它不但绕过了繁琐的杂交瘤技术,甚至可以绕过免疫,而且可以直接获取人源性抗体,解决了鼠单抗应用于人体的免疫原性问题。
(2)pⅧ及其它展示系统 pⅧ是丝状噬菌体主要衣壳蛋白(major coat protein),每个病毒颗粒有3000个拷贝pⅧ蛋白。pⅧ的N端附近可融合5肽或6肽,但不能融合更长的肽链,因为较大的多聚蛋白会造成空间障碍,影响噬菌体装配,使其丧失感染力。但当有辅助噬菌体参与时,可提供野生型pⅧ蛋白,降低价数,此时可融合多肽甚至抗体片段。
2. λ噬菌体展示系统 (1)pⅤ展示系统 λ噬菌体的主要尾部蛋白pⅤ可供外源序列插入。λ噬菌体基因Ⅴ编码的主要尾部蛋白形成管状结构,由32个盘状结构组成,每个盘状结构又由6个pⅤ亚单位组成。pⅤ有两个折叠区(folding domain),C端的折叠区是病毒的非功能区,可供外源序列插入或替换。Maruyama等用pⅤ系统成功地展示了有活性的大分子蛋白:β-半乳糖苷酶(465kDa)和植物外源凝集素(120kDa)。若DNA结合蛋白等融合进丝状噬菌体,则相互干扰由细菌细胞质到外周腔分泌的通道;而用λ噬菌体使其在细胞质中完成折叠,无需分泌,则可避免这一干扰。λ噬菌体还可用于展示难以分泌的肽或蛋白质,因此也可作为丝状噬菌体展示系统的补充。
(2)D蛋白展示系统 D蛋白展示系统的特点: D蛋白在噬菌体头部的形态发生上是必需的。但是当噬菌体基因组小于野生型噬菌体基因组的82%时,它可以在缺少D蛋白的情况下完成组装,故D蛋白可作为外源序列融合的载体。这种展示一般为N端展示。它的组装可以在体内,也可以在体外。体外组装即是将D融合蛋白结合到λD-噬菌体表面,而在体内组装是将含D融合基因的质粒转化入λD-溶源的大肠杆菌中,从而补偿溶源菌所缺的D蛋白,通过热诱导而被组装,或利用噬菌体P1的Cre-loxP定点重组系统将外源基因组整合进入噬菌体基因组中。 D蛋白展示系统的特点: 无需将外源肽或蛋白分泌到细菌细胞膜就可以展示对细胞有毒性的蛋白。另外,D蛋白展示系统还可以用于cDNA文库的构建,抗原位点分析及作为甲基输送的工具。Mikawa等对D蛋白的基因进行了改造,使外源序列在D蛋白在N端和C端都能插入,并成功地展示了表面有活性的葡萄球菌A蛋白IgG结合域、β-半乳糖苷酶和β-内酰胺酶。
3. T4噬菌体展示系统 T4噬菌体展示系统是将外源肽或蛋白质与T4噬菌体的小衣壳蛋白(small outer capsid-protein,SOC)C端融合而被展示。T4噬菌体在宿主细胞内组装而不必通过分泌途径,因以可以展示的蛋白质范围广,尤其适用于那些不能被大肠杆菌分泌的复杂蛋白质的展示。 利用该系统已成功地展示了HIV-1病毒被膜糖蛋白gpl20的v3环状结构域和脊髓灰质炎病毒VPI衣壳蛋白(312肽),两者均能形成正确的折叠结构。由于该系统容量大(达35kDa以上的蛋白)、拷贝数高,故在完整结构域或蛋白质的免疫学展示、蛋白质与蛋白质间的相互作用以及生物工程等方面的研究有相当大的应用潜力。 利用大肠杆菌的脂蛋白、鞭毛蛋白展示外源蛋白已有报道,但相对而言,革兰阳性(G+ )菌比革兰阴性(G-)菌有优越性:G+细菌表面受体比G-细菌更容易接受外源序列的插入;G-细菌展示系统的表面展示要穿过整个外膜和细胞质膜,需要膜上的正确整合过程,而G+细菌展示系统只需穿过质膜即可以实现理想的展示。以细菌全细胞作为诊断或Panning实验,在从巨大文库中筛选特异性细菌克隆的实际操作中,由于细菌有较厚而致密的细胞壁,所以不容易在实验过程中发生细胞溶解。
■ 7.2重组药物基因的构建 ★ 7.2.1 目的基因的分离、纯化和鉴定 ☆ 一个理想的克隆载体大致有下列一些特性:①分子量小、多拷贝、松弛控制型;②具有多种常用的限制性内切酶的单切点;③能插入较大的外源DNA片段;④具有容易操作的检测表型。常用的质粒载体大小一般在1~10kb之间,如pBR322、PUC系列、PGEM系列和pBluescript(简称pBS)等。 ☆从细菌中分离质粒DNA的方法包括3个基本步骤: ①培养细菌使质粒扩增; ②收集和裂解细胞; ③分离和纯化质粒DNA。 ☆采用溶菌酶可以破坏菌体细胞壁,十二烷基磺酸钠(SDS)和Triton X-100可使细胞膜裂解。当用强酸或碱、热处理时,细菌的线性染色体DNA变性,而共价闭环DNA(covalently closed circular DNA,cccDNA)的两条链不会相互分开。当外界条件恢复正常时,线状染色体DNA片段难以复性,而是与变性的蛋白质和细胞碎片缠绕在一起而沉淀,而质粒DNA双链恢复原状,重新形成天然的超螺旋分子,并以溶解状态存在于液相中。
★ 7.2.2基因克隆和表达的基本步骤 1.目的基因的制备: 生物制药上游技术的重组DNA技术,是通过对核酸分子的剪切、重组和插入而实现遗传物质的重新组合,再借助质粒、病毒或其它载体,将重组基因转移到新的宿主细胞,使其在新的宿主细胞系统内复制和表达的技术,是现代生物技术的核心,其基本过程包括以下几个方面: 1.目的基因的制备: (1)人工合成基因 许多细胞生长因子,如表皮生长因子、胰岛素样生长因子、干扰素、红细胞生成素等都采用了人工合成基因。 (2)聚合酶链反应(PCR)制备基因 方法是,设计并合成一对分别与目的基因双链DNA片段的两个3·末端部分序列互补的单链寡核苷酸引物,以含目的基因序列的基因组DNA或cDNA作为模版,通过耐热DNA聚合酶扩增出目的基因。 (3)从DNA文库筛选基因 DNA基因文库共有两种,基因组文库和cDNA文库。①基因组文库。由一种生物基因组得到的DNA片段的集合,其中每个片段都连接到一个克隆载体上,该种生物的全部遗传信息由文库中的全部DNA片段代表。 ②cDNA文库。cDNA是一种更具有专一性的DNA文库,它只含有在一定生物或一定细胞和组织中表达的基因。表达基因和非表达基因的关键区别在于表达基因要转录RNA. (4)利用标记DNA探针从DNA文库中筛选目的基因 因为每个基因都有惟一的核苷酸序列,所以可以利用与该基因序列互补的标记DNA片段检出目的基因,这种标记DNA的片段称为探针(probe)。探针可以用放射性同位素标记,也可以用非放射性物质如生物素、地高辛、荧光素等标记。
2.载体的制备: (1)直接表达(非融合表达)载体 (2)融合表达载体 这类载体在启动子下游有一个细菌蛋白的N末端片段编码序列,随后是多克隆位点。外源基因在多克隆位点插入,表达产物是N端的细菌蛋白片段和C端的外源基因产物的融合蛋白。 融合蛋白表达有两个优点:一是N端的细菌蛋白质可以稳定外源蛋白质,使其不被蛋白质酶降解;二是有利于外源蛋白质的纯化,并且可以作为监测表达的报告基因。 一些分子质量较小,在细菌细胞中不稳定,易被蛋白酶降解的生长因子如表皮生长因子、胰岛素样生长因子、胰岛素原等宜采用融合表达。 (3)分泌型表达载体 细菌细胞质内有多种蛋白酶可以降解外源基因产物,而周质间(壁膜间隙)中蛋白酶较少,因此易降解的蛋白产物可采用分泌型表达,使产物分泌到周质间。分泌型表达需要在外源基因的N末端融接带有完整信号肽的细菌分泌蛋白的部分编码序列,大肠杆菌碱性磷酸酯酶、支链淀粉酶、脂蛋白、外膜蛋白(OmpA)、金黄色葡萄球菌蛋白A的带有信号肽的N末端编码序列都可用于构建分泌型表达载体。
3. 目的基因的与载体的连接: (1)黏性末端连接有三种方式 ①用同一种产生黏性末端的限制酶切开载体和目的基因的两端,然后用连接酶连接,连接处可以用同一种酶再切开,重新回收插入的目的基因片段。 ②载体和目的基因用两种能产生相同黏性末端的限制酶(如Bam HⅠ和BglⅡ)切开,然后用连接酶连接,但产生的连接部位可能用原来的任何一种酶都不能切开。 ③用两种产生不同黏性末端的限制酶分别切开载体和目的基因序列中的识别序列,然后用连接酶连接,这种连接方式的优点是能将目的基因按需要定向插入到载体的克隆化位点,形成正确的阅读框。 (2)平头末端连接 平头末端连接效率较低,需要加大连接酶用量。平头末端连接要求载体被插入部位两端也是平头,为此,可用两种方式处理载体。 ①用产生平头末端的限制酶切开载体 ②载体预定插入部位若不能用产生平头末端的酶切开,也可以用产生黏性末端的酶切开,然后用S1核酸酶除去黏性末端的单链凸出部分,或用大肠杆菌DNA聚合酶ⅠKlenow大片段补齐黏性末端的凹回部分。 (3)人工接头连接 如果目的基因与切开的载体的末端不能吻合,通常要加上一个含有所需限制酶识别序列的合成DNA片段,以便于连接和以后再切开连接后的DNA。
4.将含目的基因的重组表达载体引入受体细胞并在其中复制和表达: 含目的基因的表达载体构建完成后,需导入宿主细胞中表达,通常采用转化法。转化是指细胞在一定生理状态即感受态(competence)时,可摄取外源遗传物质,摄入的遗传物质可独立复制或通过体内重组成为宿主细胞染色体的一部分,并带给宿主细胞某些新的遗传性状。不同的宿主需用不同的方法处理,形成感受态,进行转化。 (1)氯化钙转化法 (2)原生质体-聚乙二醇(PEG)转化法 (3)电穿孔法(electroporation) 5.筛选带有重组目的基因的转化子: (1)抗药性筛选 目前使用的质粒载体几乎都带有某种抗药性基因作为选择性标记,为转化子的筛选提供了方便。 (2)单菌落快速电泳 将抗药性转化子单菌落随机挑出,快速提取质粒,电泳检测,找出比单纯载体分子量大的条带,对含大分子量质粒的菌株进一步做质粒DNA酶切图谱检查或基因功能检查。 (3)限制酶图谱分析 将初步筛选的转化子细胞或质粒的DNA进行限制酶切分析,确定是否为含有目的基因的重组子。 (4)Southern印迹杂交或菌落原位杂交 (5)基因及其表达产物的鉴定 可测定基因DNA的核苷酸序列,也可通过免疫分析鉴定基因表达产物的存在,还可直接测定产物的氨基酸序列、功能和活性等。 6.鉴定目的基因的表达产物.
■ 7.3重组药物基因表达系统 重组药物基因表达系统的筛选和构建是实现目的基因高效表达的关键。目前,表达系统既可以用原核生物如大肠杆菌、枯草杆菌或链霉菌等,也可以用真核生物如酵母、昆虫或哺乳动物细胞和转基因动物等。
★ 7.3.1 原核生物基因表达系统 以枯草芽孢杆菌表达系统为例: ☆大肠杆菌质粒在枯草芽孢杆菌中不能有效地复制。而且,枯草芽孢杆菌本身的天然质粒都是隐蔽型质粒,没有可检测的表型,因此不便于基因克隆。从金黄色葡萄球菌中分离的质粒,如pC194,有氯霉素抗性基因,能转化枯草芽孢杆菌并在其中正常复制并表现出抗生素抗性。 ☆由于质粒的结构和分配不稳定性,直接在枯草芽孢杆菌中克隆会遇到困难,所以构建了一些穿梭载体,即能在两种不同生物细胞(如大肠杆菌和枯草芽孢杆菌)中保持复制的质粒载体。常用的穿梭载体有pHV系列、pHP系列、pEB10系列和pLB5系列。 ☆枯草芽孢杆菌的表达载体中,一些是以大肠杆菌的Lac系统、噬菌体λ(大肠杆菌)或φ105(枯草芽孢杆菌)的温度敏感型阻遏物为基础构建的,另一些是枯草芽孢杆菌的蔗糖诱导性基因sacB的调节区为基础构建的。
★ 7.3.2 真核生物基因表达系统 1.酿酒酵母系统 (1)酵母的克隆载体 酵母细胞中的天然质粒为2μ质粒,因为没有明显的选择标记,不适于作基因工程载体。利用重组DNA技术发展了一系列酵母克隆载体,其中包括以下几方面: ①酵母整合型质粒(yeast integrating plasmid,YIP)。 ②酵母附加体型质粒(yeast episomal plasmid,YEP)。 ③酵母复制型质粒(yeast replicating plasmid,YRP)。YRP在酵母细胞中以高拷贝数存在,产生的转化体极稳定。 ④酵母着丝粒型质粒(yeast centromere plasmid,YCP)。这类质粒除了像YRP一样含有酵母染色体着丝粒序列外,还含有使质粒在酵母细胞中保持稳定的DNA片段 ⑤人造酵母染色体(yeast artificial chromosome,YAP)。这种载体含有天然酵母染色体的三种基本成分:复制起点、着丝粒序列和端粒序列。具有线性结构和天然酵母染色体的许多性质。 酵母克隆载体除了上述5种类型外,还有一种基于酵母TY转座子的逆转录病毒样载体(retrovirus-like vectors)。
(2)酵母启动子 外源基因在酵母中表达比较困难,需要利用酵母本身的启动子和 翻译起始信号,这可能与酵母启动子的独特结构有关。一般酵母启动子有4种可识别的结构元件。 ①起始序列。转录起始部位有几个共有序列,而一半以上已知酵母基因的起始部位具有其中两个序列,即TC(G/A)A和PuPuPyPuPu。 ②TATA box。具有规范序列TATAT/AAT/A,位于起始部位上游40~120个核苷酸,在功能上相当于大肠杆菌启动子的pribnow box。 ③上游抑制序列(upstream repressing sequences,URS)。负调控蛋白与URS结合降低基因的转录速度。 ④上游激活序列(upstream activating sequences,UAS)。正调控蛋白与UAS结合可增强转录,而UAS缺失使转录消除,UAS的一个结构特性是存在一个或多个双重对称区。 此外,转录水平还受称为下游激活序列(downstream activating sequences,DAS),基因本身内部序列的影响。
常见的酵母启动子系统 启动子 强度 调节方式 磷酸甘油酸激酶(PGK) 4+(mRNA的5%) 葡萄糖诱导不到20倍 半乳糖激酶(GAL1) 半乳糖诱导1000倍,但受葡萄糖抑制 酸性磷酸酯酶(PHOS) 2+ 无机磷酸阻遏200倍 乙酸脱氢酶Ⅱ(ADH2) 葡萄糖阻遏100倍 铜金属硫蛋白(CUP1) + 铜诱导20倍 交配外激素α1(MFα1) 在野生型α细胞中为组成型,但在sir3细胞中温度变化诱导105倍
(3)酵母的分泌信号 (4)常用酵母表达载体 (5)新型酵母表达系统 酵母表达系统的一个重要特征是外源蛋白都以分泌形式表达。这样可以避免产物在细胞内积累和被蛋白酶降解,有利于细胞正常生长、表达产物的稳定性及分离提纯。 (4)常用酵母表达载体 一个最常用的酵母表达载体是pMFα8。这是一个分泌型载体,含有大肠杆菌质粒colEⅠ和酵母2μ质粒的复制原点、酵母α因子(MFα1)基因以及相应的启动子、分泌信号和加工位点。α因子是酵母的一种分泌性寡肽,最初以较大的前体分子合成,经特异性裂解被分泌到细胞外。 (5)新型酵母表达系统 酵母表达量很高,特别是新型酵母——毕赤酵母(Pichia pastoris)的产量可达10~20g/L以上。酵母可进行高密度发酵培养,在发酵罐中细胞干重可达120g/L。
2.昆虫细胞及幼虫表达系统 在昆虫系统中用作载体的是感染昆虫的杆状病毒,主要有两种:苜蓿银纹夜峨核型多角体病毒和家蚕核型多角体病毒。 核多角体病毒(NPV)基因组是大的双链DNA分子,约148kb。在正常感染期间,病毒产生的核包涵体,由包埋在蛋白质基质中的病毒颗粒组成,主要成分是病毒编码的一种蛋白质,称为多角体蛋白。多角体蛋白基因的启动子是一个很强的启动子,在病毒感染细胞后期,多角体蛋白可达细胞总蛋白含量的50%。而多角体蛋白不是病毒复制所必需的,因此用外源基因取代多角体蛋白基因,构成重组病毒,就可以利用多角体蛋白基因组启动子驱动外源基因在昆虫细胞或幼虫中高效表达。 构建NPV表达载体需要采用一种间接策略,即利用一个小的重组转移载体及体内同源重组产生作为表达载体的重组病毒基因组。将外源基因插入多角体蛋白基因启动子下游。重组AcMNPV的表达一般是通过感染秋粘虫(Spodoptera frugiperda)培养细胞,外源基因在感染期间表达,在感染后大约3天可获得很高产量的蛋白质。 迄今为止,国内外已有干扰素α和干扰素β、肿瘤坏死因子α、人巨噬细胞集落刺激因子和粒细胞-巨噬细胞集落刺激因子等多种细胞因子在昆虫系统中获得表达。
3. 哺乳动物细胞系统 对于哺乳动物,没有上述类似的载体可供利用,外源基因需要整合到宿主细胞染色体中,随染色体一起复制、遗传、表达。 (1)外源DNA导入哺乳动物细胞的方法 ①磷酸钙-DNA共沉淀法 ②脂质体包裹法 ③显微注射法 ④电穿孔法 ⑤病毒载体导入法 (2)共转染(cotransfection) (3)选择标记基因 ①HSVtk基因 ②DHFR-Mtx选择系统 (4)pSV和pRSV质粒 (5)外源基因在哺乳动物细胞中的高水平表达操作要点 : ①使用强的增强子/启动子 ②避免mRNA5·-非编译区内形成二级结构; ③缩短mRNA5·-非编译区,消除起始密码子上游的AUG,因为这些AUG三联体对真正起始密码子的起始不利; ④起始密码子周围的顺序应符合kozalt规则,其中最重要的是在-3位置(AUG密码子的A为+1)是嘌呤,而在+4位置是G; ⑤消除mRNA-非编译区的富含AU序列,因其能降低mRNA的稳定性; ⑥如需要可诱导表达系统,可以选择金属硫蛋白MD启动子,用金属离子镉或锌诱导转录。
哺乳动物细胞的可扩增选择遗传标记 选择标记基因 选择 二氢叶酸还原酶(DHFR) 金属硫蛋白(MT) 黄嘌呤-鸟嘌呤磷酸 核糖基转移酶(XGPRT) 新霉素磷酸转移酶 天冬氨酸转甲酰酶(CAD) 腺嘌呤核苷酸脱氨酶 腺苷酸脱氢酶 UMP合成酶 甲酰蝶呤(Mtx)抗性 金属离子镉抗性 霉酚酸抗性 卡那霉素、新霉素、G418抗性 L-膦酸乙酰-L-天冬氨酸(PLAL)抗性 腺嘌呤核苷、亚硝基羟基丙氨酸、α-脱氧间型霉素 腺嘌呤、重氮丝氨酸、脱氧助间型霉素 6-氮尿苷或吡啶呋喃菌素
★ 7.3.3 各种表达系统的特点 各种表达系统的特性比较 表达体系 优缺点 产量 原核生物体系 大肠杆菌 真核生物体系 酵母 具有良好的可操作性,成本低,但不能进行糖基化修饰,胞内较容易形成包涵体 外源蛋白10%~70%胞内表达,0.3%~4%胞外表达,其余表达于周质空间 真核生物体系 酵母 兼有原核生物细胞系统良好的可操作性和真核生物系统的表达后加工能力,但存在产量低及过度糖基化等问题 外源目标蛋白占菌体总蛋白的10% 甲醇营养型酵母 第二代酵母表达系统,部分克服了过度糖基化缺点,有较好的分泌性,产量较高,但产物结构与天然分子仍有一些差距 外源目标蛋白占菌体总蛋白的10%~30% 昆虫细胞 具有高等真核生物表达系统的优点,产物的抗原性、免疫原性和功能与天然蛋白质相近,表达水平较高,但糖基化程度低,形式单一 发酵液中蛋白表达量约为1~500mg/L 哺乳动物细胞系统 产物的抗原性、免疫原性和功能与天然蛋白质最接近,糖基化等后加工最准确,但表达水平较低 发酵液中蛋白表达量约为0.2~200mg/L
■ 7.4重组药物高效表达的方法 基因工程药物多属于真核生物蛋白与多肽,影响真核生物基因在大肠杆菌中表达效率的主要因素有:启动子强度、翻译起始序列、mRNA的二级结构、密码子选择、转录终止、质粒拷贝数、质粒稳定性和宿主细胞生理等,其中许多因素是在翻译水平上起作用。
★7.4.1选择和构建强启动子 启动子是与RNA聚合酶结合并启动RNA转录的40~50bp的DNA序列,原核生物细胞启动子主要有-10区和-35区两个保守区域,-10区位于转录起始点上游5~10bp处,由6~8bp组成,富含AT,又称TATAbox或普里布诺/普氏盒(Pribnow box);-35区位于转录起始点上游约35bp处,一般由9bp组成,原核生物RNA聚合酶不能识别真核生物基因启动子。因此若在大肠杆菌中高效表达真核生物基因,需要在构建表达载体时选用原核生物强启动子,并且,这种强启动子必须是受到控制或可诱导的,以使外源蛋白不会过早表达,影响宿主细胞的生长和增殖。大肠杆菌基因工程中常用的强启动子有Lac、Trp、tac、λPL和T7启动子。 比较多种大肠杆菌启动子,得出了-35区和-10区的共有序列5·TTGACA3·和5·TATAAT3·,发现启动子强度与其和共有序列的相似程度成正比。
★ 7.4.2优化翻译起始区 影响翻译起始的主要因素是Shine-Delgarno(S-D)序列或核糖体结合位点(rbs)。它位于起始密码子AUG上游3~11bp处,由3~9bp组成,富含嘌呤核苷酸,与16SrRNA3·末端序列互补,互补程度能影响翻译速度,与5·-GGAGG-3·序列产生完全的互补,这个序列中单一碱基变化能使翻译速度降低10倍。 改变S-D区后的4个碱基组成会影响翻译。这个位置有4个A或4个T能产生最高的翻译效率。如果这个区含4个C或4个G,则翻译速率分别只有最高效率的50%和25%。 起始密码子AUG前面的三联体也能影响翻译效率。 AUG起始密码子后面的密码子组成也影响翻译速度。
★ 7.4.3优化mRNA二级结构 翻译起始需要活化的30S核糖体亚基与折叠成特定二级结构的mRNA5·末端区之间相互作用,因此,对于高效翻译,mRNA的起始密码子和S-D序列不应该形成双链结构,以便接近30S核糖体亚基。改变mRNA5·末端和S-D序列之间的距离会影响翻译,当这个距离少于15个碱基时,翻译效率明显降低。S-D序列和起始密码子之间的距离变化也影响翻译,当以分泌型表达人表皮生长因子基因时,这个距离在7~9个核苷酸能得到最理想的表达。
★ 7.4.4使用宿主偏爱的密码子 密码子是使用的偏性与细胞中tRNA的可利用性和密码子嘧啶末端的非随机选择两个因素有关。密码子第三位置的嘧啶选择是有偏爱性的,且与基因表达有关。在高表达基因中,如果密码子的前两个碱基是A或U,则优先使用的第三个碱基是C;如果前两个碱基是G或C,则偏爱的第三个碱基是U。 利用人工合成的基因,可以容易地使密码子偏性选择最优化,以利于基因最大限度表达。
★ 7.4.5提高质粒拷贝数 影响基因转录速度的因素有两个,一是启动子强度,二是基因拷贝数。增加基因剂量的最简易方法是利用高拷贝数质粒克隆目的基因。通常用的高拷贝数质粒载体多数是colEⅠ质粒的衍生物。
★7.4.6利用强转录终止子 一些强启动子可能引起转录通读,使转录超过真核生物基因终止信号,产生超长转录物,增加细胞能量消耗;或使转录物形成非必需的二级结构,降低翻译效率;还可能干扰其它必需基因或调控基因的转录,例如由于连读Rop基因而干扰质粒复制,导致质粒拷贝数下降。因此,在大肠杆菌中表达外源基因需要强终止子。
★7.4.7增强质粒稳定性 外源基因的高效率表达可能导致细胞生长速度降低或形态学变化,如成为纤丝状和减弱细胞耐性。如果产生了丢失质粒或发生结构重排的突变体,这种突变体不再表达重组基因或减少了质粒拷贝数,可能具有更快的生长速度,并迅速在培养物中成为优势菌,从而引起基因工程菌的质粒丢失。
(1)分配不稳定性 这个问题可以通过保持抗生素选择压而避免,但是,出于成本和大量处理废物的考虑,这不是一个理想的解决方法。可以把其它质粒如pSC101的par区克隆到pBR322系列的载体中,使质粒稳定。 消除质粒分配不稳定性的另一种方法是反选择无质粒细胞。使含目的基因的质粒同时携带λcⅠ基因,然后用λ噬菌体的阻遏物缺陷型突变体使携带重组质粒的宿主细胞溶源化。溶源菌中质粒的丧失将伴随λ阻遏物的丢失,从而,原噬菌体被诱导进入裂解生长周期,引起无质粒细胞死亡。 质粒形成多聚体也会引起质粒的不稳定性。 (2)结构不稳定性 可以利用阻遏物控制外源基因的表达,使其在细胞生长和增殖阶段保持在最低限度,这样可以减轻细胞代谢负担和对缺失体的选择
★ 7.4.8宿主细胞生理学调控 基因表达还受细胞生理的控制,其中,主要因素包括营养成分及其操作方式,环境参数如温度、pH和溶解氧等。 注意: 基因工程产物生产时,评价工程细胞表达的高低应考虑提供三个参数:①产量,单位是mg目标产物/L发酵液;②生产能力,单位是mg/(L.h);③表达水平(%)。单位是目标蛋白量/总蛋白量。其中表达水平随发酵条件波动极大(0~70%)。
The End 谢谢观赏