6 蛋白质工程 学习目的 初步了解蛋白质结构,以及蛋白质分子设计和蛋白质修饰和表达等的基本原理。了解如何利用蛋白质工程技术和其他相关技术获得更加符合人类需求且比天然蛋白质更优良的蛋白质。
6.1 蛋白质结构基础 6.1.1 蛋白质结构的基本构件 蛋白质、核酸 、多糖和脂类等生物大分子的结构与功能。 蛋白质工程 6 蛋白质工程 http://www.oursci.org/magazine/200210/021003.htm
氨基酸分类: 非极性R基氨基酸、不带电荷的 极性R基氨基酸 、带正电荷的R 基氨基酸 、带负电荷的R基酸性氨 基酸 6.1.1 蛋白质结构的基本构建 蛋白质工程 6.1.1.1蛋白质的化学组成 基本元素: 有机元素: 碳、氢、氧和氮 无机元素: 碱金属、碱土金属 和重金属 蛋白质: 、胨、肽 氨基酸分类: 非极性R基氨基酸、不带电荷的 极性R基氨基酸 、带正电荷的R 基氨基酸 、带负电荷的R基酸性氨 基酸
6.1.1.2 氨基酸的物理性质 无色结晶 特殊晶型 溶点极高 两性离子形式存在 氨基和羧基 接受质子和释放质子 两性电解质 蛋白质工程 6.1.1 蛋白质结构的基本构建 蛋白质工程 6.1.1.2 氨基酸的物理性质 无色结晶 特殊晶型 溶点极高 两性离子形式存在 氨基和羧基 接受质子和释放质子 两性电解质
6.1.1.3 蛋白质的一级结构 各种氨基酸的简写符号 丙氨酸 Ala A 异亮氨酸 Ile I 精氨酸 Arg R 亮氨酸 Leu L 6.1.1 蛋白质结构的基本构建 蛋白质工程 6.1.1.3 蛋白质的一级结构 各种氨基酸的简写符号 丙氨酸 Ala A 异亮氨酸 Ile I 精氨酸 Arg R 亮氨酸 Leu L 天冬酰胺 Asn N 赖氨酸 Lys K 天冬氨酸 Asp D 蛋氨酸 Met M Asn或Asp Asx B 苯丙氨酸 Phe F 半胱氨酸 Cys C 脯氨酸 Pro P 谷氨酰胺 Gln Q 丝氨酸 Ser S 谷氨酸 Glu E 苏氨酸 Thr T Gln或Glu Glx Z 色氨酸 Trp W 甘氨酸 Gly G 酪氨酸 Tyr Y 组氨酸 His H 缬氨酸 Val V 名称 三字母符号 单字母符号 名称 三字母符号 单字母符号
多肽链 :由许多氨基酸按一定的排列顺序通 过肽键相连而成。 酰胺键 :一个氨基酸的氨基与另一氨基酸的 羧基缩合失去一分子水。 肽键结构 6.1.1.3 蛋白质的一级结构 蛋白质工程 多肽链 :由许多氨基酸按一定的排列顺序通 过肽键相连而成。 酰胺键 :一个氨基酸的氨基与另一氨基酸的 羧基缩合失去一分子水。 肽键结构
多肽主链的空间限制 (一)酰胺平面与α-碳原子的二面角(φ和ψ) (二)可允许的φ和ψ值:拉氏构象图 二面角 (φ和ψ)所规定的构象能否 存在取决于两个相邻肽单位中非共 价键合原子之间的接近有无阻碍。
人 Thr Thr Ile 猪 Ala Thr Ile 牛 Ala Ala Val 图6-2 猪、牛和人的胰岛素的一级结构 6.1.1.3 蛋白质的一级结构 蛋白质工程 X Y Z 人 Thr Thr Ile 猪 Ala Thr Ile 牛 Ala Ala Val 图6-2 猪、牛和人的胰岛素的一级结构
分子构象: 空间结构、高级结构、立体结构、 三维结构。 二级结构 :指多肽链主链骨架中的若干肽段,各 自沿着某个轴盘旋或折叠,并以氢键 6.1 蛋白质结构基础 蛋白质工程 6.1.2 蛋白质的高级结构 分子结构: 一级结构、二级结构、三级结构 和四级结构。 分子构象: 空间结构、高级结构、立体结构、 三维结构。 二级结构 :指多肽链主链骨架中的若干肽段,各 自沿着某个轴盘旋或折叠,并以氢键 维系,从而形成有规则的构象。 α螺旋、β折叠和β转角
6.1.2 蛋白质的高级结构 蛋白质工程 α螺旋结构 β折叠结构
三级结构:在三维空间中沿着多方向进行卷 曲、折叠、盘绕而成的近似球形的 结构。 蛋白质构象作用力: R基之间的氢键 6.1.2 蛋白质的高级结构 蛋白质工程 三级结构:在三维空间中沿着多方向进行卷 曲、折叠、盘绕而成的近似球形的 结构。 蛋白质构象作用力: R基之间的氢键 非极性R基之间的疏水基相互作用 α螺旋和β折叠中的肽链内或肽链间的氢键 带正负电荷的R基之间的离子键
稳定蛋白质三维结构的作用力 离子键 及 盐键 氢键 疏水键 范德华力 a 离子键 b 氢键 c 疏水键 d 范德华引力
数条多肽链组成,这些多肽链通常以二硫键相连接成为亚基。 四级结构 亚基聚合而成 亚基之间非共价键结合 均一四级结构 非均一四级结构 6.1.2 蛋白质的高级结构 蛋白质工程 亚基 (三级结构) 一条多肽链组成。 数条多肽链组成,这些多肽链通常以二硫键相连接成为亚基。 四级结构 亚基聚合而成 亚基之间非共价键结合 均一四级结构 非均一四级结构
二聚体、三聚体、四聚体、五聚体,最多可聚合成六十聚体 6.1.2 蛋白质的高级结构 蛋白质工程 维持四级结构的主要力: 疏水键、氢键、离子键和范德华引力 常见的聚合体: 二聚体、三聚体、四聚体、五聚体,最多可聚合成六十聚体
6.1 蛋白质结构基础 蛋白质工程 6.1.3 蛋白质分子之间的相互作用
6.1.3 蛋白质分子之间的相互作用 蛋白质工程 铁蛋白 钼铁蛋白 钼铁蛋白和铁蛋白相互作用示意图(引自Schlessman et al.)
蛋白质必须具备特定的结构,才能表现特定的功能,在蛋白质肽链中有一些基团对特定功能而言是必需基团,另一些是非必需基团。 蛋白质工程 6.1 蛋白质结构基础 6.1.4 蛋白质结构与功能的关系 蛋白质必须具备特定的结构,才能表现特定的功能,在蛋白质肽链中有一些基团对特定功能而言是必需基团,另一些是非必需基团。 在体内,蛋白质分子是如何利用它的特定结构执行特定的生物功能的。
指在不同的有机体中实现同一功能的蛋白质,但这些同源蛋白质中的氨基酸序列存在着种属的差异性。 6.1.4 蛋白质结构与功能的关系 蛋白质工程 同源蛋白质 指在不同的有机体中实现同一功能的蛋白质,但这些同源蛋白质中的氨基酸序列存在着种属的差异性。 结构域 多肽链之间以共价键方式连接 功能区域
铁蛋白的分子结构是由铁核和蛋白质壳组成的。 铁蛋白的隧道可分为电子隧道和物质交换隧道,前者起着传递电子的作用,后者起着物质交换的通道作用。 6.1.4 蛋白质结构与功能的关系 蛋白质工程 铁蛋白的分子结构是由铁核和蛋白质壳组成的。 铁蛋白的隧道可分为电子隧道和物质交换隧道,前者起着传递电子的作用,后者起着物质交换的通道作用。 铁蛋白蛋白质壳通过柔性调节产生电子传递现象。
A:蛋白质壳; B: 铁核; C:三相物质交换隧道 6.1.4 蛋白质结构与功能的关系 蛋白质工程 A 铁蛋白分子结构图 A:蛋白质壳; B: 铁核; C:三相物质交换隧道
6.1.4蛋白质结构与功能的关系 蛋白质工程 protease inhibitor-proteasecomplex inhibitor 丝氨酸蛋白酶抑制剂(Serpins)抑制蛋白酶活性的途径与机理
6.1.4 蛋白质结构与功能的关系 蛋白质工程 模拟核小体分子
从预期功能出发,设计期望的结构,合成目的基因且有效克隆表达或通过诱变、定向修饰和改造等一系列工序,合成新型优良蛋白质。 6 蛋白质工程 蛋白质工程 6.2 蛋白质工程的研究方法 6.2.1 蛋白质工程的研究策略 蛋白质工程的基本途径: 从预期功能出发,设计期望的结构,合成目的基因且有效克隆表达或通过诱变、定向修饰和改造等一系列工序,合成新型优良蛋白质。
一、蛋白质工程崛起的缘由 基因工程在原则上只能生产自然界已存 在的蛋白质,这些天然蛋白质是生物在 长期进化过程中形成的,它们的结构和 功能符合特定物种生存的需要,却不一 定完全符合人类生产和生活的需要。
6.2.1蛋白质工程的研究策略 蛋白质工程 蛋白质工程的主要研究手段: 利用所谓的反向生物学技术,其基本思路是按期望的结构寻找最适合的氨基酸序列,通过计算机设计,进而模拟特定的氨基酸序列在细胞内或在体内环境中进行多肽折叠而成三维结构的全过程,并预测蛋白质的空间结构和表达出生物学功能的可能及其高低程度。
6.2.1 蛋白质工程的研究策略 蛋白质工程
三、蛋白质工程的基本原理 DNA合成 分子设计 基因 DNA 氨基酸序列 多肽链 蛋白质 三维结构 预期功能 生物功能 mRNA 折叠 转录 翻译
蛋白质工程实例: 实例1:干扰素的保存 天然的干扰素在体外保存相当困难。 如果将其分子上的一个半胱氨酸变成丝氨酸,那么在—70℃的条件下,可以保存半年。
实例2:玉米中赖氨酸的含量比较低 原因:赖氨酸合成过程中两个关键酶——天冬氨酸激酶和二氢吡啶二羧酸合成酶的活性,受细胞内赖氨酸浓度的影响。当赖氨酸浓度达到一定量时,就会抑制这两种酶的活性。 如果对赖氨酸合成过程中的两个关键酶进行改造,可以使玉米叶片和种子中的游离赖氨酸分别提高5倍和2倍。
实例3:工业用酶 许多工业用酶是在改变天然酶的特性后,才使之适应生产和使用需要的。
3、蛋白质工程产物: 是自然界原本不存在的新的蛋白质。 在已研究过的几千种酶中,只有极少数可以应用于工业生产,绝大多数酶都不能应用于工业生产,这些酶虽然在自然状态下有活性,但在工业生产中没有活性或活性很低。这是因为工业生产中每一步的反应体系中常常会有酸、碱或有机溶剂存在,反应温度较高,在这种条件下,大多数酶会很快变性失活。提高蛋白质的稳定性是工业生产中一个非常重要的课题。一般来说,提高蛋白质的稳定性包括:延长酶的半衰期,提高酶的热稳定性,延长药用蛋白的保存期,抵御由于重要氨基酸氧化引起的活性丧失等。 3、蛋白质工程产物: 是自然界原本不存在的新的蛋白质。
从结构设计出发,从蛋白质的二级结构开始,以摸索蛋白质结构的稳定性。 6.2 蛋白质工程的研究方法 蛋白质工程 6.2.2 蛋白质的全新设计 6.2.2.1 设计目标的选择 蛋白质全新设计 功能设计、结构设计。 研究重点和难点 从结构设计出发,从蛋白质的二级结构开始,以摸索蛋白质结构的稳定性。
6.2.2.2 蛋白质设计技术与方法 常用的蛋白质设计思路 是否存在蛋白质多聚体状态;二级结构与预期目标是否吻合。 6.2.2 蛋白质的全新设计 蛋白质工程 6.2.2.2 蛋白质设计技术与方法 常用的蛋白质设计思路 是否存在蛋白质多聚体状态;二级结构与预期目标是否吻合。 是否具有预定的三级结构。圆二色谱和核磁共振技术可用于研究蛋白质。 是否以单分子或多聚体形式存在。三级结构测定目前主要依靠荧光和核磁共振技术。体积排阻色谱法也可以用于判断分子体积大小、聚合体数目和蛋白质结构是处于无规则状态或三级结构等生化参数。
6.2.2 蛋白质的全新设计 蛋白质工程 天然的锌指多肽 FSD-1多肽(从头设计)
6.2.3 改变现有蛋白质的结构 分离纯化目标蛋白质。 分析目标蛋白质的一级结构;分析目标蛋白质的三维结构以及结构与功能的关系。 6.2 蛋白质工程的研究方法 蛋白质工程 6.2.3 改变现有蛋白质的结构 分离纯化目标蛋白质。 分析目标蛋白质的一级结构;分析目标蛋白质的三维结构以及结构与功能的关系。 根据蛋白质的一级结构设计引物,克隆目的基因。 根据蛋白质的三维结构和结构与功能的关系以及蛋白质改造的目的设计改造方案。 对目的基因进行人工定点突变。 改造后的基因在宿主细胞中表达。 分离纯化表达的蛋白质并分析其功能,评价是否达到设计目的。
6.2.3 改变现有蛋白质的结构 蛋白质工程 改变蛋白质结构的核心技术 基因人工定点突变技术 M13载体法 PCR扩增法
Consequences of point mutations within a coding sequence (gene) for the protein Silent mutations: -> change in nucleotide sequence with no consequences for protein sequence -> Change of amino acid -> truncation of protein -> change of c-terminal part of protein -> change of c-terminal part of protein
该法的原理是利用人工合成带突变位点的寡聚核苷酸作为引物,利用M13噬菌体载体系统合成突变基因。 6.2.3 改变现有蛋白质的结构 蛋白质工程 6.2.3.1 M13载体法 该法的原理是利用人工合成带突变位点的寡聚核苷酸作为引物,利用M13噬菌体载体系统合成突变基因。
6.2.3.1 M13载体法 蛋白质工程 M13载体法基因人工定点突变示意图(引自吴乃虎,1998)
蛋白质工程 6.2.3 改变蛋白质的现有结构 6.2.3.2PCR扩增法 该法的原理也是利用人工合成带突变位点的诱变引物,通过PCR扩增而获得定点突变的基因。PCR定点诱变法可分为重组PCR定点诱变法和大引物诱变法两种。
蛋白质工程 6.2.3.2 PCR扩增法 重组PCR定点突变法示意图(引自吴乃虎,1998)
蛋白质工程 6.2.3.2 PCR扩增法 大引物诱变法示意图(引自吴乃虎,1998)
PCR技术适合进行基因的定点诱变 c a 3` 5` 3` 5` 3` 5` b d 3` 5` 加入引物a、d 3` 5` 3` 5` 加klenow DNA聚合酶 3` 5` 3` 5` 3` 5` b d 3` 5` 加入引物a、d 3` 5` 3` 5` 5` 3` 3` 3` 5` 3` 5` 3` 5` 3` 5` 变性、退火 5` 3` 3` 5`
Arg117位自溶点的缺失突变,得到缺失突变体,其结果表明该突变体的稳定性明显提高。 6 蛋白质工程 蛋白质工程 6.3蛋白质工程的应用实例 6.3.1胰蛋白酶 223个氨基酸残基和以异亮氨酸为N端的单肽链。 Arg117位自溶点的缺失突变,得到缺失突变体,其结果表明该突变体的稳定性明显提高。 将酶分子表面的正电荷改变成负电荷,以提高胰蛋白酶催化活性中心His57的pKa值,在pH较高的条件下显示出对精氨酸具有更高的专一性。
二硫键的错误配对将降低其生物学活性并对人具有抗原性。 6.3 蛋白质工程的应用实例 蛋白质工程 6.3.2 人白细胞介素-2 由133个氨基酸残基组成,共有三个半胱氨酸。 二硫键的错误配对将降低其生物学活性并对人具有抗原性。 用基因定点突变方法可将IL-2的125位Cys改为丝氨酸(Ser)或丙氨酸(Ala),避免错误配对的产生,而且其热稳定性等方面也有较明显的改善。
Stability and Activity of Various Modified Versions of tPA
Modifying Metal Requirements Serine protease for laundry detergent Require calcium Calcium induces conformation change necessary for activity Modify amino acid sequence to achieve conformation and stability without calcium
蛋白质高级结构的预测
Homology Modeling 1. 搜索已知三级结构的同源蛋白质序列 (模板) PSI-BLAST multiple sequence alignment (MSA) 2. 选取与给定序列相似性最高的结构作为模板 3. 将氨基酸残基替换到结构模板中对应的位置上,降低自由能 4. 准确性好 序列相似性高 模型可靠性高 >30% sequence identity 5. 常用工具:MODELLER,Swiss-model
截至2008年6月,与迅速增长的庞大基因组核酸数据相反,已知三级结构的蛋白数量还不到6万个。(来自蛋白结构数据PDB的统计)
同源建模法预测蛋白质三级结构一般由四步完成: 从待测蛋白质序列出发,搜索蛋白质结构数据库(如PDB,SWISS-PROT等),得到许多相似序列(同源序列),选定其中一个(或几个)作为待测蛋白质序列的模板; 待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐; 建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构,待测蛋白质空间结构模型; 利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。
SWISS-MODEL 蛋白质结构预测 SWISS-MODEL利用同源建模的方法实现对一段未知序列的三级结构的预测。该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。http://swissmodel.expasy.org//SWISS-MODEL.html
First Approach mode(简捷模式) 这种模式提供一个简捷的用户介面:用户只需要输入一条氨基酸序列,服务器就会自动选择合适的模板。如果一条模板与提交的目标序列相似度大于25%,建模程序就会自动开始运行,结果以Email形式返回。
常用观看蛋白三级结构的软件 RasMol Cn3D WPDB
6.4 蛋白质组学 针对有关基因或转录组数据库的生物体或组织/细胞,建立其蛋白质组或亚蛋白质组及其蛋白质组连锁群,即组成性蛋白质组学研究。 6 蛋白质工程 蛋白质工程 6.4 蛋白质组学 针对有关基因或转录组数据库的生物体或组织/细胞,建立其蛋白质组或亚蛋白质组及其蛋白质组连锁群,即组成性蛋白质组学研究。 以重要生命过程或人类重大疾病为对象,进行重要的生理/病理体系或过程的局部蛋白质研究,即比较蛋白质组学研究 。 蛋白质组学支撑技术平台或生物信息学研究。
部分医学科学重点研究领域 研究细胞的增殖、分化、异常转化、肿瘤形成等方面,涉及白血病、乳腺癌、结肠癌和神经母细胞瘤等重大疾病。 蛋白质工程 6.4 蛋白质组学 蛋白质工程 部分医学科学重点研究领域 研究细胞的增殖、分化、异常转化、肿瘤形成等方面,涉及白血病、乳腺癌、结肠癌和神经母细胞瘤等重大疾病。 http://www.jsahvc.edu.cn/syx/pathology_0/sxzd/7.files/outline.htm
重大疾病(如肝癌)、维甲酸诱导白血病细胞凋亡启动模型。 维甲酸定向诱导胚胎干细胞向神经系统分化的蛋白质组。 蛋白质工程 6.4 蛋白质组学 目前国内研究进展 重大疾病(如肝癌)、维甲酸诱导白血病细胞凋亡启动模型。 维甲酸定向诱导胚胎干细胞向神经系统分化的蛋白质组。 血清中筛选诊断重大疾病的标志物——人血清蛋白质组学。 各类肿瘤疾病形成过程中,参与信号转导通道的蛋白质组。
蛋白质工程的进展和前景 1、科学家通过对胰岛素的改造,已使其成为速效型药品。 2、生物和材料科学家正积极探索将蛋白质工程应用于微电子方面。 3、蛋白质工程目前成功的例子不多,原因是对蛋白质的高级结构了解不够。但随着科学技术的深入发展,它将会给人类带来更多的福音。
举例说明对现有蛋白质进行改造的主要方法及其应用。 什么是蛋白质组学? 6 蛋白质工程 蛋白质工程 复习思考题 简单叙述蛋白质结构的基本组件。 简述氨基酸的基本理化性质。 简单描述反向生物学的途径。 举例说明对现有蛋白质进行改造的主要方法及其应用。 什么是蛋白质组学?
1.沈同,王镜岩,赵邦悌. 1980. 生物化学(上,下册).北京:高等教育出版社 6 蛋白质工程 蛋白质工程 主要参考文献 1.沈同,王镜岩,赵邦悌. 1980. 生物化学(上,下册).北京:高等教育出版社 2. 王大成. 2002.蛋白质工程. 北京:化学工业出版社 3.Pennington SR,Dunn MJ. 2001. Proteomics: from Protein Sequence to Funcation. New York:BIOS Scientific Publisher Limited 4.沈仁权,顾其敏,李泳裳等. 1980.基础生物化学. 上海:上海科学技术出版社