普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第四章:蛋白质结构分析
第一节 蛋白质结构组织层次 一、蛋白质的结构特征 (一)一级结构 蛋白质的一级结构(primary structure)是指多肽链的氨基酸残基的排列顺序。
(二)二级结构 蛋白质二级结构(secondary structure)是指多肽链主链原子借助于氢键沿一维方向排列成具有周期性的结构构象,是多肽链局部的空间结构(构象)主要有α螺旋、β折叠、β转角、无规卷曲等形式。 1、α螺旋 α螺旋( α -helix)是蛋白质中最常见、最典型、含量最丰富的结构元件,是一种重复性结构。 α螺旋的结构特征
2、β折叠 平行式(parallel)、反平行式(antiparallel)
3、 β转角 4、无规卷曲
(三)超二级结构、结构域 超二级结构(supersecondary structure)是指相邻的二级结构单元组合在一起,彼此相互作用,排列形成规则的、在空间结构上能够辨认的二级结构组合体,同时充当三级结构的构件,基本形式有α α、 β β、β α β等。
结构域(domain)是在超二级结构的基础上形成的三级结构的局部折叠区,它是相对独立的紧密球状实体,通常由50~300个氨基酸残基组成,其特点是在三维空间可以明显区分和相对独立,并且具有一定的生物功能。 (四)三级结构 三级结构(tertiary structure)是指整条多肽链的三维结构,包括骨架和侧链在内的所有原子的空间排列。 (五)四级结构 四级结构(quaternary structure)指在亚基和亚基之间通过疏水作用等次级键结合成为有序排列的特定的空间结构。
二、蛋白质结构分类系统 (一)SCOP分类数据库 蛋白质结构分类数据库SCOP(structure classification of proteins) 1、 SCOP的层次 家族(family)、超家族(superfamily)、折叠(fold)、结构类型(class) 2、SCOP的用途 (二)CATH蛋白质结构分类数据库
第二节 蛋白质结构的测定与理论预测 一、蛋白质结构的实验测定 (一)X射线晶体衍射图谱法(X-ray crystallography) (二)核磁共振法(NMR) (三)电子显微镜二维晶体三维重构
二、蛋白质结构比对 (一)蛋白质结构比对的目的和意义 (二)蛋白质结构比对的基本原理
(三)常用结构比对方法
蛋白质结构同源模建(又称同源模拟、同源建模)的理论基础是蛋白质的三级结构比蛋白质的一级结构更为保守。 三、蛋白质结构预测 (一)同源模建 蛋白质结构同源模建(又称同源模拟、同源建模)的理论基础是蛋白质的三级结构比蛋白质的一级结构更为保守。 步骤: 1、模板的选择 2、待测序列与模板序列的比对 3、同源模型的建立 4、同源模型精修和评估
(二)折叠识别 1、折叠识别基本原理 蛋白质折叠识别方法,是从蛋白质结构数据库中识别与待测序列具有相似折叠类型,进而实现对待测序列的空间结构预测。自然界中蛋白质折叠类型的数目是有限的,许多蛋白质虽然享有很低的序列相似性,但它们仍可能具有相同的折叠类型,这就是折叠识别的理论依据。
2、设计合适的打分函数来衡量待测序列与模板数据库中结构的相容。 3、对打分函数得到的结果进行统计显著性分析。 步骤: 1、建立蛋白质结构模板数据库 2、设计合适的打分函数来衡量待测序列与模板数据库中结构的相容。 3、对打分函数得到的结果进行统计显著性分析。 4、对结构模板数据库中通过计算得到的具有统计显著性的蛋白质结构排序,折叠识别方法一般会给出多个可能具有结构相似性的蛋白质结构模板。
(三)从头计算法 原理:蛋白质的天然构象对应其能量最低的构象,因此通过构造合适的能量函数及优化方法,可以实现从蛋白质序列直接预测其三维结构的目的。 1、Rosetta方法 2、1-TASSER
(四)二级结构预测 (五)不同蛋白质预测方法的评价
第三节 蛋白质折叠与疾病 一、蛋白质折叠的意义 二、蛋白质折叠研究的概述 三、蛋白质折叠机制的理论模型
1、框架模型 2、疏水塌缩模型 3、扩散-碰撞-粘合机制 4、成核-凝聚-生长模型 5、拼版模型
五、蛋白质错误折叠与疾病 (一)蛋白感染因子导致的疾病 疯牛病 是由一种尚未完全了解其本质的蛋白感染因子—Prion所引起。
(二)淀粉样蛋白导致的疾病 由淀粉样蛋白导致的疾病大致分为两类---- 老年痴呆症和帕金森症。