计算机科学与生命科学(13)生物信息学基础 2013年秋季学期通选课程 上课时间:周一 18:30点 上课地点:软件园4区502d 主讲人:魏天迪 讲义网址:http://www.mbtech.sdu.edu.cn/biocomp/
蛋白质三维结构预测 已知一个蛋白质的氨基酸序列,预测其三维结构。 三类方法:1. 同源建模法;2. 穿线法;3. 从头预测法。 MEAKIVKVLDSSRCEDGFGKKRKRAASYAAYVTGVSCAKLQNVPPPNGQCQIPDKRRRLEGENKLSAYENRSGKALVRYYTYFKKTGIAKRVMMYENGEWNDLPEHVICAIQNELEEKSAAIEFKLCGHSFILDFLHMQRLDMETGAKTPLAWIDNAGKCFFPEIYESDERTNYCHHKCVEDPKQNAPHDIKLRLEIDVNGGETPRLNLEECSDESGDNMMDDVPLAQRSSNEHYDEATEDSCSRKLEAAVSKWDETDAIVVSGAKLTGSEVLDKDAVKKMFAVGTASLGHVPVLDVGRFSSEIAEARLALFQKQVEITKKHRGDANVRYAWLPAKREVLSAVMMQGLGVGGAFIRKSIYGVGIHLTAADCPYFSARYCDVDENGVRYMVLCRVIMGNMELLRGDKAQFFSGGEEYDNGVDDIESPKNYIVWNINMNTHIFPEFVVRFKLSNLPNAEGNLIAKRDNSGVTLEGPKDLPPQLESNQGARGSGSANSVGSSTTRPKSPWMPFPTLFAAISHKVAENDMLLINADYQQLRDKKMTRAEFVRKLRVIVGDDLLRSTITTLQNQPKSKEIPGSIRDHEEGAGGL 已知一个蛋白质的氨基酸序列,预测其三维结构。 三类方法:1. 同源建模法;2. 穿线法;3. 从头预测法。 前两类方法合称为基于模板法。
同源建模法 同源建模法:相似的氨基酸序列对应着相似的蛋白质结构。
同源建模法: SWISS-MODEL http://swissmodel.expasy.org/ Automated mode: 什么都不用自己操心,只输入EMAIL、项目名称和目标序列,点Submit。
穿线法 穿线法:不相似的氨基酸序列也可能对应着相似的蛋白质结构。
穿线法 穿线法:不相似的氨基酸序列也可能对应着相似的蛋白质结构。 已知结构的蛋白质 > 9万,不同的结构拓扑 < 1300。
自动穿线法: I-TASSER http://zhanglab.ccmb.med.umich.edu/I-TASSER/ I-TASSER: 在线的蛋白质结构预测服务器,在近三届蛋白质结构预测比赛(CASP7/8/9)中皆排名第一。作者为美国密歇根大学的张阳教授。 什么都不用自己操心,只需注册一个用户,输入EMAIL、密码和目标序列(I-TASSER文件夹下seq.txt ),点RUN。
从头预测法 从头预测法:1973年 Anfinsen 《科学》:蛋白质的三维结构决定于自身的基酸序列,并且处于最低自由能状态。 由于运算量和准确度的问题,只适合几十个氨基酸长的蛋白质。
从头预测法 QUARK: http://zhanglab.ccmb.med.umich.edu/QUARK/
三种预测法的选择 首先考虑同源建模法,寻找模板。如果找到的模板序列与目标序列的一致度高于30%,那么就放心的用同源建模法。如果低于30%,再尝试穿线法。用穿线法得出的结果评估不错的话就齐活。评估不理想的话,如果目标序列短于100个氨基酸,那么尝试从头预测法,如果序列长于100个氨基酸就没什么办法了。
三维模型质量评估软件 Verify3D: http://nihserver.mbi.ucla.edu/SAVES PROCHECK: http://nihserver.mbi.ucla.edu/SAVES ProQ: http://www.sbc.su.se/~bjornw/ProQ MetaMQAPII: https://genesilico.pl/toolkit/mqap ModFOLD: http://www.reading.ac.uk/bioinf/ModFOLD QMEAN: http://swissmodel.expasy.org/qmean/cgi/index.cgi 模型质量评估软件不是评价一个模型跟真实模型的差别大小,而是从几何学、立体化学和能量分布三方面评估一个模型的自身合理性。只能说评估好的模型很可能跟真实的结构很接近。
三维模型质量评估软件 Verify3D: http://nihserver.mbi.ucla.edu/SAVES PROCHECK: http://nihserver.mbi.ucla.edu/SAVES ProQ: http://www.sbc.su.se/~bjornw/ProQ/ProQ.cgi 以上一步I-TASSER预测出的模型为例,试一下上面三个评估软件。
三维模型局部优化软件:ModLoop 从上一个练习Verify3D输出的曲线图中看出,模型的10到17位结构情况相对差一些。可以用ModLoop来优化这个区域的结构。 http://salilab.org/modloop/ 输入值为:Modeller license key:MODELIRANJE,模型文件,需修改区域的起始位置(可多个,书写格式点小问号获得帮助)。 跑完之后出来一个网页,上面有优化之后的结构文件下载地址,右键另存为即可。结果可直接查看ModLoop文件夹里的output.pdb。
结构重叠分析软件: SuperPose http://wishart.biology.ualberta.ca/SuperPose/ 可以把两个相似的三维结构重叠到一起,进行多方面的比较,比如RMSD等。如果两个结构的RMSD为0埃,那么它们结构一致,可以完全重合;一般来说,RMSD小于3埃时,认为这两个结构比较一致。