计算机科学与生命科学(11) 生物信息学基础 2013年秋季学期通选课程 上课时间:周一 18:30点 上课地点:软件园4区502d 主讲人:魏天迪 讲义网址:http://www.mbtech.sdu.edu.cn/biocomp/
多序列比对 常用的多序列比对工具包: ClustalW – 最广泛使用的 T-coffee – 最新的 MUSCLE – 最快的
多序列比对 常用的多序列比对工具包: Clustal是最早的多序列比对软件, ClustalW是Clustal的最新版本。至今它已经有35,000 多次文献引用,是在生物学领域中被引用最多的多序列比对软件。
A List of ClustalW Servers 多序列比对 常用的多序列比对工具包: A List of ClustalW Servers Name Location URL EBI Europe http://www.ebi.ac.uk/Tools/msa/clustalw2 PIR USA http://pir.georgetown.edu/pirwww/search/multialn.shtml EMBnet http://www.ch.embnet.org/software/ClustalW.html BCM http://searchlauncher.bcm.tmc.edu/multi-align/Options/clustalw.html GenomeNet Japan http://www.genome.jp/tools/clustalw DDBJ http://clustalw.ddbj.nig.ac.jp/top-j.html Strasbourg http://bips.u-strasbg.fr/fr/Documentation /ClustalW
氨基酸基本结构 氨基 酸根 侧链
氨基酸性质 疏水 亲水 负电 正电
多序列比对 常用的多序列比对工具包: EMBL ClustalW http://www.ebi.ac.uk/Tools/msa/clustalw2 红: 疏水 蓝: 酸性(负电) 紫红: 碱性(正电) 绿: 羟基 + 胺基 +
多序列比对 常用的多序列比对工具包: EMBL ClustalW http://www.ebi.ac.uk/Tools/msa/clustalw2 (*) 绝对保守的位点 (:) 拥有大致相同大小的氨基酸并且这些氨基酸的亲属水性相似。 (.) 拥有大致相同大小的氨基酸或亲属水性相似的氨基酸。
多序列比对 常用的多序列比对工具包: T-coffee是近几年发表的多序列比对软件,很准确,速度相对慢一些。 http://tcoffee.crg.cat/apps/tcoffee/play?name=regular
多序列比对 常用的多序列比对工具包: T-Coffee Mirror Sites http://tcoffee.crg.cat/apps/tcoffee/play?name=regular T-Coffee Mirror Sites Name URL SIB http://tcoffee.vital-it.ch EBI http://www.ebi.ac.uk/Tools/msa/tcoffee CNRS http://www.igs.cnrs-mrs.fr/Tcoffee/tcoffee_cgi/ index.cgi Max-Planck http://toolkit.tuebingen.mpg.de/t_coffee CBSU http://cbsuapps.tc.cornell.edu/t_coffee.aspx EMBnet http://www.es.embnet.org/Services/MolBio/t-coffee
多序列比对 常用的多序列比对工具包: T-Coffee http://tcoffee.crg.cat
多序列比对 常用的多序列比对工具包: T-Coffee http://tcoffee.crg.cat fasta_aln file score_html file phylip file clustalw_aln file
多序列比对 常用的多序列比对工具包: MUSCLE是一个运算速度较快的多序列比对软件。 Home page : http://www.ebi.ac.uk/Tools/msa/muscle/
多序列比对结果的查看编辑器 http://www.jalview.org/
多序列比对中找保守区
多序列比对中找保守区 http://meme.nbcr.net/meme/cgi-bin/meme.cgi
序列Logo en = (20 - 1) / 2*ln(2)*n entropy: 熵 en: 小样本检验修正 TRVGNYEMGRTLGEGSFAKVKYAKNTVTGDQAAIK KQTISYMAERVVGTGSFGIVFQAKCLETGESVAIK VVGGKFKLGRKLGSGSFGEIFLGVNVQTGEEVAVK VIGGKFKLGRKIGSGSFGELYLGINVQTGEEVAVK VSKKYVPPLRPIGRGASGIVCAAWNSETGEEVAIK MGADDFELLTMIGKGAFGEVRVVREINTGHVFAMK 对于某一列来说: 每个字母的高度 Height = fi * R (i=1,…,20) (f是出现频率) R = log2(20) – (entropy + en) entropy = -∑fi * log2(fi) en = (20 - 1) / 2*ln(2)*n entropy: 熵 en: 小样本检验修正 在线软件WebLogo:http://weblogo.berkeley.edu/