生物序列的信息检索 多序列比对及进化树的构建

Slides:



Advertisements
Similar presentations
第四章 核苷酸和蛋白质序列为 基础的数据库检索 (I) 生物信息学. 检索数据库的方法  用关键词或词组进行数据库检索 (Text-based database searching)  用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching) Gene.
Advertisements


DOC 推廣活動 月餅星光大道. 中秋  農曆八月十五日,是中國傳統的中秋節。 古人將一年分成春夏秋冬四季,而一季又 分為孟、仲、季三月,八月是仲秋之月, 而十五又是這個月中間的一天,正處在秋 季的正中,所以把八月十五稱為「中秋」 或「仲秋」。  中秋夜,月亮最圓,月色最美,因此人們 把月圓看成是團圓的象徵,同時也稱八月.
2014 年 10 月. 学生入学考试 15 位编号 号工号 ****** 北科 MBA 网址: 如: 初试密码为身份证 后六位,登录成功 后可进行修改。
中 五 級中 五 級 戰後國共關係 與 中華人民共和國成立 中國歷史科 1 )認識國共政治協商的概況 2 )認識國共內戰的概略經過及結果 3 )中華人民共和國成立.
手动换页 域外风情系列 儿子去美国留学,毕业后定居美国。还给我找了 个洋媳妇苏珊。如今,小孙子托比已经 3 岁了。 今年夏天,儿子为我申请了探亲签证。在美国待 了三个月,洋媳妇苏珊教育孩子的方法,令我这 个中国婆婆大开眼界。
不吃早餐的影響: 體內的葡萄糖無法 足夠供應給大腦與 肌肉,會感覺疲勞, 注意力無法集中。。 營養的早餐:乳品 + 全榖類食品 + 蛋白質 + 水果 早餐你吃了嗎?
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
99學年度第1學期導師輔導工作座談會 全校性共同必修服務學習課程 報告單位:學務處領導知能與服務學習中心.
第十章 教育技术科学研究.
人文地理專題研究 王志明.
2014年爱婴医院复核方案解读 省卫生计生委妇幼处 邱灵.
导言 第四 单元 凡尔赛—华盛顿体系与第二次世界大战
职业教育.课程改革.项目课程 江苏省太仓中等专业学校校长 江苏省职业教育教学改革创新指导委员会委员 江苏省职业教育课程开发研究中心组组长
龙星课程—肿瘤生物信息学上机课程 曹莎
社團經費申請 及核銷相關規定 製作:世新大學會計室.
会计实验.
“卓越工程师”培养的质量保障体系构建探索
土地出让转让的政策与实务 岳晓武 国土资源部利用司.
老師:鍾郁芬 老師 指導 組長:陳欣怡 組員:曾郁雯 倪敏富 王宣化 簡宏倫 黃郁涵
题目回顾 泉水在地下蓄积,一旦有机会,它便骄傲地涌出地面,成为众人瞩目的喷泉,继而汇成溪流,奔向远方。但人们对地下的泉水鲜有关注,其实,正是因为有地下那些默默不语的泉水的不断聚集,才有地上那一股股清泉的不停喷涌。 请根据你对材料的理解和感悟,自选一个角度,写一篇不少于800字的文章,文体自定,标题自拟。要求:立意明确,不要套作,不得抄袭。
北京吉利大学 教学改革与产教协同 长沙.
广 东 技 术 师 范 学 院 美术学院 装潢专业 2012级(3)班 郑可珊
第十九章 散文 教学要求: 了解散文的含义、分类、特点,学习写作抒情散文。 重点: 散文的特点,散文的写作。 难点: 散文的写作训练。
生物信息学数据库.
地價稅簡介.
农机化项目管理培训会 柳州市农机局 郑崇宁
一二·九运动                                                                    0712班.
中小学教育科研课题的选择 王典伟.
出口农产品风险管理 企业分类及监督管理表格
生育保险 朝阳社保中心支付部:黄玮.
让微笑伴您一生.
● 四 (2)班 家 长 网络交 流 会 ● 快乐成长 与您 共享 家庭 学校 社会.
学科科研工作与科研 奖励政策解读讲座 朱文斌 博士 教授 2015年9月8日.
第三章 旅游团队导游服务程序 主讲 李凯旋.
第9章 金融监管.
首都师范大学.
在PHP和MYSQL中实现完美的中文显示
《环游西藏》之二 碧玉湖 音乐《白塔》 摄制:C&Y.
基因组数据注释和功能分析 陈启昀 陈 辰 丁文超 张增明 浙江加州国际纳米技术研究院(ZCNI)
關心今天的老人, 就是關心明天的自己 作者:周儀.
第八章 菜单设计 §8.1 Visual FoxPro 系统菜单 §8.2 为自己的程序添加菜单 §8.3 创建快捷菜单.
SQL Injection.
Authors: Saumil Mehta and Deendayal Dinakarpandian
第一讲: 基本流程(1).
生物序列的信息检索 多序列比对及进化树的构建
科研信息管理工具 Endnote X4 王辉.
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
第17章 网站发布.
iPhone/iPod Touch/Android
Science and technology report service systemUsage method
新PQDT论文全文库提交平台.
《郑伯克段于鄢》 黎兰老师制作.
VB与Access数据库的连接.
姚金宇 MIT SCHEME 使用说明 姚金宇
iSIGHT 基本培训 使用 Excel的栅栏问题
國民年金 np97006.
Visual Basic程序设计 第13章 访问数据库
SCI收录号查询方法介绍 上海大学情报研究所
波形平均和叠加分析指南 上海骐驰仪器有限公司 Shanghai Qichi Instruments Co. Ltd.
Python 环境搭建 基于Anaconda和VSCode.
Polarization of electro- magnetic wave after reflection
僅首頁出現本title即可 責任的故事(二年級) 生命最美麗動人的本能 簡報製作:瑞柑國民小學 鄭雙慧 文/ 何秀芳.
仲裁处理细则及常见问题解析.
嘉義縣立溪口國民中學 辦理96年度推動自由軟體學校資訊融入教學
YOUR SUBTITLE GOES HERE
多序列比对和系统进化分析 ——以镰刀形贫血症为例 浙江大学生物信息实验室.
便利商店公仔行銷之研究以7-ELEVEn Open小將為例
如何在EBSCO host上创建检索结果邮件订阅
百万行、千万行数据查询教程 老黄牛.
Presentation transcript:

生物序列的信息检索 多序列比对及进化树的构建 生物信息学 上机练习 生物序列的信息检索 多序列比对及进化树的构建 1

1,序列的数据库信息检索示例: 待查询序列: CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC

问题 1,这是什么基因?基因的标识符是什么?在基因组上的定位是怎样的? 2,编码的蛋白质多少个氨基酸?序列标识符为?序列是? 3,该蛋白没有保守的功能结构域 ? 4,该蛋白亚细胞定位是?它的功能是怎样的? 5,该蛋白在真核生物中是否保守? 6,该蛋白有没有三级结构信息?

答案 1. 该基因为人的BIRC5基因;基因标识符:NM_001168.2;染色体定位:17号染色体,76214196..76225635; 2. 人的BIRC5蛋白质包含142个氨基酸,序列标识符为:NP_001159.2; 序列为:MGAPTLPPAWQPFLKDHRISTFKNWPFLEGCACP… 3. BIRC5具有保守的功能结构域BIR; 4. BIRC5的细胞亚定位:胞质,核;其功能有: (1) 在瘤形成过程中可能起一定作用; (2) 阻碍G2/M期的细胞编程性凋亡; (3) Chromosomal passenger complex (CPC)的成员之一。等等。 5. 该基因在真核生物中其中一个保守蛋白是来自苏门答腊猩猩Pongo abelii的BIRC5蛋白:Q5RAH9; 6. 该蛋白的三级结构已知,在PDB中的标识符为1E31等。

2,多序列比对及进化树构建 构建Cytochrome C1家族进化树 在Uniprot数据库中搜索Cytochrome C1在不同物种中的氨基酸序列,下载fasta文件 使用MEGA软件对结果进行分析: 1)多序列比对(MSA multiple sequence alignment) 2)构建进化树

Cytochrome C1家族序列获取 工具网站 http://www.uniprot.org/

选择搜索结果中Entry name 以“CY1_”开头的序列(选十几个物种序列,每一个种属只选一个序列,即entry name一样的只选择一个即可) 下载fasta文件(批量下载勾选的文件,点download)

创建Fasta 可直接下载或复制粘贴创建Fasta文件: 以>为开头,后接序列名称,重启一行,输入序列 >CY1_BOVIN MAAAAATLRGAMVGPRG… >CY1_YEAST MFSNLSKRWAQRTLSKS… >CY1_HUMAN MAAAAASLRGVVLGPRG… >…

Fasta文件要求 每个序列的Title仅保留蛋白/基因名称+种属来源,如:CY1_YEAST 序列名称中不含有 ‘=’ 字符 氨基酸序列可以分成多行,但内部不要有空格

MEGA 5软件使用 打开MEGA 5,拉开Align菜单,选择Edit/Build Alignment

MEGA 5软件使用 Creat a new Alignment 选择Protein

MEGA 5软件使用 在新弹出的窗口中,选择Data->Open->Retrieve Sequences from File,然后导入刚才保存的fasta文件

多序列比对 Ctrl+A选择全部序列,Aligment->Align by ClustalW

多序列比对 可以修改各补偿值等参数,点OK

多序列比对 多序列比对完成 Dateexport alignment, 导出MEGE format和 Fasta format两份结果,

进化树构建 关闭Alignment窗口,回到MEGA软件主窗口,File -> Open A File/Session,打开之前保存的*.meg文件

进化树构建 选择Phylogeny->Construct/Test Neighbor-Joining Tree 点yes

Bootstrap method 验证进化树,选择 点击compute开始 Bootstrap method 验证进化树,选择 bootstrap

调整树的形状

作业: 自主选择你所感兴趣的问题,利用生物信息学信息检索途径,回答你的问题。 格式: 已知:… 待查询问题: … 解答途径: 方法、数据库… 结果:… 鼓励使用新途径解决新问题! 本科已修生物信息课的同学可以不用上机练习课,但需要完成此项作业。

作业要求 作业保存为.txt或.doc文件,发送至sntt@ustc.edu.cn 邮件名称:学号+姓名