多序列比对和系统进化分析 ——以镰刀形贫血症为例 浙江大学生物信息实验室.

Slides:



Advertisements
Similar presentations
第四章 核苷酸和蛋白质序列为 基础的数据库检索 (I) 生物信息学. 检索数据库的方法  用关键词或词组进行数据库检索 (Text-based database searching)  用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching) Gene.
Advertisements

2014 年 10 月. 学生入学考试 15 位编号 号工号 ****** 北科 MBA 网址: 如: 初试密码为身份证 后六位,登录成功 后可进行修改。
可愛的小動物 黃凱澄 狗 犬(學名: Canis lupus familiaris ),現代俗稱為狗,一 種常見的犬科,生物學分類上是狼的一個種類。狗是最早 被馴化的一個物種。被人豢養的稱為家犬,返回野外沒人 養的狗稱為「野狗」或「流浪狗」。犬的壽命約十多年, 與貓的平均壽命相近。若無發生意外,平均壽命以小型犬.
第四节 RNA 的空间结构与功能. RNA 的种类和功能 核糖体 RNA ( rRNA ):核蛋白体组成成分 转移 RNA ( tRNA ):转运氨基酸 信使 RNA ( mRNA ):蛋白质合成模板 不均一核 RNA ( hnRNA ):成熟 mRNA 的前体 小核 RNA ( snRNA ):
第九章 核酸序列的其他分析方法 生物信息学. 1. 确定 DNA 序列的分子量和碱基组成  分子量( molecular weight )  单链 DNA ( single strand DNA , ssDNA )  双链 DNA ( double strand DNA , dsDNA ) 
第十一章 药物生物信息学基础.
多序列比对与Clustal的使用,以及各类常见的序列分析工具介绍
分子生物学部分开发实验 植物遗传亲缘关系研究.
系统进化树的构建方法与软件应用 姓名:张镜悬
龙星课程—肿瘤生物信息学上机课程 曹莎
序列分析.
蛋白质工程的崛起.
生物信息学数据库.
多序列比对.
生命的物质基础.
尖孢镰刀菌致病相关物质β-D-葡萄糖苷酶基因的克隆与序列分析
教学目标 1. 掌握基因的含义,以及基因、DNA、染色体之间的关系 2. 理解基因控制蛋白质合成(转录、翻译的含义、过程)
第2节 基因对性状的控制.
基因的表达 凌通课件.
基因指导蛋白质的合成及对性状的控制.
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
泛起进化的层层涟漪。遗传变异规律的妙用,赢来战胜病魔的惊喜!
第四次大作业 登陆学校图书馆网站的电子数据库
基因组数据注释和功能分析 陈启昀 陈 辰 丁文超 张增明 浙江加州国际纳米技术研究院(ZCNI)
生物資訊 bioinformatics 林育慶.
Hadoop I/O By ShiChaojie.
第八章 菜单设计 §8.1 Visual FoxPro 系统菜单 §8.2 为自己的程序添加菜单 §8.3 创建快捷菜单.
Basic Local Alignment Search Tool
普通高等教育 “十二五”规划教材 生物信息学 Bioinformatics 第五章:真核生物基因组的注释.
第二章 数据搜索与两两比对 本章描述了 如何比对两条或多条相关核苷酸或多肽序列, 如何搜索存储序列信息的数据库。
走进编程 程序的顺序结构(二).
蛋白质结构分析及三维可视化 以镰刀型红细胞贫血症为例
第一讲: 基本流程(1).
生物信息学 与 信息技术 张 勤
生物序列的信息检索 多序列比对及进化树的构建
如何下载英飞凌单片机相关资料? 中英文用户手册、数据手册、应用笔记等.
以ISI平台为例,为您演示一下如何在Endnote文献中查看该文献的References
第十章 方差分析.
iPhone/iPod Touch/Android
数据挖掘工具性能比较.
生物信息学 第六章 基因预测和基因结构分析 (II).
生物序列的信息检索 多序列比对及进化树的构建
第8章 遗传密码 8.1 遗传密码的基本特性.
一个交叉学科的胜利 简介 生物信息学 黄晓靖.
WSDM见闻 程龚.
第十章 古DNA数据分析.
氨基酸序列熵值计算工具的实现 及其在A型流感病毒HA蛋白序列 分析中的应用
超越自然还是带来毁灭 “人造生命”令全世界不安
用计算器开方.
计算机网络与网页制作 Chapter 07:Dreamweaver CS5入门
编译OpenSSL 本节内容 视频提供:昆山爱达人信息技术有限公司 视频录制:yang 官网地址:
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
iSIGHT 基本培训 使用 Excel的栅栏问题
AD相关LncRNA调控及分析方法研究 项目成员:魏晓冉 李铁志 指导教师:张莹 2018年理学院大学生创新创业训练计划项目作品成果展示
LOGIX500软件入门 西安华光信息技术有限公司 2008年7月11日.
本节内容 文件系统 视频提供:昆山爱达人信息技术有限公司 官网地址: 联系QQ: QQ交流群 : 联系电话:
第4课时 绝对值.
基于最大margin的决策树归纳 李 宁.
VRP教程 2011.
SCI收录号查询方法介绍 上海大学情报研究所
学习目标 1、如何对结果进行分组 2、分组函数的一些实用方法.
蔡世民 合作者:禚钊,傅忠谦,张捷 电子科学与技术系 中国科学技术大学 2011/4/29
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
16S-rDNASeq: one-stop pipeline for microbial community diversity analysis based on 16S-rDNAseq 何 飞.
_08文件操作 本节课讲师——void* 视频提供:昆山爱达人信息技术有限公司 官网地址:
生 物 信 息 学 Bioinformatics 巩晶 癌症研究中心 山东大学 医学院
基因信息的传递.
生物結構期末報告 學生:葉雅如 M 老師: 鄒文雄 教授.
RefWorks使用指南 归档、管理个人参考文献.
科研必备技能 许忠平.
Presentation transcript:

多序列比对和系统进化分析 ——以镰刀形贫血症为例 浙江大学生物信息实验室

主要目的 了解分子进化及系统发育分析 掌握多序列比对方法 熟悉系统发育树建立方法 掌握用Mega软件进行构建系统发育树

多序列比对和系统进化

序列比对 序列比对是序列相似性分析的常用方法。通过将两个 或多个核酸序列或蛋白序列进行比对,显示其中相似 的结构域,这是进一步相似性分析的基础。通过比较 未知序列与已知序列的一致性或相似性,可以预测未 知序列功能。 根本任务: 发现序列之间的相似性,辨别序列之间的差异 目的: 相似序列,相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系

两条序列比对 多序列比对 通过比较两条序列之间的相似区域和保守性位点,寻 找二者之间可能的进化关系。 局部比对算法(Blast) 全局比对的算法(多序列比对) 多序列比对 序列多重比对(Multiple Alignment)的目标是发现多条 序列的共性。 用于描述一组序列之间的相似性关系,以便了解一个 基因家族的基本特征,寻找motif,保守区域等。用于 描述一个同源基因之间的亲缘关系的远近,应用到分 子进化分析中。在比对过程 如果说序列两两比对比较主要用于建立两条序列的同源关系和推测它们的结构、功能,那么,同时比对一组序列对于研究分子结构、功能及进化关系更为有用。 某些在生物学上有重要意义的相似性只能通过将多个序列对比排列起来才能识别。同样,只有在多序列比对之后,才能发现与结构域或功能相关的保守序列片段。 对于一系列同源蛋白质,人们希望研究隐含在蛋白质序列中的系统发育的关系,以便更好地理解这些蛋白质的进化。在实际研究中,生物学家并不是仅仅分析单个蛋白质,而是更着重于研究蛋白质之间的关系,研究一个家族中的相关蛋白质,研究相关蛋白质序列中的保守区域,进而分析蛋白质的结构和功能。

分子进化及系统发育分析 分子进化研究目的 从物种的一些分子特性出发,构建系统发 育树,进化了解物种之间的生物系统发现 关系 通过序列同源性的比较进而了解基因的进 化以及生物系统发生的内在规律 系统发育树 是表明被认为具有共同祖先的物种演化关 系的树,是一种亲缘分支分类方法。

系统发育树的构建

使用工具 Blast Clustalx MEGA

Example-Sickle Cell Anemia 镰状细胞贫血是一种常染色体显性遗传血红蛋白(Hb)病。因β-肽链第6位氨基酸谷氨酸被缬氨酸所代替,构成镰状血红蛋白(HbS),取代了正常Hb(HbA)。

实验流程 一段序列 同源序列 多序列比对 系统发育树 Blast MEGA

Part 1 Blast软件的使用 一段序列 同源序列 多序列比对 系统发育树 Blast MEGA Blast

BLAST (Basic Local Alignment Search Tool)即碱基局部对准检索工具,是一种序列类似性检索工具。它采用统计学记分系统,能将真正配对的序列同随机产生的干扰序列区别开来;同 时采用启发式算法系统,即采用的是局部对准算法(Local Alignment Algorithm),而不是全序列对准算法(Global Alignment Algorithm)。 Blast是通过比对(alignment)在数据库中寻找和你的查询序列(query)相似度很高的序列。通俗地说就是在已知的序列数据库中找和你的序列差不多的序列。

http://www.ncbi.nlm.nih.gov/

http://blast.ncbi.nlm.nih.gov/Blast.cgi

Blast种类 blastp:将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行查询; blastn:将待查询的核酸序列及其互补序列一起对 核酸序列数据库进行查询; blastx:先将待查询的核酸序列按六种可读框架(逐个向前三个碱基和逐个向后三个碱基读码)翻译成蛋白质序列,然后将翻译结果对蛋白质序列数据库进行查询; tblastn:先将核酸序列数据库中的核酸序列按六种可读框架翻译成蛋白质序列,然后将待查询的蛋白质序列及其互补序列对其翻译结果进行查询; tblastx:先将待查询的核酸序列和核酸序列数据库中的核酸序列按六种可读框架翻译成蛋白质序列,然后再将两种翻译结果从蛋白质水平进行查询。

Blast种类选择

Blast种类 输入序列

图像总览

结果描述

比对信息

下载序列 Human sickle beta-hemoglobin mRNA 人镰刀型血红蛋白 Human messenger RNA for beta-globin 人信使RNAβ球蛋白 Gorilla gorilla 大猩猩血红蛋白 Synthetic construct HBB 人工合成血红蛋白 Ursus maritimus 北极熊血红蛋白 Balaenoptera omurai 角岛鲸血红蛋白 Pteropus alecto 狐蝠血红蛋白 Callithrix jacchus 普通狨血红蛋白 Canis lupus familiaris 家犬血红蛋白 Ceratotherium simum 白犀血红蛋白

下载序列

编辑序列-seqdump.txt

同源序列-seqdump2.txt 名字中不能有空格

Part 2 Clustalx软件的使用 一段序列 同源序列 多序列比对 系统发育树 Blast MEGA Clustalx

Clustalx-Clustal是一个单机版的基于渐进比对的多序列 比对工具,由Higgins D. G Clustalx-Clustal是一个单机版的基于渐进比对的多序列 比对工具,由Higgins D.G.等开发。 Clustalx是Clustal多 重序列比对程序的Windows版本。 序列将显示屏幕的窗口中。采用多色彩的模式可以在比 对中加亮保守区的特征。窗口上面的下拉菜单可让你选 择传统多重比对和轮廓比对需要的所有选项。 Clustalx比对结果是构建系统发育树的前提

Clustalx主界面 Clustalx界面

导入同源序列 Clustalx界面

导入同源序列 Clustalx界面

导入同源序列

多序列比对

多序列比对-seqdump2.aln

结果文件

Part 3 MEGA软件的使用 一段序列 同源序列 多序列比对 系统发育树 Blast MEGA MEGA

MEGA全称是molecular evolutionary genetics analysis(分子进化遗传分析)。可用于序列比对、进化树的推断、估计分子进化速度、验证进化假说。 http://www.megasoftware.net/

MEGA主界面 Clustalx界面

数据转格式 Clustalx界面

数据转格式 Clustalx界面 1.点击 2.点击

数据转格式 Clustalx界面

数据转格式-命名 Clustalx界面

数据转格式 Clustalx界面

删掉

数据转格式 Clustalx界面

导入数据 Clustalx界面

导入数据 Clustalx界面

导入数据 Clustalx界面

导入数据 Clustalx界面 点击打开文件窗口 显示保守位点 显示变异位点

系统发育树 Clustalx界面

系统发育树 Clustalx界面

系统发育树——构建方法 分化程度较大的远缘序列: 分化程度较小的近缘序列: 最大似然法(Maximum Likelihood,ML) Clustalx界面 分化程度较大的远缘序列: 最大似然法(Maximum Likelihood,ML) 邻接法 (Neighbor-joining,NJ) 最小进化法(Minimum-Evolution,ME) 分化程度较小的近缘序列: 最大简约法(Maximum Parsimony,MP) 除权配对法(UPGMA)

系统发育树——进化树可靠性 Bootstrap Method 从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列 Clustalx界面 Bootstrap Method 从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列 重复上面的过程,得到多组新的序列 对这些新的序列进行建树,再观察这些树与原始树是否有差异,以此评价建树的可靠性 至少进行100次重复取样

系统发育树——以最大似然法为例 Clustalx界面

系统发育树 Clustalx界面 当前打开文件

系统发育树 Clustalx界面

系统发育树 Original tree Bootstrap consensus tree 节点上的值为通过Bootstrap检验次数的百分数 Clustalx界面 Original tree Bootstrap consensus tree 节点上的值为通过Bootstrap检验次数的百分数

系统发育树 Tree:树型选择 Branch:分支信息修改 Label:分支名称修改 Scale:标尺设定 Cutoff:阈值设置 Clustalx界面 Tree:树型选择 Branch:分支信息修改 Label:分支名称修改 Scale:标尺设定 Cutoff:阈值设置

系统发育树 Clustalx界面 双击修改命名 子树操作符 搜索

系统发育树——多种树型 Clustalx界面

系统发育树——保存 Clustalx界面

系统发育树——保存 Clustalx界面

Part 4 MEGA软件做多序列比对

导入数据 Clustalx界面 注意:文件必须是fasta格式,且以.fasta为后缀

导入数据 Clustalx界面

导入数据 Clustalx界面

多序列比对

多序列比对

多序列比对

多序列比对 Clustalx界面

小 结 一段序列 同源序列 多序列比对 系统发育树 Blast MEGA Blast Clustalx MEGA

课后练习 在NCBI中找到P26374的蛋白序列,然后通过blastp,搜索nr库中相似的10个序列,多序列比对后,用Mega软件进行系统发育树构建(要求用两种以上方法)

谢谢