氨基酸序列熵值计算工具的实现 及其在A型流感病毒HA蛋白序列 分析中的应用

Slides:



Advertisements
Similar presentations
3 的倍数特征 抢三十
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
冀教版四年级数学上册 本节课我们主要来学习 2 、 3 、 5 的倍数特征,同学们要注意观察 和总结规律,掌握 2 、 3 、 5 的倍 数分别有什么特点,并且能够按 要求找出符合条件的数。
教育技术装备统计系统 使用培训 教育部基础教育司 教育部教育管理信息中心.
硕士论文开题报告 煤炭企业物流信息系统的 研究与设计 指导老师: 学生姓名: 学 号:
龙星课程—肿瘤生物信息学上机课程 曹莎
老子的素朴 厦门大学计算机科学系 庄朝晖.
國有土地管理與運用問題之探討 主講人: 廖 蘇 隆 中華民國100年10月17 日.
氨基酸脱水缩合过程中的相关计算 广东省德庆县香山中学 伍群艳 H O C H COOH R2 N NH2 C C 肽键 R1 H2O.
第五章 各类园林绿地的规划设计.
PET-CT-SUVmax与鼻咽癌放疗过程中原发灶 径线变化的关系
校園霸凌事件處理、申復流程暨狀況模擬 林華杉教官 此範本可作為群組設定中簡報訓練教材的起始檔案。 章節
在线考试系统 答辩人: 朱允昌、朱碧云、张海燕 汇报时间: 指导老师: 任艳、徐怡 软件应用与开发类
面向对象程序设计 (Visual C# .NET)
妈妈我爱你 你总说我还不懂事 维护我像一张白纸 你眼中我永远是长不大的孩子 虽然我有好多心事 却已不愿说与你知 我曾任性地排斥你爱我的方式
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
特异性免疫过程 临朐城关街道城关中学连华.
在PHP和MYSQL中实现完美的中文显示
学习前的准备工作 讲师:burning.
Chinese Virtual Observatory
R in Enterprise Environment 企业环境中的R
SOA – Experiment 3: Web Services Composition Challenge
管理信息结构SMI.
走进编程 程序的顺序结构(二).
网络常用常用命令 课件制作人:谢希仁.
第11章:一些著名开源软件介绍 第12章:服务安装和配置 本章教学目标: 了解当前一些应用最广泛的开源软件项目 搭建一个网站服务器
第一单元 初识C程序与C程序开发平台搭建 ---观其大略
数据挖掘工具性能比较.
VSS使用简介 王树升
程序设计工具实习 Software Program Tool
第二节 免疫球蛋白的类型 双重特性: 抗体活性 免疫原性(抗原物质).
C语言程序设计 主讲教师:陆幼利.
顺序表的删除.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
台灣中部明潭水庫集水區 坡地崩塌治理對策之研究 林志玄、李錦浚 水土保持學報39(1)
超越自然还是带来毁灭 “人造生命”令全世界不安
用计算器开方.
Web安全基础教程
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第六章 Excel的应用 一、Excel的单元格与区域 1、单元格:H8, D7, IV26等 2、区域:H2..D8, HS98:IT77
第4章 Excel电子表格制作软件 4.4 函数(一).
JSP实用教程 清华大学出版社 第2章 JSP运行环境和开发环境 教学目标 教学重点 教学过程 2019年5月7日.
iSIGHT 基本培训 使用 Excel的栅栏问题
第三节 构成抗原的条件 一、影响免疫原性的因素 (一)抗原因素: 1. 分子量: 一般是分子量越大,免疫 原性越强。
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
LOGIX500软件入门 西安华光信息技术有限公司 2008年7月11日.
第4课时 绝对值.
Visual Basic程序设计 第13章 访问数据库
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
保變住開發要點 資料來源:台北市政府都發局.
GIS基本功能 数据存储 与管理 数据采集 数据处理 与编辑 空间查询 空间查询 GIS能做什么? 与分析 叠加分析 缓冲区分析 网络分析
总复习.
第六章 Excel的应用 五、EXCEL的数据库功能 1、Excel的数据库及其结构 2、Excel下的数据排序 (1)Excel的字段名行
基因信息的传递.
我會看年曆.
多序列比对和系统进化分析 ——以镰刀形贫血症为例 浙江大学生物信息实验室.
XX大学XX学院 多色复古论文答辩PPT模板 X124-2 蓝梦 学号.
第8章 创建与使用图块 将一个或多个单一的实体对象整合为一个对象,这个对象就是图块。图块中的各实体可以具有各自的图层、线性、颜色等特征。在应用时,图块作为一个独立的、完整的对象进行操作,可以根据需要按一定比例和角度将图块插入到需要的位置。 2019/6/30.
本底对汞原子第一激发能测量的影响 钱振宇
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
使用Fragment 本讲大纲: 1、创建Fragment 2、在Activity中添加Fragment
RefWorks使用指南 归档、管理个人参考文献.
实验六、COM类型病毒分析实验 实验开发教师: 刘乃琦 谌黔燕.
海报题目 简介: 介绍此项仿真工作的目标和需要解决的问题。 可以添加合适的图片。
Presentation transcript:

氨基酸序列熵值计算工具的实现 及其在A型流感病毒HA蛋白序列 分析中的应用 王靖飞 中国农业科学院哈尔滨兽医研究所 2007.8.11 昆明

前 言 A型流感病毒HA蛋白氨基酸序列中特殊位点的突变对其抗原性、毒力、受体结合特性等有显著影响 前 言 A型流感病毒HA蛋白氨基酸序列中特殊位点的突变对其抗原性、毒力、受体结合特性等有显著影响 这些特殊位点的识别和其突变规律的揭示对流感病毒疫苗、致病机理、跨宿主传播等研究具有重要意义 氨基酸序列最大熵可以用来反映氨基酸位点的保守性和可变性

HA氨基酸序列熵值计算流程 序列文件 ClustalX 对齐 对齐文件.fasta 熵值计算工具Entropy 熵值计算,保守区和可变区分析

熵值计算工具——Entropy的开发 开发环境:Microsoft Visual Studio .NET 2003 开发语言:C# 主要技术:文件流、ADO.NET等 主要控件:DataGrid、OpenFileDialog等

Entropy的功能介绍 1、熵值计算 利用熵值计算公式计算每个序列集各位点的熵值。 2、保守序列 保守序列定义:每个位点出现概率最多的氨基酸的值。并针对可能出现的情况对每个位点的显示形式加以区别。 3、数量统计 以数量的形式显示每个序列集,每个位点各种氨基酸的数量。 4、百分数统计 以百分比的形式显示每个序列集,每个位点各氨基酸占总氨基酸数量的百分比 。

Entropy的界面

Entropy的应用——序列数据获取 从NCBI的流感病毒资源数据库采集流感病毒HA蛋白氨基酸序列。选择A型流感病毒、任意宿主、任意地区、HA片段,H3/H5亚型、仅选择全长序列、移除同一序列,其余条件系统默认。符合条件的序列集有832/932条序列(至2007年7月16日)。分别命名为SetH5和SetH3。取得的序列统一制成FASTA格式

Entropy的应用——多序列比对1 ClustalX装载序列后,杂乱无章

Entropy的应用——多序列比对2 序列比对后,适当的引入空位,比对结果整齐有序

Entropy的应用——多序列比对3 已对齐的SetH3

Entropy的应用——多序列比对4 已对齐SetH5

Entropy的应用——对齐序列编辑1 箭头所示,由于该位点仅一条序列插入一个N致使其余序列全部产生空位,切除N后该位点对齐 比对后的序列利用Bioedit软件进行编辑,将氮端或碳端部分冗长序列切除,或删除个别序列个别位点的氨基酸插入

Entropy的应用——对齐序列编辑2 已编辑SetH3

Entropy的应用——对齐序列编辑3 已编辑SetH5

Entropy的应用——编辑后再次对齐分析 已编辑SetH5(切割位点附近有大量碱性氨基酸插入)

Entropy的应用——数据输入

Entropy的应用——数据输入 已装载序列

Entropy的应用——熵值计算

Entropy的应用——结果显示(熵值)

Entropy的应用——结果显示(保守序列分析)

Entropy的应用——结果显示(氨基酸数量统计)

Entropy的应用——结果显示(氨基酸出现概率)

Entropy的应用——多数据集分析 226位点对比结果

Entropy的应用——熵值判断标准 根据熵值计算公式可以推导出氨基酸序列比对时,熵值的范围在0~4.392之间(只有一个氨基酸残基出现在当前位点时熵值为0;所有20个氨基酸残基,包含氨基酸残基缺失或插入产生的空位,均匀的出现在当前位点时熵值为4.392) 通常认为熵值≥2.000时该位点是可变异的,当熵值<2.000时认为该位点是保守的,当熵值≤1.000时该位点是高度保守的。关于熵值的保守性定义可以结合比对对象特征定义 在此,我们定义熵的范围(0~4.392),缺省值设置是1.000。 H≥1.000, 代表高突变位点; 1.000 ≥H ≥ 0.600, 定义为易突变为点; H≤0.600, 定义为保守位点

Entropy的应用——分析结果1 ■代表高突变位点,△代表易突变位点 上面是H3数据,下面是H5数据

Entropy的应用——分析结果2

Entropy的应用——分析结果3

Entropy的应用——分析结果4

讨论与结论1 研究表明,H3和H5亚型HA蛋白氨基酸序列的熵值差异较大,所以氨基酸残基位点突变比率相差也较大,尤其是功能区和功能位点差异最为明显 1、受体结合区熵值相对较小,表明氨基酸位点相对保守,说明A型流感病毒各亚型受体具有较强的宿主特异性,相对比较保守。 2、抗原表位区H3的熵值普遍高于H5,H3亚型较H5亚型更易发生抗原漂移。结合已有研究成果,这种变化主要来自宿主免疫系统的选择压力,进一步可以验证人类免疫系统对流感病毒的选择压力高于禽类。

讨论与结论2 3、H3亚型137、226位点熵值为分别为1.691和1.865,具有较高的突变率。而226位点位于受体结合位点“Pocket”(袋状蛋白)的底部,在和唾液酸结合过程中作用重要,这一位点氨基酸残基易于突变,表明H3亚型流感病毒在和宿主细胞表面的受体作用时具有不同的结合常数。即同一亚型病毒与相同受体结合时,结合力稳定性不同,因此可以表现出不同的毒力 。 4、同一亚型不同抗原表位的熵值也不同。经验表明,突变率高的抗原表为通常为病毒的主要抗原表位。如,H3亚型表位A和表位B位主要抗原表位;H5亚型表位B为主要表位。 5、应用Entropy可以方便地进行氨基酸序列保守区分析,同时也可以对多个数据集的分析结果进行比较分析,以发现数据集的聚类特征。

谢 谢!