Download presentation
Presentation is loading. Please wait.
1
氨基酸序列熵值计算工具的实现 及其在A型流感病毒HA蛋白序列 分析中的应用
王靖飞 中国农业科学院哈尔滨兽医研究所 昆明
2
前 言 A型流感病毒HA蛋白氨基酸序列中特殊位点的突变对其抗原性、毒力、受体结合特性等有显著影响
前 言 A型流感病毒HA蛋白氨基酸序列中特殊位点的突变对其抗原性、毒力、受体结合特性等有显著影响 这些特殊位点的识别和其突变规律的揭示对流感病毒疫苗、致病机理、跨宿主传播等研究具有重要意义 氨基酸序列最大熵可以用来反映氨基酸位点的保守性和可变性
3
HA氨基酸序列熵值计算流程 序列文件 ClustalX 对齐 对齐文件.fasta 熵值计算工具Entropy 熵值计算,保守区和可变区分析
4
熵值计算工具——Entropy的开发 开发环境:Microsoft Visual Studio .NET 2003 开发语言:C#
主要技术:文件流、ADO.NET等 主要控件:DataGrid、OpenFileDialog等
5
Entropy的功能介绍 1、熵值计算 利用熵值计算公式计算每个序列集各位点的熵值。 2、保守序列
保守序列定义:每个位点出现概率最多的氨基酸的值。并针对可能出现的情况对每个位点的显示形式加以区别。 3、数量统计 以数量的形式显示每个序列集,每个位点各种氨基酸的数量。 4、百分数统计 以百分比的形式显示每个序列集,每个位点各氨基酸占总氨基酸数量的百分比 。
6
Entropy的界面
7
Entropy的应用——序列数据获取 从NCBI的流感病毒资源数据库采集流感病毒HA蛋白氨基酸序列。选择A型流感病毒、任意宿主、任意地区、HA片段,H3/H5亚型、仅选择全长序列、移除同一序列,其余条件系统默认。符合条件的序列集有832/932条序列(至2007年7月16日)。分别命名为SetH5和SetH3。取得的序列统一制成FASTA格式
8
Entropy的应用——多序列比对1 ClustalX装载序列后,杂乱无章
9
Entropy的应用——多序列比对2 序列比对后,适当的引入空位,比对结果整齐有序
10
Entropy的应用——多序列比对3 已对齐的SetH3
11
Entropy的应用——多序列比对4 已对齐SetH5
12
Entropy的应用——对齐序列编辑1 箭头所示,由于该位点仅一条序列插入一个N致使其余序列全部产生空位,切除N后该位点对齐
比对后的序列利用Bioedit软件进行编辑,将氮端或碳端部分冗长序列切除,或删除个别序列个别位点的氨基酸插入
13
Entropy的应用——对齐序列编辑2 已编辑SetH3
14
Entropy的应用——对齐序列编辑3 已编辑SetH5
15
Entropy的应用——编辑后再次对齐分析
已编辑SetH5(切割位点附近有大量碱性氨基酸插入)
16
Entropy的应用——数据输入
17
Entropy的应用——数据输入 已装载序列
18
Entropy的应用——熵值计算
19
Entropy的应用——结果显示(熵值)
20
Entropy的应用——结果显示(保守序列分析)
21
Entropy的应用——结果显示(氨基酸数量统计)
22
Entropy的应用——结果显示(氨基酸出现概率)
23
Entropy的应用——多数据集分析 226位点对比结果
24
Entropy的应用——熵值判断标准 根据熵值计算公式可以推导出氨基酸序列比对时,熵值的范围在0~4.392之间(只有一个氨基酸残基出现在当前位点时熵值为0;所有20个氨基酸残基,包含氨基酸残基缺失或插入产生的空位,均匀的出现在当前位点时熵值为4.392) 通常认为熵值≥2.000时该位点是可变异的,当熵值<2.000时认为该位点是保守的,当熵值≤1.000时该位点是高度保守的。关于熵值的保守性定义可以结合比对对象特征定义 在此,我们定义熵的范围(0~4.392),缺省值设置是1.000。 H≥1.000, 代表高突变位点; 1.000 ≥H ≥ 0.600, 定义为易突变为点; H≤0.600, 定义为保守位点
25
Entropy的应用——分析结果1 ■代表高突变位点,△代表易突变位点 上面是H3数据,下面是H5数据
26
Entropy的应用——分析结果2
27
Entropy的应用——分析结果3
28
Entropy的应用——分析结果4
29
讨论与结论1 研究表明,H3和H5亚型HA蛋白氨基酸序列的熵值差异较大,所以氨基酸残基位点突变比率相差也较大,尤其是功能区和功能位点差异最为明显 1、受体结合区熵值相对较小,表明氨基酸位点相对保守,说明A型流感病毒各亚型受体具有较强的宿主特异性,相对比较保守。 2、抗原表位区H3的熵值普遍高于H5,H3亚型较H5亚型更易发生抗原漂移。结合已有研究成果,这种变化主要来自宿主免疫系统的选择压力,进一步可以验证人类免疫系统对流感病毒的选择压力高于禽类。
30
讨论与结论2 3、H3亚型137、226位点熵值为分别为1.691和1.865,具有较高的突变率。而226位点位于受体结合位点“Pocket”(袋状蛋白)的底部,在和唾液酸结合过程中作用重要,这一位点氨基酸残基易于突变,表明H3亚型流感病毒在和宿主细胞表面的受体作用时具有不同的结合常数。即同一亚型病毒与相同受体结合时,结合力稳定性不同,因此可以表现出不同的毒力 。 4、同一亚型不同抗原表位的熵值也不同。经验表明,突变率高的抗原表为通常为病毒的主要抗原表位。如,H3亚型表位A和表位B位主要抗原表位;H5亚型表位B为主要表位。 5、应用Entropy可以方便地进行氨基酸序列保守区分析,同时也可以对多个数据集的分析结果进行比较分析,以发现数据集的聚类特征。
31
谢 谢!
Similar presentations